第 主成分分析和因子分析_第1頁
第 主成分分析和因子分析_第2頁
第 主成分分析和因子分析_第3頁
第 主成分分析和因子分析_第4頁
第 主成分分析和因子分析_第5頁
已閱讀5頁,還剩58頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

會計學(xué)1第主成分分析和因子分析第12章主成分分析和因子分析12.1

主成分分析12.2因子分析

factoranalysis第1頁/共63頁2021-6-20學(xué)習(xí)目標(biāo)主成分分析和因子分析的基本原理主成分分析和因子分析的異同主成分分析和因子分析的數(shù)學(xué)模型用SPSS進(jìn)行主成分分析和因子分析用主成分分析和因子分析對實際問題進(jìn)行綜合評價第2頁/共63頁2021-6-20在研究實際問題時,往往需要收集多個變量。但這樣會使多個變量間存在較強(qiáng)的相關(guān)關(guān)系,即這些變量間存在較多的信息重復(fù),直接利用它們進(jìn)行分析,不但模型復(fù)雜,還會因為變量間存在多重共線性而引起較大的誤差為能夠充分利用數(shù)據(jù),通常希望用較少的新變量代替原來較多的舊變量,同時要求這些新變量盡可能反映原變量的信息主成分分析和因子分子正式解決這類問題的有效方法。它們能夠提取信息,使變量簡化降維,從而使問題更加簡單直觀主成分分析和因子分析

(principalcomponentanalysis&factoranalysis)第3頁/共63頁2021-6-20因子分析得到的是什么?因子分析方法在部分領(lǐng)域應(yīng)用的一些例子心理學(xué):心理學(xué)家瑟斯登對56項測驗的得分進(jìn)行因子分析,得出了7中主要智利因子:詞語理解能力,語言流暢能力、計數(shù)能力、空間能力、記憶力、知覺速度和推理能力教育學(xué):某師范大學(xué)在對以幼兒園3~6歲幼兒為對象,通過80名幼兒教師對480名幼兒好奇心行為特征描述的開放式問卷調(diào)查,編制出60個項目的初始問卷,對500名幼兒的初測結(jié)果進(jìn)行探索性因子分析后,形成了33個項目的正式問卷,對1000名幼兒的評價結(jié)果進(jìn)行驗證性因子分析,結(jié)果表明:教師評價的3~6歲幼兒好奇心結(jié)構(gòu)包括敏感、對未知事物的關(guān)注、好問、喜歡擺弄、探索持久和好奇體驗6個因子第4頁/共63頁2021-6-20因子分析得到的是什么?醫(yī)學(xué):一位研究者對山東某縣2000~2002年3年的全死因調(diào)查資料中不同地區(qū)各惡性腫瘤標(biāo)化死亡率進(jìn)行因子分析后發(fā)現(xiàn),該縣居民惡性腫瘤的發(fā)病和死亡具有明顯的地區(qū)分布。在地區(qū)分布中,各種惡性腫瘤的死亡具有一定程度的聚集性。經(jīng)因子分析得到的4個主因子可以解釋10種惡性腫瘤死亡率的74.54%;10種惡性腫瘤中,被解釋的比例最小也在62%以上;而胃癌、白血病、膀胱癌、乳腺癌、結(jié)腸癌死亡率被解釋的比例均在77%以上,表明這10種惡性腫瘤之間存在中等偏強(qiáng)的內(nèi)在聯(lián)系和地區(qū)分布特點第5頁/共63頁2021-6-20因子分析得到的是什么?地質(zhì)學(xué):海南島的石綠鐵礦及外圍地區(qū)有透輝石透閃巖石和陽起石兩種巖石。地質(zhì)工作者對兩種巖石標(biāo)本的11種化驗數(shù)據(jù)進(jìn)行了因子分析,分別得到5種和4種主要因子。結(jié)果表明,透輝石透閃巖石與陽起石有明顯區(qū)別,前者的元素組合屬碳酸鹽沉積型,后者屬巖漿分異型。透輝石透閃巖石中鐵的沉積與泥質(zhì)成分有關(guān),屬于正常沉積。由此推斷石綠鐵礦的主要成礦為沉積作用,并據(jù)此提出了找礦標(biāo)志和找礦方向上市公司評價:某研究者選擇35家能源類上市公司,根據(jù)2007年的12項經(jīng)營指標(biāo)數(shù)據(jù),采用因子分析法分別按盈利能力、資產(chǎn)管理能力、償債能力及經(jīng)營業(yè)績綜合評分等方面對35家上市公司進(jìn)行了排名。其中:盈利能力排在前5位的是:神火股份、海油工程、蘭花科創(chuàng)、潞安環(huán)能和中國石油;經(jīng)營業(yè)績綜合得分排在前5位的是:神火股份、潞安環(huán)能、蘭花科創(chuàng)、海油工程和開灤股份第6頁/共63頁12.1主成分分析

12.1.1主成分分析的基本原理

12.1.2主成分分析的數(shù)學(xué)模型

12.1.3主成分分析的步驟第12章主成分分析和因子分析第7頁/共63頁12.1.1主成分分析的基本原理12.1主成分分析第8頁/共63頁2021-6-20主成分的概念由KarlPearson在1901年提出考察多個變量間相關(guān)性一種多元統(tǒng)計方法研究如何通過少數(shù)幾個主成分(principalcomponent)來解釋多個變量間的內(nèi)部結(jié)構(gòu)。即從原始變量中導(dǎo)出少數(shù)幾個主分量,使它們盡可能多地保留原始變量的信息,且彼此間互不相關(guān)主成分分析的目的:數(shù)據(jù)的壓縮;數(shù)據(jù)的解釋常被用來尋找判斷事物或現(xiàn)象的綜合指標(biāo),并對綜合指標(biāo)所包含的信息進(jìn)行適當(dāng)?shù)慕忉屖裁词侵鞒煞址治觯?/p>

(principalcomponentanalysis)第9頁/共63頁2021-6-20對這兩個相關(guān)變量所攜帶的信息(在統(tǒng)計上信息往往是指數(shù)據(jù)的變異)進(jìn)行濃縮處理假定只有兩個變量x1和x2,從散點圖可見兩個變量存在相關(guān)關(guān)系,這意味著兩個變量提供的信息有重疊主成分分析的基本思想

(以兩個變量為例)如果把兩個變量用一個變量來表示,同時這一個新的變量又盡可能包含原來的兩個變量的信息,這就是降維的過程第10頁/共63頁2021-6-20橢圓中有一個長軸和一個短軸,稱為主軸。在長軸方向,數(shù)據(jù)的變化明顯較大,而短軸方向變化則較小如果沿著長軸方向設(shè)定一個新的坐標(biāo)系,則新產(chǎn)生的兩個變量和原始變量間存在一定的數(shù)學(xué)換算關(guān)系,同時這兩個新變量之間彼此不相關(guān),而且長軸變量攜帶了大部分的數(shù)據(jù)變化信息,而主成分分析的基本思想

(以兩個變量為例)

短軸變量只攜帶了一小部分變化的信息(變異)此時,只需要用長軸方向的變量就可以代表原來兩個變量的信息。這樣也就把原來的兩個變量降維成了一個變量。長短軸相差越大,降維也就越合理第11頁/共63頁2021-6-20多維變量的情形類似,只不過是一個高維橢球,無法直觀地觀察每個變量都有一個坐標(biāo)軸,所以有幾個變量就有幾主軸。首先把橢球的各個主軸都找出來,再用代表大多數(shù)數(shù)據(jù)信息的最長的幾個軸作為新變量,這樣,降維過程也就完成了主成分分析的基本思想

(以兩個變量為例)找出的這些新變量是原來變量的線性組合,叫做主成分第12頁/共63頁12.1.2主成分分析的數(shù)學(xué)模型12.1主成分分析第13頁/共63頁2021-6-20數(shù)學(xué)上的處理是將原始的p個變量作線性組合,作為新的變量設(shè)p個原始變量為,新的變量(即主成分)為,主成分和原始變量之間的關(guān)系表示為主成分分析的數(shù)學(xué)模型主成分分析的數(shù)學(xué)模型aij為第i個主成分yi和原來的第j個變量xj之間的線性相關(guān)系數(shù),稱為載荷(loading)。比如,a11表示第1主成分和原來的第1個變量之間的相關(guān)系數(shù),a21表示第2主成分和原來的第1個變量之間的相關(guān)系數(shù)第14頁/共63頁2021-6-20選擇幾個主成分?選擇標(biāo)準(zhǔn)是什么?被選的主成分所代表的主軸的長度之和占了主軸總程度之和的大部分在統(tǒng)計上,主成分所代表的原始變量的信息用其方差來表示。因此,所選擇的第一個主成分是所有主成分中的方差最大者,即Var(yi)最大如果第一個主成分不足以代表原來的個變量,在考慮選擇第二個主成分,依次類推這些主成分互不相關(guān),且方差遞減主成分的選擇第15頁/共63頁2021-6-20究竟選擇幾個主成分才合適呢?一般要求所選主成分的方差總和占全部方差的80%以上就可以了。當(dāng)然,這只是一個大體標(biāo)準(zhǔn),具體選擇幾個要看實際情況如果原來的變量之間的相關(guān)程度高,降維的效果就會好一些,所選的主成分就會少一些,如果原來的變量之間本身就不怎么相關(guān),降維的效果自然就不好不相關(guān)的變量就只能自己代表自己了主成分的選擇第16頁/共63頁12.1.3主成分分析的步驟12.1主成分分析第17頁/共63頁2021-6-20對原來的p個指標(biāo)進(jìn)行標(biāo)準(zhǔn)化,以消除變量在水平和量綱上的影響根據(jù)標(biāo)準(zhǔn)化后的數(shù)據(jù)矩陣求出相關(guān)系數(shù)矩陣求出協(xié)方差矩陣的特征根和特征向量確定主成分,并對各主成分所包含的信息給予適當(dāng)?shù)慕忉屩鞒煞址治龅牟襟E第18頁/共63頁2021-6-20【例12-1】根據(jù)我國31個省市自治區(qū)2006年的6項主要經(jīng)濟(jì)指標(biāo)數(shù)據(jù),進(jìn)行主成分分析,找出主成分并進(jìn)行適當(dāng)?shù)慕忉屩鞒煞址治?/p>

(實例分析)

31個地區(qū)的6項經(jīng)濟(jì)指標(biāo)SPSS第19頁/共63頁2021-6-20第1步

選擇【Analyze】下拉菜單,并選擇【DataReduction-Factor】,進(jìn)入主對話框第2步在主對話框中將所有原始變量選入【Variables】第3步

點擊【Descriptives】,在【correlationMatrix】下選擇

【Coefficirnts】,點擊【Continue】回到主對話框第4步點擊【Extraction】,在【Display】下選擇【ScreePlot】,點擊【Continue】回到主對話框第5步點擊【Rotation】,在【Display】下選擇【LoadingPlot】,點擊【Continue】回到主對話框點擊【OK】用SPSS進(jìn)行主成分分析主成分分析SPSS第20頁/共63頁2021-6-20SPSS的輸出結(jié)果各變量之間的相關(guān)系數(shù)矩陣變量之間的存在較強(qiáng)的相關(guān)關(guān)系,適合作主成分分析

第21頁/共63頁2021-6-20SPSS的輸出結(jié)果

(選擇主成分)各主成分所解釋的原始變量的方差該表是選則主成分的主要依據(jù)第22頁/共63頁2021-6-20“InitialEigenvalues”(初始特征根)

實際上就是本例中的6個主軸的長度特征根反映了主成分對原始變量的影響程度,表示引入該主成分后可以解釋原始變量的信息特征根又叫方差,某個特征根占總特征根的比例稱為主成分方差貢獻(xiàn)率設(shè)特征根為,則第i個主成分的方差貢獻(xiàn)率為比如,第一個主成分的特征根為3.963,占總特征根的的比例(方差貢獻(xiàn)率)為66.052%,這表示第一個主成分解釋了原始6個變量66.052%的信息,可見第一個主成分對原來的6個變量解釋的已經(jīng)很充分了根據(jù)什么選擇主成分?第23頁/共63頁2021-6-20根據(jù)主成分貢獻(xiàn)率一般來說,主成分的累計方差貢獻(xiàn)率達(dá)到80%以上的前幾個主成分,都可以選作最后的主成分比如表13.3中前兩個主成分的累計方差貢獻(xiàn)率為95.57%根據(jù)特特征根的大小一般情況下,當(dāng)特征根小于1時,就不再選作主成分了,因為該主成分的解釋力度還不如直接用原始變量解的釋力度大比如表13.3中除前兩個外,其他主成分的特征根都小于1。所以SPSS只選擇了兩個主成分就本例而言,兩個主成分就足以說明各地區(qū)的經(jīng)濟(jì)發(fā)展?fàn)顩r了根據(jù)什么選擇主成分?第24頁/共63頁2021-6-20SPSS還提供了一個更為直觀的圖形工具來幫助選擇主成分,即碎石圖(ScreePlot)從碎石圖可以看到6個主軸長度變化的趨勢實踐中,通常結(jié)合具體情況,選擇碎石圖中變化趨勢出現(xiàn)拐點的前幾個主成分作為原先變量的代表,該例中選擇前兩個主成分即可根據(jù)什么選擇主成分?

(ScreePlot)拐點第25頁/共63頁2021-6-20怎樣解釋主成分?主成分的因子載荷矩陣表1中的每一列表示一個主成分作為原來變量線性組合的系數(shù),也就是主成分分析模型中的系數(shù)aij比如,第一主成分所在列的系數(shù)0.670表示第1個主成分和原來的第一個變量(人均GDP)之間的線性相關(guān)系數(shù)。這個系數(shù)越大,說明主成分對該變量的代表性就越大第26頁/共63頁2021-6-20根據(jù)主成分分析模型和因子載荷,可以得到兩個主成分與原來6個變量之間的線性組合表達(dá)式如下怎樣解釋主成分?

(主成分與原始變量的關(guān)系)注意:表達(dá)式中的不是原始變量,而是標(biāo)準(zhǔn)化變量第27頁/共63頁2021-6-20載荷圖(LoadingPlot)直觀顯示主成分對原始6變量的解釋情況圖中橫軸表示第一個主成分與原始變量間的相關(guān)系數(shù);縱軸表示第二個主成分與原始變量之間的相關(guān)系數(shù)每一個變量對應(yīng)的主成分載荷就對應(yīng)坐標(biāo)系中的一個點,比如,人均GDP變量對應(yīng)的點是(0.670,0.725)第一個主成分很充分地解釋了原始的6個變量(與每個原始變量都有較強(qiáng)的正相關(guān)關(guān)系),第二個主成分則較好地解釋了居民消費水平、人均GDP和年末總?cè)丝谶@3個變量(與它們的相關(guān)關(guān)系較高),而與其他變量的關(guān)系則較弱(相關(guān)系數(shù)的點靠近坐標(biāo)軸)怎樣解釋主成分?

(LoadingPlot)相關(guān)系數(shù)的點越遠(yuǎn)離坐標(biāo)軸,主成分對原始變量的代表性就越大。這3個點遠(yuǎn)離主成分2的坐標(biāo)第28頁/共63頁12.2因子分析

12.2.1因子分析的意義和數(shù)學(xué)模型

12.2.2因子分析的步驟

12.2.3因子分析的應(yīng)用第12章主成分分析和因子分析第29頁/共63頁12.2.1因子分析的意義和數(shù)學(xué)模型12.2因子分析第30頁/共63頁2021-6-20由CharlesSpearman于1904年首次提出的與主成分分析類似,它們都是要找出少數(shù)幾個新的變量來代替原始變量不同之處:主成分分析中的主成分個數(shù)與原始變量個數(shù)是一樣的,即有幾個變量就有幾個主成分,只不過最后我們確定了少數(shù)幾個主成分而已。而因子分析則需要事先確定要找?guī)讉€成分,也稱為因子(factor),然后將原始變量綜合為少數(shù)的幾個因子,以再現(xiàn)原始變量與因子之間的關(guān)系,一般來說,因子的個數(shù)會遠(yuǎn)遠(yuǎn)少于原始變量的個數(shù)什么是因子分析?

(factoranalysis)第31頁/共63頁2021-6-20因子分析可以看作是主成分分析的推廣和擴(kuò)展,但它對問題的研究更深入、更細(xì)致一些。實際上,主成分分析可以看作是因子分析的一個特例通過對變量之間關(guān)系的研究,找出能綜合原始變量的少數(shù)幾個因子,使得少數(shù)因子能夠反映原始變量的絕大部分信息,然后根據(jù)相關(guān)性的大小將原始變量分組,使得組內(nèi)的變量之間相關(guān)性較高,而不同組的變量之間相關(guān)性較低屬于多元統(tǒng)計中處理降維的一種統(tǒng)計方法,其目的就是要減少變量的個數(shù),用少數(shù)因子代表多個原始變量什么是因子分析?

(factoranalysis)第32頁/共63頁2021-6-20因變量和因子個數(shù)的不一致,使得不僅在數(shù)學(xué)模型上,而且在實際求解過程中,因子分析和主成分分析都有著一定的區(qū)別,計算上因子分析更為復(fù)雜因子分析可能存在的一個優(yōu)點是:在對主成分和原始變量之間的關(guān)系進(jìn)行描述時,如果主成分的直觀意義比較模糊不易解釋,主成分分析沒有更好的改進(jìn)方法;因子分析則額外提供了“因子旋轉(zhuǎn)(factorrotation)”這樣一個步驟,可以使分析結(jié)果盡可能達(dá)到易于解釋且更為合理的目的因子分析的數(shù)學(xué)模型第33頁/共63頁2021-6-20原始的p個變量表達(dá)為k個因子的線性組合變量設(shè)p個原始變量為,要尋找的k個因子(k<p)為,主成分和原始變量之間的關(guān)系表示為因子分析的數(shù)學(xué)模型因子分析的數(shù)學(xué)模型系數(shù)aij為第個i變量與第k個因子之間的線性相關(guān)系數(shù),反映變量與因子之間的相關(guān)程度,也稱為載荷(loading)。由于因子出現(xiàn)在每個原始變量與因子的線性組合中,因此也稱為公因子。為特殊因子,代表公因子以外的因素影響第34頁/共63頁2021-6-20共同度量(Communality)因子的方差貢獻(xiàn)率因子分析的數(shù)學(xué)模型

(共同度量Communality和公因子的方差貢獻(xiàn)率)變量xi的信息能夠被k個公因子解釋的程度,用k個公因子對第i個變量xi的方差貢獻(xiàn)率表示第j個公因子對變量xi的提供的方差總和,反映第j個公因子的相對重要程度第35頁/共63頁12.2.2因子分析的步驟12.2因子分析第36頁/共63頁2021-6-20因子分析要求樣本的個數(shù)要足夠多一般要求樣本的個數(shù)至少是變量的5倍以上。同時,樣本總數(shù)據(jù)量理論要求應(yīng)該在100以上用于因子分析的變量必須是相關(guān)的如果原始變量都是獨立的,意味著每個變量的作用都是不可替代的,則無法降維檢驗方法計算各變量之間的相關(guān)矩陣,觀察各相關(guān)系數(shù)。若相關(guān)矩陣中的大部分相關(guān)系數(shù)小于0.3,則不適合作因子分析使用Kaiser-Meyer-Olkin檢驗(簡稱KMO檢驗)和Bartlett球度檢驗(Bartlett’stestofsphericity)來判斷(SPSS將兩種檢驗統(tǒng)稱為“KMOandBartlett’stestofsphericity”)因子分析的步驟

(數(shù)據(jù)檢驗)第37頁/共63頁2021-6-20Bartlett球度檢驗以變量的相關(guān)系數(shù)矩陣為基礎(chǔ),假設(shè)相關(guān)系數(shù)矩陣是單位陣(對角線元素不為0,非對角線元素均為0)。如果相關(guān)矩陣是單位陣,則各變量是獨立的,無法進(jìn)行因子分析KMO檢驗用于檢驗變量間的偏相關(guān)性,KMO統(tǒng)計量的取值在0~1之間如果統(tǒng)計量取值越接近1,變量間的偏相關(guān)性越強(qiáng),因子分析的效果就越好KMO統(tǒng)計量在0.7以上時,因子分析效果較好;KMO統(tǒng)計量在0.5以下時,因子分析效果很差因子分析的步驟

(數(shù)據(jù)檢驗)第38頁/共63頁2021-6-20Principalcomponents(主成分法):多數(shù)情況下可以使用該方法(這也是SPSS的默認(rèn)選項)。通過主成分分析的思想提取公因子,它假設(shè)變量是因子的線性組合UnweightLeastSquare(不加權(quán)最小平方法):該方法使實際的相關(guān)矩陣和再生的相關(guān)矩陣之差的平方和達(dá)到最小GeneralizedLeastSquare(加權(quán)最小平方法):用變量值進(jìn)行加權(quán),該方法也是使實際的相關(guān)矩陣和再生的相關(guān)矩陣之差的平方和達(dá)到最小MaximumLikelihood(最大似然法):該方法不要求數(shù)據(jù)服從正態(tài)分布,在樣本量較大時使用較好PrincipalAxisFactoring(主軸因子法):該方法從原始變量的相關(guān)性出發(fā),使得變量間的相關(guān)程度盡可能地被公因子解釋因子分析的步驟

(因子提取)第39頁/共63頁2021-6-20因子數(shù)量的確定用公因子方差貢獻(xiàn)率提取:與主成分分析類似,一般累計方差貢獻(xiàn)率達(dá)到80%以上的前幾個因子可以作為最后的公因子用特征根提?。阂话阋笠蜃訉?yīng)的特征根要大于1,因為特征根小于1說明該共因子的解釋力度太弱,還不如使用原始變量的解釋力度大實際應(yīng)用中,因子的提取要結(jié)合具體問題而定,在某種程度上,取決于研究者自身的知識和經(jīng)驗因子分析的步驟

(因子提取)第40頁/共63頁2021-6-20因子命名是因子分析重要一步一個因子包含了多個原始變量的信息,它究竟反映了原始變量的哪些共同信息?因子分析得到的因子的含義是模糊的,需要重新命名,以便對研究的問題作出合理解釋可通過考察觀察因子載荷矩陣并結(jié)合實際問題完成命名已經(jīng)不是統(tǒng)計問題。它需要研究者自身的專業(yè)素質(zhì)和對實際問題背景的了解程度,這需要更多的實踐經(jīng)驗因子分析的步驟

(因子命名)第41頁/共63頁2021-6-20觀察因子載荷矩陣如果因子載荷aij的絕對值在第i行的多個列上都有較大的取值(通常大于0.5),表明原始變量與多個因子都有較大的相關(guān)關(guān)系,意味著原始變量xi需要由多個因子來共同解釋如果因子載荷aij的絕對值在第j列的多個行上都有較大的取值,則表因子fi能共同解釋許多變量的信息,而對每個原始變量只能解釋其中的少部分信息,表明因子不能有效代表任何一個原始變量,因子的含義模糊不清,難以對因子給出一個合理的解釋需要進(jìn)行因子旋轉(zhuǎn),以便得到更加合理的解釋因子分析的步驟

(因子命名)第42頁/共63頁2021-6-20因子旋轉(zhuǎn)(factorrotation)的目的是使因子的含義更加清楚,以便于對因子的命名和解釋旋轉(zhuǎn)的方法有正交旋轉(zhuǎn)和斜交旋轉(zhuǎn)兩種正交旋轉(zhuǎn)是指坐標(biāo)軸始終保持垂直90度旋轉(zhuǎn),這樣新生成的因子仍可保持不相關(guān)斜交旋轉(zhuǎn)坐標(biāo)軸的夾角可以是任意的,因此新生成的因子不能保證不相關(guān)。因此實際應(yīng)用中更多地使用正交旋轉(zhuǎn)SPSS提供5種旋轉(zhuǎn)方法,其中最常用的是Varimax(方差最大正交旋轉(zhuǎn))法因子分析的步驟

(因子命名—旋轉(zhuǎn))第43頁/共63頁2021-6-20Varimax(方差最大正交旋轉(zhuǎn)):最常用的旋轉(zhuǎn)方法。使各因子保持正交狀態(tài),但盡量使各因子的方法達(dá)到最大,即相對的載荷平方和達(dá)到最大,從而方便對因子的解釋Quartimax(四次方最大正交旋轉(zhuǎn)):該方法傾向于減少和每個變量有關(guān)的因子數(shù),從而簡化對原變量的解釋Equamax(平方最大正交旋轉(zhuǎn)):該方法介于方差最大正交旋轉(zhuǎn)和四次方最大正交旋轉(zhuǎn)之間DirectOblimin(斜交旋轉(zhuǎn)):該方法需要事先指定一個因子映像的自相關(guān)范圍Promax:該方法在方差最大正交旋轉(zhuǎn)的基礎(chǔ)上進(jìn)行斜交旋轉(zhuǎn)因子分析的步驟

(因子命名—旋轉(zhuǎn))第44頁/共63頁2021-6-20因子得分(factorscore)是每個因子在每個樣本上的具體取值,它由下列因子得分函數(shù)給出因子分析的步驟

(計算因子得分)因子得分函數(shù)因子得分是各變量的線性組合第45頁/共63頁12.2.3因子分析的應(yīng)用12.2因子分析第46頁/共63頁2021-6-20【例12-2】根據(jù)我國31個省市自治區(qū)2006年的6項主要經(jīng)濟(jì)指標(biāo)數(shù)據(jù),進(jìn)行因子分析,對因子進(jìn)行命名和解釋,并計算因子得分和排序因子分析

(實例分析)31個地區(qū)6項經(jīng)濟(jì)指標(biāo)的因子分析SPSS第47頁/共63頁2021-6-20用SPSS進(jìn)行因子分析第1步

選擇【Analyze】【DataReduction-Factor】主對話框。將所有原始變量選入【Variables】第2步

點擊【Descriptives】【correlationMatrix】【KMOandBartlett’stestofsphericity】(其他選項根據(jù)需要)【Continue】第3步

點擊【Extraction】,在【Method】框中選擇因子的提取方法(本例使用隱含的Principalcomponents);在【Extract】中輸入選擇因子的最小特征根(隱含的是特征根大于1);在【Display】下選擇

【ScreePlot】【Continue】第4步

點擊【Rotation】,在【Method】框中選擇因子旋轉(zhuǎn)方法(隱含的不旋轉(zhuǎn),本例選擇【Varimax】);在【Display】下選擇【LoadingPlot】【Continue】第5步

點擊【Scores】,并選中【DisplayfactorScorecoefficientmatrix】(SPSS隱含的估計因子得分系數(shù)的方法是Regression)

【Continue】【OK】因子分析SPSS第48頁/共63頁2021-6-20

數(shù)據(jù)的相關(guān)性檢驗因子分析

(實例分析)KMO檢驗和Bartlett球度檢驗

Bartlett球度檢驗統(tǒng)計量為277.025。檢驗的P值接近0。表明6個變量之間有較強(qiáng)的相關(guān)關(guān)系。而KMO統(tǒng)計量為0.695,接近0.7。適合作因子分析

第49頁/共63頁2021-6-20

共同度量

因子分析

(實例分析)

變量共同度量

所有變量的共同度量都在80%以上,因此,提取出的公因子對原始變量的解釋能力應(yīng)該是很強(qiáng)的

第50頁/共63頁2021-6-20

因子方差貢獻(xiàn)率

因子分析

(實例分析)各因子所解釋的原始變量的方差除最后3列外,其余部分與主成分分析中的表相同。“RotationSumsofSquaredLoadings”部分是因子旋轉(zhuǎn)后對原始變量方差的解釋情況。旋轉(zhuǎn)后的累計方差沒有改變,只是兩個因子所解釋的原始變量的方差發(fā)生了一些變化。

第51頁/共63頁2021-6-20

Varimax法得到的旋轉(zhuǎn)后的因子載荷矩陣

因子分析

(實例分析)旋轉(zhuǎn)后的因子載荷矩陣第一個因子與年末總?cè)丝?、固定資產(chǎn)投資、社會消費品零售總額、財政收入這幾個載荷系數(shù)較大,主要解釋了這幾個變量。從實際意義上看,可以把因子1姑且命名為“經(jīng)濟(jì)水平”因子。而第二個因子與人均GDP、居民消水平這兩個變量的載荷系數(shù)較大,主要解釋了這兩個變量,從實際意義看,可以將因子2姑且命名為“消費水平”因子

(是否合理讀者自己評判)第52頁/共63頁2021-6-20原始的6個變量與兩個因子的關(guān)系(模型表達(dá))因子分析

(實例分析)因子分析的數(shù)學(xué)模型表達(dá)式中的xi已經(jīng)不是原始變量,而是標(biāo)準(zhǔn)化變量

第53頁/共63頁2021-6-20

旋轉(zhuǎn)后的因子載荷圖因子分析

(實例分析)旋轉(zhuǎn)后的因子載荷系數(shù)更加接近于1(如果旋轉(zhuǎn)后的因子載荷系數(shù)向0—1分化越明顯,說明旋轉(zhuǎn)的效果越好),從而使因子的意義更加清楚了

第54頁

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論