多元統(tǒng)計分析因子分析_第1頁
多元統(tǒng)計分析因子分析_第2頁
多元統(tǒng)計分析因子分析_第3頁
多元統(tǒng)計分析因子分析_第4頁
多元統(tǒng)計分析因子分析_第5頁
已閱讀5頁,還剩57頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

多元統(tǒng)計分析因子分析第1頁,共62頁,2023年,2月20日,星期四2第一節(jié)因子分析的基本思想第2頁,共62頁,2023年,2月20日,星期四3因子分析的基本思想因子分析是根據(jù)相關矩陣內部的依賴關系,把一些具有錯綜復雜關系的變量綜合為數(shù)量較少的幾個因子。通過不同因子來分析決定某些變量的本質及其分類的一種統(tǒng)計方法。簡單地說,就是根據(jù)相關性大小把變量分組,使得同組內的變量之間相關性較高,不同組的變量相關性較低。每組變量代表一個基本結構,這個基本結構稱為因子。第3頁,共62頁,2023年,2月20日,星期四4例如某機關對其職員就以下6個方面進行考核,這6個方面是職員的詞匯、閱讀、寫作能力,以及數(shù)字、代數(shù)、微積分的運算能力。而這6個方面可歸結為職員的語文能力和數(shù)學能力兩個方面。第4頁,共62頁,2023年,2月20日,星期四5例如某公司與48名申請工作的人進行面談,然后就申請人十五個方面進行打分,這十五個方面分別是:申請書的形式、外貌、學術能力、討人喜歡的能力、自信心、洞察力、誠實、推銷能力、經(jīng)驗、工作積極性、抱負、理解能力、潛力、入圍公司的強烈程度、適應性。這15個方面可歸結為應聘者的外露能力、討人喜歡的能力、經(jīng)驗、專業(yè)能力這4個方面。第5頁,共62頁,2023年,2月20日,星期四6因子分析(factoranalysis)是一種數(shù)據(jù)簡化的技術。它通過研究眾多變量之間的內部依賴關系,探求觀測數(shù)據(jù)中的基本結構,并用少數(shù)幾個假想變量來表示其基本的數(shù)據(jù)結構。這幾個假想變量能夠反映原來眾多變量的主要信息。原始的變量是可觀測的顯在變量,而假想變量是不可觀測的潛在變量,稱為因子。

例如,在企業(yè)形象或品牌形象的研究中,消費者可以通過一個有24個指標構成的評價體系,評價百貨商場的24個方面的優(yōu)劣。第6頁,共62頁,2023年,2月20日,星期四7但消費者主要關心的是三個方面,即商店的環(huán)境、商店的服務和商品的價格。因子分析方法可以通過24個變量,找出反映商店環(huán)境、商店服務水平和商品價格的三個潛在的因子,對商店進行綜合評價。而這三個公共因子可以表示為:

稱是不可觀測的潛在因子。24個變量共享這三個因子,但是每個變量又有自己的個性,不被包含的部分,稱為特殊因子。第7頁,共62頁,2023年,2月20日,星期四8注意:因子分析與回歸分析不同,因子分析中的因子是一個比較抽象的概念,而回歸因子有非常明確的實際意義。主成分分析分析與因子分析也有不同,主成分分析僅僅是變量變換,而因子分析需要構造因子模型。主成分分析:原始變量的線性組合表示新的綜合變量,即主成分。因子分析:潛在的假想變量和隨機影響變量的線性組合表示原始變量。第8頁,共62頁,2023年,2月20日,星期四9第二節(jié)

因子分析模型

一、數(shù)學模型

設個變量,如果表示為第9頁,共62頁,2023年,2月20日,星期四10

稱為公共因子,是不可觀測的變量,他們的系數(shù)稱為因子載荷。是特殊因子,是不能被前m個公共因子包含的部分。并且滿足:即不相關;第10頁,共62頁,2023年,2月20日,星期四11即互不相關,方差為1。第11頁,共62頁,2023年,2月20日,星期四12即互不相關,方差不一定相等,。第12頁,共62頁,2023年,2月20日,星期四13用矩陣的表達方式第13頁,共62頁,2023年,2月20日,星期四141、因子載荷aij的統(tǒng)計意義

因子載荷是第i個變量與第j個公共因子的相關系數(shù)

模型為

(載荷矩陣中第i行,第j列的元素)反映了第i個變量與第j個公共因子的相關性。絕對值越大,相關的密切程度越高。

根據(jù)公共因子的模型性質,有

三、因子載荷矩陣中的幾個統(tǒng)計特征第14頁,共62頁,2023年,2月20日,星期四15

因子載荷不是惟一的且滿足因子模型的條件設T為一個p×p的正交矩陣,令A*=AT,,則模型可以表示為第15頁,共62頁,2023年,2月20日,星期四162、變量共同度的統(tǒng)計意義統(tǒng)計意義:兩邊求方差

所有的公共因子和特殊因子對變量的貢獻為1。如果非??拷?,非常小,則因子分析的效果好,從原變量空間到公共因子空間的轉化性質好。定義:變量的共同度是因子載荷矩陣的第i行的元素的平方和。記為第16頁,共62頁,2023年,2月20日,星期四17

3、公共因子方差貢獻的統(tǒng)計意義因子載荷矩陣中各列元素的平方和稱為所有的對的方差貢獻和。衡量的相對重要性。第17頁,共62頁,2023年,2月20日,星期四18第三節(jié)因子載荷矩陣的估計方法

設隨機向量的均值為,協(xié)方差為,

為的特征根,為對應的標準化特征向量,則

主成分分析法第18頁,共62頁,2023年,2月20日,星期四19

上式給出的表達式是精確的,然而,它實際上是毫無價值的,因為我們的目的是尋求用少數(shù)幾個公共因子解釋,故略去后面的p-m項的貢獻,有第19頁,共62頁,2023年,2月20日,星期四20

上式有一個假定,模型中的特殊因子是不重要的,因而從的分解中忽略了特殊因子的方差。第20頁,共62頁,2023年,2月20日,星期四21第21頁,共62頁,2023年,2月20日,星期四22

假定某地固定資產(chǎn)投資率,通貨膨脹率,失業(yè)率,相關系數(shù)矩陣為試用主成分分析法求因子分析模型。第22頁,共62頁,2023年,2月20日,星期四23

特征根為:第23頁,共62頁,2023年,2月20日,星期四24

可取前兩個因子F1和F2為公共因子,第一公因子F1物價就業(yè)因子,對X的貢獻率為51.67%。第二公因子F2為投資因子,對X的貢獻為28.33%。共同度分別為1,0.706,0.706。第24頁,共62頁,2023年,2月20日,星期四25第四節(jié)因子旋轉(正交變換)

因子分析的數(shù)學目的不僅僅要找出公共因子以及對變量進行分組,更重要的要知道每個公共因子的含義,以便進行進一步的分析。如果每個公共因子的含義不清,則不便于進行實際背景的解釋。由于因子載荷陣是不惟一的,所以應該對因子載荷陣進行旋轉。目的是使因子載荷陣的結構簡化,使載荷矩陣每列或行的元素平方值向0和1兩極分化。主要的正交旋轉法有方差最大法和四次方最大法。(一)為什么要旋轉因子第25頁,共62頁,2023年,2月20日,星期四26

百米跑成績跳遠成績鉛球成績跳高成績

400米跑成績百米跨欄鐵餅成績撐桿跳遠成績標槍成績

1500米跑成績

奧運會十項全能運動項目得分數(shù)據(jù)的因子分析

第26頁,共62頁,2023年,2月20日,星期四27

因子載荷矩陣可以看出,除第一因子中所有的變量在公共因子上有較大的正載荷,可以稱為一般運動因子。其他的3個因子不太容易解釋。似乎是跑和投擲的能力對比,似乎是長跑耐力和短跑速度的對比。于是考慮旋轉因子,得下表

第27頁,共62頁,2023年,2月20日,星期四28變量F1F2F3F4共同度X1X2X3X4X5X6X7X8X9X100.8840.6310.2450.2390.7970.4040.186-0.036-0.0480.0450.1360.1940.8250.1500.0750.1530.8140.1760.735-0.0410.1560.5150.2230.7500.1020.6350.1470.7620.1100.112-0.113-0.006-0.1480.0760.468-0.17-0.0790.2170.1410.9340.840.700.810.650.870.620.720.660.570.89第28頁,共62頁,2023年,2月20日,星期四29

通過旋轉,因子有了較為明確的含義。百米跑,跳遠和400米跑,需要爆發(fā)力的項目在有較大的載荷,可以稱為短跑速度因子;鉛球,鐵餅和標槍在上有較大的載荷,可以稱為爆發(fā)性臂力因子;百米跨欄,撐桿跳遠,跳遠和為跳高在上有較大的載荷,爆發(fā)腿力因子;為長跑耐力因子。第29頁,共62頁,2023年,2月20日,星期四30(二)旋轉方法

1、方差最大法2、四次方最大旋轉第30頁,共62頁,2023年,2月20日,星期四31

1、方差最大法

方差最大法從簡化因子載荷矩陣的每一列出發(fā),使和每個因子有關的載荷值平方的方差最大。當只有少數(shù)幾個變量在某個因子上有較高的載荷值時,對因子的解釋最簡單。方差最大的直觀意義是希望通過因子旋轉后,使每個因子上的載荷值盡量拉開距離,一部分的載荷趨于1,另一部分趨于0。第31頁,共62頁,2023年,2月20日,星期四32第32頁,共62頁,2023年,2月20日,星期四33根據(jù)求極值的原理,使

,由此可求出因子軸旋轉角度第33頁,共62頁,2023年,2月20日,星期四34當公共因子個數(shù)m>2時,可以將上述m=2的方法用于逐次對每兩個公共因子進行旋轉。每旋轉一次,V值就會增大,即V是單調不減的,并且V是有界的,因為因子載荷的絕對值不大于1。因此,經(jīng)過若干次旋轉后,V變化相對就不大了,即可停止旋轉。對兩因子的旋轉,第34頁,共62頁,2023年,2月20日,星期四35

2、四次方最大旋轉

四次方最大旋轉是從簡化載荷矩陣的行出發(fā),通過旋轉初始因子,使每個變量只在一個因子上有較高的載荷,而在其它的因子上盡可能低的載荷。如果每個變量只在一個因子上有非零的載荷,這時的因子解釋是最簡單的。四次方最大法通過使因子載荷矩陣中每一行的因子載荷平方的方差達到最大。第35頁,共62頁,2023年,2月20日,星期四36第36頁,共62頁,2023年,2月20日,星期四37旋轉后因子的共同度設正交矩陣,做正交變換旋轉后因子的共同度沒有發(fā)生變化!第37頁,共62頁,2023年,2月20日,星期四38旋轉后公共因子的方差貢獻設正交矩陣,做正交變換旋轉后公共因子的方差貢獻發(fā)生了變化!第38頁,共62頁,2023年,2月20日,星期四39第五節(jié)因子得分

(一)因子得分的概念

前面我們主要解決了用公共因子的線性組合來表示一組觀測變量的有關問題。如果我們要使用這些因子做其他的研究,比如把得到的因子作為自變量來做回歸分析,對樣本進行分類或評價,這就需要我們對公共因子進行測度,即給出公共因子的值。第39頁,共62頁,2023年,2月20日,星期四40

因子分析的數(shù)學模型為:

因子得分函數(shù):可見,要求得每個因子的得分,必須求得分函數(shù)的系數(shù),而由于p>m,所以不能得到精確的得分,只能通過估計。第40頁,共62頁,2023年,2月20日,星期四412、回歸法

1)思想

其中第41頁,共62頁,2023年,2月20日,星期四42第42頁,共62頁,2023年,2月20日,星期四43簡記為其中因此第43頁,共62頁,2023年,2月20日,星期四44而因子載荷陣故第44頁,共62頁,2023年,2月20日,星期四45

人均要素變量因子分析。對我國31個省市自治區(qū)的要素狀況作因子分析。指標體系中有如下指標:X1:人口(萬人)X2:面積(萬平方公里)X3:GDP(億元)X4:人均水資源(立方米/人)X5:人均生物量(噸/人)X6:萬人擁有的大學生數(shù)(人)X7:萬人擁有科學家、工程師數(shù)(人)

RotatedFactorPatternFACTOR1FACTOR2FACTOR3X1-0.21522-0.273970.89092X20.63973-0.28739-0.28755X3-0.157910.063340.94855X40.95898-0.01501-0.07556X50.97224-0.06778-0.17535X6-0.114160.98328-0.08300X7-0.110410.97851-0.07246第45頁,共62頁,2023年,2月20日,星期四46

高載荷指標

因子命名

因子1X2;面積(萬平方公里)X4:人均水資源(立方米/人)X5:人均生物量(噸/人)自然資源因子

因子2X6:萬人擁有的大學生數(shù)(人)X7:萬人擁有的科學家、工程師數(shù)(人)

人力資源因子

因子3

X1;人口(萬人)X3:GDP(億元)經(jīng)濟發(fā)展總量因子

X1=-0.21522F1-0.27397F2+0.89092F3+X2=0.63973F1-0.28739F2-0.28755F3+X3=-0.15791F1+0.06334F2+0.94855F3+X4=0.95898F1-0.01501F2-0.07556F3X5=0.97224F1-0.06778F2-0.17535F3X6=-0.11416F1+0.98328F2-0.08300F3X7=-0.11041F1+0.97851F2-0.07246F3第46頁,共62頁,2023年,2月20日,星期四47

StandardizedScoringCoefficients

FACTOR1

FACTOR2

FACTOR3X10.05764

-0.06098

0.50391X20.22724-0.09901

-0.07713X30.146350.12957

0.59715X40.479200.11228

0.17062X50.455830.07419

0.10129X60.054160.48629

0.04099X70.057900.48562

0.04822F1=0.05764X1+0.22724X2+0.14635X3+0.47920X4+0.45583X5+0.05416X6+0.05790X7F2=-0.06098X1-0.09901X2+0.12957X3+0.11228X4+0.07419X5+0.48629X6+0.48562X7F3=0.50391X1-0.07713X2+0.59715X3+0.17062X4+0.10129X5+0.04099X6+0.04822X7第47頁,共62頁,2023年,2月20日,星期四48REGIONFACTOR1FACTOR2FACTOR3beijing?-0.081694.23473-0.37983tianjin-0.474221.31789-0.87891hebei-0.22192-0.358020.86263shanxi1-0.48214-0.32643-0.54219neimeng0.54446-0.66668-0.92621liaoning-0.205110.463770.34087jilin-0.214990.10608-0.57431heilongj0.10839-0.11717-0.02219shanghai-0.200692.38962-0.04259前三個因子得分第48頁,共62頁,2023年,2月20日,星期四49國民生活質量的因素分析國家發(fā)展的最終目標,是為了全面提高全體國民的生活質量,滿足廣大國民日益增長的物質和文化的合理需求。在可持續(xù)發(fā)展消費的統(tǒng)一理念下,增加社會財富,創(chuàng)自更多的物質文明和精神文明,保持人類的健康延續(xù)和生生不息,在人類與自然協(xié)同進化的基礎上,維系人類與自然的平衡,達到完整的代際公平和區(qū)際公平(即時間過程的最大合理性與空間分布的最大合理化)。從1990年開始,聯(lián)合國開發(fā)計劃署(UYNP)首次采用“人文發(fā)展系數(shù)”指標對于國民生活質量進行測度。人文發(fā)展系數(shù)利用三類內涵豐富的指標組合,即人的健康狀況(使用出生時的人均預期壽命表達)、人的智力程度(使用組合的教育成就表達)、人的福利水平(使用人均國民收入或人均GDP表達),并且特別強調三類指標組合的整體表達內涵,去衡量一個國家或地區(qū)的社會發(fā)展總體狀況以及國民生活質量的總水平。第49頁,共62頁,2023年,2月20日,星期四50在這個指標體系中有如下的指標:X1——預期壽命X2——成人識字率X3——綜合入學率X4——人均GDP(美元)X5——預期壽命指數(shù)X6——教育成就指數(shù)X7——人均GDP指數(shù)第50頁,共62頁,2023年,2月20日,星期四51

旋轉后的因子結構

RotatedFactorPatternFACTOR1FACTOR2FACTOR3

X1

0.38129

0.41765

0.81714

X2

0.12166

0.84828

0.45981

X3

0.64803

0.61822

0.22398

X4

0.90410

0.205310.34100

X5

0.38854

0.43295

0.80848

X6

0.28207

0.85325

0.43289

X7

0.90091

0.20612

0.35052

FACTOR1為經(jīng)濟發(fā)展因子

FACTOR2為教育成就因子

FACTOR3為健康水平因子第51頁,共62頁,2023年,2月20日,星期四52被每個因子解釋的方差和共同度VarianceexplainedbyeachfactorFACTOR1FACTOR2FACTOR3

2.4397002.2763172.009490FinalCommunalityEstimates:Total=6.725507X1X2X3X4X5

0.9875300.9457960.8523060.9758300.992050

X6X7

0.9949950.976999

第52頁,共62頁,2023年,2月20日,星期四53

StandardizedScoringCoefficients標準化得分系數(shù)

FACTOR1FACTOR2FACTOR3X1-0.18875-0.343970.85077X2-0.241090.60335-0.10234X30.354620.50232-0.59895X40.53990-0.17336-0.10355X5-0.17918-0.316040.81490X6-0.092300.62258-0.24876第53頁,共62頁,2023年,2月20日,星期四54第六節(jié)因子分析的步驟、展望和建議

計算所選原始變量的相關系數(shù)矩陣

相關系數(shù)矩陣描述了原始變量之間的相關關系??梢詭椭袛嘣甲兞恐g是否存在相關關系,這對因子分析是非常重要的,因為如果所選變量之間無關系,做因子分析是不恰當?shù)摹2⑶蚁嚓P系數(shù)矩陣是估計因子結構的基礎。

選擇分析的變量用定性分析和定量分析的方法選擇變量,因子分析的前提條件是觀測變量間有較強的相關性,因為如果變量之間無相關性或相關性較小的話,他們不會有共享因子,所以原始變量間應該有較強的相關性。一、因子分析通常包括以下五個步驟第54頁,共62頁,2023年,2月20日,星期四55

提取公共因子

這一步要確定因子求解的方法和因子的個數(shù)。需要根據(jù)研究者的設計方案或有關的經(jīng)驗或知識事先確定。因子個數(shù)的確定可以根據(jù)因子方差的大小。只取方差大于1(或特征值大于1)的那些因子,因為方差小于1的因子其貢獻可能很?。话凑找蜃拥睦塾嫹讲钬暙I率來確定,一般認為要達到70%才能符合要求;

因子旋轉

通過坐標變換使每個原始變量在盡可能少的因子之間有密切的關系,這樣因子解的實際意義更容易解釋,并為每個潛在因子賦予有實際意義的名字。第55頁,共

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論