




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
關(guān)于因子分析與對應(yīng)分析第一頁,共五十八頁,2022年,8月28日主成分分析是將多個指標(biāo)化為少數(shù)相互無關(guān)的綜合指標(biāo)的統(tǒng)計方法,通常數(shù)學(xué)上的處理就是將原來的p個指標(biāo)做線性組合,作為新的綜合指標(biāo),記第一個綜合指標(biāo)為F1。選取這個線性組合的原則是令F1的方差最大,稱F1為第一主成分;然后選取第二主成分F2,且F1與F2的協(xié)方差為0,類似構(gòu)造其余的主成分。主成分分析——【Factor】過程對觀測量數(shù)目沒有嚴(yán)格要求第二頁,共五十八頁,2022年,8月28日第一節(jié)因子分析——【Factor】過程
主成分分析的推廣和發(fā)展,對觀測量數(shù)目要求至少是變量的5倍以上,且越多越好
一、因子分析簡介做什么?因子分析是多元統(tǒng)計分析中處理降維的一種統(tǒng)計方法,它主要將具有錯綜復(fù)雜關(guān)系的變量或者樣品綜合為數(shù)量較少的幾個因子,以再現(xiàn)原始變量與因子之間的相互關(guān)系?;舅枷耄海?)首先,通過變量(或樣品)的相關(guān)系數(shù)矩陣(或相似系數(shù)矩陣)內(nèi)部結(jié)構(gòu)的研究,找出能控制所有變量(或樣品)的少數(shù)幾個隨機(jī)變量(常稱為因子)去描述多個變量(或樣品)之間的相關(guān)(相似)關(guān)系;(2)然后,根據(jù)相關(guān)性(或相似性)的大小把變量(或樣品)分組,使得同組內(nèi)的變量(或樣品)之間的相關(guān)性(或相似性)較高,但不同組的變量相關(guān)性(或相似性)較低。第三頁,共五十八頁,2022年,8月28日依據(jù)處理的對象不同,可以分為兩類:
R型因子分析,對變量做降維處理
Q型因子分析,對樣本做降維處理R型因子分析第四頁,共五十八頁,2022年,8月28日第五頁,共五十八頁,2022年,8月28日因子分析的幾個概念:1、因子載荷第六頁,共五十八頁,2022年,8月28日2、變量共同度
第七頁,共五十八頁,2022年,8月28日3、公因子Fj的方差貢獻(xiàn)第八頁,共五十八頁,2022年,8月28日4、因子旋轉(zhuǎn)因子旋轉(zhuǎn)的目的是為了使得因子載荷陣的結(jié)構(gòu)簡化,便于對公共因子進(jìn)行解釋。這里所謂的結(jié)構(gòu)簡化是使每個變量僅在一個公共因子上有較大的載荷,而在其余公共因子上載荷比較小。這種變換因子載荷陣的方法稱為因子軸的旋轉(zhuǎn)。旋轉(zhuǎn)的方法有很多種,如正交旋轉(zhuǎn),斜交旋軸等。第九頁,共五十八頁,2022年,8月28日5、因子得分第十頁,共五十八頁,2022年,8月28日因子分析的一般步驟第十一頁,共五十八頁,2022年,8月28日二、引例(練習(xí)一)例1利用因子分析過程分析各個城市的市政設(shè)施建設(shè)情況。數(shù)據(jù)文件:“各地區(qū)城市市政設(shè)施.sav”,下表是部分?jǐn)?shù)據(jù)。第十二頁,共五十八頁,2022年,8月28日【Analyze】/【DataReduction】/【Factor】要求:選入分析變量(因子分析的變量)(定義記錄旋轉(zhuǎn)條件)第十三頁,共五十八頁,2022年,8月28日要求:輸出相關(guān)系數(shù)矩陣;進(jìn)行因子分析適用條件的檢驗(yàn)Descriptives:選擇需要輸出的統(tǒng)計量(統(tǒng)計量)單變量描述統(tǒng)計量:各分析變量的均值、標(biāo)準(zhǔn)差及觀測數(shù)原始分析結(jié)果:原變量的公因子方差、與變量相同個數(shù)的因子、各因子的特征根及其所占總方差的百分比和累計百分比(相關(guān)矩陣)所有變量間的相關(guān)系數(shù)矩陣顯著性水平相關(guān)系數(shù)矩陣的行列式值KMO檢驗(yàn)和Bartlett球形檢驗(yàn)相關(guān)系數(shù)矩陣的逆矩陣再生相關(guān)系數(shù)矩陣反映像協(xié)方差陣和相關(guān)陣第十四頁,共五十八頁,2022年,8月28日要求:輸出碎石圖Extraction:選擇因子提取的方法(選擇公共因子的提取方法)公共因子的提取方法:(1)主成分分析法(默認(rèn));(2)不加權(quán)最小二乘法;(3)廣義最小二乘法;(4)極大似然法;(5)主軸因子法;(6)因子法;(7)影像因子法相關(guān)矩陣協(xié)方差矩陣(設(shè)定公共因子提取標(biāo)準(zhǔn))顯示未經(jīng)旋轉(zhuǎn)變換的因子提取結(jié)果顯示碎石圖,體現(xiàn)各因子重要程度自定義提取因子的數(shù)量以特征根大于指定數(shù)值為提取標(biāo)準(zhǔn)(收斂時的最大迭代次數(shù))第十五頁,共五十八頁,2022年,8月28日Rotation:選擇因子旋轉(zhuǎn)的方法方差最大化正交旋轉(zhuǎn)斜交旋轉(zhuǎn)法四分旋轉(zhuǎn)法平均正交旋轉(zhuǎn)法斜交旋轉(zhuǎn)法(設(shè)置旋轉(zhuǎn)解的輸出)(因子旋轉(zhuǎn)的方法)輸出主成分轉(zhuǎn)換矩陣輸出二維或三維的因子載荷圖第十六頁,共五十八頁,2022年,8月28日要求:輸出因子得分系數(shù)矩陣FactorScores:因子得分(在數(shù)據(jù)文件中建立一個新變量,用于保存各觀測量的因子得分)(因子得分計算方法)回歸法巴特列特法安德森-魯賓法(輸出因子得分系數(shù)矩陣及因子協(xié)方差矩陣)第十七頁,共五十八頁,2022年,8月28日要求:用均值代替缺失值Options對話框(選擇缺失值處理方法)(選擇系數(shù)的輸出方式)因子載荷矩陣和結(jié)構(gòu)矩陣按數(shù)值大小排序不顯示絕對值小于指定數(shù)的載荷系數(shù)第十八頁,共五十八頁,2022年,8月28日變量間相關(guān)性很高結(jié)果解讀:1、相關(guān)系數(shù)矩陣表第十九頁,共五十八頁,2022年,8月28日接近0.9,適合做因子分析拒絕原假設(shè),認(rèn)為各變量之間不獨(dú)立2、KMO檢驗(yàn)和Bartlett球形檢驗(yàn)結(jié)果表注:
KMO檢驗(yàn)用于檢驗(yàn)變量間的偏相關(guān)系數(shù)是否過小,一般,KMO大于0.9時效果最佳,小于0.5時不適宜做因子分析。
Bartlett球形檢驗(yàn)用于檢驗(yàn)相關(guān)系數(shù)矩陣是否是單位陣,如果結(jié)論是不拒絕該假設(shè),則表示各個變量都是各自獨(dú)立的。第二十頁,共五十八頁,2022年,8月28日該變量95.4%的信息已經(jīng)被提取3、變量共同度表給出了提取公共因子前后各變量的共同度(衡量公共因子的相對重要性指標(biāo))說明:比如變量X1的共同度位0.954,即提取的公共因子對變量X1的方差做出了95.4%的貢獻(xiàn)。第二十一頁,共五十八頁,2022年,8月28日4、主成分表列出了所有的主成分,且按照特征根從大到小次序排列。說明:第一主成分特征根為5.280,方差貢獻(xiàn)率為88.001%,前兩個主成分的累計貢獻(xiàn)率為94.504%,根據(jù)提取因子的條件——特征值大于1,本例只選出一個因子。第二十二頁,共五十八頁,2022年,8月28日提取一個主成分即可5、碎石圖按照特征根大小排列的主成分散點(diǎn)圖??v坐標(biāo)為特征值,橫坐標(biāo)為因子數(shù)。第二十三頁,共五十八頁,2022年,8月28日6、因子負(fù)荷矩陣用來反映各個變量的變異主要由哪些因子解釋。第二十四頁,共五十八頁,2022年,8月28日7、因子得分系數(shù)矩陣得出用各個變量的線性組合表達(dá)的主成分。第二十五頁,共五十八頁,2022年,8月28日8、因子得分的協(xié)方差矩陣反映各因子間的聯(lián)系程度。注:本例只提取了一個公共因子,故表格內(nèi)容無實(shí)際意義。第二十六頁,共五十八頁,2022年,8月28日例2利用因子分析過程分析一年內(nèi)各個城市的日照情況。數(shù)據(jù)文件:“主要城市日照數(shù).sav”?!続nalyze】/【DataReduction】/【Factor】要求:選入分析變量第二十七頁,共五十八頁,2022年,8月28日要求:輸出因子分析適用條件的檢驗(yàn)第二十八頁,共五十八頁,2022年,8月28日要求:輸出碎石圖第二十九頁,共五十八頁,2022年,8月28日要求:輸出因子得分系數(shù)陣第三十頁,共五十八頁,2022年,8月28日要求:采用方差最大化正交旋轉(zhuǎn);輸出因子載荷圖第三十一頁,共五十八頁,2022年,8月28日結(jié)果解讀:1、KMO檢驗(yàn)和Bartlett球形檢驗(yàn)結(jié)果表說明:KMO檢驗(yàn)結(jié)果為0.798,大于0.5,比較適合作因子分析;Bartlett球形檢驗(yàn)的Sig.值為0,各變量不獨(dú)立。第三十二頁,共五十八頁,2022年,8月28日2、變量共同度表說明:變量“Jan”的共同度為0.915,即選取的公共因子提取了變量“Jan”91.5%的信息。第三十三頁,共五十八頁,2022年,8月28日3、主成分表說明:第一主成分特征根為6.854,方差貢獻(xiàn)率為57.041%,前3個主成分的累積貢獻(xiàn)率為84.421%,根據(jù)提取因子的條件——特征值大于1,本例選出3個因子。第三十四頁,共五十八頁,2022年,8月28日4、碎石圖說明:前3個主成分的特征根都在1以上。第三十五頁,共五十八頁,2022年,8月28日5、因子載荷矩陣給出各變量的因子表達(dá)式。第三十六頁,共五十八頁,2022年,8月28日6、旋轉(zhuǎn)后因子載荷矩陣經(jīng)過正交旋轉(zhuǎn)后的因子載荷矩陣,給出旋轉(zhuǎn)后的各變量的因子表達(dá)式。說明:第一主因子主要由前5個變量決定,第二主因子主要由中間4個變量決定,第三主因子主要由最后3個變量決定。第三十七頁,共五十八頁,2022年,8月28日7、因子轉(zhuǎn)換矩陣旋轉(zhuǎn)前的因子載荷矩陣乘以因子轉(zhuǎn)換矩陣等于旋轉(zhuǎn)后的因子載荷矩陣。第三十八頁,共五十八頁,2022年,8月28日8、因子旋轉(zhuǎn)后的因子載荷圖圖中的坐標(biāo)軸就是各個主因子。第三十九頁,共五十八頁,2022年,8月28日9、因子得分系數(shù)矩陣得到因子得分表達(dá)式。第四十頁,共五十八頁,2022年,8月28日10、因子得分的協(xié)方差矩陣說明:因子得分的協(xié)方差矩陣為單位陣,得出提取的3個公共因子之間是不相關(guān)的。第四十一頁,共五十八頁,2022年,8月28日第二節(jié)簡單對應(yīng)分析
——【CorrespondebceAnalysis】過程
又稱列聯(lián)表對應(yīng)分析一、對應(yīng)分析簡介對應(yīng)分析是通過進(jìn)行主成分分析來描述兩個或多個分類變量各水平間相關(guān)性的分析方法,它的分析結(jié)果主要采用反映變量間相互關(guān)系的對應(yīng)分析圖來表示。對應(yīng)分析在SPSS中分為兩類:
簡單對應(yīng)分析——【CorrespondebceAnalysis】過程:主要研究兩個分類變量之間的關(guān)系。
多元對應(yīng)分析——【OptimalScaling】過程第四十二頁,共五十八頁,2022年,8月28日對應(yīng)分析表(列聯(lián)表):第四十三頁,共五十八頁,2022年,8月28日
最后分別對行剖面點(diǎn)集和列剖面點(diǎn)集做主成分分析,以判斷兩個變量的聯(lián)系情況。第四十四頁,共五十八頁,2022年,8月28日例2利用簡單對應(yīng)分析過程分析不同年齡段選民的傾向。數(shù)據(jù)文件:voter.sav二、引例(練習(xí)二)第四十五頁,共五十八頁,2022年,8月28日【Analyze】/【DimensionReduction】/【CorrespondenceAnalysis】要求:選入行變量(取值范圍為1~3)與列變量(取值范圍為1~4)(行變量)定義行變量取值范圍(列變量)定義列變量取值范圍第四十六頁,共五十八頁,2022年,8月28日Model:模式子對話框(設(shè)置分析結(jié)果維數(shù))(選擇距離測量方式)卡方距離歐氏距離,主要用于連續(xù)變量(變量的標(biāo)準(zhǔn)化方式)(正則化方法)對稱法(默認(rèn))第四十七頁,共五十八頁,2022年,8月28日Satistics:設(shè)置需要輸出的統(tǒng)計量輸出對應(yīng)分析表(列聯(lián)表)輸出行點(diǎn)概述表輸出列點(diǎn)概述表輸出行輪廓表輸出列輪廓表指定的前n個維度輸出基于行列得分的原始表格(輸出行點(diǎn)和列點(diǎn)的標(biāo)準(zhǔn)差、以及各維度坐標(biāo)間的相關(guān)系數(shù))第四十八頁,共五十八頁,2022年,8月28日Plots:設(shè)置需要輸出圖形(輸出對應(yīng)分析圖)雙變量散點(diǎn)圖行點(diǎn)圖列點(diǎn)圖限制標(biāo)簽長度輸出各行變量分類對應(yīng)于行得分的散點(diǎn)圖輸出各列變量分類對應(yīng)于列得分的散點(diǎn)圖(圖形維度)輸出分析結(jié)果的所有維度限制輸出維度的數(shù)目第四十九頁,共五十八頁,2022年,8月28日結(jié)果解讀:1、對應(yīng)分析表給出不同年齡階段的人群分別投票給三位總統(tǒng)候選人的人數(shù)。第五十頁,共五十八頁,2022年,8月28日2、結(jié)果匯總表列出維數(shù)、奇異值(慣量的平方根)、慣量(又指特征根)、總的卡方檢驗(yàn)及Sig.值維數(shù)奇異值特征根總的卡方檢驗(yàn)注:慣量用于說明對應(yīng)分析各個維度的結(jié)果能夠解釋列聯(lián)表中兩個變量聯(lián)系的程度。說明:表中兩個維度分別解釋了總信息量的99.6%和0.4%,說明二維圖形完全可以表示兩個變量間的信息,且觀察時以第一維度為主。第五十一頁,共五十八頁,2022年,8月28日3、行點(diǎn)概述表給出行變量的3個分組在兩個維度中的分值每組所占百分比每組所對各個維度的貢獻(xiàn)量(點(diǎn)對維度慣量的貢獻(xiàn)量)(維度對點(diǎn)慣量的貢獻(xiàn)量)分組在第一、第二維度的坐標(biāo)值第五十二頁,共五十八頁,2022年,8月28日4、列點(diǎn)概述表給出列變量的4個分組在兩個維度中的分值每組所占百分比分組在第一、第二維度的坐標(biāo)值每組所對各個維度的貢獻(xiàn)量(點(diǎn)對維度慣量的貢獻(xiàn)量)(維度對點(diǎn)慣量的貢獻(xiàn)量)第五十三頁,共五十八頁,2022年,8月28日5、對應(yīng)分析圖首先看同一變量的不同分組在某一側(cè)維度上靠的遠(yuǎn)近程度,較近表示這些分組在該維度上區(qū)別不大,比如第二維度;然后看不同變量的各分組間的位置,從圖形中心(0,0)出發(fā),相同方位上大致相同的區(qū)域內(nèi)的不同變量的分組彼此有聯(lián)系。說明:可看出45~64歲這個階段的選民都傾向于克林頓,其他的沒有明顯的傾向性。第五十四頁,共五十八頁,2022年,8月28日第三節(jié)最優(yōu)尺度分析
——【OptimalScaling】過程初步認(rèn)識【Analyze】/【DimensionReduction】/【OptimalScaling】多元對應(yīng)分析分類變量主成分分析非線性典型相關(guān)分析分析變量中
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025至2030年中國埋地管道重防腐靜電噴涂設(shè)備數(shù)據(jù)監(jiān)測研究報告
- 統(tǒng)編版二年級語文下冊第八單元達(dá)標(biāo)測試卷(含答案)
- 上海市曹楊二中2024-2025學(xué)年高二上學(xué)期期末考試化學(xué)試卷(含答案)
- 遼寧省鞍山市高新區(qū)2024-2025學(xué)年九年級下學(xué)期開學(xué)考試化學(xué)試題(含答案)
- 技校汽車底盤試題及答案
- 3 2025年耳鼻喉科相關(guān)疾病試題
- 色彩生命測試題及答案
- 遺產(chǎn)繼承分配方案合同
- 高等教育自學(xué)考試《00065國民經(jīng)濟(jì)統(tǒng)計概論》模擬試卷一
- 2025年度主管護(hù)師考試專項(xiàng)復(fù)習(xí)試題庫70題及答案(四)
- GB/T 15242.2-2017液壓缸活塞和活塞桿動密封裝置尺寸系列第2部分:支承環(huán)尺寸系列和公差
- 部編人教版六年級下冊小學(xué)數(shù)學(xué)全冊課時練(一課一練)
- 乳腺癌患者護(hù)理課件
- 提高人工氣道氣囊管理正確率品管圈匯報書模板課件
- 2023年安徽審計職業(yè)學(xué)院單招職業(yè)適應(yīng)性測試筆試題庫及答案解析
- (中職)化學(xué)工藝概論第二版1.2化工企業(yè)組織部門結(jié)構(gòu)教學(xué)課件
- Q∕SY 01128-2020 錄井資料采集處理解釋規(guī)范
- CPK計算表格EXCEL模板
- 人教部編版九年級歷史上冊第4課 希臘城邦和亞歷山大帝國(共26張PPT)
- 主要用能設(shè)備臺賬
- 《中國河流和湖泊》填圖
評論
0/150
提交評論