主成分分析法詳解_第1頁
主成分分析法詳解_第2頁
主成分分析法詳解_第3頁
主成分分析法詳解_第4頁
主成分分析法詳解_第5頁
已閱讀5頁,還剩43頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

(優(yōu)選)主成分分析法目前一頁\總數(shù)四十八頁\編于十一點一、主成分分析法概述二、主成分分析法的基本原理三、主成分分析法的應(yīng)用四、主成分分析法的步驟和方法五、主成分分析法的操作流程六、主成分分析法的結(jié)果分析七、應(yīng)用主成分分析法的注意事項八、與因子分析法的區(qū)別目前二頁\總數(shù)四十八頁\編于十一點一、主成分分析法概述每個人都會遇到有很多變量的數(shù)據(jù)。這些數(shù)據(jù)的共同特點是變量很多,在如此多的變量之中,有很多是相關(guān)的。人們希望能夠找出它們的少數(shù)“代表”來對它們進(jìn)行描述。介紹兩種把變量維數(shù)降低以便于描述、理解和分析的方法:主成分分析(principalcomponentanalysis)和因子分析(factoranalysis)。實際上主成分分析可以說是因子分析的一個特例。目前三頁\總數(shù)四十八頁\編于十一點定義:主成分分析(PrincipalComponentsAnalysis,PCA)也稱為主分量分析,是一種通過降維來簡化數(shù)據(jù)結(jié)構(gòu)的方法,即如何把多個變量(變量)轉(zhuǎn)化為少數(shù)幾個綜合變量(綜合變量),而這幾個綜合變量可以反映原來多個變量的大部分信息。主成分:把相關(guān)的變量變?yōu)闊o關(guān)的主成分。注意:進(jìn)行主成分的變量之間必須要有相關(guān)性,經(jīng)過分析后變量之間獨立。目前四頁\總數(shù)四十八頁\編于十一點二、主成分分析法基本原理主成分分析就是設(shè)法將原來眾多具有一定相關(guān)性的變量(如p個變量),重新組合成一組新的相互無關(guān)的綜合變量來代替原來變量。怎么處理?通常數(shù)學(xué)上的處理就是將原來p個變量作線性組合作為新的綜合變量。如何選擇?如果將選取的第一個線性組合即第一個綜合變量記為F1,自然希望F1盡可能多的反映原來變量的信息。怎樣反映?目前五頁\總數(shù)四十八頁\編于十一點最經(jīng)典的方法就是用方差來表達(dá),即var(F1)越大,表示F1包含的信息越多。因此在所有的線性組合中所選取的F1應(yīng)該是方差最大的,故稱之為第一主成分(principalcomponentI)。如果第一主成分不足以代表原來p個變量的信息,再考慮選取F2即第二個線性組合。F2稱為第二主成分(principalcomponentII)。F1和F2的關(guān)系?目前六頁\總數(shù)四十八頁\編于十一點1、基于類型的古村落旅游競爭力分析

本文以社區(qū)參與型古村落為主要研究對象,采用主成分分析法、層次熵法等確定主要的旅游評價指標(biāo)并獲得其貢獻(xiàn)指數(shù)。三、主成分分析法的應(yīng)用

目前七頁\總數(shù)四十八頁\編于十一點2、基于主成分分析的新疆與全國旅游產(chǎn)業(yè)競爭力評價

本文采用主成分分析(PCA)方法,對新疆旅游業(yè)的競爭能力與全國其他省、區(qū)、直轄市進(jìn)行比較。對全國31個省、區(qū)、直轄市的310個原始數(shù)據(jù),根據(jù)PCA方法的原理和步驟進(jìn)行計算機處理,可以得到主成分因子的特征值、貢獻(xiàn)率與累積貢獻(xiàn)率及因子提取結(jié)果。前3個主成分因子的累積貢獻(xiàn)率達(dá)87.154%,根據(jù)累積貢獻(xiàn)率大于85%的主成分因子選取原則,選擇前3個主成分因子,而且選擇的3個主成分因子相互之間不存在相關(guān)性。目前八頁\總數(shù)四十八頁\編于十一點四、主成分分析法的步驟1)數(shù)據(jù)歸一化處理:數(shù)據(jù)標(biāo)準(zhǔn)化(Z)2)計算相關(guān)系數(shù)矩陣R:3)計算特征值;特征值越大說明重要程度越大。4)計算主成分貢獻(xiàn)率及方差的累計貢獻(xiàn)率;5)計算主成分載荷與特征向量:

主成分的負(fù)荷值大小反映了主成分因子對可測變量的影響程度;載荷值越大說明此變量對主成分的解釋越多,及貢獻(xiàn)越大。6)寫出主成分模型目前九頁\總數(shù)四十八頁\編于十一點主成分選取的條件:

(1)特征值(特征值>1);

(2)方差的累計貢獻(xiàn)率。(前K個主成分的方差累計貢獻(xiàn)率達(dá)到了80%或85%,也可以說累計貢獻(xiàn)率≥80%或≥85%)(較多)。

兩個條件滿足其一就可以了,究竟以哪個為主依個人情況而定或根據(jù)實際情況兩個結(jié)合使用。如果前K個主成分的累計貢獻(xiàn)率達(dá)到了85%,則表明取前K個主成分基本包含了全部測量指標(biāo)所具有的信息,從而達(dá)到了變量降維的目的。目前十頁\總數(shù)四十八頁\編于十一點五、主成分分析法的操作流程目前十一頁\總數(shù)四十八頁\編于十一點目前十二頁\總數(shù)四十八頁\編于十一點目前十三頁\總數(shù)四十八頁\編于十一點目前十四頁\總數(shù)四十八頁\編于十一點目前十五頁\總數(shù)四十八頁\編于十一點目前十六頁\總數(shù)四十八頁\編于十一點目前十七頁\總數(shù)四十八頁\編于十一點KMO檢驗是在主成份分析前對數(shù)據(jù)的分析:

KMO越接近于1越好,等于相關(guān)系數(shù),≥0.5就可以。1、相關(guān)系數(shù)R:KMO檢驗六、主成分分析法的結(jié)果分析目前十八頁\總數(shù)四十八頁\編于十一點目前十九頁\總數(shù)四十八頁\編于十一點2、確定主成分本操作是選擇以特征根大于1為標(biāo)準(zhǔn)提取主成分,提取了4個主成分。按照累積方差的觀點,應(yīng)該提取≥80%或≥85%的值,本例題提取5個主成分,其累積方差貢獻(xiàn)率為85.644%,應(yīng)該提取前五個主成分。目前二十頁\總數(shù)四十八頁\編于十一點兩個條件都滿足目前二十一頁\總數(shù)四十八頁\編于十一點3、寫出主成分模型

目前二十二頁\總數(shù)四十八頁\編于十一點2、寫出主成分模型

主成分因子載荷矩陣:

載荷值越大,說明此變量對主成分的解釋越多,及貢獻(xiàn)越大;越大越好。目前二十三頁\總數(shù)四十八頁\編于十一點前面的表給出的是因子載荷矩陣,主成分系數(shù)應(yīng)該為特征向量,其換算方法為:用主成分載荷矩陣中的數(shù)據(jù)除以主成分相對應(yīng)的特征值開平方根便得到兩個主成分中每個指標(biāo)所對應(yīng)的系數(shù)。(1)主成分系數(shù)(特征向量)計算目前二十四頁\總數(shù)四十八頁\編于十一點目前二十五頁\總數(shù)四十八頁\編于十一點目前二十六頁\總數(shù)四十八頁\編于十一點目前二十七頁\總數(shù)四十八頁\編于十一點目前二十八頁\總數(shù)四十八頁\編于十一點目前二十九頁\總數(shù)四十八頁\編于十一點目前三十頁\總數(shù)四十八頁\編于十一點(2)寫各主成分模型F1=0.50X1+0.40X2-0.02X3+0.07X4+0.36X5+0.14X6

F1主要表示X1、X2、X5的信息F2=1.28X1-0.18X2-0.07X3+0.38X4-0.08X5+0.50X6

F2主要表示X1、X4、X6F3=2.27X1+0.14X2-0.54X3-0.47X4-0.12X5+0.07X6

F3主要表示X1F4=3.69X1-0.01X2+0.38X3-0.13X4+0.52X5-0.03X6

F4主要表示X1、X3、X5目前三十一頁\總數(shù)四十八頁\編于十一點主成分的綜合模型:兩個公式之意:F中X1的綜合系數(shù)w1=(F1的x1的系數(shù)×x1在F1中的方差貢獻(xiàn)率+F2的x1的系數(shù)×x1在F2中的方差貢獻(xiàn)率…Fn)/方差累計貢獻(xiàn)率注意:X1、X2在F1、F2中各自所對應(yīng)的方差貢獻(xiàn)率。

方差貢獻(xiàn)率與方差累計貢獻(xiàn)率的區(qū)別

目前三十二頁\總數(shù)四十八頁\編于十一點主成分賦權(quán)法其中,aij描述了因子i在第j個主成分中的因子得分系數(shù),即第i個因子對第j個主成分的貢獻(xiàn),它與該主成分對應(yīng)方差的貢獻(xiàn)率Ej的組合,便是需要確定的第i個環(huán)境因子的權(quán)重值。目前三十三頁\總數(shù)四十八頁\編于十一點主成分賦權(quán)法:計算權(quán)重集進(jìn)行歸一化處理由此即得到權(quán)重集:和為1.目前三十四頁\總數(shù)四十八頁\編于十一點4、旋轉(zhuǎn):

從下表的因子荷載看,第三個主成分因子在10個指標(biāo)上的載荷值都不明顯,因此很難對第三個主成分因子進(jìn)行有效定義。旋轉(zhuǎn)的條件:當(dāng)某個主成分因子的各載荷值大小都不明顯,很難對此主成分因子進(jìn)行有效定義時,采用旋轉(zhuǎn)進(jìn)一步分析。目前三十五頁\總數(shù)四十八頁\編于十一點旋轉(zhuǎn)后的主成分因子載荷矩陣目前三十六頁\總數(shù)四十八頁\編于十一點景區(qū)滿意度旋轉(zhuǎn)前后成分矩陣圖對比目前三十七頁\總數(shù)四十八頁\編于十一點選取主成分的個數(shù),急轉(zhuǎn)處是確定主成分的個數(shù)處。5、碎石圖分析景區(qū)滿意度碎石圖目前三十八頁\總數(shù)四十八頁\編于十一點八、與因子分析法的區(qū)別目前三十九頁\總數(shù)四十八頁\編于十一點1、基本概念主成分分析就是將多項指標(biāo)轉(zhuǎn)化為少數(shù)幾項綜合指標(biāo),用綜合指標(biāo)來解釋多變量的方差-協(xié)方差結(jié)構(gòu)。綜合指標(biāo)即為主成分。所得出的少數(shù)幾個主成分,要盡可能多地保留原始變量的信息,且彼此不相關(guān)。因子分析是研究如何以最少的信息丟失,將眾多原始變量濃縮成少數(shù)幾個因子變量,以及如何使因子變量具有較強的可解釋性的一種多元統(tǒng)計分析方法。目前四十頁\總數(shù)四十八頁\編于十一點因子分析實例:目前四十一頁\總數(shù)四十八頁\編于十一點目前四十二頁\總數(shù)四十八頁\編于十一點目前四十三頁\總數(shù)四十八頁\編于十一點2、基本思想的異同共同點主成分分析法和因子分析法都是用少數(shù)的幾個變量(因子)來綜合反映原始變量(因子)的主要信息,變量雖然較原始變量少,但所包含的信息量卻占原始信息的85%以上,所以即使用少數(shù)的幾個新變量,可信度也很高,也可以有效地解釋問題。并且新的變量彼此間互不相關(guān),消除了多重共線性。這兩種分析法得出的新變量,并不是原始變量篩選后剩余的變量。主成分分析和因子分析都產(chǎn)生了新變量。目前四十四頁\總數(shù)四十八頁\編于十一點不同之處主成分分析中,最終確定的新變量是原始變量的線性組合,每個主成分都是由原有p個變量線性組合得到。在諸多主成分Zi中,Zi在方差中占的比重最大,說明它綜合原有變量的能力最強,越往后主成分在方差中的比重也小,綜合原信息的能力越弱。因子分析是要利用少數(shù)幾個公共因子去解釋較多個要觀測變量中存在的復(fù)雜關(guān)系,它不是對原始變量的重新組合,而是對原始變量進(jìn)行分解,分解為公共因子與特殊因子兩部分。公共因子是由所有變量共同具有的少數(shù)幾個因子;特殊因子是每個原始變量獨自具有的因子。目前四十五頁\總數(shù)四十八頁\編于十一點主成分分析是研究如何通過少數(shù)幾個主成分來解釋多變量的方差一協(xié)方差結(jié)構(gòu)的分析方法,也就是求出少數(shù)幾個主成分(變量),使它們盡可能多地保留原始變量的信息,且彼此不相關(guān)。因子分析是尋找潛在的起支配作用的因子模型的方法。因子分析是根據(jù)相關(guān)性大小把變量分組,使得同組內(nèi)的變量之間相關(guān)性較高,但不同的組的變量相關(guān)性較低,每組變量代表一個基本結(jié)構(gòu),這個基本結(jié)構(gòu)稱為公共因子。通過因子分析得來的新變量是對每個原始變量進(jìn)行內(nèi)部剖析。目前四十六頁\總數(shù)四十八頁\編于十一點3、應(yīng)用中的優(yōu)缺點比較

主成分分析優(yōu)點:首先它利用降維技術(shù)用少數(shù)幾個綜合變量來代替原始多個變量,這些綜合變量集中了原始變量的大部分信息。其次它通過計算綜合主成分函數(shù)得分,對客觀經(jīng)濟(jì)現(xiàn)象進(jìn)行科學(xué)評價。再

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論