主成分分析法_第1頁
主成分分析法_第2頁
主成分分析法_第3頁
主成分分析法_第4頁
主成分分析法_第5頁
已閱讀5頁,還剩1頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

matlab中主成分分析的函數(shù)JaczCheng/lewutian來源:/toddsun/blogprincomp功能:主成分分析格式:PC=princomp(X)[PGSCORE」atent,tsquare]=princomp(X)說明:[PC,SCORE,latent,tsquare]=princomp(X)對數(shù)據(jù)矩陣X進(jìn)行主成分分析,給出各主成分(PC)、所謂的Z-得分(SCORE)、X的方差矩陣的特征值(latent)和每個數(shù)據(jù)點的HotellingT2統(tǒng)計量(tsquare)。pcacov功能:運用協(xié)方差矩陣進(jìn)行主成分分析格式:PC=pcacov(X)[PC,latent,explained]=pcacov(X)說明:[PC,latent,explained]=pcacov(X)通過協(xié)方差矩陣X進(jìn)行主成分分析,返回主成分(PC)、協(xié)方差矩陣X的特征值(latent)和每個特征向量表征在觀測量總方差中所占的百分?jǐn)?shù)(explained)。pcares功能:主成分分析的殘差格式:residuals=pcares(X,ndim)說明:pcares(X,ndim)返回保留X的ndim個主成分所獲的殘差。注意,ndim是一個標(biāo)量,必須小于X 的列數(shù)。而且,X是數(shù)據(jù)矩陣,而不是協(xié)方差矩陣。barttest功能:主成分的巴特力特檢驗格式:ndim=barttest(X,alpha)[ndim,prob,chisquare]=barttest(X,alpha)說明:巴特力特檢驗是一種等方差性檢驗。ndim=barttest(X,alpha)是在顯著性水平alpha下,給出滿足數(shù)據(jù)矩陣X的非隨機(jī)變量的n維模型,ndim即模型維數(shù),它由一系列假設(shè)檢驗所確定,ndim=1表明數(shù)據(jù)X對應(yīng)于每個主成分的方差是相同的;ndim=2表明數(shù)據(jù)X對應(yīng)于第二成分及其余成分的方差是相同的。主成分分析Matlab源碼分析function[pc,score,latent,tsquare]=princomp(x);%PRINCOMPPrincipalComponentAnalysis(centeredandscaleddata).%[PC,SCORE,LATENT,TSQUARE]=PRINCOMP(X)takesadatamatrixXand%returnstheprincipalcomponentsinPC,theso-calledZ-scoresinSCORES,%theeigenvaluesofthecovarianeematrixofXinLATENT,andHotelling's%T-squaredstatisticforeachdatapointinTSQUARE.%Referenee:J.EdwardJackson,AUser'sGuidetoPrincipalComponents%JohnWiley&Sons,Inc.1991pp.1-25.%B.Jones3-17-94%Copyright1993-2002TheMathWorks,Inc.%$Revision:2.9$$Date:2002/01/1721:31:45$[m,n]=size(x);%得到矩陣的規(guī)模,m行,n列r=min(m-1,n); %maxpossiblerankofx%該矩陣最大的秩不能超過列數(shù),%也不能超過行數(shù)減1centerx=(x-avg(ones(m,1),:));%x的每個元素減去該列的均值,%使樣本點集合重心與坐標(biāo)原點重合[U,latent,pc]=svd(centerx./sqrt(m-1),0);%“經(jīng)濟(jì)型”的奇異值分解score=centerx*pc; %得分矩陣即為原始矩陣乘主成分矩陣ifnargout<3,return;endlatent=diag(latent)42; %將奇異值矩陣轉(zhuǎn)化為一個向量if(rlatent=[latent(1:r);zeros(n-r,1)];score(:,r+1:end)=0;endifnargout<4,return;endtmp=sqrt(diag(1./latent(1:r)))*score(:,1:r)';tsquare=sum(tmp.*tmp)';主成分分析和因子分析的區(qū)別1、 因子分析中是把變量表示成各因子的線性組合,而主成分分析中則是把主成分表示成個變量的線性組合。2、 主成分分析的重點在于解釋個變量的總方差,而因子分析則把重點放在解釋各變量之間的協(xié)方差。3、 主成分分析中不需要有假設(shè)(assumptions),因子分析則需要一些假設(shè)。因子分析的假設(shè)包括:各個共同因子之間不相關(guān),特殊因子(specificfactor)之間也不相關(guān),共同因子和特殊因子之間也不相關(guān)。4、 主成分分析中,當(dāng)給定的協(xié)方差矩陣或者相關(guān)矩陣的特征值是唯一的時候,的主成分一般是獨特的;而因子分析中因子不是獨特的,可以旋轉(zhuǎn)得到不到的因子。5、 在因子分析中,因子個數(shù)需要分析者指定(spss根據(jù)一定的條件自動設(shè)定,只要是特征值大于1的因子進(jìn)入分析),而指定的因子數(shù)量不同而結(jié)果不同。在主成分分析中,成分的數(shù)量是一定的,一般有幾個變量就有幾個主成分。和主成分分析相比,由于因子分析可以使用旋轉(zhuǎn)技術(shù)幫助解釋因子,在解釋方面更加有優(yōu)勢。大致說來,當(dāng)需要尋找潛在的因子,并對這些因子進(jìn)行解釋的時候,更加傾向于使用因子分析,并且借助旋轉(zhuǎn)技術(shù)幫助更好解釋。而如果想把現(xiàn)有的變量變成少數(shù)幾個新的變量(新的變量幾乎帶有原來所有變量的信息)來進(jìn)入后續(xù)的分析,則可以使用主成分分析。當(dāng)然,這中情況也可以使用因子得分做到。所以這中區(qū)分不是絕對的。總的來說,主成分分析主要是作為一種探索性的技術(shù),在分析者進(jìn)行多元數(shù)據(jù)分析之前,用主成分分析來分析數(shù)據(jù),讓自己對數(shù)據(jù)有一個大致的了解是非常重要的。主成分分析一般很少單獨使用,通常用做以下用途:a了解數(shù)據(jù)(screeningthedata);b和clusteranalysis一起使用;c和判別分析一起使用,比如當(dāng)變量很多,個案數(shù)不多,直接使用判別分析可能無解,這時候可以使用主成份發(fā)對變量簡化(reducedimensionality);d在多元回歸中,主成分分析可以幫助判斷是否存在共線性(條件指數(shù)),還可以用來處理共線性。在算法上,主成分分析和因子分析很類似,不過,在因子分析中所采用的協(xié)方差矩陣的對角元素不在是變量的方差,而是和變量對應(yīng)的共同度(變量方差中被各因子所解釋的部分。)。/lewutian推薦文章:MATLABwavread相關(guān)函數(shù)的一些問題英文口語自我介紹Blitz++與MTL數(shù)值計算庫簡介MatLab坐標(biāo)的繪制我認(rèn)為一個理科大學(xué)生應(yīng)該掌握的軟件matlab中的diff函數(shù)-微

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論