主成分分析在SPSS中的操作應(yīng)用_圖文_第1頁(yè)
主成分分析在SPSS中的操作應(yīng)用_圖文_第2頁(yè)
主成分分析在SPSS中的操作應(yīng)用_圖文_第3頁(yè)
主成分分析在SPSS中的操作應(yīng)用_圖文_第4頁(yè)
主成分分析在SPSS中的操作應(yīng)用_圖文_第5頁(yè)
已閱讀5頁(yè),還剩10頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、市場(chǎng)研究 2005 在社會(huì)經(jīng)濟(jì)統(tǒng)計(jì)綜合評(píng)價(jià)中主成分分析和因子分析 是兩個(gè)常被使用的統(tǒng)計(jì)分析方法 。 現(xiàn)在 SPSS 、 SAS 等統(tǒng)計(jì) 軟件使用越來(lái)越普遍 , 但 SPSS 并未像 SAS 一樣 , 將 主 成 分分析與因子分析作為兩個(gè)獨(dú)立的方法并列處理 注 :主 成分分析與因子分析二者是又有著區(qū)別與聯(lián)系 , 最主要 的不同在于它們的數(shù)學(xué)模型的構(gòu)建上 , 具體區(qū)別請(qǐng)見(jiàn)參 考文獻(xiàn) 2, 而是根 據(jù) 二 者 之 間 的 關(guān) 系 有 機(jī) 地 將 主 成 分 分 析嵌入到因子分析之中 , 這樣雖然簡(jiǎn)化了分析程序 , 卻為 主成分分析的計(jì)算帶來(lái)不便 。 且國(guó)內(nèi)許多 SPSS 教程并沒(méi) 有詳細(xì)講解如何應(yīng)用

2、 SPSS 進(jìn)行主成分分析 , 那到底如何 使用 SPSS 進(jìn) 行 主 成 分 分 析 呢 ? 為 使 讀 者 能 夠 正 確 使 用SPSS 軟件進(jìn)行主成分分析 , 本文將通過(guò)一個(gè)實(shí)例來(lái)詳細(xì)介紹如何用 SPSS 進(jìn)行主成分分析 。 接下來(lái)先簡(jiǎn)單介紹主 成分分析原理與模型 , 以便讀者對(duì)主成分分析有個(gè)大致 的了解 。(一 主成分分析原理主成分分析是設(shè)法將原來(lái)眾多具有一定相關(guān)性 (比 如 P 個(gè)指標(biāo) , 重新組合成一組新的互相無(wú)關(guān)的綜合指標(biāo) 來(lái)代替原來(lái)的指標(biāo) 。 通常數(shù)學(xué)上的處理就是將原來(lái) P 個(gè) 指標(biāo)作線性組合 , 作為新的綜合指標(biāo) 。 最經(jīng)典的做法就是 用 F 1(選取的第一個(gè)線性組合 ,

3、即 第 一 個(gè) 綜 合 指 標(biāo) 的 方 差來(lái)表達(dá) , 即 Var(F 1 越大 , 表示 F 1包含的信息越多 。 因此在所有的線性組合中選取的 F 1應(yīng)該是方差最大的 , 故稱F 1為第一主成分 。 如果第一主成分不足以代表原來(lái) P 個(gè)指標(biāo)的信息 , 再考慮選取 F 2即選第二個(gè)線性組合 , 為了有 效地反映原來(lái)信息 , F 1已 有 的 信 息 就 不 需 要 再 出 現(xiàn) 在 F 2中 , 用數(shù)學(xué)語(yǔ)言表達(dá)就是要求 Cov(F 1, F 2=0, 則稱 F 2為第 二主成分 , 依此類推可以構(gòu)造出第三 、 第四 , , 第 P 個(gè) 主成分 。(二 主成分分析數(shù)學(xué)模型F 1=a 11ZX 1+

4、a 21ZX 2+ +a p1ZX p F 2=a 12ZX 1+a 22ZX 2 +a p2ZX pF p =a 1m ZX 1+a 2m ZX 2+ +a pm ZX p其 中 a 1i , a 2i , ,a pi (i=1, ,m 為 X 的 協(xié) 方 差 陣 的特征值多對(duì)應(yīng)的特征向量 , ZX 1, ZX 2, , ZX p 是原始 變量經(jīng)過(guò)標(biāo)準(zhǔn)化處理的值 , 因?yàn)樵趯?shí)際應(yīng)用中 , 往往存在 指標(biāo)的量綱不同 , 所以在計(jì)算之前須先消除量綱的影響 , 而將原始數(shù)據(jù)標(biāo)準(zhǔn)化 , 本文所采用的數(shù)據(jù)就存在量綱影 響 注 :本文指的數(shù)據(jù)標(biāo)準(zhǔn)化是指 Z 標(biāo)準(zhǔn)化 。A=(a ij p m =(a 1,

5、a 2, a m , , Ra i =i a i , R 為相關(guān)系數(shù)矩陣 , i 、a i 是相應(yīng)的特征值和單位特征向量 , 12 p 0。進(jìn)行主成分分析主要步驟如下 :1. 根據(jù)研究問(wèn)題選取指標(biāo)與數(shù)據(jù) ;2. 進(jìn) 行 指 標(biāo) 數(shù) 據(jù) 標(biāo) 準(zhǔn) 化 (SPSS 軟 件 Factor 過(guò) 程 自 動(dòng)執(zhí)行 ;3. 進(jìn)行指標(biāo)之間的相關(guān)性判定 ; 4. 確定主成分個(gè)數(shù) m ; 5. 確定主成分 F i 表達(dá)式 ; 6. 進(jìn)行主成分 F i 命名 ;主成分分析在 SPSS 中的操作應(yīng)用#慧聰國(guó)際行業(yè)研究院廣州分公司張文霖理論與方法一 、 引言二 、 主成分分析原理和模型 1#$200512 7. 計(jì)算綜合

6、主成分值并進(jìn)行評(píng)價(jià)與研究 。 (一 指標(biāo)選取原則本 文 所 選 取 的 數(shù) 據(jù) 來(lái) 自 中 國(guó) 統(tǒng) 計(jì) 年 鑒 2003 中2002年的統(tǒng)計(jì)數(shù)據(jù) , 在沿海 10個(gè)省市經(jīng)濟(jì)狀況主要指標(biāo)體系中選取了 10個(gè)指標(biāo) :X 1 GDP X 2 人均 GDP X 3 農(nóng)業(yè)增加值 X 4 工業(yè)增加值 X 5 第三產(chǎn)業(yè)增加值 X 6 固定資產(chǎn)投資 X 7 基本建設(shè)投資 X 8 國(guó)內(nèi)生產(chǎn)總值占全國(guó)比重 (% X 9 海關(guān)出口總額 X 10 地方財(cái)政收入 (二 主成分分析在 SPSS 中的具體操作步驟運(yùn) 用 SPSS 統(tǒng) 計(jì) 分 析 軟 件 Factor 過(guò) 程 2對(duì) 沿 海 10個(gè) 省市經(jīng)濟(jì)綜合指標(biāo)進(jìn)行主成分

7、分析 。 具體操作步驟如下 :1.Analyze Data Reduction Factor Analysis , 彈 出 Factor Analysis 對(duì)話框2. 把 X 1X 10選入 Variables 框3.Descriptives:Correlation Matrix 框 組 中 選 中 Coeffi-cients , 然后點(diǎn)擊 Continue , 返回 Factor Analysis 對(duì)話框4. 點(diǎn)擊“ OK ” 地方財(cái) 政收入第三產(chǎn)業(yè) 增加值表 1沿海 10個(gè)省市經(jīng)濟(jì)數(shù)據(jù)遼寧 山東 河北 天津 江蘇 上海 浙江 福建 廣東 廣西地區(qū) GDP 人均 GDP農(nóng)業(yè)增加值 工業(yè)增加值

8、固定資 產(chǎn)投資基本建 設(shè)投資社會(huì)消費(fèi)品 零售總額海關(guān)出 口總額表 2Factor Analyze 對(duì)話框與 Descriptives 子對(duì)話框理 論 與 方 法三 、 對(duì)沿海 10個(gè)省市經(jīng)濟(jì)綜合指標(biāo)進(jìn) 行主成分分析市場(chǎng)研究 2005 SPSS 在調(diào)用 Factor Analyze 過(guò) 程 進(jìn) 行 分 析 時(shí) , SPSS 會(huì)自動(dòng)對(duì)原始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理 , 所以在得到計(jì)算結(jié)果 后的變量都是指經(jīng)過(guò)標(biāo)準(zhǔn)化處理后的變量 , 但 SPSS 并不直接給出標(biāo)準(zhǔn)化后的數(shù)據(jù) , 如需要得到標(biāo)準(zhǔn)化數(shù)據(jù) , 則需 調(diào)用 Descriptives 過(guò)程進(jìn)行計(jì)算 。從表 3可知 GDP 與工業(yè)增加值 , 第三產(chǎn)業(yè)增加

9、值 、 固定資產(chǎn)投資 、 基本建 設(shè) 投 資 、 社 會(huì) 消 費(fèi) 品 零 售 總 額 、 地 方財(cái)政收入這幾個(gè)指標(biāo)存在著極其顯著的關(guān)系 , 與海關(guān) 出口總額存在著顯著關(guān)系 。 可見(jiàn)許多變量之間直接的相 關(guān)性比較強(qiáng) , 證明他們存在信息上的重疊 。主成分個(gè)數(shù)提取原則為主成分對(duì)應(yīng)的特征值大 于 1的前 m 個(gè)主成分 。 特征值在某種程度上可以被看成是表 示主成分影響力度大小的指標(biāo) , 如果特征值小于 1, 說(shuō)明 該主成分的解釋力度還不如直接引入一個(gè)原變量的平均解釋力度大 , 因此一般可以用特征值大于 1作為納入標(biāo) 準(zhǔn) 。 通過(guò)表 4(方差分解主成分提取分析 可知 , 提取 2個(gè) 主成分 , 即 m

10、=2, 從表 5(初始因子載荷矩陣 可知 GDP 、 工 業(yè)增加值 、 第三產(chǎn) 業(yè) 增 加 值 、 固 定 資 產(chǎn) 投 資 、 基 本 建 設(shè) 投 資 、 社會(huì)消費(fèi)品零 售 總 額 、 海 關(guān) 出 口 總 額 、 地 方 財(cái) 政 收 入 在第一主成分上有較高載荷 , 說(shuō)明第一主成分基本反映 了這些指標(biāo)的信息 ; 人均 GDP 和農(nóng)業(yè)增加值指標(biāo)在第二 主成分上有較高載荷 , 說(shuō)明第二主成分基本反映了人均GDP 和農(nóng)業(yè)增加值兩個(gè)指標(biāo)的信息 。 所以提取兩個(gè)主成表 3相關(guān)系數(shù)矩陣GDP人均 GDP 農(nóng)業(yè)增加值 工業(yè)增加值 第三產(chǎn)業(yè)增加值 固定資產(chǎn)投資 基本建設(shè)投資 社會(huì)消費(fèi)品零售總額 海關(guān)出口總額

11、地方財(cái)政收入地方 財(cái)政 收入第三 產(chǎn)業(yè) 增加值GDP農(nóng)業(yè)增加值 工業(yè)增加值固定 資產(chǎn) 投資基本 建設(shè) 投資社會(huì)消 費(fèi)品零 售總額海關(guān) 出口 總額人均GDP 表 4方差分解主成分提取分析表Component Total %of Variance Cumulative %Total %of Variance Cumulative %Initial EigenvaluesExtraction Sums of Squared Loadings Extraction Method:Principal Component Analysis.GDP人均 GDP農(nóng)業(yè)增加值 工業(yè)增加值 第三產(chǎn)業(yè)增加值 固定資產(chǎn)

12、投資 基本建設(shè)投資 社會(huì)消費(fèi)品零售總額 海關(guān)出口總額 地方財(cái)政收入Extraction Method:Principal Component Analysis.a. 2components extracted.Component 12表 5初始因子載荷矩陣Correlation MatrixTotal Variance Explained 理論與方法Component Matrix a! 200512參考文獻(xiàn)1于秀林 , 任雪松 . 多元統(tǒng)計(jì)分析 M. 北京 :中國(guó)統(tǒng)計(jì)出版社 , 1999.8. P154.2林海明 , 張文霖 . 主成分分析與因 子分析詳細(xì)的異同和 SPSS 軟件 J. 統(tǒng)

13、計(jì)研究 2005(3 .表 6Compute Variable 對(duì)話框分是可以基本反映全部指標(biāo)的信息 , 所以決定用兩個(gè)新 變量來(lái)代替原來(lái)的十個(gè)變量 。 但這兩個(gè)新變量的表達(dá)還 不能從輸出窗口中 直 接 得 到 , 因 為 “ Component Matrix ” 是 指初始因子載荷矩陣 , 每一個(gè)載荷量表示主成分與對(duì)應(yīng) 變量的相關(guān)系數(shù) 。用表 5(主成分載荷矩陣 中的數(shù)據(jù)除以主成分相對(duì) 應(yīng)的特征值開(kāi)平方根便得到兩個(gè)主成分中每個(gè)指標(biāo)所對(duì) 應(yīng)的系數(shù) 2。 將初始因子載荷矩陣中的兩列數(shù)據(jù)輸入 (可 用復(fù)制粘貼的方法 到數(shù)據(jù)編輯窗口 (為變量 B1、 B 2 , 然后 利 用 “ Transform

14、 Compute Variable ” , 在 Compute Variable 對(duì) 話 框 中 輸 入 “ A1=B1/SQR(7.22 ” 注 :第 二 主 成 分 SQR 后的括號(hào)中填 1.235, 即可得到特征向量 A1(見(jiàn)表 6 。 同 理 , 可得到特征向量 A2。 將得到的特征向量與標(biāo)準(zhǔn)化后的 數(shù)據(jù)相乘 , 然后就可以得出主成分表達(dá)式 注 :因本例只是 為了說(shuō)明如何在 SPSS 進(jìn)行主成分分析 , 故在此不對(duì)提取 的主成分進(jìn)行命名 , 有興趣的讀者可自行命名 :F 1=0.353ZX 1+0.042ZX 2-0.041ZX 3+0.364ZX 4+ 0.367ZX 5+0.366

15、ZX 6+0.352ZX 7+0.364ZX 8+0.298ZX 9+ 0.355ZX 10F 2=0.175ZX 1-0.741ZX 2+0.609ZX 3-0.004ZX 4+ 0.063ZX 5-0.061ZX 6-0.022ZX 7+0.158ZX 8-0.046ZX 9-0.115ZX 10前文提到 SPSS 會(huì)自動(dòng)對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化 , 但不會(huì)直 接給出 , 需要我們自己另外算 , 我們可以通過(guò) Analyze Descriptive Statistics Descriptives 對(duì) 話 框 來(lái) 實(shí) 現(xiàn) :彈 出 Descriptives 對(duì) 話 框 后 , 把 X 1X 10選

16、入 Variables 框 , 在 Save standardized values as variables 前 的 方 框 打 上 鉤 , 點(diǎn) 擊 “ OK ” , 經(jīng)標(biāo)準(zhǔn)化的數(shù)據(jù)會(huì)自動(dòng)填入數(shù)據(jù)窗口中 , 并以 Z 開(kāi)頭命名 。以每個(gè)主成分所對(duì)應(yīng)的特征值占所提取主成分總的 特征值之和的比例作為權(quán)重計(jì)算主成分綜合模型 :即可得到主成分綜合模型 :F=0.327ZX 1-0.072ZX 2+0.054ZX 3+0.310ZX 4+0.323ZX 5+ 0.304ZX 6+0.297ZX 7+0.334ZX 8+0.248ZX 9+0.286ZX 10根據(jù)主成分綜合模型即可計(jì)算綜合主成分值 , 并對(duì)其 按綜合主成分值進(jìn)行排序 , 即可對(duì)各地區(qū)進(jìn)行綜合評(píng)價(jià) 比較 , 結(jié)果見(jiàn)表 8。對(duì)得出的綜合主成 分 (評(píng) 價(jià) 值 , 我 們 可 用 實(shí) 際 結(jié) 果 、 經(jīng)驗(yàn)與原始數(shù)據(jù)做聚類分析進(jìn)行檢驗(yàn) , 對(duì)有爭(zhēng)議的結(jié)果 , 可用原始數(shù)據(jù)做判別分析解決爭(zhēng)議 , 具體評(píng)價(jià)與檢驗(yàn)本 文不做論述 , 如讀者有興趣可自行進(jìn)行檢驗(yàn)論述 。本 文 旨 在 闡 述 如 何 利 用 SPSS 軟 件 進(jìn) 行 正 確 的 主 成 分分析 , 使 讀 者 能 正 確 使 用 SPSS 進(jìn) 行 主 成 分 分 析 ,

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論