




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1、【本章學(xué)習(xí)目的】 通過對本章的學(xué)習(xí)理解主成分分析的基本理論;掌握用 SPSS 軟件求解主成分的方法; 了解因子分析的基本理論;掌握求解因子的方法步驟;能夠用 SPSS 軟件進行因子分析, 并能正確理解系統(tǒng)輸出結(jié)果。 第十一章 主成分分析與因子分析第一節(jié) 主成分分析與因子分析概述 第二節(jié) 主成分分析與因子分析的統(tǒng)計原理 第三節(jié) 主成分分析與因子分析實例主要內(nèi)容第一節(jié)主成分分析與因子分析概述 問題發(fā)現(xiàn):在對某一事物進行實證研究時,為了更全面、準(zhǔn)確地反映事物的特征及其發(fā)展規(guī)律,人們往往要考慮與其有關(guān)系的多個指標(biāo),這些指標(biāo)在多元統(tǒng)計中也稱為變量。這樣就產(chǎn)生了如下問題:一方面人們?yōu)榱吮苊膺z漏重要的信息而
2、考慮盡可能多的指標(biāo),另一方面考慮指標(biāo)的增多增加了問題的復(fù)雜性,同時由于各指標(biāo)均是對同事物的反映,不可避免地造成信息的大量重疊,這種信息的重疊有時甚至?xí)⑹挛锏恼嬲卣髋c內(nèi)在規(guī)律。主成分分析正是研究如何通過原來變量的少數(shù)幾個線性組合來解釋原來變量絕大多數(shù)信息的一種多元統(tǒng)計方法。一、主成分分析的基本思想第一節(jié)主成分分析與因子分析概述 主成分:通過對原始變量相關(guān)矩陣或協(xié)方差矩陣內(nèi)部結(jié)構(gòu)關(guān)系的研究,利用原始變量的線性組合形成幾個綜合指標(biāo)(主成分),在保留原始變量主要信息的前提下起到降維與簡化問題的作用,使得在研究復(fù)雜問題時更容易抓住主要矛盾。主成分與原始變量之間有如下基本關(guān)系:1.每個主成分都是各原
3、始變量的線性組合;2.主成分的數(shù)目大大少于原始變量的數(shù)目;3.主成分保留了原始變量絕大多數(shù)信息;4.各主成分之間互不相關(guān)。一、主成分分析的基本思想第一節(jié)主成分分析與因子分析概述 問題發(fā)現(xiàn):人們在研究實際問題時,往往希望盡可能多地收集相關(guān)變量,以期望對問題有比較全面、完整的把握和認(rèn)識。例如,企業(yè)綜合評價研究中,可能會收集諸如盈利能力、負(fù)債能力、運營能力等方面的經(jīng)濟指標(biāo)數(shù)據(jù)。這些數(shù)據(jù)在帶來有關(guān)信息的同時,也給數(shù)據(jù)的分析帶來了一定的困難:這眾多的變量之間可能存在著或多或少的相關(guān)性,實際觀測到的數(shù)據(jù)包含的信息有一部分可能是重復(fù)的。因子分析:在盡可能不損失信息或者少損失信息的情況下,將多個變量減少為少數(shù)
4、幾個因子的方法。這幾個因子可以高度概括大量數(shù)據(jù)中的信息,這樣,既減少了變量個數(shù),又同樣能再現(xiàn)變量之間的內(nèi)在聯(lián)系。二、因子分析的基本思想第一節(jié)主成分分析與因子分析概述 主成分分析(principal component analysis, PCA)是把原來多個變量轉(zhuǎn)換為少數(shù)幾個綜合指標(biāo)的一種統(tǒng)計分析方法。因子分析(factor analysis)是一種數(shù)據(jù)簡化的技術(shù)。它通過研究眾多變量之間的內(nèi)部依賴關(guān)系,探求觀測數(shù)據(jù)中的基本結(jié)構(gòu),并用少數(shù)幾個假想因子來表示其基本的數(shù)據(jù)結(jié)構(gòu)。主成分分析不要求明確的理論指導(dǎo),屬于探索性工具;而因子分析常常是在有明確理論指導(dǎo)或明確假設(shè)時對理論進行驗證,故屬于驗證性工具
5、。三、主成分分析與因子分析的概念第二節(jié)主成分分析與因子分析的的基本原理一、主成分分析的統(tǒng)計原理 主成分分析的本質(zhì)是坐標(biāo)的旋轉(zhuǎn)變換,將原始的 n 個變量進行重新的線性組合,生成 n 個新的變量,它們之間互不相關(guān),稱為 n 個“成 分”。同時按照方差最大化的原則,保證第一個 成分的方差最大,然后依次遞減。這 n 個成分是 按照方差從大到小排列的,其中前 m 個成分可能 就包含了原始變量的大部分方差(及變異信息)。 那么這 m 個成分就成為原始變量的“主成分”, 它們包含了原始變量的大部分信息。 注意:得到的主成分不是原始變量篩選后的 剩余變量,而是原始變量經(jīng)過重新組合后的“綜 合變量”。第二節(jié)主成
6、分分析與因子分析的的基本原理案例:用最簡單的二維數(shù)據(jù)來直觀的解釋主成分分析的原理。假設(shè)現(xiàn)在有兩個變量X1、X2,在坐標(biāo)上畫出散點圖如下:可見,x1、x2之間存在相關(guān)關(guān)系,如果我們將坐標(biāo)軸整體逆時針旋轉(zhuǎn)45度,變成新的坐標(biāo)系Y1、Y2。第二節(jié)主成分分析與因子分析的的基本原理案例:根據(jù)坐標(biāo)變化的原理,我們可以算出:Y1=sqrt(2)/2* X1+sqrt(2)/2* X2Y2=sqrt(2)/2* X1-sqrt(2)/2* X2其中sqrt(x)為x的平方根。通過對X1、X2的重新進行線性組合,得到了兩個新的變量Y1、Y2。此時,Y1、Y2變得不再相關(guān),而且Y1方向變異(方差)較大,Y2方向的
7、變異(方差)較小,這時我們可以提取Y1作為X1、X2的主成分,參與后續(xù)的統(tǒng)計分析,因為它攜帶了原始變量的大部分信息。至此我們解決了兩個問題:降維和消除共線性。對于二維以上的數(shù)據(jù),就不能用上面的幾何圖形直觀的表示了,只能通過矩陣變換求解,但是本質(zhì)思想是一樣的。第二節(jié)主成分分析與因襲分析的的基本原理二、因子分析的統(tǒng)計原理 原理:對原始變量間的內(nèi)在相關(guān)結(jié)構(gòu)進行分組,相關(guān)性強的分在一組, 組間相關(guān)性較弱,各組變量代表一個基本要素(公共因子)。通過原始變量之間的復(fù) 雜關(guān)系分解原始變量,得到公共因子和特殊因子。原始變量被表示成公共因子的線性組合。 其中公共因子是所有原始變量所共同具有的特征,而特殊因子則是
8、原始變量所特有的部分。因子分析強調(diào)對新變量(因子)的實際意義的解釋。因子分析的過程:(1)確認(rèn)待分析的原變量是否適合做因子分析;(2)構(gòu)造因子變量;(3)利用旋轉(zhuǎn)方法使因子變量更具有可解釋性;(4)計算因子變量得分。第二節(jié)主成分分析與因子分析的的基本原理三、主成分分析與因子分析的聯(lián)系與區(qū)別 (一)聯(lián)系 兩者都是降維和信息濃縮的方法。生成的新變量均代表了原始變量的大部分信息且互 相獨立,都可以用于后續(xù)的回歸分析、判別分析、聚類分析等。(二)區(qū)別 (1)主成分分析是按照方差最大化的方法生成的新變量,強調(diào)新變量貢獻了多大比 例的方差,不關(guān)心新變量是否有明確的實際意義; (2)因子分析著重要求新變量具
9、有實際意義,能解釋原始變量間的內(nèi)在結(jié)構(gòu)。第三節(jié)主成分分析與因子分析實例一、主成分分析實例SPSS沒有提供單獨的主成分分析方法,而是混在因子分析當(dāng)中,下面通過一個例子來討論主成分分析與因子分析的實現(xiàn)方法及相關(guān)問題。案例:某市為全面分析機械類企業(yè)的經(jīng)濟效益,選擇了8個不同的利潤指標(biāo),14家企業(yè)關(guān)于這8個指標(biāo)的統(tǒng)計數(shù)據(jù)如下表所示,試進行主成分分析。企業(yè)序號凈資產(chǎn)利潤率(%)Xi1固定資產(chǎn)利潤率(%)Xi2總資產(chǎn)利潤率(%)Xi3銷售收入利潤率(%)Xi4產(chǎn)品成本利潤率(%)Xi5物耗利潤率(%)Xi6人均利潤率(千元/人)(%)Xi7流動資金利潤率(%)Xi812345678910111213144
10、0.425.013.222.334.335.622.048.440.624.812.51.832.338.524.712.73.36.711.812.57.813.419.18.09.70.613.99.17.211.23.95.67.116.49.910.919.89.84.20.79.411.36.111.04.33.77.116.710.29.919.08.94.20.78.39.58.312.94.46.08.022.812.610.929.711.94.60.89.812.28.720.25.57.48.929.317.613.939.616.26.51.113.316.42.4423.5420.5780.1761.7263.0170.8471.7722.4490.7890.8740.0562.1261.32720.09.13.67.327.526.610.617.835.813.73.91.017.111.6第三節(jié)主成分分析與因子分析實例第三節(jié)主成分分析與因子分析實例二、因子分析實例在企業(yè)經(jīng)濟效益的評價中,設(shè)計的指標(biāo)往往很多。為了簡化系統(tǒng)結(jié)構(gòu),抓住經(jīng)濟效益評 價中的主要問題,我們可由原始數(shù)據(jù)矩陣出發(fā)求主成分。我國部分省、直轄市、自治區(qū)獨立 核算的工業(yè)企業(yè)的經(jīng)濟效益的評價中,涉及 9 項指標(biāo),即樣品數(shù) n
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 三農(nóng)產(chǎn)品種養(yǎng)殖技術(shù)培訓(xùn)手冊
- 基于“互聯(lián)網(wǎng)+醫(yī)院-家庭”雙向聯(lián)動模式在冠心病PCI術(shù)后患者康復(fù)中的應(yīng)用分析
- 6 飛向藍天的恐龍 教學(xué)設(shè)計-2023-2024學(xué)年語文四年級下冊統(tǒng)編版
- 5《協(xié)商決定班級事務(wù)》第一課時(教學(xué)設(shè)計)2024-2025學(xué)年統(tǒng)編版道德與法治五年級上冊
- 共享辦公空間運營與管理預(yù)案
- 拒絕校園欺凌守護美好青春
- 5 多樣的棲息地 教學(xué)設(shè)計-2023-2024學(xué)年六年級下冊科學(xué)蘇教版
- 專業(yè)建筑室內(nèi)設(shè)計合作協(xié)議
- 某縣污水管網(wǎng)施工組織設(shè)計方案
- 2024年五年級數(shù)學(xué)下冊 三 長方體 正方體3.5 體積與體積單位(一)教學(xué)實錄 西師大版
- 云南省主要礦產(chǎn)資源
- 臨床試驗疑難問題解答
- 光伏發(fā)電工程施工組織設(shè)計施工工程光伏發(fā)電工程光伏發(fā)電施工組織設(shè)計
- 磁共振基礎(chǔ)知識及3.0T磁共振1
- 酒店概論教案
- 傳統(tǒng)體育養(yǎng)生概論
- 電力建設(shè)工程預(yù)算定額2006版
- 地鐵活塞風(fēng)相關(guān)計算
- DLT5216-2005 35kV~220kV城市地下變電站設(shè)計規(guī)定
- 華彩中國舞教案第四級分享
- SMT鋼網(wǎng)管理規(guī)范
評論
0/150
提交評論