應(yīng)用多元統(tǒng)計(jì)分析課后答案-朱建平版(共24頁)_第1頁
應(yīng)用多元統(tǒng)計(jì)分析課后答案-朱建平版(共24頁)_第2頁
應(yīng)用多元統(tǒng)計(jì)分析課后答案-朱建平版(共24頁)_第3頁
應(yīng)用多元統(tǒng)計(jì)分析課后答案-朱建平版(共24頁)_第4頁
應(yīng)用多元統(tǒng)計(jì)分析課后答案-朱建平版(共24頁)_第5頁
已閱讀5頁,還剩17頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、2.1.試敘述多元聯(lián)合分布和邊際分布之間的關(guān)系。解:多元聯(lián)合分布討論多個(gè)隨機(jī)變量聯(lián)合到一起的概率分布狀況,的聯(lián)合分布密度函數(shù)是一個(gè)p維的函數(shù),而邊際分布討論是的子向量的概率分布,其概率密度函數(shù)的維數(shù)小于p。2.2設(shè)二維隨機(jī)向量服從二元正態(tài)分布,寫出其聯(lián)合分布。解:設(shè)的均值向量為,協(xié)方差矩陣為,則其聯(lián)合分布密度函數(shù)為。2.3已知隨機(jī)向量的聯(lián)合密度函數(shù)為其中,。求(1)隨機(jī)變量和的邊緣密度函數(shù)、均值和方差;(2)隨機(jī)變量和的協(xié)方差和相關(guān)系數(shù);(3)判斷和是否相互獨(dú)立。(1)解:隨機(jī)變量和的邊緣密度函數(shù)、均值和方差; 所以 由于服從均勻分布,則均值為,方差為。同理,由于服從均勻分布,則均值為,方差為

2、。(2)解:隨機(jī)變量和的協(xié)方差和相關(guān)系數(shù); (3)解:判斷和是否相互獨(dú)立。和由于,所以不獨(dú)立。2.4設(shè)服從正態(tài)分布,已知其協(xié)方差矩陣S為對(duì)角陣,證明其分量是相互獨(dú)立的隨機(jī)變量。解: 因?yàn)榈拿芏群瘮?shù)為又由于 則 則其分量是相互獨(dú)立。2.6 漸近無偏性、有效性和一致性;2.7 設(shè)總體服從正態(tài)分布,有樣本。由于是相互獨(dú)立的正態(tài)分布隨機(jī)向量之和,所以也服從正態(tài)分布。又 所以。2.8 方法1: 。方法2: 。 故為的無偏估計(jì)。2.9.設(shè)是從多元正態(tài)分布抽出的一個(gè)簡單隨機(jī)樣本,試求的分布。證明: 設(shè)為一正交矩陣,即。令,所以。且有,。 所以獨(dú)立同分布。又因?yàn)橐驗(yàn)橛忠驗(yàn)樗栽焦?,由于?dú)立同正態(tài)分布,所以2

3、.10.設(shè)是來自的簡單隨機(jī)樣本,(1)已知且,求和的估計(jì)。(2)已知求和的估計(jì)。解:(1), (2) 解之,得,第三章3.1 試述多元統(tǒng)計(jì)分析中的各種均值向量和協(xié)差陣檢驗(yàn)的基本思想和步驟。其基本思想和步驟均可歸納為:第一,提出待檢驗(yàn)的假設(shè)H0和H1;第二,給出檢驗(yàn)的統(tǒng)計(jì)量及其服從的分布;第三,給定檢驗(yàn)水平,查統(tǒng)計(jì)量的分布表,確定相應(yīng)的臨界 值,從而得到否定域;第四,根據(jù)樣本觀測值計(jì)算出統(tǒng)計(jì)量的值,看是否落入否定域中,以便對(duì)待判假設(shè)做出決策(拒絕或接受)。均值向量的檢驗(yàn): 統(tǒng)計(jì)量 拒絕域均值向量的檢驗(yàn):在單一變量中當(dāng)已知 當(dāng)未知 (作為的估計(jì)量)一個(gè)正態(tài)總體協(xié)差陣已知 協(xié)差陣未知 () 兩個(gè)正態(tài)

4、總體有共同已知協(xié)差陣 有共同未知協(xié)差陣 (其中 )協(xié)差陣不等 協(xié)差陣不等 多個(gè)正態(tài)總體單因素方差 多因素方差 協(xié)差陣的檢驗(yàn)檢驗(yàn) 檢驗(yàn) 統(tǒng)計(jì)量3.2 試述多元統(tǒng)計(jì)中霍特林T2分布和威爾克斯分布分別與一元統(tǒng)計(jì)中t分布和F分布的關(guān)系。答:(?。┗籼亓諸2分布是t分布對(duì)于多元變量的推廣。而若設(shè),且與相互獨(dú)立,則稱統(tǒng)計(jì)量T2=nX-'S-1(X-)的分布為非中心霍特林T2分布。若,且與相互獨(dú)立,令,則 。(2)威爾克斯分布在實(shí)際應(yīng)用中經(jīng)常把統(tǒng)計(jì)量化為統(tǒng)計(jì)量進(jìn)而化為統(tǒng)計(jì)量,利用統(tǒng)計(jì)量來解決多元統(tǒng)計(jì)分析中有關(guān)檢驗(yàn)問題。 與統(tǒng)計(jì)量的關(guān)系統(tǒng)計(jì)量及分別任意任意1任意任意21任意任意2任意任意3.3 試述威

5、爾克斯統(tǒng)計(jì)量在多元方差分析中的重要意義。答:威爾克斯統(tǒng)計(jì)量在多元方差分析中是用于檢驗(yàn)均值的統(tǒng)計(jì)量。 用似然比原則構(gòu)成的檢驗(yàn)統(tǒng)計(jì)量為 給定檢驗(yàn)水平,查Wilks分布表,確定臨界值,然后作出統(tǒng)計(jì)判斷。第四章4.1 簡述歐幾里得距離與馬氏距離的區(qū)別和聯(lián)系。答: 設(shè)p維歐幾里得空間Rp中的兩點(diǎn)X=(X1, X2XP)'和Y=Y1, Y2YP'。則歐幾里得距離為i=1p(Xi-Yi)2。歐幾里得距離的局限有在多元數(shù)據(jù)分析中,其度量不合理。會(huì)受到實(shí)際問題中量綱的影響。設(shè)X,Y是來自均值向量為,協(xié)方差為的總體G中的p維樣本。則馬氏距離為D(X,Y)=X-Y'-1X-Y。當(dāng)-1=I即單

6、位陣時(shí),D(X,Y)=X-Y'X-Y=i=1p(Xi-Yi)2即歐幾里得距離。因此,在一定程度上,歐幾里得距離是馬氏距離的特殊情況,馬氏距離是歐幾里得距離的推廣。4.2 試述判別分析的實(shí)質(zhì)。答:判別分析就是希望利用已經(jīng)測得的變量數(shù)據(jù),找出一種判別函數(shù),使得這一函數(shù)具有某種最優(yōu)性質(zhì),能把屬于不同類別的樣本點(diǎn)盡可能地區(qū)別開來。設(shè)R1,R2,Rk是p維空間R p的k個(gè)子集,如果它們互不相交,且它們的和集為Rp,則稱R1,R2Rp為Rp的一個(gè)劃分。判別分析問題實(shí)質(zhì)上就是在某種意義上,以最優(yōu)的性質(zhì)對(duì)p維空間Rp構(gòu)造一個(gè)“劃分”,這個(gè)“劃分”就構(gòu)成了一個(gè)判別規(guī)則。4.3 簡述距離判別法的基本思想和

7、方法。答:距離判別問題分為兩個(gè)總體的距離判別問題和多個(gè)總體的判別問題。其基本思想都是分別計(jì)算樣本與各個(gè)總體的距離(馬氏距離),將距離近的判別為一類。兩個(gè)總體的距離判別問題設(shè)有協(xié)方差矩陣相等的兩個(gè)總體G1和G2,其均值分別是m1和m 2,對(duì)于一個(gè)新的樣品X,要判斷它來自哪個(gè)總體。計(jì)算新樣品X到兩個(gè)總體的馬氏距離D2(X,G1)和D2(X,G2),則 X G1 ,D2(X,G1) D2(X,G2)X G2 ,D2(X,G1)> D2(X,G2,具體分析, 記 則判別規(guī)則為 X G1 ,W(X)0X G2 ,W(X)<0多個(gè)總體的判別問題。設(shè)有個(gè)總體,其均值和協(xié)方差矩陣分別是和,且。計(jì)算

8、樣本到每個(gè)總體的馬氏距離,到哪個(gè)總體的距離最小就屬于哪個(gè)總體。具體分析, 取,??梢匀【€性判別函數(shù)為 , 相應(yīng)的判別規(guī)則為 若 4.4 簡述貝葉斯判別法的基本思想和方法?;舅枷耄涸O(shè)k個(gè)總體,其各自的分布密度函數(shù),假設(shè)k個(gè)總體各自出現(xiàn)的概率分別為,。設(shè)將本來屬于總體的樣品錯(cuò)判到總體時(shí)造成的損失為,。設(shè)個(gè)總體相應(yīng)的維樣本空間為 。在規(guī)則下,將屬于的樣品錯(cuò)判為的概率為 則這種判別規(guī)則下樣品錯(cuò)判后所造成的平均損失為 則用規(guī)則來進(jìn)行判別所造成的總平均損失為 貝葉斯判別法則,就是要選擇一種劃分,使總平均損失達(dá)到極小?;痉椒ǎ?令,則 若有另一劃分,則在兩種劃分下的總平均損失之差為 因?yàn)樵谏蠈?duì)一切成立,

9、故上式小于或等于零,是貝葉斯判別的解。從而得到的劃分為 4.5 簡述費(fèi)希爾判別法的基本思想和方法。答:基本思想:從個(gè)總體中抽取具有個(gè)指標(biāo)的樣品觀測數(shù)據(jù),借助方差分析的思想構(gòu)造一個(gè)線性判別函數(shù) 系數(shù)可使得總體之間區(qū)別最大,而使每個(gè)總體內(nèi)部的離差最小。將新樣品的個(gè)指標(biāo)值代入線性判別函數(shù)式中求出值,然后根據(jù)判別一定的規(guī)則,就可以判別新的樣品屬于哪個(gè)總體。4.6 試析距離判別法、貝葉斯判別法和費(fèi)希爾判別法的異同。答: 費(fèi)希爾判別與距離判別對(duì)判別變量的分布類型無要求。二者只是要求有各類母體的兩階矩存在。而貝葉斯判別必須知道判別變量的分布類型。因此前兩者相對(duì)來說較為簡單。 當(dāng)k=2時(shí),若1=2=則費(fèi)希爾判

10、別與距離判別等價(jià)。當(dāng)判別變量服從正態(tài)分布時(shí),二者與貝葉斯判別也等價(jià)。 當(dāng)12時(shí),費(fèi)希爾判別用1+2作為共同協(xié)差陣,實(shí)際看成等協(xié)差陣,此與距離判別、貝葉斯判別不同。 距離判別可以看為貝葉斯判別的特殊情形。貝葉斯判別的判別規(guī)則是 X G1 ,W(X)lndX G2 ,W(X)<lnd距離判別的判別規(guī)則是 X G1 ,W(X)0X G2 ,W(X)<0二者的區(qū)別在于閾值點(diǎn)。當(dāng),時(shí),。二者完全相同。4.7 設(shè)有兩個(gè)二元總體G1和G2 ,從中分別抽取樣本計(jì)算得到 X(1)=51, X(2)=3-2,Sp=5.82.12.17.6 假設(shè)1=2,試用距離判別法建立判別函數(shù)和判別規(guī)則。 樣品X=(

11、6,0)應(yīng)屬于哪個(gè)總體?解:1=X(1)=51 ,2=X(2)=3-2 , =1+22=4-0.5Wp=x-=x-'-11-2 , x-'=6,0-4,0.5=2,0.5-1=139677.6-2.1-2.15.8 ,1-2=(2,3)'Wp=2,0.5139677.6-2.1-2.15.823=24.439.67>0 X G1即樣品X屬于總體G1第五章5.1 判別分析和聚類分析有何區(qū)別?答:即根據(jù)一定的判別準(zhǔn)則,判定一個(gè)樣本歸屬于哪一類。具體而言,設(shè)有n個(gè)樣本,對(duì)每個(gè)樣本測得p項(xiàng)指標(biāo)(變量)的數(shù)據(jù),已知每個(gè)樣本屬于k個(gè)類別(或總體)中的某一類,通過找出一個(gè)最優(yōu)的

12、劃分,使得不同類別的樣本盡可能地區(qū)別開,并判別該樣本屬于哪個(gè)總體。聚類分析是分析如何對(duì)樣品(或變量)進(jìn)行量化分類的問題。在聚類之前,我們并不知道總體,而是通過一次次的聚類,使相近的樣品(或變量)聚合形成總體。通俗來講,判別分析是在已知有多少類及是什么類的情況下進(jìn)行分類,而聚類分析是在不知道類的情況下進(jìn)行分類。5.2 試述系統(tǒng)聚類的基本思想。答:系統(tǒng)聚類的基本思想是:距離相近的樣品(或變量)先聚成類,距離相遠(yuǎn)的后聚成類,過程一直進(jìn)行下去,每個(gè)樣品(或變量)總能聚到合適的類中。5.3 對(duì)樣品和變量進(jìn)行聚類分析時(shí), 所構(gòu)造的統(tǒng)計(jì)量分別是什么?簡要說明為什么這樣構(gòu)造?答:對(duì)樣品進(jìn)行聚類分析時(shí),用距離來

13、測定樣品之間的相似程度。因?yàn)槲覀儼裯個(gè)樣本看作p維空間的n個(gè)點(diǎn)。點(diǎn)之間的距離即可代表樣品間的相似度。常用的距離為(一)閔可夫斯基距離:q取不同值,分為(1)絕對(duì)距離(), (2)歐氏距離(), (3)切比雪夫距離(), (二)馬氏距離 (三)蘭氏距離 對(duì)變量的相似性,我們更多地要了解變量的變化趨勢或變化方向,因此用相關(guān)性進(jìn)行衡量。將變量看作p維空間的向量,一般用(一)夾角余弦(二)相關(guān)系數(shù)5.4 在進(jìn)行系統(tǒng)聚類時(shí),不同類間距離計(jì)算方法有何區(qū)別?選擇距離公式應(yīng)遵循哪些原則?答: 設(shè)dij表示樣品Xi與Xj之間距離,用Dij表示類Gi與Gj之間的距離。(1). 最短距離法(2)最長距離法(3)中間

14、距離法其中-1/40(4)重心法 (5)類平均法 (6)可變類平均法其中b是可變的且b <1(7)可變法 其中b是可變的且b <1(8)離差平方和法 Dpq2=npnqnr=xp-xq'xp-xq=Sr-Sp-Sq通常選擇距離公式應(yīng)注意遵循以下的基本原則:(1)要考慮所選擇的距離公式在實(shí)際應(yīng)用中有明確的意義。如歐氏距離就有非常明確的空間距離概念。馬氏距離有消除量綱影響的作用。(2)要綜合考慮對(duì)樣本觀測數(shù)據(jù)的預(yù)處理和將要采用的聚類分析方法。如在進(jìn)行聚類分析之前已經(jīng)對(duì)變量作了標(biāo)準(zhǔn)化處理,則通常就可采用歐氏距離。(3)要考慮研究對(duì)象的特點(diǎn)和計(jì)算量的大小。樣品間距離公式的選擇是一個(gè)

15、比較復(fù)雜且?guī)в幸欢ㄖ饔^性的問題,我們應(yīng)根據(jù)研究對(duì)象的特點(diǎn)不同做出具體分折。實(shí)際中,聚類分析前不妨試探性地多選擇幾個(gè)距離公式分別進(jìn)行聚類,然后對(duì)聚類分析的結(jié)果進(jìn)行對(duì)比分析,以確定最合適的距離測度方法。5.5試述K均值法與系統(tǒng)聚類法的異同。答:相同:K均值法和系統(tǒng)聚類法一樣,都是以距離的遠(yuǎn)近親疏為標(biāo)準(zhǔn)進(jìn)行聚類的。不同:系統(tǒng)聚類對(duì)不同的類數(shù)產(chǎn)生一系列的聚類結(jié)果,而K均值法只能產(chǎn)生指定類數(shù)的聚類結(jié)果。具體類數(shù)的確定,離不開實(shí)踐經(jīng)驗(yàn)的積累;有時(shí)也可以借助系統(tǒng)聚類法以一部分樣品為對(duì)象進(jìn)行聚類,其結(jié)果作為K均值法確定類數(shù)的參考。5.6 試述K均值法與系統(tǒng)聚類有何區(qū)別?試述有序聚類法的基本思想。答:K均值法的

16、基本思想是將每一個(gè)樣品分配給最近中心(均值)的類中。系統(tǒng)聚類對(duì)不同的類數(shù)產(chǎn)生一系列的聚類結(jié)果,而K均值法只能產(chǎn)生指定類數(shù)的聚類結(jié)果。具體類數(shù)的確定,有時(shí)也可以借助系統(tǒng)聚類法以一部分樣品為對(duì)象進(jìn)行聚類,其結(jié)果作為K均值法確定類數(shù)的參考。有序聚類就是解決樣品的次序不能變動(dòng)時(shí)的聚類分析問題。如果用表示個(gè)有序的樣品,則每一類必須是這樣的形式,即,其中且,簡記為。在同一類中的樣品是次序相鄰的。一般的步驟是(1)計(jì)算直徑D(i,j)。(2)計(jì)算最小分類損失函數(shù)Lp(l,k)。(3)確定分類個(gè)數(shù)k。(4)最優(yōu)分類。5.7 檢測某類產(chǎn)品的重量, 抽了六個(gè)樣品, 每個(gè)樣品只測了一個(gè)指標(biāo),分別為1,2,3,6,9

17、,11.試用最短距離法,重心法進(jìn)行聚類分析。(1)用最短距離法進(jìn)行聚類分析。采用絕對(duì)值距離,計(jì)算樣品間距離陣D(0) G1 G2 G3 G4 G5 G6G1 0G2 1 0G3 2 1 0G4 5 4 3 0 G5 8 7 6 3 0G6 10 9 8 5 2 0由上表易知 D(0)中最小元素是D12=D23=1 于是將G1,G2,G3聚為一類,記為G7計(jì)算距離陣D(1) G7 G4 G5 G6G7 0G4 3 0 G5 6 3 0 G6 8 5 2 0 D(1)中最小元素是D56=2 于是將G5,G6聚為一類,記為G8計(jì)算樣本距離陣D(2) G7 G4 G8G7 0G4 3 0G8 6 3

18、0D(2)中最小元素是D47=D48=3 于是將G4,G7,G8聚為一類,記為G9因此,(2)用重心法進(jìn)行聚類分析計(jì)算樣品間平方距離陣D2(0) G1 G2 G3 G4 G5 G6G1 0G2 1 0G3 4 1 0G4 25 16 9 0 G5 64 49 36 9 0G6 100 81 64 25 4 0易知 D2(0)中最小元素是D212=D223=1 于是將G1,G2,G3聚為一類,記為G7計(jì)算距離陣D2(1) G7 G4 G5 G6G7 0G4 16 0 G5 49 9 0 G6 81 25 4 0 注:計(jì)算方法D247=6-131+2+12,其他以此類推。D2(1)中最小元素是D2

19、56=4 于是將G5,G6聚為一類,記為G8計(jì)算樣本距離陣D2(2) G7 G4 G8G7 0G4 16 0G8 64 16 0D2(2)中最小元素是D247=D248=16 于是將G4,G7,G8聚為一類,記為G9因此,第六章6.1 試述主成分分析的基本思想。答:我們處理的問題多是多指標(biāo)變量問題,由于多個(gè)變量之間往往存在著一定程度的相關(guān)性,人們希望能通過線性組合的方式從這些指標(biāo)中盡可能快的提取信息。當(dāng)?shù)谝粋€(gè)組合不能提取更多信息時(shí),再考慮第二個(gè)線性組合。繼續(xù)這個(gè)過程,直到提取的信息與原指標(biāo)差不多時(shí)為止。這就是主成分分析的基本思想。6.2 主成分分析的作用體現(xiàn)在何處?答:一般說來,在主成分分析適

20、用的場合,用較少的主成分就可以得到較多的信息量。以各個(gè)主成分為分量,就得到一個(gè)更低維的隨機(jī)向量;主成分分析的作用就是在降低數(shù)據(jù)“維數(shù)”的同時(shí)又保留了原數(shù)據(jù)的大部分信息。6.3 簡述主成分分析中累積貢獻(xiàn)率的具體含義。答:主成分分析把個(gè)原始變量的總方差分解成了個(gè)相互獨(dú)立的變量的方差之和。主成分分析的目的是減少變量的個(gè)數(shù),所以一般不會(huì)使用所有個(gè)主成分的,忽略一些帶有較小方差的主成分將不會(huì)給總方差帶來太大的影響。這里我們稱 為第個(gè)主成分的貢獻(xiàn)率。第一主成分的貢獻(xiàn)率最大,這表明綜合原始變量的能力最強(qiáng),而的綜合能力依次遞減。若只取個(gè)主成分,則稱 為主成分的累計(jì)貢獻(xiàn)率,累計(jì)貢獻(xiàn)率表明綜合的能力。通常取,使得

21、累計(jì)貢獻(xiàn)率達(dá)到一個(gè)較高的百分?jǐn)?shù)(如85以上)。 6.4 在主成分分析中“原變量方差之和等于新的變量的方差之和”是否正確? 說明理由。答:這個(gè)說法是正確的。i=1pii2=tr=trTT'=trT'T=tr=k=1pk, i=1pii2=k=1pk即原變量方差之和等于新的變量的方差之和6.5 試述根據(jù)協(xié)差陣進(jìn)行主成分分析和根據(jù)相關(guān)陣進(jìn)行主成分分析的區(qū)別。答:從相關(guān)陣求得的主成分與協(xié)差陣求得的主成分一般情況是不相同的。從協(xié)方差矩陣出發(fā)的,其結(jié)果受變量單位的影響。主成分傾向于多歸納方差大的變量的信息,對(duì)于方差小的變量就可能體現(xiàn)得不夠,也存在“大數(shù)吃小數(shù)”的問題。實(shí)際表明,這種差異有時(shí)

22、很大。我們認(rèn)為,如果各指標(biāo)之間的數(shù)量級(jí)相差懸殊,特別是各指標(biāo)有不同的物理量綱的話,較為合理的做法是使用R代替。對(duì)于研究經(jīng)濟(jì)問題所涉及的變量單位大都不統(tǒng)一,采用R代替后,可以看作是用標(biāo)準(zhǔn)化的數(shù)據(jù)做分析,這樣使得主成分有現(xiàn)實(shí)經(jīng)濟(jì)意義,不僅便于剖析實(shí)際問題,又可以避免突出數(shù)值大的變量。6.6 已知X=(X1,X2,X3)的協(xié)差陣為 113/23/23/221/453/43/253/431/4 試進(jìn)行主成分分析。解:-E=11-3/23/23/2214-53/43/253/4314-=0計(jì)算得-64-4-8-12=0,1=12, 2=8, 3=4DY1=1=12, DY2=2=8, DY3=3=4當(dāng)1

23、=12時(shí),(-1E)-423623-2753653-17-12631812-5433012103-34-2330-31000-20-203-100010-203-10001=23,1,3'同理,計(jì)算得 2=8時(shí),2=(-2,3,3)' , 3=4時(shí),2=(0,-3,1)'易知1,2,3相互正交單位化向量得,T1=11=(32 ,14 ,34)'T2=22=(-12 ,34 ,34)' T3=33=(0 ,-32 ,12)'Y1=T1'X ,Y2=T2'X , Y3=T3'X綜上所述,第一主成分為Y1=32 X1+14 X2

24、+34X3 DY1=12第二主成分為Y2=-12 X1+34 X2+34X3 DY2=8第三主成分為Y3=-32 X2+12X3 DY3=46.7 設(shè)X=(X1,Xp)的協(xié)方差陣(p×p)為 =21 1 1 , 0<p<1證明:1=21-1-為最大特征根,其對(duì)應(yīng)的主成分為Y1=1i=1pxi 。證明:-E=2-2 222- 2 22 2-=(p-1)2+2-2 2 (p-1)2+2-2- 2 (p-1)2+2- 2 2-=(p-1)2+2- 2 2 0 2(1-)- 2 0 0 2(1-)-0<<1, 1=p-1+1 2, 2= 2(1-p),1-2=p>

25、;0 1=p-1+1 2 為最大特征根當(dāng)1=p-1+1 2時(shí),-1E=21-p 2 2 2 2(1-p) 2(1-p) 2 2 2(1-p)(1-) 0 (1-) (1-)0 00- 0 00 -01 000 0 00 01=(1,1,1,)' ,T1=1p,1p,1p' ,所以,Y1=1i=1pxi第七章7.1 試述因子分析與主成分分析的聯(lián)系與區(qū)別。答:因子分析與主成分分析的聯(lián)系是:兩種分析方法都是一種降維、簡化數(shù)據(jù)的技術(shù)。兩種分析的求解過程是類似的,都是從一個(gè)協(xié)方差陣出發(fā),利用特征值、特征向量求解。因子分析可以說是主成分分析的姐妹篇,將主成分分析向前推進(jìn)一步便導(dǎo)致因子分析。

26、因子分析也可以說成是主成分分析的逆問題。如果說主成分分析是將原指標(biāo)綜合、歸納,那么因子分析可以說是將原指標(biāo)給予分解、演繹。因子分析與主成分分析的主要區(qū)別是:主成分分析本質(zhì)上是一種線性變換,將原始坐標(biāo)變換到變異程度大的方向上為止,突出數(shù)據(jù)變異的方向,歸納重要信息。而因子分析是從顯在變量去提煉潛在因子的過程。此外,主成分分析不需要構(gòu)造分析模型而因子分析要構(gòu)造因子模型。7.2 因子分析主要可應(yīng)用于哪些方面?答:因子分析是一種通過顯在變量測評(píng)潛在變量,通過具體指標(biāo)測評(píng)抽象因子的統(tǒng)計(jì)分析方法。目前因子分析在心理學(xué)、社會(huì)學(xué)、經(jīng)濟(jì)學(xué)等學(xué)科中都有重要的應(yīng)用。具體來說,因子分析可以用于分類。如用考試分?jǐn)?shù)將學(xué)生的

27、學(xué)習(xí)狀況予以分類;用空氣中各種成分的比例對(duì)空氣的優(yōu)劣予以分類等等因子分析可以用于探索潛在因素。即是探索未能觀察的或不能觀測的的潛在因素是什么,起的作用如何等。對(duì)我們進(jìn)一步研究與探討指示方向。在社會(huì)調(diào)查分析中十分常用。因子分析的另一個(gè)作用是用于時(shí)空分解。如研究幾個(gè)不同地點(diǎn)的不同日期的氣象狀況,就用因子分析將時(shí)間因素引起的變化和空間因素引起的變化分離開來從而判斷各自的影響和變化規(guī)律。7.3 簡述因子模型X=AY+中載荷矩陣A的統(tǒng)計(jì)意義。 答:對(duì)于因子模型 因子載荷陣為與的協(xié)方差為:=若對(duì)作標(biāo)準(zhǔn)化處理,rXi,Fj=,因此 一方面表示對(duì)的依賴程度;另一方面也反映了變量對(duì)公共因子的相對(duì)重要性。變量共同

28、度 說明變量的方差由兩部分組成:第一部分為共同度,它描述了全部公共因子對(duì)變量的總方差所作的貢獻(xiàn),反映了公共因子對(duì)變量的影響程度。第二部分為特殊因子對(duì)變量的方差的貢獻(xiàn),通常稱為個(gè)性方差。而公共因子對(duì)的貢獻(xiàn)表示同一公共因子對(duì)各變量所提供的方差貢獻(xiàn)之總和,它是衡量每一個(gè)公共因子相對(duì)重要性的一個(gè)尺度。7.4 在進(jìn)行因子分析時(shí),為什么要進(jìn)行因子旋轉(zhuǎn)?最大方差因子旋轉(zhuǎn)的基本思路是什么?答:因子分析的目標(biāo)之一就是要對(duì)所提取的抽象因子的實(shí)際含義進(jìn)行合理解釋。但有時(shí)直接根據(jù)特征根、特征向量求得的因子載荷陣難以看出公共因子的含義。這種因子模型反而是不利于突出主要矛盾和矛盾的主要方面的,也很難對(duì)因子的實(shí)際背景進(jìn)行合

29、理的解釋。這時(shí)需要通過因子旋轉(zhuǎn)的方法,使每個(gè)變量僅在一個(gè)公共因子上有較大的載荷,而在其余的公共因子上的載荷比較小。最大方差旋轉(zhuǎn)法是一種正交旋轉(zhuǎn)的方法,其基本思路為:AA*d11d12dp1dp2 d1mdpm 其中令 的第列元素平方的相對(duì)方差可定義為最大方差旋轉(zhuǎn)法就是選擇正交矩陣,使得矩陣所有m個(gè)列元素平方的相對(duì)方差之和達(dá)到最大。7.5 試分析因子分析模型與線性回歸模型的區(qū)別與聯(lián)系。答:因子分析模型是一種通過顯在變量測評(píng)潛在變量,通過具體指標(biāo)測評(píng)抽象因子的統(tǒng)計(jì)分析方法的模型。而線性回歸模型回歸分析的目的是設(shè)法找出變量間的依存(數(shù)量)關(guān)系, 用函數(shù)關(guān)系式表達(dá)出來。因子分析模型中每一個(gè)變量都可以表

30、示成公共因子的線性函數(shù)與特殊因子之和。即,() 該模型可用矩陣表示為: 而回歸分析模型中多元線性回歸方程模型為:y1=b0+b1x1+b2x2+bnxn+ei 其中b0是常數(shù)項(xiàng),b1,b2bn是偏回歸系數(shù),ei是殘差。 因子模型滿足:(1); (2),即公共因子與特殊因子是不相關(guān)的;(3),即各個(gè)公共因子不相關(guān)且方差為1;(4),即各個(gè)特殊因子不相關(guān),方差不要求相等。而回歸分析模型滿足(1)正態(tài)性:隨機(jī)誤差(即殘差)e服從均值為 0,方差為s的正態(tài)分布;(2)等方差:對(duì)于所有的自變量x,殘差e的條件方差為s ,且s為常數(shù);(3)獨(dú)立性:在給定自變量x的條件下,殘差e的條件期望值為0(本假設(shè)又稱

31、零均值假設(shè));(4)無自相關(guān)性:各隨機(jī)誤差項(xiàng)e互不相關(guān)。兩種模型的聯(lián)系在于都是線性的。因子分析的過程就是一種線性變換。7.6 設(shè)某客觀現(xiàn)象可用X=(X1,X2,X3)來描述, 在因子分析時(shí),從約相關(guān)陣出發(fā)計(jì)算出特征值為1=1.754,2=1,3=0.255. 由于1+2/(1+2+3)85%,所以找前兩個(gè)特征值所對(duì)應(yīng)的公共因子即可, 又知1,2對(duì)應(yīng)的正則化特征向量分別為(0.707,-0.316,0.632)及(0,0.899,0.4470),要求:(1)計(jì)算因子載荷矩陣A,并建立因子模型。(2)計(jì)算共同度hi2(i=1,2,3)。(3)計(jì)算第一公因子對(duì)X 的“貢獻(xiàn)”。解:(1)根據(jù)題意,A=

32、t1-t21002=0.7070-0.3160.8990.6320.44701.754001=0.9360-0.4180.8990.8370.4470建立因子模型為, X1 0.936F1+1 , X2=-0.418F1+0.899F2+2 X3=0.837F1+0.4470F2+3 (2)h12=0.9362=0.876,h22=-0.4182+0.8992=0.983 ,h32=0.8372+0.4472=0.900 (3)因?yàn)槭菑募s相關(guān)陣計(jì)算的特征值,所以公共因子對(duì)X的“貢獻(xiàn)”為g12=1=1.754。第八章 相應(yīng)分析8.1 什么是相應(yīng)分析?它與因子分析有何關(guān)系?答:相應(yīng)分析也叫對(duì)應(yīng)分析,通常意義下,是指兩個(gè)定性變量的多種水平進(jìn)行相應(yīng)性研究。其特點(diǎn)是它所研究的變量可以是定性的。相應(yīng)分析與因子分析的關(guān)系是: 在進(jìn)行相應(yīng)分析過程中,計(jì)算出過渡矩陣后,要分別對(duì)變量和樣本進(jìn)行因子分析。因此,因子分析是相應(yīng)分析的基礎(chǔ)。具體而言,r(Zuj)=j(Zuj)式表明Zuj為相對(duì)于特征值j的關(guān)于因素A各水平

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論