多元統(tǒng)計(jì)分析課后練習(xí)答案

上傳人：燈*** IP屬地：河北上傳時(shí)間：2024-01-09 格式：PDF 頁(yè)數(shù)：9 大小：2.45MB 積分：12 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩4頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第1章多元正態(tài)分布

1、在數(shù)據(jù)處理時(shí)，為什么通常要進(jìn)展標(biāo)準(zhǔn)化處理

數(shù)據(jù)的標(biāo)準(zhǔn)化是將數(shù)據(jù)按比例縮放，使之落入一個(gè)小的特定區(qū)間。在某些比

照和評(píng)價(jià)的指標(biāo)處理中經(jīng)常會(huì)用到，去除數(shù)據(jù)的單位限制，將其轉(zhuǎn)化為無(wú)量綱的

純數(shù)值，便于不同單位或量級(jí)的指標(biāo)能夠進(jìn)展比照和加權(quán)。其中最典型的就是

0-1標(biāo)準(zhǔn)化和Z標(biāo)準(zhǔn)化。

2、歐氏距離與馬氏距離的優(yōu)缺點(diǎn)是什么

歐氏距離也稱歐幾里得度量、歐幾里得度量，是一個(gè)通常采用的距離定義，

它是在m維空間中兩個(gè)點(diǎn)之間的真實(shí)距離。在二維和三維空間中的歐氏距離的就

是兩點(diǎn)之間的距離。

缺點(diǎn)：就大局部統(tǒng)計(jì)問(wèn)題而言，歐氏距離是不能令人滿意的。每個(gè)坐標(biāo)對(duì)歐

氏距離的奉獻(xiàn)是同等的。當(dāng)坐標(biāo)表示測(cè)量值時(shí)，它們往往帶有大小不等的隨機(jī)波

動(dòng)，在這種情況下，合理的方法是對(duì)坐標(biāo)加權(quán)，使變化較大的坐標(biāo)比變化較小的

坐標(biāo)有較小的權(quán)系數(shù)，這就產(chǎn)生了各種距離。當(dāng)各個(gè)分量為不同性質(zhì)的量時(shí)，''距

離”的大小與指標(biāo)的單位有關(guān)。它將樣品的不同屬性之間的差異等同對(duì)待，這一

點(diǎn)有時(shí)不能滿足實(shí)際要求。沒(méi)有考慮到總體變異對(duì)距離遠(yuǎn)近的影響。

馬氏距離表示數(shù)據(jù)的協(xié)方差距離。為兩個(gè)服從同一分布并且其協(xié)方差矩陣為

》的隨機(jī)變量與的差異程度：如果協(xié)方差矩陣為單位矩陣，那么馬氏距離就簡(jiǎn)化

為歐氏距離,如果協(xié)方差矩陣為對(duì)角陣，則其也可稱為正規(guī)化的歐氏距離。

優(yōu)點(diǎn)：它不受量綱的影響，兩點(diǎn)之間的馬氏距離與原始數(shù)據(jù)的測(cè)量單位無(wú)關(guān)。

由標(biāo)準(zhǔn)化數(shù)據(jù)和中心化數(shù)據(jù)計(jì)算出的二點(diǎn)之間的馬氏距離一樣。馬氏距離還可以

排除變量之間的相關(guān)性的干擾。

缺點(diǎn)：夸大了變化微小的變量的作用。受協(xié)方差矩陣不穩(wěn)定的影響，馬氏距

離并不總是能順利計(jì)算出。

3、當(dāng)變量XI和X2方向上的變差相等，且與互相獨(dú)立時(shí)，采用歐氏距離與統(tǒng)計(jì)

距離是否一致

統(tǒng)計(jì)距離區(qū)別于歐式距離，此距離要依賴樣本的方差和協(xié)方差，能夠表達(dá)各

變量在變差大小上的不同，以及優(yōu)勢(shì)存在的相關(guān)性，還要求距離與各變量所用的

單位無(wú)關(guān)。如果各變量之間相互獨(dú)立，即觀測(cè)變量的協(xié)方差矩陣是對(duì)角矩陣，則

馬氏距離就退化為用各個(gè)觀測(cè)指標(biāo)的標(biāo)準(zhǔn)差的倒數(shù)作為權(quán)數(shù)的加權(quán)歐氏距離。

4、如果正態(tài)隨機(jī)向量X=(X“X2，X/的協(xié)方差陣￡為對(duì)角陣，證明X的分量

是相互獨(dú)立的隨機(jī)變量。

解：因?yàn)閄=(X],X2，XJ的密度函數(shù)為

又由于E

則/(X],…,與)

則其分量是相互獨(dú)立。

5.為和幾是相互獨(dú)立的隨機(jī)變量，且為?及(0,1),外?及(3,4)。

(a)求療的分布。

(b)如果y=[匕、，]，寫(xiě)出Zr關(guān)于為與人的表達(dá)式，并寫(xiě)出Zr的分

[仇-3)/2」

布。

(c)如果y=71且y?N(*，Z)，寫(xiě)出/工一。關(guān)于八與八的表達(dá)式，并

-%一

寫(xiě)出HZ。的分布。

解：(a)由于外?N(0,l),所以以?/⑴。

(b)由于以?N(0,1),y「N(3,4)；

所以21二2?"(o,l)；

故Z/=尤+(及丁尸，且?/(2)

乙

第2章均值向量和協(xié)方差陣的檢驗(yàn)

1、略

2、試談Wilks統(tǒng)計(jì)量在多元方差分析中的重要意義。

3、題目此略

多元均值檢驗(yàn)，從題意知道，容量為9的樣本，總體協(xié)方差未知

假設(shè)H0：〃=〃()，Hl：(n=9p=5)

檢驗(yàn)統(tǒng)計(jì)量尸=(f的"〃/(n_n

72=〃(K一〃0)寸(又一〃°)服從p,n-l的72分布

統(tǒng)計(jì)量實(shí)際上是樣本均值與總體均值之間的馬氏距離再乘以n*(n-1)，這個(gè)值

越大，相等的可能性越小，備擇假設(shè)成立時(shí)，〃有變大的趨勢(shì)，所以拒絕域選

擇尸值較大的右側(cè)局部，也可以轉(zhuǎn)變?yōu)镕統(tǒng)計(jì)量

零假設(shè)的拒絕區(qū)域{(n-p)/[(n-l)*p]}*T2>/；?_/?)

1/10*T2>F5,4(5)

uo=(6212.0132.8729729.515.78)'

樣本均值(4208.7835.121965.8912.2127.79)'

(樣本均值-口o),=(-2003.232.25-1006.112,7112.01)

協(xié)方差矩陣（降維一一因子分析一一抽?。?/p>

Inter-ItemCovarianceMatrix

人均GDP（元）三產(chǎn)比重（％）人均消費(fèi)（元）人口增長(zhǎng)（%）文盲半文盲（%）

人均GDP（元）1020190.840582.460331693.531-599.784-6356.325

三產(chǎn)比重（％）582.46019.480-105.4646.62543.697

人均消費(fèi)（元）331693.531-105.464125364.321-213.634-3130.038

人口增長(zhǎng)（％）-599.7846.625-213.6346.09925.410

文盲半文盲（％）-6356.32543.697-3130.03825.410196.884

協(xié)方差的逆矩陣

1.88034E-05-0.000440368-6.09781E-050.00279921-0.000625893

-0.000440370.207023949-0.000210374-0.0237044-0.06044981

-6.0978E-05-0.0002103740.00022733-0.01050190.003047474

0.002799208-0.023704352-0.0105018810.85288927-0.18139981

-0.00062589-0.060449810.003047474-0.18139980.070148804

計(jì)算：遙遠(yuǎn)及少數(shù)民族聚居區(qū)社會(huì)經(jīng)濟(jì)開(kāi)展水平的指標(biāo)數(shù)據(jù).xls

72=9*(-2003.232.25-1006.112.7112.0l)*sA-l*(-2003.232.25

-1006.112.7112.01）'=9*50.11793817=451,06144353

F統(tǒng)計(jì)量=45.2>6.2拒絕零假設(shè)，邊緣及少數(shù)民族聚居區(qū)的社會(huì)經(jīng)濟(jì)開(kāi)展水平與

全國(guó)平均水平有顯著差異。

4、略

第3章聚類分析

1.、聚類分析的根本思想和功能是什么

聚類分析的根本思想是研究的樣品或指標(biāo)之間存著程度不同的相似性，于

是根據(jù)一批樣品的多個(gè)觀測(cè)指標(biāo)，具體找出一些能夠度量樣品或指標(biāo)之間的相似

程度的統(tǒng)計(jì)量，以這些統(tǒng)計(jì)量作為劃分類型的依據(jù)，把一些相似程度較大的樣品

聚合為一類，把另外一些彼此之間相似程度較大的樣品又聚合為另外一類，直到

把所有的樣品聚合完畢，形成一個(gè)有小到大的分類系統(tǒng)，最后再把整個(gè)分類系統(tǒng)

畫(huà)成一張分群圖，用它把所有樣品間的親疏關(guān)系表示出來(lái)。功能是把相似的研究

對(duì)象歸類。

2、試述系統(tǒng)聚類法的原理和具體步驟。

系統(tǒng)聚類是將每個(gè)樣品分成假設(shè)干類的方法，其根本思想是先將各個(gè)樣品

各看成一類,然后規(guī)定類與類之間的距離，選擇距離最小的一對(duì)合并成新的一類,

計(jì)算新類與其他類之間的距離，再將距離最近的兩類合并，這樣每次減少一類，

直至所有的樣品合為一類為止。

具體步驟：

1、對(duì)數(shù)據(jù)進(jìn)展變換處理；（不是必須的，當(dāng)數(shù)量級(jí)相差很大或指標(biāo)變量具有不同

單位時(shí)是必要的)

2、構(gòu)造n個(gè)類，每個(gè)類只包含一個(gè)樣本；

3、計(jì)算n個(gè)樣本兩兩間的距離ijd；

4、合并距離最近的兩類為一新類；

5、計(jì)算新類與當(dāng)前各類的距離，假設(shè)類的個(gè)數(shù)等于1,轉(zhuǎn)到6；否則回4；

6、畫(huà)聚類圖；

7、決定類的個(gè)數(shù)，從而得出分類結(jié)果。

3、試述K-均值聚類的方法原理。

K-均值法是一種非譜系聚類法，把每個(gè)樣品聚集到其最近形心(均值)類中，

它是把樣品聚集成K個(gè)類的集合，類的個(gè)數(shù)k可以預(yù)先給定或者在聚類過(guò)程中

確定，該方法應(yīng)用于比系統(tǒng)聚類法大得多的數(shù)據(jù)組。步驟是把樣品分為K個(gè)初

始類，進(jìn)展修改，逐個(gè)分派樣品到期最近均值的類中(通常采用標(biāo)準(zhǔn)化數(shù)據(jù)或非

標(biāo)準(zhǔn)化數(shù)據(jù)計(jì)算歐氏距離)重新計(jì)算承受新樣品的類和失去樣品的類的形心。重

復(fù)這一步直到各類無(wú)元素進(jìn)出。

4、試述模糊聚類的思想方法。

模糊聚類分析是根據(jù)客觀事物間的特征、親疏程度、相似性，通過(guò)建設(shè)模糊

相似關(guān)系對(duì)客觀事物進(jìn)展聚類的分析方法，實(shí)質(zhì)是根據(jù)研究對(duì)象本身的屬性構(gòu)造

模糊矩陣，在此根基上根據(jù)一定的隸屬度來(lái)確定其分類關(guān)系。根本思想是要把

需要識(shí)別的事物與模板進(jìn)展模糊比照，從而得到所屬的類別。簡(jiǎn)單地說(shuō)，模糊聚

類事先不知道具體的分類類別，而模糊識(shí)別是在分類的情況下進(jìn)展的。模糊聚類

分析廣泛應(yīng)用在氣象預(yù)報(bào)、地質(zhì)、農(nóng)業(yè)、林業(yè)等方面。它有兩種根本方法:系

統(tǒng)聚類法和逐步聚類法。該方法多用于定性變量的分類。

5、略

第4章判別分析

1、應(yīng)用判別分析應(yīng)該具備什么樣的條件

答：判別分析最根本的要求是，分組類型在兩組以上，每組案例的規(guī)模必須至

少在一個(gè)以上，解釋變量必須是可測(cè)量的，才能夠計(jì)算其平均值和方差。

對(duì)于判別分析有三個(gè)假設(shè)：

(1)每一個(gè)判別變量不能是其他判別變量的線性組合。有時(shí)一個(gè)判別變量與另

外的判別變量高度相關(guān)，或與其的線性組合高度相關(guān)，也就是多重共線性。

(2)各組變量的協(xié)方差矩陣相等。判別分析最簡(jiǎn)單和最常用的的形式是采用現(xiàn)

行判別函數(shù)，他們是判別變量的簡(jiǎn)單線性組合，在各組協(xié)方差矩陣相等的假設(shè)條

件下，可以使用很簡(jiǎn)單的公式來(lái)計(jì)算判別函數(shù)和進(jìn)展顯著性檢驗(yàn)。

(3)各判別變量之間具有多元正態(tài)分布，即每個(gè)變量對(duì)于所有其他變量的固定

值有正態(tài)分布，在這種條件下可以準(zhǔn)確計(jì)算顯著性檢驗(yàn)值和分組歸屬的概率。

2、試述貝葉斯判別法的思路。

答：貝葉斯判別法的思路是先假定對(duì)研究的對(duì)象已有一定的認(rèn)識(shí)，常用先驗(yàn)概率

分布來(lái)描述這種認(rèn)識(shí)，然后我們?nèi)〉靡粋€(gè)樣本，用樣本來(lái)修正已有的認(rèn)識(shí)〔先驗(yàn)

概率分布)，得到后驗(yàn)概率分布，各種統(tǒng)計(jì)推斷都通過(guò)后驗(yàn)概率分布來(lái)進(jìn)展。將

貝葉斯判別方法用于判別分析，就得到貝葉斯判別。

3、試述費(fèi)歇判別法的根本思想。

答：費(fèi)歇判別法的根本思想是將高維數(shù)據(jù)點(diǎn)投影到低維空間上來(lái)，然而利用方

差分析的思想選出一個(gè)最優(yōu)的投影方向。因此，嚴(yán)格的說(shuō)費(fèi)歇判別分析本身不是

一種判別方法，只是利用費(fèi)歇統(tǒng)計(jì)量進(jìn)展數(shù)據(jù)預(yù)處理的方法，以使更有利于用判

別分析方法解決問(wèn)題。為了有利于判別，我們選擇投影方向a應(yīng)使投影后的k個(gè)一

元總體能盡量分開(kāi)(同一總體中的樣品的投影值盡量靠近)。k要做到這一點(diǎn)，只

要投影后的k個(gè)一元總體均值有顯著差異，即可利用方差分析的方法使組間平方

和盡可能的大。則選取投影方向a使A(a)達(dá)極大即可。

4、什么是逐步判別分析

答：具有篩選變量能力的判別方法稱為逐步判別分析法。逐步判別分析法就是先

從所有因子中挑選一個(gè)具有最顯著判別能力的因子，然后再挑選第二個(gè)因子，這

因子是在第一因子的根基上具有最顯著判別能力的因子，即第一個(gè)和第二個(gè)因子

聯(lián)合起來(lái)有顯著判別能力的因子；接著挑選第三個(gè)因子，這因子是在第一、第二

因子的根基上具有最顯著判別能力的因子。由于因子之間的相互關(guān)系，當(dāng)引進(jìn)了

新的因子之后，會(huì)使原來(lái)已引入的因子失去顯著判別能力。因此，在引入第三個(gè)

因子之后就要先檢驗(yàn)已經(jīng)引入的因子是否還具有顯著判別能力，如果有就要剔除

這個(gè)不顯著的因子；接著再繼續(xù)引入，直到再?zèng)]有顯著能力的因子可剔除為止，

最后利用已選中的變量建設(shè)判別函數(shù)。

5、簡(jiǎn)要表達(dá)判別分析的步驟及流程

答：11)研究問(wèn)題：選擇對(duì)象，評(píng)估一個(gè)多元問(wèn)題各組的差異，將觀測(cè)個(gè)體歸類,

確定組與組之間的判別函數(shù)。

(2)設(shè)計(jì)要點(diǎn)：選擇解釋變量，樣本量的考慮，建設(shè)分析樣本的保存樣本。

(3)假定：解釋變量的正態(tài)性，線性關(guān)系，解釋變量間不存在多重共線性，協(xié)

方差陣相等。

(4)估計(jì)判別函數(shù)：聯(lián)立估計(jì)或逐步估計(jì)，判別函數(shù)的顯著性。

(5)使用分類矩陣評(píng)估預(yù)測(cè)的精度：確定最優(yōu)臨界得分，確定準(zhǔn)則來(lái)評(píng)估判比

照率，預(yù)測(cè)準(zhǔn)確的統(tǒng)計(jì)顯著性。

(6)判別函數(shù)的解釋：需要多少個(gè)函數(shù)。評(píng)價(jià)單個(gè)函數(shù)主要從判別權(quán)重、判別

載荷、偏F值幾個(gè)方面；評(píng)價(jià)兩個(gè)以上的判別函數(shù)，分為評(píng)價(jià)判別的函數(shù)和評(píng)價(jià)

合并的函數(shù)。

(7)判別結(jié)果的驗(yàn)證：分開(kāi)樣本或穿插驗(yàn)證，刻畫(huà)組間的差異。

6、略

第5章主成分分析

1、主成分的根本思想是什么

在對(duì)某一事物進(jìn)展實(shí)證研究時(shí)，為更全面、準(zhǔn)確地反映事物的特征及其開(kāi)展

規(guī)律，往往考慮與其有關(guān)的多個(gè)指標(biāo)，在多元統(tǒng)計(jì)中也稱為變量。一方防止遺漏

重要信息而考慮盡可能多的指標(biāo)看，另一方面考慮指標(biāo)的增多，又難以防止信息

重疊。希望涉及的變量少，而得到的信息量有較多。

主成分的根本思想是研究假設(shè)何通過(guò)原來(lái)的少數(shù)幾個(gè)線性組合來(lái)解釋原

來(lái)變量絕大多數(shù)信息的一種多元統(tǒng)計(jì)方法。研究某一問(wèn)題涉及的眾多變量之間有

一定的相關(guān)性，必然存在著支配作用的公共因素。通過(guò)對(duì)原始變量相關(guān)矩陣或協(xié)

方差矩陣內(nèi)部構(gòu)造關(guān)系的研究，利用原始變量的線性組合形成幾個(gè)無(wú)關(guān)的綜合指

標(biāo)(主成分)來(lái)代替原來(lái)的指標(biāo)。通常數(shù)學(xué)上的處理就是將原來(lái)P個(gè)指標(biāo)作線性

組合，作為新的綜合指標(biāo)。最經(jīng)典的做法就是用F11選取的第一個(gè)線性組合，

即第一個(gè)綜合指標(biāo))的方差來(lái)表達(dá)，即Var(Fl)越大，表示Fl包含的信息越

多。因此在所有的線性組合中選取的Fl應(yīng)該是方差最大的，故稱F1為第一主

成分，如果第一主成分缺乏以代表原來(lái)P個(gè)指標(biāo)的信息，再考慮選取F2即選第

二個(gè)線性組合，為了有效地反映原來(lái)信息，F(xiàn)1已有的信息就不需要再出現(xiàn)在F2

中，用數(shù)學(xué)語(yǔ)言表達(dá)就是要求Cov(Fl,F2)=0則稱F2為第二主成分，依此類

推可以構(gòu)造出第三、第四.....，第P個(gè)主成分。

2、主成分在應(yīng)用中的主要作用是什么

作用：利用原始變量的線性組合形成兒個(gè)綜合指標(biāo)〔主成分)，在保存原始變量

主要信息的前提下起到降維與簡(jiǎn)化問(wèn)題的作用，使得在研究復(fù)雜問(wèn)題時(shí)更容易抓

住主要矛盾。通過(guò)主成分分析，可以從事物之間錯(cuò)綜復(fù)雜的關(guān)系中找出一些主要

成分，從而能有效利用大量數(shù)據(jù)進(jìn)展定量分析，解釋變量之間的內(nèi)在關(guān)系，得到

對(duì)事物特征及其開(kāi)展規(guī)律的一些深層次的啟發(fā)，把研究工作引向深入。主成分分

析能降低所研究的數(shù)據(jù)空間的維數(shù)，有時(shí)可通過(guò)因子載荷aij的結(jié)論，弄清X(qián)變

量間的某些關(guān)系，多維數(shù)據(jù)的一種圖形表示方法，用主成分分析篩選變量，可以

用較少的計(jì)算量來(lái)選擇，獲得選擇最正確變量子集合的效果。

3.由協(xié)方差陣出發(fā)和由相關(guān)陣出發(fā)求主成分有什么不同

(1)由協(xié)方差陣出發(fā)

設(shè)隨即向量X=(XI,X2,X3,……Xp)5的協(xié)方差矩陣為2,九12九2?……

2即為2的特征值，Y1,丫2,……yp為矩陣A各特征值對(duì)應(yīng)的標(biāo)準(zhǔn)正交特

征向量，則第i個(gè)主成分為Yi=yli*Xl+y2i*X2+……+丫pi*Xp,i=l,2,……,p

此時(shí)VAR(Yi)=Xi,COV(Yi,Yj)=0,iWj

我們把XI,X2,X3,……Xp的協(xié)方差矩陣2的非零特征根入12入22……2九p>

0向量對(duì)應(yīng)的標(biāo)準(zhǔn)化特征向量Y1,丫2,……Yp分別作為系數(shù)向量，Y1=Y「*X,

Y2=y2，*X,……，Yp=yp，*X分別稱為隨即向量X的第一主成分，第二主成

分……第p主成分。Y的分量Yl,Y2,……，Yp依次是X的第一主成分、第

二主成分……第p主成分的充分必要條件是：(1)Y=P，*X,即P為p階正交陣,

⑵Y的分量之間互不相關(guān)，即D(Y)=diag(Xl,X2,……，入p),(3)Y的p個(gè)分

量是按方差由大到小排列，即入1導(dǎo)九2》……2九p。

⑵由相關(guān)陣出發(fā)

對(duì)原始變量X進(jìn)展標(biāo)準(zhǔn)化，

Z=(SA1/2)A-1*(X-U)cov(Z)=R

原始變量的相關(guān)矩陣實(shí)際上就是對(duì)原始變量標(biāo)準(zhǔn)化后的協(xié)方差矩陣，因此，有相

關(guān)矩陣求主成分的過(guò)程與主成分個(gè)數(shù)確實(shí)定準(zhǔn)則實(shí)際上是與由協(xié)方差矩陣出發(fā)

求主成分的過(guò)程與主成分個(gè)數(shù)確實(shí)定準(zhǔn)則相一致的。解，Yi分別表示相關(guān)陣R

的特征根值與對(duì)應(yīng)的標(biāo)準(zhǔn)正交特征向量，此時(shí)，求得的主成分與原始變量的關(guān)系

式為：

Yi=丫F*Z=丫i'*(2Al/2)A-1*(X-U)

在實(shí)際研究中，有時(shí)單個(gè)指標(biāo)的方差對(duì)研究目的起關(guān)鍵作用,為了到達(dá)研究

目的，此時(shí)用協(xié)方差矩陣進(jìn)展主成分分析恰到好處。有些數(shù)據(jù)涉及到指標(biāo)的不同

度量尺度使指標(biāo)方差之間不具有可比性，對(duì)于這類數(shù)據(jù)用協(xié)方差矩陣進(jìn)展主成分

分析也有不妥。相關(guān)系數(shù)矩陣計(jì)算主成分其優(yōu)勢(shì)效應(yīng)僅表達(dá)在相關(guān)性大、相關(guān)指

標(biāo)數(shù)多的一類指標(biāo)上。防止單個(gè)指標(biāo)方差對(duì)主成分分析產(chǎn)生的負(fù)面影響，自然會(huì)

想到把單個(gè)指標(biāo)的方差從協(xié)方差矩陣中剝離，而相關(guān)系數(shù)矩陣恰好能到達(dá)此目

的。

4、略

第6章因子分析

1、因子分析與主成分分析有什么本質(zhì)不同

答：(1)因子分析把諸多變量看成由對(duì)每一個(gè)變量都有作用的一些公共因子和

一些僅對(duì)某一個(gè)變量有作用的特殊因子線性組合而成，因此，我們的目的就是要

從數(shù)據(jù)中探查能對(duì)變量起解釋作用的公共因子和特殊因子，以及公共因子和特殊

因子的線性組合。主成分分析則簡(jiǎn)單一些，它只是從空間生成的角度尋找能解釋

諸多變量絕大局部變異的幾組彼此不相關(guān)的新變量

(2)因子分析中，把變量表示成各因子的線性組合，而主成分分析中，把主成

分表示成各變量的線性組合

(3)主成分分析中不需要有一些專門(mén)假設(shè)，因子分析則需要一些假設(shè)，因子分

析的假設(shè)包括：各個(gè)因子之間不相關(guān)，特殊因子之間不相關(guān)，公共因子和特殊因

子之間不相關(guān)。

(4)在因子分析中，提取主因子的方法不僅有主成分法，還有極大似然法等，

基于這些不同算法得到的結(jié)果一般也不同。而主成分分析只能用主成分法提取。

(5)主成分分析中，當(dāng)給定的協(xié)方差矩陣或者相關(guān)矩陣的特征根唯一時(shí)，主成

分一般是固定；而因子分析中，因子不是固定的，可以旋轉(zhuǎn)得到不同的因子。

(6)在因子分析中，因子個(gè)數(shù)需要分析者指定，結(jié)果隨指定的因子數(shù)不同而不

同。在主成分分析中，主成分的數(shù)量是一定的，一般有幾個(gè)變量就有幾個(gè)主成分。

(7)與主成分分析相比，由于因子分析可以使用旋轉(zhuǎn)技術(shù)幫助解釋因子，在解

釋方面更加有優(yōu)勢(shì)。而如果想把現(xiàn)有的變量變成少數(shù)幾個(gè)新的變量(新的變量幾

乎帶有原來(lái)所有變量的信息)來(lái)進(jìn)展后續(xù)的分析，則可以使用主成分分析。

2、因子載荷％的統(tǒng)計(jì)定義是什么它在實(shí)際問(wèn)題的分析中的作用是什么

答：(1)因子載荷為的統(tǒng)計(jì)定義：是原始變量X,與公共因子寫(xiě)的協(xié)方差，X,與

弓”=1,2,...,0;/=1,2,...m)都是均值為0,方差為1的變量，因此％同時(shí)也是X,

與弓的相關(guān)系數(shù)。

(2)記g；=4/+磅+...+4.(/=1,2,...〃),則焉表示的是公共因子與對(duì)于乂的

每一分量X,(i=l,2”..,p)所提供的方差的總和，稱為公共因子與對(duì)原始變量X的

方奉獻(xiàn)，它是衡量公共因子相對(duì)重要性的指標(biāo)。g；越大，說(shuō)明公共因子F,.對(duì)X,

的奉獻(xiàn)越大，或者說(shuō)對(duì)X的影響作用就越大。如果因子載荷矩陣對(duì)A的所有的

g；(7=l,2,…〃)都計(jì)算出來(lái)，并按大小排序，就可以依此提煉出最有影響的公共

因子。

3、略

第7章對(duì)應(yīng)分析

1、試述對(duì)應(yīng)分析的思想方法及特點(diǎn)。

思想：對(duì)應(yīng)分析又稱為相應(yīng)分析，也稱R—Q分析。是因子分子根基開(kāi)展起來(lái)的

一種多元統(tǒng)計(jì)分析方法。它主要通過(guò)分析定性變量構(gòu)成的列聯(lián)表來(lái)提醒變量之間

的關(guān)系。當(dāng)我們對(duì)同一觀測(cè)數(shù)據(jù)施加R和Q型因子分析，并分別保存兩個(gè)公共因

子，則是對(duì)應(yīng)分析的初步。對(duì)應(yīng)分析的根本思想是將一個(gè)聯(lián)列表的行和列中各

元素的比例構(gòu)造以點(diǎn)的形式在較低維的空間中表示出來(lái)。它最大特點(diǎn)是能把眾多

的樣品和眾多的變量同時(shí)作到同一張圖解上，將樣品的大類及其屬性在圖上直觀

而又明了地表示出來(lái)，具有直觀性。另外，它還省去了因子選擇和因子軸旋轉(zhuǎn)等

復(fù)雜的數(shù)學(xué)運(yùn)算及中間過(guò)程，可以從因子載荷圖上對(duì)樣品進(jìn)展直觀的分類，而且

能夠指示分類的主要參數(shù)(主因子)以及分類的依據(jù)，是一種直觀、簡(jiǎn)單、方便

的多元統(tǒng)計(jì)方法。

特點(diǎn)：對(duì)應(yīng)分析的根本思想是將一個(gè)聯(lián)列表的行和列中各元素的比例構(gòu)造以點(diǎn)

的形式在較低維的空間中表示出來(lái)。它最大特點(diǎn)是能把眾多的樣品和眾多的變量

同時(shí)作到同一張圖解上，將樣品的大類及其屬性在圖上直觀而又明了地表示出

來(lái)，具有直觀性。另外，它還省去了因子選擇和因子軸旋轉(zhuǎn)等復(fù)雜的數(shù)學(xué)運(yùn)算及

中間過(guò)程，可以從因子載荷圖上對(duì)樣品進(jìn)展直觀的分類，而且能夠指示分類的主

要參數(shù)[主因子)以及分類的依據(jù)，是一種直觀、簡(jiǎn)單、方便的多元統(tǒng)計(jì)方法。

2、試述對(duì)應(yīng)分析中總慣量的意義。

總慣量不僅反映了行剖面集定義的各點(diǎn)與其重心加權(quán)距離的總和，同時(shí)與/

統(tǒng)計(jì)量?jī)H相差一個(gè)常數(shù),而廠統(tǒng)計(jì)量反映了列聯(lián)表橫聯(lián)與縱聯(lián)的相關(guān)關(guān)系，因此

總慣量也反映了兩個(gè)屬性變量各狀態(tài)之間的相關(guān)關(guān)系。對(duì)應(yīng)分析就是在對(duì)總慣量

信息損失最小的前提下，簡(jiǎn)化數(shù)據(jù)構(gòu)造以反映兩屬性變量之間的相關(guān)關(guān)系。

3、略

第8章典型相關(guān)分析

1、試述典型相關(guān)分析的統(tǒng)計(jì)思想及該方法在研究實(shí)際問(wèn)題中的作用。

答：典型相關(guān)分析是研究?jī)山M變量之間相關(guān)關(guān)系的一種多元統(tǒng)計(jì)方法。用于

提醒兩組變量之間的內(nèi)在聯(lián)系。典型相關(guān)分析的目的是識(shí)別并量化兩組變量

之間的聯(lián)系。將兩組變量相關(guān)關(guān)系的分析轉(zhuǎn)化為一組變量的線性組合與另一

組變量線性組合之間的相關(guān)關(guān)系。

根本思想：

(1)在每組變量中找出變量的線性組合，使得兩組的線性組合之間具有最大的

相關(guān)系數(shù)。即：X(k,及,，，煬、X(才1，福,，，及7)是兩組相互關(guān)聯(lián)的隨機(jī)變

量，分別在兩組變量中選取假設(shè)干有代表性的綜合變量Ui、V1,使是原變量的

線性組合。

Uia[X\a2及..apXpm'X

Vib[Y1歷次....bqYqgX

在〃(aX)〃(bX)1的條件下，使得(aX,bX)到達(dá)最大。

(2)選取和最初挑選的這對(duì)線性組合

人人文庫(kù)> 全部分類> 教育資料 > 輔導(dǎo)培訓(xùn)

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

多元統(tǒng)計(jì)分析課后練習(xí)答案

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

多元統(tǒng)計(jì)分析課后練習(xí)答案

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔