多元統(tǒng)計(jì)分析期末考試考點(diǎn)整理_第1頁(yè)
多元統(tǒng)計(jì)分析期末考試考點(diǎn)整理_第2頁(yè)
多元統(tǒng)計(jì)分析期末考試考點(diǎn)整理_第3頁(yè)
多元統(tǒng)計(jì)分析期末考試考點(diǎn)整理_第4頁(yè)
多元統(tǒng)計(jì)分析期末考試考點(diǎn)整理_第5頁(yè)
已閱讀5頁(yè),還剩3頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、二名詞解釋1 1、 多元統(tǒng)計(jì)分析:多元統(tǒng)計(jì)分析是運(yùn)用數(shù)理統(tǒng)計(jì)的方法來(lái)研究多變量(多指標(biāo))問(wèn)題的理論和方法,是一元統(tǒng)計(jì)學(xué)的推廣2 2、 聚類分析:是根據(jù)“物以類聚”的道理,對(duì)樣品或指標(biāo)進(jìn)行分類的一種多元統(tǒng)計(jì)分析方法。將個(gè)體或?qū)ο蠓诸?,使得同一類中的?duì)象之間的相似性比與其他類的對(duì)象的相似性更強(qiáng)。使類內(nèi)對(duì)象的同質(zhì)性最大化和類間對(duì)象的異質(zhì)性最大化3 3、 隨機(jī)變量:是指變量的值無(wú)法預(yù)先確定僅以一定的可能性(概率)取值的量。它是由于隨機(jī)而獲得的非確定值,是概率中的一個(gè)基本概念。即每個(gè)分量都是隨機(jī)變量的向量為隨機(jī)向量。類似地,所有元素都是隨機(jī)變量的矩陣稱為隨機(jī)矩陣。4 4、統(tǒng)計(jì)量:多元統(tǒng)計(jì)研究的是多指標(biāo)問(wèn)

2、題 ,為了了解總體的特征,通過(guò)對(duì)總體抽樣得到代表 總體 的樣本,但因?yàn)樾畔⑹欠稚⒃诿總€(gè)樣本上的 ,就需要對(duì)樣本進(jìn)行加工,把樣本的信息濃縮 到不包 含未知量的樣本函數(shù)中,這個(gè)函數(shù)稱為統(tǒng)計(jì)量、計(jì)算題A16-42其中啟=(1Q紂眉=-4 4-1一試判斷叼+2吟與-r-ro o2 2 J J10-6-15-61 1 a a 2U2U-162040k設(shè)H =花一?是否獨(dú)立?按用片的聯(lián)合分帚再Ii i -6-61-6 lti-1G-1G2020 ) )2.對(duì)某地區(qū)農(nóng)村的白名2周宙另翌的身高、胸圉、上半骨 圉進(jìn)行測(cè)雖,得相關(guān)數(shù)據(jù) 如下根據(jù)汶往資料,該地區(qū)城市2周歲男嬰的遞三個(gè)指標(biāo)的 均值血二(90Q乩16慶

3、現(xiàn)欲在多元正態(tài)性的假定下檢驗(yàn)該地區(qū)農(nóng) 村另娶是 否與城市男嬰有相同 的均值?井中乂 =60.2 xA)-1=(115.6924)-1-14.62103.172-37 37602、假設(shè)檢驗(yàn)I可題:比、# =險(xiǎn)用/H地r-8.o經(jīng)計(jì)算可得:X-AA22=6x70.0741=420.445由題目已知熱“(3,) = 295由是AI=AW3,3) A147.5所以在顯著性水平ff=0.01下,拒絕原設(shè)盡 即認(rèn)為農(nóng)村和城市的2周歲男嬰上述三個(gè) 指標(biāo)的均 值有顯著性差異OPP P4、設(shè)盂=(耳兀.昂工/M ( (XE),協(xié)方差陣龍=P1 P PI 0 pP P 1P P廠43107-14.62108.94

4、6A1 、8.9464-37 376035.S936=0.01,(3,2) = 99.2,03) =293隔工4) =16.7)3107-14.6210E9464ST1=(23J3848)-1-14.62103.172-37.37608 9464-37 376035.5936構(gòu)造檢驗(yàn)統(tǒng)計(jì)量:尸卻勺(丟-冏)(巫-角)(1)(1) 試從匚出發(fā)求X的第一總體主成分;(2)(2) 試|可當(dāng)取多大時(shí)才鏈 更髡 主成分冊(cè)貢蕾率達(dá)陽(yáng)滋以上.對(duì)二舄=人=1p得人所對(duì)應(yīng)的單位特征向量為匚1* 2 2故得第-主成分一舒+有寸冷禺+*血(2)第一個(gè)主成分的責(zé)獻(xiàn)率為- - =1八95%雄+2入+川4題型二解答題1、

5、簡(jiǎn)述多元統(tǒng)計(jì)分析中協(xié)差陣檢驗(yàn)的步驟答:第一,提出待檢驗(yàn)的假設(shè)和 H1;H1;第二,給出檢驗(yàn)的統(tǒng)計(jì)量及其服從的分布;第三,給定檢驗(yàn)水平,查統(tǒng)計(jì)量的分布表,確定相應(yīng)的臨界值,從而得到否定域;第四,根據(jù)樣本觀測(cè)值計(jì)算出統(tǒng)計(jì)量的值,看是否落入否定域中,以便對(duì)待判彳段設(shè)做出決策(拒絕或接受)。2 2、 簡(jiǎn)述一下聚類分析的思想答:聚類分析的基本思想,是根據(jù)一批樣品的多個(gè)觀測(cè)指標(biāo),具體地找出一些能夠度量樣品或指標(biāo)之間相似程度的統(tǒng)計(jì)量,然后利用統(tǒng)計(jì)量將樣品或指標(biāo)進(jìn)行歸類。把相似的樣品或指標(biāo)歸為一類,把不相似的歸為其他類。直到把所有的樣品(或指標(biāo))聚合完畢3 3、 多元統(tǒng)計(jì)分析的內(nèi)容和方法答:1 1、簡(jiǎn)化數(shù)據(jù)結(jié)

6、構(gòu),將具有錯(cuò)綜復(fù)雜關(guān)系的多個(gè)變量綜合成數(shù)量較少且互不相關(guān)的變量,使研究問(wèn)題得到簡(jiǎn)化但損失的信息又不太多。(1 1)主成分分析(2 2)因子分析(3 3)對(duì)應(yīng)分析A 1-P-PA 1-P-P-P-P-PP=0得特征根*A=l + 3p,-PZ-l0.95x4-1 -3-禹0 933等2 2、分類與判別,對(duì)所考察的變量按相似程度進(jìn)行分類。(1 1)聚類分析:根據(jù)分析樣本的各研 究變量,將性質(zhì)相似的樣本歸為一類的方法。(2 2)判別分析:判別樣本應(yīng)屬何種類型的統(tǒng)計(jì)方法。4 4、系統(tǒng)聚類法基本原理和步驟 答:1 1)先計(jì)算 n n 個(gè)樣本兩兩間的距離2 2)構(gòu)造 n n 個(gè)類,每個(gè)類只包含一個(gè)樣本3

7、3)合并距離最近的兩類為一新類4 4)計(jì)算新類與當(dāng)前各類的距離5 5) 類的個(gè)數(shù)是否等于 1,1,如果不等于回到 3 3 在做6 6)畫出聚類圖7 7)決定分類個(gè)數(shù)和類5 5、聚類分析的類型有:答:(1 1)對(duì)樣本分類,稱為 Q Q 型聚類分析(2 2) 對(duì)變量分類,稱為 R R 型聚類分析# # Q Q 型聚類是對(duì)樣本進(jìn)行聚類,它使具有相似性特征的樣本聚集在一起,使差異性大的樣本分離開(kāi)來(lái)。#R#R 型聚類是對(duì)變量進(jìn)行聚類,它使具有相似性的變量聚集在一起,差異性大的變量分離開(kāi)來(lái),可在相似變量中選擇少數(shù)具有代表性的變量參與其他分析,實(shí)現(xiàn)減少變量個(gè)數(shù),達(dá)到變量降維的目的。6 6、簡(jiǎn)述歐氏距離與馬氏

8、距離的區(qū)別和聯(lián)系。4a簡(jiǎn)述歐氏距 離與馬氏距離的區(qū)別和聯(lián)系.答I設(shè)P空閭RP中的兩點(diǎn)X= (XpX 2 Xp ) ;和Y= YpYr- Yp;D則歐氏距藕次 歐氏距離的局限肓在多元數(shù)據(jù)分忻中,其度重不合理-會(huì)受到粥間題 中it岡的斃響設(shè)是來(lái)自均值向II為(J,協(xié)方差為別勺總體G中的p維樣本.則馬氏K巨離為 1B1DaT) = X-YLX-Y n當(dāng)遲=【即單位陣時(shí)小轍Y) =x Y X一 丫 =二(& 丫 =Yj ) W歐氏距 離.因此,在一定程 度上,歐氏E巨離是馬氏距離的特殊情況.馬氏距離是歐氏距離的推廣.7 7、試述系統(tǒng)聚類的基本思想。答:系統(tǒng)聚類的基本思想是:距離相近的樣品(或變

9、量)先聚成類,距離相遠(yuǎn)的后聚成類,過(guò)程一直進(jìn)行下去,每個(gè)樣品(或變量)總能聚到合適的類中。8 8 對(duì)樣品和變量進(jìn)行聚類分析時(shí)所構(gòu)造的統(tǒng)計(jì)量分別是什么?簡(jiǎn)要說(shuō)明為什么這樣構(gòu)造?答:對(duì)樣品進(jìn)行聚類分析時(shí),用距離來(lái)測(cè)定樣品之間的相似程度。因?yàn)槲覀儼?n n 個(gè)樣本看作p p 維空間的 n n 個(gè)點(diǎn)。點(diǎn)之間的距離即可代表樣品間的相似度。常用的距離為(-)明氏距離;=d血一心嚴(yán)1q取不同值,分次護(hù)(1)絕對(duì)距離(七巧工)=X口迄-座/Jt-1 4(2)歐氏距離一% )=(祇一兀嚴(yán)(3)切比雪夫距禽新g ) % (Q =出警- X金1 ? 一才j r工、 、/*-(-)馬氏距禽 八p r X*+JA “*

10、K * JfrfK(二)蘭氏距離殼=(卷-XJ)心(X1-xp對(duì)變的拒似性,我們更多地要了解變堡的變化趨勢(shì) 或變化方向,因此用相關(guān)性 進(jìn)行W0舟變量看作P維空間的向量,一般用PVGOM比一 I礦)(工:) 、廠 jM八必/V * *iI(-)相關(guān)系數(shù)9 9、在進(jìn)行系統(tǒng)聚類時(shí),選擇距離公式應(yīng)遵循哪些原則答:(1)(1)要考慮所選擇的距離公式在實(shí)際應(yīng)用中有明確的意義。如歐氏距離就有非常明確的空間距離概念。馬氏距離有消除量綱影響的作用。(2(2 ) )要綜合考慮對(duì)樣本觀測(cè)數(shù)據(jù)的預(yù)處理和將要采用的聚類分析方法。如在進(jìn)行聚類分析之前已經(jīng)對(duì)變量作了標(biāo)準(zhǔn)化處理,則通常就可采用歐氏距離。(3)(3) 要考慮研

11、究對(duì)象的特點(diǎn)和計(jì)算量的大小。樣品間距離公式的選擇是一個(gè)比較復(fù)雜且?guī)в幸欢ㄖ饔^性的問(wèn)題, 我們應(yīng)根據(jù)研究對(duì)象的特點(diǎn)不同做出具體分折。實(shí)際中,聚類分析前不妨試探性地多選擇幾個(gè)距離公式分別進(jìn)行聚類,然后對(duì)聚類分析的結(jié)果進(jìn)行對(duì)比分析, 以確定最合適的距離測(cè)度方法。1010、歐式距離的優(yōu)點(diǎn)缺點(diǎn)歐式距離(Euclid距離)m m優(yōu)點(diǎn):幾何意義明確,簡(jiǎn)單,容易掌握,由于中學(xué)數(shù)學(xué)就已初步接觸,數(shù)學(xué)知識(shí)不多的人也可以把握它的基本含義。缺點(diǎn):從統(tǒng)計(jì)學(xué)的角度看,使用歐式距離要求一個(gè)向量的 說(shuō)各個(gè)坐標(biāo)對(duì)歐式距離的貢獻(xiàn)同等且變差大小相同, 效果良好,否n n 個(gè)分量不相關(guān),且具有相當(dāng)?shù)姆?差,或者此時(shí)使用歐式距離才合適,且因此需要對(duì)坐標(biāo)加權(quán),化為統(tǒng)(JL4X)1X . X)則就不能如實(shí)反映情況且容易導(dǎo)致錯(cuò)誤的結(jié)論。計(jì)距離1111、 模糊聚類分析的實(shí)質(zhì)和基本原理答:模糊聚類分析的實(shí)質(zhì)就是根據(jù)研究對(duì)象本身的屬性

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論