




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、多元統(tǒng)計(jì)分析題型一定義、名詞解釋題型二 計(jì)算(協(xié)方差陣、模糊矩陣)題型三解答題一、定義§ 1隨機(jī)向量及其分布一、隨機(jī)向量的聯(lián)合分布設(shè)司,4為是定義在樣本空間Q上的9個(gè)隨機(jī)變量,則稱 (國(guó)/心,是七維隨機(jī)向量(或?yàn)榫S隨機(jī)變量).中元函數(shù)產(chǎn)(田一馬,,.i) =尸工G g .號(hào),,為" 稱為中維隨機(jī)向量國(guó).才",苞y的聯(lián)合分布函數(shù).如果存在非負(fù)可積函數(shù)/&.4.),使得產(chǎn)(4巧,7J Z,Jj小心心dF 則稱是夕維連續(xù)型隨機(jī)向量,稱八為 (國(guó)&*力了的聯(lián)合分布密度.§ 2 的機(jī)向量的數(shù)字特征一、隨機(jī)向量的數(shù)學(xué)期望(均值)定義1設(shè)了=(為工.y
2、,若與(工二)=%,z,中存在, 則稱EF = 01;,左1/=(氏中r,/J = N為片TJ的數(shù)學(xué)期望(向量).設(shè)片=(卷),稱1為隨機(jī)矩陣,稱ZT = (©;)“為隨機(jī)矩陣工的數(shù)學(xué)期望(矩陣).二、邊緣分布稱2維隨機(jī)向量,為),的分量構(gòu)成的子向量的概率分 布為.為)'的邊緣分布.設(shè)夕維隨機(jī)向量.為)'的分布函數(shù)為產(chǎn)(22,.),則 關(guān)于用的邊緣分布函數(shù)為£(管)=PXf < Xf = A+S,.+8,必+C0,+8),設(shè)維連續(xù)型隨機(jī)向量(%,4,為)'的聯(lián)合分布密度為/(.卬0,與),則關(guān)于.的邊緣分布密度為/(工)=J二j二"&
3、#39;£-1'七,¥+1,年)火局.四、協(xié)方差矩陣的性質(zhì)設(shè)工,廠為隨機(jī)向量,*, B為常數(shù)矩陣,貝IJ 性質(zhì) 1 CoyAX, BY) = A CoxX, >) B,性質(zhì) 2 LAX) = ALX)A五、協(xié)方差矩陣r的代數(shù)性質(zhì)記 s = zzr,1 . Z為非負(fù)定矩陣,即對(duì)Da e AJ有aEa / 0 .記號(hào):若E為非負(fù)定矩陣,則記作EN。,若工為正定矩陣,則記作Z>0.二、數(shù)學(xué)期望的性質(zhì)設(shè)X,y為隨機(jī)矩陣,,八夕為常數(shù)矩陣,則性質(zhì) 1 EAX) = AEX.性質(zhì) 2 E(.4XB) = A EX B,性質(zhì) 3 EJ) = EXEY.三、協(xié)方差矩陣定
4、義2設(shè)%=(國(guó)昌,為丫,=(4,),若可(/),/=1, 2. P, 7 = 1, 2.,/存在,則稱工,)=EX-EX)Y-Eiy=而您/)】?jī)?nèi)為隨機(jī)向量工與尸的協(xié)方差矩陣.當(dāng)。1)=0時(shí),稱隨機(jī)向量1與廠不相關(guān).稱CoyX.X) = DX為隨機(jī)向量X的協(xié)方差矩陣.顯然,協(xié)方差矩陣是一個(gè)對(duì)稱矩陣.定義3 稱火=4%為隨機(jī)向量1的相關(guān)陣 由相關(guān)系數(shù)的概念,顯然有勿=1, |共1, /.八L 2,,p.(1)最矩距離法(Nearestneighbor)考慮月個(gè)樣本構(gòu)成的距離矩陣,定義G與$之間的距離為兩類最近樣品的距離,即(3-3-29)£)= min 4,現(xiàn)在設(shè)G,與G合并為一個(gè)新類
5、記為5,則任意一類G.與G的距離為y mm d”=min( min d* min ) = min(Dv,D).(3-3-30)2 .若E為正定矩陣,則有下述等價(jià)結(jié)論.Z>0o3非奇異方陣乙使£ = .Z>0 o 3正交矩陣I,使E= MZg(44 其中,>0./= L2,,.為Z的全部特征根.(3) E >。o工的任一主子式均大于零.(4) £ > 0 o Va w 火尸,有 aa > 0 ,且 a£a = 0 o a = 0.(5)S>0<=> £7存在且S-l>0.§ 3多元總體
6、一、多元總體設(shè)觀測(cè)指標(biāo)為則才;工./7構(gòu)成一個(gè)維隨機(jī) 向量1=(;4 C,1的一切可能取值的全體就構(gòu)成了 元總 體,仍記作"維隨機(jī)向量1的概率分布即為所對(duì)應(yīng)總體的概率分布,X 的數(shù)字特征也即為所對(duì)應(yīng)總體的數(shù)字特征.二、樣本觀測(cè)陣設(shè)對(duì)元總體才二5,為)'進(jìn)行了次觀測(cè),記為第/次的觀測(cè)結(jié)果($L 2,每次的觀測(cè)結(jié)果稱為一個(gè)樣品.如果滿足:% , 4),花)相互獨(dú)立;(2)每個(gè)一%均與總體I具有相同的概率分布.稱小為來總體的一個(gè)容鼠為的簡(jiǎn)單隨機(jī)樣本,仍 簡(jiǎn)稱為樣本.稱樣本觀測(cè)值的個(gè)體構(gòu)成的矩陣為樣本觀測(cè)陣(資料陣).三、樣本數(shù)字特征%112Xp叫用2 % . 二% % 。吊 吊 吃
7、)25W 4 1 .樣本均值(向量)記 弓=上£一 稱=(.不元.七)'為樣本均值向最. “12,樣本離差陣記= X(%-吊)( -可),稱s= (%)”為樣本離差陣.3 .樣本協(xié)差陣毛爾“=_Ls=(-L7 s.“:為樣本協(xié)差陣.4 .樣本相關(guān)陣稱天=(弓)上夕為樣本和I關(guān)陣.§1-3.1多元正態(tài)分布定義1.5:若夕元隨機(jī)向量X=(不&,| 的概率密度函數(shù)為: /(七,力尸)" 二萬; exp - 3(x f)2一(x -“(2萬),iXf|/>0)(1.24) 則稱x=(x,乜,,為了遵從。元正態(tài)分布,也稱虺P元正 態(tài)變量。記為X N&a
8、mp;A)|Z|為協(xié)差陣Z的行列式。二、一般的正態(tài)分布設(shè)隨機(jī)向量、=(與,天,,巧,),若其的密度函數(shù)為/(不+,,x)=(如"2國(guó)-仁 exp-g(x-M£T (%-/)-oo<A; V+oc其中、=(不多,xy的均值為石(x)=«"j,a .從y(x, /aX-Vi _i)(x一"XX 一“)協(xié)方差為(x /4 X。Z4)(玉一“)(x 一 )(七一幺)2(吃一幺Xx -4,) .;WTa一x.q“) (xp_/Y 稱x =(不受,,巧,)服從均值為E(X),協(xié)方差為E的正態(tài)分布。馬氏是巨商定義:設(shè)總體6為,維總體 (考察,個(gè)指標(biāo)),
9、均值向量為 = (,=2, 一,一,)',協(xié)方差陣為x=(,),則樣品 X=(xx2,.,x/n) z與總體G的馬氏距離定義為2(X,G) = (X -)T(X -)當(dāng)/n = 1H寸, 2 (x, G)=(一") , )=bb二名詞解釋1、多元統(tǒng)計(jì)分析:多元統(tǒng)計(jì)分析是運(yùn)用數(shù)理統(tǒng)計(jì)的方法來研究多變量(多指標(biāo))問題的理 論和方法,是一元統(tǒng)計(jì)學(xué)的推廣2、聚類分析:是根據(jù)“物以類聚”的道理,對(duì)樣品或指標(biāo)進(jìn)行分類的一種多元統(tǒng)計(jì)分析方 法。將個(gè)體或?qū)ο蠓诸?,使得同一類中的?duì)象之間的相似性比與其他類的對(duì)象的相似性更強(qiáng)。 使類內(nèi)對(duì)象的同質(zhì)性最大化和類間對(duì)象的異質(zhì)性最大化3、隨機(jī)變量:是指變
10、量的值無法預(yù)先確定僅以一定的可能性(概率)取值的量。它是由于隨機(jī)而獲得的非確定值,是概率中的一個(gè)基本概念。即每個(gè)分量都是隨機(jī)變量的向量為隨機(jī)向 量。類似地,所有元素都是隨機(jī)變量的矩陣稱為隨機(jī)矩陣。4、統(tǒng)計(jì)量:多元統(tǒng)計(jì)研究的是多指標(biāo)問題 ,為了了解總體的特征,通過對(duì)總體抽樣得到代表 總體的樣本,但因?yàn)樾畔⑹欠稚⒃诿總€(gè)樣本上的 ,就需要對(duì)樣本進(jìn)行加工,把樣本的信息濃縮 到不包含未知量的樣本函數(shù)中,這個(gè)函數(shù)稱為統(tǒng)計(jì)量三、計(jì)算題T6 72、1.設(shè)1 =(A.科?。╉瓶诨ǎ?其中#=(1Q2)6= -44-1 2-14試判斷巧+ 2巧與屋L餐是否獨(dú)立?解:10-6-15=_61520-16 2040故出
11、此的聯(lián)合分布為I故不獨(dú)立。-1620 )40,2、82.0)60.2 455)-1 = (115,6924)-1、104.3107-14.62108.946414.62103.172-37 376089464、-37 376035.59362、對(duì)某地區(qū)農(nóng)村的6名2同歲男嬰的身高、胸圍、上半曾圉進(jìn)行測(cè)量, 得相關(guān)數(shù)據(jù)如下,根據(jù)以往資料,該地區(qū)城市2周歲男嬰的這三個(gè)指標(biāo)的 均值外二(為5%16現(xiàn)欲在事元正態(tài)性的假定下檢驗(yàn)讀地區(qū)農(nóng)村男嬰是 否與城市男嬰有相同的均值.答:2、假設(shè)檢驗(yàn)問題;/邛=回% R工內(nèi) r-8,o>經(jīng)計(jì)算可得;X-出=2 2 .(43107-1462108 9464、L 二
12、(231384司-14.62103.172-37.3760、8 9464-37 3760 35.5936 ;構(gòu)造檢驗(yàn)統(tǒng)計(jì)量1F =M/-晶)節(jié)(”= 6x70,0741 = 420,445由題目已知/1(3,3) = 29.5,由是琉廣學(xué)/。3) = 147.5所以在顯著性水平s= 0 01下,拒絕原設(shè)與 即認(rèn)為農(nóng)村和城市的2周歲男嬰上述三個(gè) 指標(biāo)的均值有顯著性差異(a = 0.01, oiC,2) = 99.2, Oi 03) =29 5,況00,4) =16.7)答:4、設(shè) =過,凡名劣尸砥(。,辦 協(xié)方差陣£= pP(1)試從E出發(fā)求X的第一總體士成分,(2)試1司當(dāng)取多大時(shí)才
13、能A14由P-P-P主成分的貢獻(xiàn)率達(dá)95%以上. =0得特征根為4=1;-pa -i得項(xiàng)對(duì)應(yīng)的單位特征向量為仁1故得第一主成分八%亭#舞+興(2)第一個(gè)主成分的貢獻(xiàn)率為"的上 95% 4 H+44得p3U.95;4 二1 再 0933題型三解答題1、簡(jiǎn)述多元統(tǒng)計(jì)分析中協(xié)差陣檢驗(yàn)的步驟答:第一,提出待檢驗(yàn)的假設(shè)和H1;第二,給出檢驗(yàn)的統(tǒng)計(jì)量及其服從的分布;第三,給定檢驗(yàn)水平,查統(tǒng)計(jì)量的分布表,確定相應(yīng)的臨界值,從而得到否定域;第四,根據(jù)樣本觀測(cè)值計(jì)算出統(tǒng)計(jì)量的值,看是否落入否定域中, 以便對(duì)待判假設(shè)做出決策(拒絕或接受)。2、簡(jiǎn)述一下聚類分析的思想答:聚類分析的基本思想, 是根據(jù)一批樣
14、品的多個(gè)觀測(cè)指標(biāo),具體地找出一些能夠度量樣品或指標(biāo)之間相似程度的統(tǒng)計(jì)量,然后利用統(tǒng)計(jì)量將樣品或指標(biāo)進(jìn)行歸類。把相似的樣品或指標(biāo)歸為一類,把不相似的歸為其他類。直到把所有的樣品(或指標(biāo))聚合完畢.3、多元統(tǒng)計(jì)分析的內(nèi)容和方法答:1、簡(jiǎn)化數(shù)據(jù)結(jié)構(gòu),將具有錯(cuò)綜復(fù)雜關(guān)系的多個(gè)變量綜合成數(shù)量較少且互不相關(guān)的變量, 使研究問題得到簡(jiǎn)化但損失的信息又不太多。(1)主成分分析(2)因子分析(3)對(duì)應(yīng)分析等2、分類與判別,對(duì)所考察的變量按相似程度進(jìn)行分類。 (1)聚類分析:根據(jù)分析樣本的各研 究變量,將性質(zhì)相似的樣本歸為一類的方法。 (2)判別分析:判別樣本應(yīng)屬何種類型的統(tǒng)計(jì) 方法。4、系統(tǒng)聚類法基本原理和步驟
15、答:1)先計(jì)算n個(gè)樣本兩兩間的距離2)構(gòu)造n個(gè)類,每個(gè)類只包含一個(gè)樣本3)合并距離最近的兩類為一新類4)計(jì)算新類與當(dāng)前各類的距離5)類的個(gè)數(shù)是否等于 1,如果不等于回到 3在做6)畫出聚類圖7)決定分類個(gè)數(shù)和類5、聚類分析的類型有:答:(1)對(duì)樣本分類,稱為 Q型聚類分析(2)對(duì)變量分類,稱為 R型聚類分析# Q 型聚類是對(duì)樣本進(jìn)行聚類,它使具有相似性特征 的樣本聚集在一起,使差異性大的樣本分離開來。#R型聚類是對(duì)變量進(jìn)行聚類,它使具有相似性的變量聚集在一起,差異性大的變量分離開來,可在相似變量中選擇少數(shù)具有代表性 的變量參與其他分析,實(shí)現(xiàn)減少變量個(gè)數(shù),達(dá)到變量降維的目的。6、 簡(jiǎn)述歐氏距離與
16、馬氏距離的區(qū)別和聯(lián)系。4"簡(jiǎn)述歐氏距離與馬氏距離的區(qū)別和聯(lián)系.答I設(shè)p維空間RP中的兩點(diǎn)X=(XrX2XPy和Y= YpY2- YP '0則歐氏距離為 歐氏距離的局B艮有在多元數(shù)據(jù)分析中,其度量不合理.會(huì)受到匆際問題中磐岡的影響.設(shè)Z,T是來自均值向量為H,械方差為上的總體G中的p維樣本.則馬氏K巨惠為 一 1- 1D國(guó)了:X Y'l XY -當(dāng)工 =【即單位陣時(shí),D(K,¥、X Y ' X丫=匕/及Y =Y力即次氏SE離口因此,在一定程度上,隙氏£巨離是馬氏距離的特殊情況,馬氏距離是歐氏距離的推廣.7、 試述系統(tǒng)聚類的基本思想。答:系統(tǒng)聚
17、類的基本思想是:距離相近的樣品(或變量)先聚成類,距離相遠(yuǎn)的后聚成類, 過程一直進(jìn)行下去,每個(gè)樣品(或變量)總能聚到合適的類中。8對(duì)樣品和變量進(jìn)行聚類分析時(shí)所構(gòu)造的統(tǒng)計(jì)量分別是什么?簡(jiǎn)要說明為什么這樣構(gòu)造?答:對(duì)樣品進(jìn)行聚類分析時(shí),用距離來測(cè)定樣品之間的相似程度。因?yàn)槲覀儼裯個(gè)樣本看作p維空間的n個(gè)點(diǎn)。點(diǎn)之間的距離即可代表樣品間的相似度。常用的距離為(:明氏距離;&/4)=(£因或一工魅嚴(yán)"比.1q取不同值,分為聲(1)絕對(duì)距離9】)= X,詆-巴X-1 ,(2)歐氏距離。=(£ |凡1t 一產(chǎn)(3)切比雪夫距離("s)=巴篙區(qū)編-xJk1 戶
18、X. 一"(-)馬氏距離廣 p L工4 +了”k K " 1*,dR3fK(二)蘭氏距離 dj(M) = (Xt - XJ)X-1(X1 -xp對(duì)變量的相似性,我們更多地要了解堂量的變化趨勢(shì)或變化方向,因此用相關(guān)性迸行衡量口將堂里看作P維空間的向里,一艘用()夾角余弦 /X X2 叭欄工:冷£;)(-)相關(guān)系數(shù)。= '9、在進(jìn)行系統(tǒng)聚類時(shí),選擇距離公式應(yīng)遵循哪些原則?答:(1)要考慮所選擇的距離公式在實(shí)際應(yīng)用中有明確的意義。如歐氏距離就有非常明確的空間距離概念。馬氏距離有消除量綱影響的作用。(2)要綜合考慮對(duì)樣本觀測(cè)數(shù)據(jù)的預(yù)處理和將要采用的聚類分析方法。如在進(jìn)行聚類分析之前已經(jīng)對(duì)變量作了標(biāo)準(zhǔn)化處理,則通常就可采用歐氏距離。(3)要考慮研究對(duì)象的特點(diǎn)和計(jì)算量的大小。樣品間距離公式的選擇是一個(gè)比較復(fù)雜且?guī)в幸欢ㄖ饔^性的問題, 我們應(yīng)根據(jù)研究對(duì)象的特點(diǎn)不同做出具體分折。實(shí)際中,聚類分析前不妨試探性地多選擇幾個(gè)距離公式分別進(jìn)行聚類,然后對(duì)聚類分析的結(jié)果進(jìn)行對(duì)比分析, 以確定最合適的距離測(cè)度方法。10、歐式距離的優(yōu)點(diǎn)缺點(diǎn)答:歐式距離(Euclii距離)% = (£5謹(jǐn) - X/Q” 嚴(yán)優(yōu)點(diǎn):幾何意義明確,簡(jiǎn)單,容易掌握,由于中學(xué)數(shù)學(xué)就已初步接觸,數(shù)學(xué)知識(shí)不多的人也可以把握它的基本含義。缺點(diǎn):從統(tǒng)計(jì)學(xué)的角度看, 使用歐
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 企業(yè)內(nèi)部溝通協(xié)作平臺(tái)建設(shè)方案
- 江西省九江市都昌縣2024-2025學(xué)年八年級(jí)上學(xué)期期末生物試題(含答案)
- 北京延慶區(qū)2024-2025學(xué)年高二上學(xué)期期末生物學(xué)試題(含答案)
- 三農(nóng)用物資采購(gòu)管理作業(yè)指導(dǎo)書
- 從理論到實(shí)踐科學(xué)探究活動(dòng)課
- 青稞種植知識(shí)培訓(xùn)課件
- 電商直播平臺(tái)搭建與運(yùn)營(yíng)服務(wù)協(xié)議
- 數(shù)學(xué)王國(guó)里的智慧讀后感
- 電子支付平臺(tái)推廣專項(xiàng)資金協(xié)議
- 智能供應(yīng)鏈管理服務(wù)合同
- 2024年湖南鐵路科技職業(yè)技術(shù)學(xué)院?jiǎn)握新殬I(yè)適應(yīng)性測(cè)試題庫附答案
- 醫(yī)療器械質(zhì)量安全風(fēng)險(xiǎn)會(huì)商管理制度
- 降低用藥錯(cuò)誤發(fā)生率
- 起重機(jī)維護(hù)保養(yǎng)記錄表
- 《攝影構(gòu)圖》課件
- 醫(yī)藥河南省城市醫(yī)師衛(wèi)生支農(nóng)工作鑒定表
- 自然辯證法智慧樹知到期末考試答案章節(jié)答案2024年浙江大學(xué)
- 《我愛上班》朗誦稿
- 大唐杯5G大賽考試題庫原題真題版(含答案)
- 2024屆高考英語復(fù)習(xí)語法填空課件
- 第14課當(dāng)代中國(guó)的外交課件-高中歷史選擇性必修一
評(píng)論
0/150
提交評(píng)論