多元正態(tài)分布均值向量和協(xié)差陣的檢驗(yàn)_第1頁
多元正態(tài)分布均值向量和協(xié)差陣的檢驗(yàn)_第2頁
多元正態(tài)分布均值向量和協(xié)差陣的檢驗(yàn)_第3頁
多元正態(tài)分布均值向量和協(xié)差陣的檢驗(yàn)_第4頁
多元正態(tài)分布均值向量和協(xié)差陣的檢驗(yàn)_第5頁
已閱讀5頁,還剩37頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

多元統(tǒng)計(jì)分析第三章多元正態(tài)分布均值向量和協(xié)差陣的檢驗(yàn)一、均值向量的檢驗(yàn)二、協(xié)差陣的檢驗(yàn)

1、霍特林(Hotelling)分布

由于這一統(tǒng)計(jì)量的分布首先由霍特林提出來的,故稱為霍特林T2分布。值得指出的是,我國著名的統(tǒng)計(jì)學(xué)家許寶騄先生在1938年用不同的方法也導(dǎo)出T2分布的密度函數(shù)。在一元統(tǒng)計(jì)中,若來自總體的樣本,則統(tǒng)計(jì)量其中顯然與上面給出的T2統(tǒng)計(jì)量形式類似,且,可見T2分布是t分布的推廣。

在一元統(tǒng)計(jì)中,若分布,則分布,即把t分布轉(zhuǎn)化為F分布來處理,在多元統(tǒng)計(jì)分析中統(tǒng)計(jì)量也有類似的性質(zhì)。這個(gè)公式在后面檢驗(yàn)中經(jīng)常用到。2、一個(gè)正態(tài)總體均值向量的假設(shè)檢驗(yàn)這里需要對(duì)統(tǒng)計(jì)量的選取做一些解釋,說明為什么統(tǒng)計(jì)量服從分布。根據(jù)二次型分布定理,若則顯然而故在處理實(shí)際問題時(shí),單一變量的檢驗(yàn)和多變量的檢驗(yàn)可以聯(lián)合使用,多元的檢驗(yàn)具有概括和全面的特點(diǎn),而一元的檢驗(yàn)容易發(fā)現(xiàn)各變量之間的關(guān)系和差異,能給人們提供更多的統(tǒng)計(jì)分析的信息。例1:對(duì)某地區(qū)農(nóng)村的6名2周歲男嬰的身高、胸圍、上半臂圍進(jìn)行測(cè)量,得樣本數(shù)據(jù)如表所示:編號(hào)身高(cm)胸圍(cm)上半臂圍(cm)17860.616.527658.112.539263.214.548159.014.058160.815.568459.514.0根據(jù)以往資料,該地區(qū)城市2周歲男嬰的三個(gè)指標(biāo)的均值為(90,58,16),假定總體服從正態(tài)分布,問該地區(qū)農(nóng)村男嬰與城市男嬰在上述三個(gè)指標(biāo)的均值有無顯著性差異?顯著性水平取0.01。這是一個(gè)假設(shè)檢驗(yàn)問題:3、兩個(gè)正態(tài)總體均值向量的假設(shè)檢驗(yàn)當(dāng)兩個(gè)總體的協(xié)方差陣未知時(shí),自然會(huì)想到用每個(gè)總體的樣本協(xié)方差陣和去代替,而又由于所以有以后假設(shè)統(tǒng)計(jì)量的選取和前面統(tǒng)計(jì)量的選取思路是一樣的,只提出待檢驗(yàn)的假設(shè),然后給出統(tǒng)計(jì)量及其分布,為節(jié)省篇幅,就不再重復(fù)解釋。序號(hào)政治環(huán)境經(jīng)濟(jì)法律環(huán)境文化環(huán)境1653525602755020553604535654754040705703030506554035657604530608654025609605030701055553575序號(hào)政治環(huán)境經(jīng)濟(jì)法律環(huán)境文化環(huán)境1555540652506045703454535754505050705555030756604045607655545758506035809404530651045504570且兩組樣本相互獨(dú)立,有共同未知協(xié)方差陣假設(shè)檢驗(yàn)構(gòu)造統(tǒng)計(jì)量經(jīng)計(jì)算得進(jìn)一步計(jì)算得對(duì)于給定的顯著性水平,查F分布表,臨界值

(1)單因素方差分析(復(fù)習(xí))Wilks(威爾克斯分布)

在一元統(tǒng)計(jì)分析中,方差是刻畫隨機(jī)變量分散程度的一個(gè)重要特征,而方差的概念在多變量情況下變?yōu)閰f(xié)差陣。如何用一個(gè)數(shù)量指標(biāo)來反映協(xié)差陣所體現(xiàn)的分散程度呢?有的用行列式,有的用跡等方法,目前用的最多的是行列式。這里需要說明的是,在實(shí)際應(yīng)用中經(jīng)常把Λ統(tǒng)計(jì)量化為T2統(tǒng)計(jì)量,進(jìn)而再化為F統(tǒng)計(jì)量,利用F統(tǒng)計(jì)量來解決多元統(tǒng)計(jì)分析中有關(guān)檢驗(yàn)問題。(3)多元方差分析類似一元方差分析辦法,將諸平方和變成離差陣有:例3.3為了研究某種疾病,對(duì)一批人同時(shí)測(cè)量了4個(gè)指標(biāo):β脂蛋白(X1),甘油三酯(X2),α脂蛋白(X3),前β脂蛋白(X4),按不同年齡、不同性別分為三組(20至35歲女性、20至25歲男性和35至50歲男性),數(shù)據(jù)見表3.4~表3.6,試問這三組的4項(xiàng)指標(biāo)間有無顯著性差異?(α=0.01)表3.420至35歲女性身體指標(biāo)化驗(yàn)數(shù)據(jù)序號(hào)β脂蛋白(X1)甘油三酯(X2)α脂蛋白(X3)前β脂蛋白(X4)12607540182200723417324087451841706539175270110392462051303423719069271582004645159250117212010200107282011225130361112210125261713170643114142707633131519060341616280812018173101192515182705731819250673114202601353929表3.520至25歲男性身體指標(biāo)化驗(yàn)數(shù)據(jù)序號(hào)β脂蛋白(X1)甘油三酯(X2)α脂蛋白(X3)前β脂蛋白(X4)1310122302123106035183190402715422565341651706537166210823117728067371882103836179280653023102007640171120076392012280942611131906033171429555301615270125242116280120321817240623220182806929201937070302020280403717表3.635至50歲男性身體指標(biāo)化驗(yàn)數(shù)據(jù)序號(hào)β脂蛋白(X1)甘油三酯(X2)α脂蛋白(X3)前β脂蛋白(X4)132064391722605937113360882826429510036125270653221638011436217240554210826055342092601102920102957333211124011438181231010332181333011221111434512724201525062221616260592119172251003430183451203618193601072523202501173616解:比較3個(gè)組(k=3)的4項(xiàng)指標(biāo)(p=4)間是否有顯著性差異問題,就是多總體均值向量是否相等的檢驗(yàn)問題。設(shè)第i組為4維總體,來自3個(gè)總體的樣本容量。檢驗(yàn)::至少有一對(duì)不相等。因統(tǒng)計(jì)量,可利用統(tǒng)計(jì)量與F統(tǒng)計(jì)量的關(guān)系,取檢驗(yàn)統(tǒng)計(jì)量為F統(tǒng)計(jì)量:其中由樣本計(jì)算得:,,

進(jìn)一步計(jì)算可得計(jì)算F統(tǒng)計(jì)量的2個(gè)自由度為8和108。對(duì)于給定的檢驗(yàn)水平,查F分布表,得臨界值。由于樣本值,則拒絕H0。說明三個(gè)組的指標(biāo)間有顯著性的差異。進(jìn)一步若還想了解三個(gè)組間指標(biāo)的差異究竟由哪幾項(xiàng)指標(biāo)引起的,可以對(duì)4項(xiàng)指標(biāo)逐項(xiàng)用一元方差分析方法進(jìn)行檢驗(yàn),我們將發(fā)現(xiàn)三個(gè)組指標(biāo)間只有第一項(xiàng)指標(biāo)(X1)有顯著性差異。事實(shí)上,用一元方差分析檢驗(yàn)第一項(xiàng)指標(biāo)(X1)在三個(gè)組中是否有顯著性差異時(shí),因?qū)τ诮o定的檢驗(yàn)水平,查F分布表,得臨界值。由于樣本值,說明第一項(xiàng)指標(biāo)(X1)有顯著性的差異。例4:對(duì)例3中給出的3組身體指標(biāo)化驗(yàn)數(shù)據(jù),試判斷這3個(gè)組的協(xié)方差陣是否相等?()解:這是3個(gè)4維正態(tài)總體的協(xié)方差陣是否相等的檢驗(yàn)問題。設(shè)第i組為4維總體,來自3個(gè)總體的樣本容量。

檢驗(yàn):至少有一對(duì)不相等。在成立時(shí),取近似檢驗(yàn)統(tǒng)計(jì)量為統(tǒng)計(jì)量:由樣本值計(jì)算3個(gè)總體的樣本協(xié)方差陣:,進(jìn)一步可以計(jì)算出則得

對(duì)于給定的檢驗(yàn)水平,查分布表,得臨界值。由于樣本值則接受H0。說明這3個(gè)組的協(xié)方差陣之間沒有顯著性的差異。3、多個(gè)正態(tài)總體均值向量和協(xié)差陣同時(shí)檢驗(yàn)設(shè)有k個(gè)p維正態(tài)總體分別為每個(gè),且未知,從k個(gè)正態(tài)總體中分別取ni()個(gè)獨(dú)立樣本如下:第2個(gè)總體:

第k個(gè)總體:我們考慮假設(shè)檢驗(yàn):且

第1個(gè)總體:或至少有一對(duì)不相等。

構(gòu)造統(tǒng)計(jì)量

其中

記在實(shí)際應(yīng)用中,將統(tǒng)計(jì)量中的改為n-k改為n,得到修正的統(tǒng)計(jì)量,記為則統(tǒng)計(jì)量在n很大,H0成立時(shí),統(tǒng)計(jì)量近似服從

其中:

給定檢驗(yàn)水平,由樣本值計(jì)算出值,若,或否則拒絕H0,否則接受H0。例3.5對(duì)例3.3中給出的3組身體指標(biāo)化驗(yàn)數(shù)據(jù),試判斷這3個(gè)組的均值向量和協(xié)方差陣是否相等?()解:這是3個(gè)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論