




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第三章多元正態(tài)分布參數(shù)的假設(shè)檢驗(yàn)1主要內(nèi)容幾個(gè)重要統(tǒng)計(jì)量的分布單總體均值向量的檢驗(yàn)及置信域多總體均值向量的檢驗(yàn)協(xié)方差陣的檢驗(yàn)獨(dú)立性檢驗(yàn)2§3.1幾個(gè)重要統(tǒng)計(jì)量的分布一、正態(tài)變量二次型的分布1.分量獨(dú)立的n維隨機(jī)向量X
的二次型則,其中設(shè)且相互獨(dú)立,記3X的二次型具有以下一些結(jié)論:結(jié)論1
當(dāng)時(shí),則
當(dāng)時(shí),則有(或記為)。結(jié)論2
當(dāng),的分布常稱為非中心分布。4定義3.1.1
設(shè)n維隨機(jī)向量X~Nn(,In)(≠0),則稱隨機(jī)變量為服從自由度為n、非中心參數(shù)為的分布,記為顯然則當(dāng)X~Nn(,In
),≠0,且時(shí),令5結(jié)論3
設(shè),A為對(duì)稱矩陣,且rank(A)=r二次型(A為對(duì)稱冪等矩陣)。結(jié)論4
設(shè)則其中(對(duì)稱冪等矩陣),且rank(A)=r(r≤n)。6結(jié)論5
二次型與線性函數(shù)的獨(dú)立性:設(shè),A為n階對(duì)稱矩陣,B為m×n矩陣,令,Z=BX(Z為m維隨機(jī)向量),則BX
和相互獨(dú)立
BA=O。結(jié)論6
兩個(gè)二次型相互獨(dú)立的條件:設(shè),A,B為n階對(duì)稱矩陣,則72.一般p維正態(tài)隨機(jī)向量的二次型p維隨機(jī)向量的二次型具有下述結(jié)論:結(jié)論1
設(shè)則,其中結(jié)論2
設(shè)則A為對(duì)稱矩陣,rank(A)=r.則結(jié)論3
設(shè)A和B為p
階對(duì)稱矩陣,則83.非中心
t
分布和非中心F
分布定義3.1.2
設(shè)相互獨(dú)立,令則稱T的分布具有自由度為n、非中心參數(shù)為的非中心t分布,記為T~t(n,).定義3.1.3
設(shè)相互獨(dú)立,令則稱F的分布為具有自由度為m,n和非中心參數(shù)為的F分布,記為F~F(m,n,).94.非中心、非中心
t
分布和非中心F
分布的應(yīng)用在一元統(tǒng)計(jì)中,關(guān)于在一個(gè)正態(tài)總體的均值檢驗(yàn)中,檢驗(yàn)H0:=0時(shí),檢驗(yàn)統(tǒng)計(jì)量為否定域?yàn)閧|T|>},其中滿足:P{|T|>}=(顯著性水平).當(dāng)否定H0時(shí),可能犯第一類錯(cuò)誤,且第一類錯(cuò)誤的概率=P{“以真當(dāng)假”}=P{|T|>|=0}|}=顯著性水平;10當(dāng)H0相容時(shí),可能犯第二類錯(cuò)誤,且第二類錯(cuò)誤的概率=P{“以假當(dāng)真”}=P{|T|≤|≠0}設(shè)=1≠0此時(shí)檢驗(yàn)統(tǒng)計(jì)量T~t(n-1,)(非中心參數(shù)),利用非中心t分布可以計(jì)算第二類錯(cuò)誤的值,從而得到檢驗(yàn)法的功效函數(shù)為1-.類似地,非中心和非中心F分布在一元統(tǒng)計(jì)的相應(yīng)檢驗(yàn)中,將應(yīng)用非中心分布來(lái)計(jì)算第二類錯(cuò)誤。11二、威沙特(Wishart)分布1.威沙特分布的定義定義3.1.4
設(shè)X(a)~Np(0,∑)(a=1,…,n)相互獨(dú)立,記為n×p矩陣,則稱隨機(jī)陣的分布為威沙特分布,記為W~Wp(n,∑).顯然,p=1時(shí),此時(shí)即就是.當(dāng)p=1,時(shí),W1(n,1)就是12一般地,設(shè)X(a)~Np(,∑)(a=1,2,…,n)相互獨(dú)立,記則稱服從非中心參數(shù)為Δ的非中心威沙特分布,記為,其中13當(dāng)X(a)~Np(a
,∑)(a=1,2,…,n)相互獨(dú)立時(shí),非中心參數(shù)或這里其中p為隨機(jī)陣W
的階數(shù),n
為自由度,一元統(tǒng)計(jì)中的
2對(duì)應(yīng)p元統(tǒng)計(jì)中的協(xié)方差陣∑.142.威沙特分布的性質(zhì)性質(zhì)1
設(shè)X(a)~Np(,∑)(a=1,2,…,n)相互獨(dú)立,則樣本離差陣A服從威沙特分布,即性質(zhì)2
關(guān)于自由度n具有可加性:設(shè)(i=1,…,k)相互獨(dú)立,則其中15特別地:(1)aW~Wp(n,a∑)(a>0為常數(shù)).(2)設(shè),則,即性質(zhì)3
設(shè)p階隨機(jī)陣,C是m×p常數(shù)矩陣,則m階隨機(jī)陣也服從威沙特分布,即16性質(zhì)4
分塊威沙特矩陣的分布:設(shè)相互獨(dú)立,其中又已知隨機(jī)陣則(1)(2)當(dāng)時(shí),W11與W22相互獨(dú)立.17性質(zhì)5
設(shè),記,則其中且與W11相互獨(dú)立.性質(zhì)6
設(shè)隨機(jī)陣,則18性質(zhì)7
設(shè),A為n階對(duì)稱矩陣,則其中性質(zhì)8
設(shè)A和B均為n階對(duì)稱冪等矩陣,則相互獨(dú)立19三、霍特林(Hotelling)T2分布1.霍特林T2分布的定義定義3.1.5
設(shè)X~Np(0,∑),隨機(jī)陣W~Wp(n,∑)(∑>0,n≥p),且X與W相互獨(dú)立,則稱統(tǒng)計(jì)量為霍特林T2統(tǒng)計(jì)量,其分布稱為服從
n個(gè)自由度的
T2
分布,記為更一般地,若X~Np(,∑)(≠0),則稱T2的分布為非中心霍特林
T2分布,記為T2~T2(p,n,
).202.霍特林T2分布的性質(zhì)性質(zhì)1
設(shè)X(a)(a=1,…,n)是來(lái)自p元總體Np(,∑)的隨機(jī)樣本,X和A
分別是正態(tài)總體Np(,∑)的樣本均值向量和樣本離差陣,則統(tǒng)計(jì)量21性質(zhì)2
T2與F分布的關(guān)系:設(shè)T2~T2(p,n),則性質(zhì)3
設(shè)X(a)(a=1,…,n)是來(lái)自p元總體Np(,∑)的隨機(jī)樣本.,A分別為樣本均值和樣本離差陣,記則22性質(zhì)4
T2統(tǒng)計(jì)量的分布只與p,n
有關(guān),而與∑無(wú)關(guān)。性質(zhì)5
T2統(tǒng)計(jì)量對(duì)非退化變換保持不變.23四、威爾克斯(Wilks)
統(tǒng)計(jì)量及其分布1.威爾克斯(Wilks)分布的定義定義3.1.6
設(shè)X~Np(,∑),則稱協(xié)方差陣的行列式|∑
|為X的廣義方差.若X(a)(a=1,…,n)為p元總體X的隨機(jī)樣本.A為樣本離差陣,則稱或?yàn)闃颖緩V義方差.定義3.1.7
設(shè)A1~Wp(n1,∑),A2~Wp(n2,∑)(∑>0,n1≥p),且A1與A2獨(dú)立,則稱廣義方差之比為威爾克斯統(tǒng)計(jì)量或統(tǒng)計(jì)量.其分布稱為威爾克斯分布,記為242.統(tǒng)計(jì)量與
T
2
或F
統(tǒng)計(jì)量的關(guān)系結(jié)論1
當(dāng)n2=1時(shí),設(shè)n1=n>p,則或25結(jié)論2
當(dāng)
n2=2時(shí),設(shè)n1=n>p,則結(jié)論3
當(dāng)p=1時(shí),則26結(jié)論4
當(dāng)
p=2時(shí),則結(jié)論5
當(dāng)n2>2,p>2時(shí),可用2
統(tǒng)計(jì)量或F
統(tǒng)計(jì)量近似.博克斯(Box)(1949)給出以下結(jié)論:其中設(shè)~(p,n1,n2),則當(dāng)n→∞時(shí),273.兩個(gè)重要結(jié)論結(jié)論1
若~(p,n1,n2),則存在(k=1,…,p)相互獨(dú)立,使得結(jié)論2
若n2<p,則28§3.2
單總體均值向量的檢驗(yàn)及置信域一、均值向量的檢驗(yàn)設(shè)總體X~Np(,∑),隨機(jī)樣本X(a)(a=1,…,n).檢驗(yàn)(0為已知向量)1.當(dāng)∑=∑0已知時(shí)均值向量的檢驗(yàn)因?yàn)槔枚涡头植嫉慕Y(jié)論,知29按傳統(tǒng)的檢驗(yàn)方法,對(duì)給定的顯著性水平
,查2分布臨界值表得,使,則否定域?yàn)橛蓸颖局礨(a)(a=1,…,n),計(jì)算及值,若,則否定H0,否則H0
相容.假設(shè)在H0成立情況下,隨機(jī)變量,由樣本值計(jì)算得到T02的值為d,同時(shí)可以計(jì)算以下概率值:常稱此概率值為顯著性概率值,或簡(jiǎn)稱為p
值.30
對(duì)給定的顯著性水平,當(dāng)p<
時(shí),則在顯著性水平下否定假設(shè)H0;在這種情況下,可能犯“以真當(dāng)假”的第一類錯(cuò)誤,且
就是犯第一類錯(cuò)誤的概率.
當(dāng)p≥
時(shí),則在顯著性水平下H0相容;在這種情況下,可能犯“以假當(dāng)真”的第二類錯(cuò)誤,且犯第二類錯(cuò)誤的概率
為其中檢驗(yàn)統(tǒng)計(jì)量,非中心參數(shù)312.當(dāng)∑未知時(shí)均值向量的檢驗(yàn)考慮統(tǒng)計(jì)量因?yàn)闃颖倦x差陣為32由定義3.1.5可知再利用T2與F
分布的關(guān)系,檢驗(yàn)統(tǒng)計(jì)量取為33例3.2.1
人的出汗多少與人體內(nèi)鈉和鉀的含量有一定的關(guān)系.今測(cè)量了20名健康成年女性的汗出量(X1)、鈉的含量(X2)和鉀的含量(X3)(數(shù)據(jù)見(jiàn)表3.1).試檢驗(yàn)(=0.05).表3.1成年女性的出汗量及其體內(nèi)鈉和鉀含量的數(shù)據(jù)序號(hào)X1X2X3序號(hào)X1X2X31357911131517193.73.83.12.46.73.93.51.54.54.148.547.255.524.847.436.927.813.571.644.19.310.99.714.08.512.79.810.18.211.224681012141618204.73.24.67.25.44.54.58.56.55.565.153.236.133.154.158.840.256.452.840.98.012.07.97.611.312.38.47.110.99.434解:記隨機(jī)向量,假定X~N3(,∑).檢驗(yàn)取檢驗(yàn)統(tǒng)計(jì)量為由樣本值計(jì)算得:及35進(jìn)一步計(jì)算可得因?yàn)?查表得由于,故H0
相容.36
利用統(tǒng)計(jì)軟件進(jìn)行檢驗(yàn)時(shí),首先計(jì)算p
值(此時(shí)檢驗(yàn)統(tǒng)計(jì)量F~F(3,17)):因?yàn)閜=0.06493>0.05=
,故H0
相容.在這種情況下,可能犯第二類錯(cuò)誤,且第二類錯(cuò)誤的概率為(假定總體均值=1≠0,取1=X
).37二、似然比統(tǒng)計(jì)量設(shè)p元總體的密度函數(shù)為f(x,),其中是未知參數(shù),且∈(參數(shù)空間),又設(shè)0是的子集,我們希望對(duì)下列假設(shè):作出判斷,這就是假設(shè)檢驗(yàn)問(wèn)題.稱H0為原假設(shè)(或零假設(shè)),H1為對(duì)立假設(shè)(或備擇假設(shè)).38從總體X抽取容量為n
的樣本X(t)(t=1,…,n).把樣本的聯(lián)合密度函數(shù)記為L(zhǎng)(X;),并稱它為樣本的似然函數(shù).引入統(tǒng)計(jì)量它是樣本X(t)(t=1,…,n)的函數(shù),常稱為似然比統(tǒng)計(jì)量.由于0,從而0≤≤1.39
定理3.2.1
當(dāng)樣本容量n很大時(shí),近似服從自由度為f的2
分布,其中f=的維數(shù)-0的維數(shù).40
設(shè)樣本的似然函數(shù)為L(zhǎng)(,).檢驗(yàn)均值向量=0的似然比統(tǒng)計(jì)量為:在第二章已經(jīng)導(dǎo)出:上面比式的分母當(dāng)時(shí)達(dá)最大值,且最大值為41上面比式的分子當(dāng)時(shí)達(dá)最大值,且最大值為故42下面來(lái)推導(dǎo)似然比統(tǒng)計(jì)量與T2的關(guān)系:43利用分塊矩陣行列式的性質(zhì)有:44可以得到其中否定域:其中45三、置信域與聯(lián)立置信區(qū)間1.置信域假設(shè)X(t)(t=1,2,…,n)來(lái)自p元正態(tài)總體Np(,∑)(∑未知),由前面的討論可知或者46任給置信度1-,查F的分布臨界值表得F
滿足(3.2.1)則均值向量的置信度為1-的置信域?yàn)樵撝眯庞蚴且粋€(gè)中心在的橢球.47當(dāng)檢驗(yàn)假設(shè)H0:=0時(shí),若0
落入上述置信域內(nèi),即則在顯著水平下,H0相容;若0沒(méi)有落入上述置信域內(nèi),則否定H0.可見(jiàn)在多元統(tǒng)計(jì)中,討論均值向量的假設(shè)檢驗(yàn)問(wèn)題本質(zhì)上也等價(jià)于求均值向量的置信域.48例3.2.1
人的出汗多少與人體內(nèi)鈉和鉀的含量有一定的關(guān)系.今測(cè)量了20名健康成年女性的汗出量(X1)、鈉的含量(X2)和鉀的含量(X3)(數(shù)據(jù)見(jiàn)表3.1).表3.1成年女性的出汗量及其體內(nèi)鈉和鉀含量的數(shù)據(jù)序號(hào)X1X2X3序號(hào)X1X2X31357911131517193.73.83.12.46.73.93.51.54.54.148.547.255.524.847.436.927.813.571.644.19.310.99.714.08.512.79.810.18.211.224681012141618204.73.24.67.25.44.54.58.56.55.565.153.236.133.154.158.840.256.452.840.98.012.07.97.611.312.38.47.110.99.4例3.2.2
沿用例3.2.1的數(shù)據(jù),試求的置信度為95%的置信橢球.49解:
由觀測(cè)數(shù)據(jù)計(jì)算樣本均值向量和樣本離差陣A及樣本協(xié)方差陣SS的特征值和單位正交向量l分別為50記由S-1的譜分解式并令則的置信度為95%的置信橢球?yàn)橹眯艡E球的第一長(zhǎng)軸半徑為方向沿l1;第二長(zhǎng)軸半徑為方向沿l2;短軸半徑為0.8356,方向沿l3.第一長(zhǎng)軸與短軸的比為即第一長(zhǎng)軸的長(zhǎng)度是短軸的12倍還多.512.聯(lián)立置信區(qū)間設(shè)X~Np(,∑),考慮X
的線性組合由多元正態(tài)分布的性質(zhì)2可知:假設(shè)X(t)(t=1,2,…,n)為p元正態(tài)總體Np(,∑)的簡(jiǎn)單隨機(jī)樣本,則總體Z的樣本為且樣本均值和樣本方差分別為這里分別為樣本X(t)(t=1,2,…,n)的樣本均值和樣本協(xié)方差陣.52對(duì)任意的a,考慮的置信區(qū)間便能得到所要的聯(lián)立置信區(qū)間.事實(shí)上,當(dāng)a固定而未知時(shí),的置信度為1-的置信區(qū)間可根據(jù)t
統(tǒng)計(jì)量得到.于是置信區(qū)間為(3.2.2)其中滿足:(這里t~t(n-1)).53由(3.2.2)式可以給出的分量i(i=1,2,…,p)的置信區(qū)間,如取a=ei=(0,…,1,…,0)′,即取ei的第i個(gè)分量為1,其余均為0的向量,則(3.2.2)式給出一元正態(tài)均值的置信區(qū)間.顯然通過(guò)選則不同的系數(shù)向量a,便可得到的若干個(gè)線性組合的置信度為1-的置信區(qū)間;但請(qǐng)注意,這時(shí)總的置信度不再是1-,而比1-低.54下面給出構(gòu)造所有的聯(lián)立置信區(qū)間估計(jì)的Scheffe方法.對(duì)于給定的樣本X(t)(t=1,2,…,n)和系數(shù)向量a,若全體值的置信區(qū)間是由(3.2.2)式給出,則不等式成立.若讓a變化,求所有的聯(lián)立置信區(qū)間,那么應(yīng)將(3.2.2)式的右邊換上更大的常數(shù)才較為合理.為此來(lái)求最大值(3.2.3)根據(jù)附錄中定理7.1有且最大值在a與成比例時(shí)達(dá)到.55定理3.2.2
假設(shè)X(t)(t=1,2,…,n)為來(lái)自p元正態(tài)總體Np(,∑)(∑>0未知)的隨機(jī)樣本,則對(duì)所有的a,區(qū)間包含的概率為1-
(其中F滿足(3.2.1)式).56由于置信概率由T2分布確定,因此為方便起見(jiàn),以后稱定理3.2.2給出的聯(lián)立置信區(qū)間為T2區(qū)間。在T2區(qū)間中,若取a=ei=(0,…,1,…,0)′,我們便同時(shí)得到i(i=1,…,p)的置信度均為1-T2區(qū)間其中sii
為樣本協(xié)方差陣S
的第i個(gè)對(duì)角元素.(3.2.4)57§3.3
多總體均值向量的檢驗(yàn)一、兩正態(tài)總體均值向量的檢驗(yàn)1.兩總體協(xié)方差陣相等(但未知)時(shí)均值向量的檢驗(yàn)設(shè)X(a)(a=1,…,n)為來(lái)自總體X~Np((1),∑)的隨機(jī)樣本,Y(a)(a=1,…,m)為來(lái)自總體Y~Np((2),∑)的隨機(jī)樣本,且相互獨(dú)立,∑未知.檢驗(yàn)檢驗(yàn)統(tǒng)計(jì)量,可考慮以下檢驗(yàn)統(tǒng)計(jì)量T2:其中A1和A2是兩總體的樣本離差陣.58由T2統(tǒng)計(jì)量的定義3.1.5可知利用T2與F的關(guān)系,檢驗(yàn)統(tǒng)計(jì)量取為59
例3.3.1
為了研究日、美兩國(guó)在華投資企業(yè)對(duì)中國(guó)經(jīng)營(yíng)環(huán)境的評(píng)價(jià)是否存在差異.今從兩國(guó)在華投資企業(yè)中各抽出10家,讓其對(duì)中國(guó)的政治、經(jīng)濟(jì)、法律、文化等環(huán)境進(jìn)行打分,評(píng)分結(jié)果如表3.2所示(表中序號(hào)1至10為美國(guó)在華投資企業(yè)的代號(hào),11至20為日本在華投資企業(yè)的代號(hào).數(shù)據(jù)來(lái)源于:國(guó)務(wù)院發(fā)展研究中心APEC在華投資企業(yè)情況調(diào)查).60表3.2日、美兩國(guó)在華投資企業(yè)對(duì)中國(guó)經(jīng)營(yíng)環(huán)境的評(píng)價(jià)數(shù)據(jù)序號(hào)政治環(huán)境經(jīng)濟(jì)環(huán)境法律環(huán)境文化環(huán)境1234567891065756075705560656055355045403040454050552520354030353025303560556570506560607075111213141516171819205550455055606550404555604550504055604550404535503045453530456570757075607580657061解:比較日、美兩國(guó)在華投資企業(yè)對(duì)中國(guó)多方面的經(jīng)營(yíng)環(huán)境的評(píng)價(jià)是否有差異問(wèn)題,就是兩總體均值向量是否相等的檢驗(yàn)問(wèn)題.記美國(guó)在華投資企業(yè)對(duì)中國(guó)4個(gè)方面的經(jīng)營(yíng)環(huán)境的評(píng)價(jià)為4元總體X,并設(shè)X~N4((1),∑).日本在華投資企業(yè)對(duì)中國(guó)經(jīng)營(yíng)環(huán)境的評(píng)價(jià)為4元總體Y,并設(shè)Y~N4((2),∑).來(lái)自兩總體的樣本容量n=m=10.檢驗(yàn)取檢驗(yàn)統(tǒng)計(jì)量為由樣本值計(jì)算得:62進(jìn)一步計(jì)算可得:63對(duì)給定顯著性水平=0.01,利用統(tǒng)計(jì)軟件進(jìn)行檢驗(yàn)時(shí),首先計(jì)算p值(此時(shí)檢驗(yàn)統(tǒng)計(jì)量F~F(4,15)):因p=0.0037<0.01=,故否定H0,即日、美兩國(guó)在華企業(yè)投資對(duì)中國(guó)經(jīng)營(yíng)環(huán)境的評(píng)價(jià)存在顯著性差異.在這種情況下,可能犯第一類錯(cuò)誤,且犯第一類錯(cuò)誤的概率為0.01.642.兩總體協(xié)方差陣不等時(shí)均值向量的檢驗(yàn)在一元統(tǒng)計(jì)中(p=1時(shí)),當(dāng)時(shí),檢驗(yàn)H0:(1)=(2)也沒(méi)有很好的方法,以下介紹實(shí)用中的幾種方法.(1)當(dāng)n=m時(shí),作為成對(duì)數(shù)據(jù)進(jìn)行處理:令將兩個(gè)總體化為單個(gè)p元總體Z的均值檢驗(yàn)問(wèn)題利用§3.2中介紹的方法進(jìn)行檢驗(yàn).注意:這里X(i)與Y(i)(i=1,…,n)相互獨(dú)立的信息沒(méi)有利用.65(2)當(dāng)n≠m時(shí)(不妨設(shè)n<m):想法也是將其化為單個(gè)p元新總體的均值檢驗(yàn)問(wèn)題.若只取n對(duì)數(shù)據(jù),按(1)的方法處理又將損失一些信息.改進(jìn)的方法是利用X(i)(i=1,…,n)和Y(j)(j=1,…,m)構(gòu)造新總體Z的樣本Z(i),令66可以證明:def所以Z(i)~Np((1)-(2),∑Z)(i=1,…,n),且相互獨(dú)立.利用前面介紹的單個(gè)正態(tài)總體均值向量的檢驗(yàn)方法進(jìn)行檢驗(yàn).(3)當(dāng)∑1和∑2相差甚大時(shí),可構(gòu)造近似檢驗(yàn)統(tǒng)計(jì)量進(jìn)行檢驗(yàn)(見(jiàn)參考文獻(xiàn)[1]).67二、多正態(tài)總體均值向量的檢驗(yàn)——多元方差分析設(shè)有k個(gè)p元正態(tài)總體Np((t),)(t=1,…,k),(t=1,…,k;a=1,…,nt)是來(lái)自Np((t),)的隨機(jī)樣本,檢驗(yàn)H0:(1)=(2)=…=(k),H1:至少存在i≠j使得(i)
≠
(j)(即(1),…,(k)中至少有一對(duì)不等).
當(dāng)p=1時(shí),此檢驗(yàn)問(wèn)題就是一元方差分析問(wèn)題,比如比較k個(gè)不同品牌的同類產(chǎn)品中某一質(zhì)量指標(biāo)X(如耐磨度)有無(wú)顯著差異的問(wèn)題.我們把不同品牌對(duì)于不同總體(假定為正態(tài)總體),這樣多組比較問(wèn)題就是檢驗(yàn)68
從第i個(gè)總體抽取容量為ni
的隨機(jī)樣本如下(i=1,…,k;記n=n1+n2+…+nk):記69記總偏差平方和SST=組內(nèi)偏差平方和SSE=組間偏差平方和SSA=則有平方和分解公式:SST=SSA+SSE70直觀考察,若H0成立,當(dāng)總偏差平方和SST固定不變時(shí),應(yīng)有SSA小而SSE大,因此比值SSA/SSE應(yīng)很小.檢驗(yàn)統(tǒng)計(jì)量取為給定顯著性水平,按傳統(tǒng)檢驗(yàn)方法,查F分布臨界值表得F滿足P{F>F}=,否定域W={F>F}.71推廣到k個(gè)p元總體Np((i),)(假定k個(gè)總體的協(xié)方差陣相等,且記為),記第i個(gè)p元總體的數(shù)據(jù)陣為對(duì)總離差陣T進(jìn)行分解:其中稱為組內(nèi)離差陣,稱為組間離差陣.72根據(jù)直觀想法及用似然比原理得到檢驗(yàn)H0的統(tǒng)計(jì)量為易見(jiàn):(1)因Ai~Wp(ni-1,)且相互獨(dú)立(i=1,…,k),由可加性得(2)在H0下,T~Wp(n-1,).(3)還可以證明在H0下,B~Wp(k-1,),且B與A相互獨(dú)立.73根據(jù)分布的定義,可知給定顯著性水平,查威爾克斯臨界值表,可得,使故否定域W={<}.當(dāng)手頭沒(méi)有威爾克斯臨界值表時(shí),可用2分布或F分布來(lái)近似,即由的函數(shù)的近似分布進(jìn)行檢驗(yàn)(見(jiàn)參考文獻(xiàn)[1]或[2]).74例3.3.2
為了研究某種疾病,對(duì)一批人同時(shí)測(cè)量了4個(gè)指標(biāo):脂蛋白(X1),甘油三脂(X2),脂蛋白(X3),前脂蛋白(X4)
。按不同年齡、不同性別分為三組(20至35歲的女性、20至25歲的男性和35至50歲的男性),數(shù)據(jù)見(jiàn)表3.3。試問(wèn)這三個(gè)組的4項(xiàng)指標(biāo)間有無(wú)顯著差異(=0.01)?75X1X2X3X4組X1X2X3X4組X1X2X3X4組260200240170270205190200250200225210170270190280310270250260757287651101306945117107130125647660811195767135403445393934274521283626313334202531313918171817242315152020111714131618158142911111111111111111111310310190225170210280210280200200280190295270280240280370280122604065658267386576769460551251206269704030352734373137363040392633302432322930372118151616171817231720111716211820202017222222222222222222223202603602952703802402602602952403103303452502602253453602506459881006511455551107311410311212762591001201071173937283632364234293338322124222134362536171126122121102020211818112016193018231633333333333333333333表3.3身體指標(biāo)化驗(yàn)數(shù)據(jù)76解:比較三個(gè)組(k=3)的4項(xiàng)指標(biāo)(p=4)間是否有差異問(wèn)題,就是多總體均值是否相等的檢驗(yàn)問(wèn)題.設(shè)第i組為4元總體N4((i),)(i=1,2,3),來(lái)自3個(gè)總體的樣本容量n1=n2=n3=20.檢驗(yàn):
因似然比統(tǒng)計(jì)量~(p,n-k,k-1),在此例中k-1=2,可以利用統(tǒng)計(jì)量與F統(tǒng)計(jì)量的關(guān)系,取檢驗(yàn)統(tǒng)計(jì)量為F統(tǒng)計(jì)量:77由樣本值計(jì)算得:,以及78進(jìn)一步計(jì)算可得79
對(duì)給定=0.01,利用統(tǒng)計(jì)軟件(如SAS系統(tǒng)),首先計(jì)算p值(此時(shí)檢驗(yàn)統(tǒng)計(jì)量F~F(8,108)):因p=0.003538<0.01=,故否定H0,這表明三個(gè)組的指標(biāo)之間有顯著的差異.在這種情況下,可能犯第一類錯(cuò)誤,且犯第一類錯(cuò)誤的概率為0.01.
進(jìn)一步地若還想了解三個(gè)組指標(biāo)間的差異究竟是由哪幾項(xiàng)指標(biāo)引起的,可以對(duì)4項(xiàng)指標(biāo)逐項(xiàng)用一元方差分析法進(jìn)行檢驗(yàn),我們將發(fā)現(xiàn)三個(gè)組指標(biāo)間只有第一指標(biāo)X1有顯著差異.80
事實(shí)上,用一元方差分析檢驗(yàn)第一項(xiàng)指標(biāo)X1在三個(gè)組中是否有顯著差異時(shí),因其中t11和a11分別是T和A中的第一個(gè)對(duì)角元素,有
p1=P{F1≥8.8780}=0.0004401(檢驗(yàn)統(tǒng)計(jì)量F1~F(2,57)),因p1=0.0004401顯著地小于0.01,故第一項(xiàng)指標(biāo)X1在三個(gè)組中有顯著差異.81§3.4
協(xié)方差陣的檢驗(yàn)一、單個(gè)p元正態(tài)總體協(xié)方差陣的檢驗(yàn)設(shè)X(a)(a=1,…,n)為來(lái)自p元正態(tài)總體Np(,)(>0未知)的隨機(jī)樣本,檢驗(yàn)1.當(dāng)0=Ip時(shí)檢驗(yàn)H0:=Ip,H1:Ip利用似然比原理來(lái)導(dǎo)出似然比統(tǒng)計(jì)量1:82當(dāng)=Ip成立時(shí),似然函數(shù)L(,Ip)在=X
達(dá)最大值,因此1表示式的分子=L(X,Ip)1表示式的分母=L(X,)83似然比統(tǒng)計(jì)量其中
利用定理3.2.1可知,當(dāng)n很大且H0成立時(shí),ξ=-2ln1的近似分布為,利用檢驗(yàn)統(tǒng)計(jì)量ξ來(lái)構(gòu)造檢驗(yàn)方法.842.當(dāng)0Ip時(shí)檢驗(yàn)H0:=0
,H1:0因0>0,存在非退化矩陣Dp×p,使D0D=Ip.令則def檢驗(yàn)其中85若注意到D0D=Ip,則似然比統(tǒng)計(jì)量2還可以表示為研究似然比統(tǒng)計(jì)量2的抽樣分布是很困難的,通常根據(jù)定理3.2.1由2的近似分布來(lái)構(gòu)造檢驗(yàn)法.當(dāng)樣本容量n很大時(shí),在H0
成立時(shí),-2ln2的極限分布為除此以外,在不同適用范圍下還有其他近似分布可用來(lái)構(gòu)造檢驗(yàn)法(見(jiàn)參考文獻(xiàn)[1]或[2]).863.檢驗(yàn)H0:=20
(2未知)當(dāng)0=Ip時(shí)此檢驗(yàn)常稱為球性檢驗(yàn).以下利用似然比原理來(lái)導(dǎo)出似然比統(tǒng)計(jì)量3:87當(dāng)2給定時(shí),似然函數(shù)L(,20)在=X達(dá)最大值,且令可得出.88從而有3表示式的分子=3表示式的分母=89似然比統(tǒng)計(jì)量或等價(jià)于當(dāng)樣本容量n很大時(shí),在H0為真時(shí)有以下近似分布:近似為90二、多總體協(xié)方差陣的檢驗(yàn)設(shè)有k個(gè)總體Np((t),t)(t=1,…,k),(t=1,…,k;a=1,…,nt)為來(lái)自第t個(gè)總體Np((t),t)的隨機(jī)樣本,記.檢驗(yàn)def似然比統(tǒng)計(jì)量4為91上式的分母=上式的分子=92則似然比統(tǒng)計(jì)量4為根據(jù)無(wú)偏性的要求進(jìn)行修正,將4中的ni用ni-1替代,n用n-k替代.然后對(duì)4取對(duì)數(shù),可得到統(tǒng)計(jì)量:93當(dāng)樣本容量n很大時(shí),在H0為真時(shí)M有以下近似分布:其中94例3.4.1
對(duì)例3.3.2表3.3中給出的身體指標(biāo)化驗(yàn)數(shù)據(jù),試判斷三個(gè)組(即三個(gè)總體)的協(xié)方差陣是否相等?(=0.10)解:這是三個(gè)4元正態(tài)總體的協(xié)方差陣是否相等的檢驗(yàn)問(wèn)題.設(shè)第i
組為4維總體N4((i),i)(i=1,2,3).來(lái)自三個(gè)總體的樣本容量n1=n2=n3=20.檢驗(yàn)在H0成立時(shí),取近似檢驗(yàn)統(tǒng)計(jì)量為2(f)統(tǒng)計(jì)量:95由樣本計(jì)算三個(gè)總體的樣本協(xié)方差陣:9697進(jìn)一步計(jì)算可得對(duì)給定=0.10,利用統(tǒng)計(jì)軟件,首先計(jì)算p值(此時(shí)檢驗(yàn)統(tǒng)計(jì)量):因p=0.4374>0.10=,故H0相容,這表明三個(gè)組的協(xié)方差陣之間沒(méi)有顯著的差異.98三、多個(gè)正態(tài)總體的均值和協(xié)方差陣同時(shí)檢驗(yàn)設(shè)有k個(gè)總體Np((t),t)(t=1,…,
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 離婚協(xié)議書美國(guó)
- 醫(yī)藥研發(fā)合同2024年
- 個(gè)人私家車租賃合同
- 二手合法房屋買賣合同
- 電子身份認(rèn)證系統(tǒng)開發(fā)授權(quán)協(xié)議
- 手房買賣學(xué)區(qū)房補(bǔ)充協(xié)議
- 電影拍攝聘用合同
- 企業(yè)年度慶典活動(dòng)方案
- 單元主題二“滄海桑田”-地表形態(tài)的形成與演變-高中地理單元教學(xué)設(shè)計(jì)
- 買賣合同-油脂油料省間調(diào)撥合同8篇
- 大學(xué)學(xué)院學(xué)生獎(jiǎng)助資金及相關(guān)經(jīng)費(fèi)發(fā)放管理暫行辦法
- 神木市孫家岔鎮(zhèn)神能乾安煤礦礦山地質(zhì)環(huán)境保護(hù)與土地復(fù)墾方案
- 那些活了很久很久的樹
- 2023年R2移動(dòng)式壓力容器充裝操作證考試題及答案(完整版)
- 無(wú)為市人民醫(yī)院城東醫(yī)院建設(shè)項(xiàng)目環(huán)境影響報(bào)告書
- 九年級(jí)物理實(shí)驗(yàn)記錄單
- 非煤礦山安全應(yīng)急預(yù)案
- 高一英語(yǔ)閱讀理解專練20篇
- 2022年湖北省高中學(xué)業(yè)水平考試真題-音樂(lè)學(xué)科
- 博朗IRT6520中文說(shuō)明書家用版
- 旅行社運(yùn)營(yíng)實(shí)務(wù)電子課件 1.1 初識(shí)旅行社
評(píng)論
0/150
提交評(píng)論