數(shù)理統(tǒng)計與隨機過程講義_第1頁
數(shù)理統(tǒng)計與隨機過程講義_第2頁
數(shù)理統(tǒng)計與隨機過程講義_第3頁
數(shù)理統(tǒng)計與隨機過程講義_第4頁
數(shù)理統(tǒng)計與隨機過程講義_第5頁
已閱讀5頁,還剩18頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第四章假設(shè)檢驗假設(shè)檢驗是一種重要應(yīng)用價值的統(tǒng)計推斷形式,是數(shù)理統(tǒng)計的分支。從發(fā)展歷史上有重要的節(jié)點為1:Pearson的擬合優(yōu)度的/2檢驗19002:Fisher的顯著性檢驗19203:Neyman-Pearson一致最優(yōu)檢驗19284:Wald的判決理論19505:Bayes方法(二戰(zhàn)之后發(fā)展的學派)§4.1基本術(shù)語關(guān)于隨機變量的分布、數(shù)字特征等,每一種論斷都稱為統(tǒng)計假設(shè),分為參數(shù)假設(shè)和非參數(shù)假設(shè),例如X~N(u,c2),假設(shè)H:u=1,。=1就稱為參數(shù)假設(shè);給定一組樣本值,假設(shè)H:X~正態(tài)分布,對于分布進行論斷,為非參數(shù)假設(shè)。無論上面那種假設(shè),都是給出一個對立的假設(shè),比如X~N(u,。2),那么假設(shè)H0:u=1,。=1的對立假設(shè)就是H1:u豐1,。豐1,我們就把氣稱為基本假設(shè),或者原假設(shè),而H]就稱為對立(備選)假設(shè)為了分別那個假設(shè)是對的,需要判斷假設(shè)真?zhèn)?,就是對假設(shè)做出“否”還是“是”的程序就是檢驗,這個檢驗常用否定域形式給出,按照一定規(guī)則把樣本值集合分成兩個部分VuV,當樣本值落入子集V認為H0不真,那么V是H0的否定域,V為H0的接受域那么這樣就產(chǎn)生了兩種錯誤第一類錯誤a:本來H是真,但是卻否定了,棄真;0第二類錯誤P:本來H不真,但是卻接受為真,叫取偽。選定一種檢驗方法,我們希望上述兩種錯誤概率都小。但是給定樣本容量,使得兩種錯誤任意小是不可能的,我們主要研究兩大類檢驗方法:1:樣本容量給定,控制第一類錯誤,使得錯誤概率有一個上界a,叫做檢驗的顯著性水平,根據(jù)這種原則建立的檢驗就是蘭水平顯著性檢驗;2:樣本容量給定,控制第一類錯誤a水平固定,還使得第二類錯誤最小,就是接受不真實假設(shè)的概率最小,否定不真實假設(shè)的概率就稱為檢驗功效1-0使得功效最大,,根據(jù)這種原則建立的檢驗就是史水平最大功效檢驗,或者最佳檢驗。§4.2參數(shù)假設(shè)檢驗設(shè)X符合分布F(x,0),未知參數(shù)0g0參數(shù)空間,空間分成兩部分00和。-00,二者交集為空。主要對于正態(tài)分布參數(shù)的統(tǒng)計假設(shè)的顯著性檢驗方法。針對不同問題,提出基本假設(shè)與備選假設(shè)H0:0G00H1:0G0-00如果參數(shù)空間僅僅是由0=0。和0=q兩個點組成的,那么我們稱簡單假設(shè),否則是復(fù)合假設(shè)。給定檢驗的顯著性水平a,其大小依據(jù)不同問題不同,比如火箭、飛機等可靠性問題,a要越小越好,對于一般生產(chǎn)問題,太小了則意味著生產(chǎn)時間和成本的增加;建立對于基本假設(shè)的統(tǒng)計量和否定域;取樣,計算統(tǒng)計量值,落入否定域則判讀H0為假,否則為真。例壬:某種藥片制劑中國家規(guī)定成分A的含量X必須為10%,現(xiàn)在抽取5個片劑試樣,測得A的含量為10.9%9.45%10.38%9.61%9.92%假設(shè)X?N(u0=10%,Q2),按照顯著性水平a=0.05進行檢驗是否與規(guī)定10%相符?解:建立基本假設(shè)H0:u=u0,這里顯著性水平a=0.05,樣本容量為5,樣本值如上。如何確定統(tǒng)計量呢?樣本均值X可以求出,但是這里方差未知,用無偏估計量s:*來代替a2,那么統(tǒng)計量t=*匕?t(n—1)<S2*/nn

這是我們以前推導(dǎo)過的,因此可以建立否定域為尸〈I11>t}=a〔?〕即落入?yún)^(qū)域111>t則認為假,此區(qū)域之外就是真。a這類檢驗也稱為t-檢驗法。回到我們的問題,x=0.1005,S2*=上^(x-x)2=0.00592,那么i=1t=七%=1.6949為統(tǒng)計量的值,由顯著性水平a=0.05,我們查得,、';S2*/nnt(4)=2.7764。0052由于t=1.6949<t(4)=2.7764,這個統(tǒng)計量值落在否定域之外,就是說基0052本假設(shè)是真的,因此判斷顯著性水平a=0.05下規(guī)定成分A的含量與規(guī)定10%相符的。兩樣本t檢驗法:有時為了比較兩種方法、儀器、產(chǎn)品等的差異性,我們在相同條件下做對比試驗,然后得到成對的數(shù)據(jù),分析這些數(shù)據(jù)作出推斷。再次回顧第二章中定理F=-1企j,?N(u_,

“2i=1筆),2n2定理:設(shè)x,x,…,x子樣來自母體N(u,C2),j,j,…,j子樣來自母體12n11112n2NF=-1企j,?N(u_,

“2i=1筆),2n222ni1nTOC\o"1-5"\h\z1i=11那么X-F?N(u-u,—+1),那么一個新的變量12nnU=(又-F)-(u1-u)?N(0,1)

b2b2

+—2-Vnn'1U=(又-F)-(u1-u)?N(0,1)

b2b2

+—2-Vnn'12123^L12

V=n_-S2*+n_-S2*符合x2(n-1)+x2(n-1),即x2(n+n—2),加和性質(zhì)b21b221212且上述兩個變量相互獨立。那么依據(jù)定義「V/(n+n—2)~’(n1+n2—2)12例子:設(shè)兩種橡膠輪胎進行耐磨性試驗對比,從中各自隨機取8個,各取一個隨機配對裝在8架飛機上,經(jīng)過一段時間測量磨損量如下(單位毫克)這里顯著性水平a=0.05。X49005220550060204870634076608650Y49304900514057005010611068807930方法一:假設(shè)兩個母體N(u,b2),N(u2,b2)方差一樣原假設(shè)H0:u1=u2,對立假設(shè)為H:u尹u獨立那么按照上述定理得到X=6145S「2=18673;1Y=5825S;=120442代入得到U

vU

vV/14=0.516?t(14)查表t(a/2)=2.145,可見大于計算的統(tǒng)計量值,那么就不否定(接受)假14設(shè)H0,認為二者磨損量無顯著差異。方法二:我們采用配對實驗TOC\o"1-5"\h\zZ=X-Y-30320360320-140230780720由于E[z]=E[x—y]=旦一旦=d,D[z]=D[x]+D[y]=b2iii12iiiD那么,z,是來自母體N(d,bD)的正態(tài)母體,此時假設(shè)H0:u1=u2等價于d=0的假設(shè),設(shè)Z=1乙=320,S2*=占^(z,—Z)2=102200,那么我們也可以構(gòu)造ni=1ni=1=2.83?t\o"CurrentDocument"V;S*2/n7、n查表,顯著性水平a=0.05下,t14(a/2)=2.365,我們發(fā)現(xiàn)2.83>2.365,說明落在了否定域,即否定原假設(shè)H0,兩種輪胎的耐磨性是有差異的。討論:同一顯著性水平a=0.05下,相同的數(shù)據(jù),為何兩種方法得到完全不同的推斷結(jié)論呢?這是因為,配對分析時,自由度下降了n=8-1,從而臨界值提高了,即t(a/2)=2.365,增加了否定原假設(shè)的可能性,每架飛機突出兩種輪胎之間差14異,消除了飛機之間的數(shù)據(jù)影響,只要兩個輪子耐磨性有一定差異,就可能否定假設(shè)H0;而不做配對,自由度增加為8+8-2=14,臨界值降低,減小了否定原假設(shè)的可能性。什么時候用方法一還是方法二,還是得靠具體情況定。其他不同的問題,構(gòu)造不同的統(tǒng)計量,利用不同的分布進行檢驗,書上有基本的統(tǒng)計量表格,無非就是查表計算問題。§4.3非參數(shù)假設(shè)的x2檢驗所謂非參數(shù)假設(shè),就是不確切知道母體分布的數(shù)學形式的情況下,對于母體分布的各種論斷,比如服從什么什么分布,相互獨立,等等。其特點是:A不依賴與母體分布的具體形式,什么形式都適用的檢驗;B由于缺乏母體分布的完全知識,所以使用的統(tǒng)計量精確分布難以求出,只能求出極限分布,一般需要大樣本容量。Pearson提出了x2檢驗法,步驟為1):將所有觀測值X進行分割不同子集X=U氣,A.nA=忙2j,子集的k=1數(shù)目為尸;2):統(tǒng)計觀測值在每個子集氣中出現(xiàn)的頻數(shù)匕(出現(xiàn)的次數(shù)),當然滿足£n=n;kk=13):在基本假設(shè)H0真實的情況下,就是按照我們設(shè)定的分布概率密度函數(shù),計算每個子集氣中的理論期望頻數(shù),設(shè)落入概率為P=P{xeAJH}=jf(xIH0)dx,k=1,2,???,r,^.=1注意這是概率Akk=1

那么我們得到期望頻數(shù)為E=nP,就是總共抽取n個樣本,那么每個子n,kk集氣內(nèi)理論上應(yīng)該抽取了幾個。建立統(tǒng)計量X2=£(〃廣孵=£(nW)r2(-1)EnPk=1nk=1kk符合X2(r-1)分布,且表示了實際觀察和理論結(jié)果之間相對差異的總和,當這個值大于某個臨界值,則否定此假設(shè)。否則接受假設(shè)。Pearson證明為何上述統(tǒng)計量符合X2(r-1)分布:證明:1)當r=2兩個子集,n+n=n,P+P=1(n—nP)2_

nP(1-P)—中11TOC\o"1-5"(n—nP)2_

nP(1-P)—中112(n—nP)2那么X2=才二nPk=1k這里注意(n-nP)2=(n-n-n(1-P))2=(n-nP)2,代入即可221111那么由DeMoirre-Laplace(隸莫弗)定理,二項分布門=n\nPi=的極限*P(1-P)'11分布為標準正態(tài)分布,即門?N(0,1),那么平?X2(2-1)分布。這是r=2時是符合的。2)當r>2的一般情況我們知道頻數(shù)有§"=n,上面為二項分布,這里符合多項分布k=1nrn!nrn!*n!*…*n!11r12r

同樣由中心極限定理.氣—叫~N(0,1),那么P)Y=n「nPj~N(0,1-P.)j.JnPX2=£("匚氣k”=£(氣"nPk)2就是rX2=£("匚氣k”=£(氣"nPk)2就是r個正態(tài)隨機變量的平方和,但是由于這k=1nk=1kk些變量之間有一個制約關(guān)系。就像前面我們證明正態(tài)母體均值和方差的分布時一樣證明方法,構(gòu)造的正交矩陣使得z=AY,我們會發(fā)現(xiàn)E.—n-nPVn—nP1VVP,j,j-=£-4~j=—=(£n—n£P(guān))=0j=1TOC\o"1-5"\h\zj=1y'jj=1''n'、‘"j=1j=1X2==£(n=£丫火=&火,只是r—1正態(tài)變量的平方和,所以自由度為j=1k=1kk=1k=2r-1。損失的信息就是因為那個制約關(guān)系存在。Fisher推論:如果分布f(X;9)有m個未知參數(shù)0=(七七…,。),那么□X2=£四二E21服從X2(r—m—1)分布,這里0=(0,0,…,0)是最大似然估計nP12mk=1k量,P也是有0=&,6,???,§)利用最大似然估計之后,代入假設(shè)的分布函數(shù)k12mf(X;0)計算得到的。因為§=&,6,…,0)也是從樣本數(shù)據(jù)中得到的,已經(jīng)用掉12m□了m個信息量。或者從矩陣的思想考慮,將X2=£(nk-nPk寫成矩陣形式,nPk=1k其rank是r—m—1,這個證明具體可以參考陳希孺的《數(shù)理統(tǒng)計引論》。注意1)此定理是由樣本容量n足夠大,因此nP不應(yīng)該太小一般選取kn>50,nP>5,如果小了,則進行合并處理。具體看下面例子k2)存在下面的轉(zhuǎn)換亍(n-nP)2亍昭—2nnP+n2P2亍n2仁亍T八%2=J—k_p-k—=J—k^pks=J—P—2,rn+nPk=1kk=1kk=1kk=1k=1Vn2—nk=M為什么這樣轉(zhuǎn)換?計算了nPk,上面每次都要做減法再平方,除法,而下面少了r-1次減法。計算量下降了。這也是編程序時注意的。例1在一實驗中,每隔一定時間觀察一次由某種鈾所放射的到達計數(shù)器卜一的口粒子數(shù)X,共觀察了抵。次、得結(jié)果如下表所示:表8-2鈾放射的到達計數(shù)器上的b粒子數(shù)的實驗記就(J134567S91011整121516171199212L0A,1At1421&&?nA.,0其中£是觀察到有f個"粒子的次數(shù),從理論上考慮知X應(yīng)服從汩松分布PCX=i)-,=0,1,2?(6.7)?!問(5.7)式是否符合實際(取』=Q05)?即在水平。?。5下檢驗假設(shè)總體X服從泊松分布:濃縮鈾(EnrichedUranium),指經(jīng)過同位素提煉后,鈾235含量超過90%的鈾金屬,與其相對的是貧化鈾。不論是和平利用核能,還是為制造核武器,濃縮鈾都是必要的。因此,國際原子能機構(gòu)希望能夠控制全球各國所有鈾濃縮活動,以防止核武器擴散。a粒子是一種放射性粒子,由兩個質(zhì)子及兩個中子組成,并不帶任何電子,亦即等同于氦-4的內(nèi)核,或電離化后的氦-4,He2+。通常具有放射性而原子量較大的化學元素,會透過a衰變放射出a粒子,從而變成較輕的元素,直至該元素穩(wěn)定為止。由于a粒子的體積比較大,又帶兩個正電荷,很容易就可以電離其他物質(zhì)。因此,它能量亦散失得較快,穿透能力在眾多電離輻射中是最弱的,人類的皮膚或一張紙已能隔阻a粒子。a粒子釋放出的放射性同位素在人體外部不構(gòu)成危險。然而,釋放a粒子的物質(zhì)(鐳、鈾等等)一旦被吸入或注入,那將是十分危險。它就能直接破壞內(nèi)臟的細胞。這里n=100=Zf((=nk,i=k),總共分了13個區(qū)間,進行統(tǒng)計的。而且假設(shè)poisson分布還缺一個參數(shù)人,P(x=i)上e-X,那么利用似然估計進行估i!計。構(gòu)造似然函數(shù)產(chǎn),L(X;X)=-^e-nX,1!n!那么dInL寸.1—;—=ZE-n,dXXi=1得到最大似然估計量為(要用次數(shù)乘以每次觀測的個數(shù)得到i),再平均,得到-1X=X=(0*1+...)=4.2100因此我們得帶估計參數(shù)的理論分布,由此計算理論頻數(shù)尸(X—r)—'—?/一0?1*2土…-解因在中參數(shù)A未具體給出,所以先估計七由最大似然估計法得力=亍=4.A在H,假設(shè)F,即在X服從洎松分布的假設(shè)下,X所有可能取的值為口=叫.1,八…},將口分成如表所示的兩兩不相交的了集A-"…,『匚.則K有估訃;,=況X=,}=9號",/=0.1例如/<—X—0}—e4--=(\()15,P,=P\X3}==廣--。?18如.,?'!|-=I’[X事12;=1一〉」=。+。。2.r—|表8.3例1的尸擬合松驗計算表■--;.p.\鹽}'、0.01Sj].5]A81.6153J閂睥1%3160.13213.2m松1-,I7D.IH5⑶515,G22ME51911土13L84511E]Fi31上37.423i)eI14M.17.1^590.0696,A]].7,30A82U.1)3B']0.0]7】H3.海2,6U.007心{奶兒7U-3Hi.5芝=I0H.2S1.h:]U.003?L:0.002.y.計算結(jié)果如表8.3所示,其中有些?A<5的組予以適當合并,使得I每組均有?!?,如表中第四列花括與所水,此處,并組后為=8,但因在計算概率時,估計了-個參數(shù)L故〃=1”的自由度為8-1一I=6.志一,訴以-r一T)=刀"6)=12.592,現(xiàn)在Z'=106.281—100=6_281<.12?592,故在水平&05下接受,心即汰為樣本來自泊松分布總體,也就是說認為理論上的結(jié)論是符合實際的.口注意:Pearson統(tǒng)計方法也可以驗證母體是否服從某個給定的分布F0(x),即假設(shè)H0:F(x)=F(x)。實質(zhì)是檢驗對于劃分區(qū)間上H0:F(x)=F(x),并沒有對每個點進行計算,雖然這樣有可能把不真實的假設(shè)包含進來,但是概率很小。

F(豹)—預(yù)(隊-1)=頁o?)—歹。(奸1)=伽,i^2,一,r—1和F(豹)、乩(邊)獨立性檢驗:設(shè)兩個母體,分布抽取的樣本向量x和y,那么二者相關(guān)性定義為_cov(X,y)_研3-mj(y-m、)]bx。、E[(x-m)2]、:'E[(y-m)2]叫做相關(guān)系數(shù),如果為0則不相關(guān)。從分布來看,設(shè)F(x,y)為聯(lián)合分布,F(xiàn)(x)和F(y)各自的邊緣分布,那么兩個變量的獨立性檢驗就是H0:F(x,y)=F(x)F(y)實際中我們總是隨機抽樣來考察其獨立性,設(shè)容量為n的二維隨機樣本(x,,y,),x和y的可能取值分別分成r個和S個互不相交的小區(qū)間,用nk表示x屬于區(qū)間i和y屬于區(qū)間k的個數(shù)。12a4^11^22…朔q71^1???穴珈■■■-r,■*?■用1.促2.陽.n記做n=£nk=1n=£n,n=££ni=1i=1k=1同時設(shè)x屬于區(qū)間i和y屬于區(qū)間k的概率為p(i,k),那么我們得到邊緣概率

p(i,?)=£p(i,k),p(?,k)=£p(i,k),n=£nk=1k=1i=1i=1££p(i,k)=%.,k)=£p(i,?)=1i=1k=1k=1i=1獨立性假設(shè)就是H0:p(i,k)=p(i,?)p(,k)p(i,?)和p(?,k)都需要從數(shù)據(jù)W,約)中進行估計,由于制約關(guān)系獨立性假設(shè)就是H0:p(i,k)=p(i,?)p(,k)p(i,?)和p(?,k)都需要從數(shù)據(jù)W,約)中進行估計,由于制約關(guān)系£p(i,?)=1i=1£p(?,k)=1k=1共需要估計r+s—2量即可。按照最大似然估計方法很容易得到估計概率就是七?,p(?,k)=n.knn因此,按照一維統(tǒng)計量公式_乂(n—nP)2X_knP*k=1k二維統(tǒng)計量公式_彥s(n-np(i,k))2Znp(i,k)i=1k=1由于np(i,k)=np(i,?)p(?,k)="i?".kn所以0s(n—np(i,k))2心sx2=££—ik=乙乙np(i,k)niki=1k=1ni=1k=1i??kn例題當時,聯(lián)立表2稱為是四分的(又稱為四格表).[例3]調(diào)查339名50歲以上吸煙習慣與患慢性氣管炎病的關(guān)系,得下表.試向吸煙者與不吸煙者慢性氣管炎患病率是否有所不同.表3患慢性氣管炎者未患慢性氣管炎者fi計理病率吸煙14M|16加20521.0不吸煙13121】349.7SI28333916.5在這里對每個對象考察兩個指標3——是否吸煙;Y——是否患慢性氣管炎.它們均各取兩種值,Av—吸煙,A2——不吸煙:殆患慢性氣管炎——未患慢性氣管炎.所以爐=4=2.由(17)式得-205a134外=朝’約頑~

人58▲283代入(18)式得/_(43—206x66/33。尸(1但_206x283/339)蟲2(^5x56/339~205x283?33廠一.(13—134乂56/33。)*(121-J34x283/338)134x56/330—一^134x283/339(43-33,86)^(162-171.14)(J3-22,14)*306"171J14十22714—+1ai_^.7.48白由度=3—1)(q-l)=L對?=0,01查表(附表2)得宓=6.63&顯然7.48AA.636,所以我們拒絕假設(shè)H。,即認為慢性氣管炎的患病率與吸煙有關(guān).

§4.4廣義似然比檢驗這里主要解決如何得到統(tǒng)計量的問題。1928年NeymanPearson利用似然比的方法獲得統(tǒng)計量的一般方法:設(shè)x的分布參數(shù)有兩個假設(shè),必居其一:基本假設(shè)H:x-f(x;0),0e0對立假設(shè)H:x~f(x;0),06。關(guān)于隨機樣本X的聯(lián)合概率分布為基本假設(shè)H0:P0(x;0)=Hf(x.;0),0e00i=1對立假設(shè)H:P](x;0)=Hf(x.;0),06。i=1則定義似然比為sup叫(x;0)L(X)=皿亍1—:—supl"lf(x.;0)Oe。].=1類似于最大似然估計問題中一樣的原理,如果似然比值L(X)較小,那么表明屬于假設(shè)H0:的概率要比屬于假設(shè)H1:的概率小,那么應(yīng)該拒絕基本假設(shè),因此P(L(x)<L0)<a我們稱為否定域,否定基本假設(shè),這種假設(shè)檢驗稱為a水平的廣義似然比檢驗。廣義似然比檢驗有什么意義?意義在于能夠構(gòu)造用于假設(shè)檢驗的統(tǒng)計量。例子:已知正態(tài)母體N(u,a2)均值和方差都未知,那么假設(shè)基本假設(shè)Ho:x~nf(x;uo,a2)g0(X)=supu="oa2xi-uo)2對立假設(shè)H:x?0f(x;u,a2)ncf2=—^g0(X)=supu="oa2xi-uo)2代入得到g0(X)=n—n2—u)2-n/2代入得到g0(X)=n—n2—u)2-n/2n.In一2〔乙(x一X)2+n(X一u)2e-n/2=1g(X-X)2ni=1*-'°」同理對于g(X)=supu乏u0b2代入得到(1=1g(X-X)2ni=1(1Ang1(X)=1n-2g(x-X)2

i一i=1n212-n/2=1+n-1那么廣義似然比L(X)=%n212-n/2=1+n-1L(X)=%=g1-i=g(X一X)2ii=1你會發(fā)現(xiàn)當均值和方差都未知時,應(yīng)該用統(tǒng)計檢驗量t=土二%,這也是t分布*2*/nn和t檢驗的由來。例子:X2檢驗統(tǒng)計量怎么構(gòu)建的?任意一種母體X,僅僅取r個值的離散隨機變量,其概率分布為P{X=i}=P,i=1,2,…,r,i這里9={p},且gp=1由于上述制約條件,其參數(shù)空間是r-1維空間。我們設(shè)i=1基本假設(shè)H0:Pi=Pi0'P°=P10…尸。其子樣取值(氣,…,xn)進行計算頻數(shù),以n表示xi取i=1,2,...,r的個數(shù),且gn=n,ii=1那么有

得到廣義似然比為[91i=1kniJ〉nP=,n其子樣取值(氣,…,xn)進行計算頻數(shù),以n表示xi取i=1,2,...,r的個數(shù),且gn=n,ii=1那么有得到廣義似然比為[91i=1kniJ〉nP=,nIn—冷ini=1ii=1展開=-Ei=1[nP+n-nPi0ii0]ln1+tn-nPnPi0由于nP0和n接近,可以小參數(shù)[nP+n-nP]i0ii0n-nP—i冷nPi01n-nPTi0InP)i0+0()——nPii0—ii0+iT0+°()i0nPnP2nPi=1i0i=1i0i=1i0_£■1(n-nP,-.]2inP:我們發(fā)現(xiàn)自然出現(xiàn)了Pearson定理中的x2=£旦_"k)檢驗統(tǒng)計量。nPk=1k結(jié)論:廣義似然比檢驗?zāi)軌驑?gòu)造檢驗方法中所用到的檢驗統(tǒng)計量,其地位和最大似然估計方法一樣?!?.5最大功效檢驗a水平顯著性檢驗一般規(guī)則就是建立一個統(tǒng)計量,然后判斷此統(tǒng)計量U(X)P{lU(X)l>Z}<a來肯定基本假設(shè)。但是每種檢驗方法都相對于一個統(tǒng)計檢驗量,怎么衡量那種檢驗方法好?存在一個最優(yōu)的檢驗方法嗎?H0:0=00是一種假設(shè),但是有可能真實分布參數(shù)為0—0'的分布,因此把所有0可能取值的范圍0稱為容許假設(shè),則{f(X;0),0G0}稱為母體的可能分布族,那么H]:060-00稱為備選假設(shè)。我們再次分析兩類錯誤:H:0=0真H:0e0-0真接受H0正確概率第II類錯誤拒絕H0第I類錯誤正確概率我們希望上述兩類錯誤都是最低,但是實際上不可能,當樣本容量一定時,兩類錯誤不可能同時被控制。限制第一類錯誤:P{xeVIH0}<a,0=00,對于H0為真,樣本值否定域V內(nèi)的概率小于顯著水平的前提下,使得P{xeVIH},0e0的正確概率最大,在此原則下,定義功效函數(shù)(勢函數(shù))1P(0)=P{xeV}當H0為真,勢函數(shù)就是第一類錯誤,當H1:Oe0-Oo為真,勢函數(shù)為正確檢測概率。最大功效(mostpower,MP)檢驗:supP{xeVIH}<a,0=000maxP(0)omin1-P(0)0e0-0o0e0-0o例子:母體正態(tài)N(u,a2),方差已知,對于均值有兩種假設(shè)H:u=uH:u=u>u給定顯著性水平a下,考慮下面四種否定域

如果H0:u=u0為真,那么?N(0,1)上述四種否定域下的水平都等于a。這幾種檢驗?zāi)莻€好?我們來看第二類錯誤大小,或者看功效大小。~X—U+U—UU—U當H:u=u>u為真時,,11一~N(A=.10,1)的分布,均值挪動了。110氣:。2/n\o2/n我們來看第一種檢驗的功效:」=6-弋)2dx=1-①(Z-A)■v'2Ka依次類推我們得到其他三種否定域檢驗的功效j--(X3)2dx=中(-Z-A)=1-①(Z+A)-85aa七(七)=2—①(Z/2+A)—①(Z/2-A)O4("=0(Z/2+A)+①(Z/2-A)-1當我們?nèi)=0.1,%=0,"]=1,。=1,n=9時,我們計算得到四種功效P1=0.9573,P2=0.0001,O4=0.9115,O4=0.003第一種檢驗方法功效最大。同理如果,七可正可負,那么假設(shè)變?yōu)镠:u=uH:u^u可以推出第三種檢驗方法匕=j|X^>Za」的功效最大。例子:母體正態(tài)N(u,a2),方差已知,對于均值有兩種假設(shè)H:u=u=0H:u豐u給定顯著性水平以=0.05下,匕=[-TX=j=-Za/2.檢驗的功效,隨樣本容量n的變化,以及給定樣本容量n,三種功效O1(u1)=":#—:*dx=1-0(Za-A)

1(*-△)2P(u)T-Za^^e-2dx=0(-Z-A)=1—①(Z+A)21-8v'2kaaP3(u1)=2-①(Za/2+A)-0(Za/2-A)如何變化的。解:1解:1)先解出否定域,查表Z=1.96a/210.90.80.70.6)pl0.50.40.300.511.5u/b2當H1:u豐u1為真時,功效P3(u1)=2-0(Z/2+A)-0(Z/2-A),A=^nP(u)10.90.80.70.6)pl0.50.40.300.511.5u/b231bb0.20.10隨著n增加,功效不斷增加,隨著%增加也在增加。b2)這里我們選定n=100,a=0.05

§4.6Neyman-Pearson定理這個定理就是告訴我們怎么樣找到MP檢驗。定義示性函數(shù)1xeV0xeV這是否定域的表示函數(shù),反之如果一個函數(shù)僅僅取0和1,那么則可以對應(yīng)一個否定域,二者是一一對應(yīng)關(guān)系。示性函數(shù)4(x)又叫檢驗函數(shù),功效函數(shù)可以表示P(0)=E[4(x)]=』4(x)f(x;0)dx=jf(x;0)dx=P{xeV}40V問這樣表達的好處是什么?那么最大功效MP檢驗說的是,假設(shè)任意兩個檢驗方法,對應(yīng)了倆個檢驗函數(shù)4(x)和4(x)21E[4.(x)]<a,0e0P(0)>p(0),0e0-041420那么41(x)檢驗對應(yīng)的功效比42(x)的大,由任意性,則稱41(x)檢驗為MP檢驗。

定理:X=(X,X,,X),分布f(x;9),對于簡單假設(shè)H:0=0,H:0=0,滿12n0011足E[8(X)]=a正好等于

001f(x;f(x;01)>kf(x;o0)k>0f(x;01)<kf(x;0。)>那么偵X)為a水平的MP檢驗,而且肯定存在這樣的常數(shù)k使得偵X)滿足上式。證明:8(x)滿足上面兩公式,任意再選一個8*(x)也是a水平的檢驗,E[8*(x)]<a=E[8(x)]0000如果我們能證明8(x)功效最大即可。[8(X)—8*(X)][f(X;01)-kf(X;00)]潤因為8(x)和8*(x)都是取1和0的二值函數(shù),所以當8(x)-8*(x)>0,那么8(x)取1,f(x;01)-kf(x;00)>0,當8(x)-8*(x)<0,那么8(X)取0,f(x;01)-kf(x;00)<0,因此上式必成立。對之積分』[。(X)-8*(x)][f(x;0)一kf(X;0)]』x>0TOC\o"1-5"\h\z10E[8(x)]一E[8*(x)]>kE[8(x)]一kE[8*(x)]>001010000則得出E[8(X)]>E[8*(X)]則表明8(X)檢驗的功效大,由于8*(X)的任意性,那0101么可以得出8(x)檢驗的就是MP檢驗。此定理告訴我們MP檢驗歸結(jié)于求似然函數(shù)L(X)和一個比值k。8(x)=<L(X)=力^>kf(x;0)0企業(yè)<kf(X;0°)例子:從MP檢驗的角度看二進制調(diào)幅通信,用幅值0和A>0來代表二進制信息0和1,每個比特時間持續(xù)T,但是這個時間T內(nèi),你是不知到底是發(fā)送0和1的,只有采樣進行判別,但是這個二進制調(diào)幅信號傳輸過程中遭到高斯噪聲污染,因此我們面臨著判斷H0:u=0,xeN(0,a2)

給樣本x=(x,x,,x),對于H,f(X;u=0)=H1e2*12n0\;'2e2f(X;u=A)=H—e」京"、2兀。2(X-A)2-Ex2]}>k,ii那么似然比有L(X)=f(X;u=A)=exp{-f(X;u=0)貝那么得到統(tǒng)計量—2*2lnk+nA8(x)=<(X-A)2-Ex2]}>k,iiL(X)=—2*2lnk+nA2X=2nA當原假設(shè)成立時,X符合N(0,*2/n)的分布,那么滿足a水平時,我們可以先確定判別門限,若信息1和0各自傳輸概率為1/2,依據(jù)最小錯誤率準則,可以得到k=1,這里暗含了Bayesian準則,得出檢驗統(tǒng)計量為XJ>A/2,信息1

|<A/2,信息0例子:設(shè)總體X符合Bernoulli分布B(1,p),p是未知參數(shù),原假設(shè)為H:p=p與對立假設(shè)H:p=p>p,構(gòu)造

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論