概率論與數(shù)理統(tǒng)計第19講_第1頁
概率論與數(shù)理統(tǒng)計第19講_第2頁
概率論與數(shù)理統(tǒng)計第19講_第3頁
概率論與數(shù)理統(tǒng)計第19講_第4頁
概率論與數(shù)理統(tǒng)計第19講_第5頁
已閱讀5頁,還剩55頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

7.4正態(tài)總體統(tǒng)計量的分布1經(jīng)常關(guān)心統(tǒng)計量的分布,主要是關(guān)心作為連續(xù)型隨機變量的統(tǒng)計量的分布,也就是概率密度,知道了分布,就可以計算統(tǒng)計量落在給定的區(qū)域的概率,可以進行進一步的研究。就本書的范圍而言,我們重點研究正態(tài)總體X~N(m,s2)的樣本的統(tǒng)計量的分布。

2下面都假設(shè)X1,X2,…,Xn是取自正態(tài)總體X~N(m,s2)的樣本。而研究的方向,是試圖將這n個相互獨立的隨機變量進行一些運算,來得到服從標(biāo)準(zhǔn)正態(tài)分布,c2分布,t分布,F(xiàn)分布的隨機變量,則可作為進一步推導(dǎo)的基礎(chǔ)。

3首先是要對樣本進行各種線性組合。設(shè)有不全為0的n個數(shù)k1,k2,…,kn分別乘上各個樣本相加得到一個新的隨機變量Y,

Y=k1X1+k2X2+…+knXn

則Y被稱為X1,X2,…,Xn的一個線性組合,也服從正態(tài)分布,而且其數(shù)學(xué)期望和方差都可以由總體的均值和方差算出來。因此,Y也就可以進一步做標(biāo)準(zhǔn)化的運算而得到Y(jié)*~N(0,1)。其中的n個數(shù)k1,k2,…,kn也稱之為線性組合的組合系數(shù)。4例如,樣本均值X就是樣本的一個線性組合,

其組合系數(shù)k1=k2=…=kn=1/n。因此可以知道

,將其標(biāo)準(zhǔn)化可得

5因為所有的樣本都相互獨立且服從N(m,s2),因此也都可以標(biāo)準(zhǔn)化成為標(biāo)準(zhǔn)正態(tài)分布的隨機變量,也就是說,令

6而大家知道n個自由度的c2分布的隨機變量可由n個相互獨立的服從標(biāo)準(zhǔn)正態(tài)分布的隨機變量的平方和得到,因此由式(7.28)可知

7根據(jù)式(7.14),上式還可以用總體偏差平方和寫成

8但是這種情況比較少用到,是因為實際應(yīng)用中,總體的期望m經(jīng)常是不知道的,在這種情況下出于無奈,就將式中的m換成樣本均值

X,從而要研究如式(7.17)所示的樣本偏差平方和W。

將W的表示式中的n個平方項在平方之前的隨機變量記為

9則雖然每一個Yi都是樣本的線性組合,服從正態(tài)分布,易知E(Yi)=0,(i=1,2,…,n),但是Y1,Y2,…,Yn并不相互獨立,因此

也就無法變換成n個自由度的c2分布的隨機變量。

10以樣本容量n=3為例

X=(X1+X2+X3)/3

易證Y1,Y2,Y3不獨立。11但是后來統(tǒng)計學(xué)家們經(jīng)過艱苦努力有了一個令人驚喜的發(fā)現(xiàn),就是用Y1,Y2,…,Yn線性組合出n-1個正態(tài)分布的隨機變量Z2,Z3,…,Zn,

Zm=km1Y1+km2Y2+…+kmnYn (m=2,…,n)(7.32)

則只要恰當(dāng)?shù)剡x擇上式中的各個組合系數(shù)kij,(i=2,3,…,n,j=1,2,…,n),居然就可以得使得Z2,Z3,…,Zn互不相關(guān),也就是相互獨立,而且有Zi~N(0,s2),而且還恰好有也就是說,樣本偏差平方和永遠(yuǎn)都可以看作是n-1個相互獨立的服從N(0,s2)的隨機變量的平方和!而上面還故意留出了一個Z1沒有提,統(tǒng)計學(xué)家們還證明了,如果令Z1=X,則Z1和Z2,Z3,…,Zn也相互獨立!這些結(jié)論的證明因為要用到大量的線性代數(shù)知識,所以本書不證。但是上面的敘述可以描述為如下的定理。13定理7.1設(shè)X1,X2,…,Xn是取自總體X~N(m,s2)的樣本,則樣本偏差平方和W與樣本均值X相互獨立,且有

而大多數(shù)統(tǒng)計學(xué)教材通常不提樣本偏差平方和,而用(n-1)S2來表示它,因此上述定理也最經(jīng)常地描述為樣本方差S2與樣本均值X相互獨立,且有

14而現(xiàn)代統(tǒng)計學(xué)經(jīng)常就是以式(7.35)為基礎(chǔ)炮制或者拼湊出各種分布的統(tǒng)計量。

15例如,可以將n個樣本X1,X2,…,Xn分成前n1個和后n2個兩部分,其中n1+n2=n,即為第一部分,也可稱為樣本1,而為第二部分,也可稱為樣本2,這樣樣本1和樣本2都可以統(tǒng)計出自己的樣本均值和樣本方差,分別記為 和,則根據(jù)式(7.35)就有16而樣本1和樣本2當(dāng)然是相互獨立的,因此上面兩個服從c2分布的隨機變量也相互獨立,則相加仍然服從c2分布,其自由度也是兩個隨機變量的自由度相加,即

這就又炮制出了一個自由度為n1+n2-2個自由度的c2分布的隨機變量。17這是指的c2分布的隨機變量相加。也可以考慮相除,因為服從F分布的隨機變量有結(jié)構(gòu)

,其中U,V是相互獨立的服從c2分布的

隨機變量,且U的自由度是n1,V的自由度是n2。

18因此利用這個F分布的構(gòu)成,利用式(7.36)的兩個相互獨立的服從c2分布的隨機變量,各自都除以自己的自由度后再相除,就可以得出結(jié)論19再例如,我們知道服從自由度為n的t分布的

隨機變量具有的結(jié)構(gòu),即只要尋找

到一個服從標(biāo)準(zhǔn)正態(tài)分布的隨機變量放在分子上,再找一個服從自由度為n的c2分布的隨機變量除以自己的自由度再開平方后放在分母上,就可以得到一個自由度為n的服從t分布的隨機變量。20因此我們可以將式(7.27)中的隨機變量

放在分子上,再將式(7.35)的隨

機變量除以自由度n-1再開平方即

放在分母上,就得

也就是說,你只要將式(7.27)左邊的分母上的總體的標(biāo)準(zhǔn)差s換成樣本標(biāo)準(zhǔn)差S,就得到服從n-1個自由度的t分布。22關(guān)于湊出t分布的隨機變量還有一種流行的辦法,就是將上面的分成n1和n2兩個樣本的情況,需要分別計算兩個樣本的樣本均值

,而也服從正態(tài)分布,均值是

0,方差卻是,因此

23這樣又可以為了拼湊服從t分布的隨機變量而將它放在分子上,而分母上就放由式(7.37)表示的n1+n2-2個自由度的服從c2分布的隨機變量除以n1+n2-2再開平方就行。具體式子這里就不寫了。24總之就是以式(7.35)為核心,使得統(tǒng)計學(xué)家們能夠興高采烈地炮制出各種各樣的服從t分布,c2分布,F(xiàn)分布的隨機變量。例如更為復(fù)雜的就是將樣本分成m個子樣本,m>2,那會搞出更加復(fù)雜的一系列統(tǒng)計量的。

25而現(xiàn)在再考慮一下,在經(jīng)歷了這些推導(dǎo)過程后,如果原來的正態(tài)總體突然變成不是正態(tài)總體,而是均值和方差都存在的任何隨機變量,甚至離散型隨機變量這樣的總體,導(dǎo)致所有的樣本也都是同樣的非正態(tài)分布的隨機變量的時候,情況將是怎樣的呢?

26

Zm=km1Y1+km2Y2+…+kmnYn (m=2,…,n)(7.32)

那就又要看為了推導(dǎo)出式(7.35)的第一步就是式(7.32),要推導(dǎo)出Z2,Z3,…,Zn因為選取了適當(dāng)?shù)慕M合系數(shù)而變得不相關(guān),但是要知道線性組合其實都是一些隨機變量相加啊!而且這些被相加的隨機變量的方差不太大也不太小,27

Zm=km1Y1+km2Y2+…+kmnYn (m=2,…,n)(7.32)

因此雖然Z2,Z3,…,Zn最終看都是樣本X1,X2,…,Xn的線性組合且X1,X2,…,Xn也都不服從正態(tài)分布了,甚至是離散型隨機變量,但是由于中心極限定理的作用Z2,Z3,…,Zn都將近似地服從正態(tài)分布,而且最后也是樣本的線性組合因此也近似服從正態(tài)分布了!這么一來它們相互之間的不相關(guān)就近似是相互獨立了!于是后續(xù)的一切結(jié)果也就都成立,28也就是說,當(dāng)總體為正態(tài)變量推導(dǎo)出來的服從一定自由度的c2分布t分布F分布的統(tǒng)計量,在總體變?yōu)榉钦龖B(tài)變量時,仍然能夠近似地還是服從同樣的相應(yīng)的自由度的c2分布t分布F分布的隨機變量!這樣本節(jié)的這些推導(dǎo)辦法就似乎是有萬能的作用了,是可以用在任意分布的隨機變量的總體上了。當(dāng)然,一個前提就是樣本容量必須足夠地多。但是話又說回來,如果樣本容量太少了,則攜帶的關(guān)于總體的信息量本來就不多,則本來就不會產(chǎn)生出什么好的效果的。297.5高概率區(qū)和低概率區(qū)30對于一給定的隨機變量X,設(shè)其概率密度函數(shù)為f(x),則一般而言,如果X不是服從均勻分布以至于f(x)在一段區(qū)間或者區(qū)域內(nèi)都是一樣的情況,通常f(x)總是在某一些區(qū)間的取值較大,某一些區(qū)間取值較小。

f(x)xO31例如,假設(shè)X~N(0,1),對X做一次試驗得到一個試驗結(jié)果數(shù)a,將這個數(shù)代入到標(biāo)準(zhǔn)正態(tài)分布的概率密度函數(shù)中,如果這個數(shù)是較為靠近0的數(shù),例如,0.23,1.12等等,則試驗結(jié)果就落在概率密度函數(shù)的函數(shù)值較大的區(qū)域,我們會認(rèn)為試驗結(jié)果正常。而如果這個數(shù)很大或者很小,比如說,是3.45,或-5.5,等等,將這樣的數(shù)代入到概率密度函數(shù)中將得到很小的值,我們會認(rèn)為試驗結(jié)果不太正常。

3233因此產(chǎn)生出這樣一個概念,就是根據(jù)概率密度函數(shù)來將X取值的區(qū)間(如果X是一元隨機變量)或區(qū)域(如果X是多元隨機變量)分為兩部分,一部分是概率密度函數(shù)取值較大的部分,稱之為高概率區(qū),另一部分是概率密度函數(shù)取值較小的部分,稱之為低概率區(qū)。

而之所以沒有寫成嚴(yán)格的數(shù)學(xué)定義形式,是因為概率密度函數(shù)值的高低是相對的,例如,方差較小的概率密度函數(shù)值有可能較大,而方差較大的概率密度函數(shù)值有可能較小。

但是這個想法是我們的出發(fā)點。

35尤其是,對于上一節(jié)討論過的服從正態(tài)分布t分布c2分布F分布這四大分布的概率密度函數(shù),都有一個共性,就是它們都是單峰的,就是說概率密度函數(shù)都是有一個最高峰,向兩邊都是單調(diào)下降的,因此都是高概率區(qū)在中間,低概率區(qū)是在兩邊的。

36因此需要人為地規(guī)定一個低概率的數(shù)值,通常取值定為0.1,0.05,0.025,0.01,0.0001等非常低的概率值,在數(shù)理統(tǒng)計學(xué)中統(tǒng)一將這個數(shù)值用a表示,是希臘字母,通常念為阿爾法,這個低概率數(shù)值被稱作顯著性因子。

37通常還要將這個顯著性因子分為兩部分,就是高端的低概率值和低端的低概率值,一種較為常用的辦法就是一邊一半,高端的低概率值和低端的低概率值都是a/2,這被稱為對稱的高概率區(qū)劃分法,是最常用的。當(dāng)然也還有根據(jù)需要的其他劃分法。

因此相對應(yīng)于低概率的顯著性因子a,相當(dāng)于高概率的概率值1-a也有一個通用的術(shù)語,叫置信概率。

38上一節(jié)介紹了,在獲得總體的樣本之后,統(tǒng)計學(xué)家們可以根據(jù)需要拼湊出服從標(biāo)準(zhǔn)正態(tài)分布,t分布,c2分布,F(xiàn)分布的統(tǒng)計量,而這些統(tǒng)計量及相應(yīng)的觀測值,也都有一些標(biāo)準(zhǔn)的記號。

39如果一個統(tǒng)計量服從標(biāo)準(zhǔn)正態(tài)分布,則將它記為大寫字母U,而它的觀測值,則記為小寫字母u。而標(biāo)準(zhǔn)正態(tài)分布的上a分位點,記作ua,前面已經(jīng)講到過就是P{U>ua}=a。因此,按對稱的高概率區(qū)劃分法,也考慮到標(biāo)準(zhǔn)正態(tài)分布的對稱性,不難得出,顯著性因子為a的高概率區(qū)是

,當(dāng)然,它也可以稱為置信概率為1-a的高概率區(qū)。40aua/2-ua/241將服從t分布的統(tǒng)計量記作T,它的觀測值記為t,n個自由度的t分布的上a分位點記作ta(n),則按對稱的高概率區(qū)劃分法,同樣考慮到t分布的對稱性,顯著性因子為a的高概率區(qū)是

將服從c2分布的統(tǒng)計量還記作c2,甚至對應(yīng)的觀測值也記作c2,而n個自由度的c2分布的上a分位點記作,因此這里注意到記號的不要混淆,就是說,如果看到記號c2后面跟著分布二字,或者跟著一個圓括號里有自由度,這就代表c2分布,而孤零零的一個c2記號代表統(tǒng)計量或者統(tǒng)計量的觀測值,究竟是觀測量還是觀測值要根據(jù)敘述的上下文來定,而c2記號加一個下標(biāo)a,后面又跟著一個圓括號里面是自由度,這代表相應(yīng)自由度的c2分布的上a分位點。43將服從c2分布的統(tǒng)計量還記作c2,甚至對應(yīng)的觀測值也記作c2,而n個自由度的c2分布的上a分位點記作,用這樣的記號,根據(jù)對稱的高概率區(qū)劃分法,自由度為n,顯著性因子為a的高概率區(qū)是44對于服從F分布的統(tǒng)計量記作F,F的觀測值為f,第1,2自由度為n1,n2的F分布的上a分位點記作fa(n1,n2)。則根據(jù)對稱的高概率區(qū)劃分法,兩個自由度為n1,n2,顯著性因子為a的高概率區(qū)是

45練習(xí):

已知X1,X2,X3相互獨立且服從標(biāo)準(zhǔn)正態(tài)分布,則

服從什么分布?練習(xí):

已知X1

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論