版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
7.4正態(tài)總體統(tǒng)計量的分布1經(jīng)常關(guān)心統(tǒng)計量的分布,主要是關(guān)心作為連續(xù)型隨機變量的統(tǒng)計量的分布,也就是概率密度,知道了分布,就可以計算統(tǒng)計量落在給定的區(qū)域的概率,可以進行進一步的研究。就本書的范圍而言,我們重點研究正態(tài)總體X~N(m,s2)的樣本的統(tǒng)計量的分布。
2下面都假設(shè)X1,X2,…,Xn是取自正態(tài)總體X~N(m,s2)的樣本。而研究的方向,是試圖將這n個相互獨立的隨機變量進行一些運算,來得到服從標(biāo)準(zhǔn)正態(tài)分布,c2分布,t分布,F(xiàn)分布的隨機變量,則可作為進一步推導(dǎo)的基礎(chǔ)。
3首先是要對樣本進行各種線性組合。設(shè)有不全為0的n個數(shù)k1,k2,…,kn分別乘上各個樣本相加得到一個新的隨機變量Y,
Y=k1X1+k2X2+…+knXn
則Y被稱為X1,X2,…,Xn的一個線性組合,也服從正態(tài)分布,而且其數(shù)學(xué)期望和方差都可以由總體的均值和方差算出來。因此,Y也就可以進一步做標(biāo)準(zhǔn)化的運算而得到Y(jié)*~N(0,1)。其中的n個數(shù)k1,k2,…,kn也稱之為線性組合的組合系數(shù)。4例如,樣本均值X就是樣本的一個線性組合,
其組合系數(shù)k1=k2=…=kn=1/n。因此可以知道
,將其標(biāo)準(zhǔn)化可得
5因為所有的樣本都相互獨立且服從N(m,s2),因此也都可以標(biāo)準(zhǔn)化成為標(biāo)準(zhǔn)正態(tài)分布的隨機變量,也就是說,令
6而大家知道n個自由度的c2分布的隨機變量可由n個相互獨立的服從標(biāo)準(zhǔn)正態(tài)分布的隨機變量的平方和得到,因此由式(7.28)可知
7根據(jù)式(7.14),上式還可以用總體偏差平方和寫成
8但是這種情況比較少用到,是因為實際應(yīng)用中,總體的期望m經(jīng)常是不知道的,在這種情況下出于無奈,就將式中的m換成樣本均值
X,從而要研究如式(7.17)所示的樣本偏差平方和W。
將W的表示式中的n個平方項在平方之前的隨機變量記為
9則雖然每一個Yi都是樣本的線性組合,服從正態(tài)分布,易知E(Yi)=0,(i=1,2,…,n),但是Y1,Y2,…,Yn并不相互獨立,因此
也就無法變換成n個自由度的c2分布的隨機變量。
10以樣本容量n=3為例
X=(X1+X2+X3)/3
則
易證Y1,Y2,Y3不獨立。11但是后來統(tǒng)計學(xué)家們經(jīng)過艱苦努力有了一個令人驚喜的發(fā)現(xiàn),就是用Y1,Y2,…,Yn線性組合出n-1個正態(tài)分布的隨機變量Z2,Z3,…,Zn,
Zm=km1Y1+km2Y2+…+kmnYn (m=2,…,n)(7.32)
則只要恰當(dāng)?shù)剡x擇上式中的各個組合系數(shù)kij,(i=2,3,…,n,j=1,2,…,n),居然就可以得使得Z2,Z3,…,Zn互不相關(guān),也就是相互獨立,而且有Zi~N(0,s2),而且還恰好有也就是說,樣本偏差平方和永遠(yuǎn)都可以看作是n-1個相互獨立的服從N(0,s2)的隨機變量的平方和!而上面還故意留出了一個Z1沒有提,統(tǒng)計學(xué)家們還證明了,如果令Z1=X,則Z1和Z2,Z3,…,Zn也相互獨立!這些結(jié)論的證明因為要用到大量的線性代數(shù)知識,所以本書不證。但是上面的敘述可以描述為如下的定理。13定理7.1設(shè)X1,X2,…,Xn是取自總體X~N(m,s2)的樣本,則樣本偏差平方和W與樣本均值X相互獨立,且有
而大多數(shù)統(tǒng)計學(xué)教材通常不提樣本偏差平方和,而用(n-1)S2來表示它,因此上述定理也最經(jīng)常地描述為樣本方差S2與樣本均值X相互獨立,且有
14而現(xiàn)代統(tǒng)計學(xué)經(jīng)常就是以式(7.35)為基礎(chǔ)炮制或者拼湊出各種分布的統(tǒng)計量。
15例如,可以將n個樣本X1,X2,…,Xn分成前n1個和后n2個兩部分,其中n1+n2=n,即為第一部分,也可稱為樣本1,而為第二部分,也可稱為樣本2,這樣樣本1和樣本2都可以統(tǒng)計出自己的樣本均值和樣本方差,分別記為 和,則根據(jù)式(7.35)就有16而樣本1和樣本2當(dāng)然是相互獨立的,因此上面兩個服從c2分布的隨機變量也相互獨立,則相加仍然服從c2分布,其自由度也是兩個隨機變量的自由度相加,即
這就又炮制出了一個自由度為n1+n2-2個自由度的c2分布的隨機變量。17這是指的c2分布的隨機變量相加。也可以考慮相除,因為服從F分布的隨機變量有結(jié)構(gòu)
,其中U,V是相互獨立的服從c2分布的
隨機變量,且U的自由度是n1,V的自由度是n2。
18因此利用這個F分布的構(gòu)成,利用式(7.36)的兩個相互獨立的服從c2分布的隨機變量,各自都除以自己的自由度后再相除,就可以得出結(jié)論19再例如,我們知道服從自由度為n的t分布的
隨機變量具有的結(jié)構(gòu),即只要尋找
到一個服從標(biāo)準(zhǔn)正態(tài)分布的隨機變量放在分子上,再找一個服從自由度為n的c2分布的隨機變量除以自己的自由度再開平方后放在分母上,就可以得到一個自由度為n的服從t分布的隨機變量。20因此我們可以將式(7.27)中的隨機變量
放在分子上,再將式(7.35)的隨
機變量除以自由度n-1再開平方即
放在分母上,就得
也就是說,你只要將式(7.27)左邊的分母上的總體的標(biāo)準(zhǔn)差s換成樣本標(biāo)準(zhǔn)差S,就得到服從n-1個自由度的t分布。22關(guān)于湊出t分布的隨機變量還有一種流行的辦法,就是將上面的分成n1和n2兩個樣本的情況,需要分別計算兩個樣本的樣本均值
,而也服從正態(tài)分布,均值是
0,方差卻是,因此
23這樣又可以為了拼湊服從t分布的隨機變量而將它放在分子上,而分母上就放由式(7.37)表示的n1+n2-2個自由度的服從c2分布的隨機變量除以n1+n2-2再開平方就行。具體式子這里就不寫了。24總之就是以式(7.35)為核心,使得統(tǒng)計學(xué)家們能夠興高采烈地炮制出各種各樣的服從t分布,c2分布,F(xiàn)分布的隨機變量。例如更為復(fù)雜的就是將樣本分成m個子樣本,m>2,那會搞出更加復(fù)雜的一系列統(tǒng)計量的。
25而現(xiàn)在再考慮一下,在經(jīng)歷了這些推導(dǎo)過程后,如果原來的正態(tài)總體突然變成不是正態(tài)總體,而是均值和方差都存在的任何隨機變量,甚至離散型隨機變量這樣的總體,導(dǎo)致所有的樣本也都是同樣的非正態(tài)分布的隨機變量的時候,情況將是怎樣的呢?
26
Zm=km1Y1+km2Y2+…+kmnYn (m=2,…,n)(7.32)
那就又要看為了推導(dǎo)出式(7.35)的第一步就是式(7.32),要推導(dǎo)出Z2,Z3,…,Zn因為選取了適當(dāng)?shù)慕M合系數(shù)而變得不相關(guān),但是要知道線性組合其實都是一些隨機變量相加啊!而且這些被相加的隨機變量的方差不太大也不太小,27
Zm=km1Y1+km2Y2+…+kmnYn (m=2,…,n)(7.32)
因此雖然Z2,Z3,…,Zn最終看都是樣本X1,X2,…,Xn的線性組合且X1,X2,…,Xn也都不服從正態(tài)分布了,甚至是離散型隨機變量,但是由于中心極限定理的作用Z2,Z3,…,Zn都將近似地服從正態(tài)分布,而且最后也是樣本的線性組合因此也近似服從正態(tài)分布了!這么一來它們相互之間的不相關(guān)就近似是相互獨立了!于是后續(xù)的一切結(jié)果也就都成立,28也就是說,當(dāng)總體為正態(tài)變量推導(dǎo)出來的服從一定自由度的c2分布t分布F分布的統(tǒng)計量,在總體變?yōu)榉钦龖B(tài)變量時,仍然能夠近似地還是服從同樣的相應(yīng)的自由度的c2分布t分布F分布的隨機變量!這樣本節(jié)的這些推導(dǎo)辦法就似乎是有萬能的作用了,是可以用在任意分布的隨機變量的總體上了。當(dāng)然,一個前提就是樣本容量必須足夠地多。但是話又說回來,如果樣本容量太少了,則攜帶的關(guān)于總體的信息量本來就不多,則本來就不會產(chǎn)生出什么好的效果的。297.5高概率區(qū)和低概率區(qū)30對于一給定的隨機變量X,設(shè)其概率密度函數(shù)為f(x),則一般而言,如果X不是服從均勻分布以至于f(x)在一段區(qū)間或者區(qū)域內(nèi)都是一樣的情況,通常f(x)總是在某一些區(qū)間的取值較大,某一些區(qū)間取值較小。
f(x)xO31例如,假設(shè)X~N(0,1),對X做一次試驗得到一個試驗結(jié)果數(shù)a,將這個數(shù)代入到標(biāo)準(zhǔn)正態(tài)分布的概率密度函數(shù)中,如果這個數(shù)是較為靠近0的數(shù),例如,0.23,1.12等等,則試驗結(jié)果就落在概率密度函數(shù)的函數(shù)值較大的區(qū)域,我們會認(rèn)為試驗結(jié)果正常。而如果這個數(shù)很大或者很小,比如說,是3.45,或-5.5,等等,將這樣的數(shù)代入到概率密度函數(shù)中將得到很小的值,我們會認(rèn)為試驗結(jié)果不太正常。
3233因此產(chǎn)生出這樣一個概念,就是根據(jù)概率密度函數(shù)來將X取值的區(qū)間(如果X是一元隨機變量)或區(qū)域(如果X是多元隨機變量)分為兩部分,一部分是概率密度函數(shù)取值較大的部分,稱之為高概率區(qū),另一部分是概率密度函數(shù)取值較小的部分,稱之為低概率區(qū)。
而之所以沒有寫成嚴(yán)格的數(shù)學(xué)定義形式,是因為概率密度函數(shù)值的高低是相對的,例如,方差較小的概率密度函數(shù)值有可能較大,而方差較大的概率密度函數(shù)值有可能較小。
但是這個想法是我們的出發(fā)點。
35尤其是,對于上一節(jié)討論過的服從正態(tài)分布t分布c2分布F分布這四大分布的概率密度函數(shù),都有一個共性,就是它們都是單峰的,就是說概率密度函數(shù)都是有一個最高峰,向兩邊都是單調(diào)下降的,因此都是高概率區(qū)在中間,低概率區(qū)是在兩邊的。
36因此需要人為地規(guī)定一個低概率的數(shù)值,通常取值定為0.1,0.05,0.025,0.01,0.0001等非常低的概率值,在數(shù)理統(tǒng)計學(xué)中統(tǒng)一將這個數(shù)值用a表示,是希臘字母,通常念為阿爾法,這個低概率數(shù)值被稱作顯著性因子。
37通常還要將這個顯著性因子分為兩部分,就是高端的低概率值和低端的低概率值,一種較為常用的辦法就是一邊一半,高端的低概率值和低端的低概率值都是a/2,這被稱為對稱的高概率區(qū)劃分法,是最常用的。當(dāng)然也還有根據(jù)需要的其他劃分法。
因此相對應(yīng)于低概率的顯著性因子a,相當(dāng)于高概率的概率值1-a也有一個通用的術(shù)語,叫置信概率。
38上一節(jié)介紹了,在獲得總體的樣本之后,統(tǒng)計學(xué)家們可以根據(jù)需要拼湊出服從標(biāo)準(zhǔn)正態(tài)分布,t分布,c2分布,F(xiàn)分布的統(tǒng)計量,而這些統(tǒng)計量及相應(yīng)的觀測值,也都有一些標(biāo)準(zhǔn)的記號。
39如果一個統(tǒng)計量服從標(biāo)準(zhǔn)正態(tài)分布,則將它記為大寫字母U,而它的觀測值,則記為小寫字母u。而標(biāo)準(zhǔn)正態(tài)分布的上a分位點,記作ua,前面已經(jīng)講到過就是P{U>ua}=a。因此,按對稱的高概率區(qū)劃分法,也考慮到標(biāo)準(zhǔn)正態(tài)分布的對稱性,不難得出,顯著性因子為a的高概率區(qū)是
,當(dāng)然,它也可以稱為置信概率為1-a的高概率區(qū)。40aua/2-ua/241將服從t分布的統(tǒng)計量記作T,它的觀測值記為t,n個自由度的t分布的上a分位點記作ta(n),則按對稱的高概率區(qū)劃分法,同樣考慮到t分布的對稱性,顯著性因子為a的高概率區(qū)是
將服從c2分布的統(tǒng)計量還記作c2,甚至對應(yīng)的觀測值也記作c2,而n個自由度的c2分布的上a分位點記作,因此這里注意到記號的不要混淆,就是說,如果看到記號c2后面跟著分布二字,或者跟著一個圓括號里有自由度,這就代表c2分布,而孤零零的一個c2記號代表統(tǒng)計量或者統(tǒng)計量的觀測值,究竟是觀測量還是觀測值要根據(jù)敘述的上下文來定,而c2記號加一個下標(biāo)a,后面又跟著一個圓括號里面是自由度,這代表相應(yīng)自由度的c2分布的上a分位點。43將服從c2分布的統(tǒng)計量還記作c2,甚至對應(yīng)的觀測值也記作c2,而n個自由度的c2分布的上a分位點記作,用這樣的記號,根據(jù)對稱的高概率區(qū)劃分法,自由度為n,顯著性因子為a的高概率區(qū)是44對于服從F分布的統(tǒng)計量記作F,F的觀測值為f,第1,2自由度為n1,n2的F分布的上a分位點記作fa(n1,n2)。則根據(jù)對稱的高概率區(qū)劃分法,兩個自由度為n1,n2,顯著性因子為a的高概率區(qū)是
45練習(xí):
已知X1,X2,X3相互獨立且服從標(biāo)準(zhǔn)正態(tài)分布,則
服從什么分布?練習(xí):
已知X1
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 甲苯精餾塔課程設(shè)計結(jié)論
- 網(wǎng)絡(luò)營銷微信課程設(shè)計
- 醫(yī)院設(shè)備管理制度
- 波浪能發(fā)電裝置課程設(shè)計
- 舞蹈機構(gòu)古典舞課程設(shè)計
- 用天正暖通進行課程設(shè)計
- 會計師工作總結(jié)細(xì)心核算確保賬目準(zhǔn)確無誤
- 數(shù)字時代品牌營銷的新趨勢計劃
- 日常教學(xué)反思與總結(jié)計劃
- 裝修合同簡易版
- 浙江工業(yè)大學(xué)之江學(xué)院《建筑結(jié)構(gòu)選型》2023-2024學(xué)年第一學(xué)期期末試卷
- 倉庫管理培訓(xùn)課件
- 2024年居間服務(wù)合同:律師事務(wù)所合作與業(yè)務(wù)推廣
- 大型活動音響設(shè)備保養(yǎng)方案
- 安全生產(chǎn)專(兼)職管理人員職責(zé)
- 公檢法聯(lián)席會議制度
- 成都大學(xué)《Python數(shù)據(jù)分析》2022-2023學(xué)年期末試卷
- 保險理賠崗位招聘面試題與參考回答(某大型央企)2024年
- 上海市市轄區(qū)(2024年-2025年小學(xué)五年級語文)部編版期末考試(上學(xué)期)試卷及答案
- 第10課《我們不亂扔》(教學(xué)設(shè)計)-部編版道德與法治二年級上冊
- 期末試卷(試題)-2024-2025學(xué)年五年級上冊數(shù)學(xué)人教版
評論
0/150
提交評論