版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、概率論與數(shù)理分析第六章 樣本及抽樣分布1 隨機(jī)樣本隨機(jī)樣本2 直線圖和箱線圖直線圖和箱線圖3 抽樣分布抽樣分布引言 隨機(jī)變量及其所伴隨的概率分布全面描述了隨機(jī)現(xiàn)象的統(tǒng)計(jì)性規(guī)律。 概率論的許多問(wèn)題中,隨機(jī)變量的概率分布通常是已知的,或者假設(shè)是已知的,而一切計(jì)算與推理都是在這已知是基礎(chǔ)上得出來(lái)的。 但實(shí)際中,情況往往并非如此,一個(gè)隨機(jī)現(xiàn)象所服從的分布可能是完全不知道的,或者知道其分布概型,但是其中的某些參數(shù)是未知的。1 隨機(jī)樣本隨機(jī)樣本例如: 某公路上行駛車輛的速度服從什么分布是未知的; 電視機(jī)的使用壽命服從什么分布是未知的; 產(chǎn)品是否合格服從兩點(diǎn)分布,但參數(shù)合格率p是未知的; 數(shù)理統(tǒng)計(jì)的任務(wù)則是
2、以概率論為基礎(chǔ),根據(jù)試驗(yàn)所得到的數(shù)據(jù),對(duì)研究對(duì)象的客觀統(tǒng)計(jì)規(guī)律性做出合理的推斷。1 隨機(jī)樣本隨機(jī)樣本一、總體與個(gè)體1.總體試驗(yàn)的全部可能的觀察值稱為總體.2.個(gè)體總體中的每個(gè)可能觀察值稱為個(gè)體.例1 在研究2 000名學(xué)生的年齡時(shí),這些學(xué)生的年齡的全體就構(gòu)成一個(gè)總體,每個(gè)學(xué)生的年齡就是個(gè)體. 1 隨機(jī)樣本隨機(jī)樣本3.容量總體中所包含的個(gè)體的個(gè)數(shù)稱為總體的容量.4.有限總體和無(wú)限總體容量為有限的稱為有限總體.容量為無(wú)限的稱為無(wú)限總體.產(chǎn)的燈泡壽命.某工廠10月份生產(chǎn)的燈泡壽命所組成的總 個(gè)體的總數(shù)就是10月份生產(chǎn)的燈泡數(shù), 個(gè)有限總體; 例2體中, 這是而該工廠生產(chǎn)的所有燈泡壽命所組成的總體是一
3、個(gè)無(wú)限總體, 它包括以往生產(chǎn)和今后生1 隨機(jī)樣本隨機(jī)樣本所形成的總體中共含2 000個(gè)例3在考察某大學(xué)一年級(jí)男生的身高這一試試驗(yàn)中,若一年級(jí)男生共2 000人, 每個(gè)男生的身高是一個(gè)可能觀察值,可能觀察值,是一個(gè)有限總體.總體也是有限總體.例4 考察某一湖泊中某種魚(yú)的含汞量, 所得1 隨機(jī)樣本隨機(jī)樣本我們可以認(rèn)為有些有限總體, 它的容量很大,它是一個(gè)無(wú)限總體.例5考察全國(guó)正在使用的某種型號(hào)燈泡的壽可以認(rèn)為是無(wú)限總體.命所形成的總體,由于可能觀察值的個(gè)數(shù)很多,就1 隨機(jī)樣本隨機(jī)樣本因此在理論上可以把總體與概率分布等同起來(lái). 我們關(guān)心的是總體中的個(gè)體的某項(xiàng)指標(biāo)(如人的身高、燈泡的壽命,汽車的耗油量
4、) . 由于每個(gè)個(gè)體的出現(xiàn)是隨機(jī)的,所以相應(yīng)的數(shù)量指標(biāo)的出現(xiàn)也帶有隨機(jī)性 . 從而可以把這種數(shù)量指標(biāo)看作一個(gè)隨機(jī)變量X ,因此隨機(jī)變量X的分布就是該數(shù)量指標(biāo)在總體中的分布. 總體就可以用一個(gè)隨機(jī)變量及其分布來(lái)描述.1 隨機(jī)樣本隨機(jī)樣本5. 總體分布 例如:研究某批燈泡的壽命時(shí),關(guān)心的數(shù)量指標(biāo)就是壽命,那么,此總體就可以用隨機(jī)變量X表示,或用其分布函數(shù)F(x)表示.某批燈泡的壽命總體 壽命 X 可用一概率(指數(shù))分布來(lái)刻劃鑒于此,常用隨機(jī)變量的記號(hào)或用其分布函數(shù)表示總體. 如說(shuō)總體X或總體F(x) .體體壽命總體是指數(shù)分布總壽命總體是指數(shù)分布總1 隨機(jī)樣本隨機(jī)樣本 類似地,在研究某地區(qū)中學(xué)生的營(yíng)
5、養(yǎng)狀況時(shí) ,若關(guān)心的數(shù)量指標(biāo)是身高和體重,我們用X 和Y 分別表示身高和體重,那么此總體就可用二維隨機(jī)變量(X,Y)或其聯(lián)合分布函數(shù) F(x,y)來(lái)表示.統(tǒng)計(jì)中,總體這個(gè)概念的要旨是:總體就是一個(gè)隨機(jī)變量總體就是一個(gè)隨機(jī)變量(向量向量)或一個(gè)概率分布或一個(gè)概率分布.1 隨機(jī)樣本隨機(jī)樣本X 的分布函數(shù)和數(shù)字特征就稱為總體的分布函數(shù)和數(shù)字特征.今后將不區(qū)分總體與相應(yīng)的隨機(jī)變量.參數(shù)為p的(0-1)分布:例如, 我們檢驗(yàn)自生產(chǎn)線出來(lái)的零件是次品還是正品, 以0表示產(chǎn)品是正品, 以1表示產(chǎn)品為次品.的隨機(jī)變量.設(shè)出現(xiàn)次品的頻率為 p(常數(shù)), 那么總體是由一些“0”和一些“1”所組成, 這一總體對(duì)應(yīng)于
6、一個(gè)具有xXP ,1 )1(xppx 1 , 0 x1 隨機(jī)樣本隨機(jī)樣本根據(jù)獲得的數(shù)據(jù)來(lái)對(duì)總體分布得出 在數(shù)理統(tǒng)計(jì)中,人們都是通過(guò)從總體中抽取一部分個(gè)體,被抽出的部分個(gè)體叫做總體的一個(gè)樣本.判斷的.所謂從總體抽取一個(gè)個(gè)體,就是對(duì)總體X 進(jìn)行一次觀察并記錄其結(jié)果.稱為樣本值稱為樣本值次觀察一經(jīng)完成,次觀察一經(jīng)完成,當(dāng)當(dāng)n我們就得到一組實(shí)數(shù)我們就得到一組實(shí)數(shù),1x,1X它們依次是隨機(jī)變量它們依次是隨機(jī)變量,2X,的觀察值,的觀察值,,nx,2xnX1 隨機(jī)樣本隨機(jī)樣本二、隨機(jī)樣本的定義二、隨機(jī)樣本的定義1.樣本的定義的的簡(jiǎn)簡(jiǎn)單單得得到到的的容容量量為為、或或總總體體或或總總體體nXF)(,21稱稱
7、為為樣樣本本值值它它們們的的觀觀察察值值nxxx又稱又稱.個(gè)獨(dú)立的觀察值個(gè)獨(dú)立的觀察值的的為為nX,的的隨隨機(jī)機(jī)變變量量是是具具有有分分布布函函數(shù)數(shù)設(shè)設(shè)FX,1X若若,2X,、是具有同一分布函數(shù)是具有同一分布函數(shù) FXn相相互互獨(dú)獨(dú)立立的的,隨機(jī)變量隨機(jī)變量FXXXn為從分布函數(shù)為從分布函數(shù)則稱則稱,21,隨機(jī)樣本隨機(jī)樣本.簡(jiǎn)稱樣本簡(jiǎn)稱樣本1 隨機(jī)樣本隨機(jī)樣本. )(),(121* niinxFxxxF的的一一個(gè)個(gè)樣樣本本,為為,若若FXXXn,21,則則21XX相相互互獨(dú)獨(dú)立立,nX,且且它它們們的的分分布布函函數(shù)數(shù)都都是是 F 所所以以的的分分布布函函數(shù)數(shù)為為,),(21nXXX,具有概率
8、密度具有概率密度又若又若fX的的,則則),(21nXXX概概率率密密度度為為. )(),(121* niinxfxxxf2. 簡(jiǎn)單隨機(jī)抽樣的定義獲得簡(jiǎn)單隨機(jī)樣本的抽樣方法稱為簡(jiǎn)單隨機(jī)抽樣.1 隨機(jī)樣本隨機(jī)樣本解解的概率密度為的概率密度為總體總體 X , 0, 0, 0,e)(xxxfx , 21相相互互獨(dú)獨(dú)立立因因?yàn)闉閚XXX的概率密度為的概率密度為所以所以),( 21nXXX),(21nnxxxf ., 0, 0,e1其他其他ixnxnii ,)0(的的指指數(shù)數(shù)分分布布服服從從參參數(shù)數(shù)為為設(shè)設(shè)總總體體 X,),(21是是來(lái)來(lái)自自總總體體的的樣樣本本nXXX求樣本求樣本.),(21的概率密度的
9、概率密度nXXX,有相同的分布有相同的分布且與且與X)(1 niixf例例71 隨機(jī)樣本隨機(jī)樣本解解的分布律為的分布律為總體總體 X, 21相互獨(dú)立相互獨(dú)立因?yàn)橐驗(yàn)閚XXXiXP )1, 0( i,有相同的分布有相同的分布且與且與X的分布律為的分布律為所以所以),( 21nXXX), 1(pBX 服服從從兩兩點(diǎn)點(diǎn)分分布布設(shè)設(shè)總總體體,),(21是來(lái)自總體的樣本是來(lái)自總體的樣本nXXX,(21XX求樣本求樣本.),的分布律的分布律nXiipp 1)1(, 10 p其其中中例例81 隨機(jī)樣本隨機(jī)樣本,2211nnxXxXxXP 2211nnxXPxXPxXP niiniixnxpp11)1(.1
10、, 0,21中取值中取值在集合在集合其中其中nxxx1 隨機(jī)樣本隨機(jī)樣本三、小結(jié)三、小結(jié)個(gè)體 總體 有限總體無(wú)限總體基本概念:統(tǒng)稱為總體X.說(shuō)明2隨機(jī)樣本一個(gè)總體對(duì)應(yīng)一個(gè)隨機(jī)變量X,說(shuō)明1我們將不區(qū)分總體和相應(yīng)的隨機(jī)變量,在實(shí)際中遇到的總體往往是有限總體, 它個(gè)數(shù)很大時(shí), 在理論上可認(rèn)為它是一個(gè)無(wú)限總體.對(duì)應(yīng)一個(gè)離散型隨機(jī)變量; 當(dāng)總體中包含的個(gè)體的1 隨機(jī)樣本隨機(jī)樣本男子的頭顱的最大寬度男子的頭顱的最大寬度(mm),), 141 148 132138 154 142150 146 155 158 150 140 147 148 144150 149 145149 158 143 141 14
11、4 144 126 140 144142 141 140145 135 147 146 141 136 140 146 142137 148 154137 139 143 140 131 143 141 149 148135 148 152143 144 141 143 147 146 150 132 142142 143 153149 146 149 138 142 149 142 137 134144 146 147140 142 140 137 152 145一、直方圖例例1 1 下面給出了下面給出了8484個(gè)伊特拉斯坎個(gè)伊特拉斯坎(Etruscan)人人數(shù)據(jù)的數(shù)據(jù)的“頻率直方圖頻率直方
12、圖”. .現(xiàn)在來(lái)畫(huà)這些現(xiàn)在來(lái)畫(huà)這些2 直方圖和箱線圖直方圖和箱線圖步驟:步驟:1. 找出最小值找出最小值126, 最大值最大值158,現(xiàn)取區(qū)間現(xiàn)取區(qū)間 124.5,159.5;2. 將區(qū)間將區(qū)間 124.5,159.5 等分為等分為7個(gè)小區(qū)間,個(gè)小區(qū)間,3. 小區(qū)間的端點(diǎn)稱為組限小區(qū)間的端點(diǎn)稱為組限, ,數(shù)出落在每個(gè)小區(qū)數(shù)出落在每個(gè)小區(qū)./nfi算出頻率算出頻率,if間的數(shù)據(jù)的頻數(shù)間的數(shù)據(jù)的頻數(shù), 小區(qū)間的長(zhǎng)度記成小區(qū)間的長(zhǎng)度記成稱稱為為組組距距; 7/ )5 .1245 .159( , 5 2 直方圖和箱線圖直方圖和箱線圖列表如下:列表如下:組組 限限頻頻 數(shù)數(shù)頻頻 率率累計(jì)頻率累計(jì)頻率12
13、4.5129.510.01190.0119129.5134.540.04760.0595134.5139.5100.11910.1786139.5144.5330.39290.5715144.5149.5240.28570.8572149.5154.590.10710.9524154.5159.530.03571.0000 nfi個(gè)小區(qū)間上作以個(gè)小區(qū)間上作以現(xiàn)在自左向右依次在各現(xiàn)在自左向右依次在各,為高的小矩形為高的小矩形這樣的圖形叫頻率直方圖這樣的圖形叫頻率直方圖. .2 直方圖和箱線圖直方圖和箱線圖2 直方圖和箱線圖直方圖和箱線圖頻率直方圖頻率直方圖二、箱線圖二、箱線圖定義定義 , 21n
14、,x,xxn的的樣樣本本觀觀察察值值設(shè)設(shè)有有容容量量為為;xpP個(gè)觀察值小于或等于至少有)(n1.xp(np)個(gè)觀察值大于或等于至少有)(12. 得得分分位位數(shù)數(shù)可可按按以以下下法法則則求求樣樣本本 p,21,將將xx.)()2()1(nnxxxx 成成按按從從小小到到大大的的順順序序排排列列不是整數(shù),不是整數(shù),若若npo1 中的兩點(diǎn)要求,中的兩點(diǎn)要求,義義則只有一個(gè)數(shù)據(jù)滿足定則只有一個(gè)數(shù)據(jù)滿足定的最小整數(shù)的最小整數(shù)這一數(shù)據(jù)位于大于這一數(shù)據(jù)位于大于np樣本樣本它具有以下的性質(zhì):它具有以下的性質(zhì):,1)0(pxpp記為記為分位數(shù)分位數(shù) 2 直方圖和箱線圖直方圖和箱線圖處,處,是整數(shù),是整數(shù),若若
15、npo2 綜上,綜上, .1處的數(shù)處的數(shù)即為位于即為位于 np處的處的和和就取位于就取位于1 npnp.中位數(shù)中位數(shù) ,21)1()( npnpxx ,)1( npxpx 不不是是整整數(shù)數(shù),當(dāng)當(dāng)np .是整數(shù)是整數(shù)當(dāng)當(dāng)np2 直方圖和箱線圖直方圖和箱線圖 特別,特別, 稱為上四分位數(shù),稱為上四分位數(shù),分位數(shù)分位數(shù)25. 025. 0 x稱為下四分位數(shù),稱為下四分位數(shù),分位數(shù)分位數(shù)75. 057 . 0 x即有即有稱稱為為樣樣本本中中位位數(shù)數(shù),M或或也也記記為為分分位位數(shù)數(shù)2505 . 0Qx.時(shí)時(shí),當(dāng)當(dāng)5 . 0 p;又記為又記為1Q.3Q又又記記為為 ,21)12()2( nnxx ,)12
16、( nx5 . 0 x 不是整數(shù),不是整數(shù),當(dāng)當(dāng)np .是整數(shù)是整數(shù)當(dāng)當(dāng)np2 直方圖和箱線圖直方圖和箱線圖例例2 2設(shè)有一組容量為設(shè)有一組容量為18的樣本如下(已經(jīng)排過(guò)序)的樣本如下(已經(jīng)排過(guò)序)122 126 133 140 145 145 149 150 157.5 . 025. 02 . 0 xxx,求求樣樣本本分分位位數(shù)數(shù):解解處,處,位于第位于第416 . 32 . 0 xnp因?yàn)橐驗(yàn)?1(2 . 0 x即有即有處處,位位于于第第515 . 425. 0 xnp因?yàn)橐驗(yàn)?2(162 166 175 177 177 183 188 199 21225. 0 x即有即有2 . 018
17、, 6 . 3)(4x.14025. 018 , 5 . 4 .1452 直方圖和箱線圖直方圖和箱線圖是這組數(shù)中間兩是這組數(shù)中間兩5 . 0 xnp因?yàn)橐驗(yàn)?3(5 . 018 , 9 2 直方圖和箱線圖直方圖和箱線圖個(gè)數(shù)的平均值,個(gè)數(shù)的平均值,0.5x即有即有 )162157(21 . 5 .159數(shù)據(jù)集的箱線圖是由箱子和直線組成的圖形,數(shù)據(jù)集的箱線圖是由箱子和直線組成的圖形,它是基于以下五個(gè)數(shù)的圖形概括:它是基于以下五個(gè)數(shù)的圖形概括:,最小值最小值 Min它的作法如下:它的作法如下:,第一四分位數(shù)第一四分位數(shù)1Q,中位數(shù)中位數(shù)M和和第三四分位數(shù)第三四分位數(shù)3Q.Max最最大大值值畫(huà)一水平數(shù)
18、軸,畫(huà)一水平數(shù)軸,)1(.Max下側(cè)平行于數(shù)下側(cè)平行于數(shù)在數(shù)軸上方畫(huà)一個(gè)上、在數(shù)軸上方畫(huà)一個(gè)上、軸的矩形箱子,軸的矩形箱子,于于箱子的左右兩側(cè)分別位箱子的左右兩側(cè)分別位1Q,在在軸軸上上標(biāo)標(biāo)上上 Min,3Q,1Q,M3Q.的的上上方方2 直方圖和箱線圖直方圖和箱線圖.內(nèi)部?jī)?nèi)部;線線自箱子左側(cè)引一條水平自箱子左側(cè)引一條水平Min)2(在同一水平在同一水平高度自箱子右側(cè)引一條水平線直至最大值高度自箱子右側(cè)引一條水平線直至最大值. .段段點(diǎn)點(diǎn)的的上上方方畫(huà)畫(huà)一一條條垂垂直直線線在在M線段位于箱子線段位于箱子2 直方圖和箱線圖直方圖和箱線圖以下是以下是8個(gè)病人的血壓(收縮壓,個(gè)病人的血壓(收縮壓,m
19、mHg)數(shù))數(shù)解解np因?yàn)橐驗(yàn)楣使?Q例例3 3試作出箱線圖試作出箱線圖. .據(jù)(已經(jīng)過(guò)排序據(jù)(已經(jīng)過(guò)排序 ),),102 110 117 118 122 123 132 150 25. 08 , 2 )117110(21 . 5 .113 2 直方圖和箱線圖直方圖和箱線圖np因?yàn)橐驗(yàn)楣使?, 45 . 08 5 . 0 x )122118(21 .1202Q np因?yàn)橐驗(yàn)楣使?5. 0 xMinMax作出箱線圖如圖所示作出箱線圖如圖所示. .75. 08 , 6 )132123(21 . 5 .127 3Q ,102 ,1502 直方圖和箱線圖直方圖和箱線圖例例4 4 量(以升計(jì)量(以升計(jì).
20、 .數(shù)據(jù)應(yīng)經(jīng)過(guò)排序)數(shù)據(jù)應(yīng)經(jīng)過(guò)排序)女子組女子組2.7 2.8 2.9 3.1 3.1 3.1 3.2 3.4 3.4男子組男子組4.1 4.1 4.3 4.3 4.5 4.6 4.7 4.8 4.8試分別畫(huà)出這兩組數(shù)據(jù)的箱線圖試分別畫(huà)出這兩組數(shù)據(jù)的箱線圖. . 下面分別給出了下面分別給出了2525個(gè)男子和個(gè)男子和2525個(gè)女子的肺活個(gè)女子的肺活3.4 3.4 3.4 3.5 3.5 3.5 3.6 3.7 3.73.7 3.8 3.8 4.0 4.1 4.2 4.25.1 5.3 5.3 5.3 5.4 5.4 5.5 5.6 5.7 5.8 5.8 6.0 6.1 6.3 6.7 6.72
21、 直方圖和箱線圖直方圖和箱線圖解解女子組女子組MinMaxMnp因因. 2 . 31 Qnp因因3Q男子組男子組np因因. 7 . 41 Qnp因因. 8 . 53 Q作出箱線圖如(教材作出箱線圖如(教材P134P134)圖)圖6-4所示所示. . 25. 052 ,25. 675. 052 ,75.18. 7 . 3 25. 052 ,25. 675. 052 ,75.18 , 7 . 2 , 2 . 4 , 5 . 3, 1 . 4Min , 7 . 6Max , 3 . 5M 2 直方圖和箱線圖直方圖和箱線圖 在數(shù)據(jù)集中,在數(shù)據(jù)集中,之之間間的的距距離離:與與第第三三四四分分?jǐn)?shù)數(shù)第第一一
22、四四分分位位數(shù)數(shù)31QQIQRQQ 13稱為稱為四分位數(shù)間距四分位數(shù)間距. .,或或大大于于若若數(shù)數(shù)據(jù)據(jù)小小于于IQRQIQRQ5 . 15 . 1 31 .則認(rèn)為它是疑似異常值則認(rèn)為它是疑似異常值某一個(gè)觀察值不尋常地大于或某一個(gè)觀察值不尋常地大于或小于該數(shù)據(jù)集中的其他數(shù)據(jù),小于該數(shù)據(jù)集中的其他數(shù)據(jù), 稱為稱為疑似異常值疑似異常值. .疑似異常值疑似異常值2 直方圖和箱線圖直方圖和箱線圖修正箱線圖修正箱線圖;)1(同同,計(jì)算計(jì)算13QQIQR 則認(rèn)為它是一個(gè)則認(rèn)為它是一個(gè),或或大大于于IQRQIQRQ5 . 15 . 131 若若一一個(gè)個(gè)數(shù)數(shù)據(jù)據(jù)小小于于.疑似異常值疑似異常值畫(huà)出疑似異常值,畫(huà)
23、出疑似異常值,;*表示表示并以并以)3( 自箱子左側(cè)引一水平線段直至數(shù)據(jù)集自箱子左側(cè)引一水平線段直至數(shù)據(jù)集中中又自箱子右側(cè)引一又自箱子右側(cè)引一除去疑似異常值后的最小值,除去疑似異常值后的最小值,水平線直至數(shù)據(jù)集中除去疑似異常值后的最大值水平線直至數(shù)據(jù)集中除去疑似異常值后的最大值. .)1( )2( 2 直方圖和箱線圖直方圖和箱線圖例例5 5 下面給出了某醫(yī)院下面給出了某醫(yī)院21個(gè)病人的住院時(shí)間個(gè)病人的住院時(shí)間(以(以1 2 3 3 4 4 5 6 6 7 7 9 9解解MinMaxM25. 021 因因1Q得得75. 021 又又3Q得得IQRQ5 . 11 IQRIQRQ5 . 13 124
24、 . 8 試畫(huà)出修正箱線圖(數(shù)據(jù)已經(jīng)過(guò)排序)試畫(huà)出修正箱線圖(數(shù)據(jù)已經(jīng)過(guò)排序). .天計(jì)),天計(jì)),10 12 12 13 15 18 23 55 , 8 ,25. 5,75.1513QQ 85 . 112 ,24 , 1 ,55 , 7 , 4 ,122 直方圖和箱線圖直方圖和箱線圖,2455 觀察值觀察值故故55 是疑似異常值,是疑似異常值, 且僅此一個(gè)疑且僅此一個(gè)疑疑似異常值疑似異常值. .作出修正箱線圖如(教材作出修正箱線圖如(教材P135P135)圖)圖6-5所示所示. .2 直方圖和箱線圖直方圖和箱線圖1.1.頻率直方圖作圖步驟頻率直方圖作圖步驟 (1) 找出最小值和找出最小值和最
25、大值最大值,(2) 將選定區(qū)間分為將選定區(qū)間分為k個(gè)小區(qū)間;個(gè)小區(qū)間;./)3(nfi算算出出頻頻率率 nfi在各個(gè)小區(qū)間上作以在各個(gè)小區(qū)間上作以.為高的小矩形為高的小矩形三、小結(jié)三、小結(jié) 2 直方圖和箱線圖直方圖和箱線圖畫(huà)一水平數(shù)軸,畫(huà)一水平數(shù)軸,)1(.Max下側(cè)平行于數(shù)下側(cè)平行于數(shù)在數(shù)軸上方畫(huà)一個(gè)上、在數(shù)軸上方畫(huà)一個(gè)上、軸的矩形箱子,軸的矩形箱子,于于箱子的左右兩側(cè)分別位箱子的左右兩側(cè)分別位1Q,在在軸軸上上標(biāo)標(biāo)上上 Min,3Q,1Q,M3Q.的的上上方方.內(nèi)部?jī)?nèi)部;線線自箱子左側(cè)引一條水平自箱子左側(cè)引一條水平Min)2(高度自箱子右側(cè)引一條水平線直至最大值高度自箱子右側(cè)引一條水平線直
26、至最大值. .段段點(diǎn)點(diǎn)的的上上方方畫(huà)畫(huà)一一條條垂垂直直線線在在M線段位于箱子線段位于箱子2.2.箱線圖箱線圖作圖步驟作圖步驟2 直方圖和箱線圖直方圖和箱線圖一、基本概念1. 統(tǒng)計(jì)量的定義 ,不含未知參數(shù)不含未知參數(shù).的觀察值的觀察值,21的的一一個(gè)個(gè)樣樣本本是是來(lái)來(lái)自自總總體體設(shè)設(shè)XXXXn,),(2121的的函函數(shù)數(shù)是是nnXXXXXXg.計(jì)量計(jì)量中中若若g是一個(gè)統(tǒng)是一個(gè)統(tǒng)則稱則稱),(21nXXXgnnXXXxxx,2121是是相相應(yīng)應(yīng)于于樣樣本本設(shè)設(shè),的樣本值的樣本值),(),(2121nnXXXgxxxg是是則則稱稱3 抽樣分布抽樣分布?,),(,22321哪些不是哪些不是些是統(tǒng)計(jì)量些
27、是統(tǒng)計(jì)量判斷下列各式哪判斷下列各式哪為未知為未知為已知為已知其中其中樣本樣本的一個(gè)的一個(gè)是來(lái)自總體是來(lái)自總體設(shè)設(shè) NXXX,11XT ,3212XeXXT ),(313213XXXT ),max(3214XXXT ,2215 XXT).(123222126XXXT 是是不是實(shí)例13 抽樣分布抽樣分布2. 幾個(gè)常用統(tǒng)計(jì)量的定義,21是來(lái)自總體的一個(gè)樣本是來(lái)自總體的一個(gè)樣本設(shè)設(shè)nXXX(1) 樣本平均值;11 niiXnX(2) 樣本方差 niiXXnS122)(11 .11 niixnx其觀察值.,21是是這這一一樣樣本本的的觀觀察察值值nxxx.11122 niiXnXn3 抽樣分布抽樣分布其
28、觀察值 niixxns122)(11 (3) 樣本標(biāo)準(zhǔn)差 ;11122 niiXXnSS其觀察值.)(1112 niixxns.11122 niixnxn3 抽樣分布抽樣分布(4) 樣本k 階(原點(diǎn))矩;, 2, 1,11 kXnAnikik其觀察值., 2, 1,11 kxnnikik (5) 樣本k 階中心矩;, 3, 2,)(11 kXXnBnikik其觀察值., 3, 2,)(11 kxxnbnikik3 抽樣分布抽樣分布,)(存存在在記記成成階階矩矩的的若若總總體體kkXEkX 證明, , 21同分布同分布獨(dú)立且與獨(dú)立且與因?yàn)橐驗(yàn)閄XXXn , , 21同分布同分布獨(dú)立且與獨(dú)立且與所
29、以所以kknkkXXXX)(1kXE故有故有再根據(jù)第五章辛欽定理知由以上定義得下述結(jié)論:,時(shí)時(shí)則則當(dāng)當(dāng) n,kPkA ., 2, 1 k)(2kXE)(knXE.k ;, 2, 1,11 kXnkPniki 3 抽樣分布抽樣分布由第五章關(guān)于依概率收斂的序列的性質(zhì)知),(),(2121kPkgAAAg .是連續(xù)函數(shù)是連續(xù)函數(shù)其中其中g(shù)由第五章關(guān)于依概率收斂的序列的性質(zhì)知),(),(2121kPkgAAAg .是連續(xù)函數(shù)是連續(xù)函數(shù)其中其中g(shù) 以上結(jié)論是下一章所要介紹的矩估計(jì)法的理論根據(jù).3 抽樣分布抽樣分布3. 經(jīng)驗(yàn)分布函數(shù)相應(yīng)的統(tǒng)計(jì)量稱為經(jīng)驗(yàn)相應(yīng)的統(tǒng)計(jì)量稱為經(jīng)驗(yàn)總體分布函數(shù)總體分布函數(shù) )( x
30、F經(jīng)驗(yàn)分布函數(shù)的做法如下:, 21的一個(gè)樣本的一個(gè)樣本是總體是總體設(shè)設(shè)FXXXn , )( )( 21中中不不大大于于表表示示用用nXXXxxS )( 為為定定義義經(jīng)經(jīng)驗(yàn)驗(yàn)分分布布函函數(shù)數(shù)xFn)( ),(1)( xxSnxFn.分布函數(shù)分布函數(shù),的隨機(jī)變量的個(gè)數(shù)的隨機(jī)變量的個(gè)數(shù)x3 抽樣分布抽樣分布 ,對(duì)于一個(gè)樣本值對(duì)于一個(gè)樣本值 ) . )( )(表表示示的的觀觀察察值值仍仍以以xFxFnn實(shí)例 , 3 , 2 , 1 具有一個(gè)樣本值具有一個(gè)樣本值設(shè)總體設(shè)總體 F 則經(jīng)驗(yàn)分布函數(shù)則經(jīng)驗(yàn)分布函數(shù) . )(的的觀觀察察值值容容易易求求得得xFn )(3的的觀觀察察值值為為xF, 1,32,31
31、, 0)(3xF , 1 x, 21 x32 x. 3 x3 抽樣分布抽樣分布實(shí)例 , 2 , 1 , 1 具具有有一一個(gè)個(gè)樣樣本本值值設(shè)設(shè)總總體體F )( 3的的觀觀察察值值為為則則經(jīng)經(jīng)驗(yàn)驗(yàn)分分布布函函數(shù)數(shù)xF , 0)(3xF , 1 x, 1. 2 x,3221 x3 抽樣分布抽樣分布一般地,,21樣樣本本值值的的一一個(gè)個(gè)容容量量為為是是總總體體設(shè)設(shè)nFxxxn , , 21按自小到大的次序排列按自小到大的次序排列先將先將nxxx,并重新編號(hào)并重新編號(hào),)()2()1(nxxx )( 的的觀觀察察值值為為則則經(jīng)經(jīng)驗(yàn)驗(yàn)分分布布函函數(shù)數(shù)xFn)(xFn , 0,nk, 1 ,)1(xx ,)
32、1()( kkxxx.)(nxx 3 抽樣分布抽樣分布 , x對(duì)對(duì)于于任任一一實(shí)實(shí)數(shù)數(shù) , 時(shí)時(shí)充分大充分大當(dāng)當(dāng)對(duì)于任一實(shí)數(shù)對(duì)于任一實(shí)數(shù)nx格里汶科定理格里汶科定理經(jīng)驗(yàn)分布函經(jīng)驗(yàn)分布函 )( )( xFxFn與總體分布函數(shù)與總體分布函數(shù)數(shù)的任一個(gè)觀察值數(shù)的任一個(gè)觀察值 ,只有微小的差別只有微小的差別來(lái)來(lái)從從而而在在實(shí)實(shí)際際上上可可當(dāng)當(dāng)作作 )( xF.使用使用. 10)()(suplim xFxFPnxn , )( xF一一致致收收斂斂于于分分布布函函數(shù)數(shù) 1 )(以以概概率率xFn , 時(shí)時(shí)當(dāng)當(dāng) n即即3 抽樣分布抽樣分布二、常見(jiàn)分布統(tǒng)計(jì)量的分布稱為抽樣分布.分布分布2 . 1 分分布布,的
33、的服服從從自自由由度度為為2 n自由度是指上式右端包含的獨(dú)立變量的個(gè)數(shù).的樣本,的樣本,是來(lái)自總體是來(lái)自總體設(shè)設(shè)1)0(N,21nX,XX則稱統(tǒng)計(jì)量則稱統(tǒng)計(jì)量 222212nXXX ).(22n 記為記為3 抽樣分布抽樣分布分布的概率密度為分布的概率密度為)(2n )(yf證明,2,21)1(2分布分布分布即為分布即為因?yàn)橐驗(yàn)?),1, 0( NXi又又因因?yàn)闉?,1(22 iX由定義由定義., 2, 1,2,212niXi 即即 ,0,2122e)2(21ynnyn 0 y.其他其他3 抽樣分布抽樣分布.)(2圖分布的概率密度曲線如n,21相相互互獨(dú)獨(dú)立立因因?yàn)闉閚XXX,22221也也相相
34、互互獨(dú)獨(dú)立立所所以以nXXX分布的可加性知分布的可加性知根據(jù)根據(jù) 2 niiX12.2,2 n3 抽樣分布抽樣分布分布的性質(zhì)分布的性質(zhì)2 性質(zhì)1),(1221n 設(shè)設(shè))(2分布的可加性分布的可加性 ( 此性質(zhì)可以推廣到多個(gè)隨機(jī)變量的情形. ),(22iin 設(shè)設(shè),立立獨(dú)獨(dú)22 ,21 并且并且),(2222n ).(2122221nn 則則,獨(dú)立獨(dú)立相相互互并并且且), 2, 1(2mii mii12 則則).(212mnnn 3 抽樣分布抽樣分布性質(zhì)2),(22n 若若證明),1, 0( NXi因因?yàn)闉?(2iXE所以所以)(2iXD23 ., 2, 1ni )( 2 E故故 niiXE12
35、)(,n)(2 D niiXD12)(.2n)(2分布的數(shù)學(xué)期望和方差分布的數(shù)學(xué)期望和方差 ,)(2nE 則則.2)(2nD )(iXD, 1224)()(iiXEXE , 1 niiXE12 niiXD12 3 抽樣分布抽樣分布分布的分位點(diǎn)分布的分位點(diǎn) 2 , 對(duì)于給定的正數(shù)對(duì)于給定的正數(shù).分分位位點(diǎn)點(diǎn)的的值值得得上上 .)()(22分位點(diǎn)分位點(diǎn)分布的上分布的上為為的點(diǎn)的點(diǎn) nn)(22nP )(2d)(nyyf , 10 稱滿足條件稱滿足條件, 對(duì)于不同的對(duì)于不同的,n可可以以通通過(guò)過(guò)查查表表求求 3 抽樣分布抽樣分布,的值的值求求 z05. 0z025. 0z根據(jù)正態(tài)分布的對(duì)稱性知.1
36、zz ,645. 1 ,96. 1 例1的上的上服從標(biāo)準(zhǔn)正態(tài)分布服從標(biāo)準(zhǔn)正態(tài)分布設(shè)設(shè))1 , 0(),1 , 0(NNX,de2122 xzXPzzx滿滿足足分分位位點(diǎn)點(diǎn).可通過(guò)查表完成可通過(guò)查表完成3 抽樣分布抽樣分布分分位位點(diǎn)點(diǎn)滿滿足足的的上上設(shè)設(shè) )(),(22nnZ,d);()()(222 nynynZP ,)(2的的值值求求n )8(2025. 0 )10(2975. 0 )25(21 . 0 附表5只詳列到n=40為止.,535.17 ,247. 3 .382.34 例2.可通過(guò)查表完成可通過(guò)查表完成3 抽樣分布抽樣分布,充分大時(shí)充分大時(shí)當(dāng)當(dāng)n例如2205. 0)99645. 1(
37、21)50( .221.67 利用上面公式,而查詳表可得.505.67)50(205. 0 ,40n時(shí)可以求得 費(fèi)舍爾費(fèi)舍爾(R.A.Fisher)證明證明:.分位點(diǎn)的近似值上 .分分位位點(diǎn)點(diǎn)是是標(biāo)標(biāo)準(zhǔn)準(zhǔn)正正態(tài)態(tài)分分布布的的上上其其中中 z.)12(21)(22 nzn 3 抽樣分布抽樣分布. 2分分布布服服從從使使得得 CY體體為為來(lái)來(lái)自自總總服服從從設(shè)設(shè) ),( , )1 , 0( 621XXXNX例3解根據(jù)正態(tài)分布的性質(zhì),),3 , 0(321NXXX ),3 , 0(654NXXX , C試試決決定定常常數(shù)數(shù)26542321)()( XXXXXXY ,的簡(jiǎn)單隨機(jī)樣本的簡(jiǎn)單隨機(jī)樣本X3
38、抽樣分布抽樣分布),1 , 0(3 321NXXX 則則),1 , 0(3654NXXX ),1(3 22321 XXX故故),1(3 22654 XXX3 抽樣分布抽樣分布 , , 2621分布的可加性分布的可加性相互獨(dú)立及相互獨(dú)立及因?yàn)橐驗(yàn)?XXX2654232133 XXXXXX ,31 C所所以以)()(3126542321XXXXXX ),2(2 . 2分布分布服從服從 CY3 抽樣分布抽樣分布),1, 0( NX設(shè)設(shè)t 分布又稱學(xué)生氏(Student)分布. tntnnnthn,1221)(212 分布的概率密度函數(shù)為分布的概率密度函數(shù)為)(nt分分布布t2.,/分分布布的的服服從
39、從自自由由度度為為稱稱隨隨機(jī)機(jī)變變量量tnnYXt ,獨(dú)獨(dú)立立且且YX),(2nY ).(ntt記記為為則則3 抽樣分布抽樣分布圖圖分布的概率密度曲線如分布的概率密度曲線如t顯然圖形是關(guān)于顯然圖形是關(guān)于形.,e21)(lim22tnth 因因?yàn)闉?)1 , 0(分布分布分布近似于分布近似于足夠大時(shí)足夠大時(shí)所以當(dāng)所以當(dāng)Ntn,n但對(duì)于較小的但對(duì)于較小的.)1 , 0(分分布布相相差差很很大大分分布布與與Nt當(dāng)n充分大時(shí),其圖形類似于標(biāo)準(zhǔn)正態(tài)變量概率密度的圖.0對(duì)對(duì)稱稱的的 t3 抽樣分布抽樣分布, 對(duì)于給定的對(duì)于給定的可可以以通通過(guò)過(guò)查查表表求求由分布的對(duì)稱性知).()(1ntnt ,45時(shí)時(shí)當(dāng)
40、當(dāng) n分布的分位點(diǎn)分布的分位點(diǎn) t.)()(分分位位點(diǎn)點(diǎn)分分布布的的上上為為的的點(diǎn)點(diǎn) ntnt )(d)()(nttthnttP , 10 稱滿足條件稱滿足條件.分分位位點(diǎn)點(diǎn)的的值值得得上上 .)( znt 3 抽樣分布抽樣分布分位點(diǎn)滿足分位點(diǎn)滿足的上的上設(shè)設(shè) )(),(ntntT,d);()()( ntynytntTP ,)(的值的值求求nt )10(05. 0t,8125. 1 )15(025. 0t.1315. 2 例4.可通過(guò)查表完成可通過(guò)查表完成3 抽樣分布抽樣分布),(12nU 設(shè)設(shè)分布分布F3.,布布分分的的服從自由度為服從自由度為隨機(jī)變量隨機(jī)變量FnnnVnUF),(/2121
41、 ),(22nV ,獨(dú)立獨(dú)立且且VU則稱則稱).,(21nnFF記記為為3 抽樣分布抽樣分布分分布布的的概概率率密密度度為為),(21nnF)(y ,12222212112221212111nnnnnynnnynnnn , 0, 0 y.其他其他3 抽樣分布抽樣分布圖圖分布的概率密度曲線如分布的概率密度曲線如F根據(jù)定義可知,).,(112nnFF則則分布的分位點(diǎn)分布的分位點(diǎn)F, 對(duì)于給定的對(duì)于給定的),(21nnFF若若.),(),(2121分分位位點(diǎn)點(diǎn)分分布布的的上上為為的的點(diǎn)點(diǎn) nnFnnF ),(2121d)(),(nnFyynnFFP 稱滿足條件稱滿足條件, 10 3 抽樣分布抽樣分布
42、分位點(diǎn)滿足分位點(diǎn)滿足分布的上分布的上設(shè)設(shè) ),(21nnF,),(21的值的值求求nnF )8 , 7(025. 0F)30,14(05. 0F,d)(),(),(2121 nnFyynnFFP ,90. 4 .31. 2 例5.可通過(guò)查表完成可通過(guò)查表完成3 抽樣分布抽樣分布:分位點(diǎn)具有如下性質(zhì)分位點(diǎn)具有如下性質(zhì)分布的上分布的上 F.),(1),(12211nnFnnF 證明),(1 211nnFFP 所所以以 ),(11211nnFFP ),(111211nnFFP ,),(111211 nnFFP ),(21nnFF因因?yàn)闉?),(11 211 nnFFP故故3 抽樣分布抽樣分布),(1
43、 12nnFF因因?yàn)闉?),(1 12 nnFFP所以所以, ),(),(11221-1nnFnnF 比比較較后后得得.),(1),(12211nnFnnF 即即)9 , 21(59 . 0F例例)12, 9(105. 0F 28. 01 .357. 0 . 分位點(diǎn)分位點(diǎn)的一些上的一些上用來(lái)求分布表中未列出用來(lái)求分布表中未列出 3 抽樣分布抽樣分布4. 正態(tài)總體的樣本均值與樣本方差的分布定理一),(,221 NXXXn是來(lái)自正態(tài)總體是來(lái)自正態(tài)總體設(shè)設(shè)有有的的樣樣本本均均值值和和樣樣本本方方差差正正態(tài)態(tài)總總體體),(2 N ,的的樣樣本本.以下兩個(gè)重要定理以下兩個(gè)重要定理則有則有)./,(2nN
44、X , 是樣本均值是樣本均值X3 抽樣分布抽樣分布定理二,),(,221的的樣樣本本是是總總體體設(shè)設(shè) NXXXn);1()1(1)222 nSn .(2)2獨(dú)立獨(dú)立與與SX,X則則有有,2方差方差分別是樣本均值和樣本分別是樣本均值和樣本S3 抽樣分布抽樣分布證明),1 , 0(/NnX 因因?yàn)闉?,1()1(222 nSn 由 t 分布的定義知)1()1(/22 nSnnX 定理三).1(/ ntnSX 則則有有,X,),(,221的的樣樣本本是是總總體體設(shè)設(shè) NXXXn,2方差方差分別是樣本均值和樣本分別是樣本均值和樣本S且兩者獨(dú)立,).1( nt3 抽樣分布抽樣分布,差差分別是這兩個(gè)樣本的方分別是這兩個(gè)樣本的方定理四分分別別是是具具有有與與設(shè)設(shè)21,2121nnYYYXXX, ),(21 N相同方差的兩正態(tài)總體相同方差的兩正態(tài)總體的的樣樣),(22 N,本本,且這兩個(gè)樣本互相獨(dú)立且這兩個(gè)樣本互相獨(dú)立,1111 niiXnX設(shè)設(shè),1212值值分分別別是是這這兩兩個(gè)個(gè)樣樣本本的的均均 niiYnY,)(11112121 niiXXnS 212222)(11niiYY
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年江蘇貨運(yùn)從業(yè)資格證考試模擬題庫(kù)答案解析
- 小學(xué)數(shù)學(xué)二年級(jí)第二學(xué)期口算計(jì)算共3018道題
- 小學(xué)數(shù)學(xué)二年級(jí)第二學(xué)期口算計(jì)算共3029道題
- 兒童科學(xué)實(shí)驗(yàn)的安全操作規(guī)程
- 企業(yè)安全風(fēng)險(xiǎn)防控與生產(chǎn)效益的平衡
- 健康管理軟件在孕婦保健中的應(yīng)用探討
- 健康教育新篇章利用家用殺菌技術(shù)解決家庭幽門(mén)問(wèn)題
- 人工智能背景下學(xué)生科技素養(yǎng)評(píng)價(jià)方法探討
- 創(chuàng)新科技在醫(yī)療研究中的IP支持與保障
- 創(chuàng)意無(wú)限海報(bào)設(shè)計(jì)的多維思考與實(shí)現(xiàn)
- 修改留言條(課堂PPT)
- 壓鑄過(guò)程原理及壓鑄工藝技術(shù)培訓(xùn)
- 3500常用字帶拼音
- 巴赫作品 《C大調(diào)前奏曲》Prelude in C major,BWV846;J. S. Bach古典吉他譜
- plc課程設(shè)計(jì)模壓機(jī)控制
- 出境竹木草制品生產(chǎn)企業(yè)衛(wèi)生防疫管理手冊(cè)
- VDA63過(guò)程審核案例
- FP21表說(shuō)明書(shū)
- 【方案】樁基靜載檢測(cè)方案
- 東西方分封制起因的對(duì)比
- 勞動(dòng)人事?tīng)?zhēng)議仲裁申請(qǐng)書(shū) - Wuhan
評(píng)論
0/150
提交評(píng)論