數(shù)理統(tǒng)計(jì)基本概念 (1)_第1頁(yè)
數(shù)理統(tǒng)計(jì)基本概念 (1)_第2頁(yè)
數(shù)理統(tǒng)計(jì)基本概念 (1)_第3頁(yè)
數(shù)理統(tǒng)計(jì)基本概念 (1)_第4頁(yè)
數(shù)理統(tǒng)計(jì)基本概念 (1)_第5頁(yè)
已閱讀5頁(yè),還剩41頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第五章第五章 數(shù)理統(tǒng)計(jì)的基礎(chǔ)知識(shí)數(shù)理統(tǒng)計(jì)的基礎(chǔ)知識(shí)引言引言從本章節(jié)開(kāi)始,從本章節(jié)開(kāi)始,我們將講述數(shù)理統(tǒng)計(jì)的基本內(nèi)容我們將講述數(shù)理統(tǒng)計(jì)的基本內(nèi)容.理統(tǒng)計(jì)作為一門(mén)學(xué)科誕生于理統(tǒng)計(jì)作為一門(mén)學(xué)科誕生于19世紀(jì)末世紀(jì)末20世紀(jì)初,世紀(jì)初,有廣泛應(yīng)用的一個(gè)數(shù)學(xué)分支,有廣泛應(yīng)用的一個(gè)數(shù)學(xué)分支, 它以概率論為基礎(chǔ),它以概率論為基礎(chǔ),據(jù)試驗(yàn)劃觀察得到的數(shù)據(jù),據(jù)試驗(yàn)劃觀察得到的數(shù)據(jù), 來(lái)研究隨機(jī)現(xiàn)象,來(lái)研究隨機(jī)現(xiàn)象,研究對(duì)象的客觀規(guī)律性作出合理的估計(jì)和判斷研究對(duì)象的客觀規(guī)律性作出合理的估計(jì)和判斷. 大量隨機(jī)現(xiàn)象必然呈現(xiàn)出它們的規(guī)律性,大量隨機(jī)現(xiàn)象必然呈現(xiàn)出它們的規(guī)律性, 故理論上只故理論上只要對(duì)隨機(jī)現(xiàn)象進(jìn)行足夠多

2、次觀察,要對(duì)隨機(jī)現(xiàn)象進(jìn)行足夠多次觀察, 則研究對(duì)象的規(guī)律則研究對(duì)象的規(guī)律數(shù)數(shù)是具是具根根以便對(duì)以便對(duì)由于由于必就一定能清楚地呈現(xiàn)出來(lái),必就一定能清楚地呈現(xiàn)出來(lái), 但實(shí)際上人們常常無(wú)法但實(shí)際上人們常常無(wú)法對(duì)所研究的對(duì)象的全體對(duì)所研究的對(duì)象的全體(或或總體總體) 進(jìn)行觀察,進(jìn)行觀察,而只能抽而只能抽必就一定能清楚地呈現(xiàn)出來(lái),必就一定能清楚地呈現(xiàn)出來(lái), 但實(shí)際上人們常常無(wú)法但實(shí)際上人們常常無(wú)法對(duì)所研究的對(duì)象的全體對(duì)所研究的對(duì)象的全體(或或總體總體) 進(jìn)行觀察,進(jìn)行觀察,而只能抽而只能抽取其中的部分取其中的部分(或或樣本樣本)數(shù)據(jù)數(shù)據(jù). 數(shù)理統(tǒng)計(jì)的任務(wù)包括:數(shù)理統(tǒng)計(jì)的任務(wù)包括:限的數(shù)據(jù)資料;限的數(shù)據(jù)資

3、料;究,究, 從而對(duì)研究對(duì)象的性質(zhì)、特點(diǎn),從而對(duì)研究對(duì)象的性質(zhì)、特點(diǎn), 作出合理的推斷作出合理的推斷,此即所謂的此即所謂的統(tǒng)計(jì)推斷問(wèn)題統(tǒng)計(jì)推斷問(wèn)題, 本課程主要講述統(tǒng)計(jì)推斷本課程主要講述統(tǒng)計(jì)推斷的基本內(nèi)容的基本內(nèi)容.進(jìn)行觀察或試驗(yàn)以獲得有限的進(jìn)行觀察或試驗(yàn)以獲得有限的怎樣有效地收集、怎樣有效地收集、 整理有整理有怎樣對(duì)所得的數(shù)據(jù)資料進(jìn)行分析、怎樣對(duì)所得的數(shù)據(jù)資料進(jìn)行分析、 研研一、總體與總體分布一、總體與總體分布通常把具有一定共性的研究對(duì)象的全體稱(chēng)通常把具有一定共性的研究對(duì)象的全體稱(chēng)總體總體,其大小與范圍隨具體研究與考察的目的而確定其大小與范圍隨具體研究與考察的目的而確定.如,如, 考察某大學(xué)

4、一年級(jí)新生的體重情況,考察某大學(xué)一年級(jí)新生的體重情況,級(jí)全體新生就構(gòu)成了待研究的總體級(jí)全體新生就構(gòu)成了待研究的總體.總體確定后,總體確定后,們稱(chēng)組成總體的每一個(gè)成員為們稱(chēng)組成總體的每一個(gè)成員為個(gè)體個(gè)體.年級(jí)新生的體重年級(jí)新生的體重)中的每一個(gè)新生的體重為一個(gè)個(gè)體中的每一個(gè)新生的體重為一個(gè)個(gè)體.總體中所包含的個(gè)數(shù)稱(chēng)為總體的總體中所包含的個(gè)數(shù)稱(chēng)為總體的容量容量,例例則該校一年則該校一年我我如前述總體如前述總體(一一容量為有限的容量為有限的稱(chēng)為稱(chēng)為有限總體有限總體; 容量為無(wú)限的稱(chēng)為容量為無(wú)限的稱(chēng)為無(wú)限總體無(wú)限總體. 總體與總體與個(gè)體的關(guān)系,個(gè)體的關(guān)系, 即集合論中集合與元素的關(guān)系即集合論中集合與元

5、素的關(guān)系. 在數(shù)理在數(shù)理統(tǒng)計(jì)中所關(guān)心的并非每個(gè)個(gè)體的所有性質(zhì),統(tǒng)計(jì)中所關(guān)心的并非每個(gè)個(gè)體的所有性質(zhì),而僅僅而僅僅是它的某一項(xiàng)或幾項(xiàng)指標(biāo),是它的某一項(xiàng)或幾項(xiàng)指標(biāo), 代表總體的指標(biāo)代表總體的指標(biāo)(如一年如一年級(jí)新生的體重級(jí)新生的體重)是一個(gè)隨機(jī)變量是一個(gè)隨機(jī)變量,X是隨機(jī)變量是隨機(jī)變量X的一個(gè)取值,的一個(gè)取值,幾個(gè)幾個(gè))隨機(jī)變量隨機(jī)變量總體中每個(gè)個(gè)體總體中每個(gè)個(gè)體從而總體就是指某個(gè)從而總體就是指某個(gè)(或或可能取的值的全體可能取的值的全體. 于是,于是,一個(gè)總體就對(duì)應(yīng)于一個(gè)一個(gè)總體就對(duì)應(yīng)于一個(gè)(或幾個(gè)或幾個(gè))隨機(jī)變量,隨機(jī)變量,對(duì)總體的研究就相當(dāng)于對(duì)這個(gè)對(duì)總體的研究就相當(dāng)于對(duì)這個(gè)(或幾個(gè)(或幾個(gè))隨

6、機(jī)變量的研究隨機(jī)變量的研究.定義定義1 統(tǒng)計(jì)學(xué)中稱(chēng)隨機(jī)變量統(tǒng)計(jì)學(xué)中稱(chēng)隨機(jī)變量(或向量或向量)X為為總體總體, 并把并把注注: (1)標(biāo),標(biāo), 但總可將其數(shù)量化,但總可將其數(shù)量化,如檢驗(yàn)?zāi)硨W(xué)校全體學(xué)生的如檢驗(yàn)?zāi)硨W(xué)校全體學(xué)生的血型,血型, 試驗(yàn)的結(jié)果有試驗(yàn)的結(jié)果有o型、型、A型、型、有時(shí)個(gè)體的特性的直接描述并非是數(shù)量指有時(shí)個(gè)體的特性的直接描述并非是數(shù)量指B型、型、AB型型4種,種,若若分別以分別以1,2,3,4依次記這依次記這4種血型,種血型,就可以用數(shù)量來(lái)表示了;就可以用數(shù)量來(lái)表示了;(2)有時(shí)即使知道其有時(shí)即使知道其分布的類(lèi)型分布的類(lèi)型(如正態(tài)分布、二項(xiàng)分布等如正態(tài)分布、二項(xiàng)分布等), 但不知

7、這些但不知這些則試驗(yàn)的結(jié)果則試驗(yàn)的結(jié)果分布中的所含參數(shù)分布中的所含參數(shù)(如如p,2 等等).總體的分布一般來(lái)說(shuō)是未知的,總體的分布一般來(lái)說(shuō)是未知的,數(shù)理統(tǒng)計(jì)的任務(wù)就是根據(jù)總體中部分個(gè)體的數(shù)據(jù)資數(shù)理統(tǒng)計(jì)的任務(wù)就是根據(jù)總體中部分個(gè)體的數(shù)據(jù)資料對(duì)總體的未知分布進(jìn)行統(tǒng)計(jì)推斷料對(duì)總體的未知分布進(jìn)行統(tǒng)計(jì)推斷.二、樣本與樣本分布二、樣本與樣本分布為對(duì)總體分布及其特性進(jìn)行統(tǒng)計(jì)推斷,為對(duì)總體分布及其特性進(jìn)行統(tǒng)計(jì)推斷,需按一定的需按一定的規(guī)則從總體中抽取若干個(gè)體進(jìn)行觀察,規(guī)則從總體中抽取若干個(gè)體進(jìn)行觀察,通過(guò)觀察可通過(guò)觀察可得到關(guān)于總體得到關(guān)于總體X的一組數(shù)值的一組數(shù)值,21xx,nx基于基于), 2 , 1(n

8、ixi 是第是第i次抽取的個(gè)體的數(shù)量指標(biāo)次抽取的個(gè)體的數(shù)量指標(biāo)iX的觀察值的觀察值. 上述抽取過(guò)程稱(chēng)為上述抽取過(guò)程稱(chēng)為抽樣抽樣,個(gè)體稱(chēng)為個(gè)體稱(chēng)為樣本樣本,樣本中所含個(gè)體數(shù)目稱(chēng)為樣本的樣本中所含個(gè)體數(shù)目稱(chēng)為樣本的容容為對(duì)總體進(jìn)行合理的統(tǒng)計(jì)推斷,為對(duì)總體進(jìn)行合理的統(tǒng)計(jì)推斷,所抽取的部分所抽取的部分量量.我們還需要在我們還需要在相同的相同的條件下進(jìn)行多次重復(fù)的、條件下進(jìn)行多次重復(fù)的、故故樣本是一個(gè)隨機(jī)變量(或向量)樣本是一個(gè)隨機(jī)變量(或向量).獨(dú)立的抽樣觀察,獨(dú)立的抽樣觀察,容量為容量為n的樣本可的樣本可視視為為n維隨機(jī)向量維隨機(jī)向量,21nXXX一旦具體取定一組樣本,一旦具體取定一組樣本, 便得到

9、樣本的一次具體的便得到樣本的一次具體的觀察值觀察值,21nxxx稱(chēng)其為稱(chēng)其為樣本值樣本值,成的集合稱(chēng)為成的集合稱(chēng)為樣本空間樣本空間.地反映總體的信息,地反映總體的信息,必須考慮抽樣方法,必須考慮抽樣方法,全體樣本值組全體樣本值組為了使抽取的樣本能很好為了使抽取的樣本能很好最常用的最常用的一種抽樣方法稱(chēng)為一種抽樣方法稱(chēng)為簡(jiǎn)單隨機(jī)抽樣簡(jiǎn)單隨機(jī)抽樣,本滿(mǎn)足下面兩個(gè)條件:本滿(mǎn)足下面兩個(gè)條件:1. 代表性代表性:nXXX,21與所考察的總體具有相同與所考察的總體具有相同它要求抽取的樣它要求抽取的樣的分布;的分布;2. 獨(dú)立性獨(dú)立性:nXXX,21是相互獨(dú)立的隨機(jī)變量是相互獨(dú)立的隨機(jī)變量.由簡(jiǎn)單隨機(jī)抽樣得

10、到的樣本稱(chēng)為由簡(jiǎn)單隨機(jī)抽樣得到的樣本稱(chēng)為簡(jiǎn)單隨機(jī)樣本簡(jiǎn)單隨機(jī)樣本,可用與總體獨(dú)立同分布的可用與總體獨(dú)立同分布的n個(gè)相互獨(dú)立的隨機(jī)變量個(gè)相互獨(dú)立的隨機(jī)變量它它nXXX,21表示表示.注注: 簡(jiǎn)單隨機(jī)樣本是一種非常理想化的樣本簡(jiǎn)單隨機(jī)樣本是一種非常理想化的樣本.際應(yīng)用中,際應(yīng)用中,對(duì)有限總體對(duì)有限總體,若采用有放回抽樣就能得若采用有放回抽樣就能得到簡(jiǎn)單隨機(jī)樣本,到簡(jiǎn)單隨機(jī)樣本,但有放回抽樣使用起來(lái)不方便,但有放回抽樣使用起來(lái)不方便,故實(shí)故實(shí)故實(shí)際操作中通常采用不著是無(wú)放回抽樣,故實(shí)際操作中通常采用不著是無(wú)放回抽樣,當(dāng)所當(dāng)所考察的總體很大時(shí),考察的總體很大時(shí),可近似把無(wú)放回抽樣所得到的可近似把無(wú)放回

11、抽樣所得到的樣本看成是一個(gè)簡(jiǎn)單隨機(jī)樣本樣本看成是一個(gè)簡(jiǎn)單隨機(jī)樣本.對(duì)無(wú)限總體對(duì)無(wú)限總體,因抽取一個(gè)個(gè)體不影響它的分布,因抽取一個(gè)個(gè)體不影響它的分布, 故故采用無(wú)放回抽樣即可得到的一個(gè)簡(jiǎn)單隨機(jī)樣本采用無(wú)放回抽樣即可得到的一個(gè)簡(jiǎn)單隨機(jī)樣本.注注:今后假定所考慮的樣本均為簡(jiǎn)單隨機(jī)樣本,今后假定所考慮的樣本均為簡(jiǎn)單隨機(jī)樣本,稱(chēng)為稱(chēng)為樣本樣本.簡(jiǎn)簡(jiǎn)例例1 樣本及觀察值的表示方法樣本及觀察值的表示方法: :(1) 某食品廠用自動(dòng)裝罐機(jī)生產(chǎn)凈重為某食品廠用自動(dòng)裝罐機(jī)生產(chǎn)凈重為345克的午餐克的午餐肉罐頭肉罐頭, , 由于隨機(jī)性由于隨機(jī)性, , 每個(gè)罐頭的凈重都有差別每個(gè)罐頭的凈重都有差別, , 現(xiàn)現(xiàn)在從生產(chǎn)

12、線(xiàn)上隨機(jī)抽取在從生產(chǎn)線(xiàn)上隨機(jī)抽取10個(gè)罐頭個(gè)罐頭, , 秤其凈重秤其凈重, 得如得如下結(jié)果:下結(jié)果:344 336 345 342 340 338 344 343 344 343這是一個(gè)容量為這是一個(gè)容量為10的樣本的觀察值的樣本的觀察值, , 它是來(lái)自該生它是來(lái)自該生產(chǎn)線(xiàn)罐頭凈重這一總體的一個(gè)樣本的觀察值產(chǎn)線(xiàn)罐頭凈重這一總體的一個(gè)樣本的觀察值. .例例1 樣本及觀察值的表示方法樣本及觀察值的表示方法: :(2) 對(duì)對(duì)363個(gè)零售商店調(diào)查得其周零售額的結(jié)果如下個(gè)零售商店調(diào)查得其周零售額的結(jié)果如下: :15421101356130000,20000(20000,10000(10000,5000(

13、5000,1000(1000)(商商店店數(shù)數(shù)元元零零售售額額 這是一個(gè)容量為這是一個(gè)容量為363的樣本的觀察值的樣本的觀察值, ,對(duì)應(yīng)的總體是對(duì)應(yīng)的總體是所有零售店的周零售額所有零售店的周零售額. . 不過(guò)這里沒(méi)有給出每一個(gè)不過(guò)這里沒(méi)有給出每一個(gè)樣本的具體的觀察值樣本的具體的觀察值, , 而是給出了樣本觀察值所在而是給出了樣本觀察值所在的區(qū)間的區(qū)間, , 稱(chēng)為分組樣本的觀察值稱(chēng)為分組樣本的觀察值. . 這樣一來(lái)當(dāng)然會(huì)這樣一來(lái)當(dāng)然會(huì)損失一些信息損失一些信息, , 但是在樣本量較大時(shí)但是在樣本量較大時(shí), , 這種經(jīng)過(guò)整這種經(jīng)過(guò)整理的數(shù)據(jù)更能使人們對(duì)總體有一個(gè)大致的印象理的數(shù)據(jù)更能使人們對(duì)總體有一個(gè)

14、大致的印象. .設(shè)總體設(shè)總體X的分布函數(shù)為的分布函數(shù)為),(xF由樣本的獨(dú)立性,由樣本的獨(dú)立性,簡(jiǎn)單隨機(jī)樣本簡(jiǎn)單隨機(jī)樣本nXXX,21的聯(lián)合分布函數(shù)為的聯(lián)合分布函數(shù)為 niinxFxxxF121)(),(并稱(chēng)其為并稱(chēng)其為樣本分布樣本分布.(1)其概率分布為其概率分布為),(ixp則樣本則樣本nXXX,21的概率分布為的概率分布為則則X為離散型隨機(jī)變量,為離散型隨機(jī)變量,若總體若總體),(),(121 niinxpxxxp稱(chēng)其為稱(chēng)其為離散樣本密度離散樣本密度.(2)其概率密度為其概率密度為X為連續(xù)型隨機(jī)變量,為連續(xù)型隨機(jī)變量,若總體若總體),(xf則樣本的概率密度為則樣本的概率密度為)(),(1

15、21 niinxfxxxf稱(chēng)其為稱(chēng)其為連續(xù)樣本密度連續(xù)樣本密度.例例2 如果總體如果總體X服從正態(tài)分布服從正態(tài)分布, , 則稱(chēng)總體則稱(chēng)總體X為正為正態(tài)總體態(tài)總體. . 正態(tài)總體是統(tǒng)計(jì)應(yīng)用中最常見(jiàn)的總體正態(tài)總體是統(tǒng)計(jì)應(yīng)用中最常見(jiàn)的總體, , 現(xiàn)現(xiàn)設(shè)總體設(shè)總體X服從正態(tài)分布服從正態(tài)分布),(2 N則其樣本密度則其樣本密度由下式給出由下式給出: : ninxxxxf1212121exp21),( .)(21exp211212 ninx 例例3 如果總體如果總體X服從以服從以)10( pp為參數(shù)的為參數(shù)的10 分布分布, , 則稱(chēng)總體則稱(chēng)總體X為為10 總體總體, , 即即,1PXP .10pXP 不

16、難算出其樣本不難算出其樣本nXXX,21的概率分布為的概率分布為nnssnnppiXiXiXP)1(,2211 其中其中)1(nkik 取取1或或0, , 而而,21nniiis 它恰好等于樣本中取值為它恰好等于樣本中取值為1的分量之總數(shù)的分量之總數(shù). .服從服從10 分布的總體具有廣泛的應(yīng)用背景分布的總體具有廣泛的應(yīng)用背景. . 概率概率p通??梢暈槟硨?shí)際總體通??梢暈槟硨?shí)際總體 (如工廠的某一批產(chǎn)品如工廠的某一批產(chǎn)品)中具中具有某特征有某特征(如廢品如廢品)的個(gè)體所占的比例的個(gè)體所占的比例, , 亦稱(chēng)為比率亦稱(chēng)為比率.從總體中隨機(jī)抽取一個(gè)個(gè)體從總體中隨機(jī)抽取一個(gè)個(gè)體, , 可視為一個(gè)隨機(jī)試

17、驗(yàn)可視為一個(gè)隨機(jī)試驗(yàn), ,試驗(yàn)結(jié)果可用一隨機(jī)變量試驗(yàn)結(jié)果可用一隨機(jī)變量X來(lái)刻畫(huà)來(lái)刻畫(huà): : 若恰好抽到具若恰好抽到具有該特征的個(gè)體有該特征的個(gè)體, , 記記; 1 X否則否則, , 記記. 0 X這樣這樣, ,X便服從以便服從以p為參數(shù)的為參數(shù)的10 分布分布, , 通常參數(shù)通常參數(shù)p是是未知的未知的, , 故需通過(guò)抽樣對(duì)其作統(tǒng)計(jì)推斷故需通過(guò)抽樣對(duì)其作統(tǒng)計(jì)推斷. .例例4 設(shè)總體設(shè)總體X服從參數(shù)為服從參數(shù)為 的泊松分布的泊松分布, ,21XXnX為其樣本為其樣本, , 則樣本的概率分布為則樣本的概率分布為,2211nniXiXiXP nkkinkkeiiXPk11! ,!21 nnseiiin

18、 其中其中)1(nkik 取非負(fù)整數(shù)取非負(fù)整數(shù), , 而而.21nniiis 三、統(tǒng)計(jì)推斷問(wèn)題簡(jiǎn)述三、統(tǒng)計(jì)推斷問(wèn)題簡(jiǎn)述通過(guò)總體通過(guò)總體X的一個(gè)樣本的一個(gè)樣本nXXX,21分布進(jìn)行推斷,分布進(jìn)行推斷,此即為此即為統(tǒng)計(jì)推斷問(wèn)題統(tǒng)計(jì)推斷問(wèn)題.樣本值的關(guān)系:樣本值的關(guān)系:總體總體推斷推斷(個(gè)體個(gè)體)樣本樣本樣本值樣本值樣抽樣抽對(duì)總體對(duì)總體X的的總體、樣本、總體、樣本、在實(shí)際應(yīng)用中,在實(shí)際應(yīng)用中,總體的分布一般是未知的,總體的分布一般是未知的, 或雖然或雖然知道總體分布所屬的類(lèi)型,知道總體分布所屬的類(lèi)型, 但其中包含有未知參數(shù)但其中包含有未知參數(shù).為對(duì)總體分布進(jìn)行推斷,為對(duì)總體分布進(jìn)行推斷, 可對(duì)總體進(jìn)

19、行抽樣研究,可對(duì)總體進(jìn)行抽樣研究,對(duì)總體的每次抽樣,對(duì)總體的每次抽樣,均得到樣本的一組確定的值均得到樣本的一組確定的值樣本值,樣本值, 統(tǒng)計(jì)推斷就是利用通過(guò)大量抽樣得到統(tǒng)計(jì)推斷就是利用通過(guò)大量抽樣得到的樣本值,的樣本值, 反過(guò)來(lái)對(duì)總體分布的屬的類(lèi)型,反過(guò)來(lái)對(duì)總體分布的屬的類(lèi)型,分布中所含的未知參數(shù)進(jìn)行推斷分布中所含的未知參數(shù)進(jìn)行推斷.或總體或總體通過(guò)觀察或試驗(yàn)得到的樣本值,通過(guò)觀察或試驗(yàn)得到的樣本值,一般是雜亂無(wú)章的,一般是雜亂無(wú)章的,需要進(jìn)行整理才能從總體上呈現(xiàn)其統(tǒng)計(jì)規(guī)律性,需要進(jìn)行整理才能從總體上呈現(xiàn)其統(tǒng)計(jì)規(guī)律性,組數(shù)據(jù)統(tǒng)計(jì)表或頻率直方圖是兩種常用的整理方法組數(shù)據(jù)統(tǒng)計(jì)表或頻率直方圖是兩種常

20、用的整理方法.1.分組數(shù)據(jù)表分組數(shù)據(jù)表:若樣本值較多時(shí),若樣本值較多時(shí),組,組, 分組的組數(shù)應(yīng)與樣本容量相適應(yīng)分組的組數(shù)應(yīng)與樣本容量相適應(yīng). 分組太少,分組太少,難以反映出分布的特征,難以反映出分布的特征,分組太多,分組太多,則由于樣本取則由于樣本取值的隨機(jī)性而使分布顯得雜亂值的隨機(jī)性而使分布顯得雜亂. 因此,因此,分分可將其分成若干可將其分成若干則則分組時(shí),分組時(shí), 確定確定分組數(shù)分組數(shù)(或組距或組距)應(yīng)以突出分布的特征并沖淡樣本的應(yīng)以突出分布的特征并沖淡樣本的隨機(jī)波動(dòng)性為原則隨機(jī)波動(dòng)性為原則. 區(qū)間所含的樣本值個(gè)數(shù)稱(chēng)為該區(qū)間所含的樣本值個(gè)數(shù)稱(chēng)為該區(qū)間的區(qū)間的組頻數(shù)組頻數(shù).四、分組數(shù)據(jù)統(tǒng)計(jì)表

21、和頻率直方圖四、分組數(shù)據(jù)統(tǒng)計(jì)表和頻率直方圖組頻數(shù)與總的樣本容量之比稱(chēng)為組頻數(shù)與總的樣本容量之比稱(chēng)為組組頻數(shù)頻數(shù).2. 頻率直方圖頻率直方圖:頻率直方圖能直觀地表示出組頻頻率直方圖能直觀地表示出組頻率數(shù)的分率數(shù)的分. 其步驟如下:其步驟如下:(1)設(shè)設(shè)nxxx,21是樣本是樣本n個(gè)觀察值個(gè)觀察值.的的nxxx,21中中求出求出)1(x和最和最的最小者的最小者;)(nx大者大者將區(qū)間將區(qū)間,ba等分成等分成m個(gè)小區(qū)間個(gè)小區(qū)間m使使nm/(一般取一般取(2)a(略小于(略小于)1(x) 和和b(略大于(略大于)(nx),選取常數(shù)選取常數(shù)并并在在10/1左右,左右,且小區(qū)間不包含右端點(diǎn)且小區(qū)間不包含右

22、端點(diǎn)):);, 1(1),mimbttttii (3)組頻率組頻率,iifnn 及及);, 2 , 1( ,nitfhii ,in求組頻數(shù)求組頻數(shù)(4)在在,tttii 上以上以ih為高,為高,t 為寬作小矩形,為寬作小矩形,其面積恰為其面積恰為,if所有小矩形合在一起就構(gòu)成了頻率所有小矩形合在一起就構(gòu)成了頻率直方圖直方圖. 典型的頻率直方圖如下圖所示典型的頻率直方圖如下圖所示.ttfi O abtttii 例例5 從某廠生產(chǎn)的某種零件中隨機(jī)抽取從某廠生產(chǎn)的某種零件中隨機(jī)抽取120個(gè)個(gè), , 測(cè)得測(cè)得其質(zhì)量其質(zhì)量(單位單位:g:g)如下表所示如下表所示, , 列出分組表列出分組表, , 并作頻

23、率并作頻率直方圖直方圖. .1982002072062062132162062052202072112022092082092112162012112041992142142092082212042162102062162122112132122012142172062142072072141992082112191902182182112212082112192142182092112212162032112202142112112082102082132072082011962072062032132092082062042062042082082131932112132031942022

24、08207218213206203202208206209206208197203216219209213222206216208203202200解解 先從這先從這120個(gè)樣個(gè)樣本值中找出最小值本值中找出最小值190, ,取取, 5 .189 a, 5 .222 b將區(qū)間將區(qū)間5 .222, 5 .189等分成等分成11個(gè)小區(qū)間個(gè)小區(qū)間, ,最大值最大值 222, ,組距組距. 3 t例例5 從某廠生產(chǎn)的某種零件中隨機(jī)抽取從某廠生產(chǎn)的某種零件中隨機(jī)抽取120個(gè)個(gè), , 測(cè)得測(cè)得其質(zhì)量其質(zhì)量(單位單位:g:g)如下表所示如下表所示, , 列出分組表列出分組表, , 并作頻率并作頻率直方圖直方圖

25、. .解解得到分組表及頻得到分組表及頻1120360/6120/665 .2225 .219360/8120/885 .2195 .216360/14120/14145 .2165 .213360/22120/22225 .2135 .210360/23120/23235 .2105 .207360/20120/20205 .2075 .204360/14120/14145 .2045 .201360/7120/775 .2015 .198360/3120/335 .1985 .195360/2120/225 .1955 .192360/1120/115 .1925 .189/合計(jì)合計(jì)高高組頻

26、率組頻率組頻數(shù)組頻數(shù)區(qū)間區(qū)間tfhfniiii 從直方圖的形狀從直方圖的形狀, , 可以粗略地認(rèn)為該種零件的質(zhì)量可以粗略地認(rèn)為該種零件的質(zhì)量率直方圖率直方圖. .服從正態(tài)分布服從正態(tài)分布, 其數(shù)學(xué)期望在其數(shù)學(xué)期望在209附近附近.t質(zhì)質(zhì)量量tfi 定義定義2設(shè)總體設(shè)總體X的一個(gè)容量為的一個(gè)容量為n的樣本的樣本值的樣本的樣本值nxxx,21可按大小次序排列成可按大小次序排列成.)()2()1(nxxx 若若,)1()( kkxxx則不大于則不大于x的樣本值的頻率為的樣本值的頻率為./nk因而函數(shù)因而函數(shù) , 1,/, 0)(nkxFn)1(xx ,)1()( kkxxx)(nxx 與事件與事件x

27、X 在在n獨(dú)立重復(fù)試驗(yàn)中的頻率相同的,獨(dú)立重復(fù)試驗(yàn)中的頻率相同的,稱(chēng)稱(chēng))(xFn為為經(jīng)驗(yàn)分布函數(shù)經(jīng)驗(yàn)分布函數(shù).五、經(jīng)驗(yàn)分布函數(shù)五、經(jīng)驗(yàn)分布函數(shù)注注:樣本的頻率直方圖可以形象地描述總體的概率樣本的頻率直方圖可以形象地描述總體的概率分布的大致形態(tài),分布的大致形態(tài),而經(jīng)驗(yàn)分布函數(shù)則可以用來(lái)描述而經(jīng)驗(yàn)分布函數(shù)則可以用來(lái)描述總體分布函數(shù)的大致形狀總體分布函數(shù)的大致形狀.有下列結(jié)論有下列結(jié)論(格里汶科格里汶科, 1933):. 10)()(suplim xFxFPnxn對(duì)于上述經(jīng)驗(yàn)分布函數(shù)對(duì)于上述經(jīng)驗(yàn)分布函數(shù)由此結(jié)果,由此結(jié)果,對(duì)于任一實(shí)數(shù)對(duì)于任一實(shí)數(shù),x當(dāng)當(dāng)n充分大時(shí),充分大時(shí),經(jīng)驗(yàn)分布函數(shù)的任一個(gè)觀察

28、值經(jīng)驗(yàn)分布函數(shù)的任一個(gè)觀察值)()(xFn與總體分布與總體分布從而在實(shí)際中可當(dāng)作從而在實(shí)際中可當(dāng)作)(xF來(lái)使用來(lái)使用. 這就是由樣本推斷總體其可行性這就是由樣本推斷總體其可行性的最基本的理論依據(jù)的最基本的理論依據(jù). )(xF只有微小的差別,只有微小的差別,函數(shù)函數(shù)例例6 隨機(jī)觀察總體隨機(jī)觀察總體,X得到一個(gè)容量為得到一個(gè)容量為10的樣本值的樣本值: :425 . 22305 . 225 . 22 . 3 求求X經(jīng)驗(yàn)分布函數(shù)經(jīng)驗(yàn)分布函數(shù). .解解 把樣本值按從小到大的順序排列為把樣本值按從小到大的順序排列為于是得經(jīng)驗(yàn)分布函數(shù)為于是得經(jīng)驗(yàn)分布函數(shù)為5 . 25 . 22202 42 . 335

29、. 2 ,4, 142 . 3,10/92 . 33,10/835 . 2,10/75 . 22,10/420,10/202,10/12, 0)(10 xxxxxxxxxFOx10.52342 )(xFn其中如其中如5 . 22 x時(shí)時(shí), , 因事件因事件xX 包含的樣本包含的樣本值個(gè)數(shù)值個(gè)數(shù), 4 k故事件故事件xX 發(fā)生的頻率為發(fā)生的頻率為,10/4從而從而.10/4)(10 xF注注: : 經(jīng)驗(yàn)分布函數(shù)經(jīng)驗(yàn)分布函數(shù))(xFn是一個(gè)階梯形函數(shù)是一個(gè)階梯形函數(shù), , 當(dāng)樣當(dāng)樣本容量增大時(shí)本容量增大時(shí), , 相鄰兩階梯的躍度變低相鄰兩階梯的躍度變低, , 階梯寬度階梯寬度變窄變窄, , 容易想

30、像容易想像, , 這樣的階梯形折線(xiàn)幾乎就是一條這樣的階梯形折線(xiàn)幾乎就是一條曲線(xiàn)曲線(xiàn), , 如果設(shè)總體如果設(shè)總體X的分布函數(shù)為的分布函數(shù)為),(xF則則)(xFn非常接近于非常接近于).(xF六、統(tǒng)計(jì)量六、統(tǒng)計(jì)量定義定義 設(shè)設(shè)nXXX,1為總體為總體X的一個(gè)樣本,的一個(gè)樣本,樣本的任一不含總體分布未知參數(shù)的函數(shù)為該樣本樣本的任一不含總體分布未知參數(shù)的函數(shù)為該樣本的的統(tǒng)計(jì)量統(tǒng)計(jì)量.例如例如,設(shè)總體設(shè)總體X服從正態(tài)分布,服從正態(tài)分布,, 5)( XE22,)( XD未知未知.nXXX,1為總體的一個(gè)樣為總體的一個(gè)樣令令,21nSXXXXSnnn 稱(chēng)此稱(chēng)此本,本,則則nS與與X均為該樣本的統(tǒng)計(jì)量,均為

31、該樣本的統(tǒng)計(jì)量, 但但 )5( XnU不是該樣本的統(tǒng)計(jì)量,不是該樣本的統(tǒng)計(jì)量, 因其含有總體分布中的未知因其含有總體分布中的未知注注: 樣本樣本nXXX,1是是n維隨機(jī)向量,維隨機(jī)向量,這個(gè)隨機(jī)向量的函數(shù),這個(gè)隨機(jī)向量的函數(shù),用大寫(xiě)字母,用大寫(xiě)字母,如:如: niiXnX11等;等;但是,但是,體取定一組觀察值體取定一組觀察值nxx,1時(shí),時(shí),統(tǒng)計(jì)量就是一個(gè)具統(tǒng)計(jì)量就是一個(gè)具. 參數(shù)參數(shù)統(tǒng)計(jì)量是統(tǒng)計(jì)量是當(dāng)樣本當(dāng)樣本,1XXnX具具體的實(shí)數(shù)值,體的實(shí)數(shù)值, 用小寫(xiě)字母,如:用小寫(xiě)字母,如: niixnx11等等.七、常用統(tǒng)計(jì)量七、常用統(tǒng)計(jì)量以下設(shè)以下設(shè)nXXX,21為總體為總體X的一個(gè)樣本的一個(gè)

32、樣本.1. 樣本均值樣本均值 niiXnX112. 樣本方差樣本方差 niiXXnS122)(113. 樣本標(biāo)準(zhǔn)差樣本標(biāo)準(zhǔn)差 niiXXnS12)(114. 樣本樣本(k階階)原點(diǎn)矩原點(diǎn)矩, 2 , 1,11 kXnAnikik5. 樣本樣本(k階階)中心矩中心矩 nikikkXXnB1, 3 , 2,)(1注注:上述五種統(tǒng)計(jì)量可統(tǒng)稱(chēng)為上述五種統(tǒng)計(jì)量可統(tǒng)稱(chēng)為矩統(tǒng)計(jì)量矩統(tǒng)計(jì)量, 簡(jiǎn)稱(chēng)為簡(jiǎn)稱(chēng)為樣樣它們都是樣本的顯函數(shù),它們都是樣本的顯函數(shù), 它們的觀察值仍分別它們的觀察值仍分別稱(chēng)為樣本均值、樣本方差、樣本標(biāo)準(zhǔn)差、樣本稱(chēng)為樣本均值、樣本方差、樣本標(biāo)準(zhǔn)差、樣本(k階階)原點(diǎn)矩、樣本原點(diǎn)矩、樣本(k階階

33、)中心矩中心矩.6.順序統(tǒng)計(jì)量順序統(tǒng)計(jì)量將樣本中的各分量按由小到大的將樣本中的各分量按由小到大的次序排列成次序排列成,)()2()1(nXXX 本矩本矩,6.順序統(tǒng)計(jì)量順序統(tǒng)計(jì)量將樣本中的各分量按由小到大的將樣本中的各分量按由小到大的次序排列成次序排列成,)()2()1(nXXX 則稱(chēng)則稱(chēng))()2()1(,nXXX為樣本的一組為樣本的一組順序統(tǒng)計(jì)量順序統(tǒng)計(jì)量,)(iX稱(chēng)為樣本的第稱(chēng)為樣本的第i個(gè)順序統(tǒng)計(jì)量個(gè)順序統(tǒng)計(jì)量. 特別地,特別地,與與)(nX分別為分別為樣本極小值樣本極小值與與樣本極大值樣本極大值,并稱(chēng)并稱(chēng))1()(XXn 為樣本的為樣本的極差極差.)1(X稱(chēng)稱(chēng)補(bǔ)充說(shuō)明補(bǔ)充說(shuō)明在樣本方差

34、中在樣本方差中 niiXXnS122)(11中,中, niiXXQ12)(為樣本的偏差平方和為樣本的偏差平方和,可將其變形如下:可將其變形如下: niiniiiXnXXXXXQ122122)2(稱(chēng)稱(chēng)從而從而.111222 niiXnXnS例例7 某廠實(shí)行計(jì)件工資制某廠實(shí)行計(jì)件工資制, , 為及時(shí)了解情況為及時(shí)了解情況, , 隨機(jī)隨機(jī)抽取抽取30名工人名工人, , 調(diào)查各自在一周內(nèi)加工的零件數(shù)調(diào)查各自在一周內(nèi)加工的零件數(shù), ,然后按規(guī)定算出每名工人的周工資如下然后按規(guī)定算出每名工人的周工資如下: : (單位單位: :元元)1511611981571551461551511561351561251

35、56153147168138169144149155171157161141159141160134156其樣本均值其樣本均值, 5 .153)151161134156(301 x它反映了該廠工人周工資的一般水平它反映了該廠工人周工資的一般水平. .為為: :這便是一個(gè)容量為這便是一個(gè)容量為30 的樣本觀察值的樣本觀察值, ,7121551511341562223012 iix所以樣本方差為所以樣本方差為5 .52871301)30(1301301222 iixxs進(jìn)一步我們計(jì)算樣本方差進(jìn)一步我們計(jì)算樣本方差2s及樣本標(biāo)準(zhǔn)差及樣本標(biāo)準(zhǔn)差, s由于由于,3278.182 樣本標(biāo)準(zhǔn)差為樣本標(biāo)準(zhǔn)差為

36、.50.133278.182 s例例8 (分組樣本均值與方差的近似計(jì)算分組樣本均值與方差的近似計(jì)算) 如果在例如果在例中收集得到的樣本觀察值用分組樣本形式給出中收集得到的樣本觀察值用分組樣本形式給出7(見(jiàn)表見(jiàn)表A), , 此時(shí)樣本均值可用下面方法近似計(jì)算此時(shí)樣本均值可用下面方法近似計(jì)算: :以以ix表示第表示第i個(gè)組的組中值個(gè)組的組中值 (即區(qū)間的中點(diǎn)即區(qū)間的中點(diǎn)), ,in為第為第i組的組頻數(shù)組的組頻數(shù), , 2 , 1ki ,1 kiinn33kiiixnnx則則例例84600301951951200,190(01850190,180(1751751180,170(6601654170,160(217015514160,150(8701456150,140(4051353140,130(1251251130,120(30合計(jì)合計(jì)組中值組中值工人數(shù)工人數(shù)周工資額區(qū)間周工資額區(qū)間名工人周平均工資額名工人周平均工資額某廠某廠表表iiiixnxnA例例8

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論