隨機樣本和統(tǒng)計量課件_第1頁
隨機樣本和統(tǒng)計量課件_第2頁
隨機樣本和統(tǒng)計量課件_第3頁
隨機樣本和統(tǒng)計量課件_第4頁
隨機樣本和統(tǒng)計量課件_第5頁
已閱讀5頁,還剩37頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第六章

樣本及其分布一、隨機樣本及統(tǒng)計量二、數理統(tǒng)計中的常用分布三、抽樣分布定理1第六章

樣本及其分布一、隨機樣本及統(tǒng)計量1數理統(tǒng)計學是運用概率論的知識,對所要研究的隨機現象進行多次觀察或試驗,研究如何合理地獲得數據資料,對所關心的問題作出估計與檢驗的一門學科本章主要介紹隨機樣本、統(tǒng)計量等基本概念,并著重介紹幾個常用的統(tǒng)計量和抽樣分布。2數理統(tǒng)計學是運用概率論的知識,第6.1節(jié)隨機樣本和統(tǒng)計量一、總體與個體、隨機樣本二、頻率分布和直方圖三、經驗分布函數四、統(tǒng)計量3第6.1節(jié)隨機樣本和統(tǒng)計量一、總體與個體、隨機樣本二、頻率一、總體與個體,隨機樣本一個統(tǒng)計問題總有它明確的研究對象.研究對象的全體稱為總體(母體),總體中每個成員稱為個體.研究某批燈泡的質量…考察國產轎車的質量總體總體4一、總體與個體,隨機樣本一個統(tǒng)計問題總有它明確的研究對象.然而在統(tǒng)計研究中,人們往往關心每個個體的一項(或幾項)數量指標和該數量指標在總體中的分布情況.這時,每個個體具有的數量指標的全體就是總體.該批燈泡壽命的全體就是總體燈泡的壽命國產轎車每公里的耗油量所有國產轎車每公里耗油量的全體就是總體5然而在統(tǒng)計研究中,人們往往關心每個個體的一項

由于每個個體的出現帶有隨機性,即相應的數量指標值的出現帶有隨機性。從而可把此種數量指標看作隨機變量,我們用一個隨機變量或其分布來描述總體。為此常用隨機變量的符號或分布的符號來表示總體。

通常,我們用隨機變量X,Y,Z,…,等表示總體。當我們說到總體,就是指一個具有確定概率分布的隨機變量。6由于每個個體的出現帶有隨機性,即相應的數量指標值的如:研究某批燈泡的壽命時,我們關心的數量指標就是壽命,那么,此總體就可以用隨機變量X表示,或用其分布函數F(x)表示.總體某批燈泡的壽命壽命X可用一概率分布來刻劃F(x)7如:研究某批燈泡的壽命時,我們關心的數量指標就是壽命,那么,因此,在統(tǒng)計學中,總體這個概念的要旨是:

總體就是一個概率分布.8因此,在統(tǒng)計學中,總體這個概念的要旨是:8某工廠10月份生產的燈泡壽命所組成的總體中,個體的總數就是10月份生產的燈泡數,這是一個有限總體;而該工廠生產的所有燈泡壽命所組成的總體可近似地看成一個無限總體,它包括以往生產和今后生產的燈泡壽命.

有限總體和無限總體實例當有限總體包含的個體的總數很大時,可近似地將它看成是無限總體.9某工廠10月份生產的燈泡壽命所組1.樣本的定義為推斷總體的分布及各種特征,按一定的規(guī)則從總體中抽取若干個體進行觀察試驗,以獲得有關總體的信息.這一抽取過程稱為“抽樣”.所抽取的部分個體稱為樣本.通常記為樣本中所包含的個體數目n稱為樣本容量.101.樣本的定義為推斷總體的分布及各種特征,按一定的容量為n的樣本可以看作n維隨機變量.但是,一旦取定一組樣本,得到的是n個具體的數,稱此為樣本的一次觀察值,簡稱樣本值.簡單隨機樣本抽取樣本的目的是為了利用樣本對總體進行統(tǒng)計推斷,這就要求樣本能很好的反映總體的特性且便于處理.為此,需對抽樣提出一些要求,通常有兩條:11容量為n的樣本可以看作n維隨機變量.但是,滿足上述兩條性質的樣本稱為簡單隨機樣本.簡稱為隨機樣本.獲得簡單隨機樣本的抽樣方法稱為簡單隨機抽樣.為了使大家對總體和樣本有一個明確的概念,我們給出如下定義:定義6.1一個隨機變量X或其相應的分布函數F(x)稱為一個總體.1.代表性:X1,X2,…,Xn中每一個與所考察的總體X有相同的分布.2.獨立性:X1,X2,…,Xn是相互獨立的隨機變量.12滿足上述兩條性質的樣本稱為簡單隨機樣本.簡稱為隨機樣本.獲得定義6.2樣本所有可能取值的全體稱為樣本空間,記為。13定義6.2樣本定理6.1樣本的分布14定理6.1樣本的分布14解例115解例115解例216解例2161717二、頻率分布和直方圖設連續(xù)型總體X的密度函數是未知的,是X的一個樣本觀值.下面介紹一種根據樣本觀察值來近似地求總體X的概率密度f(x)的圖解法-----頻率直方圖法。其具體方法如下:18二、頻率分布和直方圖設連續(xù)型總體X的密度函數是1919取a略小于m,b略大于M,則區(qū)間[a,b]是包含所有樣本值的區(qū)間.

再將區(qū)間[a,b]等分為l個小區(qū)間,分點記為且每個分點ti的值應比樣本值多取一位小數.

相應地,樣本值也分成了l個數組.

20取a略小于m,b略大于M,則區(qū)間[a,b]是每個小區(qū)間的長度稱為組距,小區(qū)間的個數l稱為組數.

經驗表明,組數l要適當的選定,過小會掩蓋各組內數據的變動情況,過大則將突出隨機性的影響而降低穩(wěn)定性,從而看不出明顯的規(guī)律.

組數l當樣本容量n≥50時應以7到18個為宜,且使每個小區(qū)間中都有樣本值中的數據.

21每個小區(qū)間的長度稱為組距,小區(qū)間的個數l稱為組數.(2)確定頻數和頻率:設第i個小區(qū)間中樣本值的頻數,則相應的頻率為(1≤i≤l).根據伯努利大數定律,當樣本容量n充分大時,應有近似等式

22(2)確定頻數和頻率:設第i個小區(qū)間中樣本值的頻數,則相應的.

上面最后一個近似等式的幾何意義是,在每個小區(qū)間上用矩形面積近似代替曲邊梯形面積

其中區(qū)間上矩形的高為23上面最后一個近似等式的幾何意義是,在每個小區(qū)間上(3)作頻率直方圖:在每個小區(qū)間上,以小區(qū)間為底、為高作矩形,矩形面積即為,由個矩形構成的圖形就叫做頻率直方圖.

頻率直方圖近似總體密度函數的圖形,愈大,近似程度愈好.

且樣本容量24(3)作頻率直方圖:在每個小區(qū)間上,以小區(qū)間為底、為高作矩形例6.2某廠生產圓釘的長度L是一個連續(xù)型隨及變量,從中抽取100個測量其長度后得數據如下:152.2156.9157.3160.9159.5163.8154.8160.4158.5154.2155.1156.9155.5161.9159.1151.6162.3160.4152.9148.6160.2156.1160.4162.7156.3160.1153.5153.6149.1154.2156.5159.9159.9154.9154.7156.1157.7152.5157.7155.0160.9152.6155.5155.5165.5155.1155.7155.2162.8152.9152.0157.1158.6153.6159.8150.9158.3153.3158.5150.5157.2155.8159.9152.0161.1152.5155.0156.7157.5153.7164.7150.0155.0158.9163.7151.5164.4148.1156.0163.6152.7153.8156.9152.7160.7151.1154.1150.8147.0155.6158.8151.8165.8148.5161.2153.8151.3150.5154.0149.6試作出試驗數據的頻率直方圖.25例6.2某廠生產圓釘的長度L是一個連續(xù)型隨及變量,從中抽解

因數據中的最小值,最大值,取將區(qū)間[145.95,165.95]10等分,每個小區(qū)的長將100個數據分為10組,如表6-1所示

26解因數據中的最小值,最大值,取將區(qū)間[145.95,16表6-1各組范圍頻數fi頻率νi

=fi/100yi=νi/2145.95~147.9510.010.005147.95~149.9550.050.025149.95~151.95100.100.050151.95~153.95160.160.080153.95~155.95200.200.100155.95~157.95150.150.075157.95~159.95120.120.060159.95~161.95100.100.050161.95~163.9560.060.030163.95~165.9550.050.02527表6-1各組范圍頻數fi頻率νi=fi/100yi=頻率直方圖如圖6-1

從直觀上看,直方圖的上邊近似于正態(tài)概率密度曲線.

圖6-1

28頻率直方圖如圖6-1從直觀上看,直方圖的上邊近似于正態(tài)概率三.經驗分布函數

設總體X的分布函數F(x)是未知的,且為X的一個樣本值.對任意實數樣本值中不超過則稱Fn(x)為經驗分布函數.

的數據的頻數記為m(x),作Fn(x)=m(x)/n,

(6.4)上面介紹了利用頻率直方圖來近似地求總體X的概率密度,現介紹另一種方法,無論總體X是怎么樣的隨機變量都可以用,這就是根據總體X的樣本作出X的“經驗分布函數”,它是總體X的分布函數的良好近似。29三.經驗分布函數設總體X的分布函數F(x)是未知的,且為例6.3

設總體X為100個同類鑄件中每個鑄件上沙眼的個數.從中任取7個鑄件,檢查每個鑄件上的沙眼數,得樣本值0,3,2,1,1,0,1.試求相應的經驗分布函數.解:樣本值中有四個不同的數值0,1,2,3,它們的頻數依次為2,3,1,1.

30例6.3設總體X為100個同類鑄件中每個鑄件上沙眼的個數相應的經驗分布函數為31相應的經驗分布函數為31圖6—2的圖形是一條不降的階梯形曲線(圖6-2).

32圖6—232四、統(tǒng)計量1.

統(tǒng)計量的定義由樣本推斷總體特征,需要對樣本值進行“加工”,“提煉”.這就需要構造一些樣本的函數,它把樣本中所含的信息集中起來.33四、統(tǒng)計量1.統(tǒng)計量的定義由樣本推斷總體特是不是例6.434是不是例6.4342.

幾個常用統(tǒng)計量(樣本矩)的定義(1)樣本平均值(2)樣本方差其觀察值它反映了總體均值的信息它反映了總體方差的信息352.幾個常用統(tǒng)計量(樣本矩)的定義(1)樣本平均值(2)樣其觀察值(3)樣本標準差其觀察值36其觀察值(3)樣本標準差其觀察值36(4)

樣本k階(原點)矩其觀察值(5)樣本k階中心矩其觀察值37(4)樣本k階(原點)矩其觀察值(5)樣本k階中心樣本矩具有下列性質:性質證明38樣本矩具有下列性質:性質證明383939五、小結個體總體有限總體無限總體基本概念:說明1

一個總體對應一個隨機變量X,我們將不區(qū)分總體和相應的隨機變量,統(tǒng)稱為總體X.說明2

在實際中遇到的總體往往是有限總體,它對應一個離散型隨機變量;當總體中包含的個體的個數很大時,在理論上

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論