抽樣與抽樣分布_第1頁(yè)
抽樣與抽樣分布_第2頁(yè)
抽樣與抽樣分布_第3頁(yè)
抽樣與抽樣分布_第4頁(yè)
抽樣與抽樣分布_第5頁(yè)
已閱讀5頁(yè),還剩33頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第十章 抽樣與抽樣分布第一節(jié) 抽樣與抽樣分布 第二節(jié) 參數(shù)估計(jì)的基本方法第三節(jié) 總體參數(shù)的區(qū)間估計(jì)第一節(jié)抽抽樣與抽抽樣分布布一、抽樣樣判斷二、抽樣樣方法三、抽樣樣分布一、抽樣判斷斷什么叫叫抽樣判判斷從所研究究的總體體全部元元素(單單位)中中抽取一一部分元元素(單單位)進(jìn)進(jìn)行調(diào)查查,并根根據(jù)樣本本數(shù)據(jù)所所提供的的信息來(lái)來(lái)推斷總總體的數(shù)數(shù)量特征征叫樣本本推斷。二、抽樣樣方法根據(jù)抽取取樣本的的原則不不同,抽抽樣方法法有概率抽樣樣和非概概率抽樣樣。概率抽樣樣的常用用方法有有:1、簡(jiǎn)單隨機(jī)機(jī)抽樣2、分層抽樣樣3、整群抽樣樣1、簡(jiǎn)單單隨機(jī)抽抽樣從總體體N個(gè)單位中中隨機(jī)地地抽取n個(gè)單位作作為樣本本,使得每一

2、一個(gè)容量量為n的樣本都都有相同的機(jī)機(jī)會(huì)(概率)被抽中抽取元元素的具具體方法法有重復(fù)復(fù)抽樣和和不重復(fù)復(fù)抽樣特點(diǎn):簡(jiǎn)單、直直觀,在在抽樣框框完整時(shí)時(shí),可直直接從中中抽取樣樣本局限性性當(dāng)N很大時(shí),不易構(gòu)構(gòu)造抽樣樣框,抽抽出的單單位很分分散,給給實(shí)施調(diào)調(diào)查增加加了困難難,沒(méi)有有利用其其他輔助助信息以以提高估估計(jì)的效效率2、分層層抽樣將抽樣樣單位按按某種特特征或某某種規(guī)則則劃分為為不同的的層,然然后從不不同的層層中獨(dú)立立、隨機(jī)機(jī)地抽取取樣本優(yōu)點(diǎn)保證樣本本的結(jié)構(gòu)構(gòu)與總體體的結(jié)構(gòu)構(gòu)比較相相近,從從而提高高估計(jì)的的精度組織實(shí)施施調(diào)查方方便既可以對(duì)對(duì)總體參參數(shù)進(jìn)行行估計(jì),也可以以對(duì)各層層的目標(biāo)標(biāo)量進(jìn)行行估計(jì)3、

3、整群抽樣樣將總體體中若干干個(gè)單位位合并為為組(群群),抽抽樣時(shí)直直接抽取取群,然然后對(duì)中中選群中中的所有有單位全全部實(shí)施施調(diào)查特點(diǎn)抽樣時(shí)只只需群的抽樣框框,可簡(jiǎn)簡(jiǎn)化工作作量調(diào)查的地地點(diǎn)相對(duì)對(duì)集中,節(jié)省調(diào)調(diào)查費(fèi)用用,方便便調(diào)查的的實(shí)施缺點(diǎn)是估估計(jì)的精精度較差差三種不同同性質(zhì)的的分布1、總體分布布2、樣本分布布3、抽樣分布布三者之間間有什么么關(guān)系?1、總體分布布1)總體體中各元元素的觀觀察值所所形成的的相對(duì)頻頻數(shù)(頻頻率)分分布2)分布布通常是是未知的的(因?yàn)闉閹缀醯玫貌坏娇偪倛D所有有觀察值值)3)可以以(根據(jù)據(jù)理論分分析)假假定它服服從某種種分布總體2、樣本分布布1)一個(gè)個(gè)樣本中中各觀察察值的形

4、形成的相相對(duì)頻數(shù)數(shù)(頻率率)分布布2)也稱(chēng)稱(chēng)經(jīng)驗(yàn)分分布3)當(dāng)樣樣本容量量n逐漸增大大時(shí),樣樣本分布布逐漸接接近總體體的分布布3、抽樣分布布1)樣本統(tǒng)統(tǒng)計(jì)量的的概率分分布,是是一種理理論分布布在重復(fù)復(fù)選取容容量為n的樣本本時(shí),由由該統(tǒng)計(jì)計(jì)量的所所有可能取值形形成的相相對(duì)頻數(shù)數(shù)分布2)樣本統(tǒng)統(tǒng)計(jì)量是是樣本的的函數(shù),依據(jù)不不同的樣樣本計(jì)算算出來(lái)的的值是不不同的所所以統(tǒng)計(jì)計(jì)量是隨隨機(jī)變量量樣本均值值,樣本比例例,樣本本方差等等3)結(jié)果來(lái)來(lái)自容量量相同的的所有可可能樣本本4)提供了了樣本統(tǒng)統(tǒng)計(jì)量長(zhǎng)長(zhǎng)遠(yuǎn)而穩(wěn)穩(wěn)定的信信息,是是進(jìn)行推推斷的理理論基礎(chǔ)礎(chǔ),也是是抽樣推推斷科學(xué)學(xué)性的重重要依據(jù)據(jù)(1)總總體分布布

5、、樣本本均值的的抽樣分分布【例】設(shè)一個(gè)總總體,含含有4個(gè)個(gè)元素(個(gè)體) ,即即總體單單位數(shù)N=4。4 個(gè)個(gè)個(gè)體分別別為x1=1,x2=2,x3=3,x4=4??傮w體分布、總體的均均值、方方差及分分布如下下總體分布14230.1.2.3現(xiàn)從總體體中抽取取n2的簡(jiǎn)簡(jiǎn)單隨機(jī)機(jī)樣本,在重復(fù)復(fù)抽樣條條件下下,共有有42=16個(gè)個(gè)樣本。所有樣樣本的結(jié)結(jié)果為3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二個(gè)觀察值第一個(gè)觀察值所有可能的n = 2 的樣本(共16個(gè))計(jì)算出各各樣本的的均值,如下表表。并給給出樣本本均值的的抽樣分分布3.53.0

6、2.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二個(gè)觀察值第一個(gè)觀察值16個(gè)樣本的均值( )x樣本均值的抽樣分布1.000.10.20.3P ( x )1.53.04.03.52.02.5樣本均值值的分布布與總體體分布的的比較的分布形形式與原原有總體體和樣本本容量n的大小小有關(guān)總體分布布14230.1.2.3抽樣分布P ( x )1.00.1.2.31.53.04.03.52.02.5x= 2.52=1.25當(dāng)總體服服從正態(tài)態(tài)分布N(,)時(shí),樣本均值值的抽樣樣分布仍仍然是服服從正態(tài)態(tài)分布的的,其均均值仍為為,方差為為,即即樣本均均值的方方差

7、比原原總體的的方差要要小,而而且樣本本容量n越大,方差越越小。 = 2.52 =1.25X總體分布上述結(jié)論論是對(duì)正正態(tài)總體體而言的的,不過(guò)過(guò)實(shí)際上上,即使使對(duì)于非非正態(tài)總總體而言言,隨著著樣本容容量的增增加,的的抽樣分分布也會(huì)會(huì)近似地地變成正正態(tài)的。事實(shí)上上,只要要樣本足足夠大(通常要要求樣本本容量不不小于45),即使是是從非正正態(tài)分布布的總體體中抽樣樣,根據(jù)據(jù)統(tǒng)計(jì)學(xué)學(xué)中的中中心極限限定理,樣本均均值的抽抽樣分布布與從正正態(tài)分布布總體中中的抽樣樣所得到到的結(jié)果果也近似似相同??偨Y(jié):樣樣本均值值的抽樣樣分布樣本均值值的數(shù)學(xué)學(xué)期望仍仍為樣本均值值的方差差(方差的概概率意義義在于刻刻畫(huà)了隨隨機(jī)變量量

8、取值的的分散程程度。方方差越小小,隨隨隨機(jī)變量量的取值值越集中中在期望望值附近近。)重復(fù)抽樣樣不重復(fù)抽抽樣(2)樣樣本比例例的抽樣樣分布總體中具具有某種種屬性的的單位數(shù)數(shù)與總體體全部單單位數(shù)之之比稱(chēng)為為總體比比例,也也稱(chēng)總體體的成數(shù)數(shù),記作作 P。而樣本本中具有有某種屬屬性的單單位數(shù)與與樣本總總數(shù)之比比稱(chēng)為樣樣本比例例,或稱(chēng)稱(chēng)樣本成成數(shù),記記作p。若從總體體中隨機(jī)機(jī)抽取出出容量為為n的樣樣本,發(fā)發(fā)現(xiàn)其中中具有某某種屬性性的單位位數(shù)為m,則樣樣本中具具有某種種屬性的的單位的的比例就就為p=m/n樣本比例例是一個(gè)個(gè)隨機(jī)變變量,當(dāng)當(dāng)樣本容容量很大大時(shí),近近似地服服從正態(tài)態(tài)分布。其分布布的數(shù)學(xué)學(xué)期望為

9、為總體的的成數(shù),方方差等于于,即:第二節(jié)參參數(shù)估估計(jì)的基基本方法法參數(shù)估計(jì)計(jì)也就是是用樣本本統(tǒng)計(jì)量量去估計(jì)計(jì)總體的的參數(shù)。比如,用樣本本均值估估計(jì)總體體均值估估計(jì)總體體均值,用樣本本方差估估計(jì)總體體方差,用樣本本比例估估計(jì)總體體比例等等。用來(lái)估計(jì)計(jì)總體參參數(shù)的統(tǒng)統(tǒng)計(jì)量的的名稱(chēng),稱(chēng)為估估計(jì)量,用符號(hào)號(hào)表表示用來(lái)估計(jì)計(jì)總體參參數(shù)時(shí)計(jì)計(jì)算出來(lái)來(lái)的估計(jì)計(jì)量的具具體數(shù)值值,稱(chēng)為為估計(jì)值值點(diǎn)估計(jì)與與區(qū)間估估計(jì)參數(shù)估計(jì)計(jì)的方法法有點(diǎn)估估計(jì)和區(qū)區(qū)間估計(jì)計(jì)(一)點(diǎn)估計(jì)計(jì)點(diǎn)估計(jì)又又稱(chēng)定值值估計(jì)。它是用用實(shí)際樣樣本指標(biāo)標(biāo)數(shù)值代代替總體體指標(biāo)數(shù)數(shù)值,即即總體平平均數(shù)的的點(diǎn)估計(jì)計(jì)值就是是樣本平平均數(shù),總體成成數(shù)的點(diǎn)點(diǎn)估

10、計(jì)值值就是樣樣本成數(shù)數(shù)。這種種估計(jì)不不考慮是是否有抽抽樣誤差差。例如,對(duì)對(duì)一批某某種型號(hào)號(hào)的電子子元件10000只進(jìn)進(jìn)行耐用用時(shí)間檢檢查,隨隨機(jī)抽取取100只,測(cè)測(cè)試的平平均耐用用時(shí)間為為1055小時(shí)時(shí),合格格率為91%,我們推推斷說(shuō)10000只電電子元件件的平均均耐用時(shí)時(shí)間為1055小時(shí),全部電電子元件件的合格格率也是是91%。評(píng)價(jià)估計(jì)計(jì)量的標(biāo)標(biāo)準(zhǔn)用于估計(jì)計(jì)的估估計(jì)量很很多,究究竟用樣樣本的哪哪種估計(jì)計(jì)量作為為總體參參數(shù)的估估計(jì)呢?統(tǒng)計(jì)學(xué)家家給出了了一些標(biāo)標(biāo)準(zhǔn):(一)無(wú)無(wú)偏性。即以抽抽樣指標(biāo)標(biāo)估計(jì)全全及指標(biāo)標(biāo)要求抽抽樣指標(biāo)標(biāo)值的平平均數(shù)等等于被估估計(jì)的全全及指標(biāo)標(biāo)本身。(二)一一致性。即當(dāng)樣

11、樣本容量量n充分分大的時(shí)時(shí),若樣樣本指標(biāo)標(biāo)充分地地靠近被被估計(jì)的的全體指指標(biāo),則則該樣本本指標(biāo)是是被估計(jì)計(jì)的全體體指標(biāo)的的一致估估計(jì)量。(三)有有效性。即如果果一個(gè)樣樣本估計(jì)計(jì)量的方方差比其其他估計(jì)計(jì)量的方方差小,則稱(chēng)該該樣本估估計(jì)量是是被估計(jì)計(jì)的全及及指標(biāo)的的有效估估計(jì)量。(二)區(qū)區(qū)間估計(jì)計(jì)區(qū)間估計(jì)計(jì)所表明明的是一一個(gè)可能能范圍,不是一一個(gè)絕對(duì)對(duì)可靠的的范圍。是用樣樣本指標(biāo)標(biāo)和它的的抽樣極極限誤差差構(gòu)成的的區(qū)間來(lái)來(lái)估計(jì)總總體指標(biāo)標(biāo),并以以一定的的概率保保證總體體指標(biāo)將將在所估估計(jì)的區(qū)區(qū)間內(nèi)。第三節(jié)總總體體參數(shù)的的區(qū)間估估計(jì)一、總總體均值值的區(qū)間間估計(jì)二、總體體比例的的區(qū)間估估計(jì)一、總體體均值

12、的的區(qū)間估估計(jì)1、區(qū)間間估計(jì)的的基本原原理根據(jù)樣樣本平均均數(shù)的分分布特征征可知:p(x-x-Xx+x)= F(t)在概率保保證程度度為F(t),概率度度為t的的情況下下,總體體平均數(shù)數(shù)的數(shù)值值將在x-x和x+x的的范圍內(nèi)內(nèi)。其中中,x-x稱(chēng)稱(chēng)為估計(jì)計(jì)下限,x+x稱(chēng)為為估計(jì)上上限。區(qū)區(qū)間x-x,x+x稱(chēng)為置置信區(qū)間間 。估計(jì)可可靠性程程度稱(chēng)為為置信度度。如果我我們將構(gòu)構(gòu)造置信信區(qū)間的的步驟重重復(fù)多次次,置信信區(qū)間中中包含總總體參數(shù)數(shù)真值的的次數(shù)所所占的比比率稱(chēng)為為置信水水平。當(dāng)總體服服從正態(tài)態(tài)分布且且方差已已知時(shí),或者總總體不是是正態(tài)分分布且方方差未知知但大樣樣本,在在這種情情況下,樣本均均值的

13、抽抽樣分布布均為正正態(tài)分布布,其數(shù)數(shù)學(xué)期望望是方方差是根據(jù)正態(tài)態(tài)分布的的性質(zhì)可可以得出出總體均均值所所在的區(qū)區(qū)間為:如果總體體方差未未知,大大樣本條條件下,則可以以用樣本本方差代代替總體體方差,這時(shí)時(shí)總體均均值在1-置信水平平下的置置信區(qū)間間可以寫(xiě)寫(xiě)為如果是采采取不重重復(fù)抽樣樣,而且且抽樣比比很大時(shí)時(shí),則樣樣本分布布的方差差應(yīng)乘以以修正系系數(shù),這時(shí)時(shí)總體均值值在1-置置信信水平下下的置信信區(qū)間可可以寫(xiě)為為: 當(dāng)總體方方差未未知時(shí)時(shí),總體體均值在在1-置置信水水平的置置信區(qū)間間可以寫(xiě)寫(xiě)為:(二)總總體成數(shù)數(shù)的估計(jì)計(jì)區(qū)間總體成數(shù)數(shù)的區(qū)間間估計(jì)原原理與總總體平均均數(shù)相同同,即:在概率率保證程程度為F(t),概率率度為t的情況況下,總總體成數(shù)數(shù)的數(shù)值值將在p-p和p+p的的范圍內(nèi)內(nèi)。其中中p-p稱(chēng)為為估計(jì)下下限,p+p稱(chēng)為估估計(jì)上限限。區(qū)間間p-p,

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論