抽樣分布與參數(shù)估計PPT_第1頁
抽樣分布與參數(shù)估計PPT_第2頁
抽樣分布與參數(shù)估計PPT_第3頁
抽樣分布與參數(shù)估計PPT_第4頁
抽樣分布與參數(shù)估計PPT_第5頁
已閱讀5頁,還剩58頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

抽樣分布與參數(shù)估計PPT第1頁,課件共63頁,創(chuàng)作于2023年2月第六章抽樣分布與參數(shù)估計

學(xué)習(xí)目標(biāo):1、理解抽樣分布的特點;

2、理解抽樣估計的概念、特點、作用以及幾個基本概念;

3、掌握抽樣誤差的含義和影響抽樣誤差的主要因素素;

4、熟練掌握抽樣平均誤差的計算;

5、熟練掌握總體均值和總體成數(shù)的區(qū)間估計方法;

6、掌握必要抽樣數(shù)目的確定方法;

7、能夠正確選擇抽樣組織方式。

第2頁,課件共63頁,創(chuàng)作于2023年2月6.1抽樣推斷的概述6.1.1抽樣推斷的概念、特點和作用

6.1.2抽樣推斷相關(guān)的幾個基本概念

6.1.3抽樣誤差

6.1.4抽樣調(diào)查的理論依據(jù)第3頁,課件共63頁,創(chuàng)作于2023年2月6.1.1抽樣推斷的概念、特點和作用

1、抽樣推斷的概念

抽樣推斷是按隨機(jī)原則從全部研究對象中抽取一部分單位進(jìn)行觀察,根據(jù)樣本資料計算樣本的特征值,然后以樣本的特征值,對總體的特征值做出具有一定可靠性的估計和判斷,以反映總體的數(shù)量特征和數(shù)量表現(xiàn)的一種統(tǒng)計方法。所謂隨機(jī)原則,即是在抽取樣本時,排除人們主觀意圖的作用,使得總體中的各單位均以相等的機(jī)會被抽中。隨機(jī)原則又稱為等可能性原則。

2、抽樣推斷的特點(1)調(diào)查單位的確定是按隨機(jī)原則從全部總體單位中抽取的。(2)用部分單位的指標(biāo)數(shù)值去推斷和估計總體指標(biāo)數(shù)值。(3)抽樣調(diào)查中的抽樣誤差是不可避免的,事先是可以計算并加以控制的。第4頁,課件共63頁,創(chuàng)作于2023年2月6.1.1抽樣推斷的概念、特點和作用

3、抽樣推斷的作用(1)有些現(xiàn)象是無法進(jìn)行全面調(diào)查的,為了測算全面資料,必須采用抽樣調(diào)查的方法。(2)從理論上講,有些現(xiàn)象雖然可以進(jìn)行全面調(diào)查,但實際上沒有必要或很難辦到,也要采用抽樣調(diào)查。(3)抽樣調(diào)查的結(jié)果可以對全面調(diào)查的結(jié)果進(jìn)行檢查和修正。(4)抽樣調(diào)查可以用于工業(yè)生產(chǎn)過程的質(zhì)量控制。(5)利用抽樣調(diào)查原理,可以對某些總體的假設(shè)進(jìn)行檢驗,來判別這種假設(shè)的真?zhèn)?,依決定行動的取舍。第5頁,課件共63頁,創(chuàng)作于2023年2月6.1.2.1全及總體和抽樣總體1、全及總體也稱為總體或母體,是指所要認(rèn)識的研究對象的全體,它是由所研究范圍內(nèi)具有某種共同性質(zhì)的全體單位所組成的集合體。在本章用大寫的字母N代表全及總體的單位數(shù)。

2、抽樣總體就是按隨機(jī)原則從全及總體中抽取的一部分單位組成的小總體。抽樣總體簡稱樣本,它也是由許多性質(zhì)相同的單位組成的。本章中用小寫n代表樣本的單位數(shù),樣本單位數(shù)n也稱為樣本容量,即一個樣本中所包含的單位數(shù)。組成樣本的每個單位稱為樣本單位。注意:作為抽樣推斷對象的全及總體是唯一確定的,但作為觀察對象的樣本就不是唯一的。從一個全及總體中可以抽取很多個樣本,每次抽到哪個樣本是不確定的。第6頁,課件共63頁,創(chuàng)作于2023年2月6.1.2.2全及指標(biāo)和抽樣指標(biāo)

1、全及指標(biāo)又稱總體指標(biāo)或總體參數(shù)根據(jù)總體各單位的標(biāo)志值或標(biāo)志屬性計算的反映總體數(shù)量特征的綜合指標(biāo)稱為全及指標(biāo),又稱總體指標(biāo)。常用的全及指標(biāo)主要有四個:全及平均數(shù)、全及成數(shù)、總體數(shù)量標(biāo)志的標(biāo)準(zhǔn)差及方差、總體是非標(biāo)志的標(biāo)準(zhǔn)差及方差。

2、抽樣指標(biāo)又稱樣本指標(biāo)或樣本統(tǒng)計量根據(jù)樣本總體各單位標(biāo)志值計算的反映樣本特征的綜合指標(biāo)稱為抽樣指標(biāo),又稱樣本指標(biāo)或樣本統(tǒng)計量。它是用來估計總體參數(shù)的。與總體參數(shù)相對應(yīng),常用的抽樣指標(biāo)也有四個指標(biāo):抽樣平均數(shù)、抽樣成數(shù)、樣本數(shù)量標(biāo)志標(biāo)準(zhǔn)差及方差、樣本是非標(biāo)志標(biāo)準(zhǔn)差及方差。第7頁,課件共63頁,創(chuàng)作于2023年2月6.1.2.3樣本容量與樣本個數(shù)

1、樣本容量樣本是從總體中抽出的部分單位的集合,這個集合的大小稱為樣本容量,一般用n表示,它表明一個樣本中所包含的單位數(shù)。樣本容量大,樣本誤差會小,但調(diào)查費用必須增加,反之,樣本容量過小,又將導(dǎo)致抽樣誤差增大,甚至失去抽樣推斷的價值。樣本按照樣本容量的大小可以分為大樣本和小樣本。一般地說,n≥30為大樣本,n<30為小樣本。在對社會經(jīng)濟(jì)現(xiàn)象進(jìn)行抽樣調(diào)查時,多數(shù)采用大樣本。

2、樣本個數(shù)

樣本可能數(shù)目又稱樣本個數(shù),是指從全及總體中可能抽取多少個樣本。它既和每個樣本的容量有關(guān),也和抽樣的方法有關(guān)。當(dāng)樣本容量給定時,樣本的可能數(shù)目便由抽樣方法決定。第8頁,課件共63頁,創(chuàng)作于2023年2月

6.1.2.4重復(fù)抽樣和不重復(fù)抽樣

1、重復(fù)抽樣

重復(fù)抽樣是從全及總體中抽取樣本時,隨機(jī)抽取一個樣本單位,記錄該單位有關(guān)標(biāo)志表現(xiàn)以后,把它放回到全及總體中去,再從全及總體中隨機(jī)抽取第二個單位,記錄它有關(guān)標(biāo)志表現(xiàn)以后,也把它放回全及總體中去,照此下去直到抽選n個樣本單位。一般地說,從總體N個單位中,隨機(jī)重復(fù)抽取n個單位構(gòu)成樣本,則共有樣本個數(shù)為:N×N×N×…×N=Nn個??梢?,重復(fù)抽樣時全及總體單位數(shù)在抽選過程中始終沒有減少,而且各單位有被重復(fù)抽中的可能。

第9頁,課件共63頁,創(chuàng)作于2023年2月6.1.2.4重復(fù)抽樣和不重復(fù)抽樣

2、不重復(fù)抽樣

不重復(fù)抽樣是從全及總體中抽取第一個樣本單位,記錄該單位有關(guān)標(biāo)志表現(xiàn)后,這個樣本單位不再放回全及總體中參加下一次抽選。然后,從總體N-1個單位中隨機(jī)抽選第二個樣本單位,記錄了該單位有關(guān)標(biāo)志表現(xiàn)以后,該單位也不再放回全及總體中去,再從全及總體N-2單位中抽選第三個樣本單位,照此下去直到抽選出n個樣本單位。一般地說,要從總體N個單位中隨機(jī)不重復(fù)抽取n個單位為:N(N-1)(N-2)…(N-n+1)=N!/(N-n)!由此可見,在相同的樣本容量要求下,不重復(fù)抽樣的樣本總是比重復(fù)抽樣的樣本個數(shù)少.可見,不重復(fù)抽樣時,總體單位數(shù)在抽選過程中是逐漸減少的,而且各單位沒有重復(fù)被抽中可能。兩種抽樣方法會產(chǎn)生三個差別:①抽取的樣本可能數(shù)目不同;②抽樣誤差的計算公式不同;③抽樣誤差的大小不同。第10頁,課件共63頁,創(chuàng)作于2023年2月

6.1.3抽樣誤差

1、抽樣誤差的一般概念

抽樣誤差是指根據(jù)樣本數(shù)據(jù)計算而得的樣本統(tǒng)計量值與被它估計的未知的總體參數(shù)真值之間的偏差。具體地是指樣本平均數(shù)與總體平均數(shù)的差(-),,樣本成數(shù)p與總體成數(shù)P的差(p-P)。

2、影響抽樣誤差的因素

1)總體內(nèi)各單位被研究標(biāo)志的變異程度。

2)樣本容量的大小,即樣本單位數(shù)的多少。

3)抽樣的組織形式。

4)抽樣的方法。第11頁,課件共63頁,創(chuàng)作于2023年2月

對一個全及總體進(jìn)行抽樣調(diào)查時,可以抽出很多個樣本。而每一個樣本都可以計算抽樣的平均數(shù)和抽樣成數(shù),這樣,樣本的平均數(shù)與總體的平均數(shù),樣本的成數(shù)與總體的成數(shù)之間的誤差,也有多種多樣。因此,必須用抽樣平均誤差來反映抽樣誤差的一般水平。

抽樣平均誤差為抽樣平均數(shù)(或抽樣成數(shù))對總體平均數(shù)(或總體成數(shù))的標(biāo)準(zhǔn)差。為了區(qū)別于通常的標(biāo)準(zhǔn)差,我們分別用表示抽樣平均數(shù)的平均誤差,用表示抽樣成數(shù)的平均誤差。用M表示樣本的可能數(shù)目。則有:在實際中,作為總體的平均數(shù)和總體成數(shù)P是未知的。同時也不可能把所有樣本的平均數(shù)和成數(shù)都計算出來。所以,按照上述計算抽樣平均誤差的方法,實際上也是辦不到的。

6.1.3.3抽樣平均誤差第12頁,課件共63頁,創(chuàng)作于2023年2月6.1.3.3抽樣平均誤差A(yù)、抽樣平均數(shù)的抽樣平均誤差

a.在重復(fù)抽樣的條件下

(6-3)b.在不重復(fù)抽樣條件下

(6-4)第13頁,課件共63頁,創(chuàng)作于2023年2月6.1.3.3抽樣平均誤差B、抽樣成數(shù)的抽樣平均誤差

a.在重復(fù)抽樣的條件下

(6-5)b.在不重復(fù)抽樣的條件下

(6-6)第14頁,課件共63頁,創(chuàng)作于2023年2月6.1.3.4抽樣極限誤差

抽樣平均誤差是所有可能樣本指標(biāo)與總體指標(biāo)之間的平均離差。但是在進(jìn)行抽樣推斷時,我們實際只抽取一個樣本,用一個樣本指標(biāo)去推斷總體指標(biāo)。由于抽樣是按隨機(jī)原則進(jìn)行的,所有不同的樣本組合都可能抽到,這樣所得到的每個樣本實際誤差可能大于抽樣平均誤差,也可能小于抽樣平均誤差,因此包括在抽樣平均誤差范圍內(nèi)的只有一部分樣本,而不是所有的樣本組合。但對于某一項調(diào)查來說,根據(jù)客觀要求一般應(yīng)有一個允許的誤差范圍,也就是說若抽樣誤差在這個范圍之內(nèi)就認(rèn)為是可行的。這一允許的誤差范圍就稱作抽樣的極限誤差。

抽樣極限誤差是抽樣指標(biāo)與總體指標(biāo)之間,在一定概率保證程度下的,抽樣誤差的最大可能范圍??傮w指標(biāo)雖然是一個確定的量,但它是未知的,而樣本指標(biāo)是一個隨機(jī)變量,其取值是不定的,它是圍繞著總體指標(biāo)左右變動的,因此,我們只能在一定的概率保證程度下,用一定的范圍來控制誤差。第15頁,課件共63頁,創(chuàng)作于2023年2月6.1.3.4抽樣極限誤差

通常用Δ表示抽樣極限誤差,設(shè)Δx和Δp分別表示抽樣平均數(shù)和抽樣成數(shù)的可能誤差范圍,則有:

Δx=|-|(6-7)Δp=|p-P|(6-8)

根據(jù)概率論數(shù)理統(tǒng)計原理,樣本平均數(shù)和樣本成數(shù)分別漸進(jìn)地服從于N(X,)和N(P,p(1-p))的正態(tài)分布。因此有:

P{|-|≤2·}=0.9545P{|p-P|≤2·}=0.9545

即抽樣極限誤差在2倍的抽樣平均誤差范圍內(nèi)的可能性為95.45%。也就是說,我們有95.45%的可靠性程度來判斷,樣本指標(biāo)與總體指標(biāo)之間的誤差不超過2或者2。

第16頁,課件共63頁,創(chuàng)作于2023年2月6.1.3.4抽樣極限誤差

抽樣極限誤差的計算公式為:

Δ=t·μ(6-9)

即有:

Δx=t·(6-10)Δp=t·(6-11)

式中的t表示極限誤差范圍為抽樣平均誤差的若干倍,t稱為概率度。第17頁,課件共63頁,創(chuàng)作于2023年2月

6.1.3.5抽樣估計的置信度

抽樣極限誤差的估計總是要和一定的概率保證程度聯(lián)系在一起的。因為既然抽樣誤差是一個隨機(jī)變量,我們就不能期望抽樣平均數(shù)(成數(shù))落在一個區(qū)間內(nèi)是一個必然事件,而只能給予一定的概率保證程度。所以在進(jìn)行抽樣估計時,不但要考慮抽樣誤差的可能范圍有多大,而且還必須考慮到落在這一范圍內(nèi)的概率有多少。前者我們稱為抽樣估計的精確程度,后者則是抽樣估計的可靠程度,也是在概率上的保證程度問題。我們稱之為抽樣估計的置信度。

抽樣估計的置信度和抽樣的極限誤差有著密切聯(lián)系。根據(jù)中心極限定理,當(dāng)抽樣誤差范圍增大時,抽樣估計的置信度也增大,抽樣估計的精確程度則降低,反之亦然。實質(zhì)上,抽樣估計的精確度與置信度是一對反方向運動的矛盾??茖W(xué)的調(diào)查方法要合理地協(xié)調(diào)它們之間的矛盾。第18頁,課件共63頁,創(chuàng)作于2023年2月6.1.4抽樣調(diào)查的理論依據(jù)

抽樣調(diào)查是建立在概率論大數(shù)定律基礎(chǔ)上的。大數(shù)定律的一系列定理為抽樣調(diào)查提供了數(shù)學(xué)依據(jù)。

大數(shù)定律是闡明大量隨機(jī)現(xiàn)象平均結(jié)果的穩(wěn)定性的一系列定理的總稱。它說明如果被研究的總體是由大量的相互獨立的隨機(jī)因素所構(gòu)成,而且每個因素對總體的影響都相對的小。那么將這些大量因素加以平均,因素的個別影響將相互抵消,而呈現(xiàn)出共同作用的影響,使總體具有穩(wěn)定的性質(zhì)。第19頁,課件共63頁,創(chuàng)作于2023年2月6.2抽樣分布6.2.1樣本空間

6.2.2重復(fù)抽樣分布

6.2.3不重復(fù)抽樣分布第20頁,課件共63頁,創(chuàng)作于2023年2月6.2.1樣本空間

樣本分布就是樣本統(tǒng)計量的概率分布,在一個抽樣框里可以抽取多套樣本,組成樣本空間,每一個樣本空間可以構(gòu)造出多個統(tǒng)計量,如樣本均值、樣本成數(shù)、樣本方差等。由隨機(jī)抽樣抽到的各個樣本單位不同,其數(shù)據(jù)表現(xiàn)不同,統(tǒng)計量的取值也不同。在同一個總體中抽出樣本容量相同的所有可能樣本后,計算每個樣本統(tǒng)計量的值和相應(yīng)的概率,就組成樣本統(tǒng)計量的概率分布,簡稱抽樣分布。在進(jìn)行隨機(jī)抽樣時,按樣本抽取方法的不同,可分為放回的重復(fù)抽樣和不放回的不重復(fù)抽樣,從而形成重復(fù)抽樣的樣本分布和不重復(fù)抽樣的樣本分布。第21頁,課件共63頁,創(chuàng)作于2023年2月6.2.2重復(fù)抽樣分布

1、樣本平均數(shù)的抽樣分布

樣本平均數(shù)分布是由所有組合樣本平均數(shù)的值與其相應(yīng)的概率表示。

[例6-5]某工作班組有4個工人,其小時工資分別為1、2、3、4元,則:總體平均數(shù):總體方差:第22頁,課件共63頁,創(chuàng)作于2023年2月

現(xiàn)用重復(fù)抽樣的方法從4人中隨機(jī)抽取2人樣本,用樣本的平均工資來推斷總體的平均工資。按重復(fù)抽樣所組成的樣本平均數(shù)的空間分布列表如下:表6-1重復(fù)抽樣樣本小時平均工資組合(單位:元)樣本變量值123411.01.52.02.521.52.02.53.032.02.53.03.542.53.03.54.0第23頁,課件共63頁,創(chuàng)作于2023年2月

根據(jù)上表整理的樣本頻數(shù)分布及樣本統(tǒng)計量,計算如下:

表6-2樣本均值及頻數(shù)分布樣本均值()

頻數(shù)()111-1.52.252.251.523-112236-0.50.250.752.54100003390.50.250.753.5271124141.52.252.25合計1640——10第24頁,課件共63頁,創(chuàng)作于2023年2月

根據(jù)以上資料,計算樣本平均數(shù)的數(shù)學(xué)期望和抽樣方差如下:抽樣方差的開平方即為抽樣誤差,用符號μ表示,

重復(fù)抽樣的樣本統(tǒng)計量與總體參數(shù)之間存在的關(guān)系:

1、重復(fù)抽樣的樣本平均數(shù)的數(shù)學(xué)期望(樣本總平均數(shù))恒等于總體平均數(shù)。即

2、隨機(jī)變量的抽樣方差等于總體方差的1/n,即即第25頁,課件共63頁,創(chuàng)作于2023年2月6.2.2重復(fù)抽樣分布2、抽樣成數(shù)的抽樣分布成數(shù)是指具有某種特征現(xiàn)象的數(shù)量占總體數(shù)量的比重,則現(xiàn)用重復(fù)抽樣方法抽取n個單位,計算樣本成數(shù)p,應(yīng)用樣本平均數(shù)分布的性質(zhì)推廣到成數(shù)的分布,則有

其方差(6-14)(6-15)第26頁,課件共63頁,創(chuàng)作于2023年2月6.2.3不重復(fù)抽樣分布1.樣本平均數(shù)的抽樣分布

[例6-7]仍用前述的例子,按不重復(fù)抽樣所組成的樣本平均數(shù)的空間分布如下:表6-3不重復(fù)抽樣的樣本小時平均工資組合樣本變量值12341—1.522.521.5—2.53322.5—3.542.533.5—第27頁,課件共63頁,創(chuàng)作于2023年2月根據(jù)上表整理的樣本頻數(shù)分布及樣本統(tǒng)計量計算如下:表6-4樣本均值及頻數(shù)分布樣本均值()頻數(shù)()1.523-112224-0.50.250.52.541000033260.50.250.53.527112合計1230——5第28頁,課件共63頁,創(chuàng)作于2023年2月

根據(jù)以上資料,計算樣本平均數(shù)和抽樣方差如下:

不重復(fù)抽樣的樣本統(tǒng)計量與總體參數(shù)之間存在的關(guān)系:

1、不重復(fù)抽樣的樣本平均數(shù)的數(shù)學(xué)期望(樣本總平均數(shù))恒等于總體平均數(shù)即

2、樣本變量的抽樣方差等于總體方差的1/n,再乘以一個不重復(fù)抽樣時的調(diào)節(jié)系數(shù)(N-n)/(N-1)即

不重復(fù)抽樣與重復(fù)抽樣相比,其抽樣方差多了一個調(diào)節(jié)系數(shù):(N-n)/(N-1)≈(N-n)/N=(1-n/N)

由此可見不重復(fù)抽樣的抽樣方差都是比重復(fù)抽樣的抽樣方差小。

第29頁,課件共63頁,創(chuàng)作于2023年2月6.2.3不重復(fù)抽樣分布2、抽樣成數(shù)的抽樣分布

不重復(fù)抽樣的成數(shù)統(tǒng)計量,比照前述的公式,有:

[例6-8]引用前述例子,在不重復(fù)抽樣情況下,產(chǎn)品合格率的抽樣平均誤差為:(N=10000)

上述計算也可看出,當(dāng)N相對n很大時,不重復(fù)抽樣的抽樣誤差與重復(fù)抽樣的抽樣誤差很接近。第30頁,課件共63頁,創(chuàng)作于2023年2月

在重復(fù)抽樣和不重復(fù)抽樣的情況下,抽樣平均數(shù)和抽樣成數(shù)的抽樣平均誤差的公式列表表6-5抽樣平均誤差公式統(tǒng)計量重復(fù)抽樣不重復(fù)抽樣抽樣平均數(shù)抽樣成數(shù)第31頁,課件共63頁,創(chuàng)作于2023年2月6.3總體參數(shù)估計6.3.1總體參數(shù)估計概述

6.3.2總體參數(shù)的點估計

6.3.3總體參數(shù)的區(qū)間估計

6.3.4樣本容量的確定

6.3.5使用計算公式求必要樣本容量時應(yīng)注意的問題第32頁,課件共63頁,創(chuàng)作于2023年2月6.3.1總體參數(shù)估計概述

總體參數(shù)估計就是用樣本統(tǒng)計量去估計未知的總體參數(shù)。總體參數(shù)是一個常量,樣本統(tǒng)計量是一個隨機(jī)變量,用樣本統(tǒng)計量去估計總體參數(shù)時,必然會產(chǎn)生一個隨機(jī)誤差??傮w參數(shù)估計有兩種方法:點估計和區(qū)間估計。

點估計:即直接用樣本統(tǒng)計量的值直接估計總體參數(shù)的值。

區(qū)間估計:即用樣本統(tǒng)計量去估計總體參數(shù)的值時存在的誤差范圍有多大,它要解決的是估計的精確度問題,誤差范圍越小,其估計的精確程度也就越高。同時還要考慮可靠性問題,即參數(shù)估計的正確性概率有多大。

在進(jìn)行參數(shù)估計時,應(yīng)根據(jù)所要解決問題的重要性和工作需要,綜合考慮參數(shù)估計的精確度(可允許的誤差區(qū)間,亦稱置信區(qū)間)和可接受的估計概率(置信概率)。

精確度和精確程度是一對矛盾。第33頁,課件共63頁,創(chuàng)作于2023年2月6.3.2總體參數(shù)的點估計

點估計又稱定值估計,它是直接用樣本統(tǒng)計量的值來估計總體參數(shù)的值,其特點是簡易直觀,但它并不考慮估計的誤差范圍和估計的可靠程度。第34頁,課件共63頁,創(chuàng)作于2023年2月6.3.2.1點估計的三個優(yōu)良標(biāo)準(zhǔn)

1、無偏性。即樣本統(tǒng)計量的值的數(shù)字期望(平均數(shù))等于被估計的總體參數(shù),用符號表示為。2、一致性。即隨著樣本單位n的不斷增大,樣本統(tǒng)計量的值與被估計總體參數(shù)的值之間的誤差越來越小,亦即原本統(tǒng)計量的值接近總體參數(shù)的值的可能性越來越大。

一致性要求可以從大數(shù)定律的角度來理解,用公式表示:公式中為任意小的一個數(shù)。上式公式表明,樣本統(tǒng)計量與總體參數(shù)之間差的絕對值小于一個任意小的數(shù),當(dāng)n趨于無窮大時,其發(fā)生的概率是肯定存在的,或者說這一事實肯定會發(fā)生的。3、有效性。即作為優(yōu)良估計量的方差應(yīng)該比其它方差小。

例如,用隨機(jī)抽樣計算的統(tǒng)計量的值與用非隨機(jī)抽樣計算的統(tǒng)計量的值,分別估計總體參數(shù)的值,因為隨機(jī)抽樣的誤差更小,則前者的估計比后者更有效。又如,用隨機(jī)抽樣統(tǒng)計量的樣本平均數(shù)和中位數(shù)分別估計總體參數(shù)的值,由于樣本平均數(shù)的抽樣誤差更小,則用前者的估計比后者更有效。第35頁,課件共63頁,創(chuàng)作于2023年2月6.3.2.2矩估計法

矩估計法也稱數(shù)字特征法。它是用樣本各階原點矩的函數(shù)來估計總體各階原點矩的同一個函數(shù),相應(yīng)的總體估計量稱為矩估計量。

“矩”又稱為“動量”,它本來是一個物理學(xué)中力學(xué)的概念,表示作用力、力臂和與其平衡點之間的數(shù)量關(guān)系。統(tǒng)計學(xué)借用“矩”這概念,通過計算一系列“矩”指數(shù)的數(shù)值來描述數(shù)據(jù)的分布特征。算術(shù)平均數(shù)、方差及平均差等都可以看成是“矩”的特例。第36頁,課件共63頁,創(chuàng)作于2023年2月矩的表現(xiàn)形式或

當(dāng)取

時,其一階原點的矩就是算術(shù)平均數(shù)。當(dāng)取時,其二階矩就是變量分布的方差。當(dāng)取時,其一階矩的絕對離差之和就是變量分布的平均差。通過樣本數(shù)量特征的計算來估計與之相應(yīng)的總體數(shù)量特征是最常用的矩估計法。第37頁,課件共63頁,創(chuàng)作于2023年2月6.3.2.2順序統(tǒng)計量法

順序統(tǒng)計量即是前面有關(guān)章節(jié)已講過的位置平均數(shù)的統(tǒng)計量,它用中位數(shù)來表示。樣本中位數(shù)和極差R都是重要的統(tǒng)計量。當(dāng)樣本數(shù)值中含有極端數(shù)值時,樣本中位數(shù)比平均數(shù)更適宜作為總體參數(shù)值的統(tǒng)計量,計算更簡便直觀。第38頁,課件共63頁,創(chuàng)作于2023年2月對于正態(tài)總體的樣本中位數(shù)漸進(jìn)地服從正態(tài)分布因而對于正態(tài)總體,用估計總體是適宜的。對于總體標(biāo)準(zhǔn)差的估計,可以用樣本極差來估計。與R有如下關(guān)系:一般情況下,可近似地取為:用樣本極差R來估計總體標(biāo)準(zhǔn)差時,其缺點是不如用樣本標(biāo)準(zhǔn)差來得可靠,當(dāng)n越大,兩者差別越大。當(dāng)n>10時,可直接用樣本標(biāo)準(zhǔn)差來估計總體標(biāo)準(zhǔn)差。(6-20)第39頁,課件共63頁,創(chuàng)作于2023年2月6.3.3總體參數(shù)的區(qū)間估計

區(qū)間估計是指由樣本統(tǒng)計量的值來估計總體未知參數(shù)的值的時候,其誤差的區(qū)間范圍有多大,并給出可靠程度的估計概率。在正態(tài)分布的情況下,估計概率(亦稱置信概率)是由概率度(置信度)和相應(yīng)的概率函數(shù)來表示,常用的數(shù)值如下(雙側(cè)):

表6-6在正態(tài)分布下估計概率常用數(shù)值

,概率度

11.6451.9622.583概率函數(shù),0.68270.900.950.95450.990.9973顯著性水平

——0.100.05——0.01——第40頁,課件共63頁,創(chuàng)作于2023年2月正態(tài)分布圖在進(jìn)行區(qū)間估計時,根據(jù)研究目的和數(shù)據(jù)分布的特征,給定估計的概率保證程度(概率度)來推算抽樣誤差范圍,或根據(jù)給定的允許誤差范圍(亦稱極限誤差)來推斷相應(yīng)的概率保證程度。第41頁,課件共63頁,創(chuàng)作于2023年2月抽樣極限誤差、抽樣平均誤差和概率度三者之間有如下關(guān)系:抽樣極限誤差=概率度×抽樣平均誤差重復(fù)抽樣:

(6-21)不重復(fù)抽樣:

(6-22)

第42頁,課件共63頁,創(chuàng)作于2023年2月6.3.3.1總體平均數(shù)的區(qū)間估計1、總體方差已知時當(dāng)總體方差已知,或樣本容量n充分大(n≥30)時,樣本數(shù)據(jù)可用正態(tài)分布的概率來估計。2、總體方差未知時當(dāng)總體服從正態(tài)分布但總體方差未知時,可用樣本標(biāo)準(zhǔn)差s來代替總體標(biāo)準(zhǔn)差,但這要應(yīng)用t分布的統(tǒng)計量進(jìn)行總體參數(shù)的區(qū)間估計。同時,樣本容量是小樣本(n<30)時,也要應(yīng)用t統(tǒng)計量。其區(qū)間估計的公式為:重復(fù)抽樣:

(6-23)不重復(fù)抽樣:

(6-24)第43頁,課件共63頁,創(chuàng)作于2023年2月

[例6-9]某地區(qū)從10000畝水稻面積中,以不重復(fù)抽樣方法隨機(jī)

抽取100畝耕地進(jìn)行調(diào)查,實測計算平均畝產(chǎn)600公斤,標(biāo)準(zhǔn)差為72.6公斤,求(1)以0.9973的概率可靠程度進(jìn)行其平均畝產(chǎn)和總產(chǎn)量的區(qū)間估計。(2)若要求極限誤差不超過14.4公斤,則其估計的概率可靠程度是多少?

解:已知公斤,公斤,N=10000畝,n=100畝,,,Δ=14.4公斤抽樣平均誤差:(公斤)抽樣極限誤差:(公斤)平均產(chǎn)量的區(qū)間估計(公斤)總產(chǎn)量的區(qū)間估計(萬公斤)

當(dāng)公斤時,,則第44頁,課件共63頁,創(chuàng)作于2023年2月

[例6-10]對某電視節(jié)目進(jìn)行收視率調(diào)查,在隨機(jī)抽樣調(diào)查的100人中,有20人經(jīng)??丛摴?jié)目,求該電視節(jié)目收視率的置信度為95%的估計區(qū)間?

解:已知

抽樣平均誤差:

抽樣極限誤差:估計區(qū)間:

即該電視節(jié)目的收視率在12.16%到27.84%之間。第45頁,課件共63頁,創(chuàng)作于2023年2月[例6-11]某企業(yè)對一批10000件產(chǎn)品進(jìn)行質(zhì)量檢驗,以不重復(fù)抽樣方法隨機(jī)抽取100件產(chǎn)品進(jìn)行檢驗,發(fā)現(xiàn)其中有3件廢品,請以90%的置信概率估計這批產(chǎn)品的廢品率?解:已知

抽樣平均誤差:抽樣極限誤差:

估計區(qū)間:

即該批產(chǎn)品的廢品率在0.21%到5.79%之間。第46頁,課件共63頁,創(chuàng)作于2023年2月6.3.4樣本容量的確定

樣本容量的確定就是在已知估計的置信概率、允許的誤差區(qū)間及樣本標(biāo)準(zhǔn)差的情況下,推出必要的樣本容量。第47頁,課件共63頁,創(chuàng)作于2023年2月6.3.4.1抽樣平均數(shù)的樣本容量

1、重復(fù)抽樣的樣本容量

2、不重復(fù)抽樣的樣本容量

第48頁,課件共63頁,創(chuàng)作于2023年2月6.3.4.2抽樣成數(shù)的樣本容量

1、重復(fù)抽樣成數(shù)的樣本容量2、不重復(fù)抽樣成數(shù)的樣本容量

第49頁,課件共63頁,創(chuàng)作于2023年2月[例6-12]某地區(qū)開展城鎮(zhèn)居民的家計調(diào)查,從歷史資料得知該市居民的人均年收入的標(biāo)準(zhǔn)差為3000元,家庭消費中食品支出占總支出(恩格爾系數(shù))的50%,要在95.45%的概率保證下,平均收入的極限誤差不超過300元,恩格爾系數(shù)的極限誤差不超過4%,求必要的樣本數(shù)?(假設(shè)該城鎮(zhèn)有10000戶居民家庭)第50頁,課件共63頁,創(chuàng)作于2023年2月A:求人均收入的必要樣本容量

解:在重復(fù)抽樣的條件下:=(戶)在不重復(fù)抽樣的條件下:(戶)第51頁,課件共63頁,創(chuàng)作于2023年2月

B:求樣本成數(shù)的必要樣本容量

在重復(fù)抽樣的條件下:(戶)在不重復(fù)抽樣的條件下:(戶)從上述兩種調(diào)查目的要求來看,在重復(fù)抽樣的條件下,至少要抽取625戶城鎮(zhèn)居民進(jìn)行調(diào)查;在不重復(fù)抽樣的條件下,至少要抽取589戶城鎮(zhèn)居民進(jìn)行調(diào)查。第52頁,課件共63頁,創(chuàng)作于2023年2月

6.3.5使用計算公式求必要樣本容量時應(yīng)注意的問題

1.當(dāng)調(diào)查對象總體的方差和成數(shù)未知時,可用有關(guān)資料替代:1)使用歷史資料;2)使用相同條件同類現(xiàn)象的資料;3)在正式調(diào)查前進(jìn)行若干次試調(diào)查,用試調(diào)查中的方差最大值來代替總體方差;4)當(dāng)成數(shù)方差未知時,取成數(shù)方差最大值0.25代替。

2.通過計算得出小數(shù)的數(shù)值,不能適用四舍五入的法則,不管小數(shù)的值大小如何都應(yīng)該入,而湊成一個整數(shù)。

3.當(dāng)有兩種調(diào)查目的時,分別計算平均數(shù)和成數(shù)的必要樣本容量,可取一個較大的樣本容量值來同時滿足兩種調(diào)查目的的需要。第53頁,課件共63頁,創(chuàng)作于2023年2月

6.4抽樣組織形式和誤差估計

6.4.1純隨機(jī)抽樣(簡單隨機(jī)抽樣)6.4.2分層(類型)抽樣6.4.3系統(tǒng)(等距)抽樣6.4.4整群抽樣6.4.5多(二)階段抽樣第54頁,課件共63頁,創(chuàng)作于2023年2月6.4抽樣組織形式和誤差估計抽樣組織形式有純隨機(jī)抽樣、分層(類型)抽樣、系統(tǒng)(等距)抽樣、整群抽樣和二(多)階抽樣。評價多種抽樣組織形式的抽樣效果關(guān)鍵是對抽樣誤差的控制。抽樣誤差越小,則抽樣效果也越好。第55頁,課件共63頁,創(chuàng)作于2023年2月影響抽樣誤差的幾個影響因素

1、總體單位標(biāo)志值的變異性,變異越大,則方差越大,抽樣誤差也越大;2、樣本容量,抽取的樣本單位數(shù)越多,抽樣誤差越小;3、抽樣方法,不重復(fù)抽樣的誤差比重復(fù)抽樣的小,但總體單位數(shù)N與樣本單位數(shù)n相比較很大時,抽樣比n/N很小時,兩種抽樣方法的抽樣誤差很接近,有時也可用重復(fù)抽樣的誤差代替不重復(fù)抽樣的誤差;4、抽樣的組織形式,嚴(yán)格來講,純隨機(jī)抽樣形式是最符合概率抽樣理論,其它各種形式的抽樣計算的抽樣誤差都應(yīng)該與純隨機(jī)抽樣誤差進(jìn)行對比,若前者小于后者,則說明該形式的抽樣效果更好。第56頁,課件共63頁,創(chuàng)作于2023年2月6.4抽樣組織形式和誤差估計

考慮抽樣效果,同時還得考慮抽樣調(diào)查的成本費用問題??己顺闃有Ч幸粋€很重要的原則:在既定調(diào)查費用的情況下,抽樣誤差越小越好;在既定的抽樣誤差范圍控制的情況下,調(diào)查費用越少越好。調(diào)查費用包括:固定費用、調(diào)查方案設(shè)計費用,調(diào)查實施費用,辦公費用及數(shù)據(jù)處理費用等。對一個抽樣設(shè)計而言,并不是抽樣誤差越

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論