統(tǒng)計學基礎課件(抽樣推斷)_第1頁
統(tǒng)計學基礎課件(抽樣推斷)_第2頁
統(tǒng)計學基礎課件(抽樣推斷)_第3頁
統(tǒng)計學基礎課件(抽樣推斷)_第4頁
統(tǒng)計學基礎課件(抽樣推斷)_第5頁
已閱讀5頁,還剩169頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第六章抽樣推斷第六章抽樣推斷

教學目的與要求:抽樣估計是抽樣調查的繼續(xù),它提供了一套利用抽樣資料來估計總體數(shù)量特征的方法。通過本章的學習,要理解和掌握抽樣估計的概念、特點,抽樣誤差的含義、計算方法,抽樣估計的置信度,推斷總體參數(shù)的方法,能結合實際資料進行抽樣估計。

本章主要內容抽樣推斷概述抽樣誤差抽樣估計的方法樣本容量的確定本章主要內容抽樣推斷概述抽樣誤差抽樣估計的方法樣本一、抽樣推斷的概念和特點

概念

抽樣推斷是在抽樣調查的基礎上,用樣本實際資料計算樣本指標,并據(jù)以推算總體相應的數(shù)量特征的一種統(tǒng)計分析方法。第一節(jié)抽樣推斷概述一、抽樣推斷的概念和特點概念抽樣推斷是在抽樣調特點

它是由部分推斷整體的一種認識方法。

抽樣推斷建立在隨機取樣的基礎上。

抽樣推斷運用概率估計的方法。

抽樣推斷的誤差可以事先計算并加以控制。特點它是由部分推斷整體的一種認識方法。抽樣推斷二、抽樣推斷的一些基本概念(一)總體和樣本總體:

又稱全及總體。指所要認識的研究對象全體??傮w單位總數(shù)用“N”表示,N總是很大的數(shù)

。對于一個總體來說,若被研究的標志系品質標志,則將這個總體稱為屬性總體;若被研究的標志系數(shù)量標志,則將這個總體稱為變量總體。二、抽樣推斷的一些基本概念(一)總體和樣本總體:樣本:

又稱子樣或抽樣總體,簡稱樣本。是從全及總體中隨機抽取出來,作為代表這一總體的那部分單位組成的集合體。樣本單位總數(shù)用“n”表示。相對N來說,n是很小的數(shù),它可以是N的幾十分之一、幾百分之一、幾千分之一、幾萬分之一。(一般來說,樣本單位數(shù)達到或超過30個稱為大樣本,而在30個以下稱為小樣本。社會經(jīng)濟現(xiàn)象的抽樣調查多取大樣本)樣本:又稱子樣或抽樣總體,簡稱樣本。是從全及總體中隨機抽(二)總體指標和樣本指標

總體指標是根據(jù)總體中各單位的標志值或標志屬性計算的,反映總體數(shù)量特征的綜合指標。

參數(shù)研究總體中的數(shù)量標志總體平均數(shù)總體標準差X=∑XNX=∑XF∑F研究總體中的品質標志總體成數(shù)成數(shù)標準差P=

N1N(只有兩種表現(xiàn))(二)總體指標和樣本指標總體指標是根據(jù)總樣本指標是根據(jù)樣本各單位標志值或標志屬性計算的綜合指標。研究數(shù)量標志

樣本平均數(shù)

x=∑xnx=∑xf∑f樣本標準差研究品質標志樣本成數(shù)

成數(shù)標準差

np=n樣本指標是根據(jù)樣本各單位標志值或標志屬性研究數(shù)樣本平均數(shù)x(三)樣本容量和樣本個數(shù)樣本容量:一個樣本包含的單位數(shù)。用“n”表示。一般要求n≥30樣本個數(shù):從一個全及總體中可能抽取的樣本數(shù)目。(三)樣本容量和樣本個數(shù)樣本容量:一個樣本包含的單位數(shù)。用(四)重復抽樣和不重復抽樣重復抽樣:又稱回置抽樣。不重復抽樣:又稱不回置抽樣??赡芙M成的樣本數(shù)目:N(N-1)(N-2)……(N-n+1)可能組成的樣本數(shù)目:nN(四)重復抽樣和不重復抽樣重復抽樣:又稱回置抽樣。不重復抽樣從A、B、C、D四個單位中,抽出兩個單位構成一個樣本,問可能組成的樣本數(shù)目是多少?重復抽樣AAACADBABBBCBDABCACBCCCDDADBDCDDNn=42=16(個樣本)例如從A、B、C、D四個單位中,抽出兩個單位構成重復抽樣AAAC不重復抽樣N(N-1)(N-2)…….4×3=12(個樣本)不重復抽樣N(N-1)(N-2)…….4×3=12(個樣一、抽樣誤差的含義

抽樣誤差是指按隨機原則抽樣時,在沒有登記誤差和系統(tǒng)性誤差的條件下,單純由于隨機抽樣的偶然因素使樣本各單位的結構不足以代表總體各單位的結構,而引起的樣本指標與總體指標之間的離差。在抽樣中誤差的來源有許多方面。

第二節(jié)抽樣誤差一、抽樣誤差的含義抽樣誤差是指按隨機原則抽樣

另一類是代表性誤差,即樣本各單位的結構不足以代表總體而引起的誤差。

其中一類是登記性誤差,即在調查過程中由于觀察、測量、登記、計算上的差錯所引起的誤差,這類誤差是所有統(tǒng)計調查都可能發(fā)生的。

另一類是代表性誤差,即樣本各單位的結構不足以代表總另一種情況是,即使遵守隨機原則,由于被抽選的樣本有各種各樣,只要被抽中的樣本其內部各單位被研究標志的構成比例和總體有所出入,就會出現(xiàn)或大或小的偶然性代表性誤差。代表性誤差的發(fā)生有以下兩種情況:一種是由于違反抽樣調查的隨機原則,如有意地多選較好的單位或較壞的單位進行調查。這樣做,所據(jù)以計算的抽樣指標必然出現(xiàn)偏高或偏低現(xiàn)象,造成系統(tǒng)性的誤差。系統(tǒng)性誤差和登記性誤差都是不應當發(fā)生的,是可以也應該采取措施避免發(fā)生或將其減小到最小限度。另一種情況是,即使遵守隨機原則,由于被抽選的樣本有各種各樣

我們所講的抽樣誤差就是指這種偶然性代表性誤差。即按隨機原則抽樣時,在沒有登記性誤差和系統(tǒng)性誤差的條件下單純由于不同的隨機樣本得出不同估計量而產生的誤差。抽樣誤差是抽樣調查所固有的,是無法避免與消除的,但可以運用數(shù)學方法計算其數(shù)量界限,并通過抽樣設計程序控制其范圍,所以這種抽樣誤差也稱為可控制誤差。需要指出,抽樣誤差不是固定不變的數(shù),它的數(shù)值是隨樣本不同而變化的,所以它也是隨機變量。我們所講的抽樣誤差就是指這種偶然性代表性誤差。即按隨二、抽樣誤差的表現(xiàn)形式

(一)抽樣實際誤差

抽樣實際誤差是指在一次具體的抽樣調查中,由隨機因素引起的樣本指標與總體指標之間的離差。如樣本平均數(shù)與總體平均數(shù)之間的絕對離差,樣本成數(shù)與總體成數(shù)之間的絕對離差。但是,在抽樣中,由于總體指標數(shù)值是未知的,因此,抽樣實際誤差是無法計算的。同時,抽樣實際誤差僅僅是一系列可能出現(xiàn)的誤差數(shù)值之一,因此,抽樣實際誤差沒有概括所有可能產生的抽樣誤差。二、抽樣誤差的表現(xiàn)形式(一)抽樣實際誤差抽樣實際誤(二)抽樣平均誤差

抽樣平均誤差是抽樣平均數(shù)或抽樣成數(shù)的標準差,反映了抽樣指標與總體指標的平均誤差程度。(二)抽樣平均誤差抽樣平均誤差是抽

抽樣平均誤差的計算公式抽樣平均數(shù)的平均誤差抽樣成數(shù)平均誤差實際上,利用上述兩個公式是計算不出抽樣平均誤差的。想一想,為什么?M表示全部可能的樣本數(shù)目抽樣平均誤差的計算公式抽樣平均數(shù)抽

該公式表明了抽樣平均誤差的意義。但是當總體單位數(shù)較大,而抽取的樣本單位數(shù)也較大時,樣本可能數(shù)目就非常大。即使求出樣本可能數(shù)目,上述公式仍然不適用,這是因為,在該公式中出現(xiàn)了總體平均數(shù)。這也正是抽樣調查所要推算出的數(shù)值,實踐中是不知道的。

該公式表明了抽樣平均誤差的意義。但是當總體單位數(shù)較大抽樣平均數(shù)平均誤差的計算方法采用重復抽樣:采用不重復抽樣:我們把式子叫做修正因子。不難看出當N較大時,與的計算結果是十分接近。因此,當N較大時在不重復抽樣條件計算抽樣平均誤差的公式可采用時抽樣平均數(shù)平均誤差的計算方法采用重復抽樣:采用不重復抽樣:我

隨機抽選某校學生100人,調查他們的體重。得到他們的平均體重為58公斤,標準差為10公斤。問抽樣推斷的平均誤差是多少?即:當根據(jù)樣本學生的平均體重估計全部學生的平均體重時,抽樣平均誤差為1公斤。已知:則:n=100σ=10x=58例題1隨機抽選某校學生100人,調查他們的體重。得到他們的平已知:則:N=2000n=400σ=300=4800

某廠生產一種新型燈泡共2000只,隨機抽出400只作耐用時間試驗,測試結果平均使用壽命為4800小時,樣本標準差為300小時,求抽樣推斷的平均誤差?重復抽樣不重復抽樣已知:則:N=2000n=400σ=300=4800某抽樣成數(shù)平均誤差的計算方法采用重復抽樣:采用不重復抽樣:抽樣成數(shù)平均誤差的計算方法采用重復抽樣:采用不重復抽樣:

某校隨機抽選400名學生,發(fā)現(xiàn)戴眼鏡的學生有80人。根據(jù)樣本資料推斷全部學生中戴眼鏡的學生所占比重時,抽樣誤差為多大?已知:則:樣本成數(shù)例題3某校隨機抽選400名學生,發(fā)現(xiàn)戴眼鏡的學生有

一批食品罐頭共60000桶,隨機抽查300桶,發(fā)現(xiàn)有6桶不合格,求合格品率的抽樣平均誤差?已知:例題3一批食品罐頭共60000桶,隨機抽查300桶,發(fā)現(xiàn)有則:樣本合格率則:樣本合格率(二)影響抽樣誤差大小的因素 1、樣本單位數(shù)的多少 2、受總體標準差的影響3、抽樣方法 4、抽樣調查的組織形式(二)影響抽樣誤差大小的因素 含義:

抽樣極限誤差是指樣本指標和總體指標之間抽樣誤差的可能范圍。由于總體指標是一個確定的數(shù),而樣本指標則是圍繞著總體指標左右變動的量,它與總體指標可能產生正離差,也可能產生負離差,樣本指標變動的上限或下限與總體指標之差的絕對值就可以表示抽樣誤差的可能范圍,我們將這種以絕對值形式表示的抽樣誤差可能范圍稱為抽樣極限誤差。

計算方法:它等于樣本指標可允許變動的上限或下限與總體指標之差的絕對值。(三)抽樣極限誤差含義:抽樣極限誤差是指樣本指標和總體指標之間抽樣誤差的=Δp│p-P│p-Δ≤P≤p+ΔPp抽樣平均數(shù)極限誤差:抽樣成數(shù)極限誤差:≤≤=Δp│p-P│p-Δ≤P≤p+ΔP

什么是抽樣估計的置信度?

抽樣估計的置信度就是表明抽樣指標和總體指標的誤差不超過一定范圍的概率保證程度。由于抽樣指標值隨著樣本的變動而變動,它本身是一個隨機變量,因而抽樣指標和總體指標的誤差仍然是一個隨機變量,并不能保證誤差不超過一定范圍這個事件是必然事件,而只能給以一定程度的概率保證。因此,就有必要來計算抽樣指標和總體指標的誤差不超過一定范圍的概率大小,即計算抽樣指標落在一定區(qū)間范圍內的概率,這種概率稱之為抽樣估計的概率度。什么是抽樣估計的置信度?

抽樣誤差的概率度是測量抽樣估計可靠程度的一個參數(shù)。用符號“

Z”表示。公式表示:

什么是抽樣估計的概率度?或抽樣誤差的概率度是測量抽樣估計可靠程度的一個參數(shù)。用符正態(tài)概率分布圖Xx+1μx-1μ68.27%x+2μx-2μ95.45%由此可知,誤差范圍愈大,抽樣估計的置信度愈高,但抽樣估計的精確度愈低;反之,誤差范圍愈小,則抽樣估計的置信度愈低,但抽樣估計的精確度愈高。因為擴大或縮小以后的平均誤差,就是極限誤差:Δ=Zμ所以,抽樣平均誤差的系數(shù)就是概率度t。數(shù)理統(tǒng)計已經(jīng)證明,抽樣誤差的概率就是概率度的函數(shù),二者對應的函數(shù)關系已編成“正態(tài)分布概率表”。(P225)正態(tài)概率分布圖Xx+1μx-1μ68.27%x+一、點估計第三節(jié)抽樣估計的方法

抽樣估計是用抽樣資料來估計相應的總體指標的數(shù)值,而總體指標是表明總體數(shù)量特征的參數(shù),所以這種估計也可以稱為參數(shù)估計。總體參數(shù)的估計有點估計和區(qū)間估計兩種方法。

點估計是以抽樣指標數(shù)值直接作為總體指標估計值的一種估計方法。例如從某地區(qū)的1000000畝小麥中隨機抽取100畝進行抽樣調查,測得平均畝產量=300千克,我們就說,全地區(qū)1000000畝小麥的平均畝產量為300千克。一、點估計第三節(jié)抽樣估計的方法抽樣估計是用抽樣總體參數(shù)優(yōu)良估計的標準無偏性一致性有效性

點估計的方法優(yōu)點是簡便易行,原理直觀,常為實際工作采用。但不足之處是沒有表明抽樣估計的誤差,更沒有表明誤差在一定范圍內的概率保證程度有多大。在參數(shù)估計中,要有合適的樣本指標作為估計量。這里的樣本指標是樣本數(shù)據(jù)的函數(shù)。如從一個樣本可以計算樣本算術平均數(shù),中位數(shù)、眾數(shù)等。應當用那一種指標作為參數(shù)估計量才是最優(yōu)的,這便是樣本指標的優(yōu)良標準問題。作為優(yōu)良的估計指標應該符合以下標準。總體參數(shù)優(yōu)良估計的標準無偏性一致性有效性點估計的

區(qū)間估計就是根據(jù)概率保證程度的要求,選定概率度t,以及極限抽樣誤差(),再利用抽樣指標或p,定出估計上限或()和估計下限(或),即指出總體指標可能存在的區(qū)間范圍。我們把區(qū)間(,或,)稱為置信區(qū)間,概率保證程度稱為置信程度。二、區(qū)間估計區(qū)間估計就是根據(jù)概率保證程度的要求,選定概率度t,以及區(qū)間估計三要素估計值抽樣誤差范圍抽樣估計的置信度區(qū)間估計三要素估計值抽樣誤差范圍抽樣估計的置信度2、區(qū)間估計與點估計的區(qū)別

一是區(qū)間估計不像點估計那樣用一個數(shù)值對總體指標進行估計,而是用一個范圍對總體指標進行估計;二是點估計是一個確切的估計值,而區(qū)間估計的是區(qū)間,根據(jù)概率度的要求可寬可窄;三是點估計無法回答估計值的把握程度,而區(qū)間估計可以回答估計區(qū)間的把握程度。2、區(qū)間估計與點估計的區(qū)別區(qū)間估計的方法一

根據(jù)給定的概率F(z),推算抽樣極限誤差的可能范圍。分析步驟:

1.抽取樣本,計算樣本指標。即計算樣本平均數(shù)和抽樣成數(shù)p,作為總體指標的估計值,并計算樣本標準差σ以推算抽樣平均誤差。

2.根據(jù)給定的F(z)查表求得概率度z。3.根據(jù)概率度t和抽樣平均誤差μ計算極限誤差Δ。4.計算被估計值的上、下限,對總體參數(shù)作出區(qū)間估計。區(qū)間估計的方法一根據(jù)給定的概率F(z),推算抽樣極限誤例6、某企業(yè)生產一種新型電子元件,用簡單隨機抽樣方法抽取100只作耐用時間實驗,測試結果,平均壽命6000小時,標準差是300小時,試在95.45%概率保證下,估計這種新電子元件平均壽命區(qū)間。解:已知n=100,=6000小時,σ=300小時(1)根據(jù)已知資料計算抽樣平均誤差(2)根據(jù)給定的置信度F(Z)=95.45%,查《正態(tài)分布表》得Z=2(3)計算抽樣極限誤差:據(jù)此估計這種新型電子元件平均壽命的區(qū)間為結論:以95.45%的概率保證程度,估計該電子元件的平均壽命區(qū)間為5940~6060小時之間。例6、某企業(yè)生產一種新型電子元件,用簡單隨機抽樣方法抽取10例7、某紗廠某時期內生產了10萬個單位的紗,按純隨機不重復抽樣的方式抽取2000個單位檢驗,檢驗結果,合格率為95%,試以95%的把握程度,估計合格率的區(qū)間范圍。解:已知N=100000,n=2000,p=95%(1)根據(jù)已知資料計算抽樣平均誤差(2)根據(jù)給定的置信度F(Z)=95%,查《正態(tài)分布表》得Z=1.96(3)計算抽樣極限誤差:該廠生產的全部紗合格率的上下限為:例7、某紗廠某時期內生產了10萬個單位的紗,按純隨機不重復抽結論:以95%的置信度估計該廠全部合格品率在94.06%~95.95%之間。結論:以95%的置信度估計該廠全部合格品率在94.06%~9

根據(jù)給定的抽樣誤差范圍,求概率保證程度.分析步驟:1.抽取樣本,計算抽樣指標。即計算樣本平均數(shù)和抽樣成數(shù)p,作為總體指標的估計值,并計算樣本標準差s以推算抽樣年均差。2.根據(jù)給定的極限誤差范圍Δ估計算總體參數(shù)的上限和下限。3.計算概率度。將抽樣極限誤Δ差除以抽樣平均誤差μ,求出概率度t

4.查表求出概率F(z),并對總體參數(shù)作出區(qū)間估計。區(qū)間估計的方法二根據(jù)給定的抽樣誤差范圍,求概率保證程度.分析步驟:1.例8、某校從該校學生中隨機抽取100人,調查到他們平均每天參加體育鍛煉的時間為30分鐘,標準差為20分鐘,若要求抽樣估計的允許誤差不超過5分鐘,試求這一估計相應的置信度,并寫出該校學生平均每天參加體育鍛煉時間的估計區(qū)間。解:已知n=100,=30,σ=20,則(1)根據(jù)已知資料計算抽樣平均誤差為(2)根據(jù)給定的極限誤差可求出查正態(tài)分布概率表得置信度F(Z)=98.76%例8、某校從該校學生中隨機抽取100人,調查到他們平均每天參(3)該校學生平均每天參加體育鍛煉時間的上下限:結論:該校同學平均每天參加體育鍛煉的時間在25~35之間,這一區(qū)間的置信度為98.76%(3)該校學生平均每天參加體育鍛煉時間的上下限:結論:該校同例9、某食品加工廠從生產的一批食品中隨機抽取200袋進行檢查,其中188袋合格,若給定抽樣極限誤差為3.4%,試求這一估計相應的置信度,并寫出該廠食品合格率的估計區(qū)間。解:已知n=200合格品數(shù)(1)計算樣本合格品率及抽樣平均誤差為:例9、某食品加工廠從生產的一批食品中隨機抽取200袋進行檢查(2)根據(jù)給定的極限誤差可計算查正態(tài)分布概率表得置信度F(Z)=95.45%(3)計算該廠食品合格率的上下限結論:估計該廠食品的合格率在90.6%~97.4%之間。(2)根據(jù)給定的極限誤差可計算查正態(tài)分布概率表得置信度F(Z一、確定樣本容量應考慮的因素

第四節(jié)樣本容量的確定

組織抽樣調查的一項重要工作就是要確定合適的樣本容量。樣本容量直接關系到調查的精度、調查費用、調查時間、需要配備的人力物力等許多方面。那么樣本容量多大才合適呢?樣本容量多了會造成不必要的浪費,但樣本容量太少又不能有效的反應情況,直接影響推斷的效果。1、要考慮調查目的。2、要考慮總體的性質和特點3、要考慮調查項目的多少4、要考察調查質量的控制因素5、要考慮調查的條件一、確定樣本容量應考慮的因素第四節(jié)樣本容量的確定二、樣本容量的確定

(一)用經(jīng)驗法確定樣本容量

用經(jīng)驗法確定樣本容量是調查者根據(jù)多次成功的抽樣調查經(jīng)驗總結出來的,在不同規(guī)模的總體中應該抽取的樣本單位數(shù)占總體比重的經(jīng)驗數(shù),供抽樣調查抽取樣本時參考。需要注意的是,這個比重只是為調查者提供了一個抽取樣本單位數(shù)的范圍,但實際應用時,還必須考慮前述的各種應考慮的因素來最后確定。不同規(guī)??傮w單位數(shù)占總體比重如表所示總體規(guī)模100以下100-10001000-50005000-1000010000-10000001000000以上樣本占總體的比重%50以上50~2030~2015~35~11以下表6-3確定樣本容量經(jīng)驗值二、樣本容量的確定(一)用經(jīng)驗法確定樣本容量重復抽樣:不重復抽樣:抽樣平均數(shù)抽樣成數(shù)(二)用公式法確定樣本容量

根據(jù)研究問題的性質確定允許誤差和相應的置信度,然后根據(jù)歷史資料或其他試點資料確定總體的標準差,再通過抽樣誤差的計算公式來推算必要的樣本單位數(shù)。重復抽樣:不重復抽樣:抽樣平均數(shù)抽樣成數(shù)(二)用公式法確定樣例10、假定某統(tǒng)計總體被研究標志的標準差為30,若要求抽樣極限誤差不超過3,概率保證程度為99.73%,試問采用重復抽樣應抽取多多少個樣本?解:計算結果表明,應抽取900個樣本進行抽查,才能滿足研究問題的需要。例10、假定某統(tǒng)計總體被研究標志的標準差為30,若要求抽樣極例11、某市婦聯(lián)擬對該市婦女每天的家務勞動時間進行調查,根據(jù)歷史資料知道他們每天家務勞動時間超過2小時的人占90%,現(xiàn)在用重估抽樣的方法,要求在95.45%de概率保證下,勞動時間超過2小時的人的比重的極限誤差不超過3%,求樣本的必要單位數(shù)。解:樣本成數(shù)的必要單位數(shù):計算結果表明,應抽取400個人進行調查,才能滿足研究問題的需要。例11、某市婦聯(lián)擬對該市婦女每天的家務勞動時間進行調查,根據(jù)本章練習本章練習一.判斷題部分1.從全部總體單位中按照隨機原則抽取部分單位組成樣本,只可能組成一個樣本。()×一.判斷題部分1.從全部總體單位中按照隨機原則抽取×2.在抽樣推斷中,全及指標值是確定的、唯一的,而樣本指標值是一個隨機變量。()√2.在抽樣推斷中,全及指標值是確定的、唯一的,而樣本指3.抽樣成數(shù)的特點是:樣本成數(shù)越大,則抽樣平均誤差越大。()×3.抽樣成數(shù)的特點是:樣本成數(shù)越大,則抽樣平均誤差越4.抽樣平均誤差總是小于抽樣極限誤差。()×4.抽樣平均誤差總是小于抽樣極限誤差。()

5.從全部總體單位中抽取部分單位構成樣本,在樣本變量相同的情況下,重復抽樣構成的樣本個數(shù)大于不重復抽樣構成的樣本個數(shù)。()√5.從全部總體單位中抽取部分單位構成樣本,在樣本6.抽樣平均誤差反映抽樣誤差的一般水平,每次抽樣的誤差可能大于抽樣平均誤差,也可能小于抽樣平均誤差。()√6.抽樣平均誤差反映抽樣誤差的一般水平,每次抽樣的誤7.在抽樣推斷中,抽樣誤差的概率度越大,則抽樣極限誤差就越大于抽樣平均誤差。()√7.在抽樣推斷中,抽樣誤差的概率度越大,則抽樣極限8.抽樣估計的優(yōu)良標準有三個:無偏性、可靠性和一致性。()×8.抽樣估計的優(yōu)良標準有三個:無偏性、可靠性9.抽樣推斷的目的是,通過對部分單位的調查,來取得樣本的各項指標。()×9.抽樣推斷的目的是,通過對部分單位的調查,來取得10.總體參數(shù)區(qū)間估計必須具備三個要素即:估計值、抽樣誤差范圍和抽樣誤差的概率度。()×10.總體參數(shù)區(qū)間估計必須具備三個要素即:估計值、抽1.抽樣平均誤差是()。A.抽樣指標的標準差B.總體參數(shù)的標準差C.樣本變量的函數(shù)D.總體變量的函數(shù)二.單項選擇題部分A1.抽樣平均誤差是()。二.單項選擇題部分A2.抽樣調查所必須遵循的基本原則是()。A.準確性原則B.隨機性原則C.可靠性原則D.靈活性原則B2.抽樣調查所必須遵循的基本原則是()。B3.在簡單隨機重復抽樣條件下,當抽樣平均誤差縮小為原來的1/2時,則樣本單位數(shù)為原來的(C)。

A.2倍

B.3倍

C.4倍

D.1/4倍C3.在簡單隨機重復抽樣條件下,當抽樣平均誤差縮小為原4.在一定的抽樣平均誤差條件下()。A.擴大極限誤差范圍,可以提高推斷的可靠程度B.擴大極限誤差范圍,會降低推斷的可靠程度C.縮小極限誤差范圍,可以提高推斷的可靠程度D.縮小極限誤差范圍,不改變推斷的可靠程度A4.在一定的抽樣平均誤差條件下()。A5.反映樣本指標與總體指標之間的平均誤差程度的指標是()。

A.平均數(shù)離差

B.概率度

C.抽樣平均誤差

D.抽樣極限誤差C5.反映樣本指標與總體指標之間的平均誤差程度的指標是6.以抽樣指標估計總體指標要求抽樣指標值的平均數(shù)等于被估計的總體指標值本身,這一標準稱為()。

A.無偏性

B.一致性

C.有效性

D.準確性A6.以抽樣指標估計總體指標要求抽樣指標值的平均數(shù)等于7.抽樣誤差是指()。

A.調查中所產生的登記性誤差

B.調查中所產生的系統(tǒng)性誤差

C.隨機的代表性誤差

D.計算過程中產生的誤差C7.抽樣誤差是指()。C8.抽樣極限誤差和抽樣平均誤差的數(shù)值之間的關系為()。

A.抽樣極限誤差可以大于或小于抽樣平均誤差

B.抽樣極限誤差一定大于抽樣平均誤差

C.抽樣極限誤差一定小于抽樣平均誤差

D.抽樣極限誤差一定等于抽樣平均誤差A8.抽樣極限誤差和抽樣平均誤差的數(shù)值之間的關系為(1.抽樣推斷的特點是()A.由推算認識總體的一種認識方法B.按隨機原則抽取樣板單位C.運用概率估計的方法D.可以計算,但不能控制抽樣誤差E.可以計算并控制抽樣誤差三.多項選擇題部分ABCE1.抽樣推斷的特點是()三.多項選擇題部2.抽樣估計中的抽樣誤差()A.是不可避免要產生的B.是可以通過改進調查方式來消除的C.是可以事先計算出來的D.只能在調查結束后才能計算的E.其大小是可能控制的ACE2.抽樣估計中的抽樣誤差()ACE3.從總體中抽取樣本單位的具體方法有()A.簡單隨機抽樣B.重復抽樣C.不重復抽樣D.等距抽樣E.非概率抽樣BC3.從總體中抽取樣本單位的具體方法有()BC4.抽樣推斷中,樣本容量的多少取決于()A.總體標準差的大小B.允許誤差的大小C.抽樣估計的把握程度D.總體參數(shù)的大?。?抽樣方法和組織形式ABCE4.抽樣推斷中,樣本容量的多少取決于(5.總體參數(shù)區(qū)間估計必須具備的三個要素是()A.樣本單位數(shù)B.樣本指標C.全及指標D.抽樣誤差范圍E.抽樣估計的置信度BDE5.總體參數(shù)區(qū)間估計必須具備的三個要素是(6.用抽樣指標估計總體指標,所謂優(yōu)良估計的標準有()

A.客觀性

B.無偏性

C.一致性

D.有效性

E.優(yōu)良性BCD6.用抽樣指標估計總體指標,所謂優(yōu)良估計的標準有(

1.總體是非標志(0,1)分布的平均數(shù)為(成數(shù)P),其方差為(P(1-P)或PQ)。四.填空題部分1.總體是非標志(0,1)分布的平均數(shù)為(成數(shù)P

2.從全及總體中隨機抽取樣本的辦法有(重復抽樣)和(不重復抽樣)兩種。2.從全及總體中隨機抽取樣本的辦法有(重復抽樣)和

3.重復抽樣平均誤差的大小與(樣本單位數(shù))成反比例關系,又與(標準差)成正比例關系。3.重復抽樣平均誤差的大小與(樣本單位數(shù))成反比例

4.抽樣極限誤差等于(抽樣平均誤差)與(概率度)的乘積。4.抽樣極限誤差等于(抽樣平均誤差)與(概率度)的

5.總體參數(shù)估計有(點估計)和(區(qū)間估計)兩種方法。5.總體參數(shù)估計有(點估計)和(區(qū)間估計)兩種方法

6.抽樣誤差范圍決定估計的(準確性),而概率保證程度決定估計的(可靠性)。6.抽樣誤差范圍決定估計的(準確性),而概率保證程1.統(tǒng)計抽樣推斷具有哪些特點?2.抽樣推斷中,參數(shù)和統(tǒng)計量之間有何區(qū)別?3.什么是抽樣誤差?影響其大小的因素主要有哪些?

五、問答題部分1.統(tǒng)計抽樣推斷具有哪些特點?五、問答題部分六.計算題部分見教材P132-133六.計算題部分見教材P132-133放映結束!無悔無愧于昨天,豐碩殷實的今天,充滿希望的明天。放映結束!無悔無愧于昨天,豐碩殷實的今天,充滿希望的明天。

第六章抽樣推斷第六章抽樣推斷

教學目的與要求:抽樣估計是抽樣調查的繼續(xù),它提供了一套利用抽樣資料來估計總體數(shù)量特征的方法。通過本章的學習,要理解和掌握抽樣估計的概念、特點,抽樣誤差的含義、計算方法,抽樣估計的置信度,推斷總體參數(shù)的方法,能結合實際資料進行抽樣估計。

本章主要內容抽樣推斷概述抽樣誤差抽樣估計的方法樣本容量的確定本章主要內容抽樣推斷概述抽樣誤差抽樣估計的方法樣本一、抽樣推斷的概念和特點

概念

抽樣推斷是在抽樣調查的基礎上,用樣本實際資料計算樣本指標,并據(jù)以推算總體相應的數(shù)量特征的一種統(tǒng)計分析方法。第一節(jié)抽樣推斷概述一、抽樣推斷的概念和特點概念抽樣推斷是在抽樣調特點

它是由部分推斷整體的一種認識方法。

抽樣推斷建立在隨機取樣的基礎上。

抽樣推斷運用概率估計的方法。

抽樣推斷的誤差可以事先計算并加以控制。特點它是由部分推斷整體的一種認識方法。抽樣推斷二、抽樣推斷的一些基本概念(一)總體和樣本總體:

又稱全及總體。指所要認識的研究對象全體??傮w單位總數(shù)用“N”表示,N總是很大的數(shù)

。對于一個總體來說,若被研究的標志系品質標志,則將這個總體稱為屬性總體;若被研究的標志系數(shù)量標志,則將這個總體稱為變量總體。二、抽樣推斷的一些基本概念(一)總體和樣本總體:樣本:

又稱子樣或抽樣總體,簡稱樣本。是從全及總體中隨機抽取出來,作為代表這一總體的那部分單位組成的集合體。樣本單位總數(shù)用“n”表示。相對N來說,n是很小的數(shù),它可以是N的幾十分之一、幾百分之一、幾千分之一、幾萬分之一。(一般來說,樣本單位數(shù)達到或超過30個稱為大樣本,而在30個以下稱為小樣本。社會經(jīng)濟現(xiàn)象的抽樣調查多取大樣本)樣本:又稱子樣或抽樣總體,簡稱樣本。是從全及總體中隨機抽(二)總體指標和樣本指標

總體指標是根據(jù)總體中各單位的標志值或標志屬性計算的,反映總體數(shù)量特征的綜合指標。

參數(shù)研究總體中的數(shù)量標志總體平均數(shù)總體標準差X=∑XNX=∑XF∑F研究總體中的品質標志總體成數(shù)成數(shù)標準差P=

N1N(只有兩種表現(xiàn))(二)總體指標和樣本指標總體指標是根據(jù)總樣本指標是根據(jù)樣本各單位標志值或標志屬性計算的綜合指標。研究數(shù)量標志

樣本平均數(shù)

x=∑xnx=∑xf∑f樣本標準差研究品質標志樣本成數(shù)

成數(shù)標準差

np=n樣本指標是根據(jù)樣本各單位標志值或標志屬性研究數(shù)樣本平均數(shù)x(三)樣本容量和樣本個數(shù)樣本容量:一個樣本包含的單位數(shù)。用“n”表示。一般要求n≥30樣本個數(shù):從一個全及總體中可能抽取的樣本數(shù)目。(三)樣本容量和樣本個數(shù)樣本容量:一個樣本包含的單位數(shù)。用(四)重復抽樣和不重復抽樣重復抽樣:又稱回置抽樣。不重復抽樣:又稱不回置抽樣??赡芙M成的樣本數(shù)目:N(N-1)(N-2)……(N-n+1)可能組成的樣本數(shù)目:nN(四)重復抽樣和不重復抽樣重復抽樣:又稱回置抽樣。不重復抽樣從A、B、C、D四個單位中,抽出兩個單位構成一個樣本,問可能組成的樣本數(shù)目是多少?重復抽樣AAACADBABBBCBDABCACBCCCDDADBDCDDNn=42=16(個樣本)例如從A、B、C、D四個單位中,抽出兩個單位構成重復抽樣AAAC不重復抽樣N(N-1)(N-2)…….4×3=12(個樣本)不重復抽樣N(N-1)(N-2)…….4×3=12(個樣一、抽樣誤差的含義

抽樣誤差是指按隨機原則抽樣時,在沒有登記誤差和系統(tǒng)性誤差的條件下,單純由于隨機抽樣的偶然因素使樣本各單位的結構不足以代表總體各單位的結構,而引起的樣本指標與總體指標之間的離差。在抽樣中誤差的來源有許多方面。

第二節(jié)抽樣誤差一、抽樣誤差的含義抽樣誤差是指按隨機原則抽樣

另一類是代表性誤差,即樣本各單位的結構不足以代表總體而引起的誤差。

其中一類是登記性誤差,即在調查過程中由于觀察、測量、登記、計算上的差錯所引起的誤差,這類誤差是所有統(tǒng)計調查都可能發(fā)生的。

另一類是代表性誤差,即樣本各單位的結構不足以代表總另一種情況是,即使遵守隨機原則,由于被抽選的樣本有各種各樣,只要被抽中的樣本其內部各單位被研究標志的構成比例和總體有所出入,就會出現(xiàn)或大或小的偶然性代表性誤差。代表性誤差的發(fā)生有以下兩種情況:一種是由于違反抽樣調查的隨機原則,如有意地多選較好的單位或較壞的單位進行調查。這樣做,所據(jù)以計算的抽樣指標必然出現(xiàn)偏高或偏低現(xiàn)象,造成系統(tǒng)性的誤差。系統(tǒng)性誤差和登記性誤差都是不應當發(fā)生的,是可以也應該采取措施避免發(fā)生或將其減小到最小限度。另一種情況是,即使遵守隨機原則,由于被抽選的樣本有各種各樣

我們所講的抽樣誤差就是指這種偶然性代表性誤差。即按隨機原則抽樣時,在沒有登記性誤差和系統(tǒng)性誤差的條件下單純由于不同的隨機樣本得出不同估計量而產生的誤差。抽樣誤差是抽樣調查所固有的,是無法避免與消除的,但可以運用數(shù)學方法計算其數(shù)量界限,并通過抽樣設計程序控制其范圍,所以這種抽樣誤差也稱為可控制誤差。需要指出,抽樣誤差不是固定不變的數(shù),它的數(shù)值是隨樣本不同而變化的,所以它也是隨機變量。我們所講的抽樣誤差就是指這種偶然性代表性誤差。即按隨二、抽樣誤差的表現(xiàn)形式

(一)抽樣實際誤差

抽樣實際誤差是指在一次具體的抽樣調查中,由隨機因素引起的樣本指標與總體指標之間的離差。如樣本平均數(shù)與總體平均數(shù)之間的絕對離差,樣本成數(shù)與總體成數(shù)之間的絕對離差。但是,在抽樣中,由于總體指標數(shù)值是未知的,因此,抽樣實際誤差是無法計算的。同時,抽樣實際誤差僅僅是一系列可能出現(xiàn)的誤差數(shù)值之一,因此,抽樣實際誤差沒有概括所有可能產生的抽樣誤差。二、抽樣誤差的表現(xiàn)形式(一)抽樣實際誤差抽樣實際誤(二)抽樣平均誤差

抽樣平均誤差是抽樣平均數(shù)或抽樣成數(shù)的標準差,反映了抽樣指標與總體指標的平均誤差程度。(二)抽樣平均誤差抽樣平均誤差是抽

抽樣平均誤差的計算公式抽樣平均數(shù)的平均誤差抽樣成數(shù)平均誤差實際上,利用上述兩個公式是計算不出抽樣平均誤差的。想一想,為什么?M表示全部可能的樣本數(shù)目抽樣平均誤差的計算公式抽樣平均數(shù)抽

該公式表明了抽樣平均誤差的意義。但是當總體單位數(shù)較大,而抽取的樣本單位數(shù)也較大時,樣本可能數(shù)目就非常大。即使求出樣本可能數(shù)目,上述公式仍然不適用,這是因為,在該公式中出現(xiàn)了總體平均數(shù)。這也正是抽樣調查所要推算出的數(shù)值,實踐中是不知道的。

該公式表明了抽樣平均誤差的意義。但是當總體單位數(shù)較大抽樣平均數(shù)平均誤差的計算方法采用重復抽樣:采用不重復抽樣:我們把式子叫做修正因子。不難看出當N較大時,與的計算結果是十分接近。因此,當N較大時在不重復抽樣條件計算抽樣平均誤差的公式可采用時抽樣平均數(shù)平均誤差的計算方法采用重復抽樣:采用不重復抽樣:我

隨機抽選某校學生100人,調查他們的體重。得到他們的平均體重為58公斤,標準差為10公斤。問抽樣推斷的平均誤差是多少?即:當根據(jù)樣本學生的平均體重估計全部學生的平均體重時,抽樣平均誤差為1公斤。已知:則:n=100σ=10x=58例題1隨機抽選某校學生100人,調查他們的體重。得到他們的平已知:則:N=2000n=400σ=300=4800

某廠生產一種新型燈泡共2000只,隨機抽出400只作耐用時間試驗,測試結果平均使用壽命為4800小時,樣本標準差為300小時,求抽樣推斷的平均誤差?重復抽樣不重復抽樣已知:則:N=2000n=400σ=300=4800某抽樣成數(shù)平均誤差的計算方法采用重復抽樣:采用不重復抽樣:抽樣成數(shù)平均誤差的計算方法采用重復抽樣:采用不重復抽樣:

某校隨機抽選400名學生,發(fā)現(xiàn)戴眼鏡的學生有80人。根據(jù)樣本資料推斷全部學生中戴眼鏡的學生所占比重時,抽樣誤差為多大?已知:則:樣本成數(shù)例題3某校隨機抽選400名學生,發(fā)現(xiàn)戴眼鏡的學生有

一批食品罐頭共60000桶,隨機抽查300桶,發(fā)現(xiàn)有6桶不合格,求合格品率的抽樣平均誤差?已知:例題3一批食品罐頭共60000桶,隨機抽查300桶,發(fā)現(xiàn)有則:樣本合格率則:樣本合格率(二)影響抽樣誤差大小的因素 1、樣本單位數(shù)的多少 2、受總體標準差的影響3、抽樣方法 4、抽樣調查的組織形式(二)影響抽樣誤差大小的因素 含義:

抽樣極限誤差是指樣本指標和總體指標之間抽樣誤差的可能范圍。由于總體指標是一個確定的數(shù),而樣本指標則是圍繞著總體指標左右變動的量,它與總體指標可能產生正離差,也可能產生負離差,樣本指標變動的上限或下限與總體指標之差的絕對值就可以表示抽樣誤差的可能范圍,我們將這種以絕對值形式表示的抽樣誤差可能范圍稱為抽樣極限誤差。

計算方法:它等于樣本指標可允許變動的上限或下限與總體指標之差的絕對值。(三)抽樣極限誤差含義:抽樣極限誤差是指樣本指標和總體指標之間抽樣誤差的=Δp│p-P│p-Δ≤P≤p+ΔPp抽樣平均數(shù)極限誤差:抽樣成數(shù)極限誤差:≤≤=Δp│p-P│p-Δ≤P≤p+ΔP

什么是抽樣估計的置信度?

抽樣估計的置信度就是表明抽樣指標和總體指標的誤差不超過一定范圍的概率保證程度。由于抽樣指標值隨著樣本的變動而變動,它本身是一個隨機變量,因而抽樣指標和總體指標的誤差仍然是一個隨機變量,并不能保證誤差不超過一定范圍這個事件是必然事件,而只能給以一定程度的概率保證。因此,就有必要來計算抽樣指標和總體指標的誤差不超過一定范圍的概率大小,即計算抽樣指標落在一定區(qū)間范圍內的概率,這種概率稱之為抽樣估計的概率度。什么是抽樣估計的置信度?

抽樣誤差的概率度是測量抽樣估計可靠程度的一個參數(shù)。用符號“

Z”表示。公式表示:

什么是抽樣估計的概率度?或抽樣誤差的概率度是測量抽樣估計可靠程度的一個參數(shù)。用符正態(tài)概率分布圖Xx+1μx-1μ68.27%x+2μx-2μ95.45%由此可知,誤差范圍愈大,抽樣估計的置信度愈高,但抽樣估計的精確度愈低;反之,誤差范圍愈小,則抽樣估計的置信度愈低,但抽樣估計的精確度愈高。因為擴大或縮小以后的平均誤差,就是極限誤差:Δ=Zμ所以,抽樣平均誤差的系數(shù)就是概率度t。數(shù)理統(tǒng)計已經(jīng)證明,抽樣誤差的概率就是概率度的函數(shù),二者對應的函數(shù)關系已編成“正態(tài)分布概率表”。(P225)正態(tài)概率分布圖Xx+1μx-1μ68.27%x+一、點估計第三節(jié)抽樣估計的方法

抽樣估計是用抽樣資料來估計相應的總體指標的數(shù)值,而總體指標是表明總體數(shù)量特征的參數(shù),所以這種估計也可以稱為參數(shù)估計??傮w參數(shù)的估計有點估計和區(qū)間估計兩種方法。

點估計是以抽樣指標數(shù)值直接作為總體指標估計值的一種估計方法。例如從某地區(qū)的1000000畝小麥中隨機抽取100畝進行抽樣調查,測得平均畝產量=300千克,我們就說,全地區(qū)1000000畝小麥的平均畝產量為300千克。一、點估計第三節(jié)抽樣估計的方法抽樣估計是用抽樣總體參數(shù)優(yōu)良估計的標準無偏性一致性有效性

點估計的方法優(yōu)點是簡便易行,原理直觀,常為實際工作采用。但不足之處是沒有表明抽樣估計的誤差,更沒有表明誤差在一定范圍內的概率保證程度有多大。在參數(shù)估計中,要有合適的樣本指標作為估計量。這里的樣本指標是樣本數(shù)據(jù)的函數(shù)。如從一個樣本可以計算樣本算術平均數(shù),中位數(shù)、眾數(shù)等。應當用那一種指標作為參數(shù)估計量才是最優(yōu)的,這便是樣本指標的優(yōu)良標準問題。作為優(yōu)良的估計指標應該符合以下標準。總體參數(shù)優(yōu)良估計的標準無偏性一致性有效性點估計的

區(qū)間估計就是根據(jù)概率保證程度的要求,選定概率度t,以及極限抽樣誤差(),再利用抽樣指標或p,定出估計上限或()和估計下限(或),即指出總體指標可能存在的區(qū)間范圍。我們把區(qū)間(,或,)稱為置信區(qū)間,概率保證程度稱為置信程度。二、區(qū)間估計區(qū)間估計就是根據(jù)概率保證程度的要求,選定概率度t,以及區(qū)間估計三要素估計值抽樣誤差范圍抽樣估計的置信度區(qū)間估計三要素估計值抽樣誤差范圍抽樣估計的置信度2、區(qū)間估計與點估計的區(qū)別

一是區(qū)間估計不像點估計那樣用一個數(shù)值對總體指標進行估計,而是用一個范圍對總體指標進行估計;二是點估計是一個確切的估計值,而區(qū)間估計的是區(qū)間,根據(jù)概率度的要求可寬可窄;三是點估計無法回答估計值的把握程度,而區(qū)間估計可以回答估計區(qū)間的把握程度。2、區(qū)間估計與點估計的區(qū)別區(qū)間估計的方法一

根據(jù)給定的概率F(z),推算抽樣極限誤差的可能范圍。分析步驟:

1.抽取樣本,計算樣本指標。即計算樣本平均數(shù)和抽樣成數(shù)p,作為總體指標的估計值,并計算樣本標準差σ以推算抽樣平均誤差。

2.根據(jù)給定的F(z)查表求得概率度z。3.根據(jù)概率度t和抽樣平均誤差μ計算極限誤差Δ。4.計算被估計值的上、下限,對總體參數(shù)作出區(qū)間估計。區(qū)間估計的方法一根據(jù)給定的概率F(z),推算抽樣極限誤例6、某企業(yè)生產一種新型電子元件,用簡單隨機抽樣方法抽取100只作耐用時間實驗,測試結果,平均壽命6000小時,標準差是300小時,試在95.45%概率保證下,估計這種新電子元件平均壽命區(qū)間。解:已知n=100,=6000小時,σ=300小時(1)根據(jù)已知資料計算抽樣平均誤差(2)根據(jù)給定的置信度F(Z)=95.45%,查《正態(tài)分布表》得Z=2(3)計算抽樣極限誤差:據(jù)此估計這種新型電子元件平均壽命的區(qū)間為結論:以95.45%的概率保證程度,估計該電子元件的平均壽命區(qū)間為5940~6060小時之間。例6、某企業(yè)生產一種新型電子元件,用簡單隨機抽樣方法抽取10例7、某紗廠某時期內生產了10萬個單位的紗,按純隨機不重復抽樣的方式抽取2000個單位檢驗,檢驗結果,合格率為95%,試以95%的把握程度,估計合格率的區(qū)間范圍。解:已知N=100000,n=2000,p=95%(1)根據(jù)已知資料計算抽樣平均誤差(2)根據(jù)給定的置信度F(Z)=95%,查《正態(tài)分布表》得Z=1.96(3)計算抽樣極限誤差:該廠生產的全部紗合格率的上下限為:例7、某紗廠某時期內生產了10萬個單位的紗,按純隨機不重復抽結論:以95%的置信度估計該廠全部合格品率在94.06%~95.95%之間。結論:以95%的置信度估計該廠全部合格品率在94.06%~9

根據(jù)給定的抽樣誤差范圍,求概率保證程度.分析步驟:1.抽取樣本,計算抽樣指標。即計算樣本平均數(shù)和抽樣成數(shù)p,作為總體指標的估計值,并計算樣本標準差s以推算抽樣年均差。2.根據(jù)給定的極限誤差范圍Δ估計算總體參數(shù)的上限和下限。3.計算概率度。將抽樣極限誤Δ差除以抽樣平均誤差μ,求出概率度t

4.查表求出概率F(z),并對總體參數(shù)作出區(qū)間估計。區(qū)間估計的方法二根據(jù)給定的抽樣誤差范圍,求概率保證程度.分析步驟:1.例8、某校從該校學生中隨機抽取100人,調查到他們平均每天參加體育鍛煉的時間為30分鐘,標準差為20分鐘,若要求抽樣估計的允許誤差不超過5分鐘,試求這一估計相應的置信度,并寫出該校學生平均每天參加體育鍛煉時間的估計區(qū)間。解:已知n=100,=30,σ=20,則(1)根據(jù)已知資料計算抽樣平均誤差為(2)根據(jù)給定的極限誤差可求出查正態(tài)分布概率表得置信度F(Z)=98.76%例8、某校從該校學生中隨機抽取100人,調查到他們平均每天參(3)該校學生平均每天參加體育鍛煉時間的上下限:結論:該校同學平均每天參加體育鍛煉的時間在25~35之間,這一區(qū)間的置信度為98.76%(3)該校學生平均每天參加體育鍛煉時間的上下限:結論:該校同例9、某食品加工廠從生產的一批食品中隨機抽取200袋進行檢查,其中188袋合格,若給定抽樣極限誤差為3.4%,試求這一估計相應的置信度,并寫出該廠食品合格率的估計區(qū)間。解:已知n=200合格品數(shù)(1)計算樣本合格品率及抽樣平均誤差為:例9、某食品加工廠從生產的一批食品中隨機抽取200袋進行檢查(2)根據(jù)給定的極限誤差可計算查正態(tài)分布概率表得置信度F(Z)=95.45%(3)計算該廠食品合格率的上下限結論:估計該廠食品的合格率在90.6%~97.4%之間。(2)根據(jù)給定的極限誤差可計算查正態(tài)分布概率表得置信度F(Z一、確定樣本容量應考慮的因素

第四節(jié)樣本容量的確定

組織抽樣調查的一項重要工作就是要確定合適的樣本容量。樣本容量直接關系到調查的精度、調查費用、調查時間、需要配備的人力物力等許多方面。那么樣本容量多大才合適呢?樣本容量多了會造成不必要的浪費,但樣本容量太少又不能有效的反應情況,直接影響推斷的效果。1、要考慮調查目的。2、要考慮總體的性質和特點3、要考慮調查項目的多少4、要考察調查質量的控制因素5、要考慮調查的條件一、確定樣本容量應考慮的因素第四節(jié)樣本容量的確定二、樣本容量的確定

(一)用經(jīng)驗法確定樣本容量

用經(jīng)驗法確定樣本容量是調查者根據(jù)多次成功的抽樣調查經(jīng)驗總結出來的,在不同規(guī)模的總體中應該抽取的樣本單位數(shù)占總體比重的經(jīng)驗數(shù),供抽樣調查抽取樣本時參考。需要注意的是,這個比重只是為調查者提供了一個抽取樣本單位數(shù)的范圍,但實際應用時,還必須考慮前述的各種應考慮的因素來最后確定。不同規(guī)??傮w單位數(shù)占總體比重如表所示總體規(guī)模100以下100-10001000-50005000-1000010000-10000001000000以上樣本占總體的比重%50以上50~2030~2015~35~11以下表6-3確定樣本容量經(jīng)驗值二、樣本容量的確定(一)用經(jīng)驗法確定樣本容量重復抽樣:不重復抽樣:抽樣平均數(shù)抽樣成數(shù)(二)用公式法確定樣本容量

根據(jù)研究問題的性質確定允許誤差和相應的置信度,然后根據(jù)歷史資料或其他試點資料確定總體的標準差,再通過抽樣誤差的計算公式來推算必要的樣本單位數(shù)。重復抽樣:不重復抽樣:抽樣平均數(shù)抽樣成數(shù)(二)用公式法確定樣例10、假定某統(tǒng)計總體被研究標志的標準差為30,若要求抽樣極限誤差不超過3,概率保證程度為99.73%,試問采用重復抽樣應抽取多多少個樣本?解:計算結果表明,應抽取900個樣本進行抽查,才能滿足研究問題的需要。例10、假定某統(tǒng)計總體被研究標志的標準差為30,若要求抽樣極例11、某市婦聯(lián)擬對該市婦女每天的家務勞動時間進行調查,根據(jù)歷史資料知道他們每天家務勞動時間超過2小時的人占90%,現(xiàn)在用重估抽樣的方法,要求在95.45%de概率保證下,勞動時間超過2小時的人的比重的極限誤差不超過3%,求樣本的必要單位數(shù)。解:樣本成數(shù)的必要單位數(shù):計算結果表明,應抽取400個人進行調查,才能滿足研究問題的需要。例11、某市婦聯(lián)擬對該市婦女每天的家務勞動時間進行調查,根據(jù)本章練習本章練習一.判斷題部分1.從全部總體單位中按照隨機原則抽取部分單位組成樣本,只可能組成一個樣本。()×一.判斷題部分1.從全部總體單位中按照隨機原則抽取×2.在抽樣推斷中,全及指標值是確定的、唯一的,而樣本指標值是一個隨機變量。()√2.在抽樣推斷中,全及指標值是確定的、唯一的,而樣本指3.抽樣成數(shù)的特點是:樣本成數(shù)越大,則抽樣平均誤差越大。()×3.抽樣成數(shù)的特點是:樣本成數(shù)越大,則抽樣平均誤差越4.抽樣平均誤差總是小于抽樣極限誤差。()×4.抽樣平均誤差總是小于抽樣極限誤差。()

5.從全部總體單位中抽取部分單位構成樣本,在樣本變量相同的情況下,重復抽樣構成的樣本個數(shù)大于不重復抽樣構成的樣本個數(shù)。()√5.從全部總體單位中抽取部分單位構成樣本,在樣本6.抽樣平均誤差反映抽樣誤差的一般水平,每次抽樣的誤差可能大于抽樣平均誤差,也可能小于抽樣平均誤差。()√6.抽樣平均誤差反映抽樣誤差的一般水平,每次抽樣的誤7.在抽樣推斷中,抽樣誤差的概率度越大,則抽樣極限誤差就越大于抽樣平均誤差。()√7.在抽樣推斷中,抽樣誤差的概率度越大,則抽樣極限8.抽樣估計的優(yōu)良標準有三個:無偏性、可靠性和一致性。()×8.抽樣估計的優(yōu)良標準有三個:無偏性、可靠性9.抽樣推斷的目的是,通過對部分單位的調查,來取得樣本的各項指標。()×9.抽樣推斷的目的是,通過對部分單位的調查,來取得10.總體參數(shù)區(qū)間估計必須具備三個要素即:估計值、抽樣誤差范圍和抽樣誤差的概率度。()×10.總體參數(shù)區(qū)間估計必須具備三個要素即:估計值、抽1.抽樣平均誤差是()。A.抽樣指標的標準差B.總體參數(shù)的標準差C.樣本變量的函數(shù)D.總體變量的函數(shù)二.單項選擇題部分A1.抽樣平均誤差是()。二.單項選擇題部分A2.抽樣調查所必須遵循的基本原則是()。A.準確性原則B.隨機性原則C.可靠性原則D.靈活性原則B2.抽樣調查所必須遵循的基本原則是()。B

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論