




版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
.
第三節(jié)抽樣誤差與參數(shù)估計
一、抽樣誤差的概念二、抽樣平均誤差三、抽樣極限誤差四、抽樣估計的概率度和置信度五、參數(shù)估計方法六、樣本容量的確定11/25/2022.第三節(jié)抽樣誤差與參數(shù)估計一、抽樣誤差的概念一、抽樣誤差的概念(一)抽樣調查誤差的種類(二)抽樣誤差的概念(三)抽樣實際誤差(四)抽樣平均誤差的概念11/25/2022一、抽樣誤差的概念(一)抽樣調查誤差的種類9/24/20(一)抽樣調查誤差的種類抽樣調查誤差登記性誤差代表性誤差隨機誤差系統(tǒng)誤差(可以計算)抽樣誤差(隨機誤差)抽樣實際誤差
.抽樣平均誤差
(無法計算)11/25/2022(一)抽樣調查誤差的種類抽樣調查誤差登記性誤差代表性誤差隨機
抽樣誤差的性質:1、隨機誤差:樣本產(chǎn)生的隨機性2、代表性誤差:樣本結構不足以代表總體結構
(二)抽樣誤差抽樣誤差概念:抽樣誤差(隨機誤差)是指由于抽樣的隨機性而產(chǎn)生的樣本指標與總體指標之間的離差。抽樣誤差表達形式:11/25/2022抽樣誤差的性質:(二)抽樣誤差抽樣誤差概念:抽樣誤差(隨機
即是指每次抽樣調查所得的樣本指標與總體指標之間的離差。抽樣實際誤差:它隨著樣本的不同而不同,是一個隨機變量。(三)抽樣實際誤差它無法計算。11/25/2022即是指每次抽樣調查所得的樣本指標
即是指所有可能出現(xiàn)的樣本指標與總體指標之間的平均離差,即所有可能出現(xiàn)的樣本指標與總體指標的標準差。
抽樣平均誤差:對于一個特定的總體來說,抽樣平均誤差可以根據(jù)數(shù)理統(tǒng)計方法在調查之前計算出來,還可以通過設計調查方案控制其大小。(四)抽樣平均誤差的概念11/25/2022即是指所有可能出現(xiàn)的樣本指標與總(一)抽樣平均誤差的定義公式(二)抽樣平均誤差的應用公式(三)影響抽樣(平均)誤差大小的因素二、抽樣平均誤差11/25/2022(一)抽樣平均誤差的定義公式二、抽樣平均誤差9/24/2M:全部可能的樣本個數(shù)1.樣本平均數(shù)的抽樣平均誤差
2.樣本成數(shù)的抽樣平均誤差
(一)抽樣平均誤差的定義公式11/25/2022M:全部可能的樣本個數(shù)1.樣本平均數(shù)的抽樣平均誤差平均誤差的定義公式只能用來解釋平均誤差的概念,在實際問題中無法應用。因為:首先,總體的平均數(shù)或成數(shù)通常未知;其次,也很難給出全部樣本的平均數(shù)或成數(shù)。
在實際工作中,用根據(jù)數(shù)理統(tǒng)計理論證明推導出來的公式。
11/25/2022平均誤差的定義公式只能用來解釋平均誤差的概念,在實際問題中無(1)重復抽樣:(2)不重復抽樣:注意:在實際計算抽樣平均誤差時,當總體標準差σ未知時,可以用樣本標準差s來代替。即:(大樣本)(小樣本)1.樣本平均數(shù)的抽樣平均誤差(二)抽樣平均誤差的應用公式11/25/2022(1)重復抽樣:(2)不重復抽樣:注意:在實際計算抽樣平均誤
例:現(xiàn)有A、B、C、D四個工人構成的總體,他們所生產(chǎn)某種產(chǎn)品的日產(chǎn)量分別為22、24、26、28件,若按重復抽樣方法,從工人總體中隨機抽取兩個工人組成一個樣本,用其樣本平均日產(chǎn)量來估計總體平均日產(chǎn)量。總體平均數(shù)為:所有可能樣本個數(shù):M
=
4×4
=
16樣本
2224262822242628
22232425232425262425262725262728試計算樣本平均日產(chǎn)量的抽樣平均誤差。(N=4
n
=
2)總體標準差為:在重復抽樣條件下,所有可能的樣本及樣本平均日產(chǎn)量如右表11/25/2022例:現(xiàn)有A、B、C、D四個工人構成的總體,他們所生產(chǎn)某種重復抽樣的樣本平均數(shù)及其離差(抽樣誤差)樣本序號樣本單位樣本平均數(shù)12345678910111213141516AAABACADBABBBCBDCACBCCCDDADBDCDD22232425232425262425262725262728合計—400離差
離差平方
-3-2-10-2-101-10120123094104101101401494011/25/2022重復抽樣的樣本平均數(shù)及其離差(抽樣.
.
樣本平均數(shù)的抽樣平均誤差(用定義公式計算)(用應用公式計算)結論:第一,所有可能樣本平均數(shù)的平均數(shù)等于總體平均數(shù)
第二,樣本平均數(shù)的標準差(抽樣平均誤差)僅為總體標準差σ的即:11/25/2022..樣本平均數(shù)的抽樣平均誤差(用定義公式計算)(用.
.
其所有可能樣本及樣本平均日產(chǎn)量如下:在不重復抽樣條件下,所有可能樣本個數(shù):M=
4×3
=
12樣本
2224262822242628
—23242523—25262425—27252627—重復抽樣的樣本平均數(shù)及其離差(抽樣誤差)樣本序號樣本單位樣本平均數(shù)123456789101112ABACADBABCBDCACBCDDADBDC232425232526242527252627合計
—離差
-2-10-201-1020120300離差平方
4104011040142011/25/2022..其所有可能樣本及樣本平均日產(chǎn)量如下:.
.
樣本平均數(shù)的抽樣平均誤差(用定義公式計算)(用應用公式計算)結論:第一,所有可能樣本平均數(shù)的平均數(shù)等于總體平均數(shù),
第二,樣本平均數(shù)的標準差(抽樣平均誤差)僅為總體標準差σ的即:11/25/2022..樣本平均數(shù)的抽樣平均誤差(用定義公式計算)(用2.樣本成數(shù)的抽樣平均誤差
由于總體成數(shù)可以表現(xiàn)為是非標志(0,1)分布的平均數(shù),而且它的標準差也可以從總體成數(shù)推算出來,
因此,可以從樣本平均數(shù)的抽樣平均誤差和總體標準差的關系推出樣本成數(shù)的抽樣平均誤差的計算公式。(1)重復抽樣:(2)不重復抽樣:
注意:在實際計算抽樣平均誤差時,當總體成數(shù)P未知時,可用樣本成數(shù)p
來代替。即:11/25/20222.樣本成數(shù)的抽樣平均誤差由于總體成數(shù)可以表現(xiàn)為是非標志.
.
例:要估計某高校10000名在校生的近視率,現(xiàn)隨機從中抽取400名,檢查有近視眼的學生320名,試計算樣本近視率的抽樣平均誤差。(1)在重復抽樣條件下,樣本近視率的抽樣平均誤差為:解:根據(jù)已知條件:11/25/2022..例:要估計某高校10000名在校生的近視率(2)在不重復抽樣條件下,樣本近視率的抽樣平均誤差為:
計算結果表明,用樣本的近視率來估計總體的近視率其抽樣平均誤差為2%左右(即用樣本的近視率來估計總體的近視率其誤差的絕對值平均說來在2%左右)。11/25/2022(2)在不重復抽樣條件下,樣本近視率的抽樣平均誤差為:計(三)影響抽樣(平均)誤差大小的因素1.總體標準差σ(總體標志變異程度)2.樣本單位數(shù)3.抽樣方法4.抽樣的組織方式例如:要使抽樣誤差減少為原來的一半,則樣本容量將為原來的4倍。它與μ成正比例變化。它與μ成反比例變化。重復抽樣的μ總是大于不重復抽樣的μ。抽樣的組織方式不同,抽樣誤差也不同。11/25/2022(三)影響抽樣(平均)誤差大小的因素1.總體標準差σ(總體標抽樣極限誤差是指在一定概率下樣本指標與總體指標之間抽樣誤差的可允許范圍。三、抽樣極限誤差
抽樣極限誤差是從另外一個角度來考慮抽樣誤差的問題。一般情況下只進行一次具體的抽樣。所以,不能只研究抽樣平均誤差,還必須研究某一次具體抽樣的抽樣誤差的可能范圍,即抽樣極限誤差。11/25/2022抽樣極限誤差是指在一定概率下樣本指標與總體指標之間抽樣誤差的樣本平均數(shù)的抽樣極限誤差樣本成數(shù)的抽樣極限誤差在參數(shù)估計時,由于實際誤差無法計算,只能用抽樣平均誤差來反映抽樣誤差的大小。而某一次抽樣的實際誤差可能為正,也可能為負,其絕對值可能大于或小于抽樣平均誤差。抽樣極限誤差是抽樣誤差的可能范圍而非完全肯定的范圍。故這個可能范圍的大小與概率是緊密聯(lián)系的。11/25/2022樣本平均數(shù)的抽樣極限誤差樣本成數(shù)的抽樣極限誤差在參數(shù)
糧食總產(chǎn)量在20000×(400±5)公斤,即在790~810萬公斤之間。
例如,要估計某鄉(xiāng)糧食畝產(chǎn)量和總產(chǎn)量,從該鄉(xiāng)2萬畝糧食作物中抽取400畝,求得其平均畝產(chǎn)量為400公斤。如果確定抽樣極限誤差為5公斤,試估計該鄉(xiāng)糧食畝產(chǎn)量和總產(chǎn)量所在的置信區(qū)間。
即該鄉(xiāng)糧食畝產(chǎn)量的區(qū)間落在400±5公斤的范圍內(nèi),即在395~405公斤之間。11/25/2022糧食總產(chǎn)量在20000×(400±5)公斤,即在790~
又如,要估計某高校10000名在校生的近視率,現(xiàn)隨機從中抽取400名,計算的近視率為80%,如果確定允許誤差范圍為4%,試估計該高校在校生近視率所在的置信區(qū)間。
即該校學生近視率的區(qū)間將落在80%±4%的范圍內(nèi),即在76%~84%之間。11/25/2022又如,要估計某高校10000名在校生的近視率,現(xiàn)隨機從中四、抽樣估計的概率度和置信度
抽樣估計時,基于概率估計要求,抽樣極限誤差得相對數(shù)t,表示誤差范圍為抽樣平均誤差的t倍。,通常需要以抽樣平均誤差(一)抽樣估計的概率度11/25/2022四、抽樣估計的概率度和置信度抽樣估計時,基于概率估計要求
t是測量抽樣估計可靠程度的一個參數(shù),稱為抽樣誤差的概率度,即臨界值11/25/2022t是測量抽樣估計可靠程度的一個參數(shù),稱為抽樣誤差的概
如上例,已知某鄉(xiāng)糧食畝產(chǎn)量的標準差為σ=80公斤,總體單位數(shù)N=20000畝,樣本單位數(shù)n=400畝,求得其抽樣平均誤差為。如果確定抽樣極限誤差為5公斤,則,我們可以用概率度:表示抽樣極限的誤差范圍,即用1.25μx
來規(guī)定誤差范圍的大小。11/25/2022如上例,已知某鄉(xiāng)糧食畝產(chǎn)量的標準差為σ=80公斤,總體單(二)抽樣估計的置信度樣本指標隨著樣本的變動而變動,是個隨機變量,樣本指標與總體指標的誤差也是個隨機變量,并不能保證誤差不超過一定范圍這件事是必然的,而只能給以一定程度的概率保證,一般用F(t)表示,總體平均數(shù)抽樣估計的置信度(可靠程度):總體成數(shù)抽樣估計的置信度:11/25/2022(二)抽樣估計的置信度樣本指標隨著樣本的變動而變動,是個隨機在進行抽樣估計時,我們既希望抽樣估計的誤差盡可能小。置信區(qū)間越小,說明估計的精確性越高;置信區(qū)間越大,說明估計的精確性較低。同時又希望抽樣估計的把握程度(概率)盡可能大。但事實上著兩者往往是矛盾的。注意:(置信區(qū)間)(概率)用下圖表示:或11/25/2022在進行抽樣估計時,我們既希望抽樣估計的誤差盡可能小。置信區(qū)間68.27%95.45%99.73%當
t=1當t
=
2當
t
=
3概率用曲線下的面積表示11/25/202268.27%95.45%99.73%當t=1當t=常用的概率度t與相應的概率F(t)對應數(shù)值如下:概率度t11.651.9622.583概率F(t)0.68270.90000.95000.95450.990.9973可以看出:當確定的抽樣極限誤差愈大,則概率度t也就愈大,相應的概率也愈大,即樣本指標落在指定范圍的可能性也愈大;反之,則相應的概率就減少。
正態(tài)分布概率表(雙側)11/25/2022常用的概率度t與相應的概率F(t)對應數(shù)值如下:概率度t1五、參數(shù)估計方法
(一)點估計1、概念:點估計也稱定值估計,就是把樣本統(tǒng)計量直接作為總體參數(shù)的估計值。例:抽樣調查的方法調查某校學生的平均體重,從全部學生中隨機抽取的400名學生,測得他們的平均體重為58公斤,這時就把58公斤作為該校全部8000名學生的平均體重。2、優(yōu)點:簡單、直觀、可得到總體參數(shù)的具體估計值。11/25/2022五、參數(shù)估計方法(一)點估計1、概念:點估計也稱定值估計,3、點估計量的優(yōu)良標準(1)無偏性如果樣本統(tǒng)計量的數(shù)學期望等于所估計的總體參數(shù)的值,該樣本統(tǒng)計量稱作總體參數(shù)的無偏估計量。也就是說:11/25/20223、點估計量的優(yōu)良標準9/24/2022(2)一致性:要求用樣本估計量估計和推斷總體參數(shù)時要達到:樣本容量n充分大時,樣本估計量充分靠近總體參數(shù),即隨著n的無限增大,樣本估計量與未知的總體參數(shù)之間的絕對離差小于任意給定的正數(shù)的可能性趨近于1的概率,即幾乎是一定發(fā)生的。根據(jù)概率論中的大數(shù)定律可知:對于任意給定的正數(shù)有:11/25/2022(2)一致性:9/24/2022(3)有效性有效性要求樣本估計量估計和推斷總體參數(shù)時,作為估計量的標準差比其它估計量的標準差小。即:設是參數(shù)的兩個無偏估計量,若的方差比的方差小,則稱比有效。11/25/2022(3)有效性設是參數(shù)4.常用的總體參數(shù)的點估計量(1)總體平均數(shù)(均值)的點估計量是樣本均值
(2)總體標準差的點估計量是樣本標準差(3)總體成數(shù)的點估計量是樣本成數(shù)11/25/20224.常用的總體參數(shù)的點估計量9/24/2022(二)區(qū)間估計區(qū)間估計就是根據(jù)樣本統(tǒng)計量和抽樣極限誤差,以一定的概率保證程度估計總體參數(shù)的所在區(qū)間。概率保證程度稱為置信度、置信水平、置信概率:表達了參數(shù)區(qū)間估計的可靠性。:表達了參數(shù)區(qū)間估計的不可靠性。11/25/2022(二)區(qū)間估計區(qū)間估計就是根據(jù)樣本統(tǒng)計量和抽樣極限誤差,以一一般說來,在樣本容量一定的前提下,精確度與置信度往往是相互矛盾的:若置信度增加,則區(qū)間必然增大,降低了精確度;若精確度提高,則區(qū)間縮小,置信度必然減小。要同時提高估計的置信度和精確度,就要增加樣本容量。置信區(qū)間的直觀意義:若作為多次同樣的抽樣,將得到多個置信區(qū)間,其中有的區(qū)間包含了總體參數(shù)的真值,有的區(qū)間沒有包含總體參數(shù)的真值。為置信區(qū)間。11/25/2022一般說來,在樣本容量一定的前提下,精確度與置信度往往是相互矛【例】某公司有職工3000人,從中隨機抽取60人調查其工資收入情況。調查結果表明,職工的月平均工資為2350元,標準差為193元,月收入在2000元及以上職工40人。試以95.45%的置信水平推斷:(1)該公司職工月平均工資所在的范圍;(2)月收入在2000元及以上職工在全部職工中所占的比重。統(tǒng)計量(估計量、樣本指標)抽樣極限誤差(最大允許誤差)置信度(概率保證程度)區(qū)間估計要素11/25/2022【例】某公司有職工3000人,從中隨機抽取60人調查其工資收解(1)依題意計算如下:
∵F(z)=95.45%,∴查表得z=2計算結果表明,有95.45%的把握說該公司職工月平均工資在2300.66到2399.34元之間。11/25/2022解(1)依題意計算如下:∵F(z)=95.45%,∴查表得(2)月收入在2000元及以上職工在全部職工中所占的比重為:計算結果表明,有95.45%的把握說該公司月收入在2000元及以上職工占全部職工的比重在54.63%到78.71%之間。11/25/2022(2)月收入在2000元及以上職工在全部職工中所占的比重為:小結:區(qū)間估計的基本步驟:第一:根據(jù)樣本資料,計算出樣本平均數(shù)或樣本成數(shù)、標準差等;第二:計算抽樣平均誤差;第三:根據(jù)給定的置信度(概率),查正態(tài)分布概率表得到相應的臨界值(概率度);第四:計算抽樣極限誤差;第五:給出置信區(qū)間并說明其置信度。
11/25/2022小結:區(qū)間估計的基本步驟:9/24/2022課堂練習1:從某廠生產(chǎn)的5000只燈泡中,隨機不重復抽取100只,對其使用壽命進行調查,調查結果如下表:
又知該廠質量規(guī)定使用壽命在3000小時以下為不合格品。使用壽命(小時)產(chǎn)品數(shù)量(只)3000以下3000—40004000—50005000以上2305018合計100(1)按不重復抽樣方法,以95.45%的概率保證程度估計該批燈泡的平均使用壽命;(2)按不重復抽樣方法,以68.27%的置信度估計該批燈泡的合格率。11/25/2022課堂練習1:從某廠生產(chǎn)的5000只燈泡中,隨機不重復抽取10(1)
∵N
=
5000
n=
100
F(t)
=
95.45%
t
=
2使用壽命(小時)組中值產(chǎn)量3000以下3000—40004000—50005000以上25003500450055002305018500010500022500099000-1480-8401601160677120021168000128000024220800合計—100434000—53440000解:總體平均壽命所在的置信區(qū)間為:上限:下限:即可以95.45%的概率估計該批燈泡平均使用壽命在4195.3~4484.7小時之間。11/25/2022(1)∵N=5000n=100F(t)樣本合格率:
(2)
.∵
n1
=
98
n=
100
F(t)
=
68.27%
t
=
1樣本合格率的抽樣平均誤差:總體合格率所在的置信區(qū)間為:上限:下限:即可以68.27%的概率保證程度估計該批燈泡的合格率在96.6%~99.4%之間。11/25/2022樣本合格率:(2).∵n1=9課堂練習2:對某批成品按不重復抽樣方法抽選200件檢查,其中廢品8件,又知樣本容量為成品總量的(1/20)。以95%的把握程度估計該批成品的廢品率范圍。解:
N
=
4000
n=
200
n1=
8
F(t)
=
95%
t
=
1.96
總體成數(shù)所在區(qū)間的上下限為:上限:下限:
即可以95%的把握程度估計該批成品的廢品率范圍在1.35%~6.65%之間。11/25/2022課堂練習2:對某批成品按不重復抽樣方法抽選200件檢查,其中六、樣本容量的確定(一)影響必要樣本容量的因素1.各單位標志變異程度的大小。總體標志變異程度越大,要求樣本容量要大些;反之則相反。3.抽樣方法。在其他條件相同時,重復抽樣比不重復抽樣要求樣本容量大些。2.抽樣極限誤差的大小。抽樣極限誤差越大,要求樣本容量越小;反之則相反。4.抽樣的組織方式。5.抽樣推斷的概率保證程度的大小。概率越大,要求樣本容量越大;反之則相反。11/25/2022六、樣本容量的確定(一)影響必要樣本容量的因素1.各單位標(二)平均數(shù)的必要樣本容量
1.重復抽樣由公式得:
2.不重復抽樣由公式得:
11/25/2022(二)平均數(shù)的必要樣本容量由公式得:2.不重復抽樣由公(三)成數(shù)的必要樣本容量1.重復抽樣由公式可得:2.不重復抽樣由公式可得:11/25/2022(三)成數(shù)的必要樣本容量由公式可得:2.不重復抽樣由公概率度如用t表示,則四個公式如下:11/25/2022概率度如用t表示,則四個公式如下:9/24/2022【例】某批發(fā)站欲估算零售商販的平均每次進貨額,根據(jù)歷史資料進貨額的標準差為1000元,假定到批發(fā)站進貨的商販有2000人,若要求置信水平為99.73%,抽樣極限誤差不超過250元,應該抽取多大的樣本?解:沒有說明采用的抽樣方法,可按上述兩個公式分別計算其必要樣本容量,∵F(z)=99.73.%,∴z=3重復抽樣條件下的必要樣本容量:不重復抽樣條件下的必要樣本容量:11/25/2022【例】某批發(fā)站欲估算零售商販的平均每次進貨額,根據(jù)歷史資料進【例】某社區(qū)想通過抽樣調查了解居民參加體育活動的比率,如果把誤差范圍設定在5%,問如果以95%的置信度進行參數(shù)估計,需要多大的樣本?解:∵F(z)=95%,∴z=1.96根據(jù)公式得:=384.16≈385(人)
注意:題目中為什么用0.5來替代p?p(1-p)在p=0.5時取得極大值,證明很容易,當p未知時,就可以用0.5來替代。11/25/2022【例】某社區(qū)想通過抽樣調查了解居民參加體育活動的比率,如果把即應抽取625戶家庭進行調查。注意:小數(shù)只入不舍,對同一總體進行多項調查時,選n最大者以滿足共同需要。課堂練習3:某市開展職工家計調查,根據(jù)歷史資料該市職工家庭平均每人年收入的標準差為250元,而家庭消費的恩格爾系數(shù)(即家庭食品支出占消費總支出的比重)為65%?,F(xiàn)在用重復抽樣的方法,要求95.45%的概率保證下,平均收入的極限誤差不超過20元,恩格爾格系數(shù)的極限誤差不超過4%,求必要的樣本單位數(shù)。解:t
=
2
11/25/2022即應抽取625戶家庭進行調查。注意:小數(shù)只入不舍,對同一.
第四節(jié)抽樣調查的組織方式
一、簡單隨機抽樣二、分層抽樣三、等距抽樣四、整群抽樣五、多階段抽樣六、非概率抽樣11/25/2022.第四節(jié)抽樣調查的組織方式一、簡單隨機抽樣9(一)簡單隨機抽樣的概念
簡單隨機抽樣是不對總體作任何加工整理,直接從總體中隨機抽取調查單位的抽樣調查方法。簡單隨機抽樣是抽樣中最基本的方式,它適用于均勻總體。(二)簡單隨機抽樣的方法
具體有三種形式:適用于單位數(shù)較少的總體。1.抽簽法。適用于大規(guī)模的社會經(jīng)濟調查中,單位數(shù)目很大的總體。2.隨機數(shù)表法。一、簡單隨機抽樣
11/25/2022(一)簡單隨機抽樣的概念隨機數(shù)字表,是由0到9這十個數(shù)碼隨機排列組成的多位數(shù)字表。在使用前,先將總體的全部單位編號,并根據(jù)編號的位數(shù)確定使用表中數(shù)字的列數(shù);然后,從任意一行、任意一列、任意方向開始數(shù),遇到編號范圍內(nèi)的數(shù)字就作為樣本單位,超過編號范圍內(nèi)的數(shù)字就跳過去,直到抽夠樣本單位數(shù)目為止。3.計算機軟件中的隨機函數(shù)產(chǎn)生隨機數(shù)字11/25/2022隨機數(shù)字表,是由0到9這十個數(shù)碼隨機排列組成的多位數(shù)字表。9(三)簡單隨機抽樣的平均誤差
1.重復抽樣。2.不重復抽樣。11/25/2022(三)簡單隨機抽樣的平均誤差(一)類型抽樣的概念類型抽樣又稱分層抽樣或分類抽樣。它是按與研究目的有關的某個主要標志將總體單位劃分為若干層(也稱類、組或子總體),然后從各層中按隨機原則分別抽取一定數(shù)目的單位構成樣本。樣本平均數(shù):分層抽樣是應用于總體內(nèi)各單位在被研究標志上有明顯差別或差別懸殊的總體的抽樣。二、類型抽樣11/25/2022(一)類型抽樣的概念類型抽樣又稱分層抽樣或分類抽樣。它是按與(二)分層抽樣的優(yōu)點
1.它提高了樣本代表性;
2.降低了影響抽樣平均誤差的總體方差。它分為等比例抽樣和不等比例抽樣。(三)分層抽樣的方法
11/25/2022(二)分層抽樣的優(yōu)點重復抽樣的平均誤差:不重復抽樣的平均誤差:為各層(類)方差的平均數(shù)(四)分層抽樣的平均誤差11/25/2022重復抽樣的平均誤差:不重復抽樣的平均誤差:為各層(類)方差的
例:某鄉(xiāng)某種糧食播種面積20000畝,按平原和山區(qū)面積等比例抽取400畝組成樣本,各組平均畝產(chǎn)和各組方差如下表,求抽樣平均畝產(chǎn)和抽樣平均誤差,并以95%的概率估計該鄉(xiāng)全部播種面積平均畝產(chǎn)的置信區(qū)間。類型抽樣平均誤差計算表類型播種面積(畝)抽樣面積(畝)樣本平均畝產(chǎn)產(chǎn)(公斤)畝產(chǎn)方差(公斤)平原140002805606400山區(qū)600012035022500合計200004004971123611/25/2022例:某鄉(xiāng)某種糧食播種面積20000畝,按平原和山區(qū)面積等即可以95%的概率保證該鄉(xiāng)農(nóng)作物的平均畝產(chǎn)在486.71公斤至507.29公斤之間。解:N
=
N1
+N2n
=
n1
+n220000=
14000+
6000400=280+120=11236=5.2511/25/2022即可以95%的概率保證該鄉(xiāng)農(nóng)作物的平均畝產(chǎn)在486.71公斤?????
?????
??????????(一)等距抽樣的概念等距抽樣(機械抽樣、系統(tǒng)抽樣),它是先將總體單位按某一標志排隊,計算出抽樣間隔,并在第一個抽樣間隔內(nèi)確定一個抽樣起點,再按固定的順序和相同的間隔來抽選樣本單位。等距抽樣可分為無關標志排序抽樣和有關標志排序抽樣兩類。例如:N
=20n=
4三、等距抽樣11/25/2022???????????????無關標志抽樣。是指排序的標志與研究的標志無關。如:觀察學生考試成績,用姓氏筆劃排序;觀察產(chǎn)品的質量,按生產(chǎn)的先后順序等。它實質上相當于簡單隨機抽樣。有關標志抽樣。是指排序的標志與被研究標志相關。如:農(nóng)產(chǎn)品產(chǎn)量調查時,將地塊按過去連續(xù)幾年的畝產(chǎn)排序;家庭消費水平調查中,按收入額排序等。11/25/2022無關標志抽樣。是指排序的標志等距抽樣均為不重復抽樣,其平均誤差的計算可分為兩類:按無關標志排序時,按簡單隨機不重復抽樣平均誤差公式計算。按有關標志排序時,按類型抽樣的平均誤差公式計算。(二)等距抽樣的平均誤差
例:年終在某儲蓄所按定期儲蓄存款進行每隔5戶的等距抽樣,得到如下資料。試以95.45%的概率估計平均定期存款的范圍。定期存款(元)1-100100-300300-500500-800800以上合計戶數(shù)(戶)58150200621448411/25/2022等距抽樣均為不重復抽樣,其平均誤差的計算可分為兩類:按定期存款(元)1-100100-300300-500500-800800以上合計戶數(shù)(戶)581502006214484解:平均定期存款在327.6~360.4元之間,可靠程度為95.45%。11/25/2022定期存款(元)1-100100-300300-500500(一)整群抽樣的概念整群抽樣也稱分群抽樣或集團抽樣,它是將總體全部單位分為若干部分(每一部分稱為一個群,簡稱群),然后以群為單位從中隨機抽取部分群。對中選群中的所有單位進行全面調查的抽樣組織方式。100100100100100100100N
=1000R=
10(群)r=
3(群)
100100100四、整群抽樣11/25/2022(一)整群抽樣的概念整群抽樣也稱分群抽樣或集團抽樣,它是(二)整群抽樣的抽樣平均誤差
設總體中的全部單位劃為R群,每群中所包含單位數(shù)為m,現(xiàn)從群中隨機抽取r群組成樣本。則,各群的樣本平均數(shù):全樣本平均數(shù):整群抽樣一般為不重復抽樣,其抽樣誤差為:樣本群間方差:11/25/2022(二)整群抽樣的抽樣平均誤差設總體中的全部單位劃為R五、多階段抽樣
將總體進行多層次分組,然后依次在各層中隨機抽組,直到抽到總體單位,叫多階段抽樣。
如:我國農(nóng)產(chǎn)量調查就是采用多階段抽樣調查,即先從省中抽縣,然后從中選的縣抽鄉(xiāng),鄉(xiāng)中抽村,再由中選的村中抽地塊,最后從中選的地塊中抽取小面積的樣本單位。多階段抽樣實施條件:1、當抽樣調查的面很廣,沒有抽樣框,總體范圍太大無法直接抽取樣本時,需要采用多階段抽樣。2、可以相對地節(jié)約人力和物力。3、可以利用現(xiàn)成的行政區(qū)劃、組織系統(tǒng)作為劃分各階段的依據(jù),為抽樣調查提供方便。11/25/2022五、多階段抽樣一般在初級階段抽樣時多用分層抽樣和等距抽樣,在次級階段抽樣時多用等距抽樣和簡單隨機抽樣。同時,還可根據(jù)各階段不同特點,采用不同的抽樣比。如方差大的階段,抽樣比大一些,方差小的階段,抽樣比小一些。而且多階抽樣在簡化抽樣工作同時,抽樣單位的分布較廣,具有較強的代表性。多階段抽樣所劃分的抽樣階段數(shù)不宜過多,一般以劃分兩、三個階段,至多四個階段為宜。多階段抽樣的平均誤差計算比較復雜(略)。11/25/2022一般在初級階段抽樣時多用分層抽樣和等距抽樣,在次級階段抽樣上述五種抽樣屬于概率抽樣方式。優(yōu)點:第一,樣本具有客觀性;第二,能夠測定抽樣誤差指標并能對其大小加以控制。缺點:第一,沒有抽樣框就無法進行抽樣;第二,實施隨機抽樣,對操作過程要求嚴格,費時費力。11/25/2022上述五種抽樣屬于概率抽樣方式。優(yōu)點:9/24/2022優(yōu)點:操作方便,省時省力,若使用得當,抽樣調查同樣能獲得成功。缺點:非隨機抽樣無法判斷其誤差,難以檢查調查結果的準確性。主要形式(四種):
非概率抽樣是指不按隨機原則,而是由調查人員主觀確定樣本單位的抽樣方式。六、非概率抽樣11/25/2022優(yōu)點:非概率抽樣是指不按隨機原則,而是由調查人員主觀確定樣本(一)方便樣抽方便抽樣(任意抽樣、便利抽樣)是指調查人員根據(jù)自己的方便去選擇樣本的抽樣方式。理論依據(jù)是,認為被調查總體的每個單位都是相同的,因此把誰選為樣本進行調查,其調查結果都是一樣的。只有在調查總體中各個單位大致相同的情況下,才適宜應用任意抽樣法。任意抽樣法多用于市場初步調查或對調查情況不甚明了時采用。11/25/2022(一)方便樣抽方便抽樣(任意抽樣、便利抽樣)是指調查人員根據(jù)(二)判斷抽樣判斷抽樣是指根據(jù)調查人員的主觀經(jīng)驗來選定樣本的抽樣方式。判斷抽樣法具有簡便易行,符合調查目的和特殊需要,可以充分利用調查樣本的已知資料,被調查者配合較好,資料回收率高等優(yōu)點。但是,易發(fā)生主觀判斷失誤而產(chǎn)生的抽樣偏差。要發(fā)揮判斷抽樣法的積極作用,對總體的基本特征必須相當清楚,才可能使所選定的樣本具有代表性、典型性。11/25/2022(二)判斷抽樣判斷抽樣是指根據(jù)調查人員的主觀經(jīng)驗來選定樣本的(三)配額抽樣配額抽樣(定額抽樣)是指調查人員將調查總體按一定標志分類或分層,確定各類(層)單位的樣本數(shù)額,在配額內(nèi)任意抽選樣本的抽樣方式。配額抽樣和分層隨機抽樣相似之處,都是事先對總體中所有單位按其屬性、特征分類。它與分層抽樣區(qū)別是,分層抽樣是按隨機原則在層內(nèi)抽選樣本,而配額抽樣則是由調查人員在配額內(nèi)主觀判斷選定樣本。11/25/2022(三)配額抽樣配額抽樣(定額抽樣)是指調查人員將調查總體按一(四)推薦抽樣推薦抽樣(滾雪球抽樣)是調查人員先找到屬于調查對象中的部分人員,再請這些人員進行推薦,找到另外的符合條件的被調查者。這樣通過不斷的推薦,就能得到符合調查目的需要的調查單位數(shù)目。類似于滾雪球,越滾越大。主要用于對某些特殊群體的調查。調查人員對這些群體的成員不全部了解或熟悉,難以實施抽樣。11/25/2022(四)推薦抽樣推薦抽樣(滾雪球抽樣)是調查人員先找到屬于調查本章小結一、抽樣調查概述二、抽樣調查的數(shù)理基礎三、抽樣誤差與抽樣估計四、抽樣調查的組織方式11/25/2022本章小結一、抽樣調查概述9/24/2022一、簡答題1.什么是抽樣推斷?它有哪些特點和作用?2.重復抽樣和不重復抽樣有哪些不同點?為什么重復抽樣的誤差總是大于不重復抽樣的抽樣誤差?3.什么是抽樣平均誤差?影響抽樣誤差大小的因素有哪些?4.什么是抽樣極限誤差?什么是抽樣誤差的概率度?5.什么是置信度?什么是抽樣估計的準確性?他們之間有什么關系?6.抽樣估計的三要素是什么?抽樣估計的優(yōu)良性標準是什么?7.影響樣本容量的因素有哪些?本章練習題
11/25/2022一、簡答題1.什么是抽樣推斷?它有哪些特點和作用?本章練習題二、單項選擇題(在每小題的四個備選答案中選出一個正確的答案,并將正確答案的號碼填在題干后的括號內(nèi))
1.用簡單隨機抽樣方法抽取樣本單位,如果要使抽樣平均誤差降低50%,則樣本容量需要提高到原來的()。
A、4倍B、5倍C2倍D、3倍
2.抽樣平均誤差反映了樣本指標與總體指標之間的()A、實際誤差B、實際誤差的絕對值C、平均誤差程度D、可能誤差范圍11/25/2022二、單項選擇題(在每小題的四個備選答案中選出一個正確的答案,3、在其他條件不變的情況下,提高抽樣估計的可靠程度,其抽樣估計的準確性將()A、保持不變B、隨之擴大C、隨之縮小D、無法確定A、重置抽樣B、機械抽樣C、不重置抽樣D、分類抽樣4、從總體中隨機抽取樣本,當抽出一個單位將其序號和標志值記下后,又將其放回到原來的總體中。此抽樣方法稱為()11/25/20223、在其他條件不變的情況下,提高抽樣估計的可靠程度,其抽樣估三、多項選擇題(從每小題的五個備選答案中選出二至五個正確答案,并將正確答案的號碼分別填寫在題干后的括號內(nèi))
1、影響抽樣誤差的因素有()()()()()A、是有限總體還是無限總體B、是變量總體還是屬性總體
C、是重復抽樣還是不重復抽樣D、抽樣單位數(shù)的多少E、總體被研究標志的變異程度11/25/2022三、多項選擇題(從每小題的五個備選答案中選出二至五個正確答案2、在其他條件不變時,抽樣極限誤差的大小和置信度的關系是()()()()()A、抽樣極限誤差的數(shù)值愈大,則置信度愈大B、抽樣極限誤差的數(shù)值愈小,則置信度愈小C、抽樣極限誤差的數(shù)值愈小,則置信度愈大D、成正比關系E、成反比關系3、抽樣法可應用在()()()()()A、對抽選的單位進行全面調查B、對電視機使用壽命的檢查C、對產(chǎn)品的質量進行控制
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 肺全切除術護理常規(guī)
- 銷售助理培訓總結
- 面肌痙攣治療
- 風濕性心臟病患者的護理
- AIGC商業(yè)應用實戰(zhàn)教程 課件 6-2 AIGC商業(yè)圖像衍生應用
- 膽道殘余結石治療
- 康復行業(yè)研究報告
- 資產(chǎn)相關業(yè)務培訓
- 零售商業(yè)環(huán)境分析表格
- 茶樓服務禮儀培訓
- 2025年安全員C證(專職安全員)考試題庫
- 地理-天一大聯(lián)考2025屆高三四省聯(lián)考(陜晉青寧)試題和解析
- 2025年廣州市公安局招考聘用交通輔警200人高頻重點模擬試卷提升(共500題附帶答案詳解)
- 貴州省貴陽市2024-2025學年九年級上學期期末語文試題(含答案)
- 2025年江蘇海事職業(yè)技術學院高職單招職業(yè)適應性測試近5年??及鎱⒖碱}庫含答案解析
- 計件工資計算表格模板
- 兩癌防治知識培訓
- 《moldflow學習資料》課件
- 2025中國移動安徽分公司春季社會招聘高頻重點提升(共500題)附帶答案詳解
- 2024年吉安職業(yè)技術學院單招職業(yè)技能測試題庫附答案
- 湖南省對口招生考試醫(yī)衛(wèi)專業(yè)試題(2024-2025年)
評論
0/150
提交評論