樣本量的確定.ppt_第1頁(yè)
樣本量的確定.ppt_第2頁(yè)
樣本量的確定.ppt_第3頁(yè)
樣本量的確定.ppt_第4頁(yè)
樣本量的確定.ppt_第5頁(yè)
已閱讀5頁(yè),還剩83頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、樣本量的確定,本講主要內(nèi)容,如何計(jì)算簡(jiǎn)單隨機(jī)抽樣的樣本量確定 如何實(shí)現(xiàn)分層抽樣中各層樣本單位數(shù)的分配,樣本容量的確定,樣本量=費(fèi)用+精度 (函數(shù)),確定樣本容量,需要處理好預(yù)定的精度與現(xiàn)有經(jīng)費(fèi),同時(shí)也要考慮資源和時(shí)間等限制條件,最終的樣本量確定是在上述因素之間的權(quán)衡關(guān)系。,分層抽樣分配樣本的標(biāo)準(zhǔn),總的樣本容量事先確定 估計(jì)值要求達(dá)到的精度預(yù)先給定,影響調(diào)查樣本容量的因素,調(diào)查估計(jì)值所希望達(dá)到的精度 調(diào)查估計(jì)值所能允許的誤差。 估計(jì)量的抽樣方差較小,估計(jì)值是精確的 估計(jì)值的精度越高,所需的樣本容量就越大 影響精度的因素也同樣影響著樣本容量的大小 所研究指標(biāo)在總體中的變異程度 總體的大小 樣本設(shè)計(jì)

2、和所使用的估計(jì)量 無(wú)回答率,客戶提供的經(jīng)費(fèi)能支持多大容量的樣本 整個(gè)調(diào)查持續(xù)的時(shí)間有多長(zhǎng) 調(diào)查需要多少訪員 能招聘到的訪員有多少,除了估計(jì)值的精度以外,調(diào)查實(shí)際操作的限制條件也許是影響樣本容量的最大因素。,1給定精度水平下樣本容量的確定,樣本容量的大小與調(diào)查估計(jì)值所要求的精度緊密相關(guān),數(shù)據(jù)是通過(guò)抽樣而不是普查收集的,就會(huì)產(chǎn)生抽樣誤差。 精度是由抽樣方差來(lái)測(cè)量的。 隨著樣本容量的增加,調(diào)查估計(jì)值的精度也會(huì)不斷提高。,標(biāo)準(zhǔn)誤差 誤差界限 變異系數(shù),抽樣方差的幾種計(jì)量方法,抽樣調(diào)查中樣本容量的確定,也經(jīng)常會(huì)使用一種或多種這樣的計(jì)量方法來(lái)對(duì)精度進(jìn)行說(shuō)明。,非抽樣誤差,非抽樣誤差會(huì)對(duì)調(diào)查估計(jì)值的精度產(chǎn)生

3、顯著的影響 非抽樣誤差的大小與樣本容量的大小卻沒(méi)有很大的關(guān)系 確定樣本容量,就不必將這些誤差作為影響因素加以考慮 為確保調(diào)查結(jié)果的準(zhǔn)確性,應(yīng)該消除非抽樣誤差,至少應(yīng)盡可能使之最小化,由于我們將在某一給定誤差界限下,闡述樣本容量確定的過(guò)程,所以有必要復(fù)習(xí)一下置信區(qū)間的概念。,對(duì)于具有正態(tài)分布的估計(jì)量來(lái)說(shuō),95%的置信區(qū)間意味著在同樣的條件下,反復(fù)抽樣100次所得的100個(gè)樣本中,有95個(gè)樣本的估計(jì)值所確定的區(qū)間包含總體真值,這個(gè)區(qū)間以樣本的估計(jì)值為中心,半徑為1.96倍的標(biāo)準(zhǔn)誤差。,置信區(qū)間,2誤差界限,誤差界限是標(biāo)準(zhǔn)誤差的倍數(shù) 標(biāo)準(zhǔn)誤差是估計(jì)量抽樣方差的平方根 乘數(shù)因子取決于在調(diào)查估計(jì)中所希望

4、 達(dá)到的置信水平(或稱置信度),對(duì)于估計(jì)值 t, 在給定其標(biāo)準(zhǔn)誤差 t的情況下, 置信區(qū)間的公式可以表示為:(t-zt t+zt),這里 zt是誤差界限, z是對(duì)應(yīng)于某一置 信水平的標(biāo)準(zhǔn)正態(tài)分布的分位點(diǎn)值 該z值可從標(biāo)準(zhǔn)正態(tài)分布表中查得,大多 數(shù)統(tǒng)計(jì)學(xué)教材中都附有這樣的統(tǒng)計(jì)表,常用的z值包括,對(duì)于 90% 的置信度,對(duì)應(yīng)的z值為 1.64 對(duì)于 95% 的置信度,對(duì)應(yīng)的z值為 1.96 對(duì)于 99% 的置信度,對(duì)應(yīng)的z值為 2.56,3多大的抽樣方差是可接受的,調(diào)查估計(jì)值能容忍多大的不確定性?。 常用的95%的置信度、5%的誤差界限對(duì)我們的 調(diào)查目標(biāo)是否適宜 估計(jì)值是否需要更高(或更低)精度

5、如果調(diào)查結(jié)果將用于進(jìn)行一項(xiàng)有重大意義或有較大風(fēng)險(xiǎn)的決策, 那么,估計(jì)值可能需要較高的精度; 如果我們只是簡(jiǎn)單地希望取得所研究總體某個(gè)特征的感性認(rèn)識(shí), 那么,稍低一點(diǎn)的精度就可以滿足要求了,多大抽樣方差是可以接受,是否需要對(duì)調(diào)查的子總體(或稱作域)進(jìn)行估計(jì)? 調(diào)查結(jié)果可能需要包括一些細(xì)分的數(shù)據(jù) 這些數(shù)據(jù)稱為子總體估計(jì)值(或域估計(jì)值) 為使數(shù)據(jù)滿足調(diào)查要求,應(yīng)該確定合適的精度 與調(diào)查估計(jì)值有關(guān)的抽樣方差有多大?,對(duì)于不同的子總體,對(duì)精度的要求可能有所不同 例如,在一次全國(guó)范圍的抽樣調(diào)查中,對(duì)國(guó)家層次的數(shù)據(jù),調(diào)查主辦者可能需要3%的誤差界限;但對(duì)于省級(jí)層次的估計(jì)值,5%的誤差界限可能就可以滿足要求;

6、 而對(duì)于省級(jí)以下層次的估計(jì)值,10%的誤差界限可能就足夠了。,在這種情況下,通常對(duì)每個(gè)研究域都進(jìn)行分層, 并單獨(dú)計(jì)算各層的樣本容量 將各個(gè)研究域中所有層的樣本容量相加,便得到 了調(diào)查所需的總樣本容量,調(diào)查估計(jì)值有關(guān)的抽樣方差有多大,為達(dá)到調(diào)查結(jié)果要求的精度,最小的調(diào)查估計(jì)值是什 么?假設(shè)我們進(jìn)行比例估計(jì)。其中,一些指標(biāo)的比例 可能是P=50%或更高,但是其它指標(biāo)的比例則可能較 低,如P=5% 或者 P=10% 事實(shí)上,P可以是P=0 到 P=1.0之間的任一數(shù)值。在確 定調(diào)查估計(jì)值所需的精度時(shí),應(yīng)該考慮當(dāng)某個(gè)既定精 度達(dá)到時(shí)所得的最小估計(jì)值。如果最小的估計(jì)值是 P=5%,那么誤差界限就應(yīng)該小于

7、5%。,例如: 某公司決定,如果公司所在的地區(qū)中,至少有P=4%的人群對(duì)某一種產(chǎn)品存在需求,那么該公司就決定生產(chǎn)這種產(chǎn)品。因此,該公司的市場(chǎng)調(diào)研部準(zhǔn)備對(duì)當(dāng)?shù)氐木用褚豁?xiàng)調(diào)查,以便估計(jì)他們?cè)谶@種產(chǎn)品上的消費(fèi)需求。 對(duì)于P=4%5%水平左右的調(diào)查估計(jì)值就不太合適,應(yīng)規(guī)定更小的誤差界限,如小于或等于0.01、 0.02等,這時(shí)候置信區(qū)間應(yīng)該是( 0.05 0.01) 或( 0.05 0 .02)。,Table 1 樣本容量和在P=0.5時(shí)運(yùn)用簡(jiǎn)單隨機(jī)抽樣估計(jì)P值得到的誤差界限,最佳的解決辦法,不應(yīng)為追求最小的誤差界限而選擇最大可能的樣本 可以接受一個(gè)較大的誤差界限,同時(shí)有效地利用現(xiàn)有資源 在此基礎(chǔ)上,

8、獲得具有相對(duì)較高精度的估計(jì)結(jié)果 采用一個(gè)較小的樣本而不是大樣本而節(jié)省下來(lái)的費(fèi)用, 可以用來(lái)修正其它影響調(diào)查結(jié)果精度的因素 例如減少無(wú)回答率(如回訪拒答者、實(shí)施小型的試點(diǎn)調(diào)查、 培訓(xùn)訪員,等等),這樣做可能更有效率,4總體的變異程度,調(diào)查總體中,我們所研究的項(xiàng)目或指標(biāo),對(duì)于不同的個(gè)人、住戶或企業(yè),得到的估計(jì)結(jié)果可能會(huì)有很大的不同。雖然我們不能控制這種變異性,但它的大小卻影響到了給定精度水平下,研究項(xiàng)目所必需的樣本容量。,我們來(lái)看假設(shè)有一個(gè)首次開(kāi)展的調(diào)查,試圖估計(jì)對(duì)某企業(yè)提供的服務(wù)持滿意態(tài)度的顧客比例。對(duì)“顧客滿意”這一指標(biāo),設(shè)置兩個(gè)可能的值:滿意或者不滿意。,表2 列出了持滿意和不滿意態(tài)度的顧客

9、可能占的比例的組合,要精確地測(cè)量總體中具有高度變異性或不 經(jīng)常出現(xiàn)的特征是很困難的。 要對(duì)這樣的變量提供精確的估計(jì)值,需要 較大的樣本容量。 當(dāng)研究的特征具有最大的變異程度時(shí),調(diào) 查需要的樣本容量也最大。 對(duì)于只取兩個(gè)值的特征,則當(dāng)這兩個(gè)值在 總體中以5050的比例出現(xiàn)時(shí),特征的變 異程度最大。,總體的變異程度,如果所研究特征的真實(shí)變異程度大于確定 樣本容量時(shí)我們估計(jì)的變異程度,那么, 調(diào)查估計(jì)值的精度就會(huì)低于期望的精度。 相反,如果所研究特征的真實(shí)變異程度與 我們所估計(jì)的變異程度相比要小,那么, 與調(diào)查目標(biāo)所要求的估計(jì)值相比,抽樣調(diào) 查得到的估計(jì)值會(huì)更加精確。,確保達(dá)到調(diào)查要求的精度,對(duì)某一

10、特征的總體變異程度進(jìn)行保守估計(jì) 如果事先不知道調(diào)查中要測(cè)量特征變異程度的 數(shù)據(jù),假定研究特征具有最大的變異程度 對(duì)于只有兩個(gè)可能取值的變量,應(yīng)該假設(shè)總體 中該變量的變異程度為兩個(gè)取值5050平分。,建議在計(jì)算所需樣本容量,多個(gè)測(cè)量的指標(biāo),抽樣調(diào)查時(shí),測(cè)量指標(biāo)(或稱項(xiàng)目,特征) 通常不止一個(gè),有時(shí)數(shù)目是很大的 每個(gè)指標(biāo)的變異程度可能都不相同 對(duì)某一指標(biāo)來(lái)說(shuō)足夠大的樣本,對(duì)變異程度 較大的另一個(gè)指標(biāo)來(lái)說(shuō)可能就有些偏小 為確保樣本容量對(duì)所有的研究指標(biāo)都足夠大, 應(yīng)該根據(jù)具有最大變異程度或被認(rèn)為最重要 的那個(gè)指標(biāo),確定樣本容量。,5.總體的大小,總體所起的作用視它規(guī)模的大小而有所差異 小規(guī)模總體的大小

11、將起重要作用 對(duì)于中等規(guī)模的總體,其作用中等重要 大總體的規(guī)模對(duì)樣本容量確定則不起作用,在樣本容量確定的過(guò)程中,表3: 顯示了不同規(guī)模的總體在P=0.5時(shí),使用簡(jiǎn)單隨機(jī)抽樣,且以誤差界限為0.05、置信度為95%的標(biāo)準(zhǔn)估計(jì)P 所需的樣本容量,對(duì)于小規(guī)??傮w,通常必須調(diào)查較大比例的樣本,以取得所期望的精度。因此,實(shí)際操作中,對(duì)小規(guī)??傮w經(jīng)常采用普查而不是抽樣調(diào)查。,計(jì)算樣本容量時(shí),通常假定采用的抽樣方式為簡(jiǎn)單隨機(jī)抽樣(SRS)。所以,如果樣本容量計(jì)算公式假定為簡(jiǎn)單隨機(jī)抽樣。,6樣本設(shè)計(jì)和估計(jì)量,分層抽樣得到的估計(jì)值通常比相同規(guī)模的簡(jiǎn)單隨機(jī)抽樣更精確,或者至少 一樣精確。 整群抽樣得到的估計(jì)值,其

12、精度通常低于使用同一估計(jì)量進(jìn)行估計(jì)時(shí)的簡(jiǎn)單隨機(jī)抽樣的估計(jì)值的精度,設(shè)計(jì)效果因子,一般來(lái)說(shuō),當(dāng)樣本容量的計(jì)算公式假定為簡(jiǎn)單隨機(jī)抽樣SRS,但使用的是更復(fù)雜的選樣方式時(shí),達(dá)到既定精度所需的樣本容量應(yīng)該乘以設(shè)計(jì)效果因子。,設(shè)計(jì)效果=對(duì)于同樣規(guī)模的樣本容量,給定樣本設(shè)計(jì)下 估計(jì)量的抽樣方差對(duì)簡(jiǎn)單隨機(jī)抽樣估計(jì)量的 抽樣方差的比率。,對(duì)于簡(jiǎn)單隨機(jī)抽樣設(shè)計(jì),設(shè)計(jì)效果 = 1 對(duì)于分層抽樣設(shè)計(jì),設(shè)計(jì)效果 1 對(duì)于整群抽樣設(shè)計(jì),設(shè)計(jì)效果 1,7回答率,所有的調(diào)查都會(huì)遇到無(wú)回答的困擾即: 由于某些原因,不能獲得被抽中樣本單位的信息 當(dāng)一個(gè)被調(diào)查單位的所有或幾乎所有的數(shù)據(jù)都缺 失時(shí),我們就稱之為完全無(wú)回答(或稱單位

13、無(wú)回答) 某次調(diào)查的回答率是用調(diào)查得到的有效問(wèn)卷數(shù)占 預(yù)期樣本容量的一個(gè)百分比來(lái)表示的 完全無(wú)回答會(huì)減少有效樣本的數(shù)量,從而會(huì)增加 抽樣誤差,并進(jìn)而降低估計(jì)值的精度,例如,如果初始樣本容量是400,而通過(guò)上述途徑估計(jì)的回答率為75%,那么選擇的樣本容量就應(yīng)該為:,根據(jù)預(yù)計(jì)的回答率調(diào)整樣本容量,一個(gè)最簡(jiǎn)單的例子 沒(méi)有無(wú)回答的簡(jiǎn)單隨機(jī)抽樣樣本容量的計(jì)算公式,簡(jiǎn)單隨機(jī)抽樣下,通常使用誤差界限和估計(jì)量的標(biāo)準(zhǔn)誤來(lái)確定所需的樣本容量。,在無(wú)放回簡(jiǎn)單隨機(jī)抽樣情況下 總體均值估計(jì)量的標(biāo)準(zhǔn)誤差的表達(dá)式,其中,S 是總體的標(biāo)準(zhǔn)差,如果誤差界限設(shè)為e,那么:,解n,得:,這里Z是對(duì)應(yīng)于某一置信水平的標(biāo)準(zhǔn)正態(tài)分布的分

14、位點(diǎn)值。,其中,總體方差S2是最不容易得到的,通常需要根據(jù)過(guò)去對(duì)類似總體所做的研究作近似計(jì)算。,為確定n,需要知道,期望的誤差界限e 置信水平 對(duì)應(yīng)的標(biāo)準(zhǔn)正態(tài)分布的分位點(diǎn)值 Z 總體規(guī)模 N 總體方差 S2,求比例樣本容量的確定,下面用一個(gè)例子,說(shuō)明估計(jì)比例問(wèn)題時(shí)樣本容量的確定過(guò)程。 在這一例子中,所需的精度是根據(jù)誤差界限確定的,所研究的指標(biāo)取兩個(gè)值,即P和1-P。,在這種情況下,對(duì)于大總體,且估計(jì)量服從正態(tài)分布時(shí), P的總體方差為:,若總體真值已知,那么直接將它代入上面的等式 就可以得到樣本容量 若總體真值未知,而且也沒(méi)有以前的信息可以利 用,那么可以P=0.5 用,因?yàn)檫@時(shí)的方差最大, 可

15、以求得一個(gè)比較保守的樣本容量,計(jì)算比例估計(jì)樣本容量的詳細(xì)步驟,先計(jì)算初始樣本容量,然后根據(jù)總體的大小、設(shè)計(jì)效果和回答率分別對(duì)它進(jìn)行調(diào)整,最后求得最終的樣本容量。,第1步:計(jì)算初始樣本容量,注意,公式(1)使用了有限總體校正因子n/N,對(duì)總體規(guī)模進(jìn)行校正。如果忽略這個(gè)因子,初始樣本容量n1就可以按下列公式計(jì)算:,如果e 和 P都不用比例表示,而用百分?jǐn)?shù)表示, n1 的計(jì)算公式同樣成立。,第2步:使用下列等式對(duì)總體的大小進(jìn)行調(diào)整,第3步:設(shè)計(jì)效果調(diào)整樣本容量,如果樣本設(shè)計(jì)不是采用簡(jiǎn)單隨機(jī)抽樣,那么可以使用下列公式,即用抽樣設(shè)計(jì)效果對(duì)樣本容量進(jìn)行調(diào)整 :,其中,是設(shè)計(jì)效果,并且有: 在簡(jiǎn)單隨機(jī)抽樣設(shè)

16、計(jì)下,B = 1, 在分層抽樣設(shè)計(jì)下, B 1, 在整群抽樣設(shè)計(jì)下, B 1。,根據(jù)無(wú)回答再次進(jìn)行調(diào)整,以確定最終的樣本容量n,其中, r = 估計(jì)的回答率。,第4步:無(wú)回答調(diào)整樣本容量,樣本容量確定的例子,下面用實(shí)例說(shuō)明樣本容量的計(jì)算過(guò)程 。 例 1. 某雜志出版商希望得到讀者對(duì)該雜志綜合滿意程度的估計(jì)值。通過(guò)郵寄調(diào)查,出版商可以聯(lián)系到所有的2500個(gè)訂戶。但是,由于時(shí)間的限制,出版商決定使用簡(jiǎn)單隨機(jī)抽樣進(jìn)行電話調(diào)查。請(qǐng)問(wèn)應(yīng)訪問(wèn)多少個(gè)讀者 ?,如果真實(shí)的總體比例落在總體比例的樣本估計(jì)值的0.10范圍內(nèi),則該出版商將感到滿意。 換句話說(shuō),誤差界限e為0.10 。 出版商希望調(diào)查估計(jì)值的置信度為

17、95%,這就意味著20次抽樣中只有1次,所得的樣本估計(jì)值確定的置信區(qū)間不包含總體真值P,而且,Z=1.96。 使用簡(jiǎn)單隨機(jī)抽樣SRS。 估計(jì)回答率為65% ,即r =0.65。 由于事先沒(méi)有關(guān)于顧客滿意度真實(shí)比例P 的可利用的信息,因此,我們假定方差取最大的情況,即假設(shè) P=0.5。,假 設(shè),樣本容量的計(jì)算步驟,第 1步:計(jì)算初始樣本容量n1,注意,隨著P 趨向0.50,P(1-P) 的值將達(dá)到最大值,因此選擇P=0.5,可得到最保守的n1的估計(jì)值。,第 2步:調(diào)整初始樣本容量,將總體的大小這一影響樣本容量確定的因素也考慮進(jìn)來(lái) 。,(記住,這一步只適于小規(guī)??傮w以及中等規(guī)模的總體),第3步:

18、根據(jù)抽樣設(shè)計(jì)效果來(lái)調(diào)整樣本容量,對(duì)這個(gè)例子來(lái)說(shuō),由于假設(shè)使用簡(jiǎn)單隨機(jī)抽樣設(shè)計(jì),所以取 B= 1。,第4步:根據(jù)無(wú)回答情況進(jìn)行調(diào)整 確定最終的樣本容量n,例 2. 現(xiàn)準(zhǔn)備實(shí)施一項(xiàng)民意調(diào)查,以決定贊成建立一個(gè)公園的居民的比例。總體由所有在兩個(gè)城市和一個(gè)農(nóng)村地區(qū)居住的、年齡在18歲及以上的居民組成。通過(guò)從每個(gè)城市或農(nóng)村中各抽取一個(gè)簡(jiǎn)單隨機(jī)樣本,可以得到一個(gè)分層隨機(jī)樣本。 問(wèn) 每一層需要多大的樣本容量?,總體的單位數(shù)為 657,500 總體在各層的分布情況如下:,所需要的樣本容量取決于調(diào)查對(duì)數(shù)據(jù)的具體要求, 為此,可以考慮以下兩個(gè)方案。,方案一,假設(shè)不需要得到各個(gè)層估計(jì)值的精度,而且如果整個(gè)地區(qū)的估計(jì)

19、值達(dá)到95%的置信度、5%的誤差界限,就認(rèn)為估計(jì)值足夠可靠了。由于沒(méi)有整個(gè)地區(qū)贊成建立省級(jí)公園居民比例的真值,所以我們假設(shè)P=0.5,預(yù)計(jì)回答率為50%。,計(jì)算過(guò)程如下: 第 1步:計(jì)算初始樣本容量n,第 2步:計(jì)算初步修正的樣本容量n2,(注意:如果 n1 /N 可以忽略不計(jì), 則可取 n2=n1),第 3步:根據(jù)設(shè)計(jì)效果,再次進(jìn)行調(diào)整n3,對(duì)于分層隨機(jī)抽樣,通常 B 1。 但這里,由于沒(méi)有可利用的B的估計(jì)值,因此,取B= 1 得到保守(即更大)的樣本容量。,第4步:根據(jù)無(wú)回答情況 確定最終的樣本容量n,即根據(jù)該方案,調(diào)查所需的樣本容量為 768。,方案 二,假設(shè)對(duì)每一層,都要求得到誤差界限

20、為0.05、置信度為95%的估計(jì)結(jié)果,那么就需要單獨(dú)計(jì)算各層的樣本容量(即將每一層作為一個(gè)總體,估計(jì)調(diào)查所需的樣本容量)。,計(jì)算之前,考慮到城市1和城市2是大總體,因而可以認(rèn)為,對(duì)它們來(lái)說(shuō),總體的大小對(duì)樣本容量的確定沒(méi)有影響。由此,如果第1、2層中的取值與案例1相同,就可以認(rèn)為這兩層需要的樣本容量都是768。然而,對(duì)于農(nóng)村地區(qū),由于總體是小規(guī)模的,因此總體的大小對(duì)該層樣本容量的確定會(huì)產(chǎn)生一定的影響。,計(jì)算步驟如下:,城市 1,由于,可以認(rèn)為,所以,城市 2,因?yàn)槌鞘?也是一個(gè)大城市,所以,同樣可以忽略有限總體校正因子對(duì)樣本容量的影響:,農(nóng)村地區(qū),因此, 方案2所需的總樣本容量為 768 + 7

21、68 + 732 = 2,268。,比較方案2的總樣本容量2,268和方案1的樣本容量768,可以發(fā)現(xiàn)方案2的樣本容量幾乎是方案1樣本容量的3倍之大。 換句話說(shuō),如果僅僅需要得到包含所有層的整個(gè)總體的估計(jì)值,那么要求的樣本容量將大大小于需要分別對(duì)各層進(jìn)行估計(jì)時(shí)所需的樣本容量。 因?yàn)閷?duì)各層分別進(jìn)行估計(jì)時(shí),需要確保使每一層的樣本容量都足夠大。,兩種方案比較,例2 清楚地說(shuō)明了要求對(duì)各研究域分別進(jìn)行估計(jì)時(shí),審查每一層精度要求的重要性。 但如果調(diào)查涉及到許多研究域,這一要求可能會(huì)使總的樣本容量顯著增大,并可能導(dǎo)致樣本容量超出調(diào)查研究者的預(yù)算和現(xiàn)有資源的承受能力。 一般來(lái)說(shuō),要求估計(jì)的研究域越多,所需要

22、的樣本容量也就越大。 因此,可能需要在精度與費(fèi)用之間進(jìn)行折衷,以保證估計(jì)的誤差在可接受的范圍之內(nèi)。 通過(guò)增大每一層估計(jì)值的允許誤差,或合并其中兩個(gè)或多個(gè)域,就可以使精度和費(fèi)用達(dá)成權(quán)衡。,分層抽樣的樣本分配,決定分層抽樣效率的一個(gè)重要因素是樣本單位在層間的分配方式。,分層抽樣設(shè)計(jì),主要理由: 使抽樣方案的效率高于簡(jiǎn)單隨機(jī)抽樣或系統(tǒng)抽樣。 確保對(duì)要進(jìn)行分析的特定研究域有足夠的樣本量, 以便進(jìn)行分析。 避免抽到一個(gè)“差的”樣本。,采用分層抽樣時(shí),總體被分為同質(zhì)的、互不重疊的幾個(gè)子總體(層)。然后,在每一個(gè)層中獨(dú)立地抽取樣本??梢允褂萌魏我环N抽樣方法來(lái)對(duì)每個(gè)層進(jìn)行抽樣,從比較簡(jiǎn)單的方法如簡(jiǎn)單隨機(jī)抽樣、

23、系統(tǒng)抽樣,到較復(fù)雜的方法如概率與大小成比例的抽樣(PPS)、整群抽樣、多階段抽樣或多相抽樣。,包含N個(gè)單位的總體,被分成大小分別為: N1,N2,NL的L個(gè)互不重疊的子總體(層)。 其中:N=N1+N2+NL。 從每層中分別獨(dú)立抽取一個(gè)樣本,各層內(nèi)樣本容量 分別為nh(h=1,2,L)。 其中: n=n1+n2+nL。,分層抽樣分配樣本的標(biāo)準(zhǔn),固定樣本容量:先確定總的樣本容量,然后 再在層間分配樣本。 固定變異系數(shù):先根據(jù)預(yù)定的精度,確定每 層所需樣本容量,然后將各層的樣本容量加 總得到總的樣本容量。,固定樣本容量,第一步:確定總的樣本容量n 第二步:計(jì)算分配給第h層的樣本比例ah ah=nh

24、/n 0ah1 且 第三步:計(jì)算第h層的樣本容量 nh=nah,給定變異系數(shù)C下總樣本容量n的計(jì)算,Nh 是第h層單位總數(shù) Sh2是第h層單位yi的真實(shí)方差 C 是Y的總體變異系數(shù) Y 是總體總值的真值 ah 是分配給第h層的樣本比例,分配方法,按比例分配 不按比例分配,按比例分配,每一層的樣本容量nh與該層的總體規(guī)模Nh的 比例相同,即各層的抽樣比f(wàn)h=nh/Nh是相同的 ,并等于總的抽樣比n/N。 層的規(guī)模越大,分配的樣本容量越就越多。,例2方案1中,計(jì)算總樣本容量=768,按比例分配方法的各層樣本容量確定如下:,第一步:計(jì)算各層的分配因子ah,城市1 城市2 農(nóng)村,第二步:計(jì)算各層樣本容量nh,城市1 城市2 農(nóng)村,各層抽樣比相等,均為0.0012,得到一個(gè)自加權(quán)的樣本設(shè)計(jì)。,不按比例分配,采用不按比例分配方案時(shí),各層之間的抽樣比不相同。,Y-比例分配 平方根N-比例分配 平方根Y-比例分配 最優(yōu)分配 內(nèi)曼最優(yōu)分配 層方差相等最優(yōu)分配,Y-比例分配,每層的分配因子ah等于該層規(guī)模度量與總體規(guī)模度量的比率。在總體估計(jì)值Y是規(guī)模度量時(shí)使用。,平方根N-比例分配,

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論