版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、2022-2-101第三章分層隨機(jī)抽樣第三章分層隨機(jī)抽樣 3.1 概述概述 3.2簡(jiǎn)單估計(jì)量及其性質(zhì)簡(jiǎn)單估計(jì)量及其性質(zhì) 3.3樣本量在各層的分配樣本量在各層的分配 3.4 回歸估計(jì)量及其性質(zhì)回歸估計(jì)量及其性質(zhì) 3.5 各層樣本量的分配各層樣本量的分配 3.6總樣本量的確定總樣本量的確定2022-2-102 簡(jiǎn)單隨機(jī)抽樣只適合小型的抽樣調(diào)查簡(jiǎn)單隨機(jī)抽樣只適合小型的抽樣調(diào)查: 1. 抽樣框抽樣框 2. 代表性代表性 如如:了解中國(guó)各民族的情況了解中國(guó)各民族的情況:(鄂倫春族鄂倫春族)2022-2-103第一節(jié)概述第一節(jié)概述 一定義與作用一定義與作用 (一一)分層抽樣和分層隨機(jī)抽樣分層抽樣和分層隨機(jī)
2、抽樣 先將總體個(gè)單元?jiǎng)澐殖蓚€(gè)互不重復(fù)的子總體,每個(gè)子先將總體個(gè)單元?jiǎng)澐殖蓚€(gè)互不重復(fù)的子總體,每個(gè)子 總體稱為層,它們的大小分為別,這個(gè)層總體稱為層,它們的大小分為別,這個(gè)層 合起來(lái)就是整個(gè)總體()。合起來(lái)就是整個(gè)總體()。 然后,在每個(gè)層中分別然后,在每個(gè)層中分別獨(dú)立獨(dú)立進(jìn)行抽樣,這種抽樣就是分層抽樣,進(jìn)行抽樣,這種抽樣就是分層抽樣,所得到的樣本稱為分層樣本。如果每層都是簡(jiǎn)單隨機(jī)抽樣,則所得到的樣本稱為分層樣本。如果每層都是簡(jiǎn)單隨機(jī)抽樣,則稱為分層隨機(jī)抽樣,所得到的樣本稱為分層隨機(jī)樣本。稱為分層隨機(jī)抽樣,所得到的樣本稱為分層隨機(jī)樣本。LNNN,.,21LhhN1不重不漏2022-2-104 各
3、層中的抽樣是獨(dú)立進(jìn)行的,因此,在各各層中的抽樣是獨(dú)立進(jìn)行的,因此,在各層中所采取的抽樣手段完全可以不相同,層中所采取的抽樣手段完全可以不相同,在一個(gè)層進(jìn)行簡(jiǎn)單隨機(jī)抽樣,在另一層則在一個(gè)層進(jìn)行簡(jiǎn)單隨機(jī)抽樣,在另一層則可采用更復(fù)雜一些的抽樣,完全視各層的可采用更復(fù)雜一些的抽樣,完全視各層的情況不同而定,這種因地制宜的手段將使情況不同而定,這種因地制宜的手段將使樣本盡可能反映總體的特性以及子總體的樣本盡可能反映總體的特性以及子總體的特性。特性。 分層抽樣有時(shí)也稱為分層抽樣有時(shí)也稱為類型抽樣或分類抽樣類型抽樣或分類抽樣。2022-2-105 分層隨機(jī)抽樣三原則:分層隨機(jī)抽樣三原則:(1)每層都抽樣每層
4、都抽樣;(2)各層都)各層都獨(dú)立獨(dú)立地抽樣;地抽樣;(3)各層的抽樣都是)各層的抽樣都是簡(jiǎn)單隨機(jī)抽樣簡(jiǎn)單隨機(jī)抽樣。2022-2-106 (二)特點(diǎn):(二)特點(diǎn): .分層抽樣的抽樣效率較高,也就是說(shuō)分層分層抽樣的抽樣效率較高,也就是說(shuō)分層抽樣的估計(jì)精度較高。抽樣的估計(jì)精度較高。 注意:注意: 分層抽樣估計(jì)量的方差只和層內(nèi)方差有關(guān),分層抽樣估計(jì)量的方差只和層內(nèi)方差有關(guān),和層間方差無(wú)關(guān)。和層間方差無(wú)關(guān)。 .分層抽樣不僅能對(duì)總體指標(biāo)進(jìn)行推算,分層抽樣不僅能對(duì)總體指標(biāo)進(jìn)行推算, 而且能對(duì)各層指標(biāo)進(jìn)行推算。而且能對(duì)各層指標(biāo)進(jìn)行推算。 如如:消費(fèi)物價(jià)指數(shù)消費(fèi)物價(jià)指數(shù)(全國(guó)和各省全國(guó)和各省) .層內(nèi)抽樣方法可
5、以不同,而且便于抽樣層內(nèi)抽樣方法可以不同,而且便于抽樣 工作的組織。工作的組織。2022-2-107(三三)作用作用 可以對(duì)各層的參數(shù)進(jìn)行估計(jì)可以對(duì)各層的參數(shù)進(jìn)行估計(jì), 有助于提有助于提高估計(jì)精度高估計(jì)精度。2022-2-108二使用場(chǎng)合二使用場(chǎng)合 應(yīng)用條件:應(yīng)用條件: 適合于適合于各層差異較大各層差異較大,有進(jìn)行分層的輔助信息有進(jìn)行分層的輔助信息。 層的劃分原則:層的劃分原則:層內(nèi)單元具有相同性質(zhì),通常按調(diào)查對(duì)象的不同類型進(jìn)層內(nèi)單元具有相同性質(zhì),通常按調(diào)查對(duì)象的不同類型進(jìn) 行劃分,這時(shí),分層抽樣能夠?qū)γ恳活惖哪繕?biāo)量進(jìn)行估行劃分,這時(shí),分層抽樣能夠?qū)γ恳活惖哪繕?biāo)量進(jìn)行估 計(jì)。計(jì)。盡可能使層內(nèi)單
6、元的標(biāo)志值相近,層間單元的差異盡可盡可能使層內(nèi)單元的標(biāo)志值相近,層間單元的差異盡可 能大,從而達(dá)到提高抽樣估計(jì)精度的目的。能大,從而達(dá)到提高抽樣估計(jì)精度的目的。既按類型又按層內(nèi)單元標(biāo)志值相近的原則進(jìn)行多重分既按類型又按層內(nèi)單元標(biāo)志值相近的原則進(jìn)行多重分 層,同時(shí)達(dá)到實(shí)現(xiàn)估計(jì)類值以及提高估計(jì)精度的目的。層,同時(shí)達(dá)到實(shí)現(xiàn)估計(jì)類值以及提高估計(jì)精度的目的。為了抽樣組織實(shí)施的方便,通常按行政管理機(jī)構(gòu)設(shè)置進(jìn)為了抽樣組織實(shí)施的方便,通常按行政管理機(jī)構(gòu)設(shè)置進(jìn) 行分層。行分層。2022-2-109如:對(duì)全國(guó)汽車貨運(yùn)量調(diào)查,目的是不僅要如:對(duì)全國(guó)汽車貨運(yùn)量調(diào)查,目的是不僅要了解全國(guó)貨運(yùn)量,而且推算不同經(jīng)濟(jì)成分了解
7、全國(guó)貨運(yùn)量,而且推算不同經(jīng)濟(jì)成分貨運(yùn)量。貨運(yùn)量。 首先為組織方便首先為組織方便,按省分層;各省再按按省分層;各省再按經(jīng)濟(jì)成分分層;為提高抽樣效率經(jīng)濟(jì)成分分層;為提高抽樣效率,再按噸位再按噸位分層。分層。2022-2-1010三符號(hào)說(shuō)明三符號(hào)說(shuō)明層號(hào):層號(hào):h(h=1,2,L) 第第h層的記號(hào)如下層的記號(hào)如下: 單元總數(shù):?jiǎn)卧倲?shù):樣本單位數(shù):第樣本單位數(shù):第i個(gè)單元標(biāo)志值為個(gè)單元標(biāo)志值為: 從該層中抽取的樣本的單元值為從該層中抽取的樣本的單元值為: 層權(quán):層權(quán): 抽樣比:抽樣比:總體均值:總體均值: 樣本均值:樣本均值:hNhn),.,2, 1(hhiniyNNWhhhhhNnfhNihihh
8、YNY11hnihihhyny11),.,2 , 1(hhiNiY2022-2-1011 層內(nèi)方差:層內(nèi)方差: 樣本方差:樣本方差:212)(11hNihhihhYYNShnihhihhyyns122)(112022-2-1012第二節(jié)簡(jiǎn)單估計(jì)量及其性質(zhì)第二節(jié)簡(jiǎn)單估計(jì)量及其性質(zhì) 一總體均值的估計(jì)一總體均值的估計(jì) (一一)簡(jiǎn)單估計(jì)量的定義簡(jiǎn)單估計(jì)量的定義 對(duì)于分層樣本,對(duì)總體均值對(duì)于分層樣本,對(duì)總體均值 的估計(jì)是通過(guò)對(duì)的估計(jì)是通過(guò)對(duì)各層的各層的 的估計(jì)的估計(jì),按層權(quán)按層權(quán) 加權(quán)平均得到的。加權(quán)平均得到的。公式為公式為: YhYhWLhhhhLhhstYNNYWY1112022-2-1013 如果
9、得到的是如果得到的是分層隨機(jī)樣本分層隨機(jī)樣本,則總體均值則總體均值 的簡(jiǎn)單的簡(jiǎn)單估計(jì)為估計(jì)為: (二二)估計(jì)量的性質(zhì)估計(jì)量的性質(zhì) 性質(zhì)性質(zhì)1 對(duì)于對(duì)于一般的分層隨機(jī)抽樣一般的分層隨機(jī)抽樣,如果如果 是是 的無(wú)偏估計(jì)的無(wú)偏估計(jì)(h=1,2,L),則則 是是 的無(wú)偏估計(jì)。的無(wú)偏估計(jì)。即對(duì)各層估計(jì)是無(wú)偏的,則對(duì)總體的估計(jì)也是無(wú)即對(duì)各層估計(jì)是無(wú)偏的,則對(duì)總體的估計(jì)也是無(wú)偏的。偏的。 的方差為的方差為: YLhhhhLhhstyNNyWy111hYhYstYYstY LhhhstYVWYV12由于各層的抽樣由于各層的抽樣是相互獨(dú)立的是相互獨(dú)立的2022-2-1014證明:因各層抽樣是相互獨(dú)立,則證明:因
10、各層抽樣是相互獨(dú)立,則 也相互獨(dú)立,也相互獨(dú)立,則有則有 LhhhLhLjhhLhhstYVWWWWVYV121hjjhL1h2h1hY,Ycov2YVWYhY0Y,covjhY2022-2-1015性質(zhì)性質(zhì)2 對(duì)于對(duì)于分層隨機(jī)抽樣分層隨機(jī)抽樣 , 是是 的無(wú)偏估計(jì)的無(wú)偏估計(jì), 的方差為的方差為: styYLhhhLhhhhhLhhhhLhhhhhLhhhstNSWnSWSNnWSnfWyVWyV1212221212212111)()(sty2022-2-1016 性質(zhì)性質(zhì)3 對(duì)于分層隨機(jī)抽樣對(duì)于分層隨機(jī)抽樣, 的一個(gè)無(wú)偏估的一個(gè)無(wú)偏估計(jì)為:計(jì)為:)(styVLhhhLhhhhhLhhhhLh
11、hhstNsWnsWsnfWyvWyv12122212121)()(2022-2-1017 注注: 當(dāng)當(dāng) 適當(dāng)?shù)拇螅鲗訕颖具m當(dāng)?shù)拇?,各層樣本平均?shù)平均數(shù) 均可適用正態(tài)近似,因此一般地均可適用正態(tài)近似,因此一般地 也適用于正態(tài)近似其置信區(qū)間。也適用于正態(tài)近似其置信區(qū)間。hhhhnNnN與,styhy2022-2-1018二總體總量的估計(jì)二總體總量的估計(jì) (一)簡(jiǎn)單估計(jì)量的定義(一)簡(jiǎn)單估計(jì)量的定義 總體總量總體總量Y的估計(jì)為:的估計(jì)為: 分層隨機(jī)樣本分層隨機(jī)樣本: (二)估計(jì)量的性質(zhì)(二)估計(jì)量的性質(zhì)性質(zhì)對(duì)于性質(zhì)對(duì)于一般的分層抽樣一般的分層抽樣,如果是,如果是 偏估計(jì),則偏估計(jì),則是是Y的無(wú)偏
12、估計(jì)。的無(wú)偏估計(jì)。的方差為:的方差為:LhhstYYNY1YYYstYstyNY 2022-2-1019LhhststYVYVNYNVYV12)()()(LhhhLhhhYVNYVWN12122)()(2022-2-1020 性質(zhì)對(duì)于性質(zhì)對(duì)于分層隨機(jī)抽樣分層隨機(jī)抽樣,的方差為:的方差為: 性質(zhì)對(duì)于分層隨機(jī)抽樣性質(zhì)對(duì)于分層隨機(jī)抽樣, 的一個(gè)無(wú)偏估計(jì)為:的一個(gè)無(wú)偏估計(jì)為: Y)(YV212121)()(hLhhhhLhhhSnfNYVNYV212121)()(hLhhhhLhhhsnfNyvNYv2022-2-1021【例例3.1】調(diào)查某地區(qū)的居民奶制品年調(diào)查某地區(qū)的居民奶制品年 消費(fèi)支出,以居民
13、戶為抽樣單元,根據(jù)經(jīng)消費(fèi)支出,以居民戶為抽樣單元,根據(jù)經(jīng)濟(jì)及收入水平將居民戶劃分為層,每層濟(jì)及收入水平將居民戶劃分為層,每層按簡(jiǎn)單隨機(jī)抽樣抽取戶,調(diào)查獲得如按簡(jiǎn)單隨機(jī)抽樣抽取戶,調(diào)查獲得如下數(shù)據(jù)(單位:元),估計(jì)該地區(qū)居民奶下數(shù)據(jù)(單位:元),估計(jì)該地區(qū)居民奶制品年消費(fèi)總支出及估計(jì)的標(biāo)準(zhǔn)差。制品年消費(fèi)總支出及估計(jì)的標(biāo)準(zhǔn)差。69P2022-2-1022樣本戶奶制品年消費(fèi)支出樣本戶奶制品年消費(fèi)支出層層 居民戶居民戶總數(shù)總數(shù)樣本戶奶制品年消費(fèi)支出樣本戶奶制品年消費(fèi)支出2022-2-1023 解: N = 200+400+750+1500=2850 =10( h=1,2,3,4)各層的層權(quán)及抽樣比為:
14、 hn52632. 02850150026316. 0285075014035. 0285040007018. 0285020044332211NNWNNWNNWNNW0067.01500100133.075010025.04001005.020010444333222111NnfNnfNnfNnf2022-2-1024各層樣本均值及樣本方差為:各層樣本均值及樣本方差為:241651055 .39143211111yyyynynii333.193556.8205667.2166722.1624)y(1124232212111211sssynsnii2022-2-1025 該地區(qū)居民奶制品年消費(fèi)
15、總支出該地區(qū)居民奶制品年消費(fèi)總支出: : 估計(jì)量方差及標(biāo)準(zhǔn)差的樣本估計(jì)為估計(jì)量方差及標(biāo)準(zhǔn)差的樣本估計(jì)為: :2096502415001657501054005 .3920041hhhyNY82h41hhh2h41221039. 5snf1N)()(hhhyvWNYv2022-2-1026 在在95%的概率保證下的概率保證下該地區(qū)居民該地區(qū)居民奶制品年消費(fèi)總支出區(qū)間為奶制品年消費(fèi)總支出區(qū)間為: :)(23208)()(元YvYs元之間即在2551381641622320896. 1209650)(YtsY2022-2-1027 【例例3.2】某市進(jìn)行家庭收入調(diào)查某市進(jìn)行家庭收入調(diào)查, ,分城鎮(zhèn)居
16、民分城鎮(zhèn)居民和農(nóng)村居民兩部分抽樣和農(nóng)村居民兩部分抽樣, ,在全部城鎮(zhèn)在全部城鎮(zhèn)2356023560戶戶中抽取中抽取300300戶戶, ,在全部農(nóng)村在全部農(nóng)村148420148420戶中抽取戶中抽取250250戶戶( (均按簡(jiǎn)單隨機(jī)抽樣進(jìn)行均按簡(jiǎn)單隨機(jī)抽樣進(jìn)行),),調(diào)查結(jié)果是城鎮(zhèn)調(diào)查結(jié)果是城鎮(zhèn)年平均戶收入為年平均戶收入為1518015180元元, ,標(biāo)準(zhǔn)差為標(biāo)準(zhǔn)差為29722972元;元;農(nóng)村年平均收入為農(nóng)村年平均收入為98569856元元, ,標(biāo)準(zhǔn)差為標(biāo)準(zhǔn)差為25462546元。元。求全市年平均戶收入的估計(jì)及其求全市年平均戶收入的估計(jì)及其90%90%的置信區(qū)的置信區(qū)間。間。2022-2-10
17、28解:)(39.1058573.850566.20799856863. 015180137. 0863. 0171980/148420137. 0171980/23560171980,148420,235602211212121元yWyWyWWNNNNNst2022-2-102920245.5225.5277.2029725.52)72.1931005.987(171980/2546863. 02972137. 0)2502546863. 03002972137. 0(22222212122LhhhLhhhhstNsWnsWyv2022-2-1030 全市年戶均收入的置信區(qū)間全市年戶均收入的
18、置信區(qū)間: 10585.39 1.645 142.287,即即 10351.33 10819.45(元元)注注:由于城鎮(zhèn)居民與農(nóng)村居民收入水平,抽樣由于城鎮(zhèn)居民與農(nóng)村居民收入水平,抽樣比不同比不同(前者大于后者前者大于后者)。如果不分層,計(jì)算。如果不分層,計(jì)算樣本平均數(shù)作為全市戶均年收入是不合理樣本平均數(shù)作為全市戶均年收入是不合理的的:287.142ststyvys12760550/250985630015180y2022-2-1031三三. . 總體比例的估計(jì)總體比例的估計(jì) (一一)簡(jiǎn)單估計(jì)量的定義簡(jiǎn)單估計(jì)量的定義 總體比例總體比例P的估計(jì)為的估計(jì)為:(二二)估計(jì)量的性質(zhì)估計(jì)量的性質(zhì) 如果定
19、義如果定義 1, 第第i個(gè)單元具有所考慮的特征個(gè)單元具有所考慮的特征 0, 其他其他 i=1,2N LhhhstpWp1iY2022-2-1032 性質(zhì)性質(zhì)7 對(duì)于對(duì)于一般的分層抽樣一般的分層抽樣,如果是,如果是 的無(wú)偏估計(jì)的無(wú)偏估計(jì)(h=1,2,L),則則 是是P的無(wú)偏估的無(wú)偏估計(jì)計(jì). 的方差為的方差為: 性質(zhì)性質(zhì)8 對(duì)于對(duì)于分層隨機(jī)抽樣分層隨機(jī)抽樣,是是P的一個(gè)無(wú)偏估的一個(gè)無(wú)偏估計(jì)計(jì), 的方差為的方差為: 因?yàn)橐驗(yàn)? 及及 hphPstpstpLhhhstpVWpV12)(stphhhhhhhnQPNnNpV1)(hhNN1stp2022-2-1033 LhhhstpVWpV12)(hhh
20、LhhhhhhLhhhhhLhhhhhhhhnQPfWnQPNnNWnQPNnNW121212)1 ()(1)(2022-2-1034 性質(zhì)性質(zhì)對(duì)于分層隨機(jī)抽樣,對(duì)于分層隨機(jī)抽樣, 的一個(gè)無(wú)偏估計(jì)為:的一個(gè)無(wú)偏估計(jì)為:)(stpV1)1 (11)()()(121212hhhLhhhhhhLhhhhhLhhhstnqpfWnqpNnNWpvWpv2022-2-1035【例例3.3】 了解某地區(qū)居民戶擁有家庭電腦的情況如下,估計(jì)該了解某地區(qū)居民戶擁有家庭電腦的情況如下,估計(jì)該地區(qū)家庭擁有電腦的比例及估計(jì)的標(biāo)準(zhǔn)差。地區(qū)家庭擁有電腦的比例及估計(jì)的標(biāo)準(zhǔn)差。 樣本戶擁有家庭電腦情況樣本戶擁有家庭電腦情況層
21、層居民戶居民戶總數(shù)總數(shù)樣本戶擁有家庭電腦情況樣本戶擁有家庭電腦情況 2022-2-1036解:, 2 . 01021p2 . 02p, 4 . 0,3p1 . 01014p0099.01)1()(0263.01)1()(0173.01)1()(0169.01)1()(44444333332222211111nqpfpvnqpfpvnqpfpvnqpfpv2022-2-1037 該地區(qū)家庭擁有電腦的比例的估計(jì)、估計(jì)量的方差、該地區(qū)家庭擁有電腦的比例的估計(jì)、估計(jì)量的方差、估計(jì)的標(biāo)準(zhǔn)差為估計(jì)的標(biāo)準(zhǔn)差為:2 . 0) 1 . 015004 . 07502 . 04002 . 0200(28501141
22、41hhhhhhstpNNpWp005. 0)0099. 015000263. 07500173. 04000169. 0200(28501)(1)(222224122hhhstpvNNpv2022-2-1038(三三) 總體具有所考慮特征單元總數(shù)總體具有所考慮特征單元總數(shù)A的估計(jì)的估計(jì) 它的方差 及方差估計(jì) 分別是:07. 0)()(ststpvpshLhhststpNNpA1stAVstAvhhLhhhhhstLhhhhhhhhstqpnnNNAvnQPNnNNAV112112022-2-1039 【例例3.4】為調(diào)查某個(gè)高血壓高發(fā)病地區(qū)青少年與成年人高血為調(diào)查某個(gè)高血壓高發(fā)病地區(qū)青少年與
23、成年人高血壓的患病率壓的患病率, ,對(duì)對(duì)1414歲以上的人分四個(gè)年齡組進(jìn)行歲以上的人分四個(gè)年齡組進(jìn)行分層隨機(jī)抽樣分層隨機(jī)抽樣, ,調(diào)查結(jié)果如下調(diào)查結(jié)果如下, ,求總體高血壓的患病率求總體高血壓的患病率P P的估計(jì)及其標(biāo)準(zhǔn)差的的估計(jì)及其標(biāo)準(zhǔn)差的估計(jì)。估計(jì)。 高血壓患病率調(diào)查數(shù)據(jù)高血壓患病率調(diào)查數(shù)據(jù)年齡組年齡組(歲歲)層權(quán)層權(quán)層樣本量層樣本量14-250.2814000.0830.91726-400.3226500.1740.82641-600.2136000.3100.69061以上0.1843500.4640.536hWhnhphq2022-2-1040解: P的估計(jì)量為: 為求為求 的方差估
24、計(jì)的方差估計(jì),取取%08.232308. 0464. 0184. 0310. 0213. 0174. 0322. 0083. 0281. 01LhhhstpWpstp的近似公式為:則LhhhhhhsthhhnqpfWpvnnf12,111, 11%884. 000884. 000007818. 012ststLhhhhhstpvpsnqpWpv2022-2-10413.3 比率估計(jì)及其性質(zhì)比率估計(jì)及其性質(zhì) (一一)分別比率估計(jì)分別比率估計(jì) 條件:條件: 各層的樣本量都比較大各層的樣本量都比較大的情況下的情況下 方法:各層分別進(jìn)行比率估計(jì),將各層加權(quán)匯總得方法:各層分別進(jìn)行比率估計(jì),將各層加權(quán)匯
25、總得到總體指標(biāo)的估計(jì)。到總體指標(biāo)的估計(jì)。(先比后加權(quán)先比后加權(quán))總體均值總體均值 和總體總量和總體總量Y的分別比率估計(jì)量的分別比率估計(jì)量:LhRhhLhhhRsRshLhhhhLhRhhRsYXxyyNYXxyWyWy1111Y已知已知各層各層的的均值和總量均值和總量2022-2-1042 對(duì)分別比估計(jì),若各層樣本量都比較大,則有對(duì)分別比估計(jì),若各層樣本量都比較大,則有:xhyhhhxhhyhLhhhhLhRhhRsRSRSSSRSRSnfWyWVyVyMSEYyE21)(222121h為第為第h層層X(jué)與與Y的相關(guān)系數(shù)的相關(guān)系數(shù)注:公式中注:公式中S、R、 用樣本數(shù)據(jù)替代用樣本數(shù)據(jù)替代2022
26、-2-1043 證明:根據(jù)比估計(jì)量的性質(zhì),當(dāng)證明:根據(jù)比估計(jì)量的性質(zhì),當(dāng) 比較大時(shí),則有:比較大時(shí),則有: 所以所以hnxhyhhhxhhyhhhRhRhhRhSSRSRSnfyVyMSEYyE21222xhyhhhxhhyhLhhhhRSLhRhhLhRhhLhRhhRSLhhhRhLhhRSSSRSRSnfWyVyVWyMSEWyWMSEyMSEYYWyEWyE21)(2221212121112022-2-1044 總量:總量: xhyhhhxhhyhLhhhhRsRsSSRSRSnfNyNVYV21)(222122022-2-1045 (二二) 聯(lián)合比率估計(jì)聯(lián)合比率估計(jì)條件:條件:各層的
27、樣本量不是都很大各層的樣本量不是都很大的情況的情況方法:先分別對(duì)方法:先分別對(duì) 作分層估計(jì),然后再采用比估計(jì)作分層估計(jì),然后再采用比估計(jì)方法。(先加權(quán)后比)方法。(先加權(quán)后比)總體均值總體均值 和總體總量和總體總量Y的聯(lián)合比率估計(jì)量:的聯(lián)合比率估計(jì)量:XRXxyYXRXxyycststRccststRc的分層估計(jì)。和分別為和XYxyststXY、Y已知已知總體總體的的均值和總量均值和總量2022-2-1046的均方誤差為的均方誤差為:RcRcYy ,yxhxhyhhhhhRcRcyxhxhyhhhhhRcRcRSSRSnfNYVYMSERSSRSnfyVyMSE2121W22222222v對(duì)聯(lián)
28、合比估計(jì),若總樣本量對(duì)聯(lián)合比估計(jì),若總樣本量 n比較大,則有比較大,則有:YyERc證明:證明:p75注意與分別比估計(jì)方差公式的差異注意與分別比估計(jì)方差公式的差異(Rh)2022-2-1047(三三) 分別比率估計(jì)量與聯(lián)合比率估計(jì)量的比較分別比率估計(jì)量與聯(lián)合比率估計(jì)量的比較 如果如果各層的樣本量都較大各層的樣本量都較大,且有理由認(rèn)為,且有理由認(rèn)為各層的比率各層的比率 差異較大差異較大,則,則分別比率估計(jì)分別比率估計(jì)優(yōu)于聯(lián)合比率估計(jì)。優(yōu)于聯(lián)合比率估計(jì)。 當(dāng)當(dāng)各層的樣本量不大各層的樣本量不大,或,或各層比率各層比率 差異很小差異很小,則,則聯(lián)合比率估計(jì)聯(lián)合比率估計(jì)更好些。更好些。 hRhR【例例4
29、.4】某市某市1996年對(duì)年對(duì)950家港口生產(chǎn)單家港口生產(chǎn)單位完成的吞吐量進(jìn)行了調(diào)查,位完成的吞吐量進(jìn)行了調(diào)查,1997年欲對(duì)年欲對(duì)全市港口生產(chǎn)單位完成的吞吐量進(jìn)行抽樣全市港口生產(chǎn)單位完成的吞吐量進(jìn)行抽樣調(diào)查。對(duì)港口生產(chǎn)單位按非國(guó)有調(diào)查。對(duì)港口生產(chǎn)單位按非國(guó)有(h=1)和和國(guó)有國(guó)有(h=2)分為兩層,單位數(shù)分別為分為兩層,單位數(shù)分別為800家家和和150家,分別在兩層中調(diào)查了家,分別在兩層中調(diào)查了10家、家、15家港口生產(chǎn)單位,調(diào)查數(shù)據(jù)如下表,試估家港口生產(chǎn)單位,調(diào)查數(shù)據(jù)如下表,試估計(jì)計(jì)1997年全市港口生產(chǎn)單位完成的吞吐量。年全市港口生產(chǎn)單位完成的吞吐量。2022-2-1049 1997年非
30、國(guó)有和國(guó)有企業(yè)調(diào)查數(shù)據(jù)年非國(guó)有和國(guó)有企業(yè)調(diào)查數(shù)據(jù)ii195801495530222021022103203359384336049641201174230400517718056006516253258610008807302349770056083322868110012309272215972082310137971031039011478465ixiyixiy接上表接上表128176501391911601411601070157356982022-2-1051h=1,非國(guó)有H=2,國(guó)有合計(jì)1015258001509500.8421050.15789510.01250.117140010
31、2900274300214.25686226.7655.6217.6688.28477.34494665.2610704.7182541.899072.281071.510.9598591.049725hnhNhWhfhXhXhxhy2xhs2yhshRyxhs2022-2-1052 1.按分別比率估計(jì)量估計(jì)按分別比率估計(jì)量估計(jì):5 .272536102900049725. 1171400959859. 021hhhRSXRY68.9193895253.2247762815.6946132421222212yxhhxhhhyhhhhRSSRsRsnfNYv48.9588RSRSYvYs2022
32、-2-10532.按聯(lián)合比率估計(jì)量估計(jì)按聯(lián)合比率估計(jì)量估計(jì)212773102 .6881506 .217800hhhstyNY2797006 .6551507 .22680021hhhstxNX1 .271956274300279700277310XXYYststRC2022-2-105484.8629369819.2003236265.6626143621222212yxhxhyhhhhhRCsRsRsnfNYv44.9289RCRCYvYsn兩種途徑:兩種途徑:n分別回歸估計(jì):分別回歸估計(jì):對(duì)每層樣本分別求取回歸估計(jì)量,對(duì)每層樣本分別求取回歸估計(jì)量,然后對(duì)各層的回歸估計(jì)量進(jìn)行加權(quán)平均,即先
33、然后對(duì)各層的回歸估計(jì)量進(jìn)行加權(quán)平均,即先“回歸回歸”后后“加權(quán)加權(quán)”;n聯(lián)合回歸估計(jì):聯(lián)合回歸估計(jì):對(duì)兩個(gè)變量先分別計(jì)算出總體總對(duì)兩個(gè)變量先分別計(jì)算出總體總值或總體均值的分層簡(jiǎn)單估計(jì)量,然后再對(duì)它們值或總體均值的分層簡(jiǎn)單估計(jì)量,然后再對(duì)它們的分層估計(jì)量來(lái)構(gòu)造回歸估計(jì),即先的分層估計(jì)量來(lái)構(gòu)造回歸估計(jì),即先“加權(quán)加權(quán)”后后“回歸回歸”。3.3回歸估計(jì)量及其性質(zhì)回歸估計(jì)量及其性質(zhì)2022-2-10563.3分層隨機(jī)抽樣下的回歸估計(jì)分層隨機(jī)抽樣下的回歸估計(jì) ( (一一) ) 分別回歸估計(jì)分別回歸估計(jì) 適用適用: 各層樣本量不小的情況各層樣本量不小的情況 方法方法: 先對(duì)各層的平均數(shù)或總和作回歸估計(jì),然
34、先對(duì)各層的平均數(shù)或總和作回歸估計(jì),然后按層權(quán)平均或相加,得到總體指標(biāo)的估計(jì)后按層權(quán)平均或相加,得到總體指標(biāo)的估計(jì)。(先。(先回歸再加權(quán))回歸再加權(quán))定義定義 3.6 分別回歸估計(jì)是指在分層隨機(jī)抽樣中,分別回歸估計(jì)是指在分層隨機(jī)抽樣中,先在每層中對(duì)層均值或?qū)涌偤妥龌貧w估計(jì),然后再先在每層中對(duì)層均值或?qū)涌偤妥龌貧w估計(jì),然后再對(duì)各層的回歸估計(jì)按總體層權(quán)進(jìn)行加權(quán)平均。對(duì)對(duì)各層的回歸估計(jì)按總體層權(quán)進(jìn)行加權(quán)平均。對(duì) 的分別回歸估計(jì)為:的分別回歸估計(jì)為:2022-2-1057 總體均值的分別估計(jì)量:總體均值的分別估計(jì)量: 總體總量的分別估計(jì)量:總體總量的分別估計(jì)量: 1、當(dāng)各層的回歸系數(shù)為給定的常數(shù)時(shí),分別
35、估計(jì)、當(dāng)各層的回歸系數(shù)為給定的常數(shù)時(shí),分別估計(jì)量是無(wú)偏的,其方差為:量是無(wú)偏的,其方差為:hhhhLhhLhlrshlrsxXyWyWy11LhhhhhhlrslrsxXyNyNY1yxhhxhhyhhhhlrsSSSnfWYV2122222022-2-1058 并且當(dāng)并且當(dāng) 時(shí)時(shí), 達(dá)到最小達(dá)到最小,即即 2、通常、通常 未知未知,可以用樣本回歸系數(shù)可以用樣本回歸系數(shù) 作為作為 的估計(jì)的估計(jì): 這時(shí)分別估計(jì)量是有偏的,但當(dāng)每一層的樣本量這時(shí)分別估計(jì)量是有偏的,但當(dāng)每一層的樣本量LhSSBxhyxhhh,.2 , 1,2lrsyVLhhyhhhhlrsSnfWyV1222min11hhbhhh
36、nihhinihhihhihxxxxyyb121hn2022-2-1059 都較大時(shí),估計(jì)的偏倚可以忽略,其方差近似都較大時(shí),估計(jì)的偏倚可以忽略,其方差近似為為: 方差方差 的樣本估計(jì)為的樣本估計(jì)為: 式中式中,212211hLhyhhhhlrsSnfWyVlrsyV2121)(ehLhhhhlrssnfWyv21221hnihhihhhihehxxbyyns2221(1)()(1)LhhlrsyhhhhWfV ySn121()()()hhnhihhihihnhihiyyxxbxx2221(1)()1(1)(2)LhhlrshyhhhhhWfv ynsrn n2:hr第第h層樣層樣本相關(guān)系本相
37、關(guān)系數(shù)的平方數(shù)的平方2022-2-1061(二二) 聯(lián)合回歸估計(jì)聯(lián)合回歸估計(jì) 條件:各層樣本量不大條件:各層樣本量不大 聯(lián)合回歸估計(jì)是對(duì)聯(lián)合回歸估計(jì)是對(duì) 作分層估計(jì);然作分層估計(jì);然后構(gòu)造總體均值和總量的聯(lián)合估計(jì)量。后構(gòu)造總體均值和總量的聯(lián)合估計(jì)量。(先分層(先分層再回歸)再回歸) 總體均值、總量的聯(lián)合估計(jì)量:總體均值、總量的聯(lián)合估計(jì)量: ststlrcxXyyststlrclrcXXYyNYXY與其中:hhhstyWyhhhstxWx2022-2-1062 1、當(dāng)回歸系數(shù)為事先給定的常數(shù)時(shí),聯(lián)合估計(jì)量、當(dāng)回歸系數(shù)為事先給定的常數(shù)時(shí),聯(lián)合估計(jì)量 是無(wú)偏的,其方差為:是無(wú)偏的,其方差為:yxhx
38、hyhhhhhlrcSSSnNfNyV2122222 hyxhxhyhhhhlrcSSSnfNYV212222lrclrcYy及2022-2-1063 當(dāng)當(dāng) 取取 時(shí)時(shí), 達(dá)到最小。達(dá)到最小。 2、當(dāng)回歸系數(shù)未知時(shí),取、當(dāng)回歸系數(shù)未知時(shí),取 為為 的樣本估計(jì):的樣本估計(jì): LhhxhhhLhhyxhhhcnSfWnSfWB1221211lrcyVcBhxhhhhhyxhhhhhniihhhhhnihhihhihhhhcsnfWsnfWxxnnfWxxyynnfWbhh222122111111122221(1)()(2)LhhlrcyhcxhcxyhhhWfV ySB SB Sn222 21(1
39、)()(2)Lhhlrcyhcxhc xyhhhWfv ysb sbsn2:hr第第h層層樣本相樣本相關(guān)系數(shù)關(guān)系數(shù)的平方的平方21221(1)/(1)/LhhxyhhhcLhhxhhhWfsnbWfsn2022-2-1065這時(shí)聯(lián)合估計(jì)是有偏的這時(shí)聯(lián)合估計(jì)是有偏的,但當(dāng)樣本量但當(dāng)樣本量n 較大時(shí)較大時(shí),估估計(jì)量的偏倚趨于零計(jì)量的偏倚趨于零,回歸估計(jì)是漸近無(wú)偏的,且回歸估計(jì)是漸近無(wú)偏的,且yxhcxhcyhhhhhlrcSBSBSnfWyV212222lrcyVyxhcxhcyhhhhhlrcsbsbsnfWyv212222方差方差 的樣本估計(jì)為的樣本估計(jì)為:2022-2-1066(三三)分別回
40、歸估計(jì)與聯(lián)合回歸估計(jì)的比較分別回歸估計(jì)與聯(lián)合回歸估計(jì)的比較 當(dāng)回歸系數(shù)當(dāng)回歸系數(shù)事先設(shè)定事先設(shè)定時(shí),分別回歸估優(yōu)于聯(lián)合時(shí),分別回歸估優(yōu)于聯(lián)合回歸估計(jì),尤其在回歸估計(jì),尤其在各層回歸系數(shù)相差較大時(shí),分別各層回歸系數(shù)相差較大時(shí),分別回歸估計(jì)更好。回歸估計(jì)更好。 當(dāng)回歸系數(shù)由當(dāng)回歸系數(shù)由樣本估計(jì)樣本估計(jì)時(shí),如果各層的時(shí),如果各層的樣本量樣本量不太小,且各層的不太小,且各層的回歸系數(shù)回歸系數(shù)相差較大,還是采用分相差較大,還是采用分別回歸估計(jì)為宜。若各層的樣本量不太大,且各層別回歸估計(jì)為宜。若各層的樣本量不太大,且各層的回歸系數(shù)大致相同,則采用聯(lián)合回歸估計(jì)較好。的回歸系數(shù)大致相同,則采用聯(lián)合回歸估計(jì)較好
41、。若層內(nèi)的回歸系數(shù)差別不太大,而每層的樣本量并若層內(nèi)的回歸系數(shù)差別不太大,而每層的樣本量并非都相當(dāng)大時(shí),聯(lián)合回歸估計(jì)可能更保險(xiǎn)些。非都相當(dāng)大時(shí),聯(lián)合回歸估計(jì)可能更保險(xiǎn)些。2022-2-1067 【例例4.6】P P4545 :(續(xù)前例續(xù)前例)利用回歸估計(jì)量估利用回歸估計(jì)量估計(jì)該市港口生產(chǎn)單位計(jì)該市港口生產(chǎn)單位1997年完成的吞吐年完成的吞吐量。量。解解: 樣本回歸系數(shù)樣本回歸系數(shù): (1)按分別回歸估計(jì)量估計(jì)按分別回歸估計(jì)量估計(jì): =163421.10+107135.19=270556.30h=1,非國(guó)有 h=2,國(guó)有1.070170.856402hb2121hhhhhhlrhhhlrsxXb
42、yNyNY2022-2-106822.8987246981.190629464 .70809522211222212xhhyhhhhhhhlrssbsnnnfNYv11.9480lrslrsYvYs0290.12535.7355757.75611222hxhhhhhyxhhhhcsnfWsnfWb(2)按聯(lián)合回歸估計(jì)量估計(jì)按聯(lián)合回歸估計(jì)量估計(jì):2022-2-10694 .271753279700274300029. 1277310stcstlrcXXbYY17.8535833267.215084155 .63849916212222yxhcxhcyhhhhhlrcsbsbsnfNYv96.92
43、38lrclrcYvYs2022-2-1070小結(jié)小結(jié)比估計(jì)量與回歸估計(jì)量的異同:比估計(jì)量與回歸估計(jì)量的異同: 1.從形式上看,比估計(jì)量是一個(gè)簡(jiǎn)單估計(jì)量從形式上看,比估計(jì)量是一個(gè)簡(jiǎn)單估計(jì)量 的的線性組合,而回歸估計(jì)量?jī)蓚€(gè)簡(jiǎn)單估計(jì)量線性組合,而回歸估計(jì)量?jī)蓚€(gè)簡(jiǎn)單估計(jì)量 的的線性組合;但實(shí)質(zhì)上都是利用兩個(gè)簡(jiǎn)單估計(jì)量和線性組合;但實(shí)質(zhì)上都是利用兩個(gè)簡(jiǎn)單估計(jì)量和輔助變量來(lái)估計(jì)總體指標(biāo)。輔助變量來(lái)估計(jì)總體指標(biāo)。 2.比估計(jì)量借助主要變量與輔助變量之間的比值比估計(jì)量借助主要變量與輔助變量之間的比值關(guān)系;回歸估計(jì)量借助兩者之間的線性相關(guān)關(guān)系。關(guān)系;回歸估計(jì)量借助兩者之間的線性相關(guān)關(guān)系。Ryx、2022-2-
44、1071 第四節(jié)第四節(jié) 樣本量在各層的分配樣本量在各層的分配 簡(jiǎn)單隨機(jī)抽樣只需要根據(jù)調(diào)查精度的要求與簡(jiǎn)單隨機(jī)抽樣只需要根據(jù)調(diào)查精度的要求與費(fèi)用的限制來(lái)確定抽樣容量的大小,而分層抽樣費(fèi)用的限制來(lái)確定抽樣容量的大小,而分層抽樣則提出另一個(gè)重要的問(wèn)題,一旦確定則提出另一個(gè)重要的問(wèn)題,一旦確定n,又如何,又如何在各層中分配抽樣容量在各層中分配抽樣容量 ,其中有些問(wèn)題要考,其中有些問(wèn)題要考慮,比如在各層中各有精度的要求以及費(fèi)用的限慮,比如在各層中各有精度的要求以及費(fèi)用的限制,由于各層具有各自的鮮明特征,其花費(fèi)自然制,由于各層具有各自的鮮明特征,其花費(fèi)自然不同,因而在樣本容量分配上必須帶有經(jīng)濟(jì)觀點(diǎn)。不同,
45、因而在樣本容量分配上必須帶有經(jīng)濟(jì)觀點(diǎn)。另一個(gè)重要考慮因素是由于另一個(gè)重要考慮因素是由于 的不同而帶來(lái)數(shù)據(jù)的不同而帶來(lái)數(shù)據(jù)處理的困難。處理的困難。 樣本量的分配必須盡可能地使估計(jì)量及其方樣本量的分配必須盡可能地使估計(jì)量及其方差具有較簡(jiǎn)單的形式,從而使數(shù)據(jù)匯總工作量小,差具有較簡(jiǎn)單的形式,從而使數(shù)據(jù)匯總工作量小,做到省時(shí)省力。做到省時(shí)省力。hnhn2022-2-1072樣本量分配對(duì)精度的影響樣本量分配對(duì)精度的影響2022-2-1073 某個(gè)總體分為三層,其層權(quán)某個(gè)總體分為三層,其層權(quán) 及層標(biāo)準(zhǔn)差及層標(biāo)準(zhǔn)差 見(jiàn)下表,見(jiàn)下表,設(shè)總樣本量為設(shè)總樣本量為300,考慮四種不同的樣本量分配,并,考慮四種不同的
46、樣本量分配,并計(jì)算出每一種分配下,總體均值估計(jì)量的方差:計(jì)算出每一種分配下,總體均值估計(jì)量的方差: 樣本量的不同分配對(duì)方差的影響樣本量的不同分配對(duì)方差的影響hWhSh常數(shù)分配與 成正比與 成正比與 成正比 10.22010049604020.330100110909030.5341001411501703.863.113.093.00hWhS yV2hShWhhSW2022-2-10742022-2-1075 (一一)比例分配(比例分配(proportional allocation ) 即在分層抽樣中,若每層的樣本量nh 都與層的大小Nh 成比例,即 也就是按各層的層權(quán)進(jìn)行分配,即大的子總體
47、多抽一些,小的子總體少抽一些。 比例分配時(shí), 也與層權(quán) 成比例。 簡(jiǎn)單隨機(jī)抽樣中總體的每一個(gè)單元入樣的概率即為抽樣比f(wàn) 。因而按比例分配而在各層中進(jìn)行簡(jiǎn)單隨機(jī)抽樣的分層方法,任何一層中的樣本被抽中的概率都為f。因此比例分配的分層隨機(jī)抽樣是一種等概率抽樣。hhhWNNnnfNnNnfhhhhnhWhw2022-2-1076總體均值 的估計(jì)是:YyynynynnnynnyWyniiLhnihinihihLhhhLhhLhhhprophh1111111111LhhpropanppP11的估計(jì):總體比例顯然估計(jì)量有相當(dāng)簡(jiǎn)單的形式。2022-2-1077 自加權(quán):自加權(quán):如果總體總量(或均值)的無(wú)偏估計(jì)
48、量可以寫(xiě)成樣本觀測(cè)值的總和(或平均數(shù))的常數(shù)倍(如:Y=ky或 ),那么這種樣本(或估計(jì)量)稱作自加權(quán)自加權(quán)的或等加權(quán)等加權(quán)的。 按比例分配的分層抽樣就是自加權(quán)的。簡(jiǎn)單隨機(jī)抽樣(放回的和不放回的)也是自加權(quán)的。ynNyNyNyproppropykY 2022-2-1078的方差為:LhhhLhhhhhhLhhhpropSWnfSnfnnWyVWyV12121211)()(propyLhhhhLhhhhhpropQPWnfNQPNNnfpV112111)(的方差為:proppLhhhSW122022-2-1079二二. 最優(yōu)分配最優(yōu)分配 (一) 最優(yōu)分配 在分層隨機(jī)抽樣中, 在總費(fèi)用給定的條件下
49、,估計(jì)量的方差達(dá)到最??;或在給定估計(jì)量方差的條件下,使總費(fèi)用最小的各層樣本量的分配稱為最優(yōu)分配(optimum allocation)。 簡(jiǎn)單線性費(fèi)用函數(shù):LhhhTnccC102022-2-1080 建立目標(biāo)函數(shù): 根據(jù)柯西-許瓦茲(Cauchy-Schwarz)不等式,對(duì)于任意的 ,有 , 0, 0hhba221221120hhhhhLhhhhLhhhLhhhnSWncnSWncNSWVCCVC222hhhhbabaLhhhLhhhhstNSWnSWyV12122)(通過(guò)極小化目標(biāo)函數(shù),可同時(shí)達(dá)到給定方差下費(fèi)用最小和給定費(fèi)用下方差最小的效果。2022-2-1081 當(dāng)且僅當(dāng) (K為常數(shù))時(shí)
50、,上式等號(hào)成立。所以對(duì)于目標(biāo)函數(shù)則有: 上式成立的條件是:Kbahh22hhhhhhhhSWcnSWncVCKSWncnSWnchhhhhhhhh/2022-2-1082 所以則使目標(biāo)函數(shù)達(dá)到最小時(shí)的最優(yōu)分配為:hhhhcSKWn/hhhhcSWKnn/hhhhhhhhhhhhhcSNcSNcSWcSWnn/2022-2-1083 上式表明, 越大(即層越大),則層內(nèi)抽樣應(yīng)越多;又若 越大(即層內(nèi)變差越大),則層內(nèi)抽樣也應(yīng)越多;但如果 越大(即層內(nèi)平均每單元費(fèi)用越大),則在該層中的抽樣應(yīng)少一些。即最優(yōu)分配的 與 或 成正比,與 成反比。LhhhhhhhLhhhhhhhhcSNcSNcSWcSW
51、nn11Lh.,2, 1hNhShchnhhSWhhSNhc2022-2-1084 由此得出下面的行為準(zhǔn)則,如果某一層: 單元數(shù)較多 內(nèi)部差異較大 費(fèi)用比較省 則對(duì)這一層的樣本量分配較多些。2022-2-1085 (二) Neyman(內(nèi)曼)分配 條件: 如果每層抽樣的費(fèi)用相同,即 時(shí),最優(yōu)分配可簡(jiǎn)化為:將 代入 即得:cchLhhhhhLhhhhhhSNSNnSWSWnn11Lh,.2 , 1hnLhhhLhhhNSWnSWVh121222022-2-1086達(dá)到最小: 【例例3.5】( (續(xù)例續(xù)例3.1)p693.1)p69如果樣本量為如果樣本量為 n = 40,n = 40,則按比則按比
52、例分配和例分配和NeymanNeyman分配分配, ,各層的樣本量應(yīng)為多少各層的樣本量應(yīng)為多少? ? 解解: : 按比例分配時(shí)按比例分配時(shí), ,各層的樣本量為各層的樣本量為: :即各層的樣本量分別為:3,6,11,20 (公式計(jì)算結(jié)果如果帶小數(shù),這時(shí)樣本容量不按四舍五入法則取整數(shù),取比這個(gè)數(shù)大的最小整數(shù)代替。如:n=56.03 則n=57))(styV05.214052632.053.104026316.061.54014035.081.24007018.044332211nWnnWnnWnnWnLhhhLhhhstSWNSWnyV1221min1)(1)(2022-2-1087按Neyman
53、分配:3181.7333.19352632.08380.23556.820526316.05330.6667.216614035.08286.2722.162407018.044332211sWsWsWsW4151775.403181. 78380.235330. 68286. 2hhhsW2022-2-1088各層的樣本量為各層的樣本量為: :即各層的樣本量分別為:3,7,23,7。45. 679. 251775.408286. 240241111nsWsWnnhhh53.233n23. 74n2022-2-1089 【例例3.6】在例3.2中若固定n=550不變,城鎮(zhèn)居民與農(nóng)村居民年收入的
54、標(biāo)準(zhǔn)差估計(jì)分別為 元, 元,對(duì)城鎮(zhèn)居民與農(nóng)村居民抽樣平均每戶的費(fèi)用比1:2,試求城鎮(zhèn)與農(nóng)村兩層比例分配與最優(yōu)分配的樣本量。又若不考慮費(fèi)用因素,那么最優(yōu)分配的結(jié)果又有何變化?30001S25002S如何計(jì)如何計(jì)算呢?算呢?2022-2-1090解: 城鎮(zhèn)與農(nóng)村居民年收入調(diào)查樣本量分配的計(jì)算h1235600.137 30001411.0411.02148420 0.863 250022157.5 1525.61719802568.5 1936.6hNhWhShchhSWhhhcSW/2022-2-1091 (1)比例分配 (2)最優(yōu)分配 (3)內(nèi)曼分配 47565.474550863. 07535
55、.75550137. 021nn43327.4335506 .19366 .152511773.1165506 .19360 .41121nn46299.4615505 .25685 .21578801.885505 .25680 .41121nn2022-2-1092 不考慮費(fèi)用的內(nèi)曼分配在農(nóng)村的樣本量比考慮費(fèi)用的最優(yōu)分配在農(nóng)村的樣本量更大。這是因?yàn)檗r(nóng)村調(diào)查費(fèi)用較高,因此最優(yōu)原則是適當(dāng)增加城鎮(zhèn)樣本量,減少農(nóng)村樣本量。2022-2-1093(三)某些層要求大于100%抽樣時(shí)的修正 按最優(yōu)分配時(shí),當(dāng)某些層的標(biāo)準(zhǔn)差 特別大,而層的大小 相對(duì)指定的總樣本量n又小很多,若加上對(duì)這些層抽樣的平均單位費(fèi)用
56、 又很低,而抽樣比f(wàn)比較大,則可能出現(xiàn)按最優(yōu)分配計(jì)算的這個(gè)層的樣本量 超過(guò) 的情況。 實(shí)際工作中,如果第k層出現(xiàn)這種情況,最優(yōu)分配是對(duì)這個(gè)層進(jìn)行100%的抽樣,即取 ,然后,將剩下的樣本量 按最優(yōu)分配分到各層。hnhNhhNn knn hchShNLhhhhhhhhcSNcSNnn12022-2-1094以不考慮費(fèi)用的內(nèi)曼分配為例,實(shí)際操作步驟如下:2022-2-1095 在這種情況下,對(duì)于方差 的一般公式,可以直接將修正后的最優(yōu)分配所得的 帶入,而內(nèi)曼分配最小方差公式則需必要的調(diào)整: 其中, 是僅對(duì)最后實(shí)際分配的樣本量 嚴(yán)格小于 的各層求和, 也只是這些層中抽取的單元總數(shù)。 修正的含義可理解
57、為:因?yàn)閷?duì)于那些實(shí)施普查( )的層來(lái)說(shuō),已經(jīng)不存在所謂的抽樣誤差了,自然需要從原來(lái)的公式中將它們舍去。)(styV/hn)(1)(1)(2/2/hhhhhhstSWNSWnyV/hnhNhhNn/n2022-2-1096【例例3.7】某個(gè)模擬的總體分為4層, 和 的值見(jiàn)下表,設(shè)n=80,請(qǐng)問(wèn)該如何進(jìn)行內(nèi)曼分配? 一個(gè)模擬總體的分配情況hNhShhSNh154002000210500500032001020004400208000合計(jì)合計(jì)61517000hNhS2022-2-1097解:解:計(jì)算各層的樣本量:(1)第一層樣本量的分配: 而 ,可見(jiàn) ,則(2)將 個(gè)待分配的樣本量分到24層:941
58、. 91700020008041111hhhSNSNnn51N11Nn 5/1n75580/1nn2515000500075)(4222/12hhhSNSNnnn2022-2-1098而 ,可見(jiàn) , 則 (3)將 個(gè)待分配的樣本量分到3、4層:因?yàn)?, ,所以102N22Nn 10/2n6510580/2/1nnn1310000200065)(4333/2/13hhhSNSNnnnn2003N33Nn 13/3n(4)將6510580/2/1nnn個(gè)待分配的樣本量分到第4層: 2022-2-1099因?yàn)?, ,所以 因此,各層所分配的樣本量是: 5,10,13,525210000800065)
59、(4344/2/14hhhSNSNnnnn4004N44Nn 52/4n 此時(shí)上題計(jì)算總體均值估計(jì)量的最小方差為:5917. 34759. 00676. 4)2061540010615200(6151)2061540010615200(651)(1)(1)(222/2/hhhhhhstSWNSWnyV對(duì)第三、四層計(jì)算2022-2-10100第五節(jié)第五節(jié) 總樣本量的確定總樣本量的確定 一一.影響樣本總量影響樣本總量n的因素的因素 1. 估計(jì)量精度的要求: (1)對(duì)總體參數(shù)估計(jì)的精度 (2)對(duì)各層參數(shù)估計(jì)的精度 2.費(fèi)用的限制 (1)總費(fèi)用的限制 (2)不同層中平均抽取一個(gè)單元的費(fèi)用 3. 層的劃
60、分和層的樣本量的分配形式2022-2-10101 由于估計(jì)量的精度實(shí)際上取決于每層樣本量的大小,因此在總樣本量給定的情況下,對(duì)層樣本量的不同分配,其精度也不同。反之對(duì)同一精度要求,對(duì)不同的樣本量分配形式,計(jì)算得到的總樣本量也有差異,因此在確定總樣本時(shí),要求先確定樣本量的分配形式。2022-2-10102 二二. 估計(jì)總體均值情形估計(jì)總體均值情形 1. 一般公式一般公式令 其中 已經(jīng)選定,在調(diào)查的目標(biāo)是估計(jì)總體均值 時(shí),當(dāng)給定方差V的上限或d時(shí),hhnwn hw212212212212212111hLhhhhLhhhhLhhhhLhhhhLhhhhSWWNSwWnSNWSnWSnfWVY2022
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 鄉(xiāng)村別墅地產(chǎn)租賃合約三篇
- 2024年標(biāo)準(zhǔn)擔(dān)保公司過(guò)橋貸款服務(wù)協(xié)議范本版B版
- 2024年度知識(shí)產(chǎn)權(quán)專利布局與預(yù)警服務(wù)合同3篇
- 大學(xué)體育運(yùn)動(dòng)會(huì)開(kāi)幕致辭
- 工藝品銷售工作總結(jié)
- 語(yǔ)文高考押題專題四:詩(shī)歌鑒賞
- 汕頭語(yǔ)文二模試題
- 物流成本課程設(shè)計(jì)
- 游泳館教練教學(xué)課程設(shè)計(jì)
- 描寫(xiě)七夕節(jié)風(fēng)俗隨筆
- 2019MATLAB-Simulink電力系統(tǒng)建模與仿真第2版
- 繪本故事:睡睡鎮(zhèn)
- BMW銷售流程培訓(xùn)教材課件
- 煤炭入股合伙人協(xié)議書(shū)
- 普通銑床操作規(guī)程
- 導(dǎo)尿管相關(guān)尿路感染防控措施實(shí)施情況督查表
- 三甲醫(yī)院評(píng)審護(hù)理院感組專家現(xiàn)場(chǎng)訪談問(wèn)題梳理(護(hù)士)
- 家庭、私有制和國(guó)家的起源
- 中職《數(shù)學(xué)》課程思政教學(xué)案例(一等獎(jiǎng))
- 水庫(kù)移民安置檔案分類大綱與編號(hào)方案
- GA 1802.2-2022生物安全領(lǐng)域反恐怖防范要求第2部分:病原微生物菌(毒)種保藏中心
評(píng)論
0/150
提交評(píng)論