分層隨機(jī)抽樣_第1頁(yè)
分層隨機(jī)抽樣_第2頁(yè)
分層隨機(jī)抽樣_第3頁(yè)
分層隨機(jī)抽樣_第4頁(yè)
分層隨機(jī)抽樣_第5頁(yè)
已閱讀5頁(yè),還剩109頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

分層隨機(jī)抽樣第1頁(yè),課件共114頁(yè),創(chuàng)作于2023年2月2023/7/92第一節(jié)定義與符號(hào)第2頁(yè),課件共114頁(yè),創(chuàng)作于2023年2月2023/7/93第3頁(yè),課件共114頁(yè),創(chuàng)作于2023年2月定義4.3

分層隨機(jī)抽樣(stratifiedrandomsampling):如果每層中的抽樣都是獨(dú)立地按照簡(jiǎn)單隨機(jī)抽樣進(jìn)行的,那么這樣的分層抽樣稱為分層隨機(jī)抽樣,所得的樣本稱為分層隨機(jī)樣本(stratifiedrandomsample)。2023/7/94第4頁(yè),課件共114頁(yè),創(chuàng)作于2023年2月2023/7/95二、作用由于每層都進(jìn)行抽樣,這就可使樣本在總體中分布更加均勻,從而具有更好的代表性。由于抽樣在每一層中獨(dú)立進(jìn)行,所以一者允許各層選擇不同的適合本層的抽樣方法,二則可同時(shí)對(duì)各子總體(層)進(jìn)行參數(shù)估計(jì),而不單是對(duì)整個(gè)總體的參數(shù)進(jìn)行估計(jì)。由于各層的總體方差因單元之間差異小而肯定小于整個(gè)總體的方差,而抽樣精度與此成正比,所以分層抽樣可以提高參數(shù)估計(jì)的精度。第5頁(yè),課件共114頁(yè),創(chuàng)作于2023年2月6分層原則:

總體中的每一個(gè)單元一定屬于并且只屬于某一個(gè)層,而不可能同時(shí)屬于兩個(gè)層或不屬于任何一個(gè)層。1.估計(jì):層內(nèi)單元具有相同性質(zhì),通常按調(diào)查對(duì)象的不同類型進(jìn)行劃分。2.精度:盡可能使層內(nèi)單元的指標(biāo)值相近,層間單元的差異盡可能大,從而達(dá)到提高抽樣估計(jì)精度的目的。3.估計(jì)和精度:既按類型、又按層內(nèi)單元指標(biāo)值相近的原則進(jìn)行多重分層,同時(shí)達(dá)到實(shí)現(xiàn)估計(jì)類值以及提高估計(jì)精度的目的。4.實(shí)施:抽樣組織實(shí)施的方便,通常按行政管理機(jī)構(gòu)設(shè)置進(jìn)行分層。第6頁(yè),課件共114頁(yè),創(chuàng)作于2023年2月7例題例如,對(duì)全國(guó)范圍汽車運(yùn)輸?shù)某闃诱{(diào)查,調(diào)查目的不僅要推算全國(guó)貨運(yùn)汽車完成的運(yùn)量,還要推算不同經(jīng)濟(jì)成分(國(guó)有、集體、個(gè)體)汽車完成的運(yùn)量。為組織的方便,首先將貨運(yùn)汽車總體按省分層,由各省運(yùn)輸管理部門負(fù)責(zé)省內(nèi)的調(diào)查工作。各省再將省內(nèi)擁有的汽車按經(jīng)濟(jì)成分分層。為提高抽樣效率,再對(duì)汽車按噸位分層。例如,某高校對(duì)學(xué)生在宿舍使用電腦的情況進(jìn)行調(diào)查,根據(jù)經(jīng)驗(yàn),本科生和研究生擁有電腦的狀況差異較大。因此,在抽樣前對(duì)學(xué)生按本科生和研究生進(jìn)行分層是有必要的。第7頁(yè),課件共114頁(yè),創(chuàng)作于2023年2月三、符號(hào)2023/7/98所有總體參數(shù)的估計(jì)量都采用下標(biāo)“st”以示區(qū)別:第8頁(yè),課件共114頁(yè),創(chuàng)作于2023年2月2023/7/99第9頁(yè),課件共114頁(yè),創(chuàng)作于2023年2月2023/7/910第二節(jié)簡(jiǎn)單估計(jì)量及其性質(zhì)一、對(duì)總體均值的估計(jì)分層樣本,總體均值

的估計(jì)分層隨機(jī)樣本,總體均值

的簡(jiǎn)單估計(jì)

第10頁(yè),課件共114頁(yè),創(chuàng)作于2023年2月2023/7/911估計(jì)量的性質(zhì)

性質(zhì)1&2:對(duì)于一般的分層抽樣,如果是的無(wú)偏估計(jì)(),則是的無(wú)偏估計(jì)。的方差為:只要對(duì)各層估計(jì)無(wú)偏,則總體估計(jì)也無(wú)偏。各層可以采用不同的抽樣方法,只要相應(yīng)的估計(jì)量是無(wú)偏的,則對(duì)總體的推算也是無(wú)偏的。第11頁(yè),課件共114頁(yè),創(chuàng)作于2023年2月2023/7/912證明性質(zhì)1

由于對(duì)每一層有

因此,

估計(jì)量的方差

由于各層是獨(dú)立抽取的,因此上式第二項(xiàng)中的協(xié)方差全為0,從而有

第12頁(yè),課件共114頁(yè),創(chuàng)作于2023年2月2023/7/913

性質(zhì)3:對(duì)于分層隨機(jī)抽樣,是的無(wú)偏估計(jì),的方差為:

第13頁(yè),課件共114頁(yè),創(chuàng)作于2023年2月2023/7/914證明性質(zhì)3:

對(duì)于分層隨機(jī)抽樣,各層獨(dú)立進(jìn)行簡(jiǎn)單隨機(jī)抽樣,對(duì)每一層有

因此,由性質(zhì)1,有

由第二章性質(zhì)2,得

因此

第14頁(yè),課件共114頁(yè),創(chuàng)作于2023年2月2023/7/915

性質(zhì)4:對(duì)于分層隨機(jī)抽樣,的一個(gè)無(wú)偏估計(jì)為:

第15頁(yè),課件共114頁(yè),創(chuàng)作于2023年2月2023/7/916證明性質(zhì)4:

對(duì)于分層隨機(jī)抽樣,各層獨(dú)立進(jìn)行簡(jiǎn)單隨機(jī)抽樣,由第二章性質(zhì)3,得的無(wú)偏估計(jì)為:

因此,的一個(gè)無(wú)偏估計(jì)為:

第16頁(yè),課件共114頁(yè),創(chuàng)作于2023年2月2023/7/917二、對(duì)總體總量的估計(jì)

總體總量

的估計(jì)為:

如果得到的是分層隨機(jī)樣本,則總體總量的簡(jiǎn)單估計(jì)為:

第17頁(yè),課件共114頁(yè),創(chuàng)作于2023年2月2023/7/9182.估計(jì)量的性質(zhì)性質(zhì)1:對(duì)于一般的分層抽樣,如果是的無(wú)偏估計(jì),則是的無(wú)偏估計(jì)。的方差為:第18頁(yè),課件共114頁(yè),創(chuàng)作于2023年2月2023/7/919性質(zhì)2:對(duì)于分層隨機(jī)抽樣,的方差為:第19頁(yè),課件共114頁(yè),創(chuàng)作于2023年2月2023/7/920性質(zhì)3:對(duì)于分層隨機(jī)抽樣,的一個(gè)無(wú)偏估計(jì)為:

第20頁(yè),課件共114頁(yè),創(chuàng)作于2023年2月2023/7/921例3.1

調(diào)查某地區(qū)的居民奶制品年消費(fèi)支出,以居民戶為抽樣單元,根據(jù)經(jīng)濟(jì)及收入水平將居民戶劃分為4層,每層按簡(jiǎn)單隨機(jī)抽樣抽取10戶,調(diào)查獲得如下數(shù)據(jù)(單位:元),要估計(jì)該地區(qū)居民奶制品年消費(fèi)總支出及其95%的置信區(qū)間。層居民戶總數(shù)樣本戶奶制品年消費(fèi)支出1234567891012001040011015104080900240050130608010055160851601703750180260110014060200180300220415005035150203025103025第21頁(yè),課件共114頁(yè),創(chuàng)作于2023年2月2023/7/922第22頁(yè),課件共114頁(yè),創(chuàng)作于2023年2月2023/7/923第23頁(yè),課件共114頁(yè),創(chuàng)作于2023年2月24

三、對(duì)總體比例的估計(jì)

總體比例P的估計(jì)為:

估計(jì)量的性質(zhì)

對(duì)于一般的分層抽樣,如果是的無(wú)偏估計(jì)(),則是的無(wú)偏估計(jì)。的方差為:第24頁(yè),課件共114頁(yè),創(chuàng)作于2023年2月25第25頁(yè),課件共114頁(yè),創(chuàng)作于2023年2月26例3.2

在例3.1的調(diào)查中,同時(shí)調(diào)查了居民戶擁有家庭電腦的情況,獲得如下數(shù)據(jù)(單位:臺(tái)),要估計(jì)該地區(qū)居民擁有家庭電腦的比例及估計(jì)的標(biāo)準(zhǔn)差。層居民戶總數(shù)樣本戶擁有家庭電腦情況12345678910120000010001002400010000001037501100001010415001000000000第26頁(yè),課件共114頁(yè),創(chuàng)作于2023年2月27

解:由上表可得,

根據(jù)前面對(duì)各層層權(quán)及抽樣比的計(jì)算結(jié)果,可得各層估計(jì)量的方差:

因此,該地區(qū)居民擁有家庭電腦比例的估計(jì)為:

估計(jì)量的方差為:

估計(jì)量的標(biāo)準(zhǔn)差為:層居民總數(shù)樣本戶擁有家庭電腦情況12345678910120000010001002400010000001037501100001010415001000000000第27頁(yè),課件共114頁(yè),創(chuàng)作于2023年2月對(duì)總體具有特定特征的單元總數(shù)估計(jì)2023/7/928對(duì)于分層隨機(jī)抽樣,總體中具有指定特征的單元總數(shù)A的簡(jiǎn)單估計(jì)量

,具有如下性質(zhì)第28頁(yè),課件共114頁(yè),創(chuàng)作于2023年2月第三節(jié)比率估計(jì)量及其性質(zhì)一種是對(duì)每層樣本分別考慮比估計(jì)量,然后對(duì)各層的比估計(jì)量進(jìn)行加權(quán)平均,即先“比”后“加權(quán)”,此時(shí)所得的估計(jì)量稱為分別比估計(jì)(separateratioestimator)另一種是對(duì)比率的分子和分母分別加權(quán)計(jì)算出總體均值或總體總量的分層估計(jì)量,然后再用對(duì)應(yīng)的分層估計(jì)量來(lái)構(gòu)造比估計(jì),即先“加權(quán)”后“比”,這樣所得的估計(jì)量稱為聯(lián)合比估計(jì)(combinedratioestimator)2023/7/929第29頁(yè),課件共114頁(yè),創(chuàng)作于2023年2月分別比估計(jì)定義3.4總體均值

和總體總量

的分別比估計(jì)為:2023/7/930第30頁(yè),課件共114頁(yè),創(chuàng)作于2023年2月定理3.5對(duì)于分層隨機(jī)抽樣的分別比估計(jì),若各層的樣本量

都比較大,則有2023/7/931第31頁(yè),課件共114頁(yè),創(chuàng)作于2023年2月證明根據(jù)比估計(jì)量的性質(zhì),當(dāng)

比較大時(shí),有2023/7/932第32頁(yè),課件共114頁(yè),創(chuàng)作于2023年2月聯(lián)合比估計(jì)定義3.4總體均值

和總體總量

的分別比估計(jì)為:2023/7/933第33頁(yè),課件共114頁(yè),創(chuàng)作于2023年2月定理3.5對(duì)于分層隨機(jī)抽樣的聯(lián)合比估計(jì),若總樣本量

比較大,則有2023/7/934第34頁(yè),課件共114頁(yè),創(chuàng)作于2023年2月分別比估計(jì)與聯(lián)合比估計(jì)的比較2023/7/935第35頁(yè),課件共114頁(yè),創(chuàng)作于2023年2月1)當(dāng),即或

分別比估計(jì)的精度與聯(lián)合比估計(jì)的精度是一樣的。2)當(dāng),即,分別比估計(jì)的精度不低于聯(lián)合比估計(jì)的精度。3)當(dāng)且,這意味著分別比估計(jì)的精度要高于聯(lián)合比估計(jì)的精度。2023/7/936第36頁(yè),課件共114頁(yè),創(chuàng)作于2023年2月4)當(dāng)且,

或且,聯(lián)合比估計(jì)的精度要高于分別比估計(jì)的精度。5)當(dāng),即比估計(jì)量的方差小于簡(jiǎn)單估計(jì)量的方差時(shí),需視具體情況而定。

2023/7/937第37頁(yè),課件共114頁(yè),創(chuàng)作于2023年2月第四節(jié)回歸估計(jì)量及其性質(zhì)與比估計(jì)相似,將回歸估計(jì)的思想與技術(shù)用于分層隨機(jī)樣本時(shí),同樣有兩種可行的辦法:一種是對(duì)每層樣本分別求取回歸估計(jì)量,然后對(duì)各層的回歸估計(jì)量進(jìn)行加權(quán)平均,即先“回歸”后“加權(quán)”,此時(shí)所得的估計(jì)量稱為分別回歸估計(jì);另一種可行的辦法是對(duì)兩個(gè)變量先分別計(jì)算出總體均值或總體總量的分層簡(jiǎn)單估計(jì)量,然后再對(duì)它們的分層簡(jiǎn)單估計(jì)量來(lái)構(gòu)造回歸估計(jì),即先“加權(quán)”后“回歸”,這時(shí)所得的估計(jì)量稱為聯(lián)合回歸估計(jì)第38頁(yè),課件共114頁(yè),創(chuàng)作于2023年2月3.4.1分別回歸估計(jì)定義3.6

分別回歸估計(jì)是指在分層隨機(jī)抽樣中,先在每層中對(duì)層均值或?qū)涌偤妥龌貧w估計(jì),然后再對(duì)各層的回歸估計(jì)按總體層權(quán)進(jìn)行加權(quán)平均。第39頁(yè),課件共114頁(yè),創(chuàng)作于2023年2月第40頁(yè),課件共114頁(yè),創(chuàng)作于2023年2月

(1)各層的回歸系數(shù)βh事先給定第41頁(yè),課件共114頁(yè),創(chuàng)作于2023年2月

2.不能事先設(shè)定各層的回歸系數(shù)βh第42頁(yè),課件共114頁(yè),創(chuàng)作于2023年2月第43頁(yè),課件共114頁(yè),創(chuàng)作于2023年2月第44頁(yè),課件共114頁(yè),創(chuàng)作于2023年2月3.4.2聯(lián)合回歸估計(jì)第45頁(yè),課件共114頁(yè),創(chuàng)作于2023年2月1.當(dāng)β為事先設(shè)定的常數(shù)時(shí)第46頁(yè),課件共114頁(yè),創(chuàng)作于2023年2月2.當(dāng)回歸系數(shù)β不能事先設(shè)定時(shí)第47頁(yè),課件共114頁(yè),創(chuàng)作于2023年2月第48頁(yè),課件共114頁(yè),創(chuàng)作于2023年2月3.4.3分別回歸估計(jì)與聯(lián)合回歸估計(jì)的比較第49頁(yè),課件共114頁(yè),創(chuàng)作于2023年2月第50頁(yè),課件共114頁(yè),創(chuàng)作于2023年2月第51頁(yè),課件共114頁(yè),創(chuàng)作于2023年2月例3.3已知某公司一般職員(包括辦事員和保管人員)及高級(jí)管理(經(jīng)理)人員剛進(jìn)入公司時(shí)的工資總額,欲通過(guò)抽樣調(diào)查估計(jì)當(dāng)前該公司職員的工資總額Y。抽樣按照一般職員層與高管層進(jìn)行分層隨機(jī)抽取。一般職員層抽取n1=15名職員,高管層抽取n2=10名職員。同時(shí)還知道一般職員層人員總數(shù)N1=390名,該類職員進(jìn)入公司時(shí)工資總額為X1=5523965元;高管層人員總數(shù)N2=84名,該類職員進(jìn)入公司時(shí)工資總額為X2=2541660元。經(jīng)過(guò)分層隨機(jī)抽樣調(diào)查所得的數(shù)據(jù)如表3—5所示。請(qǐng)對(duì)上述數(shù)據(jù)分別按照分別比估計(jì)、聯(lián)合比估計(jì)、分別回歸估計(jì)、聯(lián)合回歸估計(jì)以及差估計(jì)方法對(duì)該公司當(dāng)前職員工資總額Y做出估計(jì),同時(shí)計(jì)算出各個(gè)估計(jì)量的精度。第52頁(yè),課件共114頁(yè),創(chuàng)作于2023年2月第53頁(yè),課件共114頁(yè),創(chuàng)作于2023年2月第54頁(yè),課件共114頁(yè),創(chuàng)作于2023年2月第55頁(yè),課件共114頁(yè),創(chuàng)作于2023年2月第56頁(yè),課件共114頁(yè),創(chuàng)作于2023年2月第57頁(yè),課件共114頁(yè),創(chuàng)作于2023年2月第58頁(yè),課件共114頁(yè),創(chuàng)作于2023年2月第59頁(yè),課件共114頁(yè),創(chuàng)作于2023年2月第60頁(yè),課件共114頁(yè),創(chuàng)作于2023年2月五種估計(jì)方法結(jié)果比較第61頁(yè),課件共114頁(yè),創(chuàng)作于2023年2月注意:此時(shí)的比估計(jì)和回歸估計(jì)(回歸系數(shù)采用樣本回歸系數(shù)進(jìn)行估計(jì))均為有偏估計(jì),并且考慮到各層的樣本量都不大,回歸估計(jì)的偏倚有可能更大,所以此時(shí)采用比估計(jì),特別是聯(lián)合比估計(jì)會(huì)更保險(xiǎn)。

而差估計(jì)雖然標(biāo)準(zhǔn)差相對(duì)較大,但它卻是無(wú)偏的,均方誤差并不一定大,所以仍然有采用的價(jià)值。第62頁(yè),課件共114頁(yè),創(chuàng)作于2023年2月3.4.4比率估計(jì)與回歸估計(jì)小結(jié)在分層隨機(jī)抽樣中,當(dāng)輔助變量可加以利用時(shí),為了提高估計(jì)量的精度,可以采用分別比估計(jì)、聯(lián)合比估計(jì)、分別回歸估計(jì)以及聯(lián)合回歸估計(jì)等估計(jì)方法。在比估計(jì)中,分別比估計(jì)與聯(lián)合比估計(jì)均為有偏估計(jì)量,當(dāng)各層樣本量都較大時(shí),分別比估計(jì)與聯(lián)合比估計(jì)近似無(wú)偏;當(dāng)某些層的樣本量不夠大,而總樣本量較大時(shí),聯(lián)合比估計(jì)近似無(wú)偏。在回歸估計(jì)中,少數(shù)情況下,回歸系數(shù)可以是事先設(shè)定的常數(shù),其估計(jì)量無(wú)偏;多數(shù)情況下,回歸系數(shù)需利用樣本回歸系數(shù)進(jìn)行估計(jì),其估計(jì)有偏,但在大樣本的情況下近似無(wú)偏。當(dāng)Y與X高度相關(guān)時(shí),分別比估計(jì)、聯(lián)合比估計(jì)、分別回歸估計(jì)以及聯(lián)合回歸估計(jì)等估計(jì)等產(chǎn)生的估計(jì)量都是有效的。第63頁(yè),課件共114頁(yè),創(chuàng)作于2023年2月選擇估計(jì)方法,大致需遵循的原則在選擇估計(jì)方法時(shí),大致需遵循下面的原則:(1)由于分別估計(jì)(無(wú)論是分別比估計(jì)還是分別回歸估計(jì))要求各層的樣本量都比較大,所以當(dāng)某些層的樣本量不夠大時(shí),建議采用聯(lián)合估計(jì)(2)當(dāng)回歸系數(shù)需要由樣本進(jìn)行估計(jì)時(shí),回歸估計(jì)量是有偏的,尤其當(dāng)樣本量較小的時(shí)候,回歸估計(jì)量的偏倚可能會(huì)更大,從而導(dǎo)致均方誤差增大,因此在這種情況下,采取比估計(jì)尤其是聯(lián)合比估計(jì)也許更保險(xiǎn)(3)如果各層的樣本量都比較大,同時(shí)每層的比估計(jì)或回歸估計(jì)也比較有效(即ρh均比較大),而且各層的Rh之間(或βh之間)差異較大,則此時(shí)分別估計(jì)優(yōu)于聯(lián)合估計(jì),估計(jì)量的方差更小第64頁(yè),課件共114頁(yè),創(chuàng)作于2023年2月(4)如果各層的樣本量不大,而且各層的Rh之間(或βh之間)差異較小,則采用聯(lián)合估計(jì)較為適宜(5)如果各層的Rh之間(或βh之間)差別不是太大,而且并不是每層的樣本量都相當(dāng)大,則聯(lián)合估計(jì)可能更保險(xiǎn)一些如果各層的回歸系數(shù)都接近于1,則可以采用差估計(jì)。雖然有時(shí)差估計(jì)量的方差偏大,但由于它為無(wú)偏估計(jì)量,所以總的均方誤差不一定大。第65頁(yè),課件共114頁(yè),創(chuàng)作于2023年2月2023/7/966第五節(jié)各層樣本量的分配

確定樣本量:總的樣本量,各層樣本量估計(jì)量的方差不僅與各層的方差有關(guān),還和各層所分配的樣本量有關(guān)。第66頁(yè),課件共114頁(yè),創(chuàng)作于2023年2月實(shí)際工作中有不同的分配方法,可以按各層單元數(shù)占總體單元數(shù)的比例分配,也可以采用使估計(jì)量總方差達(dá)到最小、費(fèi)用最小。

2023/7/967第67頁(yè),課件共114頁(yè),創(chuàng)作于2023年2月2023/7/968一、比例分配

按各層單元數(shù)占總體單元數(shù)的比例,也就是按各層的層權(quán)進(jìn)行分配.對(duì)于分層隨機(jī)抽樣,這時(shí)總體均值的估計(jì)是自加權(quán)第68頁(yè),課件共114頁(yè),創(chuàng)作于2023年2月2023/7/969總體中的任一個(gè)單元,不管它在哪一個(gè)層,都以同樣的概率入樣,因此按比例分配的分層隨機(jī)樣本,估計(jì)量的形式特別簡(jiǎn)單。這種樣本也稱為自加權(quán)的樣本??傮w比例的估計(jì)是

第69頁(yè),課件共114頁(yè),創(chuàng)作于2023年2月2023/7/970二、最優(yōu)分配

(一)最優(yōu)分配在分層隨機(jī)抽樣中,如何將樣本量分配到各層,使得總費(fèi)用給定的條件下,估計(jì)量的方差達(dá)到最小,或給定估計(jì)量方差的條件下,使總費(fèi)用最小,能滿足這個(gè)條件的樣本量分配就是最優(yōu)分配。第70頁(yè),課件共114頁(yè),創(chuàng)作于2023年2月2023/7/971第71頁(yè),課件共114頁(yè),創(chuàng)作于2023年2月2023/7/972第72頁(yè),課件共114頁(yè),創(chuàng)作于2023年2月2023/7/973定理3.7的證明對(duì)所有層成立時(shí),達(dá)到極小

常數(shù)第73頁(yè),課件共114頁(yè),創(chuàng)作于2023年2月2023/7/974簡(jiǎn)單線性費(fèi)用函數(shù),總費(fèi)用由此得出下面的行為準(zhǔn)則,如果某一層·單元數(shù)較多·內(nèi)部差異較大·費(fèi)用比較省則對(duì)這一層的樣本量要多分配一些。第74頁(yè),課件共114頁(yè),創(chuàng)作于2023年2月2023/7/975三Neyman(內(nèi)曼)最優(yōu)分配如果每層抽樣的費(fèi)用相同,最優(yōu)分配可簡(jiǎn)化為這種分配稱為Neyman分配。這時(shí),達(dá)到最小。

第75頁(yè),課件共114頁(yè),創(chuàng)作于2023年2月2023/7/976第76頁(yè),課件共114頁(yè),創(chuàng)作于2023年2月2023/7/977例3.4

某市有甲、乙兩個(gè)地區(qū),現(xiàn)要進(jìn)行家庭收入的調(diào)查。令n=500,已知甲地區(qū)共有20000戶居民,乙地區(qū)共有50000戶居民;甲地居民和乙地居民年收入標(biāo)準(zhǔn)差估計(jì)分別為S1=2500,S2=2000;同時(shí)對(duì)甲地和乙地每戶的平均抽樣費(fèi)用之比為2∶3,請(qǐng)分別計(jì)算出在甲地和乙地進(jìn)行比例分配、一般最優(yōu)分配(考慮費(fèi)用因素)以及內(nèi)曼分配(不考慮費(fèi)用因素)的樣本量。第77頁(yè),課件共114頁(yè),創(chuàng)作于2023年2月2023/7/978第78頁(yè),課件共114頁(yè),創(chuàng)作于2023年2月2023/7/979第79頁(yè),課件共114頁(yè),創(chuàng)作于2023年2月2023/7/980四、某些層要求大于100%抽樣時(shí)的修正

按最優(yōu)分配時(shí),有時(shí)抽樣比f(wàn)較大,某個(gè)層的又比較大,則可能出現(xiàn)按最優(yōu)分配計(jì)算的這個(gè)層的樣本量超過(guò)的情況。實(shí)際工作中,如果第k層出現(xiàn)這種情況,最優(yōu)分配是對(duì)這個(gè)層進(jìn)行100%的抽樣,即取,然后,將剩下的樣本量按最優(yōu)分配分到各層。

第80頁(yè),課件共114頁(yè),創(chuàng)作于2023年2月五、偏離最優(yōu)分配時(shí)對(duì)精度的影響2023/7/981第81頁(yè),課件共114頁(yè),創(chuàng)作于2023年2月例3.62023/7/982第82頁(yè),課件共114頁(yè),創(chuàng)作于2023年2月2023/7/983第83頁(yè),課件共114頁(yè),創(chuàng)作于2023年2月六、多變量情況下樣本量在各層的分配1.比例分配

在分層隨機(jī)抽樣中,當(dāng)一項(xiàng)調(diào)查含有多個(gè)指標(biāo)時(shí),最簡(jiǎn)單的一種樣本量分配方式就是比例分配。由于比例分配并不涉及具體的指標(biāo),并且此時(shí)總體總量和總體均值的估計(jì)都是自加權(quán)的,不但形式簡(jiǎn)單,而且數(shù)據(jù)處理也相對(duì)容易,并且在多數(shù)情況下都能得到比較令人滿意的結(jié)果,所以此時(shí)這種分配方式是可取的。2023/7/984第84頁(yè),課件共114頁(yè),創(chuàng)作于2023年2月

2.各指標(biāo)最優(yōu)分配平均法2023/7/985第85頁(yè),課件共114頁(yè),創(chuàng)作于2023年2月

3.查特吉方法(1967年)2023/7/986從實(shí)際分配的樣本量與各個(gè)指標(biāo)所對(duì)應(yīng)的理論最優(yōu)分配樣本量發(fā)生偏離所引起的方差增量的角度進(jìn)行考慮的。一些實(shí)際的研究結(jié)果標(biāo)明,查特吉方法與最優(yōu)分配平均法的差別甚小第86頁(yè),課件共114頁(yè),創(chuàng)作于2023年2月4.耶茨方法Ⅰ(1960年)有些調(diào)查中,單個(gè)變量的最優(yōu)分配彼此差別很大,沒(méi)有一個(gè)明顯的折中數(shù)字,這時(shí)就需要一些準(zhǔn)則來(lái)確定該如何進(jìn)行樣本量的分配。這就是接下來(lái)所要講的耶茨(Yates)方法Ⅰ和Ⅱ。耶茨方法Ⅰ要求由估計(jì)量的誤差所引起的損失可以用錢或效用來(lái)衡量。通常將損失寫成估計(jì)量方差的線性函數(shù)是合理的。2023/7/987第87頁(yè),課件共114頁(yè),創(chuàng)作于2023年2月2023/7/988第88頁(yè),課件共114頁(yè),創(chuàng)作于2023年2月

5.耶茨方法Ⅱ(1960年)2023/7/989第89頁(yè),課件共114頁(yè),創(chuàng)作于2023年2月2023/7/990第六節(jié)總樣本量的確定

令當(dāng)方差給定時(shí)

第90頁(yè),課件共114頁(yè),創(chuàng)作于2023年2月2023/7/991當(dāng)按比例分配時(shí),

實(shí)際工作中,n的計(jì)算可以分為兩步,先計(jì)算:然后進(jìn)行修正:

第91頁(yè),課件共114頁(yè),創(chuàng)作于2023年2月2023/7/992當(dāng)按Neyman分配時(shí),

第92頁(yè),課件共114頁(yè),創(chuàng)作于2023年2月2023/7/993第93頁(yè),課件共114頁(yè),創(chuàng)作于2023年2月2、精度要求是以

的絕對(duì)誤差限d(在給定的置信水平1-α下)的形式給出的2023/7/994第94頁(yè),課件共114頁(yè),創(chuàng)作于2023年2月2023/7/995第95頁(yè),課件共114頁(yè),創(chuàng)作于2023年2月3.精度要求以

的相對(duì)誤差限r(nóng)(在給定的置信水平1-α下)的形式給出2023/7/996第96頁(yè),課件共114頁(yè),創(chuàng)作于2023年2月2023/7/997第97頁(yè),課件共114頁(yè),創(chuàng)作于2023年2月例3.72023/7/998第98頁(yè),課件共114頁(yè),創(chuàng)作于2023年2月2023/7/999第99頁(yè),課件共114頁(yè),創(chuàng)作于2023年2月2023/7/9100第100頁(yè),課件共114頁(yè),創(chuàng)作于2023年2月2023/7/9101二、總費(fèi)用給定時(shí)總樣本量的確定給定V時(shí)第101頁(yè),課件共114頁(yè),創(chuàng)作于2023年2月2023/7/9102給定C時(shí)第102頁(yè),課件共114頁(yè),創(chuàng)作于2023年2月2023/7/9103第七節(jié)分層抽樣的其他方面

一、多重分層定義當(dāng)調(diào)查指標(biāo)ψ與兩個(gè)或多個(gè)輔助變量x1,x2,…都存在相關(guān)關(guān)系時(shí),為了提高分層的效益,需要按每一個(gè)輔助變量進(jìn)行分層,通常的做法是先按最主要的變量分成大層,在大層中再按第二主要變量分成子層,從而形成交叉分層。當(dāng)存在多個(gè)分層變量時(shí),這種分層方式即稱為多重分層(multiplestratification)。第103頁(yè),課件共114頁(yè),創(chuàng)作于2023年2月對(duì)于多重分層,當(dāng)“子層”劃分好以后,就要考慮樣本量在各子層的分配問(wèn)題。最簡(jiǎn)單常用的樣本量分配方法是按照與每一子層大小成比例的原則進(jìn)行分配。在多重分層中,有時(shí)會(huì)出現(xiàn)這樣一個(gè)問(wèn)題:當(dāng)總樣本量n相對(duì)于子層總數(shù)RC不夠大時(shí),會(huì)出現(xiàn)某些子層分配不到樣本的情況。

若n<max(R,C),則此時(shí)應(yīng)當(dāng)考慮重新確定分層變量或者不采用分層抽樣,否則這種分層的效益是很難保證的。

若n<RC,同時(shí)還滿足n≥max(R,C),就可以考慮用試驗(yàn)設(shè)計(jì)的思想來(lái)進(jìn)行樣本量的分配。2023/7/9104第104頁(yè),課件共114頁(yè),創(chuàng)作于2023年2月2023/7/9105二、事后分層

實(shí)際工作中,有時(shí)進(jìn)行事先分層會(huì)存在一定的困難各層的抽樣框無(wú)法得到幾個(gè)變量都適合于分層,要進(jìn)行事先的交叉分層比較困難,并且我們并不需要交叉分層后每個(gè)子層的估計(jì)(如需要按年齡分

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論