版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第7章其它抽樣方法第7章其它抽樣方法第一節(jié)樣本輪換
第二節(jié)雙重抽樣
第三節(jié)隨機(jī)化裝置
第一節(jié)樣本輪換
第二節(jié)雙重抽樣
第三節(jié)隨機(jī)化裝置
問(wèn)題提出
時(shí)間序列數(shù)據(jù)以及隨后出現(xiàn)的面板數(shù)據(jù)都是經(jīng)濟(jì)統(tǒng)計(jì)分析和計(jì)量分析中非常重要的數(shù)據(jù)類型。當(dāng)我們?cè)谘芯繎?yīng)該應(yīng)用什么統(tǒng)計(jì)和計(jì)量的方法去分析既定的時(shí)間序列數(shù)據(jù)時(shí),是否考慮過(guò)以下幾個(gè)問(wèn)題?
時(shí)間序列數(shù)據(jù)是如何產(chǎn)生的?
所產(chǎn)生的時(shí)間序列數(shù)據(jù)是否準(zhǔn)確?
如何讓時(shí)間序列數(shù)據(jù)更加準(zhǔn)確?問(wèn)題提出時(shí)間序列數(shù)
隨著社會(huì)經(jīng)濟(jì)現(xiàn)象的不斷變化和發(fā)展,很多調(diào)查對(duì)象的總體也在不斷變化和發(fā)展。為了能夠及時(shí)反映調(diào)查總體的這種變化和發(fā)展,調(diào)查部門就需要對(duì)同一總體在不同時(shí)間上進(jìn)行連續(xù)性抽樣調(diào)查(SuccessiveSamplingSurvey),并定期公布調(diào)查結(jié)果,形成一系列時(shí)序統(tǒng)計(jì)數(shù)據(jù)。因此,社會(huì)經(jīng)濟(jì)抽樣調(diào)查一般都應(yīng)該是連續(xù)性的定期調(diào)查。
一次性抽樣調(diào)查與截面數(shù)據(jù)
連續(xù)性抽樣調(diào)查與時(shí)間序列數(shù)據(jù)及面板數(shù)據(jù)隨著社會(huì)經(jīng)濟(jì)現(xiàn)象的不斷變化和發(fā)展,很
抽樣調(diào)查除了對(duì)總體的一次性抽樣以外,很多重要的調(diào)查是隔一段時(shí)間重復(fù)進(jìn)行的,對(duì)于這種經(jīng)常性的抽樣問(wèn)題,就必須重視其樣本輪換問(wèn)題的研究。對(duì)于樣本輪換問(wèn)題,我們至少應(yīng)考慮以下問(wèn)題:每次調(diào)查的樣本如何組成?是采用固定樣本還是采用全新的樣本,或者是部分保留部分替換,即樣本輪換;在估計(jì)后期的總量或均值時(shí),是否需要利用前期的信息來(lái)改進(jìn)現(xiàn)期的估計(jì),以及如何利用;如果采用樣本輪換的方法,如何確定最優(yōu)的保留比例或替換比例。第一節(jié)
樣本輪換
抽樣調(diào)查除了對(duì)總體的一次性抽樣以外,很多重要的調(diào)查是連續(xù)性抽樣設(shè)計(jì)方法按抽取樣本的不同劃分輪換樣本重復(fù)樣本固定樣本單水平輪換不完全的單水平輪換多水平輪換連續(xù)性抽樣設(shè)計(jì)方法按抽取樣本的不同劃分輪換樣本重復(fù)樣本固定樣
輪換模式應(yīng)用舉例加拿大勞動(dòng)力調(diào)查(LFS)使用6~0單水平輪換模式美國(guó)現(xiàn)時(shí)人口調(diào)查(CPS)使用4~8~4不完全單水平輪換模式美國(guó)消費(fèi)者支出的季度調(diào)查(CEQ)便采用4~0三水平輪換模式中國(guó)城市住戶抽樣調(diào)查中國(guó)規(guī)模以下工業(yè)企業(yè)抽樣調(diào)查中國(guó)農(nóng)產(chǎn)量抽樣調(diào)查輪換模式應(yīng)用舉例加拿大勞動(dòng)力調(diào)查(LFS)使用6~0單一、樣本輪換的原因如果是單純地估計(jì)現(xiàn)值的情況,當(dāng)然最好每次重新抽取新樣本,這樣必然會(huì)增加費(fèi)用;如果要逐期地與上期比較,則采用固定樣本的方法為好,固定樣本可以消除樣本的因素而只觀察動(dòng)態(tài)的變化。然而,樣本長(zhǎng)期不變,隨著時(shí)間的推移,固定樣本會(huì)顯露它的弊端,既難以反映總體的變化,而且受訪者也會(huì)產(chǎn)生厭煩心理,出現(xiàn)不合作或回答質(zhì)量下降等問(wèn)題,從而影響調(diào)查質(zhì)量。另外,無(wú)論是采用固定樣本還是全新樣本都難以正確地反映總體在各個(gè)不同時(shí)間上的水平及變化,因此,一種廣泛采用的方法是樣本輪換,即每隔一定時(shí)間(一個(gè)月、一季或一年)更換一定比例的單元,保留其余單元。第一節(jié)
樣本輪換
一、樣本輪換的原因第一節(jié)樣本輪換
與傳統(tǒng)的一次性抽樣調(diào)查相比,輪換的抽樣調(diào)查具有以下特有的優(yōu)勢(shì):
節(jié)省調(diào)查費(fèi)用和調(diào)查資源
在一定程度上減輕被調(diào)查者回答負(fù)擔(dān)
利用前后各期之間的相關(guān)關(guān)系提高估計(jì)精度與傳統(tǒng)的一次性抽樣調(diào)查相比,輪換的抽樣我國(guó)1996年新修訂的《統(tǒng)計(jì)法》第十條明確規(guī)定:“統(tǒng)計(jì)調(diào)查應(yīng)當(dāng)以周期性普查為基礎(chǔ),以經(jīng)常性抽樣調(diào)查為主體,以必要的統(tǒng)計(jì)報(bào)表、重點(diǎn)調(diào)查、綜合分析等為補(bǔ)充,搜集、整理基本統(tǒng)計(jì)資料?!币虼耍诮窈笪覈?guó)政府統(tǒng)計(jì)部門開展的統(tǒng)計(jì)調(diào)查制度與方法改革的過(guò)程中,最重要的就是圍繞如何更好地發(fā)揮經(jīng)常性抽樣調(diào)查的主體作用,研究并應(yīng)用更加符合我國(guó)國(guó)情的經(jīng)常性抽樣調(diào)查方法,以此得出更加準(zhǔn)確的統(tǒng)計(jì)數(shù)據(jù),為我國(guó)政府部門、研究機(jī)構(gòu)以及各類企事業(yè)單位等社會(huì)各界服務(wù)。
我國(guó)抽樣調(diào)查制度與方法改革的方向我國(guó)1996年新修訂的《統(tǒng)計(jì)法》第十條明確規(guī)定:“統(tǒng)計(jì)調(diào)查應(yīng)二、樣本輪換的最優(yōu)比例第一個(gè)時(shí)期采用有放回簡(jiǎn)單隨機(jī)抽樣方式抽出樣本量為n的樣本;在第二個(gè)時(shí)期采用有放回簡(jiǎn)單隨機(jī)抽樣方式選出樣本量為nq的舊有樣本點(diǎn)以便替換掉,即保留的樣本量為np,保留樣本的比例為p,同時(shí)獨(dú)立地依有放回簡(jiǎn)單隨機(jī)樣本方式補(bǔ)充新的nq個(gè)新樣本點(diǎn),這里p+q=1,這樣第二個(gè)時(shí)期的樣本量仍舊為n。設(shè):第一節(jié)
樣本輪換
二、樣本輪換的最優(yōu)比例第一節(jié)樣本輪換
為第一個(gè)時(shí)期與第二個(gè)時(shí)期相同的np個(gè)單元在第一個(gè)時(shí)期的均值。為第一個(gè)時(shí)期nq個(gè)單元在第一個(gè)時(shí)期的均值。為np個(gè)單元在第二個(gè)時(shí)期的樣本均值。為nq個(gè)補(bǔ)充單元在第二個(gè)時(shí)期的樣本均值。ρ為和之間的相關(guān)系數(shù)。如果希望估計(jì)第二個(gè)時(shí)期的樣本均值并充分利用第一個(gè)時(shí)期的信息,令該估計(jì)量為,那么它應(yīng)該是充分利用前后期中保留樣本、不保留樣本和后期新補(bǔ)充樣本的加權(quán)平均數(shù)。
第一節(jié)
樣本輪換
為第一個(gè)時(shí)期與第二個(gè)時(shí)期相同的np個(gè)單元在第一
設(shè)我們希望得到的估計(jì)量是兩期估計(jì)量的線性函數(shù),即
=a+b+c+d
(7.1)要求估計(jì)其參數(shù)a,b,c,d。因?yàn)镋()=E()=,E()=E()=,所以E()=(a+b)+(c+d)。要使成為的無(wú)偏估計(jì)量,需a+b=0,c+d=1,也即b=-a,d=1-c。代入(7.1),有
=a(-)+c+(1-c)
第一節(jié)
樣本輪換
設(shè)我們希望得到的估計(jì)量是兩期估計(jì)量的線性函第一節(jié)
樣本輪換
該估計(jì)量的方差可以求得為:
其中是第一個(gè)時(shí)期的方差,是第二個(gè)時(shí)期的方差。我們要求出a和c,使得達(dá)到最小,就要以上公式分別對(duì)a和c求偏微分并使之等于0,即可求出a和c的最優(yōu)值分別為:第一節(jié)樣本輪換該估計(jì)量的方差可以求得為:其第一節(jié)
樣本輪換
該估計(jì)量的方差可以求得為:第一節(jié)樣本輪換該估計(jì)量的方差可以求得為:第一節(jié)
樣本輪換
將其代入公式(7.1),就得到該估計(jì)量的方差為:第一節(jié)樣本輪換將其代入公式(7.1),就得到該估計(jì)第一節(jié)
樣本輪換
如果不利用前期信息,只根據(jù)第二期的結(jié)果來(lái)估計(jì)均值,那么:其方差為:第一節(jié)樣本輪換如果不利用前期信息,只根據(jù)第二期的結(jié)果第一節(jié)
樣本輪換
故利用前期信息后的設(shè)計(jì)效果為:
從上式可以看出,當(dāng)ρ的值比較大時(shí),利用上期信息可以較大地提高的效率。表7.1給出了不同的q,ρ值時(shí)的值。第一節(jié)樣本輪換故利用前期信息后的設(shè)計(jì)效果為:第一節(jié)
樣本輪換
表7.1不同的q,ρ值時(shí)的值第一節(jié)樣本輪換表7.1不同的q,ρ
若對(duì)上式關(guān)于q求偏導(dǎo),并使之等于0,那么便可得到最優(yōu)輪換比:若對(duì)上式關(guān)于q求偏導(dǎo),并使之等于0,那么便可得到最優(yōu)第一節(jié)
樣本輪換
三、樣本輪換方法(一)
隨機(jī)輪換法
在進(jìn)行輪換時(shí)按確定的輪換單位數(shù)目或比例,從原有樣本中隨機(jī)抽出若干單位不再調(diào)查,而從其余未包括在樣本中的總體單位中抽取同樣數(shù)目的單位來(lái)代替。第一節(jié)樣本輪換三、樣本輪換方法第一節(jié)
樣本輪換
(二)
等距輪換法
在總體抽樣框中確定出各個(gè)等距抽樣的樣本,在各次的調(diào)查中,按相應(yīng)位置的等距樣本單位進(jìn)行輪換。我國(guó)農(nóng)村住戶調(diào)查就是采用這種輪換方式。(三)
子樣本輪換法從總體中抽出若干套子樣本,每次調(diào)查一定數(shù)量的子樣本,逐次輪換其中的部分子樣本。
第一節(jié)樣本輪換(二)
等第一節(jié)
樣本輪換
子樣本輪換實(shí)際上就是每次采用交叉子樣本,而交叉子樣本不僅能有效地減少和控制估計(jì)偏差,而且由于每個(gè)交叉子樣本都能代表總體,即使有的子樣本資料搜集不到,我們也可以用其他的子樣本甚至一個(gè)子樣本來(lái)觀察和推斷總體。此外,用交叉子樣本還可以考察非抽樣誤差發(fā)生的程度。因此,一般來(lái)說(shuō),子樣本輪換方法是以上三種樣本輪換方法中最好的。第一節(jié)樣本輪換子樣本輪換實(shí)際上就是每次采用交第一節(jié)
樣本輪換
五、案例介紹美國(guó)人口現(xiàn)狀調(diào)查(currentpopulationsurvey,CPS)是國(guó)際上最著名的抽樣調(diào)查項(xiàng)目之一,已經(jīng)成為美國(guó)以及許多國(guó)家進(jìn)行居民調(diào)查的參考模型,其實(shí)施是在每個(gè)月包含19號(hào)的那一周進(jìn)行,調(diào)查的問(wèn)題涉及受訪者此前一周內(nèi)的活動(dòng)。調(diào)查氛圍覆蓋全美50個(gè)州和哥倫比亞地區(qū)。CPS采用的就是樣本輪換的方法,即每位受訪者連續(xù)4個(gè)月接受訪問(wèn),然后退出樣本,8個(gè)月后再進(jìn)入樣本,連續(xù)4個(gè)月接受訪問(wèn),最后永久地退出樣本。第一節(jié)樣本輪換五、案例介紹第一節(jié)
樣本輪換
CPS在1995年7月的抽樣設(shè)計(jì)方案中樣本輪換的特征:
1.在任意一個(gè)月內(nèi),都有1/8的住戶單元第一次接受調(diào)查,1/8的住戶單元第二次接受調(diào)查,依次類推。
2.每個(gè)月都由新的樣本組代替從樣本中永久退出的老樣本組。
3.每個(gè)月都有一個(gè)樣本組在閑置8個(gè)月后重新接受調(diào)查,以此代替剛剛進(jìn)入閑置期的樣本組。
4.通過(guò)輪換設(shè)計(jì),保證每個(gè)樣本單元在2個(gè)年份的4個(gè)相同月份里接受調(diào)查。
5.在連續(xù)的2個(gè)月內(nèi),有3/4的樣本點(diǎn)是相同的;在連續(xù)的2年內(nèi),有1/2的樣本點(diǎn)是相同的。
第一節(jié)樣本輪換CPS在1995年7月的抽樣設(shè)計(jì)方案
二維平衡單水平輪換模式的輪換過(guò)程
二維平衡單水平輪換模式的輪換過(guò)程
第二節(jié)
雙重抽樣
我們可以先從總體中抽取一個(gè)大的初始樣本,從而獲得總體的輔助信息,然后再?gòu)某跏紭颖净驈目傮w中再抽一個(gè)子樣本,這種方法就是雙重抽樣。
第二節(jié)雙重抽樣我們可以先從總體中抽取一個(gè)大的第二節(jié)
雙重抽樣
一、定義雙重抽樣(doublesampling),也稱二相抽樣或二重抽樣(two-phasesampling),是指在抽樣時(shí)分兩步抽取樣本。一般情況下,先從總體N中抽取一個(gè)較大的樣本,稱為第一重(相)樣本(thefirstphasesample),對(duì)之進(jìn)行調(diào)查以獲取總體的某些輔助信息,為下一步的抽樣估計(jì)提供條件;然后進(jìn)行第二重抽樣(thesecondphasesampling)。第二重抽樣所抽的樣本n相對(duì)較小,但是第二重抽樣調(diào)查才是主調(diào)查。第二節(jié)雙重抽樣一、定義第二節(jié)
雙重抽樣
二、雙重抽樣與兩階段抽樣的區(qū)別(一)兩階段抽樣(two-stagesampling)是先從總體N個(gè)單元(初級(jí)單元)中抽出n個(gè)樣本單元,卻并不對(duì)這n個(gè)樣本單元中的所有小單元(二級(jí)單元)都進(jìn)行調(diào)查,而是在其中再抽出若干個(gè)二級(jí)單元進(jìn)行調(diào)查;雙重抽樣則不同,要對(duì)第一重(相)樣本進(jìn)行調(diào)查以獲取總體的某些輔助信息,并且要利用這些輔助信息進(jìn)行排序、分層、抽樣或估計(jì)等。第二節(jié)雙重抽樣二、雙重抽樣與兩階段抽樣的區(qū)別第二節(jié)
雙重抽樣
(二)兩階段抽樣的第二階段抽樣單元和第一階段抽樣單元往往是不同的;雙重抽樣要有一份最終單元的完整名冊(cè)(總體所有單元的抽樣框),而兩階段抽樣只是需要第一階段單元(初級(jí)單元)名冊(cè),然后在中選的初級(jí)單元中構(gòu)造第二階段抽樣的抽樣框。第二節(jié)雙重抽樣(二)兩階段抽樣的第二階段抽樣單元和第二節(jié)
雙重抽樣
三、雙重抽樣的作用(一)有助于篩選主調(diào)查對(duì)象,如對(duì)高血壓病人的調(diào)查、銀行對(duì)儲(chǔ)戶存款的調(diào)查等;(二)提高抽樣效率,因?yàn)榈诙爻闃涌衫玫谝恢貥颖镜男畔⑦M(jìn)行分層和比率估計(jì);(四)可用于研究樣本輪換中的某些問(wèn)題;(五)降低無(wú)回答偏差,對(duì)無(wú)回答層進(jìn)行第二重抽樣并對(duì)其推斷。第二節(jié)雙重抽樣三、雙重抽樣的作用第二節(jié)
雙重抽樣
四、雙重抽樣的應(yīng)用
(一)為分層的雙重抽樣分層抽樣如果事先無(wú)法知道總體的層權(quán),可以采用雙重抽樣。具體實(shí)施過(guò)程如下:第一步:利用簡(jiǎn)單隨機(jī)抽樣,從總體的N個(gè)單元中隨機(jī)抽取第一重樣本,樣本單元數(shù)為;根據(jù)已知的分層標(biāo)志將第一重樣本分層,令,則是總體層權(quán)的無(wú)偏估計(jì)。第二節(jié)雙重抽樣四、雙重抽樣的應(yīng)用第二節(jié)
雙重抽樣
第二步:利用分層隨機(jī)抽樣,從第一重樣本中抽取出第二重樣本,樣本單元數(shù)為n,第h層樣本單元數(shù)為,。采用雙重分層抽樣,對(duì)總體均值的無(wú)偏估計(jì)量為:
的方差為:第二節(jié)雙重抽樣第二步:利用分層隨機(jī)抽樣,從第一重樣第二節(jié)
雙重抽樣
上式可簡(jiǎn)化為:
的樣本估計(jì)量為:第二節(jié)雙重抽樣上式可簡(jiǎn)化為:的樣本第二節(jié)
雙重抽樣
第一步:從總體的N個(gè)單元中隨機(jī)抽取第一重樣本,樣本單元數(shù)為;對(duì)于第一重樣本,僅觀測(cè)輔助變量信息,用輔助變量的樣本均值估計(jì)總體均值。(二)為比率估計(jì)的雙重抽樣在實(shí)際工作中,如果輔助變量的信息未知,可以利用雙重抽樣進(jìn)行比率估計(jì)。具體實(shí)施過(guò)程如下:第二節(jié)雙重抽樣第一步:從總體的N個(gè)單元中隨機(jī)抽取第第二節(jié)
雙重抽樣
雙重抽樣對(duì)總體均值的比率估計(jì):
第二步:從第一重樣本中隨機(jī)抽取出第二重樣本,樣本單元數(shù)為n;對(duì)于第二重樣本,觀測(cè)目標(biāo)變量與輔助變量,并用獲得的和,計(jì)算,構(gòu)造比率估計(jì)。雙重抽樣比率估計(jì)的方差為:第二節(jié)雙重抽樣雙重抽樣對(duì)總體均值的比率估計(jì):第二節(jié)
雙重抽樣
雙重抽樣比率估計(jì)方差的樣本估計(jì):
第二節(jié)雙重抽樣雙重抽樣比率估計(jì)方差的樣本估計(jì):第二節(jié)
雙重抽樣
(三)為回歸估計(jì)的二重抽樣與比率估計(jì)相似,在輔助信息未知時(shí)可以采用二重抽樣進(jìn)行回歸估計(jì)。具體實(shí)施過(guò)程如下:第一步:從總體的N個(gè)單元中隨機(jī)抽取第一重樣本,樣本單元數(shù)為;對(duì)于第一重樣本,僅觀測(cè)輔助變量信息,用輔助變量的樣本均值估計(jì)其總體均值。第二節(jié)雙重抽樣(三)為回歸估計(jì)的二重抽樣第二節(jié)
雙重抽樣
第二步:從第一重樣本中隨機(jī)抽取出第二重樣本,樣本單元數(shù)為n;對(duì)于第二重樣本,觀測(cè)目標(biāo)變量與輔助變量,并計(jì)算、和回歸系數(shù)b,構(gòu)造回歸估計(jì)。雙重抽樣對(duì)總體均值的回歸估計(jì):雙重抽樣回歸估計(jì)的方差為:第二節(jié)雙重抽樣第二步:從第一重樣本中隨機(jī)抽取出第第二節(jié)
雙重抽樣
式中:為第一重樣本殘差方差,其均值近似等于總體殘差方差:因此雙重抽樣回歸估計(jì)方差的樣本估計(jì):第二節(jié)雙重抽樣式中:為第一重樣本殘差方差,其均值近第二節(jié)
雙重抽樣
(四)二重抽樣在無(wú)回答調(diào)整中的應(yīng)用在出現(xiàn)無(wú)回答時(shí),可使用二重抽樣對(duì)無(wú)回答樣本進(jìn)行二次抽樣調(diào)查,并對(duì)無(wú)回答層進(jìn)行推斷。如果無(wú)回答樣本得到了完全回答,則基本上可以消除無(wú)回答偏差。具體可見本書10.3節(jié)。第二節(jié)雙重抽樣(四)二重抽樣在無(wú)回答調(diào)整中的應(yīng)用第三節(jié)隨機(jī)化裝置一、敏感性問(wèn)題調(diào)查所謂敏感性問(wèn)題(sensitivequestion)是指所調(diào)查的內(nèi)容涉及私人機(jī)密,受訪者不愿或不便于向外界透露的問(wèn)題。對(duì)于這類敏感性問(wèn)題,必須采取經(jīng)過(guò)特別設(shè)計(jì)的裝置與方法,以消除受訪者的顧慮,能夠如實(shí)回答問(wèn)題,避免調(diào)查出現(xiàn)嚴(yán)重偏誤。這種為敏感性問(wèn)題調(diào)查特別設(shè)計(jì)的技術(shù),稱隨機(jī)化回答技術(shù)(RandomizedResponseTechnique)。第三節(jié)隨機(jī)化裝置一、敏感性問(wèn)題調(diào)查第三節(jié)隨機(jī)化裝置
敏感性問(wèn)題按總體的特征可分為屬性特征和數(shù)量特征問(wèn)題兩類。屬性特征的敏感性問(wèn)題是指受訪者是否具有敏感性問(wèn)題的特征,一般是估計(jì)具有敏感性特征的單位在總體中所占的比例,因此又可稱作敏感性比例問(wèn)題。數(shù)量特征的敏感性問(wèn)題是指受訪者具有敏感性問(wèn)題數(shù)額的多少的特征,一般是估計(jì)敏感性數(shù)額的均值或總和,也可稱作敏感性均值問(wèn)題。第三節(jié)隨機(jī)化裝置敏感性問(wèn)題按總體的特征可分為二、沃納隨機(jī)化回答模型使用隨機(jī)化回答技術(shù)的第一個(gè)模型是由沃納(S.L.Warner)首先提出的。例如,某大學(xué)欲調(diào)查學(xué)生考試的作弊問(wèn)題,隨機(jī)抽取n個(gè)學(xué)生進(jìn)行調(diào)查,對(duì)每位學(xué)生顯示兩個(gè)相反的問(wèn)題,問(wèn)題可以寫在外形完全相同的m張卡片上,其中m1個(gè)卡片寫上“我曾在考試中作過(guò)弊”,另外m-m1個(gè)卡片寫上“我不曾在考試中作過(guò)弊”。然后把這m個(gè)卡片折疊好,放在一個(gè)盒子里。其中:
A問(wèn)題:我曾在考試中作過(guò)弊。
B問(wèn)題:我不曾在考試中作過(guò)弊。第三節(jié)隨機(jī)化裝置二、沃納隨機(jī)化回答模型第三節(jié)隨機(jī)化裝置
調(diào)查時(shí)將m種外形完全一致的卡片像洗牌一樣充分混合后,由受訪者依簡(jiǎn)單隨機(jī)抽樣中的抽簽方式隨機(jī)抽取一張卡片,對(duì)照自己的情況回答“是”或“否”,然后放回盒子中。設(shè)卡片A的比例是P,則卡片B的比例就是1-P。由古典概率可知,在大規(guī)模的調(diào)查中,抽中卡片的概率為P(A)=P,抽中卡片的概率為P(B)=1-P。若樣本量為n,回答“是”的人數(shù)為m,則(是)的估計(jì)值為m/n。我們知道,回答“是”的人有兩種情況:一種是抽中了卡片A,而這些人作過(guò)弊;另一種是抽中了卡片B,而這些人沒有作過(guò)弊。利用全概公式,得:
(是)=P(A)·(是|A)+P(B)·(是|B)第三節(jié)隨機(jī)化裝置調(diào)查時(shí)將m種外形完全一致的卡片像洗牌一樣充分混合后,沃納(Warner)隨機(jī)化回答模型被調(diào)查者卡片B卡片A是是不是不是P1-P沃納(Warner)隨機(jī)化回答模型被調(diào)查者卡片B卡片A是是不
不管是抽到卡片A還是抽到卡片B,作過(guò)弊的概率是相等的,假設(shè)這一比例為,即(是|A)=,則抽到卡片B,回答“是”的概率為1-,即P(是|B)=1-。代入上述公式,得的一個(gè)估計(jì)滿足:第三節(jié)隨機(jī)化裝置因此當(dāng)時(shí),有:其方差為:不管是抽到卡片A還是抽到卡片B,作過(guò)弊的概率是相等的
的一個(gè)無(wú)偏估計(jì)為:第三節(jié)隨機(jī)化裝置當(dāng)n很大時(shí),的一個(gè)無(wú)偏估計(jì)為:第三節(jié)隨機(jī)化裝置當(dāng)n很大三、西蒙斯(Simmons)隨機(jī)化回答模型西蒙斯在沃納模型基礎(chǔ)上作了改進(jìn),他將其中一張卡片上的問(wèn)題改為與所調(diào)查的敏感性問(wèn)題完全無(wú)關(guān)的另一個(gè)非敏感性問(wèn)題。因此西蒙斯模型也稱為無(wú)關(guān)問(wèn)題的隨機(jī)化回答模型。
仍假設(shè)敏感性問(wèn)題的卡片比例為P,無(wú)關(guān)問(wèn)題的卡片比例為1-P。對(duì)于敏感性問(wèn)題回答“是”的比例為,是我們所要調(diào)查的比例,對(duì)無(wú)關(guān)問(wèn)題回答“是”的比例要求是已知的,則根據(jù)全概率公式,得:
(是)=P+(1-P)第三節(jié)隨機(jī)化裝置三、西蒙斯(Simmons)隨機(jī)化回答模型第三節(jié)隨機(jī)化西蒙斯模型改進(jìn)的方式是引入一個(gè)無(wú)關(guān)的問(wèn)題。卡片A:“我有漏稅行為”卡片B:“我是上半年出生的”被調(diào)查者卡片B卡片A是是不是不是P1-P西蒙斯模型改進(jìn)的方式是引入一個(gè)無(wú)關(guān)的問(wèn)題。被調(diào)查者卡片B
當(dāng)樣本量為n,回答“是”的人數(shù)為m,則(是)的估計(jì)值為m/n,因此的估計(jì)值滿足:第三節(jié)隨機(jī)化裝置解此方程得:它的方差為(若忽略fpc):V()的一個(gè)無(wú)偏估計(jì)為:當(dāng)樣本量為n,回答“是”的人數(shù)為m,則(是)的估計(jì)值【例10.1】某大學(xué)對(duì)本校大學(xué)生考風(fēng)情況進(jìn)行調(diào)查。利用西蒙斯模型,對(duì)每個(gè)受訪者準(zhǔn)備了一套同樣的(40張)卡片,卡片A和卡片B各20張,比例各占1/2??ㄆ螦的問(wèn)題是:最近學(xué)期期末考試你有過(guò)作弊行為嗎?卡片上B的問(wèn)題是:你的陽(yáng)歷生日日期為奇數(shù)嗎?
假如對(duì)依簡(jiǎn)單隨機(jī)抽樣方式抽出的400個(gè)人進(jìn)行調(diào)查,在n=400人中總共有m=115人的答案為“是”,試估計(jì)該校大學(xué)生考試作弊的比例并給出90%的置信區(qū)間。第三節(jié)隨機(jī)化裝置【例10.1】某大學(xué)對(duì)本校大學(xué)生考風(fēng)情況進(jìn)行調(diào)查。利用
解:n=800,m=135,P=0.5,為生日日期為奇數(shù)的人數(shù)比例。在大規(guī)模調(diào)查的情況下,可以看作生日為奇數(shù)和偶數(shù)的各占一半,因此=0.5。根據(jù)公式得:第三節(jié)隨機(jī)化裝置
=
故的90%置信區(qū)間約為:(0.075±1.64×0.0453),即:=0.002054
解:n=800,m=135,P=0.5,為生日日期四、隨機(jī)截尾模型現(xiàn)實(shí)中我們也經(jīng)常需要調(diào)查定量的敏感性問(wèn)題,例如調(diào)查銀行存款數(shù)額,學(xué)生考試作弊的平均次數(shù),在職人員的工資外收入等。Greenberg等人針對(duì)這類問(wèn)題提出了幾種隨機(jī)化調(diào)查方法,但是,這些方法都要求受訪者根據(jù)自己的實(shí)際情況回答敏感性問(wèn)題或非敏感性問(wèn)題的具體數(shù)值,給受訪者/受查者造成了一定的困擾。近年來(lái)提出了所謂隨機(jī)截尾模型,把對(duì)于具體數(shù)值的調(diào)查轉(zhuǎn)化為對(duì)于屬性的調(diào)查,避免了直接回答,使得受訪者心理上比較容易接受。第三節(jié)隨機(jī)化裝置四、隨機(jī)截尾模型第三節(jié)隨機(jī)化裝置
設(shè)反映敏感性問(wèn)題的特征量為X,取值范圍是,密度函數(shù)為,X的數(shù)學(xué)期望為,即我們所要估計(jì)的值。又設(shè)Y是一個(gè)服從上的均勻分布的隨機(jī)變量。第三節(jié)隨機(jī)化裝置
設(shè)樣本容量為n,得到的調(diào)查數(shù)據(jù)是,i=1,2,…n,即:=
,因此設(shè)反映敏感性問(wèn)題的特征量為X,取值范圍是,以樣本均值=代替,得到的一個(gè)無(wú)偏估計(jì)為:第三節(jié)隨機(jī)化裝置估計(jì)量的方差為:
的一個(gè)估計(jì)為:以樣本均值=代替,得到五、采用隨機(jī)化回答技術(shù)應(yīng)注意的問(wèn)題第三節(jié)隨機(jī)化裝置(一)注意在受訪者正式抽取并回答問(wèn)題前,清楚介紹這種做法的原理,讓受訪者充分理解這種方法的特點(diǎn),以徹底消除受訪者的顧慮,明白自己究竟回答哪個(gè)問(wèn)題別人是不知道的,使其相信這種設(shè)計(jì)是建立在科學(xué)的基礎(chǔ)上,不是哄騙人的。(二)所提問(wèn)題必須簡(jiǎn)單明了,防止因有歧義而出現(xiàn)理解不同。對(duì)涉及問(wèn)題的解釋必須在抽卡片以前進(jìn)行,否則就暴露了抽到的是哪類卡片,也就失去了隨機(jī)化回答的意義。五、采用隨機(jī)化回答技術(shù)應(yīng)注意的問(wèn)題第三節(jié)隨機(jī)化裝置(一第三節(jié)隨機(jī)化裝置(三)在應(yīng)用西蒙斯模型時(shí),無(wú)關(guān)問(wèn)題的選擇特別重要,一定要隱蔽性強(qiáng)的,使受訪者在回答無(wú)關(guān)問(wèn)題時(shí)不會(huì)暴露正在回答哪個(gè)問(wèn)題。例如“你是男生嗎?”這類問(wèn)題就很不妥,因?yàn)椴捎秒S機(jī)化回答技術(shù)需要當(dāng)面解釋,受訪者的性別不可能保密,這樣也就失去了無(wú)關(guān)問(wèn)題本來(lái)應(yīng)具有的保護(hù)作用。
(四)做好調(diào)查者的培訓(xùn)工作,使他們能夠正確理解隨機(jī)化回答技術(shù)的實(shí)質(zhì)并加以運(yùn)用,這樣才能更好地向受訪者解釋清楚,消除受訪者的顧慮,以對(duì)調(diào)查的問(wèn)題給予正確回答。第三節(jié)隨機(jī)化裝置(三)在應(yīng)用西蒙斯模型時(shí),無(wú)關(guān)問(wèn)題
第7章其它抽樣方法第7章其它抽樣方法第一節(jié)樣本輪換
第二節(jié)雙重抽樣
第三節(jié)隨機(jī)化裝置
第一節(jié)樣本輪換
第二節(jié)雙重抽樣
第三節(jié)隨機(jī)化裝置
問(wèn)題提出
時(shí)間序列數(shù)據(jù)以及隨后出現(xiàn)的面板數(shù)據(jù)都是經(jīng)濟(jì)統(tǒng)計(jì)分析和計(jì)量分析中非常重要的數(shù)據(jù)類型。當(dāng)我們?cè)谘芯繎?yīng)該應(yīng)用什么統(tǒng)計(jì)和計(jì)量的方法去分析既定的時(shí)間序列數(shù)據(jù)時(shí),是否考慮過(guò)以下幾個(gè)問(wèn)題?
時(shí)間序列數(shù)據(jù)是如何產(chǎn)生的?
所產(chǎn)生的時(shí)間序列數(shù)據(jù)是否準(zhǔn)確?
如何讓時(shí)間序列數(shù)據(jù)更加準(zhǔn)確?問(wèn)題提出時(shí)間序列數(shù)
隨著社會(huì)經(jīng)濟(jì)現(xiàn)象的不斷變化和發(fā)展,很多調(diào)查對(duì)象的總體也在不斷變化和發(fā)展。為了能夠及時(shí)反映調(diào)查總體的這種變化和發(fā)展,調(diào)查部門就需要對(duì)同一總體在不同時(shí)間上進(jìn)行連續(xù)性抽樣調(diào)查(SuccessiveSamplingSurvey),并定期公布調(diào)查結(jié)果,形成一系列時(shí)序統(tǒng)計(jì)數(shù)據(jù)。因此,社會(huì)經(jīng)濟(jì)抽樣調(diào)查一般都應(yīng)該是連續(xù)性的定期調(diào)查。
一次性抽樣調(diào)查與截面數(shù)據(jù)
連續(xù)性抽樣調(diào)查與時(shí)間序列數(shù)據(jù)及面板數(shù)據(jù)隨著社會(huì)經(jīng)濟(jì)現(xiàn)象的不斷變化和發(fā)展,很
抽樣調(diào)查除了對(duì)總體的一次性抽樣以外,很多重要的調(diào)查是隔一段時(shí)間重復(fù)進(jìn)行的,對(duì)于這種經(jīng)常性的抽樣問(wèn)題,就必須重視其樣本輪換問(wèn)題的研究。對(duì)于樣本輪換問(wèn)題,我們至少應(yīng)考慮以下問(wèn)題:每次調(diào)查的樣本如何組成?是采用固定樣本還是采用全新的樣本,或者是部分保留部分替換,即樣本輪換;在估計(jì)后期的總量或均值時(shí),是否需要利用前期的信息來(lái)改進(jìn)現(xiàn)期的估計(jì),以及如何利用;如果采用樣本輪換的方法,如何確定最優(yōu)的保留比例或替換比例。第一節(jié)
樣本輪換
抽樣調(diào)查除了對(duì)總體的一次性抽樣以外,很多重要的調(diào)查是連續(xù)性抽樣設(shè)計(jì)方法按抽取樣本的不同劃分輪換樣本重復(fù)樣本固定樣本單水平輪換不完全的單水平輪換多水平輪換連續(xù)性抽樣設(shè)計(jì)方法按抽取樣本的不同劃分輪換樣本重復(fù)樣本固定樣
輪換模式應(yīng)用舉例加拿大勞動(dòng)力調(diào)查(LFS)使用6~0單水平輪換模式美國(guó)現(xiàn)時(shí)人口調(diào)查(CPS)使用4~8~4不完全單水平輪換模式美國(guó)消費(fèi)者支出的季度調(diào)查(CEQ)便采用4~0三水平輪換模式中國(guó)城市住戶抽樣調(diào)查中國(guó)規(guī)模以下工業(yè)企業(yè)抽樣調(diào)查中國(guó)農(nóng)產(chǎn)量抽樣調(diào)查輪換模式應(yīng)用舉例加拿大勞動(dòng)力調(diào)查(LFS)使用6~0單一、樣本輪換的原因如果是單純地估計(jì)現(xiàn)值的情況,當(dāng)然最好每次重新抽取新樣本,這樣必然會(huì)增加費(fèi)用;如果要逐期地與上期比較,則采用固定樣本的方法為好,固定樣本可以消除樣本的因素而只觀察動(dòng)態(tài)的變化。然而,樣本長(zhǎng)期不變,隨著時(shí)間的推移,固定樣本會(huì)顯露它的弊端,既難以反映總體的變化,而且受訪者也會(huì)產(chǎn)生厭煩心理,出現(xiàn)不合作或回答質(zhì)量下降等問(wèn)題,從而影響調(diào)查質(zhì)量。另外,無(wú)論是采用固定樣本還是全新樣本都難以正確地反映總體在各個(gè)不同時(shí)間上的水平及變化,因此,一種廣泛采用的方法是樣本輪換,即每隔一定時(shí)間(一個(gè)月、一季或一年)更換一定比例的單元,保留其余單元。第一節(jié)
樣本輪換
一、樣本輪換的原因第一節(jié)樣本輪換
與傳統(tǒng)的一次性抽樣調(diào)查相比,輪換的抽樣調(diào)查具有以下特有的優(yōu)勢(shì):
節(jié)省調(diào)查費(fèi)用和調(diào)查資源
在一定程度上減輕被調(diào)查者回答負(fù)擔(dān)
利用前后各期之間的相關(guān)關(guān)系提高估計(jì)精度與傳統(tǒng)的一次性抽樣調(diào)查相比,輪換的抽樣我國(guó)1996年新修訂的《統(tǒng)計(jì)法》第十條明確規(guī)定:“統(tǒng)計(jì)調(diào)查應(yīng)當(dāng)以周期性普查為基礎(chǔ),以經(jīng)常性抽樣調(diào)查為主體,以必要的統(tǒng)計(jì)報(bào)表、重點(diǎn)調(diào)查、綜合分析等為補(bǔ)充,搜集、整理基本統(tǒng)計(jì)資料。”因此,在今后我國(guó)政府統(tǒng)計(jì)部門開展的統(tǒng)計(jì)調(diào)查制度與方法改革的過(guò)程中,最重要的就是圍繞如何更好地發(fā)揮經(jīng)常性抽樣調(diào)查的主體作用,研究并應(yīng)用更加符合我國(guó)國(guó)情的經(jīng)常性抽樣調(diào)查方法,以此得出更加準(zhǔn)確的統(tǒng)計(jì)數(shù)據(jù),為我國(guó)政府部門、研究機(jī)構(gòu)以及各類企事業(yè)單位等社會(huì)各界服務(wù)。
我國(guó)抽樣調(diào)查制度與方法改革的方向我國(guó)1996年新修訂的《統(tǒng)計(jì)法》第十條明確規(guī)定:“統(tǒng)計(jì)調(diào)查應(yīng)二、樣本輪換的最優(yōu)比例第一個(gè)時(shí)期采用有放回簡(jiǎn)單隨機(jī)抽樣方式抽出樣本量為n的樣本;在第二個(gè)時(shí)期采用有放回簡(jiǎn)單隨機(jī)抽樣方式選出樣本量為nq的舊有樣本點(diǎn)以便替換掉,即保留的樣本量為np,保留樣本的比例為p,同時(shí)獨(dú)立地依有放回簡(jiǎn)單隨機(jī)樣本方式補(bǔ)充新的nq個(gè)新樣本點(diǎn),這里p+q=1,這樣第二個(gè)時(shí)期的樣本量仍舊為n。設(shè):第一節(jié)
樣本輪換
二、樣本輪換的最優(yōu)比例第一節(jié)樣本輪換
為第一個(gè)時(shí)期與第二個(gè)時(shí)期相同的np個(gè)單元在第一個(gè)時(shí)期的均值。為第一個(gè)時(shí)期nq個(gè)單元在第一個(gè)時(shí)期的均值。為np個(gè)單元在第二個(gè)時(shí)期的樣本均值。為nq個(gè)補(bǔ)充單元在第二個(gè)時(shí)期的樣本均值。ρ為和之間的相關(guān)系數(shù)。如果希望估計(jì)第二個(gè)時(shí)期的樣本均值并充分利用第一個(gè)時(shí)期的信息,令該估計(jì)量為,那么它應(yīng)該是充分利用前后期中保留樣本、不保留樣本和后期新補(bǔ)充樣本的加權(quán)平均數(shù)。
第一節(jié)
樣本輪換
為第一個(gè)時(shí)期與第二個(gè)時(shí)期相同的np個(gè)單元在第一
設(shè)我們希望得到的估計(jì)量是兩期估計(jì)量的線性函數(shù),即
=a+b+c+d
(7.1)要求估計(jì)其參數(shù)a,b,c,d。因?yàn)镋()=E()=,E()=E()=,所以E()=(a+b)+(c+d)。要使成為的無(wú)偏估計(jì)量,需a+b=0,c+d=1,也即b=-a,d=1-c。代入(7.1),有
=a(-)+c+(1-c)
第一節(jié)
樣本輪換
設(shè)我們希望得到的估計(jì)量是兩期估計(jì)量的線性函第一節(jié)
樣本輪換
該估計(jì)量的方差可以求得為:
其中是第一個(gè)時(shí)期的方差,是第二個(gè)時(shí)期的方差。我們要求出a和c,使得達(dá)到最小,就要以上公式分別對(duì)a和c求偏微分并使之等于0,即可求出a和c的最優(yōu)值分別為:第一節(jié)樣本輪換該估計(jì)量的方差可以求得為:其第一節(jié)
樣本輪換
該估計(jì)量的方差可以求得為:第一節(jié)樣本輪換該估計(jì)量的方差可以求得為:第一節(jié)
樣本輪換
將其代入公式(7.1),就得到該估計(jì)量的方差為:第一節(jié)樣本輪換將其代入公式(7.1),就得到該估計(jì)第一節(jié)
樣本輪換
如果不利用前期信息,只根據(jù)第二期的結(jié)果來(lái)估計(jì)均值,那么:其方差為:第一節(jié)樣本輪換如果不利用前期信息,只根據(jù)第二期的結(jié)果第一節(jié)
樣本輪換
故利用前期信息后的設(shè)計(jì)效果為:
從上式可以看出,當(dāng)ρ的值比較大時(shí),利用上期信息可以較大地提高的效率。表7.1給出了不同的q,ρ值時(shí)的值。第一節(jié)樣本輪換故利用前期信息后的設(shè)計(jì)效果為:第一節(jié)
樣本輪換
表7.1不同的q,ρ值時(shí)的值第一節(jié)樣本輪換表7.1不同的q,ρ
若對(duì)上式關(guān)于q求偏導(dǎo),并使之等于0,那么便可得到最優(yōu)輪換比:若對(duì)上式關(guān)于q求偏導(dǎo),并使之等于0,那么便可得到最優(yōu)第一節(jié)
樣本輪換
三、樣本輪換方法(一)
隨機(jī)輪換法
在進(jìn)行輪換時(shí)按確定的輪換單位數(shù)目或比例,從原有樣本中隨機(jī)抽出若干單位不再調(diào)查,而從其余未包括在樣本中的總體單位中抽取同樣數(shù)目的單位來(lái)代替。第一節(jié)樣本輪換三、樣本輪換方法第一節(jié)
樣本輪換
(二)
等距輪換法
在總體抽樣框中確定出各個(gè)等距抽樣的樣本,在各次的調(diào)查中,按相應(yīng)位置的等距樣本單位進(jìn)行輪換。我國(guó)農(nóng)村住戶調(diào)查就是采用這種輪換方式。(三)
子樣本輪換法從總體中抽出若干套子樣本,每次調(diào)查一定數(shù)量的子樣本,逐次輪換其中的部分子樣本。
第一節(jié)樣本輪換(二)
等第一節(jié)
樣本輪換
子樣本輪換實(shí)際上就是每次采用交叉子樣本,而交叉子樣本不僅能有效地減少和控制估計(jì)偏差,而且由于每個(gè)交叉子樣本都能代表總體,即使有的子樣本資料搜集不到,我們也可以用其他的子樣本甚至一個(gè)子樣本來(lái)觀察和推斷總體。此外,用交叉子樣本還可以考察非抽樣誤差發(fā)生的程度。因此,一般來(lái)說(shuō),子樣本輪換方法是以上三種樣本輪換方法中最好的。第一節(jié)樣本輪換子樣本輪換實(shí)際上就是每次采用交第一節(jié)
樣本輪換
五、案例介紹美國(guó)人口現(xiàn)狀調(diào)查(currentpopulationsurvey,CPS)是國(guó)際上最著名的抽樣調(diào)查項(xiàng)目之一,已經(jīng)成為美國(guó)以及許多國(guó)家進(jìn)行居民調(diào)查的參考模型,其實(shí)施是在每個(gè)月包含19號(hào)的那一周進(jìn)行,調(diào)查的問(wèn)題涉及受訪者此前一周內(nèi)的活動(dòng)。調(diào)查氛圍覆蓋全美50個(gè)州和哥倫比亞地區(qū)。CPS采用的就是樣本輪換的方法,即每位受訪者連續(xù)4個(gè)月接受訪問(wèn),然后退出樣本,8個(gè)月后再進(jìn)入樣本,連續(xù)4個(gè)月接受訪問(wèn),最后永久地退出樣本。第一節(jié)樣本輪換五、案例介紹第一節(jié)
樣本輪換
CPS在1995年7月的抽樣設(shè)計(jì)方案中樣本輪換的特征:
1.在任意一個(gè)月內(nèi),都有1/8的住戶單元第一次接受調(diào)查,1/8的住戶單元第二次接受調(diào)查,依次類推。
2.每個(gè)月都由新的樣本組代替從樣本中永久退出的老樣本組。
3.每個(gè)月都有一個(gè)樣本組在閑置8個(gè)月后重新接受調(diào)查,以此代替剛剛進(jìn)入閑置期的樣本組。
4.通過(guò)輪換設(shè)計(jì),保證每個(gè)樣本單元在2個(gè)年份的4個(gè)相同月份里接受調(diào)查。
5.在連續(xù)的2個(gè)月內(nèi),有3/4的樣本點(diǎn)是相同的;在連續(xù)的2年內(nèi),有1/2的樣本點(diǎn)是相同的。
第一節(jié)樣本輪換CPS在1995年7月的抽樣設(shè)計(jì)方案
二維平衡單水平輪換模式的輪換過(guò)程
二維平衡單水平輪換模式的輪換過(guò)程
第二節(jié)
雙重抽樣
我們可以先從總體中抽取一個(gè)大的初始樣本,從而獲得總體的輔助信息,然后再?gòu)某跏紭颖净驈目傮w中再抽一個(gè)子樣本,這種方法就是雙重抽樣。
第二節(jié)雙重抽樣我們可以先從總體中抽取一個(gè)大的第二節(jié)
雙重抽樣
一、定義雙重抽樣(doublesampling),也稱二相抽樣或二重抽樣(two-phasesampling),是指在抽樣時(shí)分兩步抽取樣本。一般情況下,先從總體N中抽取一個(gè)較大的樣本,稱為第一重(相)樣本(thefirstphasesample),對(duì)之進(jìn)行調(diào)查以獲取總體的某些輔助信息,為下一步的抽樣估計(jì)提供條件;然后進(jìn)行第二重抽樣(thesecondphasesampling)。第二重抽樣所抽的樣本n相對(duì)較小,但是第二重抽樣調(diào)查才是主調(diào)查。第二節(jié)雙重抽樣一、定義第二節(jié)
雙重抽樣
二、雙重抽樣與兩階段抽樣的區(qū)別(一)兩階段抽樣(two-stagesampling)是先從總體N個(gè)單元(初級(jí)單元)中抽出n個(gè)樣本單元,卻并不對(duì)這n個(gè)樣本單元中的所有小單元(二級(jí)單元)都進(jìn)行調(diào)查,而是在其中再抽出若干個(gè)二級(jí)單元進(jìn)行調(diào)查;雙重抽樣則不同,要對(duì)第一重(相)樣本進(jìn)行調(diào)查以獲取總體的某些輔助信息,并且要利用這些輔助信息進(jìn)行排序、分層、抽樣或估計(jì)等。第二節(jié)雙重抽樣二、雙重抽樣與兩階段抽樣的區(qū)別第二節(jié)
雙重抽樣
(二)兩階段抽樣的第二階段抽樣單元和第一階段抽樣單元往往是不同的;雙重抽樣要有一份最終單元的完整名冊(cè)(總體所有單元的抽樣框),而兩階段抽樣只是需要第一階段單元(初級(jí)單元)名冊(cè),然后在中選的初級(jí)單元中構(gòu)造第二階段抽樣的抽樣框。第二節(jié)雙重抽樣(二)兩階段抽樣的第二階段抽樣單元和第二節(jié)
雙重抽樣
三、雙重抽樣的作用(一)有助于篩選主調(diào)查對(duì)象,如對(duì)高血壓病人的調(diào)查、銀行對(duì)儲(chǔ)戶存款的調(diào)查等;(二)提高抽樣效率,因?yàn)榈诙爻闃涌衫玫谝恢貥颖镜男畔⑦M(jìn)行分層和比率估計(jì);(四)可用于研究樣本輪換中的某些問(wèn)題;(五)降低無(wú)回答偏差,對(duì)無(wú)回答層進(jìn)行第二重抽樣并對(duì)其推斷。第二節(jié)雙重抽樣三、雙重抽樣的作用第二節(jié)
雙重抽樣
四、雙重抽樣的應(yīng)用
(一)為分層的雙重抽樣分層抽樣如果事先無(wú)法知道總體的層權(quán),可以采用雙重抽樣。具體實(shí)施過(guò)程如下:第一步:利用簡(jiǎn)單隨機(jī)抽樣,從總體的N個(gè)單元中隨機(jī)抽取第一重樣本,樣本單元數(shù)為;根據(jù)已知的分層標(biāo)志將第一重樣本分層,令,則是總體層權(quán)的無(wú)偏估計(jì)。第二節(jié)雙重抽樣四、雙重抽樣的應(yīng)用第二節(jié)
雙重抽樣
第二步:利用分層隨機(jī)抽樣,從第一重樣本中抽取出第二重樣本,樣本單元數(shù)為n,第h層樣本單元數(shù)為,。采用雙重分層抽樣,對(duì)總體均值的無(wú)偏估計(jì)量為:
的方差為:第二節(jié)雙重抽樣第二步:利用分層隨機(jī)抽樣,從第一重樣第二節(jié)
雙重抽樣
上式可簡(jiǎn)化為:
的樣本估計(jì)量為:第二節(jié)雙重抽樣上式可簡(jiǎn)化為:的樣本第二節(jié)
雙重抽樣
第一步:從總體的N個(gè)單元中隨機(jī)抽取第一重樣本,樣本單元數(shù)為;對(duì)于第一重樣本,僅觀測(cè)輔助變量信息,用輔助變量的樣本均值估計(jì)總體均值。(二)為比率估計(jì)的雙重抽樣在實(shí)際工作中,如果輔助變量的信息未知,可以利用雙重抽樣進(jìn)行比率估計(jì)。具體實(shí)施過(guò)程如下:第二節(jié)雙重抽樣第一步:從總體的N個(gè)單元中隨機(jī)抽取第第二節(jié)
雙重抽樣
雙重抽樣對(duì)總體均值的比率估計(jì):
第二步:從第一重樣本中隨機(jī)抽取出第二重樣本,樣本單元數(shù)為n;對(duì)于第二重樣本,觀測(cè)目標(biāo)變量與輔助變量,并用獲得的和,計(jì)算,構(gòu)造比率估計(jì)。雙重抽樣比率估計(jì)的方差為:第二節(jié)雙重抽樣雙重抽樣對(duì)總體均值的比率估計(jì):第二節(jié)
雙重抽樣
雙重抽樣比率估計(jì)方差的樣本估計(jì):
第二節(jié)雙重抽樣雙重抽樣比率估計(jì)方差的樣本估計(jì):第二節(jié)
雙重抽樣
(三)為回歸估計(jì)的二重抽樣與比率估計(jì)相似,在輔助信息未知時(shí)可以采用二重抽樣進(jìn)行回歸估計(jì)。具體實(shí)施過(guò)程如下:第一步:從總體的N個(gè)單元中隨機(jī)抽取第一重樣本,樣本單元數(shù)為;對(duì)于第一重樣本,僅觀測(cè)輔助變量信息,用輔助變量的樣本均值估計(jì)其總體均值。第二節(jié)雙重抽樣(三)為回歸估計(jì)的二重抽樣第二節(jié)
雙重抽樣
第二步:從第一重樣本中隨機(jī)抽取出第二重樣本,樣本單元數(shù)為n;對(duì)于第二重樣本,觀測(cè)目標(biāo)變量與輔助變量,并計(jì)算、和回歸系數(shù)b,構(gòu)造回歸估計(jì)。雙重抽樣對(duì)總體均值的回歸估計(jì):雙重抽樣回歸估計(jì)的方差為:第二節(jié)雙重抽樣第二步:從第一重樣本中隨機(jī)抽取出第第二節(jié)
雙重抽樣
式中:為第一重樣本殘差方差,其均值近似等于總體殘差方差:因此雙重抽樣回歸估計(jì)方差的樣本估計(jì):第二節(jié)雙重抽樣式中:為第一重樣本殘差方差,其均值近第二節(jié)
雙重抽樣
(四)二重抽樣在無(wú)回答調(diào)整中的應(yīng)用在出現(xiàn)無(wú)回答時(shí),可使用二重抽樣對(duì)無(wú)回答樣本進(jìn)行二次抽樣調(diào)查,并對(duì)無(wú)回答層進(jìn)行推斷。如果無(wú)回答樣本得到了完全回答,則基本上可以消除無(wú)回答偏差。具體可見本書10.3節(jié)。第二節(jié)雙重抽樣(四)二重抽樣在無(wú)回答調(diào)整中的應(yīng)用第三節(jié)隨機(jī)化裝置一、敏感性問(wèn)題調(diào)查所謂敏感性問(wèn)題(sensitivequestion)是指所調(diào)查的內(nèi)容涉及私人機(jī)密,受訪者不愿或不便于向外界透露的問(wèn)題。對(duì)于這類敏感性問(wèn)題,必須采取經(jīng)過(guò)特別設(shè)計(jì)的裝置與方法,以消除受訪者的顧慮,能夠如實(shí)回答問(wèn)題,避免調(diào)查出現(xiàn)嚴(yán)重偏誤。這種為敏感性問(wèn)題調(diào)查特別設(shè)計(jì)的技術(shù),稱隨機(jī)化回答技術(shù)(RandomizedResponseTechnique)。第三節(jié)隨機(jī)化裝置一、敏感性問(wèn)題調(diào)查第三節(jié)隨機(jī)化裝置
敏感性問(wèn)題按總體的特征可分為屬性特征和數(shù)量特征問(wèn)題兩類。屬性特征的敏感性問(wèn)題是指受訪者是否具有敏感性問(wèn)題的特征,一般是估計(jì)具有敏感性特征的單位在總體中所占的比例,因此又可稱作敏感性比例問(wèn)題。數(shù)量特征的敏感性問(wèn)題是指受訪者具有敏感性問(wèn)題數(shù)額的多少的特征,一般是估計(jì)敏感性數(shù)額的均值或總和,也可稱作敏感性均值問(wèn)題。第三節(jié)隨機(jī)化裝置敏感性問(wèn)題按總體的特征可分為二、沃納隨機(jī)化回答模型使用隨機(jī)化回答技術(shù)的第一個(gè)模型是由沃納(S.L.Warner)首先提出的。例如,某大學(xué)欲調(diào)查學(xué)生考試的作弊問(wèn)題,隨機(jī)抽取n個(gè)學(xué)生進(jìn)行調(diào)查,對(duì)每位學(xué)生顯示兩個(gè)相反的問(wèn)題,問(wèn)題可以寫在外形完全相同的m張卡片上,其中m1個(gè)卡片寫上“我曾在考試中作過(guò)弊”,另外m-m1個(gè)卡片寫上“我不曾在考試中作過(guò)弊”。然后把這m個(gè)卡片折疊好,放在一個(gè)盒子里。其中:
A問(wèn)題:我曾在考試中作過(guò)弊。
B問(wèn)題:我不曾在考試中作過(guò)弊。第三節(jié)隨機(jī)化裝置二、沃納隨機(jī)化回答模型第三節(jié)隨機(jī)化裝置
調(diào)查時(shí)將m種外形完全一致的卡片像洗牌一樣充分混合后,由受訪者依簡(jiǎn)單隨機(jī)抽樣中的抽簽方式隨機(jī)抽取一張卡片,對(duì)照自己的情況回答“是”或“否”,然后放回盒子中。設(shè)卡片A的比例是P,則卡片B的比例就是1-P。由古典概率可知,在大規(guī)模的調(diào)查中,抽中卡片的概率為P(A)=P,抽中卡片的概率為P(B)=1-P。若樣本量為n,回答“是”的人數(shù)為m,則(是)的估計(jì)值為m/n。我們知道,回答“是”的人有兩種情況:一種是抽中了卡片A,而這些人作過(guò)弊;另一種是抽中了卡片B,而這些人沒有作過(guò)弊。利用全概公式,得:
(是)=P(A)·(是|A)+P(B)·(是|B)第三節(jié)隨機(jī)化裝置調(diào)查時(shí)將m種外形完全一致的卡片像洗牌一樣充分混合后,沃納(Warner)隨機(jī)化回答模型被調(diào)查者卡片B卡片A是是不是不是P1-P沃納(Warner)隨機(jī)化回答模型被調(diào)查者卡片B卡片A是是不
不管是抽到卡片A還是抽到卡片B,作過(guò)弊的概率是相等的,假設(shè)這一比例為,即(是|A)=,則抽到卡片B,回答“是”的概率為1-,即P(是|B)=1-。代入上述公式,得的一個(gè)估計(jì)滿足:第三節(jié)隨機(jī)化裝置因此當(dāng)時(shí),有:其方差為:不管是抽到卡片A還是抽到卡片B,作過(guò)弊的概率是相等的
的一個(gè)無(wú)偏估計(jì)為:第三節(jié)隨機(jī)化裝置當(dāng)n很大時(shí),的一個(gè)無(wú)偏估計(jì)為:
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 保護(hù)鼻子健康教案反思
- 角形的邊說(shuō)課稿
- 教師職業(yè)病健康知識(shí)講座
- 展覽合同終止合同協(xié)議范例
- 市政工程保溫板施工合同
- 消費(fèi)者權(quán)益爭(zhēng)議解決協(xié)議
- 房屋建筑施工合同審計(jì)
- 辦公樓廁所翻新合同樣本
- 家電企業(yè)會(huì)計(jì)人員聘用協(xié)議
- 酒店窗戶安裝施工協(xié)議
- 工程造價(jià)審計(jì)投標(biāo)方案(技術(shù)標(biāo))
- PaaS開發(fā)運(yùn)營(yíng)三級(jí)理論考試題庫(kù)(匯總)
- 中藥對(duì)婦科疾病的作用研究
- 《國(guó)家基本專業(yè)檔案目錄》解讀
- 長(zhǎng)沙市長(zhǎng)郡雙語(yǔ)實(shí)驗(yàn)學(xué)校人教版七年級(jí)上冊(cè)期中生物期中試卷及答案
- 高考文言通假字匯總
- “治未病”思想與脾胃病的防治
- 項(xiàng)目監(jiān)理人員配置標(biāo)準(zhǔn)
- 磷酸二氫鉀的安全技術(shù)說(shuō)明書
- (高級(jí))信息通信網(wǎng)絡(luò)運(yùn)行管理員技能鑒定考試題庫(kù)(附答案)
- 垃圾滲濾液處理站運(yùn)維及滲濾液處理投標(biāo)方案(技術(shù)標(biāo))
評(píng)論
0/150
提交評(píng)論