第十章-其它抽樣方法技術課件_第1頁
第十章-其它抽樣方法技術課件_第2頁
第十章-其它抽樣方法技術課件_第3頁
第十章-其它抽樣方法技術課件_第4頁
第十章-其它抽樣方法技術課件_第5頁
已閱讀5頁,還剩131頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

第十章其它抽樣方法技術第十章其它抽樣方法技術1本章要點本章主要對樣本輪換、雙重抽樣、隨機化裝置、交叉子樣本等抽樣技術原理、方法、特點及應用條件進行了較為全面的介紹。具體要求:掌握本章所介紹的幾種抽樣技術的特點及應用條件,在抽樣實際工作中能夠正確運用該種技術,提高估計的精度與效果。本章要點本章主要對樣本輪換、雙重抽樣、隨機2第一節(jié)樣本輪換

第二節(jié)雙重抽樣

第三節(jié)隨機化裝置

第四節(jié)交叉子樣本第一節(jié)樣本輪換

第二節(jié)雙重抽樣

第三節(jié)隨機化裝置3問題提出

時間序列數(shù)據(jù)以及隨后出現(xiàn)的面板數(shù)據(jù)都是經(jīng)濟統(tǒng)計分析和計量分析中非常重要的數(shù)據(jù)類型。當我們在研究應該應用什么統(tǒng)計和計量的方法去分析既定的時間序列數(shù)據(jù)時,是否考慮過以下幾個問題?

時間序列數(shù)據(jù)是如何產(chǎn)生的?

所產(chǎn)生的時間序列數(shù)據(jù)是否準確?

如何讓時間序列數(shù)據(jù)更加準確?問題提出時間序列數(shù)4

隨著社會經(jīng)濟現(xiàn)象的不斷變化和發(fā)展,很多調(diào)查對象的總體也在不斷變化和發(fā)展。為了能夠及時反映調(diào)查總體的這種變化和發(fā)展,調(diào)查部門就需要對同一總體在不同時間上進行連續(xù)性抽樣調(diào)查(SuccessiveSamplingSurvey),并定期公布調(diào)查結果,形成一系列時序統(tǒng)計數(shù)據(jù)。因此,社會經(jīng)濟抽樣調(diào)查一般都應該是連續(xù)性的定期調(diào)查。

一次性抽樣調(diào)查與截面數(shù)據(jù)

連續(xù)性抽樣調(diào)查與時間序列數(shù)據(jù)及面板數(shù)據(jù)隨著社會經(jīng)濟現(xiàn)象的不斷變化和發(fā)展,很5

抽樣調(diào)查除了對總體的一次性抽樣以外,很多重要的調(diào)查是隔一段時間重復進行的,對于這種經(jīng)常性的抽樣問題,就必須重視其樣本輪換問題的研究。對于樣本輪換問題,我們至少應考慮以下問題:每次調(diào)查的樣本如何組成?是采用固定樣本還是采用全新的樣本,或者是部分保留部分替換,即樣本輪換;在估計后期的總量或均值時,是否需要利用前期的信息來改進現(xiàn)期的估計,以及如何利用;如果采用樣本輪換的方法,如何確定最優(yōu)的保留比例或替換比例。第一節(jié)

樣本輪換

抽樣調(diào)查除了對總體的一次性抽樣以外,很多重要的調(diào)查是6連續(xù)性抽樣設計方法按抽取樣本的不同劃分輪換樣本重復樣本固定樣本單水平輪換不完全的單水平輪換多水平輪換連續(xù)性抽樣設計方法按抽取樣本的不同劃分輪換樣本重復樣本固定樣7輪換模式應用舉例加拿大勞動力調(diào)查(LFS)使用6~0單水平輪換模式美國現(xiàn)時人口調(diào)查(CPS)使用4~8~4不完全單水平輪換模式美國消費者支出的季度調(diào)查(CEQ)便采用4~0三水平輪換模式中國城市住戶抽樣調(diào)查中國規(guī)模以下工業(yè)企業(yè)抽樣調(diào)查中國農(nóng)產(chǎn)量抽樣調(diào)查輪換模式應用舉例加拿大勞動力調(diào)查(LFS)使用6~0單8一、樣本輪換的原因如果是單純地估計現(xiàn)值的情況,當然最好每次重新抽取新樣本,這樣必然會增加費用;如果要逐期地與上期比較,則采用固定樣本的方法為好,固定樣本可以消除樣本的因素而只觀察動態(tài)的變化。然而,樣本長期不變,隨著時間的推移,固定樣本會顯露它的弊端,既難以反映總體的變化,而且受訪者也會產(chǎn)生厭煩心理,出現(xiàn)不合作或回答質量下降等問題,從而影響調(diào)查質量。另外,無論是采用固定樣本還是全新樣本都難以正確地反映總體在各個不同時間上的水平及變化,因此,一種廣泛采用的方法是樣本輪換,即每隔一定時間(一個月、一季或一年)更換一定比例的單元,保留其余單元。第一節(jié)

樣本輪換

一、樣本輪換的原因第一節(jié)樣本輪換9與傳統(tǒng)的一次性抽樣調(diào)查相比,輪換的抽樣調(diào)查具有以下特有的優(yōu)勢:

節(jié)省調(diào)查費用和調(diào)查資源

在一定程度上減輕被調(diào)查者回答負擔

利用前后各期之間的相關關系提高估計精度與傳統(tǒng)的一次性抽樣調(diào)查相比,輪換的抽樣10我國1996年新修訂的《統(tǒng)計法》第十條明確規(guī)定:“統(tǒng)計調(diào)查應當以周期性普查為基礎,以經(jīng)常性抽樣調(diào)查為主體,以必要的統(tǒng)計報表、重點調(diào)查、綜合分析等為補充,搜集、整理基本統(tǒng)計資料?!币虼耍诮窈笪覈y(tǒng)計部門開展的統(tǒng)計調(diào)查制度與方法改革的過程中,最重要的就是圍繞如何更好地發(fā)揮經(jīng)常性抽樣調(diào)查的主體作用,研究并應用更加符合我國國情的經(jīng)常性抽樣調(diào)查方法,以此得出更加準確的統(tǒng)計數(shù)據(jù),為我國政府部門、研究機構以及各類企事業(yè)單位等社會各界服務。我國抽樣調(diào)查制度與方法改革的方向我國1996年新修訂的《統(tǒng)計法》第十條明確規(guī)定:“統(tǒng)計調(diào)查應11二、樣本輪換的最優(yōu)比例第一個時期采用有放回簡單隨機抽樣方式抽出樣本量為n的樣本;在第二個時期采用有放回簡單隨機抽樣方式選出樣本量為nq的舊有樣本點以便替換掉,即保留的樣本量為np,保留樣本的比例為p,同時獨立地依有放回簡單隨機樣本方式補充新的nq個新樣本點,這里p+q=1,這樣第二個時期的樣本量仍舊為n。設:第一節(jié)

樣本輪換

二、樣本輪換的最優(yōu)比例第一節(jié)樣本輪換12為第一個時期與第二個時期相同的np個單元在第一個時期的均值。為第一個時期nq個單元在第一個時期的均值。為np個單元在第二個時期的樣本均值。為nq個補充單元在第二個時期的樣本均值。ρ為和之間的相關系數(shù)。如果希望估計第二個時期的樣本均值并充分利用第一個時期的信息,令該估計量為,那么它應該是充分利用前后期中保留樣本、不保留樣本和后期新補充樣本的加權平均數(shù)。

第一節(jié)

樣本輪換

為第一個時期與第二個時期相同的np個單元在第一13設我們希望得到的估計量是兩期估計量的線性函數(shù),即

=a+b+c+d(10.1)要求估計其參數(shù)a,b,c,d。因為E()=E()=,E()=E()=,所以E()=(a+b)+(c+d)。要使成為的無偏估計量,需a+b=0,c+d=1,也即b=-a,d=1-c。代入(10.1),有=a(-)+c+(1-c)

第一節(jié)

樣本輪換

設我們希望得到的估計量是兩期估計量的線性函14第一節(jié)

樣本輪換

該估計量的方差可以求得為:其中是第一個時期的方差,是第二個時期的方差。我們要求出a和c,使得達到最小,就要以上公式分別對a和c求偏微分并使之等于0,即可求出a和c的最優(yōu)值分別為:第一節(jié)樣本輪換該估計量的方差可以求得為:其15第一節(jié)

樣本輪換

該估計量的方差可以求得為:第一節(jié)樣本輪換該估計量的方差可以求得為:16第一節(jié)

樣本輪換

將其代入公式(10.1),就得到該估計量的方差為:第一節(jié)樣本輪換將其代入公式(10.1),就得到該估17第一節(jié)

樣本輪換

如果不利用前期信息,只根據(jù)第二期的結果來估計均值,那么:其方差為:第一節(jié)樣本輪換如果不利用前期信息,只根據(jù)第二期的結果18第一節(jié)

樣本輪換

故利用前期信息后的設計效果為:從上式可以看出,當ρ的值比較大時,利用上期信息可以較大地提高的效率。表10.1給出了不同的q,ρ值時的值。第一節(jié)樣本輪換故利用前期信息后的設計效果為:19第一節(jié)

樣本輪換

表10.1不同的q,ρ值時的值第一節(jié)樣本輪換表10.1不同的q,20若對上式關于q求偏導,并使之等于0,那么便可得到最優(yōu)輪換比:若對上式關于q求偏導,并使之等于0,那么便可得到最優(yōu)21第一節(jié)

樣本輪換

三、樣本輪換方法(一)

隨機輪換法

在進行輪換時按確定的輪換單位數(shù)目或比例,從原有樣本中隨機抽出若干單位不再調(diào)查,而從其余未包括在樣本中的總體單位中抽取同樣數(shù)目的單位來代替。第一節(jié)樣本輪換三、樣本輪換方法22第一節(jié)

樣本輪換

(二)

等距輪換法

在總體抽樣框中確定出各個等距抽樣的樣本,在各次的調(diào)查中,按相應位置的等距樣本單位進行輪換。我國農(nóng)村住戶調(diào)查就是采用這種輪換方式。(三)

子樣本輪換法從總體中抽出若干套子樣本,每次調(diào)查一定數(shù)量的子樣本,逐次輪換其中的部分子樣本。

第一節(jié)樣本輪換(二)

等23第一節(jié)

樣本輪換

子樣本輪換實際上就是每次采用交叉子樣本,而交叉子樣本不僅能有效地減少和控制估計偏差,而且由于每個交叉子樣本都能代表總體,即使有的子樣本資料搜集不到,我們也可以用其他的子樣本甚至一個子樣本來觀察和推斷總體。此外,用交叉子樣本還可以考察非抽樣誤差發(fā)生的程度。因此,一般來說,子樣本輪換方法是以上三種樣本輪換方法中最好的。第一節(jié)樣本輪換子樣本輪換實際上就是每次采用交24第一節(jié)

樣本輪換

五、案例介紹美國人口現(xiàn)狀調(diào)查(currentpopulationsurvey,CPS)是國際上最著名的抽樣調(diào)查項目之一,已經(jīng)成為美國以及許多國家進行居民調(diào)查的參考模型,其實施是在每個月包含19號的那一周進行,調(diào)查的問題涉及受訪者此前一周內(nèi)的活動。調(diào)查氛圍覆蓋全美50個州和哥倫比亞地區(qū)。CPS采用的就是樣本輪換的方法,即每位受訪者連續(xù)4個月接受訪問,然后退出樣本,8個月后再進入樣本,連續(xù)4個月接受訪問,最后永久地退出樣本。第一節(jié)樣本輪換五、案例介紹25第一節(jié)

樣本輪換

CPS在1995年7月的抽樣設計方案中樣本輪換的特征:

1.在任意一個月內(nèi),都有1/8的住戶單元第一次接受調(diào)查,1/8的住戶單元第二次接受調(diào)查,依次類推。2.每個月都由新的樣本組代替從樣本中永久退出的老樣本組。3.每個月都有一個樣本組在閑置8個月后重新接受調(diào)查,以此代替剛剛進入閑置期的樣本組。4.通過輪換設計,保證每個樣本單元在2個年份的4個相同月份里接受調(diào)查。5.在連續(xù)的2個月內(nèi),有3/4/的樣本點是相同的;在連續(xù)的2年內(nèi),有1/2的樣本點是相同的。

第一節(jié)樣本輪換CPS在1995年7月的抽樣設計方案26

二維平衡單水平輪換模式的輪換過程

27

二維平衡單水平輪換模式的輪換過程

28第二節(jié)

雙重抽樣

我們可以先從總體中抽取一個大的初始樣本,從而獲得總體的輔助信息,然后再從初始樣本或從總體中再抽一個子樣本,這種方法就是雙重抽樣。

第二節(jié)雙重抽樣我們可以先從總體中抽取一個大的29第二節(jié)

雙重抽樣

一、定義雙重抽樣,也稱二相抽樣或二重抽樣(two-phasesampling),是指在抽樣時分兩步抽取樣本。一般情況下,先從總體N中抽取一個較大的樣本,稱為第一重(相)樣本(thefirstphasesample),對之進行調(diào)查以獲取總體的某些輔助信息,為下一步的抽樣估計提供條件;然后進行第二重抽樣(thesecondphasesampling)。第二重抽樣所抽的樣本n相對較小,但是第二重抽樣調(diào)查才是主調(diào)查。第二節(jié)雙重抽樣一、定義30第二節(jié)

雙重抽樣

二、雙重抽樣與兩階段抽樣的區(qū)別(一)兩階段抽樣(two-stagesampling)是先從總體N個單元(初級單元)中抽出n個樣本單元,卻并不對這n個樣本單元中的所有小單元(二級單元)都進行調(diào)查,而是在其中再抽出若干個二級單元進行調(diào)查;雙重抽樣則不同,要對第一重(相)樣本進行調(diào)查以獲取總體的某些輔助信息,并且要利用這些輔助信息進行排序、分層、抽樣或估計等。第二節(jié)雙重抽樣二、雙重抽樣與兩階段抽樣的區(qū)別31第二節(jié)

雙重抽樣

(二)兩階段抽樣的第二階段抽樣單元和第一階段抽樣單元往往是不同的;雙重抽樣要有一份最終單元的完整名冊(總體所有單元的抽樣框),而兩階段抽樣只是需要第一階段單元(初級單元)名冊,然后在中選的初級單元中構造第二階段抽樣的抽樣框。第二節(jié)雙重抽樣(二)兩階段抽樣的第二階段抽樣單元和32第二節(jié)

雙重抽樣

三、雙重抽樣的作用(一)有助于篩選主調(diào)查對象(二)節(jié)約調(diào)查費用(三)提高抽樣效率(四)可用于研究樣本輪換中的某些問題(五)降低無回答偏倚第二節(jié)雙重抽樣三、雙重抽樣的作用33第二節(jié)

雙重抽樣

四、雙重抽樣的應用

(一)為分層的雙重抽樣分層抽樣如果事先無法知道總體的層權,可以采用雙重抽樣。具體實施過程如下:第一步:利用簡單隨機抽樣,從總體的N個單元中隨機抽取第一重樣本,樣本單元數(shù)為;根據(jù)已知的分層標志將第一重樣本分層,令,則是總體層權的無偏估計。第二節(jié)雙重抽樣四、雙重抽樣的應用34第二節(jié)

雙重抽樣

第二步:利用分層隨機抽樣,從第一重樣本中抽取出第二重樣本,樣本單元數(shù)為n,第h層樣本單元數(shù)為,。采用雙重分層抽樣,對總體均值的估計量為:的方差為:第二節(jié)雙重抽樣第二步:利用分層隨機抽樣,從第一重樣35第二節(jié)

雙重抽樣

上式可簡化為:的樣本估計量為:第二節(jié)雙重抽樣上式可簡化為:的樣本36第二節(jié)

雙重抽樣

第一步:從總體的N個單元中隨機抽取第一重樣本,樣本單元數(shù)為;對于第一重樣本,僅觀測輔助變量信息,用輔助變量的樣本均值估計總體均值。(二)為比率估計的雙重抽樣在實際工作中,如果輔助變量的信息未知,可以利用雙重抽樣進行比率估計。具體實施過程如下:第二節(jié)雙重抽樣第一步:從總體的N個單元中隨機抽取第37第二節(jié)

雙重抽樣

雙重抽樣對總體均值的比率估計:第二步:從第一重樣本中隨機抽取出第二重樣本,樣本單元數(shù)為n;對于第二重樣本,觀測目標變量與輔助變量,并用獲得的和,計算,構造比率估計。雙重抽樣比率估計的方差為:第二節(jié)雙重抽樣雙重抽樣對總體均值的比率估計:38第二節(jié)

雙重抽樣

雙重抽樣比率估計方差的樣本估計:

第二節(jié)雙重抽樣雙重抽樣比率估計方差的樣本估計:39第二節(jié)

雙重抽樣

(三)為回歸估計的二重抽樣與比率估計相似,在輔助信息未知時可以采用二重抽樣進行回歸估計。具體實施過程如下:第一步:從總體的N個單元中隨機抽取第一重樣本,樣本單元數(shù)為;對于第一重樣本,僅觀測輔助變量信息,用輔助變量的樣本均值估計其總體均值。第二節(jié)雙重抽樣(三)為回歸估計的二重抽樣40第二節(jié)

雙重抽樣

第二步:從第一重樣本中隨機抽取出第二重樣本,樣本單元數(shù)為n;對于第二重樣本,觀測目標變量與輔助變量,并計算、和回歸系數(shù)b,構造回歸估計。雙重抽樣對總體均值的回歸估計:雙重抽樣回歸估計的方差為:第二節(jié)雙重抽樣第二步:從第一重樣本中隨機抽取出第41第二節(jié)

雙重抽樣

式中:為第一重樣本殘差方差,其均值近似等于總體殘差方差:因此雙重抽樣回歸估計方差的樣本估計:第二節(jié)雙重抽樣式中:為第一重樣本殘差方差,其均值近42第三節(jié)隨機化裝置一、敏感性問題調(diào)查所謂敏感性問題(sensitivequestion)是指所調(diào)查的內(nèi)容涉及私人機密,受訪者不愿或不便于向外界透露的問題。對于這類敏感性問題,必須采取經(jīng)過特別設計的裝置與方法,以消除受訪者的顧慮,能夠如實回答問題,避免調(diào)查出現(xiàn)嚴重偏誤。這種為敏感性問題調(diào)查特別設計的技術,稱隨機化回答技術(RandomizedResponseTechnique)。第三節(jié)隨機化裝置一、敏感性問題調(diào)查43第三節(jié)隨機化裝置

敏感性問題按總體的特征可分為屬性特征和數(shù)量特征問題兩類。屬性特征的敏感性問題是指受訪者是否具有敏感性問題的特征,一般是估計具有敏感性特征的單位在總體中所占的比例,因此又可稱作敏感性比例問題。數(shù)量特征的敏感性問題是指受訪者具有敏感性問題數(shù)額的多少的特征,一般是估計敏感性數(shù)額的均值或總和,也可稱作敏感性均值問題。第三節(jié)隨機化裝置敏感性問題按總體的特征可分為44二、沃納隨機化回答模型使用隨機化回答技術的第一個模型是由沃納(S.L.Warner)首先提出的。例如,某大學欲調(diào)查學生考試的作弊問題,隨機抽取n個學生進行調(diào)查,對每位學生顯示兩個相反的問題,問題可以寫在外形完全相同的m張卡片上,其中m1個卡片寫上“我曾在考試中作過弊”,另外m-m1個卡片寫上“我不曾在考試中作過弊”。然后把這m個卡片折疊好,放在一個盒子里。其中:A問題:我曾在考試中作過弊。B問題:我不曾在考試中作過弊。第三節(jié)隨機化裝置二、沃納隨機化回答模型第三節(jié)隨機化裝置45調(diào)查時將m種外形完全一致的卡片像洗牌一樣充分混合后,由受訪者依簡單隨機抽樣中的抽簽方式隨機抽取一張卡片,對照自己的情況回答“是”或“否”,然后放回盒子中。設卡片A的比例是P,則卡片B的比例就是1-P。由古典概率可知,在大規(guī)模的調(diào)查中,抽中卡片的概率為P(A)=P,抽中卡片的概率為P(B)=1-P。若樣本量為n,回答“是”的人數(shù)為m,則(是)的估計值為m/n。我們知道,回答“是”的人有兩種情況:一種是抽中了卡片A,而這些人作過弊;另一種是抽中了卡片B,而這些人沒有作過弊。利用全概公式,得:(是)=P(A)·(是|A)+P(B)·(是|B)第三節(jié)隨機化裝置調(diào)查時將m種外形完全一致的卡片像洗牌一樣充分混合后,46不管是抽到卡片A還是抽到卡片B,作過弊的概率是相等的,假設這一比例為,即(是|A)=,則抽到卡片B,回答“是”的概率為1-,即P(是|B)=1-。代入上述公式,得的一個估計滿足:第三節(jié)隨機化裝置因此當時,有:其方差為:不管是抽到卡片A還是抽到卡片B,作過弊的概率是相等的47的一個無偏估計為:第三節(jié)隨機化裝置當n很大時,的一個無偏估計為:第三節(jié)隨機化裝置當n很大48三、西蒙斯(Simmons)隨機化回答模型西蒙斯在沃納模型基礎上作了改進,他將其中一張卡片上的問題改為與所調(diào)查的敏感性問題完全無關的另一個非敏感性問題。因此西蒙斯模型也稱為無關問題的隨機化回答模型。

仍假設敏感性問題的卡片比例為P,無關問題的卡片比例為1-P。對于敏感性問題回答“是”的比例為,是我們所要調(diào)查的比例,對無關問題回答“是”的比例要求是已知的,則根據(jù)全概率公式,得:(是)=P+(1-P)第三節(jié)隨機化裝置三、西蒙斯(Simmons)隨機化回答模型第三節(jié)隨機化49當樣本量為n,回答“是”的人數(shù)為m,則(是)的估計值為m/n,因此的估計值滿足:第三節(jié)隨機化裝置解此方程得:它的方差為(若忽略fpc):V()的一個無偏估計為:當樣本量為n,回答“是”的人數(shù)為m,則(是)的估計值50【例10.1】某大學對本校大學生考風情況進行調(diào)查。利用西蒙斯模型,對每個受訪者準備了一套同樣的(40張)卡片,卡片A和卡片B各20張,比例各占1/2??ㄆ螦的問題是:最近學期期末考試你有過作弊行為嗎?卡片上B的問題是:你的陽歷生日日期為奇數(shù)嗎?第三節(jié)隨機化裝置【例10.1】某大學對本校大學生考風情況進行調(diào)查。利用51【例10.1】某大學對本校大學生考風情況進行調(diào)查。利用西蒙斯模型,對每個受訪者準備了一套同樣的(40張)卡片,卡片A和卡片B各20張,比例各占1/2??ㄆ螦的問題是:最近學期期末考試你有過作弊行為嗎?卡片上B的問題是:你的陽歷生日日期為奇數(shù)嗎?假如對依簡單隨機抽樣方式抽出的400個人進行調(diào)查,在n=400人中總共有m=115人的答案為“是”,試估計該校大學生考試作弊的比例并給出90%的置信區(qū)間。第三節(jié)隨機化裝置【例10.1】某大學對本校大學生考風情況進行調(diào)查。利用52解:n=800,m=135,P=0.5,為生日日期為奇數(shù)的人數(shù)比例。在大規(guī)模調(diào)查的情況下,可以看作生日為奇數(shù)和偶數(shù)的各占一半,因此=0.5。根據(jù)公式得:第三節(jié)隨機化裝置

=

故的90%置信區(qū)間約為:(0.0751.640.0453),即:=0.002054

解:n=800,m=135,P=0.5,為生日日期53四、隨機截尾模型現(xiàn)實中我們也經(jīng)常需要調(diào)查定量的敏感性問題,例如調(diào)查銀行存款數(shù)額,學生考試作弊的平均次數(shù),在職人員的工資外收入等。Greenberg等人針對這類問題提出了幾種隨機化調(diào)查方法,但是,這些方法都要求受訪者根據(jù)自己的實際情況回答敏感性問題或非敏感性問題的具體數(shù)值,給受訪者/受查者造成了一定的困擾。近年來提出了所謂隨機截尾模型,把對于具體數(shù)值的調(diào)查轉化為對于屬性的調(diào)查,避免了直接回答,使得受訪者心理上比較容易接受。第三節(jié)隨機化裝置四、隨機截尾模型第三節(jié)隨機化裝置54設反映敏感性問題的特征量為X,取值范圍是,密度函數(shù)為,X的數(shù)學期望為,即我們所要估計的值。又設Y是一個服從上的均勻分布的隨機變量。第三節(jié)隨機化裝置設樣本容量為n,得到的調(diào)查數(shù)據(jù)是,I=1,2,…n,即:=

,因此設反映敏感性問題的特征量為X,取值范圍是,55以樣本均值=代替,得到的一個無偏估計為:第三節(jié)隨機化裝置估計量的方差為:的一個估計為:以樣本均值=代替,得到56五、采用隨機化回答技術應注意的問題第三節(jié)隨機化裝置(一)注意在受訪者正式抽取并回答問題前,清楚介紹這種做法的原理,讓受訪者充分理解這種方法的特點,以徹底消除受訪者的顧慮,明白自己究竟回答哪個問題別人是不知道的,使其相信這種設計是建立在科學的基礎上,不是哄騙人的。(二)所提問題必須簡單明了,防止因有歧義而出現(xiàn)理解不同。對涉及問題的解釋必須在抽卡片以前進行,否則就暴露了抽到的是哪類卡片,也就失去了隨機化回答的意義。五、采用隨機化回答技術應注意的問題第三節(jié)隨機化裝置(一57第三節(jié)隨機化裝置(三)在應用西蒙斯模型時,無關問題的選擇特別重要,一定要隱蔽性強的,使受訪者在回答無關問題時不會暴露正在回答哪個問題。例如“你是男生嗎?”這類問題就很不妥,因為采用隨機化回答技術需要當面解釋,受訪者的性別不可能保密,這樣也就失去了無關問題本來應具有的保護作用。(四)做好調(diào)查者的培訓工作,使他們能夠正確理解隨機化回答技術的實質并加以運用,這樣才能更好地向受訪者解釋清楚,消除受訪者的顧慮,以對調(diào)查的問題給予正確回答。第三節(jié)隨機化裝置(三)在應用西蒙斯模型時,無關問題58第四節(jié)交叉子樣本交叉子樣本(Interpenetratingsub-samples)方法最初是由印度著名統(tǒng)計學家馬哈拉諾比斯于30年代提出來的用于大規(guī)模的抽樣調(diào)查,后來由美國統(tǒng)計學家戴明推廣和發(fā)展,他稱之謂重復抽樣。它的主要優(yōu)點是便于計算抽樣標準誤差,即使是復雜的抽樣設計和復雜的估計量,也可以很快得到方差的估計量。它還可以用于發(fā)現(xiàn)偏差,核對調(diào)查員的調(diào)查質量等。第四節(jié)交叉子樣本交叉子樣本(Interpen59第四節(jié)交叉子樣本一、獨立的交叉子樣本設總體為N,現(xiàn)欲抽取樣本容量為n的樣本。那么可以利用交叉子樣本的方法,

假設抽取K個子樣本,使每個樣本的容量為m(n=Km),每個交叉子樣本可以得到總體參數(shù)θ的一個無偏估計量那么交叉子樣本的估計量及其方差為:(不重復抽樣)第四節(jié)交叉子樣本一、獨立的交叉子樣本(不重復抽樣)60【例10.2】假設有一小城鎮(zhèn),現(xiàn)欲估計這一城鎮(zhèn)的房屋數(shù)。該城鎮(zhèn)共有50個居委會,由于居委會作為抽樣單位太大,將每個居委會劃分為8個地段,這樣共有400個地段,擬抽取20%的地段做樣本,所以n=80,現(xiàn)采用K=5獨立交叉子樣本,每個交叉子樣本的容量為16。抽樣的方法可用系統(tǒng)抽樣的方法,將總體分成16段(層),每段有25個地段。抽選時先在1—25之間用不重復抽樣方法抽取5個隨機數(shù)作為隨機起點。如表(10.2)中的第一行,它們分別是:18,1,8,23,11。第四節(jié)交叉子樣本【例10.2】假設有一小城鎮(zhèn),現(xiàn)欲估計這一城鎮(zhèn)的房屋數(shù)。61第四節(jié)交叉子樣本第四節(jié)交叉子樣本62第四節(jié)交叉子樣本方差的估計量為:95%的置信區(qū)間為第四節(jié)交叉子樣本方差的估計量為:95%的置信區(qū)間為63第四節(jié)交叉子樣本交叉字樣本的估計量也適用于復雜的估計量,例如比率估計量。如果每個子樣本的估計量為,則總體的分別比率估計量為:1959年莫蒂和南加瑪還證明了交叉子樣本的合并比率估計量,其方差也是近似的。第四節(jié)交叉子樣本交叉字樣本的估計量也適用于復雜的64第四節(jié)交叉子樣本二、交叉子樣本的其他應用四十年代馬哈拉諾比斯曾將交叉子樣本方法用于農(nóng)產(chǎn)量調(diào)查中,用來發(fā)現(xiàn)不同調(diào)查員的偏差。其方法是抽取一對相聯(lián)系(或鄰近)的子樣本。如在田塊中設置啞鈴型的測框,啞鈴的兩端組成兩個子樣本。分別由兩組調(diào)查人員各調(diào)查一個子樣本,然后將兩個子樣本的結果相比較,采用t檢驗,如果兩個子樣之間有顯著差別,則說明調(diào)查中有不同方向和不同程度的偏差存在,如果沒有顯著差異,則不能說明沒有偏差,只能所沒有發(fā)現(xiàn)偏差。第四節(jié)交叉子樣本二、交叉子樣本的其他應用65第四節(jié)交叉子樣本這種方法也可用于某一調(diào)查中,研究調(diào)查人員是否需要進行培訓??蓪山M相聯(lián)系的子樣本分別由經(jīng)過培訓的調(diào)查人員和未經(jīng)培訓的調(diào)查人員進行調(diào)查,然后把兩組的結果加以比較,如果有顯著差別,說明培訓是需要的,如果無顯著差別,說明培訓的作用不大。交叉子樣本還可以在不同的操作方法中進行檢驗,如果各子樣的差別不大,說明各種操作方法都是可行的,如果其中有一種操作方法與其它方法有較大差別,那么對這種操作方法應仔細檢查。第四節(jié)交叉子樣本這種方法也可用于某一調(diào)查中,研66編號為奇數(shù)的習題答案10.1(略)10.3(1)雙重抽樣中最優(yōu)的,

雙重分層抽樣方差估計為:(2)不分層的簡單隨機抽樣方差,故雙重抽樣效率高。(3)

10.5的雙重回歸估計量的標準差為1.05

編號為奇數(shù)的習題答案10.1(略)10.5的雙重回歸6710.7,,,為生日日期為奇數(shù)的人數(shù)比例在大規(guī)模調(diào)查的情況下,可以看作生日為奇數(shù)和偶數(shù)的各占一半,因此。根據(jù)公式得:即估計有70%的已婚男子存私房錢,由公式得:故的95%置信區(qū)間約為:即:(60.4%,79.6%)因此不能認為已婚男子存私房錢的比例約為60%。

10.7,68

第十章其它抽樣方法技術第十章其它抽樣方法技術69本章要點本章主要對樣本輪換、雙重抽樣、隨機化裝置、交叉子樣本等抽樣技術原理、方法、特點及應用條件進行了較為全面的介紹。具體要求:掌握本章所介紹的幾種抽樣技術的特點及應用條件,在抽樣實際工作中能夠正確運用該種技術,提高估計的精度與效果。本章要點本章主要對樣本輪換、雙重抽樣、隨機70第一節(jié)樣本輪換

第二節(jié)雙重抽樣

第三節(jié)隨機化裝置

第四節(jié)交叉子樣本第一節(jié)樣本輪換

第二節(jié)雙重抽樣

第三節(jié)隨機化裝置71問題提出

時間序列數(shù)據(jù)以及隨后出現(xiàn)的面板數(shù)據(jù)都是經(jīng)濟統(tǒng)計分析和計量分析中非常重要的數(shù)據(jù)類型。當我們在研究應該應用什么統(tǒng)計和計量的方法去分析既定的時間序列數(shù)據(jù)時,是否考慮過以下幾個問題?

時間序列數(shù)據(jù)是如何產(chǎn)生的?

所產(chǎn)生的時間序列數(shù)據(jù)是否準確?

如何讓時間序列數(shù)據(jù)更加準確?問題提出時間序列數(shù)72

隨著社會經(jīng)濟現(xiàn)象的不斷變化和發(fā)展,很多調(diào)查對象的總體也在不斷變化和發(fā)展。為了能夠及時反映調(diào)查總體的這種變化和發(fā)展,調(diào)查部門就需要對同一總體在不同時間上進行連續(xù)性抽樣調(diào)查(SuccessiveSamplingSurvey),并定期公布調(diào)查結果,形成一系列時序統(tǒng)計數(shù)據(jù)。因此,社會經(jīng)濟抽樣調(diào)查一般都應該是連續(xù)性的定期調(diào)查。

一次性抽樣調(diào)查與截面數(shù)據(jù)

連續(xù)性抽樣調(diào)查與時間序列數(shù)據(jù)及面板數(shù)據(jù)隨著社會經(jīng)濟現(xiàn)象的不斷變化和發(fā)展,很73

抽樣調(diào)查除了對總體的一次性抽樣以外,很多重要的調(diào)查是隔一段時間重復進行的,對于這種經(jīng)常性的抽樣問題,就必須重視其樣本輪換問題的研究。對于樣本輪換問題,我們至少應考慮以下問題:每次調(diào)查的樣本如何組成?是采用固定樣本還是采用全新的樣本,或者是部分保留部分替換,即樣本輪換;在估計后期的總量或均值時,是否需要利用前期的信息來改進現(xiàn)期的估計,以及如何利用;如果采用樣本輪換的方法,如何確定最優(yōu)的保留比例或替換比例。第一節(jié)

樣本輪換

抽樣調(diào)查除了對總體的一次性抽樣以外,很多重要的調(diào)查是74連續(xù)性抽樣設計方法按抽取樣本的不同劃分輪換樣本重復樣本固定樣本單水平輪換不完全的單水平輪換多水平輪換連續(xù)性抽樣設計方法按抽取樣本的不同劃分輪換樣本重復樣本固定樣75輪換模式應用舉例加拿大勞動力調(diào)查(LFS)使用6~0單水平輪換模式美國現(xiàn)時人口調(diào)查(CPS)使用4~8~4不完全單水平輪換模式美國消費者支出的季度調(diào)查(CEQ)便采用4~0三水平輪換模式中國城市住戶抽樣調(diào)查中國規(guī)模以下工業(yè)企業(yè)抽樣調(diào)查中國農(nóng)產(chǎn)量抽樣調(diào)查輪換模式應用舉例加拿大勞動力調(diào)查(LFS)使用6~0單76一、樣本輪換的原因如果是單純地估計現(xiàn)值的情況,當然最好每次重新抽取新樣本,這樣必然會增加費用;如果要逐期地與上期比較,則采用固定樣本的方法為好,固定樣本可以消除樣本的因素而只觀察動態(tài)的變化。然而,樣本長期不變,隨著時間的推移,固定樣本會顯露它的弊端,既難以反映總體的變化,而且受訪者也會產(chǎn)生厭煩心理,出現(xiàn)不合作或回答質量下降等問題,從而影響調(diào)查質量。另外,無論是采用固定樣本還是全新樣本都難以正確地反映總體在各個不同時間上的水平及變化,因此,一種廣泛采用的方法是樣本輪換,即每隔一定時間(一個月、一季或一年)更換一定比例的單元,保留其余單元。第一節(jié)

樣本輪換

一、樣本輪換的原因第一節(jié)樣本輪換77與傳統(tǒng)的一次性抽樣調(diào)查相比,輪換的抽樣調(diào)查具有以下特有的優(yōu)勢:

節(jié)省調(diào)查費用和調(diào)查資源

在一定程度上減輕被調(diào)查者回答負擔

利用前后各期之間的相關關系提高估計精度與傳統(tǒng)的一次性抽樣調(diào)查相比,輪換的抽樣78我國1996年新修訂的《統(tǒng)計法》第十條明確規(guī)定:“統(tǒng)計調(diào)查應當以周期性普查為基礎,以經(jīng)常性抽樣調(diào)查為主體,以必要的統(tǒng)計報表、重點調(diào)查、綜合分析等為補充,搜集、整理基本統(tǒng)計資料?!币虼耍诮窈笪覈y(tǒng)計部門開展的統(tǒng)計調(diào)查制度與方法改革的過程中,最重要的就是圍繞如何更好地發(fā)揮經(jīng)常性抽樣調(diào)查的主體作用,研究并應用更加符合我國國情的經(jīng)常性抽樣調(diào)查方法,以此得出更加準確的統(tǒng)計數(shù)據(jù),為我國政府部門、研究機構以及各類企事業(yè)單位等社會各界服務。我國抽樣調(diào)查制度與方法改革的方向我國1996年新修訂的《統(tǒng)計法》第十條明確規(guī)定:“統(tǒng)計調(diào)查應79二、樣本輪換的最優(yōu)比例第一個時期采用有放回簡單隨機抽樣方式抽出樣本量為n的樣本;在第二個時期采用有放回簡單隨機抽樣方式選出樣本量為nq的舊有樣本點以便替換掉,即保留的樣本量為np,保留樣本的比例為p,同時獨立地依有放回簡單隨機樣本方式補充新的nq個新樣本點,這里p+q=1,這樣第二個時期的樣本量仍舊為n。設:第一節(jié)

樣本輪換

二、樣本輪換的最優(yōu)比例第一節(jié)樣本輪換80為第一個時期與第二個時期相同的np個單元在第一個時期的均值。為第一個時期nq個單元在第一個時期的均值。為np個單元在第二個時期的樣本均值。為nq個補充單元在第二個時期的樣本均值。ρ為和之間的相關系數(shù)。如果希望估計第二個時期的樣本均值并充分利用第一個時期的信息,令該估計量為,那么它應該是充分利用前后期中保留樣本、不保留樣本和后期新補充樣本的加權平均數(shù)。

第一節(jié)

樣本輪換

為第一個時期與第二個時期相同的np個單元在第一81設我們希望得到的估計量是兩期估計量的線性函數(shù),即

=a+b+c+d(10.1)要求估計其參數(shù)a,b,c,d。因為E()=E()=,E()=E()=,所以E()=(a+b)+(c+d)。要使成為的無偏估計量,需a+b=0,c+d=1,也即b=-a,d=1-c。代入(10.1),有=a(-)+c+(1-c)

第一節(jié)

樣本輪換

設我們希望得到的估計量是兩期估計量的線性函82第一節(jié)

樣本輪換

該估計量的方差可以求得為:其中是第一個時期的方差,是第二個時期的方差。我們要求出a和c,使得達到最小,就要以上公式分別對a和c求偏微分并使之等于0,即可求出a和c的最優(yōu)值分別為:第一節(jié)樣本輪換該估計量的方差可以求得為:其83第一節(jié)

樣本輪換

該估計量的方差可以求得為:第一節(jié)樣本輪換該估計量的方差可以求得為:84第一節(jié)

樣本輪換

將其代入公式(10.1),就得到該估計量的方差為:第一節(jié)樣本輪換將其代入公式(10.1),就得到該估85第一節(jié)

樣本輪換

如果不利用前期信息,只根據(jù)第二期的結果來估計均值,那么:其方差為:第一節(jié)樣本輪換如果不利用前期信息,只根據(jù)第二期的結果86第一節(jié)

樣本輪換

故利用前期信息后的設計效果為:從上式可以看出,當ρ的值比較大時,利用上期信息可以較大地提高的效率。表10.1給出了不同的q,ρ值時的值。第一節(jié)樣本輪換故利用前期信息后的設計效果為:87第一節(jié)

樣本輪換

表10.1不同的q,ρ值時的值第一節(jié)樣本輪換表10.1不同的q,88若對上式關于q求偏導,并使之等于0,那么便可得到最優(yōu)輪換比:若對上式關于q求偏導,并使之等于0,那么便可得到最優(yōu)89第一節(jié)

樣本輪換

三、樣本輪換方法(一)

隨機輪換法

在進行輪換時按確定的輪換單位數(shù)目或比例,從原有樣本中隨機抽出若干單位不再調(diào)查,而從其余未包括在樣本中的總體單位中抽取同樣數(shù)目的單位來代替。第一節(jié)樣本輪換三、樣本輪換方法90第一節(jié)

樣本輪換

(二)

等距輪換法

在總體抽樣框中確定出各個等距抽樣的樣本,在各次的調(diào)查中,按相應位置的等距樣本單位進行輪換。我國農(nóng)村住戶調(diào)查就是采用這種輪換方式。(三)

子樣本輪換法從總體中抽出若干套子樣本,每次調(diào)查一定數(shù)量的子樣本,逐次輪換其中的部分子樣本。

第一節(jié)樣本輪換(二)

等91第一節(jié)

樣本輪換

子樣本輪換實際上就是每次采用交叉子樣本,而交叉子樣本不僅能有效地減少和控制估計偏差,而且由于每個交叉子樣本都能代表總體,即使有的子樣本資料搜集不到,我們也可以用其他的子樣本甚至一個子樣本來觀察和推斷總體。此外,用交叉子樣本還可以考察非抽樣誤差發(fā)生的程度。因此,一般來說,子樣本輪換方法是以上三種樣本輪換方法中最好的。第一節(jié)樣本輪換子樣本輪換實際上就是每次采用交92第一節(jié)

樣本輪換

五、案例介紹美國人口現(xiàn)狀調(diào)查(currentpopulationsurvey,CPS)是國際上最著名的抽樣調(diào)查項目之一,已經(jīng)成為美國以及許多國家進行居民調(diào)查的參考模型,其實施是在每個月包含19號的那一周進行,調(diào)查的問題涉及受訪者此前一周內(nèi)的活動。調(diào)查氛圍覆蓋全美50個州和哥倫比亞地區(qū)。CPS采用的就是樣本輪換的方法,即每位受訪者連續(xù)4個月接受訪問,然后退出樣本,8個月后再進入樣本,連續(xù)4個月接受訪問,最后永久地退出樣本。第一節(jié)樣本輪換五、案例介紹93第一節(jié)

樣本輪換

CPS在1995年7月的抽樣設計方案中樣本輪換的特征:

1.在任意一個月內(nèi),都有1/8的住戶單元第一次接受調(diào)查,1/8的住戶單元第二次接受調(diào)查,依次類推。2.每個月都由新的樣本組代替從樣本中永久退出的老樣本組。3.每個月都有一個樣本組在閑置8個月后重新接受調(diào)查,以此代替剛剛進入閑置期的樣本組。4.通過輪換設計,保證每個樣本單元在2個年份的4個相同月份里接受調(diào)查。5.在連續(xù)的2個月內(nèi),有3/4/的樣本點是相同的;在連續(xù)的2年內(nèi),有1/2的樣本點是相同的。

第一節(jié)樣本輪換CPS在1995年7月的抽樣設計方案94

二維平衡單水平輪換模式的輪換過程

95

二維平衡單水平輪換模式的輪換過程

96第二節(jié)

雙重抽樣

我們可以先從總體中抽取一個大的初始樣本,從而獲得總體的輔助信息,然后再從初始樣本或從總體中再抽一個子樣本,這種方法就是雙重抽樣。

第二節(jié)雙重抽樣我們可以先從總體中抽取一個大的97第二節(jié)

雙重抽樣

一、定義雙重抽樣,也稱二相抽樣或二重抽樣(two-phasesampling),是指在抽樣時分兩步抽取樣本。一般情況下,先從總體N中抽取一個較大的樣本,稱為第一重(相)樣本(thefirstphasesample),對之進行調(diào)查以獲取總體的某些輔助信息,為下一步的抽樣估計提供條件;然后進行第二重抽樣(thesecondphasesampling)。第二重抽樣所抽的樣本n相對較小,但是第二重抽樣調(diào)查才是主調(diào)查。第二節(jié)雙重抽樣一、定義98第二節(jié)

雙重抽樣

二、雙重抽樣與兩階段抽樣的區(qū)別(一)兩階段抽樣(two-stagesampling)是先從總體N個單元(初級單元)中抽出n個樣本單元,卻并不對這n個樣本單元中的所有小單元(二級單元)都進行調(diào)查,而是在其中再抽出若干個二級單元進行調(diào)查;雙重抽樣則不同,要對第一重(相)樣本進行調(diào)查以獲取總體的某些輔助信息,并且要利用這些輔助信息進行排序、分層、抽樣或估計等。第二節(jié)雙重抽樣二、雙重抽樣與兩階段抽樣的區(qū)別99第二節(jié)

雙重抽樣

(二)兩階段抽樣的第二階段抽樣單元和第一階段抽樣單元往往是不同的;雙重抽樣要有一份最終單元的完整名冊(總體所有單元的抽樣框),而兩階段抽樣只是需要第一階段單元(初級單元)名冊,然后在中選的初級單元中構造第二階段抽樣的抽樣框。第二節(jié)雙重抽樣(二)兩階段抽樣的第二階段抽樣單元和100第二節(jié)

雙重抽樣

三、雙重抽樣的作用(一)有助于篩選主調(diào)查對象(二)節(jié)約調(diào)查費用(三)提高抽樣效率(四)可用于研究樣本輪換中的某些問題(五)降低無回答偏倚第二節(jié)雙重抽樣三、雙重抽樣的作用101第二節(jié)

雙重抽樣

四、雙重抽樣的應用

(一)為分層的雙重抽樣分層抽樣如果事先無法知道總體的層權,可以采用雙重抽樣。具體實施過程如下:第一步:利用簡單隨機抽樣,從總體的N個單元中隨機抽取第一重樣本,樣本單元數(shù)為;根據(jù)已知的分層標志將第一重樣本分層,令,則是總體層權的無偏估計。第二節(jié)雙重抽樣四、雙重抽樣的應用102第二節(jié)

雙重抽樣

第二步:利用分層隨機抽樣,從第一重樣本中抽取出第二重樣本,樣本單元數(shù)為n,第h層樣本單元數(shù)為,。采用雙重分層抽樣,對總體均值的估計量為:的方差為:第二節(jié)雙重抽樣第二步:利用分層隨機抽樣,從第一重樣103第二節(jié)

雙重抽樣

上式可簡化為:的樣本估計量為:第二節(jié)雙重抽樣上式可簡化為:的樣本104第二節(jié)

雙重抽樣

第一步:從總體的N個單元中隨機抽取第一重樣本,樣本單元數(shù)為;對于第一重樣本,僅觀測輔助變量信息,用輔助變量的樣本均值估計總體均值。(二)為比率估計的雙重抽樣在實際工作中,如果輔助變量的信息未知,可以利用雙重抽樣進行比率估計。具體實施過程如下:第二節(jié)雙重抽樣第一步:從總體的N個單元中隨機抽取第105第二節(jié)

雙重抽樣

雙重抽樣對總體均值的比率估計:第二步:從第一重樣本中隨機抽取出第二重樣本,樣本單元數(shù)為n;對于第二重樣本,觀測目標變量與輔助變量,并用獲得的和,計算,構造比率估計。雙重抽樣比率估計的方差為:第二節(jié)雙重抽樣雙重抽樣對總體均值的比率估計:106第二節(jié)

雙重抽樣

雙重抽樣比率估計方差的樣本估計:

第二節(jié)雙重抽樣雙重抽樣比率估計方差的樣本估計:107第二節(jié)

雙重抽樣

(三)為回歸估計的二重抽樣與比率估計相似,在輔助信息未知時可以采用二重抽樣進行回歸估計。具體實施過程如下:第一步:從總體的N個單元中隨機抽取第一重樣本,樣本單元數(shù)為;對于第一重樣本,僅觀測輔助變量信息,用輔助變量的樣本均值估計其總體均值。第二節(jié)雙重抽樣(三)為回歸估計的二重抽樣108第二節(jié)

雙重抽樣

第二步:從第一重樣本中隨機抽取出第二重樣本,樣本單元數(shù)為n;對于第二重樣本,觀測目標變量與輔助變量,并計算、和回歸系數(shù)b,構造回歸估計。雙重抽樣對總體均值的回歸估計:雙重抽樣回歸估計的方差為:第二節(jié)雙重抽樣第二步:從第一重樣本中隨機抽取出第109第二節(jié)

雙重抽樣

式中:為第一重樣本殘差方差,其均值近似等于總體殘差方差:因此雙重抽樣回歸估計方差的樣本估計:第二節(jié)雙重抽樣式中:為第一重樣本殘差方差,其均值近110第三節(jié)隨機化裝置一、敏感性問題調(diào)查所謂敏感性問題(sensitivequestion)是指所調(diào)查的內(nèi)容涉及私人機密,受訪者不愿或不便于向外界透露的問題。對于這類敏感性問題,必須采取經(jīng)過特別設計的裝置與方法,以消除受訪者的顧慮,能夠如實回答問題,避免調(diào)查出現(xiàn)嚴重偏誤。這種為敏感性問題調(diào)查特別設計的技術,稱隨機化回答技術(RandomizedResponseTechnique)。第三節(jié)隨機化裝置一、敏感性問題調(diào)查111第三節(jié)隨機化裝置

敏感性問題按總體的特征可分為屬性特征和數(shù)量特征問題兩類。屬性特征的敏感性問題是指受訪者是否具有敏感性問題的特征,一般是估計具有敏感性特征的單位在總體中所占的比例,因此又可稱作敏感性比例問題。數(shù)量特征的敏感性問題是指受訪者具有敏感性問題數(shù)額的多少的特征,一般是估計敏感性數(shù)額的均值或總和,也可稱作敏感性均值問題。第三節(jié)隨機化裝置敏感性問題按總體的特征可分為112二、沃納隨機化回答模型使用隨機化回答技術的第一個模型是由沃納(S.L.Warner)首先提出的。例如,某大學欲調(diào)查學生考試的作弊問題,隨機抽取n個學生進行調(diào)查,對每位學生顯示兩個相反的問題,問題可以寫在外形完全相同的m張卡片上,其中m1個卡片寫上“我曾在考試中作過弊”,另外m-m1個卡片寫上“我不曾在考試中作過弊”。然后把這m個卡片折疊好,放在一個盒子里。其中:A問題:我曾在考試中作過弊。B問題:我不曾在考試中作過弊。第三節(jié)隨機化裝置二、沃納隨機化回答模型第三節(jié)隨機化裝置113調(diào)查時將m種外形完全一致的卡片像洗牌一樣充分混合后,由受訪者依簡單隨機抽樣中的抽簽方式隨機抽取一張卡片,對照自己的情況回答“是”或“否”,然后放回盒子中。設卡片A的比例是P,則卡片B的比例就是1-P。由古典概率可知,在大規(guī)模的調(diào)查中,抽中卡片的概率為P(A)=P,抽中卡片的概率為P(B)=1-P。若樣本量為n,回答“是”的人數(shù)為m,則(是)的估計值為m/n。我們知道,回答“是”的人有兩種情況:一種是抽中了卡片A,而這些人作過弊;另一種是抽中了卡片B,而這些人沒有作過弊。利用全概公式,得:(是)=P(A)·(是|A)+P(B)·(是|B)第三節(jié)隨機化裝置調(diào)查時將m種外形完全一致的卡片像洗牌一樣充分混合后,114不管是抽到卡片A還是抽到卡片B,作過弊的概率是相等的,假設這一比例為,即(是|A)=,則抽到卡片B,回答“是”的概率為1-,即P(是|B)=1-。代入上述公式,得的一個估計滿足:第三節(jié)隨機化裝置因此當時,有:其方差為:不管是抽到卡片A還是抽到卡片B,作過弊的概率是相等的115的一個無偏估計為:第三節(jié)隨機化裝置當n很大時,的一個無偏估計為:第三節(jié)隨機化裝置當n很大116三、西蒙斯(Simmons)隨機化回答模型西蒙斯在沃納模型基礎上作了改進,他將其中一張卡片上的問題改為與所調(diào)查的敏感性問題完全無關的另一個非敏感性問題。因此西蒙斯模型也稱為無關問題的隨機化回答模型。

仍假設敏感性問題的卡片比例為P,無關問題的卡片比例為1-P。對于敏感性問題回答“是”的比例為,是我們所要調(diào)查的比例,對無關問題回答“是”的比例要求是已知的,則根據(jù)全概率公式,得:(是)=P+(1-P)第三節(jié)隨機化裝置三、西蒙斯(Simmons)隨機化回答模型第三節(jié)隨機化117當樣本量為n,回答“是”的人數(shù)為m,則(是)的估計值為m/n,因此的估計值滿足:第三節(jié)隨機化裝置解此方程得:它的方差為(若忽略fpc):V()的一個無偏估計為:當樣本量為n,回答“是”的人數(shù)為m,則(是)的估計值118【例10.1】某大學對本校大學生考風情況進行調(diào)查。利用西蒙斯模型,對每個受訪者準備了一套同樣的(40張)卡片,卡片A和卡片B各20張,比例各占1/2??ㄆ螦的問題是:最近學期期末考試你有過作弊行為嗎?卡片上B的問題是:你的陽歷生日日期為奇數(shù)嗎?第三節(jié)隨機化裝置【例10.1】某大學對本校大學生考風情況進行調(diào)查。利用119【例10.1】某大學對本校大學生考風情況進行調(diào)查。利用西蒙斯模型,對每個受訪者準備了一套同樣的(40張)卡片,卡片A和卡片B各20張,比例各占1/2??ㄆ螦的問題是:最近學期期末考試你有過作弊行為嗎?卡片上B的問題是:你的陽歷生日日期為奇數(shù)嗎?假如對依簡單隨機抽樣方式抽出的400個人進行調(diào)查,在n=400人中總共有m=115人的答案為“是”,試估計該校大學生考試作弊的比例并給出90%的置信區(qū)間。第三節(jié)隨機化裝置【例10.1】某大學對本校大學生考風情況進行調(diào)查。利用120解:n=800,m=135,P=0.5,為生日日期為奇數(shù)的人數(shù)比例。在大規(guī)模調(diào)查的情況下,可以看作生日為奇數(shù)和偶數(shù)的各占一半,因此=0.5。根據(jù)公式得:第三節(jié)隨機化裝置

=

故的90%置信區(qū)間約為:(0.0751.640.0453),即:=0.002054

解:n=800,m=135,P=0.5,為生日日期121四、隨機截尾模型現(xiàn)實中我們也經(jīng)常需要調(diào)查定量的敏感性問題,例如調(diào)查銀行存款數(shù)額,學生考試作弊的平均次數(shù),在職人員的工資外收入等。Greenberg等人針對這類問題提出了幾種隨機化調(diào)查方法,但是,這些方法都要求受訪者根據(jù)自己的實際情況回答敏感性問題或非敏感性問題的具體數(shù)值,給受訪者/受查者造成了一定的困擾。近年來提出了所謂隨機截尾模型,把對于具體數(shù)值的調(diào)查轉化為對于屬性的調(diào)查,避免了直接回答,使得受訪者心理上比較容易接受。第三節(jié)隨機化裝置四、隨機截尾模型第三節(jié)隨機化裝置122設反映敏感性問題的特征量為X,取值范圍是,密度函數(shù)為,X的數(shù)學期望為,即我們所要估計的值。又設Y是一個服從上的均勻分布的隨機變量。第三節(jié)隨機化裝置設樣本容量為n,得到的調(diào)查數(shù)據(jù)是,I=1,2,…n,即:=

,因此設反映敏感性問題的特征量為X,取值范圍是,123以樣本均值=代替,得到的一個無偏估計為:第三節(jié)隨機化裝置估計量的方差為:

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論