其它抽樣方法課件

上傳人：w*** IP屬地：貴州上傳時間：2022-12-13 格式：PPTX 頁數(shù)：118 大?。?.19MB 積分：25 舉報 版權(quán)申訴

已閱讀5頁，還剩113頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第7章其它抽樣方法第7章其它抽樣方法第一節(jié)樣本輪換

第二節(jié)雙重抽樣

第三節(jié)隨機(jī)化裝置

第一節(jié)樣本輪換

第二節(jié)雙重抽樣

第三節(jié)隨機(jī)化裝置

問題提出

時間序列數(shù)據(jù)以及隨后出現(xiàn)的面板數(shù)據(jù)都是經(jīng)濟(jì)統(tǒng)計分析和計量分析中非常重要的數(shù)據(jù)類型。當(dāng)我們在研究應(yīng)該應(yīng)用什么統(tǒng)計和計量的方法去分析既定的時間序列數(shù)據(jù)時，是否考慮過以下幾個問題？

時間序列數(shù)據(jù)是如何產(chǎn)生的？

所產(chǎn)生的時間序列數(shù)據(jù)是否準(zhǔn)確？

如何讓時間序列數(shù)據(jù)更加準(zhǔn)確？問題提出時間序列數(shù)

隨著社會經(jīng)濟(jì)現(xiàn)象的不斷變化和發(fā)展，很多調(diào)查對象的總體也在不斷變化和發(fā)展。為了能夠及時反映調(diào)查總體的這種變化和發(fā)展，調(diào)查部門就需要對同一總體在不同時間上進(jìn)行連續(xù)性抽樣調(diào)查(SuccessiveSamplingSurvey)，并定期公布調(diào)查結(jié)果，形成一系列時序統(tǒng)計數(shù)據(jù)。因此，社會經(jīng)濟(jì)抽樣調(diào)查一般都應(yīng)該是連續(xù)性的定期調(diào)查。

一次性抽樣調(diào)查與截面數(shù)據(jù)

連續(xù)性抽樣調(diào)查與時間序列數(shù)據(jù)及面板數(shù)據(jù)隨著社會經(jīng)濟(jì)現(xiàn)象的不斷變化和發(fā)展，很

抽樣調(diào)查除了對總體的一次性抽樣以外，很多重要的調(diào)查是隔一段時間重復(fù)進(jìn)行的,對于這種經(jīng)常性的抽樣問題，就必須重視其樣本輪換問題的研究。對于樣本輪換問題，我們至少應(yīng)考慮以下問題：每次調(diào)查的樣本如何組成？是采用固定樣本還是采用全新的樣本，或者是部分保留部分替換，即樣本輪換；在估計后期的總量或均值時，是否需要利用前期的信息來改進(jìn)現(xiàn)期的估計，以及如何利用；如果采用樣本輪換的方法，如何確定最優(yōu)的保留比例或替換比例。第一節(jié)

樣本輪換

抽樣調(diào)查除了對總體的一次性抽樣以外，很多重要的調(diào)查是連續(xù)性抽樣設(shè)計方法按抽取樣本的不同劃分輪換樣本重復(fù)樣本固定樣本單水平輪換不完全的單水平輪換多水平輪換連續(xù)性抽樣設(shè)計方法按抽取樣本的不同劃分輪換樣本重復(fù)樣本固定樣

輪換模式應(yīng)用舉例加拿大勞動力調(diào)查（LFS）使用6~0單水平輪換模式美國現(xiàn)時人口調(diào)查（CPS）使用4~8~4不完全單水平輪換模式美國消費(fèi)者支出的季度調(diào)查（CEQ）便采用4~0三水平輪換模式中國城市住戶抽樣調(diào)查中國規(guī)模以下工業(yè)企業(yè)抽樣調(diào)查中國農(nóng)產(chǎn)量抽樣調(diào)查輪換模式應(yīng)用舉例加拿大勞動力調(diào)查（LFS）使用6~0單一、樣本輪換的原因如果是單純地估計現(xiàn)值的情況，當(dāng)然最好每次重新抽取新樣本，這樣必然會增加費(fèi)用；如果要逐期地與上期比較，則采用固定樣本的方法為好，固定樣本可以消除樣本的因素而只觀察動態(tài)的變化。然而，樣本長期不變，隨著時間的推移，固定樣本會顯露它的弊端，既難以反映總體的變化，而且受訪者也會產(chǎn)生厭煩心理，出現(xiàn)不合作或回答質(zhì)量下降等問題，從而影響調(diào)查質(zhì)量。另外，無論是采用固定樣本還是全新樣本都難以正確地反映總體在各個不同時間上的水平及變化，因此，一種廣泛采用的方法是樣本輪換，即每隔一定時間（一個月、一季或一年）更換一定比例的單元，保留其余單元。第一節(jié)

樣本輪換

一、樣本輪換的原因第一節(jié)樣本輪換

與傳統(tǒng)的一次性抽樣調(diào)查相比，輪換的抽樣調(diào)查具有以下特有的優(yōu)勢：

節(jié)省調(diào)查費(fèi)用和調(diào)查資源

在一定程度上減輕被調(diào)查者回答負(fù)擔(dān)

利用前后各期之間的相關(guān)關(guān)系提高估計精度與傳統(tǒng)的一次性抽樣調(diào)查相比，輪換的抽樣我國1996年新修訂的《統(tǒng)計法》第十條明確規(guī)定：“統(tǒng)計調(diào)查應(yīng)當(dāng)以周期性普查為基礎(chǔ)，以經(jīng)常性抽樣調(diào)查為主體，以必要的統(tǒng)計報表、重點調(diào)查、綜合分析等為補(bǔ)充，搜集、整理基本統(tǒng)計資料?！币虼?，在今后我國政府統(tǒng)計部門開展的統(tǒng)計調(diào)查制度與方法改革的過程中，最重要的就是圍繞如何更好地發(fā)揮經(jīng)常性抽樣調(diào)查的主體作用，研究并應(yīng)用更加符合我國國情的經(jīng)常性抽樣調(diào)查方法，以此得出更加準(zhǔn)確的統(tǒng)計數(shù)據(jù)，為我國政府部門、研究機(jī)構(gòu)以及各類企事業(yè)單位等社會各界服務(wù)。

我國抽樣調(diào)查制度與方法改革的方向我國1996年新修訂的《統(tǒng)計法》第十條明確規(guī)定：“統(tǒng)計調(diào)查應(yīng)二、樣本輪換的最優(yōu)比例第一個時期采用有放回簡單隨機(jī)抽樣方式抽出樣本量為n的樣本；在第二個時期采用有放回簡單隨機(jī)抽樣方式選出樣本量為nq的舊有樣本點以便替換掉，即保留的樣本量為np，保留樣本的比例為p，同時獨立地依有放回簡單隨機(jī)樣本方式補(bǔ)充新的nq個新樣本點，這里p+q=1，這樣第二個時期的樣本量仍舊為n。設(shè)：第一節(jié)

樣本輪換

二、樣本輪換的最優(yōu)比例第一節(jié)樣本輪換

為第一個時期與第二個時期相同的np個單元在第一個時期的均值。為第一個時期nq個單元在第一個時期的均值。為np個單元在第二個時期的樣本均值。為nq個補(bǔ)充單元在第二個時期的樣本均值。ρ為和之間的相關(guān)系數(shù)。如果希望估計第二個時期的樣本均值并充分利用第一個時期的信息，令該估計量為，那么它應(yīng)該是充分利用前后期中保留樣本、不保留樣本和后期新補(bǔ)充樣本的加權(quán)平均數(shù)。

第一節(jié)

樣本輪換

為第一個時期與第二個時期相同的np個單元在第一

設(shè)我們希望得到的估計量是兩期估計量的線性函數(shù)，即

=a+b+c+d

（7.1）要求估計其參數(shù)a，b，c，d。因為E（）=E（）=，E（）=E（）=，所以E（）=（a+b）+（c+d）。要使成為的無偏估計量，需a+b=0，c+d=1，也即b=-a，d=1-c。代入（7.1），有

=a（-）+c+（1-c）

第一節(jié)

樣本輪換

設(shè)我們希望得到的估計量是兩期估計量的線性函第一節(jié)

樣本輪換

該估計量的方差可以求得為：

其中是第一個時期的方差，是第二個時期的方差。我們要求出a和c，使得達(dá)到最小，就要以上公式分別對a和c求偏微分并使之等于0，即可求出a和c的最優(yōu)值分別為：第一節(jié)樣本輪換該估計量的方差可以求得為：其第一節(jié)

樣本輪換

該估計量的方差可以求得為：第一節(jié)樣本輪換該估計量的方差可以求得為：第一節(jié)

樣本輪換

將其代入公式（7.1），就得到該估計量的方差為：第一節(jié)樣本輪換將其代入公式（7.1），就得到該估計第一節(jié)

樣本輪換

如果不利用前期信息，只根據(jù)第二期的結(jié)果來估計均值，那么：其方差為：第一節(jié)樣本輪換如果不利用前期信息，只根據(jù)第二期的結(jié)果第一節(jié)

樣本輪換

故利用前期信息后的設(shè)計效果為：

從上式可以看出，當(dāng)ρ的值比較大時，利用上期信息可以較大地提高的效率。表7.1給出了不同的q，ρ值時的值。第一節(jié)樣本輪換故利用前期信息后的設(shè)計效果為：第一節(jié)

樣本輪換

表7.1不同的q，ρ值時的值第一節(jié)樣本輪換表7.1不同的q，ρ

若對上式關(guān)于q求偏導(dǎo)，并使之等于0，那么便可得到最優(yōu)輪換比：若對上式關(guān)于q求偏導(dǎo)，并使之等于0，那么便可得到最優(yōu)第一節(jié)

樣本輪換

三、樣本輪換方法（一）

隨機(jī)輪換法

在進(jìn)行輪換時按確定的輪換單位數(shù)目或比例，從原有樣本中隨機(jī)抽出若干單位不再調(diào)查，而從其余未包括在樣本中的總體單位中抽取同樣數(shù)目的單位來代替。第一節(jié)樣本輪換三、樣本輪換方法第一節(jié)

樣本輪換

（二）

等距輪換法

在總體抽樣框中確定出各個等距抽樣的樣本，在各次的調(diào)查中，按相應(yīng)位置的等距樣本單位進(jìn)行輪換。我國農(nóng)村住戶調(diào)查就是采用這種輪換方式。（三）

子樣本輪換法從總體中抽出若干套子樣本，每次調(diào)查一定數(shù)量的子樣本，逐次輪換其中的部分子樣本。

第一節(jié)樣本輪換（二）

等第一節(jié)

樣本輪換

子樣本輪換實際上就是每次采用交叉子樣本，而交叉子樣本不僅能有效地減少和控制估計偏差，而且由于每個交叉子樣本都能代表總體，即使有的子樣本資料搜集不到，我們也可以用其他的子樣本甚至一個子樣本來觀察和推斷總體。此外，用交叉子樣本還可以考察非抽樣誤差發(fā)生的程度。因此，一般來說，子樣本輪換方法是以上三種樣本輪換方法中最好的。第一節(jié)樣本輪換子樣本輪換實際上就是每次采用交第一節(jié)

樣本輪換

五、案例介紹美國人口現(xiàn)狀調(diào)查（currentpopulationsurvey，CPS）是國際上最著名的抽樣調(diào)查項目之一，已經(jīng)成為美國以及許多國家進(jìn)行居民調(diào)查的參考模型，其實施是在每個月包含19號的那一周進(jìn)行，調(diào)查的問題涉及受訪者此前一周內(nèi)的活動。調(diào)查氛圍覆蓋全美50個州和哥倫比亞地區(qū)。CPS采用的就是樣本輪換的方法，即每位受訪者連續(xù)4個月接受訪問，然后退出樣本，8個月后再進(jìn)入樣本，連續(xù)4個月接受訪問，最后永久地退出樣本。第一節(jié)樣本輪換五、案例介紹第一節(jié)

樣本輪換

CPS在1995年7月的抽樣設(shè)計方案中樣本輪換的特征：

1．在任意一個月內(nèi)，都有1/8的住戶單元第一次接受調(diào)查，1/8的住戶單元第二次接受調(diào)查，依次類推。

2．每個月都由新的樣本組代替從樣本中永久退出的老樣本組。

3．每個月都有一個樣本組在閑置8個月后重新接受調(diào)查，以此代替剛剛進(jìn)入閑置期的樣本組。

4．通過輪換設(shè)計，保證每個樣本單元在2個年份的4個相同月份里接受調(diào)查。

5.在連續(xù)的2個月內(nèi)，有3/4的樣本點是相同的；在連續(xù)的2年內(nèi)，有1/2的樣本點是相同的。

第一節(jié)樣本輪換CPS在1995年7月的抽樣設(shè)計方案

二維平衡單水平輪換模式的輪換過程

第二節(jié)

雙重抽樣

我們可以先從總體中抽取一個大的初始樣本，從而獲得總體的輔助信息，然后再從初始樣本或從總體中再抽一個子樣本，這種方法就是雙重抽樣。

第二節(jié)雙重抽樣我們可以先從總體中抽取一個大的第二節(jié)

雙重抽樣

一、定義雙重抽樣（doublesampling），也稱二相抽樣或二重抽樣(two-phasesampling)，是指在抽樣時分兩步抽取樣本。一般情況下，先從總體N中抽取一個較大的樣本，稱為第一重(相)樣本(thefirstphasesample)，對之進(jìn)行調(diào)查以獲取總體的某些輔助信息，為下一步的抽樣估計提供條件；然后進(jìn)行第二重抽樣(thesecondphasesampling)。第二重抽樣所抽的樣本n相對較小，但是第二重抽樣調(diào)查才是主調(diào)查。第二節(jié)雙重抽樣一、定義第二節(jié)

雙重抽樣

二、雙重抽樣與兩階段抽樣的區(qū)別（一）兩階段抽樣（two-stagesampling）是先從總體N個單元(初級單元)中抽出n個樣本單元，卻并不對這n個樣本單元中的所有小單元(二級單元)都進(jìn)行調(diào)查，而是在其中再抽出若干個二級單元進(jìn)行調(diào)查；雙重抽樣則不同，要對第一重(相)樣本進(jìn)行調(diào)查以獲取總體的某些輔助信息，并且要利用這些輔助信息進(jìn)行排序、分層、抽樣或估計等。第二節(jié)雙重抽樣二、雙重抽樣與兩階段抽樣的區(qū)別第二節(jié)

雙重抽樣

（二）兩階段抽樣的第二階段抽樣單元和第一階段抽樣單元往往是不同的；雙重抽樣要有一份最終單元的完整名冊(總體所有單元的抽樣框)，而兩階段抽樣只是需要第一階段單元(初級單元)名冊，然后在中選的初級單元中構(gòu)造第二階段抽樣的抽樣框。第二節(jié)雙重抽樣（二）兩階段抽樣的第二階段抽樣單元和第二節(jié)

雙重抽樣

三、雙重抽樣的作用（一）有助于篩選主調(diào)查對象，如對高血壓病人的調(diào)查、銀行對儲戶存款的調(diào)查等；（二）提高抽樣效率，因為第二重抽樣可利用第一重樣本的信息進(jìn)行分層和比率估計；（四）可用于研究樣本輪換中的某些問題；（五）降低無回答偏差，對無回答層進(jìn)行第二重抽樣并對其推斷。第二節(jié)雙重抽樣三、雙重抽樣的作用第二節(jié)

雙重抽樣

四、雙重抽樣的應(yīng)用

（一）為分層的雙重抽樣分層抽樣如果事先無法知道總體的層權(quán)，可以采用雙重抽樣。具體實施過程如下：第一步：利用簡單隨機(jī)抽樣，從總體的N個單元中隨機(jī)抽取第一重樣本，樣本單元數(shù)為；根據(jù)已知的分層標(biāo)志將第一重樣本分層，令，則是總體層權(quán)的無偏估計。第二節(jié)雙重抽樣四、雙重抽樣的應(yīng)用第二節(jié)

雙重抽樣

第二步：利用分層隨機(jī)抽樣，從第一重樣本中抽取出第二重樣本，樣本單元數(shù)為n，第h層樣本單元數(shù)為，。采用雙重分層抽樣，對總體均值的無偏估計量為：

的方差為：第二節(jié)雙重抽樣第二步：利用分層隨機(jī)抽樣，從第一重樣第二節(jié)

雙重抽樣

上式可簡化為：

的樣本估計量為：第二節(jié)雙重抽樣上式可簡化為：的樣本第二節(jié)

雙重抽樣

第一步：從總體的N個單元中隨機(jī)抽取第一重樣本，樣本單元數(shù)為；對于第一重樣本，僅觀測輔助變量信息，用輔助變量的樣本均值估計總體均值。（二）為比率估計的雙重抽樣在實際工作中，如果輔助變量的信息未知，可以利用雙重抽樣進(jìn)行比率估計。具體實施過程如下：第二節(jié)雙重抽樣第一步：從總體的N個單元中隨機(jī)抽取第第二節(jié)

雙重抽樣

雙重抽樣對總體均值的比率估計：

第二步：從第一重樣本中隨機(jī)抽取出第二重樣本，樣本單元數(shù)為n；對于第二重樣本，觀測目標(biāo)變量與輔助變量，并用獲得的和，計算，構(gòu)造比率估計。雙重抽樣比率估計的方差為：第二節(jié)雙重抽樣雙重抽樣對總體均值的比率估計：第二節(jié)

雙重抽樣

雙重抽樣比率估計方差的樣本估計：

第二節(jié)雙重抽樣雙重抽樣比率估計方差的樣本估計：第二節(jié)

雙重抽樣

（三）為回歸估計的二重抽樣與比率估計相似，在輔助信息未知時可以采用二重抽樣進(jìn)行回歸估計。具體實施過程如下：第一步：從總體的N個單元中隨機(jī)抽取第一重樣本，樣本單元數(shù)為；對于第一重樣本，僅觀測輔助變量信息，用輔助變量的樣本均值估計其總體均值。第二節(jié)雙重抽樣（三）為回歸估計的二重抽樣第二節(jié)

雙重抽樣

第二步：從第一重樣本中隨機(jī)抽取出第二重樣本，樣本單元數(shù)為n；對于第二重樣本，觀測目標(biāo)變量與輔助變量，并計算、和回歸系數(shù)b，構(gòu)造回歸估計。雙重抽樣對總體均值的回歸估計：雙重抽樣回歸估計的方差為：第二節(jié)雙重抽樣第二步：從第一重樣本中隨機(jī)抽取出第第二節(jié)

雙重抽樣

式中：為第一重樣本殘差方差，其均值近似等于總體殘差方差：因此雙重抽樣回歸估計方差的樣本估計：第二節(jié)雙重抽樣式中：為第一重樣本殘差方差，其均值近第二節(jié)

雙重抽樣

（四）二重抽樣在無回答調(diào)整中的應(yīng)用在出現(xiàn)無回答時，可使用二重抽樣對無回答樣本進(jìn)行二次抽樣調(diào)查，并對無回答層進(jìn)行推斷。如果無回答樣本得到了完全回答，則基本上可以消除無回答偏差。具體可見本書10.3節(jié)。第二節(jié)雙重抽樣（四）二重抽樣在無回答調(diào)整中的應(yīng)用第三節(jié)隨機(jī)化裝置一、敏感性問題調(diào)查所謂敏感性問題(sensitivequestion)是指所調(diào)查的內(nèi)容涉及私人機(jī)密，受訪者不愿或不便于向外界透露的問題。對于這類敏感性問題，必須采取經(jīng)過特別設(shè)計的裝置與方法，以消除受訪者的顧慮，能夠如實回答問題，避免調(diào)查出現(xiàn)嚴(yán)重偏誤。這種為敏感性問題調(diào)查特別設(shè)計的技術(shù)，稱隨機(jī)化回答技術(shù)(RandomizedResponseTechnique)。第三節(jié)隨機(jī)化裝置一、敏感性問題調(diào)查第三節(jié)隨機(jī)化裝置

敏感性問題按總體的特征可分為屬性特征和數(shù)量特征問題兩類。屬性特征的敏感性問題是指受訪者是否具有敏感性問題的特征，一般是估計具有敏感性特征的單位在總體中所占的比例，因此又可稱作敏感性比例問題。數(shù)量特征的敏感性問題是指受訪者具有敏感性問題數(shù)額的多少的特征，一般是估計敏感性數(shù)額的均值或總和，也可稱作敏感性均值問題。第三節(jié)隨機(jī)化裝置敏感性問題按總體的特征可分為二、沃納隨機(jī)化回答模型使用隨機(jī)化回答技術(shù)的第一個模型是由沃納(S.L.Warner)首先提出的。例如，某大學(xué)欲調(diào)查學(xué)生考試的作弊問題，隨機(jī)抽取n個學(xué)生進(jìn)行調(diào)查，對每位學(xué)生顯示兩個相反的問題，問題可以寫在外形完全相同的m張卡片上，其中m1個卡片寫上“我曾在考試中作過弊”，另外m-m1個卡片寫上“我不曾在考試中作過弊”。然后把這m個卡片折疊好，放在一個盒子里。其中：

A問題：我曾在考試中作過弊。

B問題：我不曾在考試中作過弊。第三節(jié)隨機(jī)化裝置二、沃納隨機(jī)化回答模型第三節(jié)隨機(jī)化裝置

調(diào)查時將m種外形完全一致的卡片像洗牌一樣充分混合后，由受訪者依簡單隨機(jī)抽樣中的抽簽方式隨機(jī)抽取一張卡片，對照自己的情況回答“是”或“否”，然后放回盒子中。設(shè)卡片A的比例是P，則卡片B的比例就是1-P。由古典概率可知，在大規(guī)模的調(diào)查中，抽中卡片的概率為P（A）=P，抽中卡片的概率為P（B）=1-P。若樣本量為n，回答“是”的人數(shù)為m，則(是)的估計值為m/n。我們知道，回答“是”的人有兩種情況：一種是抽中了卡片A,而這些人作過弊；另一種是抽中了卡片B，而這些人沒有作過弊。利用全概公式，得：

(是)=P(A)·(是|A)+P(B)·(是|B)第三節(jié)隨機(jī)化裝置調(diào)查時將m種外形完全一致的卡片像洗牌一樣充分混合后，沃納（Warner）隨機(jī)化回答模型被調(diào)查者卡片B卡片A是是不是不是P1-P沃納（Warner）隨機(jī)化回答模型被調(diào)查者卡片B卡片A是是不

不管是抽到卡片A還是抽到卡片B，作過弊的概率是相等的，假設(shè)這一比例為，即(是|A)=,則抽到卡片B，回答“是”的概率為1-，即P(是|B)=1-。代入上述公式，得的一個估計滿足：第三節(jié)隨機(jī)化裝置因此當(dāng)時，有：其方差為：不管是抽到卡片A還是抽到卡片B，作過弊的概率是相等的

的一個無偏估計為：第三節(jié)隨機(jī)化裝置當(dāng)n很大時，的一個無偏估計為：第三節(jié)隨機(jī)化裝置當(dāng)n很大三、西蒙斯(Simmons)隨機(jī)化回答模型西蒙斯在沃納模型基礎(chǔ)上作了改進(jìn)，他將其中一張卡片上的問題改為與所調(diào)查的敏感性問題完全無關(guān)的另一個非敏感性問題。因此西蒙斯模型也稱為無關(guān)問題的隨機(jī)化回答模型。

仍假設(shè)敏感性問題的卡片比例為P，無關(guān)問題的卡片比例為1-P。對于敏感性問題回答“是”的比例為，是我們所要調(diào)查的比例，對無關(guān)問題回答“是”的比例要求是已知的，則根據(jù)全概率公式，得：

(是)=P+(1-P)第三節(jié)隨機(jī)化裝置三、西蒙斯(Simmons)隨機(jī)化回答模型第三節(jié)隨機(jī)化西蒙斯模型改進(jìn)的方式是引入一個無關(guān)的問題?？ㄆ珹：“我有漏稅行為”卡片B：“我是上半年出生的”被調(diào)查者卡片B卡片A是是不是不是P1-P西蒙斯模型改進(jìn)的方式是引入一個無關(guān)的問題。被調(diào)查者卡片B

當(dāng)樣本量為n，回答“是”的人數(shù)為m，則(是)的估計值為m/n，因此的估計值滿足：第三節(jié)隨機(jī)化裝置解此方程得：它的方差為（若忽略fpc）：V（）的一個無偏估計為：當(dāng)樣本量為n，回答“是”的人數(shù)為m，則(是)的估計值【例10.1】某大學(xué)對本校大學(xué)生考風(fēng)情況進(jìn)行調(diào)查。利用西蒙斯模型，對每個受訪者準(zhǔn)備了一套同樣的(40張)卡片，卡片A和卡片B各20張，比例各占1/2?？ㄆ螦的問題是：最近學(xué)期期末考試你有過作弊行為嗎？卡片上B的問題是：你的陽歷生日日期為奇數(shù)嗎?

假如對依簡單隨機(jī)抽樣方式抽出的400個人進(jìn)行調(diào)查，在n=400人中總共有m=115人的答案為“是”，試估計該校大學(xué)生考試作弊的比例并給出90%的置信區(qū)間。第三節(jié)隨機(jī)化裝置【例10.1】某大學(xué)對本校大學(xué)生考風(fēng)情況進(jìn)行調(diào)查。利用

解：n=800，m=135，P=0.5，為生日日期為奇數(shù)的人數(shù)比例。在大規(guī)模調(diào)查的情況下，可以看作生日為奇數(shù)和偶數(shù)的各占一半，因此=0.5。根據(jù)公式得：第三節(jié)隨機(jī)化裝置

故的90%置信區(qū)間約為：（0.075±1.64×0.0453），即：=0.002054

解：n=800，m=135，P=0.5，為生日日期四、隨機(jī)截尾模型現(xiàn)實中我們也經(jīng)常需要調(diào)查定量的敏感性問題，例如調(diào)查銀行存款數(shù)額，學(xué)生考試作弊的平均次數(shù)，在職人員的工資外收入等。Greenberg等人針對這類問題提出了幾種隨機(jī)化調(diào)查方法，但是，這些方法都要求受訪者根據(jù)自己的實際情況回答敏感性問題或非敏感性問題的具體數(shù)值，給受訪者/受查者造成了一定的困擾。近年來提出了所謂隨機(jī)截尾模型，把對于具體數(shù)值的調(diào)查轉(zhuǎn)化為對于屬性的調(diào)查，避免了直接回答，使得受訪者心理上比較容易接受。第三節(jié)隨機(jī)化裝置四、隨機(jī)截尾模型第三節(jié)隨機(jī)化裝置

設(shè)反映敏感性問題的特征量為X，取值范圍是，密度函數(shù)為，X的數(shù)學(xué)期望為，即我們所要估計的值。又設(shè)Y是一個服從上的均勻分布的隨機(jī)變量。第三節(jié)隨機(jī)化裝置

設(shè)樣本容量為n，得到的調(diào)查數(shù)據(jù)是，i=1，2，…n，即：=

，因此設(shè)反映敏感性問題的特征量為X，取值范圍是，以樣本均值=代替，得到的一個無偏估計為：第三節(jié)隨機(jī)化裝置估計量的方差為：

的一個估計為：以樣本均值=代替，得到五、采用隨機(jī)化回答技術(shù)應(yīng)注意的問題第三節(jié)隨機(jī)化裝置(一)注意在受訪者正式抽取并回答問題前，清楚介紹這種做法的原理，讓受訪者充分理解這種方法的特點，以徹底消除受訪者的顧慮，明白自己究竟回答哪個問題別人是不知道的，使其相信這種設(shè)計是建立在科學(xué)的基礎(chǔ)上，不是哄騙人的。(二)所提問題必須簡單明了，防止因有歧義而出現(xiàn)理解不同。對涉及問題的解釋必須在抽卡片以前進(jìn)行，否則就暴露了抽到的是哪類卡片，也就失去了隨機(jī)化回答的意義。五、采用隨機(jī)化回答技術(shù)應(yīng)注意的問題第三節(jié)隨機(jī)化裝置(一第三節(jié)隨機(jī)化裝置(三)在應(yīng)用西蒙斯模型時，無關(guān)問題的選擇特別重要，一定要隱蔽性強(qiáng)的，使受訪者在回答無關(guān)問題時不會暴露正在回答哪個問題。例如“你是男生嗎?”這類問題就很不妥，因為采用隨機(jī)化回答技術(shù)需要當(dāng)面解釋，受訪者的性別不可能保密，這樣也就失去了無關(guān)問題本來應(yīng)具有的保護(hù)作用。

(四)做好調(diào)查者的培訓(xùn)工作，使他們能夠正確理解隨機(jī)化回答技術(shù)的實質(zhì)并加以運(yùn)用，這樣才能更好地向受訪者解釋清楚，消除受訪者的顧慮，以對調(diào)查的問題給予正確回答。第三節(jié)隨機(jī)化裝置(三)在應(yīng)用西蒙斯模型時，無關(guān)問題

第7章其它抽樣方法第7章其它抽樣方法第一節(jié)樣本輪換

第二節(jié)雙重抽樣

第三節(jié)隨機(jī)化裝置

第一節(jié)樣本輪換

第二節(jié)雙重抽樣

第三節(jié)隨機(jī)化裝置

問題提出

時間序列數(shù)據(jù)是如何產(chǎn)生的？

所產(chǎn)生的時間序列數(shù)據(jù)是否準(zhǔn)確？

如何讓時間序列數(shù)據(jù)更加準(zhǔn)確？問題提出時間序列數(shù)

一次性抽樣調(diào)查與截面數(shù)據(jù)

連續(xù)性抽樣調(diào)查與時間序列數(shù)據(jù)及面板數(shù)據(jù)隨著社會經(jīng)濟(jì)現(xiàn)象的不斷變化和發(fā)展，很

樣本輪換

一、樣本輪換的原因第一節(jié)樣本輪換

與傳統(tǒng)的一次性抽樣調(diào)查相比，輪換的抽樣調(diào)查具有以下特有的優(yōu)勢：

節(jié)省調(diào)查費(fèi)用和調(diào)查資源

在一定程度上減輕被調(diào)查者回答負(fù)擔(dān)

樣本輪換

二、樣本輪換的最優(yōu)比例第一節(jié)樣本輪換

第一節(jié)

樣本輪換

為第一個時期與第二個時期相同的np個單元在第一

設(shè)我們希望得到的估計量是兩期估計量的線性函數(shù)，即

=a+b+c+d

=a（-）+c+（1-c）

第一節(jié)

樣本輪換

設(shè)我們希望得到的估計量是兩期估計量的線性函第一節(jié)

樣本輪換

該估計量的方差可以求得為：

樣本輪換

該估計量的方差可以求得為：第一節(jié)樣本輪換該估計量的方差可以求得為：第一節(jié)

樣本輪換

將其代入公式（7.1），就得到該估計量的方差為：第一節(jié)樣本輪換將其代入公式（7.1），就得到該估計第一節(jié)

樣本輪換

故利用前期信息后的設(shè)計效果為：

樣本輪換

表7.1不同的q，ρ值時的值第一節(jié)樣本輪換表7.1不同的q，ρ

樣本輪換

三、樣本輪換方法（一）

隨機(jī)輪換法

樣本輪換

（二）

等距輪換法

子樣本輪換法從總體中抽出若干套子樣本，每次調(diào)查一定數(shù)量的子樣本，逐次輪換其中的部分子樣本。

第一節(jié)樣本輪換（二）

等第一節(jié)

樣本輪換

CPS在1995年7月的抽樣設(shè)計方案中樣本輪換的特征：

1．在任意一個月內(nèi)，都有1/8的住戶單元第一次接受調(diào)查，1/8的住戶單元第二次接受調(diào)查，依次類推。

2．每個月都由新的樣本組代替從樣本中永久退出的老樣本組。

3．每個月都有一個樣本組在閑置8個月后重新接受調(diào)查，以此代替剛剛進(jìn)入閑置期的樣本組。

4．通過輪換設(shè)計，保證每個樣本單元在2個年份的4個相同月份里接受調(diào)查。

5.在連續(xù)的2個月內(nèi)，有3/4的樣本點是相同的；在連續(xù)的2年內(nèi)，有1/2的樣本點是相同的。

第一節(jié)樣本輪換CPS在1995年7月的抽樣設(shè)計方案

二維平衡單水平輪換模式的輪換過程

第二節(jié)

雙重抽樣

我們可以先從總體中抽取一個大的初始樣本，從而獲得總體的輔助信息，然后再從初始樣本或從總體中再抽一個子樣本，這種方法就是雙重抽樣。

第二節(jié)雙重抽樣我們可以先從總體中抽取一個大的第二節(jié)

雙重抽樣

四、雙重抽樣的應(yīng)用

雙重抽樣

的方差為：第二節(jié)雙重抽樣第二步：利用分層隨機(jī)抽樣，從第一重樣第二節(jié)

雙重抽樣

上式可簡化為：

的樣本估計量為：第二節(jié)雙重抽樣上式可簡化為：的樣本第二節(jié)

雙重抽樣

雙重抽樣對總體均值的比率估計：

雙重抽樣

雙重抽樣比率估計方差的樣本估計：

第二節(jié)雙重抽樣雙重抽樣比率估計方差的樣本估計：第二節(jié)

雙重抽樣

A問題：我曾在考試中作過弊。

B問題：我不曾在考試中作過弊。第三節(jié)隨機(jī)化裝置二、沃納隨機(jī)化回答模型第三節(jié)隨機(jī)化裝置

的一個無偏估計為：第三節(jié)隨機(jī)化裝置當(dāng)n很大時，的一個無偏估計為：

人人文庫> 全部分類> 教育資料 > 輔導(dǎo)培訓(xùn)

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

其它抽樣方法課件

文檔簡介

溫馨提示

最新文檔

評論

其它抽樣方法課件

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔