版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
抽樣框和樣本抽取過程說明一、 抽樣單位本方案采用分層的四階段不等概率抽樣,各階段的抽樣單位為:第一階段:以區(qū)(地級市、省會城市和直轄市的各大城區(qū)和郊區(qū))、縣(包括縣級市)為初級抽樣單位。第二階段:以街道、鄉(xiāng)鎮(zhèn)為二級抽樣單位。第三階段:以居民委員會、村民委員會為三級抽樣單位。第四階段:以家庭住戶并在每戶中確定1人為最終單位。二、 構(gòu)建抽樣框根據(jù)行政區(qū)劃資料,全國(含22個省、4個自治區(qū)、4個直轄市;不含西藏自治區(qū)、港澳臺)共有2801個區(qū)縣單位,這些區(qū)縣單位作為PSU(初級抽樣單元)構(gòu)成調(diào)查總體,具體劃分為5個抽樣框。抽樣框1:三大直轄市市轄區(qū)具體包括北京、天津、上海三個直轄市的共44個市轄區(qū),需要說明的是,這一部分未包括直轄市重慶,原因如下:(1) 從設立直轄市的時間來看,1997年全國行政區(qū)劃正式設立重慶直轄市,而1949年建國之初即存在京津滬三大直轄市的行政區(qū)劃。(2) 從各省、直轄市人類發(fā)展指數(shù)(HDI)的排名來看,重慶與京津滬三大直轄市相比差距較大(見表一);(3) 從所處經(jīng)濟地理區(qū)域上來看,重慶位于內(nèi)陸地區(qū),而京津滬三大直轄市均位于沿海發(fā)達地區(qū);(4) 從經(jīng)濟發(fā)展水平來看,重慶的人均GDP與京津滬三大直轄市相比差距較大(見表一);⑸從城鄉(xiāng)人口對比來看,重慶的農(nóng)業(yè)人口與非農(nóng)業(yè)人口的比例與京津滬三大直轄市相比差距較大(見表一);表一重慶與京津滬三大直轄市部分指標對比指標北京天津上海重慶人類發(fā)展指數(shù)排名23122人均GDP(萬元)2.261.793.480.52非農(nóng)業(yè)人口百分比60%56%67%23%總之,從人文、經(jīng)濟、城鄉(xiāng)人口對比、地理、歷史等多方面相比較,重慶與京津滬三大直轄市的同質(zhì)性并不明顯;若簡單地按行政區(qū)劃的標準將重慶劃分至直轄市這一抽樣框,將對結(jié)果產(chǎn)生一定的影響。抽樣框2:省會城市市轄區(qū)具體包括全國26個省會城市和重慶市的共175個市轄區(qū)。依照各城市的經(jīng)濟地理區(qū)域分為三層。東部:沈陽市、濟南市、杭州市、南京市、福州市、廣州市中部:哈爾濱市、長春市、石家莊市、鄭州市、太原市、合肥市、南昌市、武漢市、長沙市、??谑?、南寧市西部:呼和浩特市、烏魯木齊市、銀川市、蘭州市、西寧市、昆明市、貴陽市、西安市、成都市、重慶市抽樣框3:東部地區(qū)區(qū)縣具體包括京津滬三大直轄市和東部6省的所有區(qū)縣,除去直轄市和6個省會城市市轄區(qū)部分;共611個區(qū)縣。即:北京(除市轄區(qū))、天津(除市轄區(qū))、上海(除市轄區(qū))、遼寧?。ǔ蜿柺惺休爡^(qū))、山東?。ǔ凉鲜惺休爡^(qū))、浙江?。ǔ贾菔惺休爡^(qū))、江蘇?。ǔ暇┦惺休爡^(qū))、福建?。ǔV菔惺休爡^(qū))、廣東?。ǔ龔V州市市轄區(qū))。抽樣框4:中部地區(qū)區(qū)縣具體包括中部11省和自治區(qū)的所有區(qū)縣,除去11個省會城市市轄區(qū)部分;共1136個區(qū)縣。即:黑龍江(除哈爾濱市市轄區(qū))、吉林?。ǔL春市市轄區(qū))、河北?。ǔ仪f市市轄區(qū))、河南?。ǔ嵵菔惺休爡^(qū))、山西?。ǔ惺休爡^(qū))、安徽?。ǔ戏适惺休爡^(qū))、江西?。ǔ喜惺休爡^(qū))、湖北?。ǔ錆h市市轄區(qū))、湖南?。ǔL沙市市轄區(qū))、海南省(除??谑惺休爡^(qū))、廣西壯族自治區(qū)(除南寧市市轄區(qū))抽樣框5:西部地區(qū)區(qū)縣具體包括西部10省和自治區(qū)的所有區(qū)縣,除去10個省會城市市轄區(qū)部分;共835個區(qū)縣。即:內(nèi)蒙古自治區(qū)(除呼和浩特市市轄區(qū))、新疆維吾爾自治區(qū)(除烏魯木齊市市轄區(qū))、寧夏回族自治區(qū)(除銀川市市轄區(qū))、甘肅省(除蘭州市市轄區(qū))、青海省(除西寧市市轄區(qū))、云南?。ǔッ魇惺休爡^(qū))、貴州?。ǔF陽市市轄區(qū))、陜西?。ǔ靼彩惺休爡^(qū))、四川?。ǔ啥际惺休爡^(qū))、重慶(除重慶市市轄區(qū))三、 總樣本量由于調(diào)查的結(jié)果主要是估計各種比例數(shù)據(jù)以及比例數(shù)據(jù)之間的比較,所以在調(diào)查樣本量的確定上是以估計簡單隨機抽樣的總體比例尸時的樣本量為基礎。在95%的置信度下按抽樣絕對誤差不超過3%的要求進行計算,需要抽取樣本量:這里刁為抽樣絕對誤差取0.03,"a在置信度為0.95時為1.96,p(1p)最大取0.25。由于采用多階段的復雜抽樣,設計效應庭參一般會在2和2.5之間,我們把庭參定為2,這樣需要的樣本量就為2000個。綜合考慮精確度、費用以及調(diào)查實施的可行性等因素,以及以往若干全國社會調(diào)查的經(jīng)驗;再加上考慮到在調(diào)查實施中通常會存在一部分戶內(nèi)找不到、或沒有合格調(diào)查對象、以及各種原因造成的無回答等情況,根據(jù)對回答率的估計,以及總體劃分為五個抽樣框,我們把樣本量確定為10000個。這10000個樣本不僅能滿足對總體的估計,而且也能滿足對抽樣框各自總體的估計,所以是比較合適的樣本量。四、 樣本分配總樣本數(shù)10000,采用四階段抽樣方案,在每個抽選出的初級抽樣單元(區(qū)/縣)中抽出4個二級抽樣單元(街道/鄉(xiāng)鎮(zhèn)),在每個抽選出的二級單元中抽出2個三級抽樣單元(村委會/居委會),最后在每個抽選出的三級抽樣單元中抽出10個最終抽樣單元在抽樣框1(三大直轄市市轄區(qū))中共抽出15個PSU,每一個直轄市對應抽出5個PSU;在抽樣框2(省會城市市轄區(qū))中共抽出16個PSU,并以東中西三層的省會城市市轄區(qū)人口按比例分配,其中東部省會城市抽出5個PSU,中部省會城市抽出6個PSU,西部省會城市抽出5個PSU;在抽樣框3(東部地區(qū)區(qū)縣)、抽樣框4(中部地區(qū)區(qū)縣)和抽樣框5(西部地區(qū)區(qū)縣)中共抽出94個PSU,并以東部、中部、西部各部分的總?cè)丝谔蕹渲邪ǖ闹陛犑泻褪鞘械氖休爡^(qū)人口后的剩余人口按比例分配,其中抽樣框3中抽出30個PSU,抽樣框4中抽出42個PSU,抽樣框5中抽出22個PSU。對應于四階段抽樣方案,樣本在各抽樣框中的具體分配數(shù)目如下表所示:表二樣本在各抽樣框中的分配二、抽樣步驟1、初級抽樣單元(區(qū)縣)的選?。孩懦闃涌?中PSU的抽取每個直轄市以簡單隨機抽樣的方式抽出5個PSU,共計15個。⑵抽樣框2中PSU的抽取將抽樣框2(省會城市市轄區(qū))分為東部、中部、西部三層,對照表二中各層的樣本分配數(shù),分別將各層內(nèi)的省會城市市轄區(qū)按照所屬省會城市的教育水平(即中學以上的人口數(shù)百分比)排序,并以各市轄區(qū)人口數(shù)作為輔助信息,采用PPS(不等概率抽樣)系統(tǒng)抽樣,抽出16個PSU。(3)抽樣框3、4、5中PSU的抽取考慮本次調(diào)查的具體內(nèi)容,在10000個樣本中,欲實現(xiàn)城市樣本數(shù)與農(nóng)村樣本數(shù)的對比約為6000:4000。在抽樣框1和抽樣框2中,每個PSU都抽出4個街道作為二級抽樣單元,對應的最終抽樣單元均為城市樣本;為實現(xiàn)城鄉(xiāng)樣本比例的平衡,在抽樣框5、4、5中,每個PSU對應下表(表三)確定4個二級抽樣單元在街道和鄉(xiāng)鎮(zhèn)中的分配。表三抽樣框3、4、5中二級單位分配標準二級抽樣單位層別非農(nóng)人口百分比街道鄉(xiāng)鎮(zhèn)43.37%及以上40[22.53%,43.37%)31[14.75%,22.53%)22[11.34%,14.75%)1311.34%以下04在抽樣框3(東部地區(qū)區(qū)縣)中,將各區(qū)縣按表三所述標準分為5層;考慮到本次調(diào)查的具體內(nèi)容,在每一層中各區(qū)縣按教育水平(即各區(qū)縣中,教育程度為中學以上的人口數(shù)百分比)排序,并以各區(qū)縣人口數(shù)作為輔助信息,采用PPS系統(tǒng)抽樣,抽出30個PSU。抽樣框4和抽樣框5中的PSU抽取過程與之相同。這種方式的目的在于,保證在抽選出的PSU中農(nóng)業(yè)人口與非農(nóng)業(yè)人口比例的分布、以及各PSU教育水平的分布與總體分布大體相符。具體控制目標是在抽樣框3、4、5中的376個二級抽樣單元中,街道與鄉(xiāng)鎮(zhèn)的比例大致為176:200,從而實現(xiàn)抽樣框3、4、5中抽取的最終單元中城鎮(zhèn)樣本與農(nóng)村樣本的比例大致為3520:4000(即[176X2X10]:[200X2X10])。2112、 二級抽樣單元(街道或鄉(xiāng)鎮(zhèn))的選?。焊鶕?jù)表三,我們可以計算出各初級抽樣單元中二級抽樣單元(街道或者鄉(xiāng)鎮(zhèn))的分配表基于該分配表,根據(jù)2000年人口普查分區(qū)縣、街道/鄉(xiāng)鎮(zhèn)、居委會和村委會的人口數(shù),我們按照如下步驟選取二級抽樣單元:a城鎮(zhèn)樣本街道級單位的抽?。?) 在選取的每一個區(qū)縣級單位內(nèi),計算所有街道級單位居委會20—69歲人口總數(shù),同時給每一含有居委會人口的街道級單位一個隨機數(shù)字;(2) 將各街道級單位按照所給出的隨機數(shù)字從最低到最高排序;(3) 按照PPS法選取K個街道(K表四中該初級抽樣單元所要求的二級抽樣單元(街道)數(shù)目,如果某些街道居委會人口過大,該街道可能被抽中2次或者以上),具體為:1) 列出該區(qū)縣中含有居委會人口的街面鄉(xiāng)鎮(zhèn)名稱,以及20—69歲居委會人口數(shù);2) 累加各街道/鄉(xiāng)鎮(zhèn)的居委會人口數(shù)生成一列數(shù)組,累加到該區(qū)縣內(nèi)的總居委會人口。例如,假設該區(qū)縣有10個街道/鄉(xiāng)鎮(zhèn)單位,各居委會人口數(shù)分別為50,150,90,70,180,110,40,60,120,和130,總?cè)丝跒?000。我們將人口數(shù)列表如下:街道1:1—50街道2:51—200街道3:201—290街道4:291—360街道5:361—540街道6:541—650街道7:651-690街道8:691-750街道9:751-870街道10:871-10003)假設表四中該初級抽樣單元所要求的二級抽樣單元數(shù)目為2個街道,二級抽樣單元的抽樣方法為:(1)在1和N/2之間選取一個隨機數(shù)字(在我們的例子中為1000)并且選取包含所選取的隨機數(shù)字的街道,(2)加上N/2選取第2個街道。例如,假設本例子中第一個隨機數(shù)字是222,因為222對應的為街道3,該街道被選取了。然后選取第2個街道,對應222+500=722的那個街道(街道8)。3.b農(nóng)村樣本鄉(xiāng)鎮(zhèn)級單位的抽取1) 在選取的每一個區(qū)縣級單位內(nèi),計算所有鄉(xiāng)鎮(zhèn)級單位村委會20-69歲人口總數(shù),同時給每一含有村委會人口的鄉(xiāng)鎮(zhèn)級單位一個隨機數(shù)字;2) 將各鄉(xiāng)鎮(zhèn)級單位按照所給出的隨機數(shù)字從最低到最高排序;3) 按照PPS法選取K個鄉(xiāng)鎮(zhèn)(K為表四中該初級抽樣單元所要求的二級抽樣單元(鄉(xiāng)212鎮(zhèn))數(shù)目,如果某些鄉(xiāng)鎮(zhèn)村委會人口過大,該鄉(xiāng)鎮(zhèn)可能被抽中2次或者以上),具體為:1) 列出該區(qū)縣中含有村委會人口的街面鄉(xiāng)鎮(zhèn)名稱,以及20-69歲村委會人口數(shù);2) 累加各街道/鄉(xiāng)鎮(zhèn)的村委會人口數(shù)生成一列數(shù)組,累加到該區(qū)縣內(nèi)的總村委會人口。例如,假設該區(qū)縣有10個街道/鄉(xiāng)鎮(zhèn)單位含有村委會人口,各村委會人口數(shù)分別為50,150,90,70,180,110,40,60,120,和130,總?cè)丝跒?000。我們將人口數(shù)列表如下:鄉(xiāng)鎮(zhèn)1:1-50鄉(xiāng)鎮(zhèn)2:51-200鄉(xiāng)鎮(zhèn)3:201-290鄉(xiāng)鎮(zhèn)4:291-360鄉(xiāng)鎮(zhèn)5:361-540鄉(xiāng)鎮(zhèn)6:541-650鄉(xiāng)鎮(zhèn)7:651-690鄉(xiāng)鎮(zhèn)8:691-750鄉(xiāng)鎮(zhèn)9:751-870鄉(xiāng)鎮(zhèn)10:871-10003)假設表四中該初級抽樣單元所要求的二級抽樣單元數(shù)目為2個鄉(xiāng)鎮(zhèn),二級抽樣單元的抽樣方法為:(1)在1和N/2之間選取一個隨機數(shù)字(在我們的例子中為1000)并且選取包含所選取的隨機數(shù)字的鄉(xiāng)鎮(zhèn),(2)加上N/2選取第2個鄉(xiāng)鎮(zhèn)。例如,假設本例子中第一個隨機數(shù)字是222,因為222對應的為鄉(xiāng)鎮(zhèn)3,該鄉(xiāng)鎮(zhèn)被選取了。然后選取第2個鄉(xiāng)鎮(zhèn),對應222+500=722的那個鄉(xiāng)鎮(zhèn)(鄉(xiāng)鎮(zhèn)8)。(2) 三級抽樣單元(居委會或村委會)的選?。涸诿恳贿x取的街道或者鄉(xiāng)鎮(zhèn)中,通過PPS隨機選取2個三級單元(居委會或村委會)。這一步可以采取與街道/鄉(xiāng)鎮(zhèn)抽樣同樣的步驟。也就是,根據(jù)2000年人口普查分區(qū)縣、街道/鄉(xiāng)鎮(zhèn)、居委會和村委會的人口數(shù),我們按步驟選取三級抽樣單元。以居委會的抽樣為例,在每一選取的街道,列出每一居委會20-69歲人口數(shù),同時給每一居委會一個隨機數(shù),各居委會按照所給出的隨機數(shù)字從最低到最高排序,計算該街道所有居委會人口的累積分布,假設N為該街道累積居委會人口數(shù):(1)在1和N/2之間選取一個隨機數(shù)字并且選取包含所選取的隨機數(shù)字的居委會,(2)加上N/2選取第2個居委會。(3) 最終抽樣單元的選?。ㄔ诰游瘯?nèi)抽取居民戶和在戶內(nèi)抽取受訪者):在抽中的居/村委會中按照第五次人口普查摸查底冊進行等距系統(tǒng)抽樣,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度店長聘用合同特殊條款適用性分析
- 二零二五年度牛羊草料進口代理服務合同樣本2篇
- 二零二五年度出國留學學費支付及管理合同4篇
- 二零二五年度城市綠化打井工程監(jiān)理合同8篇
- 2025年度個人小型挖機租賃服務規(guī)范合同4篇
- 二零二五版嬰幼兒奶粉品牌授權及產(chǎn)品供應鏈管理合同4篇
- 2025年度個人二手車轉(zhuǎn)讓及二手車增值服務合同
- 二零二五年度木工材料供應鏈管理合同4篇
- 2025年度個人工程車租賃及道路救援服務合同2篇
- 2025年度個人車輛購置貸款延期還款合同4篇
- 回收二手機免責協(xié)議書模板
- (正式版)JC∕T 60023-2024 石膏條板應用技術規(guī)程
- 人教版高中生物學新舊教材知識差異盤點
- (權變)領導行為理論
- 2024屆上海市浦東新區(qū)高三二模英語卷
- 2024年智慧工地相關知識考試試題及答案
- YY/T 0681.2-2010無菌醫(yī)療器械包裝試驗方法第2部分:軟性屏障材料的密封強度
- GB/T 8005.2-2011鋁及鋁合金術語第2部分:化學分析
- 不動產(chǎn)登記實務培訓教程課件
- 不銹鋼制作合同范本(3篇)
- 2023年系統(tǒng)性硬化病診斷及診療指南
評論
0/150
提交評論