常用的抽樣方法_第1頁(yè)
常用的抽樣方法_第2頁(yè)
常用的抽樣方法_第3頁(yè)
常用的抽樣方法_第4頁(yè)
常用的抽樣方法_第5頁(yè)
已閱讀5頁(yè),還剩44頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、關(guān)于常用的抽樣方法第1頁(yè),共49頁(yè),2022年,5月20日,0點(diǎn)5分,星期四一、單純隨機(jī)抽樣(simple random sampling) 1、抽樣方法 根據(jù)研究目的選定總體,首先對(duì)總體中所有的觀察單位編號(hào),遵循隨機(jī)原則,采用不放回抽取方法,從總體中隨機(jī)抽取一定數(shù)量觀察單位組成樣本。 具體方法 隨機(jī)數(shù)字法 抽簽法第2頁(yè),共49頁(yè),2022年,5月20日,0點(diǎn)5分,星期四 2、優(yōu)缺點(diǎn) 對(duì)所有觀察單位編號(hào),當(dāng)數(shù)量大時(shí),有難度 抽樣誤差的計(jì)算較方便第3頁(yè),共49頁(yè),2022年,5月20日,0點(diǎn)5分,星期四 3、抽樣誤差的估計(jì) 有限總體與無(wú)限總體 總體類型 均數(shù)標(biāo)準(zhǔn)誤 率的標(biāo)準(zhǔn)誤 無(wú)限總體 有限總體

2、 第4頁(yè),共49頁(yè),2022年,5月20日,0點(diǎn)5分,星期四 二、系統(tǒng)抽樣(systematic sampling) 又稱等距/機(jī)械抽樣 1、抽樣方法 先將總體的觀察單位按某順序號(hào)等分成n個(gè)部分再?gòu)牡谝徊糠蛛S機(jī)抽第k號(hào)觀察單位,依次用相等間隔,機(jī)械地從每一部分各抽取一個(gè)觀察單位組成樣本。 第5頁(yè),共49頁(yè),2022年,5月20日,0點(diǎn)5分,星期四 2、優(yōu)缺點(diǎn)(1)抽樣方法簡(jiǎn)便(2)易得到一個(gè)按比例分配的樣本,抽樣誤差較小(3)仍需對(duì)每個(gè)觀察單位編號(hào)(4)當(dāng)觀察單位按順序有周期趨勢(shì)或單調(diào)性趨勢(shì)時(shí),產(chǎn)生明顯偏性第6頁(yè),共49頁(yè),2022年,5月20日,0點(diǎn)5分,星期四 3、抽樣誤差 無(wú)固定的計(jì)算公

3、式,常按單純隨機(jī)抽樣方法來(lái)計(jì)算,與總體的性質(zhì)和被抽樣個(gè)體間的間隔有關(guān)。第7頁(yè),共49頁(yè),2022年,5月20日,0點(diǎn)5分,星期四三、整群抽樣(cluster sampling) 1、抽樣方法 先將總體劃分為若干個(gè)“群”組,每個(gè)群包括若干個(gè)觀察單位,再隨機(jī)抽取n個(gè)群,被抽到的各群的全部觀察單位則組成樣本。第8頁(yè),共49頁(yè),2022年,5月20日,0點(diǎn)5分,星期四 2、優(yōu)缺點(diǎn)(1)在較大規(guī)模的現(xiàn)場(chǎng)調(diào)查中,易組織,較節(jié)省。(2)若各群間的差異較大,該抽樣方法的誤差較大。 3、抽樣誤差第9頁(yè),共49頁(yè),2022年,5月20日,0點(diǎn)5分,星期四四、分層抽樣(stratified sampling) 1、

4、抽樣方法 先將總體按某種特征分成若干層,再?gòu)拿恳粚觾?nèi)隨機(jī)抽取一定數(shù)量的觀察單位,合起來(lái)組成樣本。第10頁(yè),共49頁(yè),2022年,5月20日,0點(diǎn)5分,星期四(1)按比例分配:按總體各層觀察單位數(shù)的多少分配(2)最優(yōu)分配:按各層觀察單位數(shù)多少及其變異大小分配 第11頁(yè),共49頁(yè),2022年,5月20日,0點(diǎn)5分,星期四 2、優(yōu)缺點(diǎn)(1)在一定程度上控制了抽樣誤差,尤其是最優(yōu)分配法(2)應(yīng)盡量使層內(nèi)差別小而層間差別大,以提高效率(3)事先應(yīng)了解各層的總體含量,最優(yōu)分配還應(yīng)了解標(biāo)準(zhǔn)差第12頁(yè),共49頁(yè),2022年,5月20日,0點(diǎn)5分,星期四多階段隨機(jī)抽樣第13頁(yè),共49頁(yè),2022年,5月20日,

5、0點(diǎn)5分,星期四 樣本含量的估計(jì)第14頁(yè),共49頁(yè),2022年,5月20日,0點(diǎn)5分,星期四單純隨機(jī)抽樣一、先決條件 1、容許誤差,預(yù)計(jì)樣本統(tǒng)計(jì)量與相應(yīng)總體參數(shù)的最大相差控制在什么范圍。常取可信區(qū)間長(zhǎng)度一半。 2、所調(diào)查總體標(biāo)準(zhǔn)差,若不了解,須通過(guò)預(yù)試驗(yàn)的標(biāo)準(zhǔn)差S或前人的資料作出估計(jì); 3、第一類錯(cuò)誤的概率 4、對(duì)有限總體抽樣時(shí),還須了解總體觀察單位數(shù)。第15頁(yè),共49頁(yè),2022年,5月20日,0點(diǎn)5分,星期四二、計(jì)算公式第16頁(yè),共49頁(yè),2022年,5月20日,0點(diǎn)5分,星期四隨機(jī)應(yīng)答技術(shù)Randomized Response Techniques (RRT)第17頁(yè),共49頁(yè),2022

6、年,5月20日,0點(diǎn)5分,星期四 敏感問(wèn)題(sensitive problem) 是指涉及個(gè)人(或單位)的隱私或利益的問(wèn)題以及大多數(shù)人認(rèn)為不便在公開(kāi)場(chǎng)合表態(tài)或陳述的問(wèn)題,在某些情況下,還包括一些違法犯罪的行為。 第18頁(yè),共49頁(yè),2022年,5月20日,0點(diǎn)5分,星期四敏感問(wèn)題的特點(diǎn):一般是社會(huì)輿論導(dǎo)向所不認(rèn)同的或反對(duì)的行為或觀點(diǎn)不同特征的人群有不同的敏感問(wèn)題不同敏感問(wèn)題在敏感程度上存在差異敏感問(wèn)題的分類:屬性特征敏感問(wèn)題數(shù)量特征敏感問(wèn)題第19頁(yè),共49頁(yè),2022年,5月20日,0點(diǎn)5分,星期四 對(duì)于敏感性問(wèn)題,若采用直接回答的形式,被調(diào)查者難免產(chǎn)生抵觸情緒,不愿據(jù)實(shí)回答,這樣導(dǎo)致調(diào)查數(shù)據(jù)

7、失真、調(diào)查結(jié)果無(wú)效。 因此尋求解決敏感性問(wèn)題調(diào)查的有效方法至關(guān)重要。 第20頁(yè),共49頁(yè),2022年,5月20日,0點(diǎn)5分,星期四 隨機(jī)化回答是指在調(diào)查中使用特定的隨機(jī)化裝置,使得被調(diào)查者以預(yù)定的概率來(lái)回答敏感性問(wèn)題。這一技術(shù)的宗旨就是最大限度地為被調(diào)查者保守秘密,從而取得被調(diào)查者的信任。 RRT技術(shù)的基本原理在于當(dāng)被調(diào)查者確信調(diào)查者及其他人無(wú)法從被調(diào)查者的回答中獲知他們的真實(shí)行為時(shí),能更加真實(shí)地對(duì)敏感問(wèn)題進(jìn)行回答。并且RRT技術(shù)保護(hù)調(diào)查對(duì)象的個(gè)人隱私,能充分得到調(diào)查對(duì)象的配合,最終可顯著降低無(wú)應(yīng)答率和誤答率,得到高質(zhì)量的調(diào)查結(jié)果。 隨機(jī)應(yīng)答技術(shù)Randomized Response Tech

8、niques (RRT)第21頁(yè),共49頁(yè),2022年,5月20日,0點(diǎn)5分,星期四(一)沃納模型(Warner model) 1965年由Warner提出的,其設(shè)計(jì)思想是向被調(diào)查者顯示兩個(gè)與敏感性問(wèn)題(具有特征A)有關(guān),但完全對(duì)立的問(wèn)題,讓調(diào)查者按預(yù)定的概率從中選一個(gè)回答,調(diào)查者無(wú)權(quán)過(guò)問(wèn)被調(diào)查者回答的是哪一個(gè)問(wèn)題,從而起到了為被調(diào)查者保密的效果。 (二)西蒙斯模型 1967年由西蒙斯提出的,其基本思想仍以沃納模型為基礎(chǔ),但有一些改進(jìn),它將沃納模型中與敏感性問(wèn)題相對(duì)的具有特征A的問(wèn)題改為一個(gè)與敏感性問(wèn)題不相關(guān)的其它問(wèn)題。 (三)“隨機(jī)變量和”回答模型隨機(jī)化應(yīng)答模型第22頁(yè),共49頁(yè),2022年

9、,5月20日,0點(diǎn)5分,星期四一、隨機(jī)應(yīng)答技術(shù)的步驟 設(shè)計(jì)一對(duì)問(wèn)題,使兩個(gè)問(wèn)題的答案種數(shù)和編碼完全一致,應(yīng)答者隨機(jī)選取一個(gè)問(wèn)題,將答案編碼選出,在答案上做出相應(yīng)的記號(hào)。由于答卷上沒(méi)有問(wèn)題的編號(hào),只有一套答案編碼,人們無(wú)從知曉應(yīng)答者回答的是哪一個(gè)問(wèn)題,因而起到保密作用。 1向應(yīng)答者提出一對(duì)問(wèn)題第23頁(yè),共49頁(yè),2022年,5月20日,0點(diǎn)5分,星期四 (1)兩個(gè)相關(guān)聯(lián)問(wèn)題模式: 設(shè)計(jì)兩個(gè)相對(duì)立的陳述。 例如 問(wèn)題1:你曾經(jīng)吸過(guò)毒嗎? 是 否 問(wèn)題2:你從未吸過(guò)毒嗎? 是 否(2)兩個(gè)不相關(guān)聯(lián)問(wèn)題模式: 第一陳述為敏感性問(wèn)題,第二陳述是與第一陳述無(wú)關(guān)的非敏感性問(wèn)題,可以得到確切的答案。 例如 問(wèn)

10、題1:你曾經(jīng)吸過(guò)毒嗎? 是 否 問(wèn)題2:你是工人嗎? 是 否第24頁(yè),共49頁(yè),2022年,5月20日,0點(diǎn)5分,星期四2設(shè)置一個(gè)隨機(jī)裝置進(jìn)行調(diào)查 使用一個(gè)內(nèi)裝許多黑、白兩色小球的匣子,黑白球的比例接近1:1,但不等于1:1,例如可以是60和40。 混合均勻后,被調(diào)查者從匣子中隨機(jī)摸取一球,摸取的是黑球還是白球只有被調(diào)查者知道。若摸取的是黑球,則回答第一個(gè)問(wèn)題,否則,回答第二個(gè)問(wèn)題。 答卷上只有答案選擇,沒(méi)有題號(hào),可按如下格式設(shè)計(jì):“請(qǐng)將你的回答在相應(yīng)的編號(hào)處做上記號(hào):是 否”。第25頁(yè),共49頁(yè),2022年,5月20日,0點(diǎn)5分,星期四3根據(jù)概率理論進(jìn)行計(jì)算(1) 問(wèn)題1:你曾經(jīng)吸過(guò)毒嗎?

11、是 否 問(wèn)題2:你從未吸過(guò)毒嗎? 是 否 假設(shè)黑球所占的比例為P,白球所占的比例為1-P,應(yīng)答者中回答“是”的總比例為r,那么對(duì)第一個(gè)問(wèn)題回答“是”的比例RA可以由下式推算: rPRA+ (1-P)(1-RA) RA= r - (1-P)/(2P-1) (1P0.50)第26頁(yè),共49頁(yè),2022年,5月20日,0點(diǎn)5分,星期四(2) 問(wèn)題1:你曾經(jīng)吸過(guò)毒嗎? 是 否 問(wèn)題2:你是工人嗎? 是 否 假設(shè)回答者中工人占的比例為RU,則r與RA的關(guān)系為: r PRA+(1-P) RU RAr (1-P) RU/ P 第27頁(yè),共49頁(yè),2022年,5月20日,0點(diǎn)5分,星期四例14-1: 欲調(diào)查某

12、地已婚育齡婦女有無(wú)婚前性行為的比例。 (1)先把這項(xiàng)技術(shù)的意義、性質(zhì)和方法,特別是其保密功能,坦誠(chéng)地告訴調(diào)查對(duì)象,以取得理解、信任和合作。 (2)問(wèn)卷中設(shè)A、B兩個(gè)問(wèn)題。 (3)備有一個(gè)口袋,里面裝有黑白兩種顏色的球(也可用圍棋的黑子和白子),兩種球的比例不是1:1,例如可以是60和40。第28頁(yè),共49頁(yè),2022年,5月20日,0點(diǎn)5分,星期四(4)調(diào)查對(duì)象在填寫(xiě)答案前,先隨機(jī)抽取一個(gè)球(球的顏色對(duì)調(diào)查員保密),據(jù)球的顏色決定回答兩個(gè)問(wèn)題中的哪一個(gè)。(5)由于調(diào)查員不知道某一對(duì)象抽取的球是什么顏色的,所以無(wú)法知道某一對(duì)象回答的是問(wèn)題A還是問(wèn)題B,也無(wú)法知道調(diào)查對(duì)象的“秘密”。(6)設(shè)立兩個(gè)

13、問(wèn)題: 問(wèn)題A:婚前有過(guò)性行為?回答: 是 否 問(wèn)題B:婚前沒(méi)有性行為?回答: 是 否 第29頁(yè),共49頁(yè),2022年,5月20日,0點(diǎn)5分,星期四(7)如果調(diào)查對(duì)象抽取的球是黑色的,則回答問(wèn)題A;如果調(diào)查對(duì)象抽取的球是白色的,則回答問(wèn)題B。(8)計(jì)算調(diào)查對(duì)象中婚前有性行為者的比例。第30頁(yè),共49頁(yè),2022年,5月20日,0點(diǎn)5分,星期四若調(diào)查200人,回答“是”的比例為=0.48,第31頁(yè),共49頁(yè),2022年,5月20日,0點(diǎn)5分,星期四第32頁(yè),共49頁(yè),2022年,5月20日,0點(diǎn)5分,星期四二、估計(jì)比例用的3種改進(jìn)模型1、模型I 把問(wèn)題 B改為一個(gè)完全無(wú)關(guān)、答案為“是”的概率是已

14、知值的問(wèn)題將沃納模型中與敏感性問(wèn)題相對(duì)的具有特征A的問(wèn)題改為一個(gè)與敏感性問(wèn)題不相關(guān)的其它問(wèn)題。 BA第33頁(yè),共49頁(yè),2022年,5月20日,0點(diǎn)5分,星期四例14-: 欲調(diào)查某地已婚育齡婦女有無(wú)婚前性行為的比例。問(wèn)題A:婚前有過(guò)性行為?回答: 是 否 問(wèn)題B:你生日(月日)除以余數(shù)是嗎? 回答: 是 否第34頁(yè),共49頁(yè),2022年,5月20日,0點(diǎn)5分,星期四有無(wú)性行為第35頁(yè),共49頁(yè),2022年,5月20日,0點(diǎn)5分,星期四 如果黑球比例為p=60%,同時(shí)回答問(wèn)題A和B均為是的比例=0.24,生日(月日)除以余數(shù)是占0=33.33%,則第36頁(yè),共49頁(yè),2022年,5月20日,0點(diǎn)

15、5分,星期四西蒙斯模型的不足之處(1) 是預(yù)先已知或待估計(jì)的值, 的估計(jì)偏差會(huì)增加估計(jì)方差。(2)要提高估計(jì)精度,應(yīng)增大P值和減小 值。但隨著P值的增大和 的減小,被調(diào)查者的疑慮會(huì)增加。第37頁(yè),共49頁(yè),2022年,5月20日,0點(diǎn)5分,星期四2、模型II 將模型I中設(shè)立無(wú)關(guān)聯(lián)問(wèn)題B的方法改為兩套抽取球的裝置 優(yōu)點(diǎn):對(duì)問(wèn)題B回答“是”的概率不必是已知的。 要求調(diào)查對(duì)象抽取兩次彩球和回答問(wèn)題兩次。 裝置中黑球的比例是P1和P2,有專家建議,兩者都不要取0或0.5,習(xí)慣k常取P2=1P1。 不論對(duì)于第一裝置還是對(duì)于第二裝量,摸到黑球者如實(shí)回答問(wèn)題A,摸到白球者如實(shí)回答問(wèn)題B。 要求調(diào)查對(duì)象在兩次

16、回答問(wèn)題中不能有矛盾。 第38頁(yè),共49頁(yè),2022年,5月20日,0點(diǎn)5分,星期四例14-3 對(duì)于前面所說(shuō)的調(diào)查婚前性行為的研究中,假定共480名調(diào)查對(duì)象。問(wèn)題A:你在婚前有過(guò)性行為嗎? 回答 是 否 。問(wèn)題B:你在這3天內(nèi)是吃過(guò)魚(yú)嗎?回答 是 否 。 第39頁(yè),共49頁(yè),2022年,5月20日,0點(diǎn)5分,星期四第40頁(yè),共49頁(yè),2022年,5月20日,0點(diǎn)5分,星期四第41頁(yè),共49頁(yè),2022年,5月20日,0點(diǎn)5分,星期四課本上有誤第42頁(yè),共49頁(yè),2022年,5月20日,0點(diǎn)5分,星期四第43頁(yè),共49頁(yè),2022年,5月20日,0點(diǎn)5分,星期四兩次試驗(yàn)?zāi)P偷闹饕毕?1)若對(duì)同

17、一批被調(diào)查者試驗(yàn)兩次,他們兩次回答的結(jié)果必具有相關(guān)性,從而破壞了模型的隨機(jī)性。但如果對(duì)兩批被調(diào)查者分別進(jìn)行試驗(yàn),又不容易保證兩次的結(jié)構(gòu)具有相似性,從而產(chǎn)生較大誤差。(2)方差V()是兩次試驗(yàn)產(chǎn)生的方差之和,在相同條件下,它比西蒙斯模型的方差要大得多。(3) P1和P2不能太接近。當(dāng)p1=p2時(shí),模型就沒(méi)有意義了。要減小方差V() ,就應(yīng)該增大P1而減小P2 ,但當(dāng)p1增得過(guò)大時(shí), 又會(huì)減少被調(diào)查者的配合。第44頁(yè),共49頁(yè),2022年,5月20日,0點(diǎn)5分,星期四3模型III 本方法的優(yōu)點(diǎn)是不需要設(shè)立非敏感問(wèn)題。但是球的顏色要有3種(紅、黑、白)。每種球的比例是已知的(P31-P1-P2),要求摸到紅球者如實(shí)回答問(wèn)題,摸到黑球者全部回答“是”,摸到白球者全部回答“否”。 第45頁(yè),共49頁(yè),2022年,5月20日,0點(diǎn)5分,星期四第46頁(yè),共49頁(yè),20

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論