現(xiàn)場調(diào)查中的抽樣方法.ppt_第1頁
現(xiàn)場調(diào)查中的抽樣方法.ppt_第2頁
現(xiàn)場調(diào)查中的抽樣方法.ppt_第3頁
現(xiàn)場調(diào)查中的抽樣方法.ppt_第4頁
現(xiàn)場調(diào)查中的抽樣方法.ppt_第5頁
已閱讀5頁,還剩70頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

現(xiàn)場調(diào)查中的抽樣方法,練習,人群總數(shù)10000(男4000人,女6000) 分層抽樣,男性抽100人,女性抽1000人,共1100人 樣本中共105人抽煙,其中男性55人,女性50人 問:人群總吸煙率是多少?,練習,人群總數(shù)10000(男4000人,女6000),抽取樣本男100人(55人抽煙), 女1000人(50人抽煙)。 問:人群總吸煙率是多少? 直接算法:總吸煙率 = (55+50)/(100+1000) = 9.5% 正確算法:男4000抽100,每人代表40人(W=40) 女6000抽1000,每人代表6人(W=6) 總吸煙率 = (55*40+50*6)/(100*40+1000*6) = 25%,調(diào)查的分類,普查(全面調(diào)查) 典型調(diào)查(案例調(diào)查) 抽樣調(diào)查,普查 Census,人群中每個人都調(diào)查 沒有抽樣誤差 人群很小時可以使用 人群數(shù)很大時耗費人、財、物力,質(zhì)量不易控制,非抽樣誤差大 不適于患病率低和診斷技術比較復雜的疾病 無應答率常常較高,典型調(diào)查(案例調(diào)查),有目的地選定典型的人、單位進行調(diào)查,對事物特征作深入了解。 沒有隨機原則,不能估計總體參數(shù),只能對總體特征作經(jīng)驗推論,不屬于統(tǒng)計推斷的范疇,抽樣調(diào)查,抽樣調(diào)查:從總體中抽取一定數(shù)量的觀察單位組成樣本,根據(jù)樣本信息來了解總體特征。,基本概念,總體:根據(jù)研究目的確定的同質(zhì)觀察單位的全體 樣本:從總體中隨機抽取的部分觀察單位的總和 抽樣的目的:用樣本信息推斷總體特征 抽樣誤差: 由抽樣造成的樣本信息偏離總體參數(shù) 可計算總體參數(shù)的95%可信區(qū)間,95%可信區(qū)間:以樣本信息推論總體時,計算出的可信區(qū)間有95%的概率覆蓋總體參數(shù)。 高血壓患病率為20%(15%-28%) 高血壓患病率為18%(4%-51%),X市居民甲狀腺結節(jié)患病情況調(diào)查:在沿海地區(qū)、山區(qū)、平原地區(qū)各隨機抽取1個村莊,每個村中再隨機抽取100戶家庭,每個家庭的全部成員作為調(diào)查對象。 在某地區(qū)的醫(yī)院進行醫(yī)院感染情況的抽樣調(diào)查,抽中40所醫(yī)院。實施過程中,有些醫(yī)院不配合??筛鶕?jù)醫(yī)院特征(如同級、同類、病床數(shù))替換愿意配合的醫(yī)院。,調(diào)查某地區(qū)腹瀉患病率,采用多階段抽樣方法。第1階段:兼顧地理位置、經(jīng)濟水平、人口數(shù)量、工作基礎和意愿,選擇A縣、B縣,C區(qū)和D縣作為調(diào)查點;第2階段,在某地區(qū)進行某病患病率調(diào)查,將鄉(xiāng)鎮(zhèn)按收入水平分層3層(高中低三層分別有150、120、100個鄉(xiāng)鎮(zhèn)),在每層各抽取10個鄉(xiāng)鎮(zhèn),每個鄉(xiāng)鎮(zhèn)再各隨機抽取2個村莊,抽中村莊內(nèi)居民全部調(diào)查。 抽樣方法設計如何? 每個村莊約60人,共調(diào)查到2400人,其中240人患病,患病率為多少?,兩類抽樣方法,非概率抽樣:無法確定被調(diào)查對象的概率,無法推斷總體,常用于探索性研究 碰巧抽樣或方便抽樣:超市里走出的前10個人 意圖抽樣:調(diào)查者有意的抽取某些對象,認為能代表某類人群。如:選擇一個大城市,一個城鎮(zhèn),一個鄉(xiāng)村地區(qū) 滾雪球抽樣 概率抽樣:每個個體有一個可計算的非零概率, 可計算抽樣誤差,可推斷總體,概率抽樣調(diào)查 Sample surveys,按一定的概率,在人群中抽取一部分人來調(diào)查 以樣本統(tǒng)計量估計總體參數(shù) 節(jié)省時間、人力、物力,調(diào)查可以做得更細致 不適用于患病率很低疾病,常用概率抽樣的方法,簡單隨機抽樣 系統(tǒng)抽樣(等距抽樣、機械抽樣) 分層抽樣(分類抽樣) 整群抽樣,將總體的全部觀察單位編號,再用隨機數(shù)字等方法隨機抽取部分觀察單位組成樣本 例:某中學2100名學生,隨機抽200人估計近視率 先將所有學生編號:1,2,3,4,2100 查隨機數(shù)字表 6394 0710 6376 3587 0304 7988 94 710 76 1487 304 1688 注意:8400以上的數(shù)字不要 產(chǎn)生隨機數(shù)字: =rand() =randbetween() 隨機數(shù)字發(fā)生器 (練習),單純隨機抽樣 Simple random sampling (SRS),1, 2, 3, 4, 2100 2101,2102,2103,2104,4200 4201,4202,4203,4204,6300 6301,6302,6303,6304,8400 8401,8402,8403,8404,999910500,1600個數(shù),2100個數(shù),1600個數(shù),500個數(shù),單純隨機抽樣,優(yōu)點:均數(shù)(或率)及標準誤的計算簡單 缺點:總體例數(shù)多時,需有全部名單,編號,將全部觀察單位根據(jù)某一順序編號,計算抽樣間隔,隨機抽第k號(小于抽樣間隔)觀察單位,然后依次用相等間隔抽取觀察單位組成樣本 先將所有學生編號:1,2,3,4,2100 確定抽樣間隔:2100/200=10.5(人),取10 在1-10之間隨機找一個數(shù)字,例如4 依次機械抽取:14,24,34, ,1994,2004,系統(tǒng)抽樣,系統(tǒng)抽樣,優(yōu)點: 易于理解,易行 樣本是均勻分布的,抽樣誤差小于單純隨機抽樣,對樣本進行方差估計時,可以將它看成是SRS 缺點: 當抽樣單位的排列有周期趨勢時,抽樣結果可能有偏差,根據(jù)樣本量估算,需要抽取該社區(qū)1/10的兒童采血檢測; 每個家庭有門牌號,從1-2000號,單號一排,雙號一排。調(diào)查者首先用隨機數(shù)字表從1-10中選一個數(shù)字,然后用系統(tǒng)隨機方法抽取該街道的1/10有兒童的家庭。 這一抽樣方法有什么潛在問題?,在農(nóng)村某地區(qū)開展兒童維生素D缺乏調(diào)查,分層抽樣,按影響較大的某種特征將總體分成若干組(統(tǒng)計上 叫做”層”),再從每一層內(nèi)隨機抽取一定數(shù)量的觀 察單位 分層變量最好是層間差別大,層內(nèi)差別小 層內(nèi)樣本量分配 按比例分配 等額分配 最優(yōu)分配 按照性別分層,男生和女生 每層中隨機抽取100名學生,分層抽樣,優(yōu)點: 減少抽樣誤差,分層后增加層內(nèi)同質(zhì)性 便于對不同的層采取不同的抽樣方法,如城鄉(xiāng)分層 還可對不同層獨立進行分析(各層要滿足樣本量),先將總體分成若干個群,每個群包括若干觀察單位,再隨機抽取k個群,每個群的全部觀察單位組成樣本,整群抽樣,群間差異越小、抽取的“群”越多,精度越高,樣本量確定后,宜增加“群”數(shù)而減少群內(nèi)的觀察數(shù) 學校共有70個班(各個班級情況相似時比較好) 隨機抽取20個班(各班人數(shù)越少,抽班級數(shù)越多越好) 20個班級的所有學生都調(diào)查,整群抽樣,整群抽樣,優(yōu)點: 便于組織、節(jié)省經(jīng)費,容易控制調(diào)查質(zhì)量 缺點: 當樣本例數(shù)一定時,抽樣誤差大于單純隨機抽樣的誤差 抽取的群數(shù)應盡量多(15個),群數(shù)太少抽樣誤差大,各種抽樣方法的方差,分層抽樣 系統(tǒng)抽樣 單純隨機抽樣 整群抽樣,設計效力(Design Effect):樣本量不變時,實際抽樣方法的方差與單純隨機抽樣的方差的比值 Ratio of actual variance to variance assuming SRS, given same n DE一般為1.3-3,多階段抽樣,單階段抽樣:四種基本抽樣方法都是通過一次抽樣產(chǎn)生一個完整的樣本 多階段抽樣:總體大,情況復雜,分布廣,可分若干階段進行抽樣,每個階段可用上述四種方法中任意一種進行抽樣 例:在某省進行某項調(diào)查: 第一階段:用系統(tǒng)抽樣法隨機抽取30個縣 第二階段:用SRS法每縣抽取10個自然村 第三階段:用SRS法每村抽取10名村民,第1階段為初級抽樣單位PSU(primary sampling unit) 第2階段為二級抽樣單位SSU(second sampling unit) 第3階段為三級抽樣單位TSU(tertiary sampling unit),初級抽樣單位多,調(diào)查結果抽樣誤差小,精度高 建議不少于10-15個,第1階段:50個班級中隨機抽取20個班級 第2階段:每個抽中班級中隨機抽取3個小組 第3階段:每個小組中隨機抽取4名學生 初級抽樣單位:班級 二級抽樣單位:班級里的小組 三級抽樣單位:學生,阜陽市各級醫(yī)療機構治療發(fā)熱 兒童用藥現(xiàn)況調(diào)查,2008年安徽省阜陽市發(fā)生EV71手足口病疫情 3月1日至5月9日共報告6049病例 99%的為14歲以下兒童 大多數(shù)病例以急性發(fā)熱起病 EV71重癥危險因素研究發(fā)現(xiàn) 首診在村級醫(yī)療機構 氨基比林和激素類藥物,調(diào)查目的,了解阜陽市各級醫(yī)療機構治療發(fā)熱兒童的用藥現(xiàn)狀 發(fā)現(xiàn)存在的問題及影響因素 為規(guī)范發(fā)熱兒童用藥提供依據(jù),調(diào)查對象和內(nèi)容,各級醫(yī)療機構的兒科醫(yī)生:訪談用藥習慣 各級醫(yī)療機構發(fā)熱兒童的治療處方:各種藥物的使用情況,樣本量計算,根據(jù)簡單隨機抽樣計算公式,以氨基比林使用比例為p,=5%,設計效率1.44 根據(jù)預調(diào)查獲得各級醫(yī)療機構氨基比林使用比例計算樣本量,市級和縣級共8家醫(yī)院 鄉(xiāng)鎮(zhèn)衛(wèi)生院171所 村診所:每個鄉(xiāng)鎮(zhèn)有20-40所左右 調(diào)查3-6月份的各級醫(yī)院的處方用藥情況,如何抽樣?,處方:分層多階段抽樣,抽取市(縣)、鄉(xiāng)鎮(zhèn)及村級醫(yī)療機構 市、縣級醫(yī)院:8所全部調(diào)查 鄉(xiāng)鎮(zhèn)醫(yī)院:171所中隨機抽取30所 村診所:在抽中的30個鄉(xiāng)鎮(zhèn)醫(yī)院所在鄉(xiāng)鎮(zhèn)中,分別隨機抽取1-2個村衛(wèi)生室,共40所 抽取各醫(yī)院2008年3-6月治療發(fā)熱兒童的用藥處方 市、縣級醫(yī)院:每月隨機抽取8張,共32張 鄉(xiāng)鎮(zhèn)醫(yī)院:每月隨機抽取4張,共16張 村衛(wèi)生室:每月隨機抽取2張,共8張,醫(yī)生:分層多階段抽樣,抽取市(縣)、鄉(xiāng)鎮(zhèn)及村級醫(yī)療機構 市、縣級醫(yī)院:8所全部調(diào)查 鄉(xiāng)鎮(zhèn)醫(yī)院:171所中隨機抽取30所 村診所:在抽中的30個鄉(xiāng)鎮(zhèn)醫(yī)院所在鄉(xiāng)鎮(zhèn)中,分別隨機抽取1-2個村衛(wèi)生室,共40所 抽取到醫(yī)院的兒科醫(yī)生全部調(diào)查,某市醫(yī)務人員甲型H1N1 流感疫苗接種意愿調(diào)查,背 景,2009年甲型H1N1流感大流行,防控工作再次成為全球關注焦點 流感疫苗-有效防控流感的手段,WHO和我國準備為醫(yī)務人員優(yōu)先接種甲型H1N1疫苗 醫(yī)務人員是特殊群體,非常重要: 救治病人的中堅力量 暴露的高風險人群 感染后易傳給患者,醫(yī)院內(nèi)傳播 文獻顯示醫(yī)務人員流感疫苗接種率較低,目的,了解該市醫(yī)護人員接種甲型H1N1疫苗的意愿,分析不愿接種的原因,為政府制定流感疫苗接種策略提供科學依據(jù),研究人群:該市醫(yī)護人員,如何抽樣?,采用分層二階段抽樣方法,第一階段:先抽醫(yī)院 第二階段:再抽取醫(yī)護人員,第一階段抽取多少醫(yī)院合適?,抽取5家? 抽取10家? 抽取20家? 抽取30家? 抽取50家?,抽取的Cluster越少,抽樣誤差越大,數(shù)理統(tǒng)計推理和中心極限定理表明,從正態(tài)總體中隨機抽取例數(shù)為n的樣本,樣本均數(shù)服從正態(tài)分布 對樣本均數(shù)這個正態(tài)變量采用u=(樣本均數(shù)-總體均數(shù))/變換,變換為標準正態(tài)分布N(0.1),即u分布。 實際工作中往往是s來估計的,這時就是t變換了,其結果就是t分布 可信區(qū)間估計時,因為未知,一般按照t分布的原理, 95%CI=Xbar SE =1, t=12.7 =2, t= 4.3 =3, t= 3.18, 2.2 (=10) 2.1(=20) 2.0(=30) 1.96(=infinite),隨著cluster增加,95%CI越精確,假設醫(yī)院疫苗接種意愿率50%, 抽4家,95%CI:44%-56% 抽8家,95%CI:45.7%-54.3% 抽13家,95%CI:46.2%-53.9% 抽18家,95%CI:46.5%-53.5%,采用分層二階段抽樣方法,第一階段:共隨機抽取30家醫(yī)院,其中: 三級醫(yī)院抽取5家 二級醫(yī)院抽取10家 一級醫(yī)院抽取15家 第二階段:抽取醫(yī)護人員 每家醫(yī)院中隨機抽取若干名醫(yī)護人員,每家醫(yī)院中抽取多少名醫(yī)護人員?,估計總體率的樣本量(按簡單隨機抽樣計算),=0.05,U=1.96, p=估計總體率, =容許誤差,一般取總體率95%可信區(qū)間寬度的一半,醫(yī)護人員甲流疫苗愿意接種率50%,=0.05,=5%,如果p=0.5,則 n=1.96 0.5(1-0.5)/ 0.05 400 人,2,2,兩階段抽樣,樣本量需要乘以設計效力,兩階段抽樣的抽樣誤差大于單純隨機抽樣 本次抽樣方法需要乘以設計效力,2 共需約800名醫(yī)護人員 失訪率10%,約900人,900名樣本的分配,900名樣本的分配:等額分配,什么是PSU? 什么是分層變量?,假如是單純隨機抽樣,總體率的計算,該市醫(yī)護人員中,接種意愿率為:49.9% 95%CI:46.6%-53.2%,900名醫(yī)護人員中,449名愿意接種, 意愿接種率點值估計: 95%CI估計:,練習計算,權重調(diào)整,權重的大?。簑eight=1/抽樣概率 每名個體抽樣概率不等時,需要按照權重進行調(diào)整 權重調(diào)整的目的:使調(diào)整后樣本人群的特征與總體人群特征一致 如:總體為3000人,男女比例1:1 樣本中男生抽100人,女生抽200人,男生 100,女生 200,女生=1500,男生=1500,男生抽樣概率=100/1500= 1/15 女生抽樣概率=200/1500= 2/15,男生權重=1/(1/15)=15 女生權重=1/(200/1500)= 7.5,復雜抽樣方差與SRS不同,需用特殊軟件計算 EpiInfo有三個模塊,可以進行復雜抽樣的一些基本分析 Complex Sample Frequencies Complex Sample Tables Complex Sample Means 更為復雜的計算需要用其他軟件 SAS, SUDAAN, SPSS, STATA,區(qū)間(方差)估計,計算時需要PSU和權重!,三級醫(yī)院共抽取5家(共18家),每家被抽中概率p1=0.28,二級醫(yī)院共抽取10家(共25家),每家被抽中概率p1=0.4,一級醫(yī)院共抽取15家(共45家),每家被抽中概率p1=0.33,三級醫(yī)院共抽取5家,每家被抽中概率p1=0.28,二級醫(yī)院共抽取10家,每家被抽中概率p1=0.4,一級醫(yī)院共抽取15家,每家被抽中概率p1=0.33,按權重調(diào)整的意愿接種率,權重調(diào)整的意愿接種率:44.9%,95%CI:41%48.9%,兩個率的比較,醫(yī)生和護士的接種意愿率是否有差別? 看醫(yī)生和護士的接種意愿率95%CI是否互相包含 互相包含:無差別,互相不包含:有差別 使用Epi info復雜抽樣模塊,醫(yī)生接種意愿44%(38%-51%) 護士

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論