




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
關(guān)于非抽樣誤差抽樣調(diào)查理論與方法第1頁(yè),課件共27頁(yè),創(chuàng)作于2023年2月美國(guó)《文學(xué)摘要》對(duì)于1936年美國(guó)總統(tǒng)選舉進(jìn)行了預(yù)測(cè),當(dāng)時(shí)大多數(shù)觀察家認(rèn)為羅斯福會(huì)輕易獲勝,而《文學(xué)摘要》根據(jù)自己的抽樣斷定蘭登與羅斯福的獲勝比率將是57%和43%。然而卻是羅斯福以62%比38%的絕對(duì)優(yōu)勢(shì)坐上了總統(tǒng)寶座。與事實(shí)完全相悖的預(yù)測(cè)斷送了這家原本頗有名氣的雜志的前程,不久它只得??痛恕瓣P(guān)門大吉”。美國(guó)《文學(xué)摘要》發(fā)出了1000萬(wàn)張調(diào)查表,收回了200萬(wàn)張,花費(fèi)了那么大的精力,收集了那么多的數(shù)據(jù),怎么會(huì)出那么大的錯(cuò)誤呢?主要原因就是抽樣框的選取。原來(lái)它是按照電話簿和俱樂(lè)部成員的名單發(fā)出調(diào)查表的,由此選取的樣本明顯地排斥窮人!因?yàn)楫?dāng)時(shí)一般窮人很少擁有私人電話或隸屬于哪個(gè)俱樂(lè)部(1936年,美國(guó)大約有1100萬(wàn)部住宅電話)。眾所周知,經(jīng)濟(jì)地位在很大程度上影響著政治態(tài)度:窮人壓倒多數(shù)地傾向于羅斯福而有錢人則偏向于蘭登?!段膶W(xué)摘要》的樣本反映不出這個(gè)社會(huì)現(xiàn)實(shí)從而犯了致命的錯(cuò)誤。第2頁(yè),課件共27頁(yè),創(chuàng)作于2023年2月設(shè)計(jì)帶來(lái)非抽樣誤差有很多表現(xiàn)在抽樣框出了問(wèn)題,第一章中所述的《文學(xué)摘要》的抽樣框明顯地偏向于某一部分人而忽略了另一部分人,從中產(chǎn)生的非抽樣誤差使得抽樣結(jié)果不能反映總體(全體選民)的意見(jiàn)。這種致命的錯(cuò)誤來(lái)源于抽樣框“丟失”了總體中占有一定比例的單元,如果這一部分被“丟失”的群體在調(diào)查關(guān)心的參數(shù)方面有其獨(dú)特的一面,那么這種“丟失”引起的非抽樣誤差使推斷或估計(jì)帶有明顯的偏性。
如果我們的抽樣方案是分層抽樣,分層抽樣不太可能按照關(guān)心的總體參數(shù)去實(shí)施,而常常根據(jù)若干輔助信息來(lái)進(jìn)行,當(dāng)然這些輔助信息與調(diào)查變量應(yīng)當(dāng)有較強(qiáng)的相關(guān)程度。倘若這些輔助變量資料不健全,不準(zhǔn)確甚至借用這些輔助變量本身屬于判斷失誤,由此引起的非抽樣誤差可能會(huì)嚴(yán)重威脅到估計(jì)的準(zhǔn)確性。第3頁(yè),課件共27頁(yè),創(chuàng)作于2023年2月有時(shí)候陳舊的抽樣框?qū)?lái)我們所不希望看到的非抽樣誤差,因?yàn)殛惻f的抽樣框會(huì)造成總體單元的“丟失”現(xiàn)象,一般地它還難以反映近期有關(guān)變量的一些變化。以上所述的非抽樣誤差屬于在抽樣之前的設(shè)計(jì)方案工作及編制抽樣框中需要認(rèn)真對(duì)待的。本章就抽樣過(guò)程中產(chǎn)生的非抽樣誤差進(jìn)行詳盡的討論?!?無(wú)回答現(xiàn)象在設(shè)計(jì)方案相當(dāng)合理,編制的抽樣框令人十分滿意的情況,無(wú)回答現(xiàn)象的發(fā)生是非抽樣誤差表現(xiàn)的主要形式之一。無(wú)回答類型通??蓺w結(jié)為:(1)遺漏。由隨機(jī)抽樣所確定的調(diào)查單位出現(xiàn)“找不到”現(xiàn)象,或者由于客觀存在的一些困難,諸如交通極端不便,氣候異常惡劣等而無(wú)法找到確定要去訪問(wèn)的對(duì)象。第4頁(yè),課件共27頁(yè),創(chuàng)作于2023年2月(2)被調(diào)查對(duì)象不在家。有時(shí)候可以請(qǐng)家庭中其他人甚至就近換一家進(jìn)行訪問(wèn),這樣的做法雖然方便,但是在一定程度上破壞了隨機(jī)性。有時(shí)候?yàn)榱舜_保抽樣的隨機(jī)性,“不在家”就造成了“無(wú)回答”。(3)不能回答。某些被訪問(wèn)者對(duì)于問(wèn)卷中的若干問(wèn)題缺乏有關(guān)資料或者出于各種各樣的原因而不愿意回答。(4)堅(jiān)決拒絕調(diào)查。這是由于各種原因造成的,尤其是有些問(wèn)題涉及到個(gè)人隱私等等,由此產(chǎn)生的偏差一般較難消除。造成無(wú)回答現(xiàn)象的原因有許許多多,但一般地,由政府部門出面組織的抽樣調(diào)查常常能得到被調(diào)查者的友好合作,這種情況下無(wú)回答現(xiàn)象的比例相對(duì)地較少,然而對(duì)于一般的市場(chǎng)信息調(diào)查等非政府組織的抽樣調(diào)查無(wú)回答現(xiàn)象比例非常的高。隨著我國(guó)社會(huì)主義市場(chǎng)經(jīng)濟(jì)的發(fā)展和完善,這種情況正在逐步得到改善。第5頁(yè),課件共27頁(yè),創(chuàng)作于2023年2月其實(shí)調(diào)查人員的素質(zhì),調(diào)查問(wèn)題的擬定,被調(diào)查人員的文化素質(zhì)等等都對(duì)無(wú)回答率有一定影響。每件抽樣調(diào)查,我們需要力求低比率的無(wú)回答現(xiàn)象,從目前來(lái)看,完全避免無(wú)回答現(xiàn)象是不可能的。對(duì)于無(wú)回答現(xiàn)象產(chǎn)生的非抽樣誤差我們關(guān)心的是:1、問(wèn)卷的回收率調(diào)查報(bào)告一般要求列出回收率,尤其是通過(guò)郵寄方式進(jìn)行的調(diào)查,更需如此。因?yàn)榛厥章实母叩蛯⒂辛Φ卣撟C調(diào)查的成功與否。對(duì)回收率的分析將有助于在無(wú)回答現(xiàn)象較嚴(yán)重的情況下進(jìn)行數(shù)據(jù)分析,同時(shí)也有助于分析出哪些對(duì)象是可以再訪問(wèn)從而采取多次訪問(wèn)的手段盡量減少無(wú)回答率。2、如何進(jìn)行數(shù)據(jù)分析第6頁(yè),課件共27頁(yè),創(chuàng)作于2023年2月設(shè)抽樣容量為n,無(wú)回答個(gè)數(shù)為,那么我們的實(shí)際調(diào)查量為。根據(jù)個(gè)有效數(shù)據(jù)分析將比原定的計(jì)劃少了很多信息。如果這個(gè)訪問(wèn)到的對(duì)象是從原定的對(duì)象中隨機(jī)無(wú)放回地抽取的,那么推斷的結(jié)果只是精度上的損失,至于估計(jì)量的一些良好性質(zhì),例如無(wú)偏性等仍然保留。然而事情并非這樣地如意,無(wú)回答者常常擁有某些特征以致對(duì)調(diào)查的問(wèn)題持有特定的態(tài)度,因此依據(jù)個(gè)回答數(shù)據(jù)所作出的推斷往往帶有偏性。以總體平均數(shù)的估計(jì)為例,我們面臨的情況相當(dāng)于總體中N個(gè)單元?jiǎng)澐譃閮刹糠郑骸卮鹫撸獰o(wú)回答者。倘若抽樣方式是簡(jiǎn)單隨機(jī)的,那么與的比例理應(yīng)相當(dāng)于與的比例。這兩部分的平均數(shù)分別記為和,于是總體平均數(shù)為:(12.1)第7頁(yè),課件共27頁(yè),創(chuàng)作于2023年2月根據(jù)“回答者”部分的平均數(shù)是的無(wú)偏估計(jì),用估計(jì)顯然會(huì)產(chǎn)生偏倚:(12.2)這個(gè)偏倚中,與是可以利用調(diào)查得到的數(shù)據(jù)進(jìn)行估計(jì)的,但是由于“無(wú)回答”,是根本無(wú)法獲知其信息的,因此要對(duì)估計(jì)量給于“糾偏”,其難度極大,尤其是在較大時(shí)也就是“無(wú)回答者”占有相當(dāng)大比例時(shí),連的置信限都難于得到。在有些實(shí)例中,人們只能對(duì)偏倚作出一些猜測(cè),這些猜測(cè)有時(shí)候可以根據(jù)一些歷史的資料作出,有一定的參考價(jià)值;但是有時(shí)候憑主觀作出的猜測(cè)無(wú)法證實(shí)其正確性,因此利用它來(lái)“糾偏”缺乏依據(jù)也缺乏精確度,這顯然歸因于無(wú)回答現(xiàn)象帶來(lái)的惡果。第8頁(yè),課件共27頁(yè),創(chuàng)作于2023年2月(1)對(duì)某些問(wèn)題無(wú)回答的數(shù)據(jù)以該問(wèn)題回答數(shù)據(jù)的平均數(shù)來(lái)代替;(2)從對(duì)某問(wèn)題回答的個(gè)數(shù)據(jù)中作次隨機(jī)有放回的抽樣,以填補(bǔ)個(gè)無(wú)回答者的數(shù)據(jù)。然而在用計(jì)算機(jī)處理抽樣數(shù)據(jù)時(shí),不單單是簡(jiǎn)單地用去代替或者最多給出一定量的糾偏。眾所周知,抽樣調(diào)查一般不止問(wèn)一個(gè)問(wèn)題,我們的問(wèn)卷經(jīng)常圍繞調(diào)查的目的而設(shè)置一系列問(wèn)題,我們遇到的無(wú)回答現(xiàn)象經(jīng)常表現(xiàn)為:全部問(wèn)題無(wú)回答或部分問(wèn)題無(wú)回答。在部分問(wèn)題無(wú)回答者中,將會(huì)呈現(xiàn)回答問(wèn)題的多少以及哪些問(wèn)題無(wú)回答的復(fù)雜情況,這給計(jì)算機(jī)處理及整體推斷帶來(lái)一定的困難。有些學(xué)者提出對(duì)于這樣的“丟失”數(shù)據(jù)能否人為地補(bǔ)缺,如果對(duì)無(wú)回答對(duì)象一無(wú)所知的情況下,我們可以采取下述措施:第9頁(yè),課件共27頁(yè),創(chuàng)作于2023年2月上述做法還是相當(dāng)于從個(gè)回答者的數(shù)據(jù)出發(fā)對(duì)總體作出推斷,但是在計(jì)算機(jī)上整體考慮來(lái)說(shuō)是作為個(gè)樣本來(lái)處理的,給整體全面的推斷帶來(lái)某種方便,且也具有一定合理性,因?yàn)槲覀兊某闃诱{(diào)查本身是要求個(gè)均有回答的。然而這樣的處理在精度上如何計(jì)算,或者說(shuō)新構(gòu)成的估計(jì)量方差如何估計(jì),國(guó)外的一些統(tǒng)計(jì)學(xué)家曾作過(guò)研究與進(jìn)一步的探索。3、多次訪問(wèn)為了縮小無(wú)回答所引起的偏差,減少無(wú)回答的數(shù)量,有必要采取一些措施,例如對(duì)訪問(wèn)者的培訓(xùn),對(duì)敏感問(wèn)題的適當(dāng)處理以消除被訪問(wèn)者的疑慮,調(diào)查前作好充分的準(zhǔn)備工作等等,采用多次訪問(wèn)是個(gè)有效的方法。當(dāng)然,對(duì)于那些“堅(jiān)決拒絕回答者”來(lái)說(shuō),多次訪問(wèn)很難奏效,但是對(duì)于那些“不在家”或“不能回答”原因的無(wú)回答者應(yīng)當(dāng)有不小的作用。第10頁(yè),課件共27頁(yè),創(chuàng)作于2023年2月實(shí)際工作表明,多次訪問(wèn)的確能做到減少無(wú)回答率,隨之而引出的問(wèn)題是承擔(dān)的費(fèi)用問(wèn)題。一般地,抽樣方案設(shè)計(jì)中會(huì)留下一部分經(jīng)費(fèi)用于“再訪問(wèn)”以便提高回答率。所謂多次訪問(wèn)不可能“許多次”,因?yàn)殡S著訪問(wèn)次數(shù)的增加,每次的回收率將隨之減少,因此“許多次”是不必要的。另外在再次訪問(wèn)時(shí),最好的辦法是換一個(gè)訪問(wèn)員獨(dú)立地對(duì)前一次無(wú)回答者進(jìn)行訪問(wèn),這樣常常可以收到很好的效果。4、Polize—Simmons較正如果由于條件的限制,只能進(jìn)行一次調(diào)查,如何較正由于無(wú)回答而引起的誤差呢?Polize—Simmons對(duì)總體平均數(shù)提出的建議對(duì)我們有一定的參考價(jià)值。假定所有訪問(wèn)者均是在除周日以外的6個(gè)晚上進(jìn)行,對(duì)于每一個(gè)實(shí)際被調(diào)查者在答完問(wèn)卷以后再附帶詢問(wèn)一個(gè)問(wèn)題:“除周日之外,您在今晚以前的5個(gè)晚上有幾天在家?”這個(gè)問(wèn)題的如實(shí)回答實(shí)際上告訴了訪問(wèn)員關(guān)于他晚上在家第11頁(yè),課件共27頁(yè),創(chuàng)作于2023年2月的頻率的一個(gè)大致估計(jì):(其中是被調(diào)查者回答的天數(shù))。根據(jù)調(diào)查的結(jié)果可以將被訪問(wèn)人分為6部分,即。設(shè)每個(gè)部分含有個(gè)人。顯然,越大,就越大,對(duì)應(yīng)此的組入樣的可能性就越大,這樣該部分的平均數(shù)在估計(jì)總體平均數(shù)的過(guò)程中應(yīng)當(dāng)賦予與該組在家頻率相適應(yīng)的權(quán)。這種思想實(shí)質(zhì)上類似于不等概率抽樣時(shí)的平均數(shù)估計(jì)。按照這種加權(quán)平均的思想,我們將原先的樣本平均數(shù)(當(dāng)然是基于被調(diào)查到的樣本)調(diào)整為所謂Polize-Simmons估計(jì)量:(12.3)第12頁(yè),課件共27頁(yè),創(chuàng)作于2023年2月Polize-Simmons較正在直觀上有合理的解釋:某些調(diào)查指標(biāo)——諸如生活費(fèi)用的平均年收入或年支出——與被調(diào)查者是否容易找到是較強(qiáng)相關(guān)的兩個(gè)因素。如果不采用加權(quán)平均數(shù)而采用被調(diào)查者的平均數(shù),那么所得到的估計(jì)就相對(duì)地突出了那些容易被找到的人的影響,而掩蓋了另一部分不容易找到的人的影響。P-S較正采用加權(quán)平均對(duì)偏差作了一定程度上的較正。當(dāng)然所利用的權(quán)本身是通過(guò)抽樣調(diào)查的數(shù)據(jù)估算出來(lái)的,它將無(wú)可質(zhì)疑地影響到估計(jì)量的方差(增大),對(duì)估計(jì)的精度付出代價(jià),但是我們畢竟不要再花費(fèi)時(shí)間、精力和費(fèi)用去作多次訪問(wèn)并達(dá)到糾偏的作用。第13頁(yè),課件共27頁(yè),創(chuàng)作于2023年2月§3計(jì)量誤差計(jì)量誤差是又一種重要的非抽樣誤差。由于計(jì)量工具的不夠精確,或由于調(diào)查人員工作的粗糙失誤,或者是數(shù)據(jù)處理人員的馬馬虎虎,都有可能造成調(diào)查所得數(shù)據(jù)與真值之間的不一致。這樣的計(jì)量誤差(或稱調(diào)查誤差)將嚴(yán)重地威脅到抽樣推斷。本節(jié)還要簡(jiǎn)略討論到另一種調(diào)查誤差,那就是人為的“虛假”數(shù)據(jù),數(shù)據(jù)的偽造與虛假干擾了我們的調(diào)查與推斷,有時(shí)候會(huì)發(fā)生不堪設(shè)想的嚴(yán)重后果。1、設(shè)計(jì)引起的誤差因?yàn)榉桨敢约皢?wèn)卷的設(shè)計(jì)引起偏差的問(wèn)題,我們已經(jīng)在第一章中較為詳盡地闡述過(guò),本節(jié)稍稍談?wù)撚纱艘鸬挠?jì)量方面的誤差。在調(diào)查咨詢方面取得極大成功的蓋洛普十分強(qiáng)調(diào)問(wèn)卷設(shè)計(jì)中的用詞,用詞欠妥有可能引起調(diào)查結(jié)果在計(jì)量方面顯著的不同,足以例證的當(dāng)推Rugg試驗(yàn):第14頁(yè),課件共27頁(yè),創(chuàng)作于2023年2月問(wèn)題甲:“您認(rèn)為美國(guó)應(yīng)當(dāng)禁止反對(duì)民主的公開(kāi)言論嗎?”其結(jié)果是54%的人贊成。問(wèn)題乙:“您認(rèn)為美國(guó)應(yīng)該允許反對(duì)民主的公開(kāi)言論嗎?”結(jié)果是75%的人不贊成。兩個(gè)問(wèn)題表示美國(guó)多數(shù)以上的人不同意在美國(guó)有公開(kāi)反對(duì)民主的言論,但比例為54:75,相距甚遠(yuǎn)。既然人們傾向于不允許反對(duì)民主的公開(kāi)言論,但“禁止”兩字使不少人感到這與“民主及言論自由”有相悖之處。這里面涉及到美國(guó)的國(guó)情、美國(guó)人的心理承受等各種因素。當(dāng)然,要想完全避免問(wèn)題設(shè)計(jì)引起的計(jì)量上的誤差很難做到,因此我們主張有時(shí)候可以做些小范圍的試調(diào)查,從而調(diào)整我們的各種用詞。第15頁(yè),課件共27頁(yè),創(chuàng)作于2023年2月2、調(diào)查員誤差對(duì)于一個(gè)對(duì)象的訪問(wèn),如果不存在調(diào)查員方面的問(wèn)題,照理調(diào)查所取得的數(shù)據(jù)與真值之間只有隨機(jī)誤差,因此從理論上講,只要對(duì)該對(duì)象多次訪問(wèn)再取平均數(shù)則可以基本上“抵消”隨機(jī)誤差的影響。然而由于調(diào)查員方面引起的誤差(通常稱為系統(tǒng)誤差)不可能通過(guò)多次訪問(wèn)而抵消。調(diào)查員誤差常常歸因于:(1)調(diào)查員本身的素質(zhì),倘若一個(gè)調(diào)查員工作粗糙、登錄馬虎等,則會(huì)引起不必要的差錯(cuò)。有些調(diào)查員只在調(diào)查中將對(duì)象提供的以前的或公開(kāi)的資料照抄,殊不知這些以前的或公開(kāi)的數(shù)據(jù)與現(xiàn)在要調(diào)查得到的數(shù)據(jù)之間有時(shí)是存在差異的,這樣的誤差當(dāng)然是由調(diào)查員而引起的。(2)調(diào)查員的誘導(dǎo)引起的調(diào)查誤差。調(diào)查員為了將問(wèn)題展開(kāi)下去,常啟發(fā)被調(diào)查人員,或做一些示范暗示,做一些比喻,言語(yǔ)與動(dòng)作之間常帶有調(diào)查員本身的一些想法第16頁(yè),課件共27頁(yè),創(chuàng)作于2023年2月愿望等,只要回答的結(jié)果不對(duì)被調(diào)查人員的生活及其他帶來(lái)不利影響的話,有些被調(diào)查人員就會(huì)自然地順著調(diào)查員的思路回答問(wèn)卷。(3)調(diào)查員按照被調(diào)查人員給自己留下的初步印象而推測(cè)填寫(xiě)問(wèn)卷。不能否認(rèn),調(diào)查員本身是生活在社會(huì)中的一員,對(duì)許多事情有自己的思想,會(huì)作出自己的判斷。被調(diào)查人員的年齡、性別、社會(huì)職業(yè)、家庭收入,以及一進(jìn)門就可看到的家庭擺設(shè)、衛(wèi)生狀況,甚至被調(diào)查人員的容貌等都會(huì)給調(diào)查人員一個(gè)較深刻的印象,在問(wèn)卷中有些不清楚的問(wèn)題,或者需要被調(diào)查人員講述一些觀點(diǎn)而由調(diào)查員記錄下來(lái)的內(nèi)容,都有可能由于調(diào)查員認(rèn)為這樣的人必定如何回答該問(wèn)題的印象而引起誤差?;蛘哒{(diào)查員根據(jù)先前對(duì)其他人的訪問(wèn)留下的印象,比如對(duì)某問(wèn)題持贊成者多,那么這種印象也很有可能成為他采訪下一個(gè)對(duì)象時(shí)已經(jīng)形成初步結(jié)論。第17頁(yè),課件共27頁(yè),創(chuàng)作于2023年2月以上這些調(diào)查員誤差都是屬于系統(tǒng)誤差,稱為偏差,不可能通過(guò)大量訪問(wèn)或多次訪問(wèn)加以克服。要盡可能地避免或減少調(diào)查員誤差就必須挑選合格稱職的調(diào)查員,并且對(duì)調(diào)查員預(yù)先進(jìn)行培訓(xùn),講清楚注意點(diǎn),尤其是要向調(diào)查員反復(fù)強(qiáng)調(diào)職業(yè)道德。另外抽樣調(diào)查的督導(dǎo)十分重要,督導(dǎo)的作用是檢查調(diào)查質(zhì)量,并從中抽取少部分進(jìn)行核查訪問(wèn)以評(píng)估調(diào)查的質(zhì)量。核查通常采用電話方式,若上門核查則常常采用調(diào)查員之間交叉核查的辦法。3、被調(diào)查人員誤差被調(diào)查人員誤差雖然需要“防治”,但有些是可以原諒的,例如被調(diào)查者對(duì)問(wèn)題的理解發(fā)生差錯(cuò)就是一例,當(dāng)然如果是調(diào)查員上門訪問(wèn),那么這種差錯(cuò)就容易及時(shí)更正,但如果是郵寄問(wèn)卷等則無(wú)法糾正了。另外,有不少事情是需要被調(diào)查人員回憶后再回答的,它不像“什么時(shí)侯出生”、“何地出生”、“家中有幾口人”等這些問(wèn)題既簡(jiǎn)單且不易發(fā)生差錯(cuò)。第18頁(yè),課件共27頁(yè),創(chuàng)作于2023年2月有些事情,時(shí)間比較長(zhǎng)且又比較復(fù)雜,回憶有一定的困難,差錯(cuò)也是難免的。對(duì)于這種類型的差錯(cuò),一般要求調(diào)查員有耐心地等待,給予一定的回憶時(shí)間。倘若被調(diào)查人員身體不適、情緒欠佳,或者調(diào)查環(huán)境使人煩躁等都會(huì)引起回答誤差。另一類由被調(diào)查人員引起的調(diào)查誤差是不可原諒的,那就是被調(diào)查人員“謊報(bào)軍情”提供虛假數(shù)據(jù)。這里面有一部分人因?yàn)闋可娴揭恍┟舾行詥?wèn)題而不愿如實(shí)回答,對(duì)于敏感性問(wèn)題的巧妙處理將在下一節(jié)進(jìn)行討論。但是,在我國(guó)的確存在著虛報(bào)瞞報(bào)、篡改統(tǒng)計(jì)數(shù)據(jù)等現(xiàn)象,使國(guó)家統(tǒng)計(jì)局掌握統(tǒng)計(jì)信息,反映我國(guó)國(guó)民經(jīng)濟(jì)發(fā)展及社會(huì)運(yùn)行狀況工作遇到人為麻煩。因此,廣泛宣傳統(tǒng)計(jì)法,加強(qiáng)對(duì)統(tǒng)計(jì)法執(zhí)行的力度已經(jīng)刻不容緩。關(guān)于樣本數(shù)據(jù)是否虛假,存在一個(gè)發(fā)現(xiàn)與判斷的問(wèn)題,往往只有比較樣本數(shù)據(jù)的整體變化才有可能確定,或者可以利用歷史樣本以及經(jīng)驗(yàn)進(jìn)行判斷。第19頁(yè),課件共27頁(yè),創(chuàng)作于2023年2月例如,如果我們發(fā)現(xiàn)某村申報(bào)小麥畝產(chǎn)量為500公斤,從該村歷史上的小麥畝產(chǎn)量以及周圍地區(qū)的小麥畝產(chǎn)量的抽樣數(shù)據(jù),也許我們會(huì)很果斷地判定它的虛假性。一般來(lái)說(shuō),抽樣調(diào)查總是調(diào)查一批數(shù)據(jù),是多參數(shù)的,各參數(shù)之間存在一定的相關(guān),根據(jù)歷史資料等有時(shí)可以估算到相關(guān)程度,即使是粗略估計(jì)也能有助于我們及時(shí)發(fā)現(xiàn)虛報(bào)數(shù)據(jù).在數(shù)值上利用計(jì)算機(jī)作出判斷是人們感興趣的研究課題,它其實(shí)與對(duì)抽樣的質(zhì)量評(píng)估緊密地聯(lián)系在一起。簡(jiǎn)單地說(shuō),設(shè)為抽樣獲得的數(shù)據(jù),從這幾個(gè)對(duì)象中隨機(jī)選取一個(gè)子集進(jìn)行再調(diào)查,兩次調(diào)查的數(shù)據(jù)分別記為和。(1)比較這兩組數(shù)據(jù)之間的差異,它在某種程度上可以鑒別真?zhèn)涡裕瑫r(shí)也對(duì)整個(gè)抽樣的質(zhì)量進(jìn)行適當(dāng)評(píng)估。第20頁(yè),課件共27頁(yè),創(chuàng)作于2023年2月(2)利用,對(duì)總體參數(shù)的估計(jì)量為,利用對(duì)總體參數(shù)相應(yīng)的估計(jì)量記為,與之間的差異可以評(píng)估抽樣推斷的質(zhì)量,同時(shí)也可以檢測(cè)即使有虛假數(shù)據(jù)存在可能是否會(huì)影響到整體的估計(jì)。在處理數(shù)據(jù)過(guò)程中,一旦發(fā)現(xiàn)虛假數(shù)據(jù),通常采用的處理手段是:刪去或重新調(diào)查。刪去數(shù)據(jù)必須小心謹(jǐn)慎,如果確定是虛假數(shù)據(jù),那么毋庸置疑地剔除。但是在實(shí)際情況中有些數(shù)據(jù)看起來(lái)相當(dāng)“異?!保以跉v史資料中似乎也從未發(fā)生過(guò),大有“虛假”之嫌,而它也許是真實(shí)的。例如某縣遭到史無(wú)前例的天災(zāi),那么在該年該縣的農(nóng)產(chǎn)量便會(huì)呈現(xiàn)極度異常值,像這樣的雖異常但真實(shí)的數(shù)據(jù)是不應(yīng)該輕易剔除的,因?yàn)槊恳粋€(gè)數(shù)據(jù)為我們提供了一定的信息,輕易地喪失信息將嚴(yán)重地威脅到估計(jì)的精度。第21頁(yè),課件共27頁(yè),創(chuàng)作于2023年2月§4敏感性問(wèn)題的調(diào)查在社會(huì)經(jīng)濟(jì)調(diào)查中經(jīng)常會(huì)出現(xiàn)一些敏感性的或高度私人絕密的問(wèn)題。例如對(duì)于青少年吸毒問(wèn)題的調(diào)查,吸毒是個(gè)敏感性問(wèn)題,幾乎沒(méi)有一個(gè)吸毒的青少年會(huì)向公安部門或政府機(jī)構(gòu)的調(diào)查者袒露自己的吸毒行為。又如科技人員的流向或有關(guān)流向意愿,國(guó)家人事部門為了掌握有關(guān)人才流動(dòng)信息曾作過(guò)抽樣調(diào)查,但是被調(diào)查者未必愿意在正式流動(dòng)之前表白自己的意向,否則也許會(huì)在原工作單位造成不必要的麻煩。調(diào)研工作者很希望設(shè)計(jì)一種辦法既使被調(diào)查者不擔(dān)心暴露隱私,又使調(diào)查者獲得正確的資料,這就是本節(jié)所要介紹的兩種處理敏感問(wèn)題的方法。1、Warner裝置針對(duì)有些問(wèn)題僅有“是”或“否”兩種回答而我們的目的是獲取總體中“是”的比例這樣的調(diào)查,Warner設(shè)計(jì)了一種隨機(jī)化裝置,基本想法如下:第22頁(yè),課件共27頁(yè),創(chuàng)作于2023年2月對(duì)于n個(gè)對(duì)象中的每一個(gè)以概率P與1-P就關(guān)心的敏感性問(wèn)題提出兩個(gè)截然相反的回答,例如“我贊成某事”或“我不贊成某事”,任何一個(gè)對(duì)象面對(duì)任何一個(gè)回答只需回答“是”或“否”。Warner裝置的巧妙之處在于調(diào)查人員無(wú)法知道被調(diào)查人員回答了哪個(gè)問(wèn)題,要做到這一點(diǎn)并不困難,只要準(zhǔn)備幾張無(wú)差異的折疊紙條,以概率P與1-P在紙條上寫(xiě)上述兩個(gè)問(wèn)題。被調(diào)查者隨機(jī)地摸出一張紙條打開(kāi),但是調(diào)查員不允許查看紙條上書(shū)寫(xiě)哪個(gè)問(wèn)題,被調(diào)查者針對(duì)他所摸到的那個(gè)問(wèn)題如實(shí)回答,若回答“是”,則以紅球投進(jìn)一密閉口袋,若回答“否”,則投之于白球,整個(gè)投球過(guò)程也不讓調(diào)查員看到,調(diào)查員唯有在整個(gè)過(guò)程結(jié)束后打開(kāi)口袋查點(diǎn)紅白球個(gè)數(shù)。這種裝
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年高壓液壓柱塞泵馬達(dá)項(xiàng)目發(fā)展計(jì)劃
- 2025年度新能源材料研發(fā)保密與共享合同
- 2025年度綠色建筑項(xiàng)目財(cái)產(chǎn)贈(zèng)與合同
- 2025年(半)干式煙氣脫硫成套設(shè)備項(xiàng)目建議書(shū)
- 2025年度出境領(lǐng)隊(duì)帶團(tuán)操作規(guī)范合同范本
- 水務(wù)生態(tài)保護(hù)規(guī)劃計(jì)劃
- 2025年食品分離機(jī)械項(xiàng)目合作計(jì)劃書(shū)
- 持續(xù)改進(jìn)教學(xué)工作的機(jī)制計(jì)劃
- 高危行業(yè)的安全防控計(jì)劃
- 合理安排急診排班的重要性計(jì)劃
- 消防安全電動(dòng)車培訓(xùn)
- 阿爾茲海默病的家庭護(hù)理
- 腹水形成的原因及治療
- 糖尿病酮癥酸中毒小講課
- 高中地理必修第一冊(cè)期末試卷及答案-中圖版-2024-2025學(xué)年
- 護(hù)理核心制度測(cè)試題+參考答案
- 《2023版CSCO卵巢癌診療指南》解讀課件
- 福建省公路水運(yùn)工程試驗(yàn)檢測(cè)費(fèi)用參考指標(biāo)
- 人教版一年級(jí)道德與法治下冊(cè)全冊(cè)教案
- 2024-2030年中國(guó)化妝鏡行業(yè)市場(chǎng)發(fā)展趨勢(shì)與前景展望戰(zhàn)略分析報(bào)告
- Project項(xiàng)目管理(從菜鳥(niǎo)到實(shí)戰(zhàn)高手)
評(píng)論
0/150
提交評(píng)論