版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第十一章抽樣技術(shù)本章學(xué)習(xí)內(nèi)容11.1有關(guān)的概念11.2制定抽樣計(jì)劃的步驟11.3概率抽樣方法11.4非概率抽樣方法11.5抽樣中的誤差課后習(xí)題本章學(xué)習(xí)目的能夠科學(xué)地進(jìn)行抽樣熟練掌握各種抽樣方法本章學(xué)習(xí)重點(diǎn)與難點(diǎn)如何定義總體、確定抽樣框科學(xué)確定樣本量恰當(dāng)?shù)剡x擇抽樣方法進(jìn)行抽樣11.1有關(guān)的概念1、總體(或全域)或同質(zhì)總體,是指能提供所需信息的人的全體。2、抽樣與普查普查這一概念用于描述獲取同質(zhì)總體中每個(gè)成員的信息。抽樣指一個(gè)相對(duì)較小、但精心選擇的樣本能準(zhǔn)確地反映出所抽簽的總體的特征。一個(gè)樣本是總體所有成員的一個(gè)子集。從總體中子集獲得的有關(guān)信息,可以用來估測(cè)總體的特征。理想的狀況是,子集能夠代表總體的各個(gè)部分。案例:抽樣的效果根據(jù)日本在公元1970年舉辦之國勢(shì)調(diào)查,在正式調(diào)查報(bào)告未提出前,先以抽樣1%及10%為樣本,做為快報(bào)預(yù)先發(fā)表。事后將三項(xiàng)統(tǒng)計(jì)數(shù)字資料比較于下:人口總數(shù)男女全部統(tǒng)計(jì)83,199,63740,811,76042,387,87710%抽樣83,200,00040,791,00042,409,0001%抽樣83,110,00040,740,00042,370,00011.2制定抽樣計(jì)劃的步驟1.定義同質(zhì)總體詳細(xì)說明可提供信息或與所需信息有關(guān)的個(gè)體或?qū)嶓w所具有的特性??蓮囊韵聨追矫孢M(jìn)行描述:地域特征、人口統(tǒng)計(jì)學(xué)的特征、產(chǎn)品或服務(wù)使用情況、認(rèn)知程度等。2、選擇資料收集方法3、選擇抽樣框抽樣框是指總體的數(shù)據(jù)目錄或單位的名單,從中可以抽出樣本單位。理想的完整和準(zhǔn)確的名單通常是不存在的,因而需要依據(jù)能夠產(chǎn)生具有希望特征的樣本個(gè)體的程序來反映抽樣框。11.2制定抽樣計(jì)劃的步驟4、選擇抽樣方法取決于研究目的、經(jīng)濟(jì)實(shí)力、時(shí)間限制、欲調(diào)查問題的性質(zhì)。1)概率抽樣概率抽樣指在總體中的每個(gè)單位都有可能被抽中。概率抽樣的優(yōu)點(diǎn):信息全面、能估算出抽樣誤差、調(diào)查結(jié)果可以用來推斷總體。概率抽樣的弊?。嘿M(fèi)用高、策劃和實(shí)施時(shí)間長(zhǎng)。2)非概率抽樣非概率抽樣指從總體中非隨機(jī)地選擇特定的要素(單位)。非概率抽樣的弊?。翰荒芄烙?jì)出抽樣誤差、難以確定樣本代表性的程度、難以推及總體。非概率抽樣的固有優(yōu)勢(shì):費(fèi)用低、實(shí)施時(shí)間少、若合理運(yùn)用也能產(chǎn)生極具代表性的合理的抽樣結(jié)果。11.2制定抽樣計(jì)劃的步驟5、確定樣本量考慮可得預(yù)算的重要性、各種各樣的抽選規(guī)則、子集量的分析和傳統(tǒng)的統(tǒng)計(jì)樣本量的計(jì)算。對(duì)非概率抽樣,通常依靠可得預(yù)算、抽選規(guī)則(憑經(jīng)驗(yàn)確定)、子集量分析來決定樣本量。對(duì)概率抽樣,需要在允許誤差的目標(biāo)水平和置信水平下,計(jì)算樣本量。確定樣本量通??紤]這樣一些因素:A個(gè)體差異大?。捍髣t多些B調(diào)查項(xiàng)目多少:多則多些C控制質(zhì)量情況:差則多些D抽樣組織方式:不嚴(yán)密則多些11.2制定抽樣計(jì)劃的步驟
6、制定選擇樣本單位的操作程序示例:抽樣的操作程序可以如下:以下指南是有關(guān)你在某個(gè)街區(qū)訪問時(shí)應(yīng)走的路徑。在城市中,這可能是一個(gè)城市街區(qū);在農(nóng)村,街區(qū)可能是一塊被道路包圍的土地。1、如果在你的路線當(dāng)中遇到死胡同,繼續(xù)沿這條路或街道的另一面向反方向走。在可能的地方又拐,每隔兩戶住家訪問一戶。2、如果你沿街區(qū)走了一圈,又回到了出發(fā)點(diǎn)而沒有完成列出的電話簿上家庭的四個(gè)訪問,那么可以試著訪問起點(diǎn)的那一家。3、如果你調(diào)查了整個(gè)街區(qū),還是沒有完成所要求的訪問,則繼續(xù)從街區(qū)(或鄉(xiāng)間小路)對(duì)面附近的第一個(gè)住戶開始。只要這個(gè)地址在你的紙上的一個(gè)“*”旁出現(xiàn)就把它當(dāng)作你所在區(qū)域的接到中的另一個(gè)地址,并訪問這一家。如果不是,就訪問左邊的一家。永遠(yuǎn)遵守右手法則……7、描樣計(jì)劃的實(shí)施實(shí)施之前,應(yīng)先對(duì)抽樣進(jìn)行討論研究,檢查、確定是否要根據(jù)擬好的詳細(xì)程序來實(shí)施計(jì)劃。11.3概率抽樣方法-簡(jiǎn)單隨機(jī)抽樣總體中每個(gè)單位在抽選時(shí)有相等的被抽中機(jī)會(huì)抽樣概率公式為:抽樣概率=樣本單位數(shù)/總體單位數(shù)例如,如果總體單位數(shù)為10000,樣本單位數(shù)為400,那么抽樣概率為4%,計(jì)算過程為:0.04=400/10000為了滿足隨機(jī)性,抽樣程序主要通過三種方式實(shí)現(xiàn):1.抽簽法——制作選簽工作繁重,實(shí)踐中較少采用2.隨機(jī)數(shù)字表法3.計(jì)算機(jī)抽取——大量的模擬實(shí)驗(yàn)發(fā)現(xiàn),計(jì)算機(jī)產(chǎn)生的隨機(jī)數(shù)是偽隨機(jī)數(shù),其隨機(jī)性并不理想。隨機(jī)數(shù)字表的應(yīng)用:如果一個(gè)抽樣框是可以得到的,簡(jiǎn)單隨機(jī)抽樣方式步驟如下:(1)對(duì)總體的每個(gè)單位進(jìn)行編號(hào),總體單位數(shù)為10000的總體可編號(hào)為1~10000。(2)在隨機(jī)數(shù)表中從任意的一個(gè)編號(hào)數(shù)開始向上數(shù)或向下數(shù)或跳躍數(shù)選編號(hào),在00001和10000之間選出400個(gè)(樣本單位數(shù))。(3)在有明確總體單位的數(shù)字表中選出的數(shù)字將包括在樣本中注意:使用隨機(jī)數(shù)字表時(shí),為了克服可能的個(gè)人習(xí)慣,增加隨機(jī)性,起點(diǎn)也應(yīng)隨機(jī)產(chǎn)生。如隨意翻開一頁,閉上眼睛,將火柴隨意扔到頁面上,將火柴所指的數(shù)字作為頁號(hào),同樣的方法產(chǎn)生起始行號(hào)和列號(hào)。例一:N=678,要抽取n=5的樣本方法:隨機(jī)確定一個(gè)起點(diǎn)和順序,每次取出三個(gè)數(shù)字,選出頭5個(gè)001~678之間的互不相同的數(shù)字,作為樣本。例二:N=327,要抽取n=50的樣本方法1:如果采用例一的方法效率較低(328~999及000都用不上),所以可以采用變通的方法,如果抽取的隨機(jī)數(shù)在401~800之間,則減去400,減去400后的數(shù)字如果在001~327之間就選為樣本。方法2:如果得到的隨機(jī)數(shù)大于327,則用這個(gè)數(shù)字除以327,以余數(shù)入樣。簡(jiǎn)單隨機(jī)抽樣的優(yōu)缺點(diǎn):優(yōu)點(diǎn):簡(jiǎn)單,并且滿足概率抽樣的一切必要的要求。缺點(diǎn):編制完整的抽樣框極其困難;訪談費(fèi)用過高;可能會(huì)抽中一個(gè)很差的樣本;沒有利用輔助信息,效率低下。11.3概率抽樣方法-等距抽樣調(diào)查人員必須決定一個(gè)間隔,并在此間隔基礎(chǔ)上從總體單位表中選擇樣本公式:樣本距離=總體單位數(shù)/樣本單位數(shù)抽樣的步驟:1.確定間隔2.確定起點(diǎn)3.抽樣
例一:N=54,n=6,用等距抽樣抽選樣本方法:確定樣本距離(k=9),在1~9之間隨機(jī)確定起點(diǎn),最后確定樣本。例二:N=53,n=6,用等距抽樣抽選樣本確定樣本距離(k≈9),在1~9之間確定起點(diǎn),如果起點(diǎn)在1~8則樣本數(shù)為6個(gè),如起點(diǎn)為8,則樣本為8、17、26、35、44、53;如果起點(diǎn)為9點(diǎn),則樣本為9、18、27、36、45,只有5個(gè)。解決辦法:圓形抽樣法等距抽樣的優(yōu)缺點(diǎn):相對(duì)于簡(jiǎn)單隨機(jī)抽樣方式其最主要的優(yōu)勢(shì)就是經(jīng)濟(jì)性:更為簡(jiǎn)單,花的時(shí)間更少,花費(fèi)也少;樣本分布比簡(jiǎn)單隨機(jī)抽樣好;最大的缺陷在于總體單位的排列上。一些總體單位數(shù)可能包含隱蔽的形態(tài),調(diào)查者可能疏忽,把它們抽選為樣本。11.3概率抽樣方法—分層抽樣程序:把總體各單位分成兩個(gè)或兩個(gè)以上的相互獨(dú)立的完全的組(如男性和女性),而后從兩個(gè)或兩個(gè)以上的組中簡(jiǎn)單隨機(jī)抽樣,樣本相互獨(dú)立。分層抽樣有三個(gè)步驟:首先,利用抽樣框中的輔助信息進(jìn)行分層。分組的標(biāo)志一般與所關(guān)心的總體特征有關(guān),例如調(diào)查吸煙狀況,很明顯男女的吸煙狀況可能存在不同,因此可以用性別來進(jìn)行分組。第二,確定在每個(gè)層次上總體的比例。等比例和不等比例的分配。等比例分配操作簡(jiǎn)單,容易理解;不等比例的分配可以提高效率,例如有的層規(guī)模太小等比例分配只能獲得很少量的樣本,有的層方差很大,多分配樣本可以提高精度。最后,調(diào)查者必須從每層中抽取獨(dú)立隨機(jī)樣本。分層抽樣的最大的優(yōu)點(diǎn)在于由于減少了誤差的來源提高了調(diào)查的精度。例一:假設(shè)某產(chǎn)品的消費(fèi)群體中有40%是男性,60%是女性,分層抽樣可以將總體按性別分為兩個(gè)層次,男性層抽取40%的樣本,女性層抽60%的樣本。可以想象簡(jiǎn)單隨機(jī)抽樣很難準(zhǔn)確抽出這一比例。例二:某宿舍有6人,新生3人,老生3人?,F(xiàn)欲抽取2個(gè)樣本,估計(jì)該宿舍平均擁有數(shù)的數(shù)目。用簡(jiǎn)單隨機(jī)抽樣得到的均值范圍是3~23。如果分層抽樣,則均值范圍是11~15。真實(shí)值是13本。編號(hào)老生擁有書編號(hào)新生擁有書A20D2B22E4C24F6合計(jì)66合計(jì)1211.3概率抽樣方法-整群抽樣樣本是一組單位一組單位地抽取。步驟:同質(zhì)總體被分為相互獨(dú)立的完全的較小子集,而后隨機(jī)抽選子集構(gòu)成樣本。采用整群抽樣的原因主要在于:實(shí)施方便,節(jié)省時(shí)間和費(fèi)用;缺乏總體單位的抽樣框可以進(jìn)行整群抽樣,例如沒有全市中學(xué)生的名錄但是擁有學(xué)校的名錄,就可以整群抽取。整群抽樣的主要弱點(diǎn)在于,群內(nèi)各單位之間存在相似性,差異比較小,而群與群之間的差別比較大,使得整群抽樣的抽樣誤差比較大。本書中的整群抽樣實(shí)際上包含多階抽樣。地理區(qū)域抽樣是整群抽樣的典型方式。示例:在一個(gè)州內(nèi)的調(diào)查可以如下抽樣:(1)選取這個(gè)州內(nèi)的縣以表明不同區(qū)域都有代表性,縣也許是通過與縣中家庭數(shù)成正比的方式抽出,家庭數(shù)目較多的縣比家庭數(shù)目較少的縣抽中的機(jī)會(huì)要大一點(diǎn)。(2)在樣本縣中抽住宅區(qū)域。(3)在中選住宅區(qū)域中抽家庭。11.4非概率抽樣指任何不滿足概率抽樣要求的抽樣。1、便利抽樣依據(jù)便利原則抽取樣本,典型的方式是“攔截式調(diào)查”2、判斷抽樣基于個(gè)人主觀判斷選擇具有代表性的總體單位進(jìn)行調(diào)查的非概率抽樣方法。3、配額抽樣配額抽樣是根據(jù)一定標(biāo)志對(duì)總體分層或分類后,從各層或各類中主觀地選取一定比例的調(diào)查單位的方法。4、滾雪球抽樣滾雪球抽樣是指,通過使用初始被調(diào)查者的推薦來挑選另外的被調(diào)查者的抽樣程序。5、自愿樣本自愿樣本不是經(jīng)過抽取,而是由自愿接受調(diào)查的單位所組成的樣本。特點(diǎn)是:組織方便,成本低廉,雖然樣本結(jié)構(gòu)與總體結(jié)構(gòu)相距甚遠(yuǎn),但是由于參與者大多是對(duì)調(diào)查內(nèi)容關(guān)心的人,對(duì)于了解情況、分析問題、查找原因都是十分重要的信息。例如:飯店的餐桌中央優(yōu)勢(shì)會(huì)有調(diào)查表;報(bào)刊上的問卷等等。6、因特網(wǎng)抽樣因特網(wǎng)抽樣的發(fā)展與因特網(wǎng)的代表性密切相關(guān),從目前來看,因特網(wǎng)依然存在代表性問題,網(wǎng)絡(luò)用戶的特征依然是年輕、受過教育的男性為主。此外由于不存在可以作為抽樣框的包括所有e-mail的中心數(shù)據(jù)庫,因特網(wǎng)抽樣還是一種非概率抽樣。從每人19個(gè)性伴侶看網(wǎng)絡(luò)調(diào)查可信度.mht網(wǎng)絡(luò)調(diào)查的評(píng)價(jià):網(wǎng)絡(luò)調(diào)查.doc網(wǎng)絡(luò)調(diào)查的形式:/s/m/2006-05-11/10061078141.html網(wǎng)站的訪問者因特網(wǎng)調(diào)查是對(duì)那些有意或碰巧訪問某個(gè)組織的網(wǎng)站的自愿的應(yīng)答者進(jìn)行的。這些不受限制的樣本顯然是:便利樣本——他們可能不具有代表性——偶然或選擇偏差;對(duì)網(wǎng)站訪問者進(jìn)行抽樣的一個(gè)更好的方法是隨機(jī)選擇抽樣單位——“彈出式調(diào)查”軟件——隨機(jī)選擇網(wǎng)站訪問者。隨機(jī)的問題:可能讓某個(gè)網(wǎng)址的經(jīng)常訪問者有過多的代表性,而這樣就代表了網(wǎng)站的訪問量,而不是訪問者。討論小組樣本一個(gè)已經(jīng)建立的消費(fèi)者討論小組或其它事先招募的成員討論小組,是一種創(chuàng)立因特網(wǎng)用戶樣本的流行的、科學(xué)的和有效的方法。通常,從一個(gè)討論小組中進(jìn)行抽樣,會(huì)產(chǎn)生很高的回應(yīng)率,因?yàn)?,討論小組的成員已經(jīng)同意與調(diào)研機(jī)構(gòu)的電子郵件或因特網(wǎng)調(diào)查進(jìn)行合作。發(fā)現(xiàn):有兩個(gè)人口統(tǒng)計(jì)小組不能通過因特網(wǎng)抽樣完全涉及:65歲及以上的人(一個(gè)正在迅速增長(zhǎng)的群體);那些年收入在15000美元以下的人。相比之下,18-25歲——一個(gè)傳統(tǒng)調(diào)研方法歷史上很難覆蓋到的群體,現(xiàn)在在因特網(wǎng)上卻極其容易被覆蓋。招募的特別樣本在特別的基礎(chǔ)上,可以創(chuàng)立一個(gè)電子郵件地址的抽樣框架。調(diào)研者可以通過“蝸牛式的傳統(tǒng)信件”或者電話來聯(lián)系應(yīng)答者,尋求他們的電子郵件地址,并且獲得準(zhǔn)許進(jìn)行因特網(wǎng)調(diào)查。使用離線技術(shù),如隨機(jī)數(shù)字撥號(hào)以及簡(jiǎn)短的電話篩選訪問來招募應(yīng)答者,可能獲得具有代表性的因特網(wǎng)調(diào)查樣本??蛻絷P(guān)系庫里包含電子郵件地址(通過要求顧客在產(chǎn)品登記卡上、在電話互動(dòng)中,在網(wǎng)上登記等),可以為樣本招募提供有用的數(shù)據(jù)庫。決定參與的名單在將某個(gè)人的電子郵件地址加入公司數(shù)據(jù)庫之前,應(yīng)確認(rèn)并且再次確認(rèn)每個(gè)人對(duì)交流某個(gè)主題的興趣。不要向應(yīng)答者發(fā)送未經(jīng)授權(quán)的電子郵件,這是很重要的。如果個(gè)人沒有決定接收某個(gè)特定組織的電子郵件,他們可能認(rèn)為這種主動(dòng)提供的調(diào)查請(qǐng)求是一種垃圾郵件。調(diào)研人員不能從這些沒有同意調(diào)查的人里面期待很高的回應(yīng)率。有經(jīng)驗(yàn)的因特網(wǎng)用戶是不能容忍垃圾郵件的,他們可能帶來不好的結(jié)果,產(chǎn)生大量的問題。11.5抽樣中的誤差一、誤差的描述1.估計(jì)量方差2.偏差3.均方誤差二、抽樣誤差抽樣誤差是由于抽樣的隨機(jī)性造成的誤差。可以用估計(jì)量的方差和標(biāo)準(zhǔn)差來度量。影響抽樣誤差的因素有:總體方差、樣本量、抽樣方式、估計(jì)方式。三、非抽樣誤差除抽樣因素以外,由其他原因引起的樣本統(tǒng)計(jì)量與真值之間的差異。引起非抽樣誤差的原因主要有:抽樣框誤差、調(diào)研對(duì)象范圍誤差、訪談員誤差、拒訪誤差、回答偏差等。失敗案例:看起來并不隨機(jī)的隨機(jī)次序籃球運(yùn)動(dòng)員——高潮、低潮;心理學(xué)家訪問費(fèi)城76人隊(duì)的隊(duì)員,運(yùn)動(dòng)員估計(jì),他們?cè)趧偼吨幸粋€(gè)球之后再接著投中,要比失球之后再投中的
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年混凝土工程物流與運(yùn)輸服務(wù)合同
- 2025江蘇店鋪?zhàn)赓U版合同
- 2025年通遼貨運(yùn)從業(yè)資格仿真考題
- 2024年度北京教育培訓(xùn)合作協(xié)議2篇
- 2025主材采購合同
- 融資租賃公司租賃合同
- 2024年商鋪?zhàn)赓U合同模板下載合同條款詳細(xì)說明9篇
- 2024年度人力資源經(jīng)理試用期合同范本(企業(yè)創(chuàng)新)5篇
- 城市排水系統(tǒng)土石方施工協(xié)議
- 2024區(qū)網(wǎng)紅景點(diǎn)民宿租賃合同3篇
- 偏微分方程知到智慧樹章節(jié)測(cè)試課后答案2024年秋浙江師范大學(xué)
- 2024年共青團(tuán)入團(tuán)考試測(cè)試題庫及答案
- 2022年全國應(yīng)急普法知識(shí)競(jìng)賽試題庫大全-下(判斷題庫-共4部分-2)
- 花鍵計(jì)算公式DIN5480
- 《建筑與市政工程施工現(xiàn)場(chǎng)臨時(shí)用電安全技術(shù)標(biāo)準(zhǔn)》JGJT46-2024知識(shí)培訓(xùn)
- 2024年事業(yè)單位招聘考試公共基礎(chǔ)知識(shí)模擬試卷及答案(共七套)
- 《燃?xì)獍踩R(shí)培訓(xùn)》課件
- 高考及人生規(guī)劃講座模板
- 浙教版2023小學(xué)信息技術(shù)五年級(jí)上冊(cè) 第6課《順序結(jié)構(gòu)》說課稿及反思
- 第20課《人民英雄永垂不朽》課件+2024-2025學(xué)年統(tǒng)編版語文八年級(jí)上冊(cè)
- 智能語音應(yīng)用開發(fā)及服務(wù)合同
評(píng)論
0/150
提交評(píng)論