單元4 第5章 抽樣設計_第1頁
單元4 第5章 抽樣設計_第2頁
單元4 第5章 抽樣設計_第3頁
單元4 第5章 抽樣設計_第4頁
單元4 第5章 抽樣設計_第5頁
已閱讀5頁,還剩59頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

市場調(diào)查與預測第5章

抽樣設計學習目標1.了解選擇調(diào)查對象的各種方法及其使用條件。2.熟悉抽樣調(diào)查的概念及其作用。3.掌握抽樣調(diào)查相關的術語和概念。4.熟悉隨機抽樣與非隨機抽樣各種方法的概念和操作程序,掌握它們的優(yōu)缺點及應用。5.熟悉抽樣誤差的概念及影響抽樣誤差的因素。2023/10/252學習內(nèi)容5.1調(diào)查對象選擇方法介紹5.2抽樣調(diào)查方案設計概述5.3隨機抽樣方法5.4非隨機抽樣方法5.5樣本容量與抽樣誤差 2023/10/253引例

我國1%人口抽樣調(diào)查我國的《全國人口普查條例》(2010年由國務院頒布實施)明確規(guī)定,人口普查每10年進行一次,尾數(shù)逢0的年份為普查年度,在兩次人口普查之間進行全國1%人口抽樣調(diào)查。這項調(diào)查既是我國現(xiàn)有人口統(tǒng)計制度的組成部分,也是我國的一項法律規(guī)定。我國分別在1987年、1995年、2005和2015年進行過四次1%人口抽樣調(diào)查。我國2015年進行的1%人口抽樣調(diào)查時點為2015年11月1日零時。這是為了使1%人口抽樣調(diào)查數(shù)據(jù)與普查數(shù)據(jù)有更好的可比性,我國人口普查的標準時點是普查年份的11月1日零時,在本次人口抽樣調(diào)查之前的人口普查年度是2010,此后的人口普查年度是2020。2015年1%人口抽樣調(diào)查總體是中華人民共和國全部人口,調(diào)查對象是指于調(diào)查標準時點在中華人民共和國境內(nèi)抽中調(diào)查小區(qū)內(nèi)的全部人口(不包括港澳臺居民和外國人)。本次抽樣調(diào)查以各地級市(地區(qū)、盟、州)為子總體,采取分層、二階段、概率比例、整群抽樣方法。具體的抽樣步驟為:第1步,將全國31個省、自治區(qū)、直轄市各自所轄的全部社區(qū)/村級單位按照社會經(jīng)濟發(fā)展指標及地理地形進行分層;第2步,在層內(nèi)按一定的比例抽取社區(qū)/村級樣本單位;第3步,在每個抽中的社區(qū)/村級單位中,在已劃分好的調(diào)查小區(qū)基礎上,采用簡單隨機抽樣的方法,抽取調(diào)查小區(qū)。每個調(diào)查小區(qū)的人口大約200到250人,全國將抽取約6萬個調(diào)查小區(qū)。最終實際樣本量為2131萬人,占全國總?cè)丝诘?.55%。根據(jù)這次人口抽樣調(diào)查的數(shù)據(jù)推斷出,2015年11月1日零時我國大陸31個省、自治區(qū)、直轄市和現(xiàn)役軍人的人口為137349萬人。同第六次全國人口普查2010年11月1日零時的133972萬人相比,五年共增加3377萬人,增長2.52%,年平均增長率為0.50%。經(jīng)事后質(zhì)量抽查,總?cè)丝诘膬袈┑锹蕿?.54%。全國人口中已包括據(jù)此計算的漏登人口數(shù)。5.1調(diào)查對象選擇方法介紹調(diào)查對象選擇方法類型65.1.1普遍調(diào)查

1.定義普遍調(diào)查(EntirePopulationSurvey)指對被調(diào)查對象的所有單位無一例外地逐個進行的調(diào)查。

如:我國于1953年、1964年、1982年、1990年、2000年、2010年和2020年進行的全國人口普查;

我國于2004年、2008年、2013年和2018年進行了四次全國經(jīng)濟普查。普遍調(diào)查主要有兩種方式:

(1)為某個具體的普查項目建立專門性調(diào)查機構(gòu),設計專門的調(diào)查問卷或提綱,招募并培訓專門的調(diào)查員,對總體中的每一個體進行直接調(diào)查獲得資料。

(2)利用統(tǒng)計報表組織對全部總體單位進行資料收集工作。這種方式主要由一些權威組織機構(gòu)。普查中有一種特殊形式,稱之為快速普查,其特點是要求快速、全面、準確地反映情況??焖倨詹樗@取的指標數(shù)量很少,通常只有一兩個,要盡量縮短資料收集的路徑,直接向調(diào)查對象單位布置任務,使用現(xiàn)代先進工具,如電話、傳真、電子郵件等進行調(diào)查。

快速普查只有在一些特殊情況下選用。如在新冠疫情期間,全國疫情信息的獲取就采用了快速普查。并非所有的現(xiàn)象都可選擇普遍調(diào)查。如當總體規(guī)模為無限時,或在調(diào)查過程中對調(diào)查單位具有破壞性的調(diào)查等都不可進行普查。5.1.1普遍調(diào)查

2.特點相對于非全面調(diào)查而言,普遍調(diào)查具有如下特點:

(1)工作量大,費時、費力、費錢。這一特點在總體規(guī)模較大時更加明顯。

以我國1982年第三次人口普查工作所花費的時間、人力和資金成本為例,時間是從1979年底國務院成立人口普查領導小組,至1985年11月宣布正式結(jié)束,歷時近6年;人力資源上正式參與普查的人員包括518萬名普查員,109萬名普查指導員,13萬編碼員,4000多名電腦錄入員,1000多名計算機工件人員;資金花費約4億人民幣,1560萬美元聯(lián)合國資助。(2)資料準確,適于了解總體的基本情況。基于總體的全部單位獲取信息資料,最終得到的結(jié)果能較好地反映總體的特征。(3)調(diào)查項目所獲得的信息比較聚集,因而調(diào)查項目不宜過多,只能了解一些必不可少的基本資料。

特別是在調(diào)查手段智能水平較低和資料分析工具落后的情況下這一特點更加顯著,如我國人口普查調(diào)查項目在1953年只有6項,1982年只有19項,1990年增至23項。2020年由于資料收集智能工具和互聯(lián)網(wǎng)技術的加持使得調(diào)查內(nèi)容增多且效率提高。(4)需高度集中的組織和高度統(tǒng)一的安排,以保證調(diào)查工作的一致性和條理性。這是普查準確的重要條件,有較高挑戰(zhàn)性。綜上所述,在市場調(diào)查實踐中,普遍調(diào)查并不常用。5.1.2抽樣調(diào)查1.定義抽樣調(diào)查(SamplingSurvey)是指按一定的方式從研究總體中選取部分個體單位進行調(diào)查獲取資料,并用這部分個體所得到的調(diào)查結(jié)果推廣到總體中去的一種方法。根據(jù)從總體中選擇樣本時是否遵循隨機原則,可以將抽樣調(diào)查方法分為隨機抽樣和非隨機抽樣兩大類方法。只有隨機抽樣方法獲得的樣本信息才可以從統(tǒng)計意義上推斷總體特征,因此,通常除特別說明外,我們在分析抽樣調(diào)查時主要針對的是隨機抽樣。隨機抽樣及其相關分析的理論基礎是數(shù)理統(tǒng)計,不僅可以根據(jù)樣本資料描述樣本,還可以根據(jù)樣本信息推斷總體特征。2.特點概括而言,抽樣調(diào)查具有以下特點:(1)非常節(jié)省時間、人力和物力。(2)可以比較迅速地獲得資料數(shù)據(jù),很多時候時間對于決策是至關重要的。(3)可以比較詳細地收集信息,獲得內(nèi)容豐富的資料(行為、態(tài)度)。(4)準確性高。雖然抽樣調(diào)查中存在抽樣誤差(或系統(tǒng)誤差)與登記性誤差,但由于調(diào)查工作量小,因而可以通過有效的組織和管理降低登記性誤差;另外,在隨機抽樣中抽樣誤差是可以控制的,因而可以達到準確性的目標。5)應用范圍十分廣泛,具有較大的方便性和靈活性。抽樣調(diào)查適用于所有情形的市場調(diào)查項目。普遍調(diào)查與抽樣調(diào)查各有所長,但在市場調(diào)查實踐中抽樣調(diào)查具有更大的應用場景和更多的應用機會,關于兩者的比較:比較內(nèi)容普查抽樣調(diào)查應用場景1.調(diào)查總體單位數(shù)少;2.結(jié)果有特殊要求和特殊意義的情境各種場景調(diào)查對象全部部分具體方法普查(含快速普查)、全面統(tǒng)計報表隨機抽樣、非隨機抽樣主要優(yōu)點準確性高時間短、成本較小、準確性高、信息較多、應用范圍廣主要缺點成本大、時間長、信息較少、統(tǒng)一組織管理不易在非隨機抽樣的情況下不能準確推斷總體5.1.3典型調(diào)查1.定義典型調(diào)查是一種非全面調(diào)查。是研究者根據(jù)調(diào)查目的,在對總體單位全面分析的基礎上,選擇若干具有代表性的單位進行調(diào)查的方法。典型調(diào)查是中國革命實踐的經(jīng)驗總結(jié),在中國傳統(tǒng)社會經(jīng)濟調(diào)查中應用非常廣泛,如“解剖麻雀”就是其中的經(jīng)典案例。典型調(diào)查成功的關鍵是選擇出真正具有代表性的典型單位。應該關注的幾個方面:(1)要熟悉和把握總體。選擇典型調(diào)查單位時應該對所要調(diào)查的總體有比較全面的了解。(2)要依據(jù)市場調(diào)查項目的調(diào)查目的和要求進行選擇。選擇典型單位要圍繞調(diào)查目的和要求選擇典型單位。(3)要綜合考慮調(diào)查總體的同質(zhì)性、總體規(guī)模和調(diào)查對象的特點等因素的基礎上確定選擇的思路和方法。通常,總體規(guī)模較大時則可以根據(jù)大多數(shù)原則或平均水平原則選擇典型單位。(4)選擇典型單位要具有適當?shù)撵`活性和動態(tài)性。在一項市場調(diào)查項目中可以起初選擇的典型單位并不理想,隨著對總體了解的深入,可以及時根據(jù)需要更換或增減典型單位。2.特點(1)從本質(zhì)來說,典型調(diào)查是一種選擇調(diào)查,是研究者根據(jù)對總體和調(diào)查任務的理解進行的主觀性選擇;(2)從選擇數(shù)量上看,典型調(diào)查是一種小型調(diào)查,通常效率較高,但其結(jié)論的可靠性更多地依賴于研究者對典型的選擇;(3)從調(diào)查具體方法上看,典型調(diào)查是一種解剖麻雀的調(diào)查方法,典型調(diào)查之所以在中國傳統(tǒng)經(jīng)濟社會成為主流的調(diào)查方法是由于當時經(jīng)濟社會現(xiàn)象總體普遍存在異質(zhì)性程度低的特點;(4)從調(diào)查結(jié)果上看,典型調(diào)查是一種側(cè)重于定性分析的調(diào)查研究方式,典型調(diào)查重在對典型的“解剖”,因此通常需要對選擇出的典型單位作較深入的信息收集以更好地看清總體。

綜上所述,典型調(diào)查在針對同質(zhì)性強的總體進行調(diào)查時可以是非常高效高質(zhì)的方法,但它存在諸多局限性:最易受研究者主觀因素的影響;缺少科學的定量分析手段;所代表的總體范圍和調(diào)查結(jié)論的適用范圍不易統(tǒng)一;只適用于同質(zhì)性較強的對象等。在市場調(diào)查實踐中,由于市場調(diào)查總體很少具有這樣的同質(zhì)性特點,因此典型調(diào)查更多地只用于探索性調(diào)查。5.1.4重點調(diào)查1.定義重點調(diào)查是在調(diào)查總體的全部單位中選擇一個或幾個對全局具有決定性的單位進行調(diào)查,并根據(jù)這些總體單位的特征推斷出總體相應特征的調(diào)查方法。重點調(diào)查只適用于具有重點單位的情形,所謂重點單位是指在研究者關注的指標上總體中存在少數(shù)幾個總體單位,它們在這一指標上的數(shù)值總和占總體這個指標值之和的比重很大。譬如,要調(diào)查我國國內(nèi)電商平臺在某個季度的銷售總額,可以通過調(diào)查我國國內(nèi)電商平臺中少數(shù)幾個龍頭電商平臺,如京東、淘寶、唯品會、蘇寧易購、美團、拼多多等在這個季度的銷售總額,并根據(jù)歷史資料統(tǒng)計出這些重點單位銷售總額占比的估計值,由此推算出我國國內(nèi)電商平臺在這個季度的銷售總額。重點單位的選擇是重點調(diào)查成功與否的關鍵。實踐中能否采用重點調(diào)查的方法,是由調(diào)查任務和研究對象的特點決定的。2.特點重點調(diào)查的主要特點是它的適用情形非常特殊,只有在研究者關注的指標上總體只具有少數(shù)幾個重點單位,并且這些總體單位可以較好地反映總體在這個指標上的特征。當總體具有這樣的少數(shù)幾個重點單位時,重點調(diào)查是比較容易組織開展的。另外,重點調(diào)查是一種側(cè)重于定量分析的調(diào)查研究方式。5.1.5個案調(diào)查1.定義個案調(diào)查是對某一具體社會經(jīng)濟單位進行全面深入調(diào)查研究的方法。個案的類型包括各類人員個案、單位或社會團體個案、各類事件個案。個案調(diào)查通常要先確定調(diào)查目標和調(diào)查對象,根據(jù)已掌握的信息列出調(diào)查提綱,做好調(diào)查前的各項準備工作;然后,開展實地調(diào)查,圍繞個案收集資料并進行研判,根據(jù)新的進展調(diào)整調(diào)查思路和提綱,直到達成調(diào)查目標;最后,根據(jù)調(diào)查的全部資料進行系統(tǒng)分析研究,得出結(jié)論并提出建議或?qū)Σ?。如有些汽車整車生產(chǎn)企業(yè)在面對用戶投訴存在某方面產(chǎn)品重大質(zhì)量問題時,需要在作出是否需要召回處置決策前針對這個重大質(zhì)量問題進行深入全面的調(diào)查就屬于個案調(diào)查。2.特點個案調(diào)查過程是一個詳細了解事實的過程,得到的資料十分豐富、生動、細致。個案調(diào)查重視從系統(tǒng)的角度研究個案,重視將調(diào)查對象放到社會的、經(jīng)濟的、文化的背景中去觀察、分析和判斷;重視將調(diào)查對象放在歷史的背景中去觀察、分析和判斷。個案調(diào)查具有以下主要特征:(1)個案調(diào)查側(cè)重于定性研究,個案調(diào)查是通過收集個案多角度資料以深入全面地反映個案,資料豐富且具體,主要以定性資料來描述個案特征;(2)個案研究主觀隨意性較大,受研究者主觀因素的影響較多,缺少嚴密的科學方法。個案調(diào)查的資料都是針對個案的,不同的研究者可能由于其價值觀、知識結(jié)構(gòu)、專業(yè)能力、研究方法偏好和生活經(jīng)歷等因素而對相同的信息產(chǎn)生不同的理解和解讀,這些對最終的研究結(jié)果都會產(chǎn)生比較大的影響。(3)個案調(diào)查對象的規(guī)模一般較小,但強調(diào)對個案調(diào)查的全面、深入和細微,具體調(diào)查方法要求具有靈活性和多樣化,以保證獲得個案各個方面的信息從而對個案有比較全面準確深入的把握。5.2抽樣調(diào)查方案設計概述5.2.1抽樣調(diào)查的概念與作用1.含義抽樣調(diào)查是從所要研究現(xiàn)象全部個體單位中,按一定的方式選取部分個體單位進行調(diào)查,取得資料,并用這部分個體所得到的調(diào)查結(jié)果推廣到總體中去的一種方法。抽樣方法可以分為兩大類:隨機抽樣:簡單隨機抽樣、系統(tǒng)抽樣、分層抽樣、整群抽樣、多階段抽樣和PPS抽樣等非隨機抽樣:偶遇抽樣、判斷抽樣、配額抽樣和滾雪球抽樣等與全面調(diào)查相比,抽樣調(diào)查具有以下三個顯著優(yōu)勢:(1)經(jīng)濟:與全面調(diào)查相比,抽樣調(diào)查的樣本量大大減少,從而可以顯著地節(jié)約人力、物力和財力。(2)高效:由于抽樣調(diào)查只對總體中少量單位進行調(diào)查,故能十分迅速地得到調(diào)查討論。(3)準確:抽樣調(diào)查中參加調(diào)查的人員比較精干,登記性調(diào)查的誤差較小,從而能提高調(diào)查的質(zhì)量。2.作用(1)可以完成全面調(diào)查無法完成的調(diào)查項目??捎糜谀切┎豢赡芑虿槐匾M行全面調(diào)查的社會經(jīng)濟現(xiàn)象。(2)可以較好滿足在資源和時間有限條件下及時高效高質(zhì)完成調(diào)查項目的要求。采用抽樣調(diào)查方式,可節(jié)省人力、物力和時間,達到滿意的調(diào)查效果,這對于企業(yè)需要快速做出是否要抓住稍縱即逝的市場機會決策至關重要。(3)可以高效開展縱向調(diào)查,以把握市場現(xiàn)象隨時間變化的情況或規(guī)律。抽樣調(diào)查可以用較小的成本對同一現(xiàn)象在不同時間進行連續(xù)不斷的調(diào)查,可隨時了解現(xiàn)象的發(fā)展變化情況。(4)可以對全面調(diào)查的質(zhì)量進行驗證,也可以作為全面調(diào)查的補充調(diào)查。譬如,在中國的人口普查年份會通過抽樣調(diào)查(常常是10%)對普查質(zhì)量進行評估,在兩個人口普查年份之間年份開展一次人口抽樣調(diào)查以彌補因兩次普查時間間隔太長而不能準確反映人口狀況的不足,為相關決策提供準確可靠的信息。

抽樣調(diào)查不僅可以應用于市場調(diào)查,作為一種普適性的方法,它具有廣泛的應用領域,如可運用于企業(yè)產(chǎn)品質(zhì)量管理,更好地為企業(yè)決策提供服務。如可以應用于農(nóng)業(yè)領域的新品種培育和選擇、新藥上市場前的各種試驗等。5.2.2常用專業(yè)術語1.總體和樣本總體是指所要調(diào)查對象的全體。樣本是總體的一部分,它由總體中按一定程序抽得的那部分個體或抽樣單元組成。2.總體指標和樣本指標總體指標是根據(jù)總體各單位標志值計算的指標。樣本指標是根據(jù)樣本各單位標志值計算的指標。3.參數(shù)值與統(tǒng)計值參數(shù)值也稱總體值,它是關于總體中某一變量的綜合性描述,或者說是總體中所有元素的某種特征的綜合數(shù)量表現(xiàn)。參數(shù)值只有對總體中每一元素都進行調(diào)查或測量才能得到。常用希臘字母表示,如總體平均數(shù)μ、總體比例π、總體方差σ2。統(tǒng)計值也稱樣本值,它是關于樣本中某一變量的綜合性描述,或者說是樣本中所有元素的某種特征的綜合數(shù)量表現(xiàn)。是相應的參數(shù)值的估計值。常用羅馬字母表示,如樣本平均數(shù)Χ、樣本比例ρ、樣本方差S2。案例:1996年美國總統(tǒng)選舉預測結(jié)果與實際結(jié)果的比較(%)民意測驗機構(gòu)克林頓多爾佩羅特

其他Hotline/Battleground路透社/Zogby哈里斯民意測驗NBC/華爾街時報蓋洛普民意測驗Pew研究中心美國廣播公司CBS/紐約時報494951515152525440413938383839359899987922122222實際投票結(jié)果494192統(tǒng)計值與參數(shù)值有什么區(qū)別?兩者的重要區(qū)別:參數(shù)值是唯一的、確定不變的,通常是未知的;

統(tǒng)計值是隨樣本的不同而變化的,對特定的樣本是可以計算的。從樣本的統(tǒng)計值來推斷總體的參數(shù)值是市場調(diào)查的重要內(nèi)容。4.重復抽樣和不重復抽樣重復抽樣又稱回置抽樣,是一種在總體中允許重復抽取樣本單位的抽選方法,即從總體中隨機抽出一個樣本單位后,將它再放回去,使它仍有被抽取的機會,在抽樣過程中總體單位數(shù)始終相同,被抽中樣本單位的概率也完全相等。不重復抽樣又稱不回置抽樣,即先被抽選的樣本單位不再放回到總體中去,即任何樣本單位一經(jīng)抽出,就不再有第二次被抽取的可能性。思考:哪種方法更滿足隨機原則?哪種方法的操作性更好?實踐中如何選擇這兩種方法?5.抽樣框和抽樣單元抽樣單元是指將總體劃分為有限個互不重疊而又完備的部分,每一個這樣的部分作為一次直接抽樣所使用的基本單位時,這些基本單位被稱為抽樣單元。抽樣單元可大可小。抽樣框,也稱抽樣范圍,是指一次直接抽樣時總體中所有抽樣單位的名單。

抽樣框一般可采用現(xiàn)成的名單,如街道中的社區(qū)名單、單位電話號碼簿、企業(yè)協(xié)會單位名錄、住戶登記表、用戶名單等。在利用現(xiàn)有名單作為抽樣框時,要先對該整個名單進行審核和檢查,避免有重復或遺漏現(xiàn)象的出現(xiàn),以提高抽樣框?qū)傮w的代表性。抽樣框和抽樣單元這一組概念可以看作是為了滿足市場調(diào)查實踐而對總體與總體單元概念的拓展。例:在全國性消費服務滿意度調(diào)查中可以分別設計如下兩種抽樣調(diào)查方案:(1)設置省、直轄市和自治區(qū)為一級抽樣單元,省下面的地級市設置為二級單元,城市中的街道可以設置為三級單元,消費者設為四級單元,抽樣方案按照不同級別的抽樣單元分別進行。如第二級中江蘇省有13個地級市,那么這13個地級市構(gòu)成對應的抽樣框,其中的每一個地級市都是抽樣單元。(2)把全國所有的消費者作為抽樣框,其中的每一個消費者是抽樣單元。6.置信度和置信區(qū)間置信度和置信區(qū)間是在進行區(qū)間估計時用到的一組概念,反映了由統(tǒng)計值來推斷參數(shù)時的基本原理。置信度指由樣本統(tǒng)計值構(gòu)造的置信區(qū)間中有多大比例包含了總體參數(shù)值,它反映的是抽樣的可靠程度。置信區(qū)間是與一定的置信度相對應的,是基于樣本統(tǒng)計值構(gòu)造的總體參數(shù)值可能的取值范圍,置信區(qū)間上下限的寬度能夠反映抽樣的精確程度。置信區(qū)間越大,抽樣的精確程度就越低。5.2.3抽樣方案設計所謂抽樣方案設計,就是從一定總體抽取樣本以前,預先確定抽樣程序和方案,在保證所抽選的樣本對總體有充分代表性的前提下,力求取得最經(jīng)濟、最有效的結(jié)果。抽樣方案是指導抽樣實踐的具體計劃和項目指南。抽樣方案設計的基本內(nèi)容有:第一,確定抽樣調(diào)查的目的、任務和要求;第二,確定調(diào)查對象的范圍和抽樣單元;第三,確定抽取樣本的方法;第四,確定必要的樣本量;第五,對主要抽樣指標的精度提出要求;第六,確定總體目標量的估算方法;第七,制定實施總體方案的辦法和步驟;第八,評估樣本質(zhì)量。抽樣方案設計的主要程序:確定必要的樣本量實施抽樣選擇抽樣技術確定總體目標量的估算方法定義總體及抽樣單位確定所采集的抽樣框界定總體的重要性:界定總體就是在具體抽樣前,對從中抽取樣本的總體范圍與界限作明確的界定,這一方面是調(diào)查目的決定的,另一方面也是達到良好的抽樣效果的前提條件。案例:1936年美國《文摘》雜志對總統(tǒng)大選進行民意測驗:發(fā)出1000萬

詢問明信片【依據(jù)電話號碼簿和汽車登記簿】,收回200萬份,其調(diào)查結(jié)果極其自信地預測共和黨候選人蘭登將以領先15%的得票率戰(zhàn)勝民主黨候選人羅斯福而當選總統(tǒng)。然而……思考:調(diào)查一個網(wǎng)站的點擊率和人氣情況,可以該網(wǎng)站注冊電子郵箱的客戶作為研究的總體?

不能!

因為有可能同一個人在同一個網(wǎng)站注冊幾個賬戶,一部分人注冊過以后很少用,甚至根本就沒有用過該賬戶,都應該排除在抽樣的總體之外。因此在確定調(diào)查總體時除了要明確調(diào)查對象以外,還要確定是否具有可操作性。如果不清楚明確地界定總體的范圍與界限,即使采用嚴格的抽樣方法,也可能抽出對總體嚴重缺乏代表性的樣本來。5.3隨機抽樣方法5.3.1簡單隨機抽樣

簡單隨機抽樣又稱為純隨機抽樣,從一個包含N個單位的總體中,按隨機原則抽取n個單位作為樣本。簡單隨機抽樣是一般統(tǒng)計推斷方法假設的條件和前提,換言之,在統(tǒng)計推斷時大多數(shù)方法都是針對簡單隨機抽樣的。1.簡單隨機抽樣的方法

簡單隨機抽樣一般可采用擲硬幣、抽簽、查隨機數(shù)表等方法抽取樣本。(1)抽簽法具體操作步驟:首先,給總體的每個單位編號;接著,做成號簽,要保證所有的號簽看不出任何區(qū)別,即無法直觀辨別;然后,把號簽充分混合之后,抽取所需單位數(shù);最后,按照抽中的號碼,查對調(diào)查單位,加以登記。(2)隨機數(shù)表法隨機數(shù)表是將0-9十個數(shù)字用完全隨機順序排列編制而得的表隨機數(shù)表法的基本步驟:

第一步將總體中的每一個單元都編上號,要注意的是,所有號碼的位數(shù)均應相同,如N=599,則所有元素的編號依次為001-599。當總體規(guī)模是100、1000、10000之類的數(shù)值時,需要從0開始編碼。

第二步從隨機數(shù)表的任一位置開始,向任何一個方向連續(xù)地摘錄數(shù)字。

第三步將得到的數(shù)字按上邊編號的位數(shù)分割為若干組數(shù)碼,得到的數(shù)碼所對應的單元即入樣,重復的數(shù)碼和沒有對應單元的數(shù)碼去掉,直至抽足所需樣本量為止。簡單隨機抽樣的優(yōu)點:(1)方法簡單直觀,當總體名單完整時,可直接從中隨機選取樣本;(2)由于抽取概率相同,計算抽樣誤差及對總體指標進行推斷時比較方便。簡單隨機抽樣的缺點:(1)在實際調(diào)查中,編制和獲得完整的抽樣框是非常困難的,有時甚至是不可能做到的;(2)簡單抽樣得到的樣本較為分散,會消耗比較大的調(diào)查成本。簡單隨機抽樣適合于總體單位數(shù)不是很龐大,而且總體分布比較均勻的情況。利用SPSS實現(xiàn)簡單隨機抽樣的步驟:在已建立的抽樣框數(shù)據(jù)編輯窗口中,單擊“數(shù)據(jù)”——“選擇個案”,出現(xiàn)“選擇個案”對話框。選中“隨機個案樣本”,點開“樣本”。如果是精確抽樣,則輸入樣本量和總體規(guī)模;如果是近似抽樣,根據(jù)抽樣的比率,輸入百分比。單擊“繼續(xù)”后,選中“過濾掉未選定的個案”,最后點擊“確定”,得到的隨機樣本數(shù)據(jù)集。思考:如何利用EXCEL實現(xiàn)簡單隨機抽樣?5.3.2系統(tǒng)抽樣

系統(tǒng)抽樣(Systematicsampling)也叫等距抽樣,是指按隨機原則在總體單位中等間距地抽取樣本。通常需要先對總體的每個單元進行編號,使之按照一定順序排列,然后按一定間隔選取樣本的抽樣方法。使用系統(tǒng)抽樣方式的前提條件是必須獲得完整的總體名單或良好的抽樣框,這一點與簡單隨機抽樣是一樣的。抽樣間隔的運算公式如下:

抽樣間距=總體規(guī)模/樣本容量用字母表示為

K=N/n。例請運用系統(tǒng)抽樣方法,從120戶居民家庭戶中選出9戶作為調(diào)查樣本。具體操作過程如下:第一步對120戶居民家庭編號,編號為“1”到“120”;第二步計算抽樣間隔K=[120/9]=13(利用四舍五入取整數(shù));第三步隨機抽取第一個編號,具體做法是:利用簡單隨機抽樣方法從編號為1-13的家庭中隨機抽取第一個編號;第四步從第一個被抽中的家庭編號開始,每隔13抽取一個編號,總共抽取9個編號。如第一個編號為8,則其他被抽中的編號分別為21、34、47、60、73、86、99、112;第五步將被抽中編號對應的家庭找出,即構(gòu)成調(diào)查樣本。在EXCEL的“數(shù)據(jù)分析”工具中有一個“抽樣”工具,有助于更加高效地完成隨機數(shù)表法抽樣或系統(tǒng)抽樣等。系統(tǒng)抽樣的重要前提條件:總體中個體的排列相對于研究的變量來說應該是隨機的,即不存在某種與研究變量相關的規(guī)則排列,否則系統(tǒng)抽樣將會出現(xiàn)極大的偏差。因此,在給抽樣框編號時,應該注意以下兩種情況:1、總體名單中,個體的排列具有某種次序上的先后、等級上的高低的情況。例1112131415……5657585960共50個數(shù)抽10個計算平均數(shù),會出現(xiàn)什么情況?樣本代表性如何?

2、總體名單中,個體的排列上有與抽樣間隔對應的周期性分布。例60657075806065707580……6065707580共50個數(shù)抽10個計算平均數(shù),會出現(xiàn)什么情況?樣本代表性如何?問題:遇到以上兩種情況怎么辦?5.3.3分層抽樣分層抽樣(Stratifiedsampling)又稱類型抽樣,是根據(jù)市場調(diào)查的目的和總體單位的特征,按總體單位的某個或多個重要標志將總體劃分成若干個互不重疊且完備的子總體(也可稱之為層),并將總樣本量分配到各子總體;在各層中選用簡單隨機抽樣或者系統(tǒng)抽樣等方式抽取樣本單位;最后將各層抽得的子樣本放到一起就構(gòu)成總樣本。分層抽樣時可以根據(jù)調(diào)查的具體要求,按照一個或多個總體單位標志進行分層。分層抽樣在實踐中應用廣泛,因為它具有如下的優(yōu)點:(1)在不增加總樣本量的前提下可以有效降低抽樣誤差,提高抽樣精度,使總體更具代表性。(2)不僅有利于了解總體內(nèi)各層的特征,而且也可以選擇某些層進行單獨研究或比較研究。(3)從對調(diào)查活動的管理和具體實施角度看,分層抽樣比簡單隨機抽樣便利得多。

例:假設總體是30,000人,從中抽取1,000人作樣本。按照年齡指標來分層的。如下圖所示

5.3.4整群抽樣整群抽樣(Clustersampling)是先根據(jù)調(diào)查目的和總體特征將總體劃分為若干互不重疊且完備的群;然后,采用某種隨機抽樣方法,從所有的群中直接抽取一個個群;最后,將抽中的所在群中的全部單元放到一起構(gòu)成樣本的抽樣方法。要注意的是,分層抽樣和整群抽樣都是先將總體劃分為互不重疊且完備的若干部分(層或群),但是劃分的原則是不一樣的。在分層抽樣時,是要將在單體單元某些標志特性比較一致的單元分為一層,要求各層之間的差異性比較大為宜。在整群抽樣中分群時的要求則恰恰相反,要求各群之間的差異較小,每個群中各單元的差異較大。整群抽樣的一個顯著特點是對群直接進行隨機抽樣,只要群被抽到了,那么這些群中的所有單元都全部進入樣本。這樣抽取樣本的結(jié)果往往會使得樣本比較集聚,不太分散,從調(diào)查實施的角度看比較易于管理,但從樣本的代表性看就會有些欠缺。

例南京某高校開展大學生對校食堂服務滿意度的調(diào)查。該校有20000名在校本科生全部住在學校學生宿舍,希望抽取約10%的學生進行調(diào)查,用整群抽樣法抽樣時,可以按宿舍來劃分,每一個宿舍作為一個群。假設該校所有在校本科生住在530個學生宿舍,從中抽取55個宿舍進行調(diào)查,抽樣過程見圖整群抽樣具有以下優(yōu)點和缺點:整群抽樣的優(yōu)點有:組織實施比較方便,一旦選定了那些群就可以抽出許多相對集中的單位進行調(diào)查;適用條件寬松,不需要完整的抽樣框,只需要群的名單,且不需要群內(nèi)單元的名單,這就使得抽樣工作大為簡化,這也是整群抽樣在實踐中得到應用的重要原因。整群抽樣的缺點主要表現(xiàn)在這種方法獲得的樣本往往分布不夠廣泛,對總體的代表性相對較差,可能會導致調(diào)查結(jié)果偏差較大。5.3.5多階段抽樣多級抽樣(Multistagesampling)又叫多階段抽樣。在很多情況下,特別是復雜的、大規(guī)模的市場調(diào)查中,調(diào)查單位一般不是一次性直接抽取到的,而是采用兩階段或多階段抽取的辦法,即先抽取大的單元,在大單元中再選取小單元,再在小單元中選取更小的單元,這種抽樣方式稱為多級抽樣。按照多階段抽樣中通常的抽樣次序可以把抽樣單位分為初級抽樣單位PSU、次級抽樣單位SSU和末端抽樣USU等類型。初級抽樣單位(Primary

Sampling

Unit,

PSU):多階段抽樣中第一階段抽樣單位。

經(jīng)驗:

PSU抽樣單元數(shù)是相應階段設計樣本量的3倍或以上,否則降低抽樣對象的層級。次級抽樣單位(Secondary

Sampling

Unit,

SSU)指用于第二階段抽樣的單位。

經(jīng)驗:1、

為保證SSU的可比性,在制作抽樣框時,對過大的單元要拆分,對過小的單元要合并,主要考慮其與下一級的抽樣比。2、越接近于末端抽樣,越需考慮調(diào)查實施,SSU的數(shù)量反而不宜過多,即不宜給實施帶來過多困境.末端抽樣(Ultimate

Sampling

Unit,

USU)

指抽取研究(調(diào)查)對象的抽樣階段。通常采用簡單易行的抽樣方法多階段抽樣適用于大規(guī)模調(diào)查,它組織實施的便利程度和抽樣精度介于分層抽樣和整群抽樣之間。對于那些抽樣單位數(shù)多且較分散的總體,由于編制抽樣框較為困難,或者難以直接抽取所需樣本,就可以利用多級抽樣方法完成。例某市有60萬企業(yè)職工,他們屬于全市160家不同規(guī)模的企業(yè),現(xiàn)打算從中抽取2000名職工進行調(diào)查.采用二階段抽樣,步驟:第一步,從160家企業(yè)中按隨機原則抽取40家企業(yè);

第二步,從被抽中的這40家企業(yè)中分別抽50名職工構(gòu)成樣本。抽樣過程見圖實踐中,有兩個重要的技術問題需要重視

一是每個階段抽樣框的設計

二是每個階段抽樣樣本量的確定。如何確定每一級抽樣檢查的單位數(shù)呢?主要考慮因素:1.各抽樣階段中的子總體(即該階段的抽樣單元)同質(zhì)性程度。2.各階段子總體的數(shù)量。3.研究者所擁有的人力、時間和經(jīng)費等條件。。?減少誤差的方法:相對增加開頭階段的樣本數(shù)而適當減少最后階段的樣本數(shù)。

5.3.6PPS抽樣

PPS抽樣(SamplingwithProbabilityProportionaltoSize)的中文名為“概率與元素規(guī)模大小成比例的抽樣”主要解決多階段抽樣中某些階段抽樣單元在調(diào)查對象上的規(guī)模差異較大而導致最終樣本代表性不好的問題PPS抽樣本質(zhì)上是改進多階段抽樣方法中因某些階段抽樣單元規(guī)模不等情況下的不等概率抽樣,旨在提高樣本對總體的代表性表5-4用PPS方法抽取第一階段樣本序號規(guī)模所占比例‰累計‰選擇號碼范圍所選號碼入樣單元企業(yè)190001515000-0140121企業(yè)260001025015-024

企業(yè)3150002550025-0490482企業(yè)4600151050

企業(yè)51200253051-052

企業(yè)660001063053-062

企業(yè)7180003093064-0920893┇┇┇┇┇

企業(yè)1582400040939899-9389031企業(yè)1593600060999939-998948、99519、20企業(yè)16060011000999

PPS抽樣的具體步驟:

1、將某一階段各抽樣單元排列起來,寫出它們的規(guī)模,計算它們在總體中所占比重。

2.將每個抽樣單元規(guī)模所占千分比進行向上累計,并填入表格第四欄“累計‰”。

3.運用隨機數(shù)表法或系統(tǒng)抽樣方法對抽樣框進行抽樣。

4.確定每個抽中單元的樣本量。在PPS抽樣中規(guī)模較大的抽樣單元被抽中的機會可能不止一個,要準確統(tǒng)計出每個抽樣單元被抽中的次數(shù)。

在下一個階段,要從這個抽樣單元中抽取的樣本量等于每份樣本數(shù)乘以被抽中的次數(shù)。5.4非隨機抽樣方法一般而言,任何不滿足概率抽樣要求的抽樣方法都被稱為非概率抽樣。

使用非隨機抽樣方法通常比用隨機抽樣的方法抽樣要省錢、省事得多,但是其缺點也比較明顯,不能計算抽樣誤差,這就意味著評估和預測樣本數(shù)據(jù)質(zhì)量和結(jié)果存在很大的困難。非隨機抽樣法經(jīng)常使用的主要有四種方法:5.4.1方便抽樣方便抽樣又稱偶遇抽樣,是根據(jù)調(diào)查者的方便與否來抽取樣本的一種抽樣方法。

通常在街頭向行人詢問對市場物價的看法,或請行人填寫某種問卷的做法都屬于偶遇抽樣。方便抽樣簡便易行,能及時取得所需的信息資料,省時、省力、節(jié)約經(jīng)費,但抽樣偏差較大一般用于非正式的探索性調(diào)查,只有在調(diào)查總體各單位之間差異不大時,抽取的樣本才有較高的代表性。5.4.2判斷抽樣判斷抽樣又稱為目的抽樣,它是憑借研究者的主觀意愿、經(jīng)驗和知識,從總體中選擇具有典型性的代表單位作為樣本的一種抽樣方法。應用這種方法的前提條件是調(diào)查者必須對總體的有關特征有相當多的了解。判斷抽樣選取樣本單位一般有兩種方法:

一種是選擇最能代表普遍情況的調(diào)查對象;

另一種是利用調(diào)查總體的全面統(tǒng)計資料,按照一定標準選取樣本。判斷抽樣方法在樣本量小及樣本不易分門別類挑選時有其較大的優(yōu)越性。5.4.3配額抽樣配額抽樣是非隨機抽樣中最流行的一種。配額抽樣也是先將總體中的所有單位按一定的標志分為若干類別(或稱為組),然后在每個類別中用便利抽樣或判斷抽樣方法選取樣本單位。按照配額的要求不同,可以分為獨立控制配額抽樣和交叉控制配額抽樣。

獨立控制配額抽樣是根據(jù)調(diào)查總體的不同特性,對具有某個特性的調(diào)查樣本分別規(guī)定單獨分配數(shù)額,而不規(guī)定必須同時具有兩種或兩種以上特性的樣本數(shù)額。

交叉控制配額抽樣是對調(diào)查對象的各個特性的樣本數(shù)額交叉分配。例:在一個社區(qū)養(yǎng)老服務需求的調(diào)查中,研究者將家庭作為分析單位,打算從社區(qū)中抽取600個家庭作為樣本收集資料。根據(jù)家庭規(guī)模和是否有老人共同生活兩個標志統(tǒng)計了社區(qū)四類家庭的占比,如表所示。根據(jù)樣本規(guī)模為600戶,則從每層次總體中按比例抽取樣本,應在(1)-(4)類別中依次抽取120戶、120戶、210戶和150戶。假如這個項目請30個調(diào)查員進行入戶訪問調(diào)查,則可以指定每個調(diào)查員在(1)、(2)、(3)和(4)類別中分別調(diào)查4戶、4戶、7戶和5戶家庭,也就是說每個調(diào)查員只要按規(guī)定完成這四個類別的配額就可以,不需要過分強調(diào)在每個類別中如何選擇到對應的調(diào)查單位。

類別編號家庭規(guī)模是否有60周歲以上老人共同生活在總體中所占比重(1)3口及以下有20%(2)3口及以下無20%(3)3口以上有35%(4)3口以上無25%配額抽樣類似于隨機抽樣中的分層抽樣,表面上看,配額抽樣的操作方法與隨機抽樣中的分層抽樣非常相似。與分層抽樣有顯著區(qū)別有二:

首先,配額抽樣不需要遵循分層抽樣必須遵循的隨機性原則,而是可以主觀地在各類別中選取相應量的調(diào)查單位,而分層抽樣必須遵守隨機抽樣的原則;

其次,在分層抽樣中,用于分類的指標,應考慮研究目標來選擇,而配額抽樣無此要求。配額抽樣方法簡單易行,可以保證總體的各個類別都能包括在所抽樣本之中,與其他幾種非隨機抽樣方法相比,樣本具有較高的代表性。5.4.4雪球抽樣雪球抽樣(SnowballSampling)是以“滾雪球”的方式抽取樣本。即通過少量樣本單位以獲取更多樣本單位的信息。雪球抽樣的基本步驟是:首先,找出少數(shù)樣本單位;其次,通過這些樣本單位了解更多的樣本單位;再次,通過更多的樣本單位去了解更多更多的樣本單位;如此類推,如同滾雪球,使調(diào)查結(jié)果越來越接近總體。適用于樣本不易識別,或識別成本極高的情況。優(yōu)點是便于有針對性地找到被調(diào)查者,而不至于“大海撈針”。局限性是要求樣本單位之間必須有一定的聯(lián)系,并且愿意保持和提供這種關系,否則,將會影響這種調(diào)查方法的進行,影響調(diào)查效果。5.5樣本容量與抽樣誤差5.5.1調(diào)查誤差的種類和來源調(diào)查誤差是指調(diào)查的結(jié)果和客觀實際情況的出入和差數(shù)。調(diào)查誤差的來源:抽樣誤差和非抽樣誤差。分析者●方法選擇

●模型擬合●解釋預測研究者●理論假設

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論