![現(xiàn)代社會(huì)調(diào)查方法之抽樣_第1頁(yè)](http://file4.renrendoc.com/view11/M01/38/09/wKhkGWXZL_uAX_3IAABTRLoD8X8962.jpg)
![現(xiàn)代社會(huì)調(diào)查方法之抽樣_第2頁(yè)](http://file4.renrendoc.com/view11/M01/38/09/wKhkGWXZL_uAX_3IAABTRLoD8X89622.jpg)
![現(xiàn)代社會(huì)調(diào)查方法之抽樣_第3頁(yè)](http://file4.renrendoc.com/view11/M01/38/09/wKhkGWXZL_uAX_3IAABTRLoD8X89623.jpg)
![現(xiàn)代社會(huì)調(diào)查方法之抽樣_第4頁(yè)](http://file4.renrendoc.com/view11/M01/38/09/wKhkGWXZL_uAX_3IAABTRLoD8X89624.jpg)
![現(xiàn)代社會(huì)調(diào)查方法之抽樣_第5頁(yè)](http://file4.renrendoc.com/view11/M01/38/09/wKhkGWXZL_uAX_3IAABTRLoD8X89625.jpg)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
章第四章抽樣抽樣
目的要求掌握概率抽樣的原理、程序與方法;掌握抽樣誤差的概念與測(cè)量方法;熟悉非概率抽樣方法與樣本規(guī)模;了解抽樣的意義;目錄抽樣的意義與作用1概率抽樣的原理與程序2概率抽樣方法3非概率抽樣方法4樣本規(guī)模與抽樣誤差5以上現(xiàn)象是否說明了這樣一個(gè)道理:我們可以通過對(duì)部分的觀察來推論總體的情況?!肮苤懈Q豹,可見一斑”“一葉知秋”在日常生活當(dāng)中所熟知的抽樣有哪些?一、抽樣的意義與作用(一)抽樣的意義
人們?cè)谘芯磕硞€(gè)自然現(xiàn)象或社會(huì)現(xiàn)象時(shí),往往會(huì)遇到不方便、不可能或不必要對(duì)所有的對(duì)象作調(diào)查的情況,于是從中抽取一部分對(duì)象作調(diào)查,這就是抽樣.復(fù)雜的社會(huì)現(xiàn)象有限的研究資源
抽樣主要涉及和處理有關(guān)總體與部分之間的關(guān)系問題。抽樣作為人們從部分認(rèn)識(shí)整體這一過程的關(guān)鍵環(huán)節(jié),其基本作用是向人們提供一種實(shí)現(xiàn)“由部分認(rèn)識(shí)總體”這一目標(biāo)的途徑和手段。抽樣(二)抽樣的作用抽樣是社會(huì)研究的主要內(nèi)容之一,也是社會(huì)調(diào)查的一個(gè)重要步驟。它與研究目的及研究?jī)?nèi)容緊密相關(guān)。它直接關(guān)系到資料的收集、整理與分析。它還涉及到整個(gè)研究的費(fèi)用以及應(yīng)用的范圍。抽樣是否科學(xué),直接關(guān)系到研究的成敗一、抽樣的意義與作用(三)抽樣的相關(guān)概念抽樣(sampling):從組成某個(gè)總體的所有元素的集合中,按一定的方式選擇或抽取一部分元素的過程??傮w(population):構(gòu)成它的所有元素的集合例:四川省應(yīng)屆畢業(yè)生擇業(yè)傾向調(diào)查。通常用N表示樣本(sample)從總體中按一定方式抽取出的一部分元素的集合。例:12.8萬(wàn)名應(yīng)屆畢業(yè)生中抽取1000名大學(xué)生。通常用n表示一、抽樣的意義與作用抽樣單位(samplingunit)一次直接的抽樣所使用的基本單位。抽樣單位與構(gòu)成總體的元素有時(shí)是相同有時(shí)又不同。如12.8萬(wàn)大學(xué)生,當(dāng)以1000名大學(xué)生作為樣本時(shí)?當(dāng)以40個(gè)班級(jí)作為樣本時(shí)?抽樣框(samplingframe)
抽樣范圍,指一次直接抽樣時(shí)總體中所有抽樣單位的名單。例:從一所中學(xué)的全體學(xué)生中抽取200名學(xué)生作為調(diào)查樣本。
從一所中學(xué)的所有班級(jí)中抽取20個(gè)班級(jí)作為調(diào)查樣本。參數(shù)值(parameter)是對(duì)總體中某一變量的綜合描述,或總體中所有元素某些特征的綜合數(shù)量表現(xiàn)。最常見的參數(shù)值是總體某一變量的平均值。參數(shù)值只有對(duì)總體中的每一個(gè)元素進(jìn)行調(diào)查或測(cè)量才能得到。例:某市待業(yè)青年平均年齡,某工廠工人的平均收入。一、抽樣的意義與作用統(tǒng)計(jì)值(statistic)是對(duì)樣本中某一變量的綜合描述,或樣本中所有元素某些特征的綜合數(shù)量表現(xiàn)。根據(jù)樣本計(jì)算出來的關(guān)于樣本變量的數(shù)量表現(xiàn)。統(tǒng)計(jì)值是從樣本中計(jì)算出來的,它是相應(yīng)的參數(shù)值的估計(jì)值。參數(shù)值:確定的、唯一的、未知的。統(tǒng)計(jì)值:變化的。置信度(confidencelevel)總體參數(shù)值落在樣本統(tǒng)計(jì)值某一區(qū)間內(nèi)的概率,或者說,是總體參數(shù)值落在樣本統(tǒng)計(jì)值某一區(qū)間內(nèi)的把握性程度。反映的是樣本的可靠性程度。如置信水平為95%,則表示總體參數(shù)值落在樣本統(tǒng)計(jì)值某一區(qū)間的概率為95%。置信區(qū)間(confidenceintevalue)上述“某一區(qū)間”,就是置信區(qū)間。指在一定置信水平下,樣本統(tǒng)計(jì)值與總體參數(shù)值之間的誤差范圍。與誤差范圍成正比。一、抽樣的意義與作用依據(jù)概率論的基本原理,按照等概率原則進(jìn)行的抽樣,能夠避免抽樣過程中的人為誤差,保證樣本的代表性依據(jù)研究者的主觀意愿、判斷或是否方便等因素來抽取對(duì)象,往往產(chǎn)生較大誤差,難以保證樣本的代表性。(四)抽樣的類型根據(jù)抽取對(duì)象的具體方式分類:概率抽樣非概率抽樣一、抽樣的意義與作用抽樣方法概率抽樣非概率抽樣簡(jiǎn)單隨機(jī)抽樣系統(tǒng)抽樣分層抽樣整群抽樣多段抽樣偶遇抽樣判斷抽樣定額抽樣雪球抽樣(一)概率抽樣的基本原理1.無(wú)意識(shí)抽樣導(dǎo)致的偏差方便獲取的樣本:易得,但缺乏代表性;
例如:如何獲取由100個(gè)學(xué)生構(gòu)成的樣本訪問者的偏好影響樣本的代表性;
例如:有意回避具有某些特(“酷”、“冷”)的受訪者抽樣的地點(diǎn)影響樣本的代表性
例如:圖書館門口訪問二、概率抽樣的原理與程序(一)概率抽樣的基本原理2.同質(zhì)性和異質(zhì)性
買100支單價(jià)為1元的鉛筆,在結(jié)賬的時(shí)候是用乘法還是加法?買10支單價(jià)為1元的鉛筆、20支單價(jià)為2元的簽字筆和30支單價(jià)為5元的鋼筆,結(jié)賬時(shí)該如何計(jì)算?10*1+20+2+30*5100鉛筆具有同質(zhì)性,60支筆具有異質(zhì)性(價(jià)格不同)二、概率抽樣的原理與程序是否可以這樣認(rèn)為?對(duì)于具有同質(zhì)性的總體,我們只需要了解其中一個(gè)成員,就能知道整個(gè)群體的情況;對(duì)于具有異質(zhì)性總體,我們往往需要根據(jù)總體內(nèi)部的不同特征選取一定數(shù)量具有代表性的樣本來推論總體的情況。例:西南醫(yī)科大學(xué)在校生網(wǎng)購(gòu)情況分析研究總體:西南醫(yī)科大學(xué)在校大一、大二、大三學(xué)生是否具有同質(zhì)性?否,不同經(jīng)濟(jì)狀況、消費(fèi)觀念會(huì)導(dǎo)致不同的網(wǎng)購(gòu)行為采用抽樣調(diào)查:選取100個(gè)具有代表性的樣本來推論西南醫(yī)科大學(xué)在校生的網(wǎng)購(gòu)情況。什么樣的樣本才能代表總體的情況?從年級(jí)分類:大一、大二、大三從學(xué)院分類:藥學(xué)院、法學(xué)院、公共衛(wèi)生學(xué)院。。。從性別分類:男、女采用概率抽樣抽取的樣本為什么能代表總體的情況?(二)抽樣分布
抽樣分布是根據(jù)概率的原則而成立的理論分布,它顯示出:從一個(gè)總體中不斷抽取樣本時(shí),各種可能出現(xiàn)的樣本統(tǒng)計(jì)值的分布情況。二、概率抽樣的原理與程序當(dāng)樣本容量為2個(gè)時(shí),根據(jù)組合公式計(jì)算總共可以抽取45個(gè)不同的樣本,這些樣本的平均數(shù)范圍從6.5年(當(dāng))到14.5年,其中會(huì)產(chǎn)生一些相同的平均數(shù),比如6-14,7-13,8-12,9-11這四個(gè)樣本的平均數(shù)都是10年。當(dāng)樣本容量為3個(gè)時(shí),可以抽取120個(gè)樣本,這些樣本的平均數(shù)范圍從7年到14年,其中相同的平均數(shù)更多。當(dāng)樣本容量繼續(xù)增大時(shí)(越來越接近總體的1/2時(shí)),樣本平均數(shù)的分布會(huì)進(jìn)一步發(fā)生變化。趨勢(shì)是:平均數(shù)的范圍將逐步縮?。捶植紙D的底部越來越窄);相同的平均數(shù)會(huì)相應(yīng)增多;全部平均數(shù)的分布向總體平均數(shù)集中的趨勢(shì)也會(huì)越來越明顯。根據(jù)“中心極限定理”,當(dāng)n(抽取的樣本量)足夠大時(shí)(通常假定大于30),無(wú)論總體的分布如何,其樣本平均數(shù)所構(gòu)成的分布都趨于正態(tài)分布。根據(jù)概論統(tǒng)計(jì)理論,正態(tài)根部曲線下的任何部分的面積都可以用數(shù)學(xué)方法推算。這意味著,任何兩個(gè)數(shù)值之間的樣本平均數(shù)次數(shù)所占的比例都是可以求得的。約有68%的樣本平均數(shù)在“”這兩個(gè)數(shù)值的范圍內(nèi)約有95.46%的樣本統(tǒng)計(jì)值落在總體參數(shù)值正負(fù)兩個(gè)標(biāo)準(zhǔn)差范圍內(nèi)。在實(shí)際應(yīng)用中,人們更多的是采用以下幾個(gè)數(shù)字:有90%落在之間;有95%落在之間;如果從反面來考慮這一結(jié)論,可以得出以下推論:對(duì)于任何一次隨機(jī)抽樣來說,其樣本的統(tǒng)計(jì)值落在總體參數(shù)值正負(fù)1.65個(gè)標(biāo)準(zhǔn)差之間的概率是90%。只要我們采用的是隨機(jī)抽樣的方法,就可以根據(jù)抽樣分布,用樣本的數(shù)值來推論總體的情況。界定總體:對(duì)從中抽取樣本的總體范圍與界限作明確的界定制定抽樣框:依據(jù)已經(jīng)明確界定的總體范圍,收集總體中全部抽樣單位的名單,并通過對(duì)名單進(jìn)行統(tǒng)一編號(hào)來建立起供抽樣使用的抽樣框決定抽樣方案:選擇抽樣方法,確定樣本規(guī)模實(shí)際抽取樣本:1.先抽好樣本,再調(diào)查2.一邊抽樣一邊調(diào)查(樣本規(guī)模較大時(shí))評(píng)估樣本質(zhì)量:對(duì)樣本的質(zhì)量、代表性、偏差等進(jìn)行初步的檢驗(yàn)和衡量二、概率抽樣的原理與程序(三)抽樣的一般程序例:西南醫(yī)科大學(xué)在校生學(xué)習(xí)倦怠的原因及影響因素的調(diào)查界定總體:所有西南醫(yī)科大學(xué)在校學(xué)生制定抽樣框:假定有3萬(wàn)名在校生,則需要搜集所有3萬(wàn)名學(xué)生名單,進(jìn)行統(tǒng)一編號(hào)來建立起供抽樣使用的抽樣框。決定抽樣方案:根據(jù)實(shí)際的情況,選擇合適的抽樣方法,并確定樣本規(guī)模。如選擇簡(jiǎn)單隨機(jī)抽樣,樣本規(guī)模為200人。抽取樣本:評(píng)估樣本質(zhì)量:對(duì)樣本的代表性、偏差等進(jìn)行檢驗(yàn)在實(shí)踐上可行可行性目的性最有利于研究資料的獲取和最符合研究的目的與研究的可得資源相適應(yīng)能夠從樣本自身計(jì)算出有效的估計(jì)值或抽樣變動(dòng)的近似值(四)抽樣設(shè)計(jì)的原則美國(guó)抽樣專家科什(kish)教授提出一個(gè)優(yōu)秀的抽樣設(shè)計(jì)應(yīng)該滿足的四條標(biāo)準(zhǔn):經(jīng)濟(jì)性可測(cè)性目的性可行性四條標(biāo)準(zhǔn)之間存在著一定的制約關(guān)系,甚至相互沖突。增加可測(cè)性→加大樣本容量→增加資源→經(jīng)濟(jì)性減弱實(shí)際的抽樣設(shè)計(jì)就是研究者在這四條標(biāo)準(zhǔn)中進(jìn)行取舍和保持平衡的過程三、概率抽樣的方法偶遇抽樣判斷抽樣定額抽樣雪球抽樣簡(jiǎn)單隨機(jī)抽系統(tǒng)多層抽樣分層抽樣整群抽樣多段抽樣概率抽樣非概率抽樣抽樣類型概率抽樣是按照概率原理進(jìn)行的,它要求樣本具有隨機(jī)性,即總體中每一個(gè)成員都有被抽中的可能性。不同形式的概率抽樣對(duì)選擇涉及調(diào)查研究問題的性質(zhì)、良好的抽樣框的獲得、調(diào)查研究經(jīng)費(fèi)的多少、資料收集方法等因素有不同的要求。三、概率抽樣的方法三、概率抽樣的方法
(一)簡(jiǎn)單隨機(jī)抽樣:
又稱純隨機(jī)抽樣,是按照等概率原則直接從含有N個(gè)元素的總體中抽取n個(gè)元素組成樣本(N>n),常用的辦法是抽簽。概率抽樣的最基本形式。要點(diǎn):它要求被抽取樣本的總體的個(gè)體數(shù)有限它是從總體中逐個(gè)進(jìn)行抽取它是一種不放回抽樣它是一種等概率抽樣用從個(gè)體數(shù)為N的總體中抽取一個(gè)容量為n的樣本,那么每個(gè)個(gè)體被抽取的概率等于方法:
1.總體較少:攪拌抽簽;
2.總體較多:用隨機(jī)數(shù)表
抽簽法(抓鬮法)
將總體中的所有個(gè)體(共N個(gè))編號(hào)(號(hào)碼可以從1到N),并把號(hào)碼寫在形狀、大小相同的號(hào)簽上(號(hào)簽可以用小球、卡片、紙條等制作),然后將這些號(hào)簽放在同一個(gè)箱子里,進(jìn)行均勻攪拌。抽簽時(shí),每次從中抽出1個(gè)號(hào)簽,連續(xù)抽取n次,就得到一個(gè)容量為n的樣本。對(duì)個(gè)體編號(hào)時(shí),也可以利用已有的編號(hào)。例如學(xué)生的學(xué)號(hào),座位號(hào)等。三、概率抽樣的方法隨機(jī)數(shù)表法隨機(jī)數(shù)表是統(tǒng)計(jì)工作者用計(jì)算機(jī)生成的隨機(jī)數(shù),保證表中的每個(gè)位置上的數(shù)字是等可能出現(xiàn)的用隨機(jī)數(shù)表進(jìn)行抽樣的步驟:將總體中個(gè)體編號(hào);選定開始的數(shù)字;獲取樣本號(hào)碼用隨機(jī)數(shù)表抽取樣本,可以任選一個(gè)數(shù)作為開始,讀數(shù)的方向可以向左,也可以向右、向上、向下等等。因此并不是唯一的由于隨機(jī)數(shù)表是等概率的,因此利用隨機(jī)數(shù)表抽取樣本保證了被抽取個(gè)體的概率是相等的三、概率抽樣的方法簡(jiǎn)單隨機(jī)抽樣方法的優(yōu)缺點(diǎn)優(yōu)點(diǎn):可能產(chǎn)生代表性樣本缺點(diǎn):不容易做抽樣元素多,編號(hào)難必須能夠接觸到被選中的個(gè)體攪拌均勻不易三、概率抽樣的方法
(二)系統(tǒng)抽樣
定義:等距抽樣或機(jī)械抽樣,將總體的元素編號(hào)排序后,按照固定的間隔抽取個(gè)體組成樣本的方法。系統(tǒng)抽樣的具體步驟1、給總體中的每一個(gè)元素按順序編上號(hào)碼,制定出抽樣框。2、計(jì)算出抽樣時(shí)間距,方法是用總體的規(guī)模除以樣本的規(guī)模。K(抽樣間隔)=N(總體規(guī)模)/n(樣本規(guī)模)3、在最前面的K個(gè)元素中,采用簡(jiǎn)單隨機(jī)抽樣的方法抽取一個(gè)元素,記下這個(gè)元素的編號(hào)(假設(shè)為A),A稱為隨機(jī)起點(diǎn)。4、在抽樣框中,自A開始,每隔K個(gè)元素抽取一個(gè)元素,即所抽元素編號(hào)為A,A+K,A+2K,…A+(n-1)K。5、將這n個(gè)元素合起來,就構(gòu)成了該總體的一個(gè)樣本。三、概率抽樣的方法
系統(tǒng)抽樣例子:某校3000名新生中抽取100名樣本。3000/100=30每隔30人取1名。起始值是2號(hào),下一個(gè)就是32號(hào)。依次類推。注意1:系統(tǒng)抽樣的一個(gè)十分重要的前提條件,是總體中個(gè)體的排列,相對(duì)于研究的變量來說是隨機(jī)的,即不存在某種與研究變量相關(guān)的規(guī)則分布。否則,系統(tǒng)抽樣的結(jié)果將會(huì)產(chǎn)生極大的偏差。
例如:從總體2000戶家庭的社區(qū)中,抽取一個(gè)50戶家庭的樣本進(jìn)行調(diào)查消費(fèi)狀況的調(diào)查,而這2000戶家庭的名單是按每個(gè)家庭總收入的多少,由高到低的順序排列的。初始號(hào)碼為3和38,所抽樣本家庭平均收入有很大區(qū)別,消費(fèi)狀況也有很大區(qū)別。注意2:元素排列的周期性可能導(dǎo)致抽樣的重大偏差!
例如:每個(gè)班級(jí)內(nèi)的50名學(xué)生按照學(xué)生成績(jī)的高低來排序,抽樣間距為50,每個(gè)班抽取一名學(xué)生組成樣本,初始號(hào)碼為2或48號(hào),所抽樣本的平均成績(jī)差別很大系統(tǒng)抽樣的優(yōu)缺點(diǎn)優(yōu)點(diǎn):(1)簡(jiǎn)單易操作(2)當(dāng)對(duì)總體結(jié)構(gòu)有一定了解時(shí),充分利用已有的信息對(duì)總體中的個(gè)體進(jìn)行排隊(duì)后再抽樣,可提高抽樣效率(3)當(dāng)總體中的個(gè)體存在一種自然編號(hào)時(shí),采用系統(tǒng)抽樣比較方便缺點(diǎn):(4)當(dāng)在不了解樣本總體的情況下(如性別差異,經(jīng)濟(jì)基礎(chǔ),個(gè)人喜好,天氣因素等等),所抽出的樣本可能會(huì)有一定的偏差。三、概率抽樣的方法(三)分層抽樣(stratifiedsampling)又稱類型抽樣,它是先將總體中的所有元素按某種特征或標(biāo)志(如性別、年齡、地域等)劃分成若干類型或?qū)哟?,然后再在各個(gè)類型或?qū)哟沃胁捎煤?jiǎn)單隨機(jī)抽樣或系統(tǒng)抽樣的辦法抽取一個(gè)子樣本,最后將子樣本合起來構(gòu)成樣本。
三、概率抽樣的方法
分層抽樣的步驟1.總體與樣本容量確定抽取的比例。2.由分層情況,確定各層抽取的樣本數(shù)。3.各層的抽取數(shù)之和應(yīng)等于樣本容量。4.對(duì)于不能取整的數(shù),求其近似值。
三、概率抽樣的方法分層抽樣舉例
一個(gè)單位的職工有500人,其中不到35歲的有125人,35~49歲的有280人,50歲以上的有95人。為了了解該單位職工年齡與身體狀況的有關(guān)指標(biāo),從中抽取100名職工作為樣本,應(yīng)該怎樣抽?。拷猓撼槿∪藬?shù)與職工總數(shù)的比是100:500=1:5,
則各年齡段(層)的職工人數(shù)依次是125:280:95
=25:56:19,然后分別在各年齡段(層)運(yùn)用簡(jiǎn)單隨機(jī)抽樣方法抽取。答:在分層抽樣時(shí),不到35歲、35~49歲、50歲以上的三個(gè)年齡段分別抽取25人、56人和19人。三、概率抽樣的方法
優(yōu)點(diǎn):在不增加樣本規(guī)模的前提下降低抽樣誤差,提高抽樣精度,增大代表性。便于了解總體內(nèi)不同層次的情況,以及對(duì)總體中的不同層次進(jìn)行單獨(dú)研究或者進(jìn)行比較。缺點(diǎn):
對(duì)抽樣框的要求比較高,必須有分層的輔助信息;收集或編制抽樣框的費(fèi)用比較高;若調(diào)查變量與分層的變量不相關(guān),效率可能降低;三、概率抽樣的方法
分層的標(biāo)準(zhǔn)問題以分析的主要變量或相關(guān)變量作為分層的標(biāo)準(zhǔn)保證各層內(nèi)部同質(zhì)性強(qiáng),各層之間異質(zhì)性強(qiáng)以已有明顯層次區(qū)分的變量作為分層變量
三種抽樣方法的比較類別各自特點(diǎn)相互聯(lián)系適用范圍共同點(diǎn)簡(jiǎn)單隨機(jī)抽樣從總體中逐個(gè)抽取總體中的個(gè)體數(shù)較少抽樣過程中每個(gè)個(gè)體被抽取的概率相等系統(tǒng)抽樣將總體均分成幾部分,按事先確定的規(guī)則在各部分抽取在起始部分抽樣時(shí)采用簡(jiǎn)單隨機(jī)抽樣總體中的個(gè)體數(shù)較多分層抽樣將總體分成幾層,分層進(jìn)行抽取各層抽樣時(shí)采用簡(jiǎn)單隨機(jī)抽樣或系統(tǒng)抽樣總體由差異明顯的幾部分組成簡(jiǎn)單隨機(jī)抽樣最簡(jiǎn)單,但是也是相對(duì)復(fù)雜的。系統(tǒng)抽樣操作簡(jiǎn)單,在有充分的總體信息的前提下,估計(jì)精度比隨機(jī)抽樣高,且操作、簡(jiǎn)單。分層抽樣由于已經(jīng)利用了總體信息,因此估計(jì)精度也比隨機(jī)簡(jiǎn)單抽樣要高。三、概率抽樣的方法
(四)整群抽樣(clustersampling)
將總體按某種標(biāo)準(zhǔn)劃分為一些子群體,每個(gè)子群為一個(gè)抽樣單位,用隨機(jī)方法從中抽若干子群,將抽出的子群中的所有個(gè)體結(jié)合起來構(gòu)成樣本。整群抽樣例子:大學(xué)有100個(gè)班,每班30人,現(xiàn)在抽300人,怎么抽樣?抽10個(gè)班。某城市10萬(wàn)戶,要抽取1000戶,怎么辦?社區(qū)200個(gè),社區(qū)戶數(shù)500。選2個(gè)社區(qū)。三、概率抽樣的方法
整群抽樣特點(diǎn):
抽樣單位不是單個(gè)的個(gè)體,而是成群的個(gè)體優(yōu)缺點(diǎn):
優(yōu)點(diǎn):不需要詳細(xì)的所有元素的名單,簡(jiǎn)單,費(fèi)用低缺點(diǎn):樣本的分布面不廣,代表性相對(duì)較差整群抽樣和分層抽樣的比較:
子群間異質(zhì)性強(qiáng),群內(nèi)同質(zhì)性強(qiáng)——分層抽樣
子群間同質(zhì)性強(qiáng),群內(nèi)異質(zhì)性強(qiáng)——整群抽樣
三、概率抽樣的方法
(五)多階段抽樣(multidstagesampling)
按抽樣元素的隸屬關(guān)系或?qū)哟侮P(guān)系,把抽樣分為幾個(gè)階段進(jìn)行。在社會(huì)調(diào)查中,當(dāng)總體的規(guī)模特別大,或者總體分布的范圍特別廣時(shí),研究者一般采取多段抽樣的方法來抽取樣本。
例1:大學(xué)——院系——班級(jí)——學(xué)生
例2:城市——區(qū)——街道——居委會(huì)——家庭——個(gè)人如調(diào)查“瀘州市青年工人收入狀況”,首先以企業(yè)為單位抽樣,即以全市的企業(yè)為抽樣框,從中隨機(jī)抽取一部分企業(yè)(5);然后在抽中的企業(yè)中以車間為抽樣單位抽樣,即從全部車間中抽取若干個(gè)車間(20):最后,在抽中的車間內(nèi)抽取青年工人(1000人)五種概率抽樣方法比較“四川醫(yī)科大學(xué)在校學(xué)生食堂滿意度調(diào)查”,總共有學(xué)生10000人,其中男生6000人,女生4000人;學(xué)院22個(gè),大一2000人,大二3000人,大三3000人,大四2000人。抽取1000個(gè)樣本。簡(jiǎn)單隨機(jī)抽樣方法:先根據(jù)10000個(gè)學(xué)生的名單制作抽樣框,然后根據(jù)隨機(jī)數(shù)表或抓鬮方式抽取1000名學(xué)生。系統(tǒng)抽樣:先根據(jù)10000個(gè)學(xué)生的名單制作抽樣框計(jì)算抽樣間距:10000/1000=10在10000個(gè)學(xué)生中隨機(jī)抽取一個(gè)學(xué)生:例如33號(hào)在抽樣框中從33號(hào)開始每隔10個(gè)學(xué)生抽取一個(gè)樣本:43、53、63、73......分層抽樣首先把10000名學(xué)生分為男生、女生兩個(gè)部分,男生6000人、女生4000人,比例為3:2采用隨機(jī)抽樣或系統(tǒng)抽樣方法,按照每部分抽取個(gè)體數(shù):該部分的個(gè)體總數(shù)=樣本容量:總體中的個(gè)體數(shù)原則,從女生中抽取400人,男生中抽取600人,組成樣本。或?qū)?0000名學(xué)生分為大一、大二、大三、大四四個(gè)部分,大一2000人,大二3000人,大三3000人,大四2000人采用隨機(jī)抽樣或系統(tǒng)抽樣方法,按照每部分抽取個(gè)體數(shù):該部分的個(gè)體總數(shù)=樣本容量:總體中的個(gè)體數(shù)原則,大一中抽取200人,大二中抽取300人,大三抽取300人,大四中抽取200人,組成樣本。整群抽樣把全校22個(gè)學(xué)院作為抽樣框,從22個(gè)學(xué)院中采用簡(jiǎn)單隨機(jī)抽樣、分層抽樣或系統(tǒng)抽樣的方法抽取3個(gè)學(xué)院,將3個(gè)學(xué)院中所有的學(xué)生所有調(diào)查樣本。多階段抽樣把全校2個(gè)各學(xué)院作為抽樣框,從22個(gè)學(xué)院中采用簡(jiǎn)單隨機(jī)抽樣、分層抽樣或系統(tǒng)抽樣的方法抽取5個(gè)學(xué)院;從5個(gè)學(xué)院的所有班級(jí)作為抽樣框(如80個(gè)班級(jí)),從80個(gè)班級(jí)中采用簡(jiǎn)單隨機(jī)抽樣、分層抽樣或系統(tǒng)抽樣的方法抽取個(gè)40班級(jí);以40個(gè)班級(jí)中的所有學(xué)生作為抽樣框,采用簡(jiǎn)單隨機(jī)抽樣、分層抽樣或系統(tǒng)抽樣的方法抽取1000名學(xué)生作為調(diào)查樣本;三、概率抽樣的方法(六)PPS抽樣是一種常用的不等概率抽樣方法,叫做“概率與元素的規(guī)模大小成比例的抽樣”。多段抽樣中,其實(shí)暗含了一個(gè)假定:即每一個(gè)階段抽樣時(shí),其元素的規(guī)模是相同的。比如第一階段抽取學(xué)校時(shí),暗含了每個(gè)學(xué)校的規(guī)模相同。在這樣的假定下,采取上述幾種隨機(jī)抽樣的方法,最終每名學(xué)生被抽中的概率相等。
但現(xiàn)實(shí)生活中,每一個(gè)學(xué)校包含的學(xué)生人數(shù)不同,因而按照上述多段抽樣的方法來抽取樣本時(shí),最終每名學(xué)生被抽中的概率實(shí)際上是不同的。從100所學(xué)校中抽取10所學(xué)校(規(guī)模不一樣大)假設(shè)甲學(xué)校比較大,有2萬(wàn)名學(xué)生,乙學(xué)校比較小,只有3千名學(xué)生。那么當(dāng)二者在第一階段都被抽中后,第二階段分別從他們中抽取500名學(xué)生,甲學(xué)校學(xué)生被抽中的概率為:(10/100)*(500/20000)=1/400乙學(xué)校學(xué)生被抽中的概率為:(10/100)*(500/30000)=1/600PPS抽樣原理:以階段性的不等概率換取最終的、總體的等概率。做法(以二階段為例):1、在第一階段,每個(gè)群按照其規(guī)模(其所含元素的數(shù)量)被給予大小不等的抽取概率。2、到了第二階段,從每個(gè)抽中的群中都抽取同樣多的元素(也是不等概率的)。正是這一大一小,平衡了由于群的規(guī)模帶來的概率差異。公式每一個(gè)元素被抽中的概率所抽取的群數(shù)總體的規(guī)模群的規(guī)模群的規(guī)模平均每個(gè)群中所要抽取的元素
=
×
×PPS的做法已經(jīng)排除了群的規(guī)模這一影響因素——第一個(gè)分子與第二個(gè)分母相互約掉了——每一個(gè)元素的被選中概率變成了:(所抽取的群數(shù)*每個(gè)群中所抽取的元素?cái)?shù)目)/總體的規(guī)模。這實(shí)際上就是樣本規(guī)模除以總體規(guī)模。PPS的具體操作方法:1、在確定的總體內(nèi),給每個(gè)抽樣單位按序編號(hào),并且寫出它們的規(guī)模;2、累計(jì)相加每個(gè)抽樣單位包含的單位數(shù),并根據(jù)累計(jì)相加結(jié)果確定每個(gè)單位的號(hào)碼范圍;3、采用隨機(jī)數(shù)表的方法或等距抽樣的方法選擇號(hào)碼,號(hào)碼所對(duì)應(yīng)的單位入選第一階段樣本;4、在被抽取的單位中,按照抽樣元素的多少進(jìn)行第二階段抽樣。用PPS方法抽取第一階段樣本舉例學(xué)校序號(hào)學(xué)生人數(shù)/人累計(jì)人數(shù)/人號(hào)碼范圍入選號(hào)碼入樣單位0140004000000001-004000002032單位10250009000004001-00900003320012200009001-012200009786單位2042000032200012201-032200012234029824單位3、405600038200032201-038200………………………………9910000492000482001-492000484551單位201008000500000492001-500000(七)戶內(nèi)抽樣當(dāng)研究者以家庭作為分析單位,以入戶進(jìn)行結(jié)構(gòu)式訪談的方法收集資料時(shí),往往采取多階段的抽樣方法,市(縣)—鎮(zhèn)(鄉(xiāng))—村(街)—居委會(huì)(居民組)—家庭—家庭成員。
——以家庭為單位時(shí),從入選家庭中抽取一個(gè)成年人構(gòu)成訪談對(duì)象的抽樣方法。方法:科什選擇法(kish)如:關(guān)于開展農(nóng)村土地集中化生產(chǎn)調(diào)查研究具體做法:1.調(diào)查表編號(hào):將調(diào)查問卷編號(hào)為A、B1、B2、C、D、E1、E2、F八種,每種表的數(shù)目分別占調(diào)查問卷總數(shù)的1/6、1/12、1/12、1/6、1/6、1/12、1/12、1/6。2.印制選擇卡:印制若干套(1套八種)”選擇卡“發(fā)給調(diào)查員,每人1套。3.給抽中家庭每個(gè)成年人按照男性在前、年齡大的在前的方法進(jìn)行編號(hào)并排序。
4.根據(jù)調(diào)查表上的編號(hào)找出編號(hào)相同的那種“選擇表”查出中選個(gè)體的序號(hào),進(jìn)行調(diào)查。Kish選擇表A式選擇表如果家庭戶中18歲以上人口數(shù)為被抽選人的序號(hào)為11213141516或以上1F式選擇表如果家庭戶中18歲以上人口數(shù)為被抽選人的序號(hào)為11223344556或以上6序號(hào)年齡和性別特征1最年長(zhǎng)的男性2次年長(zhǎng)的男性……n最年幼的男性n+1最年長(zhǎng)的女性n+2次年長(zhǎng)的女性……n+m最年幼的女性序號(hào)成員特征1爸爸50歲2兒子23歲3奶奶70歲4媽媽48歲5女兒27歲序號(hào)成員特征1爸爸50歲2兒子23歲3奶奶70歲4媽媽48歲5女兒27歲F
式選擇表如果家庭戶中18歲以上人口數(shù)為被抽選人的序號(hào)為11223344556或以上6四、非概率抽樣方法
(一)偶遇抽樣定義:方便抽樣或自然抽樣,指研究者根據(jù)現(xiàn)實(shí)情況,以自己方便的形式抽取偶然遇到的人作為對(duì)象,或者僅僅選擇那些離得最近、最容易找到的人作為對(duì)象。適用范圍可用于經(jīng)常性的市場(chǎng)調(diào)查;可用于正式市場(chǎng)調(diào)查之前的試驗(yàn)調(diào)查;任意調(diào)查適用于同質(zhì)總體。優(yōu)點(diǎn):方便、靈活,簡(jiǎn)便易行,及時(shí)取得所需資料,節(jié)約時(shí)間和費(fèi)用成本低缺點(diǎn):樣本的代表性差、有很大的偶然性。例:1.在商場(chǎng)、碼頭等公共場(chǎng)所調(diào)查2.街頭攔截調(diào)查3.報(bào)刊的讀者調(diào)查四、非概率抽樣方法
(二)判斷抽樣:
也叫立意抽樣,研究者根據(jù)自己的主觀判斷來抽選樣本,分為印象判斷抽樣和經(jīng)驗(yàn)判斷抽樣。印象判斷抽樣:純粹憑研究者的主觀印象抽樣經(jīng)驗(yàn)判斷抽樣:根據(jù)以往經(jīng)驗(yàn)和對(duì)調(diào)查對(duì)象的了解抽樣注意的問題:
判斷抽樣的關(guān)鍵是抽樣標(biāo)準(zhǔn)的確立,這種方法的運(yùn)用與研究者本人的因素比如理論修養(yǎng)、實(shí)踐經(jīng)驗(yàn)以及對(duì)調(diào)查對(duì)象的熟悉程度有關(guān)適用場(chǎng)合:多用于無(wú)法確定總體邊界、或總體規(guī)模小、調(diào)查所涉及的范圍較窄,或調(diào)查時(shí)間、人力等條件有限而難以進(jìn)行大規(guī)模抽樣的情況。優(yōu)點(diǎn):可以充分發(fā)揮研究人員的主觀能動(dòng)作用。樣本是按照調(diào)查人員的需要來選定的,所以較好地滿足了特殊的調(diào)查需要。缺點(diǎn):如果調(diào)查人員在選取樣本時(shí)主觀判斷出現(xiàn)偏差,則判斷抽樣極易發(fā)生較大的抽樣誤差。樣本的代表性難以判斷,不能推論。四、非概率抽樣方法
(三)定額抽樣
又稱配額抽樣,先根據(jù)總體各個(gè)組成部分所包含的抽樣單位的比例分配樣本數(shù)額,然后由調(diào)查者在各個(gè)組成部分內(nèi)根據(jù)配額的多少采用偶遇抽樣或判斷抽樣方法抽取樣本。定額抽樣
例:某高校有2000名學(xué)生,其中男生占60%,女生占40%;文科學(xué)生和理科學(xué)生各占50%;一年級(jí)學(xué)生占40%、二年級(jí)、三年級(jí)、四年級(jí)學(xué)牛分別占30%、20%和10%?,F(xiàn)在要用定額抽樣方法依上述3個(gè)變數(shù)抽取一個(gè)規(guī)模為100人的樣本。依據(jù)總體的構(gòu)成和樣本規(guī)模,我們可得到下列定額表
四、非概率抽樣方法
定額抽樣與分層抽樣的區(qū)別在于,定額抽樣最后抽取樣本時(shí)所采用的方法是非隨機(jī)抽樣。配額抽樣的優(yōu)點(diǎn)適用于設(shè)計(jì)調(diào)查者對(duì)總體的有關(guān)特征具有一定的了解而樣本數(shù)較多的情況下,實(shí)際上,配額抽樣屬于先“分層”(事先確定每層的樣本量)再“判斷”(在每層中以判斷抽樣的方法選取抽樣個(gè)體);費(fèi)用不高,易于實(shí)施,能滿足總體比例的要求。配額抽樣的缺點(diǎn)
容易掩蓋不可忽略的偏差四、非概率抽樣方法
(四)滾雪球抽樣
當(dāng)無(wú)法了解總體時(shí),可以從總體中少數(shù)成員入手,對(duì)他們進(jìn)行調(diào)查,并進(jìn)一步詢問還知道哪些符合條件的再進(jìn)一步詢問。例:對(duì)球迷、戲迷的調(diào)查缺點(diǎn):同質(zhì)性較強(qiáng)四、非概率抽樣方法
非隨機(jī)抽樣抽選樣本的質(zhì)量,主要取決于調(diào)查者的主觀狀況和各種偶然因素
溫馨提示
- 1. 本站所有資源如無(wú)特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度學(xué)生保險(xiǎn)居間業(yè)務(wù)合同
- 教育培訓(xùn)行業(yè)經(jīng)驗(yàn)分享指南
- 汽車汽車租賃合同
- 三農(nóng)村電商物流作業(yè)指導(dǎo)書
- 轉(zhuǎn)租房屋租賃合同
- 礦業(yè)與安全技術(shù)作業(yè)指導(dǎo)書
- 房地產(chǎn)中介銷售服務(wù)合同
- 電子電路設(shè)計(jì)與制造作業(yè)指導(dǎo)書
- 組織行為學(xué)作業(yè)指導(dǎo)書
- 雙語(yǔ)藝術(shù)節(jié)之迎新文藝晚會(huì)活動(dòng)方案
- 2025年高考英語(yǔ)一輪復(fù)習(xí)講義(新高考)第2部分語(yǔ)法第23講狀語(yǔ)從句(練習(xí))(學(xué)生版+解析)
- NB/T 11459-2023煤礦井下直流電法勘探規(guī)程
- 十七個(gè)崗位安全操作規(guī)程手冊(cè)
- 爆花(2023年陜西中考語(yǔ)文試卷記敘文閱讀題及答案)
- 自主簽到培訓(xùn)課件-早安!幼兒園
- 小學(xué)項(xiàng)目化學(xué)習(xí)案例
- 2024-2030年中國(guó)大宗商品行業(yè)市場(chǎng)深度調(diào)研及發(fā)展趨勢(shì)與投資前景研究報(bào)告
- 強(qiáng)化提升1解三角形中的三線問題(解析)
- 異地就醫(yī)備案的個(gè)人承諾書
- 2024-2030年中國(guó)ODM服務(wù)器行業(yè)市場(chǎng)發(fā)展分析及前景趨勢(shì)與投資研究報(bào)告
- 室內(nèi)裝飾拆除專項(xiàng)施工方案
評(píng)論
0/150
提交評(píng)論