版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第三講
抽樣的邏輯講解:李素梅第三講
抽樣的邏輯講解:1
總體與抽樣框
概率抽樣的應(yīng)用提綱概率抽樣的實(shí)際操作總體與抽樣框概率抽樣的應(yīng)用提綱概率抽樣的實(shí)際操作2抽樣:從總體中選出具有代表性樣本的過(guò)程。以便通過(guò)對(duì)樣本的研究,取得能說(shuō)明總體的足夠可靠的資料,準(zhǔn)確地推斷總體的情況,從而認(rèn)識(shí)總體的特征或規(guī)律性。從樣本的特征推斷總體的特征統(tǒng)計(jì)值參數(shù)值本樣總體抽樣知識(shí)回顧抽樣原則:樣本具有代表性,即所選取的樣本能再現(xiàn)總體的結(jié)構(gòu)。抽樣:從總體中選出具有代表性樣本的過(guò)程。以便通過(guò)對(duì)樣本的研究3
總體
研究總體
抽樣框
樣本推論的對(duì)象
抽樣的對(duì)象
抽樣的名單
抽到的對(duì)象回顧幾個(gè)概念吧總體研究總體抽樣框樣本推論的4影響樣本代表性的因素樣本容量
抽樣方法
抽樣框、總體是否一致等
抽樣框與總體的關(guān)系:經(jīng)過(guò)正確抽樣所得的樣本信息,只適合于描述構(gòu)成抽樣框的要素組成的總體,是否能擴(kuò)展需要分析。例:對(duì)紐約以及新澤西48個(gè)社區(qū)中68個(gè)藥房藥物的銷售情況進(jìn)行25年的調(diào)查(方法:“調(diào)查鄰近藥房的方式”)----能推斷整個(gè)美國(guó)藥房銷售的情況嗎?或是否能推論紐約和新澤西的藥房的情況?總體與抽樣框影響樣本代表性的因素樣本容量抽樣方法抽樣框、總體是否一致5理想的抽樣框:所有的抽樣單位必須覆蓋總體,抽樣框要求每個(gè)總體單位都應(yīng)該對(duì)應(yīng)著一個(gè)抽樣單位,抽樣單位必須相互獨(dú)立,互不重疊。如以北京的所有街道的名單為一階抽樣中的抽樣框,其必須覆蓋北京所有的街道。最理想的抽樣框隨機(jī)抽取成員組織如學(xué)校等成員總體與抽樣框抽樣框表現(xiàn)形式----例:電話號(hào)碼簿、郵政編碼簿、車主名單、納稅人名單、領(lǐng)有營(yíng)業(yè)執(zhí)照的人員名單;大學(xué)、學(xué)術(shù)期刊、報(bào)紙、工會(huì)等名單理想的抽樣框:所有的抽樣單位必須覆蓋總體,抽樣框要求每個(gè)總體6當(dāng)你用電話簿或名冊(cè)作為抽樣框時(shí),有沒(méi)有注意它是否包含了總體所有單位呢?抽樣框誤差來(lái)源于:
1.不能覆蓋總體單位;2.包含了非總體單位;3.復(fù)合聯(lián)接;
4.抽樣框老化??傮w與抽樣框當(dāng)你用電話簿或名冊(cè)作為抽樣框時(shí),有沒(méi)有注意它是否包含了總體所7非概率抽樣方法就近法、目標(biāo)式抽樣、配額抽樣、滾雪球抽樣確定合適的樣本量執(zhí)行抽樣設(shè)計(jì)界定總體
決定抽樣框確定抽樣步驟抽樣的設(shè)計(jì)概率抽樣方法
簡(jiǎn)單隨機(jī)抽樣、分層抽樣、系統(tǒng)抽樣、整群抽樣、多階段抽樣非概率抽樣方法確定合適的樣本量執(zhí)行抽樣設(shè)計(jì)界定總體決定抽8概率抽樣(ProbabilitySampling)
概率抽樣系統(tǒng)抽樣簡(jiǎn)單隨機(jī)抽樣分層抽樣整群抽樣多階段抽樣概率抽樣:按照概率論和數(shù)理統(tǒng)計(jì)的原理,根據(jù)隨機(jī)原則從調(diào)查研究的總體中抽選樣本,使每個(gè)要素以已知非零的機(jī)會(huì)進(jìn)入樣本的方法。特點(diǎn):1、按隨機(jī)原則抽選樣本;2、總體中每一個(gè)單位被抽中的概率已知非零,樣本具有代表性;3、可以估計(jì)可能出現(xiàn)的誤差并加以控制。
概率抽樣(ProbabilitySampling)9簡(jiǎn)單隨機(jī)抽樣(SimpleRandomSampling)總體各單元不經(jīng)過(guò)任何排隊(duì)或分類,從總體N個(gè)單位中任意抽取n個(gè)單位作為樣本,使每個(gè)可能的樣本被抽中的概率相等的一種抽樣方式,是其他概率抽樣方法的基礎(chǔ)。簡(jiǎn)單隨機(jī)抽樣(SimpleRandomSampling)10 方法:拋硬幣、擲骰子、抽簽、查隨機(jī)數(shù)表等。隨機(jī)數(shù)表法例:(例:K=100,n=10)1.給每個(gè)要素編碼;2.從隨機(jī)表中隨機(jī)選取10個(gè)數(shù)字:確定所選擇的隨機(jī)數(shù)的位數(shù);隨意從隨機(jī)數(shù)表中任何一區(qū)的任何一個(gè)數(shù)目開(kāi)始,依次向各個(gè)方向順序連續(xù)選取數(shù)字。評(píng)價(jià):概率抽樣的理想類型,沒(méi)有偏見(jiàn),簡(jiǎn)單易行。但當(dāng)總體所含個(gè)體數(shù)目太多時(shí),費(fèi)時(shí)、費(fèi)力,費(fèi)用高;而且在總體異質(zhì)性很高時(shí),誤差較大。因此,名冊(cè)齊全的話,一般會(huì)用系統(tǒng)抽樣法而不是簡(jiǎn)單隨機(jī)抽樣法。黑人白人機(jī)會(huì)均等 方法:拋硬幣、擲骰子、抽簽、查隨機(jī)數(shù)表等。隨機(jī)數(shù)表法例:(11
步驟:(1)將總體的所有單位按一定順序排列起來(lái)。(2)計(jì)算抽樣間距:k=總體大小(N)/樣本大小(n)。(3)隨機(jī)確定一個(gè)起點(diǎn)a(1≤a≤k)
作為第一個(gè)樣本單位。(4)每隔k個(gè)單位抽取1個(gè),即由a,a+k,a+2k….a+(n-1)k組成容量為n的樣本。2.系統(tǒng)抽樣(SystematicSampling)亦稱等距抽樣或機(jī)械抽樣,系統(tǒng)化地選擇完整名單中每第K個(gè)要素組成樣本的概率抽樣方法。步驟:2.系統(tǒng)抽樣(Systematic12123456789103132333435363738394021222324252627282930
11121314151617181920N=40n=8k=5
我的fans多得不得了呢.優(yōu)點(diǎn)比簡(jiǎn)單隨機(jī)抽樣方便簡(jiǎn)單樣本在總體中的分布比較均勻局限性是以總體單位的無(wú)規(guī)律排列為前提的,如果總體的排列出現(xiàn)規(guī)律性,特別是周期性時(shí),就可能會(huì)使抽樣出現(xiàn)系統(tǒng)偏差。1234513
如果在一棟公寓樓里選選擇公寓樣本,如上圖樣本間距是8,那么所選樣本的每個(gè)要素可能全是西北角上房間,這樣樣本就可能會(huì)缺乏代表性.如果有周期性,可以采取在每個(gè)間隔內(nèi)隨機(jī)抽取等方法解決。如果在一棟公寓樓里選選擇公寓樣本,如上圖樣本間距是143.分層抽樣(StratifiedSampling)
先將總體按照一種或幾種特征將總體的N個(gè)單位分成互不交叉、互不重復(fù)的若干個(gè)組(層);然后從每層中獨(dú)立、隨機(jī)地抽取一個(gè)子樣本,將子樣本合在一起,即為總體的樣本。腌菜缸廠家想了解各類腌菜的長(zhǎng)度,于是….3.分層抽樣(StratifiedSampling)
先15變量的選擇:1.研究涉及到的主要變量或相關(guān)的變量;2.保證各層內(nèi)部同質(zhì)性強(qiáng)的變量;3.有明顯分層區(qū)分的變量;如:某廠職工購(gòu)買書籍的情況—”文化程度”;某高校宿舍使用電腦情況-“本科生、研究生”等常用指標(biāo):行政區(qū)劃、地理位置、海拔高度、行業(yè)、經(jīng)濟(jì)發(fā)達(dá)程度、企業(yè)規(guī)模、家庭收入水平、性別、年齡、民族等分層應(yīng)遵循原則:盡可能層內(nèi)樣本的變異小,層間變異大。
優(yōu)點(diǎn):1.樣本同質(zhì)性高,樣本分布均勻,樣本結(jié)構(gòu)與總體結(jié)構(gòu)接近;2.也可對(duì)各子層的參數(shù)進(jìn)行推斷;3.組織實(shí)施比較方便。
應(yīng)用上最為普遍。尤其是總體數(shù)目較大,內(nèi)部結(jié)構(gòu)復(fù)雜時(shí)常能取得比較好的效果;
注意:要求調(diào)查者對(duì)總體及各層有一定的了解,否則無(wú)法作出科學(xué)的分類。
變量的選擇:分層應(yīng)遵循原則:盡可能層內(nèi)樣本的變異小,層間變異16
步驟:
1.變量的選擇??砂匆环N或幾種特征對(duì)總體進(jìn)行分層。如調(diào)查某年高考生的語(yǔ)文成績(jī),可根據(jù)科目分類,如文科、理科、藝術(shù)、體育、外語(yǔ)等層次來(lái)進(jìn)行簡(jiǎn)單隨機(jī)抽樣;男性白人、女性白人、男性黑人、女性黑人;2.確定在各層中抽取樣本單位的數(shù)量??刹扇〉缺壤筒坏缺壤槿煞N不同的方法。
步驟:
1.變量的選擇??砂匆环N或幾種特征對(duì)總體進(jìn)行分17a.等比例抽樣要求各層之間的抽樣比例相等。方法1:先分成不同的層,然后采取系統(tǒng)抽樣或者隨機(jī)抽樣按照比例抽取。6040樣本n=100占總體之60%占總體之40%女生N2=400總體(N=1000)男生N1=600a.等比例抽樣要求各層之間的抽樣比例相等。6040樣本n=18 方法2.分類,再把不同類別的要素放到一個(gè)連續(xù)性的列表中,然后再對(duì)整個(gè)列表進(jìn)行隨機(jī)開(kāi)始的系統(tǒng)抽樣。(誤差將會(huì)在1-2個(gè)以內(nèi),如果在此步采取簡(jiǎn)單隨機(jī)抽樣將會(huì)使分層的效應(yīng)被抵消) 方法2.分類,再把不同類別的要素放到一個(gè)連續(xù)性的列表中,19b.不等比例抽樣,加權(quán)即各層之間的抽樣比例不等:有的層次在總體中的比重太小,其樣本量就會(huì)非常少,此時(shí)采用該方法,主要是便于對(duì)不同層次的子總體進(jìn)行專門研究或進(jìn)行比較研究。如果要用樣本資料推斷總體時(shí),則需要先對(duì)各層的數(shù)據(jù)資料進(jìn)行加權(quán)處理,調(diào)整樣本中各層的比例,使數(shù)據(jù)恢復(fù)到總體中各層實(shí)際的比例結(jié)構(gòu)。例:N=120n=60各層人數(shù)不等比例樣本樣本概率值加權(quán)重本科生60201/33碩士生40201/22博士生202011
基本上一個(gè)樣本成員的權(quán)重,應(yīng)該是其獲選為樣本概率值的倒數(shù)。加權(quán):由于各種誤差因素的存在,常導(dǎo)致樣本的人口統(tǒng)計(jì)數(shù)據(jù)有別于普查數(shù)據(jù)。為了減小這種誤差,在數(shù)據(jù)處理時(shí),我們要算出各個(gè)樣本的權(quán)值,使樣本結(jié)構(gòu)與普查數(shù)據(jù)一致,這種數(shù)據(jù)處理方法就是加權(quán)。b.不等比例抽樣,加權(quán)即各層之間的抽樣比例不等:有的層次204.整群抽樣(ClusterSampling)
整群抽樣又稱聚類抽樣,一種以群而非個(gè)體為抽樣單位的抽樣方式。先將總體劃分為若干能代表總體的子群體,從中隨機(jī)抽取一些子群體,抽取的群里所有要素共同組成樣本的方法。例:對(duì)北京市小學(xué)生的視力狀況進(jìn)行抽樣調(diào)查,以學(xué)校作為群,抽出部分學(xué)校,再對(duì)抽中的所有學(xué)校的學(xué)生統(tǒng)一調(diào)查。
4.整群抽樣(ClusterSampling)整群抽樣21群的劃分標(biāo)準(zhǔn):按行政或地域形成的群體,如學(xué)校、企業(yè)或街道等。自行劃分群時(shí)原則:盡可能群間差異小,群內(nèi)差異大,讓每個(gè)群更具有代表性。優(yōu)點(diǎn):1.轉(zhuǎn)換抽樣單位,編制抽樣框得以簡(jiǎn)化;2.群通常由那些地理位置鄰近,或隸屬于同一系統(tǒng)的單元構(gòu)成,調(diào)查方便;可了解每個(gè)子群的情況(如省-市,亦可了解市的情況);局限性:當(dāng)樣本集中于少數(shù)群時(shí),引起抽樣誤差大于其他方法。群的劃分標(biāo)準(zhǔn):按行政或地域形成的群體,如學(xué)校、企業(yè)或街道等。22對(duì)抽取的群的所有人進(jìn)行調(diào)查總體被分為若干子群體圖1:分層抽樣圖2:整群抽樣對(duì)抽取的群的所有人進(jìn)行調(diào)查總體被分為若干子群體圖1:分層抽樣235.多階段抽樣(MultiStageSampling)亦稱多級(jí)抽樣,在上述整群抽樣中,當(dāng)子群或子群內(nèi)部個(gè)體數(shù)目較多,彼此間的差異不太大時(shí),常常采用更加經(jīng)濟(jì)的方法,即不將樣本子群中的所有個(gè)體作為樣本,而是從中再抽取樣本,因最終樣本的獲得經(jīng)過(guò)兩次抽樣,我們稱其為二階段抽樣。同樣可進(jìn)行三階段、四階段等多階段抽樣。
如:我們?nèi)粢{(diào)查北京市小學(xué)生的視力狀況,可采用三階段抽樣的方法:先以學(xué)校為抽樣單位,抽出若干所小學(xué),然后再以班級(jí)為抽樣單位抽出若干班級(jí),最后以學(xué)生個(gè)人為單位從抽中的班級(jí)中抽取最終樣本。5.多階段抽樣(MultiStageSampling)24多階段抽樣例:在一項(xiàng)某市居民對(duì)香皂顏色喜好的調(diào)查中,設(shè)計(jì)者打算采用入戶調(diào)查的方式,為節(jié)省差旅費(fèi),希望樣本能夠集中,因此準(zhǔn)備采用整群抽樣。方案設(shè)計(jì)者手頭有份該市街道名單。以街道作為群,工作量太大,以居委會(huì)為群,編制抽樣框來(lái)不及,因此,他決定…………三階段抽樣所有街道名單抽取部分街道,并建立其所有居委會(huì)名單抽取部分居委會(huì)對(duì)所有家庭調(diào)查二級(jí)整群抽樣抽除部分家庭最后一階抽群最后一階抽要素多階段抽樣多級(jí)整群抽樣抽取部分居委會(huì)多階段抽樣例:在一項(xiàng)某市居民對(duì)香皂顏色喜好的調(diào)查中,設(shè)計(jì)者打25抽取100個(gè)居委會(huì),每個(gè)居委會(huì)抽取2個(gè)人?抽10個(gè)居委會(huì),每個(gè)抽取20個(gè)人?按照增加樣本容量的原則通過(guò)同質(zhì)性解決自然群如居委會(huì)群內(nèi)差異較小,需要大量的群才能充分代表所有群之間的差異盡量多地選擇群,而減少每個(gè)群中要素的數(shù)量上例:N=200建議:在多階段抽樣中,增加開(kāi)頭階段的樣本數(shù),同時(shí)適當(dāng)?shù)販p少最后階段的樣本數(shù)。多階段抽樣中如何處理樣本量的平衡問(wèn)題?抽取100個(gè)居委會(huì),每個(gè)居委會(huì)抽取2個(gè)人?抽10個(gè)居委會(huì),按26優(yōu)點(diǎn):效率較高局限性:每一階段都會(huì)有誤差。適用范圍:跨地區(qū)的研究,不可能或不方便編制一個(gè)完整的名單形成目標(biāo)總體時(shí);或者是在總體層次比較多或?qū)哟蝺?nèi)單位數(shù)目比較多時(shí),更加經(jīng)濟(jì)實(shí)用。輔助方法:對(duì)于群體規(guī)模不等的多階段抽樣,通常使用概率比例抽樣,即pps抽樣。就是根據(jù)每一群的規(guī)模分配樣本容量的
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年上學(xué)期學(xué)生會(huì)工作總結(jié)(3篇)
- 2025年5月辦公室主任工作總結(jié)(二篇)
- 2025年三聯(lián)三服務(wù)活動(dòng)總結(jié)(四篇)
- 2025年專有技術(shù)轉(zhuǎn)讓協(xié)議合同標(biāo)準(zhǔn)版本(2篇)
- 2025年度荒地承包合同協(xié)議-農(nóng)業(yè)生態(tài)保護(hù)補(bǔ)償機(jī)制
- 二零二五年度電梯日常維護(hù)保養(yǎng)服務(wù)合同范本
- 2025企業(yè)管理資料字畫作品買賣合同文檔范本
- 2025年度簡(jiǎn)易租房合同-城市中心公寓版
- 2025年度食堂用工合同含食堂員工培訓(xùn)與發(fā)展計(jì)劃
- 年終工作總結(jié)15篇
- 福建省泉州市晉江市2024-2025學(xué)年七年級(jí)上學(xué)期期末生物學(xué)試題(含答案)
- 2025年春新人教版物理八年級(jí)下冊(cè)課件 第十章 浮力 第4節(jié) 跨學(xué)科實(shí)踐:制作微型密度計(jì)
- 財(cái)務(wù)BP經(jīng)營(yíng)分析報(bào)告
- 2024年全國(guó)統(tǒng)一高考英語(yǔ)試卷(新課標(biāo)Ⅰ卷)含答案
- 《社區(qū)康復(fù)》課件-第八章 視力障礙患者的社區(qū)康復(fù)實(shí)踐
- 透析患者的血糖管理
- 《逆向建模與產(chǎn)品創(chuàng)新設(shè)計(jì)》課程標(biāo)準(zhǔn)
- 前置審方合理用藥系統(tǒng)建設(shè)方案
- 國(guó)壽增員長(zhǎng)廊講解學(xué)習(xí)及演練課件
- 新疆維吾爾自治區(qū)烏魯木齊市初中語(yǔ)文九年級(jí)期末??荚囶}詳細(xì)答案和解析
- 同等學(xué)力申碩英語(yǔ)考試高頻詞匯速記匯總
評(píng)論
0/150
提交評(píng)論