版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
河北工程大學經(jīng)濟管理學院主講:岳志春yuezhichun@163.com統(tǒng)計學2/1/20231河北工程大學經(jīng)濟管理學院第六章抽樣與抽樣分布
本章內容:抽樣與抽樣分布是推斷統(tǒng)計學中的最基本內容。學習本章了解抽樣的概率抽樣方法;理解抽樣分布的概念和形式;掌握樣本平均數(shù)、樣本比例的抽樣分布;了解抽樣組織方式及其抽樣分布。重點是樣本平均數(shù)、樣本比例的抽樣分布。2/1/20232河北工程大學經(jīng)濟管理學院第六章抽樣與抽樣分布
本章分三節(jié):第一節(jié)抽樣的基本概念第二節(jié)抽樣分布第三節(jié)抽樣組織方式及其抽樣分布2/1/20233河北工程大學經(jīng)濟管理學院第一節(jié)抽樣的基本概念本節(jié)需要把握四個問題:一、總體與樣本;二、抽樣方法;三、抽樣框;四、抽樣誤差。2/1/20234河北工程大學經(jīng)濟管理學院一、總體與樣本把握兩個問題:1、總體和總體參數(shù);2、樣本和樣本統(tǒng)計量。2/1/20235河北工程大學經(jīng)濟管理學院
1、總體與總體參數(shù)(1)總體:指根據(jù)研究目的確定的所要研究的同類事物的全體,是所要說明其數(shù)量特征的研究對象。按所研究標志性質不同,分為變量總體和屬性總體,分別研究總體的數(shù)量特征和品質特征。構成總體的個別事物(基本單元)就是總體單位,也稱個體??傮w單位的總數(shù)稱為總體容量,記作N。2/1/20236河北工程大學經(jīng)濟管理學院
1、總體與總體參數(shù)(2)總體參數(shù):指抽樣估計中用來反映總體數(shù)量特征的指標。研究目的確定后,總體確定,總體參數(shù)存在但未知,需要估計。A、變量總體中各單位可以直接用數(shù)量表示,設各單位變量值為:X1,
X2,…XN,則總體參數(shù)有均值,標準差或方差以及總體標志總量,即我們研究變量X值的全體,X的取值有一定分布,為一個隨機變量。
2/1/20237河北工程大學經(jīng)濟管理學院(2)總體參數(shù):B、對于屬性總體,各單位不能用數(shù)值來表示,但可以計算總體成數(shù),如前面所學P=N1/N,Q=N0/N,P+Q=1,則總體參數(shù)有均值,標準差或方差以及具有某一屬性的單位總數(shù),即:
1、總體與總體參數(shù)2/1/20238河北工程大學經(jīng)濟管理學院
2、樣本和樣本統(tǒng)計量
(1)樣本:是從總體中抽出的部分單位的集合,樣本所包含的總體單位個數(shù)稱為樣本容量,一般用n表示。把n≥30的樣本稱為大樣本,n﹤30的樣本稱為小樣本。對于既定總體,由于抽取樣本的方式方法不同,樣本容量可大可小,樣本不確定。樣本的內部構成與總體內部構成總有一定差異,即樣本不能完全代表總體,用樣本估計總體總存在代表性誤差。
樣本個數(shù):又稱樣本可能數(shù)目,它是指從一個總體中可能抽取多少個樣本。樣本個數(shù)的多少與抽樣方法有關。2/1/20239河北工程大學經(jīng)濟管理學院
2、樣本和樣本統(tǒng)計量
(2)樣本統(tǒng)計量:又稱樣本指標或估計量,它是根據(jù)樣本資料計算的、用以估計和推斷相應總體參數(shù)的綜合指標,常用的有:2/1/202310河北工程大學經(jīng)濟管理學院二、抽樣方法把握以下問題:1、概率抽樣與非概率抽樣;2、重復抽樣與不重復抽樣。2/1/202311河北工程大學經(jīng)濟管理學院
(1)概率抽樣:又稱隨機抽樣,指按隨機原則抽取樣本。
隨機原則:就是排除主觀意愿的干擾,使總體的每一個單位都有一定的概率被抽選為樣本單位,每個單位能否入樣是隨機的。
概率抽樣的基本組織方式有:簡單隨機抽樣、分層抽樣、等距抽樣和整群抽樣。
1、概率抽樣與非概率抽樣2/1/202312河北工程大學經(jīng)濟管理學院
1、概率抽樣與非概率抽樣(2)概率抽樣的特點:A、避免主觀選樣帶來的傾向性誤差(系統(tǒng)偏差),使樣本資料能夠估計、推斷總體的數(shù)量特征;B、因為抽樣建立在概率和數(shù)理統(tǒng)計基礎上,可以計算和控制抽樣誤差,能說明估計結果的可靠程度。實際中,在不可能或不必要全面調查時,常用概率抽樣推斷總體,還可以修正或補充全面調查的結果。2/1/202313河北工程大學經(jīng)濟管理學院
1、概率抽樣與非概率抽樣
(3)非概率抽樣:又稱非隨機抽樣,指從研究目的出發(fā),根據(jù)研究者的經(jīng)驗或判斷,從總體中有意識抽取若干個單位構成樣本。有重點調查、典型調查、配額抽樣、方便抽樣等。
配額抽樣:指抽選一群特定數(shù)目的滿足特定條件的被調查者的抽樣方法,這群被調查者已知對此研究主題有用,配額通常是年齡、收入、職業(yè)等,使用配額抽樣有助于降低非概率抽樣方法的偏差。
2/1/202314河北工程大學經(jīng)濟管理學院1、概率抽樣與非概率抽樣
(4)非概率抽樣:
適用于:了解總體大致情況,總結經(jīng)驗教訓,進行大規(guī)模調查前的試點等,有其優(yōu)越性。
缺點:受主觀影響易產(chǎn)生傾向性誤差;不能計算、控制誤差,無法說明調查結果的可靠程度。抽樣一般都是指概率抽樣。2/1/202315河北工程大學經(jīng)濟管理學院2、重復抽樣和非重復抽樣(1)重復抽樣:又稱重置抽樣,是指從總體中抽出一個樣本單位,記錄其標志值后,又將其放回總體中繼續(xù)參加下一輪單位的抽取。特點是:第一,n個單位的樣本是由n次試驗的結果構成的。第二,每次試驗是獨立的,即其試驗的結果與前次、后次的結果無關。第三,每次試驗是在相同條件下進行的,每個單位在多次試驗中選中的機會(概率)是相同的。在重復試驗中,樣本可能的個數(shù)是,N為總體單位數(shù),n為樣本容量。2/1/202316河北工程大學經(jīng)濟管理學院2、重復抽樣和非重復抽樣
(2)非重復抽樣:又稱為不重置抽樣,即每次從總體抽取一個單位,登記后不放回原總體,不參加下一輪抽樣。下一次繼續(xù)從總體中余下的單位抽取樣本。特點是:第一,n個單位的樣本由n
次試驗結果構成,但由于每次抽出不重復,所以實質上相當于從總體中同時抽取n個樣本單位。第二,每次試驗結果不是獨立的,上次中選情況影響下次抽選結果。第三,每個單位在多次(輪)試驗中中選的機會是不等的。不重復抽樣,如果是考慮順序,其樣本可能個數(shù)為;如果不考慮順序,其樣本可能個數(shù)為。2/1/202317河北工程大學經(jīng)濟管理學院三、抽樣框把握以下問題:1、概念;2、抽樣框的形式;3、對抽樣框的要求。2/1/202318河北工程大學經(jīng)濟管理學院1、概念抽樣框:指包括全部抽樣單位的名單框架。調查目的確定后,總體隨之確定,總體又叫目標總體,即理論上的抽樣范圍,與實際抽樣的總體范圍有時不一致。此外抽樣單位可以是個總體單位,也可以是若干總體單位的集合。如某省進行農戶收支調查,目標總體是全省所有農戶,抽樣單位可以是每個農戶,也可以是每個鄉(xiāng)或村。所以,有目標總體后還必須明確實際進行抽樣的總體范圍和抽樣單位。2/1/202319河北工程大學經(jīng)濟管理學院2、抽樣框的形式
(1)名單抽樣框:列出全部總體單位的名錄一覽表,如職工名單、企業(yè)名單等。
(2)區(qū)域抽樣框:按地理位置將總體范圍劃分為若干小區(qū)域,以小區(qū)域為抽樣單位。如某市居民住房調查,將全市居民戶劃分為若干街道或片區(qū)。
(3)時間表抽樣框:將總體全部單位按時間順序排列,把總體的時間過程分為若干小的時間單位,以時間單位作為抽樣單位。如對流水線上24小時內生產(chǎn)的產(chǎn)品進行質量抽檢。2/1/202320河北工程大學經(jīng)濟管理學院
3、對抽樣框的要求(1)應與目標總體一致,即包括全部總體單位,不重不漏,否則破壞隨機原則。例如,對某市居民進行抽查,以電話號碼本為抽樣框不科學。(2)盡可能利用與所研究變量高度相關的輔助變量的信息,設計最佳的抽樣組織方式和抽樣估計方法。2/1/202321河北工程大學經(jīng)濟管理學院四、抽樣誤差把握以下問題:1、調查誤差概念及其分類;2、實際抽樣誤差;3、抽樣平均誤差;4、抽樣極限誤差。2/1/202322河北工程大學經(jīng)濟管理學院1、調查誤差概念及其分類(1)統(tǒng)計調查的誤差:指調查結果與總體真值間的差異。
(2)分為登記性誤差和代表性誤差:
A、登記性誤差:指在調查和匯總過程中由于觀察、測量、登記、計算等方面的差錯或被調查者提供虛假資料造成的誤差。它是任何一種統(tǒng)計調查都可能產(chǎn)生的,可以避免。2/1/202323河北工程大學經(jīng)濟管理學院1、調查誤差概念及其分類
(2)分為登記性誤差和代表性誤差:B、代表性誤差:指用樣本指標推斷總體指標時,由于樣本結構與總體結構的不一致,樣本不能完全代表總體而產(chǎn)生的誤差。代表性誤差又分為系統(tǒng)誤差和隨機誤差:a、系統(tǒng)誤差又稱偏差,指非隨機因素引起的樣本代表性不足產(chǎn)生的誤差,可以避免;b、隨機誤差,又稱偶然性誤差、抽樣誤差,隨機因素引起的代表性誤差,不可避免,但可以計算并加以控制。2/1/202324河北工程大學經(jīng)濟管理學院2、實際抽樣誤差(1)實際抽樣誤差指某一具體樣本的樣本估計值與總體參數(shù)的真實值之間的離差。實際中,總體參數(shù)未知,誤差無法計算。平均數(shù)的誤差:成數(shù)的誤差:p-P2/1/202325河北工程大學經(jīng)濟管理學院2、實際抽樣誤差(2)由于樣本隨機抽取,估計量是隨樣本不同而不同的隨機變量,所以實際抽樣誤差是隨機變量,可正可負,可大可小。就某個既定的抽樣方案,樣本估計量所有可能值有一定的分布規(guī)律,它們與總體參數(shù)的離差即抽樣誤差也有一定的規(guī)律。實際中真正計算、控制的誤差并不是該誤差。2/1/202326河北工程大學經(jīng)濟管理學院3、抽樣平均誤差(1)它是反映抽樣誤差一般水平的指標。常用樣本估計量的標準差反映所有可能樣本估計量與其中心的平均離散程度,即抽樣平均數(shù)或抽樣成數(shù)的標準差,公式為:則抽樣平均數(shù)、抽樣成數(shù)的標準差分別為:2/1/202327河北工程大學經(jīng)濟管理學院3、抽樣平均誤差(2)又因為,則上式變?yōu)榉从乘锌赡軜颖镜墓烙嬛蹬c總體參數(shù)的平均差異程度,即抽樣平均誤差,可以衡量樣本對總體的代表性大小,它越小則統(tǒng)計量的分布就越集中在總體參數(shù)的附近。抽樣平均數(shù)、抽樣成數(shù)的標準差變?yōu)椋毫硪粋€概念是抽樣方差為抽樣平均誤差的平方。2/1/202328河北工程大學經(jīng)濟管理學院4、抽樣極限誤差(1)它是指一定概率下樣本指標與總體參數(shù)間抽樣誤差的可能范圍,又稱允許誤差。因為總體參數(shù)確定,統(tǒng)計量圍繞其左右變動,用統(tǒng)計量與總體參數(shù)之差的絕對值表示誤差的可能范圍。公式表示:在一定概率下:平均數(shù)、比例的抽樣極限誤差,在一定概率下,2/1/202329河北工程大學經(jīng)濟管理學院4、抽樣極限誤差(2)抽樣極限誤差是抽樣誤差的可能范圍而非完全肯定范圍,可能范圍大小與這一估計的可能性大小即概率緊密聯(lián)系,這個概率被稱為置信度或可信程度、把握程度、概率保證程度等,表示為,其他條件不變的情況下,抽樣極限誤差越大,置信度越大。2/1/202330河北工程大學經(jīng)濟管理學院4、抽樣極限誤差(3)相關概念:抽樣誤差率=(抽樣極限誤差/估計量)×100%,抽樣估計精度=100%-抽樣誤差率估計精度與置信度矛盾。其他條件不變下,提高估計置信度,增大允許誤差,使精度降低;反之,提高精度會降低置信度。實際中根據(jù)具體情況,可先確定置信度再求極限誤差或先確定極限誤差再求相應的把握程度。2/1/202331河北工程大學經(jīng)濟管理學院
第二節(jié)抽樣分布本節(jié)只討論重復的簡單隨機抽樣,所得容量為n的樣本(x1,x2…
xn)稱為簡單隨機樣本,它滿足兩個條件:x1,x2…
xn相互獨立;每個xi(i=1,2,…,n)都與總體X同分布。把握以下問題:一、抽樣分布的概念;二、抽樣平均數(shù)的抽樣分布;三、樣本比例的抽樣分布;四、不重復抽樣的修正系數(shù)。2/1/202332河北工程大學經(jīng)濟管理學院一、抽樣分布的概念把握以下問題:1、抽樣分布的概念;2、尋求抽樣分布的方法。2/1/202333河北工程大學經(jīng)濟管理學院1、抽樣分布的概念(1)它是指樣本統(tǒng)計量的概率分布。每個隨機變量都有其概率分布,樣本統(tǒng)計量是隨機變量,有若干可能取值,每個取值有一定的可能性即概率,從而形成統(tǒng)計量的概率分布。樣本統(tǒng)計量是由n個隨機變量構成的樣本函數(shù),抽樣分布屬于隨機變量函數(shù)的分布。2/1/202334河北工程大學經(jīng)濟管理學院1、抽樣分布的概念(2)例如,總體有N個單位,隨機抽取n個單位進行調查,可抽取個樣本,得個不盡相同的樣本平均數(shù),將樣本平均數(shù)全部可能取值及其出現(xiàn)的概率依序排列得到樣本平均數(shù)的概率分布即平均數(shù)的抽樣分布。同理得到比例的抽樣分布、樣本標準差的抽樣分布。對于抽樣分布,同樣可以計算其均值和方差(或標準差)等數(shù)字特征反映該分布的集中、離散趨勢。2/1/202335河北工程大學經(jīng)濟管理學院
1、抽樣分布的概念(3)抽樣分布反映樣本統(tǒng)計量的分布特征,是抽樣推斷的重要依據(jù),根據(jù)其分布規(guī)律,可以揭示樣本指標與總體參數(shù)間的關系,估計抽樣誤差,說明抽樣推斷的可靠程度。2/1/202336河北工程大學經(jīng)濟管理學院
2、尋求抽樣分布的方法有精確方法和大樣本方法,形成精確和漸近抽樣分布。(1)當總體分布類型已知,對任一自然數(shù)n能導出統(tǒng)計量的分布的明顯表達式,稱為精確方法,所得分布為精確分布。當n較小時特別有用,又稱小樣本方法,大多是在正態(tài)總體條件下得到的。2/1/202337河北工程大學經(jīng)濟管理學院
2、尋求抽樣分布的方法(2)大多數(shù)場合,精確分布很難求出或表達式復雜,借助極限定理,尋求n無限增大時統(tǒng)計量的極限分布,用極限分布當作所求抽樣分布的近似,稱為大樣本方法,這種極限分布稱為漸近分布。在抽樣推斷中,許多場合下統(tǒng)計量服從正態(tài)分布或以正態(tài)分布為漸近分布,此外還有分布、
t分布、F分布等精確抽樣分布。2/1/202338河北工程大學經(jīng)濟管理學院二、抽樣平均數(shù)的抽樣分布
把握以下問題:1、總體方差已知時,樣本平均數(shù)的抽樣分布;2、總體方差未知時,樣本平均數(shù)的抽樣分布。2/1/202339河北工程大學經(jīng)濟管理學院
1、總體方差已知時,樣本平均數(shù)的抽樣分布(大樣本)(1)定理1:設總體是一個簡單隨機樣本,則樣本平均數(shù)證明:因為總體是其一個簡單隨機樣本,所以相互獨立且都服從,由概率論知,相互獨立的正態(tài)隨機變量和服從正態(tài)分布,其線性函數(shù)也服從正態(tài)分布。2/1/202340河北工程大學經(jīng)濟管理學院
1、總體方差已知時,樣本平均數(shù)的抽樣分布(大樣本)(1)定理1的證明:而且,所以,將樣本平均數(shù)標準化,有:2/1/202341河北工程大學經(jīng)濟管理學院1、總體方差已知時,樣本平均數(shù)的抽樣分布(大樣本)(2)定理2:若總體平均數(shù)和方差有限,當樣本容量n充分大時,無論總體形式如何,樣本平均數(shù)近似服從正態(tài)分布(3)由定理知,樣本平均數(shù)是以總體平均數(shù)為分布中心,且n愈大,樣本平均數(shù)的離散程度愈小,抽樣誤差愈小。由此得出抽樣平均數(shù)的標準差即抽樣平均誤差的公式為:實際計算中,總體標準差未知,可用以前的標準差代替;大樣本下,用樣本標準差代替。2/1/202342河北工程大學經(jīng)濟管理學院1、總體方差已知時,樣本平均數(shù)的抽樣分布(大樣本)(4)由公式(6.6)知,影響抽樣平均誤差的因素:A、總體方差或標準差,即總體各單位變量值的差異程度;B、樣本容量,容量越大,誤差越??;C、抽樣方法(重復、不重復抽樣)和抽樣組織方式(分層抽樣、等距抽樣等)。2/1/202343河北工程大學經(jīng)濟管理學院2、總體方差未知時,樣本平均數(shù)的抽樣分布(小樣本)定理3:設總體是一個簡單隨機樣本,樣本均值為,樣本標準差為S,則統(tǒng)計量2/1/202344河北工程大學經(jīng)濟管理學院
三、樣本比例的抽樣分布把握以下問題:1、總體比例與樣本比例;2、樣本比例的抽樣分布。2/1/202345河北工程大學經(jīng)濟管理學院
1、總體比例與樣本比例總體中具有某種特征的單位占全部單位的比例稱作總體比例,記做P;樣本中具有此種特征的單位占全部樣本單位的比例稱作樣本比例,記做p。實際中如產(chǎn)品的合格率、某電視節(jié)目的收視率等。2/1/202346河北工程大學經(jīng)濟管理學院
2、樣本比例的抽樣分布(1)X服從二項分布,且有E(X)=nP,V(X)=nP(1-P),當從總體中抽出一個容量為n的樣本時,樣本中具有某種特征的單位數(shù)x服從二項分布,即x~B(n,p),因而樣本比例p=x/n也服從二項分布,且有:2/1/202347河北工程大學經(jīng)濟管理學院
2、樣本比例的抽樣分布(2)根據(jù)中心極限定理,當二項分布趨于正態(tài)分布,大樣本下,若nP、n(1-P)皆大于5,樣本比例近似服從正態(tài)分布:p~N(P,P(1-P)/n)),則比例的抽樣平均誤差為:實際中,用以前的總體比例或樣本比例
p代替。2/1/202348河北工程大學經(jīng)濟管理學院
四、不重復抽樣的修正系數(shù)1、與重復抽樣比,由于樣本單位不重復,樣本單位很可能在總體中更均勻的分布,從而樣本結構更能與總體結構近似,因此不重復抽樣所得樣本對總體的代表性更大,抽樣誤差較小。前面所講的抽樣分布和抽樣平均誤差公式都是就重復抽樣而言。
2/1/202349河北工程大學經(jīng)濟管理學院四、不重復抽樣的修正系數(shù)2、不重復抽樣的抽樣平均誤差為:其中稱為不重復抽樣的修正系數(shù),N很大時,其他條件相同下,不重復抽樣誤差小于重復抽樣。當N很大而n很小時,系數(shù)接近1,二者相差不大。因此,無限總體都可以用重復抽樣的平均誤差公式度量抽樣誤差;有限總體當抽樣比例很小時(一般小于5%),也常用重復抽樣公式計算。2/1/202350河北工程大學經(jīng)濟管理學院第三節(jié)抽樣組織方式及其抽樣分布把握以下問題:一、簡單隨機抽樣;二、分層抽樣;三、等距抽樣;四、整群抽樣;五、抽樣組織方式的選擇。2/1/202351河北工程大學經(jīng)濟管理學院一、簡單隨機抽樣它是最基本的抽樣組織方式,常用方法有抽簽法、利用隨機數(shù)表取數(shù)法和電子計算機取數(shù)法。它隊對總體單位不進行任何劃分或排隊,完全隨機地直接從總體中抽取樣本單位,使每個單位都有完全均等的機會被抽中,故又稱純隨機抽樣。它只對總體單位進行編號。這樣估計的效率低,進行大規(guī)模抽樣調查時,工作不易展開。2/1/202352河北工程大學經(jīng)濟管理學院二、分層抽樣及其抽樣估計把握以下問題:1、分層抽樣的概念及特點;2、等比例分層抽樣方式;3、抽樣平均誤差的計算;4、例6-1。2/1/202353河北工程大學經(jīng)濟管理學院1、分層抽樣的概念及特點(1)也稱類型抽樣,它是按一定標志對總體各單位進行分類(或層、子總體),然后分別從每一類中按隨機原則抽取一定的單位構成樣本。例如,抽樣調查一個城市居民收入分配狀況,如果歷史資料反映了該城市居民的貧富結構:高收入者、中等收入者與低收入者的比例結構,我們可以按此結構分類分別從高收入者、中等收入者與低收入者中按一定的比例抽取樣本。2/1/202354河北工程大學經(jīng)濟管理學院1、分層抽樣的概念及特點(2)特點:類型抽樣是統(tǒng)計分組與抽樣原理的結合,可以提高樣本的代表性;不僅可以用樣本推斷總體,還可以推斷子總體指標。前提是對總體的結構有著一定的了解,為了充分利用這些信息,提高估計的精確性,對總體按確定標志進行分類,保證抽出的樣本與總體盡可能保持相似的結構。2/1/202355河北工程大學經(jīng)濟管理學院
2、等比例分層抽樣方式分層抽樣可分為等比例和不等比例分層抽樣,實際中采用等比例分層抽樣。(1)設總體由N個單位組成,按對總體的認識,把總體分為k組,使得:然后相應從各組中分別按隨機方式抽出個單位組成樣本。設樣本容量為n,它滿足:2/1/202356河北工程大學經(jīng)濟管理學院
2、等比例分層抽樣方式(2)比例抽樣方式就是從每一類抽取時要求兩者間保持合適的比例,也就是保持各組樣本單位數(shù)與總體同組單位數(shù)之比,等于樣本容量與總體單位數(shù)之比,即所以各組的樣本單位數(shù)應為:
2/1/202357河北工程大學經(jīng)濟管理學院3、抽樣平均誤差的計算和區(qū)間估計(1)步驟:設樣本是:樣本抽出來后:第一步:計算各組平均數(shù)第二步:將各組平均數(shù)以各組單位數(shù)或各樣本組單位數(shù)為權數(shù),進行加權平均,求出樣本平均數(shù)2/1/202358河北工程大學經(jīng)濟管理學院3、抽樣平均誤差的計算和區(qū)間估計(1)步驟:第三步:計算分層抽樣的抽樣平均誤差,第i組的組內標準差為第i組的抽樣平均誤差為:即為的方差,表示從第i組中抽樣計算平均數(shù)的方差,樣本平均數(shù)的方差為,樣本平均數(shù)的抽樣平均誤差為記表示組(層)內方差平均數(shù)。2/1/202359河北工程大學經(jīng)濟管理學院
3、抽樣平均誤差的計算和區(qū)間估計(1)步驟:同樣可計算在不重復抽樣條件下的抽樣平均誤差為:2/1/202360河北工程大學經(jīng)濟管理學院
3、抽樣平均誤差的計算(2)分析:在分組下,總方差=組內方差平均數(shù)+組間方差,通過比較,分層抽樣的抽樣平均誤差小于簡單隨機抽樣的抽樣誤差。對于給定的總體,總體方差一定,劃分層時應盡量增大層間差異,縮小層內差異。因為層內差異越小。分層抽樣的抽樣平均誤差越小,參數(shù)估計的效率越高。2/1/202361河北工程大學經(jīng)濟管理學院例6-1某地區(qū)對居民在一年內用于某類消費的支出進行等比例分層抽樣,結果見表,要求計算該地區(qū)平均每戶支出的抽樣平均誤差和抽樣極限誤差。
調查戶數(shù)平均支出(元)
方差城鎮(zhèn)403502209農村
8026029162/1/202362河北工程大學經(jīng)濟管理學院4、例6-1解:樣本平均數(shù)是:層內方差平均數(shù):
抽樣平均誤差:抽樣極限誤差:2/1/202363河北工程大學經(jīng)濟管理學院三、等距抽樣把握以下問題:1、等距抽樣的概念和特點;2、無關標志排隊等距抽樣;3、有關標志排隊等距抽樣。2/1/202364河北工程大學經(jīng)濟管理學院
1、等距抽樣的概念和特點(1)又稱機械抽樣或系統(tǒng)抽樣,它是將總體各單位按某一標志進行排隊,計算出抽樣間隔,并在第一個抽樣間隔內確定一個抽樣起點,再按固定的順序和間隔來抽取樣本單位的抽樣組織形式。根據(jù)需要抽取的樣本單位數(shù)n和總體的單位數(shù)N,可以計算出等距抽樣的間隔大?。篕=N/n
,再從第一至第K個單位的范圍內確定抽樣起點,之后每隔K個單位抽取一個樣本單位。2/1/202365河北工程大學經(jīng)濟管理學院
1、等距抽樣的概念和特點(2)優(yōu)越性:提高樣本單位分布的均勻性,樣本代表性強,一般工作易開展,實際應用廣泛。但等距抽樣在排隊后,抽樣起點一確定,整個樣本就確定了。其隨機性體現(xiàn)在排隊和抽樣起點的確定上。按排隊標志與調查內容的關系,等距抽樣分為無關標志、有關標志排隊等距抽樣,二者抽樣起點確定方式、抽樣效果不同。2/1/202366河北工程大學經(jīng)濟管理學院
2、無關標志排隊等距抽樣
(1)它是指等距抽樣據(jù)以排隊的標志與調查內容沒有直接關系。例如,城市居民家計調查時,將居民按其居住的街道門牌號碼排隊;產(chǎn)品質量檢查按產(chǎn)品生產(chǎn)的時間先后順序排隊,每個一定時間或每生產(chǎn)一定數(shù)量的產(chǎn)品抽取一單位產(chǎn)品。2/1/202367河北工程大學經(jīng)濟管理學院2、無關標志排隊等距抽樣(2)抽樣起點的確定:從所要調查的標志看,總體單位的排序仍是隨機的,抽樣起點r可以隨機確定,即1≤r≤K,遵循隨機原則,避免系統(tǒng)偏差。(3)無關標志排隊等距抽樣的效果接近于簡單隨機抽樣的效果,其抽樣誤差通常按簡單隨機抽樣的抽樣誤差公式近似計算。2/1/202368河北工程大學經(jīng)濟管理學院
3、有關標志排隊等距抽樣
(1)它是指排隊標志與調查內容有關,例如職工家計調查按職工工資水平排隊。(2)在排隊后,從所調查變量看,總體單位也大致呈順序排列,其抽樣起點不宜隨機確定。否則,若第一個間隔內隨機抽取一個標志值較?。ɑ虼螅┑膯挝蛔髌瘘c,整個樣本會出現(xiàn)偏低(或高)的系統(tǒng)偏差。2/1/202369河北工程大學經(jīng)濟管理學院3、有關標志排隊等距抽樣
(3)半距起點等距抽樣(中心系統(tǒng)抽樣):以第一個抽樣距離的一半為抽樣起點(r=k/2)并每間隔k個單位抽一個單位。這樣樣本單位是處于每個抽樣距離(組)中點的總體單位。因單位變量值大致呈順序排列,所以這些單位變量值能代表所在間距內的一般水平,由此樣本代表性較高。但這種取樣限制抽樣的隨機性,且只能抽取出一個樣本。2/1/202370河北工程大學經(jīng)濟管理學院
3、有關標志排隊等距抽樣
(4)對稱等距抽樣:在第一個間距內隨機確定起點r(1≤r≤k),然后以組界[k,2k,…,(n-1)k]為對稱點兩兩對稱地抽取樣本單位,看書上圖,知第一組內r偏小,但第二組內樣本單位(2k-r)偏大;反之,第二組內r偏大,則第二個樣本單位偏小,這樣整體看,樣本有較好的代表性,又保證抽樣的隨機性,根據(jù)排隊結果可以抽出k個樣本2/1/202371河北工程大學經(jīng)濟管理學院3、有關標志排隊等距抽樣(5)有關標志排隊等距抽樣相當于分層較多(將總體分為同等大小的n個層)而每層只抽取一個調查單位的分層抽樣,所以抽樣效果類似于分層抽樣,抽樣誤差一般按分層抽樣的誤差公式近似計算。2/1/202372河北工程大學經(jīng)濟管理學院四、整群抽樣把握以下問題:1、整群抽樣的概念和特點;2、整群抽樣的抽樣平均誤差;3、例6-2。2/1/202373河北工程大學經(jīng)濟管理學院
1、整群抽樣的概念和特點(1)整群抽樣又稱集團抽樣,就是將總體各單位分成若干群,然后從其中隨機抽取部分群,對中選的群進行全面調查的抽樣組織方式。例如居民家計調查,以一個鄉(xiāng)(或街道)的所有住戶或所有人口為一群,對抽中的鄉(xiāng)或街道的住戶或人口進行全面調查。2/1/202374河北工程大學經(jīng)濟管理學院
1、整群抽樣的概念和特點(2)這種方式是整群的抽取樣本單位,只需對各群編號,簡化工作,抽樣單位集中,便于集中調查,簡單方便又節(jié)省人力、物力、財力和時間,應用廣泛。但抽樣單位集中,抽樣單位在總體中分布不夠均勻。在其他條件相同下,其樣本代表性可能較差,要適當多抽一些樣本單位。2/1/202375河北工程大學經(jīng)濟管理學院
2、整群抽樣的抽樣平均誤差
(1)整群抽樣的代表性取決于抽中群之間的差異,差異大,代表性差。因此其誤差與群間差異有關,與群內差異無關。(2)設總體的全部N個單位被劃分為R群,每群含有M個單位。現(xiàn)在從總體R群中隨機抽出r群組成樣本,對中選的群中的所有單位進行全面調查。群的平均數(shù)是:樣本均值是:2/1/202376
2、整群抽樣的抽樣平均誤差(2)從上式可以看出,整群抽樣實質上是以群代替總體單位,以群平均數(shù)代替總體單位標志值之后的簡單隨機抽樣。群間方差是:或者由樣本數(shù)據(jù)估計:因此,樣本平均數(shù)的抽樣平均誤差是:上式中出現(xiàn)修正系數(shù)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 雙十二購房指南
- 體育用品行業(yè)保安工作總結
- 軍訓心得體會15篇
- 教育的項目計劃書精彩3篇
- 建筑工程施工合同范文集合8篇
- 2023年-2024年崗位安全教育培訓試題及參考答案【培優(yōu)】
- 文學作品意識形態(tài)解讀-洞察分析
- 宇宙常數(shù)與宇宙結構形成-洞察分析
- 遺傳進化機制探究-洞察分析
- 工抵房協(xié)議模板
- 校本課程《典籍里的中國》教案
- CNAS-CV03-2022 溫室氣體 第三部分 溫室氣體聲明審定與核查規(guī)范和指南
- 四年級上冊信息技術教案-9演示文稿巧編輯 |人教版
- 2022年人力資源管理各專業(yè)領域必備知識技能
- 租賃(出租)物品清單表
- 提高聚氯乙烯卷材地面一次驗收合格率
- 【部編版】2022年語文七年級上:作文能力提升—謀篇布局(含答案)
- 甲型H1N1流感防治應急演練方案(1)
- LU和QR分解法解線性方程組
- 漏油器外殼的落料、拉深、沖孔級進模的設計【畢業(yè)論文絕對精品】
評論
0/150
提交評論