抽樣技術(shù)(第5版)課件PPT課件第3章_第1頁
抽樣技術(shù)(第5版)課件PPT課件第3章_第2頁
抽樣技術(shù)(第5版)課件PPT課件第3章_第3頁
抽樣技術(shù)(第5版)課件PPT課件第3章_第4頁
抽樣技術(shù)(第5版)課件PPT課件第3章_第5頁
已閱讀5頁,還剩94頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

2023/10/131第三章分層隨機抽樣

3.1概述3.2簡單估計量及其性質(zhì)3.3比率估計量及其性質(zhì)3.4回歸估計量及其性質(zhì)3.5各層樣本量的分配3.6總樣本量的確定3.7分層抽樣的其他方面2023/10/132第一節(jié)概述

2023/10/133

定義3.3

分層隨機抽樣(stratifiedrandomsampling):如果每層中的抽樣都是獨立地按照簡單隨機抽樣進(jìn)行的,那么這樣的分層抽樣稱為分層隨機抽樣,所得的樣本稱為分層隨機樣本(stratifiedrandomsample)。2023/10/1342023/10/135二、作用由于每層都進(jìn)行抽樣,這就可使樣本在總體中分布更加均勻,從而具有更好的代表性。由于抽樣在每一層中獨立進(jìn)行,所以一者允許各層選擇不同的適合本層的抽樣方法,二則可同時對各子總體(層)進(jìn)行參數(shù)估計,而不單是對整個總體的參數(shù)進(jìn)行估計。由于各層的總體方差因單元之間差異小而肯定小于整個總體的方差,而抽樣精度與此成正比,所以分層抽樣可以提高參數(shù)估計的精度。三、符號2023/10/136所有總體參數(shù)的估計量都采用下標(biāo)“st”以示區(qū)別:2023/10/1372023/10/138第二節(jié)簡單估計量及其性質(zhì)一、對總體均值的估計分層樣本,總體均值

的估計分層隨機樣本,總體均值

的簡單估計

2023/10/139估計量的性質(zhì)

性質(zhì)1&2:對于一般的分層抽樣,如果是的無偏估計(),則是的無偏估計。的方差為:只要對各層估計無偏,則總體估計也無偏。各層可以采用不同的抽樣方法,只要相應(yīng)的估計量是無偏的,則對總體的推算也是無偏的。2023/10/1310證明性質(zhì)1

由于對每一層有

因此,

估計量的方差

由于各層是獨立抽取的,因此上式第二項中的協(xié)方差全為0,從而有

2023/10/1311

性質(zhì)3:對于分層隨機抽樣,是的無偏估計,的方差為:

2023/10/1312證明性質(zhì)3:

對于分層隨機抽樣,各層獨立進(jìn)行簡單隨機抽樣,對每一層有

因此,由性質(zhì)1,有

由第二章性質(zhì)2,得

因此

2023/10/1313

性質(zhì)4:對于分層隨機抽樣,的一個無偏估計為:

2023/10/1314證明性質(zhì)4:

對于分層隨機抽樣,各層獨立進(jìn)行簡單隨機抽樣,由第二章性質(zhì)3,得的無偏估計為:

因此,的一個無偏估計為:

2023/10/1315二、對總體總量的估計

總體總量

的估計為:

如果得到的是分層隨機樣本,則總體總量的簡單估計為:

2023/10/13162.估計量的性質(zhì)性質(zhì)1:對于一般的分層抽樣,如果是的無偏估計,則是的無偏估計。的方差為:2023/10/1317性質(zhì)2:對于分層隨機抽樣,的方差為:2023/10/1318性質(zhì)3:對于分層隨機抽樣,的一個無偏估計為:

2023/10/1319例3.1

調(diào)查某地區(qū)的居民奶制品年消費支出,以居民戶為抽樣單元,根據(jù)經(jīng)濟及收入水平將居民戶劃分為4層,每層按簡單隨機抽樣抽取10戶,調(diào)查獲得如下數(shù)據(jù)(單位:元),要估計該地區(qū)居民奶制品年消費總支出及其95%的置信區(qū)間。層居民戶總數(shù)樣本戶奶制品年消費支出12345678910120010400110151040809002400501306080100551608516017037501802601100140602001803002204150050351502030251030252023/10/1320同理,求得:2023/10/1321

2023/10/1322

三、對總體比例的估計

總體比例P的估計為:

估計量的性質(zhì)

性質(zhì)1:對于一般的分層抽樣,如果是的無偏估計(),則是的無偏估計。的方差為:2023/10/1323性質(zhì)2:對于分層隨機抽樣,是的無偏估計,因而的方差為:

2023/10/1324

性質(zhì)3:對于分層隨機抽樣,的一個無偏估計為:第三節(jié)比率估計量及其性質(zhì)先“比”后“加權(quán)”,此時所得的估計量稱為分別比估計(separateratioestimator)先“加權(quán)”后“比”,這樣所得的估計量稱為聯(lián)合比估計(combinedratioestimator)2023/10/1325分別比估計定義3.4總體均值

和總體總量

的分別比估計為:2023/10/1326定理3.5對于分層隨機抽樣的分別比估計,若各層的樣本量

都比較大,則有2023/10/1327證明根據(jù)比估計量的性質(zhì),當(dāng)

比較大時,有2023/10/1328聯(lián)合比估計

2023/10/1329

2023/10/1330分別比估計與聯(lián)合比估計的比較2023/10/13311)當(dāng),即或

分別比估計的精度與聯(lián)合比估計的精度是一樣的。2)當(dāng),即,分別比估計的精度不低于聯(lián)合比估計的精度。3)當(dāng)且,這意味著分別比估計的精度要高于聯(lián)合比估計的精度。2023/10/13324)當(dāng)且,

或且,聯(lián)合比估計的精度要高于分別比估計的精度。5)當(dāng),即比估計量的方差小于簡單估計量的方差時,需視具體情況而定。

2023/10/1333第四節(jié)回歸估計量及其性質(zhì)與比估計相似,將回歸估計的思想與技術(shù)用于分層隨機樣本時,同樣有兩種可行的辦法:先“回歸”后“加權(quán)”,此時所得的估計量稱為分別回歸估計;先“加權(quán)”后“回歸”,這時所得的估計量稱為聯(lián)合回歸估計3.4.1分別回歸估計定義3.6

分別回歸估計是指在分層隨機抽樣中,先在每層中對層均值或?qū)涌偤妥龌貧w估計,然后再對各層的回歸估計按總體層權(quán)進(jìn)行加權(quán)平均。

1.各層的回歸系數(shù)βh事先給定

2.不能事先設(shè)定各層的回歸系數(shù)βh

3.4.2聯(lián)合回歸估計1.當(dāng)β為事先設(shè)定的常數(shù)時2.當(dāng)回歸系數(shù)β不能事先設(shè)定時3.4.3分別回歸估計與聯(lián)合回歸估計的比較經(jīng)化簡得:例3.3已知某公司一般職員(包括辦事員和保管人員)及高級管理(經(jīng)理)人員剛進(jìn)入公司時的工資總額,欲通過抽樣調(diào)查估計當(dāng)前該公司職員的工資總額Y。抽樣按照一般職員層與高管層進(jìn)行分層隨機抽取。一般職員層抽取n1=15名職員,高管層抽取n2=10名職員。同時還知道一般職員層人員總數(shù)N1=390名,該類職員進(jìn)入公司時工資總額為X1=5523965元;高管層人員總數(shù)N2=84名,該類職員進(jìn)入公司時工資總額為X2=2541660元。經(jīng)過分層隨機抽樣調(diào)查所得的數(shù)據(jù)如表3—5所示。請對上述數(shù)據(jù)分別按照分別比估計、聯(lián)合比估計、分別回歸估計、聯(lián)合回歸估計以及差估計方法對該公司當(dāng)前職員工資總額Y做出估計,同時計算出各個估計量的精度。

五種估計方法結(jié)果比較注意:此時的比估計和回歸估計(回歸系數(shù)采用樣本回歸系數(shù)進(jìn)行估計)均為有偏估計,并且考慮到各層的樣本量都不大,回歸估計的偏倚有可能更大,所以此時采用比估計,特別是聯(lián)合比估計會更保險。

而差估計雖然標(biāo)準(zhǔn)差相對較大,但它卻是無偏的,均方誤差并不一定大,所以仍然有采用的價值。3.4.4比率估計與回歸估計小結(jié)在分層隨機抽樣中,當(dāng)輔助變量可加以利用時,為了提高估計量的精度,可以采用分別比估計、聯(lián)合比估計、分別回歸估計以及聯(lián)合回歸估計等估計方法。在比估計中,當(dāng)各層樣本量都較大時,分別比估計與聯(lián)合比估計近似無偏;當(dāng)某些層的樣本量不夠大,而總樣本量較大時,聯(lián)合比估計近似無偏。在回歸估計中,少數(shù)情況下,回歸系數(shù)可以是事先設(shè)定的常數(shù),其估計量無偏;多數(shù)情況下,回歸系數(shù)需利用樣本回歸系數(shù)進(jìn)行估計,其估計有偏,但在大樣本的情況下近似無偏。當(dāng)Y與X高度相關(guān)時,分別比估計、聯(lián)合比估計、分別回歸估計以及聯(lián)合回歸估計等估計等產(chǎn)生的估計量都是有效的。選擇估計方法,大致需遵循的原則在選擇估計方法時,大致需遵循下面的原則:(1)由于分別估計(無論是分別比估計還是分別回歸估計)要求各層的樣本量都比較大,所以當(dāng)某些層的樣本量不夠大時,建議采用聯(lián)合估計(2)當(dāng)回歸系數(shù)需要由樣本進(jìn)行估計時,回歸估計量是有偏的。在這種情況下,采取比估計尤其是聯(lián)合比估計也許更保險(3)如果各層的樣本量都比較大,同時每層的比估計或回歸估計也比較有效(即ρh均比較大),而且各層的Rh之間(或βh之間)差異較大,則此時分別估計優(yōu)于聯(lián)合估計,估計量的方差更小(4)如果各層的樣本量不大,而且各層的Rh之間(或βh之間)差異較小,則采用聯(lián)合估計較為適宜(5)如果各層的Rh之間(或βh之間)差別不是太大,而且并不是每層的樣本量都相當(dāng)大,則聯(lián)合估計可能更保險一些如果各層的回歸系數(shù)都接近于1,則可以采用差估計。雖然有時差估計量的方差偏大,但由于它為無偏估計量,所以總的均方誤差不一定大2023/10/1361第五節(jié)各層樣本量的分配

確定樣本量:總的樣本量,各層樣本量估計量的方差不僅與各層的方差有關(guān),還和各層所分配的樣本量有關(guān)。實際工作中有不同的分配方法,可以按各層單元數(shù)占總體單元數(shù)的比例分配,也可以采用使估計量總方差達(dá)到最小、費用最小。

2023/10/13622023/10/1363一、比例分配

按各層單元數(shù)占總體單元數(shù)的比例,也就是按各層的層權(quán)進(jìn)行分配.對于分層隨機抽樣,這時總體均值的估計是自加權(quán)2023/10/1364總體中的任一個單元,不管它在哪一個層,都以同樣的概率入樣,因此按比例分配的分層隨機樣本,估計量的形式特別簡單。這種樣本也稱為自加權(quán)的樣本。總體比例的估計是

2023/10/1365二、最優(yōu)分配

(一)最優(yōu)分配在分層隨機抽樣中,如何將樣本量分配到各層,使得總費用給定的條件下,估計量的方差達(dá)到最小,或給定估計量方差的條件下,使總費用最小,能滿足這個條件的樣本量分配就是最優(yōu)分配。2023/10/13662023/10/13672023/10/1368定理3.7的證明對所有層成立時,達(dá)到極小

常數(shù)2023/10/1369簡單線性費用函數(shù),總費用由此得出下面的行為準(zhǔn)則,如果某一層·單元數(shù)較多·內(nèi)部差異較大·費用比較省則對這一層的樣本量要多分配一些。2023/10/1370三Neyman(內(nèi)曼)最優(yōu)分配如果每層抽樣的費用相同,最優(yōu)分配可簡化為這種分配稱為Neyman分配。這時,達(dá)到最小。

2023/10/1371例3.4

某市有甲、乙兩個地區(qū),現(xiàn)要進(jìn)行家庭收入的調(diào)查。令n=500,已知甲地區(qū)共有20000戶居民,乙地區(qū)共有50000戶居民;甲地居民和乙地居民年收入標(biāo)準(zhǔn)差估計分別為S1=2500,S2=2000;同時對甲地和乙地每戶的平均抽樣費用之比為2∶3,請分別計算出在甲地和乙地進(jìn)行比例分配、一般最優(yōu)分配(考慮費用因素)以及內(nèi)曼分配(不考慮費用因素)的樣本量。2023/10/13722023/10/13732023/10/1374四、某些層要求大于100%抽樣時的修正

按最優(yōu)分配時,有時抽樣比f較大,某個層的又比較大,則可能出現(xiàn)按最優(yōu)分配計算的這個層的樣本量超過的情況。實際工作中,如果第k層出現(xiàn)這種情況,最優(yōu)分配是對這個層進(jìn)行100%的抽樣,即取,然后,將剩下的樣本量按最優(yōu)分配分到各層。

五、偏離最優(yōu)分配時對精度的影響2023/10/1375例3.62023/10/13762023/10/13772023/10/1378第六節(jié)總樣本量的確定

令當(dāng)方差給定時

2023/10/1379當(dāng)按比例分配時,

實際工作中,n的計算可以分為兩步,先計算:然后進(jìn)行修正:

2023/10/1380當(dāng)按Neyman分配時,

2023/10/13812、精度要求是以

的絕對誤差限d(在給定的置信水平1-α下)的形式給出的2023/10/13822023/10/13833.精度要求以

的相對誤差限r(nóng)(在給定的置信水平1-α下)的形式給出2023/10/13842023/10/1385例3.72023/10/13862023/10/13872023/10/13882023/10/1389二、總費用給定時總樣本量的確定給定V時2023/10/1390給定C時2023/10/1391第七節(jié)分層抽樣的其他方面

一、多重分層定義當(dāng)調(diào)查指標(biāo)ψ與兩個或多個輔助變量x1,x2,…都存在相關(guān)關(guān)系時,為了提高分層的效益,需要按每一個輔助變量進(jìn)行分層,通常的做法是先按最主要的變量分成大層,在大層中再按第二主要變量分成子層,從而形成交叉分層。當(dāng)存在多個分層變量時,這種分層方式即稱為多重分層(multiplestratification)。對于多重分層,當(dāng)“子層”劃分好以后,就要考慮樣本量在各子層的分配問題。最簡單常用的樣本量分配方法是按照與每一子層大小成比例的原則進(jìn)行分配。在多重分層中,有時會出現(xiàn)這樣一個問題:當(dāng)總樣本量n相對于子層總數(shù)RC不夠大時,會出現(xiàn)某些子層分配不到樣本的情況。

若n<max(R,C),

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論