




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、抽樣技術(shù)第三章王學(xué)民 編第三章 分層隨機(jī)抽樣v3.1 概述v3.2 估計(jì)量的性質(zhì)v3.3 樣本容量在各層的最優(yōu)分配v3.4 樣本容量的確定v3.5 求比例的分層抽樣3.1 概述v例3.1 假定對(duì)全市N=30000名高一學(xué)生作一次數(shù)學(xué)統(tǒng)考,有關(guān)人士欲采用抽樣的方式對(duì)全市的平均考分有所了解。確定n=300。v設(shè)總體的均值為 ,方差為S2,抽取一個(gè)容量為n=300的簡(jiǎn)單隨機(jī)樣本,得樣本均值 ,Y 211,100SnV yffnNyv假設(shè)N1=3000,N2=7000,N3=20000,則從各層中分別抽取樣本容量為n1=30, n2=70, n3=200 的簡(jiǎn)單隨機(jī)樣本,其樣本均值分別記為 ,令123
2、300070002000030000YYYY123,y yy12312330007000200001723000010303styyyyyyy則它是 的無偏估計(jì)??捎?jì)算出由經(jīng)驗(yàn)知,應(yīng)有 ,故Y222123117210303stfV ySSSn2222123,SSSS 22221172103031stfV ySSSnfSV yn定義v設(shè)總體包含N個(gè)單元,將總體分成互不重復(fù)的L個(gè)子總體,每一子總體稱為一個(gè)層,L個(gè)層分別包含N1, , NL個(gè)單元,N1+ +NL = N。層被確定后,就從每一層抽一個(gè)樣本,抽樣是在各層獨(dú)立地進(jìn)行的。各層的樣本容量分別用n1, , nL表示,n1+ +nL=n。這種抽樣
3、方法稱為分層抽樣或類型抽樣或分類抽樣。v如果從每層抽取一個(gè)簡(jiǎn)單隨機(jī)樣本,則稱為分層隨機(jī)抽樣。采用分層技術(shù)的主要理由v1.需要有總體的某些分類數(shù)據(jù),且要具有規(guī)定的精確度。v2.為便于行政管理而要求分層。v3.總體的各個(gè)不同部分的抽樣問題可能顯著地不同,即采用各自不同的抽樣方法。v4.分層可能提高整個(gè)總體指標(biāo)估計(jì)值的精確度。它可以將一個(gè)內(nèi)部差異很大的總體分成一些內(nèi)部比較相似的子總體。記號(hào)v下標(biāo)h表示層號(hào),i表示這一層內(nèi)的單元號(hào)。1,1,hhhihhihhhNnYiiNyiinNWN單位的總數(shù)樣本中的單位數(shù)第 個(gè)單位的標(biāo)志值,樣本中第 個(gè)單位的標(biāo)志值,層的權(quán)數(shù)11221221111111hhhhhh
4、hNhhiihnhhiihNhhihihnhhihihnfNYYNyynSYYNsyyn層的抽樣比真實(shí)的均值樣本均值真實(shí)方差樣本方差3.2 估計(jì)量的性質(zhì)v總體均值 可表示為v定理1 在分層隨機(jī)抽樣中是總體均值 的無偏估計(jì)(st表示分層)。v證明Y111LLhhhhhhYN YW YN1LsthhhyW yY11LLsthhhhhhE yW E yW YYv定理2 在分層隨機(jī)抽樣中,估計(jì)量 的方差是v證明v定理2的重要一點(diǎn)是 的方差只取決于各層的層內(nèi)方差 ,而與層之間的差別無任何關(guān)系。層間的差異越大,分層抽樣越有效。sty22122111LhsthhhhhLhhhhhSV yNNnNnSWfn2
5、22111LLhsthhhhhhhSV yW V yWfnsty2hSv推論1 若各層中的抽樣比 是可忽略的,就有v推論2 采用按比例分配時(shí),即 ,則v推論3 在推論2中,若 ,則hhhnfN22222111LLhhhhsthhhhN SW SV yNnnhhnNnN22111LLhhsthhhhN SNnfV yW SN nNn2221LwSSSv定理3 總體總值 的無偏估計(jì) 的方差v定理4 采用分層隨機(jī)抽樣時(shí), 方差的無偏估計(jì)是21LhsthhhhhSV YNNnn221wwstSSNnV yfnnN 22wstSSV yV y當(dāng)時(shí),。YNYststYNysty2222221111LLLh
6、hhh hsthhhhhhhhsW sW ssyNNnNnnNv v若nh較小,則用t分位點(diǎn)代替u/2,合適的自由度ne是1YY和 的置信區(qū)間分別為:22ststststyus yNyuNs y和,ststyNs y公式中假定,而且是被很好確定了的。2224,1h hhhhehhhhhg sNNnngg snn其中例3.2v某市進(jìn)行家庭收入調(diào)查,分城鎮(zhèn)居民及農(nóng)村居民兩部分抽樣,在全部城鎮(zhèn)23560戶中抽取300戶,在全部農(nóng)村148420戶中抽取250戶(均按簡(jiǎn)單隨機(jī)抽樣進(jìn)行),調(diào)查結(jié)果是城鎮(zhèn)年平均戶收入為15180元,標(biāo)準(zhǔn)差為2972元;農(nóng)村年平均戶收入為2546元。求全市年平均戶收入的估計(jì)及
7、其90的置信區(qū)間。3.3 樣本容量n在各層的最優(yōu)分配v一、Neyman最優(yōu)分配v二、分層隨機(jī)抽樣的精確度的評(píng)價(jià)v三、要求進(jìn)行大于100%的抽樣的分配v四、考慮費(fèi)用時(shí),樣本容量的最優(yōu)分配一、Neyman最優(yōu)分配v 這里n1+ +nL = n。n為總的樣本容量,使的一組值n1, , nL稱為最優(yōu)分配或Neyman分配。221222111LhhhsthhhLLhhhhhhhW SnV ynNW SW SnNminstV yv定理5 分層隨機(jī)抽樣時(shí),在樣本的總的容量n固定的情況下,如:則 達(dá)到最小值。v證明 11hhhhhLLhhhhhhN SW SnnnN SW SstV y222221111LLL
8、hhhhhsthhhhhhhSW SW SV yWfnnN等號(hào)成立,當(dāng)且僅當(dāng)即2222111222211LLLhhhhhhhhhhLLhhhhhhhhW SW SnnnnW SnW Sn22221111LLLLW SW Snnnn1111LhhLLhLW SWSW Snnn也就是v注 柯西不等式:等號(hào)成立,當(dāng)且僅當(dāng) 1,1,2,hhhLhhhW SnnhLW S222111nnni iiiiiiabab1212nnaaabbbv當(dāng)各層的方差 時(shí),最優(yōu)分配為nh =nNh/N=nWh此時(shí),最優(yōu)分配即為按比例分配。v定理5導(dǎo)出下面的行動(dòng)準(zhǔn)則。若1.這一層單元較多(Nh大);2.這一層內(nèi)部變異程度較
9、大(Sh大);則這一層要抽取一個(gè)容量較大的樣本(nh大)。221LSS二、分層隨機(jī)抽樣的精確度的評(píng)價(jià)v記ran 簡(jiǎn)單隨機(jī)抽樣;prop 按比例分配的分層隨機(jī)抽樣;opt 最優(yōu)分配的分層隨機(jī)抽樣。均值估計(jì)量的方差分別用Vran,Vprop,Vopt表示。v從Vopt的定義必定有VpropVopt。nh (h=1,2, ,L)不取整時(shí),使用公式222111111LLLprophhhhhhhhhfVW SW SW SnnN2222211112211211111 LLLLhhhhopthhhhhhhhhLLpropopthhhhhhLhhhW SW SVW SW SnNnNVVW SW SnWSSn1
10、LhhhhSW SS其中是 的加權(quán)平均值。v這是因?yàn)?2112211221112122LLpropopthhhhhhLLhhhhhhLLLhhhhhhhhLhhhn VVW SW SW SSW SSW SW S SW SWSSv 反映了S1,S2, ,SL之間的差異程度。若其值大,則Vprop比Vopt明顯要大,采用按比例分配在精度上明顯要比最優(yōu)分配差,這時(shí)應(yīng)盡量考慮使用最優(yōu)分配;反之,若其值小,則說明Vprop與Vopt之間的差距不大,此時(shí)可以考慮采用按比例分配。v一般來說, 是未知的,而且需要在抽樣之前進(jìn)行估計(jì),這樣就很難給出它的一個(gè)較好估計(jì),因此所計(jì)算出的最優(yōu)分配只是近似的,有時(shí)甚至是很
11、不準(zhǔn)確的。按比例分配的優(yōu)點(diǎn)是簡(jiǎn)便易行,便于在現(xiàn)場(chǎng)使用。因此即使增加1020%的方差,那也是值得的。21LhhhWSS2hS12,1,2,hhhhNYYYhL總體:。 22112112211122112211111111111hhhNLhihiNLhihhhiNLLhihhhhihLLhhhhhhLLhhhhhhSYYNYYYYNYYNYYNNNSYYNNW SW YYv 反映了 之間的差異程度。v方差消除了: 層間均值之間差異的結(jié)果; 層間標(biāo)準(zhǔn)差之間差異的結(jié)果。22211212211111111LLranhhhhhhLprophhhLLopthhhhhhSffVfW SW YYnnnfVW Y
12、YnfVWSSW YYnn21LhhhW YY1,LYY三、要求進(jìn)行大于100%的抽樣的分配v最優(yōu)分配的三個(gè)條件:(1) n1+ n2+ + nL = n; (2) n1, n2, , nL皆為自然數(shù); (3) nhNh,h=1, 2, , L。v例2 N1=5, N2=5, n =7第一層:65, 65, 65, 65, 65;第二層:4, 20, 45, 67, 112。v若n1N1,則最優(yōu)的修正分配法是這是假定h2時(shí), ;v若又發(fā)生了 ,則我們就改變分配方案為這是假定h3時(shí), ;1112,2,hhhLhhhW SnNnnNhLW ShhnN22nN1122123,3,hhhLhhhnNn
13、NW SnnNNhLW ShhnNv我們可以繼續(xù)這樣做,直到每個(gè) 。這樣最后所得的分配可以證明是當(dāng)給定n以后所能希望得到的最優(yōu)分配。v如使用修正后的最優(yōu)分配 ,則v一般地,有其中 表示對(duì) 的各層求和, 是修正后的這些層的總樣本容量。hhnN2211minLLhhhhhhstW SW SVynN22minhhhhstW SW SVynNhhnNn四、考慮費(fèi)用時(shí),樣本容量的最優(yōu)分配v假定費(fèi)用函數(shù)具有形式 v定理6 在具有(1)式線性費(fèi)用函數(shù)的分層隨機(jī)抽樣中,在規(guī)定的費(fèi)用C的條件下,如01(1)LhhhCcc n00,1,hhhhhhhhhhhhhhhhhhhhhhhhhCcN ScCcW ScnN
14、 ScW ScN ScW ScnnnhLN ScW Sc則 達(dá)到最小值。v定理6導(dǎo)出下面的行動(dòng)準(zhǔn)則。若 這一層單元較多(Nh大); 這一層內(nèi)部變異程度較大(Sh大); 這一層抽樣比較省錢(ch?。t對(duì)這一層要抽取一個(gè)容量較大的樣本。v當(dāng)c1= =cL=c時(shí),C=c0+cn,這時(shí)定理6就退化為定理5。stV yv定理7 在具有(1)式線性費(fèi)用函數(shù)的分層隨機(jī)抽樣中,在規(guī)定的方差 的條件下,如 則費(fèi)用C達(dá)到最小值。v推論4 定理7中,若c1= =cL=c,則所需的最小樣本容量為 stV yV2,1,hhhhhhhhhhhhhhhhhhhhhW ScW ScnVW SNN ScW ScnnnhLN
15、ScW Sc22hhhhhhhhhW SN SnnnVW SNN S,且3.4 樣本容量的確定v給定方差上限V,即 ,采用的分配可表示為 ,這樣就可以確定n。stV yVhhnw n11Neyman1hhhhhhhhLLhhhhhhhNwWNN SW SwN SW SwL為按比例分配;為分配;為等額分配;等等。v解方程 ,可得一般地, 是未知的,需用估計(jì)值 代替。v按比例分配時(shí),stV yV22221122111111LLhhhhhhhhLLhhhhhhW SW SwVwnVW SW SNNV2hS2hs21000,1LhhhW SnnnnVNv最優(yōu)分配時(shí),v若V沒有給定,而是給定絕對(duì)誤差限d
16、(置信度為1),并假定 ,則 ,將 代入上述各公式中即可求得n 。21211LhhhLhhhW SnVW SN,styN2duV222Vdu3.5 求比例的分層抽樣v一、總體比例的估計(jì)v二、最優(yōu)分配v三、比例的分層抽樣在精確度上的評(píng)價(jià)v四、求比例時(shí)樣本容量的確定一、總體比例的估計(jì)v記 為第h層的總體比例, 為第h層的樣本比例,于是總體比例易見, 是P的無偏估計(jì)。v定理8 采用分層隨機(jī)抽樣時(shí),pst的方差是hhhPANhhhpanhhhhhhAN PPW PNNsthhpW p21hhhsthhW PQV pfnv推論5 采用按比例分配時(shí),有v在定理8和推論5中,將 代替 即可得到V(pst)的
17、估計(jì)量s2(pst)。v當(dāng)nh皆很大,ph和qh皆不太小時(shí),ph N( , ),于是 pst N( , ),因此可得P的置信度為1的置信區(qū)間為pstu/2s(pst) A=NP的1置信區(qū)間為Npstu/2Ns(pst)1sthhhfV pW PQn1hhhp qn hhhPQn例3.3 v為調(diào)查某個(gè)高血壓高發(fā)病地區(qū)青少年與成年人高血壓的患病率,對(duì)14歲以上的人分四個(gè)年齡組進(jìn)行分層隨機(jī)抽樣,調(diào)查結(jié)果如下表所示。求總體高血壓患病率P的估計(jì)及其標(biāo)準(zhǔn)差的估計(jì)。二、最優(yōu)分配v當(dāng)n固定時(shí),最優(yōu)分配公式為v當(dāng)總費(fèi)用 固定時(shí),最優(yōu)分配為11,1,hhhhhhLLhhhhhhhNPQN SnnnhLN SNPQ0hhCcc n111,hhhhhhhhLLhhhhhhhhhN ScNPQcnnnN ScNPQchL三、比例的分層抽樣在精確度上的評(píng)價(jià)v假定費(fèi)用函數(shù)為 。若所有各層每一單元的費(fèi)用都相同,即c1= =cL= c,則有兩條有用的工作規(guī)則:v1.除非Ph在各層間差異程度很大,與簡(jiǎn)單隨機(jī)抽樣相比,分層隨機(jī)抽樣在精確度上的提高是小的或是中等。如:取 ,則得下表0hhCcc n12313,3LWWWv2.若所有Ph的 在0.1與0.9之間,當(dāng)n為固定時(shí),采取最優(yōu)分配與采取按比例分配
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度學(xué)生傷害賠償協(xié)議書(校園意外)
- 二零二五年度道路運(yùn)輸企業(yè)司機(jī)薪酬管理合同
- 2025年度物業(yè)保潔項(xiàng)目管理勞動(dòng)合同
- 二零二五年度業(yè)主委員會(huì)與物業(yè)服務(wù)社區(qū)停車管理合同
- 2025年度門面房出租與租賃合同爭(zhēng)議解決協(xié)議
- 典當(dāng)與拍賣服務(wù)作業(yè)指導(dǎo)書
- 2025年IT服務(wù)管理培訓(xùn)課件
- 二手住房出售協(xié)議
- 網(wǎng)絡(luò)直播行業(yè)主播言論免責(zé)協(xié)議
- 客戶關(guān)系管理軟件開發(fā)外包合同書
- 機(jī)電一體化(專業(yè)畢業(yè)論文)
- 小學(xué)2年級(jí)心理健康教育課件《智斗“攔路虎”-人人都會(huì)有困難》
- 2024年新疆區(qū)公務(wù)員錄用考試《行測(cè)》真題及答案解析
- 焊工(初級(jí))考試題庫及答案
- 2024年云南省中考物理試題含答案
- 感染科質(zhì)控中心工作匯報(bào)
- Module1Unit1Welivedinasmallhouse (教案) 英語五年級(jí)下冊(cè)
- 期末試卷(試題)-2024-2025學(xué)年滬教版三年級(jí)上冊(cè)數(shù)學(xué)
- 風(fēng)險(xiǎn)評(píng)估報(bào)告模板
- 合肥市2024年中考理化生實(shí)驗(yàn)評(píng)分細(xì)則
- 2024年湖南學(xué)業(yè)水平考試地理真題及答案
評(píng)論
0/150
提交評(píng)論