版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
抽樣調(diào)查-2簡單隨機抽樣2023/12/28抽樣調(diào)查2簡單隨機抽樣§2.1定義與符號一、定義與符號
(一)定義上述抽樣就稱為不放回簡單隨機抽樣
定義2.1:設(shè)有限總體共有N個單元,一次整批抽取n個單元使得每個單元被抽中的概率都相等,任何n個不同單元的組合(樣本)都有相同的概率被抽中,這種抽樣方法稱為簡單隨機抽樣法,所抽到的樣本為簡單隨機樣本。
2023/12/282抽樣調(diào)查2簡單隨機抽樣
定義2.2:(在具體實施過程中,)從總體中逐個等概率抽取單元(每次抽取到尚未入樣的任何一個單元的概率都相等),直到抽滿n個為止。如果每次抽中一個單元,然后放回總體,重新抽取。這樣一個單元有可能被重復(fù)抽中,故又稱重復(fù)抽樣。2023/12/283抽樣調(diào)查2簡單隨機抽樣
定義2.3按照從總體的N個單元中抽取n個單元的所有可能不同的組合構(gòu)造所有可能的CNn個樣本,從CNn個樣本隨機抽取一個樣本,使每個樣本被抽中的概率都等于1/CNn.上述三中定義其實是完全等價的,而定義2.2在實際中容易實施。2023/12/284抽樣調(diào)查2簡單隨機抽樣例2.1設(shè)總體有5個單元(1,2,3,4,5),按有放回簡單隨機抽樣的方式抽取容量為2的樣本,則所有可能樣本為個,如表2.1。
表2.1放回簡單隨機抽樣所有可能樣本1,11,21,31,41,52,12,22,32,42,53,13,23,33,43,54,14,24,34,44,55,15,25,35,45,52023/12/285抽樣調(diào)查2簡單隨機抽樣例2.2上述總體按不放回簡單隨機抽樣方式抽取容量為2的樣本,則所有可能樣本為個,如表2.2。1,21,31,41,52,32,42,53,43,54,5表2.2不放回簡單隨機抽樣所有可能樣本2023/12/286抽樣調(diào)查2簡單隨機抽樣(二)樣本分布與符號從總體抽樣單元。假設(shè)順序被抽中的樣本單元的號碼為(入樣號碼),則樣本為,稱為抽樣比(Samplingfraction)。中逐個不放回抽取n個作為隨機變量樣本有什么分布呢?2023/12/287抽樣調(diào)查2簡單隨機抽樣1y1,…yn同分布但不相互獨立,其共同分布列為2(yi,yj)的聯(lián)合分布列均同(y1,y2)2023/12/288抽樣調(diào)查2簡單隨機抽樣表2.3符號總體參數(shù)樣本統(tǒng)計量2023/12/289抽樣調(diào)查2簡單隨機抽樣二、抽樣方法(一)抽簽法
制作N個外形相同的簽,將它們充分混合,然后一次抽取n個簽,或一次抽取一個但不放回,抽取n次得到n個簽。則這n個簽上所對應(yīng)號碼表示入樣的單元號。例如:某中學(xué)為了解學(xué)生身體素質(zhì)的基本狀況,從全校N=1200人中抽取一個簡單樣本n=100人進行檢查。2023/12/2810抽樣調(diào)查2簡單隨機抽樣1隨機數(shù)表(二)隨機數(shù)法如上例,N=1200,則在表中隨機連續(xù)取四列,順序往下,選出前面100個不同(不放回抽樣)的0001~1200之間的數(shù)字。如果不夠100個,可隨機再取四列,同樣操作,直至抽取100個止。2023/12/2811抽樣調(diào)查2簡單隨機抽樣Simplerandomsampling2023/12/2812抽樣調(diào)查2簡單隨機抽樣Tableofrandomnumbers2023/12/2813抽樣調(diào)查2簡單隨機抽樣2隨機數(shù)骰子隨機數(shù)骰子是由均勻材質(zhì)制成的正20面體,每個面上刻有一個0~9的數(shù)字,且每個數(shù)字只出現(xiàn)在兩個面上。要產(chǎn)生一個m位數(shù)的隨機數(shù)(如m=4,N=1200),則將m(m=4)個顏色不同的骰子盒中,并規(guī)定每個顏色代表的位數(shù),蓋上蓋子,充分搖動盒子后,打開讀出各色骰子的數(shù)字,即可得一個隨機數(shù)。重復(fù)上述過程,直至產(chǎn)生了n個滿足條件的隨機數(shù)。2023/12/2814抽樣調(diào)查2簡單隨機抽樣3利用統(tǒng)計軟件直接抽取法大部分統(tǒng)計軟件都有產(chǎn)生隨機數(shù)的功能,快捷方便。不過產(chǎn)生的是偽隨機數(shù),有一定循環(huán)周期的。簡單介紹一下利用EXCEL產(chǎn)生隨機數(shù)的方法.
2023/12/2815抽樣調(diào)查2簡單隨機抽樣2023/12/2816抽樣調(diào)查2簡單隨機抽樣2023/12/2817抽樣調(diào)查2簡單隨機抽樣2023/12/2818抽樣調(diào)查2簡單隨機抽樣§2.2簡單估計法(SE)一、總體均值的估計(一)簡單估計定義
………………..(2.6)
(二)簡單估計量的性質(zhì)引理2.1從大小為N的總體中抽取一個樣本容量為n的簡單隨機樣本,則總體中每個特定的單元入樣的概率為n/N,兩個特定單元入樣的概率為n(n-1)/N(N-1)。
2023/12/2819抽樣調(diào)查2簡單隨機抽樣
引理2.2從大小為N的總體中抽取一個樣本容量為n的簡單隨機樣本。若令:則:2023/12/2820抽樣調(diào)查2簡單隨機抽樣(二)簡單估計量的性質(zhì)
定理2.1上述簡單估計是無偏的,即
定理2.2上述簡單估計的方差(均方誤差)為:……….(2.12/2.18)
2023/12/2821抽樣調(diào)查2簡單隨機抽樣證明(P35證法1對稱證法):為0注意樣本分布2023/12/2822抽樣調(diào)查2簡單隨機抽樣推論2.7的無偏估計為………..(2.25)
證明:只須說明樣本方差是總體方差的無偏估計即可。注意2023/12/2823抽樣調(diào)查2簡單隨機抽樣
例2.3從某個N=100的總體重抽取一個容量n=10的簡單隨機樣本,要估計總體平均水平,并給出置信度為95%的置信區(qū)間估計。如表2.4序號1234567891045204661508表2.4簡單隨機樣本指標
2023/12/2824抽樣調(diào)查2簡單隨機抽樣2023/12/2825抽樣調(diào)查2簡單隨機抽樣(三)有放回簡單隨機抽樣的簡單估計量由于故有放回抽樣的精度低于不放回抽樣的精度。2023/12/2826抽樣調(diào)查2簡單隨機抽樣說明:1抽樣調(diào)查中的估計量與傳統(tǒng)數(shù)理統(tǒng)計中估計量的區(qū)別(見表2.5)表2.5抽樣理論與傳統(tǒng)數(shù)理統(tǒng)計關(guān)于樣本均值性質(zhì)異同比較抽樣理論數(shù)理統(tǒng)計理論假設(shè)樣本之間不獨立,所以可能樣本最多個,欲估計總體特征為,當n=N時可以求出樣本之間獨立,所有可能樣本最多為無限多個;欲估計總體特征為總體(一般是隨機變量X)期望μ,一般不能通過樣本求出符號、定義期望方差2023/12/2827抽樣調(diào)查2簡單隨機抽樣2總體方差一般也是未知的,故計算估計量方差(估計)值時總是用樣本方差直接去估計它,因為該估計無偏,故這樣做相對是合理的。3
對于無限總體的簡單隨機抽樣(或有限總體有放回簡單抽樣)估計中由于N一般很大,
即從有限總體抽樣得到簡單隨機樣本均值得方差是從無限總體抽樣得的獨立樣本均值的方差的1-f倍,要小些,這意味著對同等樣本量,不放回簡單隨機抽樣的精度高于有放回的。由于樣本點不會重復(fù),樣本量相同時所包含的有效樣本點更多,因此信息更多,效果當然好些。1-f又被稱為有限總體校正系數(shù)。2023/12/2828抽樣調(diào)查2簡單隨機抽樣4樣本容量n越大,估計量方差越小。當樣本容量一定時,總體方差越大,估計量方差越大。由于總體方差是固定的,因此在簡單隨機抽樣的條件下,要提高估計量精度就只有增加樣本容量了。但增加樣本容量也會帶來計算量驟增和成本增加,所以是矛盾的一對,需要找到合適的平衡點。2023/12/2829抽樣調(diào)查2簡單隨機抽樣二、總體總量的估計(一)簡單估計量…………….(2.7)(二)估計量性質(zhì)推論2.12.42.8
……….(2.13)…………….(2.19)…………….(2.26)2023/12/2830抽樣調(diào)查2簡單隨機抽樣例2.4(續(xù)例2.3)估計總體總量,并給出置信度為95%條件下的估計相對誤差
。三、總體比例的估計將總體分為兩類,一類具有該特征的單元A個,另一類不具有該特征的單元N-A個。調(diào)查的目的是估計或A
若令則2023/12/2831抽樣調(diào)查2簡單隨機抽樣(一)估計量的定義(二)估計量性質(zhì)推論2.22.52.9對于簡單隨機抽樣,p是P無偏估計。p的方差為
方差的無偏估計……(2.27)……(2.20)2023/12/2832抽樣調(diào)查2簡單隨機抽樣例2.5某超市開張一段時間后,為改進銷售服務(wù)環(huán)境,欲調(diào)查附近幾個小區(qū)居民到該超市購物的滿意度。該超市與附近一個小區(qū)的居委會取得聯(lián)系,在總體中按簡單隨機抽樣抽取了一個大小為n=200人的樣本。調(diào)查發(fā)現(xiàn)對購物表示滿意或基本滿意的居民有130人,估計對該超市購物環(huán)境持肯定態(tài)度的居民的比例,并在置信度95%條件下,給出估計的絕對誤差和置信區(qū)間,假設(shè)抽樣比可以忽略。2023/12/2833抽樣調(diào)查2簡單隨機抽樣(2)樣本協(xié)方差是總體協(xié)方差的無偏估計.
(2.22,2.23)(2.29)考慮二維總體2023/12/2834抽樣調(diào)查2簡單隨機抽樣證明:仍采用對稱法(P40證法1)(1)注意樣本分布注意為02023/12/2835抽樣調(diào)查2簡單隨機抽樣(1)證法2:(構(gòu)造性)展開2023/12/2836抽樣調(diào)查2簡單隨機抽樣(2)注意由(1)2023/12/2837抽樣調(diào)查2簡單隨機抽樣一、概念與作用(一)概念比率(Ratio)與比例(Proportion)區(qū)別(二)作用§2.3比率估計量及其性質(zhì)一種場合是待估的總體參數(shù)R是兩個變量比值。如人口密度,恩格爾系數(shù)等。
分子分母均為r.v.分子為r.v.2023/12/2838抽樣調(diào)查2簡單隨機抽樣另一種應(yīng)用場合,雖然待估的參數(shù)是某個研究變量的均值或總體總量,它本來可以通過樣本均值加以估計,但是為了提高估計的效率,它通過引進一個輔助變量xi,來計算比率,即再通過這一比率乘以總體已知的輔助變量均值或總量來達到估計的目的。2023/12/2839抽樣調(diào)查2簡單隨機抽樣二、應(yīng)用條件(1)輔助變量(auxiliaryvariable)資料易得或已知(2)輔助變量與目標變量之間存在高度相關(guān)性且相關(guān)性穩(wěn)定。(3)樣本量一般要求比較大三、簡單隨機抽樣下的比率估計2023/12/2840抽樣調(diào)查2簡單隨機抽樣(一)定義
比率估計量(ratioestimator)又稱比估計。(2.30)(2.31)2023/12/2841抽樣調(diào)查2簡單隨機抽樣(二)比率估計的性質(zhì)引理2.3定理2.6推論2.112023/12/2842抽樣調(diào)查2簡單隨機抽樣引理2.4證:當n充分大時2023/12/2843抽樣調(diào)查2簡單隨機抽樣定理2.7推論2.122023/12/2844抽樣調(diào)查2簡單隨機抽樣因而方差估計有兩種思路…(2.39)…(2.40)2023/12/2845抽樣調(diào)查2簡單隨機抽樣例2.6i123456均值XiYi011331151882910464.518表4.1假設(shè)的總體數(shù)據(jù)2023/12/2846抽樣調(diào)查2簡單隨機抽樣解:i樣本簡單估計比率估計123456789101112131415均值1,21,31,41,51,62,32,42,52,63,43,53,64,54,65,62.06.09.515.023.57.010.516.024.514.520.028.523.532.037.518181817.116.87521.1515.7515.751620.045516.312516.363619.730816.269219.218.7517.686442023/12/2847抽樣調(diào)查2簡單隨機抽樣2023/12/2848抽樣調(diào)查2簡單隨機抽樣解2023/12/2849抽樣調(diào)查2簡單隨機抽樣例2.7(P51例2.4)
在二十世紀90年代初的一項工資研究中,人們發(fā)現(xiàn)IT行業(yè)中,從業(yè)者的現(xiàn)薪與起薪之間相關(guān)系數(shù)ρ高達0.88,已知某IT企業(yè)474名員工的評鑒起薪為17016.00元/年,現(xiàn)根據(jù)對100個按簡單隨機抽樣方式選出的員工現(xiàn)薪的調(diào)查結(jié)果,估計該企業(yè)員工的現(xiàn)薪平均水平。數(shù)據(jù)如下:,,2023/12/2850抽樣調(diào)查2簡單隨機抽樣解:簡單估計95%的置信區(qū)間比率估計95%的置信區(qū)間2023/12/2851抽樣調(diào)查2簡單隨機抽樣例2.8某縣在對船舶月完成的貨運量進行調(diào)查,對運管部門登記的船舶臺帳進行整理后獲得注冊船舶2860艘,載重噸位154626噸。從2860艘船舶中抽取一個n=10的簡單隨機樣本。調(diào)查得到樣本船舶月完成的貨運量及其載重噸位如表4.2(單位:噸)要估計該縣船舶月完成貨運量1234578015001005376600100505010206789102170182314501581370120150802050表4.2樣本船舶貨運量及載重噸位數(shù)據(jù)2023/12/2852抽樣調(diào)查2簡單隨機抽樣解2023/12/2853抽樣調(diào)查2簡單隨機抽樣2023/12/2854抽樣調(diào)查2簡單隨機抽樣
(三)消除比率估計偏倚的方法2023/12/2855抽樣調(diào)查2簡單隨機抽樣
哈特利-羅斯(Hartley-Ross,1954)提出的估計量(2.51)于是可以令2023/12/2856抽樣調(diào)查2簡單隨機抽樣事實上:2023/12/2857抽樣調(diào)查2簡單隨機抽樣例2.9
2023/12/2858抽樣調(diào)查2簡單隨機抽樣四、比率估計的效率≈1/22023/12/2859抽樣調(diào)查2簡單隨機抽樣§2.4回歸估計量及其性質(zhì)比率估計成為最優(yōu)線性估計的條件:(1)樣本點(yi,xi)形成過原點的直線(2)yi對直線的偏差與xi成比例2023/12/2860抽樣調(diào)查2簡單隨機抽樣一、回歸估計的定義二、β是已知常數(shù)時(記為β0)
定理2.8
2023/12/2861抽樣調(diào)查2簡單隨機抽樣Q:“β0取何值時,回歸估計量的精度最高,即最???”定理2.9:三、由樣本回歸系數(shù)計算得到
(2.56Y對X回歸系數(shù))定理2.10這時的均值估計量是漸近無偏估計注意b并不是B的無偏估計2023/12/2862抽樣調(diào)查2簡單隨機抽樣定理2.11
它的一個近似估計為:2023/12/2863抽樣調(diào)查2簡單隨機抽樣例2.10續(xù)例2.82023/12/2864抽樣調(diào)查2簡單隨機抽樣四、精度比較1回歸估計總優(yōu)于簡單估計,除非ρ=0
2比率估計優(yōu)于簡單估計的條件
3回歸估計優(yōu)于比率估計的條件是五、多變量回歸估計(略)2023/12/2865抽樣調(diào)查2簡單隨機抽樣§2.5樣本量的確定一、總體均值情形1給定標準誤差上限,求滿足條件的最小n
2023/12/2866抽樣調(diào)查2簡單隨機抽樣
2給定絕對誤差上限及信度,求滿足條件的最小n有放回,不放回3給定相對誤差上限及信度,求滿足條件的最小n有放回不放回2023/12/2867抽樣調(diào)查2簡單隨機抽樣4給定相對標準誤差上限γ,求滿足條件
的最小n.放回不放回例2.6在例2.3中,如果要求以95%的把握保證相對誤差不超過10%,樣本量應(yīng)該取多少?2023/12/2868抽樣調(diào)查2簡單隨機抽樣2023/12/2869抽樣調(diào)查2簡單隨機抽樣二、總體總量情形作業(yè)考慮各種情行的公式例欲估計一個農(nóng)村的每月平均副業(yè)收入,已知該村共有1000戶農(nóng)戶,月副業(yè)收入的標準差不超過300元。(1)現(xiàn)要求置信度為95%,估計每戶月副業(yè)收入的誤差不超過50元,應(yīng)抽取多少戶作為樣本?(2)若每戶調(diào)查費用為15元,調(diào)查管理費用為800元,該項調(diào)查預(yù)計費用是多少?2023/12/2870抽樣調(diào)查2簡單隨機抽樣例如果上例目的是要估計全村1000戶一月的副業(yè)總收入,允許總量的誤差為40000,置信度為95%,應(yīng)抽取多少樣本?
三、總體參數(shù)P的情形四、總體參數(shù)的預(yù)先估計2023/12/2871抽樣調(diào)查2簡單隨機抽樣(1)根據(jù)以往的經(jīng)驗數(shù)據(jù)例如對同類問題獲得過一個樣本量n0為的簡單隨機樣本,并且已知在一定置信度下(比如95%),該調(diào)查對總體均值(或總量)估計的相對誤差上限為r0,則在相同的置信度下,如果希望本次調(diào)查的相對誤差上限為r,則在抽樣比可以忽略的情況下,可以近似地計算出本次調(diào)查所需的樣本量:作業(yè)證明上述結(jié)論2023/12/2872抽樣調(diào)查2簡單隨機抽樣(2)在正式調(diào)查前進行試點調(diào)查,根據(jù)試點調(diào)查的結(jié)果作出估計,或者采用兩步抽樣(3)沒有同類調(diào)查經(jīng)驗,又不能進行預(yù)調(diào)查,則只能通過有經(jīng)驗的專家作一些定性分析,對總體變異系數(shù)C(比較穩(wěn)定)作出估計。
(4)注意:針對總體參數(shù)為P時情形
當估計P<0.5,則選取較大的P,如若估計P為[0.3
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度10kv變配電工程環(huán)保驗收合同3篇
- 畢節(jié)工業(yè)職業(yè)技術(shù)學(xué)院《單片機原理與應(yīng)用實驗》2023-2024學(xué)年第一學(xué)期期末試卷
- 2025版高新技術(shù)產(chǎn)業(yè)孵化器固定期限承包合同書3篇
- 二零二五年度中央空調(diào)安裝工程質(zhì)量保修與維護合同3篇
- 直播合同模板
- 二零二五年代繳社保及企業(yè)人力資源外包合同2篇
- 聲明拒簽勞動合同
- 房屋抵押合同樣本
- 二零二五年度《國際商事合同通則》解讀及合同起草技巧3篇
- 2025版新型建筑節(jié)能材料研發(fā)與應(yīng)用合同3篇
- 高速服務(wù)區(qū)經(jīng)營分析報告
- 山東省濟南市2023-2024學(xué)年高三上學(xué)期期末學(xué)習(xí)質(zhì)量檢測物理試題(解析版)
- 國家開放大學(xué)電大本科《古代小說戲曲專題》2025期末試題及答案(試卷號:1340)
- 粵教粵科版三年級科學(xué)上冊全冊單元期中期末測試卷 含答案
- 遼寧省大連市甘井子區(qū)2023-2024學(xué)年五年級上學(xué)期期末英語試卷
- (完整版)年產(chǎn)30萬噸甲醇工藝設(shè)計畢業(yè)設(shè)計
- 外研版五年級上冊(三起)連詞成句專項訓(xùn)練
- 養(yǎng)老機構(gòu)風(fēng)險管控清單
- 辦公室消防管理制度
- 動火作業(yè)審批表
- 浙江省紹興市諸暨市2023-2024學(xué)年數(shù)學(xué)三上期末達標檢測試題含答案
評論
0/150
提交評論