抽樣調(diào)查 簡(jiǎn)單隨機(jī)抽樣PPT教案_第1頁(yè)
抽樣調(diào)查 簡(jiǎn)單隨機(jī)抽樣PPT教案_第2頁(yè)
抽樣調(diào)查 簡(jiǎn)單隨機(jī)抽樣PPT教案_第3頁(yè)
抽樣調(diào)查 簡(jiǎn)單隨機(jī)抽樣PPT教案_第4頁(yè)
抽樣調(diào)查 簡(jiǎn)單隨機(jī)抽樣PPT教案_第5頁(yè)
已閱讀5頁(yè),還剩91頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、會(huì)計(jì)學(xué)1抽樣調(diào)查抽樣調(diào)查 簡(jiǎn)單隨機(jī)抽樣簡(jiǎn)單隨機(jī)抽樣注意注意第1頁(yè)/共95頁(yè)【例 2.1】設(shè)總體有5個(gè)單元(1,2,3,4,5),按放回簡(jiǎn)單隨機(jī)抽樣的方式抽2個(gè)單元,則所有可能的樣本為2552個(gè)(考慮樣本單元的順序)1,11,21,31,41,52,12,22,32,42,53,13,23,33,43,54,14,24,34,44,55,15,25,35,45,5(放回簡(jiǎn)單隨機(jī)抽樣所有可能的樣本)第2頁(yè)/共95頁(yè)【例 2.2】設(shè)總體有5個(gè)單元(1,2,3,4,5),按不放回簡(jiǎn)單隨機(jī)抽樣的方式抽2個(gè)單元,則所有可1,21,31,41,52,32,42,53,43,54,5(不放回簡(jiǎn)單隨機(jī)抽樣所有可

2、能的樣本)能的樣本為個(gè)。10nNC在實(shí)際工作中,更多地采用不放回簡(jiǎn)單隨機(jī)抽樣,所以在實(shí)際工作中,更多地采用不放回簡(jiǎn)單隨機(jī)抽樣,所以以下討論的簡(jiǎn)單隨機(jī)抽樣一般都指不放回簡(jiǎn)單隨機(jī)抽樣以下討論的簡(jiǎn)單隨機(jī)抽樣一般都指不放回簡(jiǎn)單隨機(jī)抽樣.第3頁(yè)/共95頁(yè)二、符號(hào)大寫(xiě)字母表示總體單元的標(biāo)志值:如小寫(xiě)字母表示樣本單元的標(biāo)志值:如NYYY,21nyyy,21調(diào)查的總體目標(biāo)量主要有:總體總量 Y;總體均值 Y;總體某一指標(biāo)的比例 P;兩個(gè)總體總量的比率 R。對(duì)估計(jì)精度進(jìn)行計(jì)算時(shí),要涉及到總體方差和樣本方差等。下面分別列出:第4頁(yè)/共95頁(yè)總體方差樣本方差NiiYYNS122)(11niiyyns122)(11還

3、有一些其他符號(hào),分別說(shuō)明如下:第5頁(yè)/共95頁(yè)總 體NNiiYYYYY211NYYYYNYNNii2111NiiYNNAP11(10或iY)XYXYXYRNiiNii11,NiiYYNS122)(1121NN樣 本將左邊式子中將左邊式子中的大寫(xiě)字母改的大寫(xiě)字母改為小寫(xiě)字母為小寫(xiě)字母。第6頁(yè)/共95頁(yè)總體指標(biāo)值上面帶符號(hào)“”的表示由樣本得到的總體指標(biāo)的估計(jì)。如RPYY,稱(chēng)為RPYY,的估計(jì)。估計(jì)量的方差用V表示,如);(YV標(biāo)準(zhǔn)差用S表示,如).()(YVYS對(duì))(YV的樣本估計(jì)不用)(YV而用)(Yv.)()()(表示的估計(jì)用YvYsYS稱(chēng)Nn為抽樣比,記為f.第7頁(yè)/共95頁(yè)2.2 簡(jiǎn)單估計(jì)

4、量及其性質(zhì) 無(wú)論調(diào)查對(duì)象是何種總體參數(shù),其實(shí)所有估計(jì)無(wú)論調(diào)查對(duì)象是何種總體參數(shù),其實(shí)所有估計(jì)量通常都是樣本均值的某種線(xiàn)性組合,因此在抽樣量通常都是樣本均值的某種線(xiàn)性組合,因此在抽樣中不管討論何種估計(jì)的基本性質(zhì),都只圍繞樣本均中不管討論何種估計(jì)的基本性質(zhì),都只圍繞樣本均值進(jìn)行。而對(duì)樣本均值這個(gè)核心估計(jì)量的研究則分值進(jìn)行。而對(duì)樣本均值這個(gè)核心估計(jì)量的研究則分為兩個(gè)方面:為兩個(gè)方面:一方面是求樣本均值對(duì)所有可能樣本的數(shù)學(xué)期望一方面是求樣本均值對(duì)所有可能樣本的數(shù)學(xué)期望 (檢驗(yàn)估計(jì)量是否無(wú)偏)。(檢驗(yàn)估計(jì)量是否無(wú)偏)。另一方面是求樣本均值對(duì)所有可能樣本的方差另一方面是求樣本均值對(duì)所有可能樣本的方差 (檢

5、驗(yàn)估計(jì)量誤差的大?。?。(檢驗(yàn)估計(jì)量誤差的大小)。第8頁(yè)/共95頁(yè) 為了討論簡(jiǎn)單估計(jì)的性質(zhì),首先我們來(lái)看兩個(gè)引理:為了討論簡(jiǎn)單估計(jì)的性質(zhì),首先我們來(lái)看兩個(gè)引理: 引理一 從大小為從大小為N的總體中抽取一個(gè)樣本量的總體中抽取一個(gè)樣本量為為n的簡(jiǎn)單隨機(jī)樣本,則總體中每個(gè)特定單元的入樣概率為:的簡(jiǎn)單隨機(jī)樣本,則總體中每個(gè)特定單元的入樣概率為:兩個(gè)特定單元都入樣的概率為:兩個(gè)特定單元都入樣的概率為:Nn1122NnNnCCnNnN第9頁(yè)/共95頁(yè)NnCCnNnN/112222nNCCjY) 1() 1(/2222NNnnCCCnNnNnNCnNCiY引理一引理一的證明:在的證明:在N N個(gè)單元中取個(gè)單元

6、中取n n個(gè)單元為樣本,個(gè)單元為樣本,共有共有 個(gè)樣本。在個(gè)樣本。在 個(gè)樣本中,包含某個(gè)樣本中,包含某個(gè)特定單元個(gè)特定單元 的樣本數(shù)為:的樣本數(shù)為: 每個(gè)樣本被每個(gè)樣本被抽中的概率為:抽中的概率為: 。 1111nNCCiY同時(shí)包含兩個(gè)特定單元同時(shí)包含兩個(gè)特定單元 的樣本數(shù)為的樣本數(shù)為 每個(gè)樣本被抽中的概率為每個(gè)樣本被抽中的概率為:第10頁(yè)/共95頁(yè)iYia), 2 , 10, 1NiYYaiii不入樣(,若入樣若由二項(xiàng)分布可知:由二項(xiàng)分布可知:第11頁(yè)/共95頁(yè)1) 1() 1() 1()()()(),cov()1 ()1 ()0()1 ()()() 1() 1() 1() 1(1 (0)

7、1() 1(1)()1 (01)(2222NfffNNnnaEaEaaEaaffNnfNnfaEaEaVNNnnNNnnNNnnaaEfNnNnaEjijijiiiijii) 1() 1(10,) 1() 1(110,1NNnnaaPNNnnaaPNnaPNnaPjijiii所以,不難推出:所以,不難推出:第12頁(yè)/共95頁(yè)簡(jiǎn)單估計(jì)量的性質(zhì) u YyE)(是性質(zhì)1Y的無(wú)偏估計(jì),即y 下面我們用兩種與數(shù)理統(tǒng)計(jì)中不同的方法下面我們用兩種與數(shù)理統(tǒng)計(jì)中不同的方法來(lái)證明這一性質(zhì)。來(lái)證明這一性質(zhì)。思考思考:為什么不能用數(shù)理為什么不能用數(shù)理統(tǒng)計(jì)中常用的方法?統(tǒng)計(jì)中常用的方法?第13頁(yè)/共95頁(yè)YyE)(YY

8、NnnNnYnaEYnyEYanynyNiiNiiiNiiNiiinii111111)(1)(1)(11根據(jù)前面提到的關(guān)于根據(jù)前面提到的關(guān)于 的定義,有下式的定義,有下式ia第14頁(yè)/共95頁(yè) 第二種方法證明 u YyE)(證明:對(duì)于一個(gè)大小為N的總體,樣本量為n的簡(jiǎn)單隨機(jī)樣本有nNC個(gè),因此第15頁(yè)/共95頁(yè)NiiNnNnNnNnNiiCiinNnCinNYYNYCYCYCnnCYYYnCyyynCyEnnNnN11121111112111)(1)(1)(11)(21第16頁(yè)/共95頁(yè)其他幾個(gè)估計(jì)量的無(wú)偏性可容易推出:其他幾個(gè)估計(jì)量的無(wú)偏性可容易推出:1、對(duì)于總體總量YYNyNEYEyNY)

9、()(,2、對(duì)于總體比例PpEPEpP)()(,第17頁(yè)/共95頁(yè)y性質(zhì)2對(duì)于簡(jiǎn)單隨機(jī)抽樣, 的方差為:式中,n為樣本量;f=Nn為抽樣比;1-f為有限總體校正系數(shù)。V(y)=221SnfSNnnN(2.5)第18頁(yè)/共95頁(yè))1()1(1)(1111)(112)1(11)1(2)1(1),cov(2)(111)(2112211212212212211NiiNiiNiiNiiNjijiNiijNjiiNiijijNjiiiNiiNiiiniiYNNYNnfYNYNNnNfYYNYfNnnNfNnYYfNnYnaaYYaVYnYanVynVyV第19頁(yè)/共95頁(yè))1()()1(1)()1(1)1

10、(1221122212fnSYYNnfYYNnfYNYNnfNiiNiiNii即21)(SnfyV第20頁(yè)/共95頁(yè)212212)(1)1()()(YyEnYynEYyEyVniinii)(1)(12212YyYyEnYyEnjjiinii2121)()(YYNnYyEniinii而 )() 1() 1()(YYYYNNnnYyYyEjjiijjii 第21頁(yè)/共95頁(yè))(1)(1)(2212YyYyEnYyEnyVjjiinii)() 1() 1(1)(12212YYYYNNnnnYYNnnjjiinii)() 1() 1(1)(1221YYYYNnnYYnNjjiiNii)(11)(112

11、121YYNnYYNnNiiNii第22頁(yè)/共95頁(yè)NiNiiiYYNnYYNnnN1122)(11)()111 (121)(11YYNnNnNNii221)(111SnNnNYYNNnNnNii 21)(SnfyV即第23頁(yè)/共95頁(yè)性質(zhì)3 V(y)的無(wú)偏估計(jì)為:21snf2s式中,為樣本方差。)(yv212)(11yynsnii)()(11221YynYynnii證明:將 改寫(xiě)成:2s第24頁(yè)/共95頁(yè)由前面性質(zhì)1證明用過(guò)的對(duì)稱(chēng)論證法有:由性質(zhì)2有:22121) 1()()(SNNnYYNnYyENiinii2221)(SnNnNSnfYyE第25頁(yè)/共95頁(yè))()(11)(2212Yyn

12、EYyEnsEnii)1(1122SnNnNnSNNnn22)()1()1(SnNNnnNS第26頁(yè)/共95頁(yè)下面我們從關(guān)系式21)(SnfyV可以推出其他幾個(gè)估計(jì)量的方差)1 (111)()(1)()()(222PNPnnfpVPVSnfNyVNyNVYV第27頁(yè)/共95頁(yè) 總體總量的估計(jì)量方差是總體均值方差的直接總體總量的估計(jì)量方差是總體均值方差的直接推導(dǎo),下面我們來(lái)推導(dǎo)總體比例估計(jì)量的方差。推導(dǎo),下面我們來(lái)推導(dǎo)總體比例估計(jì)量的方差。即可。(只需證明此時(shí))111)1 (111)(2PNPNSPNPNnfPV第28頁(yè)/共95頁(yè))()1 (112112112NNNNNNNNSNNNNNNNNN

13、NNN11111)(11)1 (11PNPN第29頁(yè)/共95頁(yè)同理對(duì)樣本方差有)1 (11pnpns)1 (111)(PNPNnfPV因此第30頁(yè)/共95頁(yè))1 (11)1 (111)()(1)()(22ppnfpnpnnfpvPvsnfNyNvYv同樣下面我們從關(guān)系式21)(snfyv可以推出第31頁(yè)/共95頁(yè)估計(jì)量的方差是衡量估計(jì)量精度的度量。)(yV 從式可以看出,影響估計(jì)量方差的因素有:21)(SnfyV樣本量n; 總體未入樣比率1-f;2S 總體方差分析見(jiàn)教材P38,39第32頁(yè)/共95頁(yè) N N通常很大,當(dāng)通常很大,當(dāng)f0.05f0.05時(shí),可將時(shí),可將1-1-f f近似取為近似取

14、為1 1,這時(shí)影響估計(jì)量方差的,這時(shí)影響估計(jì)量方差的主要因素是樣本量主要因素是樣本量n n和總體方差和總體方差 。 的大小是我們無(wú)法改變的,因此,要的大小是我們無(wú)法改變的,因此,要提高估計(jì)量的精度就只有加大樣本量提高估計(jì)量的精度就只有加大樣本量。2S2S注 意第33頁(yè)/共95頁(yè)【例2.3】我們從某個(gè)N=100的總體中抽出一個(gè)大小為n=10的簡(jiǎn)單隨機(jī)樣本,要估計(jì)總體平均水平并給出置信度95%的置信區(qū)間。序號(hào)i1 2 3 4 5 6 7 8 9 104 5 2 0 4 6 6 15 0 8iy解:依題意,N=100,n=10,f=1 . 010010樣本均值為:5105011niiyny第34頁(yè)/

15、共95頁(yè)樣本方差為:111.199172)(11212yynsnii因此,總體平均值的估計(jì)為:5yYy的方差為:y的方標(biāo)準(zhǔn)差為:s.3115. 1)()(YvY的置信度95%的置信區(qū)間為:)(.2YszyY即 2.4295,7.5705.72. 1111.19101 . 0112snf)(Yv第35頁(yè)/共95頁(yè)niiyny11,的無(wú)偏估計(jì)是Yy。其方差為:V(22111)nsnNNy的無(wú)偏估計(jì)為)(yV21)(snyvu 放回簡(jiǎn)單隨機(jī)抽樣簡(jiǎn)單估計(jì)量第36頁(yè)/共95頁(yè) 注意:不放回時(shí)的方差為放回時(shí)的約1-f倍,而1-f1,因此不放回抽樣的估計(jì)精度比放回抽樣的估計(jì)精度高。第37頁(yè)/共95頁(yè)【例2.

16、4】我們從某個(gè)N=100的總體中抽出一個(gè)大小為n=10的簡(jiǎn)單隨機(jī)樣本,要估計(jì)總體總量并給出在置信度95%的條件下,估計(jì)量的相對(duì)誤差。序號(hào)i1 2 3 4 5 6 7 8 9 104 5 2 0 4 6 6 15 0 8iY解 依題意,N=100,由例2.3可知:1111.19, 52sy,因此,對(duì)總體總量的估計(jì)為:Y=1005=500 。第38頁(yè)/共95頁(yè)對(duì)V(Y)的樣本估計(jì)為:17201111.19101 . 01100)(2Yv0其標(biāo)準(zhǔn)差為:1488.131)()(Yvys因此,在置信度95%的條件下(對(duì)應(yīng)的t=1.96),Y的相對(duì)誤差為:5141. 05001488.13196. 1)(

17、YYst=51.41%第39頁(yè)/共95頁(yè)【例2.5】解:已知 n=200, a=130, 1-f1%65200130nap 某超市開(kāi)張一段時(shí)間之后,為改進(jìn)銷(xiāo)售服務(wù)環(huán)境,欲調(diào)查附近幾個(gè)小區(qū)居民到該超市購(gòu)物的滿(mǎn)意度。該超市與附近幾個(gè)小區(qū)居委會(huì)取得聯(lián)系,在整體中按簡(jiǎn)單隨機(jī)機(jī)樣,抽取了一個(gè)大小為n=200人的樣本。調(diào)查發(fā)現(xiàn)對(duì)該超市購(gòu)物環(huán)境表示滿(mǎn)意或基本滿(mǎn)意的居民有130位,要估計(jì)對(duì)該超市購(gòu)物環(huán)境持肯定態(tài)度居民的比例,并在置信度95%條件下,給出估計(jì)的絕對(duì)誤差和置信區(qū)間。假定這時(shí)的抽樣比可以忽略。第40頁(yè)/共95頁(yè)在置信度95%的條件下,估計(jì)的絕對(duì)誤差為:%63. 60338. 096. 1)(pstp

18、的95%置信區(qū)間為: 0.650338. 096. 10338. 0)()(pvps001143. 011)(pqnfpv第41頁(yè)/共95頁(yè)2.3 比率估計(jì)量及其性質(zhì) 用樣本均值作為總體均值的簡(jiǎn)單估計(jì)量,具有用樣本均值作為總體均值的簡(jiǎn)單估計(jì)量,具有無(wú)偏等很多優(yōu)良性質(zhì),且完全不依賴(lài)其它總體信息。無(wú)偏等很多優(yōu)良性質(zhì),且完全不依賴(lài)其它總體信息。但是,若我們有與調(diào)查變量相關(guān)的其它信息(通常但是,若我們有與調(diào)查變量相關(guān)的其它信息(通常稱(chēng)為輔助變量信息)可以利用,則估計(jì)的精度可以稱(chēng)為輔助變量信息)可以利用,則估計(jì)的精度可以大大提高。這就是我們下面要講的比率估計(jì)和回歸大大提高。這就是我們下面要講的比率估計(jì)和

19、回歸估計(jì)。估計(jì)。一、估計(jì)的概念第42頁(yè)/共95頁(yè)設(shè)設(shè) 主要變量為:主要變量為:Y Y 輔助變量為:輔助變量為:X X 兩變量的比率為:兩變量的比率為:XYXYR總體均值的比估計(jì):總體均值的比估計(jì):XRyYRR其中其中xyrR第43頁(yè)/共95頁(yè)二、比率估計(jì)的特點(diǎn)及注意事項(xiàng)1 1、使用比估計(jì)首先要知道輔助變量的總體均值(或總體總量),調(diào)查時(shí),既要觀(guān)測(cè)主要變量的、使用比估計(jì)首先要知道輔助變量的總體均值(或總體總量),調(diào)查時(shí),既要觀(guān)測(cè)主要變量的值還要觀(guān)測(cè)輔助變量的值;值還要觀(guān)測(cè)輔助變量的值;2 2、輔助變量必須與主要變量高度相關(guān)且整體上、輔助變量必須與主要變量高度相關(guān)且整體上應(yīng)相當(dāng)穩(wěn)定;應(yīng)相當(dāng)穩(wěn)定;3

20、 3、比估計(jì)雖然不是無(wú)偏的,但其精度要高于簡(jiǎn)、比估計(jì)雖然不是無(wú)偏的,但其精度要高于簡(jiǎn)單估計(jì)量很多。單估計(jì)量很多。下面我們看一個(gè)下面我們看一個(gè)簡(jiǎn)單估計(jì)簡(jiǎn)單估計(jì)與與比估計(jì)比估計(jì)對(duì)比的例題對(duì)比的例題第44頁(yè)/共95頁(yè)【例】對(duì)以下假設(shè)的總體(N=6),用簡(jiǎn)單隨機(jī)抽樣抽取 n=2 的樣本,比較簡(jiǎn)單隨機(jī)抽樣比率估計(jì)及簡(jiǎn)單估計(jì)的性質(zhì)。i123456均值XiYi011331151882910464.518解: 對(duì)這個(gè)總體,我們列出所有可能的1526C個(gè)樣本,以比較簡(jiǎn)單估計(jì)與比率估計(jì)的性質(zhì)。第45頁(yè)/共95頁(yè) i 樣本簡(jiǎn)單估計(jì)( )比率估計(jì)( )1234567891011121314151,21,31,41,5

21、1,62,32,42,52,63,43,53,64,54,65,62.06.09.515.023.57.010.516.024.514.520.028.523.532.037.5181817.116.87521.1515.7515.751620.045516.312516.363619.730816.269219.218.75yRy第46頁(yè)/共95頁(yè)由此,可以算出:18155 .3762151)(151iiyyE86667.97)(151)(1512iiyEyyV68644.171575.181818151)(151iRiRyyE31356. 01868644.17)()(YyEyBRR151

22、282345. 2)(151)(iRRiRyEyyV92177. 2)31356. 0(82345. 2)()()(22RRRyByVyMSE第47頁(yè)/共95頁(yè)總結(jié)1 1、從計(jì)算表格中可以看出,均值的比估計(jì)很穩(wěn)定,、從計(jì)算表格中可以看出,均值的比估計(jì)很穩(wěn)定,而均值的簡(jiǎn)單估計(jì)則波動(dòng)劇烈。而均值的簡(jiǎn)單估計(jì)則波動(dòng)劇烈。2 2、雖然比率估計(jì)是有偏估計(jì),但偏倚不大,而估計(jì)、雖然比率估計(jì)是有偏估計(jì),但偏倚不大,而估計(jì)量方差要比簡(jiǎn)單估計(jì)的方差小得多。量方差要比簡(jiǎn)單估計(jì)的方差小得多。3 3、比估計(jì)是一種很好的估計(jì)量,是提高估計(jì)精度的、比估計(jì)是一種很好的估計(jì)量,是提高估計(jì)精度的最有效的途徑。最有效的途徑。4 4

23、、思考思考:比估計(jì)為什么能大幅度地提高估計(jì)精度?比估計(jì)為什么能大幅度地提高估計(jì)精度?第48頁(yè)/共95頁(yè)對(duì)于簡(jiǎn)單隨機(jī)抽樣對(duì)于簡(jiǎn)單隨機(jī)抽樣, n, n較大時(shí)較大時(shí), ,比率估計(jì)具有以下性質(zhì):比率估計(jì)具有以下性質(zhì):2122121)(111)()(111)()(1111)()()()()()(iNiiRiNiiRiNiiRRRXYNnfNYVRXYNnfyVRXYNnfXrVRVYYNRXNYEYRXyERrERE第49頁(yè)/共95頁(yè)關(guān)于比率估計(jì)我們要說(shuō)明(或證明)以下幾個(gè)問(wèn)題:1 1、均值的比率估計(jì)不是無(wú)偏的;、均值的比率估計(jì)不是無(wú)偏的;2 2、偏倚是怎么產(chǎn)生的;、偏倚是怎么產(chǎn)生的;3 3、均值比率估

24、計(jì)的均方誤差;、均值比率估計(jì)的均方誤差;4 4、均方誤差的估計(jì)。、均方誤差的估計(jì)。第50頁(yè)/共95頁(yè)第一個(gè)問(wèn)題可從上面的例題給予說(shuō)明:31356. 0)()(68644.17)(,18YyEyByEYRRR第二個(gè)問(wèn)題我們可以從下面的表達(dá)式說(shuō)明:XRXxyyR這里這里 是常量,是常量, 是隨機(jī)變量。估計(jì)量不是是隨機(jī)變量。估計(jì)量不是隨機(jī)變量的線(xiàn)性函數(shù)。因此,估計(jì)量的偏倚是由隨機(jī)變量的線(xiàn)性函數(shù)。因此,估計(jì)量的偏倚是由R R的有偏性造成的的有偏性造成的. .Xxy,第51頁(yè)/共95頁(yè)第三個(gè)問(wèn)題,我們來(lái)證明R估計(jì)的偏倚)1 (1)(1 1)1 (1)(1121XXxXXXxXXxXXXxXXxXxxxR

25、yRxyRR,其中第52頁(yè)/共95頁(yè)因此0)()()1 (2XRYxRyEXXxxRyXxRyXXxXxRyRR由于因而偏倚主要來(lái)自于等式右邊的第二項(xiàng),由xyyxSSnfSnfXxYyEXxyE11)()(221)()(xSnfXxEXxxE第53頁(yè)/共95頁(yè)因此,偏倚的主要項(xiàng)為:因此,偏倚的主要項(xiàng)為:)(1)()(1)(2xyxSSRSXnfXxxREXxyEXRRE同樣我們可以推出:同樣我們可以推出:NoImage212)(1111)()(iNiiRXYNnfXrVRV)2(12222yxxyRSSRSXnf第54頁(yè)/共95頁(yè)21)(111)(iNiiRRXYNnfyV)2(1222yxx

26、yRSSRSnf212)(111)(iNiiRRXYNnfNYV)2()1 (2222yxxyRSSRSnfN第55頁(yè)/共95頁(yè)對(duì)上述方差分別給出樣本估計(jì)式如下:對(duì)上述方差分別給出樣本估計(jì)式如下:)2(1)(2222yxxyrssrsXnfRv)2(1)()(2222yxxyRrssrsnfRvXyv)2(1)()(222222yxxyRrssrsnfNRvXNYv第56頁(yè)/共95頁(yè)【例2.2】某縣在對(duì)船舶調(diào)查月完成的貨運(yùn)量進(jìn)行調(diào)查時(shí),對(duì)運(yùn)管部門(mén)登記的船舶臺(tái)帳進(jìn)行整理后獲得注冊(cè)船舶2860艘,載重噸位154626噸。從2860艘船舶中抽取一個(gè)n=10的簡(jiǎn)單隨機(jī)樣本,調(diào)查得到樣本船舶調(diào)查月完成的

27、貨運(yùn)量及其載重噸位如表(單位:噸),要推算該縣船舶調(diào)查月完成的貨運(yùn)量。第57頁(yè)/共95頁(yè) i i1234578015001005376600100505010206789102170182314501581370120150802050iyiyixix解:已知:N=2860, n=10, X=154626 由表可得, 2 .1123101101iiyy65101101iixx1012207.421179)(1101iiyyys第58頁(yè)/共95頁(yè)1012211.2161)(1101iixxxs101222.23382)( )(1101iiiyxyyxxs因此,對(duì)該縣船舶在調(diào)查月完成貨運(yùn)量的比率估

28、計(jì)為:2671937154626652 .1123XxyYR方差的估計(jì)為:)2()1 ()(2222yxxyRsRsRsnfNYv=2.106171110第59頁(yè)/共95頁(yè)RY標(biāo)準(zhǔn)差的估計(jì)為:458930)()(RRYvYs如果用簡(jiǎn)單估計(jì)對(duì)貨運(yùn)量進(jìn)行估計(jì),則,3212352yNY11221043303. 3)1 ()(ysnfNYv585921)()(YvYs由此,得到比率估計(jì)量設(shè)計(jì)效應(yīng)為:6135. 0)()(YvYvdeffR對(duì)于本問(wèn)題對(duì)于本問(wèn)題, ,比率估計(jì)量比率估計(jì)量比簡(jiǎn)單估計(jì)量的效率高比簡(jiǎn)單估計(jì)量的效率高! !第60頁(yè)/共95頁(yè)【例2.3】在一項(xiàng)工資研究中,人們發(fā)現(xiàn)IT行業(yè)中,從業(yè)者

29、的現(xiàn)薪與起薪之間相關(guān)系數(shù)高達(dá)0.88,已知某IT企業(yè)474名員工的平均起薪為17016.00元/年,現(xiàn)根據(jù)對(duì)100個(gè)按簡(jiǎn)單隨機(jī)抽樣方式選出的員工現(xiàn)薪的調(diào)查結(jié)果,估計(jì)該企業(yè)員工的現(xiàn)薪平均水平。已知:. 9 .102802243,2014300,23.453189043, 6 .18642, 5 .3848222xxyysssxy第61頁(yè)/共95頁(yè)【解】1、在簡(jiǎn)單估計(jì)條件下,4 .357579523.453189043100474/10011)(5 .384822snfyvyY的95%的近似置信區(qū)間為:Y8 .42188,18.34776)(),(2/2/yvzyyvzy此處教材有誤此處教材有誤(

30、P51)第62頁(yè)/共95頁(yè)064. 26 .186425 .38482xyR2、在比率估計(jì)條件下,44.470564)2(1)(8 .3512417016064. 2222xyxyRRsRsRsnfyvXRy的95%的近似置信區(qū)間為:Y35.36469,32.33780)(),(2/2/RRRRyvzyyvzy第63頁(yè)/共95頁(yè)下面我們從理論上來(lái)比較簡(jiǎn)單估計(jì)與比率估計(jì)的誤差下面我們從理論上來(lái)比較簡(jiǎn)單估計(jì)與比率估計(jì)的誤差)2(1)(1)(2222xxyyRySRSSRSnfyVSnfyV比率估計(jì)量精度高于簡(jiǎn)單估計(jì)量的充要條件是:比率估計(jì)量精度高于簡(jiǎn)單估計(jì)量的充要條件是:yxyxxyxyxxyyR

31、CCSRSSSRSRSnfSRSSRSnfyVyV2120201)2(10)()(222222第64頁(yè)/共95頁(yè)也就是說(shuō),時(shí),當(dāng)yxyxCCSRS212比率估計(jì)比簡(jiǎn)單估計(jì)更為精確。比率估計(jì)比簡(jiǎn)單估計(jì)更為精確。尤其是當(dāng)尤其是當(dāng) 時(shí),只要相關(guān)系數(shù)時(shí),只要相關(guān)系數(shù) ,比率估計(jì)就要優(yōu)于簡(jiǎn)單估計(jì)。比率估計(jì)就要優(yōu)于簡(jiǎn)單估計(jì)。yxCC 21比率估計(jì)的其他問(wèn)題看教材比率估計(jì)的其他問(wèn)題看教材P53P53第65頁(yè)/共95頁(yè)2.4 回歸估計(jì)量及其性質(zhì)一、回歸估計(jì)的定義對(duì)于簡(jiǎn)單隨機(jī)抽樣,總體均值Y和總體總量的回歸估計(jì)量(regression estimatior)的定義為:Y)()(XxyxXyylrlryNY式中,

32、xy,是樣本均值;為事先設(shè)定的一個(gè)常數(shù)如果=0,則回歸估計(jì)量就是簡(jiǎn)單估計(jì)量;如果,xy則回歸估計(jì)量就是比率估計(jì)量。第66頁(yè)/共95頁(yè)二、為常數(shù)的情形當(dāng)回歸系數(shù)為事先給定的常數(shù)時(shí),或以前為相同目的進(jìn)行的調(diào)查所得到的iY對(duì)iX的樣本回歸系數(shù)穩(wěn)定在某個(gè)數(shù)值上,取最近一次調(diào)查所得的作為設(shè)定值。性質(zhì)2 對(duì)于簡(jiǎn)單隨機(jī)抽樣回歸估計(jì)量,作為Y及Y 的回歸估計(jì),lrlrYy及都是無(wú)偏的。即,)(YyElr.)()(YyNEYElrlrlrlrYy和的方差分別為:第67頁(yè)/共95頁(yè))2(1)(02202yxxylrSSSnfyV)2()1 ()(022022yxxylrSSSnfNYV式中,yxxySSS,22分

33、別是Y,X的總體方差和總體協(xié)方差;yxxysss,22分別是Y,X的樣本方差和樣本協(xié)方差。)()(lrlrYVyV和的樣本估計(jì)量為:)2(1)(02202yxxylrsssnfyv)2()1 ()(022022yxxylrsssnfNYv第68頁(yè)/共95頁(yè)BSSSSnfdyVdxxyyxxlr202000)22(1)()2(1)(02202yxxylrSSSnfyV我們對(duì)上式兩端關(guān)于我們對(duì)上式兩端關(guān)于 求導(dǎo)數(shù),得:求導(dǎo)數(shù),得:0第69頁(yè)/共95頁(yè)因此當(dāng)因此當(dāng)0取總體回歸系數(shù)取總體回歸系數(shù)NiiNiiixyxXXXXYYSSB1212)()()(lryV達(dá)到最小,即達(dá)到最小,即時(shí),時(shí),)1 (1

34、)(1)(22222minyxylrSnfSBSnfyV式中式中,為為iYiX總體相關(guān)系數(shù)??傮w相關(guān)系數(shù)。第70頁(yè)/共95頁(yè)三、為樣本回歸系數(shù)的情形如果需要通過(guò)樣本來(lái)確定,很自然地,我們會(huì)想到用總體回歸系數(shù)的最小二乘估計(jì),也就是樣本回歸系數(shù):niiniiixyxxxxxyyssb1212)()(這時(shí)簡(jiǎn)單隨機(jī)抽樣回歸估計(jì)量)(xXbyylr是有偏的。但當(dāng)樣本量n充分大時(shí),估計(jì)量的偏倚趨于零。因此,類(lèi)似比率估計(jì)量,回歸估計(jì)量也是漸近無(wú)偏的。第71頁(yè)/共95頁(yè)且有)1 (1)()(22ylrlrSnfyVyMSE)(lryMSE的一個(gè)近似估計(jì)為:niiilrxxbyynnfyv12)()()2(1)

35、()(21112222xyesbsnnnfsnf第72頁(yè)/共95頁(yè)【例4.5】( (續(xù)續(xù)P72P72的例的例4.2)4.2)利用回歸估計(jì)量推算該縣船舶利用回歸估計(jì)量推算該縣船舶調(diào)查月完成的貨運(yùn)量調(diào)查月完成的貨運(yùn)量. .解:根據(jù)例根據(jù)例4.24.2中的計(jì)算結(jié)果可得樣本回歸系數(shù)中的計(jì)算結(jié)果可得樣本回歸系數(shù): :8195.1011.216122.233822xyxssb89.1004)652860154626(8195.102 .1123)(xXbyylr從而從而第73頁(yè)/共95頁(yè)因此,該縣船舶調(diào)查月完成的貨運(yùn)量的回歸估計(jì)為:287398289.10042860lryNY52.189218)(212

36、222xyesbsnns為了估計(jì) ,先計(jì)算回歸殘差方差:)(lrYV112221054232. 152.189218)28601101(2860)1 ()(elrsnfNYv所以第74頁(yè)/共95頁(yè)對(duì)于同一個(gè)題,我們來(lái)比較三種估計(jì)量的誤差差異對(duì)于同一個(gè)題,我們來(lái)比較三種估計(jì)量的誤差差異287398289.10042860lrlryNY112210542. 1)1 ()(ylrsnfNYv2671937154626652 .1123XxyYR11222210106. 2)2()1 ()(yxxyRsRsRsnfNYv,3212352yNY11221043303. 3)1 ()(ysnfNYv第75

37、頁(yè)/共95頁(yè) 與例與例4.24.2的結(jié)果比較,對(duì)于本問(wèn)題回歸估的結(jié)果比較,對(duì)于本問(wèn)題回歸估計(jì)優(yōu)于比率估計(jì),而比率估計(jì)又優(yōu)于簡(jiǎn)單計(jì)優(yōu)于比率估計(jì),而比率估計(jì)又優(yōu)于簡(jiǎn)單估計(jì);估計(jì); 回歸估計(jì)優(yōu)于比率估計(jì)的原因是回歸直回歸估計(jì)優(yōu)于比率估計(jì)的原因是回歸直線(xiàn)可以不通過(guò)原點(diǎn)。線(xiàn)可以不通過(guò)原點(diǎn)。 比較上述估計(jì)量的優(yōu)劣,一般是通過(guò)比比較上述估計(jì)量的優(yōu)劣,一般是通過(guò)比較它們的均方誤差或方差大小來(lái)進(jìn)行。較它們的均方誤差或方差大小來(lái)進(jìn)行。第76頁(yè)/共95頁(yè) 關(guān)于簡(jiǎn)單估計(jì)、比率估計(jì)、回歸估計(jì)的估計(jì)量方差比較簡(jiǎn)單估計(jì)量:21)(ySnfyV比率估計(jì)量:)2(1)(222yxxyRRSSRSnfyV回歸估計(jì)量:)1 (1)

38、(22ylrSnfyV第77頁(yè)/共95頁(yè)由此可以看出由此可以看出(在不考慮偏倚的情況下)有以下結(jié)論:有以下結(jié)論:2.比率估計(jì)量?jī)?yōu)于簡(jiǎn)單估計(jì)量的條件是:yxCC23.回歸估計(jì)量?jī)?yōu)于比率估計(jì)量的條件是:0)(2yxSRS在不考慮偏倚時(shí),回歸估計(jì)總是優(yōu)于比率估計(jì)在不考慮偏倚時(shí),回歸估計(jì)總是優(yōu)于比率估計(jì)1.1.回歸估計(jì)量總是優(yōu)于簡(jiǎn)單估計(jì)量,除非回歸估計(jì)量總是優(yōu)于簡(jiǎn)單估計(jì)量,除非即一般而言有即一般而言有0)()(yVyVlr第78頁(yè)/共95頁(yè) 如果不忽略偏倚,全面考慮比率估計(jì)和回歸估計(jì)的均方誤差MSE,那情況會(huì)怎么樣呢? 下面我們通過(guò)教材P61.表213的實(shí)際例題來(lái)分析比較。(略,看教材)第79頁(yè)/共9

39、5頁(yè)2.4 簡(jiǎn)單隨機(jī)抽樣的實(shí)施一、樣本量的確定原理 我們知道我們知道n n的大小會(huì)影響抽樣誤差,因?yàn)槿绻拇笮?huì)影響抽樣誤差,因?yàn)槿绻鹡 n越接近越接近N N,則抽樣誤差就會(huì)越接近于零,這一點(diǎn),則抽樣誤差就會(huì)越接近于零,這一點(diǎn)也清楚地體現(xiàn)在下面的式子里。也清楚地體現(xiàn)在下面的式子里。222)(11)11(1)(yyySyVNnSNnSnfyV三個(gè)因素決定三個(gè)因素決定 n n第80頁(yè)/共95頁(yè) 在上式中,在上式中,N N是已知的,是已知的,S S是無(wú)法知道的,所以要考是無(wú)法知道的,所以要考考慮影響考慮影響n(yōu) n的重點(diǎn)應(yīng)該是抽樣誤差。的重點(diǎn)應(yīng)該是抽樣誤差。 習(xí)慣上,不以習(xí)慣上,不以 作為調(diào)查精度指標(biāo)

40、,而是用置信度作為調(diào)查精度指標(biāo),而是用置信度 和絕對(duì)誤差限度和絕對(duì)誤差限度 替代抽樣誤差替代抽樣誤差)(yV1dYy|)(yV1)()(|1|yVdyVYyPdYyP根據(jù)雙側(cè)分位點(diǎn)的定義有根據(jù)雙側(cè)分位點(diǎn)的定義有第81頁(yè)/共95頁(yè)222/222/22/2/11.)()(1)(|ySzdNnzdyVyVdzzyVYyP或下面我們分別觀(guān)察等式右端各部分對(duì)下面我們分別觀(guān)察等式右端各部分對(duì)n n的影響。的影響。第82頁(yè)/共95頁(yè)0.900.950.991.6451.962.58 n1.191.73置信度對(duì)樣本量n的影響12/z0n0n0n絕對(duì)誤差限度d對(duì)樣本量n的影響d0.140.100.040.03n

41、4995566964這里這里25. 0,95. 01 ,100002ySN第83頁(yè)/共95頁(yè)總體方差對(duì)樣本量n的影響00.090.160.210.240.25n11362403133563702yS這里這里05. 0,95. 01 ,10000dN下面我們把置信度設(shè)為:下面我們把置信度設(shè)為:絕對(duì)誤差設(shè)為:絕對(duì)誤差設(shè)為:總體方差設(shè)為:總體方差設(shè)為:來(lái)觀(guān)察總體規(guī)模來(lái)觀(guān)察總體規(guī)模N N對(duì)樣本量對(duì)樣本量n n的影響的影響;95. 01;05. 0d25. 02yS第84頁(yè)/共95頁(yè)總體規(guī)??傮w規(guī)模N樣本容量樣本容量n5044100795002171000278500035710000370100000383100000038410000000384 總體規(guī)??傮w規(guī)模N對(duì)樣本量對(duì)樣本量n的影響的影響第85頁(yè)/共95頁(yè)二、樣本量的確定步驟第一步:確定委托單位認(rèn)可的估計(jì)精度水平,包括絕對(duì)誤差d和置信水平;第二步:按照保守原則(寧大勿?。?,實(shí)施對(duì)總體方差的預(yù)估;第三步:根據(jù)上述給定的估計(jì)精度和總體方差的預(yù)估值并考慮總體N的大小,以簡(jiǎn)單抽樣及回答率100%為前提條件,按下面的式子計(jì)算初始樣本量n222/2222/222/201/1yyySzNdSNzSzdNn第86頁(yè)/共95頁(yè)第四步:確定抽樣方法,并根據(jù)不同抽樣方法的抽樣確定抽樣方法,并根據(jù)不同抽樣方法的抽樣效應(yīng)效應(yīng)deffdeff

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論