比估計(jì)與回歸估計(jì)_第1頁(yè)
比估計(jì)與回歸估計(jì)_第2頁(yè)
比估計(jì)與回歸估計(jì)_第3頁(yè)
比估計(jì)與回歸估計(jì)_第4頁(yè)
比估計(jì)與回歸估計(jì)_第5頁(yè)
已閱讀5頁(yè),還剩13頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、Chap5比估計(jì)與回歸估計(jì)教學(xué)要求:重難點(diǎn):引語(yǔ):(請(qǐng)學(xué)生回顧)前面介紹過(guò)的目標(biāo)量有四個(gè)類型:總體均值、總體總量、總體比例、兩個(gè)指標(biāo)的總數(shù)或均值的比值,在簡(jiǎn)單隨機(jī)抽樣和分層抽樣中討論的目標(biāo)都是前三類,且它們本質(zhì)上是一類,相互之間可類推。本章討論第四類目標(biāo)量比值的估計(jì),這是第一個(gè)問(wèn)題。比如服裝消費(fèi)支出占總支出的比值,在校兒童對(duì)全體兒童的比重。其次前面所用的估計(jì)量是簡(jiǎn)單估計(jì),它只涉及所估計(jì)的指標(biāo)本身。如果有另一個(gè)與關(guān)系密切(比例關(guān)系或線性回歸關(guān)系)的指標(biāo)可作為輔助變量,來(lái)構(gòu)造另一類估計(jì)量,即比估計(jì)量或回歸估計(jì)量,來(lái)提高估計(jì)精度,這是第二問(wèn)題。如調(diào)查每月每戶平均消費(fèi),消費(fèi)通常與每戶人口數(shù)密切相關(guān),可

2、用每戶人口數(shù)作為輔助變量,先估計(jì)每月每戶平均消費(fèi)與每戶人口數(shù)的比值,然后利用已知的每戶平均人口,就可得到每月每戶平均消費(fèi)的估計(jì)值。由于這兩個(gè)問(wèn)題之間存在密切的內(nèi)在關(guān)系,因此放在這一章節(jié)一起討論。5.1比估計(jì)1. 基本概念考慮到有兩個(gè)指標(biāo)量和,不妨將總體記為,對(duì)應(yīng)樣本為,如果要估計(jì)的是總體比值,則總體比值可用樣本的比值進(jìn)行估計(jì),該估計(jì)量稱為比值估計(jì)量當(dāng)調(diào)查指標(biāo)僅為,為輔助變量時(shí),在或已知時(shí),和可用分別進(jìn)行估計(jì),稱為比(比率)估計(jì)量這三者通稱為比估計(jì)量,它們之間只相差一個(gè)常數(shù),相互之間可推導(dǎo),研究時(shí)只選擇一個(gè)即可2. 性質(zhì)我們知道簡(jiǎn)單估計(jì)量是無(wú)偏估計(jì),其均值誤差等于其方差但對(duì)于比估計(jì)量卻不具有無(wú)偏

3、性,而是漸近無(wú)偏其均值誤差與方差有差異,但偏倚不大可證:對(duì)于簡(jiǎn)單隨機(jī)抽樣,當(dāng)n很大時(shí),簡(jiǎn)要證明:當(dāng)n很大時(shí),代入上式分母中,有所以,當(dāng)n很大時(shí)此時(shí)對(duì)每個(gè)總體單元,令,對(duì)每個(gè)樣本單元有,則其總體均值和樣本均值分別為因而所以,當(dāng)n很大時(shí)此方差的估計(jì)量可采用或說(shuō)明:這兩個(gè)方差估計(jì)量很難比較誰(shuí)優(yōu)誰(shuí)劣,對(duì)不同總體有不同結(jié)論。類推可得:對(duì)于簡(jiǎn)單隨機(jī)抽樣,當(dāng)n很大時(shí),, , ,【例1】(馮例5.3)交通運(yùn)輸統(tǒng)計(jì)中有三個(gè)重要的指標(biāo),即運(yùn)量、周轉(zhuǎn)量與平均運(yùn)距,其中平均運(yùn)距是總周轉(zhuǎn)量除以運(yùn)量所得的商。為估計(jì)公路載貨汽車的平均運(yùn)距,在總體中用簡(jiǎn)單隨機(jī)抽樣抽取32輛貨車,記錄每輛車在一個(gè)月內(nèi)的運(yùn)量xi(單位噸)與周轉(zhuǎn)

4、量yi (單位噸公里),如P130表5.3所示,試估計(jì)平均運(yùn)距R并給它的90%的置信區(qū)間。解:,故平均運(yùn)距的估計(jì)值為為求方差估計(jì)值,令f1,R的90%的置信區(qū)間為3. 比估計(jì)與簡(jiǎn)單估計(jì)的比較簡(jiǎn)單估計(jì)法以樣本均值估計(jì)總體均值,比估計(jì)以估計(jì),兩者的估計(jì)方差為由于樣本方差和樣本協(xié)方差是總體方差和總體協(xié)方差的無(wú)偏估計(jì),所以的一個(gè)近似估計(jì)是即其中是指標(biāo)與的總體相關(guān)系數(shù)比估計(jì)優(yōu)于簡(jiǎn)單估計(jì)的條件是 (*)其中:,分別是總體Xi和Yi的變異系數(shù).*式說(shuō)明在估計(jì)時(shí),如果有與指標(biāo)相關(guān)系數(shù)較大的輔助指標(biāo),而且的變異系數(shù)比較小,則用比估計(jì)法的有利的即的變異系數(shù)與的變異系數(shù)相當(dāng),當(dāng)相關(guān)系數(shù)大于時(shí),比估計(jì)比簡(jiǎn)單估計(jì)更優(yōu)5

5、.回歸估計(jì)有效運(yùn)用比估計(jì)的一個(gè)前提是與輔助變量X基本上成(正)比例關(guān)系,即Yi對(duì)Xi的回歸直線通過(guò)原點(diǎn)。若Yi對(duì)Xi的回歸直線不通過(guò)原點(diǎn),為了進(jìn)一步提高精度,則應(yīng)使用回歸估計(jì)。對(duì)于簡(jiǎn)單隨機(jī)抽樣,總體均值和總量的(線性)回歸估計(jì)量定義為:其中是樣本均值,可以是:(1)事先設(shè)定的常數(shù);(2)從樣本中計(jì)算得到的某一特定統(tǒng)計(jì)量,如樣本回歸系數(shù)。下面例舉幾種回歸估計(jì)的特殊情況。(1)當(dāng)時(shí)的回歸估計(jì)量稱為差估計(jì)量(difference estimator) :(2)當(dāng)時(shí),即為簡(jiǎn)單估計(jì)量。(3)當(dāng)時(shí),則即比估計(jì)量。我們知道簡(jiǎn)單估計(jì)是無(wú)偏估計(jì),而比估計(jì)是漸近無(wú)偏的,也就是說(shuō)為設(shè)定常數(shù)與為某一統(tǒng)計(jì)量對(duì)回歸估計(jì)在

6、性質(zhì)上有很大的不同,下面分別進(jìn)行討論。為設(shè)定常數(shù)令是設(shè)定常數(shù),易證回歸估計(jì)量是的無(wú)偏估計(jì)。求它的方差時(shí),可視為的樣本均值,所以可用簡(jiǎn)單估計(jì)量的方差公式:由于樣本方差和樣本協(xié)方差是總體方差和總體協(xié)方差的無(wú)偏估計(jì),因此的一個(gè)無(wú)偏估計(jì)是的不同取值會(huì)影響值,若取值合理,就小,否則就大。若要最小,則最小。對(duì)求導(dǎo),則,即為對(duì)的總體回歸系數(shù)時(shí),取得最小值為樣本回歸系數(shù)對(duì)的總體回歸系數(shù)一般是未知的,自然人們常用其樣本回歸系數(shù)b,估計(jì),此時(shí)總體均值的回歸估計(jì)為可以證明,當(dāng)n大時(shí),以估計(jì)是近似無(wú)偏的;其均方誤差近似為理論上的最小值,即此式中的可用以下樣本殘差方差進(jìn)行估計(jì):所以的一個(gè)近似估計(jì)式為回歸估計(jì)與簡(jiǎn)單估計(jì)和

7、比估計(jì)的比較將回歸估計(jì)(為樣本回歸系數(shù)b時(shí))與比估計(jì)及簡(jiǎn)單估計(jì)的方差作大樣本比較。(1)當(dāng)樣本量n大時(shí),回歸估計(jì)的方差為而簡(jiǎn)單估計(jì)的方差而,故有也就是說(shuō),在大樣本下,回歸估計(jì)優(yōu)于簡(jiǎn)單估計(jì),除非,兩者效果才一樣。(2)對(duì)于比估計(jì),我們知道當(dāng)n大時(shí),它的方差近似為回歸估計(jì)量?jī)?yōu)于比估計(jì)量的條件為:注:上述結(jié)論是在大樣本時(shí)得到的,當(dāng)n不太大時(shí),還要考慮到回歸估計(jì)及比估計(jì)的偏倚。實(shí)際上,小樣本時(shí),回歸估計(jì)的偏倚有可能比比估計(jì)的大,因此就總的均方誤差而言,并不是總是回歸估計(jì)最小。結(jié)論:()小樣本時(shí),比估計(jì)可能比回歸估計(jì)更優(yōu)()大樣本時(shí),除非B=R,否則回歸估計(jì)優(yōu)于比估計(jì)。經(jīng)驗(yàn)作法(孫教材):當(dāng)輔助變量的變

8、異系數(shù)與指標(biāo)的變異系數(shù)之比在之間時(shí),而兩者相關(guān)系數(shù)時(shí),采用回歸估計(jì)比采用簡(jiǎn)單估計(jì)或比估計(jì)有較高的精度【例2】某系統(tǒng)共有N=687個(gè)單位,為預(yù)計(jì)當(dāng)年全系統(tǒng)的工資總量,用簡(jiǎn)單隨機(jī)抽樣抽取一個(gè)n=26個(gè)單位的樣本,下表是這些單位當(dāng)年擊傷一年工資總額數(shù)。已知上一年全系統(tǒng)工資總額為70523.16萬(wàn)元。試采用比估計(jì)和回歸估計(jì)法(取樣本回歸系數(shù)b)估計(jì)當(dāng)年全系統(tǒng)的工資總額及估計(jì)的近似標(biāo)準(zhǔn)差。解:,方法:比估計(jì)作為比較,的簡(jiǎn)單估計(jì)量為比估計(jì)的設(shè)計(jì)效應(yīng)方法:回歸估計(jì)法樣本回歸系數(shù)為求方差估計(jì),先求樣本殘差方差回歸估計(jì)法的設(shè)計(jì)效應(yīng)可見(jiàn),回歸估計(jì)法與比估計(jì)的設(shè)計(jì)效應(yīng)非常接近(因?yàn)锽與R的估計(jì)值非常相近),精度都比

9、簡(jiǎn)單估計(jì)高5.3分層比估計(jì)回顧:l 在分層抽樣一章中講過(guò)定理:總體均值的估計(jì)用各層均值的估計(jì)加權(quán)平均得到,即。和該定理的推論:對(duì)分層簡(jiǎn)單隨機(jī)樣本,若各層均值采用簡(jiǎn)單估計(jì),則總體均值分層簡(jiǎn)單估計(jì)為l 前節(jié)比估計(jì)的思想是用樣本的比值估計(jì)總體比值,即,總體均值的比估計(jì)是若將比估計(jì)的思想和技術(shù)用于分層隨機(jī)樣本,有兩種可行的方法:l 一種是先對(duì)每一層使用比估計(jì),然后進(jìn)行加權(quán)平均,得到整個(gè)總體的估計(jì)量的比估計(jì),這種方法稱為分別比估計(jì);l 另一種是對(duì)兩個(gè)指標(biāo)和各自都作分層簡(jiǎn)單估計(jì)(即推論的作法),然后用它們構(gòu)造比估計(jì),這種方法稱為聯(lián)合比估計(jì)(或組合比估計(jì))。、分別比估計(jì)(separate ratio est

10、imator)對(duì)分層簡(jiǎn)單隨機(jī)樣本,若各層均值采用比估計(jì),則總體均值的分別比估計(jì)定義為由于當(dāng)每一層的樣本量都比較大時(shí),各層的比估計(jì)是近似無(wú)偏的,所以也是近似無(wú)偏的。且其均方誤差近似為該方差的一個(gè)近似無(wú)偏估計(jì)為、聯(lián)合比估計(jì)(combined ratio estimator)對(duì)分層簡(jiǎn)單隨機(jī)樣本,先求兩個(gè)指標(biāo)和的總體均值的分層簡(jiǎn)單估計(jì):則總體均值的聯(lián)合比估計(jì)定義為其中當(dāng)總樣本量n比較大時(shí),是近似無(wú)偏的,且其均方誤差近似為的一個(gè)近似估計(jì)為注意:這個(gè)式中的是總體比而不是分別比估計(jì)相應(yīng)公式中的層i.,其它一樣。3.兩種比估計(jì)的比較(適用場(chǎng)合):先比較兩者的方差:注意式中在比估計(jì)適用的場(chǎng)合都比較小,如當(dāng)與關(guān)系

11、是通過(guò)原點(diǎn)的一條直線時(shí)(完全正相關(guān)),。由此可得結(jié)論:()當(dāng)每層的時(shí),兩種比估計(jì)效果一樣。()每一層的樣本量都比較大,每層的與相關(guān)系數(shù)較大,且相差較大時(shí),分別比估計(jì)優(yōu)于聯(lián)合比估計(jì)。()分別比估計(jì)要求每一層的樣本量都比較大,因此僅當(dāng)層數(shù)較多,而各層樣本量不夠大時(shí),才采用聯(lián)合比估計(jì)。5.分層回歸估計(jì)與比估計(jì)情形一樣,對(duì)于分層隨機(jī)樣本,也有兩種形式的回歸估計(jì),一種是先對(duì)每一層使用回歸估計(jì),然后進(jìn)行加權(quán)平均,得到整個(gè)總體的估計(jì)量的回歸估計(jì),這種方法稱為分別回歸估計(jì);另一種是對(duì)兩個(gè)指標(biāo)和各自都作分層簡(jiǎn)單估計(jì),然后用它們構(gòu)造回歸估計(jì),這種方法稱為聯(lián)合回歸估計(jì)(或組合回歸估計(jì))。分別回歸估計(jì)(separat

12、e regression estimator) 對(duì)分層隨機(jī)樣本,總體均值的分別回歸估計(jì)定義為()當(dāng)h為事先取定的值時(shí),該估計(jì)量為無(wú)偏估計(jì)量,且其方差為該方差是的多元函數(shù),可證當(dāng)h取時(shí),達(dá)最小值()當(dāng)h不能事先取定時(shí),通常取為從樣本中計(jì)算得到的此時(shí)當(dāng)各層的樣本量nh很大時(shí),以估計(jì)是近似無(wú)偏的;其方差近似為理論上的最小值,即它的一個(gè)近似估計(jì)為式中樣本殘差方差.聯(lián)合回歸估計(jì)(combined regression estimator)對(duì)分層隨機(jī)樣本,先求兩個(gè)指標(biāo)的總體均值的分層簡(jiǎn)單估計(jì): 則總體均值的聯(lián)合回歸估計(jì)定義為()當(dāng)事先取定時(shí),該估計(jì)量為無(wú)偏估計(jì)量,且其方差為該方差是的一元函數(shù),可證當(dāng)取時(shí),

13、達(dá)最小值()當(dāng)不能事先取定時(shí),通常取為從樣本中計(jì)算得到的 b此時(shí)當(dāng)總樣本量n很大時(shí),以估計(jì)是近似無(wú)偏的;其方差近似為理論上的最小值,即它的一個(gè)近似估計(jì)為3.兩種回歸估計(jì)的比較(適用場(chǎng)合):分別回歸估計(jì)的最小方差為.聯(lián)合回歸估計(jì)的最小方差式中注:上式中只需代入得恒成立由此可知:()當(dāng)每層的時(shí),兩種回歸估計(jì)效果一樣。()每一層的樣本量都比較大,每層的與相關(guān)系數(shù)較大,且相差較大時(shí),分別回歸估計(jì)優(yōu)于聯(lián)合回歸估計(jì)。()分別回歸估計(jì)要求每一層的樣本量都比較大,因此僅當(dāng)層數(shù)較多,而各層樣本量不夠大時(shí),才采用聯(lián)合回歸估計(jì)。【例】(馮例.)已知某市年年底中央直屬單位()專業(yè)技術(shù)人員總數(shù)人,市屬單位()專業(yè)技術(shù)人

14、員總數(shù)人,欲通過(guò)抽樣調(diào)查,估計(jì)年年底全市專業(yè)技術(shù)人員的總數(shù)抽樣按中直單位與市直單位分層隨機(jī)抽取,前者抽n1=15個(gè)單位,后者抽n2=個(gè)單位,數(shù)據(jù)如下表。中直單位(i=1)市直單位(i=2)jxijyijjxijyij121522418794210821110212313236757143596243823934141751801895657702663267768388756617208227881282884245998101938421021722810148165112158220113904291231833412971041345746113103107142342481428429

15、015465472151251251667471417357385182182341981986820146162對(duì)上述數(shù)據(jù)按分別比估計(jì)、聯(lián)合比估計(jì)、分別回歸估計(jì)、聯(lián)合回歸估計(jì)四種方法對(duì)年年底全市專業(yè)技術(shù)人員的總數(shù)作出估計(jì),并給出各估計(jì)量的精度。解:先將樣本數(shù)據(jù)計(jì)算得到的中間結(jié)果列如下表:中直單位(h=1)市直單位(h=2)Nh152035Wh0.0990462220.9009537780.0592592590.049185668Xh75650315612391262560.3703704257.0130293550.6666667249.6532.066666723

16、3.6298594.23816136678154296.56842290611.166757708.410531.0349580251.068493151bh1.0271567031.06283715998.0326205433.25450918()分別比估計(jì)()聯(lián)合比估計(jì)(3)分別回歸估計(jì)(4)聯(lián)合回歸估計(jì)與分層簡(jiǎn)單估計(jì)進(jìn)行比較:估計(jì)方法估計(jì)值估計(jì)值的標(biāo)準(zhǔn)差分別比估計(jì)415521607聯(lián)合比估計(jì)4154331675分別回歸估計(jì)415331160聯(lián)合回歸估計(jì)415381672分層簡(jiǎn)單估計(jì)380848.869814.635.5各種估計(jì)量的比較與選擇(小結(jié))比估計(jì)與簡(jiǎn)單估

17、計(jì)的比較:在有輔助變量時(shí),若的變異系數(shù)與的變異系數(shù)相當(dāng),且相關(guān)系數(shù)大于時(shí),比估計(jì)比簡(jiǎn)單估計(jì)更優(yōu)回歸估計(jì)與簡(jiǎn)單估計(jì)的比較:在大樣本下,除非相關(guān)系數(shù),否則回歸估計(jì)優(yōu)于簡(jiǎn)單估計(jì) 比估計(jì)與回歸估計(jì)的比較:在大樣本下,除非與的總體回歸系數(shù)B=R,否則回歸估計(jì)優(yōu)于比估計(jì)小樣本時(shí),考慮總的偏差,比估計(jì)可能比回歸估計(jì)更優(yōu)分別估計(jì)與聯(lián)合估計(jì)的比較:l 對(duì)分層抽樣,當(dāng)每一層的樣本量都比較大,每層的與相關(guān)系數(shù)較大,且或相差較大時(shí),分別估計(jì)優(yōu)于聯(lián)合估計(jì),無(wú)論是比估計(jì)還是回歸估計(jì)。l 對(duì)分層抽樣,僅當(dāng)層數(shù)較多,而各層樣本量不夠大時(shí),才采用聯(lián)合回歸估計(jì)。作業(yè): 5.4(1)要求用比估計(jì)和回歸估計(jì)兩種方法 5.9實(shí)踐題:利用上次實(shí)驗(yàn)中收集的本班學(xué)生的身高、體重?cái)?shù)據(jù),試選擇本章所介紹的比估計(jì)或回歸

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論