版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、 Chapter 4 Ratio and Regression Estimator 1802年,拉普拉斯想要估計(jì)法國的人口數(shù)目。他獲得 了一個(gè)遍布全國范圍的30commune的樣本,截至1802 年9月23日總共有2,037615居民。在包括1802年9月23 日以前的三年中,215599個(gè)新生兒在30個(gè)commune。 拉普拉斯認(rèn)為30個(gè)commune的每年注冊的新生兒數(shù)為 215599/3=71866.33.把2037615按照71866.33來分,拉普 拉斯估計(jì)每年每28.35人里有一個(gè)注冊新生兒。 具有眾多人口的鄉(xiāng)鎮(zhèn)也就可能有同樣眾多的注冊新生 兒,通過用28.35乘以全法國年度新生兒
2、總數(shù)來估計(jì)得 出法國人口總數(shù)。 調(diào)查中都有輔助信息,抽樣框也通常有每個(gè)單元額外 的信息,這些信息能被用來提高我們的估計(jì)精度。 為什么要使用比率估計(jì)為什么要使用比率估計(jì)/回歸估計(jì)回歸估計(jì) 利用總體的輔助信息提高估計(jì)的精度利用總體的輔助信息提高估計(jì)的精度。 輔助指標(biāo)的選擇 :輔助指標(biāo)應(yīng)該與調(diào)查指標(biāo)有較好較好 的正的相關(guān)關(guān)系的正的相關(guān)關(guān)系 。 的抽樣分布較 的抽樣分布變 動性要小得多。 輔助指標(biāo)的總體總量或總體均值已知總體均值已知。 比率估計(jì)、回歸估計(jì)需要有足夠的樣本量足夠的樣本量才能 保證估計(jì)的有效。 有偏估計(jì):當(dāng)樣本量足夠大時(shí),估計(jì)的偏倚趨于0。 y x u y x 簡單地想要估計(jì)一個(gè)比率簡單地
3、想要估計(jì)一個(gè)比率 :假定總體由面 積不同農(nóng)業(yè)用地構(gòu)成, yi =i地谷物的產(chǎn) 量, xi :i地的面積,B=每畝谷物的平均 產(chǎn)量 想要估計(jì)一個(gè)總體總數(shù),但總體大小但總體大小N是未是未 知的知的。但是我們知道,于是可以通過來估計(jì)N, 由此我們可以使用不同于總數(shù)N的方法而是采 用輔助變量來進(jìn)行測量。 要估計(jì)漁網(wǎng)中長度長于12cm的魚的總數(shù),抽取 一個(gè)魚的隨機(jī)樣本,估計(jì)長度長于12cm的魚所 占的比例,用魚的總數(shù)N乘以這個(gè)比例即可得 到,但如果N未知不能使用。 能稱量漁網(wǎng)中魚的總重量。魚的長度與其重量 相關(guān)。 yN yt x y yr x t t 調(diào)整來自樣本的估計(jì)量以便它們反映人調(diào)整來自樣本的估計(jì)
4、量以便它們反映人 口統(tǒng)計(jì)學(xué)的總量??诮y(tǒng)計(jì)學(xué)的總量。 在一所具有4000名學(xué)生的大學(xué)提取一個(gè) 400個(gè)學(xué)生的簡單隨機(jī)樣本,此樣本可能 包含240個(gè)女性,160個(gè)男性,且其中被 抽中的84名女性和40名男性計(jì)劃以教學(xué) 為畢業(yè)后的職業(yè)。 4000 1241240 400 8440 270013001270 240160 比率估計(jì)量被用來對無回答進(jìn)行調(diào)整對無回答進(jìn)行調(diào)整 設(shè)抽取一個(gè)行業(yè)的樣本:令yi為i行業(yè)花費(fèi)在健 康保險(xiǎn)上的金額,xi為i行業(yè)的雇員數(shù)。假定對 總體中的每個(gè)行業(yè)xi均已知。我們希望一個(gè)行 業(yè)花費(fèi)在健康保險(xiǎn)上的金額與雇員數(shù)相關(guān)。某 些行業(yè)在調(diào)查中可能涉及不到。估計(jì)保險(xiǎn)費(fèi)用 的總花銷時(shí)調(diào)整
5、無回答的方法之一是用總體數(shù) X 乘以比率 y x y x 一一、 Ratio Estimator 在 srs 條件下, 1 )( 1 ) ( 2 2 N RXY Xn f RV x y R yNX x y X x y Y X x y X x y y ii RR R 輔助指標(biāo)輔助指標(biāo)x x,其總體均值(總量)已知,其總體均值(總量)已知 【例例4.14.1】對以下假設(shè)總體(N=6),用簡單隨機(jī)抽樣抽 取的樣本,比較簡單隨機(jī)抽樣比估計(jì)及簡單估計(jì)的性質(zhì)。 i Y i X 123456平均值 01358104.5 131118294618 15 2 6 C R y 樣本樣本簡單估計(jì)簡單估計(jì)比估計(jì)比估計(jì)
6、 11,2218 21,3618 31,49.517.1 41,51516.875 51,623.521.15 62,3715.75 72,410.515.75 82,51616 92,624.520 103,414.516.3 113,52016.36 123,628.519.73 134,523.516.27 144,63219.2 155,637.518.75 y y x X y x X R i i 簡單估計(jì)是無偏的,而比估計(jì)是有偏的。 簡單估計(jì)量的方差遠(yuǎn)遠(yuǎn)大于比估計(jì)量的方差,比估計(jì)的偏差不大, 其均方誤差也比簡單估計(jì)的小得多。 因此對這個(gè)總體,比估計(jì)比簡單估計(jì)的效率高。 18 15 1
7、 )( 15 1 i i yyE 87.97)( 15 1 )( 15 1 2 i i yEyyV 686.17 15 1 )( 15 1 i RiR yyE 31356. 0)()(YyEyB RR 82. 2)( 15 1 )( 15 1 2 i RRiR yEyyV 92. 2)()()( 2 RRR yByVyMSE 二、比率估計(jì)的性質(zhì)二、比率估計(jì)的性質(zhì) 偏倚量會小,如果: 樣本量n 很大 抽樣比n/N很大 很大 S x很小 相關(guān)系數(shù)R接近于1 )( 1 )( 2 2 xyx RSSS Xn f RrE xu xu 比率估計(jì)的近似方差比率估計(jì)的近似方差 ) 2( 1 ) ( 222 2
8、 2xxyy sRsRs xn f Rv n i ii xRy nXn f Rv 1 2 2 1 ) ( 1 11 ) ( ) () ( ) () ()( 22 2 RVXNYV RVXRXVyV R R 當(dāng) R0.5 時(shí),比估計(jì)比 srs 有更高的精度。 分層抽樣下,比估計(jì)有兩種方法: 1.Separate Ratio estimator , 1 1 1 x y r, 2 2 2 x y r 厖. L L L x y r (h=1,2,.L) 2 2 2 )( 1 ) () (XRyE X RRERV V R f nX N Y RX f nX SRSRS ii i N yxyx 11 1 1
9、 2 2 2 1 2 22 2 n i ii xRy nXn f Rv 1 2 2 1 ) ( 1 11 ) ( 三、比率估計(jì)的效率三、比率估計(jì)的效率 1.與簡單估計(jì)的比較 簡單估計(jì)量無偏,而比率估計(jì)量漸近無偏。 因此這里只比較當(dāng)?shù)那樾巍?比率估計(jì)量優(yōu)于簡單估計(jì)量的條件是: V y f n S y 1 2 V y f n SR SRS Ryxyx 1 2 222 222 1 2 yxyx f SR SR S S n 22 20 xyx R SR S S 1 22 SX SY C C x y x y 正高度 相關(guān) 2.比率估計(jì)成為最優(yōu)線性無偏估計(jì)的條件 (1).與的關(guān)系是過原點(diǎn)的直線 (2).對
10、這條直線的方差與成比例。 則比率估計(jì)是最優(yōu)線性無偏估計(jì)(BLUE)。 i yi x i x i y 【例例4.24.2】某縣在對船舶調(diào)查月完成的貨運(yùn)量進(jìn)行調(diào)查 時(shí),對運(yùn)管部門登記的船舶臺帳進(jìn)行整理后獲得注冊 船舶2860艘,載重噸位154626噸,從2860艘船舶中抽 取了一個(gè)的簡單隨機(jī)樣本,調(diào)查得到樣本船舶調(diào)查月 完成的貨運(yùn)量及其載重噸位如下表(單位:噸),要 推算該縣船舶調(diào)查月完成的貨運(yùn)量。 i i Y i X i i Y i X 178010062170120 215005071823150 31005508145080 437610915820 56002010137050 i 該縣船
11、舶在調(diào)查月完成貨運(yùn)量的比率估 計(jì)為 用簡單估計(jì)對貨運(yùn)量進(jìn)行估計(jì) 1123.2 1546262671937 65 R y YX x R v Y 2 222 (1) yx Nf sR s n 11 22.10617 10 yx Rs R s Y ()458930 R v Y 2860 1123.23212352YNy 2 211 (1) 3.43303 10 y Nf v Ys n ( )585921v Y s Y () 0.6135 ( ) R v Y deff v Y 實(shí)際中對于樣本量較小的情形, 使用比率估計(jì)量時(shí)不能忽視其偏倚。 ) () ( ) () ()( 22 2 RVXNYV RVX
12、RXVyV R R 當(dāng) R0.5 時(shí),比估計(jì)比 srs 有更高的精度。 分層抽樣下,比估計(jì)有兩種方法: 1.Separate Ratio estimator , 1 1 1 x y r, 2 2 2 x y r 厖. L L L x y r (h=1,2,.L) 四、分層隨機(jī)抽樣下的比率估計(jì)四、分層隨機(jī)抽樣下的比率估計(jì) 如果各層的樣本量不小的話,則可以采用 各層分別進(jìn)行比率估計(jì),將各層加權(quán)匯總 得到總體指標(biāo)的估計(jì),這種方式稱為分別 比率估計(jì)量。separate ratio estimator h h h hRhhRS X x y WyWy Rhh h h RSRS YX x y yNY 2.C
13、ombined Ratio estimator 由 h y估計(jì) st y,由 h x估計(jì) st x。 XRX x y y C st st RC XRyNX x y Y CRC st st RC 方差的比較 如果每一層樣本量都比較大,各層R相差較大,則分別比 率估計(jì)量的方差小于聯(lián)合比率估計(jì)量的方差。 但當(dāng)每層的樣本量不太大時(shí),還是采用聯(lián)合比率估計(jì)量更 可靠些,因?yàn)檫@時(shí)分別比率估計(jì)量的偏倚很大,從而使總 的均方誤差增大。 2 2222 2 2222 ()(2) ()(2) h Rsyhhxhhyxh h h Rcyhcxhcyxh h W V YNSR SR S n W V YNSR SR S n
14、 RS Y RC Y 六六、Regression Estimator LrLr Lr yNY XxyxXyy )()( 若令 , 0 則 )(srsyyLr ; 若令 ,R 則 RLr yxX x y yy)( (比估計(jì)) () 011uu reg yx BBBxx y 回歸估計(jì)應(yīng)用的兩種情況: 1. 事先確定 設(shè)的確定值為 0 , 0 是一常數(shù),則: )( 0 xXyy Lr (1) )2()2( 1 )()( 1 11 )( 0 22 0 2 2 0 yxxy i N iLr SSS n f XXYY Nn f yV ) 3 ()2( 1 )( 0 22 0 2 yxxyLr sss n
15、f y 因?yàn)?YxXEyEyE lr )()()( 0 而)( 0iilr xXyy又可表為的樣本均值 后者的總體均值為Y 故(2)式成立 其樣本估計(jì)量: 性質(zhì): A: Lr y是Y的無偏估計(jì) B:)( Lr y是)( Lr yV的無偏估計(jì) C: 0 的最佳值是 2 0 x yx S S 總體回歸 系數(shù) 大樣本條大樣本條 件下件下 殘差方 差Se2 2 ()(1) e reg n SE Nn S y 3.分層抽樣中的回歸估計(jì) (1)分別回歸估計(jì) )( )( hhhhhLrslrs hhhhhLrh L nLrs xXyNyNY xXyWyWy 當(dāng) h 可以事先確定時(shí), Lrs y與 Lrs Y
16、 都是無偏的,且 )2( )1 ( )( 222 2 xhhyxhhyh h hh Lrs SSS n fW yV 在).2 , 1( 2 Lh S S xh yxh h 時(shí)達(dá)到極小值 )1 ( )1 ( )( 22 2 minhyh h hh Lrs S n fW yV 若 h 不能事先確定, h h n hhi n hhihhi h xx xxyy b 2 )( )( 當(dāng) 較大時(shí), 適用場合 ? h n 2 22 2 222 2 22 (1) ()(1) (1) ()()() (2) (1) (1)(1) (2) hh hh Lrsyhh h nn hh Lrshihhhih hh hh
17、hyhh hh Wf V yS n Wf yyybxx n n Wf nSr n n 層內(nèi)殘差 方差Seh2 (2)聯(lián)合回歸估計(jì) ) ( )( , ststLrcLrc ststLrc hhsthhst XXYyNY xXyy xWxyWy 當(dāng)事先設(shè)定時(shí), )2( )1 ( )( 222 2 xhyxhyh h hh Lrc SSS n fW yV 無偏 當(dāng)無法事先設(shè)定時(shí), )2( )1 ( )()( ) 1( )1 ( )( 222 2 2 2 xhcyxhcyh h hh hhichhi hh hh Lrc SbSbS n fW xxbyy nn fW y 漸近無偏 其中 2 2 2 (1
18、) ()() (1) (1) () (1) h hh hihhih hh c n hh hih hh Wf yyxx n n b Wf xx n n 如果是按比例分配,則可簡化為聯(lián) 合最小二乘估計(jì)? 【例例】某市對中央直屬單位和市屬單位專業(yè)技 術(shù)人員總數(shù)進(jìn)行了分層隨機(jī)調(diào)查,已有98年各 層人員總數(shù),135個(gè)中央直屬單位有75650專業(yè) 技術(shù)人員,1228個(gè)市屬單位有315612專業(yè)技術(shù) 人員。分別在兩層中調(diào)查了15、20家單位,調(diào) 查數(shù)據(jù)如下,試估計(jì)99年全市專業(yè)技術(shù)人員總 數(shù)。 (1)按分別比率估計(jì)量估計(jì) (2)按聯(lián)合比率估計(jì)量估計(jì) RS Y 2 1 0.959859 171400 1.04
19、9725 102900 272536.6 hh h R X RS v Y 2 2 222 1 (1) hh yhhxh h h Nf sR s n 2 hyxh R s 9588.48 RS v Y RC Y 277310 274300271956.1 279700 st st Y X X RC v Y 2 2 222 1 (1) hh yhxh h h Nf sR s n 2 yxh Rs 9289.44 RC v Y 415524 1607 415433 1675 (3)按分別回歸估計(jì)量估計(jì),用樣本回歸系數(shù)估計(jì)b (2)按聯(lián)合比率估計(jì)量估計(jì) lrS Y 22 11 () hlrhhhhhh hh N yNybXx 415331 lrS v Y 2 2 222 1 (1)1 2 hhh yhhxh h hh Nfn sb s nn 9480.11 lrS v Y1604 c b 22 1 22 2 1 (1) 756.5757 1.0290 (1)735.2535 hh yxh h h hh xh h h Wf s n Wf s n 1.06 lrc Y st Y cst bXX 415386 lrC vY 2 2 22 2 1 (1) hh yhc xh h
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 微信ibeacon藍(lán)牙搖一搖周邊商場超市應(yīng)用案例
- 《鋼材知識專業(yè)培訓(xùn)》課件
- 張志敏英語課件Icanrunfa
- 福建省福州鼓樓區(qū)2025屆高考仿真卷語文試題含解析
- 湖北省葛洲壩中學(xué)2025屆高三第二次調(diào)研數(shù)學(xué)試卷含解析
- 上海市戲劇學(xué)院附中2025屆高考沖刺模擬語文試題含解析
- 2025屆浙江省“六市六?!甭?lián)盟高三3月份模擬考試數(shù)學(xué)試題含解析
- 2025屆黑龍江省佳木斯中學(xué)高三第六次模擬考試數(shù)學(xué)試卷含解析
- 2025屆安徽省屯溪第一中學(xué)高三沖刺模擬英語試卷含解析
- 2025屆廣東省河源市連平縣連平中學(xué)高考語文三模試卷含解析
- 八年級上冊歷史知識結(jié)構(gòu)圖
- 特殊建設(shè)工程消防設(shè)計(jì)審查申請表
- 漢密爾頓抑郁量表(24項(xiàng))——評定方法
- 鄭百文案例簡要探析
- 功能高分子材料和智能高分子材料.PPT
- 莫爾條紋干涉光學(xué)系統(tǒng)仿真設(shè)計(jì)
- 紅外熱像儀的應(yīng)用PPT課件
- 未婚承諾書模板
- [推薦]:校園歌手大賽show安全應(yīng)急預(yù)案(正式)
- 部編版六年級上語文成績登記表
- 相親相愛一家人簡譜歌詞
評論
0/150
提交評論