版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
第
三
章
回
歸
分
析
原
理3·1、一元線性回歸數(shù)學(xué)模型這里所
的一元線性回歸數(shù)學(xué)模型,是數(shù)學(xué)模型的最簡單形式。當(dāng)然要注意的
是,這里模型
是在真正回歸意義上來進(jìn)行的,也可稱之為概率意義上的線性模
型。在非確定性意義上,或概率意義上討論問題,首先要注意一個最基本的概念或思路問題,這就是總體和樣本的概念。
概率論和數(shù)理統(tǒng)計的基本思想和目的,就是希望通過樣本所反映出來的信息來揭示總體的規(guī)律性,這種想法或思路顯然存在重大的問題。但另一方面,也必須承認(rèn),為了尋找總體的規(guī)律或客觀規(guī)律,只能通過樣本來進(jìn)行,因為只可能得到樣本。
在真正回歸意義上建立其有效方法時,必須作出相應(yīng)的假設(shè)條件。等價于基本假設(shè)條件:(1)假設(shè)概率函數(shù)P(Yi
|
Xi
)或隨 量
Yi
的分布對于
Xi
所有值,具有相同的方差
2
,
且
2
是一個常數(shù),亦即i
iVar(Y
)
=Var(
)
=2。(2)假設(shè)Yi
的期望值E(Yi)位于同一條直線上,即其回歸直線為EY()
i
=
XiE(i
)
0上面這個假設(shè)是
假設(shè),它實際上表明之間是確定性的關(guān)系。E(Yi)與Xi(3)假設(shè)隨
量
Yi
是完全獨立的,亦即i
jCov(Yi
,Yj
)
Cov對3·2、隨機(jī)項或誤差項的含義一元線性回歸模型的一般形式為Yi
xi
ii是一隨機(jī)項或誤差項,它的存在表明i
iX
Y的影響是隨機(jī)的,非確定性的。那么,i究竟包含了什么意義或內(nèi)容呢?概括地說來主要有:模型中被忽視了的影響因素;變量的測量誤差,這種誤差主要來自統(tǒng)計數(shù)據(jù)本身的誤差;隨機(jī)誤差。社會經(jīng)濟(jì)現(xiàn)象中涉及到人的因素和行為,還有歷史的、文化的等因素,這些因素一般來說是難以量化的、多變的;模型的數(shù)量關(guān)系誤差。即數(shù)學(xué)形式所帶來的誤差。一般來說,所有的經(jīng)濟(jì)數(shù)學(xué)模型的誤差也就是這4個方面,或者說是存在的主要問題,對此
須要有清醒和深入的認(rèn)識。3·3、一元線性回歸模型的參數(shù)估計必須理解和認(rèn)識總體回歸模型和樣本回歸模型的區(qū)別和關(guān)系,假設(shè)總體真正的回歸直線是E(Yi
)
xi它是由總體回歸模型Yi
xi
i顯然,上面的模型是
、理論上的,實際上是找不到的,它們實際上就是所謂客觀規(guī)律。而樣本的回歸直線為Y?
?
?Xi
i它是來自于樣本的回歸模型Yi
?
?Xi
ei注意總體和樣本模型的區(qū)別和聯(lián)系,無限和有限,相同和不同等。下面
同樣根據(jù)最小二乘準(zhǔn)則,建立真正回歸意義上的最小二乘法:對樣本模型Yi
?
?X
i
ei假設(shè)其估計的回歸模型為iiY?
?
?XIi?
Y
?
?X
i因此,其殘差則為ei
Yi
Y所以,其殘差平方和為22??ii
i
X
)Q
e
(Y根據(jù)前面的結(jié)果,有其中?
xi
yixi
Xi
X
,
yi
Yi
Y
xi?
Y
?X到此樣本回歸模型的參數(shù)就估計出來了。對于這個結(jié)果需要注意的是,這里的?
,?
都是的函數(shù),而是隨 量,因此,從理論上說,隨量,而不是一個或幾個固定的值,是一個概率分布。3.4、估計值的性質(zhì)是觀測值22
i
ixx
xi
(Yi
Y
)
xiYi
Y
xi
x
2
i證明:
?
xi
yii而
x
0
ix2
?
xiYi
wiYi
其中wi
xi
x
2
i同理可證:?
=
kiYini
i其中
k
1
w
Xi所以,?
,
?
是Y
線性函數(shù)(1)估計值的線性性質(zhì)所謂線性性是指估計值
?的線性函數(shù)。,?(2)估計值的無偏性。所謂無偏性是指估計值?
,?
的期望值等于總體回歸模型參數(shù)
,
的值。亦即E(?)
,
。證明:E(?)
i
)
E(
wi
wi
X
i
wi
iE(?)
E(wiYi
)
Ewi
(
X
i通過計算可知wi
0,
wi
Xi
1
E(?)
E(
wi
i
)
E(wi
)E(i
)其中E
(
i
)
0,(i
1,2,3.,n)所以有E
(?)
同理可證E
(?)
(3)有效性(或稱?
,
?
具有最小方差性)。所謂有效性主要是指最小二乘估計?
,
?
在所有線性無偏估計中,其方差是最小的。證明的基本思路是:Var
(~)Var
(?)
,Var
(~)Var(?)證明(略)。上面三個性質(zhì)是最小二乘估計的主要性質(zhì),理論上說已達(dá)到最好的結(jié)果了。因此,滿足這三條的估計也稱作最優(yōu)線性無偏估計。用。這里再一次
,參數(shù)估計之所以要進(jìn)假設(shè)計算出
的方差,
就可得到行檢驗,是因為這里?的?
,?
,
?3·5、最小二乘估計?
,?
的顯著性檢驗與置信區(qū)間所謂顯著性檢驗實際上就是對檢驗估計值與總體參數(shù)值差別大小的方法。也就是數(shù)理統(tǒng)計中的“假設(shè)檢驗”的方法一種實際應(yīng)服從正態(tài)分布,又因?
,?
是的線是隨
量Yi。性函數(shù),Y所i
以,也是服從正態(tài)分布的。只要22
2
)
iixn
X?
~
N
(
,)
ix
2
2?
~
N
(
,在上面的分布函數(shù)中,除了
,
不可能知道外,
須解決未知數(shù)
2估計值,才可能繼續(xù)進(jìn)行顯著性檢驗。1、建立隨設(shè):
yi
Yi
Y
Y?
Y
,
x
X
Xi
i
iy?i所以ei
Yi
Y?
yi
y?i而(1)Yi
X
i
i
,
Y
X
yi
xi
(i
)又(2)?
Y
?X代入iiY???
X采用一定的辦法是可以解決
2
估計值的,下面給出其推理過程,并證明其估計值?
2是一個無偏估計。量方差
2的估計值ii則有Y?YXX?()iiiey
(?
)(x)ii
y?x
?由此
就有y?i因此,進(jìn)一步則有?22()2(iiii)()
x
xe
2
i
(?
)下面分別計算上式右邊每一項的期望值:2222?x
i
(
xi
)
var(
)
E(
)2?
?
xi
2其中
var(
)
2221
i
i
in
(E
(
)
E2
)
(n
1)
i
i
ix
x2i2
?(
i
xi
)
2(
ixi
xi
)
E
i
xiE
(
)x
(
)
E2
2
ix
x
2
i
2?
ii
i
ii
i
i
i
ix
2x
2
x2
i
xY
x
(
X
)
x
(注意其中
2
ix
?
xi
i
)最終得到E(e2
i
)
2
(n
1)
2
2
2
(n
2)
2如果
定義2n
2ei?
2
,那么?
2就是
2
的無偏估計,亦即有2n
2eE(?
2
)
E(
i)
2
。但是
還不能證明?
2
是最小方差估計,這是十分遺憾的。的顯著性檢驗2、
最小二乘估計值
?
,?顯著性檢驗實際上是檢驗?,?與
,之間的差距和可靠性。具體的檢驗方法就是“假設(shè)檢驗”的方法。一般假設(shè)檢驗中用來進(jìn)行檢驗的統(tǒng)計量(實際上就是一種隨
量)主要有二個,即Z統(tǒng)計量和T統(tǒng)計量。(1)應(yīng)用Z統(tǒng)計量的條件是:已知
2而無論樣本的大小,或者未知
2
但樣本足夠的大(n至少大于30)。22)inx
X
i2已知
?
~
N
(,?2
ix
2
~
N
(,)22iinx
2
X則
有Z
?
~N(0
,1)2I
Xz
2?~
N(0
,1)當(dāng)然如果未知
2
,但樣本數(shù)大于
30,則在上式中用?
2替代即可。2)應(yīng)用T
統(tǒng)計量的條件:當(dāng)方差
2未知,且樣本小于30
時。2
)
inx
2
X
i2已知
?
~
N
(,?)2
ix
2
~
N
(
,則22
iinx有T
2
X??
?
?
~
t(n-k)=2I
XT
2=?
?
?
~t(n-k)這里的n是樣本的個數(shù),k是模型中變量的個數(shù),n-k是度。要依據(jù),具體值才能判斷或檢驗,是否是可接受的或誤差不大。只能用假設(shè)、或者具體地說是用理論假而已, 不可能知道, 的具體值,但
又說的數(shù)量結(jié)論來替代,
的具體值,也就是“假設(shè)檢驗”方法中作出“零假設(shè)”的主要依據(jù);
這樣 就可看到,所謂“假設(shè)檢驗”中原來希望檢?
驗?
,與
,
之間差異的想法或思路,已經(jīng)轉(zhuǎn)變?yōu)闄z驗,是否與理論假說或其他
判斷和經(jīng)驗相符。
在“假設(shè)檢驗”的實際應(yīng)用中,一個十分重要的問題是如何確定總體意義上的
, 的值。知道“總體”概念說到底只是一個設(shè)想,一個信念3、總體參數(shù)
,
置信區(qū)間的估計為了確定?
,?
是怎樣接近真實總體的參數(shù)
,
,
期望構(gòu)造一個區(qū)間來具體加以說明,亦即建立一個圍繞估計值?,?
的一定限制范圍,來推斷總體參數(shù)
,
在一定置信度下落在此區(qū)間。所謂置信(或稱置信水平)度實際上與顯著性水平的意義類似,只是數(shù)量的大小相反而已。例如,對于
?
的T
統(tǒng)計量,有2I
XT
2?
??
=
~t(n-k)先確定其置信度如
95%和
找出臨界值
t0025
的值。則度(n-k),然后通過
t分布表有p(
t0025T?
t0025
)
0
95即p(?
t0025?
?
?
t0025?
?
)
0
95所以,
置信度是
95%的置信區(qū)間為(?
t0025?
?
,
?
t0025?
?
)3·6、問題的分析
0
值Y?根據(jù)最小二乘法
從樣本模型Yi
?
?X
i
ei找到了它的回歸直線iiY?
?
?X已對?,?
作了檢驗并通過后,應(yīng)該可以根據(jù)上式來進(jìn)行了,亦即對于X
0Y?,可得到
0
,亦即00Y?
?
?X要具體Y?0
性質(zhì),實際上主要是分析它的誤差性質(zhì),成是總體0二是把Y?
看成0(1)如果把Y?
看成是總體回則Y?
有什么樣的性質(zhì)呢??梢宰C明0的無偏估計?,F(xiàn)證明如下:?()?
()?(
?0
0()?XE0
)EXEYE0
然后,:var(Y?
)
var(Y?
E(Y
))
var(?
?X
)0
0
0
0
var(?)
X
0
var(?)
2
X
0
cov(?,
?)2
0
)
x
2
i1
(
X
X
)2n
2
(從Y?
方差的計算結(jié)果可看出,如果
X
離樣本0
00觀測值
X
的距離越大,則Y?
的方差也就越大。這實際上說明回歸的基本思想實際上是歸納的思路,亦即
的
X
0
不能脫離樣本或經(jīng)驗的范圍太遠(yuǎn),否則模型的
值的方差將增大,
將將變得更加不可靠。同時這個結(jié)果也把回歸模型稱之為“內(nèi)插檢驗”亦即這時的X
0的類型分為兩類,第一類
必須在樣本所限定的區(qū)間內(nèi),言外之意是對經(jīng)驗之內(nèi)的情況,回歸模型的靠的。第二類稱之為“外推
”,這時的X
0效果是比較可是在樣本區(qū)間的外面,這時的
值的誤差方差顯然是較大的,亦即“外推
”是十分不可靠的。?(2)如果把Y看作真正總體0
0Y
或Y0
X
0
0
的估計值,其性質(zhì)和結(jié)果又會什么變化呢?下面
來具體看看這種情況下Y?
的期望值和方差:0對于給定的X
0
,有Y0
X
0
000Y?
?
?X則00???
(
)
(
)
X
0Y0
Y取其期望值,則有000
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 貴州省事業(yè)單位聘用合同制試行辦法
- 合肥 采購合同范本
- 大班數(shù)學(xué)課件《門牌號碼》
- 2024聘用兼職老師合同書范文
- 山東省東營市利津縣2024-2025學(xué)年八年級上學(xué)期11月期中化學(xué)試題
- m材料力學(xué)第11章 能量法
- 2024劇本版權(quán)制作及發(fā)行權(quán)購買合同參考范本
- 2024合同違約起訴狀范本
- 專題01 標(biāo)題的作用及含義-2022-2023學(xué)年小升初語文記敘文知識點銜接(部編版)
- 幼兒園防詐安全教育
- 《憶讀書》說課稿
- 【初中化學(xué)】二氧化碳的實驗室制取教學(xué)課件-2024-2025學(xué)年九年級化學(xué)人教版上冊
- 課件配音教學(xué)教學(xué)課件
- 2024年光伏發(fā)電項目監(jiān)理協(xié)議
- GB/T 5526-2024動植物油脂相對密度的測定
- GB/T 30893-2024雨生紅球藻粉
- 2024-2030年生活用紙產(chǎn)業(yè)規(guī)劃專項研究報告
- 四川省綿陽市2025屆高三第一次診斷性考試數(shù)學(xué)試題含答案
- 2024-2025學(xué)年江蘇省揚(yáng)州市邗江區(qū)梅嶺中學(xué)七年級(上)第一次月考數(shù)學(xué)試卷(含答案)
- 2024年制造業(yè)生產(chǎn)基地租賃協(xié)議模板版
- 自建房與鄰居商量間距協(xié)議書范文
評論
0/150
提交評論