版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
第四章:多重共線性
二、簡答題
1、導(dǎo)致多重共線性的原因有哪些?
2、多重共線性為什么會使得模型的預(yù)測功能失效?
3、如何利用輔回歸模型來檢驗多重共線性?
4、判斷以下說法正確、錯誤,還是不確定?并簡要陳述你的理由。
⑴盡管存在完全的多重共線性,OLS估計量還是最優(yōu)線性無偏估計量〔BLUE〕。
⑵在高度多重共線性的情況下,要評價一個或者多個偏回歸系數(shù)的個別顯著性是不可能的。
(3)如果某一輔回歸顯示出較高的值,那么必然會存在高度的多重共線性。
(4)變量之間的相關(guān)系數(shù)較高是存在多重共線性的充分必要條件。
(5)如果回歸的目的僅僅是為了預(yù)測,那么變量之間存在多重共線性是無害的o
5、考慮下面的一組數(shù)據(jù):
Y-10-8-6-4-202468:0
1234567891011
x2
13579111315171921
X3
如果我們用模型:
來對以上數(shù)據(jù)進(jìn)展擬合回歸。
(1)我們能得到這3個估計量嗎?并說明理由。
(2)如果不能,那么我們能否估計得到這些參數(shù)的線性組合?可以的話,寫出必要的計
算過程。
6、考慮以下模型:
由于X?和X,是X的函數(shù),那么它們之間存在多重共線性。這種說法對嗎?為什么?
7、在涉及時間序列數(shù)據(jù)的回歸分析中,如果回歸模型不僅含有解釋變量的當(dāng)前值,同時還
含有它們的滯后值,我們把這類模型稱為分布滯后模型〔distributed-lagmodel]。我們考慮以
下模型:
其中丫——消費(fèi),X——收入,t——時間。該模型表示當(dāng)期的消費(fèi)是其現(xiàn)期的收入及其滯后
三期的收入的線性函數(shù)。
(1)在這一類模型中是否會存在多重共線性?為什么?
(2)如果存在多重共線性的話,應(yīng)該如何解決這個問題?
8、設(shè)想在模型
中,X2和X3之間的相關(guān)系數(shù)電為零。如果我們做如下的回歸:
〔1〕會不會存在且%=自?為什么?
〔2〕A會等于由或,?或兩者的某個線性組合嗎?
:3〕會不會有var(A)=var02)JLvar(%)=var(R)?
9、通過一些簡單的計量軟件〔比方EViews、SPSS],我們可以得到各變量之間的相關(guān)矩陣:
1r23「Ik'
R=0;:…勺。
?2…1>
怎樣可以從相關(guān)矩陣看出完全多重共線性、近似多重共愛性或者不存在多重共線性?
三、計算題
1、考慮消費(fèi)函數(shù)
其中,C、丫、曲依次表示消費(fèi)、收入與財富。下面是假想數(shù)據(jù)。
CYW
7080810
651001009
901201273
951401425
1101601633
1151801876
1202002252
1402202201
1552402435
1502602686
⑴作C對丫和中'的普通最小二乘回歸。
⑵這一回歸方程是否存在著多重共線性?你的判斷依據(jù)是什么?
(3)分別作C對Y和W的回歸,這些回歸結(jié)果說明了什么?
(4)作W.對Y的回歸。這一回歸結(jié)果說明了什么?
(5)如果存在嚴(yán)重的共線性,你是否會刪除一個解釋變量?為什么?
2、下表給出了美國1971;986年期間新客車出售的數(shù)據(jù)。
年份Y
X5乂6
%2X3兀
197110227112.0121.3776.84.8979367
197210872111.0125.3839.64.5582153
197311350111.1133.1949.87.3885064
19748775117.5147.71038.48.6186794
19758539127.6161.21142.86.1685846
19769994135.7170.51252.65.2288752
197711046142.9181.51379.35.5092021
197811164153.8195.31551.27.7896048
197910559166.0217.71729.310.2598824
19808979179.3247.01918.011.2899303
19818535190.2272.32127.613.73100397
19827980197.6286.62261.411.2099526
19839179202.6297.42428.18.69100834
198410394208.5307.62670.69.65105005
198511039215.2318.52841.17.75107150
198611450224.4323.43022.16.31109597
Y——新車出售量,未經(jīng)季節(jié)調(diào)整數(shù)量;
X2——新車,消費(fèi)者價格指數(shù),1967年=100,未經(jīng)季芍調(diào)整;
——消費(fèi)者價格指數(shù),1967年=100,未經(jīng)季節(jié)調(diào)整;
x4——個人可支配收入,10億美元,未經(jīng)季節(jié)調(diào)整;
x5——利率,百分?jǐn)?shù),金融公司票據(jù)直接使用;
x6—民間就業(yè)勞動人數(shù)〔個人〕,未經(jīng)季節(jié)調(diào)整。
(1)如果你決定使用表中全部回歸元作為解釋變量,可能會遇到多重共線性嗎?為什
么?
(2)如果你這樣認(rèn)為的話,你準(zhǔn)備怎樣解決這個問題?明確你的假設(shè)并說明全部計算。
(3)制定適當(dāng)?shù)木€性或者對數(shù)線性的模型,以估計美國對汽車的需求函數(shù)。
第二局部:參考答案
一、術(shù)語解釋
1、多重共線性:對于經(jīng)典線性回歸模型[CLRM)
如果上式中某兩個或多個解釋變量之間出現(xiàn)了相關(guān)性,那么稱為存在多重共線性。依據(jù)解釋
變量之間共線性的程度不同,可以分為完全多重共線性和近似多重共線性。
2、完全多重共線性與近似多重共線性:所謂完全多重共線性,是指線性回歸模型中的
假設(shè)干解釋變量或全部解釋變量之間具有嚴(yán)格的線性關(guān)系,也就是說,對于多元線性回歸模
型,假設(shè)各解釋變量X],*2,…,X上的之間存在如下的關(guān)系式:
式中4,4,…,4是不全為零的常數(shù),那么稱這些解釋變量之間存在完全多重共線性。
當(dāng)各解釋變量X1,X2,…,X*的之間存在如下的近似的線性關(guān)系:
那么可以說上述解釋變量之間存在近似多重共線性。還可以采用如下的方式,在近似
線性關(guān)系式中,假設(shè)400,那么可將此近似線性關(guān)系表示為:
其中%=4/4,匕為隨機(jī)誤差項。
3、輔回歸:在變量之間存在多重共線性的情況下,有一個解釋變量能由其它解釋變量
近似的線性表示出來。為了找出哪個解釋變量和其它變量有這種關(guān)系,我們可以將每個%對
其余變量進(jìn)展回歸,即
這種回歸叫做輔回歸,它是相對于Y對各個X的主回歸而言的°
二、簡答題
1、答:
經(jīng)濟(jì)數(shù)據(jù)中大量存在多重共線性這一現(xiàn)象,主要原因在于:經(jīng)濟(jì)領(lǐng)域很難象其它實險學(xué)
科那樣從控制性試臉中獲得數(shù)據(jù);此外,可能有經(jīng)濟(jì)變量構(gòu)造上的原因,也有數(shù)據(jù)收集與模
型設(shè)定方面的原因,具體的,有以下幾種:
〔1〕所使用的數(shù)據(jù)收集方法。我們只能在一個有限的范圍內(nèi)得到觀察值,無法進(jìn)展重
發(fā)試臉。
〔2〕模型或從中取樣的總體受到約束〔經(jīng)濟(jì)變量的共同趨勢〕。
〔3〕模型設(shè)定的偏誤。
〔4〕過度決定的模型。這種情況尤其容易發(fā)生在解釋變量的個數(shù)大于觀測值個數(shù)的情
形。
由于上述原因,實際應(yīng)用中,解釋變量之間總會存在一定程度的線性相關(guān),因此,問題
不是多重線性有無,而是多重共線性的嚴(yán)重程度。
2、答:
多元線性回歸模型的一個重要應(yīng)用是經(jīng)濟(jì)預(yù)測。對于模型
如果給定樣本以外的解釋變量的觀測值X。,就可以得到被解釋變量的預(yù)測值
但是,這只是被解釋變量的預(yù)測值的估計值而不是預(yù)測值。預(yù)測值僅以某一個置信水平位于
以該估計值為中心的一個區(qū)間中。對于預(yù)測的置信區(qū)間,我們利用的是構(gòu)造,統(tǒng)計量,得到
在給定(1一a)的置信水平下為的置信區(qū)間為
顯然,當(dāng)解釋變量之間存在多重共線性時,(X'X)7非常大,故而丫。的置信區(qū)間也很
大,因此,模型的預(yù)測功能失效。
3、答:
輔回歸是相對于丫對各個X的主回歸而言的。在變量之間存在多重共線性的情況下,
有一個解釋變量能由其它解釋變量近似的線性表示出來。為了找出哪個解釋變量和其它變量
有這種關(guān)系,我們可以將每個X,對其余變量進(jìn)展回歸,即
Xj+a,.+1X/+l++4,
并計算相應(yīng)的決定系數(shù),分別記為R;。然后,我們在建立統(tǒng)計量:
它服從自由度為k-2和n-k+l的F分布。其中n為樣本大小,k為包括常數(shù)項在內(nèi)的解釋變
量個數(shù)。如果計算出的片超過了相應(yīng)自由度的臨界值,邨么認(rèn)為這個X,和其余的解釋變量
存在共線性;如果”.未超過臨界值,那么認(rèn)為這個X,和其余的解釋變量不存在共線性。這
種輔回歸模型檢臉不僅可以檢驗是否存在多重共線性,而且還可以得到多重共線性的具體形
式。
4、答:
〔1〕錯。如果變量之間存在完全的線性關(guān)系時,我們甚至無法估計其系數(shù)或者標(biāo)準(zhǔn)誤。
〔2〕錯。在高度多重共線性的情況下,仍然可以得到一個或者多個顯著的t值。
〔3〕錯。OLS估計量的方差有下式給出:
從此式可以看出,一個很高的R;可被一個很低的或者很高的2片抵消掉。
〔4〕錯。如果一個模型只有兩個回歸元,兩兩之間的高度相關(guān)系數(shù)便表示存在多重共
線性。但是在變量之間存在多重共線性的前提下,可能是幾個變量之間的關(guān)系。變量之間的
相關(guān)系數(shù)較高是存在多重共線性的充分非必要條件。
〔5〕不確定。如果觀測到共線性在后來的樣本數(shù)據(jù)中繼續(xù)存在,或許無害。但如果不
是這樣,或者目的在于做出準(zhǔn)確的估計的話,多重共線性便成為問題。如果僅僅要是預(yù)測的
話,預(yù)測有效的前提條件是模型構(gòu)造的穩(wěn)定。
5、答:
〔1〕不能。通過對和乂3的觀察,我們可以知道它們存在以下的關(guān)系:
X3/=2X2/-1,所以可知變量X2和X3是完全線性相關(guān)的。
〔2〕把方程寫成
其中%=氏、%=22+2月O
因此,我們可以唯一的估計出四和二?,但無法估計出原始的尸,因為兩個方程無法
解出三個未知數(shù)。
6、答:
這種說法不正確。因為Y和火;都是X的非線性函數(shù),把它們包括在回歸模型中并不違
反經(jīng)典性線性回歸模型的根本假設(shè)。多重共線性的相關(guān)是指的變量之間的線性相關(guān)。
7、答:
〔1〕是的。經(jīng)濟(jì)時間序列數(shù)據(jù)有同向變動的趨勢。在這里,收入的滯后變量一般也可
以一樣的方向變動O
〔2〕在遇到時間序列數(shù)據(jù)存在線性相關(guān)性時,我們一般都是采用一階或者高階差分變
換來消除共線性。
8、答:
〔1〕是的。這是因為X2和X3之間的相關(guān)系數(shù)為0,所以夕系數(shù)的表達(dá)式
(Z丫也)(Z靖)-(Z丁再)(Z々也)
A=------------------------------------------、
(Z)(Z**)-(1>2/3廣
中的穿插乘積項消失,從而變成與a和/系數(shù)同樣的表示式。
12〕是它們的一個線性組合。證明如下:
因此有B1=?|+/)-Ko
〔3〕不是。原因如下:
32
var(d2)=
Z4
9、答:
我們可以利用相關(guān)矩陣的行列式來判斷多重共線性與否,可以利用R的行列式大小來
判斷多重共線性的強(qiáng)弱。
(1)假設(shè)R的行列式為0時,那么存在完全的共線性。
(2)假設(shè)R的行列式很小接近于。時,那么存在近似的共線性。
(3)假設(shè)R的行列式為1時,那么變量正交、不存在共線性。
三、計算題
1、解:
〔1〕使用EViews軟件進(jìn)展回歸
DependentVariable:SER01
Method:LeastSquares
Date:07/02/06Time:19:32
Sample:110
Includedobservations:10
VariableCoefficientSrd.Errort-St£tisticProb.
C24.336986.2800513.8752840.0061
W-0.0349520.030120-1.1604330.2839
Y0.8716400.3143792.7725760.0276
R-squared0.968182Meandependentvar111.0000
AdjustedR-squarcd0.959092S.D.dependentvar31.42893
S.E.ofregression6.356758Akaikeinfbcriterion6.780239
Sumsquaredresid282.8586Schwarzcriterion6.871015
Ix)glikelihood-30.90120F-statistic106.5019
Durbin-Watsonstat2.941201Prob(F-statistic)0.000006
回歸得到的方程為?
AAA
〔2〕有。R-squarcd的值為0.968182,但是系數(shù)W通過不過顯著性檢臉。
⑶
VariableCoefficientStd.Errort-StatisticProb.
C24.454556.4138173.8127910.0051
Y0.5090910.03574314.243170.0000
R-squarcd0.962062Meandependentvar111.0000
AdjustedR-squarcd0.957319S.D.dependentvar31.42893
S.E.ofregression6.493003Akaikeinfocriterion6.756184
Sumsquaredresid337.2727Schwarzcriterion6.816701
I^oglikelihood-31.78092F-statisric202.8679
Durbin-Watsonstat2.680127Prob(F-statistic)0.000001
VariableCoefficientStd.Errort-SutisticProb.
c26.451988.4461653.1318330.0140
w0.0480390.00454310.575190.0000
R-squared0.933241Meandependentvar111.0000
AdjustedR-squarcd0.924896S.D.dependentvar31.42893
S.E.ofregression8.613107Akaikeinfocriterion7.321304
Sumsquaredresid593.4849Schwarzcriterion7.381821
Loglikelihood-34.60652I7-statistic111.8346
Durbin-Watsonstat2.389869Prob(F-statistic)0.000006
在這兩個回歸中,系數(shù)是顯著的,而在同時對兩個變量進(jìn)展回歸時,卻存在局部系數(shù)的
不顯著,說明變量之間存在多重共線性。
⑷
VariableCoefficientStd.Errort-SutisticProb.
C336363673.70690-0.0456350.9647
Y10.372730.41075325.252990.0000
R-squarcd0.987611Meandependentvar1760.000
AdjustedR-squared0.986062S.D.dependentvar632.0272
S.E.ofregression74.61690Akaikeinfocriterion11.63947
Sumsquaredresid44541.45Schwarzcriterion11.69998
Ix)glikelihood-56.19734F-statistic637.7133
Durbin-Watsonstat2.366673Prob(F-statistic)0.0()0000
VariableCoefficientStd.Errort-SutisticProb.
Y10.354970.12399183.514000.0000
R-squarcd0.987607Meandependentvar1760.000
AdjustedR-squarcd0.987607S.D.dependentvar632.0272
S.E.ofregression70.35864Akaikeinfocriterion11.43973
Sumsquaredresid44553.05Schwarzcriterion11.46999
Ix)glikelihood-56.19864Durbin-Watsonstat2.366224
不管是否帶上常數(shù)項,R-squared的值都非常大(>0.98],而且Y的系數(shù)都通過顯著性
檢臉,說明w.和丫存在高度的共線性。
〔5〕在滿足模型的經(jīng)濟(jì)含義的前提下〔以免造成模型設(shè)置失誤〕,我們還是可以通過
舍去W或者Y來消除共線性的
2、解:
〔1〕首先我們發(fā)現(xiàn)各個變量在數(shù)量級上存在較大差異,所以我們一般考慮對數(shù)線性回
歸模型。如果我們的對數(shù)回歸模型中包含了所有的解釋變量,那么得到如下的結(jié)果:
DependentVariable:I.OG(Y)
Method:LeastSquares
Date:07/02/06Time:20:31
Sample:19711986
Includedobservations:16
VariableCoefficientStd.Errort-SutisticProb.
C3.25485919.116560.1702640.8682
LOG(X2)1.7901530.8732402.0500120.0675
LOG(X3)-4.1085181.599678-2.5683410.0280
LOG(X4)2.1271991.2578391.6911540.1217
LQG(X5)-0.0304480.121848-0.2498840.8077
LOG(X6)0.2777922.0369750.1363750.8942
R-squarcd0.854803Meandependentvar9.204273
AdjustedR-squarcd0.782205S.D.dependentvar0.119580
S.E.ofregression0.055806Akaikeinfocriterion-2.653874
Sumsquaredresid0.031143Schwarzcriterion-2.364153
Toglikelihood27.23099F-statistic11.77442
Durbin-Watsonstat1.793020Prob(F-statistic)0.000624
我們發(fā)現(xiàn)R-squared=0.854803>0.80,LOG(X4)、LOG(X5)、LOG(X6)都不能通過0.10
的顯著性檢臉。我們可以得出結(jié)論,各變量之間存在多重共線性。
〔2〕由于有5個解釋變量,我們可以考慮消除局部解釋變量重新對參數(shù)進(jìn)展估計,以
得到正確的回歸方程。
我們首先得到個解釋變量之間的相關(guān)系數(shù)矩陣:
X2X3X4X5X6
X210.996864584320.991353674830.525829679620.97214455418
675
X30.9968645843210.991273632980.543312899970.96523922955
974
X40.991353674830.9912736329810.461436278030.97261537151
6
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 綜合素養(yǎng)提升的跨領(lǐng)域?qū)W習(xí)策略研究
- 科技驅(qū)動的校園環(huán)境改善策略
- IT行業(yè)保密協(xié)議(2024版)
- 2025年度智能廚電一體化購銷合同二零二五3篇
- 二零二五年度自助餐廳經(jīng)營承包合同3篇
- 漯河2024年河南漯河市沙澧河建設(shè)運(yùn)行保障中心人才引進(jìn)5人筆試歷年參考題庫附帶答案詳解
- 滁州安徽滁州明光市司法局招聘司法協(xié)理員7人筆試歷年參考題庫附帶答案詳解
- 高效能實驗的關(guān)鍵儀器的科學(xué)使用方法
- 淮安2025年江蘇淮安漣水縣公安局警務(wù)輔助人員招聘87人(一)筆試歷年參考題庫附帶答案詳解
- 二零二五年度蟲草產(chǎn)品研發(fā)與創(chuàng)新合同3篇
- 2024年小升初語文入學(xué)分班測試卷四(統(tǒng)編版)
- 流行文化對青少年價值觀的影響研究
- 2024年代理記賬工作總結(jié)6篇
- 電氣工程預(yù)算實例:清單與計價樣本
- VOC廢氣治理工程中電化學(xué)氧化技術(shù)的研究與應(yīng)用
- 煤礦機(jī)電設(shè)備培訓(xùn)課件
- 科技論文圖表等規(guī)范表達(dá)
- 高考寫作指導(dǎo)議論文標(biāo)準(zhǔn)語段寫作課件32張
- 2021年普通高等學(xué)校招生全國英語統(tǒng)一考試模擬演練八省聯(lián)考解析
- 紅色研學(xué)旅行課程的設(shè)計與實踐
- 幼兒園保育教育質(zhì)量指南評估指標(biāo)考核試題及答案
評論
0/150
提交評論