第七章線性回歸模型的擴(kuò)展_第1頁
第七章線性回歸模型的擴(kuò)展_第2頁
第七章線性回歸模型的擴(kuò)展_第3頁
第七章線性回歸模型的擴(kuò)展_第4頁
第七章線性回歸模型的擴(kuò)展_第5頁
已閱讀5頁,還剩60頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第七章線性回歸模型的擴(kuò)展第一節(jié)

變量非線性回歸模型第二節(jié)

參數(shù)非線性回歸模型*第三節(jié)

虛擬解釋變量回歸模型第四節(jié)

虛擬被解釋變量回歸模型*2/3/20231山東財(cái)經(jīng)大學(xué)統(tǒng)計(jì)學(xué)院計(jì)量經(jīng)濟(jì)教研室前幾章所討論的,都是基于橫截面數(shù)據(jù)的線性回歸模型,涉及的變量均是數(shù)值變量。實(shí)際上,許多經(jīng)濟(jì)變量之間并不存在線性關(guān)系,建模中涉及的許多變量也不直接表現(xiàn)為數(shù)值,而是屬于分類變量的范疇。為了擴(kuò)大計(jì)量經(jīng)濟(jì)建模方法的適用范圍,本章擬將橫截面數(shù)據(jù)的線性回歸建模方法擴(kuò)展到對(duì)非線性關(guān)系的分析,并將計(jì)量經(jīng)濟(jì)模型的變量類型從數(shù)值變量擴(kuò)展到分類變量。2/3/20232山東財(cái)經(jīng)大學(xué)統(tǒng)計(jì)學(xué)院計(jì)量經(jīng)濟(jì)教研室

線性回歸分析的前提是作為被解釋變量的經(jīng)濟(jì)變量與作為解釋變量的經(jīng)濟(jì)變量之間存在著線性關(guān)系。這里所說的線性是指解釋變量線性并且參數(shù)線性。但是,在眾多的經(jīng)濟(jì)現(xiàn)象中,分析經(jīng)濟(jì)變量之間的關(guān)系,根據(jù)某種經(jīng)濟(jì)理論和對(duì)實(shí)際經(jīng)濟(jì)問題的分析,所建立的經(jīng)濟(jì)模型往往不符合上面的線性要求,即模型是非線性的,稱為非線性模型(Non-linearModel)。非線性模型包括兩種情況:(1)解釋變量非線性,但是參數(shù)線性。(2)參數(shù)非線性。尤其參數(shù)非線性是對(duì)古典假定SLR.1和MLR.1的違背,對(duì)回歸分析影響很大。本節(jié)針對(duì)第一種情況進(jìn)行討論,常用的變量非線性回歸模型包括對(duì)數(shù)函數(shù)模型、雙曲線模型和多項(xiàng)式模型。這類模型有一個(gè)共同特點(diǎn),可以利用變量轉(zhuǎn)換等處理方法將模型線性化,線性化后的模型即可采用OLS方法進(jìn)行參數(shù)估計(jì)。這類非線性模型被稱為內(nèi)蘊(yùn)線性模型,或廣義線性模型。第一節(jié)變量非線性回歸模型2/3/20233山東財(cái)經(jīng)大學(xué)統(tǒng)計(jì)學(xué)院計(jì)量經(jīng)濟(jì)教研室一、對(duì)數(shù)函數(shù)模型(一)雙對(duì)數(shù)函數(shù)模型回歸分析經(jīng)常使用的對(duì)數(shù)模型是雙對(duì)數(shù)函數(shù)模型(Double-logModel),考慮如下形式的需求-收入模型

(7.2)

(7.2)中的參數(shù)是以線性形式出現(xiàn)在模型中的,雖然(7.1)中原變量x和y之間是非線性的,但因變量與自變量的對(duì)數(shù)形式是線性的,因而稱雙對(duì)數(shù)函數(shù)模型。

對(duì)數(shù)函數(shù)模型的自變量和因變量中,至少有一種是原始變量的對(duì)數(shù)形式。具體分為以下兩種類型:兩邊取對(duì)數(shù),模型可變換為:

(7.1)2/3/20234山東財(cái)經(jīng)大學(xué)統(tǒng)計(jì)學(xué)院計(jì)量經(jīng)濟(jì)教研室實(shí)際工作中,雙對(duì)數(shù)模型應(yīng)用非常廣泛,其原因在于,如果忽略誤差項(xiàng),(7.2)是一條直線(y和x都是對(duì)數(shù)形式),所以它的斜率(β1)為一常數(shù),是y相對(duì)于x的彈性系數(shù):所以彈性為一常數(shù)。由于這個(gè)特殊的性質(zhì),雙對(duì)數(shù)模型又稱為不變(固定)彈性模型。

對(duì)這類模型可作如下代換,令雙對(duì)數(shù)模型可化為標(biāo)準(zhǔn)線性模型在古典假定滿足的情況下,可以使用OLS對(duì)模型進(jìn)行估計(jì)。2/3/20235山東財(cái)經(jīng)大學(xué)統(tǒng)計(jì)學(xué)院計(jì)量經(jīng)濟(jì)教研室對(duì)于多個(gè)解釋變量的情形,(7.2)式可以擴(kuò)展為(7.3)稱為偏彈性系數(shù)。它度量了在其他變量不變的條件下,被解釋變量y對(duì)于解釋變量的彈性系數(shù)。如著名的柯布—道格拉斯(Cobb—Douglas)生產(chǎn)函數(shù)模型,就是這類模型的一個(gè)典型,我們下面舉例說明。例7-1表7-1列出了抽樣調(diào)查得到的某市19個(gè)規(guī)模以上制造業(yè)企業(yè)的投入產(chǎn)出數(shù)據(jù)。試用回歸分析法分析企業(yè)產(chǎn)出中各要素的貢獻(xiàn)及其特點(diǎn)。2/3/20236山東財(cái)經(jīng)大學(xué)統(tǒng)計(jì)學(xué)院計(jì)量經(jīng)濟(jì)教研室企業(yè)產(chǎn)值Q(萬元)職工數(shù)L(人)固定資產(chǎn)K(萬元)大華1291.878742051.92麒麟1347.058952151.3雙劍1399.69172250.21衡麓1505.119572370.26六合1578.979532488.97春風(fēng)1652.869662606.61聯(lián)華1784.9110332754.66太岳1994.5710982953.78東海2123.2311753157.15荷佳2269.7711523376.42博世2411.9411543635.99科維2608.8112073918.47梅花2774.9812304223.82綠源2965.312964550.49人和3067.1213344846.77花都3290.313745205.33金鼎3540.5715925615.31謙祥3749.7714156098.25表7-1某市19個(gè)規(guī)模以上制造業(yè)企業(yè)的投入產(chǎn)出數(shù)據(jù)2/3/20237山東財(cái)經(jīng)大學(xué)統(tǒng)計(jì)學(xué)院計(jì)量經(jīng)濟(jì)教研室用EViews建立雙對(duì)數(shù)模型,回歸結(jié)果如下:樣本回歸方程為:DependentVariable:LOG(Q)Method:LeastSquaresIncludedobservations:19afteradjustmentsVariableCoefficientStd.Errort-StatisticProb.

C-1.5452110.590710-2.6158550.0187LOG(L)0.3397010.1889871.7974790.0912LOG(K)0.8419100.0951418.8491220.0000

R-squared0.994499

Meandependentvar7.651499

AdjustedR-squared0.993811

S.D.dependentvar0.365836

S.E.ofregression0.028780

Akaikeinfocriterion-4.114328

Sumsquaredresid0.013253

Schwarzcriterion-3.965206

Loglikelihood42.08611

F-statistic1446.223

Durbin-Watsonstat0.432115Prob(F-statistic)0.0000002/3/20238山東財(cái)經(jīng)大學(xué)統(tǒng)計(jì)學(xué)院計(jì)量經(jīng)濟(jì)教研室對(duì)樣本回歸方程解釋如下:斜率系數(shù)0.3397表示產(chǎn)出對(duì)勞動(dòng)投入的彈性,即表明在資本投入保持不變的條件下,勞動(dòng)投入每增加一個(gè)百分點(diǎn),平均產(chǎn)出將增加0.3397個(gè)百分點(diǎn)。同樣地,在勞動(dòng)投入保持不變的條件下,資本投入每增加一個(gè)百分點(diǎn),產(chǎn)出將平均增加0.8419個(gè)百分點(diǎn)。兩個(gè)彈性系數(shù)相加為規(guī)模報(bào)酬系數(shù),其數(shù)值大于1,表明該市經(jīng)濟(jì)的特征很可能是規(guī)模報(bào)酬遞增的(如果數(shù)值等于1,屬于規(guī)模報(bào)酬不變;小于1,則屬于規(guī)模報(bào)酬遞減)。2/3/20239山東財(cái)經(jīng)大學(xué)統(tǒng)計(jì)學(xué)院計(jì)量經(jīng)濟(jì)教研室根據(jù)單邊檢驗(yàn)的結(jié)果,這兩個(gè)系數(shù)各自均是統(tǒng)計(jì)顯著的(這是用單邊檢驗(yàn),即,因?yàn)槲覀冾A(yù)期勞動(dòng)力和資本對(duì)產(chǎn)出影響都是正向的),模型的F值也是高度顯著的(因?yàn)閜rob=0.0000),因此能夠拒絕零假設(shè):勞動(dòng)力與資本對(duì)產(chǎn)出無影響。R2值為0.995,表明勞動(dòng)力和資本(對(duì)數(shù))的變動(dòng)解釋了大約99.5%的產(chǎn)出(對(duì)數(shù))的變動(dòng),說明了模型很好地?cái)M合了樣本數(shù)據(jù)。

2/3/202310山東財(cái)經(jīng)大學(xué)統(tǒng)計(jì)學(xué)院計(jì)量經(jīng)濟(jì)教研室(二)半對(duì)數(shù)函數(shù)模型線性模型與對(duì)數(shù)函數(shù)模型的混合就是半對(duì)數(shù)模型(Semi-logModels)。因變量是對(duì)數(shù)形式(對(duì)數(shù)-線性模型):

(7.4)

解釋變量是對(duì)數(shù)形式(線性-對(duì)數(shù)模型):

(7.5)

這兩個(gè)模型的參數(shù)是以線性形式出現(xiàn)的,雖然原變量之間是非線性的,但被解釋(解釋)變量的對(duì)數(shù)與解釋(被解釋)變量之間是線性關(guān)系,因此,半對(duì)數(shù)函數(shù)模型可以很容易地轉(zhuǎn)換成線性模型,并使用OLS估計(jì)參數(shù)。2/3/202311山東財(cái)經(jīng)大學(xué)統(tǒng)計(jì)學(xué)院計(jì)量經(jīng)濟(jì)教研室對(duì)于半對(duì)數(shù)模型(7.4),顯然有可見,表示x每變化一個(gè)相對(duì)單位(變動(dòng)率)對(duì)應(yīng)的y的平均絕對(duì)變動(dòng)量,所以,半對(duì)數(shù)函數(shù)模型又稱增長(zhǎng)率模型。(7.4)常用于度量由解釋變量相對(duì)變動(dòng)率導(dǎo)致的被解釋變量平均變動(dòng)的絕對(duì)數(shù)量;(7.5)常用于度量由解釋變量絕對(duì)量變化導(dǎo)致的被解釋變量的平均相對(duì)變動(dòng)率。兩個(gè)模型中的斜率系數(shù)又被稱為半彈性(Semi-elasticity)系數(shù)。2/3/202312山東財(cái)經(jīng)大學(xué)統(tǒng)計(jì)學(xué)院計(jì)量經(jīng)濟(jì)教研室二、雙曲線模型形如的模型,稱為雙曲線模型(Double-curveModel)。該模型刻畫了

y與x的反向變動(dòng)關(guān)系,其顯著特點(diǎn)是隨著x的無限增大(即1/x接近于零),

y趨近于。令,原模型可化為線性形式即可用OLS的方法進(jìn)行估計(jì)。菲利普斯曲線(PhillipsCurve)就是這個(gè)模型在經(jīng)濟(jì)分析中應(yīng)用的典型體現(xiàn)。菲利普斯曲線刻畫了通貨膨脹率與失業(yè)率的反向變動(dòng)關(guān)系,如圖7-1。2/3/202313山東財(cái)經(jīng)大學(xué)統(tǒng)計(jì)學(xué)院計(jì)量經(jīng)濟(jì)教研室失業(yè)率與通貨膨脹率負(fù)向相關(guān),同時(shí)通貨膨脹率變化有一個(gè)漸近底限。當(dāng)失業(yè)率x趨于無窮大時(shí),通貨膨脹率y將取漸近值。0失業(yè)率菲利普斯曲線2/3/202314山東財(cái)經(jīng)大學(xué)統(tǒng)計(jì)學(xué)院計(jì)量經(jīng)濟(jì)教研室三、多項(xiàng)式函數(shù)模型

多項(xiàng)式回歸模型(PolynomialRegressionModel)在生產(chǎn)與成本函數(shù)分析中被廣泛地使用。如果用y表示成本,x表示產(chǎn)出,則可以建立以下多項(xiàng)式模型,體現(xiàn)微觀經(jīng)濟(jì)分析中的二者關(guān)系:總成本(TC):邊際成本(MC)和平均成本(AC)的PRF為:(7.8)即總體回歸函數(shù)(PRF)為:2/3/202315山東財(cái)經(jīng)大學(xué)統(tǒng)計(jì)學(xué)院計(jì)量經(jīng)濟(jì)教研室產(chǎn)出x成本y產(chǎn)出x成本yMCTCAC成本曲線如果模型的解釋變量為時(shí)間變量t,多項(xiàng)式函數(shù)模型又稱為曲線回歸模型,常常用于對(duì)非線性長(zhǎng)期趨勢(shì)的擬合。有時(shí)為了反映自變量之間的交互影響,也需要用到多項(xiàng)式回歸模型。2/3/202316山東財(cái)經(jīng)大學(xué)統(tǒng)計(jì)學(xué)院計(jì)量經(jīng)濟(jì)教研室如以y、x、z分別表示單位面積上的糧食產(chǎn)量、施肥量和灌溉用水量。由于施肥量和灌溉用水量對(duì)糧食產(chǎn)量的效應(yīng)之間存在交互影響,所以,可以建立以下模型:施肥量x對(duì)糧食產(chǎn)量y的總邊際影響是:是施肥量對(duì)糧食產(chǎn)量的直接效應(yīng)(假定灌溉用水量不變),是施肥量對(duì)糧食產(chǎn)量的間接效應(yīng),隨灌溉用水量的不同而變化,說明肥效的發(fā)揮取決于灌溉用水的多少。同樣,灌溉用水z對(duì)糧食產(chǎn)量y的總邊際影響也可以這樣分解。顯然,該模型比單純的二元回歸模型更符合實(shí)際情況。2/3/202317山東財(cái)經(jīng)大學(xué)統(tǒng)計(jì)學(xué)院計(jì)量經(jīng)濟(jì)教研室例7-2表7-3給出了某市16個(gè)企業(yè)的產(chǎn)品產(chǎn)量(x)與單位產(chǎn)品成本(y)的抽樣調(diào)查數(shù)據(jù)。試研究二者的依存關(guān)系。企業(yè)序號(hào)產(chǎn)品產(chǎn)量(噸)x單位產(chǎn)品成本(元/噸)y企業(yè)序號(hào)產(chǎn)品產(chǎn)量(噸)x單位產(chǎn)品成本(元/噸)y143034629602310824103433106193068343232751175630514501315112738300755523108136953068656530761464730347588314615635298186653057167882962企業(yè)產(chǎn)品產(chǎn)量與單位產(chǎn)品成本數(shù)據(jù)2/3/202318山東財(cái)經(jīng)大學(xué)統(tǒng)計(jì)學(xué)院計(jì)量經(jīng)濟(jì)教研室根據(jù)規(guī)模經(jīng)濟(jì)的原理,產(chǎn)品產(chǎn)量是單位產(chǎn)品成本變化的原因。為了明確二者的具體關(guān)系類型,使用EViews的Graph功能,繪制散點(diǎn)圖如下:2/3/202319山東財(cái)經(jīng)大學(xué)統(tǒng)計(jì)學(xué)院計(jì)量經(jīng)濟(jì)教研室顯然,二者的關(guān)系不是線性關(guān)系??晒┻x擇的模型有以下兩種:雙曲線模型:半對(duì)數(shù)模型:分別擬合兩種模型,回歸結(jié)果整理如下:模型的估計(jì)值與t檢驗(yàn)值的估計(jì)值與t檢驗(yàn)值R2AICSCt檢驗(yàn)值t檢驗(yàn)值雙曲線半對(duì)數(shù)2489.77247.833.4413.18367183.6-646.28.70-7.510.840.8011.1411.3811.2311.48雙曲線模型和冪函數(shù)模型的系數(shù)均通過了顯著性檢驗(yàn),但前者無論是R2還是AIC、SC均好于后者,所以,最終的模型應(yīng)為雙曲線模型:2/3/202320山東財(cái)經(jīng)大學(xué)統(tǒng)計(jì)學(xué)院計(jì)量經(jīng)濟(jì)教研室該回歸結(jié)果說明,單位產(chǎn)品成本隨產(chǎn)量的上升而下降,當(dāng)產(chǎn)品產(chǎn)量趨近于無窮大時(shí),單位產(chǎn)品成本趨近于2489.7元/噸,這就是單位產(chǎn)品成本的理論最低值(實(shí)際上是可變成本部分)。四、Box-Cox變換在考察被解釋變量y和解釋變量的關(guān)系時(shí),經(jīng)常用的兩種模型是線性模型和對(duì)數(shù)線性模型事實(shí)上,經(jīng)濟(jì)學(xué)家對(duì)被解釋變量和解釋變量之間的具體的函數(shù)關(guān)系并不是很清楚的。2/3/202321山東財(cái)經(jīng)大學(xué)統(tǒng)計(jì)學(xué)院計(jì)量經(jīng)濟(jì)教研室由博克斯和考克斯(Box,Cox,1964)引進(jìn)的Box-Cox變換對(duì)于利用樣本數(shù)據(jù)確定函數(shù)形式非常有益的。對(duì)一種關(guān)系中的所有變量進(jìn)行某個(gè)變換就會(huì)得到一個(gè)由變換參數(shù)決定的函數(shù)族,線性和對(duì)數(shù)線性關(guān)系是這個(gè)函數(shù)族中的兩個(gè)特例。函數(shù)形式最終由估計(jì)的變換參數(shù)值確定。我們考慮變量z的下列Box-Cox變換:

時(shí),;時(shí),;時(shí),,……。2/3/202322山東財(cái)經(jīng)大學(xué)統(tǒng)計(jì)學(xué)院計(jì)量經(jīng)濟(jì)教研室對(duì)某個(gè)特殊的關(guān)系式的所有變量都進(jìn)行Box-Cox變換可得到下列模型時(shí),這個(gè)模型就是雙對(duì)數(shù)模型(7.13)。時(shí),可得即它和線性模型(7.12)是等價(jià)的。對(duì)于其它的的值,確定其它的函數(shù)形式。

2/3/202323山東財(cái)經(jīng)大學(xué)統(tǒng)計(jì)學(xué)院計(jì)量經(jīng)濟(jì)教研室也可以進(jìn)行更一般的變換,它就是每個(gè)變量的變換參數(shù)不一樣。此時(shí)變換后得到的模型為可能有些變量以線性的形式出現(xiàn)(,有些變量以對(duì)數(shù)的形式出現(xiàn)(,有些變量以倒數(shù)的形式出現(xiàn)(,等等。這樣得到的函數(shù)族更大些,但是它也給我們估計(jì)參數(shù)帶來困難。接下來,我們需要做的事情就是利用樣本數(shù)據(jù)估計(jì)變換參數(shù)或()以及,得到估計(jì)的函數(shù)形式。一般采用極大似然估計(jì)方法估計(jì)參數(shù),在此不展開討論。2/3/202324山東財(cái)經(jīng)大學(xué)統(tǒng)計(jì)學(xué)院計(jì)量經(jīng)濟(jì)教研室五、小結(jié)計(jì)量經(jīng)濟(jì)模型設(shè)定的重要方面是要使所設(shè)定的變量間函數(shù)形式能夠體現(xiàn)變量間的基本關(guān)系??傮w回歸模型是對(duì)總體回歸函數(shù)的描述,總體回歸函數(shù)正是計(jì)量經(jīng)濟(jì)要去估計(jì)的目標(biāo)。但其真實(shí)的函數(shù)形式事先并不知道。所謂模型函數(shù)形式的設(shè)定,是指根據(jù)對(duì)變量間相互關(guān)系的已有認(rèn)識(shí),把y的條件期望設(shè)定為解釋變量x的某種函數(shù)??傮w條件期望函數(shù),可以設(shè)定為各種具體的函數(shù)形式。在計(jì)量經(jīng)濟(jì)學(xué)的實(shí)踐中,通常把總體回歸函數(shù)的具體函數(shù)形式設(shè)定為初等函數(shù),應(yīng)當(dāng)注意的是不同函數(shù)形式中參數(shù)的經(jīng)濟(jì)意義有較大差異。常用的函數(shù)形式見課本P217表7-5(課件略)。2/3/202325山東財(cái)經(jīng)大學(xué)統(tǒng)計(jì)學(xué)院計(jì)量經(jīng)濟(jì)教研室大多數(shù)模型中,邊際和彈性系數(shù)為變量,其大小取決于具體樣本點(diǎn)自變量或(和)因變量的取值。在實(shí)際應(yīng)用時(shí),一般用代替具體的計(jì)算,得到的是平均的邊際效應(yīng)或彈性系數(shù)。2/3/202326山東財(cái)經(jīng)大學(xué)統(tǒng)計(jì)學(xué)院計(jì)量經(jīng)濟(jì)教研室第三節(jié)虛擬變量虛擬變量含義虛擬解釋變量的回歸分類變量表現(xiàn)為多種狀態(tài)2/3/202327山東財(cái)經(jīng)大學(xué)統(tǒng)計(jì)學(xué)院計(jì)量經(jīng)濟(jì)教研室迄今為止,本教材涉及的變量都是數(shù)值變量,諸如市場(chǎng)需求量、商品的價(jià)格、收入、產(chǎn)量等;但我們?cè)诮r(shí)還經(jīng)常遇到另外一些“變量”,如職業(yè)、性別、地區(qū)、季節(jié)等等。例如,季節(jié)的變化會(huì)對(duì)某些商品的需求量產(chǎn)生影響;性別或者職業(yè)的不同,其收入水平可能會(huì)有很大的差異。再如,當(dāng)研究某一經(jīng)濟(jì)問題時(shí)還可能有些起暫時(shí)作用的“變量”,諸如在某一時(shí)期出現(xiàn)了戰(zhàn)爭(zhēng)、天災(zāi)、人禍等。諸如此類的“變量”都是分類變量,或稱為“非數(shù)值變量”、“定性變量”或“名義變量”。一、虛擬變量

2/3/202328山東財(cái)經(jīng)大學(xué)統(tǒng)計(jì)學(xué)院計(jì)量經(jīng)濟(jì)教研室在計(jì)量經(jīng)濟(jì)建模過程中,有時(shí)候分類變量是不可缺少的。但由于在一般情況它們并不表現(xiàn)為具體的數(shù)值,為了將分類變量引入計(jì)量經(jīng)濟(jì)模型中,需要率先將其數(shù)量化,即轉(zhuǎn)化為所謂的“虛擬變量”(DummyVariable),又被稱為二元變量或二進(jìn)制變量(BinaryVariable),一般用D來表示。

分類變量數(shù)量化的方法是,當(dāng)分類變量起作用時(shí),賦值“D=1”;不起作用時(shí),賦值“D=0”。通過定義虛擬變量,就可以將分類變量等同于數(shù)值變量,引入回歸模型之中。2/3/202329山東財(cái)經(jīng)大學(xué)統(tǒng)計(jì)學(xué)院計(jì)量經(jīng)濟(jì)教研室計(jì)量經(jīng)濟(jì)模型中,虛擬變量可以發(fā)揮多方面的作用:比如,作為屬性因素的代表,如性別、所有制等;可以作為某些非精確計(jì)量的數(shù)量因素的代表,如受教育程度、管理者素質(zhì)等;作為某些偶然因素或政策因素的代表,如戰(zhàn)爭(zhēng)、災(zāi)害、改革前后等;實(shí)現(xiàn)分段回歸,研究斜率、截距的變動(dòng),或比較兩個(gè)回歸模型的結(jié)構(gòu)差異;作為時(shí)間序列分析中季節(jié)(月份)的代表;等等。2/3/202330山東財(cái)經(jīng)大學(xué)統(tǒng)計(jì)學(xué)院計(jì)量經(jīng)濟(jì)教研室在計(jì)量經(jīng)濟(jì)學(xué)中,把包含有虛擬變量的模型稱為虛擬變量模型。常用的虛擬變量模型有三種類型:

1.解釋變量中只包含虛擬變量,作用是在假定其他因素都不變時(shí),只研究分類變量是否使被解釋變量表現(xiàn)出顯著差異;

2.解釋變量中既含數(shù)值變量,又含虛擬變量,研究數(shù)值變量和虛擬變量同時(shí)對(duì)被解釋變量的影響;3.被解釋變量本身為虛擬變量的模型,即被解釋變量本身取值為0或1的模型,適于對(duì)某社會(huì)經(jīng)濟(jì)現(xiàn)象進(jìn)行“是”與“否”的判斷研究。本節(jié)討論前兩種情形。2/3/202331山東財(cái)經(jīng)大學(xué)統(tǒng)計(jì)學(xué)院計(jì)量經(jīng)濟(jì)教研室二、虛擬解釋變量的回歸

在計(jì)量經(jīng)濟(jì)模型中,加入虛擬解釋變量的途徑有兩種基本類型:一是加法類型;二是乘法類型。不同的途徑引入虛擬變量有不同的作用,加法方式引入虛擬變量改變的是模型的截距;乘法方式引入虛擬變量改變的是模型的斜率。(一)用虛擬變量表示不同截距的回歸—加法類型以加法類型引入虛擬解釋變量的模型,虛擬解釋變量與其他解釋變量是相加關(guān)系;從計(jì)量經(jīng)濟(jì)模型的意義看,其作用是改變了設(shè)定模型的截距水平。比如:2/3/202332山東財(cái)經(jīng)大學(xué)統(tǒng)計(jì)學(xué)院計(jì)量經(jīng)濟(jì)教研室例

:研究性別與收入(yi)的關(guān)系:我們可以定義虛擬變量Di,Di=0時(shí)表示女性,Di=1時(shí)表示男性,即:對(duì)于線性回歸模型(7.18),若假設(shè)H0:β1=0成立,則說明收入與性別將沒有太大關(guān)系;若假設(shè)H0:β1=0不成立,則說明收入與性別有關(guān)。

以加法類型引入虛擬變量時(shí),分為兩種情形:解釋變量只有分類變量而無數(shù)值變量;解釋變量既有數(shù)值變量又有分類變量。1.解釋變量只有分類變量而無數(shù)值變量的回歸2/3/202333山東財(cái)經(jīng)大學(xué)統(tǒng)計(jì)學(xué)院計(jì)量經(jīng)濟(jì)教研室例7-4研究學(xué)歷與收入(yi)的關(guān)系:可以建立如下模型:2/3/202334山東財(cái)經(jīng)大學(xué)統(tǒng)計(jì)學(xué)院計(jì)量經(jīng)濟(jì)教研室表7-6為從某城市隨機(jī)獲取的10名職工的學(xué)歷情況與最初參加工作時(shí)的起薪。試建立樣本回歸模型。起薪(元)教育(1=大學(xué),0=非大學(xué))起薪(元)教育(1=大學(xué),0=非大學(xué))2300150014002100250010011170013009001700220001001表7-6起薪與受教育程度數(shù)據(jù)2/3/202335山東財(cái)經(jīng)大學(xué)統(tǒng)計(jì)學(xué)院計(jì)量經(jīng)濟(jì)教研室由結(jié)果可知,對(duì)應(yīng)的t檢驗(yàn)值為2.3,在統(tǒng)計(jì)上顯著,說明學(xué)歷對(duì)收入有著顯著的影響,即說明受教育水平不同的兩類人群的起薪是不同的。由方程可得,大學(xué)畢業(yè)的起薪均值為2080元,而非大學(xué)畢業(yè)的起薪均值為1440元,前者比后者高出640元(的系數(shù))。最小二乘估計(jì)結(jié)果:2/3/202336山東財(cái)經(jīng)大學(xué)統(tǒng)計(jì)學(xué)院計(jì)量經(jīng)濟(jì)教研室因?yàn)檫@種案例實(shí)際上是不同組別的均值比較,可以通過方差分析完成,這種情況的模型又被稱為方差分析模型。該例的excel方差分析結(jié)果如表7-7:組觀測(cè)數(shù)求和平均方差非大學(xué)572001440108000大學(xué)5104002080212000方差分析差異源SSdfMSFP-valueFcrit組間1024000110240006.40.0352655.317655組內(nèi)12800008160000總計(jì)23040009

表7-7excel方差分析輸出結(jié)果2/3/202337山東財(cái)經(jīng)大學(xué)統(tǒng)計(jì)學(xué)院計(jì)量經(jīng)濟(jì)教研室2.解釋變量同時(shí)包含常規(guī)數(shù)值變量和虛擬變量的回歸例如,我們認(rèn)為,某個(gè)企業(yè)工人的月工資(y)與工作崗位類型(分為一般崗位和特殊崗位)有關(guān),也與工作年限(x)有關(guān)。回歸模型如下:(7.19)其中崗位類型用虛擬變量表示:于是有2/3/202338山東財(cái)經(jīng)大學(xué)統(tǒng)計(jì)學(xué)院計(jì)量經(jīng)濟(jì)教研室因而可以看出(7.19)實(shí)際上是兩條截距不同、斜率相同的直線的組合,如圖7-4。這里斜率相同是在模型設(shè)定時(shí)隱含的假定。xy在的假設(shè)下,用t檢驗(yàn),可以進(jìn)行工作崗位不同狀態(tài)時(shí)月工資是否存在差異的檢驗(yàn)。2/3/202339山東財(cái)經(jīng)大學(xué)統(tǒng)計(jì)學(xué)院計(jì)量經(jīng)濟(jì)教研室(二)用虛擬變量表示不同斜率的回歸——乘法類型以乘法類型引入虛擬解釋變量,是在所設(shè)定的計(jì)量經(jīng)濟(jì)模型中,將虛擬解釋變量與其他解釋變量相乘作為解釋變量,以表示模型中斜率系數(shù)的差異。以乘法類型引入虛擬解釋變量,可以進(jìn)行兩個(gè)回歸模型的比較、進(jìn)行因素間的交互影響分析和提高模型對(duì)現(xiàn)實(shí)經(jīng)濟(jì)現(xiàn)象的描述精度。1.回歸模型的比較——結(jié)構(gòu)變化檢驗(yàn)以加法類型引入虛擬解釋變量,分類變量?jī)H影響不同類型模型截距項(xiàng),但是在現(xiàn)實(shí)經(jīng)濟(jì)生活中,分類變量也可能導(dǎo)致模型的斜率系數(shù)發(fā)生變化。2/3/202340山東財(cái)經(jīng)大學(xué)統(tǒng)計(jì)學(xué)院計(jì)量經(jīng)濟(jì)教研室例如,隨著可支配收入水平的提高,城鄉(xiāng)居民的消費(fèi)結(jié)構(gòu)將出現(xiàn)較大的差異,這種差異會(huì)表現(xiàn)在分類變量(如城鄉(xiāng)、職業(yè))對(duì)斜率的影響上。這類問題可歸結(jié)于兩個(gè)回歸模型的比較。例如,在研究城鄉(xiāng)之間儲(chǔ)蓄——收入總量關(guān)系時(shí),所設(shè)定的模型為:城市:i代表城市居民家庭(7.21)

農(nóng)村:j代表農(nóng)村居民家庭(7.22)

其中,y為儲(chǔ)蓄總額(億元),x為收入總額(億元),

u為隨機(jī)擾動(dòng)項(xiàng)。2/3/202341山東財(cái)經(jīng)大學(xué)統(tǒng)計(jì)學(xué)院計(jì)量經(jīng)濟(jì)教研室如果我們分別將式(7.21)和式(7.22)對(duì)不同的人群作回歸,則可能得到以下四種結(jié)果:(1)表明這兩個(gè)回歸模型是相同的,或稱為重合回歸;(2)表明這兩個(gè)回歸模型僅在位置水平上(即截距水平上)存在差異,或稱為平行回歸;(3)表明這兩個(gè)回歸模型具有相同的位置水平(或起點(diǎn)相同)而變化速率不等,或稱為共點(diǎn)回歸;(4)表明這兩個(gè)回歸模型完全不相同,或稱為不同的回歸。2/3/202342山東財(cái)經(jīng)大學(xué)統(tǒng)計(jì)學(xué)院計(jì)量經(jīng)濟(jì)教研室以上四種情形可用圖示法描述(見圖7-5):儲(chǔ)蓄收入11儲(chǔ)蓄收入1(a)重合回歸(b)平行回歸2/3/202343山東財(cái)經(jīng)大學(xué)統(tǒng)計(jì)學(xué)院計(jì)量經(jīng)濟(jì)教研室11儲(chǔ)蓄收入

(d)不同的回歸(c)共點(diǎn)回歸11儲(chǔ)蓄收入2/3/202344山東財(cái)經(jīng)大學(xué)統(tǒng)計(jì)學(xué)院計(jì)量經(jīng)濟(jì)教研室現(xiàn)在的問題是,當(dāng)我們運(yùn)用樣本數(shù)據(jù)對(duì)模型(7.21)和模型(7.22)進(jìn)行回歸后,如何界定所得結(jié)果在統(tǒng)計(jì)意義上屬于哪一種類型呢?這時(shí)可采用以乘法類型引入虛擬變量的方法,將模型(7.21)和模型(7.22)連接為一個(gè)模型:(7.23)其中,y為儲(chǔ)蓄總額(億元),x為收入總額(億元),

u為隨機(jī)擾動(dòng)項(xiàng),D為虛擬變量。顯然在式(7.23)中,以乘法類型引入了虛擬變量所形成的解釋變量為,以加法形式引入虛擬變量所形成的解釋變量是。2/3/202345山東財(cái)經(jīng)大學(xué)統(tǒng)計(jì)學(xué)院計(jì)量經(jīng)濟(jì)教研室假如根據(jù)100個(gè)居民家庭調(diào)查數(shù)據(jù),對(duì)(7.23)式用OLS法估計(jì)得結(jié)果表明,截距和斜率差異系數(shù)、在統(tǒng)計(jì)意義下均為顯著的,說明城鄉(xiāng)之間的儲(chǔ)蓄——收入行為確實(shí)不相同。即農(nóng)村家庭(Di=0):城市家庭(Di=1):即2/3/202346山東財(cái)經(jīng)大學(xué)統(tǒng)計(jì)學(xué)院計(jì)量經(jīng)濟(jì)教研室以乘法類型引入虛擬變量作回歸模型的比較和結(jié)構(gòu)變化檢驗(yàn)有一些優(yōu)點(diǎn):(1)用一個(gè)回歸替代了多個(gè)回歸,簡(jiǎn)化了分析過程;(2)可以方便地對(duì)模型結(jié)構(gòu)的差異作各種假設(shè)檢驗(yàn);(3)合并了的回歸增加了自由度,提高了參數(shù)估計(jì)的精確性。但是,也應(yīng)注意合并后模型的應(yīng)服從基本假定,特別是所比較的方程的方差應(yīng)相同(如城鄉(xiāng)之間),否則會(huì)出現(xiàn)異方差問題,需要用WLS法進(jìn)行校正。

2/3/202347山東財(cái)經(jīng)大學(xué)統(tǒng)計(jì)學(xué)院計(jì)量經(jīng)濟(jì)教研室2.交互效應(yīng)分析

當(dāng)分析解釋變量對(duì)被解釋變量的影響時(shí),不僅要分析解釋變量自身變動(dòng)對(duì)被解釋變量的影響作用,而且還要深入分析解釋變量間的相互作用對(duì)被解釋變量的影響。在實(shí)際經(jīng)濟(jì)活動(dòng)中,兩個(gè)分類變量對(duì)被解釋變量的影響可能存在一定的交互作用,即一個(gè)解釋變量的邊際效應(yīng)有時(shí)可能要依賴于另一個(gè)解釋變量。為描述這種交互作用,可以把兩個(gè)虛擬變量的乘積以加法形式引入模型。2/3/202348山東財(cái)經(jīng)大學(xué)統(tǒng)計(jì)學(xué)院計(jì)量經(jīng)濟(jì)教研室考慮下列模型:(7.24)其中,為農(nóng)副產(chǎn)品生產(chǎn)總收益;為農(nóng)副產(chǎn)品生產(chǎn)投入;為代表油菜籽生產(chǎn)虛擬變量;為代表養(yǎng)蜂生產(chǎn)虛擬變量。

顯然(7.24)式描述了是否發(fā)展油菜籽生產(chǎn)與是否發(fā)展養(yǎng)蜂生產(chǎn)的差異對(duì)農(nóng)副產(chǎn)品總收益的影響。虛擬解釋變量和是以加法類型引入的,那么暗含著假設(shè):油菜籽生產(chǎn)和養(yǎng)蜂生產(chǎn)是分別獨(dú)立地影響農(nóng)副品生產(chǎn)總收益。2/3/202349山東財(cái)經(jīng)大學(xué)統(tǒng)計(jì)學(xué)院計(jì)量經(jīng)濟(jì)教研室在發(fā)展油菜籽生產(chǎn)時(shí),同時(shí)也發(fā)展養(yǎng)蜂生產(chǎn),所取得的農(nóng)副產(chǎn)品生產(chǎn)總收益,可能會(huì)高于不發(fā)展養(yǎng)蜂生產(chǎn)的情況。即在是否發(fā)展油菜籽生產(chǎn)與養(yǎng)蜂生產(chǎn)的虛擬變量和間,很可能存在著一定的交互作用,且這種交互影響對(duì)被解釋變量農(nóng)副產(chǎn)品生產(chǎn)收益會(huì)有影響。為了描述交互作用對(duì)被解釋變量的效應(yīng),在(7.24)式中以加法形式引入兩個(gè)虛擬解釋變量的乘積,即(7.25)(7.25)式中各變量的含義與(7.24)式相同。2/3/202350山東財(cái)經(jīng)大學(xué)統(tǒng)計(jì)學(xué)院計(jì)量經(jīng)濟(jì)教研室基礎(chǔ)類型:為不發(fā)展油菜籽生產(chǎn),也不發(fā)展養(yǎng)蜂生產(chǎn)時(shí)農(nóng)副產(chǎn)品生產(chǎn)的平均總收益

(7.26)對(duì)比類型:為同時(shí)發(fā)展油菜籽生產(chǎn)和養(yǎng)蜂生產(chǎn)時(shí),農(nóng)副產(chǎn)品生產(chǎn)的平均總收益(7.27)這里的截距水平由四項(xiàng)組成,其中:為是否發(fā)展油菜籽生產(chǎn)對(duì)農(nóng)副產(chǎn)品生產(chǎn)總收益的截距差異系數(shù);為是否發(fā)展養(yǎng)蜂生產(chǎn)對(duì)農(nóng)副產(chǎn)品生產(chǎn)總收益的截距差異系數(shù);為同時(shí)發(fā)展油菜籽生產(chǎn)和養(yǎng)蜂生產(chǎn)時(shí)對(duì)農(nóng)副產(chǎn)品生產(chǎn)總收益的交互效應(yīng)系數(shù)。2/3/202351山東財(cái)經(jīng)大學(xué)統(tǒng)計(jì)學(xué)院計(jì)量經(jīng)濟(jì)教研室關(guān)于交互效應(yīng)是否存在,可借助于交互效應(yīng)虛擬解釋變量系數(shù)的顯著性檢驗(yàn)來加以判斷。如果t檢驗(yàn)表明交互效應(yīng)虛擬變量在統(tǒng)計(jì)意義上是顯著的,則說明交互效應(yīng)對(duì)存在顯著影響。3.分段線性回歸

有的社會(huì)經(jīng)濟(jì)現(xiàn)象的變動(dòng),會(huì)在解釋變量達(dá)到某個(gè)臨界值時(shí)發(fā)生突變,為了區(qū)分不同階段的截距和斜率可利用虛擬變量進(jìn)行分段回歸。例如,某公司為了激勵(lì)公司銷售人員,按其銷售額的一定比例計(jì)提獎(jiǎng)勵(lì),但是銷售額在某一目標(biāo)水平以下和以上時(shí)計(jì)提獎(jiǎng)勵(lì)的方法不同。2/3/202352山東財(cái)經(jīng)大學(xué)統(tǒng)計(jì)學(xué)院計(jì)量經(jīng)濟(jì)教研室當(dāng)銷售額高于時(shí),計(jì)提獎(jiǎng)勵(lì)額與銷售額的比例要高于銷售額低于時(shí)的比例,也就是高于時(shí),獎(jiǎng)勵(lì)額與銷售額的線性關(guān)系更為陡峭(如圖7-6所示)。為了確切地描述獎(jiǎng)勵(lì)額度(y)與銷售額(x)間的關(guān)系,需要分兩段進(jìn)行回歸。這種分段回歸可以用虛擬變量來實(shí)現(xiàn)。ⅠⅡ0圖7-6獎(jiǎng)勵(lì)額與銷售額的關(guān)系2/3/202353山東財(cái)經(jīng)大學(xué)統(tǒng)計(jì)學(xué)院計(jì)量經(jīng)濟(jì)教研室設(shè)虛擬變量D為:則獎(jiǎng)勵(lì)額度()和銷售額()間的關(guān)系式可以統(tǒng)一地表示為:(7.28)為獎(jiǎng)勵(lì)額,為銷售額,為已知的銷售目標(biāo)臨界水平。利用統(tǒng)計(jì)資料估計(jì)(7.28)式的參數(shù),就可以得到不同斜率和截距的回歸方程:銷售額低于時(shí):銷售額不低于:2/3/202354山東財(cái)經(jīng)大學(xué)統(tǒng)計(jì)學(xué)院計(jì)量經(jīng)濟(jì)教研室是圖7-6中第Ⅰ段回歸直線的斜率,而則是第Ⅱ段回歸直線的斜率。只要檢驗(yàn)的統(tǒng)計(jì)顯著性,就可以判斷在所設(shè)定的臨界水平處是否存在著“突變”。應(yīng)當(dāng)注意,在分段回歸中,第一、二段回歸不僅截距不同,而且斜率也不同。在分為兩段回歸時(shí),使用了一個(gè)虛擬變量,容易推廣,分為k段回歸時(shí),可用

k

-1個(gè)虛擬變量。2/3/202355山東財(cái)經(jīng)大學(xué)統(tǒng)計(jì)學(xué)院計(jì)量經(jīng)濟(jì)教研室三、分類變量表現(xiàn)為多種狀態(tài)上面討論的定性(分類)變量其表現(xiàn)的狀態(tài)僅有兩種情況,如性別僅表現(xiàn)為男性和女性,學(xué)歷僅區(qū)分為“大學(xué)”和“非大學(xué)”。

但有時(shí)分類變量可表現(xiàn)為多種狀態(tài),如文化程度可區(qū)分為大學(xué)、中學(xué)、小學(xué)、文盲四種狀態(tài),省份分為東部、中部和西部三種狀態(tài),等等。

含此類分類變量模型的建立,應(yīng)避免犯以下兩類錯(cuò)誤:第一,設(shè)置一個(gè)虛擬變量,分別用0,1,2,3,…表示其不同的狀態(tài)。此方法缺陷在于,它在設(shè)定模型時(shí),假定各種狀態(tài)均值之間差量為固定值,這顯然與事實(shí)不符。2/3/202356山東財(cái)經(jīng)大學(xué)統(tǒng)計(jì)學(xué)院計(jì)量經(jīng)濟(jì)教研室第二,設(shè)立與狀態(tài)數(shù)相同個(gè)數(shù)的虛擬變量,分別表示各個(gè)不同狀態(tài)。例如文化程度區(qū)分為大學(xué)、中學(xué)、小學(xué)、文盲四種狀態(tài),如果設(shè)置四個(gè)虛擬變量,即為:

此方法缺陷在于,由于D1+D2+D3+D4=1,如果模型存在常數(shù)項(xiàng),這會(huì)使得多元回歸模型的自變量觀測(cè)值矩陣X不滿秩,產(chǎn)生完全的多重共線性。這類問題稱為“虛擬變量陷阱”(TrapofDummyVariable)。正確的虛擬變量設(shè)置方法是:如分類變量有k種表現(xiàn)狀態(tài),可引入(k-1)個(gè)虛擬變量。

2/3/202357山東財(cái)經(jīng)大學(xué)統(tǒng)計(jì)學(xué)院計(jì)量經(jīng)濟(jì)教研室例7-5科學(xué)家認(rèn)為某種藥用樹種中的藥用成分PDM含量可能隨著植物生長(zhǎng)時(shí)間(樹齡)而增加,而且其基礎(chǔ)含量與種植地的地理環(huán)境有關(guān),但其變化速度與地理環(huán)境無關(guān)。某縣地理單元分為平原、山區(qū)和海島三種。隨機(jī)抽取20棵植株進(jìn)行化驗(yàn),結(jié)果如表7-8所示。據(jù)此驗(yàn)證上述假說。2/3/202358山東財(cái)經(jīng)大學(xué)統(tǒng)計(jì)學(xué)院計(jì)量經(jīng)濟(jì)教研室植株序號(hào)PDM含量(y)樹齡(x)地理單元D1D2D3119.98510平原100232.83912海島001320.5778平原100435.42521山區(qū)010532.83920山區(qū)010631.0005海島001732.94915山區(qū)010836.99816海島001937.10220海島0011024.09230平原1001130.6355海島0011228.60211山區(qū)0101337.77918海島0011435.13522山區(qū)0101520.7363平原1001631.6095海島0011738.05918海島0011838.73029山區(qū)0101922.58819平原1002020.83016平原100表7-8樣本調(diào)查數(shù)據(jù)表2/3/202359山東財(cái)經(jīng)大學(xué)統(tǒng)計(jì)學(xué)院計(jì)量經(jīng)濟(jì)教研室以代表樹齡,代表PDM含量,各地理單元植株中PDM含量隨樹齡增長(zhǎng)率()相同,但基礎(chǔ)含量()不同。如果設(shè)置三個(gè)地理單元的虛擬變量如下科學(xué)家的假定實(shí)際上可以表述為:平原種植山區(qū)種植海島種植2/3/202360山東財(cái)經(jīng)大學(xué)統(tǒng)計(jì)學(xué)院計(jì)量經(jīng)濟(jì)教研室引入地理單元虛擬變量建立如下模型:(7.29)此模型中只引入了代表平原和山區(qū)兩個(gè)地理單元的虛擬變量,分別為和

,代表海島的虛擬變量沒有引進(jìn)。因此有下面的關(guān)系式:即和分別是種植在平原和山區(qū)植株的PDM含量基礎(chǔ)數(shù)值與海島植株相差的數(shù)額。2/3/202361山東財(cái)經(jīng)大學(xué)統(tǒng)計(jì)學(xué)院計(jì)量經(jīng)濟(jì)教研室上述模型的估計(jì)結(jié)果如表7

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論