統(tǒng)計(jì)學(xué)第七章虛擬變量_第1頁(yè)
統(tǒng)計(jì)學(xué)第七章虛擬變量_第2頁(yè)
統(tǒng)計(jì)學(xué)第七章虛擬變量_第3頁(yè)
統(tǒng)計(jì)學(xué)第七章虛擬變量_第4頁(yè)
統(tǒng)計(jì)學(xué)第七章虛擬變量_第5頁(yè)
已閱讀5頁(yè),還剩41頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

統(tǒng)計(jì)學(xué)第七章虛擬變量第一頁(yè),共四十六頁(yè),編輯于2023年,星期三一、虛擬變量的基本含義許多經(jīng)濟(jì)變量是可以定量度量的,如:商品需求量、價(jià)格、收入、產(chǎn)量等。但也有一些影響經(jīng)濟(jì)變量的因素?zé)o法定量度量,如:職業(yè)、性別對(duì)收入的影響,戰(zhàn)爭(zhēng)、自然災(zāi)害對(duì)GDP的影響,季節(jié)對(duì)某些產(chǎn)品(如冷飲)銷(xiāo)售的影響等等。為了在模型中能夠反映這些因素的影響,并提高模型的精度,需要將它們“量化”。第二頁(yè),共四十六頁(yè),編輯于2023年,星期三這種“量化”通常是通過(guò)引入“虛擬變量”來(lái)完成的。根據(jù)這些因素的屬性類(lèi)型,構(gòu)造只取“0”或“1”的人工變量,通常稱(chēng)為虛擬變量(dummyvariables),記為D。例如,反映文化程度的虛擬變量可取為:

1,本科學(xué)歷

D=0,非本科學(xué)歷第三頁(yè),共四十六頁(yè),編輯于2023年,星期三

一般地,在虛擬變量的設(shè)置中:基礎(chǔ)類(lèi)型、肯定類(lèi)型取值為1;比較類(lèi)型,否定類(lèi)型取值為0。第四頁(yè),共四十六頁(yè),編輯于2023年,星期三概念:同時(shí)含有一般解釋變量與虛擬變量的模型稱(chēng)為虛擬變量模型或者方差分析(analysis-ofvariance:ANOVA)模型。一個(gè)以性別為虛擬變量考察企業(yè)職工薪金的模型:其中:Yi為企業(yè)職工的薪金,Xi為工齡,Di=1,若是男性,Di=0,若是女性。第五頁(yè),共四十六頁(yè),編輯于2023年,星期三二、虛擬變量的引入虛擬變量做為解釋變量引入模型有兩種基本方式:加法方式和乘法方式。上述企業(yè)職工薪金模型中性別虛擬變量的引入采取了加法方式。在該模型中,如果仍假定E(i)=0,則

企業(yè)女職工的平均薪金為:1.加法方式第六頁(yè),共四十六頁(yè),編輯于2023年,星期三

企業(yè)男職工的平均薪金為:幾何意義:假定2>0,則兩個(gè)函數(shù)有相同的斜率,但有不同的截距。意即,男女職工平均薪金對(duì)工齡的變化率是一樣的,但兩者的平均薪金水平相差2。第七頁(yè),共四十六頁(yè),編輯于2023年,星期三可以通過(guò)傳統(tǒng)的回歸檢驗(yàn),對(duì)2的統(tǒng)計(jì)顯著性進(jìn)行檢驗(yàn),以判斷企業(yè)男女職工的平均薪金水平是否有顯著差異。02第八頁(yè),共四十六頁(yè),編輯于2023年,星期三

又例:在橫截面數(shù)據(jù)基礎(chǔ)上,考慮個(gè)人保健支出對(duì)個(gè)人收入和教育水平的回歸。教育水平考慮三個(gè)層次:高中以下,高中,大學(xué)及其以上。這時(shí)需要引入兩個(gè)虛擬變量:第九頁(yè),共四十六頁(yè),編輯于2023年,星期三模型可設(shè)定如下:

在E(i)=0的初始假定下,高中以下、高中、大學(xué)及其以上教育水平下個(gè)人保健支出的函數(shù):高中以下:第十頁(yè),共四十六頁(yè),編輯于2023年,星期三高中:大學(xué)及其以上:假定3>2,其幾何意義:第十一頁(yè),共四十六頁(yè),編輯于2023年,星期三還可將多個(gè)虛擬變量引入模型中以考察多種“定性”因素的影響。

如在上述職工薪金的例中,再引入代表學(xué)歷的虛擬變量D2:本科及以上學(xué)歷本科以下學(xué)歷職工薪金的回歸模型可設(shè)計(jì)為:第十二頁(yè),共四十六頁(yè),編輯于2023年,星期三女職工本科以下學(xué)歷的平均薪金:女職工本科以上學(xué)歷的平均薪金:于是,不同性別、不同學(xué)歷職工的平均薪金分別為:男職工本科以下學(xué)歷的平均薪金:男職工本科以上學(xué)歷的平均薪金:第十三頁(yè),共四十六頁(yè),編輯于2023年,星期三2.乘法方式加法方式引入虛擬變量,考察:截距的不同。許多情況下:往往是斜率就有變化,或斜率、截距同時(shí)發(fā)生變化。斜率的變化可通過(guò)以乘法的方式引入虛擬變量來(lái)測(cè)度。第十四頁(yè),共四十六頁(yè),編輯于2023年,星期三例:根據(jù)消費(fèi)理論,消費(fèi)水平C主要取決于收入水平Y(jié),但在一個(gè)較長(zhǎng)的時(shí)期,人們的消費(fèi)傾向會(huì)發(fā)生變化,尤其是在自然災(zāi)害、戰(zhàn)爭(zhēng)等反常年份,消費(fèi)傾向往往出現(xiàn)變化。這種消費(fèi)傾向的變化可通過(guò)在收入的系數(shù)中引入虛擬變量來(lái)考察。如,設(shè)消費(fèi)模型可建立如下:第十五頁(yè),共四十六頁(yè),編輯于2023年,星期三這里,虛擬變量D以與X相乘的方式引入了模型中,從而可用來(lái)考察消費(fèi)傾向的變化。假定E(i)=0,上述模型所表示的函數(shù)可化為:

正常年份:

反常年份:第十六頁(yè),共四十六頁(yè),編輯于2023年,星期三

當(dāng)截距與斜率發(fā)生變化時(shí),則需要同時(shí)引入加法與乘法形式的虛擬變量。例,考察1990年前后的中國(guó)居民的總儲(chǔ)蓄-收入關(guān)系是否已發(fā)生變化。表中給出了中國(guó)1979~2001年以城鄉(xiāng)儲(chǔ)蓄存款余額代表的居民儲(chǔ)蓄以及以GNP代表的居民收入的數(shù)據(jù)。第十七頁(yè),共四十六頁(yè),編輯于2023年,星期三第十八頁(yè),共四十六頁(yè),編輯于2023年,星期三以Y為儲(chǔ)蓄,X為收入,可令:1990年前:Yi=1+2Xi+1ii=1,2…,n1

1990年后:Yi=1+2Xi+2ii=1,2…,n2

則有可能出現(xiàn)下述四種情況中的一種:(1)1=1

,且2=2

,即兩個(gè)回歸相同,稱(chēng)為重合回歸(CoincidentRegressions);第十九頁(yè),共四十六頁(yè),編輯于2023年,星期三(2)11,但2=2

,即兩個(gè)回歸的差異僅在其截距,稱(chēng)為平行回歸(ParallelRegressions);(3)1=1

,但22

,即兩個(gè)回歸的差異僅在其斜率,稱(chēng)為匯合回歸(ConcurrentRegressions);(4)11,且22

,即兩個(gè)回歸完全不同,稱(chēng)為相異回歸(DissimilarRegressions)。第二十頁(yè),共四十六頁(yè),編輯于2023年,星期三平行回歸第二十一頁(yè),共四十六頁(yè),編輯于2023年,星期三匯合回歸第二十二頁(yè),共四十六頁(yè),編輯于2023年,星期三相異回歸第二十三頁(yè),共四十六頁(yè),編輯于2023年,星期三可以運(yùn)用鄒氏結(jié)構(gòu)變化的檢驗(yàn)。這一問(wèn)題也可通過(guò)引入乘法形式的虛擬變量來(lái)解決。將n1與n2次觀(guān)察值合并,并用以估計(jì)以下回歸:Di為引入的虛擬變量:第二十四頁(yè),共四十六頁(yè),編輯于2023年,星期三于是有:可分別表示1990年后期與前期的儲(chǔ)蓄函數(shù)。

在統(tǒng)計(jì)檢驗(yàn)中,如果3=0的假設(shè)被拒絕,則說(shuō)明兩個(gè)時(shí)期中儲(chǔ)蓄函數(shù)的截距不同,如果4=0的假設(shè)被拒絕,則說(shuō)明兩個(gè)時(shí)期中儲(chǔ)蓄函數(shù)的斜率不同。第二十五頁(yè),共四十六頁(yè),編輯于2023年,星期三具體的回歸結(jié)果為:(-6.11)(22.89)(4.33)(-2.55)由3與4的t檢驗(yàn)可知:參數(shù)顯著地不等于0,強(qiáng)烈示出兩個(gè)時(shí)期的回歸是相異的,儲(chǔ)蓄函數(shù)分別為:1990年前:1990年后:=0.9836第二十六頁(yè),共四十六頁(yè),編輯于2023年,星期三第二十七頁(yè),共四十六頁(yè),編輯于2023年,星期三第二十八頁(yè),共四十六頁(yè),編輯于2023年,星期三第二十九頁(yè),共四十六頁(yè),編輯于2023年,星期三第三十頁(yè),共四十六頁(yè),編輯于2023年,星期三鄒氏結(jié)構(gòu)變化的檢驗(yàn)和虛擬變量法的比較鄒檢驗(yàn)只是告訴我們結(jié)構(gòu)是否已經(jīng)變化,而不能告訴我們當(dāng)有變化時(shí)候是因?yàn)橹皇切甭氏喈惢蛑皇墙鼐嘞喈悾騼烧呔喈?。但是虛擬變量法不僅告訴我們兩個(gè)回歸是否有差異,而且落實(shí)到差異的起因——由于截距或由于斜率或由于兩者。我們只要做一個(gè)回歸,因?yàn)槠渌幕貧w可以方便地由它導(dǎo)出。這個(gè)單一的回歸可以用來(lái)做各種假設(shè)檢驗(yàn)。由于合并而增加了自由度,參數(shù)估計(jì)的相對(duì)精度也有所改進(jìn)。第三十一頁(yè),共四十六頁(yè),編輯于2023年,星期三3.臨界指標(biāo)的虛擬變量的引入(分段回歸)

在經(jīng)濟(jì)發(fā)生轉(zhuǎn)折時(shí)期,可通過(guò)建立臨界指標(biāo)的虛擬變量模型來(lái)反映。例如,進(jìn)口消費(fèi)品數(shù)量Y主要取決于國(guó)民收入X的多少,中國(guó)在改革開(kāi)放前后,Y對(duì)X的回歸關(guān)系明顯不同。

第三十二頁(yè),共四十六頁(yè),編輯于2023年,星期三則進(jìn)口消費(fèi)品的回歸模型可建立如下:這時(shí),可以t*=1979年為轉(zhuǎn)折期,以1979年的國(guó)民收入Xt*為臨界值,設(shè)如下虛擬變量:第三十三頁(yè),共四十六頁(yè),編輯于2023年,星期三

OLS法得到該模型的回歸方程為:則兩時(shí)期進(jìn)口消費(fèi)品函數(shù)分別為:當(dāng)t<t*=1979年,當(dāng)tt*=1979年,第三十四頁(yè),共四十六頁(yè),編輯于2023年,星期三第三十五頁(yè),共四十六頁(yè),編輯于2023年,星期三第三十六頁(yè),共四十六頁(yè),編輯于2023年,星期三第三十七頁(yè),共四十六頁(yè),編輯于2023年,星期三第三十八頁(yè),共四十六頁(yè),編輯于2023年,星期三三、虛擬變量的設(shè)置原則虛擬變量的個(gè)數(shù)須按以下原則確定:

每一定性變量所需的虛擬變量個(gè)數(shù)要比該定性變量的類(lèi)別數(shù)少1,即如果有m個(gè)定性變量,只在模型中引入m-1個(gè)虛擬變量。

例已知冷飲的銷(xiāo)售量Y除受k種定量變量Xk的影響外,還受春、夏、秋、冬四季變化的影響,要考察該四季的影響,只需引入三個(gè)虛擬變量即可:第三十九頁(yè),共四十六頁(yè),編輯于2023年,星期三則冷飲銷(xiāo)售量的模型為:在上述模型中,若再引入第四個(gè)虛擬變量:第四十頁(yè),共四十六頁(yè),編輯于2023年,星期三則冷飲銷(xiāo)售模型變量為:其矩陣形式為:

如果只取六個(gè)觀(guān)測(cè)值,其中春季與夏季取了兩次,秋、冬各取到一次觀(guān)測(cè)值,則式中的:第四十一頁(yè),共四十六頁(yè),編輯于2023年,星期三

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論