版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
一元線性回歸(二)一元線性回歸(二)例題4-1某城鎮(zhèn)1988---1998年人均可支配收入X(元,1980年不變價(jià)),人均鮮蛋需求量Y(公斤),建立模型Y=a+bX,估計(jì)收入對(duì)需求的影響。1。利用Excel完成2。利用stata完成先畫(huà)散點(diǎn)圖,然后估計(jì)方程。例題4-1某城鎮(zhèn)1988---1998年人均可支配收入X(元Y=10.766+0.005X+uY=10.766+0.005X+u測(cè)試成績(jī)和學(xué)生/教師比關(guān)系的OLS估計(jì)值及其分析。打開(kāi)數(shù)據(jù)文件:score.dtaregtestscrstr測(cè)試成績(jī)和學(xué)生/教師比關(guān)系的OLS估計(jì)值及其分析。testscr=698.93-2.28str+utestscr=698.93-2.28str+u回歸結(jié)果的分析回歸結(jié)果的分析第三講一元線性回歸2課件1。截距項(xiàng)和斜率的含義是什么?本題的截距表示:學(xué)生教師比為0(沒(méi)有學(xué)生時(shí))的測(cè)試成績(jī)的最高值,因此沒(méi)有實(shí)際意義??梢岳斫鉃榇_定回歸線的系數(shù)。1。截距項(xiàng)和斜率的含義是什么?斜率:表示彈性
-2.28的斜率表示當(dāng)每個(gè)教師對(duì)應(yīng)的學(xué)生人數(shù)增加1個(gè)時(shí),學(xué)區(qū)測(cè)試成績(jī)將平均下降2.28分。而當(dāng)每個(gè)教師對(duì)應(yīng)的學(xué)生人數(shù)減少2個(gè)時(shí),測(cè)試成績(jī)平均提高:((-2)×(-2.28))=4.56分,負(fù)的斜率表明每個(gè)教師對(duì)應(yīng)的學(xué)生人數(shù)越多(較大規(guī)模的班),則相應(yīng)的測(cè)試成績(jī)?cè)讲?。斜率:表示彈?。方程的經(jīng)濟(jì)預(yù)測(cè)能力:得到回歸結(jié)果后,可以進(jìn)行簡(jiǎn)單的預(yù)測(cè),只要給定學(xué)生/教師比(X)取值后就能預(yù)測(cè)全學(xué)區(qū)的測(cè)試成績(jī)了。testscr=698.93-2.28×str+u如每個(gè)教師對(duì)應(yīng)20個(gè)學(xué)生的學(xué)區(qū),其測(cè)試成績(jī)預(yù)測(cè)值為698.93-2.28×20=653.30。當(dāng)然,由于其他決定學(xué)區(qū)成績(jī)的因素(u)的影響,預(yù)測(cè)不會(huì)是絕對(duì)正確的。預(yù)測(cè)的準(zhǔn)確程度取決于模型的優(yōu)劣。2。方程的經(jīng)濟(jì)預(yù)測(cè)能力:3。方程的斜率的大小評(píng)估:觀察選取的420個(gè)樣本的總體分布(分位數(shù))3。方程的斜率的大小評(píng)估:一個(gè)例子:
假設(shè)某個(gè)學(xué)區(qū)處于加利福尼亞學(xué)區(qū)的中位數(shù),對(duì)應(yīng)的學(xué)生/教師比為19.7,現(xiàn)在想減少到17.7。一方面:她的學(xué)區(qū)學(xué)生/教師比從50%分位數(shù)移到接近10%分位數(shù)。這是一個(gè)相當(dāng)大的變動(dòng)。另一方面:帶入方程,測(cè)試成績(jī)預(yù)計(jì)從654.5提高到659.1,從50%分位數(shù)移到將近60%分位數(shù)。一個(gè)例子:股票的beta值:證券組合的風(fēng)險(xiǎn)與報(bào)酬(一)證券組合的風(fēng)險(xiǎn)同時(shí)投資于多種證券的方式稱(chēng)為證券的投資組合,簡(jiǎn)稱(chēng)證券組合或投資組合。證券組合的風(fēng)險(xiǎn)分為可分散風(fēng)險(xiǎn)與不可分散風(fēng)險(xiǎn)??煞稚L(fēng)險(xiǎn)不可分散風(fēng)險(xiǎn)別稱(chēng)非系統(tǒng)性風(fēng)險(xiǎn)公司特別風(fēng)險(xiǎn)系統(tǒng)性風(fēng)險(xiǎn)市場(chǎng)風(fēng)險(xiǎn)含義某些因素對(duì)單個(gè)證券造成經(jīng)濟(jì)損失的可能性某些因素給市場(chǎng)上所有證券都帶來(lái)經(jīng)濟(jì)損失的可能性特性可通過(guò)證券持有的多樣化來(lái)抵消不能通過(guò)證券組合分散掉13可分散風(fēng)險(xiǎn)可通過(guò)證券組合來(lái)消減股票的beta值:證券組合的風(fēng)險(xiǎn)與報(bào)酬(一)證券組合的風(fēng)險(xiǎn)可Rm是市場(chǎng)組合的期望收益,一般用C&P500組合收益,Rf是市場(chǎng)無(wú)風(fēng)險(xiǎn)收益,可以理解為各類(lèi)存款收益。Rm是市場(chǎng)組合的期望收益,一般用C&P500組合收益,Rf我們把利用OLS方法估計(jì)出的參數(shù)b0和b1稱(chēng)為OLS估計(jì)量,用表示。用OLS方法估計(jì)出的方程:我們把利用OLS方法估計(jì)出的參數(shù)b0和b1稱(chēng)為OLS估計(jì)量,殘差的概念殘差是每個(gè)樣本的擬合值和實(shí)際值之間的差。用ei或者表示。樣本回歸模型:樣本擬合線:殘差值:殘差的概念殘差是每個(gè)樣本的擬合值和實(shí)際值之間的差。用ei或者基本原理:1。確定樣本個(gè)數(shù)n,給出觀測(cè)值(Xi,Yi),i=1,2,3,…n。由于樣本容量已定,樣本回歸模型可寫(xiě)為:其中稱(chēng)為回歸系數(shù)(擬合參數(shù)),稱(chēng)為殘差(擬合誤差)。普通最小二乘法(OLS)基本原理:普通最小二乘法(OLS)2。利用OLS法尋找殘差的平方和最小的直線,估計(jì)出的具體值。3。此時(shí)可得到利用OLS方法測(cè)算出的Y的擬合值,注意,并不是實(shí)際的Y值,有如下計(jì)算公式:因此,是Y的估計(jì)值或擬合值,而殘差的大小決定了模型的優(yōu)劣。2。利用OLS法尋找殘差的平方和最小的直線,估計(jì)出思考:與ui是否是一回事?有什么區(qū)別和聯(lián)系?思考:與ui是否是一回事?直線上的點(diǎn)的坐標(biāo)是,樣本點(diǎn)的坐標(biāo)是Yi是從樣本點(diǎn)到直線的距離。直線上的點(diǎn)的坐標(biāo)是,樣本點(diǎn)的坐標(biāo)是Yi擬合優(yōu)度擬合優(yōu)度R2:描述OLS回歸線對(duì)樣本數(shù)據(jù)的擬合效果;描述觀測(cè)值在回歸線附近的離散程度;同時(shí)描述了樣本數(shù)據(jù)有多大程度可以被回歸方程所解釋。回歸R2是指可由Xi解釋(或預(yù)測(cè))的Yi樣本方差的比例。擬合優(yōu)度擬合優(yōu)度R2:描述OLS回歸線對(duì)樣本數(shù)據(jù)的擬合效果;OLS方法得到的擬合線一定是所有直線中擬合效果最好的,但由于樣本自身的原因,擬合效果有好有壞。最典型的例子是錯(cuò)誤的函數(shù)形式OLS方法得到的擬合線一定是所有直線中擬合效果最好的,但由于這是一個(gè)典型的對(duì)數(shù)函數(shù)的例子,用線性方程,模擬效果較差。這是一個(gè)典型的對(duì)數(shù)函數(shù)的例子,用線性方程,模擬效果較差。擬合優(yōu)度擬合優(yōu)度
對(duì)于所有樣本點(diǎn)的平方和,均有下列結(jié)論:記總體平方和(TotalSumofSquares)回歸平方和(ExplainedSumofSquares)殘差平方和(ResidualSumofSquares
)對(duì)于所有樣本點(diǎn)的平方和,均有下列結(jié)論:記總體平方TSS=ESS+RSS(證明見(jiàn)附錄)
Y的觀測(cè)值圍繞其均值的總離差(totalvariation)可分解為兩部分:一部分來(lái)自回歸線(ESS),另一部分則來(lái)自隨機(jī)勢(shì)力(RSS)。在給定樣本中,TSS不變,如果實(shí)際觀測(cè)點(diǎn)離樣本回歸線越近,則ESS在TSS中占的比重越大,因此
擬合優(yōu)度:回歸平方和ESS/Y的總離差TSSTSS=ESS+RSS(證明見(jiàn)附錄)Y的觀測(cè)值2、擬合優(yōu)度R2統(tǒng)計(jì)量
稱(chēng)R2為(樣本)擬合優(yōu)度/可決系數(shù)/判定系數(shù)(coefficientofdetermination)。
擬合優(yōu)度的取值范圍:[0,1]
R2越接近1,說(shuō)明實(shí)際觀測(cè)點(diǎn)離樣本線越近,擬合優(yōu)度越高。2、擬合優(yōu)度R2統(tǒng)計(jì)量稱(chēng)R2為(樣本)擬合優(yōu)度/可決系由于每次向回歸方程中增加解釋變量,R2必然只增不減。為此,可以通過(guò)調(diào)整自由度對(duì)解釋變量過(guò)多進(jìn)行“懲罰”,因此,可以定義“校正的擬合優(yōu)度”由于每次向回歸方程中增加解釋變量,R2必然只增不減。為此,可察看上述例題的擬合優(yōu)度注意:1。擬合優(yōu)度一定程度上反映了選取變量的對(duì)被解釋變量的“解釋能力”。2。擬合優(yōu)度低一般說(shuō)明方程忽略了某些重要的解釋因素。3。在大樣本下,擬合優(yōu)度一般不會(huì)太高。察看上述例題的擬合優(yōu)度回歸標(biāo)準(zhǔn)誤差(SER)回歸標(biāo)準(zhǔn)誤差(standarderroroftheregression.SER)是回歸誤差u的標(biāo)準(zhǔn)差估計(jì)量,是用因變量單位度量的觀測(cè)值在回歸線附近的離散程度。對(duì)于誤差項(xiàng)ui,我們更關(guān)心它在回歸線附近的離散程度,即標(biāo)準(zhǔn)差。希望標(biāo)準(zhǔn)差越小越好。由于ui本身是不可知的,因此,實(shí)際上sui是無(wú)法獲得的,為了模擬其數(shù)值大小,我們用的標(biāo)準(zhǔn)差作為ui的標(biāo)準(zhǔn)差的估計(jì)值,稱(chēng)為回歸的標(biāo)準(zhǔn)誤差。回歸標(biāo)準(zhǔn)誤差(SER)回歸標(biāo)準(zhǔn)誤差(standarderr為什么要除以n-2?n-2是自由度。為什么要除以n-2?n-2是自由度。模型中樣本值可以自由變動(dòng)的個(gè)數(shù),稱(chēng)為自由度。自由度=樣本個(gè)數(shù)—樣本數(shù)據(jù)受約束條件(方程)的個(gè)數(shù)。例如,樣本數(shù)據(jù)個(gè)數(shù)為n,它們受k個(gè)方程的約束(系數(shù)矩陣秩為k),那么,自由度df=n-k。模型中樣本值可以自由變動(dòng)的個(gè)數(shù),稱(chēng)為自由度。其中n-2為自由度。由于隨機(jī)變量必須滿足k+1個(gè)正規(guī)方程(一元線形回歸模型中有2個(gè)方程),故只有n-k-1個(gè)是相互獨(dú)立的。經(jīng)過(guò)這樣校正后,才是無(wú)偏估計(jì)。其中n-2為自由度。由于隨機(jī)變量如果無(wú)任何特征和規(guī)律可言,整個(gè)計(jì)量模型的建立將無(wú)法開(kāi)展,因此,我們需要人為地為它設(shè)定一些假定條件。如果下列假定條件滿足,我們就可以用最小二乘法對(duì)模型進(jìn)行回歸估計(jì)。本書(shū)中的經(jīng)典假設(shè)是對(duì)于大樣本數(shù)據(jù)而言,根據(jù)中心極限定理,大樣本數(shù)據(jù)有很好的分布特征。如果無(wú)任何特征和規(guī)律可言,整個(gè)計(jì)量模型的建立將無(wú)法假設(shè)1:給定Xi時(shí)ui的條件分布均值為零(1)隨機(jī)誤差項(xiàng)ui的數(shù)學(xué)期望為0。
E(ui|Xi)=0。同時(shí):
E(Yi|Xi)=E()=E()=
理論上,隨機(jī)誤差項(xiàng)被假定為沒(méi)有被納入到模型中的微小影響,因此,沒(méi)有理由相信這樣一些影響會(huì)以一種系統(tǒng)的方式使被解釋變量變大或者變小,可以假定其均值為0。假設(shè)1:給定Xi時(shí)ui的條件分布均值為零(1)隨機(jī)誤差項(xiàng)ui第三講一元線性回歸2課件例如對(duì)某一給定的班級(jí)規(guī)模Xi,如每班20個(gè)學(xué)生,其他因素ui有時(shí)使成績(jī)高于預(yù)測(cè)值(ui>0),有時(shí)使成績(jī)低于預(yù)測(cè)值(ui<0),但就總體平均而言,ui的分布的均值為零。同時(shí),給定班級(jí)規(guī)模Xi,由于ui的干擾,某些Y’i的值大于Yi,某些Y’i的值小于Yi,但就總體平均而言,Y’i的分布的均值為E(Yi|Xi)=B0+B1Xi,即總體均值在回歸線上。例如對(duì)某一給定的班級(jí)規(guī)模Xi,如每班20個(gè)學(xué)生,其他因素ui推論E(ui|Xi)=0意味著ui和Xi不相關(guān),即:Corr(ui,Xi)=0這是最小二乘法最基本的假設(shè),如果Corr(ui,Xi)<>0,模型是有偏的。推論E(ui|Xi)=0意味著ui和Xi不相關(guān),即:假設(shè)2:(Xi,Yi)滿足獨(dú)立同分布每次從總體中的抽樣都包含相同的分布;同時(shí),每次抽樣均是獨(dú)立進(jìn)行的??梢宰C明:(Xi,Yi)滿足獨(dú)立同分布,則Xi也滿足獨(dú)立同分布。假設(shè)2:(Xi,Yi)滿足獨(dú)立同分布每次從總體中的抽樣都包含假設(shè)3:不太可能出現(xiàn)大異常值有限峰度假設(shè)假設(shè)3:不太可能出現(xiàn)大異常值有限峰度假設(shè)當(dāng)出現(xiàn)大異常值時(shí),X和Y分布的峰度會(huì)變得很大。包含四階距,要求其有限。即:0<E(Xi4)<∞0<E(Yi4)<∞當(dāng)出現(xiàn)大異常值時(shí),X和Y分布的峰度會(huì)變得很大。包含四階距,要出現(xiàn)大異常值的一種可能是數(shù)據(jù)登錄錯(cuò)誤,如印刷錯(cuò)誤或?qū)Σ煌^測(cè)錯(cuò)誤地采用了不同的單位:如設(shè)想一下收集以米為單位的學(xué)生身高數(shù)據(jù),但不小心把其中一個(gè)學(xué)生的身高記成了以厘米為單位。發(fā)現(xiàn)異常值的一種方法是畫(huà)出數(shù)據(jù)圖。如果你確定是由于數(shù)據(jù)登錄錯(cuò)誤造成了異常值,則你可以改正這個(gè)錯(cuò)誤,如果不能改正就把它從數(shù)據(jù)集中刪除。出現(xiàn)大異常值的一種可能是數(shù)據(jù)登錄錯(cuò)誤,如印刷錯(cuò)誤或?qū)Σ煌^測(cè)最小二乘假設(shè)的作用主要作用:大樣本下,抽樣分布服從正態(tài)分布。同時(shí),假設(shè)樣本數(shù)據(jù)沒(méi)有錯(cuò)誤。最小二乘假設(shè)的作用主要作用:大樣本下,抽樣分布服從OLS估計(jì)量的抽樣分布OLS估計(jì)量的抽樣分布OLS估計(jì)量的抽樣分布在ui滿足高斯假定條件時(shí),通過(guò)OLS方法,我們可以得到回歸系數(shù)的估計(jì)量成為的擬合值。注意:是不是兩個(gè)常數(shù)?OLS估計(jì)量的抽樣分布在ui滿足高斯假定條件時(shí),通過(guò)OLS方計(jì)量回歸模型中,對(duì)于要研究的問(wèn)題,可以建立方程:這是總體的方程描述。應(yīng)該能夠確定。但事實(shí)上我們沒(méi)有能力獲得整體信息,只能通過(guò)部分?jǐn)?shù)據(jù)模擬整體分布,即抽樣。計(jì)量回歸模型中,對(duì)于要研究的問(wèn)題,可以建立方程:我們是在總體中進(jìn)行抽樣。每抽取一組樣本就會(huì)有一組相應(yīng)的回歸系數(shù),因此,一定不是常數(shù),而是隨機(jī)變量,并且具有一定的概率分布。小樣本下,這些
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024-2025學(xué)年人教版(2024)信息技術(shù)四年級(jí)上冊(cè) 第14課 編碼也能動(dòng)起來(lái) 教學(xué)實(shí)錄
- 2024年度公司、企業(yè)股權(quán)激勵(lì)計(jì)劃培訓(xùn)與輔導(dǎo)合同
- 2024年度德漢翻譯與時(shí)尚品牌合作服務(wù)協(xié)議3篇
- 《第3課 可敬的勞動(dòng)者 2 職業(yè)面面觀》(教學(xué)實(shí)錄)-2023-2024學(xué)年五年級(jí)下冊(cè)綜合實(shí)踐活動(dòng)安徽大學(xué)版
- 云南省麗江市古城區(qū)2024-2025學(xué)年高三語(yǔ)文3月月考試題含解析
- 2024年標(biāo)準(zhǔn)版無(wú)房貸離婚合同草案版B版
- 柳州鐵道職業(yè)技術(shù)學(xué)院《個(gè)案工作實(shí)務(wù)》2023-2024學(xué)年第一學(xué)期期末試卷
- 柳州工學(xué)院《運(yùn)動(dòng)解剖學(xué)(一)》2023-2024學(xué)年第一學(xué)期期末試卷
- 2024年度跨國(guó)公司員工勞動(dòng)合同及知識(shí)產(chǎn)權(quán)保護(hù)協(xié)議范本3篇
- 2024年度離婚后股權(quán)分配協(xié)議
- 警察職業(yè)介紹(課堂PPT)
- HACCP案例分析
- 二次精裝修施工方案及技術(shù)措施
- 7、太平人壽《基本法
- 寶龍地產(chǎn)商管公司各級(jí)員工薪酬
- 兒童哮喘診療指南
- 飲水機(jī)濾芯更換記錄表
- 空氣站質(zhì)量控制措施之運(yùn)行維護(hù)
- 方解石礦產(chǎn)地質(zhì)工作指引
- 水土保持遙感監(jiān)測(cè)技術(shù)規(guī)范
- 藍(lán)色簡(jiǎn)約公安警察工作匯報(bào)PPT模板
評(píng)論
0/150
提交評(píng)論