第10章 簡單回歸與相關(guān)分析_第1頁
第10章 簡單回歸與相關(guān)分析_第2頁
第10章 簡單回歸與相關(guān)分析_第3頁
第10章 簡單回歸與相關(guān)分析_第4頁
第10章 簡單回歸與相關(guān)分析_第5頁
已閱讀5頁,還剩104頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第10章簡單回歸與相關(guān)分析10.1變量間關(guān)系的度量10.2一元線性回歸10.3利用回歸方程進(jìn)行估計(jì)和預(yù)測10.4殘差分析學(xué)習(xí)目標(biāo)1. 相關(guān)系數(shù)的分析方法一元線性回歸的基本原理和參數(shù)的最小二乘估計(jì)回歸直線的擬合優(yōu)度回歸方程的顯著性檢驗(yàn)利用回歸方程進(jìn)行估計(jì)和預(yù)測子代與父代一樣嗎?Galton被譽(yù)為現(xiàn)代回歸和相關(guān)技術(shù)的創(chuàng)始人。1875年,Galton利用豌豆實(shí)驗(yàn)來確定尺寸的遺傳規(guī)律。他挑選了7組不同尺寸的豌豆,并說服他在英國不同地區(qū)的朋友每一組種植10粒種子,最后把原始的豌豆種子(父代)與新長的豌豆種子(子代)進(jìn)行尺寸比較當(dāng)結(jié)果被繪制出來之后,他發(fā)現(xiàn)并非每一個(gè)子代都與父代一樣,不同的是,尺寸小的豌豆會(huì)得到更大的子代,而尺寸大的豌豆卻得到較小的子代。Galton把這一現(xiàn)象叫做“返祖”(趨向于祖先的某種平均類型),后來又稱之為“向平均回歸”。一個(gè)總體中在某一時(shí)期具有某一極端特征(低于或高于總體均值)的個(gè)體在未來的某一時(shí)期將減弱它的極端性(或者是單個(gè)個(gè)體或者是整個(gè)子代),這一趨勢現(xiàn)在被稱作“回歸效應(yīng)”。人們發(fā)現(xiàn)它的應(yīng)用很廣,而不僅限于從一代到下一代豌豆大小問題子代與父代一樣嗎?正如Galton進(jìn)一步發(fā)現(xiàn)的那樣,平均來說,非常矮小的父輩傾向于有偏高的子代;而非常高大的父輩則傾向于有偏矮的子代。在第一次考試中成績最差的那些學(xué)生在第二次考試中傾向于有更好的成績(比較接近所有學(xué)生的平均成績),而第一次考試中成績最好的那些學(xué)生在第二次考試中則傾向于有較差的成績(同樣比較接近所有學(xué)生的平均成績)。同樣,平均來說,第一年利潤最低的公司第二年不會(huì)最差,而第一年利潤最高的公司第二年則不會(huì)是最好的如果把父代和子代看作兩個(gè)變量,找出這兩個(gè)變量的關(guān)系,并根據(jù)這種關(guān)系建立適當(dāng)?shù)臄?shù)學(xué)模型,就可以根據(jù)父代的數(shù)值預(yù)測子代的取值,這就是經(jīng)典的回歸方法要解決的問題。學(xué)完本章的內(nèi)容你會(huì)對回歸問題有更深入的理解10.1變量間關(guān)系的度量10.1.1變量間的關(guān)系10.1.2相關(guān)關(guān)系的描述與測度10.1.3相關(guān)系數(shù)的顯著性檢驗(yàn)怎樣分析變量間的關(guān)系?建立回歸模型時(shí),首先需要弄清楚變量之間的關(guān)系。分析變量之間的關(guān)系需要解決下面的問題變量之間是否存在關(guān)系?如果存在,它們之間是什么樣的關(guān)系?變量之間的關(guān)系強(qiáng)度如何?樣本所反映的變量之間的關(guān)系能否代表總體變量之間的關(guān)系?相關(guān)關(guān)系

(correlation)變量間關(guān)系不能用函數(shù)關(guān)系精確表達(dá)(不確定的數(shù)量關(guān)系)一個(gè)變量的取值不能由另一個(gè)變量唯一確定當(dāng)變量

x取某個(gè)值時(shí),變量y的取值可能有幾個(gè)各觀測點(diǎn)分布在直線周圍

xy相關(guān)關(guān)系

(幾個(gè)例子)

相關(guān)關(guān)系的例子父親身高y與子女身高x之間的關(guān)系收入水平y(tǒng)與受教育程度x之間的關(guān)系糧食畝產(chǎn)量y與施肥量x1

、降雨量x2

、溫度x3之間的關(guān)系商品的消費(fèi)量y與居民收入x之間的關(guān)系商品銷售額y與廣告費(fèi)支出x之間的關(guān)系相關(guān)關(guān)系

(特點(diǎn))一個(gè)變量的取值不能由另一個(gè)變量唯一確定,當(dāng)變量x取某個(gè)值時(shí),變量y的取值可能有幾個(gè)。無法用函數(shù)關(guān)系描述變量的不確定關(guān)系有規(guī)律可循,便兩間存在一定客觀規(guī)律相關(guān)與回歸分析正是描述與探索這類變量之間關(guān)系及其規(guī)律的統(tǒng)計(jì)方法。相關(guān)分析對兩個(gè)變量之間線性關(guān)系的描述與度量,它要解決的問題包括變量之間是否存在關(guān)系?如果存在關(guān)系,它們之間是什么樣的關(guān)系?變量之間的強(qiáng)度如何?樣本所反映的變量之間的關(guān)系能否代表總體變量之間的關(guān)系?相關(guān)關(guān)系

(類型)相關(guān)關(guān)系的描述與測度

(散點(diǎn)圖)散點(diǎn)圖

(scatterdiagram)

不相關(guān)

負(fù)線性相關(guān)

正線性相關(guān)

非線性相關(guān)

完全負(fù)線性相關(guān)完全正線性相關(guān)

散點(diǎn)圖

(例題分析)【例】一家大型商業(yè)銀行在多個(gè)地區(qū)設(shè)有分行,其業(yè)務(wù)主要是進(jìn)行基礎(chǔ)設(shè)施建設(shè)、國家重點(diǎn)項(xiàng)目建設(shè)、固定資產(chǎn)投資等項(xiàng)目的貸款。近年來,該銀行的貸款額平穩(wěn)增長,但不良貸款額也有較大比例的增長,這給銀行業(yè)務(wù)的發(fā)展帶來較大壓力。為弄清楚不良貸款形成的原因,希望利用銀行業(yè)務(wù)的有關(guān)數(shù)據(jù)做些定量分析,以便找出控制不良貸款的辦法。下面是該銀行所屬的25家分行2002年的有關(guān)業(yè)務(wù)數(shù)據(jù)散點(diǎn)圖

(例題分析)散點(diǎn)圖

(例題分析)相關(guān)關(guān)系的描述與測度

(相關(guān)系數(shù))相關(guān)系數(shù)

(correlationcoefficient)對變量之間關(guān)系密切程度的度量對兩個(gè)變量之間線性相關(guān)程度的度量稱為簡單相關(guān)系數(shù)若相關(guān)系數(shù)是根據(jù)總體全部數(shù)據(jù)計(jì)算的,稱為總體相關(guān)系數(shù),記為

若是根據(jù)樣本數(shù)據(jù)計(jì)算的,則稱為樣本相關(guān)系數(shù),記為r相關(guān)系數(shù)

(計(jì)算公式)

樣本相關(guān)系數(shù)的計(jì)算公式或化簡為相關(guān)系數(shù)

(取值及其意義)

r

的取值范圍是[-1,1]

|r|=1,為完全相關(guān)r=1,為完全正相關(guān)r=-1,為完全負(fù)正相關(guān)

r=0,不存在線性相關(guān)關(guān)系

-1

r<0,為負(fù)相關(guān)

0<r

1,為正相關(guān)

|r|越趨于1表示關(guān)系越密切;|r|越趨于0表示關(guān)系越不密切相關(guān)系數(shù)

(取值及其意義)

r

具有對稱性,rxy=ryx。

r數(shù)值大小與x和y的原點(diǎn)及尺度無關(guān)。

r僅僅是x和y之間線性關(guān)系的度量,不能用于描述非線性關(guān)系。

r雖然是兩個(gè)變量之間線性關(guān)系的度量,卻不一定意味著x和y一定有因果關(guān)系。相關(guān)系數(shù)

(取值及其意義)-1.0+1.00-0.5+0.5完全負(fù)相關(guān)無線性相關(guān)完全正相關(guān)負(fù)相關(guān)程度增加r正相關(guān)程度增加相關(guān)系數(shù)

(例題分析)

用Excel計(jì)算相關(guān)系數(shù)相關(guān)系數(shù)的顯著性檢驗(yàn)相關(guān)系數(shù)的顯著性檢驗(yàn)

1. r的抽樣分布隨總體相關(guān)系數(shù)和樣本容量的大小而變化當(dāng)樣本數(shù)據(jù)來自正態(tài)總體時(shí),隨著n的增大,r的抽樣分布趨于正態(tài)分布,尤其是在總體相關(guān)系數(shù)

很小或接近0時(shí),趨于正態(tài)分布的趨勢非常明顯。而當(dāng)

遠(yuǎn)離0時(shí),除非n非常大,否則r的抽樣分布呈現(xiàn)一定的偏態(tài)。當(dāng)

為較大的正值時(shí),r呈現(xiàn)左偏分布;當(dāng)

為較小的負(fù)值時(shí),r呈現(xiàn)右偏分布。只有當(dāng)

接近于0,而樣本容量n很大時(shí),才能認(rèn)為r是接近于正態(tài)分布的隨機(jī)變量(r的抽樣分布)相關(guān)系數(shù)的顯著性檢驗(yàn)

(檢驗(yàn)的步驟)1. 檢驗(yàn)兩個(gè)變量之間是否存在線性相關(guān)關(guān)系等價(jià)于對回歸系數(shù)b1的檢驗(yàn)采用R.A.Fisher提出的t檢驗(yàn)檢驗(yàn)的步驟為提出假設(shè):H0:

;H1:

0計(jì)算檢驗(yàn)的統(tǒng)計(jì)量:確定顯著性水平,并作出決策若t>t

,拒絕H0

若t<t

,不能拒絕H0相關(guān)系數(shù)的顯著性檢驗(yàn)

(例題分析)

對不良貸款與貸款余額之間的相關(guān)系數(shù)進(jìn)行顯著性檢(

0.05)提出假設(shè):H0:

;H1:

0計(jì)算檢驗(yàn)的統(tǒng)計(jì)量3.根據(jù)顯著性水平

=0.05,查t分布表得t

(n-2)=2.069由于t=7.5344>t

(25-2)=2.069,拒絕H0,不良貸款與貸款余額之間存在著顯著的正線性相關(guān)關(guān)系相關(guān)系數(shù)的顯著性檢驗(yàn)

(例題分析)各相關(guān)系數(shù)檢驗(yàn)的統(tǒng)計(jì)量10.2一元線性回歸10.2.1一元線性回歸模型10.2.2參數(shù)的最小二乘估計(jì)10.2.3回歸直線的擬合優(yōu)度10.2.4顯著性檢驗(yàn)什么是回歸分析?

(Regression)從一組樣本數(shù)據(jù)出發(fā),確定變量之間的數(shù)學(xué)關(guān)系式對這些關(guān)系式的可信程度進(jìn)行各種統(tǒng)計(jì)檢驗(yàn),并從影響某一特定變量的諸多變量中找出哪些變量的影響顯著,哪些不顯著利用所求的關(guān)系式,根據(jù)一個(gè)或幾個(gè)變量的取值來預(yù)測或控制另一個(gè)特定變量的取值,并給出這種預(yù)測或控制的精確程度回歸一詞是怎么來的??回歸分析與相關(guān)分析的區(qū)別相關(guān)分析中,變量x

變量y處于平等的地位;回歸分析中,變量y稱為因變量,處在被解釋的地位,x稱為自變量,用于預(yù)測因變量的變化相關(guān)分析中所涉及的變量x和y都是隨機(jī)變量;回歸分析中,因變量y是隨機(jī)變量,自變量x

可以是隨機(jī)變量,也可以是非隨機(jī)的確定變量相關(guān)分析主要是描述兩個(gè)變量之間線性關(guān)系的密切程度;回歸分析不僅可以揭示變量x對變量y的影響大小,還可以由回歸方程進(jìn)行預(yù)測和控制

回歸模型的類型一元線性回歸模型一元線性回歸涉及一個(gè)自變量的回歸因變量y與自變量x之間為線性關(guān)系被預(yù)測或被解釋的變量稱為因變量(dependentvariable),用y表示(不良貸款)用來預(yù)測或用來解釋因變量的一個(gè)或多個(gè)變量稱為自變量(independentvariable),用x表示(貸款余額等)因變量與自變量之間的關(guān)系用一個(gè)線性方程來表示回歸模型

(regressionmodel)回答“變量之間是什么樣的關(guān)系?”方程中運(yùn)用1個(gè)數(shù)值型因變量(響應(yīng)變量)被預(yù)測的變量1個(gè)或多個(gè)數(shù)值型或分類型自變量(解釋變量)用于預(yù)測的變量3. 主要用于預(yù)測和估計(jì)一元線性回歸模型描述因變量y如何依賴于自變量x和誤差項(xiàng)

的方程稱為回歸模型一元線性回歸模型可表示為

y=b0+b1x+ey是x的線性函數(shù)(部分)加上誤差項(xiàng)線性部分反映了由于x的變化而引起的y的變化誤差項(xiàng)

是隨機(jī)變量反映了除x和y之間的線性關(guān)系之外的隨機(jī)因素對y的影響是不能由x和y之間的線性關(guān)系所解釋的變異性

0和

1稱為模型的參數(shù)一元線性回歸模型

e

誤差項(xiàng)e是未包括在模型中而影響y的全部變量的替代物,為什么不把這些變量都引進(jìn)到模型中來呢?即,為什么不構(gòu)造一個(gè)含有盡可能多個(gè)變量的回歸模型?理論的含糊性。即使有決定y的行為理論,但常常是不完全的,影響y的變量不是無所知就是知而不確。數(shù)據(jù)的欠缺。明知被忽略變量中的一些變量,但也不一定能得到關(guān)于這些變量的數(shù)量信息。核心變量與周邊變量。影響y的某些變量,合起來的影響太小,把它們一一引入模型是不合算的。一元線性回歸模型

e人類行為的內(nèi)在隨機(jī)性。糟糕的替代變量。實(shí)際觀測數(shù)據(jù)受到測量誤差的擾亂,誤差項(xiàng)e用來代表測量誤差。節(jié)省原則。在基本上解釋y的行為的基礎(chǔ)上,模型應(yīng)盡可能簡單。錯(cuò)誤的函數(shù)形式。考慮多變量關(guān)系時(shí),無法從圖形上想象一個(gè)多維散點(diǎn)圖,不容易決定適當(dāng)?shù)暮瘮?shù)形式。一元線性回歸模型

(基本假定)誤差項(xiàng)ε是一個(gè)期望值為0的隨機(jī)變量,即E(ε)=0。對于一個(gè)給定的x值,y的期望值為E(y)=

0+

1x(重復(fù)抽樣中,x是非隨機(jī)的)對于所有的x值,ε的方差σ2都相同誤差項(xiàng)ε是一個(gè)服從正態(tài)分布的隨機(jī)變量,且相互獨(dú)立。即ε~N(0,σ2)獨(dú)立性意味著對于一個(gè)特定的x值,它所對應(yīng)的ε與其他x值所對應(yīng)的ε不相關(guān)對于一個(gè)特定的x值,它所對應(yīng)的y值與其他x所對應(yīng)的y值也不相關(guān)回歸方程

(regressionequation)描述y的平均值或期望值如何依賴于x的方程稱為回歸方程一元線性回歸方程的形式如下

E(y)=

0+

1x方程的圖示是一條直線,也稱為直線回歸方程

0是回歸直線在y軸上的截距,是當(dāng)x=0時(shí)y的期望值

1是直線的斜率,稱為回歸系數(shù),表示當(dāng)x每變動(dòng)一個(gè)單位時(shí),y的平均變動(dòng)值估計(jì)的回歸方程

(estimatedregressionequation)一元線性回歸中估計(jì)的回歸方程為用樣本統(tǒng)計(jì)量和代替回歸方程中的未知參數(shù)和,就得到了估計(jì)的回歸方程總體回歸參數(shù)和

是未知的,必須利用樣本數(shù)據(jù)去估計(jì)其中:是估計(jì)的回歸直線在y軸上的截距,是直線的斜率,它表示對于一個(gè)給定的x的值,是y的估計(jì)值,也表示x每變動(dòng)一個(gè)單位時(shí),y的平均變動(dòng)值

參數(shù)的最小二乘估計(jì)最小二乘估計(jì)使因變量的觀察值與估計(jì)值之間的離差平方和達(dá)到最小來求得和的方法。即用最小二乘法擬合的直線來代表x與y之間的關(guān)系與實(shí)際數(shù)據(jù)的誤差比其他任何直線都小可知

0和

1的估計(jì)量的抽樣分布

0和

1具有較小的標(biāo)準(zhǔn)差最小二乘估計(jì)

(圖示)xy(xn,yn)(x1,y1)

(x2,y2)(xi,yi)}ei=yi-yi^最小二乘法

(

和的計(jì)算公式)

根據(jù)最小二乘法的要求,可得求解和的公式如下估計(jì)方程的求法

(例題分析)【例】求不良貸款對貸款余額的回歸方程回歸方程為:y=-0.8295

+0.037895

x回歸系數(shù)=0.037895表示,貸款余額每增加1億元,不良貸款平均增加0.037895億元

^估計(jì)方程的求法

(例題分析)不良貸款對貸款余額回歸方程的圖示用Excel進(jìn)行回歸分析第1步:選擇“工具”下拉菜單第2步:選擇“數(shù)據(jù)分析”選項(xiàng)第3步:在分析工具中選擇“回歸”,然后選擇“確定”第4步:當(dāng)對話框出現(xiàn)時(shí)

在“Y值輸入?yún)^(qū)域”設(shè)置框內(nèi)鍵入Y的數(shù)據(jù)區(qū)域在“X值輸入?yún)^(qū)域”設(shè)置框內(nèi)鍵入X的數(shù)據(jù)區(qū)域在“置信度”選項(xiàng)中給出所需的數(shù)值在“輸出選項(xiàng)”中選擇輸出區(qū)域在“殘差”分析選項(xiàng)中選擇所需的選項(xiàng)

用Excel進(jìn)行回歸分析回歸直線的擬合優(yōu)度變差因變量

y的取值是不同的,y取值的這種波動(dòng)稱為變差。變差來源于兩個(gè)方面由于自變量x的取值不同造成的除x以外的其他因素(如x對y的非線性影響、測量誤差等)的影響對一個(gè)具體的觀測值來說,變差的大小可以通過該實(shí)際觀測值與其均值之差來表示變差的分解

(圖示)xyy{}}

離差平方和的分解

(三個(gè)平方和的關(guān)系)SST=SSR+SSE總平方和(SST){回歸平方和(SSR)殘差平方和(SSE){{離差平方和的分解

(三個(gè)平方和的意義)總平方和(SST)反映因變量的n個(gè)觀察值與其均值的總離差回歸平方和(SSR)反映自變量x的變化對因變量y取值變化的影響,或者說,是由于x與y之間的線性關(guān)系引起的y的取值變化,也稱為可解釋的平方和殘差平方和(SSE)反映除x以外的其他因素對y取值的影響,也稱為不可解釋的平方和或剩余平方和判定系數(shù)R2

(coefficientofdetermination)回歸平方和占總離差平方和的比例反映回歸直線的擬合程度取值范圍在[0,1]之間

R2

1,說明回歸方程擬合的越好;R2

0,說明回歸方程擬合的越差判定系數(shù)等于相關(guān)系數(shù)的平方,即R2=r2判定系數(shù)r2

(例題分析)【例】計(jì)算不良貸款對貸款余額回歸的判定系數(shù),并解釋其意義

判定系數(shù)的實(shí)際意義是:在不良貸款取值的變差中,有71.16%可以由不良貸款與貸款余額之間的線性關(guān)系來解釋,或者說,在不良貸款取值的變動(dòng)中,有71.16%是由貸款余額所決定的。也就是說,不良貸款取值的差異有2/3以上是由貸款余額決定的??梢姴涣假J款與貸款余額之間有較強(qiáng)的線性關(guān)系(r=0.843571).估計(jì)標(biāo)準(zhǔn)誤差

(standarderrorofestimate)實(shí)際觀察值與回歸估計(jì)值離差平方和的均方根反映實(shí)際觀察值在回歸直線周圍的分散狀況對誤差項(xiàng)

的標(biāo)準(zhǔn)差

的估計(jì),是在排除了x對y的線性影響后,y隨機(jī)波動(dòng)大小的一個(gè)估計(jì)量反映用估計(jì)的回歸方程預(yù)測y時(shí)預(yù)測誤差的大小

計(jì)算公式為注:例題的計(jì)算結(jié)果為1.9799顯著性檢驗(yàn)線性關(guān)系的檢驗(yàn)檢驗(yàn)自變量與因變量之間的線性關(guān)系是否顯著將回歸均方(MSR)同殘差均方(MSE)加以比較,應(yīng)用F檢驗(yàn)來分析二者之間的差別是否顯著回歸均方:回歸平方和SSR除以相應(yīng)的自由度(自變量的個(gè)數(shù)p)殘差均方:殘差平方和SSE除以相應(yīng)的自由度(n-p-1)線性關(guān)系的檢驗(yàn)

(檢驗(yàn)的步驟)提出假設(shè)H0:

1=0線性關(guān)系不顯著2.計(jì)算檢驗(yàn)統(tǒng)計(jì)量F確定顯著性水平

,并根據(jù)分子自由度1和分母自由度n-2找出臨界值F

作出決策:若F>F

,拒絕H0;若F<F

,不拒絕H0線性關(guān)系的檢驗(yàn)

(例題分析)提出假設(shè)H0:

1=0不良貸款與貸款余額之間的線性關(guān)系不顯著計(jì)算檢驗(yàn)統(tǒng)計(jì)量F確定顯著性水平

=0.05,并根據(jù)分子自由度1和分母自由度25-2找出臨界值F

=4.28作出決策:若F>F

,拒絕H0,線性關(guān)系顯著線性關(guān)系的檢驗(yàn)

(方差分析表)Excel輸出的方差分析表回歸系數(shù)的檢驗(yàn)在一元線性回歸中,等價(jià)于線性關(guān)系的顯著性檢驗(yàn)檢驗(yàn)x與y之間是否具有線性關(guān)系,或者說,檢驗(yàn)自變量x對因變量y的影響是否顯著理論基礎(chǔ)是回歸系數(shù)

的抽樣分布回歸系數(shù)的檢驗(yàn)

(樣本統(tǒng)計(jì)量的分布)

是根據(jù)最小二乘法求出的樣本統(tǒng)計(jì)量,它有自己的分布的分布具有如下性質(zhì)分布形式:正態(tài)分布數(shù)學(xué)期望:標(biāo)準(zhǔn)差:由于

未知,需用其估計(jì)量sy來代替得到的估計(jì)的標(biāo)準(zhǔn)差回歸系數(shù)的檢驗(yàn)

(檢驗(yàn)步驟)提出假設(shè)H0:b1=0(沒有線性關(guān)系)H1:b1

0(有線性關(guān)系)計(jì)算檢驗(yàn)的統(tǒng)計(jì)量確定顯著性水平

,并進(jìn)行決策

t>t

,拒絕H0;t<t

,不拒絕H0回歸系數(shù)的檢驗(yàn)

(例題分析)

對例題的回歸系數(shù)進(jìn)行顯著性檢驗(yàn)(

=0.05)提出假設(shè)H0:b1=0H1:b1

0計(jì)算檢驗(yàn)的統(tǒng)計(jì)量

t=7.533515>t

=2.201,拒絕H0,表明不良貸款與貸款余額之間有線性關(guān)系回歸系數(shù)的檢驗(yàn)

(例題分析)

P值的應(yīng)用P=0.000000<

=0.05,拒絕原假設(shè),不良貸款與貸款余額之間有線性關(guān)系回歸分析結(jié)果的評價(jià)用判定系數(shù)回答回歸模型在多大程度上解釋了因變量y取值的差異。考察關(guān)于誤差項(xiàng)

的正態(tài)性是否成立?所估計(jì)的回歸系數(shù)的符號(hào)是否與理論或事先預(yù)期的一致,在不良貸款與貸款余額回歸中,回歸系數(shù)為正。如果理論上認(rèn)為y與x之間的關(guān)系不僅是正的,而且是統(tǒng)計(jì)上顯著的,那么所建立的回歸方程也該如此。10.3利用回歸方程進(jìn)行估計(jì)和預(yù)測10.3.1點(diǎn)估計(jì)10.3.2區(qū)間估計(jì)利用回歸方程進(jìn)行估計(jì)和預(yù)測根據(jù)自變量x

的取值估計(jì)或預(yù)測因變量y的取值估計(jì)或預(yù)測的類型點(diǎn)估計(jì)y的平均值的點(diǎn)估計(jì)y的個(gè)別值的點(diǎn)估計(jì)區(qū)間估計(jì)y的平均值的置信區(qū)間估計(jì)y的個(gè)別值的預(yù)測區(qū)間估計(jì)點(diǎn)估計(jì)點(diǎn)估計(jì)2.點(diǎn)估計(jì)值有y的平均值的點(diǎn)估計(jì)y的個(gè)別值的點(diǎn)估計(jì)在點(diǎn)估計(jì)條件下,平均值的點(diǎn)估計(jì)和個(gè)別值的的點(diǎn)估計(jì)是一樣的,但在區(qū)間估計(jì)中則不同對于自變量x的一個(gè)給定值x0

,根據(jù)回歸方程得到因變量y的一個(gè)估計(jì)值

y的平均值的點(diǎn)估計(jì)

利用估計(jì)的回歸方程,對于自變量x的一個(gè)給定值x0

,求出因變量y的平均值的一個(gè)估計(jì)值E(y0),就是平均值的點(diǎn)估計(jì)在前面的例子中,假如我們要估計(jì)貸款余額為100億元時(shí),所有分行不良貸款的平均值,就是平均值的點(diǎn)估計(jì)。根據(jù)估計(jì)的回歸方程得y的個(gè)別值的點(diǎn)估計(jì)

利用估計(jì)的回歸方程,對于自變量x的一個(gè)給定值x0

,求出因變量y的一個(gè)個(gè)別值的估計(jì)值,就是個(gè)別值的點(diǎn)估計(jì)例如,如果我們只是想知道貸款余額為72.8億元的那個(gè)分行(這里是編號(hào)為10的那個(gè)分行)的不良貸款是多少,則屬于個(gè)別值的點(diǎn)估計(jì)。根據(jù)估計(jì)的回歸方程得區(qū)間估計(jì)區(qū)間估計(jì)點(diǎn)估計(jì)不能給出估計(jì)的精度,點(diǎn)估計(jì)值與實(shí)際值之間是有誤差的,因此需要進(jìn)行區(qū)間估計(jì)對于自變量

x的一個(gè)給定值x0,根據(jù)回歸方程得到因變量y的一個(gè)估計(jì)區(qū)間區(qū)間估計(jì)有兩種類型置信區(qū)間估計(jì)(confidenceintervalestimate)預(yù)測區(qū)間估計(jì)(predictionintervalestimate)置信區(qū)間估計(jì)利用估計(jì)的回歸方程,對于自變量x的一個(gè)給定值x0

,求出因變量y

的平均值的估計(jì)區(qū)間

,這一估計(jì)區(qū)間稱為置信區(qū)間(confidenceinterval)

E(y0)

在1-

置信水平下的置信區(qū)間為式中:se為均方殘差=(MSE)0.5置信區(qū)間估計(jì)

(例題分析)

【例】求出貸款余額為100億元時(shí),不良貸款95%置信水平下的置信區(qū)間

解:根據(jù)前面的計(jì)算結(jié)果,已知n=25,sy=1.9799,t

(25-2)=2.069置信區(qū)間為當(dāng)貸款余額為100億元時(shí),不良貸款的平均值在2.1141億元到3.8059億元之間預(yù)測區(qū)間估計(jì)利用估計(jì)的回歸方程,對于自變量x的一個(gè)給定值x0

,求出因變量y

的一個(gè)個(gè)別值的估計(jì)區(qū)間,這一區(qū)間稱為預(yù)測區(qū)間(predictioninterval)

y0在1-

置信水平下的預(yù)測區(qū)間為注意!預(yù)測區(qū)間估計(jì)

(例題分析)【例】求出貸款余額為72.8億元的那個(gè)分行,不良貸款95%的預(yù)測區(qū)間

解:根據(jù)前面的計(jì)算結(jié)果,已知n=25,sy=1.9799,t

(25-2)=2.069預(yù)測區(qū)間為貸款余額為72.8億元的那個(gè)分行,其不良貸款的預(yù)測區(qū)間在-2.2766億元到6.1366億元之間影響區(qū)間寬度的因素置信水平(1-

)區(qū)間寬度隨置信水平的增大而增大數(shù)據(jù)的離散程度s區(qū)間寬度隨離散程度的增大而增大3. 樣本容量區(qū)間寬度隨樣本容量的增大而減小4. 用于預(yù)測的xp與

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論