相關與回歸分析_第1頁
相關與回歸分析_第2頁
相關與回歸分析_第3頁
相關與回歸分析_第4頁
相關與回歸分析_第5頁
已閱讀5頁,還剩73頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1第六章相關與回歸分析2一、確定現(xiàn)象之間有無關系存在,以及相關關系的表現(xiàn)形式二、確定相關關系的密切程度三、確定相關關系的數(shù)學表達式四、測定因變量估計值與實際值之間的誤差程度3第一節(jié)相關分析一、確定現(xiàn)象之間有無關系存在(一)現(xiàn)象之間關系的分類4

1、函數(shù)關系客觀現(xiàn)象之間確實存在的、而且數(shù)量表現(xiàn)上是嚴格的確定性的依存關系。在這種關系中,某一變量的的每一個數(shù)值,都有另一個變量的確定值與之對應,并且這種關系可以用一個數(shù)學表達式反映出來。

5

xy是一一對應的確定關系設有兩個變量x和y,變量y隨變量x一起變化,并完全依賴于x,當變量x取某個數(shù)值時,

y依確定的關系取相應的值,則稱y是x的函數(shù),記為y=f(x),其中x稱為自變量,y稱為因變量各觀測點落在一條線上6圓的面積(S)與半徑之間的函數(shù)關系

S=

R2

里程(D)與速度(V)、時間(t)之間的關系

D=Vt企業(yè)的原材料消耗額(y)與產量(x1)

、單位產量消耗(x2)

、原材料價格(x3)之間的關系

y=x1x2x3

72、相關關系客觀現(xiàn)象之間確實存在的、但在數(shù)量表現(xiàn)上不嚴格對應的依存關系。兩個要點:

(1)確實存在——定性分析(2)數(shù)量表現(xiàn)上不嚴格——圍繞它們的平均數(shù)并通過一定的規(guī)律變動

8變量間關系不能用函數(shù)關系精確表達一個變量的取值不能由另一個變量唯一確定當變量x取某個值時,變量y的取值可能有幾個各觀測點分布在直線周圍

xy9單位成本(y)與產量(x)的關系……父親身高(y)與子女身高(x)之間的關系社會商品零售額(y)與居民會支配收入(x)之間的關系收入(y)與文化程度(x)之間的關系商品銷售量(y)與廣告費支出(x1)、價格(x2)之間的關系103、相關關系與函數(shù)關系的聯(lián)系和區(qū)別

主要區(qū)別:隨著某一變量變化的另一變量,其數(shù)值是否確定,如果確定,則是函數(shù)關系,如果不確定,則是相關關系。主要聯(lián)系:函數(shù)關系往往通過相關關系表現(xiàn)出來,相關關系常常要用函數(shù)關系來研究。11假相關沒有本質聯(lián)系,只是表面數(shù)字的偶然的巧合;如上證股票價格綜合指數(shù)與氣溫的關系。因果關系原因與結果之間、影響因素與被影響因素之間的關系。相關關系比因果關系包括的范圍更廣泛。即,因果關系屬于相關關系,但相關關系不一定是因果關系。統(tǒng)計只能說明現(xiàn)象間有無數(shù)量上的關系,不能說明誰因誰果(其它有關概念)12(二)相關關系的種類13二、相關關系的測定進行相關分析的一般程序:相關表和相關圖定性分析定量分析計算相關系數(shù)和判定系數(shù)相關分析的主要內容:測定相關關系的種類和關系的密切程度14(一)相關表和相關圖能源消耗量與工業(yè)總產值相關表:15能源消耗量與工業(yè)總產值相關圖16線性正相關

完全線性負相關

完全線性正相關線性負相關

曲線相關

不相關(零相關)17(二)直線相關的測定

相關系數(shù)——反映具有直線相關關系的兩個變量之間關系密切程度的指標。

判定系數(shù)——相關系數(shù)的平方相關系數(shù)與判定系數(shù)1819對變量之間關系密切程度的度量對兩個變量之間線性相關程度的度量稱為簡單相關系數(shù)若相關系數(shù)是根據(jù)總體全部數(shù)據(jù)計算的,稱為總體相關系數(shù),記為

若是根據(jù)樣本數(shù)據(jù)計算的,則稱為樣本相關系數(shù),記為r1、相關系數(shù)

(correlationcoefficient)202122…………(1)

…………….…..(2)

…….…(3)

235幢房屋的使用時間長短與月租金的資料2425直線相關的特點

①兩個變量是對等的;②只能計算出一個相關系數(shù);

低度線性相關

顯著線性相關

高度線性相關③相關系數(shù)可以為正數(shù),也可以為負數(shù),表示正相關或負相關;④計算相關系數(shù)要求兩個變量必須是隨機的。262、判定系數(shù)

相關系數(shù)的平方計算判定系數(shù),用R表示。在經濟計量學中又稱可決系數(shù)273、計算t值并查表確定臨界值,比較并作結論1、提出零假設與備擇假設2、確定檢驗所需的統(tǒng)計量

(三)相關系數(shù)的顯著性檢驗

——t檢驗28

拒絕原假設,說明房屋使用年限與租金之間有顯著的線性關系29第二節(jié)一元線性回歸分析一、回歸分析

1、概念

借助數(shù)學方程,揭示具有相關關系的變量之間數(shù)量變化規(guī)律的方法,稱為回歸分析法;回歸分析中的數(shù)學方程稱為回歸方程。

數(shù)量變化規(guī)律指,當自變量發(fā)生變化時,平均說來因變量會發(fā)生多大的變化。2、回歸分析與相關分析的關系(1)共同點:都是分析相關關系;相關系數(shù)與回歸系數(shù)符號相同。

30(2)區(qū)別

回歸分析相關分析3、揭示自變量的變化將引起因變量多大的平均變化量,并據(jù)此對因變量進行預測和估計

1、不必區(qū)分自變量和因變量;1、必須區(qū)分自變量和因變量,原因是自變量(解釋變量),結果是因變量(被解釋變量);2、兩個變量是對等的,都是隨機變量;2、自變量是可控、給定的一般變量;3、測定相關的種類和關系密切程31(三)回歸的種類32二、一元線性回歸方程的確定(一)

步驟關系密切程度分析;定性分析——確定現(xiàn)象之間是否有相關關系;確定自變量和因變量;確定回歸方程;分析解釋結果。33(二)一元線性回歸方程的確定1、總體回歸方程(PRF)

假設兩個具有線性相關關系的現(xiàn)象X和Y,X表示自變量(解釋變量)、Y表示因變量(被解釋變量),則Y與X的關系可用下面模型表達:

34其中

部分表示X與Y的線性關系,是X對Y所作出的解釋;

是隨機變量,表示其他因素(包括隨機因素、偶然因素)對Y的變化所作出的解釋。

35理論假定:

滿足零均值齊方差條件,即

36誤差項ε是一個期望值為0的隨機變量,即E(ε)=0。對于一個給定的x值,y的期望值為E(y)=+

x對于所有的x值,ε的方差σ2

都相同誤差項ε是一個服從正態(tài)分布的隨機變量,且相互獨立。即ε~N(0,σ2)獨立性意味著對于一個特定的x值,它所對應的ε與其他x值所對應的ε不相關對于一個特定的x值,它所對應的y值與其他x所對應的y值也不相關一元線性回歸模型

(基本假定)3738總體線性回歸方程(PRF)

39描述y的平均值或期望值如何依賴于x的方程稱為回歸方程一元線性回歸方程的形式如下

方程的圖示是一條直線,也稱為直線回歸方程

是回歸直線在y軸上的截距,是當x=0時y的期望值

是直線的斜率,稱為回歸系數(shù),表示當x每變動一個單位時,y的平均變動值402、樣本回歸直線方程

對于線性相關關系的兩個現(xiàn)象一般情況下我們得不到

,也就得不到上述總體回歸方程,我們只能利用一段時間的樣本數(shù)據(jù)來估計

,相應的得到樣本回歸方程(SRF)。41

——因變量的估計值(回歸理論值)a——截距,表示除x外其它因素對因變量y的平均影響b——回歸系數(shù)(斜率),表示自變量x每變動一個單位時,因變量y平均變動b個單位42②樣本回歸方程參數(shù)ab的確定最小二乘法(OLS)

43x

(xi,yi)

y觀察點與樣本回歸線(圖示)44估計參數(shù)的最小二乘法

(LeastSquareMethod)最小平方法——也稱為最小二乘法使因變量的觀察值與估計值之間的離差平方和達到最小來求得a和b的方法,即滿足下列條件:即:45a

和b

的計算公式根據(jù)最小平方法的原則,利用微分求解極值(最優(yōu)值)的原理,可得求解a

和b

的標準方程組如下:X的總和?464748房屋租金的線性回歸方程為:回歸方程中參數(shù)估計值的含義:

回歸系數(shù)

b=-2.4658,表示房屋的使用年數(shù)每增加1單位(年),房屋的租金平均減少2.4658單位(元);

回歸系數(shù)與相關系數(shù)同號

截距a=58.2743,表示新房屋時,租金平均為58.2743(元)。49幾點說明:

1樣本回歸直線必然通過數(shù)據(jù)散點中心

2回歸系數(shù)與相關系數(shù)的符號取決于的xy的協(xié)方差

3回歸系數(shù)與相關系數(shù)的關系

50三、回歸估計標準差——回歸估計精度的測定指標(一)回歸估計標準差的概念

在大樣本條件下

51

該指標的作用:回歸估計標準差反映的是因變量各實際值與其估計值之間的平均差異程度,表明其估計值對各實際值的代表性的強弱,其值越小,估計值(或回歸方程)的代表性越強,用回歸方程估計或預測的結果越準確。52

(小樣本)(大樣本)

53(二)回歸估計標準差與相關系數(shù)的關系

54

總離差平方和SST回歸平方和SSR剩余平方和SSE+=55離差平方和的分解

(三個平方和的意義)總平方和(SST)反映因變量的n個觀察值與其均值的總離差回歸平方和(SSR)反映自變量x的變化對因變量y取值變化的影響,或者說,是由于x與y之間的線性關系引起的y的取值變化,也稱為可解釋的平方和殘差平方和(SSE)反映除x以外的其他因素對y取值的影響,也稱為不可解釋的平方和或剩余平方和56判定系數(shù):57判定系數(shù)是相關系數(shù)的平方5859回歸估計標準差與相關系數(shù)的關系60

直接說明關系密切程度

直接說明回歸估計的精確程度間接說明回歸估計的精確程度

間接說明關系密切程度61第三節(jié)線性相關關系的顯著性檢驗及回歸預測一、根據(jù)樣本相關系數(shù)進行檢驗——t檢驗二、根據(jù)回歸分析的結果進行檢驗

——F檢驗——t檢驗62一、根據(jù)樣本相關系數(shù)進行檢驗—t檢驗H0:

ρ=0;H1:ρ≠0根據(jù)樣本相關系數(shù)r的抽樣分布構建的檢驗統(tǒng)計量(在H0成立的前提下服從自由度為(n-2)的t分布)為:若或P值≤α,應否定H0

,表明兩個變量間存在顯著的線性相關性。631.回歸系數(shù)的顯著性檢驗—t檢驗H0:bi

=0(x與y之間沒有線性關系)H1:bi

0(x與y之間存在線性關系)采用t檢驗法(檢驗統(tǒng)計量在H0成立的前提下服從自由度為(n-2)的t分布)。二、根據(jù)回歸分析的結果進行檢驗64回歸系數(shù)的顯著性檢驗

(Excel輸出的結果)回歸方程參數(shù)估計值回歸系數(shù)的t檢驗統(tǒng)計值回歸系數(shù)檢驗的P值

Coefficients標準誤差tStatP-valueIntercept58.27435.334710.92360.001642X-2.46580.7590-3.24870.0475465H0:b=0(x與y之間沒有線性關系)H1:b

0(x與y之間存在線性關系)檢驗統(tǒng)計量F2.回歸方程的顯著性檢驗—F檢驗確定顯著性水平

,找出臨界值F

(1,n-2);計算統(tǒng)計量的樣本觀察值或P值;作出決策:若F

F

或P值<,拒絕H066回歸方程的檢驗

(Excel輸出的結果)67F檢驗與t檢驗的一致性在一元線性回歸中,回歸方程顯著,就等于回歸系數(shù)顯著:F=t2對回歸系數(shù)的

t檢驗:H0:

=0(X與Y的線性關系不顯著);H1

0(X

與Y的線性關系顯著)對回歸方程的F

檢驗:H0:

=0(X

與Y的線性關系不顯著);H1

0(X與Y的線性關系顯著)68F檢驗與t檢驗的不一致性在多元回歸中,回歸方程顯著,不等于每個回歸系數(shù)都顯著.對回歸系數(shù)的

t檢驗:H0:

i=0(Xi與Y的線性關系不顯著);H1

i0(Xi與Y的線性關系顯著)對回歸方程的F

檢驗:H0:

1=

2=…=

K=0(所有Xi與Y的線性關系都不顯著);H1

i

不全為0(至少有一個X與Y的線性關系顯著)69三、回歸預測回歸預測是根據(jù)自變量x

的取值來估計或預測因變量y的取值;估計或預測的類型點估計,給定x=xo,因變量y對應的點估計為:區(qū)間估計:70區(qū)間預測對于自變量x的一定值x0

,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論