第八講相關(guān)與回歸分析_第1頁
第八講相關(guān)與回歸分析_第2頁
第八講相關(guān)與回歸分析_第3頁
第八講相關(guān)與回歸分析_第4頁
第八講相關(guān)與回歸分析_第5頁
已閱讀5頁,還剩84頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、第八講第八講 相關(guān)與回歸分析相關(guān)與回歸分析統(tǒng)計學(xué)(一)(一) 變量相關(guān)的概念變量相關(guān)的概念(二)(二) 相關(guān)系數(shù)及其計算相關(guān)系數(shù)及其計算一、變量間的相關(guān)關(guān)系一、變量間的相關(guān)關(guān)系變量相關(guān)的概念變量間的關(guān)系變量間的關(guān)系(函數(shù)關(guān)系(函數(shù)關(guān)系)1.是一一對應(yīng)的確定關(guān)系是一一對應(yīng)的確定關(guān)系2.設(shè)有兩個變量設(shè)有兩個變量 x 和和 y ,變量,變量 y 隨變量隨變量 x 一起變化,并完一起變化,并完全依賴全依賴于于 x ,當(dāng)變量,當(dāng)變量 x 取某取某個數(shù)值時,個數(shù)值時, y 依確定的關(guān)系依確定的關(guān)系取相應(yīng)的值,則稱取相應(yīng)的值,則稱 y 是是 x 的的函數(shù),記為函數(shù),記為 y = f (x),其中,其中 x

2、稱為自變量,稱為自變量,y 稱為因變量稱為因變量3.各觀測點落在一條線上各觀測點落在一條線上 變量間的關(guān)系變量間的關(guān)系 (函數(shù)關(guān)系)(函數(shù)關(guān)系)函數(shù)關(guān)系的例子函數(shù)關(guān)系的例子某種商品的銷售額某種商品的銷售額(y)與銷售量與銷售量(x)之間的關(guān)之間的關(guān)系可表示為系可表示為 y = p x (p 為單價為單價)圓的面積圓的面積(S)與半徑(與半徑(r)之間的關(guān)系可表示)之間的關(guān)系可表示為為S = r2 企業(yè)的原材料費用總額企業(yè)的原材料費用總額(y)與產(chǎn)品產(chǎn)量與產(chǎn)品產(chǎn)量(x1) 、單位原材料消耗量單位原材料消耗量(x2) 、單位原材料價格、單位原材料價格(x3)之間的關(guān)系可表示為之間的關(guān)系可表示為y

3、= x1 x2 x3 變量間的關(guān)系變量間的關(guān)系 (相關(guān)關(guān)系)(相關(guān)關(guān)系)1.變量間關(guān)系不能用函數(shù)關(guān)變量間關(guān)系不能用函數(shù)關(guān)系精確表達(dá)系精確表達(dá)2.一個變量的取值不能由另一個變量的取值不能由另一個變量唯一確定一個變量唯一確定3.當(dāng)變量當(dāng)變量 x 取某個值時,變?nèi)∧硞€值時,變量量 y 的取值可能有幾個的取值可能有幾個4.各觀測點分布在直線周圍各觀測點分布在直線周圍 變量間的關(guān)系變量間的關(guān)系 (相關(guān)關(guān)系(相關(guān)關(guān)系)相關(guān)關(guān)系的例子相關(guān)關(guān)系的例子商品的銷售量商品的銷售量(y)與價格與價格(x)之間的關(guān)系之間的關(guān)系商品銷售額商品銷售額(y)與廣告費支出與廣告費支出(x)之間的關(guān)系之間的關(guān)系糧食畝產(chǎn)量糧食畝產(chǎn)

4、量(y)與施肥量與施肥量(x1) 、降雨量、降雨量(x2) 、溫度溫度(x3)之間的關(guān)系之間的關(guān)系收入水平收入水平(y)與受教育程度與受教育程度(x)之間的關(guān)系之間的關(guān)系子女身高子女身高(y)與父母身高與父母身高(x)之間的關(guān)系之間的關(guān)系相關(guān)關(guān)系的類型相關(guān)關(guān)系的類型相關(guān)關(guān)系相關(guān)關(guān)系非線性非線性相關(guān)相關(guān)線性線性相關(guān)相關(guān)正正相相關(guān)關(guān)負(fù)負(fù)相相關(guān)關(guān)不相不相關(guān)關(guān)正正相相關(guān)關(guān)負(fù)負(fù)相相關(guān)關(guān)完全完全相關(guān)相關(guān)不完全不完全相關(guān)相關(guān)相關(guān)關(guān)系的圖示相關(guān)關(guān)系的圖示相關(guān)系數(shù)及其計算相關(guān)關(guān)系的測度相關(guān)關(guān)系的測度 (相關(guān)系數(shù))(相關(guān)系數(shù))1.對變量之間關(guān)系密切程度的度量對變量之間關(guān)系密切程度的度量2.對兩個變量之間線性相關(guān)程

5、度的度量稱為簡對兩個變量之間線性相關(guān)程度的度量稱為簡單相關(guān)系數(shù)單相關(guān)系數(shù)3.若相關(guān)系數(shù)是根據(jù)總體全部數(shù)據(jù)計算的,稱若相關(guān)系數(shù)是根據(jù)總體全部數(shù)據(jù)計算的,稱為總體相關(guān)系數(shù),記為為總體相關(guān)系數(shù),記為 4.若是根據(jù)樣本數(shù)據(jù)計算的,則稱為樣本相關(guān)若是根據(jù)樣本數(shù)據(jù)計算的,則稱為樣本相關(guān)系數(shù),記為系數(shù),記為 r相關(guān)關(guān)系的測度相關(guān)關(guān)系的測度(相關(guān)系數(shù))(相關(guān)系數(shù)) 樣本相關(guān)系數(shù)的計算公式樣本相關(guān)系數(shù)的計算公式相關(guān)關(guān)系的測度相關(guān)關(guān)系的測度(相關(guān)系數(shù)取值及其意義)(相關(guān)系數(shù)取值及其意義)1. r 的取值范圍是的取值范圍是 -1,12.|r|=1,為完全相關(guān)為完全相關(guān)nr =1,為完全正相關(guān),為完全正相關(guān)nr =-

6、1,為完全負(fù)正相關(guān),為完全負(fù)正相關(guān)3. r = 0,不存在線性相關(guān)關(guān)系相關(guān)不存在線性相關(guān)關(guān)系相關(guān)4.-1 r0,為負(fù)相關(guān)為負(fù)相關(guān)5.0t(13-2)=2.201,拒絕,拒絕H0,說明人,說明人均消費金額與人均國民收入之間的關(guān)系在均消費金額與人均國民收入之間的關(guān)系在5%的顯的顯著水平下是顯著的著水平下是顯著的(一)一元線性回歸方程(一)一元線性回歸方程(二)參數(shù)的最小二乘估計(二)參數(shù)的最小二乘估計(三)回歸方程的顯著性檢驗(三)回歸方程的顯著性檢驗(四)預(yù)測及應(yīng)用(四)預(yù)測及應(yīng)用二、二、 一元線性回歸一元線性回歸什么是回歸分析?什么是回歸分析?(內(nèi)容)(內(nèi)容)1.從一組樣本數(shù)據(jù)出發(fā),確定變量之

7、間的數(shù)學(xué)從一組樣本數(shù)據(jù)出發(fā),確定變量之間的數(shù)學(xué)關(guān)系式(探討變量之間一般的數(shù)量表現(xiàn))關(guān)系式(探討變量之間一般的數(shù)量表現(xiàn))2.對這些關(guān)系式的可信程度進行各種統(tǒng)計檢驗,對這些關(guān)系式的可信程度進行各種統(tǒng)計檢驗,并從影響某一特定變量的諸多變量中找出哪并從影響某一特定變量的諸多變量中找出哪些變量的影響顯著,哪些不顯著些變量的影響顯著,哪些不顯著3.利用所求的關(guān)系式,根據(jù)一個或幾個變量的利用所求的關(guān)系式,根據(jù)一個或幾個變量的取值來預(yù)測或控制另一個特定變量的取值,取值來預(yù)測或控制另一個特定變量的取值,并給出這種預(yù)測或控制的精確程度并給出這種預(yù)測或控制的精確程度回歸分析一詞是怎么來的趨向中間高度的回歸趨向中間高

8、度的回歸回歸這個術(shù)語是由英國著名統(tǒng)計學(xué)家Francis Galton在19世紀(jì)末期研究孩子及他們的父母的身高時提出來的。Galton發(fā)現(xiàn)身材高的父母,他們的孩子也高。但這些孩子平均起來并不像他們的父母那樣高。對于比較矮的父母情形也類似:他們的孩子比較矮,但這些孩子的平均身高要比他們的父母的平均身高高。 Galton把這種孩子的身高向中間值靠近的趨勢稱之為一種回歸效應(yīng),而他發(fā)展的研究兩個數(shù)值變量的方法稱為回歸分析?;貧w分析與相關(guān)分析的區(qū)別回歸分析與相關(guān)分析的區(qū)別1.相關(guān)分析中,變量相關(guān)分析中,變量 x 變量變量 y 處于平等的地位;回處于平等的地位;回歸分析中,變量歸分析中,變量 y 稱為因變量

9、,處在被解釋的地稱為因變量,處在被解釋的地位,位,x 稱為自變量,用于預(yù)測因變量的變化稱為自變量,用于預(yù)測因變量的變化2.相關(guān)分析中所涉及的變量相關(guān)分析中所涉及的變量 x 和和 y 都是隨機變量;都是隨機變量;回歸分析中,因變量回歸分析中,因變量 y 是隨機變量,自變量是隨機變量,自變量 x 可可以是隨機變量,也可以是非隨機的確定變量以是隨機變量,也可以是非隨機的確定變量3.相關(guān)分析主要是描述兩個變量之間線性關(guān)系的密相關(guān)分析主要是描述兩個變量之間線性關(guān)系的密切程度;回歸分析不僅可以揭示變量切程度;回歸分析不僅可以揭示變量 x 對變量對變量 y 的影響大小,還可以由回歸方程進行預(yù)測和控制的影響大

10、小,還可以由回歸方程進行預(yù)測和控制 回歸方程的類型回歸方程的類型一個自變量一個自變量兩個及兩個以上自變量兩個及兩個以上自變量回歸方程回歸方程多元回歸多元回歸一元回歸一元回歸線性線性回歸回歸非線性非線性回歸回歸線性線性回歸回歸非線性非線性回歸回歸一元線性回歸方程回歸方程回歸方程1.回答回答“變量之間是什么樣的關(guān)系?變量之間是什么樣的關(guān)系?”2.方程中運用方程中運用一個因變量一個因變量(被解釋變量被解釋變量)一一 個或多個自變量個或多個自變量 (解釋變量解釋變量)3. 主要用于預(yù)測和估計主要用于預(yù)測和估計一元線性回歸方程一元線性回歸方程 (概念要點(概念要點)1.當(dāng)只涉及一個自變量時稱為當(dāng)只涉及一

11、個自變量時稱為一元回歸一元回歸,若因變,若因變量量 y 與自變量與自變量 x 之間為線性關(guān)系時稱為之間為線性關(guān)系時稱為一元線一元線性回歸性回歸2.對于具有線性關(guān)系的兩個變量,可以用一條線對于具有線性關(guān)系的兩個變量,可以用一條線性方程來表示它們之間的關(guān)系性方程來表示它們之間的關(guān)系一元線性回歸方程一元線性回歸方程 (概念要點)(概念要點)3. 描述描述 y 的平均值或期望值如何依賴于的平均值或期望值如何依賴于 x 的方的方程稱為程稱為回歸方程回歸方程4. 簡單線性回歸方程的形式如下簡單線性回歸方程的形式如下 y=a+bx方程的圖示是一條直線,因此也稱為直線回歸方程方程的圖示是一條直線,因此也稱為直

12、線回歸方程a 是回歸直線在是回歸直線在 y 軸上的截距,是當(dāng)軸上的截距,是當(dāng) x=0 時時 y 的期的期望值望值b 是直線的斜率,稱為回歸系數(shù),表示當(dāng)是直線的斜率,稱為回歸系數(shù),表示當(dāng) x 每變動每變動一個單位時,一個單位時,y 的平均變動值的平均變動值參數(shù) a 和 b 的最小二乘估計最小二乘法最小二乘法(最小平方法最小平方法) (概念要點(概念要點)1. 使因變量的觀察值與估計值之間的離差平方和使因變量的觀察值與估計值之間的離差平方和達(dá)到最小來求得達(dá)到最小來求得 a 和和 b 的方法。即的方法。即2. 用最小二乘法擬合的直線來代表用最小二乘法擬合的直線來代表x與與y之間的之間的關(guān)系關(guān)系,它與

13、實際數(shù)據(jù)的誤差比其他任何直線都它與實際數(shù)據(jù)的誤差比其他任何直線都小小最小二乘法最小二乘法(圖示)(圖示)ciiyye最小二乘法最小二乘法 ( a 和和 b 的計算公式的計算公式)回歸方程的求法回歸方程的求法(實例)(實例) 【例】【例】根據(jù)例根據(jù)例7.1中的數(shù)據(jù),配合人均消費金額中的數(shù)據(jù),配合人均消費金額對人均國民收入的回歸方程對人均國民收入的回歸方程 根據(jù)根據(jù) b 和和 a 的求解公式得的求解公式得xyabc53. 02 .542 .5473077.98652638. 061538.57353. 025 .1282777.160733231374575 .1282799.915617313回

14、歸方程回歸方程 人均消費金額對人均國民收入的回歸方程為020040060080010001200140005001000150020002500人均消費與人均國民收入的回歸人均消費與人均國民收入的回歸回歸方程的求法回歸方程的求法(Excel的輸出結(jié)果)的輸出結(jié)果)SUMMARY OUTPUTSUMMARY OUTPUT回歸統(tǒng)計回歸統(tǒng)計Multiple RMultiple R0.9987038210.998703821R SquareR Square0.9974093220.997409322Adjusted R SquareAdjusted R Square0.9971738060.99717

15、3806標(biāo)準(zhǔn)誤差標(biāo)準(zhǔn)誤差14.9496776614.94967766觀測值觀測值13 13CoefficientsCoefficients標(biāo)準(zhǔn)誤差標(biāo)準(zhǔn)誤差t Statt StatP-valueP-valueLower 95%Lower 95%Upper 95%Upper 95%InterceptIntercept54.2228639254.22286392 8.993978698.99397869 6.0287966.0287968.56501E-058.56501E-05 34.427240334.4272403 74.018487574.0184875X Variable 1X Varia

16、ble 10.526377140.52637714 0.008088550.00808855 65.0768265.076821.39842E-151.39842E-15 0.508574350.50857435 0.544179930.54417993nixixySntb12)() 2(2nixixxnySnta12)(2)(1) 2(2ab回歸方程的顯著性檢驗離差平方和的分解離差平方和的分解1.因變量因變量 y 的取值是不同的,的取值是不同的,y 取值的這種取值的這種波動稱為波動稱為變差變差。變差來源于兩個方面。變差來源于兩個方面n由于自變量由于自變量 x 的取值不同造成的的取值不同造成的

17、n除除 x 以外的其他因素以外的其他因素(如如x對對y的非線性影響、的非線性影響、測量誤差等測量誤差等)的影響的影響2.對一個具體的觀測值來說,變差的大小可對一個具體的觀測值來說,變差的大小可以通過該實際觀測值與其均值之差以通過該實際觀測值與其均值之差 來來表示表示離差平方和的分解離差平方和的分解(圖示)(圖示)y離差分解圖離差分解圖離差平方和的分解離差平方和的分解 (三個平方和的關(guān)系)(三個平方和的關(guān)系)2. 兩端平方后求和有兩端平方后求和有1.從圖上看有從圖上看有SST = SSR + SSE總變差平方和總變差平方和(SST)回歸平方和回歸平方和(SSR)殘差平方和殘差平方和(SSE)離差

18、平方和的分解離差平方和的分解 (三個平方和的意義(三個平方和的意義)1.總平方和總平方和(SST)n反映因變量的反映因變量的 n 個觀察值與其均值的總離差個觀察值與其均值的總離差2.回歸平方和回歸平方和(SSR)n反映自變量反映自變量 x 的變化對因變量的變化對因變量 y 取值變化的影取值變化的影響,或者說,是由于響,或者說,是由于 x 與與 y 之間的線性關(guān)系引之間的線性關(guān)系引起的起的 y 的取值變化,也稱為可解釋的平方和的取值變化,也稱為可解釋的平方和3.殘差平方和殘差平方和(SSE)n反映除反映除 x 以外的其他因素對以外的其他因素對 y 取值的影響,也取值的影響,也稱為不可解釋的平方和

19、或剩余平方和稱為不可解釋的平方和或剩余平方和樣本決定系數(shù)樣本決定系數(shù) (判定系數(shù)(判定系數(shù) r2 )1.回歸平方和占總離差平方和的比例回歸平方和占總離差平方和的比例2. 反映回歸直線的擬合程度反映回歸直線的擬合程度3. 取值范圍在取值范圍在 0 , 1 之間之間4. r2 1,說明回歸方程擬合的越好;,說明回歸方程擬合的越好;r20,說明回歸方程擬合的越差,說明回歸方程擬合的越差5. 判定系數(shù)等于相關(guān)系數(shù)的平方,即判定系數(shù)等于相關(guān)系數(shù)的平方,即r2(r)2決定系數(shù)決定系數(shù)(判定系數(shù)判定系數(shù)) 決定系數(shù)就是相關(guān)系數(shù)的平方數(shù),即決定系數(shù)就是相關(guān)系數(shù)的平方數(shù),即 。在描述在描述 x 和和y之間關(guān)系密

20、切程度方面特別有用。之間關(guān)系密切程度方面特別有用。在估計在估計y 對對x的回歸直線時,我們試圖說明的回歸直線時,我們試圖說明y 的的變化可以用變化可以用x的變化來解釋。但事實上,的變化來解釋。但事實上, y 的的所有變化很少能只用所有變化很少能只用x的變化來解釋。通常把的變化來解釋。通常把變化分為變化分為“可解釋可解釋”部分和部分和“未解釋未解釋”部分。部分。也就是,也就是, y 的所有變化的所有變化=可解釋的變化可解釋的變化+未解釋的變化未解釋的變化2r2)(yyyi的所有變化2)(yyc可解釋的變化2)(ciyy未解釋的變化 決定系數(shù)決定系數(shù) ,度量了所有變化中可以,度量了所有變化中可以解

21、釋的部分所占的比例,即:解釋的部分所占的比例,即:2r222)()(yyyyric價格等)。如銀行利率、商品即由于其他原因的變化是未被解釋的(而收入的變化來解釋,的變化可以用人均國民人均消費金額中。于是,我們可以說,在上例中,,%3 . 0%7 .99,997. 0)9987. 0(9987. 022rr222)()()(ciciyyyyyy因此:因此:回歸方程的顯著性檢驗回歸方程的顯著性檢驗 (線性關(guān)系的檢驗(線性關(guān)系的檢驗 )1.檢驗自變量和因變量之間的線性關(guān)系是否檢驗自變量和因變量之間的線性關(guān)系是否顯著顯著2.具體方法是將回歸離差平方和具體方法是將回歸離差平方和(SSR)同剩余同剩余離差

22、平方和離差平方和(SSE)加以比較,應(yīng)用加以比較,應(yīng)用F檢驗來檢驗來分析二者之間的差別是否顯著分析二者之間的差別是否顯著如果是顯著的,兩個變量之間存在線性關(guān)系如果是顯著的,兩個變量之間存在線性關(guān)系如果不顯著,兩個變量之間不存在線性關(guān)系如果不顯著,兩個變量之間不存在線性關(guān)系回歸方程的顯著性檢驗回歸方程的顯著性檢驗 (檢驗的步驟)(檢驗的步驟)1.提出假設(shè)提出假設(shè)nH0:線性關(guān)系不顯著:線性關(guān)系不顯著2. 計算檢驗統(tǒng)計量計算檢驗統(tǒng)計量F3. 確定顯著性水平確定顯著性水平 ,并根據(jù)分子自由度,并根據(jù)分子自由度1和分和分母自由度母自由度n-2找出臨界值找出臨界值F 4. 作出決策:若作出決策:若F F

23、 ,拒絕拒絕H0;若若FF ,接受接受H0估計標(biāo)準(zhǔn)誤差估計標(biāo)準(zhǔn)誤差 Sy1.實際觀察值與回歸估計值離差平方和的平方根實際觀察值與回歸估計值離差平方和的平方根2.反映實際觀察值在回歸直線周圍的分散狀況反映實際觀察值在回歸直線周圍的分散狀況3.從另一個角度說明了回歸直線的擬合程度從另一個角度說明了回歸直線的擬合程度4.計算公式為計算公式為注:注:上例的計算結(jié)果為上例的計算結(jié)果為14.9514.95元,數(shù)值不大,元,數(shù)值不大, 說明說明回歸直線的擬合程度好回歸直線的擬合程度好22)(22nxybyaynyyySc某公司某公司6個月中每月廣告費用個月中每月廣告費用(x)和銷售和銷售額額(y)數(shù)據(jù)如表所

24、示:數(shù)據(jù)如表所示:練習(xí)一練習(xí)一 某公司銷售額某公司銷售額(y)和廣告費用和廣告費用(x)數(shù)據(jù)數(shù)據(jù) 單位單位:萬元萬元月份月份銷售額銷售額y廣告費用廣告費用x 123456 315 620 925 1 2 3 4 5 6 要求:要求:(1)計算相關(guān)系數(shù),說明兩者之間的關(guān)系)計算相關(guān)系數(shù),說明兩者之間的關(guān)系密切程度,并進行顯著性檢驗;密切程度,并進行顯著性檢驗;(2)建立回歸方程,并說明銷售額的變化)建立回歸方程,并說明銷售額的變化可以用廣告費用的變化來解釋的程度;可以用廣告費用的變化來解釋的程度;(3)計算估計標(biāo)準(zhǔn)誤差并說明回歸直線的)計算估計標(biāo)準(zhǔn)誤差并說明回歸直線的擬合程度的好壞。擬合程度的好

25、壞。 計計 算算 表表月份月份銷售額銷售額y廣告費用廣告費用xx 2y 2x y123456 315 620 925 1 2 3 4 5 6 1 4 9162536 9 225 36 400 81 625 3 30 18 80 45150合計合計7821911376326(1)計算相關(guān)系數(shù),說明兩者之間的)計算相關(guān)系數(shù),說明兩者之間的關(guān)系密切程度,并進行顯著性檢驗關(guān)系密切程度,并進行顯著性檢驗解:解:根據(jù)相關(guān)系數(shù)的計算公式有根據(jù)相關(guān)系數(shù)的計算公式有 銷售額與廣告費用之間的相關(guān)系數(shù)為銷售額與廣告費用之間的相關(guān)系數(shù)為 0.67 (中度正相關(guān))(中度正相關(guān)) 對計算的相關(guān)系數(shù)進行顯著性檢驗對計算的相

26、關(guān)系數(shù)進行顯著性檢驗(0.05) 提出假設(shè)提出假設(shè):H0: ;H1: 0 計算檢驗的統(tǒng)計量計算檢驗的統(tǒng)計量 根據(jù)顯著性水平根據(jù)顯著性水平 0.05,查,查t分布表得分布表得t(n-2)=2.132由于由于 t =1.8t(6-2)=2.132,接受,接受H0,我們不能,我們不能得出銷售額與廣告費用之間的關(guān)系在得出銷售額與廣告費用之間的關(guān)系在5%顯著水顯著水平下顯著的結(jié)論平下顯著的結(jié)論(2)建立回歸方程,并說明銷售額的變化)建立回歸方程,并說明銷售額的變化可以用廣告費用的變化來解釋的程度可以用廣告費用的變化來解釋的程度根據(jù)根據(jù) b 和和 a 的求解公式得的求解公式得 xyabc03. 34 .

27、24 . 262103. 367803. 321916782132662即由于其他原因)。的變化是未被解釋的(的變化來解釋,而的變化可以用廣告費用銷售額中。于是,我們可以說,決定系數(shù)%56%45,45. 0)67. 0(67. 022rr(3)計算估計標(biāo)準(zhǔn)誤差并說明回歸直線的)計算估計標(biāo)準(zhǔn)誤差并說明回歸直線的擬合程度的好壞。擬合程度的好壞。)( 1 . 72632603. 3784 . 2137622)(22萬元nxybyaynyyySc 估計標(biāo)準(zhǔn)誤差較大,回歸直線的估計標(biāo)準(zhǔn)誤差較大,回歸直線的擬合程度的不太好。擬合程度的不太好。預(yù)測及應(yīng)用利用回歸方程進行估計和預(yù)測利用回歸方程進行估計和預(yù)測1

28、.根據(jù)自變量根據(jù)自變量 x 的取值估計或預(yù)測因變量的取值估計或預(yù)測因變量 y的取值的取值2.估計或預(yù)測的類型估計或預(yù)測的類型n點估計點估計ny 的平均值的點估計的平均值的點估計ny 的個別值的點估計的個別值的點估計n區(qū)間估計區(qū)間估計ny 的平均值的置信區(qū)間估計的平均值的置信區(qū)間估計ny 的個別值的預(yù)測區(qū)間估計的個別值的預(yù)測區(qū)間估計利用回歸方程進行估計和預(yù)測利用回歸方程進行估計和預(yù)測(點估計)(點估計). 點估計值有點估計值有ny 的平均值的點估計的平均值的點估計ny 的個別值的點估計的個別值的點估計3. 在點估計條件下,平均值的點估計和個別值在點估計條件下,平均值的點估計和個別值的的點估計是一

29、樣的,但在區(qū)間估計中則不同的的點估計是一樣的,但在區(qū)間估計中則不同1. 對于自變量對于自變量 x 的一個給定值的一個給定值x0 ,根據(jù)回歸方,根據(jù)回歸方程得到因變量程得到因變量 y 的一個估計值的一個估計值利用回歸方程進行估計和預(yù)測利用回歸方程進行估計和預(yù)測(點估計)(點估計) y 的平均值的點估計的平均值的點估計1.利用估計的回歸方程,對于自變量利用估計的回歸方程,對于自變量 x 的一個的一個給定值給定值 x0 ,求出因變量,求出因變量 y 的平均值的一個的平均值的一個估計值估計值E(y0) ,就是平均值的點估計,就是平均值的點估計2.在前面的例子中,假如我們要估計人均國民在前面的例子中,假

30、如我們要估計人均國民收入為收入為2000元時,所有年份人均消費金額的元時,所有年份人均消費金額的平均值,就是平均值的點估計。根據(jù)估計的平均值,就是平均值的點估計。根據(jù)估計的回歸方程得回歸方程得利用回歸方程進行估計和預(yù)測利用回歸方程進行估計和預(yù)測(點估計)(點估計) y 的個別值的點估計的個別值的點估計1. 利用估計的回歸方程,對于自變量利用估計的回歸方程,對于自變量 x 的一個的一個給定值給定值 x0 ,求出因變量,求出因變量 y 的一個個別值的估的一個個別值的估計值計值 ,就是個別值的點估計,就是個別值的點估計2. 比如,如果我們只是想知道比如,如果我們只是想知道1990年人均國民年人均國民

31、收入為收入為1250.7元時的人均消費金額是多少,元時的人均消費金額是多少,則屬于個別值的點估計。根據(jù)估計的回歸方則屬于個別值的點估計。根據(jù)估計的回歸方程得程得利用回歸方程進行估計和預(yù)測利用回歸方程進行估計和預(yù)測 (區(qū)間估計)(區(qū)間估計)1.點估計不能給出估計的精度,點估計值與點估計不能給出估計的精度,點估計值與實際值之間是有誤差的,因此需要進行區(qū)實際值之間是有誤差的,因此需要進行區(qū)間估計間估計2.對于自變量對于自變量 x 的一個給定值的一個給定值 x0,根據(jù)回歸,根據(jù)回歸方程得到因變量方程得到因變量 y 的一個估計區(qū)間的一個估計區(qū)間3.區(qū)間估計有兩種類型區(qū)間估計有兩種類型n置信區(qū)間估計置信區(qū)

32、間估計n預(yù)測區(qū)間估計預(yù)測區(qū)間估計利用回歸方程進行估計和預(yù)測利用回歸方程進行估計和預(yù)測(置信區(qū)間估計(置信區(qū)間估計) y 的平均值的的平均值的置信區(qū)間置信區(qū)間估計估計 1.利用估計的回歸方程,對于自變量利用估計的回歸方程,對于自變量 x 的一個的一個給定值給定值 x0 ,求出因變量,求出因變量 y 的平均值的平均值E(y0)的的估計區(qū)間估計區(qū)間 ,這一估計區(qū)間稱為,這一估計區(qū)間稱為置信區(qū)間置信區(qū)間2. E(y0) 在在1- 置信水平下的置信區(qū)間置信水平下的置信區(qū)間為為niiyxxxxnSnty1220201)2(式中:式中:Sy為估為估計標(biāo)準(zhǔn)誤差計標(biāo)準(zhǔn)誤差利用回歸方程進行估計和預(yù)測利用回歸方程進

33、行估計和預(yù)測(置信區(qū)間估計(置信區(qū)間估計:算例算例) 【例】【例】根據(jù)前例,求出人均國民收入為根據(jù)前例,求出人均國民收入為1250.7元時,元時,人均消費金額人均消費金額95%的置信區(qū)間的置信區(qū)間 解:根據(jù)前面的計算結(jié)果解:根據(jù)前面的計算結(jié)果 712.57,Sy=14.95,t(13-2)2.201,n=13 置信區(qū)間為置信區(qū)間為人均消費金額人均消費金額95%的置信區(qū)間為的置信區(qū)間為:702.305元元722.835元之間元之間0y利用回歸方程進行估計和預(yù)測利用回歸方程進行估計和預(yù)測(預(yù)測區(qū)間估計)(預(yù)測區(qū)間估計) y 的個別值的的個別值的預(yù)測區(qū)間預(yù)測區(qū)間估計估計 1.利用估計的回歸方程,對于

34、自變量利用估計的回歸方程,對于自變量 x 的一個的一個給定值給定值 x0 ,求出因變量,求出因變量 y 的一個個別值的的一個個別值的估計區(qū)間,這一區(qū)間稱為估計區(qū)間,這一區(qū)間稱為預(yù)測區(qū)間預(yù)測區(qū)間 2. y0在在1- 置信水平下的預(yù)測區(qū)間為置信水平下的預(yù)測區(qū)間為利用回歸方程進行估計和預(yù)測利用回歸方程進行估計和預(yù)測(置預(yù)測區(qū)間估計(置預(yù)測區(qū)間估計:算例算例) 【例】【例】根據(jù)前例,求出根據(jù)前例,求出1990年人均國民收入為年人均國民收入為1250.7元時,人均消費金額的元時,人均消費金額的95%的預(yù)測區(qū)間的預(yù)測區(qū)間 解:解:根據(jù)前面的計算結(jié)果有根據(jù)前面的計算結(jié)果有 712.57,Sy=14.95,t

35、(13-2)2.201,n=13 置信區(qū)間置信區(qū)間為為712.57 34.469人均消費金額人均消費金額95%的預(yù)測區(qū)間為的預(yù)測區(qū)間為678.101元元747.039元之間元之間0y影響區(qū)間寬度的因素影響區(qū)間寬度的因素1. 置信水平置信水平 (1 - )n區(qū)間寬度隨置信水平的增大而增大區(qū)間寬度隨置信水平的增大而增大2. 數(shù)據(jù)的離散程度數(shù)據(jù)的離散程度 (s)n區(qū)間寬度隨離散程度的增大而增大區(qū)間寬度隨離散程度的增大而增大3. 樣本容量樣本容量n區(qū)間寬度隨樣本容量的增大而減小區(qū)間寬度隨樣本容量的增大而減小4. 用于預(yù)測的用于預(yù)測的 x0與與 x的差異程度的差異程度n區(qū)間寬度區(qū)間寬度隨隨 x0與與 x

36、 的差異程度的增大而增大的差異程度的增大而增大置信區(qū)間、預(yù)測區(qū)間、回歸方程置信區(qū)間、預(yù)測區(qū)間、回歸方程y預(yù)測上限預(yù)測上限置信上限置信上限預(yù)測下限預(yù)測下限置信下限置信下限x0 xx練習(xí)一練習(xí)一(續(xù))(續(xù))y 的平均值的點估計的平均值的點估計假如我們要估計廣告費用為假如我們要估計廣告費用為5萬元時,所有月份萬元時,所有月份銷售額的平均值,就是平均值的點估計。根據(jù)銷售額的平均值,就是平均值的點估計。根據(jù)估計的回歸方程得估計的回歸方程得y 的個別值的點估計的個別值的點估計如果我們只是想知道某月份廣告費用為如果我們只是想知道某月份廣告費用為3萬元時萬元時的銷售額是多少,則屬于個別值的點估計。根的銷售額是

37、多少,則屬于個別值的點估計。根據(jù)估計的回歸方程得據(jù)估計的回歸方程得y 的平均值的的平均值的置信區(qū)間置信區(qū)間估計估計0y 根據(jù)練習(xí)一,求出廣告費用為根據(jù)練習(xí)一,求出廣告費用為5萬元時,銷售額萬元時,銷售額在在95%的概率保證下的置信區(qū)間的概率保證下的置信區(qū)間 根據(jù)前面的計算結(jié)果根據(jù)前面的計算結(jié)果 17.55,Sy=7.1,t(6-2)2.776,n=6 置信區(qū)間為置信區(qū)間為22220202202021915 . 35611 . 7776. 255.17)()(1)2()(1)2(xxxxnySntyxxxxnySnty17.55 8.15銷售額在銷售額在95%的預(yù)測區(qū)間為的預(yù)測區(qū)間為9.4萬元萬

38、元25.7元之間元之間(一)(一) 多元線性回歸模型多元線性回歸模型(二)回歸參數(shù)的估計(二)回歸參數(shù)的估計(三)回歸方程的顯著性檢驗(三)回歸方程的顯著性檢驗(四)回歸系數(shù)的顯著性檢驗(四)回歸系數(shù)的顯著性檢驗(五)多元線性回歸的預(yù)測(五)多元線性回歸的預(yù)測三、多元線性回歸模型多元線性回歸模型多元線性回歸模型 (概念要點(概念要點)1.一個因變量與兩個及兩個以上自變量之間的回歸一個因變量與兩個及兩個以上自變量之間的回歸2.描述因變量描述因變量 y 如何依賴于自變量如何依賴于自變量 x1 , x2 , xp 的方程稱為的方程稱為多元線性回歸模型多元線性回歸模型3.涉及涉及 p 個自變量的多元線

39、性回歸模型可表示為個自變量的多元線性回歸模型可表示為b b0 ,b b1 1,b b ,b bp是參數(shù)是參數(shù) 是被稱為誤差項的隨機變量是被稱為誤差項的隨機變量 y 是是x1,,x2 , ,xp 的線性函數(shù)加上誤差項的線性函數(shù)加上誤差項 說明了包含在說明了包含在y里面但不能被里面但不能被p個自變量的線個自變量的線性關(guān)系所解釋的變異性性關(guān)系所解釋的變異性多元線性回歸模型多元線性回歸模型 (概念要點(概念要點) 對于對于 n 組實際觀察數(shù)據(jù)組實際觀察數(shù)據(jù)(yi ; xi1,,xi2 , ,xip ),(i=1,2,n),多元線性回歸模型可,多元線性回歸模型可表示為表示為多元線性回歸模型多元線性回歸模

40、型(基本假定)(基本假定)1.自變量自變量 x1,x2,xp是確定性變量,是確定性變量,不是隨機變量不是隨機變量2.隨機誤差項隨機誤差項的期望值為的期望值為0,且方差,且方差2 都都相同相同3.誤差項誤差項是一個服從正態(tài)分布的隨機變量,是一個服從正態(tài)分布的隨機變量,即即N(0,2),且相互獨立,且相互獨立多元線性回歸方程多元線性回歸方程 (概念要點)(概念要點)1.自變量自變量 x1,x2,xp是確定性變量,不是隨機是確定性變量,不是隨機變量變量2.描述描述 y 的平均值或期望值如何依賴于的平均值或期望值如何依賴于 x1, x1 ,xp的方程稱為的方程稱為多元線性回歸方程多元線性回歸方程3.多

41、元線性回歸方程的形式為多元線性回歸方程的形式為 E( y ) = b b0+ b b1 x1 + b b2 x2 + b bp xpb b1 1,b b ,b bp稱為偏回歸系數(shù)稱為偏回歸系數(shù)b bi 表示假定其他變量不變,當(dāng)表示假定其他變量不變,當(dāng) xi 每變動每變動一個單位時,一個單位時,y 的平均平均變動值的平均平均變動值多元線性回歸方方程的直觀解釋多元線性回歸方方程的直觀解釋二元線性回歸模型二元線性回歸模型(觀察到的觀察到的y)回歸面回歸面b b0 iy(x1,x2) 多元線性回歸的估計多元線性回歸的估計( (經(jīng)驗經(jīng)驗) )方程方程1.總體回歸參數(shù)總體回歸參數(shù) 是未知的,利用樣是未知的

42、,利用樣本數(shù)據(jù)去估計本數(shù)據(jù)去估計2. 用樣本統(tǒng)計量用樣本統(tǒng)計量 代替回歸方程中的代替回歸方程中的 未知參數(shù)未知參數(shù) 即得到估計的回歸方程即得到估計的回歸方程是是 估計值估計值 是是 y 的估計值的估計值參數(shù)的最小二乘估計參數(shù)的最小二乘法參數(shù)的最小二乘法 (要點(要點)2. 根據(jù)最小二乘法的要求,可得求解根據(jù)最小二乘法的要求,可得求解各回歸參數(shù)各回歸參數(shù) 的標(biāo)準(zhǔn)方程如下的標(biāo)準(zhǔn)方程如下1. 使因變量的觀察值與估計值之間的離差平方和使因變量的觀察值與估計值之間的離差平方和達(dá)到最小來求得達(dá)到最小來求得 。即。即回歸方程的顯著性檢驗多重樣本決定系數(shù)多重樣本決定系數(shù) (多重判定系數(shù)(多重判定系數(shù) R2 )1.回歸平方和占總離差平方和的比例回歸平方和占總離差平方和的比例2. 反映回歸直線的擬合程度反映回歸直線的擬合程度3. 取值范圍在取值范圍在 0 , 1 之間之間4. R2 1,說明回歸方程擬合的越好;,說明回歸方程擬合的越好; R20,說明,說明回歸方程擬合的越差回歸方程擬合的越差5. 等于多重相關(guān)系數(shù)的平方,即等于多重相關(guān)系數(shù)的平方,即R2=(R)2修正的多重樣本決定系數(shù)修正的多重樣本決定系數(shù) (修正的多重判定系數(shù)(修正的多重判定系數(shù) R2 )1.由于增加自變量將影響到因變量中被估計的由于增加自變量將影響到因變量中被估計的回歸方程所解

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論