線性回歸分析教程 ppt_第1頁
線性回歸分析教程 ppt_第2頁
線性回歸分析教程 ppt_第3頁
線性回歸分析教程 ppt_第4頁
線性回歸分析教程 ppt_第5頁
已閱讀5頁,還剩73頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、1本章教學(xué)目標(biāo):本章教學(xué)目標(biāo):l了解回歸分析在經(jīng)濟與管理中的廣泛應(yīng)用;l掌握回歸分析的基本概念、基本原理及其分析應(yīng)用的基本步驟;l熟練掌握使用軟件求解回歸方程及其運行輸出結(jié)果的分析與使用;l能應(yīng)用回歸分析方法解決實際問題(分析各種變量間的關(guān)系,進行預(yù)測和控制) 第第8章章 回歸分析回歸分析2 本章主要內(nèi)容:本章主要內(nèi)容:8.1 回歸分析概述8.2 一元線性回歸8.3 曲線回歸8.4 多元線性回歸本章內(nèi)容重點:本章內(nèi)容重點:最小二乘法的原理;回歸方程和回歸系數(shù)的顯著性檢驗;多元線性回歸及其預(yù)測和控制;軟件的求解分析。 3在經(jīng)濟管理和其他領(lǐng)域中,人們經(jīng)常需要研究兩個或多個變量(現(xiàn)象)之間的相互(因

2、果)關(guān)系,并使用數(shù)學(xué)模型來加以描述和解釋。如:商品銷售量與價格間的關(guān)系;產(chǎn)品的某些質(zhì)量指標(biāo)與某些控制因素之間的關(guān)系;家庭消費支出與家庭收入間的關(guān)系等等?;貧w分析就是對變量間存在的不確定關(guān)系進行分析的統(tǒng)計方法?;貧w分析是使用得最為廣泛的統(tǒng)計學(xué)分支,在質(zhì)量管理、市場營銷、宏觀經(jīng)濟管理等領(lǐng)域都有非常廣泛的應(yīng)用。本章介紹回歸分析中最基本的內(nèi)容。 8.1 回歸分析概述回歸分析概述4某鋼廠生產(chǎn)的某種合金鋼有兩個重要的質(zhì)量指標(biāo):抗拉強度(kg/mm2)和延伸率(%)。該合金鋼的質(zhì)量標(biāo)準(zhǔn)要求:抗拉強度應(yīng)大于32kg/mm2;延伸率應(yīng)大于33%。根據(jù)冶金學(xué)的專業(yè)知識和實踐經(jīng)驗,該合金鋼的含碳量是影響抗拉強度和延

3、伸率的主要因素。其中含碳量高,則抗拉強度也就會相應(yīng)提高,但與此同時延伸率則會降低。為降低生產(chǎn)成本,提高產(chǎn)品質(zhì)量和競爭能力,該廠質(zhì)量控制部門要求該種合金鋼產(chǎn)品的上述兩項質(zhì)量指標(biāo)的合格率都應(yīng)達到99%以上。 質(zhì)量控制應(yīng)用案例質(zhì)量控制應(yīng)用案例5為達到以上質(zhì)量控制要求,就需要制定該合金鋼冶煉中含碳量的工藝控制標(biāo)準(zhǔn),也即要確定在冶煉中應(yīng)將含碳量控制在什么范圍內(nèi),可以有99%的把握使抗拉強度和延伸率這兩項指標(biāo)都達到要求。這是一個典型的產(chǎn)品質(zhì)量控制問題,可以使用回歸分析方法求解。 如何制訂含碳量的控制標(biāo)準(zhǔn)?如何制訂含碳量的控制標(biāo)準(zhǔn)?61. 確定性關(guān)系確定性關(guān)系也即函數(shù)關(guān)系,即 Y = (X) ; Y = (

4、X1, X2, , Xp)或 F(X, Y) = 0; F(X1, X2, , Xp, Y) = 0例:例:價格不變時商品銷售收入與銷售量的關(guān)系。Y = cXX銷售收入Y銷售量OY 與 X 間的確定性關(guān)系 一一. 變量間的兩類關(guān)系變量間的兩類關(guān)系7家庭收入非確定性關(guān)系O家庭消費支出 = b0 + b1X2. 非確定性關(guān)系非確定性關(guān)系 指變量間雖存在著相互影響和相互制約關(guān)系,但由于許多無法預(yù)計和控制的因素的影響,使變量間的關(guān)系呈現(xiàn)不確定性。 即不能由一個或若干變量的值精確地確定另一變量的值。但通過大量觀察,可以發(fā)現(xiàn)非確定性關(guān)系的變量間存在著某種統(tǒng)計規(guī)律性稱為相關(guān)關(guān)系相關(guān)關(guān)系或回歸關(guān)系回歸關(guān)系。8

5、以三口之家為單位,某種食品在某年各月的家庭平均月消費量 Y (kg)與其價格 X (元/kg) 間的調(diào)查數(shù)據(jù)如下,試分析該食品家庭平均月消費量與價格間的關(guān)系。價格 xi 4.0 4.0 4.8 5.4 6.0 6.0 7.0 7.2 7.6 8.0 9.0 10 消費量 yi 3.0 3.8 2.6 2.8 2.0 2.9 1.9 2.2 1.9 1.2 1.5 1.6 0123450123456789101112= 0+ 1Xyx【案例案例1】商品價格與消費量的關(guān)系商品價格與消費量的關(guān)系9 由圖可知,該食品家庭月平均消費量 Y 與價格 X 間基本呈線性關(guān)系。這些點與直線 Y = 0 + 1X

6、間的偏差是由其他一些無法控制的因素和觀察誤差引起的。 因此可以建立 Y 與 X 之間關(guān)系的如下線性回歸模型 Y = 0 + 1X + (8.1-1)其中 X 解釋變量(自變量) Y 被解釋變量(因變量) 0, 1 模型中的未知參數(shù)未知參數(shù) 隨機誤差項 二二. 線性回歸模型線性回歸模型10隨機誤差項產(chǎn)生的原因隨機誤差項產(chǎn)生的原因(1) 模型中忽略的其他因素對 Y 的影響;(2) 模型不準(zhǔn)確所產(chǎn)生的偏差;(3) 模型中包含了對 Y 無顯著影響的變量;(4) 對變量的觀察誤差;(5) 其他隨機因素的影響。 11線性回歸模型的數(shù)據(jù)結(jié)構(gòu)線性回歸模型的數(shù)據(jù)結(jié)構(gòu) yi = 0 + 1xi + i ; i =

7、1, 2, , N (8.1-2)其中 i 是其他因素和試驗誤差對 yi 影響的總和。 當(dāng) X 取不完全相同的值 x1, x2, , xN 時,得到 Y 的一組相應(yīng)的觀察值 y1, y2, , yN 。顯然,每一對觀察值 (xi, yi) 都應(yīng)滿足(5.1-1)式。因此一元線性回歸模型有如下的數(shù)據(jù)結(jié)構(gòu):12例例 解釋截距和斜率一名統(tǒng)計學(xué)教授打算運用學(xué)生為準(zhǔn)備期末考試而學(xué)習(xí)統(tǒng)計學(xué)的小時數(shù)(X)預(yù)測其期末考試成績(Y)。依據(jù)上學(xué)期上課班級中收集的數(shù)據(jù)建立的回歸模型如下:如何解釋截距和斜率?解解 截距=35.0表示當(dāng)學(xué)生不為期末考試做準(zhǔn)備的話,期末考試平均成績是35.0。斜率=3表示每增加1小時學(xué)習(xí)

8、時間,期末考試平均成績就變化+3.0。換句話說,每增加1小時學(xué)習(xí)時間,期末成績就增加3.0。 131. 各 i N( 0, 2 ),且相互獨立;2. 解釋變量是可以精確觀察的普通變量(非隨機變量);3. 解釋變量與隨機誤差項是各自獨立對被解釋變量產(chǎn)生影響的。稱滿足以上條件的回歸模型為經(jīng)典回歸模型經(jīng)典回歸模型。本章僅討論經(jīng)典回歸模型。但在經(jīng)濟領(lǐng)域中,經(jīng)濟變量間的關(guān)系通常是不會完全滿足上述條件的。例如家庭消費支出 Y 與家庭收入 X 間的回歸模型就不會是同方差的。三三. 回歸模型的經(jīng)典假設(shè)條件回歸模型的經(jīng)典假設(shè)條件141. 根據(jù)問題的實際背景、專業(yè)知識或通過對樣本數(shù)據(jù)的分析,建立描述變量間相關(guān)關(guān)系

9、的回歸模型;2. 利用樣本數(shù)據(jù)估計模型中的未知參數(shù),得到回歸方程;3. 對模型進行檢驗;4. 利用通過檢驗的回歸方程對被解釋變量進行預(yù)測或控制。 四四. 回歸分析的主要內(nèi)容和分析步驟回歸分析的主要內(nèi)容和分析步驟158.2 一元線性回歸一元線性回歸一一. 一元線性回歸模型一元線性回歸模型 設(shè)被解釋變量 Y 與 解釋變量 X 間存在線形相關(guān)關(guān)系,則 Y = 0 + 1X + ; N(0, 2 ) 其中 X 是普通變量。 則 Y N( 0+ 1X, 2 ) 稱 Y 的條件期望 E( Y|X ) = 0 + 1X (8.2-1)為 Y 對 X 的回歸。 16分別是參數(shù) 0 和 1 的點估計,二二. 回

10、歸方程回歸方程 1 0 , 10XYYiixy10對每一 xi 值,由回歸方程可以確定一個回歸值回歸系數(shù)回歸系數(shù)。稱(5.2-2) 式為回歸方回歸方程。記為 Y 的條件期望 E( Y|X ) 的點估計,則由(8.2-1)式, 有(8.2-2) 并稱 1 0 ,為回歸方程的并記 17),Q(10210)() (iiyy,Q。 1iy 就可求出,0; 00Q, 01Q三三. 回歸模型的參數(shù)估計回歸模型的參數(shù)估計回歸模型中的參數(shù)估計,采用的是“最小二乘法”,其原理如下:Y 的各觀察值 yi 與回歸值 之差iiyy反映了 yi 與回歸直線之間的偏離程度,從而全部觀察值與回歸值的殘差平方和210)(ii

11、xy反映了全部觀察值與回歸直線間總的偏離程度。顯然, Q 的值越小,就說明回歸直線對所有樣本數(shù)據(jù)的擬和程度越好。所謂最小二乘法,就是要使為最小。只要令 18。 。xy0。yi要找一條直線,使min)(2iiyyiy xi最小二乘法原理示意圖最小二乘法原理示意圖 19分別是參數(shù) 0 和 1 的最小方差無偏估計。 可以證明,, )(1)(2220 xxxNDi221)()(xxDi10 和 以上兩式說明,的方差分別為:2.2.10 和10 和 四四. 最小二乘估計的性質(zhì)最小二乘估計的性質(zhì)在滿足經(jīng)典假設(shè)的條件下1 1回歸系數(shù)的估計精度不僅與 2 及樣本容量 N 有關(guān),而且與各 xi 取值的分散程度有

12、關(guān)。 在給定樣本容量下,xi 的取值越分散,的取值越分散, 則估則估計的方差就越小計的方差就越小,即對參數(shù) 0 和 1 的估計就越精確;反之估計的精確就差。了解這一點,對指導(dǎo)試驗或抽樣調(diào)查是非常重要的。 20通過參數(shù)估計得到回歸方程后,還需要對回歸方程進行檢驗,以確定變量間是否存在顯著的線性關(guān)系。對一元線性回歸模型,如果變量 Y 與 X 之間并不存在線性相關(guān)關(guān)系,則模型中的一次項系數(shù) 1 應(yīng)為 0;反之,則 10。故對一元線性回歸模型,要檢驗的原假設(shè)為 H0:1 = 0以上檢驗稱為對回歸方程的顯著性檢驗,使用的仍然是方差分析方法。Y 的觀察值 y1, y2, , yN 之間的差異是由兩方面的原

13、因引起的:(1) 解釋變量 X 的取值 xi 不同;(2) 其他因素和試驗誤差的影響。 五五. 回歸方程的顯著性檢驗回歸方程的顯著性檢驗21 為檢驗以上兩方面中哪一個對 Y 取值的影響是主要的,就需要將它們各自對 Y 取值的影響,從 yi 總的差異中分解出來。 與方差分析類似地,可以用總的偏差平方和2)(yySiT22) ()(yyyySiiiT來表示全部觀察值 yi 間總的差異量。1. 偏差平方和的分解偏差平方和的分解RESS 將 ST 作如下分解:稱 SR 為回歸平方和回歸平方和,它主要是由于變量 X 的取值不同引起的,其大小反映了 X 的對 Y 影響的重要程度。稱 SE 為剩余平方和剩余

14、平方和或殘差平方和殘差平方和,它主要是由隨機誤差和其他因素的影響所引起的。 22可以證明,2)(N/SSFER因此,在給定顯著性水平 下,若 F F (1, N-2) F(1, N-2) 2. 檢驗檢驗 H0 的統(tǒng)計量的統(tǒng)計量當(dāng) H0 為真時, 統(tǒng)計量就拒絕 H0,并稱回歸方程是顯著的,可以用回歸方程對被解釋變量進行預(yù)測或控制分析; 反之,則稱回歸方程無顯著意義。 若不能拒絕 H0,則可能有以下原因:(1) Y 和 X 之間不是線性關(guān)系;(2) 模型中忽略了對 Y 有重要影響的其他因素;(3) Y 和 X 基本無關(guān); (4) 數(shù)據(jù)誤差過大。 23回歸方程的顯著性檢驗過程同樣可以列成如下方差分析

15、表: 方差分析表來源 平方和 自由度 均方和 F 比 顯著性 回歸 SR 1 SR 剩余 SE N-2 SE /(N-2) 總和 ST N-1 )(2N/SSER3.3.方差分析表方差分析表 24【案例案例1】商品價格與消費量的關(guān)系商品價格與消費量的關(guān)系0123450123456789101112= 0+ 1Xyx以三口之家為單位,某種食品在某年各月的家庭平均月消費量 Y (kg)與其價格 X (元/kg) 間的調(diào)查數(shù)據(jù)如下,試分析該食品家庭平均月消費量與價格間的關(guān)系。價格 xi 4.0 4.0 4.8 5.4 6.0 6.0 7.0 7.2 7.6 8.0 9.0 10 消費量 yi 3.0

16、 3.8 2.6 2.8 2.0 2.9 1.9 2.2 1.9 1.2 1.5 1.6 25可用 Excel 【工具】“數(shù)據(jù)分析”“回歸”求解線性回歸問題。本案例可解得,5240. 3401.X.Y3405245240. 來源 平方和 自由度 均方和 F 比 Significance F 回歸 4.589 1 4.589 剩余 1.608 10 0.1608 28.54 0.00032 總和 6.197 11 “Significance F”為達到的顯著性水平,含義與 P-value 相同。 Significance F = 0.00032 0.001 故回歸方程是極高度顯著的。 方差分析表

17、故所求回歸方程為:案例案例 1 求解分析求解分析說明該食品價格每上漲一元,家庭月平均消費量將下降0.34kg, kg 為該食品的最大月平均消費量。26運用回歸分析,可能存在如下一些錯誤:不注意最小二乘回歸的假設(shè)條件不知道如何評估最小二乘回歸的假設(shè)條件不知道在違背某一假設(shè)條件的情況下運用除最小二乘回歸外的其它方法在對主要問題不了解的情況下運用回歸模型在相關(guān)范圍外進行外推根據(jù)某研究中的因果關(guān)系得出存在顯著關(guān)系的結(jié)論27 案例案例 1 需要繼續(xù)研究的問題需要繼續(xù)研究的問題 1. 以 90% 的可信度預(yù)測當(dāng)價格為5.6元/kg時,該食品的家庭平均月消費量。 2. 該食品的生產(chǎn)商和供應(yīng)商希望該食品的家庭

18、月平均消費量能以 90% 的把握達到 2.5kg 以上, 應(yīng)將價格控制在什么水平之下? 28)2( )()(11 )2( 2202N/SxxxxNNtdEi/) (00dyd,y可以證明,0100 xy五五. 預(yù)測和控制預(yù)測和控制1. 預(yù)測預(yù)測就是對解釋變量 X 的某一給定值 x0,求被解釋變量 Y 的取值 y0 的類似于區(qū)間估計問題。對任一給定的 x0,由回歸方程可得 y0 的回歸值(點估計): y0 的置信度為 1- 的預(yù)測區(qū)間為置信度為 1- 的預(yù)測區(qū)間,29關(guān)于預(yù)測的精度關(guān)于預(yù)測的精度xx)(00 xdy )(00 xdy 01xy00 xx0oy允許誤差 d 的公式說明,預(yù)測區(qū)間的大

19、小(預(yù)測精度)不僅與 、樣本容量 N 及各 xi 取值的分散程度有關(guān), 而且和 x0 有關(guān)。當(dāng) x0 靠近時,d 就較小,反之,x0 離越遠,d 就越大。 d 是 x0 的函數(shù) d = d(x0)。 30預(yù)測區(qū)間的近似計算預(yù)測區(qū)間的近似計算 當(dāng)樣本容量 N 足夠大時,)( )()(11 )(222202N/SxxxxNNtdEi/ 222)()(N/SNE/td 22)(N/SZE/d或中方括號內(nèi)的部分就近似于 1。 因此 d 可以使用以下近似公式計算:其中)2/(NSE(5.2-3)(5.2-4) 就是回歸方程的標(biāo)準(zhǔn)誤差標(biāo)準(zhǔn)誤差。 31由所得回歸方程 XY0.344.526 . 534. 0

20、52. 40y4007. 0)2/(NSE由 Excel 或 SPSS 的輸出結(jié)果,可解得當(dāng) x0=5.6 時,案例案例 1 的預(yù)測問題分析的預(yù)測問題分析62. 2可得標(biāo)準(zhǔn)誤差為dt0.05(10)0.4007 = 1.81250.4007 = 0.73 故當(dāng)價格為 5.6/kg 時,該食品的家庭月平均消費量的 90% 置信預(yù)測區(qū)間為:) ,(00dydykg )35. 3 ,89. 1 ( 322. 控制控制控制問題在質(zhì)量管理及其他經(jīng)濟管理領(lǐng)域中有著非常廣泛的應(yīng)用,它是預(yù)測的反問題。即當(dāng)要求以 1- 的概率將 Y 的值控制在某一范圍 ( y1, y2 ) 內(nèi)時,應(yīng)將解釋變量 X 的值控制在哪

21、一范圍內(nèi)的問題。也即要確定 X 的兩個值 x1, x2,當(dāng) x1 X x2 時,在 1- 的置信度下可使y1 Y y2即滿足 P y1 Y y2 | x1 X x2 ,則說明無法實現(xiàn)所要求的控制目標(biāo),也即 Y 的控制范圍不能過小(與,N 及 xi 的分散程度等都有關(guān))。351110ydx2210ydx)0(1 當(dāng)樣本容量 N 足夠大時,可用(5.2-3)式或(5.2-4)式作為 d 的近似值。 此時(5.2-5)和(5.2-6)式可簡化為:dydyxy10 x0yx1x2y2y1x0yx1x2y2y1控制范圍的近似求解控制范圍的近似求解1210ydx2110ydx)0(1 36 要求以90%的

22、概率使該食品的家庭月平均消費量達到2.5kg以上,應(yīng)將價格控制在什么水平之下?x0yx22.5X.Y340524dY 5210.dx )2()2(N/SNEtd本例中,可得 dt0.1(10)0.4007 = 0.55由 4.52 - 0.34x - 0.55 2.5可解得:x 4.32 故應(yīng)將該食品價格控制在4.32元/kg 之下。 注意,對于單側(cè)控制案例案例 1 的控制要求分析的控制要求分析 顯然,這是一個單側(cè)控制問題。即要確定 x2的值,使37某鋼廠生產(chǎn)的某種合金鋼有兩個重要的質(zhì)量指標(biāo):抗拉強度(kg/mm2)和延伸率(%)。該合金鋼的質(zhì)量標(biāo)準(zhǔn)要求:抗拉強度應(yīng)大于32kg/mm2;延伸率

23、應(yīng)大于33%。 根據(jù)冶金學(xué)的專業(yè)理論知識和實踐經(jīng)驗知道,該合金鋼的含碳量是影響抗拉強度和延伸率的主要因素。其中含碳量高,則抗拉強度也就會相應(yīng)提高,但與此同時延伸率則會降低。為降低生產(chǎn)成本,提高產(chǎn)品質(zhì)量和競爭能力,該廠質(zhì)量控制部門要求該種合金鋼產(chǎn)品的上述兩項質(zhì)量指標(biāo)的合格率都應(yīng)達到 99% 。 質(zhì)量控制應(yīng)用案例質(zhì)量控制應(yīng)用案例38為達到以上質(zhì)量控制要求,就需要重新修訂該合金鋼冶煉中關(guān)于含碳量的工藝控制標(biāo)準(zhǔn)。也即要確定在冶煉中應(yīng)將含碳量控制在什么范圍內(nèi),可以有99%的把握使抗拉強度和延伸率這兩項指標(biāo)都達到要求。 如何制訂含碳量的控制標(biāo)準(zhǔn)如何制訂含碳量的控制標(biāo)準(zhǔn)?39 1. 樣本數(shù)據(jù)的收集樣本數(shù)據(jù)的

24、收集 為分析抗拉強度和延伸率這兩項指標(biāo)與含碳量之間的關(guān)系,需要有關(guān)該合金鋼的含碳量與抗拉強度及延伸率的樣本數(shù)據(jù)。 該廠質(zhì)量控制部門查閱了該合金鋼的質(zhì)量檢驗紀(jì)錄,在剔除了異常情況后,整理了該合金鋼的上述兩項指標(biāo)與含碳量的 92 爐實測數(shù)據(jù)(見Excel工作表)。 案例分析案例分析40 為分析抗拉強度和延伸率這兩項指標(biāo)與含碳量之間的關(guān)系,需要建立反映它們之間相關(guān)關(guān)系的回歸模型。 設(shè) Y1, Y2分別為該合金鋼的抗拉強度和延伸率,X 為含碳量,則 Y1 = 01 +1 X +1 Y2 = 02 +2 X +2分別為該合金鋼抗拉強度和延伸率關(guān)于含碳量的一元線性回歸模型。 2. 建立線性回歸模型建立線性

25、回歸模型41用 Excel 分別求解本案例的兩個回歸方程,可得:34.7728,018269.871X.Y826987772834160878. 2)2/(1NSE這一數(shù)據(jù)在求解控制范圍時需要用到。 再由輸出的方差分析表可知, Significance F = 2.05E-32 0.001,回歸方程極高度顯著。 此外還得到標(biāo)準(zhǔn)誤差為:從而得到抗拉強度和含碳量間的線性回歸方程為3. 軟件軟件運行輸出結(jié)果分析運行輸出結(jié)果分析42同樣可得到:,8075.41026092.312XY6092.318075.4124669. 2)2/(2NSE 再由輸出的方差分析表, Significance F =

26、3.69E-10 32 41.8075 - 31.6092 X - 5.7479 33) 2/(101. 01NSZdE 解此不等式組,得: 0.0376 X 0b 0b 0令 y =1/y, x =1/x,,得: y = a + bx二二. 非線性函數(shù)的線性化方法非線性函數(shù)的線性化方法482. 冪函數(shù):冪函數(shù): y = axb 若 a 0,則 ln y = ln a + b ln x 令 y = ln y,b0 = ln a,x = ln x,得: y = b0 + bxb 10 b 00 xya1a 0yx0b 0,則 ln y = ln a + bx 令 y = ln y,b0 = ln

27、 a,得: y = b0 + bxab 0yx0aa 0504. 負(fù)指數(shù)函數(shù):負(fù)指數(shù)函數(shù):y = aeb/x 若a 0,則 ln y = ln a + b/x 令 y = ln y, b0 = ln a, x = 1/x 得:y = b0+ bx b 0a515. 對數(shù)函數(shù):對數(shù)函數(shù):y = a + b ln x令 x = ln x,得:y = a + bxb 0 x0y0yxb 0 x0yb 0a537S 型曲線:型曲線:令 y = 1/y,x = e -x,得:y = a + bxxbeay1xy01/a1/(a+b)54 在實際問題中,究竟應(yīng)使用哪種曲線來配置解釋變量與被解釋變量間的回歸

28、模型,通??筛鶕?jù)有關(guān)專業(yè)理論知識、或分析樣本數(shù)據(jù)的散點圖來決定。配置曲線的原則配置曲線的原則但合適的曲線類型并不是一下就能選準(zhǔn)的,往往需要選擇幾種類型,通過求解經(jīng)數(shù)據(jù)變換后的線性回歸方程,比較各回歸方程的顯著性水平,則顯著性水平最高的曲線對樣本數(shù)據(jù)的擬合程度最好。 55對 10 家化妝品企業(yè)某年的產(chǎn)品銷售額 yi 與當(dāng)年廣告費投入 xi 的調(diào)查數(shù)據(jù)如下:xi (百 萬 ) 2.0 3.0 4.5 5.4 6.0 6.8 7.6 8.2 9.5 10 yi (千 萬 ) 2.1 1.9 3.2 4.1 3.1 4.3 4.0 4.6 3.9 4.5 試分析化妝品銷售額與廣告費投入間的關(guān)系。 【案

29、例案例2】產(chǎn)品銷售額與廣告費投入的關(guān)系產(chǎn)品銷售額與廣告費投入的關(guān)系56對所給數(shù)據(jù)作散點圖如下:0246024681012yx案例案例 2 分析分析 由圖可知 Y 與 X 之間呈非線性相關(guān)關(guān)系,Y 隨 X 增加而增加, 但增長率逐漸遞減。根據(jù)這一特點可試用以下兩種曲線進行擬合: 冪函數(shù); 對數(shù)函數(shù) 57設(shè)設(shè) Y 與與 X 間為冪函數(shù)關(guān)系:間為冪函數(shù)關(guān)系: 令 Y = ln Y,X = ln X,0 = ln a 得線性回歸模型: Y = 0+ 1X + 用 Excel 求解,可得線性化后的回歸方程及方差分析表如下:X Y0.54470.2860eaXY1來源 平方和 自由度 均方和 F 比 Si

30、gnificance F 回歸 0.7101 1 0.7101 剩余 0.1775 8 0.0222 32.00 0.00048 總和 0.8876 9 Significance F = 0.00048 0.001,回歸方程極高度顯著。 方差分析表58設(shè)設(shè) Y 與與 X 間為對數(shù)關(guān)系:間為對數(shù)關(guān)系:令 X = ln X,得線性回歸模型:Y = 0 + 1X + 用 Excel 求解,得線性化后的回歸方程及方差分析表如下:XY1.65666913. 0來源 平方和 自由度 均方和 F 比 Significance F 回歸 6.5675 1 6.5675 剩余 1.7735 8 0.2217 2

31、9.63 0.0006 總和 8.341 9 Significance F = 0.0006 t(N-P-1)就拒絕 H0k,說明 Xk 的作用顯著。 反之,則說明 Xk 的作用不顯著。 672. 存在不顯著變量后的處理存在不顯著變量后的處理若經(jīng)檢驗,Xk 的作用不顯著,則應(yīng)從模型中剔除Xk,并重新求解 Y 對余下的 P-1 個變量的回歸方程。若檢驗中同時存在多個不顯著的變量,則每次只能剔除一個顯著性水平最低的變量,重新求解新的回歸方程。再對新的回歸系數(shù)進行檢驗,直至所有變量都顯著為止。當(dāng)模型中解釋變量很多時,通常會存在較多的不顯著變量,以上步驟就非常繁瑣。更為有效的方法是采用“逐步回歸”來求

32、解多元線性回歸方程。 68逐步回歸的基本思想是:采用一定的評價標(biāo)準(zhǔn),將解釋變量一個一個地逐步引入回歸方程。每引進一個新變量后,都對方程中的所有變量進行顯著性檢驗,并剔除不顯著的變量,被剔除的變量以后就不再進入回歸方程。采用逐步回歸方法最終所得到的回歸方程與前述方法的結(jié)果是一樣的,但計算量要少得多。在 SPSS 軟件的線性回歸功能中就提供了逐步回歸的可選項。 逐步回歸方法簡介逐步回歸方法簡介69家電商品的需求量 Y 與其價格 X1 及居民家庭平均收入 X2 有關(guān)。下表給出了某市 10 年中某家電商品需求量與價格和家庭年平均收入水平間的數(shù)據(jù)。需 求 量 (萬 臺 ) 3.0 5.0 6.5 7.0

33、 8.5 7.5 10 9.0 11 12.5 價 格 (千 元 ) 4.0 4.5 3.5 3.0 3.0 3.5 2.5 3.0 2.5 2.0 收 入 (千 元 ) 6.0 6.8 8.0 10 16 20 22 24 26 28 求該商品年需求量 Y 關(guān)于價格 X1和家庭年平均收入 X2 的回歸方程。 【案例案例3】需求量與價格及收入間的關(guān)系需求量與價格及收入間的關(guān)系70 由方差分析表,Significance F = 0.0001,因而回歸方程極高度顯著。 對回歸系數(shù)的顯著性檢驗結(jié)果為: X1 的P-value = 0.0268,X2 的 P-value = 0.0262都是一般顯著

34、。 此外還得到回歸方程的標(biāo)準(zhǔn)誤差:用 Excel 求解案例 3,可得回歸方程如下:210.16951.90311.167XXY8618. 01)P/(NSE該值在求預(yù)測區(qū)間和控制范圍時要用到。 案例案例 3 分析分析71 預(yù)計下一年度該商品的價格水平為1800元,家庭年平均收入為30000元,希望預(yù)測該商品下一年的需求量。 假定下一年度居民家庭年平均收入估計在30000-31000元之間。 若要以90%的概率使該商品的年需求量不低于12萬臺,則應(yīng)將價格控制在什么范圍內(nèi)? 案案例例 3 需要進需要進一步分析的問題一步分析的問題72 1. 預(yù)測預(yù)測 在給定解釋變量的一組取值 ( x01, x02 , x0P ),由回歸方程可得回歸值PPxxxy002201100) (00d yd, y) 1() 1(2/PN/SPNtdE 它是 Y0 = 0 + 1X01 + 2X02 + + pX0p+ 0 的一個點估計。 可以證明,Y0 的置信度為 1- 的預(yù)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論