版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、1回歸分析 本章主要內(nèi)容:本章主要內(nèi)容:8.1 回歸分析概述8.2 一元線性回歸8.3 曲線回歸8.4 多元線性回歸本章內(nèi)容重點:本章內(nèi)容重點:最小二乘法的原理;回歸方程和回歸系數(shù)的顯著性檢驗;多元線性回歸及其預測和控制;軟件的求解分析。 2回歸分析的起源(回歸分析的起源(1) 英國統(tǒng)計學家英國統(tǒng)計學家F F高爾頓和皮爾遜在研究父母身高爾頓和皮爾遜在研究父母身高與其子女身高的遺傳問題時,觀察了高與其子女身高的遺傳問題時,觀察了10781078對夫婦,對夫婦,以每對夫婦的平均身高作為以每對夫婦的平均身高作為x x,而取他們的一個成年,而取他們的一個成年兒子的身高作為兒子的身高作為y y,將結果在
2、平面直角坐標系上繪成,將結果在平面直角坐標系上繪成散點圖,發(fā)現(xiàn)趨勢近乎一條直線。并計算出的回歸散點圖,發(fā)現(xiàn)趨勢近乎一條直線。并計算出的回歸直線方程為直線方程為 33.730.516yx回歸分析的起源(回歸分析的起源(2)研究結果表明研究結果表明一群高個子父輩的兒子們在同齡人中平均僅為略高一群高個子父輩的兒子們在同齡人中平均僅為略高個子,一群矮個子父輩的兒子們在同齡人中平均個子,一群矮個子父輩的兒子們在同齡人中平均僅為略矮個子,即子代的平均高度向中心僅為略矮個子,即子代的平均高度向中心“回歸回歸”了。這一趨勢現(xiàn)在被稱作了。這一趨勢現(xiàn)在被稱作“回歸效應回歸效應”。回歸分析的起源(回歸分析的起源(3
3、)后來,人們發(fā)現(xiàn)它的應用很廣,而不局限于身高后來,人們發(fā)現(xiàn)它的應用很廣,而不局限于身高的遺傳問題。的遺傳問題。如,在第一次考試中成績最差的那些學生在第如,在第一次考試中成績最差的那些學生在第二次考試中傾向于有更好的成績二次考試中傾向于有更好的成績( (比較接近所比較接近所有學生的平均成績有學生的平均成績) ),而第一次考試中成績最,而第一次考試中成績最好的那些學生在第二次考試中則傾向于有較好的那些學生在第二次考試中則傾向于有較差的成績差的成績( (同樣比較接近所有學生的平均成同樣比較接近所有學生的平均成績績) )。同樣同樣,平均來說,第一年利潤最低的公司第二,平均來說,第一年利潤最低的公司第二
4、年不會最差,而第一年利潤最高的公司第二年不會最差,而第一年利潤最高的公司第二年則不會是最好的年則不會是最好的在經(jīng)濟管理和其他領域中,人們經(jīng)常需要研究兩個或多個變量(現(xiàn)象)之間的相互(因果)關系,并使用數(shù)學模型來加以描述和解釋。如:商品銷售量與價格間的關系;產(chǎn)品的某些質量指標與某些控制因素之間的關系;家庭消費支出與家庭收入間的關系等等?;貧w分析就是對變量間存在的不確定關系進行分析的統(tǒng)計方法。回歸分析是使用得最為廣泛的統(tǒng)計學分支,本章介紹回歸分析中最基本的內(nèi)容。 68.1 回歸分析概述回歸分析概述某鋼廠生產(chǎn)的某種合金鋼有兩個重要的質量指標:抗拉強度(kg/mm2)和延伸率(%)。該合金鋼的質量標準
5、要求:抗拉強度應大于32kg/mm2;延伸率應大于33%。根據(jù)冶金學的專業(yè)知識和實踐經(jīng)驗,該合金鋼的含碳量是影響抗拉強度和延伸率的主要因素。其中含碳量高,則抗拉強度也就會相應提高,但與此同時延伸率則會降低。為降低生產(chǎn)成本,提高產(chǎn)品質量和競爭能力,該廠質量控制部門要求該種合金鋼產(chǎn)品的上述兩項質量指標的合格率都應達到99%以上。 7質量控制應用案例質量控制應用案例為達到以上質量控制要求,就需要制定該合金鋼冶煉中含碳量的工藝控制標準,也即要確定在冶煉中應將含碳量控制在什么范圍內(nèi),可以有99%的把握使抗拉強度和延伸率這兩項指標都達到要求。這是一個典型的產(chǎn)品質量控制問題,可以使用回歸分析方法求解。 8如
6、何制訂含碳量的控制標準?如何制訂含碳量的控制標準?1. 確定性關系確定性關系也即函數(shù)關系,即 Y = (X) ; Y = (X1, X2, , Xp)或 F(X, Y) = 0; F(X1, X2, , Xp, Y) = 0例:例:價格不變時商品銷售收入與銷售量的關系。9Y = cXX銷售收入Y銷售量OY 與 X 間的確定性關系 一一. 變量間的兩類關系變量間的兩類關系10家庭收入非確定性關系O家庭消費支出 = b0 + b1X2. 非確定性關系非確定性關系 指變量間雖存在著相互影響和相互制約關系,但由于許多無法預計和控制的因素的影響,使變量間的關系呈現(xiàn)不確定性。 即不能由一個或若干變量的值精
7、確地確定另一變量的值。但通過大量觀察,可以發(fā)現(xiàn)非確定性關系的變量間存在著某種統(tǒng)計規(guī)律性稱為相關關系相關關系或回歸關系回歸關系。以三口之家為單位,某種食品在某年各月的家庭平均月消費量 Y (kg)與其價格 X (元/kg) 間的調查數(shù)據(jù)如下,試分析該食品家庭平均月消費量與價格間的關系。11價格 xi 4.0 4.0 4.8 5.4 6.0 6.0 7.0 7.2 7.6 8.0 9.0 10 消費量 yi 3.0 3.8 2.6 2.8 2.0 2.9 1.9 2.2 1.9 1.2 1.5 1.6 0123450123456789101112= 0+ 1Xyx【案例案例1】商品價格與消費量的關
8、系商品價格與消費量的關系 由圖可知,該食品家庭月平均消費量 Y 與價格 X 間基本呈線性關系。這些點與直線 Y = 0 + 1X間的偏差是由其他一些無法控制的因素和觀察誤差引起的。 因此可以建立 Y 與 X 之間關系的如下線性回歸模型 Y = 0 + 1X + (8.1-1)其中 X 解釋變量(自變量) Y 被解釋變量(因變量) 0, 1 模型中的未知參數(shù)未知參數(shù) 隨機誤差項 12二二. 線性回歸模型線性回歸模型隨機誤差項產(chǎn)生的原因隨機誤差項產(chǎn)生的原因(1) 模型中忽略的其他因素對 Y 的影響;(2) 模型不準確所產(chǎn)生的偏差;(3) 模型中包含了對 Y 無顯著影響的變量;(4) 對變量的觀察誤
9、差;(5) 其他隨機因素的影響。 13線性回歸模型的數(shù)據(jù)結構線性回歸模型的數(shù)據(jù)結構 yi = 0 + 1xi + i ; i =1, 2, , N (8.1-2)其中 i 是其他因素和試驗誤差對 yi 影響的總和。 14當 X 取不完全相同的值 x1, x2, , xN 時,得到 Y 的一組相應的觀察值 y1, y2, , yN 。顯然,每一對觀察值 (xi, yi) 都應滿足(8.1-1)式。因此一元線性回歸模型有如下的數(shù)據(jù)結構:例例 解釋截距和斜率。一名統(tǒng)計學教授打算運用學生為準備期末考試而學習統(tǒng)計學的小時數(shù)(X)預測其期末考試成績(Y)。依據(jù)上學期上課班級中收集的數(shù)據(jù)建立的回歸模型如下:
10、如何解釋截距和斜率?解解 截距=35.0表示當學生不為期末考試做準備的話,期末考試平均成績是35.0。斜率=3表示每增加1小時學習時間,期末考試平均成績就變化+3.0。換句話說,每增加1小時學習時間,期末成績就增加3.0。 151. 各 i N( 0, 2 ),且相互獨立;2. 解釋變量是可以精確觀察的普通變量(非隨機變量);3. 解釋變量與隨機誤差項是各自獨立對被解釋變量產(chǎn)生影響的。稱滿足以上條件的回歸模型為經(jīng)典回歸模型經(jīng)典回歸模型。本章僅討論經(jīng)典回歸模型。但在經(jīng)濟領域中,經(jīng)濟變量間的關系通常是不會完全滿足上述條件的。例如家庭消費支出 Y 與家庭收入 X 間的回歸模型就不會是同方差的。16三
11、三. 回歸模型的經(jīng)典假設條件回歸模型的經(jīng)典假設條件1. 根據(jù)問題的實際背景、專業(yè)知識或通過對樣本數(shù)據(jù)的分析,建立描述變量間相關關系的回歸模型;2. 利用樣本數(shù)據(jù)估計模型中的未知參數(shù),得到回歸方程;3. 對模型進行檢驗;4. 利用通過檢驗的回歸方程對被解釋變量進行預測或控制。 17四四. 回歸分析的主要內(nèi)容和分析步驟回歸分析的主要內(nèi)容和分析步驟一一. 一元線性回歸模型一元線性回歸模型 設被解釋變量 Y 與 解釋變量 X 間存在線形相關關系,則 Y = 0 + 1X + ; N(0, 2 ) 其中 X 是普通變量。 則 Y N( 0+ 1X, 2 ) 稱 Y 的條件期望 E( Y|X ) = 0
12、+ 1X (8.2-1)為 Y 對 X 的回歸。 188.2 一元線性回歸一元線性回歸二二. 回歸方程回歸方程分別是參數(shù) 0 和 1 的點估計,19 1 0 , 10XYYiixy10對每一 xi 值,由回歸方程可以確定一個回歸值回歸系數(shù)回歸系數(shù)。稱(8.2-2) 式為回歸方回歸方程。記為 Y 的條件期望 E( Y|X ) 的點估計,則由(8.2-1)式, 有(8.2-2) 并稱 1 0 ,為回歸方程的并記 20),Q(10210)() (iiyy,Q。 1iy 就可求出,0; 00Q, 01Q三三. 回歸模型的參數(shù)估計回歸模型的參數(shù)估計回歸模型中的參數(shù)估計,采用的是“最小二乘法”,其原理如下
13、:Y 的各觀察值 yi 與回歸值 之差iiyy反映了 yi 與回歸直線之間的偏離程度,從而全部觀察值與回歸值的殘差平方和210)(iixy反映了全部觀察值與回歸直線間總的偏離程度。顯然, Q 的值越小,就說明回歸直線對所有樣本數(shù)據(jù)的擬和程度越好。所謂最小二乘法,就是要使為最小。只要令 21。 。xy0。yi要找一條直線,使min)(2iiyyiy xi最小二乘法原理示意圖最小二乘法原理示意圖 最小二乘結果最小二乘結果22011020niiiQyx 011120niiiiQxyx 12,iiixxyyCov x yVar xxx01yx 可以證明,23分別是參數(shù) 0 和 1 的最小方差無偏估計。
14、, )(1)(2220 xxxNDi221)()(xxDi10 和 以上兩式說明,的方差分別為:2.2.10 和10 和 四四. 最小二乘估計的性質最小二乘估計的性質在滿足經(jīng)典假設的條件下1 1回歸系數(shù)的估計精度不僅與 2 及樣本容量 N 有關,而且與各 xi 取值的分散程度有關。 在給定樣本容量下,xi 的取值越分散,的取值越分散, 則估則估計的方差就越小計的方差就越小,即對參數(shù) 0 和 1 的估計就越精確;反之估計的精確就差。了解這一點,對指導試驗或抽樣調查是非常重要的。 通過參數(shù)估計得到回歸方程后,還需要對回歸方程進行檢驗,以確定變量間是否存在顯著的線性關系。對一元線性回歸模型,如果變量
15、 Y 與 X 之間并不存在線性相關關系,則模型中的一次項系數(shù) 1 應為 0;反之,則 10。故對一元線性回歸模型,要檢驗的原假設為 H0:1 = 0以上檢驗稱為對回歸方程的顯著性檢驗,使用的仍然是方差分析方法。Y 的觀察值 y1, y2, , yN 之間的差異是由兩方面的原因引起的:(1) 解釋變量 X 的取值 xi 不同;(2) 其他因素和試驗誤差的影響。 24五五. 回歸方程的顯著性檢驗回歸方程的顯著性檢驗 為檢驗以上兩方面中哪一個對 Y 取值的影響是主要的,就需要將它們各自對 Y 取值的影響,從 yi 總的差異中分解出來。 與方差分析類似地,可以用總的偏差平方和252)(yySiT22)
16、 ()(yyyySiiiT來表示全部觀察值 yi 間總的差異量。1. 偏差平方和的分解偏差平方和的分解RESS 將 ST 作如下分解:稱 SR 為回歸平方和回歸平方和,它主要是由于變量 X 的取值不同引起的,其大小反映了 X 的對 Y 影響的重要程度。稱 SE 為剩余平方和剩余平方和或殘差平方和殘差平方和,它主要是由隨機誤差和其他因素的影響所引起的。 可以證明,262)(N/SSFER因此,在給定顯著性水平 下,若 F F (1, N-2) F(1, N-2) 2. 檢驗檢驗 H0 的統(tǒng)計量的統(tǒng)計量當 H0 為真時, 統(tǒng)計量就拒絕 H0,并稱回歸方程是顯著的,可以用回歸方程對被解釋變量進行預測
17、或控制分析; 反之,則稱回歸方程無顯著意義。 若不能拒絕 H0,則可能有以下原因:(1) Y 和 X 之間不是線性關系;(2) 模型中忽略了對 Y 有重要影響的其他因素;(3) Y 和 X 基本無關; (4) 數(shù)據(jù)誤差過大。 回歸方程的顯著性檢驗過程同樣可以列成如下方差分析表: 方差分析表27來源 平方和 自由度 均方和 F 比 顯著性 回歸 SR 1 SR 剩余 SE N-2 SE /(N-2) 總和 ST N-1 )(2N/SSER3.3.方差分析表方差分析表 【案例案例1】商品價格與消費量的關系商品價格與消費量的關系以三口之家為單位,某種食品在某年各月的家庭平均月消費量 Y (kg)與其
18、價格 X (元/kg) 間的調查數(shù)據(jù)如下,試分析該食品家庭平均月消費量與價格間的關系。280123450123456789101112= 0+ 1Xyx價格 xi 4.0 4.0 4.8 5.4 6.0 6.0 7.0 7.2 7.6 8.0 9.0 10 消費量 yi 3.0 3.8 2.6 2.8 2.0 2.9 1.9 2.2 1.9 1.2 1.5 1.6 可用 Excel 【工具】“數(shù)據(jù)分析”“回歸”求解線性回歸問題。本案例可解得29,5240. 3401.X.Y3405245240. 來源 平方和 自由度 均方和 F 比 Significance F 回歸 4.589 1 4.58
19、9 剩余 1.608 10 0.1608 28.54 0.00032 總和 6.197 11 “Significance F”為達到的顯著性水平,含義與 P-value 相同。 Significance F = 0.00032 0.001 故回歸方程是極高度顯著的。 方差分析表故所求回歸方程為:案例案例 1 求解分析求解分析說明該食品價格每上漲一元,家庭月平均消費量將下降0.34kg, kg 為該食品的最大月平均消費量。運用回歸分析,可能存在如下一些錯誤:不注意最小二乘回歸的假設條件不知道如何評估最小二乘回歸的假設條件不知道在違背某一假設條件的情況下運用除最小二乘回歸外的其它方法在對主要問題不
20、了解的情況下運用回歸模型在相關范圍外進行外推根據(jù)某研究中的因果關系得出存在顯著關系的結論3031 案例案例 1 需要繼續(xù)研究的問題需要繼續(xù)研究的問題 1. 以 90% 的可信度預測當價格為5.6元/kg時,該食品的家庭平均月消費量。 2. 該食品的生產(chǎn)商和供應商希望該食品的家庭月平均消費量能以 90% 的把握達到 2.5kg 以上, 應將價格控制在什么水平之下? 32)2( )()(11 )2( 2202N/SxxxxNNtdEi/) (00dyd,y可以證明,0100 xy五五. 預測和控制預測和控制1. 預測預測就是對解釋變量 X 的某一給定值 x0,求被解釋變量 Y 的取值 y0 的類似
21、于區(qū)間估計問題。對任一給定的 x0,由回歸方程可得 y0 的回歸值(點估計): y0 的置信度為 1- 的預測區(qū)間為置信度為 1- 的預測區(qū)間,關于預測的精度關于預測的精度33xx)(00 xdy )(00 xdy 01xy00 xx0oy允許誤差 d 的公式說明,預測區(qū)間的大小(預測精度)不僅與 、樣本容量 N 及各 xi 取值的分散程度有關, 而且和 x0 有關。當 x0 靠近時,d 就較小,反之,x0 離越遠,d 就越大。 d 是 x0 的函數(shù) d = d(x0)。 預測區(qū)間的近似計算預測區(qū)間的近似計算 當樣本容量 N 足夠大時,34)( )()(11 )(222202N/SxxxxNN
22、tdEi/ 222)()(N/SNE/td 22)(N/SZE/d或中方括號內(nèi)的部分就近似于 1。 因此 d 可以使用以下近似公式計算:其中)2/(NSE(5.2-3)(5.2-4) 就是回歸方程的標準誤差標準誤差。 由所得回歸方程 35XY0.344.526 . 534. 052. 40y4007. 0)2/(NSE由 Excel 或 SPSS 的輸出結果,可解得當 x0=5.6 時,案例案例 1 的預測問題分析的預測問題分析62. 2可得標準誤差為dt0.05(10)0.4007 = 1.81250.4007 = 0.73 故當價格為 5.6/kg 時,該食品的家庭月平均消費量的 90%
23、置信預測區(qū)間為:) ,(00dydykg )35. 3 ,89. 1 ( 362. 控制控制控制問題在質量管理及其他經(jīng)濟管理領域中有著非常廣泛的應用,它是預測的反問題。即當要求以 1- 的概率將 Y 的值控制在某一范圍 ( y1, y2 ) 內(nèi)時,應將解釋變量 X 的值控制在哪一范圍內(nèi)的問題。也即要確定 X 的兩個值 x1, x2,當 x1 X x2 時,在 1- 的置信度下可使y1 Y y2即滿足 P y1 Y y2 | x1 X x2 ,則說明無法實現(xiàn)所要求的控制目標,也即 Y 的控制范圍不能過小(與,N 及 xi 的分散程度等都有關)。 當樣本容量 N 足夠大時,可用(5.2-3)式或(
24、5.2-4)式作為 d 的近似值。 此時(5.2-5)和(5.2-6)式可簡化為:391110ydx2210ydx)0(1dydyxy10 x0yx1x2y2y1x0yx1x2y2y1控制范圍的近似求解控制范圍的近似求解1210ydx2110ydx)0(1 要求以90%的概率使該食品的家庭月平均消費量達到2.5kg以上,應將價格控制在什么水平之下?40 x0yx22.5X.Y340524dY 5210.dx )2()2(N/SNEtd本例中,可得 dt0.1(10)0.4007 = 0.55由 4.52 - 0.34x - 0.55 2.5可解得:x 4.32 故應將該食品價格控制在4.32元
25、/kg 之下。 注意,對于單側控制案例案例 1 的控制要求分析的控制要求分析 顯然,這是一個單側控制問題。即要確定 x2的值,使某鋼廠生產(chǎn)的某種合金鋼有兩個重要的質量指標:抗拉強度(kg/mm2)和延伸率(%)。該合金鋼的質量標準要求:抗拉強度應大于32kg/mm2;延伸率應大于33%。 根據(jù)冶金學的專業(yè)理論知識和實踐經(jīng)驗知道,該合金鋼的含碳量是影響抗拉強度和延伸率的主要因素。其中含碳量高,則抗拉強度也就會相應提高,但與此同時延伸率則會降低。為降低生產(chǎn)成本,提高產(chǎn)品質量和競爭能力,該廠質量控制部門要求該種合金鋼產(chǎn)品的上述兩項質量指標的合格率都應達到 99% 。 41質量控制應用案例質量控制應用
26、案例為達到以上質量控制要求,就需要重新修訂該合金鋼冶煉中關于含碳量的工藝控制標準。也即要確定在冶煉中應將含碳量控制在什么范圍內(nèi),可以有99%的把握使抗拉強度和延伸率這兩項指標都達到要求。 42如何制訂含碳量的控制標準如何制訂含碳量的控制標準? 1. 樣本數(shù)據(jù)的收集樣本數(shù)據(jù)的收集 為分析抗拉強度和延伸率這兩項指標與含碳量之間的關系,需要有關該合金鋼的含碳量與抗拉強度及延伸率的樣本數(shù)據(jù)。 該廠質量控制部門查閱了該合金鋼的質量檢驗紀錄,在剔除了異常情況后,整理了該合金鋼的上述兩項指標與含碳量的 92 爐實測數(shù)據(jù)(見Excel工作表)。 43案例分析案例分析 為分析抗拉強度和延伸率這兩項指標與含碳量之
27、間的關系,需要建立反映它們之間相關關系的回歸模型。 設 Y1, Y2分別為該合金鋼的抗拉強度和延伸率,X 為含碳量,則 Y1 = 01 +1 X +1 Y2 = 02 +2 X +2分別為該合金鋼抗拉強度和延伸率關于含碳量的一元線性回歸模型。 442. 建立線性回歸模型建立線性回歸模型用 Excel 分別求解本案例的兩個回歸方程,可得:4534.7728,018269.871X.Y826987772834160878. 2)2/(1NSE這一數(shù)據(jù)在求解控制范圍時需要用到。 再由輸出的方差分析表可知, Significance F = 2.05E-32 0.001,回歸方程極高度顯著。 此外還得
28、到標準誤差為:從而得到抗拉強度和含碳量間的線性回歸方程為3. 軟件軟件運行輸出結果分析運行輸出結果分析同樣可得到:46,8075.41026092.312XY6092.318075.4124669. 2)2/(2NSE 再由輸出的方差分析表, Significance F = 3.69E-10 32 41.8075 - 31.6092 X - 5.7479 33) 2/(101. 01NSZdE 解此不等式組,得: 0.0376 X 0b 0b 0令 y =1/y, x =1/x,,得: y = a + bx二二. 非線性函數(shù)的線性化方法非線性函數(shù)的線性化方法2. 冪函數(shù):冪函數(shù): y = a
29、xb 若 a 0,則 ln y = ln a + b ln x 令 y = ln y,b0 = ln a,x = ln x,得: y = b0 + bx52b 10 b 00 xya1a 0yx0b 0,則 ln y = ln a + bx 令 y = ln y,b0 = ln a,得: y = b0 + bx53ab 0yx0aa 04. 負指數(shù)函數(shù):負指數(shù)函數(shù):y = aeb/x 若a 0,則 ln y = ln a + b/x 令 y = ln y, b0 = ln a, x = 1/x 得:y = b0+ bx 54b 0a5. 對數(shù)函數(shù):對數(shù)函數(shù):y = a + b ln x令 x
30、= ln x,得:y = a + bx55b 0 x0y0yxb 0 x0yb 0a7S 型曲線:型曲線:令 y = 1/y,x = e -x,得:y = a + bx57xbeay1xy01/a1/(a+b) 在實際問題中,究竟應使用哪種曲線來配置解釋變量與被解釋變量間的回歸模型,通常可根據(jù)有關專業(yè)理論知識、或分析樣本數(shù)據(jù)的散點圖來決定。58配置曲線的原則配置曲線的原則但合適的曲線類型并不是一下就能選準的,往往需要選擇幾種類型,通過求解經(jīng)數(shù)據(jù)變換后的線性回歸方程,比較各回歸方程的顯著性水平,則顯著性水平最高的曲線對樣本數(shù)據(jù)的擬合程度最好。 對 10 家化妝品企業(yè)某年的產(chǎn)品銷售額 yi 與當年
31、廣告費投入 xi 的調查數(shù)據(jù)如下:59xi (百 萬 ) 2.0 3.0 4.5 5.4 6.0 6.8 7.6 8.2 9.5 10 yi (千 萬 ) 2.1 1.9 3.2 4.1 3.1 4.3 4.0 4.6 3.9 4.5 試分析化妝品銷售額與廣告費投入間的關系。 【案例案例2】產(chǎn)品銷售額與廣告費投入的關系產(chǎn)品銷售額與廣告費投入的關系對所給數(shù)據(jù)作散點圖如下:60/通用格式/通用格式/通用格式/通用格式/通用格式/通用格式/通用格式/通用格式/通用格式/通用格式/通用格式y(tǒng)x案例案例 2 分析分析 由圖可知 Y 與 X 之間呈非線性相關關系,Y 隨 X 增加而增加, 但增長率逐漸遞減
32、。根據(jù)這一特點可試用以下兩種曲線進行擬合: 冪函數(shù); 對數(shù)函數(shù) 設設 Y 與與 X 間為冪函數(shù)關系:間為冪函數(shù)關系: 令 Y = ln Y,X = ln X,0 = ln a 得線性回歸模型: Y = 0+ 1X + 用 Excel 求解,可得線性化后的回歸方程及方差分析表如下:61X Y0.54470.2860eaXY1來源 平方和 自由度 均方和 F 比 Significance F 回歸 0.7101 1 0.7101 剩余 0.1775 8 0.0222 32.00 0.00048 總和 0.8876 9 Significance F = 0.00048 0.001,回歸方程極高度顯著
33、。 方差分析表設設 Y 與與 X 間為對數(shù)關系:間為對數(shù)關系:令 X = ln X,得線性回歸模型:Y = 0 + 1X + 用 Excel 求解,得線性化后的回歸方程及方差分析表如下:62XY1.65666913. 0來源 平方和 自由度 均方和 F 比 Significance F 回歸 6.5675 1 6.5675 剩余 1.7735 8 0.2217 29.63 0.0006 總和 8.341 9 Significance F = 0.0006 t(N-P-1)就拒絕 H0k,說明 Xk 的作用顯著。 反之,則說明 Xk 的作用不顯著。 702. 存在不顯著變量后的處理存在不顯著變量
34、后的處理71若經(jīng)檢驗,Xk 的作用不顯著,則應從模型中剔除Xk,并重新求解 Y 對余下的 P-1 個變量的回歸方程。若檢驗中同時存在多個不顯著的變量,則每次只能剔除一個顯著性水平最低的變量,重新求解新的回歸方程。再對新的回歸系數(shù)進行檢驗,直至所有變量都顯著為止。當模型中解釋變量很多時,通常會存在較多的不顯著變量,以上步驟就非常繁瑣。更為有效的方法是采用“逐步回歸”來求解多元線性回歸方程。 逐步回歸的基本思想是:采用一定的評價標準,將解釋變量一個一個地逐步引入回歸方程。每引進一個新變量后,都對方程中的所有變量進行顯著性檢驗,并剔除不顯著的變量,被剔除的變量以后就不再進入回歸方程。采用逐步回歸方法
35、最終所得到的回歸方程與前述方法的結果是一樣的,但計算量要少得多。在 SPSS 軟件的線性回歸功能中就提供了逐步回歸的可選項。 72逐步回歸方法簡介逐步回歸方法簡介家電商品的需求量 Y 與其價格 X1 及居民家庭平均收入 X2 有關。下表給出了某市 10 年中某家電商品需求量與價格和家庭年平均收入水平間的數(shù)據(jù)。73需 求 量 (萬 臺 ) 3.0 5.0 6.5 7.0 8.5 7.5 10 9.0 11 12.5 價 格 (千 元 ) 4.0 4.5 3.5 3.0 3.0 3.5 2.5 3.0 2.5 2.0 收 入 (千 元 ) 6.0 6.8 8.0 10 16 20 22 24 26
36、 28 求該商品年需求量 Y 關于價格 X1和家庭年平均收入 X2 的回歸方程。 【案例案例3】需求量與價格及收入間的關系需求量與價格及收入間的關系用 Excel 求解案例 3,可得回歸方程如下:74 由方差分析表,Significance F = 0.0001,因而回歸方程極高度顯著。 對回歸系數(shù)的顯著性檢驗結果為: X1 的P-value = 0.0268,X2 的 P-value = 0.0262都是一般顯著。 此外還得到回歸方程的標準誤差:210.16951.90311.167XXY8618. 01)P/(NSE該值在求預測區(qū)間和控制范圍時要用到。 案例案例 3 分析分析 預計下一年度該商品的價格水平為1800元,家庭年平均收入為30000元,希望預測該商品下一年的需求量。 假定下一年度居民家庭年平均收入估計在30000-31000元之間。 若要以90%的概率使該商品的年需求量不低于12萬臺,則應將價格控制在什么范圍內(nèi)? 75案案例例 3 需要進需要進一步分析的問題一步分析的問題 1. 預測預測 在給定解釋變量的一組取值 ( x01, x02 , x0P ),由回歸方程可得回歸值76PPxxxy002201100) (00d yd, y) 1(
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024高考地理一輪復習第二部分人文地理-重在運用第三章農(nóng)業(yè)地域的形成與發(fā)展第20講農(nóng)業(yè)的區(qū)位選擇課時作業(yè)含解析新人教版
- 小學藝術教育發(fā)展年度報告
- 吊籃安全管理措施
- 九年級歷史上冊第七單元工業(yè)革命和國際共產(chǎn)主義運動的興起中考真題演練課件新人教版
- 九年級英語全冊Unit5Whataretheshirtsmadeof第4課時習題課件3
- 醫(yī)學統(tǒng)計學課件-生存分析第十七章資料講解
- 二零二五年智能制造項目合作合同示范文本下載3篇
- 2024年陽泉固莊煤礦醫(yī)院高層次衛(wèi)技人才招聘筆試歷年參考題庫頻考點附帶答案
- 二零二五年鋼結構項目居間監(jiān)理咨詢合同3篇
- 2024年江西洪州職業(yè)學院高職單招職業(yè)技能測驗歷年參考題庫(頻考版)含答案解析
- 足球D級教練員培訓匯報
- 巖溶區(qū)水文地質參數(shù)研究-洞察分析
- 三基三嚴練習題庫與答案
- 大學體育與健康 教案全套 體育舞蹈 第1-16周
- 一年級數(shù)學練習題-20以內(nèi)加減法口算題(4000道)直接打印版
- 施工作業(yè)安全管理規(guī)定(4篇)
- 浙江省金華市(2024年-2025年小學五年級語文)人教版質量測試((上下)學期)試卷及答案
- 傳媒行業(yè)突發(fā)事件應急預案
- 2024年《工會法》知識競賽題庫及答案
- 《中國血脂管理指南》考試復習題庫(含答案)
- 債務抵租金協(xié)議書范文范本
評論
0/150
提交評論