系列5spss之回歸分析課件91_第1頁
系列5spss之回歸分析課件91_第2頁
系列5spss之回歸分析課件91_第3頁
系列5spss之回歸分析課件91_第4頁
系列5spss之回歸分析課件91_第5頁
已閱讀5頁,還剩50頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、第第9 9章章 回歸分析回歸分析本章主要內(nèi)容本章主要內(nèi)容p線性回歸分析線性回歸分析p曲線估計曲線估計p二項二項Logistic回歸回歸第第1 1節(jié)節(jié) 線性回歸線性回歸基礎(chǔ)知識回顧基礎(chǔ)知識回顧p一元線性回歸一元線性回歸p多元線性回歸多元線性回歸p殘差分析殘差分析p其他問題其他問題1 1 一元線性回歸一元線性回歸例例1 1 x x鋼材中碳的含量鋼材中碳的含量, y , y 合金鋼的強度合金鋼的強度 需了解需了解y y與與x x之間的關(guān)系之間的關(guān)系 iX(%)Y(kg/mm2)123456789100.030.040.050.070.090.100.120.150.170.2040.539.541.

2、041.543.042.045.047.553.056.00.050.050.100.100.150.150.200.203030404050506060一元線性一元線性(總體總體)回歸模型回歸模型 一般地,假設(shè)一般地,假設(shè) ), 0()(, 0)(2210NVarExy或進一步假設(shè)其中其中為隨機誤差為回歸系數(shù))(,10tscoefficienregression變量為回歸變量為響應(yīng))(,)(regressorxresponsey最小二乘法(圖示)(經(jīng)驗經(jīng)驗)回歸方程回歸方程)(110 xxyxyxy10u t 檢驗檢驗u 方差分析法方差分析法(F 檢驗檢驗)u 相關(guān)系數(shù)法相關(guān)系數(shù)法0:0:1

3、110HH回歸的顯著性檢驗回歸的顯著性檢驗(significance of regression)SST = SSR + SSRes總平方和總平方和(SST)回歸平方和回歸平方和(SSR)ResF檢驗(檢驗(方差分析法)方差分析法)檢驗統(tǒng)計量檢驗統(tǒng)計量FF F (1,n-2),拒絕域拒絕域 反映反映y的變化由的變化由x解釋的比例解釋的比例, 回歸直線與樣本觀測值的擬合優(yōu)度回歸直線與樣本觀測值的擬合優(yōu)度, 取值范圍在取值范圍在 0 , 1 之間之間, r2 1,說明,說明y的變化大部分由回歸的變化大部分由回歸 方程解釋方程解釋,擬合優(yōu)度好擬合優(yōu)度好, r2 0,擬合優(yōu)度差擬合優(yōu)度差決定系數(shù)決定系

4、數(shù)回歸方程的擬合優(yōu)度回歸方程的擬合優(yōu)度復(fù)相關(guān)系數(shù)復(fù)相關(guān)系數(shù)修正決定系數(shù)修正決定系數(shù)) 1/()/(1Re2nSSpnSSRTsAdj1.1.反映實際觀察值在回歸直線周圍的分散狀況;反映實際觀察值在回歸直線周圍的分散狀況;2.2.說明了回歸直線的擬合程度(衡量回歸方程的說明了回歸直線的擬合程度(衡量回歸方程的代表性,代表性,測定回歸估計的精度測定回歸估計的精度););回歸標(biāo)準(zhǔn)誤差回歸標(biāo)準(zhǔn)誤差例例1 ads.sav:利用線性回歸分析利用線性回歸分析 廣告收入與消費之間廣告收入與消費之間的關(guān)系的關(guān)系選擇菜單中的選擇菜單中的“Analyze = Regression = Linear”選項,選項,在彈

5、出的窗口分別選定模型的在彈出的窗口分別選定模型的因變量因變量和和自變量自變量即可。即可。結(jié)果的分析結(jié)果的分析1.Unstandardized Coefficients B 回歸系數(shù)回歸系數(shù)(參數(shù)參數(shù))的的估計估計值值 和和 。2.Unstandardized Coefficients Std. Error 估計量估計量 和和 的的標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差。3.Standardized Coefficients Beta 表示若事先把應(yīng)變量表示若事先把應(yīng)變量 Y 和自變量和自變量 X 標(biāo)準(zhǔn)化標(biāo)準(zhǔn)化后再來作回歸所得到的回歸系數(shù)后再來作回歸所得到的回歸系數(shù)(參參數(shù)數(shù))的估計值。注意的估計值。注意此時此時 0 的

6、估計值一定是的估計值一定是0。4.t 估計值估計值 和和 的的 t-檢驗統(tǒng)計量檢驗統(tǒng)計量的值的值(t-值值),其值等,其值等于于估計值估計值除以除以該估計量的該估計量的標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差。5.Sig. 相應(yīng)于各相應(yīng)于各 t-值的值的雙邊雙邊假設(shè)檢驗的假設(shè)檢驗的 p-值值。缺省原假缺省原假設(shè)為設(shè)為 H0: 0 = 0 或或 1 = 0。 0 1 0 1 0 1從輸出結(jié)果可以知道,我們得到的擬合直線是從輸出結(jié)果可以知道,我們得到的擬合直線是y = 37.187 + 1.209 x。 也即也即 = 37.187, = 1.209。上述結(jié)果表明:上述結(jié)果表明:1. = 37.187 表明,如果不作任何廣告推

7、廣,則商品的表明,如果不作任何廣告推廣,則商品的(周周)銷售額為銷售額為 37.187(萬元萬元)。2. = 1.209 表明,每增加表明,每增加 1 萬元的廣告投入,會導(dǎo)致萬元的廣告投入,會導(dǎo)致 1.209 萬元的銷售收入的增加。萬元的銷售收入的增加。3. 0 表明,廣告投入于銷售收入之間有一定的表明,廣告投入于銷售收入之間有一定的正比關(guān)正比關(guān)系系. 0 1 0 1 12 多元線性回歸模型多元線性回歸模型例例:某公司為了了解營銷手段對某一種某公司為了了解營銷手段對某一種食品產(chǎn)品的銷售量產(chǎn)生的影響,統(tǒng)食品產(chǎn)品的銷售量產(chǎn)生的影響,統(tǒng)計了三年期間的周銷售數(shù)據(jù),見計了三年期間的周銷售數(shù)據(jù),見SPSS

8、數(shù)據(jù)文件數(shù)據(jù)文件 food.sav。kkxxxy.22110多元線性回歸模型多元線性回歸模型假設(shè)假設(shè)2)(Var0)(EkkxxxyE.)(22110回歸系數(shù)的最小二乘估計回歸系數(shù)的最小二乘估計YXXX1)(ssMSpnSSReRe2的估計2(經(jīng)驗經(jīng)驗)回歸方程回歸方程jkjjxxy10 反映反映y的變化由的變化由x解釋的比例解釋的比例, 回歸直線與樣本觀測值的擬合優(yōu)度回歸直線與樣本觀測值的擬合優(yōu)度, 取值范圍在取值范圍在 0 , 1 之間之間, r2 1,說明,說明y的變化大部分由回歸的變化大部分由回歸 方程解釋方程解釋,擬合優(yōu)度好擬合優(yōu)度好, r2 0,擬合優(yōu)度差擬合優(yōu)度差決定系數(shù)決定系數(shù)

9、回歸方程的擬合優(yōu)度回歸方程的擬合優(yōu)度復(fù)相關(guān)系數(shù)復(fù)相關(guān)系數(shù)修正決定系數(shù)修正決定系數(shù)) 1/()/(1Re2nSSpnSSRTsAdj1.1.反映實際觀察值在回歸直線周圍的分散狀況;反映實際觀察值在回歸直線周圍的分散狀況;2.2.說明了回歸直線的擬合程度(衡量回歸方程的說明了回歸直線的擬合程度(衡量回歸方程的代表性,代表性,測定回歸估計的精度測定回歸估計的精度););回歸標(biāo)準(zhǔn)誤差回歸標(biāo)準(zhǔn)誤差回歸的顯著性檢驗(回歸的顯著性檢驗(F檢驗)檢驗)0,.,:H 0.: 211210不全為kkH) 1,() 1/(/ ReReknkFMSMSknSSkSSFsRsRk,.,2 , 1j 0 :H 0 :H

10、j1j0回歸系數(shù)的顯著性檢驗回歸系數(shù)的顯著性檢驗t檢驗檢驗) 1( t0kntcjjj例例2 :某公司為了了解營銷手段對某一種某公司為了了解營銷手段對某一種食品產(chǎn)品的銷售量產(chǎn)生的影響,統(tǒng)食品產(chǎn)品的銷售量產(chǎn)生的影響,統(tǒng)計了三年期間的周銷售數(shù)據(jù),見計了三年期間的周銷售數(shù)據(jù),見SPSS數(shù)據(jù)文件數(shù)據(jù)文件 food.sav。以周銷售量為因變量以周銷售量為因變量,促銷價格和特色廣告促銷價格和特色廣告為自變量為自變量,建立線性回歸模型建立線性回歸模型. SPSS操作操作 仍選擇菜單中的仍選擇菜單中的“Analyze = Regression = Linear”選項,選項, 回歸方程為回歸方程為 vol =

11、171500.1171500.1 9042.69042.6 promp + 100.7 feat + 經(jīng)檢驗,上式中各變量經(jīng)檢驗,上式中各變量(的參數(shù)的參數(shù))均是均是顯著顯著(0)的。的。 上式結(jié)果表明:上式結(jié)果表明:如果特色廣告保持不變?nèi)绻厣珡V告保持不變,則促銷價,則促銷價格每上漲一元,周銷售下跌格每上漲一元,周銷售下跌9042.6元;元;如果促銷價如果促銷價格保持不變格保持不變,則每增加一元的特色廣告投入,會帶,則每增加一元的特色廣告投入,會帶來來100.7元的周銷售量的增加。元的周銷售量的增加。3 3 殘差分析殘差分析殘差殘差(residual)iiiyyeu 度量了數(shù)據(jù)和擬合值間的偏

12、離度量了數(shù)據(jù)和擬合值間的偏離u反映了反映變量中不能由回歸模型解釋的部分反映了反映變量中不能由回歸模型解釋的部分u 的實現(xiàn)的實現(xiàn)(觀測觀測)值值是以自變量是以自變量x x作橫軸(或以因變量回歸值作橫軸)作橫軸(或以因變量回歸值作橫軸)以殘差作縱軸,將相應(yīng)的殘差點畫在直角坐標(biāo)以殘差作縱軸,將相應(yīng)的殘差點畫在直角坐標(biāo)系上,就可得到殘差圖系上,就可得到殘差圖. .殘差圖殘差圖:正常的殘差圖正常的殘差圖異方差異方差異方差異方差非線性非線性正態(tài)概率圖正態(tài)概率圖如果正態(tài)性假設(shè)成立如果正態(tài)性假設(shè)成立, ,那么圖中的點將形成一條直線那么圖中的點將形成一條直線目的目的: :檢驗?zāi)P偷恼龖B(tài)性假設(shè)檢驗?zāi)P偷恼龖B(tài)性假設(shè)

13、1. 00. 80. 60. 40. 20. 0O bserved C um P robO bserved C um P rob1. 00. 80. 60. 40. 20. 0E xpected C um P robE xpected C um P robD ependent V ari abl e: 民航客運量(萬人)D ependent V ari abl e: 民航客運量(萬人)N orm al P -P P l ot of R egressi on S tandardi zed R esi dualN orm al P -P P l ot of R egressi on S tanda

14、rdi zed R esi dualp異常值: y空間上的異常值點l標(biāo)準(zhǔn)化殘差l學(xué)生化殘差iiiiiiheSREeZRE1刪除殘差刪除學(xué)生化殘差iiiiiheSRE1)()(iiiihee1)(觀測值為異常值時,或3|3, 3)(iiiSRESREZRE例例3 civil.sav: 研究我國民航客運量的變化趨勢與成因研究我國民航客運量的變化趨勢與成因并作殘差分析并作殘差分析例例4 高??蒲醒芯扛咝?蒲醒芯? 研究立項課題數(shù)受哪些因素影響研究立項課題數(shù)受哪些因素影響.并作殘差分析并作殘差分析4 4 其他問題其他問題 第第 1步:步: 首先將全部首先將全部K個回歸變量,分別對響應(yīng)變個回歸變量,分別

15、對響應(yīng)變量量y建立建立K個一元線性回歸方程,并分別個一元線性回歸方程,并分別 計計算這算這K個一元線性回歸方程的個一元線性回歸方程的K個回歸系數(shù)個回歸系數(shù)的的F檢驗值,設(shè)起其最大值為檢驗值,設(shè)起其最大值為F,若若 FFin 將所對應(yīng)的回歸變量首先引入回歸將所對應(yīng)的回歸變量首先引入回歸 方程方程,設(shè)引入的變量為設(shè)引入的變量為x1。l一、前進法一、前進法(forward selection)逐步回歸法逐步回歸法回歸方程中回歸方程中 的回歸系數(shù)進行偏的回歸系數(shù)進行偏F檢驗檢驗,若其最大檢驗統(tǒng)計量若其最大檢驗統(tǒng)計量 y分別與分別與建立建立K-1個二元線性回歸方程,再對這個二元線性回歸方程,再對這K-1

16、個個將所對應(yīng)的回歸變量引入回歸方程。將所對應(yīng)的回歸變量引入回歸方程。 第第2步:步:),(),(),(13121KxxxxxxKxxx,32inFF 入方程的回歸變量的入方程的回歸變量的F F值均小于值均小于 時時 為止。這時,得到的回歸方程就是最終確定為止。這時,得到的回歸方程就是最終確定的方程。的方程。 依上述方法接著做下去。直至所有未被引依上述方法接著做下去。直至所有未被引 第第3步:步:inF 第第 1步:步: 首先將全部首先將全部K個回歸變量,對響應(yīng)變量個回歸變量,對響應(yīng)變量y建建立線性回歸方程,并分別立線性回歸方程,并分別 計算計算K個回歸系個回歸系數(shù)的偏數(shù)的偏F檢驗值,設(shè)起其最小

17、值為檢驗值,設(shè)起其最小值為F,若若 FFin 將所對應(yīng)的回歸變量首先引入回歸將所對應(yīng)的回歸變量首先引入回歸 方程方程,設(shè)引入的變量為設(shè)引入的變量為x1。l三、逐步回歸法三、逐步回歸法(stepwise regression)回歸方程中回歸方程中 的回歸系數(shù)進行偏的回歸系數(shù)進行偏F檢驗檢驗,若其最大檢驗統(tǒng)計量若其最大檢驗統(tǒng)計量 y分別與分別與建立建立K-1個二元線性回歸方程,再對這個二元線性回歸方程,再對這K-1個個將所對應(yīng)的回歸變量引入回歸方程。設(shè)引入將所對應(yīng)的回歸變量引入回歸方程。設(shè)引入的回歸變量為的回歸變量為x2 第第2步:步:),(),(),(13121KxxxxxxKxxx,32inF

18、F 檢驗的回歸系數(shù)進行顯著性再對1x刪除將若1,xFFout 依上述方法接著做下去。直至沒有引入依上述方法接著做下去。直至沒有引入也沒有刪除的回歸變量也沒有刪除的回歸變量, 這時,得到的回歸方這時,得到的回歸方程就是最終確定的方程。程就是最終確定的方程。 第第3步:步:應(yīng)用回歸分析設(shè)回歸模型ppxxxy22110 存在完全的多重共線性,即對設(shè)計矩陣X的列向量存在不完全為零的一組數(shù)c0,c1,c2,cp,使得:nixcxcxccippii, 2, 1, 022110應(yīng)用回歸分析1*)*()(XXcCijjjjcVIF211jjjRc10jVIFjx量之間有嚴重的多重共線性,且這種多重共線性可能會會過度地影響最小二乘估計值??梢宰C明:方差擴大

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論