多元線性回歸spss案例_第1頁
多元線性回歸spss案例_第2頁
多元線性回歸spss案例_第3頁
多元線性回歸spss案例_第4頁
多元線性回歸spss案例_第5頁
已閱讀5頁,還剩1頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

多元線性回歸spss案例【篇一:多元線性回歸spss案例】多元線性回歸,主要是研究一個因變量與多個自變量之間的相關(guān)關(guān)系,跟一元回歸原理差不多,區(qū)別在于影響因素(自變量)更多些而已,例如:一元線性回歸方程為:毫無疑問,多元線性回歸方程應(yīng)該為:上圖中的x1,x2,xp分別代表自變量xp截止,代表有p個自變量,如果有n組樣本,那么這個多元線性回歸,將會組成一個矩陣,如下圖所示:那么,多元線性回歸方程矩陣形式為:其中:代表隨機誤差,其中隨機誤差分為:可解釋的誤差和不可解釋的誤差,隨機誤差必須滿足以下四個條件,多元線性方程才有意義(一元線性方程也一樣)1:服成正太分布,即指:隨機誤差必須是服成正太分別的隨機變量。2:無偏性假設(shè),即指:期望值為03:同共方差性假設(shè),即指,所有的隨機誤差變量方差都相等4:獨立性假設(shè),即指:所有的隨機誤差變量都相互獨立,可以用協(xié)方差解釋。今天跟大家一起討論一下,spss一多元線性回歸的具體操作過程,下面以教程教程數(shù)據(jù)為例,分析汽車特征與汽車銷售量之間的關(guān)系。通過分析汽車特征跟汽車銷售量的關(guān)系,建立擬合多元線性回歸模型。數(shù)據(jù)如下圖所示:點擊分析回歸線性進(jìn)入如下圖所示的界面:將銷售量作為因變量拖入因變量框內(nèi),將車長,車寬,耗油率,車凈重等10個自變量拖入自變量框內(nèi),如上圖所示,在方法旁邊,選擇逐步,當(dāng)然,你也可以選擇其它的方式,如果你選擇進(jìn)入默認(rèn)的方式,在分析結(jié)果中,將會得到如下圖所示的結(jié)果:(所有的自變量,都會強行進(jìn)入)如果你選擇逐步這個方法,將會得到如下圖所示的結(jié)果:(將會根據(jù)預(yù)先設(shè)定的f統(tǒng)計量的概率值進(jìn)行篩選,最先進(jìn)入回歸方程的自變量應(yīng)該是跟因變量關(guān)系最為密切,貢獻(xiàn)最大的,如下圖可以看出,車的價格和車軸跟因變量關(guān)系最為密切,符合判斷條件的概率值必須小于0?05,當(dāng)概率值大于等于0?1時將會被剔除)選擇變量(e)框內(nèi),我并沒有輸入數(shù)據(jù),如果你需要對某個自變量進(jìn)行條件篩選,可以將那個自變量,移入選擇變量框內(nèi),有一個前提就是:該變量從未在另一個目標(biāo)列表中出現(xiàn)!,再點擊規(guī)則設(shè)定相應(yīng)的篩選條件即可,如下圖所示:點擊統(tǒng)計量彈出如下所示的框,如下所示:在回歸系數(shù)下面勾選估計,在右側(cè)勾選模型擬合度和共線性診斷兩個選項,再勾選個案診斷再點擊離群值一般默認(rèn)值為3,(設(shè)定異常值的依據(jù),只有當(dāng)殘差超過3倍標(biāo)準(zhǔn)差的觀測才會被當(dāng)做異常值)點擊繼續(xù)。提示:共線性檢驗,如果有兩個或兩個以上的自變量之間存在線性相關(guān)關(guān)系,就會產(chǎn)生多重共線性現(xiàn)象。這時候,用最小二乘法估計的模型參數(shù)就會不穩(wěn)定,回歸系數(shù)的估計值很容易引起誤導(dǎo)或者導(dǎo)致錯誤的結(jié)論。所以,需要勾選共線性診斷來做判斷通過容許度可以計算共線性的存在與否?容許度tol=1-ri平方或方差膨脹因子(vif):vif=1/1-ri平方,其中ri平方是用其他自變量預(yù)測第i個變量的復(fù)相關(guān)系數(shù),顯然,vif為tol的倒數(shù),tol的值越小,vif的值越大,自變量xi與其他自變量之間存在共線性的可能性越大。提供三種處理方法:1:從有共線性問題的變量里刪除不重要的變量2:增加樣本量或重新抽取樣本。3:采用其他方法擬合模型,如領(lǐng)回歸法,逐步回歸法,主成分分析法。再點擊繪制選項,如下所示:上圖中:dependent(因變量)zpred(標(biāo)準(zhǔn)化預(yù)測值)zresid(標(biāo)準(zhǔn)化殘差)dresid(剔除殘差)adjpred(修正后預(yù)測值)srsid(學(xué)生化殘差)sdresid(學(xué)生化剔除殘差)般我們大部分以自變量作為x軸,用殘差作為y軸,但是,也不要忽略特殊情況,這里我們以zpred(標(biāo)準(zhǔn)化預(yù)測值)作為x軸,分別用sdresid(血生化剔除殘差)和zresid(標(biāo)準(zhǔn)化殘差)作為y軸,分別作為兩組繪圖變量。再點擊保存按鈕,進(jìn)入如下界面:如上圖所示:勾選距離下面的cook距離選項(cook距離,主要是指:把一個個案從計算回歸系數(shù)的樣本中剔除時所引起的殘差大小,cook距離越大,表明該個案對回歸系數(shù)的影響也越大)在預(yù)測區(qū)間勾選均值和單值點擊繼續(xù)按鈕,再點擊確定按鈕,得到如下所示的分析結(jié)果:(此分析結(jié)果,采用的是逐步法得到的結(jié)果)接著上一期的多元線性回歸解析里面的內(nèi)容,上一次,沒有寫結(jié)果分析,這次補上,結(jié)果分析如下所示:結(jié)果分析1:由于開始選擇的是逐步法,逐步法是向前和向后的結(jié)合體,從結(jié)果可以看出,最先進(jìn)入線性回歸模型的是priceinthousands建立了模型1,緊隨其后的是wheelbase建立了模型2,所以,模型中有此方法有個概率值,當(dāng)小于等于0.05時,進(jìn)入線性回歸模型(最先進(jìn)入模型的,相關(guān)性最強,關(guān)系最為密切)當(dāng)大于等0?1時,從線性模型中剔除結(jié)果分析:1:從模型匯總中可以看出,有兩個模型,(模型1和模型2)從r2擬合優(yōu)度來看,模型2的擬合優(yōu)度明顯比模型1要好一些(0.4220.300)2:從anova表中,可以看出模型2中的回歸平方和為115.311,殘差平方和為153.072,由于總平方和=回歸平方和+殘差平方和,由于殘差平方和(即指隨即誤差,不可解釋的誤差)由于回歸平方和跟殘差平方和幾乎接近,所有,此線性回歸模型只解釋了總平方和的一半,3:根據(jù)后面的f統(tǒng)計量的概率值為0?00,由于0.000.01,隨著自變量的引入,其顯著性概率值均遠(yuǎn)小于0.01,所以可以顯著地拒絕總體回歸系數(shù)為0的原假設(shè),通過anova方差分析表可以看出銷售量與價格和軸距之間存在著線性關(guān)系,至于線性關(guān)系的強弱,需要進(jìn)一步進(jìn)行分析。結(jié)果分析:1:從已排除的變量表中,可以看出:模型2中各變量的t檢的概率值都大于0.05所以,不能夠引入線性回歸模型必須剔除。從系數(shù)a表中可以看出:1:多元線性回歸方程應(yīng)該為:銷售量=-1.822-0.055*價格+0.061*軸距但是,由于常數(shù)項的sig為(0.1160.1)所以常數(shù)項不具備顯著性,所以,我們再看后面的標(biāo)準(zhǔn)系數(shù),在標(biāo)準(zhǔn)系數(shù)一列中,可以看到常數(shù)項沒有數(shù)值,已經(jīng)被剔除所以:標(biāo)準(zhǔn)化的回歸方程為:銷售量=-0.59*價格+0,356*軸距2:再看最后一列共線性統(tǒng)計量,其中價格和軸距兩個容差和vif都一樣,而且vif都為1.012,且都小于5,所以兩個自變量之間沒有出現(xiàn)共線性,容忍度和膨脹因子是互為倒數(shù)關(guān)系,容忍度越小,膨脹因子越大,發(fā)生共線性的可能性也越大從共線性診斷表中可以看出:1:共線性診斷采用的是特征值的方式,特征值主要用來刻畫自變量的方差,診斷自變量間是否存在較強多重共線性的另一種方法是利用主成分分析法,基本思想是:如果自變量間確實存在較強的相關(guān)關(guān)系,那么它們之間必然存在信息重疊,于是就可以從這些自變量中提取出既能反應(yīng)自變量信息(方差),而且有相互獨立的因素(成分)來,該方法主要從自變量間的相關(guān)系數(shù)矩陣出發(fā),計算相關(guān)系數(shù)矩陣的特征值,得到相應(yīng)的若干成分。從上圖可以看出:從自變量相關(guān)系數(shù)矩陣出發(fā),計算得到了三個特征值(模型2中),最大特征值為2.847,最小特征值為0.003條件索引=最大特征值/相對特征值再進(jìn)行開方(即特征值2的條件索引為2.847/0.150再開方=4.351)標(biāo)準(zhǔn)化后,方差為1,每一個特征值都能夠刻畫某自變量的一定比例,所有的特征值能將刻畫某自變量信息的全部,于是,我們可以得到以下結(jié)論:1:價格在方差標(biāo)準(zhǔn)化后,第一個特征值解釋了其方差的0.02,第二個特征值解釋了0.97,第三個特征值解釋了0.002:軸距在方差標(biāo)準(zhǔn)化后,第一個特征值解釋了其方差的0.00,第二個特征值解釋了0.01,第三個特征值解釋了0.99可以看出:沒有一個特征值,既能夠解釋價格又能夠解釋軸距所以價格和軸距之間存在共線性較弱。前面的結(jié)論進(jìn)一步得到了論證。(殘差統(tǒng)計量的表中數(shù)值怎么來的,這個計算過程,我就不寫了)從上圖可以得知:大部分自變量的殘差都符合正太分布,只有一,兩處地方稍有偏離,如圖上的(-5到-3區(qū)域的)處理偏離狀態(tài)【篇二:多元線性回歸spss案例】表1-2描述性數(shù)據(jù)匯總標(biāo)準(zhǔn)化后得到的數(shù)據(jù)值,以下的回歸分析將使用標(biāo)準(zhǔn)化數(shù)據(jù)。如圖1-5所示:圖1-5數(shù)據(jù)標(biāo)準(zhǔn)化我們還可以通過描述性分析中的“”來得到各個變量的眾數(shù),均值等,還可以根據(jù)這些量繪制直方圖。我們選取個別變量(能源消費總量)的直方圖,可以看到我們因變量基本符合正態(tài)分布。如圖1-6所示:圖1-6能源消費總量1.2回歸分析我們本次實驗主要考察地區(qū)能源消費總額(因變量)與煤炭消費量、焦炭消費量、原油消費量、原煤產(chǎn)量、焦炭產(chǎn)量、原油產(chǎn)量之間的關(guān)系。以下的回歸分析所涉及只包括以上幾個變量,并使用標(biāo)準(zhǔn)化之后的數(shù)據(jù)。參數(shù)設(shè)置單擊菜單欄“”--"”--"”,將彈出如圖1-7所示的對話框,將通過選擇因變量和自變量來構(gòu)建線性回歸模型。因變量:標(biāo)準(zhǔn)化能源消費總額;自變量:標(biāo)準(zhǔn)化煤炭消費量、標(biāo)準(zhǔn)化焦炭消費量、標(biāo)準(zhǔn)化原油消費量、標(biāo)準(zhǔn)化原煤產(chǎn)量、標(biāo)準(zhǔn)化焦炭產(chǎn)量、標(biāo)準(zhǔn)化原油產(chǎn)量。自變量方法選擇:進(jìn)入,個案標(biāo)簽使用地名,不使用權(quán)重最小二乘法回歸分析一即wls權(quán)重為空。圖1-7選擇線性回歸變量還需要設(shè)置統(tǒng)計量的參數(shù),我們選擇回歸系數(shù)中的“”和其他項中的“”。選中估計可輸出回歸系數(shù)b及其標(biāo)準(zhǔn)誤,t值和p值,還有標(biāo)準(zhǔn)化的回歸系數(shù)beta。選中模型擬合度復(fù)選框:模型擬合過程中進(jìn)入、退出的變量的列表,以及一些有關(guān)擬合優(yōu)度的檢驗:r,r2和調(diào)整的r2,標(biāo)準(zhǔn)誤及方差分析表。如圖1-8所示:圖1-8設(shè)置回歸分析統(tǒng)計量在設(shè)置繪制選項的時候,我們選擇繪制標(biāo)準(zhǔn)化殘差圖,其中的正態(tài)概率圖是rankit圖。同時還需要畫出殘差圖,y軸選擇:zresid,x軸選擇:zpred。如圖1-9所示:圖1-9設(shè)置繪制左上框中各項的意義分別為:.許多時候我們需要將回歸分析的結(jié)果存儲起來,然后用得到的殘差、預(yù)測值等做進(jìn)一步的分析,“保存”按鈕就是用來存儲中間結(jié)果的??梢源鎯Φ挠校侯A(yù)測值系列、殘差系列、距離(distances)系列、預(yù)測值可信區(qū)間系列、波動統(tǒng)計量系列。本次實驗暫時不保存任何項。.設(shè)置

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論