spss回歸分析大全PPT學(xué)習(xí)教案_第1頁
spss回歸分析大全PPT學(xué)習(xí)教案_第2頁
spss回歸分析大全PPT學(xué)習(xí)教案_第3頁
spss回歸分析大全PPT學(xué)習(xí)教案_第4頁
spss回歸分析大全PPT學(xué)習(xí)教案_第5頁
已閱讀5頁,還剩220頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、會計學(xué)1spss回歸分析大全回歸分析大全2本章內(nèi)容7.1 回歸分析概述回歸分析概述7.2 線性回歸分析線性回歸分析7.3 曲線估計回歸分析曲線估計回歸分析7.4 羅輯回歸分析羅輯回歸分析7.5 序數(shù)、概率回歸分析序數(shù)、概率回歸分析7.6 非線性、權(quán)重估計、兩階最小二乘非線性、權(quán)重估計、兩階最小二乘、 最佳尺度回歸分析最佳尺度回歸分析 第1頁/共225頁3回歸分析(regression analysis) 確定兩種或兩種以上變數(shù)間相互依賴的定量關(guān)系的一種統(tǒng)計分析方法。p涉及的自變量的多少一元回歸分析多元回歸分析p自變量和因變量之間的關(guān)系類型,線性回歸分析非線性回歸分析回歸分析第2頁/共225頁4

2、回歸分析一般步驟:確定回歸方程中的解釋變量(自變量)和被解釋變量(因變量)確定回歸模型建立回歸方程對回歸方程進(jìn)行各種檢驗利用回歸方程進(jìn)行預(yù)測回歸分析第3頁/共225頁第4頁/共225頁線性回歸分析線性回歸分析第5頁/共225頁線性回歸分析線性回歸分析第6頁/共225頁22121()()niiniiyyRyy21()niiyy21()niiyy線性回歸分析線性回歸分析第7頁/共225頁9多元線性回歸的擬合優(yōu)度檢驗采用 統(tǒng)計量,稱為調(diào)整的判定系數(shù)或調(diào)整的決定系數(shù),數(shù)學(xué)定義為2R式中n-p-1、n-1分別是SSE和SST的自由度。其取值范圍和意義與一元回歸方程中的R2是相同的。u回歸方程的擬合優(yōu)度檢

3、驗(相關(guān)系數(shù)檢驗)2111SSEnpSSTnR 線性回歸分析線性回歸分析第8頁/共225頁一元線性回歸方程顯著性檢驗的零假設(shè)是1=0,檢驗采用F統(tǒng)計量,其數(shù)學(xué)定義為:2121()()2niiniiiyyMSAFMSEyyn線性回歸分析線性回歸分析第9頁/共225頁11u回歸方程的顯著性檢驗(F檢驗)多元線性回歸方程顯著性檢驗的零假設(shè)是各個偏回歸系數(shù)同時為零,檢驗采用F統(tǒng)計量,其數(shù)學(xué)定義為:即平均的SSA/平均的SSE,F(xiàn)統(tǒng)計量服從(p,n-p-1)個自由度的F分布。SPSS將會自動計算檢驗統(tǒng)計量的觀測值以及對應(yīng)的概率p值,如果p值小于給定的顯著性水平,則應(yīng)拒絕零假設(shè),認(rèn)為y與x的全體的線性關(guān)系

4、顯著。2121()()1niiniiiyyPMSAFMSEyynP線性回歸分析線性回歸分析第10頁/共225頁121()niitxx線性回歸分析線性回歸分析第11頁/共225頁13u回歸系數(shù)的顯著性檢驗(t檢驗)多元線性回歸方程的回歸系數(shù)顯著性檢驗的零假設(shè)是i=0,檢驗采用t統(tǒng)計量,其數(shù)學(xué)定義為:ti統(tǒng)計量服從n-p-1個自由度的t分布。 SPSS將會自動計算ti統(tǒng)計量的觀測值以及對應(yīng)的概率p值,如果p值小于給定的顯著性水平,則應(yīng)拒絕零假設(shè),認(rèn)為xi對y有顯著貢獻(xiàn),應(yīng)保留在線性方程中。21()injiijixxt(i=1,2, ,p)線性回歸分析線性回歸分析第12頁/共225頁iiiyyei線

5、性回歸分析線性回歸分析第13頁/共225頁線性回歸分析線性回歸分析第14頁/共225頁16u回歸方程的統(tǒng)計檢驗u殘差分析獨(dú)立性分析 繪制殘差序列的序列圖以樣本期(或時間)為橫坐標(biāo),殘差為縱坐標(biāo),如果殘差隨時間的推移呈規(guī)律性變化,則存在一定的正或負(fù)相關(guān)性。計算殘差的自相關(guān)系數(shù)取值在-1到+1之間,接近于+1表明序列存在正自相關(guān)性。 DW(DurbinWatson)檢驗DW取值在0至4之間,直觀判斷標(biāo)準(zhǔn)是DW=4,殘差序列完全負(fù)自相關(guān);DW=2,完全無自相關(guān);DW=0,完全正自相關(guān)。第15頁/共225頁17u回歸方程的統(tǒng)計檢驗u殘差分析異方差分析 繪制殘差圖如果殘差的方差隨著解釋變量值的增加呈增加

6、(或減少)的趨勢,說明出現(xiàn)了異方差現(xiàn)象。線性回歸分析線性回歸分析第16頁/共225頁18u回歸方程的統(tǒng)計檢驗u殘差分析探測樣本中的異常值和強(qiáng)影響點(diǎn)(對于y值)標(biāo)準(zhǔn)化殘差ZRE由于殘差是服從均值為0的正態(tài)分布,因此可以根據(jù)3準(zhǔn)則進(jìn)行判斷,首先對殘差進(jìn)行標(biāo)準(zhǔn)化 ,絕對值大于3對應(yīng)的觀察值為異常值。學(xué)生化殘差SRE剔除殘差DRE(或剔除學(xué)生化殘差SDRE)上述SRE、SDRE的直觀判斷標(biāo)準(zhǔn)同標(biāo)準(zhǔn)化殘差ZRE。iZREe第17頁/共225頁19線性回歸分析線性回歸分析第18頁/共225頁20多元回歸分析中的其他問題u變量篩選問題向前篩選策略 解釋變量不斷進(jìn)入回歸方程的過程,首先選擇與被解釋變量具有最高

7、線性相關(guān)系數(shù)的變量進(jìn)入方程,并進(jìn)行各種檢驗;其次在剩余的變量中挑選與解釋變量偏相關(guān)系數(shù)最高并通過檢驗的變量進(jìn)入回歸方程。向后篩選策略 變量不斷剔除出回歸方程的過程,首先所有變量全部引入回歸方程并檢驗,然后在回歸系數(shù)顯著性檢驗不顯著的一個或多個變量中,剔除t檢驗值最小的變量。逐步篩選策略 向前篩選與向后篩選策略的綜合線性回歸分析線性回歸分析第19頁/共225頁21多元回歸分析中的其他問題u變量多重共線性問題容忍度Tol容忍度值越接近于1,表示多重共線性越弱。SPSS變量多重共線性的要求不很嚴(yán)格,只是在容忍度值太小時給出相應(yīng)警告信息。方差膨脹因子VIF膨脹因子是容忍度的倒數(shù),越接近于1,表示解釋變

8、量間的多重共線性越弱。通常如果VIFi大于等于10,說明解釋變量xi與其余解釋變量之間有嚴(yán)重的多重共線性。特征根和方差比這里的特征根是指相關(guān)系數(shù)矩陣的特征根。如果最大特征根遠(yuǎn)遠(yuǎn)大于其他特征根的值,則說明這些解釋變量之間具有相當(dāng)多的重疊信息。條件指數(shù)ki10 ki 100時,認(rèn)為多重共線性較強(qiáng), ki 100時,認(rèn)為多重共線性很嚴(yán)重21iiTolR miik第20頁/共225頁22u回歸方程的統(tǒng)計檢驗u殘差分析異方差分析 等級相關(guān)分析得到殘差序列后首先對其取絕對值,然后計算出殘差和解釋變量的秩,最后計算Spearman等級相關(guān)系數(shù),并進(jìn)行等級相關(guān)分析。具體過程見相關(guān)分析相關(guān)章節(jié)。線性回歸分析線性

9、回歸分析第21頁/共225頁線性回歸分析線性回歸分析第22頁/共225頁一元線性回歸分析一元線性回歸分析第23頁/共225頁 打開【分析】打開【分析】【回歸】【回歸】【線性】,出現(xiàn)線性【線性】,出現(xiàn)線性回歸主對話回歸主對話 框,進(jìn)行框,進(jìn)行SPSS程序命令操作,程序命令操作,即對各子對話框即對各子對話框進(jìn)行設(shè)置。進(jìn)行設(shè)置。 線性回歸分析線性回歸分析第24頁/共225頁(1)變量)變量 因變量因變量 被選入該文本框中的變量為線性回歸模型中的被解釋被選入該文本框中的變量為線性回歸模型中的被解釋變量,數(shù)值類型為數(shù)值型。如果被解釋變量為分類變量,則可以用變量,數(shù)值類型為數(shù)值型。如果被解釋變量為分類變量

10、,則可以用二元或者多元二元或者多元Logistic模型等建模分析。模型等建模分析。 自變量自變量 被選入該列表框中的變量為線性模型中的解釋變量,被選入該列表框中的變量為線性模型中的解釋變量,數(shù)值類型一般為數(shù)值型。如果解釋變量為分類變量或定性變量,可數(shù)值類型一般為數(shù)值型。如果解釋變量為分類變量或定性變量,可以用虛擬變量(啞變量)表示。如果選擇多個自變量,可將自變量以用虛擬變量(啞變量)表示。如果選擇多個自變量,可將自變量分組成塊,通過分組成塊,通過“上一張上一張”和和“下一張下一張”按鈕對不同的變量子集指按鈕對不同的變量子集指定不同的進(jìn)入方法。定不同的進(jìn)入方法。線性回歸分析線性回歸分析第25頁/

11、共225頁(2)方法)方法 用于選擇線性回歸中變量的進(jìn)入和剔除方法,來建立多個回歸模型用于選擇線性回歸中變量的進(jìn)入和剔除方法,來建立多個回歸模型進(jìn)入,該方法表示自變量列表中進(jìn)入,該方法表示自變量列表中所有的變量所有的變量都進(jìn)入回歸模型。都進(jìn)入回歸模型。逐步,該方法是一個動態(tài)過程,表示具有逐步,該方法是一個動態(tài)過程,表示具有F統(tǒng)計量的統(tǒng)計量的概率最小概率最小的自變量的自變量被選進(jìn)回歸模型;對于已經(jīng)在回歸方程中的變量,被選進(jìn)回歸模型;對于已經(jīng)在回歸方程中的變量,如果它們的如果它們的F統(tǒng)計量的概率變得足夠大,則移除這些變量,統(tǒng)計量的概率變得足夠大,則移除這些變量,直到不再有自變量符合進(jìn)入或移除的條件

12、,該方法終止。直到不再有自變量符合進(jìn)入或移除的條件,該方法終止。刪除,該方法表示建立回歸模型前設(shè)定一定條件,然后根據(jù)刪除,該方法表示建立回歸模型前設(shè)定一定條件,然后根據(jù)條件刪除自變量。條件刪除自變量。向后,該方法表示首先將自變量列表中的所有自變量選入到回歸模型中,然后按向后,該方法表示首先將自變量列表中的所有自變量選入到回歸模型中,然后按順序移除順序移除,最先刪除與因變量之間的部分,最先刪除與因變量之間的部分相關(guān)性最小相關(guān)性最小的那個變量,移除第一個變量后,得到新的方程,又將與因變量之間的部分相關(guān)性最小的那個變量刪除,直到方程中沒有滿足消除條件的變量,過程結(jié)束。的那個變量,移除第一個變量后,得

13、到新的方程,又將與因變量之間的部分相關(guān)性最小的那個變量刪除,直到方程中沒有滿足消除條件的變量,過程結(jié)束。向前,該方法與向前,該方法與“向后向后”恰好相反,是將自變量按順序選入到回歸模型中。首先選入與因變量之間具有恰好相反,是將自變量按順序選入到回歸模型中。首先選入與因變量之間具有最大相關(guān)性的最大相關(guān)性的、滿足選入條件的變量進(jìn)入回歸模型中,然后再考慮下一個變量,直到?jīng)]有滿足條件的變量時,過程結(jié)束。、滿足選入條件的變量進(jìn)入回歸模型中,然后再考慮下一個變量,直到?jīng)]有滿足條件的變量時,過程結(jié)束。線性回歸分析線性回歸分析第26頁/共225頁(3)選擇變量)選擇變量 該文本框主要用于指定分析個案的選擇規(guī)則

14、,當(dāng)回歸分析中包含由選該文本框主要用于指定分析個案的選擇規(guī)則,當(dāng)回歸分析中包含由選擇規(guī)則定義的個案,則需要進(jìn)行設(shè)置。擇規(guī)則定義的個案,則需要進(jìn)行設(shè)置。線性回歸:設(shè)置規(guī)則子對話框用于選擇關(guān)系。對于分類變量,可用的關(guān)系有線性回歸:設(shè)置規(guī)則子對話框用于選擇關(guān)系。對于分類變量,可用的關(guān)系有“等于等于”和和“不等于不等于”,對于字符串型變量,可以用,對于字符串型變量,可以用“等于等于”關(guān)系,在關(guān)系,在“值值”文本框中輸入按具體數(shù)值或字符串選擇個案的規(guī)則;如在文本框中輸入按具體數(shù)值或字符串選擇個案的規(guī)則;如在“值值”中輸入中輸入“f”,則表示只有那些性別為女性的個案才能進(jìn)入分析;對于連續(xù)變量,則可用的關(guān)系

15、有,則表示只有那些性別為女性的個案才能進(jìn)入分析;對于連續(xù)變量,則可用的關(guān)系有“等于等于”、“不等于不等于”、“小于小于”、“小于等于小于等于”、“大于大于”以及以及“大于等于大于等于”,如選擇,如選擇“不等于不等于”,并在,并在“值值”中輸入中輸入“1”,表示只有那些有無線服務(wù)的個案才會包含在回歸分析中。,表示只有那些有無線服務(wù)的個案才會包含在回歸分析中。線性回歸分析線性回歸分析第27頁/共225頁(4)個案標(biāo)簽)個案標(biāo)簽 該文本框主要用于指定個案標(biāo)簽的變量。該文本框主要用于指定個案標(biāo)簽的變量。(5)WLS權(quán)重權(quán)重 該文本框表示加權(quán)最小二乘,當(dāng)判斷回歸模型的該文本框表示加權(quán)最小二乘,當(dāng)判斷回歸

16、模型的殘差存在異方差時,才選用加權(quán)最小二乘方法,指定加權(quán)變量。殘差存在異方差時,才選用加權(quán)最小二乘方法,指定加權(quán)變量。線性回歸分析線性回歸分析第28頁/共225頁線性回歸分析線性回歸分析第29頁/共225頁線性回歸分析線性回歸分析第30頁/共225頁線性回歸分析線性回歸分析第31頁/共225頁線性回歸分析線性回歸分析第32頁/共225頁在源變量列表中列出了因在源變量列表中列出了因變量(變量(DEPENDNT)及)及以下的預(yù)測變量和殘差變以下的預(yù)測變量和殘差變量:標(biāo)準(zhǔn)化預(yù)測值(量:標(biāo)準(zhǔn)化預(yù)測值(*ZPRED)、標(biāo)準(zhǔn)化殘)、標(biāo)準(zhǔn)化殘差(差(*ZRESID)、剔除)、剔除殘差(殘差(*DRESID)

17、、調(diào))、調(diào)整的預(yù)測值(整的預(yù)測值(*ADJPERD)、學(xué)生化)、學(xué)生化的殘差(的殘差(*SRESID)以)以及學(xué)生化的已刪除殘差(及學(xué)生化的已刪除殘差(*SDRESID)。)。線性回歸分析線性回歸分析第33頁/共225頁線性回歸分析線性回歸分析第34頁/共225頁預(yù)測值選項組預(yù)測值選項組該選項組用于保存該選項組用于保存回歸模型對因變量的預(yù)測值?;貧w模型對因變量的預(yù)測值。未標(biāo)準(zhǔn)化,選中該復(fù)選框,表示保存回歸未標(biāo)準(zhǔn)化,選中該復(fù)選框,表示保存回歸模型對因變量的預(yù)測值。模型對因變量的預(yù)測值。標(biāo)準(zhǔn)化,選中該復(fù)選框,表示保存標(biāo)準(zhǔn)化標(biāo)準(zhǔn)化,選中該復(fù)選框,表示保存標(biāo)準(zhǔn)化后的預(yù)測值。后的預(yù)測值。調(diào)節(jié),選中它,表

18、示保存當(dāng)某個案從回歸調(diào)節(jié),選中它,表示保存當(dāng)某個案從回歸系數(shù)的計算中排除時個案的預(yù)測值。系數(shù)的計算中排除時個案的預(yù)測值。均值預(yù)測值的均值預(yù)測值的S.E.,選中它,表示保存預(yù),選中它,表示保存預(yù)測值的標(biāo)準(zhǔn)誤。測值的標(biāo)準(zhǔn)誤。線性回歸分析線性回歸分析第35頁/共225頁線性回歸分析線性回歸分析第36頁/共225頁線性回歸分析線性回歸分析第37頁/共225頁線性回歸分析線性回歸分析第38頁/共225頁線性回歸分析線性回歸分析第39頁/共225頁線性回歸分析線性回歸分析第40頁/共225頁線性回歸分析線性回歸分析第41頁/共225頁線性回歸分析線性回歸分析第42頁/共225頁44線性回歸分析線性回歸分析

19、第43頁/共225頁45線性回歸分析線性回歸分析第44頁/共225頁46方程中包含的自變量列表方程中包含的自變量列表 同時顯示進(jìn)入方法。如本例中方程中的自變量為同時顯示進(jìn)入方法。如本例中方程中的自變量為x,方法為,方法為Enter。模型擬合概述模型擬合概述 列出了模型的列出了模型的R、R2 、調(diào)整、調(diào)整R2 及估計標(biāo)準(zhǔn)誤。及估計標(biāo)準(zhǔn)誤。R2 值越大所反映的兩變量的共變量比率越高,模型與數(shù)據(jù)的擬合程度越好。值越大所反映的兩變量的共變量比率越高,模型與數(shù)據(jù)的擬合程度越好。本例所用數(shù)據(jù)擬合結(jié)果顯示:所考察的自變量和因變量之間的相關(guān)系數(shù)為,擬合線性回歸的確定性系數(shù)為,經(jīng)調(diào)整后的確定性系數(shù)為,標(biāo)準(zhǔn)誤的估

20、計為。本例所用數(shù)據(jù)擬合結(jié)果顯示:所考察的自變量和因變量之間的相關(guān)系數(shù)為,擬合線性回歸的確定性系數(shù)為,經(jīng)調(diào)整后的確定性系數(shù)為,標(biāo)準(zhǔn)誤的估計為。線性回歸分析線性回歸分析第45頁/共225頁47方差分析表方差分析表 列出了變異源、自由度、均方、列出了變異源、自由度、均方、F值及對值及對F的顯著性檢驗。的顯著性檢驗。本例中回歸方程顯著性檢驗結(jié)果表明:回歸平方和為,殘差平方和為,總平方和為,對應(yīng)的本例中回歸方程顯著性檢驗結(jié)果表明:回歸平方和為,殘差平方和為,總平方和為,對應(yīng)的F統(tǒng)計量的值為,顯著性水平小于,可以認(rèn)為所建立的回歸方程有效。統(tǒng)計量的值為,顯著性水平小于,可以認(rèn)為所建立的回歸方程有效。線性回歸

21、分析線性回歸分析第46頁/共225頁48回歸系數(shù)表回歸系數(shù)表 列出了常數(shù)及非標(biāo)準(zhǔn)化回歸系數(shù)的值及標(biāo)準(zhǔn)化的回歸系數(shù),同時對其進(jìn)行顯著性檢驗。列出了常數(shù)及非標(biāo)準(zhǔn)化回歸系數(shù)的值及標(biāo)準(zhǔn)化的回歸系數(shù),同時對其進(jìn)行顯著性檢驗。本例中非標(biāo)準(zhǔn)化的回歸系數(shù)本例中非標(biāo)準(zhǔn)化的回歸系數(shù)B的估計值為,標(biāo)準(zhǔn)誤為,標(biāo)準(zhǔn)化的回歸系數(shù)為,回歸系數(shù)顯著性檢驗的估計值為,標(biāo)準(zhǔn)誤為,標(biāo)準(zhǔn)化的回歸系數(shù)為,回歸系數(shù)顯著性檢驗t統(tǒng)計量的值為,對應(yīng)顯著性水平,可以認(rèn)為方程顯著。因此,本例回歸分析得到的回歸方程為:統(tǒng)計量的值為,對應(yīng)顯著性水平,可以認(rèn)為方程顯著。因此,本例回歸分析得到的回歸方程為:對方程的方差分析及對回歸系數(shù)的顯著性檢驗均發(fā)現(xiàn)

22、,所建立的回歸方程顯著。對方程的方差分析及對回歸系數(shù)的顯著性檢驗均發(fā)現(xiàn),所建立的回歸方程顯著。線性回歸分析線性回歸分析第47頁/共225頁49線性回歸分析線性回歸分析第48頁/共225頁50一元線性回歸分析討論的回歸問題只涉及了一個自變量,但在實一元線性回歸分析討論的回歸問題只涉及了一個自變量,但在實際問題中,影響因變量的因素往往有多個。例如,商品的需求除了受際問題中,影響因變量的因素往往有多個。例如,商品的需求除了受自身價格的影響外,還要受到消費(fèi)者收入、其他商品的價格、消費(fèi)者自身價格的影響外,還要受到消費(fèi)者收入、其他商品的價格、消費(fèi)者偏好等因素的影響;影響水果產(chǎn)量的外界因素有平均氣溫、平均日

23、照偏好等因素的影響;影響水果產(chǎn)量的外界因素有平均氣溫、平均日照時數(shù)、平均濕度等。時數(shù)、平均濕度等。因此,在許多場合,僅僅考慮單個變量是不夠的,還需要就一個因此,在許多場合,僅僅考慮單個變量是不夠的,還需要就一個因變量與多個自變量的聯(lián)系來進(jìn)行考察,才能獲得比較滿意的結(jié)果。因變量與多個自變量的聯(lián)系來進(jìn)行考察,才能獲得比較滿意的結(jié)果。這就產(chǎn)生了測定多因素之間相關(guān)關(guān)系的問題。這就產(chǎn)生了測定多因素之間相關(guān)關(guān)系的問題。研究在線性相關(guān)條件下,兩個或兩個以上自變量對一個因變量的研究在線性相關(guān)條件下,兩個或兩個以上自變量對一個因變量的數(shù)量變化關(guān)系,稱為多元線性回歸分析,表現(xiàn)這一數(shù)量關(guān)系的數(shù)學(xué)公數(shù)量變化關(guān)系,稱為

24、多元線性回歸分析,表現(xiàn)這一數(shù)量關(guān)系的數(shù)學(xué)公式,稱為多元線性回歸模型。式,稱為多元線性回歸模型。第49頁/共225頁51第50頁/共225頁52線性回歸分析線性回歸分析第51頁/共225頁53線性回歸分析線性回歸分析第52頁/共225頁54方程中包含的自變方程中包含的自變量列表量列表 同時顯示進(jìn)入同時顯示進(jìn)入方法。如本例中方程中方法。如本例中方程中的自變量為的自變量為Q1和和Q2,Q3,Q4,Q5,選,選擇變量進(jìn)入方程的方法擇變量進(jìn)入方程的方法為為Enter。2.模型概述模型概述 列出了列出了模型的模型的R、R2 、調(diào)整、調(diào)整R2 及估計標(biāo)準(zhǔn)誤。及估計標(biāo)準(zhǔn)誤。R2 值越大所反映的自值越大所反映的

25、自變量與因變量的共變量變量與因變量的共變量比率越高,模型與數(shù)據(jù)比率越高,模型與數(shù)據(jù)的擬合程度越好。的擬合程度越好。 上面所定義模型確定系數(shù)的平方根為上面所定義模型確定系數(shù)的平方根為,確定系數(shù)為,調(diào)整后的確定系數(shù)為,確定系數(shù)為,調(diào)整后的確定系數(shù)為,標(biāo)準(zhǔn)誤為。,標(biāo)準(zhǔn)誤為。線性回歸分析線性回歸分析第53頁/共225頁553.方差分析表方差分析表 列出了變異源、自由度、均方、列出了變異源、自由度、均方、F值及對值及對F的顯著的顯著 性檢驗。性檢驗。本例中回歸平方和為,殘差平方和為,總平方和為,本例中回歸平方和為,殘差平方和為,總平方和為,F(xiàn)統(tǒng)計量的值統(tǒng)計量的值為,可以認(rèn)為所建立的回歸方程無效。為,可以

26、認(rèn)為所建立的回歸方程無效。線性回歸分析線性回歸分析第54頁/共225頁564.回歸系數(shù)表回歸系數(shù)表 列出了常數(shù)及回歸系數(shù)的值及標(biāo)準(zhǔn)化的值,同時列出了常數(shù)及回歸系數(shù)的值及標(biāo)準(zhǔn)化的值,同時對其進(jìn)行顯著性檢驗。對其進(jìn)行顯著性檢驗。回歸系數(shù)分析中,建立的回歸方程無效,說明多個變量與因變回歸系數(shù)分析中,建立的回歸方程無效,說明多個變量與因變量不存在顯著地線性關(guān)系。量不存在顯著地線性關(guān)系。線性回歸分析線性回歸分析第55頁/共225頁曲線估計第56頁/共225頁變量間相關(guān)關(guān)系的分析中,變量之間的關(guān)系并不總是表現(xiàn)出線性關(guān)系,非線性關(guān)系也極為常見。非線性又可劃分為:本質(zhì)線性關(guān)系形式上雖然呈非線性,但可通過變量轉(zhuǎn)

27、換化為線性關(guān)系。本質(zhì)非線性關(guān)系不僅形式上呈非線性,也無法通過變量轉(zhuǎn)換化為線性關(guān)系。這里的曲線估計是解決本質(zhì)線性關(guān)系問題的。第57頁/共225頁模型名回歸方程變量變換后的線性方程二次曲線(Quadratic)復(fù)合曲線(Compound)增長曲線(Growth)對數(shù)曲線(Logarithmic)三次曲線(Cubic)S曲線(S)指數(shù)曲線(Exponential)逆函數(shù)(Inverse)冪函數(shù)(Power)邏輯函數(shù)(Logistic)2012yxx211012(x = x )y =+x+x01xy ln( )ln()ln()01yx01xyeln( )01yxln( )01yx1101(x = ln

28、( )y=+xx332012xyxx3322211012,(x = x)y=+x+xxxx01xye11011(x =)ln(y)=+xx10 xye01)ln(y)= ln(+x01xy1()01 11yxxx10()xy01 11ln( )ln()(ln( )yx xx0111xuy 0111ln() ln() ln() xyu常見本質(zhì)線性模型第58頁/共225頁曲線估計(稱曲線擬合、曲線回歸)是研究兩變量間非線性關(guān)系的一種方法,選定一種用方程表達(dá)的曲線,使得實際數(shù)據(jù)與理論數(shù)據(jù)之間的差異盡可能地小。如果曲線選擇得好,那么可以揭示因變量與自變量的內(nèi)在關(guān)系,并對因變量的預(yù)測有一定意義;曲線估計

29、中,需要解決兩個問題:一是選用哪種理論模型,即用哪種方程來擬合觀測值;二是當(dāng)模型確定后,如何選擇合適的參數(shù),使得理論數(shù)據(jù)和實際數(shù)據(jù)的差異最??;第59頁/共225頁在SPSS曲線估計中,首先在不能明確哪種模型更接近樣本數(shù)據(jù)時可在上述可選擇的模型中選擇幾種模型,然后,SPSS自動完成模型的參數(shù)估計,并輸出回歸方程顯著性檢驗的F值和概率P值、判定系數(shù)R2等統(tǒng)計量;最后以判定系數(shù)R2為主要依據(jù)選擇其中的最優(yōu)模型,并進(jìn)行預(yù)測分析。第60頁/共225頁曲線估計應(yīng)用舉例為研究居民家庭教育支出和消費(fèi)性支出之間的關(guān)系,收集到1990年至2002年全國人均消費(fèi)性支出和教育支出的數(shù)據(jù)。第61頁/共225頁第一步:畫

30、散點(diǎn)圖第62頁/共225頁第63頁/共225頁第64頁/共225頁第65頁/共225頁教育支出和年人均消費(fèi)性支出的散點(diǎn)圖觀察散點(diǎn)圖發(fā)現(xiàn)兩變量之間呈非線性關(guān)系,可嘗試選擇二次、三次曲線,復(fù)合函數(shù)、冪函數(shù)等模型。第66頁/共225頁第二步:選擇函數(shù)模型第67頁/共225頁注:選擇相應(yīng)的變量第68頁/共225頁注:模型中,選擇“二次項”、“立方”、“冪”、“復(fù)合”,勾選“顯示ANOVA表格”,然后點(diǎn)擊保存按鈕第69頁/共225頁注:勾選“預(yù)測值”、“殘差”、“預(yù)測空間”(95%置信),點(diǎn)擊繼續(xù),并確定,得到輸出結(jié)果。第70頁/共225頁擬合優(yōu)度最高第三步:分析輸出結(jié)果第71頁/共225頁三次三次兩個

31、系數(shù)均大于0.05,此模型不理想第72頁/共225頁復(fù)合復(fù)合冪冪相伴概率Sig.=0.000,該模型較理想第73頁/共225頁二次、三次、復(fù)合、冪函數(shù)的曲線冪函數(shù)曲線冪函數(shù)曲線第74頁/共225頁復(fù)合函數(shù)和冪函數(shù)的擬合優(yōu)度都很好,同時兩種模型的回歸系數(shù)顯著性檢驗也都通過 ,因此可考慮采用這兩種模型。但是從曲線走勢上來看,復(fù)合函數(shù)增長趨勢比冪函數(shù)更接近原函數(shù),因此可最終考慮采用復(fù)合函數(shù)。第75頁/共225頁復(fù)合曲線第76頁/共225頁第77頁/共225頁由于在曲線估計對話框中選了“保存”項,并且勾選了“預(yù)測值”、“殘差”和“預(yù)測區(qū)間”,因此在編輯窗口增加了16個變量的值,以fit_1、err_1

32、、lcl_1、ucl_1為例進(jìn)行說明:fit_1:表示在線性回歸分析條件下,當(dāng)自變量x1值為1627.64時,因變量x1的預(yù)測值為77.75243;err_1:表示在線性回歸分析條件下,當(dāng)自變量x1值為1627.64時,因變量x2的實際值與預(yù)測值(殘差)為-39.51243;lcl_1:表示在線性回歸分析條件下,預(yù)測值95%可置信區(qū)間的下限為:-41.46780、-52.47135.ucl_1:表示在線性回歸分析條件下,預(yù)測值95%可置信區(qū)間的上限為:196.97266、179.94058.第78頁/共225頁時間序列上的時間序列上的曲線估計曲線估計第79頁/共225頁定義:時間序列的曲線估計

33、是分析社會和經(jīng)濟(jì)現(xiàn)象中經(jīng)常用到的一種曲線估計。通常把時間設(shè)為自變量x,代表具體的經(jīng)濟(jì)或社會現(xiàn)象的變量設(shè)為因變量y,研究變量x與y之間關(guān)系的方法就是時間序列曲線估計。其具體步驟與一般的曲線估計基本類似第80頁/共225頁對19782006年間社會消費(fèi)品零售總額之間的關(guān)系進(jìn)行曲線回歸分析時間序列上的曲線估計應(yīng)用舉例第81頁/共225頁注:因變量選擇y(社會消費(fèi)品零售總額),變量選擇x(年份),同時選中“時間”項,表示其為代表時間的自變量?!澳P汀笨騼?nèi)勾選線性、二次項、立方和冪四種曲線模型進(jìn)行估計,不必勾選“顯示ANOVA表格”。第82頁/共225頁注:在“曲線”估計中單擊“保存”按鈕,當(dāng)以時間作為

34、自變量時,“預(yù)測個案”是有效的?!皬墓烙嬈诘阶詈笠粋€個案的預(yù)測”是計算當(dāng)前所有樣本期內(nèi)的預(yù)測值?!邦A(yù)測范圍”是指如果預(yù)測的范圍超過了當(dāng)前樣本期,可以選擇在此項隨后的“觀測值”中鍵入一個需預(yù)測的期數(shù),“31”表示將使用不同曲線模型對19782008年這31年的社會消費(fèi)品零售總額作預(yù)測,并在spss數(shù)據(jù)編輯窗口中保留所有預(yù)測值。第83頁/共225頁結(jié)果和分析所選的所選的4種曲線函數(shù)中以立方曲線的擬合優(yōu)度最高。所以種曲線函數(shù)中以立方曲線的擬合優(yōu)度最高。所以選擇立方擬合社會消費(fèi)品零售總額在各年的變化趨勢,接選擇立方擬合社會消費(fèi)品零售總額在各年的變化趨勢,接下來結(jié)合觀察值和各種函數(shù)模型預(yù)測值的對比圖加以

35、檢驗。下來結(jié)合觀察值和各種函數(shù)模型預(yù)測值的對比圖加以檢驗。第84頁/共225頁第85頁/共225頁從對比圖中可以看出,三次函數(shù)的曲線與樣本的實際觀察值擬合得較好,所以決定對本節(jié)中的研究問題“社會消費(fèi)品零售總額的趨勢分析”采用指數(shù)函數(shù)進(jìn)行回歸分析,其具體模型為:23第86頁/共225頁由于在“曲線估計”窗口中選了“保存”項,因此在spss數(shù)據(jù)編輯窗口中就新增了fit_1,fit_2,fit_3,fit_4四個變量的預(yù)測值,同時在窗口下面還新增了兩個個案,他們分別代表對2007年和2008年的預(yù)測值。以三次函數(shù)做回歸分析:第87頁/共225頁邏輯回歸分析第88頁/共225頁90第89頁/共225頁

36、91第90頁/共225頁92第91頁/共225頁93第92頁/共225頁94第93頁/共225頁95第94頁/共225頁96第95頁/共225頁97第96頁/共225頁98第97頁/共225頁99第98頁/共225頁100第99頁/共225頁101第100頁/共225頁多項logistic回歸:二元logistic回歸:二元與多項logistic回歸的區(qū)別第101頁/共225頁103同二元Logistic回歸相對應(yīng),當(dāng)因變量有2個以上的分類變量時,就選用“多項Logistic回歸”。在因變量中,其中一個分類變量要作基線類,其他類別都同它比較成為非冗余的邏輯變換模型,對于基線類,其模型中所有系數(shù)

37、均為0。比如,三分類的變量A、B、C,可以以B為基線,A與B比較,C與B比較,這就如同建立了兩個二元Logistic回歸分析。多項Logistic回歸第102頁/共225頁104第103頁/共225頁105第104頁/共225頁106第105頁/共225頁107第106頁/共225頁108第107頁/共225頁“統(tǒng)計量和圖統(tǒng)計量和圖”框中的選項用來選擇輸出哪些統(tǒng)計量或統(tǒng)計圖表,具體選框中的選項用來選擇輸出哪些統(tǒng)計量或統(tǒng)計圖表,具體選項如下。項如下。p Classification plots Classification plots(分類圖):通過比較因變量的觀測值和預(yù)測值之間(分類圖):通過

38、比較因變量的觀測值和預(yù)測值之間關(guān)系,反映回歸模型的擬合效果。關(guān)系,反映回歸模型的擬合效果。p Hosmer-Lemeshow goodness-of-fit Hosmer-Lemeshow goodness-of-fit (H-LH-L擬合優(yōu)度檢驗統(tǒng)計量):用以檢擬合優(yōu)度檢驗統(tǒng)計量):用以檢驗整個回歸模型的擬合優(yōu)度。驗整個回歸模型的擬合優(yōu)度。p Casewise listing of residuals Casewise listing of residuals(個案殘差列表):輸出標(biāo)準(zhǔn)方差大于某值(個案殘差列表):輸出標(biāo)準(zhǔn)方差大于某值(Outliers outsideOutliers out

39、side* *std. Dev.std. Dev.)的個案或者全部個案()的個案或者全部個案(All casesAll cases)的入選狀態(tài),)的入選狀態(tài),因變量的觀測值和預(yù)測值及其相應(yīng)預(yù)測概率、殘差值。因變量的觀測值和預(yù)測值及其相應(yīng)預(yù)測概率、殘差值。p Correlations of estimates Correlations of estimates (估計參數(shù)的相關(guān)性):輸出模型中各估計參數(shù)(估計參數(shù)的相關(guān)性):輸出模型中各估計參數(shù)間的相關(guān)矩陣。間的相關(guān)矩陣。p Iteration history Iteration history (迭代歷史):輸出參數(shù)估計迭代過程中的系數(shù)及對數(shù)(

40、迭代歷史):輸出參數(shù)估計迭代過程中的系數(shù)及對數(shù)似然值。似然值。p CI for exp CI for exp(B B)(exp(exp(B B)的)的N%N%置信區(qū)間置信區(qū)間) ):選中該選項將會在模型檢驗:選中該選項將會在模型檢驗的輸出結(jié)果中列出的輸出結(jié)果中列出expexp(B B)(各回歸系數(shù)指數(shù)函數(shù)值)的)(各回歸系數(shù)指數(shù)函數(shù)值)的N%N%(缺省值為(缺省值為95%95%)置信區(qū)間,如果要改變?nèi)笔≈担梢栽诳瞻追娇騼?nèi)輸入)置信區(qū)間,如果要改變?nèi)笔≈担梢栽诳瞻追娇騼?nèi)輸入199199(一般(一般常用的值為常用的值為9090,9595,9999)之間的任何一個整數(shù)。)之間的任何一個整數(shù)。選項

41、說明第108頁/共225頁110“輸出輸出”框用來選擇輸出計算結(jié)果的方式。框用來選擇輸出計算結(jié)果的方式。p At each step At each step:顯示:顯示spssspss每個步驟的計算結(jié)果。每個步驟的計算結(jié)果。p At last step At last step:只顯示最終計算結(jié)果。:只顯示最終計算結(jié)果。“在模型中包括常數(shù)在模型中包括常數(shù)”選項用以確定所求模型的參數(shù)是否要包含常數(shù)項。選項用以確定所求模型的參數(shù)是否要包含常數(shù)項。為了更好地說明以上各選項的意義,本例選擇了所有選項,但保留各選項中的缺省值。為了更好地說明以上各選項的意義,本例選擇了所有選項,但保留各選項中的缺省值。

42、選項說明第109頁/共225頁“步進(jìn)概率”框用來設(shè)定步長標(biāo)準(zhǔn),以便逐步控制自變量進(jìn)入方程或被剔除出方程:框用來設(shè)定步長標(biāo)準(zhǔn),以便逐步控制自變量進(jìn)入方程或被剔除出方程:p進(jìn)入進(jìn)入 :設(shè)置變量進(jìn)入方程的標(biāo)準(zhǔn)值。如果變量的分?jǐn)?shù)統(tǒng)計概率小于所設(shè)置進(jìn)入方程的標(biāo)準(zhǔn)值,則該變量進(jìn)入模型,:設(shè)置變量進(jìn)入方程的標(biāo)準(zhǔn)值。如果變量的分?jǐn)?shù)統(tǒng)計概率小于所設(shè)置進(jìn)入方程的標(biāo)準(zhǔn)值,則該變量進(jìn)入模型,SPSSSPSS默認(rèn)的顯著性水平為默認(rèn)的顯著性水平為p刪除刪除:設(shè)置變量被剔除方程的標(biāo)準(zhǔn)值。如果變量的分?jǐn)?shù)統(tǒng)計概率大于所設(shè)置被剔除出方程的標(biāo)準(zhǔn)值,則將該變量剔除出方程,:設(shè)置變量被剔除方程的標(biāo)準(zhǔn)值。如果變量的分?jǐn)?shù)統(tǒng)計概率大于所設(shè)置

43、被剔除出方程的標(biāo)準(zhǔn)值,則將該變量剔除出方程,SPSSSPSS默認(rèn)的顯著性水平為默認(rèn)的顯著性水平為p “分類標(biāo)準(zhǔn)值”選項用以確定個案分類的中止點(diǎn)。因變量預(yù)測值大于分類中止點(diǎn)的個案設(shè)歸為正個案一類;因變量預(yù)測值小于分類中止點(diǎn)的個案設(shè)為負(fù)個案。選項用以確定個案分類的中止點(diǎn)。因變量預(yù)測值大于分類中止點(diǎn)的個案設(shè)歸為正個案一類;因變量預(yù)測值小于分類中止點(diǎn)的個案設(shè)為負(fù)個案。SPSSSPSS設(shè)中止點(diǎn)缺省值為,我們可以通過輸入之間任一數(shù)值改變?nèi)笔≈?,從而產(chǎn)生新的分類表。設(shè)中止點(diǎn)缺省值為,我們可以通過輸入之間任一數(shù)值改變?nèi)笔≈?,從而產(chǎn)生新的分類表。p “最大迭代次數(shù)最大迭代次數(shù)”選項用以確定最大對數(shù)似然值達(dá)到之前

44、的迭代次數(shù)。最大對數(shù)似然值是通過反復(fù)迭代計算知道收斂為止而得到的。選項用以確定最大對數(shù)似然值達(dá)到之前的迭代次數(shù)。最大對數(shù)似然值是通過反復(fù)迭代計算知道收斂為止而得到的。SPSSSPSS中該項的缺省值為中該項的缺省值為2020,我們可以重新輸入一個新的正整數(shù)來改變此項的值。,我們可以重新輸入一個新的正整數(shù)來改變此項的值。選項說明第110頁/共225頁112第111頁/共225頁第二個表格說明初始的因變量值(第二個表格說明初始的因變量值(0 0,1 1)已經(jīng)轉(zhuǎn)換為邏輯回)已經(jīng)轉(zhuǎn)換為邏輯回歸分析中常用的歸分析中常用的0 0、1 1數(shù)值。數(shù)值。SPSSSPSS輸出結(jié)果文件如下。輸出結(jié)果文件如下。(1 1

45、)第一部分輸出結(jié)果有兩個表格,第一個表格說明所有個案()第一部分輸出結(jié)果有兩個表格,第一個表格說明所有個案(2828個)都被選入作為回歸分析的個案。個)都被選入作為回歸分析的個案。6.結(jié)果討論和分析:結(jié)果分析第112頁/共225頁(2 2)第二部分(第二部分(Block 0Block 0)輸出結(jié)果有)輸出結(jié)果有4 4個表格。個表格。 第第1 1個輸出表格列出個輸出表格列出迭代過程迭代過程。其中常數(shù)項包括在模型中,初始。其中常數(shù)項包括在模型中,初始-2LL-2LL為。迭代為。迭代結(jié)束于第二步,因為此時參數(shù)與其在上一步的變化已經(jīng)小于結(jié)束于第二步,因為此時參數(shù)與其在上一步的變化已經(jīng)小于 。第第2 2

46、個分類表說明個分類表說明Step 0Step 0 的擬合效果。的擬合效果。可以看出對于可以看出對于y=0y=0,有有100%100%的準(zhǔn)確性,的準(zhǔn)確性,對于對于y=1y=1,有,有0%0%準(zhǔn)確準(zhǔn)確性,總共有性,總共有53.6%53.6%的的準(zhǔn)確性。準(zhǔn)確性。此時參數(shù)估計的變化表現(xiàn)此時參數(shù)估計的變化表現(xiàn)為對數(shù)似然值的變化為對數(shù)似然值的變化分類表分類表結(jié)果分析第113頁/共225頁 下面兩個表格給出了下面兩個表格給出了模型系數(shù)模型系數(shù)的檢驗結(jié)果,其中常數(shù)項的系數(shù)值為,其伴隨概率為,可見常數(shù)項不顯著。的檢驗結(jié)果,其中常數(shù)項的系數(shù)值為,其伴隨概率為,可見常數(shù)項不顯著。X1X1,X2X2,X3X3的系數(shù)通

47、過了檢驗,即這兩個變量顯著。的系數(shù)通過了檢驗,即這兩個變量顯著。各回歸系數(shù)各回歸系數(shù)指數(shù)函數(shù)值指數(shù)函數(shù)值結(jié)果分析第114頁/共225頁(3 3)表格列出了模型系數(shù)的綜合檢驗結(jié)果。)表格列出了模型系數(shù)的綜合檢驗結(jié)果。(4 4)表格給出了)表格給出了-2 -2對數(shù)似然值、對數(shù)似然值、Cox Cox 和和 Snell Snell 的的R R2 2 以及以及NagelkerkeNagelkerke的的R R2 2 檢驗統(tǒng)計結(jié)果。檢驗統(tǒng)計結(jié)果。coxcox和和snellsnell的的R R2 2是在似然值基礎(chǔ)上模仿線性回歸模型是在似然值基礎(chǔ)上模仿線性回歸模型的的R R2 2解釋解釋LogisticLog

48、istic回歸模型,一般小于回歸模型,一般小于1. 1.為了對為了對coxcox和和snellsnell的的R R2 2進(jìn)一步調(diào)整,使得取值范圍在進(jìn)一步調(diào)整,使得取值范圍在0101之間,之間,NagelkerkeNagelkerke把把coxcox和和snellsnell的的R R2 2除以它的最大除以它的最大值,即值,即NagelkerkeNagelkerke的的R R2 2第115頁/共225頁(5 5)表格給出了)表格給出了Hosmer Hosmer 和和 Lemeshow Lemeshow 的擬合優(yōu)度檢驗統(tǒng)計量。的擬合優(yōu)度檢驗統(tǒng)計量。Hosmer and LemeshowHosmer

49、and Lemeshow檢驗檢驗Hosmer and LemeshowHosmer and Lemeshow檢驗的隨機(jī)性表檢驗的隨機(jī)性表 與一般擬合優(yōu)度檢驗不同,與一般擬合優(yōu)度檢驗不同,HosmerHosmer和和LemeshowLemeshow的擬合優(yōu)度檢驗的擬合優(yōu)度檢驗通常把樣本通常把樣本數(shù)據(jù)根據(jù)預(yù)測概率分為數(shù)據(jù)根據(jù)預(yù)測概率分為1010組,然后根據(jù)觀測頻數(shù)和期望頻數(shù)構(gòu)造卡方統(tǒng)計組,然后根據(jù)觀測頻數(shù)和期望頻數(shù)構(gòu)造卡方統(tǒng)計量量( (即即HosmerHosmer和和LemeshowLemeshow的擬合優(yōu)度檢驗統(tǒng)計量,簡稱的擬合優(yōu)度檢驗統(tǒng)計量,簡稱HLHL擬合優(yōu)度檢驗擬合優(yōu)度檢驗統(tǒng)計量統(tǒng)計量)

50、),最后根據(jù)自由度為,最后根據(jù)自由度為8 8的卡方分布計算其的卡方分布計算其p p值并對值并對LogisticLogistic模型進(jìn)行檢模型進(jìn)行檢驗。如果該驗。如果該P(yáng) P值小于給定的顯著性水平值小于給定的顯著性水平 ( (如如0.05)0.05),表明模型的預(yù)測值與,表明模型的預(yù)測值與觀測值存在顯著差異。觀測值存在顯著差異。如果如果P P值大于給定的顯著性水平,表明在可接受的水值大于給定的顯著性水平,表明在可接受的水平上模型的估計擬合了數(shù)據(jù)。平上模型的估計擬合了數(shù)據(jù)。大于,表明擬合了數(shù)據(jù)大于,表明擬合了數(shù)據(jù)第116頁/共225頁(6 6)分類表說明第一次迭代結(jié)果的擬合效果,從該表格可以看出對

51、于)分類表說明第一次迭代結(jié)果的擬合效果,從該表格可以看出對于y=0y=0,有,有86.7%86.7%的準(zhǔn)確性;對于的準(zhǔn)確性;對于y=1y=1,有,有76.9%76.9%準(zhǔn)確性,因此對于所有個案總共有準(zhǔn)確性,因此對于所有個案總共有82.1%82.1%的準(zhǔn)確性。的準(zhǔn)確性。正確分類比例正確分類比例預(yù)測值預(yù)測值觀測值觀測值第117頁/共225頁(7 7)方程中的變量表格列出了)方程中的變量表格列出了Step 1 Step 1 中各個變量對應(yīng)的系數(shù)中各個變量對應(yīng)的系數(shù),以及該變量對應(yīng)的,以及該變量對應(yīng)的Wald Wald 統(tǒng)計量和它對應(yīng)的相伴概率。從該統(tǒng)計量和它對應(yīng)的相伴概率。從該表格中可以看出表格中可

52、以看出X3X3相伴概率最小,相伴概率最小,WaldWald統(tǒng)計量最大,可見該統(tǒng)計量最大,可見該標(biāo)量在模型中很重要標(biāo)量在模型中很重要。waldwald統(tǒng)計量統(tǒng)計量用于判斷用于判斷個變量是否應(yīng)該包含在模型中。個變量是否應(yīng)該包含在模型中。 SPSSSPSS軟件沒軟件沒有給出有給出LogisticcLogisticc回歸的標(biāo)準(zhǔn)化回歸系數(shù),因此,如果要考慮每個自變回歸的標(biāo)準(zhǔn)化回歸系數(shù),因此,如果要考慮每個自變量在回歸方程量在回歸方程中的重要性,不妨直接比較中的重要性,不妨直接比較WaldWald統(tǒng)計量的大小統(tǒng)計量的大小( (或或sig)sig),WaldWald統(tǒng)計量大統(tǒng)計量大者者( (或或sigsig

53、值小者值小者) )顯著性高,也就更重要。顯著性高,也就更重要。第118頁/共225頁(8 8)相關(guān)矩陣表格列出了常數(shù))相關(guān)矩陣表格列出了常數(shù)ConstantConstant、系數(shù)之間的相關(guān)矩陣。常數(shù)與月收入之間相關(guān)性最大,年齡和性別之間的相關(guān)性最小。、系數(shù)之間的相關(guān)矩陣。常數(shù)與月收入之間相關(guān)性最大,年齡和性別之間的相關(guān)性最小。相關(guān)矩陣相關(guān)矩陣第119頁/共225頁(9 9)下圖所示是觀測值和預(yù)測概率分布圖。該圖以)下圖所示是觀測值和預(yù)測概率分布圖。該圖以0 0和和1 1為符號,每四個符號為符號,每四個符號代表一個個案。代表一個個案。橫坐標(biāo)是個案屬于橫坐標(biāo)是個案屬于1 1的隸屬度的隸屬度,這里,

54、這里稱為預(yù)測概率稱為預(yù)測概率(Predicted Predicted ProbabilityProbability)。)??v坐標(biāo)是個案分布頻數(shù)縱坐標(biāo)是個案分布頻數(shù),反映個案的分布。,反映個案的分布。 如果邏輯回歸預(yù)測完全準(zhǔn)確,那么該坐標(biāo)圖中預(yù)測概率是之間的個案如果邏輯回歸預(yù)測完全準(zhǔn)確,那么該坐標(biāo)圖中預(yù)測概率是之間的個案都應(yīng)該是都應(yīng)該是0 0,0.510.51之間的個案都應(yīng)該是之間的個案都應(yīng)該是1. 1. 該例生成的圖基本上符合這個效果。不正確的結(jié)果包括:預(yù)測概率是該例生成的圖基本上符合這個效果。不正確的結(jié)果包括:預(yù)測概率是之間的個案中有之間的個案中有3 3個實際的觀測值為個實際的觀測值為1 1

55、,0.510.51之間的個案觀測值有之間的個案觀測值有2 2個為個為0 0,這是錯誤預(yù)測的結(jié)果。,這是錯誤預(yù)測的結(jié)果。觀測值和預(yù)測概率分布圖觀測值和預(yù)測概率分布圖第120頁/共225頁(1010)邏輯回歸的最后一個輸出表格式)邏輯回歸的最后一個輸出表格式Casewise ListCasewise List,列出了殘差大于列出了殘差大于2 2的個案的個案。本例中列出了兩個符合條件的個案,分別是第。本例中列出了兩個符合條件的個案,分別是第1010個案和第個案和第1919個案。這兩個個案都有個案。這兩個個案都有* * *,表明這兩個個案的邏輯回歸結(jié)果是錯誤的。表明這兩個個案的邏輯回歸結(jié)果是錯誤的。案

56、例列表案例列表殘差、標(biāo)準(zhǔn)化殘差第121頁/共225頁123案例2. 多項Logistic回歸分析某快餐公司為了提高早餐的市場份額,對880名消費(fèi)者做了一份調(diào)查,請利用多項Logistic回歸方法分析3種早餐的市場銷售情況。數(shù)據(jù)見表L-1。第122頁/共225頁124操作步驟:1.輸入數(shù)據(jù)第123頁/共225頁1252.在“分析”菜單的“回歸”子菜單中選擇“多項 Logistic”命令,進(jìn)行多項Logistic回歸分析;第124頁/共225頁1263.變量設(shè)置:選擇相應(yīng)的“因變量”、“因子”項目; 接著點(diǎn)擊“參考類別”,對因變量設(shè)置“參考類別”,分別有“第一類、最后一類、用戶指定取值”三種類別;

57、然后選擇“類別順序”;根據(jù)圖示設(shè)置。第125頁/共225頁1274.模型設(shè)置:點(diǎn)擊“模型”,進(jìn)入模型界面;選擇“設(shè)定/步進(jìn)式”模型;把“因素”列表中的“agecat”和“active”放入“強(qiáng)制輸入項”欄,建立項選擇“主效應(yīng)”;如圖進(jìn)行設(shè)置。第126頁/共225頁1285.統(tǒng)計量設(shè)置:點(diǎn)擊“統(tǒng)計量”, 進(jìn)行圖示設(shè)置。用于選擇關(guān)于統(tǒng)計模型的統(tǒng)計量用于選擇關(guān)于模型參數(shù)的輸出統(tǒng)計量設(shè)置分組定義第127頁/共225頁1296.收斂標(biāo)準(zhǔn)設(shè)置:點(diǎn)擊“條件”,設(shè)置收斂準(zhǔn)則。第128頁/共225頁1307.選項設(shè)置:點(diǎn)擊“選項”,在此設(shè)置逐步回歸的參數(shù)。第129頁/共225頁1318.保存設(shè)置:點(diǎn)擊“保存”,

58、勾選需要保存到數(shù)據(jù)集中的變量。第130頁/共225頁1329.結(jié)果分析:按“確定”,獲得需要的分析結(jié)果。擬合優(yōu)度表格:零假設(shè)是模型能夠很好擬合原始數(shù)據(jù)。Pearson統(tǒng)計量和偏差統(tǒng)計量的顯著水平都大于,不能否定零假設(shè),即最終模型顯著成立。零假設(shè)認(rèn)為某效應(yīng)從模型中剔除后系數(shù)沒有變化。由于卡方檢驗的顯著水平(Sig值)都遠(yuǎn)遠(yuǎn)小于,故不能否定零假設(shè),認(rèn)為3個效應(yīng)對系數(shù)的影響都是顯著的,不能剔除。第131頁/共225頁133第132頁/共225頁134第133頁/共225頁135第134頁/共225頁Ordinal Regression Ordinal Regression 序數(shù)回歸分析序數(shù)回歸分析第

59、135頁/共225頁相關(guān)分析與回歸分析定義定義:是根據(jù)反應(yīng)變量水平是否有序來區(qū)分的有序多分類的是根據(jù)反應(yīng)變量水平是否有序來區(qū)分的有序多分類的LogisticLogistic回歸,又稱回歸,又稱之為等級回歸分析,序數(shù)回歸的過程在語法中稱為之為等級回歸分析,序數(shù)回歸的過程在語法中稱為 PLUM PLUM 。應(yīng)用應(yīng)用:如療效可以分為如療效可以分為無效、緩解、好轉(zhuǎn)、治愈無效、緩解、好轉(zhuǎn)、治愈4 4個等級,其中緩解與好轉(zhuǎn)是個等級,其中緩解與好轉(zhuǎn)是病人的病人的主觀體驗主觀體驗,難以測量與量化,用序數(shù)回歸就可以分析這樣的有序,難以測量與量化,用序數(shù)回歸就可以分析這樣的有序變量。變量。Ordinal Regr

60、ession Ordinal Regression 序數(shù)回歸分析序數(shù)回歸分析有序結(jié)果變量回歸的適用條件有序結(jié)果變量回歸的適用條件: :(1) (1) 一個因變量一個因變量, ,它是兩個或以上水平的分類變量。無論是主觀它是兩個或以上水平的分類變量。無論是主觀( (名義變量名義變量) )或客觀或客觀( (有序結(jié)果變量有序結(jié)果變量) )的分類均可。的分類均可。(2) (2) 一個或以上的協(xié)變量一個或以上的協(xié)變量, ,它可以是分類變量或連續(xù)型變量。它可以是分類變量或連續(xù)型變量?;颊邔λ幬飫┝靠赡艿姆磻?yīng)可以分為患者對藥物劑量可能的反應(yīng)可以分為 無、輕微、適度或劇烈。輕微反應(yīng)無、輕微、適度或劇烈。輕微反應(yīng)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論