![第八章 相關(guān)分析和回歸分析_第1頁](http://file3.renrendoc.com/fileroot3/2021-11/25/fa599df2-337a-4e26-93f6-5a7754853a04/fa599df2-337a-4e26-93f6-5a7754853a041.gif)
![第八章 相關(guān)分析和回歸分析_第2頁](http://file3.renrendoc.com/fileroot3/2021-11/25/fa599df2-337a-4e26-93f6-5a7754853a04/fa599df2-337a-4e26-93f6-5a7754853a042.gif)
![第八章 相關(guān)分析和回歸分析_第3頁](http://file3.renrendoc.com/fileroot3/2021-11/25/fa599df2-337a-4e26-93f6-5a7754853a04/fa599df2-337a-4e26-93f6-5a7754853a043.gif)
![第八章 相關(guān)分析和回歸分析_第4頁](http://file3.renrendoc.com/fileroot3/2021-11/25/fa599df2-337a-4e26-93f6-5a7754853a04/fa599df2-337a-4e26-93f6-5a7754853a044.gif)
![第八章 相關(guān)分析和回歸分析_第5頁](http://file3.renrendoc.com/fileroot3/2021-11/25/fa599df2-337a-4e26-93f6-5a7754853a04/fa599df2-337a-4e26-93f6-5a7754853a045.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、第八章第八章SPSS相關(guān)分析與回歸分析相關(guān)分析與回歸分析8.2.4 相關(guān)分析應(yīng)用舉例相關(guān)分析應(yīng)用舉例 為研究高等院校人文社會科學研究中立項課為研究高等院校人文社會科學研究中立項課題數(shù)會受哪些因素的影響,收集題數(shù)會受哪些因素的影響,收集1999年年31個省個省市自治區(qū)部分高校有關(guān)社科研究方面的數(shù)據(jù),研市自治區(qū)部分高校有關(guān)社科研究方面的數(shù)據(jù),研究立項課題數(shù)(當年)與投入的具有高級職稱的究立項課題數(shù)(當年)與投入的具有高級職稱的人年數(shù)(當年)、發(fā)表的論文數(shù)(上年)之間是人年數(shù)(當年)、發(fā)表的論文數(shù)(上年)之間是否具有較強的線性關(guān)系。否具有較強的線性關(guān)系。8.3 偏相關(guān)分析8.3.1 偏相關(guān)分析和偏相
2、關(guān)系數(shù)偏相關(guān)分析和偏相關(guān)系數(shù) 上節(jié)中的相關(guān)系數(shù)是研究兩變量間線性上節(jié)中的相關(guān)系數(shù)是研究兩變量間線性相關(guān)性的,若還存在其他因素影響,就相關(guān)相關(guān)性的,若還存在其他因素影響,就相關(guān)系數(shù)本身來講,它未必是兩變量間線性相關(guān)系數(shù)本身來講,它未必是兩變量間線性相關(guān)強弱的真實體現(xiàn),往往有夸大的趨勢。強弱的真實體現(xiàn),往往有夸大的趨勢。 例如,在研究商品的需求量和價格、消例如,在研究商品的需求量和價格、消費者收入之間的線性關(guān)系時,需求量和價格費者收入之間的線性關(guān)系時,需求量和價格之間的相關(guān)關(guān)系實際還包含了消費者收入對之間的相關(guān)關(guān)系實際還包含了消費者收入對價格和商品需求量的影響。在這種情況下,價格和商品需求量的影響
3、。在這種情況下,單純利用相關(guān)系數(shù)來評價變量間的相關(guān)性顯單純利用相關(guān)系數(shù)來評價變量間的相關(guān)性顯然是不準確的,而需要在剔除其他相關(guān)因素然是不準確的,而需要在剔除其他相關(guān)因素影響的條件下計算變量間的相關(guān)。偏相關(guān)的影響的條件下計算變量間的相關(guān)。偏相關(guān)的意義就在于此。意義就在于此。偏相關(guān)分析也稱凈相關(guān)分析,它在控制其他變量的偏相關(guān)分析也稱凈相關(guān)分析,它在控制其他變量的線性影響的條件下分析兩變量間的線性關(guān)系,所采線性影響的條件下分析兩變量間的線性關(guān)系,所采用的工具是偏相關(guān)系數(shù)。用的工具是偏相關(guān)系數(shù)。控制變量個數(shù)為控制變量個數(shù)為1時,偏相關(guān)系數(shù)稱一階偏相關(guān);時,偏相關(guān)系數(shù)稱一階偏相關(guān);當控制兩個變量時,偏相
4、關(guān)系數(shù)稱為二階偏相關(guān);當控制兩個變量時,偏相關(guān)系數(shù)稱為二階偏相關(guān);當控制變量的個數(shù)為當控制變量的個數(shù)為0時,偏相關(guān)系數(shù)稱為零階偏時,偏相關(guān)系數(shù)稱為零階偏相關(guān),也就是簡單相關(guān)系數(shù)。相關(guān),也就是簡單相關(guān)系數(shù)。利用偏相關(guān)系數(shù)進行分析的步驟第一,計算樣本的偏相關(guān)系數(shù)第一,計算樣本的偏相關(guān)系數(shù) 假設(shè)有三個變量假設(shè)有三個變量y、x1和和x2,在分析,在分析x1和和y之間的凈之間的凈相關(guān)時,當控制了相關(guān)時,當控制了x2的線性作用后,的線性作用后,x1和和y之間的一階偏之間的一階偏相關(guān)定義為:相關(guān)定義為: 偏相關(guān)系數(shù)的取值范圍及大小含義與相關(guān)系數(shù)相同。偏相關(guān)系數(shù)的取值范圍及大小含義與相關(guān)系數(shù)相同。12 121
5、,2222121212212(1)(1)yyxxxyyyyyyrr rrrrrrr1其中,、分別表示 和x 的相關(guān)系數(shù)、 和的相關(guān)系數(shù)、和的相關(guān)系數(shù)。第二,對樣本來自的兩總體是否存在顯著的凈相關(guān)進第二,對樣本來自的兩總體是否存在顯著的凈相關(guān)進行推斷行推斷檢驗統(tǒng)計量為:檢驗統(tǒng)計量為: 其中,其中,r為偏相關(guān)系數(shù),為偏相關(guān)系數(shù),n為樣本數(shù),為樣本數(shù),q為階數(shù)。為階數(shù)。T統(tǒng)計量服從統(tǒng)計量服從n-q-2個自由度的個自由度的t分布。分布。221nqtrr 8.3.2 偏相關(guān)分析的基本操作1.選擇菜單選擇菜單AnalyzeCorrelatePartial2.把參與分析的變量選擇到把參與分析的變量選擇到Va
6、riables框中??蛑小?.選擇一個或多個控制變量到選擇一個或多個控制變量到Controlling for框框中。中。4.在在Test of Significance框中選擇輸出偏相關(guān)框中選擇輸出偏相關(guān)檢驗的雙尾概率檢驗的雙尾概率p值或單尾概率值或單尾概率p值。值。5.在在Option按鈕中的按鈕中的Statistics選項中,選中選項中,選中Zero-order Correlations表示輸出零階偏相表示輸出零階偏相關(guān)系數(shù)。關(guān)系數(shù)。 至此,至此,SPSS將自動進行偏相關(guān)分析和統(tǒng)計將自動進行偏相關(guān)分析和統(tǒng)計檢驗,并將結(jié)果顯示到輸出窗口。檢驗,并將結(jié)果顯示到輸出窗口。8.3.3 偏相關(guān)分析的
7、應(yīng)用舉例 上節(jié)中研究高校立項課題總數(shù)影響因素的相關(guān)分上節(jié)中研究高校立項課題總數(shù)影響因素的相關(guān)分析中發(fā)現(xiàn),發(fā)現(xiàn)立項課題數(shù)與論文數(shù)之間有較強正析中發(fā)現(xiàn),發(fā)現(xiàn)立項課題數(shù)與論文數(shù)之間有較強正線性相關(guān)關(guān)系,但應(yīng)看到這種關(guān)系中可能摻入了投線性相關(guān)關(guān)系,但應(yīng)看到這種關(guān)系中可能摻入了投入高級職稱的人年數(shù)的影響,因此,為研究立項課入高級職稱的人年數(shù)的影響,因此,為研究立項課題總數(shù)和發(fā)表論文數(shù)之間的凈相關(guān)系數(shù),可以將投題總數(shù)和發(fā)表論文數(shù)之間的凈相關(guān)系數(shù),可以將投入高級職稱的人年數(shù)加以控制,進行偏相關(guān)分析。入高級職稱的人年數(shù)加以控制,進行偏相關(guān)分析。8.4 線性回歸分析8.4.1線性回歸分析概述線性回歸分析概述線性
8、回歸分析的內(nèi)容線性回歸分析的內(nèi)容能否找到一個線性組合來說明一組自變量和因變量的關(guān)系如果能的話,這種關(guān)系的強度有多大,也就是利用自變量的線性組合來預測因變量的能力有多強整體解釋能力是否具有統(tǒng)計上的顯著性意義在整體解釋能力顯著的情況下,哪些自變量有顯著意義回歸分析的一般步驟回歸分析的一般步驟確定回歸方程中的解釋變量(自變量)和被解釋變量(因變量)確定回歸方程對回歸方程進行各種檢驗利用回歸方程進行預測多元線性回歸模型多元線性回歸方程:多元線性回歸方程: y=0+1x1+2x2+.+kxkn1、2、k為偏回歸系數(shù)。n1表示在其他自變量保持不變的情況下,自變量x1變動一個單位所引起的因變量y的平均變動。
9、n對于多元線性回歸方程:對于多元線性回歸方程: 在多元線性回歸分析中,引起判定系數(shù)增加的原因有兩個:一個是方程中的解釋變量個數(shù)增多,另一個是方程中引入了對被解釋變量有重要影響的解釋變量。如果某個自變量引入方程后對因變量的線性解釋有重要貢獻,那么必然會使誤差平方和顯著減小,并使平均的誤差平方和也顯著減小,從而使調(diào)整的判定系數(shù)提高。所以在多元線性回歸分析中,調(diào)整的判定系數(shù)比判定系數(shù)更能準確的反映回歸方程的擬合優(yōu)度。1/1/1122nSSTpnSSERSSTSSER8.4.3.4殘差分析殘差分析 殘差是指由回歸方程計算得到的預測值與實際樣本值之間殘差是指由回歸方程計算得到的預測值與實際樣本值之間的差
10、距,定義為:的差距,定義為: 對于線性回歸分析來講,如果方程能夠較好的反映被解釋對于線性回歸分析來講,如果方程能夠較好的反映被解釋變量的特征和規(guī)律性,那么殘差序列中應(yīng)不包含明顯的規(guī)律變量的特征和規(guī)律性,那么殘差序列中應(yīng)不包含明顯的規(guī)律性。殘差分析包括以下內(nèi)容:性。殘差分析包括以下內(nèi)容:殘差服從正態(tài)分布,其平均值殘差服從正態(tài)分布,其平均值等于等于0;殘差取值與;殘差取值與X的取值無關(guān);殘差不存在自相關(guān);殘差的取值無關(guān);殘差不存在自相關(guān);殘差方差相等。方差相等。 ).(22110ppiiiixxxyyye1、對于殘差均值和方差齊性檢驗可以利用殘差圖進行分析。如、對于殘差均值和方差齊性檢驗可以利用殘
11、差圖進行分析。如果殘差均值為零,殘差圖的點應(yīng)該在縱坐標為果殘差均值為零,殘差圖的點應(yīng)該在縱坐標為0的中心的帶狀的中心的帶狀區(qū)域中隨機散落。如果殘差的方差隨著解釋變量值(或被解區(qū)域中隨機散落。如果殘差的方差隨著解釋變量值(或被解釋變量值)的增加呈有規(guī)律的變化趨勢,則出現(xiàn)了異方差現(xiàn)釋變量值)的增加呈有規(guī)律的變化趨勢,則出現(xiàn)了異方差現(xiàn)象。象。2、DW檢驗。檢驗。 DW檢驗用來檢驗殘差的自相關(guān)。檢驗統(tǒng)計量為檢驗用來檢驗殘差的自相關(guān)。檢驗統(tǒng)計量為: DW=2表示無自相關(guān),在表示無自相關(guān),在0-2之間說明存在正自相關(guān),之間說明存在正自相關(guān),在在2-4之間說明存在負的自相關(guān)。之間說明存在負的自相關(guān)。一般情況
12、下,一般情況下,DW值在值在1.5-2.5之間即可說明無自相關(guān)現(xiàn)象。之間即可說明無自相關(guān)現(xiàn)象。)1 (2)(22221nttnttteeeDW8.4.3.5多重共線性分析多重共線性分析 多重共線性是指解釋變量之間存在線性相關(guān)關(guān)系的現(xiàn)象多重共線性是指解釋變量之間存在線性相關(guān)關(guān)系的現(xiàn)象。測度多重共線性一般有以下方式:。測度多重共線性一般有以下方式:1、容忍度:、容忍度: 其中,其中, 是第是第i個解釋變量與方程中其他解釋變量間的復相個解釋變量與方程中其他解釋變量間的復相關(guān)系數(shù)的平方,表示解釋變量之間的線性相關(guān)程度。關(guān)系數(shù)的平方,表示解釋變量之間的線性相關(guān)程度。容忍度容忍度的取值范圍在的取值范圍在0
13、-1之間,越接近之間,越接近0表示多重共線性越強,越接表示多重共線性越強,越接近近1表示多重共線性越弱。表示多重共線性越弱。2、方差膨脹因子、方差膨脹因子VIF。方差膨脹因子是容忍度的倒數(shù)。方差膨脹因子是容忍度的倒數(shù)。VIF越越大多重共線性越強,當大多重共線性越強,當VIF大于等于大于等于10時,說明存在嚴重的時,說明存在嚴重的多重共線性。多重共線性。 21iiRTol2iR8.4.3 線性回歸分析的基本操作線性回歸分析的基本操作(1)選擇菜單)選擇菜單AnalyzeRegressionLinear,出現(xiàn)窗口:出現(xiàn)窗口:(2)選擇被解釋變量進入)選擇被解釋變量進入Dependent框。框。(3
14、)選擇一個或多個解釋變量進入)選擇一個或多個解釋變量進入Independent(s)框???。(4)在)在Method框中選擇回歸分析中解釋變量的框中選擇回歸分析中解釋變量的篩選策略。其中篩選策略。其中Enter表示所選變量強行進入回表示所選變量強行進入回歸方程,是歸方程,是SPSS默認的策略,通常用在一元線默認的策略,通常用在一元線性回歸分析中;性回歸分析中;Remove表示從回歸方程中剔除表示從回歸方程中剔除所選變量;所選變量;Stepwise表示逐步篩選策略;表示逐步篩選策略;Backward表示向后篩選策略;表示向后篩選策略;Forward表示表示向前篩選策略。向前篩選策略。注:多元回歸
15、分析中,變量的篩選一般有向前篩選、向后篩多元回歸分析中,變量的篩選一般有向前篩選、向后篩選、逐步篩選三種基本策略。選、逐步篩選三種基本策略。向前篩選(向前篩選( Forward )策略:解釋變量不斷進入回歸方程)策略:解釋變量不斷進入回歸方程的過程。首先,選擇與被解釋變量具有最高線性相關(guān)系數(shù)的過程。首先,選擇與被解釋變量具有最高線性相關(guān)系數(shù)的變量進入方程,并進行回歸方程的各種檢驗;然后,在的變量進入方程,并進行回歸方程的各種檢驗;然后,在剩余的變量中尋找與被解釋變量偏相關(guān)系數(shù)最高且通過檢剩余的變量中尋找與被解釋變量偏相關(guān)系數(shù)最高且通過檢驗的變量進入回歸方程,并對新建立的回歸方程進行各種驗的變量
16、進入回歸方程,并對新建立的回歸方程進行各種檢驗;這個過程一直重復,直到再也沒有可進入方程的變檢驗;這個過程一直重復,直到再也沒有可進入方程的變量為止。量為止。向后篩選(向后篩選( Backward )策略:變量不斷剔除出回歸方程)策略:變量不斷剔除出回歸方程的過程。首先,所有變量全部引入回歸方程,并對回歸方的過程。首先,所有變量全部引入回歸方程,并對回歸方程進行各種檢驗;然后,在回歸系數(shù)顯著性檢驗不顯著的程進行各種檢驗;然后,在回歸系數(shù)顯著性檢驗不顯著的一個或多個變量中,剔除一個或多個變量中,剔除t檢驗值最小的變量,并重新建立檢驗值最小的變量,并重新建立 回歸方程和進行各種檢驗;如果新建回歸方
17、程中所有變量回歸方程和進行各種檢驗;如果新建回歸方程中所有變量的回歸系數(shù)檢驗都顯著,則回歸方程建立結(jié)束。否則按上的回歸系數(shù)檢驗都顯著,則回歸方程建立結(jié)束。否則按上述方法再一次剔除最不顯著的變量,直到再也沒有可剔除述方法再一次剔除最不顯著的變量,直到再也沒有可剔除的變量為止。的變量為止。逐步篩選(逐步篩選( Stepwise )策略:在向前篩選策略的基礎(chǔ)上)策略:在向前篩選策略的基礎(chǔ)上結(jié)合向后篩選策略,在每個變量進入方程后再次判斷是否結(jié)合向后篩選策略,在每個變量進入方程后再次判斷是否存在應(yīng)該剔除出方程的變量。因此,逐步篩選策略在引入存在應(yīng)該剔除出方程的變量。因此,逐步篩選策略在引入變量的每一個階
18、段都提供了再剔除不顯著變量的機會。變量的每一個階段都提供了再剔除不顯著變量的機會。(5)第三和第四步中確定的解釋變量及變量篩選策略可放)第三和第四步中確定的解釋變量及變量篩選策略可放置在不同的塊(置在不同的塊(Block)中。通常在回歸分析中不止一組)中。通常在回歸分析中不止一組待進入方程的解釋變量和相應(yīng)的篩選策略,可以單擊待進入方程的解釋變量和相應(yīng)的篩選策略,可以單擊Next和和Previous按鈕設(shè)置多組解釋變量和變量篩選策按鈕設(shè)置多組解釋變量和變量篩選策略并放置在不同的塊中。略并放置在不同的塊中。(6)選擇一個變量作為條件變量放到)選擇一個變量作為條件變量放到Selection Vari
19、able框中,并單擊框中,并單擊Rule按鈕給定一個判斷條件。只按鈕給定一個判斷條件。只有變量值滿足判定條件的樣本才參與線性回歸分析。有變量值滿足判定條件的樣本才參與線性回歸分析。(7)在)在Case Labels框中指定哪個變量作為樣本數(shù)據(jù)點的框中指定哪個變量作為樣本數(shù)據(jù)點的標志變量,該變量的值將標在回歸分析的輸出圖形中。標志變量,該變量的值將標在回歸分析的輸出圖形中。8.4.4 線性回歸分析的其他操作線性回歸分析的其他操作1、Statistics按鈕,出現(xiàn)的窗口可供用戶選擇更多按鈕,出現(xiàn)的窗口可供用戶選擇更多的輸出統(tǒng)計量。的輸出統(tǒng)計量。(1)Estimates:SPSS默認輸出項,輸出與回
20、歸默認輸出項,輸出與回歸系數(shù)相關(guān)的統(tǒng)計量。包括回歸系數(shù)(偏回歸系數(shù)系數(shù)相關(guān)的統(tǒng)計量。包括回歸系數(shù)(偏回歸系數(shù))、回歸系數(shù)標準誤差、標準化回歸系數(shù)、回歸)、回歸系數(shù)標準誤差、標準化回歸系數(shù)、回歸系數(shù)顯著性檢驗的系數(shù)顯著性檢驗的t統(tǒng)計量和概率統(tǒng)計量和概率p值,各解釋變值,各解釋變量的容忍度。量的容忍度。(2)Confidence Intervals:輸出每個非標準化:輸出每個非標準化回歸系數(shù)回歸系數(shù)95的置信區(qū)間。的置信區(qū)間。(3)Descriptive:輸出各解釋變量和被解釋變量:輸出各解釋變量和被解釋變量的均值、標準差、相關(guān)系數(shù)矩陣及單側(cè)檢驗概率的均值、標準差、相關(guān)系數(shù)矩陣及單側(cè)檢驗概率p值。
21、值。(4)Model fit:SPSS默認輸出項,輸出判定系默認輸出項,輸出判定系數(shù)、調(diào)整的判定系數(shù)、回歸方程的標準誤差、回數(shù)、調(diào)整的判定系數(shù)、回歸方程的標準誤差、回歸方程顯著歸方程顯著F檢驗的方程分析表。檢驗的方程分析表。(5)R squared change:輸出每個解釋變量進:輸出每個解釋變量進入方程后引起的判定系數(shù)的變化量和入方程后引起的判定系數(shù)的變化量和F值的變化值的變化量。量。(6)Part and partial correlation:輸出方程中:輸出方程中各解釋變量與被解釋變量之間的簡單相關(guān)、偏相各解釋變量與被解釋變量之間的簡單相關(guān)、偏相關(guān)系數(shù)。關(guān)系數(shù)。(7)Covarian
22、ce matrix:輸出方程中各解釋變量:輸出方程中各解釋變量間的相關(guān)系數(shù)、協(xié)方差以及各回歸系數(shù)的方差。間的相關(guān)系數(shù)、協(xié)方差以及各回歸系數(shù)的方差。(8)Collinearity Diagnostics:多重共線性分析:多重共線性分析,輸出各個解釋變量的容忍度、方差膨脹因子、特,輸出各個解釋變量的容忍度、方差膨脹因子、特征值、條件指標、方差比例等。征值、條件指標、方差比例等。(9)在)在Residual框中:框中:Durbin-waston表示輸出表示輸出DW檢驗值;檢驗值;Casewise Diagnostic表示輸出表示輸出標準化殘差絕對值大于等于標準化殘差絕對值大于等于3(SPSS默認值)
23、的默認值)的樣本數(shù)據(jù)的相關(guān)信息,包括預測值、殘差、杠桿值樣本數(shù)據(jù)的相關(guān)信息,包括預測值、殘差、杠桿值等。等。2、Options選項,出現(xiàn)的窗口可供用戶設(shè)置多元選項,出現(xiàn)的窗口可供用戶設(shè)置多元線性回歸分析中解釋變量篩選的標準以及缺失值線性回歸分析中解釋變量篩選的標準以及缺失值的處理方式。的處理方式。3、Plot選項,出現(xiàn)的窗口用于對殘差序列的分析選項,出現(xiàn)的窗口用于對殘差序列的分析。(1)窗口左邊框中各變量名的含義是:)窗口左邊框中各變量名的含義是:DEPENDNT表示表示被解釋變量,被解釋變量,*ZPRED表示標準化預測值,表示標準化預測值,*ZRESID表示標準化殘差,表示標準化殘差,*DR
24、ESID表示剔除殘差,表示剔除殘差,*ADJPRED表示調(diào)整的預測值,表示調(diào)整的預測值,*SRESID表示學生化表示學生化殘差,殘差,*SDRESID表示剔除學生化殘差。表示剔除學生化殘差。(2)繪制多對變量的散點圖,可根據(jù)需要在)繪制多對變量的散點圖,可根據(jù)需要在scatter框中框中定義散點圖的縱坐標和橫坐標變量。定義散點圖的縱坐標和橫坐標變量。(3)在)在Standardized Residual Plots框中選擇框中選擇Histogram選項繪制標準化殘差序列的直方圖;選擇選項繪制標準化殘差序列的直方圖;選擇Normal probability plot繪制標準化殘差序列的正態(tài)繪制標
25、準化殘差序列的正態(tài)分布累計概率圖。選擇分布累計概率圖。選擇Produce all partial plots選選項表示依次繪制被解釋變量和各個解釋變量的散點圖。項表示依次繪制被解釋變量和各個解釋變量的散點圖。4、Save選項,該窗口將回歸分析的某些結(jié)果以選項,該窗口將回歸分析的某些結(jié)果以SPSS變量變量的形式保存到數(shù)據(jù)編輯窗口中,并可同時生成的形式保存到數(shù)據(jù)編輯窗口中,并可同時生成XML格式的格式的文件,便于分析結(jié)果的網(wǎng)絡(luò)發(fā)布。文件,便于分析結(jié)果的網(wǎng)絡(luò)發(fā)布。(1)Predicted Values框中:保存非標準化預測值、標框中:保存非標準化預測值、標準化預測值、調(diào)整的預測值和預測值的均值標準誤
26、差。準化預測值、調(diào)整的預測值和預測值的均值標準誤差。(2)Distance框中:保存均值或個體預測值框中:保存均值或個體預測值95(默認)(默認)置信區(qū)間的下限值和上限值。置信區(qū)間的下限值和上限值。(3)Residual框中:保存非標準化殘差、標準化殘差等??蛑校罕4娣菢藴驶瘹埐睢藴驶瘹埐畹?。(4)Influence Statistics框中:保存剔除第框中:保存剔除第i個樣本后統(tǒng)個樣本后統(tǒng)計量的變化量。計量的變化量。5、WSL選項,采用加權(quán)最小二乘法替代普通最小二乘法估計選項,采用加權(quán)最小二乘法替代普通最小二乘法估計回歸參數(shù),并指定一個變量作為權(quán)重變量?;貧w參數(shù),并指定一個變量作為權(quán)重變量
27、。 以高校科研研究數(shù)據(jù)為例,建立回歸方程研究以高??蒲醒芯繑?shù)據(jù)為例,建立回歸方程研究 1、課題總數(shù)受論文數(shù)的影響、課題總數(shù)受論文數(shù)的影響 2、以課題總數(shù)為被解釋變量,解釋變量為投入人年數(shù)(、以課題總數(shù)為被解釋變量,解釋變量為投入人年數(shù)(X2)、受投入高級職稱的人年數(shù)()、受投入高級職稱的人年數(shù)(X3)、投入科研事業(yè)費()、投入科研事業(yè)費(X4)、專著數(shù)()、專著數(shù)(X6)、論文數(shù)()、論文數(shù)(X7)、獲獎數(shù)()、獲獎數(shù)(X8)。)。 (1)解釋變量采用強制進入策略()解釋變量采用強制進入策略(Enter),并做多重共線),并做多重共線性檢測。性檢測。 (2)解釋變量采用向后篩選策略讓)解釋變量
28、采用向后篩選策略讓SPSS自動完成解釋變量自動完成解釋變量的選擇。的選擇。 (3)解釋變量采用逐步篩選策略讓)解釋變量采用逐步篩選策略讓SPSS自動完成解釋變量自動完成解釋變量的選擇。的選擇。 8.4.5 應(yīng)用舉例應(yīng)用舉例1、為研究收入和支出的關(guān)系,收集、為研究收入和支出的關(guān)系,收集1978-2002年我國的年人均可支配收入和年人均消費性支出年我國的年人均可支配收入和年人均消費性支出數(shù)據(jù),研究收入與支出之間是否具有較強的線性數(shù)據(jù),研究收入與支出之間是否具有較強的線性關(guān)系。關(guān)系。2、以年人均支出和教育數(shù)據(jù)為例,建立回歸方程、以年人均支出和教育數(shù)據(jù)為例,建立回歸方程研究年人均消費支出、恩格爾系數(shù)、
29、在外就餐、研究年人均消費支出、恩格爾系數(shù)、在外就餐、教育支出、住房人均使用面積受年人均可支配收教育支出、住房人均使用面積受年人均可支配收入的影響。入的影響。練習8.5 曲線估計8.5.1 曲線估計概述曲線估計概述 變量間的相關(guān)關(guān)系中,并不總是表現(xiàn)出線性變量間的相關(guān)關(guān)系中,并不總是表現(xiàn)出線性關(guān)系,非線性關(guān)系也是極為常見的。變量之間的關(guān)系,非線性關(guān)系也是極為常見的。變量之間的非線性關(guān)系可以劃分為本質(zhì)線性關(guān)系和本質(zhì)非線非線性關(guān)系可以劃分為本質(zhì)線性關(guān)系和本質(zhì)非線性關(guān)系。本質(zhì)線性關(guān)系是指變量關(guān)系形式上雖然性關(guān)系。本質(zhì)線性關(guān)系是指變量關(guān)系形式上雖然呈非線性關(guān)系,但可通過變量變換為線性關(guān)系,呈非線性關(guān)系,但
30、可通過變量變換為線性關(guān)系,并最終可通過線性回歸分析建立線性模型。本質(zhì)并最終可通過線性回歸分析建立線性模型。本質(zhì)非線性關(guān)系是指變量關(guān)系不僅形式上呈非線性關(guān)非線性關(guān)系是指變量關(guān)系不僅形式上呈非線性關(guān)系,而且也無法變換為線性關(guān)系。本節(jié)的曲線估系,而且也無法變換為線性關(guān)系。本節(jié)的曲線估計是解決本質(zhì)線性關(guān)系問題的。計是解決本質(zhì)線性關(guān)系問題的。常見的本質(zhì)線性模型有:常見的本質(zhì)線性模型有:1、二次曲線(二次曲線(Quadratic),),方程為方程為 ,變量變換后的方程為,變量變換后的方程為2、復合曲線(復合曲線(Compound),),方程為方程為,變量變換后的方程為,變量變換后的方程為3、增長曲線(增長
31、曲線(Growth),),方程為方程為,變量變換后的方程為,變量變換后的方程為2012yxx2012 11()yxx xx01xy 01ln( )ln()ln()yx01xye01ln( )yx4、對數(shù)曲線(對數(shù)曲線(Logarithmic),),方程為方程為 ,變量變換后的線性方程,變量變換后的線性方程為為5、三次曲線(三次曲線(Cubic),),方程為方程為,變量變換后的方程為,變量變換后的方程為6、S曲線(曲線(S),),方程為方程為 ,變量變,變量變換后的方程為換后的方程為7、指數(shù)曲線(指數(shù)曲線(Exponential),),方程為方程為,變量變換后的線性方程為,變量變換后的線性方程為
32、01ln( )yx01 1yx230123yxxx012 132yxxx01/xye01 1ln( )yx10 xye01ln( )ln()yx8、逆函數(shù)(逆函數(shù)(Inverse),),方程為方程為變量變換后的方程為變量變換后的方程為9、冪函數(shù)(冪函數(shù)(Power),),方程為方程為變量變換后的方程為變量變換后的方程為10、邏輯函數(shù)(邏輯函數(shù)(Logistic),),方程為方程為 變量變換后的線性方程為變量變換后的線性方程為01/yx01 1yx10()yx01ln( )ln()ln( )yx0111/xy 0111ln()ln(ln() )xy SPSS曲線估計中,首先,在不能明確究竟曲線估
33、計中,首先,在不能明確究竟哪種模型更接近樣本數(shù)據(jù)時,可在多種可選擇的哪種模型更接近樣本數(shù)據(jù)時,可在多種可選擇的模型中選擇幾種模型;然后模型中選擇幾種模型;然后SPSS自動完成模型自動完成模型的參數(shù)估計,并輸出回歸方程顯著性檢驗的的參數(shù)估計,并輸出回歸方程顯著性檢驗的F值值和概率和概率p值、判定系數(shù)值、判定系數(shù)R2等統(tǒng)計量;最后,以判等統(tǒng)計量;最后,以判定系數(shù)為主要依據(jù)選擇其中的最優(yōu)模型,并進行定系數(shù)為主要依據(jù)選擇其中的最優(yōu)模型,并進行預測分析等。另外,預測分析等。另外,SPSS曲線估計還可以以時曲線估計還可以以時間為解釋變量實現(xiàn)時間序列的簡單回歸分析和趨間為解釋變量實現(xiàn)時間序列的簡單回歸分析和
34、趨勢外推分析。勢外推分析。8.5.2 曲線估計的基本操作曲線估計的基本操作 可通過繪制并觀察樣本數(shù)據(jù)的散點圖粗略確可通過繪制并觀察樣本數(shù)據(jù)的散點圖粗略確定被解釋變量和解釋變量之間的相關(guān)關(guān)系,為曲定被解釋變量和解釋變量之間的相關(guān)關(guān)系,為曲線擬合中的模型選擇提供依據(jù)。線擬合中的模型選擇提供依據(jù)。SPSS曲線估計曲線估計的基本操作步驟是:的基本操作步驟是:(1)選擇菜單)選擇菜單AnalyzeRegressionCurve Estimation,出現(xiàn)窗口如下頁所示。,出現(xiàn)窗口如下頁所示。(2)把被解釋變量選到)把被解釋變量選到Dependent框中。框中。(3)曲線估計中的解釋變量可以是相關(guān)因素變量
35、也可是時)曲線估計中的解釋變量可以是相關(guān)因素變量也可是時間變量。如果解釋變量為相關(guān)因素變量,則選擇間變量。如果解釋變量為相關(guān)因素變量,則選擇Variable選項,并把一個解釋變量指定到選項,并把一個解釋變量指定到Independent框;如果框;如果選擇選擇Time參數(shù)則表示解釋變量為時間變量。參數(shù)則表示解釋變量為時間變量。(4)在)在Models中選擇幾種模型。中選擇幾種模型。(5)選擇)選擇Plot Models選項繪制回歸線;選擇選項繪制回歸線;選擇Display ANOVA table輸出各個模型的方差分析表和各回歸系數(shù)輸出各個模型的方差分析表和各回歸系數(shù)顯著性檢驗結(jié)果。顯著性檢驗結(jié)果。 至此,完成了曲線估計的操作,至此,完成了曲線估計的操作,SPSS將根據(jù)選擇將根據(jù)選擇的模型自動進行曲線估計,并將結(jié)果顯示到輸出窗
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 家護行業(yè)發(fā)展的現(xiàn)狀、問題與對策分析
- 青少年如何養(yǎng)成良好自我管理習慣
- 餐廳廚房家私的設(shè)計與健康考慮
- 綠意濃濃的現(xiàn)代展館-環(huán)保、美觀兩不誤的光影藝術(shù)展現(xiàn)形式
- 科技公司如何構(gòu)建創(chuàng)新導向的企業(yè)文化
- 2025年沈陽貨運從業(yè)資格考試題庫及答案
- 趣味英語聽說訓練游戲?qū)πW生學習興趣的影響
- 科技驅(qū)動的家庭財務(wù)自由之路
- 2025年度肉類蔬菜冷鏈物流園區(qū)運營管理合同
- 2025年度退休人員勞動解除合同及退休后生活服務(wù)協(xié)議
- 長江委水文局2025年校園招聘17人歷年高頻重點提升(共500題)附帶答案詳解
- IF鋼物理冶金原理與關(guān)鍵工藝技術(shù)1
- JGJ46-2024 建筑與市政工程施工現(xiàn)場臨時用電安全技術(shù)標準
- 銷售提成對賭協(xié)議書范本 3篇
- EPC項目階段劃分及工作結(jié)構(gòu)分解方案
- 《跨學科實踐活動4 基于特定需求設(shè)計和制作簡易供氧器》教學設(shè)計
- 術(shù)后病人燙傷不良事件PDCA循環(huán)分析
- 金字塔原理完整版本
- 家譜、宗譜頒譜慶典講話
- pp顧問的常見面試問題
- 法理學原理與案例完整版教學課件全套ppt教程
評論
0/150
提交評論