第12講_回歸概念、回歸系數(shù)_第1頁(yè)
第12講_回歸概念、回歸系數(shù)_第2頁(yè)
第12講_回歸概念、回歸系數(shù)_第3頁(yè)
第12講_回歸概念、回歸系數(shù)_第4頁(yè)
第12講_回歸概念、回歸系數(shù)_第5頁(yè)
已閱讀5頁(yè),還剩41頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、SPSS基礎(chǔ)與基礎(chǔ)與Access數(shù)據(jù)庫(kù)數(shù)據(jù)庫(kù)J姓 名:(電 話(huà):*E - mail:上課時(shí)間:,上課程點(diǎn):/答疑地點(diǎn):答疑時(shí)間:商務(wù)信息學(xué)院計(jì)算機(jī)教學(xué)部相關(guān)分析 相關(guān)分析就是描述兩個(gè)或兩個(gè)以上變量間關(guān)系密切程度的統(tǒng)計(jì)方法,有效地揭示事物之間相關(guān)關(guān)系的強(qiáng)弱程度。二元變量分析偏相關(guān)分析距離相關(guān)分析上節(jié)回顧第第13講講回歸分析回歸分析基本概念基本概念一、一、“回歸回歸”起源起源“回歸回歸”一詞是英國(guó)生物學(xué)家、統(tǒng)計(jì)學(xué)家高爾頓一詞是英國(guó)生物學(xué)家、統(tǒng)計(jì)學(xué)家高爾頓(F.GaltonF.Galton)在研究父親身高和其成年兒)在研究父親身高和其成年兒子身高關(guān)系時(shí)提出的。子身高關(guān)系時(shí)提出的。 從大量父親身高和其

2、成年兒子身高數(shù)據(jù)的散點(diǎn)圖中,GaltonGalton發(fā)現(xiàn)了一條貫穿其中的直線(xiàn),它能描述父親身高和其成年兒子身高的關(guān)系,并可以用于根據(jù)父親身高預(yù)測(cè)其成年兒子身高。 Galton通過(guò)上述研究發(fā)現(xiàn)兒子的平均身高一般總是介于其父親與其種族的平均高度之間,即兒子的身高在總體上有一種“回歸”到其所屬種族高度的趨勢(shì),這種現(xiàn)象稱(chēng)為回歸現(xiàn)象,貫穿數(shù)據(jù)的直線(xiàn)稱(chēng)為回歸線(xiàn)?;貧w概念產(chǎn)生以后,被廣泛應(yīng)用于各個(gè)領(lǐng)域之中,并成為研究隨機(jī)變量與一個(gè)或多個(gè)自變量之間變動(dòng)關(guān)系的一種統(tǒng)計(jì)分析技術(shù)。二、回歸分析的基本概念二、回歸分析的基本概念u回歸分析的概念回歸分析的概念 回歸分析就是研究一個(gè)或多個(gè)變量的變動(dòng)對(duì)另一個(gè)變量的變動(dòng)的影響

3、程度的方法。u相關(guān)分析與回歸分析的關(guān)系相關(guān)分析與回歸分析的關(guān)系u 相關(guān)分析是根據(jù)統(tǒng)計(jì)數(shù)據(jù),通過(guò)計(jì)算分析變量之間關(guān)系的方向和緊密程度,而不能說(shuō)明變量之間相互關(guān)系的具體形式,無(wú)法從一個(gè)變量的變化來(lái)推測(cè)另一個(gè)變量的變化情況。u u 回歸分析能夠確切說(shuō)明變量之間相互關(guān)系的具體形式,可以通過(guò)一個(gè)相關(guān)的數(shù)學(xué)表達(dá)式,從一個(gè)變量的變化來(lái)推測(cè)另一個(gè)變量的變化情況,使估計(jì)和預(yù)測(cè)成為可能。u u 相關(guān)分析是回歸分析的基礎(chǔ)和前提,回歸分析是相關(guān)分析的深入和繼續(xù)。相關(guān)與回歸二、回歸分析的基本概念二、回歸分析的基本概念u回歸分析的目的回歸分析的目的 根據(jù)已知的資料或數(shù)據(jù),找出變量之間的關(guān)系表達(dá)式(找到回歸方程),用自變量

4、的已知值去推測(cè)因變量的值或范圍(進(jìn)行預(yù)測(cè)),實(shí)際上是研究因果關(guān)系。(例如: )u回歸分析的基本過(guò)程回歸分析的基本過(guò)程u確定自變量u選擇回歸分析的模型u估計(jì)模型中的參數(shù)u模型檢驗(yàn)u模型應(yīng)用xy10二、回歸分析的基本概念二、回歸分析的基本概念回歸分析可以回歸分析可以解決的問(wèn)題解決的問(wèn)題u確定因變量與若干個(gè)自變量之間聯(lián)系的定量表達(dá)式,即回歸方程或數(shù)學(xué)模型u通過(guò)控制可控變量的數(shù)值,借助數(shù)學(xué)模型來(lái)預(yù)測(cè)或控制因變量的取值和精度u進(jìn)行因素分析,從影響因變量變化的自變量中區(qū)分出重要因素和次要因素分類(lèi)分類(lèi) 根據(jù)變量之間相關(guān)關(guān)系的根據(jù)變量之間相關(guān)關(guān)系的表現(xiàn)形式表現(xiàn)形式分為分為u線(xiàn)性回歸分析:變量之間的相關(guān)關(guān)系是線(xiàn)

5、性關(guān)系u非線(xiàn)性回歸分析:變量之間的相關(guān)關(guān)系是非線(xiàn)性關(guān)系 根據(jù)影響因變量的根據(jù)影響因變量的自變量的多少自變量的多少分為分為u一元回歸分析u多元回歸分析二、回歸分析的基本概念二、回歸分析的基本概念回歸分析的功能回歸分析的功能 實(shí)現(xiàn)回歸分析的功能主要在實(shí)現(xiàn)回歸分析的功能主要在“AnalyzeAnalyzeRegression”Regression”命令菜單中,命令菜單中,主要分為:主要分為:u 線(xiàn)性回歸分析u 曲線(xiàn)估計(jì)分析u 二維邏輯分析u 多維邏輯分析u 順序分析u 概率分析u 非線(xiàn)性回歸分析u 加權(quán)估計(jì)分析u 兩階最小二乘分析 線(xiàn)性回歸分析線(xiàn)性回歸分析三、線(xiàn)性回歸分析三、線(xiàn)性回歸分析線(xiàn)性回歸的線(xiàn)

6、性回歸的概念概念 線(xiàn)性函數(shù)是變量之間存在的各種關(guān)系中最簡(jiǎn)單的形式,具有這種關(guān)系的回歸叫做線(xiàn)性回歸。 線(xiàn)性回歸根據(jù)自變量多少分為一元回歸和多元回歸對(duì)數(shù)據(jù)的要求:對(duì)數(shù)據(jù)的要求:u自變量和因變量必須是數(shù)值型變量u標(biāo)志或范疇變量,如專(zhuān)業(yè)、性別,必須記錄為二元的啞變量(虛擬變量)或者其他類(lèi)型的對(duì)立變量u對(duì)于因變量的所有觀測(cè)值(樣本)應(yīng)該認(rèn)為是來(lái)自相互獨(dú)立的等方差(方差齊性)的正態(tài)總體(正態(tài)分布),并且因變量和各自變量之間應(yīng)有一定的線(xiàn)性關(guān)系三、線(xiàn)性回歸分析三、線(xiàn)性回歸分析線(xiàn)性回歸的模型線(xiàn)性回歸的模型 下面以一元線(xiàn)性回歸為例,解析線(xiàn)性回歸模型。 一元線(xiàn)性回歸的數(shù)學(xué)模型為: 在數(shù)學(xué)模型中 分別稱(chēng)為回歸常數(shù)和回

7、歸系數(shù), 稱(chēng)為隨機(jī)誤差。 從數(shù)學(xué)模型可以看出因變量y的變化由兩部分組成u自變量x的變化所引起的y的線(xiàn)性變化,即u其他隨機(jī)因素引起的y的變化,即 如果隨機(jī)誤差的期望為0,那么數(shù)學(xué)模型可以轉(zhuǎn)化為: 稱(chēng)為一元線(xiàn)性回歸方程 從幾何意義上講,一元線(xiàn)性回歸方程是一條直線(xiàn), 即回歸線(xiàn)。 從一元線(xiàn)性回歸方程可以看出,一元線(xiàn)性回歸分析是在不考慮隨機(jī)因素條件下進(jìn)行分析的,所以是在比較理想狀態(tài)下的分析xy10 xy1010、xy10多元線(xiàn)性回歸數(shù)學(xué)模型nnxxxy.22110三、線(xiàn)性回歸分析三、線(xiàn)性回歸分析線(xiàn)性回歸方程的統(tǒng)計(jì)檢驗(yàn)線(xiàn)性回歸方程的統(tǒng)計(jì)檢驗(yàn) 通過(guò)樣本數(shù)據(jù)建立的回歸方程,不能立即用于對(duì)實(shí)際問(wèn)題的分析和預(yù)測(cè),

8、還需要進(jìn)行各項(xiàng)統(tǒng)計(jì)檢驗(yàn)。 回歸方程的回歸方程的擬合優(yōu)度檢驗(yàn)擬合優(yōu)度檢驗(yàn) 擬合優(yōu)度檢驗(yàn)采用判定(決定)系數(shù) 和調(diào)整判定(決定)系數(shù) ,來(lái)檢驗(yàn)。其中 是,自變量x和因變量y之間的相關(guān)系數(shù)。 和 取值范圍是01,越接近1表示擬合優(yōu)度越高,反之就越低。 2R2RR2R2R三、線(xiàn)性回歸分析三、線(xiàn)性回歸分析線(xiàn)性回歸方程的統(tǒng)計(jì)檢驗(yàn)線(xiàn)性回歸方程的統(tǒng)計(jì)檢驗(yàn) 回歸方程和回歸系數(shù)的顯著性檢驗(yàn)回歸方程和回歸系數(shù)的顯著性檢驗(yàn) 1.顯著性檢驗(yàn)H0假設(shè)是:回歸系數(shù)與0無(wú)顯著性差異。 2.檢驗(yàn)采用F統(tǒng)計(jì)量和t統(tǒng)計(jì)量,SPSS自動(dòng)計(jì)算統(tǒng)計(jì)量的觀測(cè)值和對(duì)應(yīng)的伴隨概率。 3.如果伴隨概率小于顯著性水平(0.05),拒絕H0假設(shè),回

9、歸系數(shù)與0有顯著性差異,表明自變量x和因變量y之間有線(xiàn)性關(guān)系,回歸方程有實(shí)際意義。 反之,接受H0假設(shè),回歸系數(shù)與0無(wú)顯著性差異,表明自變量x和因變量y之間線(xiàn)性關(guān)系不顯著,回歸方程無(wú)實(shí)際意義。0.0211n三、線(xiàn)性回歸分析三、線(xiàn)性回歸分析線(xiàn)性回歸方程的統(tǒng)計(jì)檢驗(yàn)線(xiàn)性回歸方程的統(tǒng)計(jì)檢驗(yàn) 殘差分析殘差分析 殘差是指由回歸方程計(jì)算所得的預(yù)測(cè)值與實(shí)際樣本值之間的差距。 殘差分析是回歸方程檢驗(yàn)的重要組成部分,如果回歸方程能夠較好地反映變量之間的變化規(guī)律,那么殘差中不包含明顯的規(guī)律性和趨勢(shì)性。 三、線(xiàn)性回歸分析三、線(xiàn)性回歸分析線(xiàn)性回歸方程的統(tǒng)計(jì)檢驗(yàn)線(xiàn)性回歸方程的統(tǒng)計(jì)檢驗(yàn) 殘差分析的主要內(nèi)容殘差分析的主要內(nèi)容

10、 (1)殘差均值為0的正態(tài)性分析 對(duì)應(yīng)的殘差有正負(fù),但總體上應(yīng)服從以0為均值的正態(tài)分布??梢酝ㄟ^(guò)繪制標(biāo)準(zhǔn)化(或?qū)W生化)殘差的累計(jì)概率圖來(lái)分析。 (2)殘差的獨(dú)立性分析 回歸方程要求前期和后期的殘差數(shù)值之間不存在相關(guān)關(guān)系,即不存在自相關(guān)。可以通過(guò)繪制殘差的序列圖、計(jì)算殘差的自相關(guān)系數(shù)和DW(Durbin-Watson)檢驗(yàn)來(lái)分析 三、線(xiàn)性回歸分析三、線(xiàn)性回歸分析線(xiàn)性回歸方程的統(tǒng)計(jì)檢驗(yàn)線(xiàn)性回歸方程的統(tǒng)計(jì)檢驗(yàn) 殘差分析的主要內(nèi)容殘差分析的主要內(nèi)容 (3)異方差分析 無(wú)論變量的取值如何變化,對(duì)應(yīng)的殘差分析的方差都應(yīng)相等(齊性),否則認(rèn)為出現(xiàn)了,異方差現(xiàn)象。可以通過(guò)繪制殘差圖和等級(jí)相關(guān)分析來(lái)分析。 (4

11、)探測(cè)樣本中的異常值 異常值對(duì)回歸方程影響較大,可以利用殘差分析探測(cè)樣本中的異常值,加以排除。 對(duì)于探測(cè)因變量y中的異常值方法:標(biāo)準(zhǔn)化殘差、學(xué)生化殘差和剔除殘差 對(duì)于探測(cè)自變量x中的異常值方法:杠桿值、庫(kù)克距離、標(biāo)準(zhǔn)化回歸系數(shù)和標(biāo)準(zhǔn)化預(yù)測(cè)值的變化三、線(xiàn)性回歸分析三、線(xiàn)性回歸分析SPSSSPSS操作及案例分析操作及案例分析 例一:一元線(xiàn)性回歸分析例一:一元線(xiàn)性回歸分析 一家地產(chǎn)公司調(diào)查了某城市的房地產(chǎn)銷(xiāo)售價(jià)格與房產(chǎn)的評(píng)估價(jià)值的數(shù)據(jù),請(qǐng)用一元線(xiàn)性回歸分析,能否用房產(chǎn)的評(píng)估價(jià)值來(lái)預(yù)測(cè)房地產(chǎn)銷(xiāo)售的價(jià)格。 分析:分析:u自變量x:房產(chǎn)的評(píng)估價(jià)值;u因變量y:房地產(chǎn)銷(xiāo)售價(jià)格u散點(diǎn)圖分析u一元線(xiàn)性回歸結(jié)果分

12、析三、線(xiàn)性回歸分析三、線(xiàn)性回歸分析SPSSSPSS操作及案例分析操作及案例分析 操作步驟:操作步驟: (1)根據(jù)數(shù)據(jù)建立散點(diǎn)圖,進(jìn)行初步分析 (2) Analyze RegressionLinear 數(shù)據(jù)文件:9-linear_one.sav 保存文件:9-linear_one.spo12自變量自變量因變量因變量三、線(xiàn)性回歸分析三、線(xiàn)性回歸分析SPSSSPSS操作及案例分析操作及案例分析 結(jié)果分析:結(jié)果分析: 從建立的散點(diǎn)圖來(lái)看,自變量x和因變量y之間存在一定的線(xiàn)性關(guān)系,而且相關(guān)程度較高。 V Va ar ri ia ab bl le es s E En nt te er re ed d/ /

13、R Re em mo ov ve ed db b房產(chǎn)評(píng)估價(jià)值a.EnterModel1VariablesEnteredVariablesRemovedMethodAll requested variables entered.a. Dependent Variable: 銷(xiāo)售價(jià)格b. 表表1 1M Mo od de el l S Su um mm ma ar ry y.916a.839.830936.42276Model1RR SquareAdjustedR SquareStd. Error ofthe EstimatePredictors: (Constant), 房產(chǎn)評(píng)估價(jià)值a. 表表2

14、2三、線(xiàn)性回歸分析三、線(xiàn)性回歸分析SPSSSPSS操作及案例分析操作及案例分析結(jié)果分析:結(jié)果分析:(1)表1:變量進(jìn)入/移出表 Enter表示選定變量全部進(jìn)入模型(2)表2:模型綜述表 相關(guān)系數(shù)R=0.916、判定系數(shù)R2=0.839、調(diào)整判定系數(shù)R2=0.830,說(shuō)明變量之間相關(guān)程度高,回歸方程的擬合優(yōu)度高。三、線(xiàn)性回歸分析三、線(xiàn)性回歸分析SPSSSPSS操作及案例分析操作及案例分析 結(jié)果分析:結(jié)果分析:(3)表3方差分析表 F檢驗(yàn)統(tǒng)計(jì)量得觀測(cè)值=93.567,伴隨概率=0.0000.05,拒絕零假設(shè),說(shuō)明自變量x和因變量y之間線(xiàn)性關(guān)系顯著,可以建立線(xiàn)性模型。(4)模型系數(shù)表 常數(shù)項(xiàng)Cons

15、tant=895.020,回歸系數(shù)=1.351 ;回歸系數(shù)的伴隨概率=0.000,拒絕零假設(shè),說(shuō)明自變量x和因變量y之間線(xiàn)性關(guān)系顯著,可以建立線(xiàn)性模型。結(jié)論: 根據(jù)上述分析結(jié)果,可以得到回歸方程,用該方程來(lái)進(jìn)行分析和預(yù)測(cè)實(shí)際問(wèn)題,結(jié)果較為準(zhǔn)確。A AN NO OV VA Ab b82047704182047703.5593.567.000a1578397618876887.5809783168019RegressionResidualTotalModel1Sum ofSquaresdfMean SquareFSig.Predictors: (Constant), 房產(chǎn)評(píng)估價(jià)值a. 表表3 3C

16、 Co oe ef ff fi ic ci ie en nt ts sa a895.020535.8331.670.1121.351.140.9169.673.000(Constant)房產(chǎn)評(píng)估價(jià)值Model1BStd. ErrorUnstandardizedCoefficientsBetaStandardizedCoefficientstSig.Dependent Variable: 銷(xiāo)售價(jià)格a. 表表4 4xy351. 102.895三、線(xiàn)性回歸分析三、線(xiàn)性回歸分析SPSSSPSS操作及案例分析操作及案例分析 例二:一元線(xiàn)性回歸分析例二:一元線(xiàn)性回歸分析 Nambe Mills公司生產(chǎn)5種

17、金屬餐具產(chǎn)品,分別是Bowl(碗)、Casserole(焙盤(pán))、Dish(碟)、Tray(托盤(pán))、Plate(盤(pán)子)。在生產(chǎn)過(guò)程中都有一個(gè)拋光的過(guò)程。為了有助于安排生產(chǎn),記錄了59個(gè)產(chǎn)品的拋光時(shí)間(time)、產(chǎn)品類(lèi)型(type)和產(chǎn)品直徑(diam)。 用一元線(xiàn)性回歸分析能否用產(chǎn)品的直徑來(lái)預(yù)測(cè)產(chǎn)品的拋光時(shí)間。三、線(xiàn)性回歸分析三、線(xiàn)性回歸分析SPSSSPSS操作及案例分析操作及案例分析 操作步驟:操作步驟: (1)繪制拋光時(shí)間和產(chǎn)品直徑的散點(diǎn)圖 (2)AnalyzeRegression Linear 數(shù)據(jù)文件:9-polishing.sav 保存文件:9-polishing.spo1 12 2

18、三、線(xiàn)性回歸分析三、線(xiàn)性回歸分析SPSSSPSS操作及案例分析操作及案例分析 結(jié)果分析:結(jié)果分析:從建立的散點(diǎn)圖來(lái)看,自變量x和因變量y之間存在一定的線(xiàn)性關(guān)系,但數(shù)據(jù)分布較為分散,所以相關(guān)程度不是很高。 三、線(xiàn)性回歸分析三、線(xiàn)性回歸分析SPSSSPSS操作及案例分析操作及案例分析 結(jié)果分析結(jié)果分析(1)變量進(jìn)入/移出方式表 表示選定變量全部進(jìn)入模型(2)模型綜述表 反映了因變量和自變量之間的線(xiàn)性相關(guān)系數(shù)R=0.700, 判定系數(shù)R2=0.490,說(shuō)明自變量可以解釋因變量49%的變異性。說(shuō)明自變量與因變量之間的相關(guān)程度一般,回歸方程的擬合優(yōu)度不高。Variables Entered/Remove

19、dVariables Entered/Removedb bdiama.EnterModel1VariablesEnteredVariablesRemovedMethodAll requested variables entered.a. Dependent Variable: timeb. M Mo od de el l S Su um mm ma ar ry yb b.700a.490.48213.69307Model1RR SquareAdjustedR SquareStd. Error ofthe EstimatePredictors: (Constant), diama. Depend

20、ent Variable: timeb. CoefficientsCoefficientsa a-1.9555.402-.362.7193.457.467.7007.407.000(Constant)diamModel1BStd. ErrorUnstandardizedCoefficientsBetaStandardizedCoefficientstSig.Dependent Variable: timea. 三、線(xiàn)性回歸分析三、線(xiàn)性回歸分析SPSSSPSS操作及案例分析操作及案例分析結(jié)果分析結(jié)果分析(3)方差分析表 F檢驗(yàn)統(tǒng)計(jì)量的觀測(cè)值為54.865,F(xiàn)分布的伴隨概率為0.000,從而拒絕零

21、假設(shè),說(shuō)明因變量和自變量的線(xiàn)性關(guān)系是顯著的,可以建立線(xiàn)性模型。(4)模型系數(shù)表 回歸模型的常數(shù)項(xiàng)為-1.955,自變量回歸系數(shù)為3.457 回歸方程為:time=3.457*diam-1.955 回歸系數(shù)的伴隨概率=0.000,應(yīng)拒絕t檢驗(yàn)的零假設(shè),說(shuō)明因變量和自變量的線(xiàn)性關(guān)系是顯著的,可以建立線(xiàn)性模型A AN NO OV VA Ab b10287.173110287.17354.865.000a10687.51157187.50020974.68458RegressionResidualTotalModel1Sum ofSquaresdfMean SquareFSig.Predictors:

22、 (Constant), diama. Dependent Variable: timeb. 三、線(xiàn)性回歸分析三、線(xiàn)性回歸分析SPSSSPSS操作及案例分析操作及案例分析 例三:例三:多元多元線(xiàn)性回歸分析線(xiàn)性回歸分析 為了研究某公司職工當(dāng)前工資水平,收集了影響職工當(dāng)前工資水平的6個(gè)因素的數(shù)據(jù)。這些影響因素是:職工的開(kāi)始工資salbegin($)、受教育時(shí)間educ(年)、來(lái)公司工作時(shí)間jobtime(月)、工種jobcat、來(lái)本公司前的工作經(jīng)驗(yàn)prevexp(月)、是否為少數(shù)民族minority。 試用多元線(xiàn)性回歸過(guò)程對(duì)該公司職工當(dāng)前工資水平尋求一個(gè)恰當(dāng)?shù)幕貧w模型。三、線(xiàn)性回歸分析三、線(xiàn)性回歸

23、分析SPSSSPSS操作及案例分析操作及案例分析操作步驟Analyze Regression Linear數(shù)據(jù)文件:9-Employee.sav保存文件:9-Employee.spo1 13 32 2變量篩選變量篩選Enter:所選變量全部進(jìn)入方程:所選變量全部進(jìn)入方程(一元回歸一元回歸)Fordward:按照所選變量對(duì)因變量影響大小順序依次引入,每引入一個(gè)變量,建立一個(gè)方程:按照所選變量對(duì)因變量影響大小順序依次引入,每引入一個(gè)變量,建立一個(gè)方程Backward:先將所選變量一次引入,然后逐步剔除對(duì)因變量影響小的變量,每剔除一個(gè)變量,:先將所選變量一次引入,然后逐步剔除對(duì)因變量影響小的變量,每

24、剔除一個(gè)變量,建立一個(gè)方程建立一個(gè)方程Stepwise:結(jié)合上述兩種方法,先引入對(duì)因變量影響大的變量,然后馬上剔除對(duì)因變量影響:結(jié)合上述兩種方法,先引入對(duì)因變量影響大的變量,然后馬上剔除對(duì)因變量影響小的變量,每一步建立一個(gè)方程小的變量,每一步建立一個(gè)方程(多元回歸多元回歸)依次輸入自變量依次輸入自變量Educ(受教育時(shí)間受教育時(shí)間)Jobcat(工種工種)Salbegin(開(kāi)始工資開(kāi)始工資)Jobtime(工作時(shí)間工作時(shí)間)Prevexp(工作經(jīng)驗(yàn)工作經(jīng)驗(yàn))Minority(少數(shù)民族少數(shù)民族)三、線(xiàn)性回歸分析三、線(xiàn)性回歸分析SPSSSPSS操作及案例分析操作及案例分析結(jié)果分析結(jié)果分析:(1)變

25、量進(jìn)入/移出方式表 從表中可以看出依次引入的變量:salbegin、jobcat、prevexp、jobtime 、educ 在依次引入的變量過(guò)程中剔除了剔除了Minority(少數(shù)民族少數(shù)民族)變量。變量。V Va ar ri ia ab bl le es s E En nt te er re ed d/ /R Re em mo ov ve ed da aBeginningSalary.Stepwise (Criteria: Probability-of-F-to-enter = .100).EmploymentCategory.Stepwise (Criteria: Probability

26、-of-F-to-enter = .100).PreviousExperience(months).Stepwise (Criteria: Probability-of-F-to-enter = .100).Monthssince Hire.Stepwise (Criteria: Probability-of-F-to-enter = .100).Educational Level(years).Stepwise (Criteria: Probability-of-F-to-enter = .100).Model12345VariablesEnteredVariablesRemovedMeth

27、odDependent Variable: Current Salarya. 變量引入的順序變量引入的順序與輸入順序不同與輸入順序不同三、線(xiàn)性回歸分析三、線(xiàn)性回歸分析SPSSSPSS操作及案例分析操作及案例分析結(jié)果分析結(jié)果分析:(2)模型綜述表從表中可以看出引進(jìn)變量后,相關(guān)系數(shù)R分別由0.880增加到0.898、0.909、0.914、0.917同時(shí)估計(jì)標(biāo)準(zhǔn)誤差由$8,115.356減少到$6,856.795M Mo od de el l S Su um mm ma ar ry yf f.880a.775.774$8,115.356.898b.806.805$7,540.433.909c.82

28、7.826$7,127.040.914d.836.835$6,940.232.917e.840.839$6,856.795Model12345RR SquareAdjustedR SquareStd. Error ofthe EstimatePredictors: (Constant), Beginning Salarya. Predictors: (Constant), Beginning Salary, EmploymentCategoryb. Predictors: (Constant), Beginning Salary, EmploymentCategory, Previous Ex

29、perience (months)c. Predictors: (Constant), Beginning Salary, EmploymentCategory, Previous Experience (months), Months sinceHired. Predictors: (Constant), Beginning Salary, EmploymentCategory, Previous Experience (months), Months sinceHire, Educational Level (years)e. Dependent Variable: Current Sal

30、aryf. ANOVAANOVAf f1E+01111.068E+0111622.118.000a3E+01047265858997.221E+0114731E+01125.557E+010977.312.000b3E+01047156858136.221E+0114731E+01133.801E+010748.392.000c2E+01047050794696.601E+0114731E+01142.883E+010598.577.000d2E+01046948166815.121E+0114731E+01152.318E+010493.084.000e2E+01046847015635.5

31、71E+011473RegressionResidualTotalRegressionResidualTotalRegressionResidualTotalRegressionResidualTotalRegressionResidualTotalModel12345Sum ofSquaresdfMean SquareFSig.Predictors: (Constant), Beginning Salarya. Predictors: (Constant), Beginning Salary, Employment Categoryb. Predictors: (Constant), Beg

32、inning Salary, Employment Category, PreviousExperience (months)c. Predictors: (Constant), Beginning Salary, Employment Category, PreviousExperience (months), Months since Hired. Predictors: (Constant), Beginning Salary, Employment Category, PreviousExperience (months), Months since Hire, Educational

33、 Level (years)e. Dependent Variable: Current Salaryf. 三、線(xiàn)性回歸分析三、線(xiàn)性回歸分析SPSSSPSS操作及案例分析操作及案例分析結(jié)果分析結(jié)果分析:(3)方差分析表:從表中可以看出,F(xiàn)分布的顯著性概率為0.000,說(shuō)明因變量和自變量的線(xiàn)性關(guān)系是顯著的,可建立線(xiàn)性模型三、線(xiàn)性回歸分析三、線(xiàn)性回歸分析SPSSSPSS操作及案例分析操作及案例分析結(jié)果分析結(jié)果分析:(4)模型系數(shù)表 表中顯示回歸模型中的常數(shù)項(xiàng)(Constant)非標(biāo)準(zhǔn)化的回歸系數(shù)(Unstandardized Coefficients)B值及其標(biāo)準(zhǔn)誤差(Std. Error)標(biāo)準(zhǔn)化

34、的回歸系數(shù)(standardized Coefficients)Beta值、t值以及顯著性水平(Sig.)C Co oe ef ff fi ic ci ie en nt ts sa a1928.206888.6802.170.0311.909.047.88040.276.0001036.931832.0511.246.2131.469.067.67721.873.0005947.000683.430.2698.702.0003039.205829.7833.663.0001.467.063.67623.117.0006160.294646.577.2799.528.000-23.7493.13

35、9-.145-7.565.000-10300.72707.813-3.804.0001.479.062.68223.911.0006060.446629.927.2749.621.000-23.7893.057-.146-7.781.000163.82631.739.0975.162.000-15038.62992.525-5.025.0001.365.069.62919.796.0005859.585624.945.2659.376.000-19.5533.250-.120-6.017.000154.69831.464.0914.917.000539.642152.735.0913.533.

36、000(Constant)Beginning Salary(Constant)Beginning SalaryEmployment Category(Constant)Beginning SalaryEmployment CategoryPrevious Experience(months)(Constant)Beginning SalaryEmployment CategoryPrevious Experience(months)Months since Hire(Constant)Beginning SalaryEmployment CategoryPrevious Experience(

37、months)Months since HireEducational Level (years)Model12345BStd. ErrorUnstandardizedCoefficientsBetaStandardizedCoefficientstSig.Dependent Variable: Current Salarya. 三、線(xiàn)性回歸分析三、線(xiàn)性回歸分析SPSSSPSS操作及案例分析操作及案例分析結(jié)論: 從表中可以得到5個(gè)回歸模型的方程 第5個(gè)回歸方程為回歸系數(shù)的伴隨概率為0.000,相關(guān)系數(shù)為0.917,判定系數(shù)為0.84,說(shuō)明回歸方程解釋了整個(gè)因變量變異程度的84%,說(shuō)明變量之間相

38、關(guān)程度高,回歸方程的擬合優(yōu)度高。對(duì)當(dāng)前工資影響較大的依次為:開(kāi)始工資、工種、來(lái)本公司前的工作經(jīng)驗(yàn)、來(lái)公司工作時(shí)間和受教育時(shí)間,主要考慮的是Beta值的大小。educjobtimeprevjobecatsalbeginsalary642.539698.154exp553.19585.5859365. 1574.15038曲線(xiàn)估計(jì)曲線(xiàn)估計(jì)四、曲線(xiàn)估計(jì)四、曲線(xiàn)估計(jì)曲線(xiàn)估計(jì)的概念曲線(xiàn)估計(jì)的概念 現(xiàn)實(shí)生活中,變量之間的關(guān)系并非都是線(xiàn)性相關(guān),實(shí)際上非相關(guān)關(guān)系更為常見(jiàn),除了可以通過(guò)繪制散點(diǎn)圖的方式粗略地考察這種非線(xiàn)性關(guān)系,還可以用曲線(xiàn)估計(jì)來(lái)進(jìn)行擬合。 曲線(xiàn)估計(jì)(曲線(xiàn)擬合、曲線(xiàn)回歸)是指選定一種用方程表達(dá)的曲

39、線(xiàn),使得實(shí)際數(shù)據(jù)與理論數(shù)據(jù)之間的差異盡可能地小。曲線(xiàn)選擇得好的話(huà),那么可以揭示因變量與自變量的內(nèi)在關(guān)系,并對(duì)因變量的預(yù)測(cè)有一定意義。曲線(xiàn)估計(jì)中需要解決的問(wèn)題曲線(xiàn)估計(jì)中需要解決的問(wèn)題一是選用哪種理論模型,即用哪種方程來(lái)擬合觀測(cè)值 二是當(dāng)模型確定后,如何選擇合適參數(shù),使得理論數(shù)據(jù)和實(shí)際數(shù)據(jù)的差異最小四、曲線(xiàn)估計(jì)四、曲線(xiàn)估計(jì)曲線(xiàn)估計(jì)的基本研究方法曲線(xiàn)估計(jì)的基本研究方法 (1)做散點(diǎn)圖來(lái)觀察曲線(xiàn)形狀做散點(diǎn)圖來(lái)觀察曲線(xiàn)形狀 變量之間關(guān)系分線(xiàn)性相關(guān)和非線(xiàn)性相關(guān) 非線(xiàn)性相關(guān)分為本質(zhì)線(xiàn)性關(guān)系和本質(zhì)非相關(guān)關(guān)系 SPSS對(duì)本質(zhì)線(xiàn)性關(guān)系采用曲線(xiàn)估計(jì)子模型;對(duì)本質(zhì)非相關(guān)關(guān)系采用非線(xiàn)性子模型 (2)結(jié)合專(zhuān)業(yè)知識(shí),或從長(zhǎng)

40、期積累的數(shù)據(jù)中找出變量之間的函數(shù)類(lèi)型結(jié)合專(zhuān)業(yè)知識(shí),或從長(zhǎng)期積累的數(shù)據(jù)中找出變量之間的函數(shù)類(lèi)型 在在SPSS中提供了中提供了11中本質(zhì)線(xiàn)性模型中本質(zhì)線(xiàn)性模型(P166 表表9.10) 應(yīng)用應(yīng)用SPSS進(jìn)行曲線(xiàn)估計(jì)時(shí),進(jìn)行曲線(xiàn)估計(jì)時(shí),l可以先選擇幾種模型,然后自動(dòng)完成模型的參數(shù)估計(jì)l輸出回歸方程顯著性檢驗(yàn)的F值和概率p值、判定系數(shù)R2等統(tǒng)計(jì)量l以判定系數(shù)為主要依據(jù)選擇其中的最優(yōu)模型,進(jìn)行預(yù)測(cè)分析四、曲線(xiàn)估計(jì)四、曲線(xiàn)估計(jì)SPSSSPSS操作及案例分析操作及案例分析 例四:某產(chǎn)品零售商為某種產(chǎn)品做廣告的投入資金advert(百萬(wàn)元)和因此而獲得的銷(xiāo)售額sales (百萬(wàn)元)的相關(guān)數(shù)據(jù),試找出一種合適的回歸函數(shù)。四、曲線(xiàn)估計(jì)四、曲線(xiàn)估計(jì)SPSSSPSS操作及案例分析操作及案例分析操作步驟:操作步驟:繪制散點(diǎn)圖初步確定可能的曲線(xiàn)估計(jì)回歸模型Graphics Scatter/DotAnalyze Regression Curve Estimation數(shù)據(jù)文件:9-advert.sav保存文件:9-adver

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論