第5章相關(guān)與回歸分析_第1頁(yè)
第5章相關(guān)與回歸分析_第2頁(yè)
第5章相關(guān)與回歸分析_第3頁(yè)
第5章相關(guān)與回歸分析_第4頁(yè)
第5章相關(guān)與回歸分析_第5頁(yè)
已閱讀5頁(yè),還剩67頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第5章相關(guān)與回歸分析一、相關(guān)分析二、簡(jiǎn)單線(xiàn)性回歸分析三、多元線(xiàn)性回歸分析四、曲線(xiàn)估計(jì)*主要內(nèi)容§5.1相關(guān)分析

1、概述(一)相關(guān)關(guān)系(1)函數(shù)關(guān)系:(如銷(xiāo)售額與銷(xiāo)售量、圓面積和圓半徑)。事物間的一種一一對(duì)應(yīng)的確定性關(guān)系。即當(dāng)一個(gè)變量x取一定值時(shí),另一變量y可以依確定的關(guān)系取一個(gè)確定的值。(2)相關(guān)關(guān)系(統(tǒng)計(jì)關(guān)系):(如收入和消費(fèi))事物間的關(guān)系不是確定性的.即當(dāng)一個(gè)變量x取一定值時(shí),另一變量y的取值可能有幾個(gè),即一個(gè)變量的值不能由另一個(gè)變量唯一確定概述相關(guān)關(guān)系的常見(jiàn)類(lèi)型:線(xiàn)性相關(guān):正線(xiàn)性相關(guān)、負(fù)線(xiàn)性相關(guān)非線(xiàn)性相關(guān)相關(guān)關(guān)系不象函數(shù)關(guān)系那樣直接,但卻普遍存在,且有強(qiáng)有弱。如何分析呢?概述(二)相關(guān)分析和回歸分析的任務(wù)研究對(duì)象:相關(guān)關(guān)系相關(guān)分析旨在測(cè)度變量間線(xiàn)性關(guān)系的強(qiáng)弱程度。回歸分析側(cè)重考察變量之間的數(shù)量變化規(guī)律,并通過(guò)一定的數(shù)學(xué)表達(dá)式來(lái)描述這種關(guān)系,進(jìn)而確定一個(gè)或幾個(gè)變量的變化對(duì)另一個(gè)變量的影響程度。2、簡(jiǎn)單相關(guān)分析(一)目的通過(guò)樣本數(shù)據(jù),研究?jī)勺兞块g線(xiàn)性相關(guān)程度的強(qiáng)弱。(例如投資與收入之間的關(guān)系、GDP與通信需求之間的數(shù)量關(guān)系)(二)基本方法繪制散點(diǎn)圖、計(jì)算相關(guān)系數(shù)

繪制散點(diǎn)圖(一)散點(diǎn)圖將樣本數(shù)據(jù)以點(diǎn)的形式繪制在直角平面上,可以用來(lái)發(fā)現(xiàn)變量間的關(guān)系和可能的趨勢(shì),比較直觀,但較為粗略。(二)基本操作步驟(1)菜單選項(xiàng):graphs→scatter(2)選擇散點(diǎn)圖類(lèi)型:(3)選擇x軸和y軸的變量不相關(guān)正線(xiàn)性相關(guān)負(fù)線(xiàn)性相關(guān)相關(guān)但非線(xiàn)性相關(guān)計(jì)算相關(guān)系數(shù)(一)相關(guān)系數(shù)(1)作用:以精確的相關(guān)系數(shù)(r)體現(xiàn)兩個(gè)變量間的線(xiàn)性關(guān)系程度。相關(guān)系數(shù)的值在-1到1之間,在說(shuō)明變量之間的線(xiàn)性關(guān)系強(qiáng)弱時(shí),可將相關(guān)程度分為以下幾種:│r│≥0.8,視為高度相關(guān)。0.5≤│r│<0.8,視為中度相關(guān)。0.3≤│r│<0.5,視為低度相關(guān)。1、定量變量的相關(guān)指標(biāo)這種情況是最常見(jiàn)的,此時(shí)一般使用積差相關(guān)系數(shù),又稱(chēng)Pearson相關(guān)系數(shù)表示其相關(guān)性的大小。作為參數(shù)方法,積差相關(guān)分析有一定的使用條件:線(xiàn)性相關(guān)的情況樣本中不存在極端值服從聯(lián)合正態(tài)分布(寬松)計(jì)算相關(guān)系數(shù)計(jì)算相關(guān)系數(shù)簡(jiǎn)單相關(guān)系數(shù)相關(guān)系數(shù)的檢驗(yàn)(t檢驗(yàn)):提出假設(shè):H0:;H1:0檢驗(yàn)的統(tǒng)計(jì)量:計(jì)算統(tǒng)計(jì)量的值,并得到對(duì)應(yīng)的相伴概率p結(jié)論:如果p<=α,則拒絕H0,兩總體存在線(xiàn)性相關(guān);如果p>α,不能拒絕H0.不滿(mǎn)足積差相關(guān)分析的條件。用等級(jí)表示的原始數(shù)據(jù)(定序變量)。秩相關(guān):又叫等級(jí)相關(guān)(rankcorrelation),即斯皮爾曼(Spearman)等級(jí)相關(guān)。適用于以下資料:計(jì)算相關(guān)系數(shù)計(jì)算相關(guān)系數(shù)2、定序變量間的線(xiàn)性相關(guān)關(guān)系:Kendall相關(guān)系數(shù)(Kendall’s)

有序變量的等級(jí)資料的相關(guān)性就是指行變量等級(jí)高的列變量等級(jí)也高,行變量等級(jí)低的列變量等級(jí)也低。SPSS所提供的有序變量的相關(guān)指標(biāo)有Kendall’sTau-b,理論上取值范圍也是±1。SPSS的相關(guān)分析基本操作步驟:(1)菜單選項(xiàng):analyze→correlate→bivariate...(2)選擇計(jì)算相關(guān)系數(shù)的兩個(gè)或多個(gè)變量到variables框.(3)選擇相關(guān)系數(shù)(correlationcoefficients).(4)顯著性檢驗(yàn)(testofsignificance)例5.1:某人壽保險(xiǎn)公司準(zhǔn)備在中低收入家庭中開(kāi)展壽險(xiǎn)險(xiǎn)種的市場(chǎng)促銷(xiāo)活動(dòng),為此,該公司市場(chǎng)企劃部搞了一次抽樣調(diào)查活動(dòng),專(zhuān)門(mén)對(duì)所在地區(qū)購(gòu)買(mǎi)過(guò)壽險(xiǎn)的居民家庭進(jìn)行訪(fǎng)問(wèn)(數(shù)據(jù)見(jiàn)《人壽保險(xiǎn).sav》),試據(jù)此分析人均年收入與壽險(xiǎn)保額之間的相關(guān)關(guān)系。相關(guān)分析的應(yīng)用3、偏相關(guān)分析(一)偏相關(guān)系數(shù)(1)含義:在控制了其他變量的影響的情況下,計(jì)算兩變量間的相關(guān)系數(shù)。虛假相關(guān):如小學(xué)1~6年級(jí)全體學(xué)生進(jìn)行速算比賽(身高和分?jǐn)?shù)間的相關(guān)受年齡的影響)偏相關(guān)分析(2)計(jì)算方法:SPSS的偏相關(guān)分析(二)基本操作步驟(1)菜單選項(xiàng):analyze→correlate→partial…(2)選擇將需要描述相關(guān)性的兩個(gè)或多個(gè)變量到variable框。(3)選擇控制變量到controllingfor框。(4)option選項(xiàng):zero-ordercorrelations:輸出簡(jiǎn)單相關(guān)系數(shù)矩陣(三)應(yīng)用舉例例5.2:根據(jù)調(diào)查問(wèn)卷.sav中的數(shù)據(jù),試分析年齡和身高的相關(guān)性。SPSS的偏相關(guān)分析§5.2簡(jiǎn)單線(xiàn)性回歸分析(1)簡(jiǎn)單線(xiàn)性回歸模型(一元線(xiàn)性回歸模型)

y=β0+β1x+ε模型表明,因變量Y的變化可以由兩部分來(lái)解釋?zhuān)徊糠质怯勺宰兞縓的變化引起的Y的線(xiàn)性變化,另一部分是有其他隨機(jī)因素引起Y的變化,即ε,ε是隨機(jī)擾動(dòng)項(xiàng)。1、簡(jiǎn)單線(xiàn)性回歸模型(2)基本假定誤差項(xiàng)ε是一個(gè)期望值為0的隨機(jī)變量,即E(ε)=0。(零均值)對(duì)于所有的x值,ε的方差σ2相同(同方差)誤差項(xiàng)ε是一個(gè)服從正態(tài)分布的隨機(jī)變量,且相互獨(dú)立。即ε~N(0,σ2)(正態(tài)性,無(wú)自相關(guān))獨(dú)立性意味著對(duì)于一個(gè)特定的x值,它所對(duì)應(yīng)的ε與其他x值所對(duì)應(yīng)的ε不相關(guān)(3)一元線(xiàn)性回歸方程稱(chēng)一元線(xiàn)性回歸方程,是對(duì)應(yīng)于自變量X某一取值時(shí)因變量Y的均值。β

0、β1是未知參數(shù),β

0是常數(shù)項(xiàng),β1為回歸系數(shù),它表示自變量X每變化一個(gè)單位,因變量Y的平均變化量。b與r的關(guān)系:r>0r<0r=0b>0 b<0 b=0(4)估計(jì)的一元線(xiàn)性回歸方程截距斜率(回歸系數(shù))2、簡(jiǎn)單線(xiàn)性回歸分析概述回歸分析的基本步驟:(1)確定自變量和因變量;(2)從樣本數(shù)據(jù)出發(fā)確定變量之間的數(shù)學(xué)關(guān)系式,對(duì)回歸方程的各個(gè)參數(shù)進(jìn)行估計(jì);(3)回歸方程的擬和優(yōu)度檢驗(yàn);(4)回歸方程的顯著性檢驗(yàn)(F檢驗(yàn));(5)回歸系數(shù)的顯著性檢驗(yàn)(t檢驗(yàn));(6)殘差分析;(7)利用回歸方程進(jìn)行預(yù)測(cè)。1、估計(jì)回歸方程參數(shù)估計(jì)的準(zhǔn)則目標(biāo):回歸線(xiàn)上的觀察值與預(yù)測(cè)值之間的距離總和達(dá)到最小最小二乘法(最小二乘法使每個(gè)樣本點(diǎn)(xi,yi)與回歸直線(xiàn)上的對(duì)應(yīng)點(diǎn)(xi,E(yi))在垂直方向上的偏差距離最小)最小二乘法

(圖示)xy(xn

,yn)(x1,y1)(x2,y2)(xi,yi)}ei

=yi-yi^一元線(xiàn)性回歸模型的確定根據(jù)實(shí)際數(shù)據(jù),用最小平方法,即使,分別對(duì)a、b求偏導(dǎo)并令其為零,求得兩個(gè)標(biāo)準(zhǔn)方程:解聯(lián)立方程,得到2、一元線(xiàn)性回歸方程評(píng)價(jià)(擬和優(yōu)度)(1)目的:檢驗(yàn)樣本觀察點(diǎn)聚集在回歸直線(xiàn)周?chē)拿芗潭?,評(píng)價(jià)回歸方程對(duì)樣本數(shù)據(jù)點(diǎn)的擬和程度。(2)思路:因?yàn)橐蜃兞咳≈档淖兓軆蓚€(gè)因素的影響自變量不同取值的影響其他因素的影響于是,因變量總變差=自變量引起的+其他因素引起的即:因變量總變差=回歸方程可解釋的+不可解釋的可證明:因變量總離差平方和=回歸平方和+剩余平方和xy總離差=回歸離差+剩余離差SST=SSR+SSE

R2表示因變量全部變差中有百分之幾的變差可由x與y的回歸關(guān)系來(lái)解釋。,r的符號(hào)同回歸系數(shù)b(3)統(tǒng)計(jì)量:判定系數(shù)(擬和優(yōu)度)R2=SSR/SST=1-SSE/SST.R2體現(xiàn)了回歸方程所能解釋的因變量變差的比例;R2越接近于1,則說(shuō)明回歸平方和占了因變量總變差平方和的絕大部分比例,因變量的變差主要由自變量的不同取值造成,回歸方程對(duì)樣本數(shù)據(jù)點(diǎn)擬合得好。2、一元線(xiàn)性回歸方程的評(píng)價(jià)3、回歸方程的顯著性檢驗(yàn)檢驗(yàn)自變量和因變量之間的線(xiàn)性關(guān)系是否顯著具體方法是將回歸離差平方和(SSR)同剩余離差平方和(SSE)加以比較,應(yīng)用F檢驗(yàn)來(lái)分析二者之間的差別是否顯著如果是顯著的,兩個(gè)變量之間存在線(xiàn)性關(guān)系如果不顯著,兩個(gè)變量之間不存在線(xiàn)性關(guān)系3、回歸方程的顯著性檢驗(yàn)提出假設(shè)H0:線(xiàn)性關(guān)系不顯著(H0:b1=0)2.計(jì)算檢驗(yàn)統(tǒng)計(jì)量F3、計(jì)算F統(tǒng)計(jì)量的值和相伴概率p4、判斷:若p<=a,拒絕H0,自變量與因變量之間存在顯著的線(xiàn)性關(guān)系。反之,不能拒絕H04、回歸系數(shù)的顯著性檢驗(yàn)在一元線(xiàn)性回歸中,等價(jià)于回歸方程的顯著性檢驗(yàn)檢驗(yàn)x與y之間是否具有線(xiàn)性關(guān)系,或者說(shuō),檢驗(yàn)自變量x對(duì)因變量y的線(xiàn)性影響是否顯著。理論基礎(chǔ)是回歸系數(shù)

的抽樣分布4、回歸系數(shù)的顯著性檢驗(yàn)是根據(jù)最小二乘法求出的樣本統(tǒng)計(jì)量,它有自己的分布的分布具有如下性質(zhì)分布形式:正態(tài)分布數(shù)學(xué)期望:標(biāo)準(zhǔn)差:由于無(wú)未知,需用其估計(jì)量Sy來(lái)代替得到的估計(jì)的標(biāo)準(zhǔn)差4、回歸系數(shù)的顯著性檢驗(yàn)提出假設(shè)H0:β1=0(沒(méi)有線(xiàn)性關(guān)系)H1:β1

0(有線(xiàn)性關(guān)系)計(jì)算檢驗(yàn)的統(tǒng)計(jì)量3、計(jì)算t統(tǒng)計(jì)量的值和相伴概率p

4、判斷:P值<=a,拒絕H0,即回歸系數(shù)與0有顯著差異,自變量對(duì)因變量有顯著的線(xiàn)性影響,反之,不能拒絕H05、線(xiàn)性回歸方程的殘差分析(一)殘差序列的正態(tài)性檢驗(yàn):繪制標(biāo)準(zhǔn)化殘差的直方圖或累計(jì)概率圖(二)殘差序列的隨機(jī)性檢驗(yàn)繪制殘差和預(yù)測(cè)值的散點(diǎn)圖,應(yīng)隨機(jī)分布在經(jīng)過(guò)零的一條直線(xiàn)上下(三)殘差序列的等方差性檢驗(yàn)隨機(jī)、等方差、獨(dú)立隨機(jī)、異方差、獨(dú)立非獨(dú)立5、線(xiàn)性回歸方程的殘差分析(四)殘差序列獨(dú)立性檢驗(yàn):殘差序列是否存在后期值與前期值相關(guān)的現(xiàn)象,利用D.W(Durbin-Watson)檢驗(yàn)d-w=0:殘差序列存在完全正自相關(guān):d-w=4:殘差序列存在完全負(fù)自相關(guān);0<d-w<2:殘差序列存在某種程度的正自相關(guān);2<d-w<4:殘差序列存在某種程度的負(fù)自相關(guān);d-w=2:殘差序列不存在自相關(guān)。三、SPSS的一元線(xiàn)性回歸分析(一)基本操作步驟(1)菜單選項(xiàng):Analyze→regression→linear…(2)選擇一個(gè)變量為因變量進(jìn)入dependent框(3)選擇一個(gè)變量為自變量進(jìn)入independent框(4)Enter:所選變量全部進(jìn)入回歸方程(默認(rèn)方法)(二)statistics選項(xiàng)(1)基本統(tǒng)計(jì)量輸出Estimates:默認(rèn).顯示回歸系數(shù)相關(guān)統(tǒng)計(jì)量.confidenceintervals:每個(gè)非標(biāo)準(zhǔn)化的回歸系數(shù)95%的置信區(qū)間.Descriptive:各變量均值、標(biāo)準(zhǔn)差和相關(guān)系數(shù)單側(cè)檢驗(yàn)概率.Modelfit:默認(rèn).判定系數(shù)、估計(jì)標(biāo)準(zhǔn)誤差、方差分析表、容忍度(2)Residual框中的殘差分析Durbin-waston:D-W值casewisediagnostic:異常值(奇異值)檢測(cè)(輸出預(yù)測(cè)值及殘差和標(biāo)準(zhǔn)化殘差)三、SPSS的一元線(xiàn)性回歸分析(三)plot選項(xiàng):圖形分析.Standardizeresidualplots:繪制殘差序列直方圖和累計(jì)概率圖,檢測(cè)殘差的正態(tài)性繪制指定序列的散點(diǎn)圖,檢測(cè)殘差的隨機(jī)性、異方差性ZPRED:標(biāo)準(zhǔn)化預(yù)測(cè)值ZRESID:標(biāo)準(zhǔn)化殘差SRESID:學(xué)生化殘差produceallpartialplot:繪制因變量和所有自變量之間的散點(diǎn)圖三、SPSS的一元線(xiàn)性回歸分析一元線(xiàn)性回歸分析應(yīng)用舉例例5.3:某公司正在決定是否為公司新的文字處理系統(tǒng)簽定一項(xiàng)維修合同,公司管理人員認(rèn)為,維修費(fèi)用與該系統(tǒng)使用時(shí)間有關(guān),現(xiàn)采集的每周使用時(shí)間(小時(shí))和年維修費(fèi)用(千美元)的統(tǒng)計(jì)資料如下。已知該公司每周使用文字處理系統(tǒng)的時(shí)間為30小時(shí),如果維修合同中的費(fèi)用是30000美元,你建議這個(gè)合同簽嗎?為什么?使用時(shí)間13102028321724314038年維修費(fèi)用172230374730.532.5395140一元線(xiàn)性回歸分析小結(jié)需要著重閱讀和理解的輸出結(jié)果:擬和優(yōu)度R2的值方差分析表回歸方程系數(shù)表觀察殘差圖§5.3多元線(xiàn)性回歸分析一、多元線(xiàn)性回歸模型一個(gè)因變量與兩個(gè)及兩個(gè)以上自變量之間的回歸描述因變量

y如何依賴(lài)于自變量

x1

,x2

,…,

xp

和誤差項(xiàng)

的方程稱(chēng)為多元線(xiàn)性回歸模型涉及p個(gè)自變量的多元線(xiàn)性回歸模型可表示為

b0,b1,b2

,,bp是參數(shù)

是被稱(chēng)為誤差項(xiàng)的隨機(jī)變量

y是x1,,x2,,xp

的線(xiàn)性函數(shù)加上誤差項(xiàng)

說(shuō)明了包含在y里面但不能被p個(gè)自變量的線(xiàn)性關(guān)系所解釋的變異性多元線(xiàn)性回歸方程描述y的平均值或期望值如何依賴(lài)于

x1,x1

,…,xp的方程稱(chēng)為多元線(xiàn)性回歸方程多元線(xiàn)性回歸方程的形式為

E(y)=0+1x1

+2x2

+…+

pxp

b1,b2,,bp稱(chēng)為偏回歸系數(shù)

bi

表示假定其他變量不變,當(dāng)xi

每變動(dòng)一個(gè)單位時(shí),y的平均平均變動(dòng)值二、多元線(xiàn)性回歸分析的主要問(wèn)題回歸方程的評(píng)價(jià)回歸方程的檢驗(yàn)自變量篩選多重共線(xiàn)性問(wèn)題多重決定系數(shù)判定系數(shù)回歸平方和占總離差平方和的比例修正的多重決定系數(shù)由于增加自變量將影響到因變量中被估計(jì)的回歸方程所解釋的變異性的數(shù)量,為避免高估這一影響,需要用自變量的數(shù)目去修正R2的值用n表示觀察值的數(shù)目,p表示自變量的數(shù)目,修正的多元判定系數(shù)的計(jì)算公式可表示為回歸方程的顯著性檢驗(yàn)提出假設(shè)H0:12p=0(y與所有x的線(xiàn)性關(guān)系均不顯著)H1:1,2,,p至少有一個(gè)不等于02.計(jì)算檢驗(yàn)統(tǒng)計(jì)量F3.計(jì)算F統(tǒng)計(jì)量的值和相伴概率p4.判斷:p<=a:拒絕H0,即所有回歸系數(shù)與0有顯著差異,自變量與因變量之間存在顯著的線(xiàn)性關(guān)系。反之,不能拒絕H0回歸系數(shù)的顯著性檢驗(yàn)如果F檢驗(yàn)已經(jīng)表明了回歸模型總體上是顯著的,那么回歸系數(shù)的檢驗(yàn)就是用來(lái)確定每一個(gè)單個(gè)的自變量xi

對(duì)因變量y的影響是否顯著對(duì)每一個(gè)自變量都要單獨(dú)進(jìn)行檢驗(yàn)應(yīng)用t檢驗(yàn)在多元線(xiàn)性回歸中,回歸方程的顯著性檢驗(yàn)不再等價(jià)于回歸系數(shù)的顯著性檢驗(yàn)回歸系數(shù)的顯著性檢驗(yàn)1、提出假設(shè)H0:βi

=0(自變量xi與

因變量y沒(méi)有線(xiàn)性關(guān)系)H1:βi

0(自變量xi與

因變量y有線(xiàn)性關(guān)系)2、計(jì)算檢驗(yàn)的統(tǒng)計(jì)量t3、逐個(gè)計(jì)算t統(tǒng)計(jì)量的值和相伴概率p4、逐個(gè)進(jìn)行檢驗(yàn)和判斷:p<=a,拒絕H0,即:該回歸系數(shù)與0有顯著差異,該自變量與因變量之間存在顯著的線(xiàn)性關(guān)系,應(yīng)保留在回歸方程中。反之,不能拒絕H0自變量篩選(一)自變量篩選的目的多元回歸分析引入多個(gè)自變量.如果引入的自變量個(gè)數(shù)較少,則不能很好的說(shuō)明因變量的變化;并非自變量引入越多越好,原因:有些自變量可能對(duì)因變量的解釋沒(méi)有貢獻(xiàn)。自變量間可能存在較強(qiáng)的線(xiàn)性關(guān)系,即多重共線(xiàn)性.因而不能全部引入回歸方程。自變量篩選(二)自變量向前篩選法(forward):即自變量不斷進(jìn)入回歸方程的過(guò)程.首先,選擇與因變量具有最高相關(guān)系數(shù)的自變量進(jìn)入方程,并進(jìn)行各種檢驗(yàn);其次,在剩余的自變量中尋找偏相關(guān)系數(shù)最高的變量進(jìn)入回歸方程,并進(jìn)行檢驗(yàn);默認(rèn):回歸系數(shù)檢驗(yàn)的概率值小于PIN(0.05)才可以進(jìn)入方程.反復(fù)上述步驟,直到?jīng)]有可進(jìn)入方程的自變量為止. 多元線(xiàn)性回歸分析中的自變量篩選(三)自變量向后篩選法(backward):即:自變量不斷剔除出回歸方程的過(guò)程.首先,將所有自變量全部引入回歸方程;其次,在一個(gè)或多個(gè)t值不顯著的自變量中將t值最小的那個(gè)變量剔除出去,并重新擬和方程和進(jìn)行檢驗(yàn);默認(rèn):回歸系數(shù)檢驗(yàn)值大于POUT(0.10),則剔除出方程如果新方程中所有變量的回歸系數(shù)t值都是顯著的,則變量篩選過(guò)程結(jié)束.否則,重復(fù)上述過(guò)程,直到無(wú)變量可剔除為止.多元線(xiàn)性回歸分析中的自變量篩選(四)自變量逐步篩選法(stepwise):即:是“向前法”和“向后法”的結(jié)合。向前法只對(duì)進(jìn)入方程的變量的回歸系數(shù)進(jìn)行顯著性檢驗(yàn),而對(duì)已經(jīng)進(jìn)入方程的其他變量的回歸系數(shù)不再進(jìn)行顯著性檢驗(yàn),即:變量一旦進(jìn)入方程就不會(huì)被剔除隨著變量的逐個(gè)引進(jìn),由于變量之間存在著一定程度的相關(guān)性,使得已經(jīng)進(jìn)入方程的變量其回歸系數(shù)不再顯著,因此會(huì)造成最后的回歸方程可能包含不顯著的變量。逐步篩選法則在變量的每一個(gè)階段都考慮剔除一個(gè)變量的可能性。共線(xiàn)性檢測(cè)在回歸方程中,雖然各自變量對(duì)因變量是有意義的,但由于某些自變量彼此相關(guān),這種自變量彼此間的相關(guān)叫存在共線(xiàn)性問(wèn)題,必然給評(píng)價(jià)自變量的貢獻(xiàn)帶來(lái)困難。(一)共線(xiàn)性帶來(lái)的主要問(wèn)題回歸方程檢驗(yàn)顯著但所有偏回歸系數(shù)均檢驗(yàn)不顯著偏回歸系數(shù)估計(jì)值大小或符號(hào)與常識(shí)不符定性分析對(duì)因變量肯定有顯著影響的因素,在多元分析中檢驗(yàn)不顯著,不能納入方程去除一個(gè)變量,偏回歸系數(shù)估計(jì)值發(fā)生巨大變化線(xiàn)性回歸分析中的共線(xiàn)性檢測(cè)(二)共線(xiàn)性診斷自變量的容忍度(tolerance)和方差膨脹因子容忍度:Toli=1-Ri2.其中:Ri2是自變量xi與方程中其他自變量間的復(fù)相關(guān)系數(shù)的平方.容忍度越大則與方程中其他自變量的共線(xiàn)性越低,應(yīng)進(jìn)入方程。(據(jù)經(jīng)驗(yàn)T<0.1一般認(rèn)為具有多重共線(xiàn)性)方差膨脹因子(VIF):容忍度的倒數(shù)SPSS在回歸方程建立過(guò)程中不斷計(jì)算待進(jìn)入方程自變量的容忍度,并顯示目前的最小容忍度線(xiàn)性回歸分析中的共線(xiàn)性檢測(cè)(二)共線(xiàn)性診斷特征根如果自變量間確實(shí)存在較強(qiáng)的相關(guān)關(guān)系,那么它們之間必然存在信息重疊,于是可從這些自變量中提取出既能反映自變量信息(方差)又相互獨(dú)立的因素(主成分)來(lái).如果相當(dāng)多維度的特征根約等于0,則可能有比較嚴(yán)重的共線(xiàn)性。條件指數(shù)0<k<10無(wú)多重共線(xiàn)性;k>=

30可能存在;k>=100嚴(yán)重多重共線(xiàn)性的對(duì)策重新抽取樣本數(shù)據(jù)增大樣本量多種自變量篩選方法結(jié)合(選擇逐步回歸法建方程)人為去除次要變量主成分回歸分析(提取因子作為影響因素)進(jìn)行嶺回歸。SPSS的多元線(xiàn)性回歸分析(一)基本操作步驟(1)菜單選項(xiàng):analyze→regression→linear…(2)選擇一個(gè)變量為因變量進(jìn)入dependent框(3)選擇一個(gè)或多個(gè)變量為自變量進(jìn)入independent框(4)選擇多元回歸分析的自變量篩選方法:Enter:所選變量全部進(jìn)入回歸方程(默認(rèn)方法)Stepwise:逐步篩選;backward:向后篩選;forward:向前篩選多元線(xiàn)性回歸分析操作(二)statistics選項(xiàng)(基本統(tǒng)計(jì)量輸出)RegressionCoefficients:定義回歸系數(shù)的輸出情況。Residuals:用語(yǔ)選擇輸出殘差診斷的信息(包括Durbin-Watson:自相關(guān)檢驗(yàn))Collinearity

dignostics:共線(xiàn)性診斷.多元線(xiàn)性回歸分析操作(三)save選項(xiàng):將回歸分析結(jié)果保存到數(shù)據(jù)編輯窗口中或某磁盤(pán)文件中PredictedValue:預(yù)測(cè)值選項(xiàng)Residuals:可供存儲(chǔ)的各種殘差其他判斷異常值和強(qiáng)影響點(diǎn)的統(tǒng)計(jì)量多元線(xiàn)性回歸分析應(yīng)用舉例例5.4:為研究高等院校人文社會(huì)科學(xué)研究中立項(xiàng)課題數(shù)受那些因素的影響,收集某年31個(gè)省市自治區(qū)部分高校有關(guān)社科研究方面的數(shù)據(jù),試?yán)镁€(xiàn)性回歸方法進(jìn)行分析。(數(shù)據(jù)見(jiàn)“高??蒲醒芯?sav”)多元線(xiàn)性回歸分析應(yīng)用舉例例5.5:某專(zhuān)門(mén)為年輕人制作肖像的公司計(jì)劃在國(guó)內(nèi)再開(kāi)設(shè)幾家分店,收集了目前已開(kāi)設(shè)的分店的銷(xiāo)售數(shù)據(jù)(y,萬(wàn)元)及分店所在城市的16歲以下人數(shù)(x1,萬(wàn)人)、人均可支配收入(x2,元)。(數(shù)據(jù)見(jiàn)“reg.sav”)試進(jìn)行統(tǒng)計(jì)分析。多元線(xiàn)性回歸分析應(yīng)用舉例例5.6:某大學(xué)教務(wù)處對(duì)學(xué)生的動(dòng)手能力頗感興趣,在研究中發(fā)現(xiàn),學(xué)生的學(xué)習(xí)成績(jī)特別是統(tǒng)計(jì)成績(jī)同計(jì)算機(jī)有關(guān)。他們將學(xué)生分為兩類(lèi),一類(lèi)利用計(jì)算機(jī)學(xué)習(xí)統(tǒng)計(jì),另一類(lèi)不用計(jì)算機(jī)學(xué)統(tǒng)計(jì)。現(xiàn)隨機(jī)從兩類(lèi)學(xué)生中抽取兩個(gè)樣本,包括統(tǒng)計(jì)成績(jī)和過(guò)去的績(jī)分點(diǎn)(數(shù)據(jù)見(jiàn)“統(tǒng)計(jì)成績(jī).sav”),在顯著性水平0.05上,能否確定使用計(jì)算機(jī)學(xué)生的統(tǒng)計(jì)成績(jī)高于不使用計(jì)算機(jī)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論