多重回歸與相關(guān)_第1頁
多重回歸與相關(guān)_第2頁
多重回歸與相關(guān)_第3頁
多重回歸與相關(guān)_第4頁
多重回歸與相關(guān)_第5頁
已閱讀5頁,還剩38頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、關(guān)聯(lián)性分析方法分類關(guān)聯(lián)性分析方法分類回歸分析與回歸分析與Pearson其人其人l皮爾遜推廣了高爾登皮爾遜推廣了高爾登(Golton)(Golton)的相的相關(guān)結(jié)論和方法,推導(dǎo)出人們稱之為關(guān)結(jié)論和方法,推導(dǎo)出人們稱之為“皮爾遜積差皮爾遜積差”的公式,給出了簡的公式,給出了簡單的計算:說明對三個變量的一般單的計算:說明對三個變量的一般相關(guān)理論,并且賦予多重回歸方程相關(guān)理論,并且賦予多重回歸方程系數(shù)以零階相關(guān)系數(shù)的名稱。系數(shù)以零階相關(guān)系數(shù)的名稱。l他意識到只有通過回歸才能回答韋爾頓提出的關(guān)于出現(xiàn)他意識到只有通過回歸才能回答韋爾頓提出的關(guān)于出現(xiàn)相關(guān)器官的選擇問題,意識到要測定復(fù)回歸系數(shù)值,須相關(guān)器官的

2、選擇問題,意識到要測定復(fù)回歸系數(shù)值,須廣泛搜集所有變量的均數(shù)、標(biāo)準(zhǔn)差和相關(guān)的數(shù)據(jù)。廣泛搜集所有變量的均數(shù)、標(biāo)準(zhǔn)差和相關(guān)的數(shù)據(jù)。l他提出了凈相關(guān)、復(fù)相關(guān)、總相關(guān)、相關(guān)比等概念,發(fā)他提出了凈相關(guān)、復(fù)相關(guān)、總相關(guān)、相關(guān)比等概念,發(fā)明了計算復(fù)相關(guān)和凈相關(guān)的方法及相關(guān)系數(shù)的公式。明了計算復(fù)相關(guān)和凈相關(guān)的方法及相關(guān)系數(shù)的公式。 實例實例l例例15-1:試建立血糖與其他幾項指標(biāo)的多重線性回歸方程試建立血糖與其他幾項指標(biāo)的多重線性回歸方程主要內(nèi)容主要內(nèi)容l多重回歸方程:定量刻劃出一個因變量多重回歸方程:定量刻劃出一個因變量Y與多個自與多個自變量變量X1,X2之間的線性依存關(guān)系。其中之間的線性依存關(guān)系。其中:變

3、量可以是隨機變動的,也可以人為選定變量可以是隨機變動的,也可以人為選定因變量是服從狀態(tài)分布的隨機變量因變量是服從狀態(tài)分布的隨機變量l若所有變量都是隨機的,還可做多重相關(guān)來描述因若所有變量都是隨機的,還可做多重相關(guān)來描述因變量與一組自變量之間的線性關(guān)系;變量與一組自變量之間的線性關(guān)系;l用偏相關(guān)用偏相關(guān)(partial correlation)描述因變量和一個自變描述因變量和一個自變量在扣除其他自變量影響之后的線性相關(guān)。量在扣除其他自變量影響之后的線性相關(guān)。多重回歸與多重相關(guān)的定義多重回歸與多重相關(guān)的定義u簡單線性回歸推廣為簡單線性回歸推廣為0相當(dāng)于簡單回歸中的相當(dāng)于簡單回歸中的 i為偏回歸系數(shù)

4、,反映了當(dāng)其他自變量對因變量的影響固為偏回歸系數(shù),反映了當(dāng)其他自變量對因變量的影響固定時,第定時,第i個自變量個自變量xi每改變一個單位后因變量的平均變化每改變一個單位后因變量的平均變化u樣本多重回歸方程樣本多重回歸方程:mmxbxbxbby22110mmYXXX.22110第一節(jié)第一節(jié) 多重回歸方程多重回歸方程一個因變量一個因變量y多個自變量多個自變量x1,x2,xmn個個體組成的隨機樣本個個體組成的隨機樣本一、線性回歸模型的前提條件一、線性回歸模型的前提條件L-I-N-El線線 性性(Line):自變量和因變量之間的關(guān)系有線性趨勢自變量和因變量之間的關(guān)系有線性趨勢l獨立性獨立性(Indep

5、endence):總體中的個體之間相互獨立總體中的個體之間相互獨立l正態(tài)性正態(tài)性(Normal)給定一組給定一組x值后,相應(yīng)的值后,相應(yīng)的y值服從正態(tài)分布值服從正態(tài)分布l等方差等方差(Equal variance)各各x值變動時,相應(yīng)的值變動時,相應(yīng)的y有相同的變異度有相同的變異度二、多重回歸方程的求解二、多重回歸方程的求解l用最小二乘法尋找適宜的系數(shù)用最小二乘法尋找適宜的系數(shù)b0,b1,b2bm,使得誤差,使得誤差(殘差殘差)平方和最平方和最小。小。l計算復(fù)雜,一般需借助計算機完成計算復(fù)雜,一般需借助計算機完成niiiyy12)(估計結(jié)果估計結(jié)果單變量散點圖單變量散點圖C Co or rr

6、re el la at ti io on ns s1.632-.355.415.559.6321-.039.219.459-.355-.0391-.330-.510.415.219-.3301.610.559.459-.510.6101總膽固醇甘油三脂胰島素糖化血紅蛋白血糖總膽固醇甘油三脂胰島素糖化血紅蛋白血糖C Co oe ef ff fi ic ci ie en nt ts sa a5.9432.8292.101.047.142.366.078.390.701.351.204.3091.721.099-.271.121-.339-2.229.036.638.243.3982.623.016

7、(Constant)總膽固醇甘油三脂胰島素糖化血紅蛋白Model1BStd. ErrorUnstandardizedCoefficientsBetaStandardizedCoefficientstSig.Dependent Variable: 血糖a. SPSS分析結(jié)果分析結(jié)果轉(zhuǎn)t檢驗偏回歸偏回歸系數(shù)系數(shù)標(biāo)準(zhǔn)標(biāo)準(zhǔn)誤誤標(biāo)準(zhǔn)回標(biāo)準(zhǔn)回歸系數(shù)歸系數(shù)三、假設(shè)檢驗三、假設(shè)檢驗l總體回歸方程的整體檢驗總體回歸方程的整體檢驗方差分析方差分析l總體偏回歸系數(shù)的假設(shè)檢驗總體偏回歸系數(shù)的假設(shè)檢驗t檢驗檢驗 l擬合優(yōu)度檢驗擬合優(yōu)度檢驗決定系數(shù)、調(diào)整決定系數(shù)與方差分析決定系數(shù)、調(diào)整決定系數(shù)與方差分析l模型篩選過程中的

8、檢驗?zāi)P秃Y選過程中的檢驗偏回歸平方和偏回歸平方和三、多重回歸的方差分析三、多重回歸的方差分析l用于回答總的來說回歸用于回答總的來說回歸方程是否成立方程是否成立 H0:1=2=m=0 H1:1,2,m不全為不全為0222YYYYYY殘差回歸殘差殘差回歸回歸MSMSSSSSF/ 總總= 回回+ 誤差誤差 總總=n-1 回回=m 誤差誤差=n-(m+1)S SS SS S總回殘A AN NO OV VA Ab b133.711433.4288.278.000a88.841224.038222.55226RegressionResidualTotalModel1Sum ofSquaresdfMean

9、SquareFSig.Predictors: (Constant), 糖化血紅蛋白, 甘油三脂, 胰島素, 總膽固醇a. Dependent Variable: 血糖b. 方差分析結(jié)果方差分析結(jié)果方差分析表方差分析表lSPSS分析結(jié)果分析結(jié)果四、偏回歸平方和四、偏回歸平方和SSSSSS總回殘SS偏回歸偏回歸(X1)SS偏回歸偏回歸(X2)SS偏回歸偏回歸(X3)SS偏回歸偏回歸(X4)F=MS偏回歸偏回歸(X1)MS偏回歸偏回歸(X2)MS偏回歸偏回歸(X3)MS偏回歸偏回歸(X4)MS殘差殘差MS殘差殘差MS殘差殘差MS殘差殘差五、偏回歸系數(shù)的假設(shè)檢驗五、偏回歸系數(shù)的假設(shè)檢驗l回歸方程有統(tǒng)計

10、學(xué)意義并不說明每一個偏回歸回歸方程有統(tǒng)計學(xué)意義并不說明每一個偏回歸系數(shù)都有意義系數(shù)都有意義 H0: i0 H1: i 0 i=1,2,m 1,0ibiisbtSPSS結(jié)果標(biāo)準(zhǔn)化偏回歸系數(shù)標(biāo)準(zhǔn)化偏回歸系數(shù)?P值大小能反映自變量對應(yīng)變量影響的大小嗎值大小能反映自變量對應(yīng)變量影響的大小嗎?偏回歸系數(shù)大小能反映自變量影響的大小嗎偏回歸系數(shù)大小能反映自變量影響的大小嗎lP值越小只是越有理由認(rèn)為某值越小只是越有理由認(rèn)為某自變量對應(yīng)變量有影響,并不自變量對應(yīng)變量有影響,并不表明影響越大。表明影響越大。l偏回歸系數(shù)大小受自變量單位偏回歸系數(shù)大小受自變量單位與量剛影響,不能由偏回歸系與量剛影響,不能由偏回歸系數(shù)

11、的大小直接說明某自變量對數(shù)的大小直接說明某自變量對應(yīng)變量的影響大小。應(yīng)變量的影響大小。這種影響大小這種影響大小及方向通過標(biāo)及方向通過標(biāo)準(zhǔn)化偏回歸系準(zhǔn)化偏回歸系數(shù)來反映數(shù)來反映l偏回歸系數(shù)計算:數(shù)據(jù)中心化偏回歸系數(shù)計算:數(shù)據(jù)中心化估計系數(shù)估計系數(shù)l各個自變量標(biāo)準(zhǔn)化后所求得的標(biāo)準(zhǔn)化回歸方程各個自變量標(biāo)準(zhǔn)化后所求得的標(biāo)準(zhǔn)化回歸方程b0=0,各標(biāo)準(zhǔn)化回歸系數(shù)間可以直接比較絕對,各標(biāo)準(zhǔn)化回歸系數(shù)間可以直接比較絕對值的大小,反映自變量對應(yīng)變量的線性影響大小值的大小,反映自變量對應(yīng)變量的線性影響大小l上例標(biāo)準(zhǔn)化偏回歸系數(shù)結(jié)果上例標(biāo)準(zhǔn)化偏回歸系數(shù)結(jié)果misxxxiiijij,.,2 , 1,六、評價擬合效果的

12、重要統(tǒng)計量六、評價擬合效果的重要統(tǒng)計量l決定系數(shù)決定系數(shù)R2:越接近于:越接近于1,回歸效果越好,回歸效果越好, 本例本例R2=SS回回/SS總總=133.711/222.552=60.08%l剩余標(biāo)準(zhǔn)差:即殘差均方的平方根?;貧w估計剩余標(biāo)準(zhǔn)差:即殘差均方的平方根。回歸估計精度的指標(biāo),其值越小,估計精度越高。精度的指標(biāo),其值越小,估計精度越高。A AN NO OV VA Ab b133.711433.4288.278.000a88.841224.038222.55226RegressionResidualTotalModel1Sum ofSquaresdfMean SquareFSig.Pre

13、dictors: (Constant), 糖化血紅蛋白, 甘油三脂, 胰島素, 總膽固醇a. l常用于評價所擬合的回歸方程的好壞程度,但常用于評價所擬合的回歸方程的好壞程度,但是不能單靠增加自變量的數(shù)目來提高決定系數(shù)。是不能單靠增加自變量的數(shù)目來提高決定系數(shù)。全面地衡量,應(yīng)當(dāng)是既要確定系數(shù)大,又要自全面地衡量,應(yīng)當(dāng)是既要確定系數(shù)大,又要自變量數(shù)目少,為此可采用校正確定系數(shù)變量數(shù)目少,為此可采用校正確定系數(shù)) 1/) 1/112nSSmnSSMSMSadjR(總殘總殘調(diào)整的決定系數(shù)調(diào)整的決定系數(shù)Adj R2 =0.5282六、多重相關(guān)六、多重相關(guān) (multiple correlation)l當(dāng)

14、自變量和因變量均為多元正態(tài)分布的隨機變量當(dāng)自變量和因變量均為多元正態(tài)分布的隨機變量時,才考慮進行相關(guān)性分析。時,才考慮進行相關(guān)性分析。1.1.簡單相關(guān)系數(shù):簡單相關(guān)系數(shù):l對于一組隨機變量對于一組隨機變量x1 ,x2, xm和和y的樣本,可計的樣本,可計算其中任何兩個變量間的相關(guān)系數(shù)??闪谐上嚓P(guān)算其中任何兩個變量間的相關(guān)系數(shù)??闪谐上嚓P(guān)系數(shù)矩陣。系數(shù)矩陣。l推斷各總體簡單相關(guān)系數(shù)是否為推斷各總體簡單相關(guān)系數(shù)是否為0的假設(shè)檢驗可的假設(shè)檢驗可用用t檢驗或查檢驗或查r界值表界值表l一個變量與一組變量的的相關(guān)的密切程度可由復(fù)一個變量與一組變量的的相關(guān)的密切程度可由復(fù)相關(guān)系數(shù)反映相關(guān)系數(shù)反映,即即Y和和

15、 的簡單相關(guān)系數(shù)的簡單相關(guān)系數(shù) l前例前例R2=0.6008,R=0.6008=0.77510.6008=0.7751l復(fù)相關(guān)系數(shù)的平方就是決定系數(shù)。其是否為復(fù)相關(guān)系數(shù)的平方就是決定系數(shù)。其是否為0的的假設(shè)檢驗等價于多重回歸的方差分析。假設(shè)檢驗等價于多重回歸的方差分析??偦豐SSSyyyyYYcorrRii22)()(),(Y2.復(fù)相關(guān)系數(shù):復(fù)相關(guān)系數(shù):l設(shè)總體中扣除設(shè)總體中扣除q個變量影響后的偏相關(guān)系數(shù)為個變量影響后的偏相關(guān)系數(shù)為(-q),樣本中相應(yīng)的偏相關(guān)系數(shù)為,樣本中相應(yīng)的偏相關(guān)系數(shù)為 r(-q), l H0: (-q)=0,l H1: (-q) 02,122)()(qnrqnrtqql

16、在其他變量不變的情況下,某兩個變量間的相在其他變量不變的情況下,某兩個變量間的相關(guān)系數(shù)。關(guān)系數(shù)。3.偏相關(guān)系數(shù):偏相關(guān)系數(shù):第二節(jié)第二節(jié) 回歸分析中自變量的選擇回歸分析中自變量的選擇l回歸方程中的自變量并非多多多多益善回歸方程中的自變量并非多多多多益善l回歸方程中的自變量并非都有統(tǒng)計學(xué)意義回歸方程中的自變量并非都有統(tǒng)計學(xué)意義l回歸方程中的自變量并非都符合專業(yè)解釋回歸方程中的自變量并非都符合專業(yè)解釋 最優(yōu)模型篩選最優(yōu)模型篩選l目標(biāo):如何選擇最好的、符合專業(yè)解釋的回歸模型目標(biāo):如何選擇最好的、符合專業(yè)解釋的回歸模型 用較少的自變量建立回歸方程用較少的自變量建立回歸方程l要求:選擇自變量首先要靠背景

17、知識來指導(dǎo),所選方要求:選擇自變量首先要靠背景知識來指導(dǎo),所選方 程符合專業(yè)知識,最后還要靠其來驗收程符合專業(yè)知識,最后還要靠其來驗收l方法:全局擇優(yōu)、局部擇優(yōu)方法:全局擇優(yōu)、局部擇優(yōu)選擇自變量的標(biāo)準(zhǔn)選擇自變量的標(biāo)準(zhǔn)l全局擇優(yōu)法:全局擇優(yōu)法:對自變量的所有組合考察對自變量的所有組合考察l評價準(zhǔn)則評價準(zhǔn)則1、決定系數(shù)與、決定系數(shù)與調(diào)整決定系數(shù)調(diào)整決定系數(shù)最大:最大: 要求自變量個數(shù)不得過小或過大。要求自變量個數(shù)不得過小或過大。2、Cp統(tǒng)計量lCp統(tǒng)計量最小統(tǒng)計量最小 :1973年,由年,由Mallows提出提出(n-p-1)(MS誤差誤差,p/MS誤差誤差,全全-1)+(p+1)lCp統(tǒng)計量越接

18、近統(tǒng)計量越接近p1的回歸方程為最佳方程的回歸方程為最佳方程3、Up最大:)2)(1(12pnpnRUpp1973年由日本學(xué)者赤池提出年由日本學(xué)者赤池提出p計算公式計算公式pAIC越小越好越小越好準(zhǔn)則 (Akaike information criterion)pnSSnAIC2ln殘差R Rc c2 2CPCPAICAICR Rc c2 2CPCPAICAICX1X10.284430.284432 250.85750.857X2 X4X2 X40.43950.43953 345.1645.16X2X20.178640.178642 254.57954.579X3 X4X3 X40.435420

19、.435423 345.35645.356X3X30.230630.230632 252.81452.814X1 X2 X3X1 X2 X30.407560.407564 447.50747.507X4X40.346530.346532 248.40548.405X1 X2 X4X1 X2 X40.446830.446834 445.65545.655X1 X2X1 X20.274780.274783 352.11652.116X1 X3 X4X1 X3 X40.487970.487974 443.56843.568X1 X3X1 X30.375220.375223 348.09148.091

20、X1 X4X1 X40.441370.441373 345.0745.07X1 X2 X3 X4X1 X2 X3 X40.528230.528235 542.15742.157X2 X3X2 X30.407480.407483 346.6646.66二、逐步選擇變量的方法二、逐步選擇變量的方法1.向前引入法向前引入法 (forward selection):前進法前進法 將與將與y簡單相關(guān)系數(shù)最大且簡單相關(guān)系數(shù)最大且F檢驗又有意義的選為檢驗又有意義的選為第一個變量,第一個變量,直到不再拒絕直到不再拒絕H0 。 注:一次只能引入一個自變量,若兩個變量在一起效果好,注:一次只能引入一個自變量,若兩

21、個變量在一起效果好,單獨一個卻不好時,則該變量無機會選中。單獨一個卻不好時,則該變量無機會選中。2.向后引入法向后引入法(backward selection):后退法后退法 首先對全部候選自變量建立回歸方程,然后一個首先對全部候選自變量建立回歸方程,然后一個個剔除無統(tǒng)計學(xué)意義的變量,直到再不能剔除。個剔除無統(tǒng)計學(xué)意義的變量,直到再不能剔除。l在向前引入的每一步之后都考慮從已引入方程在向前引入的每一步之后都考慮從已引入方程的變量中剔除相形見絀者。先規(guī)定兩個值的變量中剔除相形見絀者。先規(guī)定兩個值F引入引入和和F剔除剔除, F引入引入F剔除剔除,引入和剔除交替進行,直到,引入和剔除交替進行,直到無

22、可引入和剔除為止。調(diào)整兩個無可引入和剔除為止。調(diào)整兩個F值可影響篩選值可影響篩選結(jié)果。結(jié)果。l小樣本檢驗水準(zhǔn)小樣本檢驗水準(zhǔn)a定為定為0.10或或0.15,大樣本定為,大樣本定為0.05。值越小表示選取自變量的標(biāo)準(zhǔn)越嚴(yán)。值越小表示選取自變量的標(biāo)準(zhǔn)越嚴(yán)。l 注意,引入變量的檢驗水準(zhǔn)要小于或等于剔除注意,引入變量的檢驗水準(zhǔn)要小于或等于剔除變量的檢驗水準(zhǔn)。變量的檢驗水準(zhǔn)。3.逐步引入逐步引入-剔除法剔除法(stepwise selection) l前進法:容易忽略有意義的變量前進法:容易忽略有意義的變量局限性:即后續(xù)變量的引入可能會使先進局限性:即后續(xù)變量的引入可能會使先進入方程的自變量變得不重要。入

23、方程的自變量變得不重要。l后退法:容易引進更多的變量后退法:容易引進更多的變量局限性:自變量高度相關(guān)時,可能得不出局限性:自變量高度相關(guān)時,可能得不出正確的結(jié)果正確的結(jié)果 。l逐步法:所選變量比較精悍,但計算繁瑣逐步法:所選變量比較精悍,但計算繁瑣三種方法比較三種方法比較C Co oe ef ff fi ic ci ie en nt ts sa a3.0062.3641.272.215-1.8627.874.978.254.6103.845.001.4541.5021.3102.308.568.576-3.4536.073.732.259.4562.833.009.1991.266.678.2

24、96.3692.290.031.0671.2884.3092.7761.552.134-1.43310.051.635.253.3962.507.020.1111.160.545.293.2971.861.076-.0611.151-.219.122-.274-1.785.088-.472.0355.9432.8292.101.047.07711.809.638.243.3982.623.016.1341.143.142.366.078.390.701-.616.901-.271.121-.339-2.229.036-.522-.019.351.204.3091.721.099-.072.77

25、56.5002.3962.713.0121.54311.456.663.230.4132.880.008.1871.140-.287.112-.360-2.570.017-.518-.056.402.154.3542.612.016.084.721(Constant)糖化血紅蛋白(Constant)糖化血紅蛋白總膽固醇(Constant)糖化血紅蛋白總膽固醇胰島素(Constant)糖化血紅蛋白總膽固醇胰島素甘油三脂(Constant)糖化血紅蛋白胰島素甘油三脂Model12345BStd. ErrorUnstandardizedCoefficientsBetaStandardizedCoef

26、ficientstSig.Lower Bound Upper Bound95% Confidence Interval for Ba. 逐步篩選結(jié)果逐步篩選結(jié)果第三節(jié)第三節(jié) 多重回歸分析應(yīng)用及一些問題多重回歸分析應(yīng)用及一些問題一、多重線性回歸的應(yīng)用一、多重線性回歸的應(yīng)用l預(yù)測預(yù)報:預(yù)測預(yù)報:利用實測值建立的預(yù)報方程,可以進行預(yù)測利用實測值建立的預(yù)報方程,可以進行預(yù)測預(yù)報。預(yù)報。 1.因素分析:發(fā)現(xiàn)影響因素因素分析:發(fā)現(xiàn)影響因素 二、應(yīng)用多重線性回歸的幾點注意二、應(yīng)用多重線性回歸的幾點注意 l應(yīng)用條件:線性、獨立、正態(tài)、等方差(應(yīng)用條件:線性、獨立、正態(tài)、等方差(LINE)l樣本含量:在進行多重

27、線性回歸分析時,一般要求觀察樣本含量:在進行多重線性回歸分析時,一般要求觀察例數(shù)不少于變量個數(shù)的例數(shù)不少于變量個數(shù)的5-10倍。倍。l數(shù)據(jù)類型:回歸方程中的各變量一般應(yīng)是數(shù)值變量,但數(shù)據(jù)類型:回歸方程中的各變量一般應(yīng)是數(shù)值變量,但如果自變量為分類變量或有序變量時,須轉(zhuǎn)換。如果自變量為分類變量或有序變量時,須轉(zhuǎn)換。l預(yù)測范圍預(yù)測范圍 回歸方程進行預(yù)報,各自變量的取值范圍應(yīng)在回歸方程進行預(yù)報,各自變量的取值范圍應(yīng)在觀察范圍之內(nèi)。觀察范圍之內(nèi)。l“最優(yōu)最優(yōu)”方程的意義方程的意義l方法學(xué)上:全局擇優(yōu)與局部擇優(yōu)方法學(xué)上:全局擇優(yōu)與局部擇優(yōu)相對最優(yōu)相對最優(yōu)l實際應(yīng)用:符合專業(yè)意義實際應(yīng)用:符合專業(yè)意義例如

28、例如 若回歸方程能較好地反映若回歸方程能較好地反映y和和xi 的線性關(guān)系,殘的線性關(guān)系,殘差應(yīng)該是服從差應(yīng)該是服從 =0的正態(tài)分布。的正態(tài)分布。 也可用每一例的殘差也可用每一例的殘差 做圖,理想做圖,理想的殘差圖上的點應(yīng)圍繞的殘差圖上的點應(yīng)圍繞x軸軸( )隨機分布。隨機分布。iiiiyyye與iyl繪制殘差的直方圖判斷分布的正態(tài)性以及發(fā)現(xiàn)異繪制殘差的直方圖判斷分布的正態(tài)性以及發(fā)現(xiàn)異常值;繪制殘差與自變量常值;繪制殘差與自變量(或因變量預(yù)測值或因變量預(yù)測值)的散的散點圖考察模型形式以及方差齊性。點圖考察模型形式以及方差齊性。三、殘差分析:三、殘差分析:l(a)可以認(rèn)為基本滿足線性和等方差的假定條

29、件可以認(rèn)為基本滿足線性和等方差的假定條件l(b)(c)的散點呈現(xiàn)曲線趨勢,提示資料不滿足線性的假定。的散點呈現(xiàn)曲線趨勢,提示資料不滿足線性的假定。l(d)(e)(f)顯示殘差變化,提示資料不滿足方差齊的前提條件顯示殘差變化,提示資料不滿足方差齊的前提條件l(g)(h)顯示方差不齊,而且散點呈現(xiàn)曲線趨勢,提示資料不滿顯示方差不齊,而且散點呈現(xiàn)曲線趨勢,提示資料不滿足線性和方差齊性的前提條件。足線性和方差齊性的前提條件。常見殘差圖常見殘差圖例例15-1的進一步剖析的進一步剖析剔除剔除No25號數(shù)據(jù)(標(biāo)準(zhǔn)化殘差號數(shù)據(jù)(標(biāo)準(zhǔn)化殘差2.46)逐步篩選的結(jié)果逐步篩選的結(jié)果E Ex xc cl lu ud

30、de ed d V Va ar ri ia ab bl le es s-.006-.033.974-.007.801.074.457.652.095.974-.282-1.789.087-.349.908-.044-.253.803-.054.789.146.930.362.195.920總膽固醇甘油三脂胰島素總膽固醇甘油三脂Model12Beta IntSig.PartialCorrelationToleranceCollinearityStatisticsC Co oe ef ff fi ic ci ie en nt ts sa a3.7831.9671.923.066-.2777.842

31、.864.213.6384.060.000.4251.3036.0712.2762.667.0141.36210.779.748.214.5523.499.002.3061.190-.195.109-.282-1.789.087-.420.031(Constant)糖化血紅蛋白(Constant)糖化血紅蛋白胰島素Model12BStd. ErrorUnstandardizedCoefficientsBetaStandardizedCoefficientstSig. Lower Bound Upper Bound95% Confidence Interval for BDependent Variable: 血糖a. l二分類:二分類:xi取取0或或1, 多分類:設(shè)置分類數(shù)減多分類:設(shè)置分類數(shù)減1個啞變量個啞變量 血型X1X2X3A100B010O001AB000l如果變量有等級之分如果變量有等級之分 近似等間距的:近似等間距的: xi取取1,2,3. 不等間距或無法度量間距的:用適當(dāng)?shù)臄?shù)量化方法不等間距或無法度量間距的:用適當(dāng)?shù)臄?shù)量化方法四、名義變量的分析四、名義變量的分析n部分或全部自變量間存在高度相關(guān)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論