多因素線性回歸

上傳人：0*** IP屬地：湖北上傳時(shí)間：2023-02-03 格式：PPT 頁(yè)數(shù)：88 大?。?70.50KB 積分：28 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩83頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1多重線性回歸分析復(fù)旦大學(xué)生物統(tǒng)計(jì)學(xué)教研室2線性回歸模型單因素線性回歸模型（復(fù)習(xí)）多重線性回歸方程多重線性回歸模型模型的參數(shù)估計(jì)多重線性回歸對(duì)資料的要求多重線性回歸舉例應(yīng)用3單因素線性回歸的復(fù)習(xí)4舉例復(fù)習(xí)單因素回歸模型例為了研究3歲至8歲男孩人群平均身高(cm)與年齡(year)的規(guī)律，在某地區(qū)在3歲至8歲男孩中隨機(jī)抽樣，共分6個(gè)年齡層抽樣：3歲，4歲，…，8歲，每個(gè)層抽3名男孩，共抽18名男孩。資料如下：5本例的研究目的和實(shí)現(xiàn)方法研究目的：了解年齡與兒童人群的平均身高對(duì)應(yīng)關(guān)系。方法1：可以做普查，得到每個(gè)年齡組所有兒童的身高，并且計(jì)算每個(gè)年齡組的兒童人群的平均身高。方法2：作抽樣調(diào)查，本例就是通過(guò)按年齡組分層抽樣調(diào)查，獲得樣本后用回歸分析的方法得到每個(gè)年齡組兒童人群的平均身高估計(jì)值和相應(yīng)的統(tǒng)計(jì)推斷。6兒童身高的分布特征一般而言，兒童身高滿足同一年齡x的兒童身高y近似服從正態(tài)分布，因此對(duì)于每個(gè)年齡x，均有一個(gè)身高y的總體均數(shù)。不同年齡x的兒童身高分別近似服從對(duì)應(yīng)不同身高總體均數(shù)的正態(tài)分布。身高的總體均數(shù)是年齡x的一個(gè)函數(shù)7畫散點(diǎn)圖考查身高與年齡的分布關(guān)系Y的離散程度與X沒(méi)有關(guān)系，并且散點(diǎn)呈直線帶8畫散點(diǎn)圖考查身高總體均數(shù)與年齡的關(guān)系

年齡組的身高樣本均數(shù)與年齡的散點(diǎn)圖9由散點(diǎn)圖確定身高總體均數(shù)與年齡

可能是直線關(guān)系年齡組的身高樣本均數(shù)與年齡的散點(diǎn)圖顯示年齡組的身高樣本均數(shù)與年齡幾乎在一條直線上，略有些偏離直線的點(diǎn)可以理解為樣本均數(shù)的抽樣誤差所致(因?yàn)闃颖揪鶖?shù)一般不等于總體均數(shù))，因此可以假定固定年齡的身高總體均數(shù)與年齡x的關(guān)系可能是直線關(guān)系，即假定：10回歸方程并且稱上述直線方程為(總體)回歸方程?；貧w方程中，為未知參數(shù)，需要用樣本資料通過(guò)擬合曲線后得到其估計(jì)值，并分別記為a和b，相應(yīng)得到樣本估計(jì)的回歸方程通常稱為Y的預(yù)測(cè)值，其意義為固定x，Y的總體均數(shù)的估計(jì)值。11Y與x的直線回歸關(guān)系由總體回歸方程可知：當(dāng)=0時(shí)，。即：對(duì)于x的任何值，總體均數(shù)沒(méi)有任何改變，因此建立Y與x的直線回歸方程就沒(méi)有任何意義了，所以稱0時(shí)，Y與x

之間存在直線回歸關(guān)系，反之＝0Y與x

之間稱不存在直線回歸關(guān)系。12回歸模型根據(jù)正態(tài)分布性質(zhì)，可以得到：固定年齡X，身高Y服從總體均數(shù)為，方差為2的正態(tài)分布由散點(diǎn)圖可以假定總體均數(shù)故令,即：,并稱為直線回歸模型13誤差與殘差

稱為隨機(jī)誤差稱為殘差(residual)根據(jù)上述，直線回歸分析要求資料滿足固定X，Y服從正態(tài)分布等價(jià)于殘差服從正態(tài)分布。14直線回歸原理示意圖所以如果固定x，Y服從正態(tài)分布，其散點(diǎn)圖呈直線帶分布15直線回歸系數(shù)的估計(jì)用最小二乘法擬合直線，選擇a和b使其殘差（樣本點(diǎn)到直線的垂直距離)平方和達(dá)到最小。即使下列的SSE達(dá)到最小值。由此得到16回歸系數(shù)的意義由總體回歸方程可知回歸系數(shù)表示：x增加一個(gè)單位，總體均數(shù)增加個(gè)單位由于是的估計(jì)表達(dá)式，所以(樣本）回歸系數(shù)b表示x增加一個(gè)單位，估計(jì)y平均增加b個(gè)單位。

17回歸系數(shù)假設(shè)檢驗(yàn)的必要性由于樣本回歸系數(shù)b與總體回歸系數(shù)存在抽樣誤差，即：一般情況下，b，因此需要考慮抽樣誤差對(duì)統(tǒng)計(jì)推斷是否存在重大影響。由于

＝0時(shí)，，Y與x之間不存在直線回歸關(guān)系，因此是否為0，涉及到所建立的回歸方程是否有意義的重大問(wèn)題，然而即使＝0，樣本回歸系數(shù)b一般不為0，因此需要對(duì)回歸系數(shù)是否等于0進(jìn)行假設(shè)檢驗(yàn)。18回歸系數(shù)的假設(shè)檢驗(yàn)H0：=0vs.H1：0=0.05回歸系數(shù)的標(biāo)準(zhǔn)誤為其中s為殘差的標(biāo)準(zhǔn)差則回歸系數(shù)的檢驗(yàn)統(tǒng)計(jì)量為

19回歸系數(shù)的假設(shè)檢驗(yàn)殘差的標(biāo)準(zhǔn)差s還可以表示為可以證明：H0：=0成立時(shí)，檢驗(yàn)統(tǒng)計(jì)量tb服從自由度為n-2的t分布。即：當(dāng)出現(xiàn)，=0而言這是小概率事件，故可以拒絕H0：=0，認(rèn)為0。20回歸系數(shù)檢驗(yàn)統(tǒng)計(jì)量t的分布示意圖當(dāng)|t|>t0.05,1,n-2時(shí)，對(duì)＝0而言是小概率事件，對(duì)>0而言并非是小概率事件21成組t檢驗(yàn)由單因素線性回歸實(shí)現(xiàn)下列將舉例證實(shí)成組t檢驗(yàn)可以用單因素線性回歸實(shí)現(xiàn)，以此進(jìn)一步理解線性回歸的意義。舉例：在2型糖尿病患者人群和健康人群中分別隨機(jī)抽取15個(gè)年齡在50歲~60歲男性對(duì)象，測(cè)量其體重指數(shù)BMI，分析這兩個(gè)人群的平均BMI是否不同。22成組t檢驗(yàn)由單因素線性回歸實(shí)現(xiàn)先做成組t檢驗(yàn)，借助Stata軟件得到下列t檢驗(yàn)結(jié)果糖尿病組的BMI均數(shù)-健康組的BMI均數(shù)=1.74，t=4.2754，P=0.0002，95%CI為(0.9063416,2.573658)23成組t檢驗(yàn)由單因素線性回歸實(shí)現(xiàn)定義因變量Y為BMI，糖尿病組定義自變量x=1，健康組定義自變量x=0，數(shù)據(jù)格式如下借助Stata軟件實(shí)現(xiàn)線性回歸：regyx24成組t檢驗(yàn)由單因素線性回歸實(shí)現(xiàn)Stata輸出結(jié)果為回歸系數(shù)=糖尿病組均數(shù)-健康組均數(shù)=1.74t=4.28,P<0.001，95%可信區(qū)間為(0.9063416，2.573658），與t檢驗(yàn)結(jié)果完全相同25成組t檢驗(yàn)由單因素線性回歸實(shí)現(xiàn)原理因?yàn)榛貧w方程為Y是固定X時(shí)的Y總體均數(shù)，所以X=0時(shí)，健康人群的總體均數(shù)為，X=1時(shí)，糖尿病人群的總體均數(shù)為因此糖尿病人群總體均數(shù)與健康人群的總體均數(shù)之差為，因此檢驗(yàn)兩個(gè)總體均數(shù)相等的問(wèn)題就是檢驗(yàn)回歸系數(shù)的問(wèn)題。26成組t檢驗(yàn)由單因素線性回歸實(shí)現(xiàn)原理由于預(yù)測(cè)值是總體均數(shù)的估計(jì)值，所以x=0,X=1，所以事實(shí)上，樣本回歸方程就是成組t檢驗(yàn)由單因素線性回歸實(shí)現(xiàn)原理27成組t檢驗(yàn)由單因素線性回歸實(shí)現(xiàn)原理由于線性回歸模型為X=0時(shí)，X=1時(shí)即：對(duì)于成組t檢驗(yàn)資料而言，用X=1和X=0定義分組變量，其資料滿足線性回歸對(duì)資料的要求，故其結(jié)果與成組t檢驗(yàn)相同。28多重線性回歸模型介紹29多重線性回歸方程設(shè)有m個(gè)自變量為，亦稱協(xié)變量，應(yīng)變量為Y，則描述Y的總體均數(shù)與m個(gè)自變量之間的線性關(guān)系可以用下列的多重線性回歸方程

其中0為常數(shù)項(xiàng)，亦稱截距，1，2，…，m稱為偏回歸系數(shù)。30多重線性回歸模型刻畫觀察變量Y與自變量之間的對(duì)應(yīng)關(guān)系為下列多重線性回歸模型i表示除Xi以外的其它自變量固定的情況下，Xi變化一個(gè)單位，相應(yīng)Y的平均變化值，即Y總體均數(shù)的相應(yīng)變化值。31多重線性回歸模型0，1，2，…，m

一般是未知的，但可根據(jù)樣本資料擬合回歸方程得到其估計(jì)值，，由此可寫出相應(yīng)的樣本回歸方程稱樣本偏回歸系數(shù)，簡(jiǎn)稱偏回歸系數(shù)。32多重線性回歸模型由于多重線性回歸方程的參數(shù)估計(jì)方法采用最小二乘法，對(duì)于多個(gè)自變量的情況，計(jì)算量相對(duì)比較煩瑣，一般需用計(jì)算機(jī)完成計(jì)算，故以下將通過(guò)實(shí)例介紹多重線性回歸方程的基本分析步驟和分析策略。33多重線性回歸舉例1欲研究糖尿病患者的總膽固醇（X1）和甘油三酯（X2）對(duì)空腹血糖（Y）的影響，某研究者調(diào)查40名糖尿病患者的總膽固醇、甘油三酯和空腹血糖的測(cè)量值如下，試根據(jù)上述研究問(wèn)題作統(tǒng)計(jì)分析。34舉例1的數(shù)據(jù)

總膽固醇X1,和甘油三酯X2對(duì)空腹血糖Y35參數(shù)估計(jì)根據(jù)上述研究問(wèn)題，考慮用多重線性回歸進(jìn)行統(tǒng)計(jì)分析，其回歸方程為尋找0，1和2

使下列和式SS達(dá)到最小，稱為最小二乘法。36參數(shù)估計(jì)結(jié)果故借助統(tǒng)計(jì)軟件，得到下列參數(shù)估計(jì)由此得到回歸方程的估計(jì)表達(dá)式37線性回歸的模型檢驗(yàn)借助線性回歸的方差分析可以進(jìn)行模型檢驗(yàn)。首先線性回歸方程可以把因變量的總變異SS總分解為回歸平方和SS回歸和殘差平方和SS殘差。對(duì)應(yīng)的自由度為38線性回歸的模型檢驗(yàn)?zāi)Ｐ蜋z驗(yàn)的檢驗(yàn)假設(shè)H0:1=2=…=m=0H1:1，2，…，m

不全為0=0.05檢驗(yàn)統(tǒng)計(jì)量39線性回歸的模型檢驗(yàn)當(dāng)H0:1=2=…=m=0為真時(shí)，即：如果，可以拒絕H0，推斷1，2，…，m

不全為0。40線性回歸的模型檢驗(yàn)本例借助Stata軟件輸出結(jié)果得到：拒絕H0，故可以推斷1，2不全為041線性回歸模型的單個(gè)參數(shù)檢驗(yàn)單個(gè)回歸系數(shù)i的檢驗(yàn)表示其它m－1個(gè)自變量均在當(dāng)前回歸模型中的條件下，Xi的回歸系數(shù)i是否為0的統(tǒng)計(jì)檢驗(yàn)，具體方法如下：H0：i＝0H1：i0＝0.05檢驗(yàn)統(tǒng)計(jì)量42線性回歸模型的單個(gè)參數(shù)檢驗(yàn)其中bi是i的最小二乘估計(jì)(而且是無(wú)偏估計(jì))，是bi的標(biāo)準(zhǔn)誤，n為樣本量，m為模型中的自變量個(gè)數(shù)?？梢宰C明：當(dāng)H0：i＝0成立時(shí)，統(tǒng)計(jì)量服從自由度為n-m-1的t分布。即：i＝0為真時(shí)，對(duì)于1次隨機(jī)抽樣而言:出現(xiàn)的概率為0.05，故可拒絕無(wú)效假設(shè)H0：i＝0，并可以認(rèn)為i0。43線性回歸模型的單個(gè)參數(shù)檢驗(yàn)本例單個(gè)參數(shù)檢驗(yàn)結(jié)果總膽固醇(X1)上升1mmol/L，估計(jì)空腹血糖平均上升0.172mmol/L，差異有統(tǒng)計(jì)學(xué)意義。甘油三酯(X2)上升1mmol/L，估計(jì)空腹血糖平均上升0.318mmol/L，差異有統(tǒng)計(jì)學(xué)意義。44線性回歸模型舉例2為了研究0歲至8歲兒童身高增長(zhǎng)的規(guī)律，在某社區(qū)隨機(jī)抽樣，調(diào)查了20名男孩和20女孩的年齡和身高，男性取值為1，女性取值為0。試找出兒童身高的一般規(guī)律。定義身高為因變量Y，年齡為X1，性別為X245線性回歸模型舉例2的數(shù)據(jù)46線性回歸模型舉例2對(duì)于同一性別而言，兒童的平均身高與年齡通常呈線性增長(zhǎng)關(guān)系，但不同性別的兒童身高及其增長(zhǎng)速度有一定的差異，因此試圖用下列回歸方程表示不同性別的兒童身高與年齡的關(guān)系。47線性回歸模型舉例2方程對(duì)于女孩，代入方程，得到下列回歸方程1表示女孩的每年的平均身高增長(zhǎng)量，0表示女孩出生時(shí)的平均身高。對(duì)于男孩，代入方程，得到下列回歸方程48線性回歸模型舉例2男孩的每年的平均身高增長(zhǎng)量為1+3男孩出生時(shí)的平均身長(zhǎng)為0+2如果3=0，則男孩與女孩的每年的平均身高增長(zhǎng)量相同。如果2=0，則男孩與女孩出生時(shí)的平均身長(zhǎng)相同。49線性回歸模型舉例2借助Stata軟件輸入命令genx1x2=x1*x2產(chǎn)生x1*x2變量regyx1x2x1x2線性回歸分析50線性回歸模型2舉例由線性回歸的方差分析結(jié)果可以推斷：1，2，3不全為0，故可以認(rèn)為擬合該回歸模型是有統(tǒng)計(jì)學(xué)意義的。擬合回歸方程的主要評(píng)價(jià)指標(biāo)是決定系數(shù)R2R2表示因變量Y與自變量X1，┄，Xm

伴隨變化的變異成分占Y總變異的比例。51線性回歸模型2舉例本例的Stata輸出結(jié)果如下R2=0.9972，即：Y的99.72%的變異是與X1和X2伴隨變化的52線性回歸模型舉例2由此得到樣本估計(jì)的回歸方程女孩（X2=0）的身高回歸方程為女孩在出生時(shí)（X1=0）的平均身高約為64.6cm，身高平均每年增長(zhǎng)約為8cm，由1的P<0.0001，推斷差異有統(tǒng)計(jì)學(xué)意義。53線性回歸模型舉例2男孩（X2=1代入方程）的身高回歸方程為其中1+3的估計(jì)值為8.279，還應(yīng)檢驗(yàn)總體回歸系數(shù)之和1+3是否為0借助Stata軟件：testx1+x1x2=0，得到(1)x1+x1x2=0F(1,36)=6379.64Prob>F=0.0000，故有統(tǒng)計(jì)學(xué)意義。54線性回歸模型對(duì)資料的要求線性回歸要求資料滿足：殘差變異程度與任何一個(gè)自變量Xi沒(méi)有關(guān)聯(lián)性殘差變化與任何一個(gè)自變量Xi沒(méi)有任何伴隨趨勢(shì)。因變量觀察值之間獨(dú)立（從抽樣背景上考察）其中第1條和第2條要求是通過(guò)分別作殘差與每個(gè)自變量的散點(diǎn)圖進(jìn)行判別的。55線性回歸模型對(duì)資料的要求本例：用Stata命令計(jì)算殘差predicte,residualgraphex1,xlabelylabel散點(diǎn)圖顯示殘差與X1之間沒(méi)有明顯的伴隨趨勢(shì)56線性回歸模型對(duì)資料的要求graphex2,xlabelylabel殘差與x2的散點(diǎn)圖顯示沒(méi)有明顯的伴隨趨勢(shì)57舉例介紹應(yīng)用線性回歸進(jìn)行協(xié)方差分析例：為了評(píng)價(jià)缺鐵性貧血的兩種不同的療效，某研究者在預(yù)試驗(yàn)中收集了40名患者，隨機(jī)分為A組和B組，兩組的治療方案分別稱為A方案和B方案，A方案用分組變量X1=0表示，B方案用X1=1表示。經(jīng)過(guò)一個(gè)月治療后，治療前紅細(xì)胞數(shù)(萬(wàn)/l)和治療后的紅細(xì)胞增加數(shù)等如表20－8，記治療后的紅細(xì)胞增加數(shù)為Y，治療前的紅細(xì)胞數(shù)為X2，試評(píng)價(jià)兩種治療方案的療效差異。58協(xié)方差分析舉例數(shù)據(jù)59協(xié)方差分析舉例記治療后的紅細(xì)胞增加數(shù)Y的總體均數(shù)為，若不考慮治療前紅細(xì)胞數(shù)（稱為基線）對(duì)療效的影響，則可用下列回歸方程刻畫兩種治療方案的療效。A方案對(duì)應(yīng)X1=0方程，得到用A方案治療前后的紅細(xì)胞數(shù)改變量的總體均數(shù)為0，B方案對(duì)應(yīng)X1=1

代入方程，得到用B方案治療前后的紅細(xì)胞數(shù)改變量的總體均數(shù)為0＋1，因此兩種方案的療效差異的總體均數(shù)為1，本質(zhì)上就是一個(gè)成組t檢驗(yàn)。60協(xié)方差分析舉例由于治療后的紅細(xì)胞增加數(shù)往往與治療前的紅細(xì)胞數(shù)水平X2有關(guān)，一般需要校正治療前紅細(xì)胞數(shù)水平X2對(duì)治療后的紅細(xì)胞增加數(shù)的影響（稱為校正基線對(duì)結(jié)果的影響），故可用下列回歸方程61協(xié)方差分析舉例由方程A方案（X1=0）的紅細(xì)胞增加數(shù)的總體均數(shù)為B方案（X1=1）的紅細(xì)胞增加數(shù)的總體均數(shù)為兩種治療方案的紅細(xì)胞增加數(shù)的總體均數(shù)差值為62協(xié)方差分析舉例所以稱協(xié)方差模型中的1的估計(jì)和檢驗(yàn)是校正了基線后的兩種治療方案療效差異的統(tǒng)計(jì)推斷。借助Stata軟件：regyx1x2校正基線后，兩組均數(shù)差異為0.625，t=2.11，P=0.042<0.05差異有統(tǒng)計(jì)學(xué)意義。63協(xié)方差分析的意義未校正基線是比較兩條水平直線的高度差異是否為0，校正基線后是比較兩條非水平直線的平行距離是否為064線性回歸模型分析應(yīng)注意問(wèn)題由于自變量之間往往存在一定的相關(guān)性，甚至有可能出現(xiàn)多個(gè)自變量的共線問(wèn)題，以致回歸系數(shù)的估計(jì)出現(xiàn)較大誤差，甚至可能出現(xiàn)模型檢驗(yàn)是有統(tǒng)計(jì)學(xué)意義的，但每個(gè)回歸系數(shù)的單個(gè)系數(shù)檢驗(yàn)顯示差異無(wú)統(tǒng)計(jì)學(xué)意義，一般要通過(guò)篩選自變量或主成分方法解決。多個(gè)自變量共線一般用膨脹系數(shù)表述。65線性回歸模型分析應(yīng)注意問(wèn)題設(shè)自變量為，以Xi為自變量，其他m-1個(gè)變量為自變量做線性回歸，得到相應(yīng)的決定系數(shù)R2，由此計(jì)算Xi的膨脹系數(shù)如果存在某個(gè)VIFk>10，則可以認(rèn)為存在較嚴(yán)重的多元共線。如果遠(yuǎn)大于1，也可認(rèn)定多元共線。66自變量的篩選策略一般而言，自變量的篩選策略要根據(jù)研究問(wèn)題和研究背景，分析研究背景，選擇最合理的自變量進(jìn)入模型。例如：干預(yù)性研究，干預(yù)因素必須放入模型中，同時(shí)考慮哪些變量是對(duì)評(píng)價(jià)干預(yù)效果是有影響，并且要考慮這些因素能否對(duì)干預(yù)效果能否控制其混雜作用。例如：要考查不同自變量與因變量之間的直接關(guān)系與間接關(guān)系。67自變量的篩選策略舉例例：為了研究糖尿病患者的C反應(yīng)蛋白Y與年齡X1和體重指數(shù)X2的關(guān)系，某研究者調(diào)查了60名糖尿病患者，測(cè)量和收集了C反應(yīng)蛋白Y（mg/L）與年齡X1和體重指數(shù)X2，試分析C反應(yīng)蛋白與年齡和體重指數(shù)的關(guān)系。68自變量的篩選策略舉例的數(shù)據(jù)69自變量的篩選策略舉例考慮模型1考慮模型2考慮模型370自變量的篩選策略舉例模型1的擬合結(jié)果為模型2的擬合結(jié)果為71自變量的篩選策略舉例模型3的擬合結(jié)果3個(gè)模型結(jié)果綜述如下72自變量的篩選策略舉例討論模型1的結(jié)果雖然顯示X1的P<0.001，推斷Y與X1呈線性回歸關(guān)系，但當(dāng)模型中增加一個(gè)自變量x2時(shí)（即：模型3），則X1的P值大大增加，P=0.605，無(wú)統(tǒng)計(jì)學(xué)意義，回歸系數(shù)大幅度下降，而X2的P值<0.001，其回歸系數(shù)為0.233，比較模型中僅有一個(gè)自變量X2(模型2），其回歸系數(shù)為0.251，兩者相差很小，并且P值也<0.001，進(jìn)一步分析X1與X2的相關(guān)系數(shù)為0.702,P<0.001，故可以推斷模型1所得到的Y與X1的線性回歸關(guān)系實(shí)際上是X1與X2相關(guān)并且Y與X2的線性回歸關(guān)系而間接形成的。73逐步回歸如果作為探索性研究，對(duì)研究背景中的許多因素不太了解之間的關(guān)系，可以采用逐步回歸作為各種關(guān)系的初探，其意義為尋找影響Y的主要因素。一般而言，模型的參數(shù)越多，模型的擬合程度越好，殘差平方和就越小，但回歸系數(shù)的檢驗(yàn)效能就越低，另外過(guò)多的參數(shù)會(huì)導(dǎo)致內(nèi)部符合程度很好但外部的預(yù)測(cè)誤差會(huì)很大，所以從外部預(yù)測(cè)誤差和統(tǒng)計(jì)檢驗(yàn)的效能角度，希望在基本相同的擬合程度情況下，參數(shù)越少越好。74逐步回歸逐步回歸的基本準(zhǔn)則是在滿足模型中的所有自變量的回歸系數(shù)的P值均小于前提下，盡可能地使模型中引入的自變量個(gè)數(shù)達(dá)到最多。嚴(yán)格地講：逐步回歸可以分為前進(jìn)法(forward)，后退法(Backward)，逐步前進(jìn)法(stepwiseforward)和逐步后退法(stepwisebackward)。75逐步回歸前進(jìn)法：從未進(jìn)入模型的自變量中挑選一個(gè)自變量進(jìn)入模型，要求進(jìn)入模型時(shí)，該自變量回歸系數(shù)P值<并且比其他為進(jìn)入模型的自變量的P值都小，每次只挑選一個(gè)自變量進(jìn)入模型，直到在沒(méi)有進(jìn)入模型的自變量的P值（如果該變量進(jìn)入模型）>為止。76逐步回歸后退法：將所有待選的自變量全部進(jìn)入模型，如果存在P值>的自變量，則挑選P值最大的自變量剔除模型中，然后再擬合模型，如果還存在P值>的自變量，則繼續(xù)剔除P值最大的自變量，直到模型中所有自變量的P值均<為止。77逐步回歸逐步前進(jìn)法：在前進(jìn)法的基礎(chǔ)上，每引入一個(gè)自變量，還需考察引入后模型中是否存在自變量>，如果存在某些自變量的P值>，則挑選P值最大的自變量剔除，然后再考察是否還存在自變量的P值>，如果還存在繼續(xù)按照這個(gè)準(zhǔn)則剔除，直到模型中的自變量的P均小于，然后在從待選自變量中挑選P值最小并且P<的自變量引入模型，依次循環(huán)，直至既沒(méi)有變量可以引入模型，也沒(méi)有變量可以剔除模型為止。78逐步回歸逐步后退法：在后退法的基礎(chǔ)上，每剔除一個(gè)自變量，考察一下未進(jìn)入模型的自變量中有沒(méi)有自變量滿足P<，在P<的自變量中挑選P值最小的自變量進(jìn)入模型，直至沒(méi)有自變量可以進(jìn)入模型后，繼續(xù)在模型中挑選P值最大并且P>的自變量剔除，依次循環(huán)，直至既沒(méi)有自變量可以剔除，也沒(méi)有自變量可以引入為止。79逐步回歸舉例例：為了研究影響糖尿病患者糖化血紅蛋白（HbA1c）的主要危險(xiǎn)因素，某研究者調(diào)查了某醫(yī)院內(nèi)分泌門診的200名糖尿病患者的糖化血紅蛋白，年齡，

人人文庫(kù)> 全部分類> 教育資料 > 輔導(dǎo)培訓(xùn)

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

多因素線性回歸

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

多因素線性回歸

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔