Logistic回歸分析及應(yīng)用_第1頁(yè)
Logistic回歸分析及應(yīng)用_第2頁(yè)
Logistic回歸分析及應(yīng)用_第3頁(yè)
Logistic回歸分析及應(yīng)用_第4頁(yè)
Logistic回歸分析及應(yīng)用_第5頁(yè)
已閱讀5頁(yè),還剩71頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第十六章Logistic回歸分析

Logisticregression1整理ppt復(fù)習(xí)多元線性回歸

(multiplelinearregression)在醫(yī)學(xué)實(shí)踐中,常會(huì)遇到一個(gè)應(yīng)變量與多個(gè)自變量數(shù)量關(guān)系的問(wèn)題。如醫(yī)院住院人數(shù)不僅與門(mén)診人數(shù)有關(guān),而且可能與病床周轉(zhuǎn)次數(shù),床位數(shù)等有關(guān);兒童的身高不僅與遺傳有關(guān)還與生活質(zhì)量,性別,地區(qū),國(guó)別等有關(guān);人的體外表積與體重、身高等有關(guān)。2整理ppt表1多元線性回歸分析的數(shù)據(jù)結(jié)構(gòu)實(shí)驗(yàn)對(duì)象yX1X2X3….XP

1y1a11a12a13…a1p

2y2a21a22a23…a2p

3y3a31a32a33…a3p

nynan1an2an3…anp

━━━━━━━━━━━━━━━━━━其中:y取值是服從正態(tài)分布3整理ppt多元線性回歸模型通過(guò)實(shí)驗(yàn)測(cè)得含有p個(gè)自變量x1,x2,x3,…,xp及一個(gè)因變量y的n個(gè)觀察對(duì)象值,利用最小二乘法原理,建立多元線性回歸模型:其中b0為截距,b1,b2…bp稱(chēng)為偏回歸系數(shù).bi表示當(dāng)將其它p-1個(gè)變量的作用加以固定后,Xi改變1個(gè)單位時(shí)Y將改變bi個(gè)單位.4整理pptlogisticregressionanalysisLogistic回歸分析及其應(yīng)用5整理ppt〔一〕根本概念和原理

1.應(yīng)用背景

Logistic回歸模型是一種概率模型,適合于病例—對(duì)照研究、隨訪研究和橫斷面研究,且結(jié)果發(fā)生的變量取值必須是二分的或多項(xiàng)分類(lèi)??捎糜绊懡Y(jié)果變量發(fā)生的因素為自變量與因變量,建立回歸方程。6整理ppt

設(shè)資料中有一個(gè)因變量y、p個(gè)自變量x1,x2,…,xp,對(duì)每個(gè)實(shí)驗(yàn)對(duì)象共有n次觀測(cè)結(jié)果,可將原始資料列成表2形式。2、Logistic回歸模型的數(shù)據(jù)結(jié)構(gòu)7整理ppt表2Logistic回歸模型的數(shù)據(jù)結(jié)構(gòu)實(shí)驗(yàn)對(duì)象yX1X2X3….XP

1y1a11a12a13…a1p

2y2a21a22a23…a2p

3y3a31a32a33…a3p

nynan1an2an3…anp

━━━━━━━━━━━━━━━━━━其中:y取值是二值或多項(xiàng)分類(lèi)8整理ppt

表3肺癌與危險(xiǎn)因素的調(diào)查分析例號(hào)是否患病性別吸煙年齡地區(qū)111030021014613000351………………30000261

注:是否患病中,‘0’代表否,‘1’代表是。性別中‘1’代表男,‘0’代表女,吸煙中‘1’代表吸煙,‘0’代表不吸煙。地區(qū)中,‘1’代表農(nóng)村,‘0’代表城市。

9整理ppt

表4配對(duì)資料(1:1)對(duì)子號(hào)病例對(duì)照x1x2x3x1x2x3113010120311303012020…10222000注:X1蛋白質(zhì)攝入量,取值:0,1,2,3X2不良飲食習(xí)慣,取值:0,1,2,3X3精神狀況,取值:0,1,2

10整理pptLogistic回歸

--Logistic回歸與多重線性回歸聯(lián)系與區(qū)別聯(lián)系:

用于分析多個(gè)自變量與一個(gè)因變量的關(guān)系,目的是矯正混雜因素、篩選自變量和更精確地對(duì)因變量作預(yù)測(cè)等。區(qū)別:

線性模型中因變量為連續(xù)性隨機(jī)變量,且要求呈正態(tài)分布.Logistic回歸因變量的取值僅有兩個(gè),不滿(mǎn)足正態(tài)分布。11整理ppt3、Logistic回歸模型令:y=1發(fā)病〔陽(yáng)性、死亡、治愈等〕y=0未發(fā)病〔陰性、生存、未治愈等〕將發(fā)病的概率記為P,它與自變量x1,x2,…,xp之間的Logistic回歸模型為:可知,不發(fā)病的概率為:

12整理ppt

經(jīng)數(shù)學(xué)變換得:定義:為L(zhǎng)ogistic變換,即:

13整理ppt

4、回歸系數(shù)βi的意義流行病學(xué)的常用指標(biāo)優(yōu)勢(shì)比〔oddsratio,OR)或稱(chēng)比數(shù)比,定義為:暴露人群發(fā)病優(yōu)勢(shì)與非暴露人群發(fā)病優(yōu)勢(shì)之比。即Xi的優(yōu)勢(shì)比為:14整理ppt故對(duì)于樣本資料OR=exp()95%置信區(qū)間為:可見(jiàn)是影響因素Xi增加一個(gè)單位所引起的對(duì)數(shù)優(yōu)勢(shì)的增量,反映了其對(duì)Y作用大小。如果要比較不同因素對(duì)Y作用大小,需要消除變量量綱的影響,為此計(jì)算標(biāo)準(zhǔn)化回歸系數(shù)15整理ppt5.假設(shè)檢驗(yàn)〔1〕回歸方程的假設(shè)檢驗(yàn)H0:所有H1:某個(gè)計(jì)算統(tǒng)計(jì)量為:G=-2lnL,服從自由度等于n-p的分布〔2〕回歸系數(shù)的假設(shè)檢驗(yàn)H0:H1:計(jì)算統(tǒng)計(jì)量為:Wald,自由度等于1。16整理ppt〔二〕Logistic回歸類(lèi)型及其實(shí)例分析

1、非條件Logistic回歸當(dāng)研究設(shè)計(jì)為隊(duì)列研究、橫斷面研究或成組病例對(duì)照研究時(shí),可以用非條件Logistic回歸。17整理ppt實(shí)例1

某研討究者調(diào)查了30名成年人,記錄了同肺癌發(fā)病的有關(guān)因素情況,數(shù)據(jù)見(jiàn)表4。其中是否患病中,‘0’代表否,‘1’代表是;性別中‘1’代表男,‘0’代表女;吸煙中‘1’代表吸煙,‘0’代表不吸煙;地區(qū)中,‘1’代表農(nóng)村,‘0’代表城市。試分析各因素與肺癌間的關(guān)系。18整理ppt表5肺癌與危險(xiǎn)因素的調(diào)查分析例號(hào)是否患病性別吸煙年齡地區(qū)111030021014613000351………………30000261注:是否患病中,‘0’代表否,‘1’代表是。性別中‘1’代表男,‘0’代表女,吸煙中‘1’代表吸煙,‘0’代表不吸煙。地區(qū)中,‘1’代表農(nóng)村,‘0’代表城市。19整理pptSPSS操作步驟:Analyze-----Regression-----BinaryLogistic-----Dependent框(y)-----Covariates框〔x1,x2,…)------ok非條件Logistic回歸

SPSS操作步驟:20整理ppt21整理ppt22整理ppt結(jié)果說(shuō)明,性別,吸煙,年齡三個(gè)因素都與肺癌有關(guān).由于在對(duì)某一因素進(jìn)行單因素分析時(shí)沒(méi)有控制其它因素的干擾,因此結(jié)果不可靠.單因素分析的結(jié)果23整理ppt多因素分析的結(jié)果24整理ppt25整理ppt

由上最大似然估計(jì)分析知因素X2(吸煙),X3(年齡)對(duì)肺癌的發(fā)生有影響。所得的回歸方程為:Logit(P)=-9.7544+2.5152X1+3.9849X2+0.1884X3-1.3037X4.26整理ppt2.條件logistic回歸分析配對(duì)設(shè)計(jì)的類(lèi)型:1:1、1:m、n:m〔可采用分層COX模型來(lái)擬合〕。例如:某市調(diào)查三種生活因素與胃癌的關(guān)系,資料見(jiàn)表5。27整理ppt表6配對(duì)資料(1:1)對(duì)子號(hào)病例對(duì)照x1x2x3x1x2x3113010120311303012020…10222000注:X1蛋白質(zhì)攝入量,取值:0,1,2,3X2不良飲食習(xí)慣,取值:0,1,2,3X3精神狀況,取值:0,1,228整理ppt配對(duì)Logistic回歸SPSS操作步驟:Analyze-----Survival----COXRegression-----Time框〔outcome)-----Status框〔Status〕-----DefineEvent:Singlevalue1:continue-----Covariates框〔x1、x2、x3)-----Strata框〔id〕---Options---atlaststep------ok29整理ppt30整理ppt31整理ppt32整理ppt33整理ppt34整理ppt35整理ppt36整理ppt3、逐步Logistic回歸分析〔1〕向前法(forwardselection)開(kāi)始方程中沒(méi)有變量,自變量由少到多一個(gè)一個(gè)引入回歸方程。按自變量對(duì)因變量的奉獻(xiàn)〔P值的大小〕由小到大依次挑選,變量入選的條件是其P值小于規(guī)定進(jìn)入方程的P界值Enter,缺省值P(0.05)。37整理ppt〔2〕后退法(backwardselection)開(kāi)始變量都在方程中,然后按自變量因變量的奉獻(xiàn)〔P值的大小〕由大到小依次剔除,變量剔除的條件是其P值小于規(guī)定的剔除標(biāo)準(zhǔn)Remove,缺省值p(0.10)。

38整理ppt〔3〕逐步回歸法

逐步引入-剔除法〔stepwiseselection)

前進(jìn)逐步引入-剔除法是在前進(jìn)法的思想下,考慮剔除變量,因此有兩個(gè)p界值Enter,Remove。39整理ppt

無(wú)論是條件還是非條件Logistic回歸,在多變量分析時(shí)均可以采用逐步回歸方法,實(shí)現(xiàn)的方法是:在model后加選項(xiàng):/selection=forward、backward或stepwise再給出SLE,SLS的界值。調(diào)試法:P從大到小取值0.5,0.1,0.05…,一般實(shí)際用時(shí),SLE,SLS應(yīng)屢次選取調(diào)整40整理ppt解釋設(shè)第i個(gè)因素的回歸系數(shù)為bi,表示當(dāng)有多個(gè)自變量存在時(shí),其它自變量固定不變的情況下,自變量Xi每增加一個(gè)單位時(shí),所得到的優(yōu)勢(shì)比的自然對(duì)數(shù)。也就是其它自變量固定不變的情況下,自變量Xi每增加一個(gè)單位時(shí),影響因變量Y=0發(fā)生的倍數(shù)。當(dāng)bi>0時(shí),對(duì)應(yīng)的優(yōu)勢(shì)比(oddsratio,記為ORi〕:ORi=exp(bi)>1,說(shuō)明該因素是危險(xiǎn)因素;當(dāng)bi<0時(shí),對(duì)應(yīng)的優(yōu)勢(shì)比ORi=exp(bi)<1,說(shuō)明該因素是保護(hù)因素。

41整理ppt

在本例中不良飲食習(xí)慣X2,取值:0、1,2、3,b=1.2218,OR=3.393,表示不良飲食習(xí)慣是危險(xiǎn)因素;精神狀況X3,取值:0、1、2,b=2.2947,OR=9.922,表示精神狀況是危險(xiǎn)因素。42整理pptSPSS無(wú)論是條件還是非條件Logistic回歸,在多變量分析時(shí)均可以采用逐步回歸方法,實(shí)現(xiàn)的方法是:在method后加選項(xiàng):Enter:所有變量一次全部進(jìn)入方程。Forward:逐步向前法Backward:后退法變量移出方程所采取的檢驗(yàn)方法:Conditional;LR;Ward(盡量不用)43整理ppt44整理ppt二分類(lèi)Logistic回歸method中文名稱(chēng)剔除依據(jù)Enter全部進(jìn)入Forward:conditional向前逐步條件參數(shù)估計(jì)似然比Forward:LR向前逐步最大偏似然估計(jì)似然比Forward:Wald向前逐步Wald統(tǒng)計(jì)量Backward:conditional向后逐步條件參數(shù)估計(jì)似然比Backward:LR向后逐步最大偏似然估計(jì)似然比Backward:Wald向后逐步Wald統(tǒng)計(jì)量45整理pptSPSS軟件實(shí)現(xiàn)方法File→Open→相應(yīng)數(shù)據(jù)(已存在)→Analyze→Regression→BinaryLogistic→Dependent(y)→Covariates(自變量〕→Mothod〔逐步回歸方法〕→Specifymodel(單因素或多因素〕→save(欲保存的內(nèi)容〕→Options(輸出選項(xiàng)〕→OK46整理ppt調(diào)試法:P從大到小取值0.5,0.1,0.05…,一般實(shí)際用時(shí),Enter、Remove應(yīng)屢次選取調(diào)整47整理pptBlock1:Method=ForwardStepwise(LikelihoodRatio)48整理ppt49整理ppt50整理ppt51整理ppt52整理ppt53整理ppt4.Logistic回歸--Logistic回歸種類(lèi)成組資料的非條件Logistic回歸配對(duì)資料的條件Logistic回歸兩分類(lèi)反應(yīng)變量的Logistic回歸多分類(lèi)有序反應(yīng)變量Logistic回歸多分類(lèi)無(wú)序反應(yīng)變量Logistic回歸1:1配對(duì)資料的條件Logistic回歸1:m配對(duì)資料的條件Logistic回歸n:m配對(duì)資料的條件Logistic回歸Logistic回歸分析54整理ppt對(duì)于成組資料的非條件Logistic回歸〔1〕兩分類(lèi)反響變量的Logistic回歸55整理ppt56整理ppt自變量分為以下情況:定量資料時(shí),直接計(jì)算;二值時(shí),化為0與1或1與2;有序多分類(lèi):有線性規(guī)律時(shí)連續(xù)賦值0,1,2,….無(wú)線性規(guī)律按無(wú)序多分類(lèi)無(wú)序多分類(lèi):需要先轉(zhuǎn)換成n-1個(gè)啞變量,以啞變量進(jìn)行分析。

57整理ppt58整理ppt59整理ppt60整理ppt61整理ppt二分類(lèi)Logistic回歸—多重比較的方法Indicator—第一類(lèi)或最后一類(lèi)為參照類(lèi),每一類(lèi)與參照類(lèi)比較Simple------除參照類(lèi)外,每一類(lèi)與參照類(lèi)比較Difference-除第一類(lèi)外,每一類(lèi)與其前各類(lèi)的平均效應(yīng)比較,有稱(chēng)反HelmertHelmert----除最后一類(lèi)外,每一類(lèi)與其后各類(lèi)的平均Repeated—相鄰兩類(lèi)比較,除第一類(lèi)外,每類(lèi)與其前一比較Polynominal—正交多名義分類(lèi)比較,該法假設(shè)每一分類(lèi)都有相等的空間,僅適于數(shù)值變量Deviation—除參照類(lèi)外,每一類(lèi)與總效應(yīng)比較62整理ppt63整理ppt64整理ppt〔2〕多分類(lèi)無(wú)序反響變量Logistic回歸*65整理ppt66整理ppt〔3〕多分類(lèi)有序反響變量Logistic回歸*67整理ppt68整理ppt練習(xí)據(jù)報(bào)道目前全世界每年的自殺率為10/10萬(wàn),我國(guó)自殺率為23/10萬(wàn),我國(guó)高校自殺率那么為2/10萬(wàn)。為了了解當(dāng)代大學(xué)生綜合素質(zhì)現(xiàn)狀、為了進(jìn)行提高大學(xué)生綜合素質(zhì)的對(duì)策研究,利用中國(guó)現(xiàn)場(chǎng)統(tǒng)計(jì)研究會(huì)教育統(tǒng)計(jì)與管理專(zhuān)業(yè)學(xué)會(huì)設(shè)計(jì)的?中國(guó)大學(xué)生綜合素質(zhì)調(diào)查問(wèn)卷?,采用分層整群抽樣,選擇了不同年級(jí)、不同性別、不同專(zhuān)業(yè)以及不同生源的醫(yī)學(xué)大學(xué)生554名的調(diào)查問(wèn)卷,其中129人有過(guò)自殺的意念。應(yīng)用Logistic回歸分析,探討大學(xué)生有自殺意念的影響因素。69整理ppt部隊(duì)3所院校,1121份有效問(wèn)卷、

地方3所院校1874份有效問(wèn)卷。

表8各校有效問(wèn)卷情況單位有效問(wèn)卷份數(shù)軍隊(duì):北京軍醫(yī)學(xué)院554海軍工程大學(xué)450解放軍信息工程大學(xué)117地方:同濟(jì)醫(yī)學(xué)院778中國(guó)科技大學(xué)628廣西工學(xué)院46870整理ppt1.各工程的名稱(chēng)及量化方法在?中國(guó)大學(xué)生綜合素質(zhì)調(diào)查問(wèn)卷?中又增加的2個(gè)小題記為A01,A02。根本情況A共有21項(xiàng),分別記為A1,A2,…,A21。當(dāng)有的工程中又分為2項(xiàng)時(shí)再分別賦予不同的名稱(chēng),如A10父母親文化程度分為:父親文化程度A10.1、母親文化程度A10.2。其它工程的名稱(chēng)以此類(lèi)推。71整理ppt利用EXCEL將調(diào)查問(wèn)卷各項(xiàng)進(jìn)行量化:有序的工程按照順序賦值0,1,2,……;兩分類(lèi)無(wú)序工程賦

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論