Logistic回歸分析(重點、難點).ppt_第1頁
Logistic回歸分析(重點、難點).ppt_第2頁
Logistic回歸分析(重點、難點).ppt_第3頁
Logistic回歸分析(重點、難點).ppt_第4頁
Logistic回歸分析(重點、難點).ppt_第5頁
已閱讀5頁,還剩60頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、第三軍醫(yī)大學(xué)軍事預(yù)防醫(yī)學(xué)院衛(wèi)生統(tǒng)計學(xué)教研室Department of Health statistics ,TMMU Tel:68752343授課對象:2010級研究生 任課教員:張彥琦 講師,醫(yī)學(xué)統(tǒng)計學(xué) Medical Statistics,第十六章 Logistic回歸分析 Logistic Regression Analysis,Department ofHealth Statistics,衛(wèi)生統(tǒng)計學(xué)教研室 張彥琦,第一節(jié) 非條件Logistic回歸分析,第二節(jié) 條件Logistic回歸分析,教學(xué)內(nèi)容,第三節(jié) Logistic回歸分析的應(yīng)用 及注意事項,流行病學(xué)

2、概念回顧,Department ofHealth Statistics,衛(wèi)生統(tǒng)計學(xué)教研室 張彥琦,掌握,了解,1. Logistic回歸參數(shù)估計的基本思想 2. Logistic回歸系數(shù)的假設(shè)檢驗和區(qū)間估計方法,教學(xué)目標(biāo),1. Logistic回歸分析結(jié)果及解釋 2. Logistic回歸變量篩選方法 3. Logistic回歸系數(shù)的流行病學(xué)意義 4. Logistic回歸的應(yīng)用及注意事項,理解,非條件Logistic回歸和條件Logistic回歸的區(qū)別,幾個重要的流行病學(xué)概念,Department ofHealth Statistics,衛(wèi)生統(tǒng)計學(xué)教研室 張彥琦,病因分析(預(yù)后分析)的目的:

3、找出影響疾病發(fā)生(或預(yù)后好壞)的影響因素及其影響的強度。 如果某因素對疾病發(fā)生有影響,就稱該因素與疾病的發(fā)生有關(guān)聯(lián),關(guān)聯(lián)的強度則反映其對疾病發(fā)生影響的大小。,Department ofHealth Statistics,衛(wèi)生統(tǒng)計學(xué)教研室 張彥琦,幾個重要的流行病學(xué)概念,隊列研究(cohort study) 病例對照研究(case-control study) 危險度(risk) 相對危險度(relative risk, RR) 比數(shù)比或優(yōu)勢比(odds ratio, OR),Department ofHealth Statistics,衛(wèi)生統(tǒng)計學(xué)教研室 張彥琦,隊列研究,隊列研究(cohort

4、 study) :對“因”分類上的人群作追蹤隨訪,觀察其“果”,然后對資料進行比較分析,從而判斷“因”與“果”之間有無關(guān)聯(lián)及關(guān)聯(lián)的強度。,Department ofHealth Statistics,衛(wèi)生統(tǒng)計學(xué)教研室 張彥琦,病例對照研究,病例對照研究(case-control study):是對“果”分類上的人群作回顧性調(diào)查,觀察其“因”,然后對資料進行比較分析,從而判斷“果”與“因”間關(guān)聯(lián)有無統(tǒng)計學(xué)意義及關(guān)聯(lián)的強度。,Department ofHealth Statistics,衛(wèi)生統(tǒng)計學(xué)教研室 張彥琦,危險度,危險度( risk) :通常指某個不幸事件發(fā)生的概率。危險度大表示發(fā)生的可能性

5、大。,某病發(fā)病危險度:觀察對象在觀察期間內(nèi)發(fā)生某病的概率,即某病發(fā)病率。,Department ofHealth Statistics,衛(wèi)生統(tǒng)計學(xué)教研室 張彥琦,相對危險度,RR1:表示該因素為危險因素,使發(fā)病危險度增大。 RR1:表示該因素為保護因素,使發(fā)病危險度減小。 RR=1:表示該因素對疾病的發(fā)病無影響。,相對危險度(relative risk, RR) :暴露于某種危險因子的發(fā)病率 pe 與不暴露于該種危險因子的發(fā)病率 p0 之比。,Department ofHealth Statistics,衛(wèi)生統(tǒng)計學(xué)教研室 張彥琦,相對危險度,病例對照研究一般不能計算RR。,Department

6、 ofHealth Statistics,衛(wèi)生統(tǒng)計學(xué)教研室 張彥琦,比數(shù)(odds):發(fā)生率與未發(fā)生率之比,即 p/(1-p) ,即陽性率/陰性率。 比數(shù)比(odds ratio, OR) :兩個比數(shù)之比, 即 ,通常在流行病研究中 p1為病例組的暴露率,p2為對照組的暴露率。,比數(shù)比,對發(fā)病率較低的疾病,一般有RROR,Department ofHealth Statistics,衛(wèi)生統(tǒng)計學(xué)教研室 張彥琦,比數(shù)比,(對發(fā)病率較低的疾病),病例對照研究一般用OR替代RR。,Department ofHealth Statistics,衛(wèi)生統(tǒng)計學(xué)教研室 張彥琦,一個病例對照研究資料,OR,Dep

7、artment ofHealth Statistics,衛(wèi)生統(tǒng)計學(xué)教研室 張彥琦,醫(yī)學(xué)研究中常碰到應(yīng)變量的可能取值僅有兩個(即二分類變量),如發(fā)病與未發(fā)病、陽性與陰性、死亡與生存、治愈與未治愈、暴露與未暴露等,顯然這類資料不滿足多重回歸的條件。,什么情況下采用Logistic回歸,Department ofHealth Statistics,衛(wèi)生統(tǒng)計學(xué)教研室 張彥琦,目的:作出以多個自變量(危險因素)估計應(yīng)變量(結(jié)果因素)的logistic回歸方程。屬于概率型非線性回歸。 資料:1. 應(yīng)變量為反映某現(xiàn)象發(fā)生與不發(fā)生的二值變量; 2. 自變量宜全部或大部分為分類變量,可有少數(shù)數(shù)值變量。分類變量要

8、數(shù)量化。,什么情況下采用Logistic回歸,Department ofHealth Statistics,衛(wèi)生統(tǒng)計學(xué)教研室 張彥琦,用途:研究某種疾病或現(xiàn)象發(fā)生和多個危險因素(或保護因子)的數(shù)量關(guān)系。 用 檢驗(或u檢驗)的局限性: 1.只能研究1個危險因素; 2.只能得出定性結(jié)論。,什么情況下采用Logistic回歸,Department ofHealth Statistics,衛(wèi)生統(tǒng)計學(xué)教研室 張彥琦,種類: 1. 成組(非條件)logistic回歸方程。 2. 配對(條件)logistic回歸方程。,什么情況下采用Logistic回歸,第一節(jié) Logistic回歸分析 Logistic

9、 Regression,Department ofHealth Statistics,衛(wèi)生統(tǒng)計學(xué)教研室 張彥琦,實例,表16-1 膀胱癌患者及對照吸煙史資料,Department ofHealth Statistics,衛(wèi)生統(tǒng)計學(xué)教研室 張彥琦,例16-2 為了探討冠心病發(fā)生的有關(guān)危險因素,對26例冠心病病人和28例對照者進行病例對照研究,調(diào)查記錄了8個可能的危險因素,試用Logistic逐步回歸分析方法篩選危險因素,并分析各自變量的作用大小。,實例,Department ofHealth Statistics,衛(wèi)生統(tǒng)計學(xué)教研室 張彥琦,表16-2 冠心病8個可能的危險因素與編碼說明,實例,D

10、epartment ofHealth Statistics,衛(wèi)生統(tǒng)計學(xué)教研室 張彥琦,實例,表16-3 冠心病危險因素病例對照研究原始數(shù)據(jù),Department ofHealth Statistics,衛(wèi)生統(tǒng)計學(xué)教研室 張彥琦,Logistic回歸模型,在m個自變量的作用下陽性結(jié)果發(fā)生的概率記作:,Department ofHealth Statistics,衛(wèi)生統(tǒng)計學(xué)教研室 張彥琦,Logistic回歸模型,這就擺脫了二值反應(yīng)變量在一般線性回歸分析中可能出現(xiàn)的應(yīng)變量值域的窘境。,Department ofHealth Statistics,衛(wèi)生統(tǒng)計學(xué)教研室 張彥琦,Logistic曲線,De

11、partment ofHealth Statistics,衛(wèi)生統(tǒng)計學(xué)教研室 張彥琦,常數(shù)項: 表示暴露劑量 為0時個體發(fā)病與不發(fā)病概率之比的自然對數(shù)。 回歸系數(shù): 表示自變量 改變一個單位時Logit(P )的改變量。,模型參數(shù)的意義,Logistic模型還有另一種線性化表達形式,稱為Logit模型:,Department ofHealth Statistics,衛(wèi)生統(tǒng)計學(xué)教研室 張彥琦,流行病學(xué)衡量危險因素作用大小的比數(shù)比指標(biāo)。計算公式為:,模型參數(shù)的意義,Department ofHealth Statistics,衛(wèi)生統(tǒng)計學(xué)教研室 張彥琦,模型參數(shù)的意義,j 表示 ORj 的自然對數(shù)值。

12、,Department ofHealth Statistics,衛(wèi)生統(tǒng)計學(xué)教研室 張彥琦,模型參數(shù)的意義,Department ofHealth Statistics,衛(wèi)生統(tǒng)計學(xué)教研室 張彥琦,模型參數(shù)的意義,Department ofHealth Statistics,衛(wèi)生統(tǒng)計學(xué)教研室 張彥琦,logistic回歸模型的參數(shù)估計,原理:最大似然( likelihood )估計,Department ofHealth Statistics,衛(wèi)生統(tǒng)計學(xué)教研室 張彥琦,可反映某一因素兩個不同水平(c1,c0)的優(yōu)勢比。,logistic回歸模型的參數(shù)估計,Department ofHealth S

13、tatistics,衛(wèi)生統(tǒng)計學(xué)教研室 張彥琦,logistic回歸模型的假設(shè)檢驗,2.,1.似然比檢驗: -2lnL近似服從 分布 G = 2(lnL1-lnL0)= 2ln(L1/L0) =p-l,Department ofHealth Statistics,衛(wèi)生統(tǒng)計學(xué)教研室 張彥琦,標(biāo)準(zhǔn)化回歸系數(shù),標(biāo)準(zhǔn)化回歸系數(shù)絕對值越大,說明相應(yīng)變量的作用越大.,Department ofHealth Statistics,衛(wèi)生統(tǒng)計學(xué)教研室 張彥琦,實例分析,Department ofHealth Statistics,衛(wèi)生統(tǒng)計學(xué)教研室 張彥琦,數(shù)據(jù)準(zhǔn)備成3列:例數(shù)、吸煙史(1:有,0:無),膀胱癌(1

14、:有,0:無),實例分析,Department ofHealth Statistics,衛(wèi)生統(tǒng)計學(xué)教研室 張彥琦,Data Weight cases,實例分析,Department ofHealth Statistics,衛(wèi)生統(tǒng)計學(xué)教研室 張彥琦,Analyze Regression Binary Logistic,實例分析,Department ofHealth Statistics,衛(wèi)生統(tǒng)計學(xué)教研室 張彥琦,應(yīng)變量編碼,模型擬合結(jié)果,實例分析,Department ofHealth Statistics,衛(wèi)生統(tǒng)計學(xué)教研室 張彥琦,方法:前進法、后退法和逐步法。檢驗統(tǒng)計量:不是 F 統(tǒng)計量,

15、而是似然比統(tǒng)計量、 Wald 統(tǒng)計量和計分統(tǒng)計量之一。,變量的篩選,Department ofHealth Statistics,衛(wèi)生統(tǒng)計學(xué)教研室 張彥琦,變量的篩選,例16-2 為了探討冠心病發(fā)生的有關(guān)危險因素,對26例冠心病病人和28例對照者進行病例對照研究,調(diào)查記錄了8個可能的危險因素,試用Logistic逐步回歸分析方法篩選危險因素,并分析各自變量的作用大小。,Department ofHealth Statistics,衛(wèi)生統(tǒng)計學(xué)教研室 張彥琦,表16-2 冠心病8個可能的危險因素與編碼說明,實例分析,Department ofHealth Statistics,衛(wèi)生統(tǒng)計學(xué)教研室 張

16、彥琦,實例分析,表16-3 冠心病危險因素病例對照研究原始數(shù)據(jù),Department ofHealth Statistics,衛(wèi)生統(tǒng)計學(xué)教研室 張彥琦,由標(biāo)準(zhǔn)化回歸系數(shù)可以看出,選入的四個危險因素按其影響大小排列的順序為X6、X8、X5、X1, 它們分別是動物脂肪攝入量、A型性格、高血脂史和年齡增高。,實例分析,第二節(jié) 條件Logistic回歸分析Conditional Logistic Regression,Department ofHealth Statistics,衛(wèi)生統(tǒng)計學(xué)教研室 張彥琦,條件Logistic回歸的原理,條件Logistic回歸(conditional Logistic

17、 regression)是針對配對或分層資料分析的一種方法。 為了控制一些重要的混雜因素(如性別和年齡等),流行病學(xué)常采用1:M配對的研究方法,即每一個病例與M個與它條件相一致的對照形成一個匹配組(每一匹配組為一個層)。 條件Logistic回歸,其實質(zhì)是在構(gòu)造似然函數(shù)時利用適當(dāng)?shù)臈l件分布,實現(xiàn)在各層中進行比較。,Department ofHealth Statistics,衛(wèi)生統(tǒng)計學(xué)教研室 張彥琦,表16-5 1: M 條件logistic回歸數(shù)據(jù)的格式,* t = 0 為病例,其他為對照,1:M數(shù)據(jù)格式,Department ofHealth Statistics,衛(wèi)生統(tǒng)計學(xué)教研室 張彥琦

18、,條件Logistic回歸模型,Department ofHealth Statistics,衛(wèi)生統(tǒng)計學(xué)教研室 張彥琦,實例分析,例16-3 某市調(diào)查三種生活方式與胃癌發(fā)病的關(guān)系,采用1:1配對的病例對照研究形式。按每個病例的性別、年齡和居住地選取一個健康作為對照。調(diào)查的三種生活方式取值見表16-7,共調(diào)查了50對病例與對照。試作條件Logistic逐步回歸分析。,表16-7 三種生活方式取值,Department ofHealth Statistics,衛(wèi)生統(tǒng)計學(xué)教研室 張彥琦,數(shù)據(jù)準(zhǔn)備成4列:X1、X2、X3,配對號及疾病發(fā)生情況Y(1:病例,0:對照)。,實例分析,Department

19、ofHealth Statistics,衛(wèi)生統(tǒng)計學(xué)教研室 張彥琦,模型擬合結(jié)果,顯然,存在不顯著的變量,可以進行逐步回歸分析。,實例分析,Department ofHealth Statistics,衛(wèi)生統(tǒng)計學(xué)教研室 張彥琦,實例分析,第三節(jié) Logistic回歸的應(yīng)用 及注意事項,Department ofHealth Statistics,衛(wèi)生統(tǒng)計學(xué)教研室 張彥琦,logistic回歸分析的特點之一是參數(shù)意義清楚,即得到某一因素的回歸系數(shù)后,可以很快估計出這一因素在不同水平下的優(yōu)勢比OR或近似相對危險度RR,因此非常適合于流行病學(xué)研究。 logistic回歸既適合于隊列研究(cohort

20、study),也適合于病例-對照研究(case-control study),同樣還可以用于橫斷面研究(cross-sectional study),logistic回歸的應(yīng)用,Department ofHealth Statistics,衛(wèi)生統(tǒng)計學(xué)教研室 張彥琦,臨床試驗的目的大多是為了評價某種藥物或治療方法的效果,如果有其他影響效果的非處理因素(如年齡、病情等)在試驗組和對照組中分布不均衡,就有可能夸大或掩蓋試驗組的治療效果。 當(dāng)非處理因素過多時,可能會遇到各層樣本量過小和非處理因素在試驗組和對照組內(nèi)的分布不均衡的問題。用單因素分析很難保證對比組間的齊同性。 當(dāng)評價指標(biāo)為二值變量時(如有效

21、和無效),可以利用logistic回歸分析得到調(diào)整后的藥物評價結(jié)果。,logistic回歸的應(yīng)用,Department ofHealth Statistics,衛(wèi)生統(tǒng)計學(xué)教研室 張彥琦,在一些藥物或毒物效價的劑量-反應(yīng)實驗研究中,每一只動物藥物耐受量可能有很大的不同,不同劑量使動物發(fā)生“陽性反應(yīng)”的概率分布常呈正偏態(tài),將劑量取對數(shù)后則概率分布接近正態(tài)分布。由于正態(tài)分布函數(shù)與logistic分布函數(shù)十分接近,如果用P表示在劑量為X時的陽性率,可用下述模型表示它們之間的關(guān)系,用這一模型可以求出任一劑量的陽性反應(yīng)率,傳統(tǒng)的一些方法往往對實驗設(shè)計有嚴(yán)格的要求,如劑量按等比級數(shù)排列,各劑量組的例數(shù)必須相

22、同等, 采用logistic回歸的方法則沒有這些限制。,logistic回歸的應(yīng)用,Department ofHealth Statistics,衛(wèi)生統(tǒng)計學(xué)教研室 張彥琦,logistic回歸是一個概率型模型,因此可以利用它預(yù)測某事件發(fā)生的概率。例如在臨床上可以根據(jù)患者的一些檢查指標(biāo),判斷患某種疾病的概率有多大。,logistic回歸的應(yīng)用,Department ofHealth Statistics,衛(wèi)生統(tǒng)計學(xué)教研室 張彥琦,Logistic回歸的樣本量,Logistic回歸要求有足夠的樣本含量,樣本含量愈大分析結(jié)果愈可靠。 實際中病例和對照的人數(shù)應(yīng)至少各有2030例,方程中的變量個數(shù)愈多需

23、要的例數(shù)也就愈大。 對于配對資料,一般樣本的匹配組數(shù)應(yīng)為納入方程中的自變量個數(shù)的20倍以上。,Department ofHealth Statistics,衛(wèi)生統(tǒng)計學(xué)教研室 張彥琦,logistic回歸變量的數(shù)量化,連續(xù)型變量 以原始觀察值或通過某種數(shù)據(jù)變換的形式出現(xiàn),此時exp(b)表示每增加1單位的相對危險度,不一定有實際意義; 將連續(xù)變量按不同區(qū)間分成若干組,按1,2,g給分,然后按連續(xù)變量進行處理。則exp(b)表示平均增加一段的相對危險度。 將連續(xù)變量按不同區(qū)間分成若干組后,化作啞變量處理。 無序分類變量:化成若干個啞變量 有序分類變量:按連續(xù)變量的方式處理或啞變量,Department ofHealth Statistics,衛(wèi)生統(tǒng)計學(xué)教研室 張彥琦,j 的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論