




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、Logistic 回歸分析,Logistic Regression Analysis,翟景花 公共衛(wèi)生學(xué)院,2,復(fù)習(xí): 線性回歸分析對(duì)反應(yīng)變量的要求,反應(yīng)變量 y,連續(xù)型 服從正態(tài)分布,舒張壓,年齡,膽固醇含量,自變量 x,數(shù)值型 與Y呈線性關(guān)系,例如,3,醫(yī)學(xué)研究中經(jīng)常遇到分類型變量,例如,二分類變量: 生存與死亡 有病與無病 有效與無效 感染與未感染 多分類有序變量: 疾病程度(輕度、中度、重度) 治愈效果(治愈、顯效、好轉(zhuǎn)、無效) 多分類無序變量: 手術(shù)方法(A、B、C) 就診醫(yī)院(甲、乙、丙、丁,4,醫(yī)學(xué)研究者經(jīng)常關(guān)心的問題諸如,吸煙是否影響肺癌的發(fā)?。?年齡和糖尿病的發(fā)病有無關(guān)系?
2、哪些因素導(dǎo)致了手術(shù)后有的人感染,而有的人不感染? 哪些因素導(dǎo)致了某種治療方法出現(xiàn)治愈、顯效、好轉(zhuǎn)、無效等不同的效果,是回歸分析問題嗎,5,這些應(yīng)該是屬于回歸分析問題,但是這種回歸分析問題不能借助于線性回歸模型,因?yàn)榉磻?yīng)變量的假設(shè)條件遭到破壞 能否找到一種其他形式的模型y=f(x)來描述分類變量y和x之間依存關(guān)系呢,NO,因?yàn)閺臄?shù)學(xué)角度看,使得x取任意值而y僅 取1和0兩個(gè)值的函數(shù)不存在,YES,6,轉(zhuǎn)換一個(gè)角度來解決這個(gè)問題,y=f(x,p=p(y=1|x)=p(x,不能直接分析 變量y與x的關(guān)系,轉(zhuǎn)換為分析 y取某個(gè)值的概率 變量p與x的關(guān)系,y=1,0 x任意,0p1, x任意,存在,Lo
3、gistic回歸模型,不存在,7,主要內(nèi)容,Logistic 回歸模型的基本概念 Logistic回歸的參數(shù)估計(jì)及假設(shè)檢驗(yàn) Logistic回歸分析的分類 Logistic回歸的應(yīng)用,8,第一節(jié) Logistic 回歸模型的基本概念,一、 Logistic 回歸的實(shí)例,9,二、 Logistic 回歸模型的基本結(jié)構(gòu),AMI搶救后死亡率與影響因素關(guān)系的回歸模型,P值大于1或小于0,變量變換,10,1970年,Cox引入了Logit變換 請(qǐng)注意其右側(cè)仍然可以寫成線性的形式! 大量實(shí)踐證明,LogitP往往和自變量呈線性關(guān)系。 已經(jīng)成為了分類變量的標(biāo)準(zhǔn)建模方法,Logistic 函數(shù),Logisti
4、c 回歸模型,11,多變量的Logistic回歸模型,12,Logistic 回歸概念,是分類數(shù)據(jù)統(tǒng)計(jì)分析的一種重要方法,研究多水平(包括2個(gè)水平)的應(yīng)變量與其影響因子間關(guān)系的回歸分析。即用于分析某類事件發(fā)生概率與自變量之間依存關(guān)系的回歸,即Logistic回歸。 Logistic這個(gè)名稱來源于它所采用的Logit變換,和英文單詞Logistic的含義(后勤的)一點(diǎn)關(guān)系都沒有,與邏輯就更不相干了。 自從傳入國內(nèi)以來,Logistic回歸就一直采用英文寫法,從沒有使用過譯名,13,第二節(jié) Logistic回歸的參數(shù)估計(jì)及假設(shè)檢驗(yàn),引發(fā)的新特點(diǎn) 由于反應(yīng)變量為二分類,所以誤差項(xiàng)應(yīng)當(dāng)服從二項(xiàng)分布,而
5、不是正態(tài)分布。 誤差項(xiàng)的分布規(guī)律應(yīng)當(dāng)和所預(yù)測(cè)的反應(yīng)變量相同 由于上述原因,最小二乘法也不再適用, 最大似然法的優(yōu)越性和重要性一舉凸現(xiàn)出來,14,最大似然法(maximum likelihood,ML)的基本思想是先建立似然函數(shù)或?qū)?shù)似然函數(shù),求似然函數(shù)或?qū)?shù)似然函數(shù)達(dá)到極大時(shí)參數(shù)的取值,稱為參數(shù)的最大似然估計(jì)值。 計(jì)算方法來自于概率分布。 似然(L, likelihood):某種結(jié)局組合出現(xiàn)的概率,由于總體率不同L也不同,所以又被稱為似然函數(shù),一、Logistic回歸的參數(shù)估計(jì)及意義,15,16,常數(shù)項(xiàng)表示在自變量取值均為0時(shí),死亡優(yōu)勢(shì)(比數(shù))的自然對(duì)數(shù)值。 exp( )=0.124是無休克、
6、無心衰和搶救及時(shí)組死亡的優(yōu)勢(shì)。 當(dāng)死亡率很低時(shí),該值近似等于自然死亡率,17,為L(zhǎng)ogistic回歸系數(shù),表示其它自變量取值固定時(shí),該自變量增加一個(gè)單位引起優(yōu)勢(shì)比自然對(duì)數(shù)的變化量。=lnOR, OR=e或OR=exp() OR表示暴露組的疾病危險(xiǎn)是非暴露組的多少倍。 OR1為危險(xiǎn)因素;OR1為保護(hù)因素,18,logistic回歸模型系數(shù)的意義解釋: 從 e =ORRR,說明當(dāng)發(fā)病率很低時(shí),e近似地表示了相對(duì)危險(xiǎn)度,即暴露下的發(fā)病率與非暴露下的發(fā)病率之比,例如,在例20-1中得到 11.110, 因此,RR OR= e =3.034, 表明心梗發(fā)生后搶救前有休克的死亡危險(xiǎn)是沒有休克的3.034
7、倍,19,一般地,logistic回歸模型系數(shù)的意義是,2)如果X是連續(xù)變量,則OR近似表示在X相鄰兩個(gè)單位上的相對(duì)危險(xiǎn)度,1)如果X=1、0,則OR近似表示在X=1條件下的發(fā)病率與X=0條件下發(fā)病率之比。(見例20-1,3)如果X是分類變量,則要將X的啞變量放入模型,則OR表示兩個(gè)類之間的相對(duì)危險(xiǎn)度,20,二、假設(shè)檢驗(yàn)和回歸系數(shù)的區(qū)間估計(jì),1.似然比檢驗(yàn)(likelihood ratio test) 檢驗(yàn)整個(gè)模型是否有統(tǒng)計(jì)學(xué)意義,即檢驗(yàn)所有的偏回歸系數(shù)是否均為0。檢驗(yàn)假設(shè)為 H0:1= m=0 H1 :1,m 不全為0 統(tǒng)計(jì)量 G=- 2lnL (-1,-m) -2lnL 其中L是不包含m個(gè)
8、自變量的模型的似然函數(shù)。 L是包含所有自變量的模型似然函數(shù),G反映的是后一個(gè)模型較前一個(gè)模型擬和優(yōu)度提高的程度。 大樣本, H0成立的條件下,G服從自由度為m的卡方檢驗(yàn),21,分別檢驗(yàn)各個(gè)自變量是否有意義,即單個(gè)總體回歸系數(shù)是否為零。檢驗(yàn)假設(shè)為 H0:i=0 H1 :i0 統(tǒng)計(jì)量 G=-2lnL-2lnL (i) 其中L是扣除Xi的模型似然函數(shù),L是包含Xi的模型的似然函數(shù)。 大樣本, H0成立的條件下,G服從自由度為1的卡方檢驗(yàn),22,2.Wald檢驗(yàn) 常用于回歸系數(shù)的假設(shè)檢驗(yàn),檢驗(yàn)假設(shè)為 H0:i=0 H1 :i0 統(tǒng)計(jì)量,該檢驗(yàn)是通過比較值來進(jìn)行的,它是基于值服從正態(tài)分布的假設(shè),23,3
9、.優(yōu)勢(shì)比的區(qū)間估計(jì) 總體回歸系數(shù)的的(1-)置信區(qū)間為,24,按數(shù)據(jù)的類型: 非條件logistic回歸分析(成組數(shù)據(jù)) 條件logistic回歸分析(配對(duì)病例-對(duì)照數(shù)據(jù)) 按反應(yīng)變量取值個(gè)數(shù): 二值logistic回歸分析 多值logistic回歸分析 按自變量個(gè)數(shù): 一元logistic回歸分析 對(duì)應(yīng)四格表資料卡方檢驗(yàn) 多元logistic回歸分析,第三節(jié) Logistic回歸分析的分類,Logistic回歸分析,25,條件logistic回歸,研究中有N個(gè)配比組,每組中n個(gè)病例配m個(gè)對(duì)照者。這時(shí),各個(gè)研究對(duì)象發(fā)生某事件的概率即為條件概率。 適用于 配比設(shè)計(jì)的病例-對(duì)照研究 精細(xì)分層設(shè)計(jì)的
10、隊(duì)列研究,26,條件Logistic回歸,1:1條件Logistic回歸及模型 在1:1配對(duì)設(shè)計(jì)的病例-對(duì)照研究中,若y=1表示得病,y=0表示未得病;A表示病例,B為對(duì)照,一對(duì)病例和對(duì)照中只有1人得病的條件下恰好是A得病的概率為,27,條件Logistic回歸模型,28,第四節(jié) Logistic回歸的應(yīng)用,篩選危險(xiǎn)因素:如例20-1 校正混雜因素 預(yù)測(cè)與判別,29,篩選危險(xiǎn)因素,病因?qū)W研究 病例-對(duì)照研究 隊(duì)列研究 影響因素的研究 橫斷面調(diào)查,30,校正混雜因素,一般采用Mantel-Haenszel分層分析 分層較細(xì)或存在格子零頻數(shù)時(shí),M-H法無法采用。 logistic回歸分析可綜合校正
11、多個(gè)混雜因素的影響,31,預(yù)測(cè)與判別,logistic回歸模型作為一種概率模型,非條件logistic回歸方程可計(jì)算相應(yīng)的概率預(yù)測(cè)值,對(duì)個(gè)體所屬類別作出概率性的判別。但由于條件logistic回歸模型不能估計(jì)常數(shù)項(xiàng),不能用于預(yù)測(cè),32,注意問題,個(gè)體間的獨(dú)立性 足夠的樣本量 模型評(píng)價(jià) 標(biāo)準(zhǔn)化回歸系數(shù),33,注意問題,篩選自變量時(shí),臨床和流行病學(xué)意義和生物學(xué)機(jī)制在模型結(jié)果解釋中占更重要的地位。 自變量可以是無序分類變量、有序分類變量和數(shù)值變量。無序分類變量常用多個(gè)0-1假(?。┳兞縼泶妫菇Y(jié)果更容易解釋。數(shù)值變量可以轉(zhuǎn)換成等級(jí)變量,使參數(shù)意義更明確。 大多數(shù)情況下,不需對(duì)常數(shù)項(xiàng)做解釋和假設(shè)檢驗(yàn)。條件Logistic回歸模型無常數(shù)項(xiàng),不能用于預(yù)測(cè),34,Logistic回歸分析和線性回歸分析的異同點(diǎn),相同點(diǎn): 都可以利用模型來篩選危險(xiǎn)因子; 都可以校正混雜因子的影響; 都可以用來做預(yù)測(cè)。 不同點(diǎn): 前者對(duì)因變量無分布要求,后者要求因變量是正態(tài)分布變量; 前者要求因變量必須是分類型變量,后者要求因變量必須是連續(xù)型數(shù)值變量。 前者不要求自變量和因變量呈線性關(guān)系,后者要求自變量和因變量呈線性關(guān)系; 前者是分析因變量取某個(gè)值的概率與自變量的關(guān)系,后者是直接分析因變量與自變量的關(guān)系,35,小結(jié),Logistic回歸為概率型的非線性模型
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年頂管加強(qiáng)安全施工管理與風(fēng)險(xiǎn)評(píng)估合同
- 家具加工維修合同范本
- 2025年度租賃代售房屋租賃期限調(diào)整合同
- 磁性材料市場(chǎng)消費(fèi)者行為與產(chǎn)品創(chuàng)新策略研究
- 二零二五年度房地產(chǎn)代理銷售居間服務(wù)合同
- 二零二五年度醫(yī)療健康大數(shù)據(jù)分析醫(yī)生聘用合同
- 員工二零二五年度向公司借款合同續(xù)簽條件合同
- 二零二五年度全款購進(jìn)口跑車及保險(xiǎn)合同模板
- 2025至2030年中國緩沖止動(dòng)器數(shù)據(jù)監(jiān)測(cè)研究報(bào)告
- 獎(jiǎng)金激勵(lì)合同范本
- 我的妹妹-教學(xué)設(shè)計(jì)教案
- GB/T 30512-2014汽車禁用物質(zhì)要求
- GB/T 17984-2010麻花鉆技術(shù)條件
- 五年級(jí)上冊(cè)語文閱讀理解附答案
- 小學(xué)一年級(jí)硬筆書法入門25839教學(xué)內(nèi)容
- 心理測(cè)量學(xué)(全套教學(xué)課件)
- 高職英語課程說課稿課件
- T∕CRHA 003-2021 實(shí)驗(yàn)室 人源性干細(xì)胞檢測(cè)通用要求
- 大班綜合《要是你給老鼠玩手機(jī)》課件
- DN900鋼管dn800E管定向鉆穿越京杭大運(yùn)河施工方案
- 新人美版八年級(jí)下冊(cè)初中美術(shù)全冊(cè)課件
評(píng)論
0/150
提交評(píng)論