Logistic回歸分析及其應(yīng)用_第1頁
Logistic回歸分析及其應(yīng)用_第2頁
Logistic回歸分析及其應(yīng)用_第3頁
Logistic回歸分析及其應(yīng)用_第4頁
Logistic回歸分析及其應(yīng)用_第5頁
已閱讀5頁,還剩35頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

Logistic回歸分析

及其應(yīng)用溫澤淮DME中心3/13/20241概述1967年TrueltJ,ConnifieldJ和KannelW在《JournalofChronicDisease》上發(fā)表了冠心病危險(xiǎn)因素的研究,較早將Logistic回歸用于醫(yī)學(xué)研究。一般概念一元直線回歸多元直線回歸3/13/20242一元直線回歸模型

y=a+bx+e多元直線回歸模型

y=a+b1x1+b2x2+…+bkxk+e3/13/20243-4.00-2.000.002.004.00X:自變量0.000.250.500.751.00F(y):因變量的logit值如果一定要進(jìn)行直線回歸也可以做出結(jié)果,但此時(shí)效果不佳。當(dāng)自變量取一定值時(shí),因變量的預(yù)測(cè)值可能為負(fù)數(shù)。3/13/20244一般直線回歸難以解決的問題醫(yī)學(xué)數(shù)據(jù)的復(fù)雜、多樣連續(xù)型和離散型數(shù)據(jù)醫(yī)學(xué)研究中疾病的復(fù)雜性一種疾病可能有多種致病因素或與多種危險(xiǎn)因素有關(guān)疾病轉(zhuǎn)歸的影響因素也可能多種多樣臨床治療結(jié)局的綜合性3/13/20245簡(jiǎn)單的解決方法固定其他因素,研究有影響的一兩個(gè)因素;分層分析:按1~2個(gè)因素組成的層進(jìn)行層內(nèi)分析和綜合。統(tǒng)計(jì)模型3/13/20246尋找適宜的模型進(jìn)行l(wèi)ogit變換logit(p)=ln(——),p為y=1所對(duì)應(yīng)的概率logit(0.1)=ln(———)=ln(0.1/0.9)p1-p0.11-0.13/13/20247logit(p)=ln(——)p=0或1時(shí),此式失效

以p=r/n代之logit(p)=ln[(r+0.5)/(n–r+0.5)]此稱經(jīng)驗(yàn)logistic變換

以Z代上式的logit(p),Z=a+b1x1+b2x2+…+bkxk稱此為logistic回歸模型p1-p3/13/20248P=ez/(1+ez)ea+b1x1+b2x2+…+bkxk

1+ea+b1x1+b2x2+…+bkxk此為非條件logistic回歸模型應(yīng)用于成組數(shù)據(jù)的分析P=3/13/20249自變量取定一些值時(shí),因變量取0、1的概率就是條件概率,對(duì)條件概率進(jìn)行l(wèi)ogistic回歸,稱為條件logistic回歸表達(dá)式:eb1x1+b2x2+…+bkxk

1-eb1x1+b2x2+…+bkxk

常用于分析配比的資料P=3/13/202410概述小結(jié)logistic回歸對(duì)因變量的比數(shù)的對(duì)數(shù)值〔logit值〕建立模型因變量的logit值的改變與多個(gè)自變量的加權(quán)和呈線性關(guān)系因變量呈二項(xiàng)分布3/13/202411分析的一般步驟變量的編碼啞變量的設(shè)置和引入各個(gè)自變量的單因素分析變量的篩選交互作用的引入建立多個(gè)模型選擇較優(yōu)的模型模型應(yīng)用條件的評(píng)價(jià)輸出結(jié)果的解釋3/13/2024121.變量的編碼變量的編碼要易于識(shí)別注意編碼的等級(jí)關(guān)系改變分類變量的編碼,其分析的意義并不改變。牢記編碼使用變量數(shù)值標(biāo)識(shí)〔valuelabels〕記錄編碼內(nèi)容3/13/202413變量的編碼變量名變量標(biāo)識(shí)變量值值標(biāo)識(shí)

SEX性別1男2女EDU教育程度0文盲1小學(xué)2初中及以上3/13/202414variablelabelsqnum'問卷序號(hào)'rnum'錄入序號(hào)'pnum'病人編號(hào)'hnum'住院號(hào)/門診號(hào)'chname'患者中文姓名'drugroup'組別'name'患者姓名'sex'患者性別'age'患者年齡'valuelabelssex1'男'2'女'/hisc1'是'0'否'9'無法判斷'/nsex1'正常'0'異常'9'未檢'/demdx1'有'0'無'/addx0'無'1'危險(xiǎn)性'2'可能'3'很可能'/edu0‘文盲’1‘小學(xué)程度’2‘初中及以上'3/13/2024152.啞變量的設(shè)置和引入啞變量,又稱指示變量或設(shè)計(jì)矩陣。有利于檢驗(yàn)等級(jí)變量各個(gè)等級(jí)間的變化是否相同。一個(gè)k分類的分類變量,可以用k-1個(gè)啞變量來表示。3/13/202416啞變量的設(shè)置教育程度X1X2X3文盲:0000小學(xué):1100初中:2010高中:3001教育程度:文盲,小學(xué),初中,高中以上3/13/202417教育程度X1X2X3文盲:0100小學(xué):1010初中:2001高中:3000以高中作為參照3/13/202418SPSS提供的方法Indicator:默認(rèn)。以第1或最后1類作對(duì)照,其他每類與對(duì)照比較;Sample:以第1或最后1類作對(duì)照,其他每類與對(duì)照比較,但反映平均效應(yīng)。Difference:除第1類外各分類與其前各類平均效應(yīng)比較;Helmert:除最后1類外各分類與其前各類平均效應(yīng)比較;Repeated:除第1類外各分類與其前一類比較;Polynomial:假設(shè)類間距相等,用于數(shù)值型變量。Deviation:以第1或最后1類作對(duì)照,其余每類與總效應(yīng)比較。3/13/2024193.自變量的單因素分析了解自變量與因變量的分布檢驗(yàn)是否符合建立模型的應(yīng)用條件偏離應(yīng)用條件時(shí),進(jìn)行數(shù)據(jù)變換各個(gè)自變量?jī)山M間的比較計(jì)數(shù)資料計(jì)量資料雙變量分析3/13/2024204.變量的篩選變量篩選的原那么專業(yè)上考慮測(cè)量上考慮共線性問題:計(jì)算相關(guān)矩陣,相關(guān)系數(shù)0.8-0.9,那么選其一。缺失數(shù)據(jù)少、測(cè)量誤差低的優(yōu)先選擇經(jīng)驗(yàn)上考慮雙變量分析中有顯著性的自變量〔P≤0.15〕選擇那些改變主效應(yīng)的自變量3/13/202421變量的篩選變量篩選的可用方法逐步logistic回歸:自動(dòng)選擇有顯著性的自變量,不僅用于自變量的剔選,也用于交互作用項(xiàng)是否顯著的判斷。前進(jìn)法:逐個(gè)引入模型外的變量后退法:放入所有變量,再逐個(gè)篩選

理論上看,前進(jìn)法選擇變量的經(jīng)驗(yàn)公式缺乏總體概念,當(dāng)用于因素分析時(shí),建議用后退法。當(dāng)變量間有完全相關(guān)性時(shí),后退法無法使用,可用前進(jìn)法。3/13/2024225.交互作用的引入交互作用的定義當(dāng)自變量和因變量的關(guān)系隨第三個(gè)變量的變化而改變時(shí),那么存在交互作用交互作用項(xiàng)的引入基于臨床實(shí)際認(rèn)為對(duì)結(jié)果有重要影響基于模型應(yīng)用條件的分析引入兩個(gè)自變量的乘積項(xiàng)交互作用的檢驗(yàn)交互作用的解釋3/13/2024236.建立多個(gè)模型飽和模型自定義的模型從飽和模型中選擇自變量再建立模型3/13/2024247.選擇較優(yōu)的模型模型擬合優(yōu)度檢驗(yàn)AIC〔Akaikeinformationcriterion〕:同一資料的多個(gè)模型的比較,此值越小,模型越適宜。SC〔Schwartzcriterion〕:同上Score統(tǒng)計(jì)量:同上,但不包括截距項(xiàng)。-2logL〔似然比檢驗(yàn),OmnibusTest〕:檢驗(yàn)全部自變量的作用是否顯著。較為可靠。適用于含連續(xù)性變量的情況。模型擬合好,x2值大,P值小。Hosmer-Lemeshow檢驗(yàn):評(píng)價(jià)估計(jì)概率和觀察概率接近的程度。適用于含連續(xù)性變量的情況。模型好,x2值小,P值大。3/13/2024258.模型應(yīng)用條件的評(píng)價(jià)殘差分析殘差是觀察值與估計(jì)值之差合理的logistic回歸模型也可能得到不理想的殘差,這在自變量是二分類變量時(shí)更易出現(xiàn)。增加交互作用項(xiàng)可能增加模型的效能3/13/2024269.輸出結(jié)果的解釋模型中各個(gè)系數(shù)的顯著性檢驗(yàn)Wald檢驗(yàn):類似于直線回歸系數(shù)的t檢驗(yàn)Waldx2檢驗(yàn):同上似然比檢驗(yàn):自變量不在模型中與在模型中的似然值比較。Score檢驗(yàn)3/13/202427輸出結(jié)果的解釋回歸系數(shù)的解釋系數(shù)的正負(fù)值:正〔負(fù)〕系數(shù)表示隨自變量的增加因變量logit值的增加〔減少〕。二分類自變量系數(shù)為比數(shù)比的對(duì)數(shù)值,由此比數(shù)比=eb多分類自變量以第i類作參照,比較相鄰或相隔的兩個(gè)類別。連續(xù)型自變量當(dāng)自變量改變一個(gè)單位時(shí),比數(shù)比為eb3/13/202428輸出結(jié)果的解釋模型擬合的優(yōu)劣自變量與結(jié)果變量〔因變量〕有無關(guān)系確認(rèn)因變量與自變量的編碼模型包含的各個(gè)自變量的臨床意義由模型回歸系數(shù)計(jì)算得到的各個(gè)自變量的比數(shù)比的臨床意義3/13/202429輸出結(jié)果的解釋模型的預(yù)測(cè)結(jié)果的評(píng)價(jià)敏感度、特異度和陽性預(yù)測(cè)值正確選擇預(yù)測(cè)概率界值,簡(jiǎn)單地以0.5為界值,但并不是最好的。C指數(shù)預(yù)測(cè)結(jié)果與觀察結(jié)果的一致性的度量。C值越大〔最大為1〕,模型預(yù)測(cè)結(jié)果的能力越強(qiáng)。3/13/202430非條件logistic回歸研究對(duì)象之間是否發(fā)生某事件是獨(dú)立的。適用于:成組的病例-對(duì)照研究無分層的隊(duì)列研究或橫斷面調(diào)查診斷性試驗(yàn)3/13/202431條件logistic回歸研究中有N個(gè)配比組,每組中n個(gè)病例配m個(gè)對(duì)照者。這時(shí),各個(gè)研究對(duì)象發(fā)生某事件的概率即為條件概率。適用于配比設(shè)計(jì)的病例-對(duì)照研究精細(xì)分層設(shè)計(jì)的隊(duì)列研究3/13/202432logistic回歸的應(yīng)用疾病影響因素的研究校正混雜因素疾病預(yù)后的估計(jì)疾病診斷3/13/202433疾病影響因素的研究病因?qū)W研究病例-對(duì)照研究隊(duì)列研究影響因素的研究橫斷面調(diào)查臨床試驗(yàn)3/13/202434校正混雜因素一般采用Mantel-Haenszel分層分析分層較細(xì)或存在格子零頻數(shù)時(shí),M-H法無法采用。logistic回歸分析可綜合校正多個(gè)混雜因素的影響3/13/202435疾病預(yù)后的估計(jì)logistic回歸模型作為一種概率模型,可用于預(yù)測(cè)某事件發(fā)生的概率。logistic回歸不要求在因變量正態(tài)假設(shè)的前提下進(jìn)行預(yù)測(cè)。3/13/202436疾病診斷疾病診斷的判別診斷性試驗(yàn)研究中,敏感度和特異度的估計(jì)logistic回歸模型綜合校正協(xié)變量的影響充分利用數(shù)據(jù)提供的信息可進(jìn)行95%可信區(qū)間的估計(jì)3/13/202437logistic回歸的其他問題多分類logistic回歸模型因變量為二分類變量因變量為多分類變量

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論