![Logisti回歸方程1_第1頁](http://file2.renrendoc.com/fileroot_temp3/2021-11/16/48a3ead3-1d95-40c6-89b7-4e08b782689f/48a3ead3-1d95-40c6-89b7-4e08b782689f1.gif)
![Logisti回歸方程1_第2頁](http://file2.renrendoc.com/fileroot_temp3/2021-11/16/48a3ead3-1d95-40c6-89b7-4e08b782689f/48a3ead3-1d95-40c6-89b7-4e08b782689f2.gif)
![Logisti回歸方程1_第3頁](http://file2.renrendoc.com/fileroot_temp3/2021-11/16/48a3ead3-1d95-40c6-89b7-4e08b782689f/48a3ead3-1d95-40c6-89b7-4e08b782689f3.gif)
![Logisti回歸方程1_第4頁](http://file2.renrendoc.com/fileroot_temp3/2021-11/16/48a3ead3-1d95-40c6-89b7-4e08b782689f/48a3ead3-1d95-40c6-89b7-4e08b782689f4.gif)
![Logisti回歸方程1_第5頁](http://file2.renrendoc.com/fileroot_temp3/2021-11/16/48a3ead3-1d95-40c6-89b7-4e08b782689f/48a3ead3-1d95-40c6-89b7-4e08b782689f5.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、 Logistic Regression Analysis Logistic回歸分析回歸分析 陳新 Logistic回歸分析分析 在醫(yī)學(xué)研究中, 經(jīng)常要分析某種結(jié)果的產(chǎn)生與哪些因素有關(guān)。 例如:生存與死亡, 發(fā)病與未發(fā)病, 陰性與陽性等結(jié)果的產(chǎn)生可能與病人的年齡、性別、生活習(xí)慣、體質(zhì)、遺傳等許多因素有關(guān)。如何找出其中哪些因素對結(jié)果的產(chǎn)生有顯著性影響呢? Logistic回歸分析能較好地解決這類問題。 一、一、 Logistic回歸模型 1 1、 Logistic回歸模型的構(gòu)造 若因變量y為連續(xù)型正態(tài)定量變量時(shí), 可采用多元線性回歸分析y與變量 X1, X2, , Xp之間的關(guān)系: y0+1X1
2、+2X2+pXp l 現(xiàn)y為發(fā)病或未發(fā)病,生存與死亡等定性分類變量,不能直接用上模型進(jìn)行分析。 l 能否用發(fā)病的概率P來直接代替 y呢?l p 0 0+1 1X X1 1+2 2X X2 2+p pX Xp p 等式左邊 變化范圍P 發(fā)病概率 0 P11P 不發(fā)病概率 0 P1 p/1-p 比數(shù) (ratio) 0 p/1-p+ ln(p/1-p) 比數(shù)的對數(shù)值 (ratio) - ln(p/1-p) +2、 Logistic 回歸模型為:llnP/(1-P)=0+1X1+pXp. 定義:logit(P)= lnP/(1-P)為 Logistic變換, Logistic 回歸模型為: logi
3、t(P)=0+1X1+pXp ;經(jīng)數(shù)學(xué)變換可得: exp(0+1X1+pXp)l P= l 1+ exp(0+1X1+pXp);l l exp表示指數(shù)函數(shù)。 Logistic回歸模型是一種概率模型, 它是以疾病,死亡等結(jié)果發(fā)生的概率為因變量, 影響疾病發(fā)生的因素為自變量建立回歸模型。 它特別適用于因變量為二項(xiàng), 多項(xiàng)分類的資料。 在臨床醫(yī)學(xué)中多用于鑒別診斷, 評價(jià)治療措施的好壞及分析與疾病預(yù)后有關(guān)的因素等。 CHISS軟件要求,對分類變量Y數(shù)量化,而且賦值為: 1 發(fā)病 (陽性, 死亡 , 治愈等) y = 0未發(fā)病 (陰性, 生存, 未治愈等). 注意 :P=P(y=1), 即發(fā)病的概率。
4、l3、 軟件的要求軟件的要求4 、回歸系數(shù)i的意義設(shè)只有一個(gè)自變量X,Logistic方程為 ln P/(1-P)= 0+ 1x X= 0表示非暴露,1 表示暴露。 X=1時(shí)的發(fā)病概率為 P1; X=0時(shí)的發(fā)病概率為 P0。 P1/(1-P1) 則, OR= P0/(1-P0) ln(OR)=logitP(1)-logitP(0) =(0+11)-(0+10) = 1 logistic logistic 回歸系數(shù)的回歸系數(shù)的意義 表示自變量每增加一個(gè)單位,其優(yōu)勢比的對數(shù)值的改變量, OR=e lnOR= 亦即自變量每增加一個(gè)單位,其相對危險(xiǎn)度為e 。例如,吸煙與肺癌的關(guān)系的研究 令 1 吸煙
5、1 肺癌 X = y= 0 不吸 0 非肺癌若求得: = 1, OR=e 意思是: 吸煙的人得肺癌癥的危險(xiǎn)性是不吸煙的2.71828倍。 注意 變量X的賦值與OR的關(guān)系令 0 吸 X = 1 不吸 則求得 = ? OR=?則求得: = -1, OR=1/e 意思是: 不吸煙的人得肺癌癥的危險(xiǎn)性是吸煙的36.79%。 實(shí)例分析實(shí)例分析5 5、參數(shù)檢驗(yàn)、參數(shù)檢驗(yàn)1.1.似然比檢驗(yàn)(似然比檢驗(yàn)(likehoodlikehood ratio test ratio test)通過比較包含與不包含某一個(gè)或幾個(gè)待通過比較包含與不包含某一個(gè)或幾個(gè)待檢驗(yàn)觀察因素的兩個(gè)模型的對數(shù)似然函檢驗(yàn)觀察因素的兩個(gè)模型的對數(shù)
6、似然函數(shù)變化來進(jìn)行,其統(tǒng)計(jì)量為數(shù)變化來進(jìn)行,其統(tǒng)計(jì)量為G G G=-2(ln LG=-2(ln Lp p-ln L-ln Lk k) ) n n較大時(shí),較大時(shí), G G近似服從自由度為待檢驗(yàn)近似服從自由度為待檢驗(yàn)因素個(gè)數(shù)的因素個(gè)數(shù)的 分布。分布。比分檢驗(yàn)比分檢驗(yàn)(score testscore test) 以未包含某個(gè)或幾個(gè)變量的模型以未包含某個(gè)或幾個(gè)變量的模型計(jì)算保留模型中參數(shù)的估計(jì)值,并假計(jì)算保留模型中參數(shù)的估計(jì)值,并假設(shè)新增參數(shù)為零,計(jì)算似然函數(shù)的一設(shè)新增參數(shù)為零,計(jì)算似然函數(shù)的一價(jià)偏導(dǎo)數(shù)及信息距陣,兩者相乘便得價(jià)偏導(dǎo)數(shù)及信息距陣,兩者相乘便得比分檢驗(yàn)的統(tǒng)計(jì)量比分檢驗(yàn)的統(tǒng)計(jì)量S S 。n
7、 n 較大時(shí),較大時(shí), S S近似服從自由度為待檢因素個(gè)數(shù)的近似服從自由度為待檢因素個(gè)數(shù)的 分布。分布。WaldWald檢驗(yàn)(檢驗(yàn)( waldwald test test)即廣義的即廣義的t t檢驗(yàn),統(tǒng)計(jì)量為檢驗(yàn),統(tǒng)計(jì)量為u u u u服從正態(tài)分布,即為標(biāo)準(zhǔn)正態(tài)離服從正態(tài)分布,即為標(biāo)準(zhǔn)正態(tài)離差。差。iibbu =s 以上三種方法中,似然比檢以上三種方法中,似然比檢驗(yàn)最可靠,比分檢驗(yàn)一般與它相驗(yàn)最可靠,比分檢驗(yàn)一般與它相一致,但兩者計(jì)算量均較大;而一致,但兩者計(jì)算量均較大;而WaldWald檢驗(yàn)未考慮各因素間的綜合檢驗(yàn)未考慮各因素間的綜合作用,在因素間有共線性存在時(shí)作用,在因素間有共線性存在時(shí),
8、 ,結(jié)果不像其它兩者可靠。結(jié)果不像其它兩者可靠。分析因素分析因素xi為等級變量時(shí),如以最小或?yàn)榈燃壸兞繒r(shí),如以最小或最大等級作參考組,并按等級順序依最大等級作參考組,并按等級順序依次取為次取為0,1,2,。此時(shí),。此時(shí), e(bi) 表示表示xi增加一個(gè)等級時(shí)的優(yōu)勢比,增加一個(gè)等級時(shí)的優(yōu)勢比, e(k* bi)表表示示xi增加增加k個(gè)等級時(shí)的優(yōu)勢比。個(gè)等級時(shí)的優(yōu)勢比。分析因素分析因素xi為連續(xù)性變量時(shí),為連續(xù)性變量時(shí), e(bi)表示表示xi增加一個(gè)計(jì)量單位時(shí)的優(yōu)勢比。增加一個(gè)計(jì)量單位時(shí)的優(yōu)勢比。6 6、 LogisticLogistic回歸分析方法回歸分析方法 分析思想與多重線性回歸分析相同
9、分析思想與多重線性回歸分析相同 篩選變量的方法篩選變量的方法: : 前進(jìn)法前進(jìn)法 后退法后退法 逐步法逐步法 統(tǒng)計(jì)量不再是線性回歸分析中的統(tǒng)計(jì)量不再是線性回歸分析中的F F統(tǒng)計(jì)統(tǒng)計(jì) 量,量,而是上面介紹的三種統(tǒng)計(jì)量之一。而是上面介紹的三種統(tǒng)計(jì)量之一。 為計(jì)算方便,通常向前選取變量用為計(jì)算方便,通常向前選取變量用似然比或比分檢驗(yàn),而向后剔除變量似然比或比分檢驗(yàn),而向后剔除變量常用常用WaldWald檢驗(yàn)。檢驗(yàn)。7 7、啞變量的設(shè)置和引入、啞變量的設(shè)置和引入啞變量,又稱啞變量,又稱指示變量指示變量有利于檢驗(yàn)等級變量各個(gè)等級間的變化有利于檢驗(yàn)等級變量各個(gè)等級間的變化是否相同。是否相同。一個(gè)一個(gè)k k
10、分類的分類變量,進(jìn)行分類的分類變量,進(jìn)行LogisticLogistic回回歸分析前需將該變量轉(zhuǎn)換成歸分析前需將該變量轉(zhuǎn)換成k-1k-1個(gè)指示變個(gè)指示變量或啞變量(量或啞變量(dummy variabledummy variable)來表示。)來表示。這樣指示變量都是二分變量,每一個(gè)指這樣指示變量都是二分變量,每一個(gè)指示變量均有一個(gè)回歸系數(shù),其解釋同前。示變量均有一個(gè)回歸系數(shù),其解釋同前。啞變量的設(shè)置教育程度X1X2X3沈陽000北京100天津010上海001地區(qū)地區(qū):北京,天津北京,天津, 上海上海, 沈陽沈陽 二、條件二、條件LogisticLogistic回歸回歸對配比調(diào)查資料,多采用條
11、件對配比調(diào)查資料,多采用條件LogisticLogistic回歸分析。回歸分析。假設(shè)自變量在各配比組對結(jié)果變量的假設(shè)自變量在各配比組對結(jié)果變量的作用相同,即自變量的回歸系數(shù)與配作用相同,即自變量的回歸系數(shù)與配比組無關(guān)。比組無關(guān)。配比設(shè)計(jì)的配比設(shè)計(jì)的LogisticLogistic回歸模型回歸模型 不含常數(shù)項(xiàng)。不含常數(shù)項(xiàng)。1 12 2logit P=bk kxbxb x三、三、logisticlogistic回歸的作用回歸的作用(1)建立logistic回歸模型: logit(p)=0+1X1+2X2+pXp ;(2) 預(yù)測預(yù)報(bào) 若已知x1, x2 xm數(shù)值大小時(shí), 通過模型可以預(yù)測發(fā)病、死亡等的概率; (3) 因素分析 尋找發(fā)病、死亡等影響有顯著性的因素。 設(shè) 研 究 問 題 中 含 有 p 個(gè) 指 標(biāo) 變 量 x 1 , x2,xp及Y. n個(gè)觀察對象. 其數(shù)據(jù)結(jié)構(gòu)為: 編號 X1 X2 . XP y 1 x11 x21 x1p y1 2 x2
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 設(shè)計(jì)類合同協(xié)議書
- 軟件產(chǎn)品開發(fā)與生命周期管理作業(yè)指導(dǎo)書
- 2025年聊城道路貨運(yùn)駕駛員從業(yè)資格證考試
- 2025年咸寧道路貨運(yùn)駕駛員從業(yè)資格證考試題庫
- 2024-2025學(xué)年高中政治課時(shí)作業(yè)12博大精深的中華文化含解析新人教版必修3
- 2024-2025學(xué)年度九年級物理全冊15.3串聯(lián)和并聯(lián)教學(xué)設(shè)計(jì)3新版新人教版
- 2024-2025學(xué)年高中英語Unit2LanguageSectionⅦWriting-調(diào)查報(bào)告教案含解析牛津譯林版必修3
- 2024年春八年級物理下冊第十章浮力章末小結(jié)與提升分層精煉新版新人教版
- 2024年新教材高中生物課時(shí)素養(yǎng)評價(jià)十八6.3.2隔離在物種形成中的作用含解析新人教版必修2
- 蘇科版數(shù)學(xué)八年級上冊聽評課記錄《1-3探索三角形全等的條件(1)》
- 國庫集中支付培訓(xùn)班資料-國庫集中支付制度及業(yè)務(wù)操作教學(xué)課件
- 詩詞寫作入門課件
- 2023年上海青浦區(qū)區(qū)管企業(yè)統(tǒng)一招考聘用筆試題庫含答案解析
- 2023版押品考試題庫必考點(diǎn)含答案
- 植物之歌觀后感
- 空氣能熱泵安裝示意圖
- 建筑工程施工質(zhì)量驗(yàn)收規(guī)范檢驗(yàn)批填寫全套表格示范填寫與說明
- 2020年中秋國慶假日文化旅游市場安全生產(chǎn)檢查表
- 昆明天大礦業(yè)有限公司尋甸縣金源磷礦老廠箐-小凹子礦段(擬設(shè))采礦權(quán)出讓收益評估報(bào)告
- 心有榜樣行有力量 -從冬奧冠軍徐夢桃身上感受青春奮斗初中主題班會
- 七年級英語下冊閱讀理解10篇
評論
0/150
提交評論