講座logistic20140331復(fù)習(xí)過程_第1頁
講座logistic20140331復(fù)習(xí)過程_第2頁
講座logistic20140331復(fù)習(xí)過程_第3頁
講座logistic20140331復(fù)習(xí)過程_第4頁
講座logistic20140331復(fù)習(xí)過程_第5頁
已閱讀5頁,還剩52頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

講座logistic20140331一元直線回歸模型

y=a+bx+e多元直線回歸模型

y=a+b1x1+b2x2+…+bkxk+e直線回歸分析的適用環(huán)境:線性(linear):反應(yīng)變量Y的總體平均值與自變量X呈線性關(guān)系判斷:散點(diǎn)圖;殘差圖獨(dú)立(independent)任意兩個(gè)觀察值互相獨(dú)立判斷:專業(yè)知識(shí)正態(tài)性(normal)假定線性模型的誤差項(xiàng)服從正態(tài)分布判斷:殘差直方圖等方差性(equalvariance):在X的取值范圍內(nèi),不論X取什么值,Y都具有相同的方差判斷:X與Y,殘差的散點(diǎn)圖Logistic回歸分析概率型非線性回歸研究二分類觀察結(jié)果與一些影響因素之間關(guān)系的一種多變量分析方法。logistic回歸的主要用途:一是尋找危險(xiǎn)因素二是預(yù)測,根據(jù)建立的logistic回歸模型,預(yù)測在不同的自變量情況下,發(fā)生某病或某種情況的概率有多大。三是判別,實(shí)際上跟預(yù)測類似,根據(jù)logistic模型,判斷某人屬于某病或?qū)儆谀撤N情況的概率有多大,也就是看一下這個(gè)人有多大的可能性是屬于某病患者。

logistic回歸與多重線性回歸logistic回歸與多重線性回歸實(shí)際上有很多相同之處,最大的區(qū)別就在于他們的因變量不同,這兩種回歸可以歸于同一個(gè)家族,即廣義線性模型(generalizedlinearmodel)。這一家族中的模型形式基本上都差不多,不同的就是因變量不同,如果是連續(xù)的,就是多重線性回歸,如果是二項(xiàng)分布,就是logistic回歸,如果是poisson分布,就是poisson回歸,如果是負(fù)二項(xiàng)分布,就是負(fù)二項(xiàng)回歸logistic回歸的因變量可以是二分類的,也可以是多分類的,但是二分類的更為常用,也更加容易解釋。所以實(shí)際中最為常用的就是二分類的logistic回歸。Logistic回歸分析在流行病學(xué)研究中的應(yīng)用疾病病因和危險(xiǎn)因素探討-病例對照研究實(shí)驗(yàn)研究中藥物或毒物的劑量反應(yīng)關(guān)系臨床試驗(yàn)評(píng)價(jià)疾病預(yù)后因素分析膳食因素與2型糖尿病關(guān)系的logistic回歸分析大學(xué)生高血壓相關(guān)因素的Logistic回歸分析產(chǎn)后抑郁癥影響因素的病例對照研究產(chǎn)褥期抑郁及其影響因素的Logistic回歸分析產(chǎn)褥期抑郁及其影響因素的Logistic回歸分析天津市嬰幼兒孤獨(dú)癥患病率與危險(xiǎn)因素。。。。。孫振球主編.《醫(yī)學(xué)統(tǒng)計(jì)學(xué)》人民衛(wèi)生出版社.Logistic回歸模型影響Y的取值的m個(gè)自變量,X1,X2…Xm。P表示m個(gè)自變量的作用下陽性結(jié)果發(fā)生的概率,則Logistic回歸模型表示為稱為P的logit變換。Logistic回歸模型-參數(shù)的含義影響Y的取值的m個(gè)自變量,X1,X2…Xm。P表示m個(gè)自變量的作用下陽性結(jié)果發(fā)生的概率,則Logistic回歸模型表示為β0表示暴露劑量為0時(shí)個(gè)體發(fā)病與不發(fā)病概率之比的自然對數(shù)。流行病學(xué)中的一些基本概念:相對危險(xiǎn)度(relativerisk):RR=P1/P2比數(shù)

Odds=P/(1-P)比數(shù)比OR=[P1/(1-P1)]/[P2/(1-P2)]在患病率較小情況下,OR≈RRLogistic回歸中的常數(shù)項(xiàng)(b0)表示,在不接觸任何潛在危險(xiǎn)/保護(hù)因素條件下,效應(yīng)指標(biāo)發(fā)生與不發(fā)生事件的概率之比的對數(shù)值。Logistic回歸中的回歸系數(shù)(bi

)表示,某一因素改變一個(gè)單位時(shí),效應(yīng)指標(biāo)發(fā)生與不發(fā)生事件的概率之比的對數(shù)變化值,即OR的對數(shù)值。Logistic回歸系數(shù)的意義分析因素xi為二分類變量時(shí),存在(暴露)xi

=1,不存在(未暴露)xi

=0,則Logistic回歸中xi的系數(shù)bi就是暴露與非暴露優(yōu)勢比的對數(shù)值.即OR=exp(bi)=e(bi)醫(yī)學(xué)研究中疾病的復(fù)雜性一種疾病可能有多種致病因素或與多種危險(xiǎn)因素有關(guān)疾病轉(zhuǎn)歸的影響因素也可能多種多樣臨床治療結(jié)局的綜合性解決辦法:固定其他因素,研究有影響的一兩個(gè)因素(配比);分層分析:按1~2個(gè)因素組成的層進(jìn)行層內(nèi)分析和綜合。統(tǒng)計(jì)模型實(shí)例分析為了探討冠心病發(fā)生的有關(guān)危險(xiǎn)因素,對26例冠心病病人和28例對照者進(jìn)行病例-對照研究,各因素的說明見表1,資料見數(shù)據(jù)庫data1,試用logistic逐步回歸分析方法篩選危險(xiǎn)因素。

Logistic回歸分析的一般步驟變量的編碼啞變量的設(shè)置和引入各個(gè)自變量的單因素分析變量的篩選交互作用的引入建立多個(gè)模型選擇較優(yōu)的模型模型應(yīng)用條件的評(píng)價(jià)輸出結(jié)果的解釋1.變量的編碼變量的編碼要易于識(shí)別注意編碼的等級(jí)關(guān)系改變分類變量的編碼,其分析的意義并不改變。牢記編碼使用變量數(shù)值標(biāo)識(shí)(valuelabels)記錄編碼內(nèi)容變量的編碼變量名變量標(biāo)識(shí)變量值值標(biāo)識(shí)

SEX性別1男

2女

EDU教育程度0文盲

1小學(xué)

2初中及以上2.啞變量的設(shè)置和引入啞變量,又稱指示變量。有利于檢驗(yàn)等級(jí)變量各個(gè)等級(jí)間的變化是否相同。一個(gè)k分類的分類變量,可以用k-1個(gè)啞變量來表示。啞變量的設(shè)置教育程度X1X2X3文盲:0000小學(xué):1100初中:2010高中:3001教育程度:文盲,小學(xué),初中,高中以上教育程度X1X2X3文盲:0100小學(xué):1010初中:2001高中:3000以高中作為參照SPSS提供的方法Indicator:

默認(rèn)。以第1或最后1類作對照,其他每類與對照比較;Sample:

以第1或最后1類作對照,其他每類與對照比較,但反映平均效應(yīng)。Difference:

除第1類外各分類與其前各類平均效應(yīng)比較;Helmert:

除最后1類外各分類與其前各類平均效應(yīng)比較;Repeated:

除第1類外各分類與其前一類比較;Polynomial:

假設(shè)類間距相等,用于數(shù)值型變量。Deviation:

以第1或最后1類作對照,其余每類與總效應(yīng)比較。3.自變量的單因素分析了解自變量與因變量的分布檢驗(yàn)是否符合建立模型的應(yīng)用條件偏離應(yīng)用條件時(shí),進(jìn)行數(shù)據(jù)變換各個(gè)自變量兩組間的比較計(jì)數(shù)資料計(jì)量資料雙變量分析4.變量的篩選變量篩選的原則專業(yè)上考慮測量上考慮共線性問題:計(jì)算相關(guān)矩陣,相關(guān)系數(shù)0.8-0.9,則選其一。缺失數(shù)據(jù)少、測量誤差低的優(yōu)先選擇經(jīng)驗(yàn)上考慮雙變量分析中有顯著性的自變量(P≤0.15)選擇那些改變主效應(yīng)的自變量變量的篩選變量篩選的可用方法逐步logistic回歸:自動(dòng)選擇有顯著性的自變量,不僅用于自變量的剔選,也用于交互作用項(xiàng)是否顯著的判斷。前進(jìn)法:逐個(gè)引入模型外的變量后退法:放入所有變量,再逐個(gè)篩選

理論上看,前進(jìn)法選擇變量的經(jīng)驗(yàn)公式缺乏總體概念,當(dāng)用于因素分析時(shí),建議用后退法。當(dāng)變量間有完全相關(guān)性時(shí),后退法無法使用,可用前進(jìn)法。5.交互作用的引入交互作用的定義當(dāng)自變量和因變量的關(guān)系隨第三個(gè)變量的變化而改變時(shí),則存在交互作用交互作用項(xiàng)的引入基于臨床實(shí)際認(rèn)為對結(jié)果有重要影響基于模型應(yīng)用條件的分析引入兩個(gè)自變量的乘積項(xiàng)交互作用的檢驗(yàn)交互作用的解釋6.建立多個(gè)模型飽和模型自定義的模型從飽和模型中選擇自變量再建立模型飽和模型(saturatedmodel)是指各觀測變量之間均容許相關(guān)的最復(fù)雜模型,自由度為0.飽和模型其實(shí)是人為設(shè)定的約束條件最少的模型,純粹按照數(shù)據(jù)的相互關(guān)系來構(gòu)建最優(yōu)的模型,所以,它是數(shù)學(xué)上最優(yōu)的模型,一種理想的狀態(tài)。

7.選擇較優(yōu)的模型模型擬合優(yōu)度檢驗(yàn)AIC(Akaikeinformationcriterion):同一資料的多個(gè)模型的比較,此值越小,模型越合適。SC(Schwartzcriterion):同上Score統(tǒng)計(jì)量:同上,但不包括截距項(xiàng)。似然比檢驗(yàn)(OmnibusTest):檢驗(yàn)全部自變量的作用是否顯著。較為可靠。適用于含連續(xù)性變量的情況。模型擬合好,x2值大,P值小。Hosmer-Lemeshow檢驗(yàn):評(píng)價(jià)估計(jì)概率和觀察概率接近的程度。適用于含連續(xù)性變量的情況。模型好,x2值小,P值大。非條件logistic回歸的SPSS實(shí)現(xiàn)AnalyzeRegressionBinarylogistic應(yīng)變量自變量非條件logistic回歸的SPSS實(shí)現(xiàn)AnalyzeRegressionBinarylogistic8.模型應(yīng)用條件的評(píng)價(jià)殘差分析殘差是觀察值與估計(jì)值之差合理的logistic回歸模型也可能得到不理想的殘差,這在自變量是二分類變量時(shí)更易出現(xiàn)。增加交互作用項(xiàng)可能增加模型的效能非條件logistic回歸的SPSS實(shí)現(xiàn)AnalyzeRegressionBinarylogistic應(yīng)變量自變量非條件logistic回歸的SPSS實(shí)現(xiàn)AnalyzeRegressionBinarylogistic9.輸出結(jié)果的解釋模型中各個(gè)系數(shù)的顯著性檢驗(yàn)Wald檢驗(yàn):類似于直線回歸系數(shù)的t檢驗(yàn)Waldx2檢驗(yàn):同上似然比檢驗(yàn):自變量不在模型中與在模型中的似然值比較。Score檢驗(yàn)輸出結(jié)果的解釋回歸系數(shù)的解釋系數(shù)的正負(fù)值:正(負(fù))系數(shù)表示隨自變量的增加因變量logit值的增加(減少)。二分類自變量系數(shù)為比數(shù)比的對數(shù)值,由此比數(shù)比=eb多分類自變量

以第i類作參照,比較相鄰或相隔的兩個(gè)類別。連續(xù)型自變量當(dāng)自變量改變一個(gè)單位時(shí),比數(shù)比為eb輸出結(jié)果的解釋模型擬合的優(yōu)劣自變量與結(jié)果變量(因變量)有無關(guān)系確認(rèn)因變量與自變量的編碼模型包含的各個(gè)自變量的臨床意義由模型回歸系數(shù)計(jì)算得到的各個(gè)自變量的比數(shù)比的臨床意義輸出結(jié)果的解釋模型的預(yù)測結(jié)果的評(píng)價(jià)敏感度、特異度和陽性預(yù)測值正確選擇預(yù)測概率界值,簡單地以0.5為界值,但并不是最好的。C指數(shù)預(yù)測結(jié)果與觀察結(jié)果的一致性的度量。C值越大(最大為1),模型預(yù)測結(jié)果的能力越強(qiáng)。非條件logistic回歸的SPSS實(shí)現(xiàn)AnalyzeRegressionBinarylogistic應(yīng)變量自變量非條件logistic回歸的SPSS實(shí)現(xiàn)AnalyzeRegressionBinarylogistic非條件logistic回歸研究對象之間是否發(fā)生某事件是獨(dú)立的。適用于:成組的病例-對照研究無分層的隊(duì)列研究或橫斷面調(diào)查診斷性試驗(yàn)條件logistic回歸研究中有N個(gè)配比組,每組中n個(gè)病例配m個(gè)對照者。這時(shí)各個(gè)研究對象發(fā)生某事件的概率即為條件概率。適用于配比設(shè)計(jì)的病例-對照研究精細(xì)分層設(shè)計(jì)的隊(duì)列研究校正混雜因素一般采用Mantel-Haenszel分層分析分層較細(xì)或存在格子零頻數(shù)時(shí),M-H法無法采用。logistic回歸分析可綜合校正多個(gè)混雜因素的影響Logistic應(yīng)用-疾病預(yù)后的估計(jì)logistic回歸模型作為一種概率模型,可用于預(yù)測某事件發(fā)生的概率。logistic回歸不要求在因變量正態(tài)假設(shè)的前提下進(jìn)行預(yù)測。其預(yù)測的準(zhǔn)確性取決于擬合數(shù)據(jù)資料的代表性Logistic應(yīng)用-疾病診斷疾病診斷的判別診斷性試驗(yàn)研究中,敏感度和特異度的估計(jì)logistic回歸模型綜合校正協(xié)變量的影響充分利用數(shù)據(jù)提供的信息可進(jìn)行95%可信區(qū)間的估計(jì)logistic回歸的其他問題多分類logistic回歸模型因變量為二分類變量因變量為多分類變量多分類logistic回歸其他問題研究對象例數(shù)的確定研究設(shè)計(jì)時(shí)樣本含量的估計(jì)經(jīng)驗(yàn)方法:模型中的每一自變量至少需要出現(xiàn)10個(gè)結(jié)局。給定例數(shù)時(shí)自變量太多刪除變量合并變量及變量的分類其他問題logistic回歸的局限性理論上的不足:自變量對疾病的影響是獨(dú)立的,但實(shí)際情況及推導(dǎo)結(jié)果不同。模型有不合理性:“乘法模型”與一般希望的“相加模型”相矛盾。樣本含量不宜太少:例數(shù)大于200例時(shí)才可不考慮參數(shù)估計(jì)的偏性。相關(guān)閱讀-logistic回歸分析在醫(yī)院/衛(wèi)生管理工作中的應(yīng)用住院病例醫(yī)療費(fèi)用分布及影響因素Logistic回歸分析醫(yī)療風(fēng)險(xiǎn)影響因素的有序多分類Logistic回歸分析10種系統(tǒng)疾病住院醫(yī)療費(fèi)用的Logistic分析2009年出院病人住院日影響因素Logistic回歸分析超長住院日影響因素的Logistic回歸分析病人選擇就診醫(yī)院影響因素的lo

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論