cox模型及其應(yīng)用課件_第1頁
cox模型及其應(yīng)用課件_第2頁
cox模型及其應(yīng)用課件_第3頁
cox模型及其應(yīng)用課件_第4頁
cox模型及其應(yīng)用課件_第5頁
已閱讀5頁,還剩39頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

cox模型及其應(yīng)用主要用于生存分析寧波大學醫(yī)學院沈其君cox模型及其應(yīng)用主要用于生存分析寧波大學醫(yī)學院沈其君1第一節(jié)基本概念一、隨訪研究與生存時間1.隨訪研究

在隊列研究中,對一批研究對象進行追蹤觀察所獲得的有關(guān)結(jié)局以及出現(xiàn)這種結(jié)局所經(jīng)歷的時間等方面的研究。目的:a估計生存率和生存時間長短,進行療效考核和預(yù)后評價。b對生存狀況進行簡單客觀的統(tǒng)計描述(生存概率、生存率、中位生存期等)。c探討影響療效和預(yù)后的“危險因素”及“保護因素”。第一節(jié)基本概念一、隨訪研究與生存時間2隨訪研究的三個因素(兩點一線)起點事件:反映研究對象生存過程的起始特征的事件。終點事件:研究者所關(guān)心的特定結(jié)局。生存時間:從某個起始事件開始到某個終點事件的發(fā)生所經(jīng)歷的時間。也稱失效時間。生存時間舉例(小孩智齒除外?)起始事件終點事件

服藥痊愈手術(shù)切除

死亡染毒死亡化療緩解緩解復(fù)發(fā)終點事件和起始事件是相對而言的,它們都由研究目的決定,須在設(shè)計時明確規(guī)定,并在研究期間嚴格遵守,不能隨意改變。隨訪研究的三個因素(兩點一線)起點事件:反映研究對象生存過程32.可能出現(xiàn)的隨訪結(jié)局(僅以死亡為終點為例)1.出現(xiàn)規(guī)定的結(jié)局(失效failure)2.死于其他疾病3.失訪(只要未能觀察到事先規(guī)定的終點事件)4.隨訪結(jié)束時病人尚存活等生存時間的類型1.完全數(shù)據(jù)(completedata)

從起點至死亡(死于所研究疾?。┧?jīng)歷的時間。2.截尾數(shù)據(jù)(刪失數(shù)據(jù),censoreddata)從起點至截尾點所經(jīng)歷的時間?!旧形从^察到研究對象出現(xiàn)反應(yīng)(終點事件)時,即由于某種原因停止了隨訪,這時記錄到的時間信息是不完整的,這種生存時間數(shù)據(jù)稱為不完全數(shù)據(jù)或截尾值?!拷匚苍颍菏гL、死于其它疾病、觀察結(jié)束時病人尚存活等。2.可能出現(xiàn)的隨訪結(jié)局(僅以死亡為終點為例)1.出現(xiàn)規(guī)定的結(jié)43.生存時間與截尾時間生存時間(survial、failure、waitingtime)從某個起始事件開始到某個終點事件的發(fā)生所經(jīng)歷的時間。截尾時間(censored):研究對象某一時間進入隨訪到出現(xiàn)失訪。真實的生存時間未知,只知道比觀察到的截尾生存時間要長。二、生存數(shù)據(jù)特點1.數(shù)據(jù)的分布為獨特分布,不規(guī)則,未知分布。通常不服從正態(tài)分布。有時近似服從指數(shù)分布、weibull分布、gompertz分布、對數(shù)logistic。2.不可避免地包含有截尾數(shù)據(jù)。3.生存時間與截尾時間生存時間(survial、failur5三、生存時間分布1.生存函數(shù)--任意時刻生存率

s(t)=p(T≥t)0≤t≤∞①中位生存期:又稱半數(shù)生存期,表示恰好有50%的個體尚存活的時間。②特定的生存函數(shù)都有特定的生存分布。2.危險率函數(shù)(harzardfuction)

危險率:患者已活到t時刻,到t+t這段時間內(nèi)死亡的(廣義的死亡)可能性。(條件概率)生存概率:單位時段開始存活的個體到該時段結(jié)束時仍存活的可能性。三、生存時間分布1.生存函數(shù)--任意時刻生存率6h(t)=3.生存函數(shù)s(t)與危險率函數(shù)h(t)的關(guān)系t為任意時刻的危險率S(t)=h(t)=累積危險概率h(t)=3.生存函數(shù)s(t)與危險率函數(shù)h(t)的7第二節(jié)COX模型結(jié)構(gòu)及流行病學意義一、問題提出1、組間比較2、多因素(協(xié)變量):回歸

y=b0+b1x1+b2x2+…+bnxn例如,惡性黑色素瘤的預(yù)后影響因素有部位、病程、治療、惡性程度、形態(tài)大小、是否轉(zhuǎn)移等。3、生存分析如何構(gòu)建回歸模型?第二節(jié)COX模型結(jié)構(gòu)及流行病學意義一、問題提出8二、生存分析回歸模型的一般構(gòu)造1、構(gòu)造思想(1)自變量x----影響因素因變量y----生存時間(2)x與y之間的表現(xiàn)形式

若是未知分布或有缺失值數(shù)據(jù),存在一定的問題和難度(3)預(yù)后因素對生存時間的影響

即x對s(t)、h(t)的影響,也就是x與s(t)、h(t)之間可建立回歸模型。2、模型構(gòu)造的兩大部分:基本部分和修改部分

假定x1,x2,…,xp為協(xié)變量或影響因素;h(t)為具有協(xié)變量x1—xp的個體在t時刻的風險函數(shù)或死亡率,表示生存時間已達t的人在t時刻的瞬時死亡率;h0(t)為t的未知函數(shù),即x=0時t時刻的風險函數(shù),稱為基準風險函數(shù)。h(t)是h0(t)受所有協(xié)變量修改的結(jié)果。二、生存分析回歸模型的一般構(gòu)造1、構(gòu)造思想93、生存分析的回歸模型Cox模型的基本形式為

h(t)=h0(t)exp(b1x1+b2x2+…+bnxn)稱此模型為比例風險模型。自變量x可以是各種預(yù)后影響因素,也可以是這些因素的交互作用項;b1—bn為各協(xié)變量所對應(yīng)的回歸系數(shù)。4、參數(shù)估計方法(1)全參數(shù)法h0(t)分布要明確,極大似然法(2)半?yún)?shù)法cox模型的貢獻在于可對h0(t)不作要求(3)非參數(shù)法h0和自變量的估計形式都未知3、生存分析的回歸模型Cox模型的基本形式為4、參數(shù)估計方法10三、流行病學意義假設(shè)cox模型為

h(t)=h0(t)exp(b1x1+b2x2+…+bnxn)1、b1—bn為回歸系數(shù)①當n=1時,x1=

exp(bx)=

當b>0,則eb>1,h(t,1)>h(t,0)當b<0,則eb<1,h(t,1)<h(t,0)

兩組病人的危險性比值為

RRt==eb10新療法常規(guī)療法ebe0h(t,1)=h0(t)ebh(t,0)=h0(t)e0在某一時刻新療法對于常規(guī)療法的危險性有多大三、流行病學意義假設(shè)cox模型為10新療法常規(guī)療法e11②當n=2時,x1=x2=h(t,11)=h0(t)eb1+b2h(t,10)=h0(t)eb1h(t,01)=h0(t)eb2h(t,00)=h0(t)e0③當x為連續(xù)性變量時,RRt=e(x-x*)2、RRt=eb=稱為比例風險模型(proportionalhazardsmodel)1010101012第三節(jié)cox模型的參數(shù)估計與統(tǒng)計推斷一、極大似然法估計二、cox模型的似然函數(shù)(部分似然法)

partiallikelihoodfunction1、無截尾數(shù)據(jù)的資料例i=1—4,tj=t1—t4,(無截尾,無重合ties)①危險集ristsetR(t1)=﹛1,2,3,4﹜R(t2)=﹛2,3,4﹜R(t3)=﹛3,4﹜R(t4)=﹛4﹜第三節(jié)cox模型的參數(shù)估計與統(tǒng)計推斷一、極大似然法估計13

②似然函數(shù)的構(gòu)造思想

L()=條件危險概率各死亡時點上各死亡之概率的乘積

===

②似然函數(shù)的構(gòu)造思想14

===1所以L()=一般地,設(shè)有病人i=1—n,死亡點為tj,經(jīng)排序后得t1﹤t2﹤…﹤tj(i=j)

15

2、有截尾數(shù)據(jù)的資料例i=1—4,其中i=4為截尾數(shù)據(jù),t1﹤t2﹤t3,t4+,無ties分析i=4,假設(shè)A、B、C三段互斥,(重新排序后和無截尾數(shù)據(jù)分析一樣)。L()=L()A+L()B+L()C=偏似然函數(shù)與一般似然函數(shù)和全似然函數(shù)不同偏似然函數(shù)具有一般似然函數(shù)的性質(zhì)2、有截尾數(shù)據(jù)的資料16三、參數(shù)估計與假設(shè)檢驗h(t)=h0(t)exp(∑bx)當h0(t)未知分布時,Cox提出通過構(gòu)建部分似然函數(shù),應(yīng)用最大似然法對回歸系數(shù)進行估計(可參考logistic模型中介紹的參數(shù)估計方法)。對回歸系數(shù)的檢驗方法有Score檢驗、Wald檢驗和似然比檢驗三種??捎糜谀P椭胁伙@著變量的剔除和新變量的引入,或用于包含不同變量數(shù)的模型之間的比較。可對樣本結(jié)果、每個變量及所有變量總的效果或回歸效果進行檢驗或推斷。由檢驗問題而引出的分析:因素分析預(yù)測:先求得回歸系數(shù),估計s0(t),進而估計h0(t);把h(t)當作s(t)進行預(yù)測。三、參數(shù)估計與假設(shè)檢驗17四、cox模型的前提條件與推廣1、cox模型的三個假定:(1)生存時間是連續(xù)分布;(2)模型中的協(xié)變量不隨時間變化;(3)生存時間準確記錄,無重合(ties)數(shù)據(jù)。2、有重合數(shù)據(jù)時(1)tie不多時,可用Peto、Breslow等提出的方法進行估計。

L()=為ti時刻tie的個數(shù)(2)tie較多或生存數(shù)據(jù)為離散資料時,可用logistic模型的思想進行估計。3、有時變協(xié)變量時

可用帶時變協(xié)變量的cox擴展模型進行估計。四、cox模型的前提條件與推廣184、的形式①exp(∑bx)②線性(1+∑bx

)③㏒(1+exp(∑bx))④擴大的模型族

=(1+k∑bx

)Yk當k→0時,用乘法①;當k→1時,用加法②。4、的形式19第四節(jié)cox模型算前準備及變量篩選一、資料的形式與要求1、有指示變量2、不能有缺項3、關(guān)于生存數(shù)據(jù)的比例﹥60%

樣本量n﹥參數(shù)個數(shù);每一種計算總有一定的n、參數(shù);n為參數(shù)個數(shù)的5—10倍(保險);有效的生存數(shù)據(jù)達到一定量(﹥2倍參數(shù)個數(shù))二、變量的設(shè)置1、計量資料(原始數(shù)據(jù)、數(shù)據(jù)轉(zhuǎn)換、中心化、標準化、尺度化、離散化等)2、二分類資料(0,1)3、無序多分類資料(0,1作為因素進入)4、有序多分類資料(0,1或等級)第四節(jié)cox模型算前準備及變量篩選一、資料的形式與要20三、算前變量考察1、計量資料

頻數(shù)分布如何?有無離群值?在剔除其他變量的影響下,其與應(yīng)變量的關(guān)系?2、分類資料各類分類分布如何?之間有無相關(guān)性?3、當變量多時相關(guān)性如何?四、變量篩選1、單因素

因素一個個進入或剔除,可用方法有x2檢驗、t檢驗、方差分析、logistic模型等2、多因素同時進入,當變量不多時刻直接作多因素分析,方法有聚類分析、逐步回歸、因子分析等三、算前變量考察21五、因素的分析1、交互作用如x1﹡x5(乘積后進入模型)2、深入分析(1)在引進前可先作一定變量的轉(zhuǎn)換處理(2)離散化后,行多個0,1變量,綜合分析x與y的關(guān)系六、SAS代碼DATAEX14_3;INPUTX1-X4TSTATUS@@;CARDS;301112.41100014.11……170106.81181113.61;PROCPHREG;MODELT*STATUS(0)=X1-X4/TIES=EFRONSELECTION=STEPWISESLE=0.05SLS=0.05RL;RUN;五、因素的分析22cox模型及其應(yīng)用主要用于生存分析寧波大學醫(yī)學院沈其君cox模型及其應(yīng)用主要用于生存分析寧波大學醫(yī)學院沈其君23第一節(jié)基本概念一、隨訪研究與生存時間1.隨訪研究

在隊列研究中,對一批研究對象進行追蹤觀察所獲得的有關(guān)結(jié)局以及出現(xiàn)這種結(jié)局所經(jīng)歷的時間等方面的研究。目的:a估計生存率和生存時間長短,進行療效考核和預(yù)后評價。b對生存狀況進行簡單客觀的統(tǒng)計描述(生存概率、生存率、中位生存期等)。c探討影響療效和預(yù)后的“危險因素”及“保護因素”。第一節(jié)基本概念一、隨訪研究與生存時間24隨訪研究的三個因素(兩點一線)起點事件:反映研究對象生存過程的起始特征的事件。終點事件:研究者所關(guān)心的特定結(jié)局。生存時間:從某個起始事件開始到某個終點事件的發(fā)生所經(jīng)歷的時間。也稱失效時間。生存時間舉例(小孩智齒除外?)起始事件終點事件

服藥痊愈手術(shù)切除

死亡染毒死亡化療緩解緩解復(fù)發(fā)終點事件和起始事件是相對而言的,它們都由研究目的決定,須在設(shè)計時明確規(guī)定,并在研究期間嚴格遵守,不能隨意改變。隨訪研究的三個因素(兩點一線)起點事件:反映研究對象生存過程252.可能出現(xiàn)的隨訪結(jié)局(僅以死亡為終點為例)1.出現(xiàn)規(guī)定的結(jié)局(失效failure)2.死于其他疾病3.失訪(只要未能觀察到事先規(guī)定的終點事件)4.隨訪結(jié)束時病人尚存活等生存時間的類型1.完全數(shù)據(jù)(completedata)

從起點至死亡(死于所研究疾?。┧?jīng)歷的時間。2.截尾數(shù)據(jù)(刪失數(shù)據(jù),censoreddata)從起點至截尾點所經(jīng)歷的時間。【尚未觀察到研究對象出現(xiàn)反應(yīng)(終點事件)時,即由于某種原因停止了隨訪,這時記錄到的時間信息是不完整的,這種生存時間數(shù)據(jù)稱為不完全數(shù)據(jù)或截尾值?!拷匚苍颍菏гL、死于其它疾病、觀察結(jié)束時病人尚存活等。2.可能出現(xiàn)的隨訪結(jié)局(僅以死亡為終點為例)1.出現(xiàn)規(guī)定的結(jié)263.生存時間與截尾時間生存時間(survial、failure、waitingtime)從某個起始事件開始到某個終點事件的發(fā)生所經(jīng)歷的時間。截尾時間(censored):研究對象某一時間進入隨訪到出現(xiàn)失訪。真實的生存時間未知,只知道比觀察到的截尾生存時間要長。二、生存數(shù)據(jù)特點1.數(shù)據(jù)的分布為獨特分布,不規(guī)則,未知分布。通常不服從正態(tài)分布。有時近似服從指數(shù)分布、weibull分布、gompertz分布、對數(shù)logistic。2.不可避免地包含有截尾數(shù)據(jù)。3.生存時間與截尾時間生存時間(survial、failur27三、生存時間分布1.生存函數(shù)--任意時刻生存率

s(t)=p(T≥t)0≤t≤∞①中位生存期:又稱半數(shù)生存期,表示恰好有50%的個體尚存活的時間。②特定的生存函數(shù)都有特定的生存分布。2.危險率函數(shù)(harzardfuction)

危險率:患者已活到t時刻,到t+t這段時間內(nèi)死亡的(廣義的死亡)可能性。(條件概率)生存概率:單位時段開始存活的個體到該時段結(jié)束時仍存活的可能性。三、生存時間分布1.生存函數(shù)--任意時刻生存率28h(t)=3.生存函數(shù)s(t)與危險率函數(shù)h(t)的關(guān)系t為任意時刻的危險率S(t)=h(t)=累積危險概率h(t)=3.生存函數(shù)s(t)與危險率函數(shù)h(t)的29第二節(jié)COX模型結(jié)構(gòu)及流行病學意義一、問題提出1、組間比較2、多因素(協(xié)變量):回歸

y=b0+b1x1+b2x2+…+bnxn例如,惡性黑色素瘤的預(yù)后影響因素有部位、病程、治療、惡性程度、形態(tài)大小、是否轉(zhuǎn)移等。3、生存分析如何構(gòu)建回歸模型?第二節(jié)COX模型結(jié)構(gòu)及流行病學意義一、問題提出30二、生存分析回歸模型的一般構(gòu)造1、構(gòu)造思想(1)自變量x----影響因素因變量y----生存時間(2)x與y之間的表現(xiàn)形式

若是未知分布或有缺失值數(shù)據(jù),存在一定的問題和難度(3)預(yù)后因素對生存時間的影響

即x對s(t)、h(t)的影響,也就是x與s(t)、h(t)之間可建立回歸模型。2、模型構(gòu)造的兩大部分:基本部分和修改部分

假定x1,x2,…,xp為協(xié)變量或影響因素;h(t)為具有協(xié)變量x1—xp的個體在t時刻的風險函數(shù)或死亡率,表示生存時間已達t的人在t時刻的瞬時死亡率;h0(t)為t的未知函數(shù),即x=0時t時刻的風險函數(shù),稱為基準風險函數(shù)。h(t)是h0(t)受所有協(xié)變量修改的結(jié)果。二、生存分析回歸模型的一般構(gòu)造1、構(gòu)造思想313、生存分析的回歸模型Cox模型的基本形式為

h(t)=h0(t)exp(b1x1+b2x2+…+bnxn)稱此模型為比例風險模型。自變量x可以是各種預(yù)后影響因素,也可以是這些因素的交互作用項;b1—bn為各協(xié)變量所對應(yīng)的回歸系數(shù)。4、參數(shù)估計方法(1)全參數(shù)法h0(t)分布要明確,極大似然法(2)半?yún)?shù)法cox模型的貢獻在于可對h0(t)不作要求(3)非參數(shù)法h0和自變量的估計形式都未知3、生存分析的回歸模型Cox模型的基本形式為4、參數(shù)估計方法32三、流行病學意義假設(shè)cox模型為

h(t)=h0(t)exp(b1x1+b2x2+…+bnxn)1、b1—bn為回歸系數(shù)①當n=1時,x1=

exp(bx)=

當b>0,則eb>1,h(t,1)>h(t,0)當b<0,則eb<1,h(t,1)<h(t,0)

兩組病人的危險性比值為

RRt==eb10新療法常規(guī)療法ebe0h(t,1)=h0(t)ebh(t,0)=h0(t)e0在某一時刻新療法對于常規(guī)療法的危險性有多大三、流行病學意義假設(shè)cox模型為10新療法常規(guī)療法e33②當n=2時,x1=x2=h(t,11)=h0(t)eb1+b2h(t,10)=h0(t)eb1h(t,01)=h0(t)eb2h(t,00)=h0(t)e0③當x為連續(xù)性變量時,RRt=e(x-x*)2、RRt=eb=稱為比例風險模型(proportionalhazardsmodel)1010101034第三節(jié)cox模型的參數(shù)估計與統(tǒng)計推斷一、極大似然法估計二、cox模型的似然函數(shù)(部分似然法)

partiallikelihoodfunction1、無截尾數(shù)據(jù)的資料例i=1—4,tj=t1—t4,(無截尾,無重合ties)①危險集ristsetR(t1)=﹛1,2,3,4﹜R(t2)=﹛2,3,4﹜R(t3)=﹛3,4﹜R(t4)=﹛4﹜第三節(jié)cox模型的參數(shù)估計與統(tǒng)計推斷一、極大似然法估計35

②似然函數(shù)的構(gòu)造思想

L()=條件危險概率各死亡時點上各死亡之概率的乘積

===

②似然函數(shù)的構(gòu)造思想36

===1所以L()=一般地,設(shè)有病人i=1—n,死亡點為tj,經(jīng)排序后得t1﹤t2﹤…﹤tj(i=j)

37

2、有截尾數(shù)據(jù)的資料例i=1—4,其中i=4為截尾數(shù)據(jù),t1﹤t2﹤t3,t4+,無ties分析i=4,假設(shè)A、B、C三段互斥,(重新排序后和無截尾數(shù)據(jù)分析一樣)。L()=L()A+L()B+L()C=偏似然函數(shù)與一般似然函數(shù)和全似然函數(shù)不同偏似然函數(shù)具有一般似然函數(shù)的性質(zhì)2、有截尾數(shù)據(jù)的資料38三、參數(shù)估計與假設(shè)檢驗h(t)=h0(t)exp(∑bx)當h0(t)未知分布時,Cox提出通過構(gòu)建部分似然函數(shù),應(yīng)用最大似然法對回歸系數(shù)進行估計(可參考logistic模型中介紹的參數(shù)估計方法)。對回歸系數(shù)的檢驗方法有Score檢驗、Wald檢驗和似然比檢驗三種??捎糜谀P椭胁伙@著變量的剔除和新變量的引入,或用于包含不同變量數(shù)的模型之間的比較??蓪颖窘Y(jié)果、每個變量及所有變量總的效果或回歸效果進行檢驗或推斷。由檢驗問題而引出的分析:因素分析預(yù)測:先求得回歸系數(shù),估計s0(t),進而估計h0(t);把h(t)當作s(t)進行預(yù)測。三、參數(shù)估計與假設(shè)檢驗39四、cox模型的前提條件與推廣1、cox模型的三個假定:(1)生存時間是連續(xù)分布;(2)模型中的協(xié)變量不隨時間變化;(3)生存時間準確記錄,無重合(ties)數(shù)據(jù)。2、有重合數(shù)據(jù)時(1)tie不多時,可用Peto、Breslow等提出的方法進行估計。

L()=

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論