第十七章:生存分析(理論)_第1頁
第十七章:生存分析(理論)_第2頁
第十七章:生存分析(理論)_第3頁
第十七章:生存分析(理論)_第4頁
第十七章:生存分析(理論)_第5頁
已閱讀5頁,還剩52頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

問題1在你學過的統(tǒng)計方法中,對于不能痊愈的慢性病治療效果的考核可用什么指標和統(tǒng)計方法?(其結(jié)局都是死亡)引出新概念:生存時間不僅要考察結(jié)局的好壞,還要考察經(jīng)歷的時間長短。對于能治愈疾病,看治愈時間的長短,對于不能治愈的疾病,看延長生存時間的長短。問題2采用隨訪研究可以研究生存時間,但此時失訪問題不可避免,怎么辦?例如,使用生存率(或有效率)指標,分子是什么?分母是什么?以3年生存率為例3年期滿的某病生存人數(shù)/期初某病觀察總?cè)藬?shù)3年期滿的某病生存人數(shù)/3年期滿的某病觀察總?cè)藬?shù)對象在期間失訪如何處理?對上述2個問題的解決辦法應(yīng)用一類對生存時間進行的統(tǒng)計分析—生存分析:包括生存率估計(乘積極限法和壽命表法)生存率比較(log-rank檢驗和Breslow檢驗)Cox模型第十七章

生存分析第一節(jié)基本概念

在醫(yī)學,生物學研究中,常用到生存分析(SurvivalAnalysis)方法。例如對于腫瘤等疾病的療效及預(yù)后的考核,通常不用治愈率,有效率等表示,而用將來復(fù)發(fā)或死亡的時間長短表示,也即生存時間來表示。

所謂生存時間(survivaltime)是指從某個標準時刻(如發(fā)病,確診,開始治療或進行手術(shù)的時間)算起至死亡或復(fù)發(fā)為止的時間。

生存分析數(shù)據(jù)的三個特點:1.隨訪觀察獲得,同時考慮生存時間和生存結(jié)局

2.有截尾數(shù)據(jù)(censoreddata)

隨訪中未能知道病人的確切生存時間,只知道病人的生存時間大于某時間。(1)病人失訪或因其他原因而死亡---失訪(2)到了研究的終止期病人尚未死亡---終訪截尾數(shù)據(jù)可記為t+,如:4+=生存時間大于4年。雖然截尾數(shù)據(jù)提供的信息是不完全的,但不能刪去,因為這不僅損失了資料,而且會造成偏性。3.生存期的資料一般不服從正態(tài)分布。

由于上述原因,常用的統(tǒng)計方法不適用,而要用特殊的統(tǒng)計方法。生存分析是指對于生存時間這一指標進行分析的一系列特殊的統(tǒng)計方法。例17-1為了估計HIV(人類免疫缺陷病毒)陽性患者的生存時間,某研究者進行了臨床隨訪研究。研究對象是于2002年1月1日至2004年12月31日期間在某市確診為HIV陽性者,隨訪這些對象直至死于AIDS(艾滋?。┗蚱洳l(fā)癥(status=1為死亡,0為刪失),研究截止日期為2008年12月31日。并記錄每個研究對象的性別(sex=1為男,0為女)、年齡(age,歲)、是否用藥(drug=1為用藥,0為不用)。表17-1100名HIV陽性患者的生存時間(月)及其影響因素ID

entdateenddatetimesexagedrugstatus1 2004-10-7 2005-8-7 10 027 1 12 2002-6-29 2002-7-29 1 0

47 103 2004-8-2 2005-1-1 5 140 114 2004-4-5 2007-2-3 34 137 015 2004-10-1 2004-10-31 1 033 1 16 2003-12-12 2004-1-11 1 0421 17 2003-12-8 2008-9-5 57 037 0 18 2003-2-14 2003-10-15 8 1321 19 2002-1-10 2003-1-10 12 037 1 010 2002-12-17 2004-7-15 19 1340 1

包括:(1)開始觀察日期,終止觀察日期---生存時間(2)結(jié)局(最終觀察到的是死亡還是存活)死于該病---完全數(shù)據(jù)存活或死于其他原因---截尾數(shù)據(jù)每個生存期數(shù)據(jù)要用2個變量表示:觀察到的生存時間和是否截尾(如:用0表示截尾,用1表示死亡;4+

用4,0表示;4用4,1表示)。(3)協(xié)變量---各種影響生存期長短的因素。隨訪資料的記錄--生存分析的數(shù)據(jù)結(jié)構(gòu)和要求一、生存時間是一個廣義的概念,生存時間不一定專用于死與活的情況,生存時間(存活時間)可定義為從某種起始事件到達某終點事件所經(jīng)歷的時間跨度。例如:急性白血病病人治療-復(fù)發(fā)之間的緩解期;冠心病病人在兩次發(fā)作之間隔;已作輸卵管結(jié)扎的婦女從施行輸卵管吻合手術(shù)后至受孕的時間間隔;在流行病學研究中,從開始接觸危險因素到發(fā)病所經(jīng)歷的時間;住院到出院之間所花費的醫(yī)療費用;從購買到失效期間某醫(yī)療設(shè)備被使用的次數(shù);從購買到第一次維修某車輛所行駛的總里程等。結(jié)婚到離婚 投保(人壽保險)到死亡 開始戒煙(毒)到再次吸煙(毒) 。。。。。。展開你的想象力,專業(yè)應(yīng)用領(lǐng)域很廣!

結(jié)局(終點事件)的理解死亡(生存)復(fù)發(fā)(白血病、第二次心肌梗死)痊愈、好轉(zhuǎn)并發(fā)癥(糖尿病的視網(wǎng)膜病變等)長出第一顆乳牙第一次來月經(jīng)動物實驗中發(fā)生腫瘤等

2種類型,即完全數(shù)據(jù)和刪失數(shù)據(jù):完全數(shù)據(jù):提供了病人確切的生存時間,是生存分析的主要依據(jù);刪失數(shù)據(jù):刪失數(shù)據(jù)也提供部分信息,說明病人在某時刻之前沒有死亡,一般用于確定暴露人口.二、生存時間類型

在隨訪過程中,觀察到了病人的確切結(jié)局,也就知道其具體的存活時間.完全數(shù)據(jù)(completedata)隨訪工作中,由于某種原因未能觀察到病人的明確結(jié)局,這樣,就不知道該病人的確切生存時間,稱之為刪失數(shù)據(jù)。常在生存時間數(shù)據(jù)后加上符號+表示刪失數(shù)據(jù)。刪失數(shù)據(jù)(censoreddata,截尾數(shù)據(jù))

隨訪研究示意(完全數(shù)據(jù)與截尾數(shù)據(jù))觀察起點觀察終點56123

4

起點事件

終點事件

失訪三、生存時間圖示四.生存率(SurvivalRate)

又稱為生存函數(shù),它表示一個病人的生存時間長于時間t的概率,用S(t)表示:s(t)=P(Tt)如5年生存率:s(5)=P(T5)

如無刪失數(shù)據(jù),則生存率計算公式(17-3)如有刪失數(shù)據(jù),則生存率計算公式(17-4)式中pi(i=1,2,...,k)為各時段的生存概率。生存率的計算五、死亡概率與生存概率死亡概率(probabilityofdeath)死亡概率:表示某單位時段開始時存活的個體,在該時段內(nèi)死亡的可能性。

生存概率(probabilityofsurvival)生存概率:表示某單位時段開始時存活的個體,在該時段結(jié)束時仍存活的可能性。

生存概率與生存率?下列關(guān)于生存概率和生存率的敘述,正確的是A.二者均隨時間增加而增大B.二者均隨時間增加而減小C.生存概率是生存率的累積D.生存率是生存概率的累積E.生存概率一定小于生存率生存曲線以生存時間為橫軸,生存率為縱軸繪圖,即所謂的Kaplan-Meier生存曲線生存曲線的繪制生存曲線的特征它是一條下降的曲線,下降的坡度越陡,表示生存率越低或生存時間越短,其斜率表示死亡速率。常見生存函數(shù)的類型示意六、風險函數(shù)(hazardfunction)

風險函數(shù)表示一個生存到時間t的個體,在從t到這一區(qū)間內(nèi)死亡概率的極限,也就是一個生存到時間t的個體在時間t的瞬時死亡率(條件死亡速率)。

風險函數(shù)圖的意義當用t作橫坐標,h(t)為縱坐標所繪的曲線,如遞增,則表示條件死亡速率隨時間而增加,如平行于橫軸,則表示沒有隨時間而加速。常見風險函數(shù)的類型示意

風險函數(shù)的不同情況:常數(shù),如:死于飛機失事。下降,如:意外傷害。先升后降,如:交通事故。上升,如:持續(xù)接觸危險因素。澡盆樣,如:人的一生。平均生存時間

由于生存時間的分布總是偏態(tài)的,故平均生存時間常用中位生存時間(mediansurvivaltime)來計算,其意義是50%的個體存活且有50%的個體死亡的時間,也即生存率為50%時在生存曲線中所對應(yīng)的生存時間。(1)估計生存函數(shù)及其他相關(guān)指標。(2)比較各組的生存函數(shù)。(3)研究影響生存期長短的因素。(4)預(yù)測不同個體的預(yù)后。生存分析目的與用途第二節(jié)生存分析的統(tǒng)計方法生存過程的描述

非參數(shù)方法 參數(shù)方法

乘積-極限法

指數(shù)分布 (又稱Kaplan-Meier法)

Weibull分布壽命表方法

Gamma分布

logistic分布 對數(shù)正態(tài)分布。。。

生存率的估計(非參數(shù)法)

Kaplan-Meier法又稱:乘積極限法(

product-limit,PL法)P(T>t)=S1S2…St

從隨訪開始到生存時間長于t年的生存率為:式中Si表示已生存ti-1年條件下再生存一年到達ti年的條件概率。計算生存率例17-2(P307)

例17-2為了比較不同手術(shù)方法治療腎上腺腫瘤的療效,某研究者隨機將43例病人分成兩組,甲組23例、乙組20例的生存時間(月)如下所示:

甲組:1,3,5(3),6(3),7,8,10(2),14+,17,

19+,20+,22+,26+,31+,34,34+,44,5

乙組:1(2),2,3(2),4(3),6(2),8,9

(2),10,11,12,13,15,17,18

其中有“+”者是刪失數(shù)據(jù),表示病人仍生存或失訪,括號內(nèi)為重復(fù)死亡數(shù)。試計算甲組的生存率與標準誤。

序號

時間(月)死亡數(shù)

刪失數(shù)

期初例數(shù)

死亡概率

生存概率

生存率

生存率標準誤

(1)(2)(3)(4)(5)(6)(7)(8)(9)

1110231/23=0.04350.95650.95650.0425

2310221/22=0.04550.95450.9565×0.9545=0.91300.0588

3530213/21=0.14290.85710.9130×0.8571=0.78260.0860

4630183/18=0.16670.83330.7826×0.8333=0.65220.0993

5710151/15=0.06670.93330.6522×0.9333=0.60870.1018

6810141/14=0.07140.92860.6087×0.9286=0.56520.1034

71020132/13=0.15380.84620.5652×0.8462=0.47830.1042

81401110/11=0.00001.00000.4783×1.0000=0.47830.1042

91710101/10=0.10000.90000.4783×0.9000=0.43040.1041

10190190/9=0.00001.00000.4304×1.0000=0.43040.1041

11200180/8=0.00001.00000.4304×1.0000=0.43040.1041

12220170/7=0.00001.00000.4304×1.0000=0.43040.1041

13260161/6=0.00001.00000.4304×1.0000=0.43040.1041

14310150/5=0.00001.00000.4304×1.0000=0.43040.1041

15341041/4=0.25000.75000.4304×0.7500=0.32280.1216

16340130/3=0.00001.00000.3228×1.0000=0.32280.1216

17441021/2=0.50000.50000.3228×0.5000=0.16140.1293

18591011/1=1.00000.00000.1614×0.0000=0.00000.0000

表17-4甲種手術(shù)方式的生存率與標準誤生存曲線以生存時間為橫軸,生存率為縱軸繪圖,即所謂的Kaplan-Meier生存曲線圖兩組手術(shù)方式生存概率(Kaplan-Meier)曲線補充說明生存率的可信區(qū)間估計(正態(tài)近似法)100(1-)%可信區(qū)間為:

平均生存時間由于生存時間的分布總是偏態(tài)的,故平均生存時間常用中位生存時間(mediansurvivaltime)來計算,其意義是50%的個體存活且有50%的個體死亡的時間,也即生存率為50%時在生存曲線中所對應(yīng)的生存時間。兩種計算方法:圖解法和線性內(nèi)插法圖解法(使用spss生存率圖編輯來說明其結(jié)果)線性內(nèi)插法:取2個相繼生存率,使得一個大于0.5,一個小于0.5,然后,以表17-4為例計算甲組中位生存時間。(8-10)/(8-百分位數(shù))=(0.5652-0.4783)/(0.5652-0.50),t=9.50(月)圖平均生存時間示意(Kaplan-Meier估計)生存率

壽命表法(lifetablemethod)不作要求!壽命表法計算生存率的基本原理是將整個隨訪時間劃分為若干個時間區(qū)間,分別計算每個時間區(qū)間開始時的觀察個體數(shù)、死亡數(shù)和失訪數(shù),進而計算每個時間區(qū)間的條件死亡率和條件生存率。根據(jù)概率的乘法原理,t時刻的生存率為t時刻前各時間區(qū)間條件生存率的乘積。生存率的估計(非參數(shù)法)

P310例17-3不作要求!生存過程的比較非參數(shù)方法 參數(shù)方法時序(log-rank)檢驗

分布參數(shù)檢驗分層時序檢驗

Gehan檢驗 (廣義Wilcoxon檢驗)Mantel-Haenszel檢驗

logrank檢驗

P311例17-4H0:兩組生存過程相同

H1:兩組生存過程不同例甲、乙兩種手術(shù)方法生存過程的log-rank檢驗計算表

ti

死亡數(shù)期初病例數(shù) 理論死亡數(shù) 合計 甲組 乙組 甲組 乙組

Time d ni n1in2i d*nA/n d*nB/n 1 3 43 23 20 1.6047 1.3953 2 1 40 22 18 0.5500 0.4500 3 3 39 22 17 1.6923 1.3077 4 3 36 21 15 . . 5 3 33 21 12 .. 6 5 30 18 12 ..…………… 44 1 2 20 . . 591 1 10 . . 合計

23.809 12.191死亡存活合計甲組12223

乙組2

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論