生存分析(第17章)

上傳人：a*** IP屬地：湖北上傳時(shí)間：2023-02-05 格式：PPT 頁數(shù)：93 大?。?.25MB 積分：28 舉報(bào) 版權(quán)申訴

已閱讀5頁，還剩88頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1第17章生存分析SurvivalAnalysis第二軍醫(yī)大學(xué)衛(wèi)生統(tǒng)計(jì)學(xué)教研室張羅漫12講課內(nèi)容第一節(jié)生存分析中的基本概念(重點(diǎn))第二節(jié)生存率的估計(jì)與生存曲線第三節(jié)生存曲線的log-rank檢驗(yàn)第四節(jié)Cox比例風(fēng)險(xiǎn)回歸模型(重點(diǎn))23開始觀察時(shí)間:1992.01.01終止隨訪時(shí)間:2001.12.3141.

兩種治療方法的治愈率相同，但平均治愈天數(shù)不同。甲、乙兩藥物治療某病治愈率均為90%，甲藥治療的患者平均12天出院，乙藥治療的患者平均7天出院。隨訪觀測評價(jià)臨床療效存在三個(gè)問題52.一部分研究對象可觀測到死亡，得到準(zhǔn)確生存時(shí)間（完全數(shù)據(jù)）；一部分研究對象中途失訪、或死于其它疾病、或觀測結(jié)束時(shí)仍存活，得不到準(zhǔn)確生存時(shí)間（不完全數(shù)據(jù)）。3.生存時(shí)間分布通常不服從正態(tài)分布。隨訪觀測評價(jià)臨床療效存在三個(gè)問題62個(gè)效應(yīng)變量

生存時(shí)間(天數(shù))

結(jié)局(死亡或生存、陽性或陰性等)存在不完全數(shù)據(jù)分布類型復(fù)雜生存時(shí)間分布常呈正偏態(tài)分布生存時(shí)間資料的特點(diǎn)7

2個(gè)效應(yīng)變量錯(cuò)誤1：忽略生存時(shí)間，采用logistic回歸分析死亡與否與各Xi的關(guān)系。錯(cuò)誤2：忽略結(jié)局，采用多元線性回歸分析生存時(shí)間與各Xi的關(guān)系。對生存時(shí)間資料的錯(cuò)誤處理8對生存時(shí)間資料的錯(cuò)誤處理不完全數(shù)據(jù)錯(cuò)誤1：丟棄不完全數(shù)據(jù)，只考慮完全

數(shù)據(jù)，損失了部分信息。錯(cuò)誤2：將不完全數(shù)據(jù)當(dāng)作完全數(shù)據(jù)處

理，低估了生存時(shí)間的平均水平。9對生存時(shí)間資料的錯(cuò)誤處理非正態(tài)分布數(shù)據(jù)錯(cuò)誤1：描述時(shí)采用平均生存時(shí)間而不是采用中位生存時(shí)間來表示生存時(shí)間的平均水平。錯(cuò)誤2：推斷時(shí)采用常規(guī)t檢驗(yàn)或方差分析進(jìn)行各組間生存時(shí)間比較。10針對以上生存時(shí)間資料的特點(diǎn)，生存分析是將事件發(fā)生的結(jié)果與隨訪時(shí)間兩個(gè)因素結(jié)合起來、可以對完全或不完全數(shù)據(jù)進(jìn)行分析的方法。11第一節(jié)生存分析中的基本概念TheBasicConceptofSurvivalAnalysis1112

一、名詞解釋

1.生存時(shí)間(survivaltime,

起始事件終點(diǎn)事件

發(fā)病死亡戒煙開始重新吸煙白血病治療緩解復(fù)發(fā)冠心病前一次發(fā)作下一次發(fā)作接觸危險(xiǎn)因素發(fā)病開始服藥治愈132.截尾值(censoredvalue，X+)隨訪中由于某種原因未能觀測到病人的明確結(jié)局，提示真實(shí)生存時(shí)間長于觀測到的時(shí)間原因：失訪(一般失訪率不應(yīng)＞20％)；死于其他疾??；病人生存期超過研究的終止期；治療措施改變。又稱刪失值或終檢值

，本章討論右刪失情況143.死亡概率(mortalityprobability,q)

死于某時(shí)間段內(nèi)的可能性大小。有刪失值時(shí)：年初校正人數(shù)=原年初人數(shù)刪失例數(shù)/2154.生存概率(survivalprobability,p)單位時(shí)段開始時(shí)存活的個(gè)體到該時(shí)段結(jié)束時(shí)仍存活的可能性。

p=1q有刪失值時(shí)：年初校正人數(shù)=原年初人數(shù)刪失例數(shù)/2165.生存率

(survivalrate，S(t,X))

又稱生存函數(shù)，累積生存概率。生存概率針對單位時(shí)間；生存率針對某個(gè)較長時(shí)間段，它是生存概率的累積結(jié)果。如5年生存率是每一年不同生存概率乘積。協(xié)變量17例手術(shù)治療50例肺癌病人，術(shù)后1、2、3年的死亡數(shù)分別為10、10、10例，無截尾數(shù)據(jù)。求各年的生存概率和3年生存率。各年生存概率p1=(50–10)/50=0.8000p2=(40–10)/40=0.7500p3=(30–10)/30=0.66673年生存率

S(3)=(N–d)/N

=(50–30)/50=0.4000S(3)=p1×

p2×

p3=0.8000×0.7500×0.6667=0.4000186.風(fēng)險(xiǎn)函數(shù)

(hazardfunction，h(t,X))生存時(shí)間已達(dá)到t的一群具有協(xié)變量X的觀測對象在t

時(shí)刻的瞬時(shí)死亡率。本章討論的重點(diǎn)風(fēng)險(xiǎn)函數(shù)h(t,X)是生存率S(t,X)的導(dǎo)數(shù)函數(shù)，通過研究風(fēng)險(xiǎn)函數(shù)同樣達(dá)到研究生存率的目的。19

二、資料收集（一）隨訪內(nèi)容

1.明確開始隨訪的時(shí)間如出院時(shí)間、確診時(shí)間、開始治療時(shí)間

2.隨訪的結(jié)局終止隨訪時(shí)間死亡死亡時(shí)間生存但中途失訪最后一次訪問時(shí)間死于其他疾病死于該病時(shí)間生存但隨訪結(jié)束研究結(jié)束時(shí)間

3.記錄影響生存時(shí)間的有關(guān)因素20（二）隨訪方式○○○○○××××?xí)r間0始點(diǎn)t終點(diǎn)×

死亡○失訪治療措施改變死于其他疾病21○○○○○××××?xí)r間0始點(diǎn)t終點(diǎn)×

死亡○失訪治療措施改變死于其他疾病22○○○○○××××?xí)r間

始點(diǎn)t終點(diǎn)×

死亡○失訪治療措施改變死于其他疾病23三、生存分析研究的主要內(nèi)容1.描述生存過程生存時(shí)間分布特點(diǎn)估計(jì)生存率及平均生存時(shí)間繪制生存曲線2.比較生存過程對各樣本生存曲線進(jìn)行比較3.影響生存時(shí)間的因素分析擬合生存分析模型24四、生存分析的基本方法25第一節(jié)生存分析中的基本概念25一、名詞解釋二、資料收集三、生存分析研究的主要內(nèi)容四、生存分析的基本方法26第二節(jié)生存率的估計(jì)與生存曲線

（生存過程的描述）26EstimateofSurvivalRate&SurvivalCurve27

一、小樣本資料

1.生存率的計(jì)算

2.生存率標(biāo)準(zhǔn)誤的計(jì)算

3.生存曲線

4.中位生存時(shí)間281.生存率的計(jì)算乘積極限法

(product-limitedmethod)由Kaplan-Meier于1958年提出，又稱為Kaplan-Meier法。利用生存概率與概率乘法原理計(jì)算生存率29例有人研究了甲種手術(shù)方法治療腎上腺腫瘤病人23例的生存情況，定義從手術(shù)后到病人死亡時(shí)間為生存時(shí)間，得到生存時(shí)間(月)如下(+為截尾數(shù)據(jù))，試計(jì)算其生存率與標(biāo)準(zhǔn)誤。

1，3，5，5，5，6，6，6，7，8，10，

10，14+，17，19+

，20+

，22+

，26+

，

31+

，34，34+

，44，59。相同數(shù)據(jù)只列一次，完全數(shù)據(jù)與截尾數(shù)據(jù)相同時(shí)，截尾數(shù)據(jù)在后。300.957×0.955×0.857＝0.783312.生存率標(biāo)準(zhǔn)誤的計(jì)算

由Greenwood1926年提出32總體生存率1－的可信區(qū)間

333.生存曲線例

用乙種手術(shù)方法治療與甲種手術(shù)方法病情基本相同的腎上腺腫瘤病人20例，定義從手術(shù)后到病人死亡的時(shí)間為生存時(shí)間，得到生存時(shí)間(月)如下(+為截尾數(shù)據(jù))。試計(jì)算其生存率與標(biāo)準(zhǔn)誤，并繪制甲、乙兩種手術(shù)方法的生存曲線。

1，1，2，3，3，4，4，4，6，6，8，9，

9，10，11，12，13，15，17，18。34SPSS實(shí)現(xiàn)3536死亡373839每一級階梯代表一個(gè)死亡時(shí)間點(diǎn)，在截尾時(shí)間點(diǎn)無階梯。39173440例有人研究了甲種手術(shù)方法治療腎上腺腫瘤病人23例的生存情況，定義從手術(shù)后到病人死亡時(shí)間為生存時(shí)間，得到生存時(shí)間(月)如下(+為截尾數(shù)據(jù))，試計(jì)算其生存率與標(biāo)準(zhǔn)誤。

1，3，5，5，5，6，6，6，7，8，10，

10，14+，17，19+

，20+

，22+

，26+

，

31+

，34，34+

，44，59。414.中位生存時(shí)間生存率為50%時(shí)對應(yīng)的時(shí)間。424.中位生存時(shí)間生存率為50%時(shí)對應(yīng)的時(shí)間。434344

二、大樣本資料

1.生存率的計(jì)算

壽命表法（lifetablemethod）由E.Halley(英，1656－1742)最早提出。452418-456=19621962-19.5=1942.5462.生存率曲線4647

第二節(jié)生存率的估計(jì)與生存曲線47一、小樣本資料

乘積極限法

(Kaplan-Meier法)二、大樣本資料壽命表法4849第三節(jié)生存曲線的log-rank檢驗(yàn)

（生存過程的比較）48Log-rankTestforSurvivalCurves50log-rank檢驗(yàn)譯為時(shí)序檢驗(yàn)，譯為對數(shù)秩檢驗(yàn)是錯(cuò)誤的。log－記錄。log-rank檢驗(yàn)是對各組生存曲線作整體的比較log-rank檢驗(yàn)的基本思想將各組生存時(shí)間混合統(tǒng)一排序后，對實(shí)際死亡數(shù)與期望死亡數(shù)進(jìn)行比較。log-rank檢驗(yàn)是一種非參數(shù)方法。51例用甲、乙兩種手術(shù)方法分別治療病情基本相同的腎上腺腫瘤病人23例與20例，定義從手術(shù)后到病人死亡的時(shí)間為生存時(shí)間，得到生存時(shí)間(月)如下(+為截尾數(shù)據(jù))，問甲、乙兩種手術(shù)方式后病人生存率有無差別？甲(n=23)1，3，5，5，5，6，6，6，7，8，10，10，14+，17，19+

，20+

，22+

，26+

，31+

，34，34+

，44，59乙(n=20)1，1，2，3，3，4，4，4，6，6，8，9，9，10，11，12，13，15，17，1852H0:兩種手術(shù)方式后病人的生存曲線相同H1:兩種手術(shù)方式后病人的生存曲線不相同=0.05是兩條生存曲線的整體比較53混合統(tǒng)一排序截尾生存時(shí)間5455（1）將兩組生存時(shí)間混合后統(tǒng)一排序

c1i、c2i分別表示兩組截尾數(shù)據(jù)（2）計(jì)算各組的期望死亡數(shù)：56（3）求各組的期望死亡人數(shù)之和：

（4）計(jì)算值：結(jié)論：按=0.05水準(zhǔn)拒絕H0

，接受H1

，認(rèn)為兩種手術(shù)方式后病人的生存曲線有差別。57SPSS軟件計(jì)算58死亡59差別由三種方法在各時(shí)點(diǎn)所取權(quán)重不同造成。60第三節(jié)生存曲線的log-rank檢驗(yàn)59兩樣本生存曲線比較及SPSS實(shí)現(xiàn)61第四節(jié)Cox比例風(fēng)險(xiǎn)回歸模型

（生存過程影響因素分析）60Cox’sProportionalHazardRegressionModel62

1972年由英國統(tǒng)計(jì)學(xué)家D.R.Cox

提出，解決以下問題：在生存時(shí)間的分布種類繁多且難以確定、存在截尾數(shù)據(jù)的情況下，研究協(xié)變量X與生存函數(shù)S(t,X)之間的關(guān)系。Cox模型不直接考察生存函數(shù)S(t,X)與協(xié)變量的關(guān)系，而是用風(fēng)險(xiǎn)函數(shù)h(t,X)作為應(yīng)變量。該方法在不對生存時(shí)間的具體分布進(jìn)行假設(shè)的情況下分析協(xié)變量的影響，大大降低了生存分析的煩瑣性，被譽(yù)為生存分析研究的里程碑。63DavidRoxbeeCox(英，1924～)1972年發(fā)表了在生存分析領(lǐng)域具有開創(chuàng)性的論文《回歸模型和壽命表》，提出了著名的Cox比例風(fēng)險(xiǎn)模型，從而極大地推動了壽命分布模型的發(fā)展并且拓寬了模型的應(yīng)用。1990年他因此獲得了凱特靈獎和金質(zhì)獎?wù)?。?966年到1991年，擔(dān)任著名生物統(tǒng)計(jì)學(xué)雜志Biometrika編委，發(fā)表了300多篇論文，出版了多部著作。他被推舉擔(dān)任了英國皇家統(tǒng)計(jì)學(xué)會和國際統(tǒng)計(jì)機(jī)構(gòu)的會長。64一、Cox模型的基本形式與意義h(t,X)=h0(t)exp(β1X1+β2X2+···+βmXm)h(t,X)：風(fēng)險(xiǎn)函數(shù)，瞬時(shí)死亡率

X=(X1,X2,···,Xm)’:影響生存時(shí)間的協(xié)變量，不隨時(shí)間而變化。

h0(t)：危險(xiǎn)因素為0的基礎(chǔ)風(fēng)險(xiǎn)率，分布未知,

與h(t,X)呈比例非參數(shù)部分

β=(β1,β2,···,βm)’:偏回歸系數(shù)參數(shù)部分65對于0，1變量，假設(shè)危險(xiǎn)因素Xj在非暴露組取值為0，在暴露組取值為1：h(t,X)=h0(t)exp(β1X1+β2X2+···+βmXm

)

對于連續(xù)變量，假設(shè)危險(xiǎn)因素Xj取值為k與k+1Cox比例風(fēng)險(xiǎn)回歸模型6667例:

為探討胃癌患者的預(yù)后，對是否施行手術(shù)治療(X1,手術(shù)=1,否=0)和是否接受放射治療(X2,放射=1,否=0)的效果進(jìn)行分析，其偏回歸系數(shù)分別為－0.360與－0.333。h(t,Xi=1)=h0(t)exp(β1X1+β2X2)=h0(t)exp(0.360×1

0.333×1)=0.5h0(t)

h(t,Xi=0)=h0(t)exp(0.360×0

0.333×0)=

h0(t)RR=h(t,Xi=1)∕h(t,Xi=0)=0.5多因素相對危險(xiǎn)度

RR=h(t,Xi=1)/h(t,Xi=0)=exp[β’(Xi=1Xi=0)]68多因素相對危險(xiǎn)度

RR=h(t,Xi=1)/h(t,Xi=0)=HR風(fēng)險(xiǎn)比(hazardratio)69

二、參數(shù)估計(jì)與假設(shè)檢驗(yàn)（一）參數(shù)估計(jì)在時(shí)刻ti上病人死亡的條件概率為：S代表ti時(shí)刻以后危險(xiǎn)集R(ti)中對似然函數(shù)有貢獻(xiàn)的個(gè)體。70

n個(gè)病人死亡的條件概率相乘，并非通常意義下的似然函數(shù)，但Cox證明了它是觀察數(shù)據(jù)在特定意義下的一部分，稱為偏似然函數(shù)。71

截尾資料(i=0截尾；i=1死亡)的偏似然函數(shù)

對ln()求關(guān)于j的一階偏導(dǎo)數(shù)，并求其等于0

的解，可得到j(luò)的最大似然函數(shù)估計(jì)值bj。72

（二）假設(shè)檢驗(yàn)

1.最大似然比檢驗(yàn)（maximumlikelihoodratiotest）模型中原有不顯著變量剔除與新變量引進(jìn)；包含不同協(xié)變量的模型間比較。733.計(jì)分檢驗(yàn)（scoretest）新變量是否能夠引進(jìn)模型。2.wald檢驗(yàn)（waldtest）模型中的協(xié)變量是否應(yīng)從模型中剔除。74

（三）生存率的估計(jì)基礎(chǔ)生存率75三、因素的初步篩選與最佳模型的建立常用多元逐步Cox模型分析，SAS程序：

procphreg;modelt*y(1)=X1～Xn/selection=stepwiseslentry=0.05slstay=0.10;

檢驗(yàn)各因素是否有統(tǒng)計(jì)學(xué)意義：

Maximunlikelihoodratiotest(選與剔)Scoretest(選)Waldtest(剔)

四、Cox模型的統(tǒng)計(jì)描述

1.回歸系數(shù)（bj）和標(biāo)準(zhǔn)回歸系數(shù)（bj’）反應(yīng)某因素Xj對生存時(shí)間影響的程度。

2.相對危險(xiǎn)度(某因素Xj取值為1與取值為0相比)RR的1–可信區(qū)間：773.個(gè)體預(yù)后指數(shù)(personalprognosisindex)PI>0

表示該病人對應(yīng)的危險(xiǎn)度大于平均水平PI=0表示該病人對應(yīng)的危險(xiǎn)度達(dá)到平均水平PI<0表示該病人對應(yīng)的危險(xiǎn)度小于平均水平

五、應(yīng)用實(shí)例7980X4治療方式（傳統(tǒng)=1，新=0）X5淋巴結(jié)是否轉(zhuǎn)移（是=1，否=0）81SPSS軟件計(jì)算82死亡83基于最大似然估計(jì)的向前逐步回歸法848586六、Cox模型的注意事項(xiàng)及應(yīng)用范圍設(shè)計(jì)階段應(yīng)注意的問題研究樣本要有代表性；協(xié)變量在研究對象中的分布要有敏感性；盡可能全部包括影響因素；生存時(shí)間要有明確規(guī)定；過多的失訪容易造成研究結(jié)果的偏倚；協(xié)變量隨時(shí)間變化而變化時(shí)采用Cox時(shí)間依存協(xié)變量模型；樣本含量一般為自變量個(gè)數(shù)的15～20倍。87模型配合時(shí)應(yīng)注意的問題消除多元共線的影響；選擇單因

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

生存分析(第17章)

文檔簡介

溫馨提示

最新文檔

評論

生存分析(第17章)

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔