【原創(chuàng)】R語言生存分析可視化數(shù)據(jù)分析報告論文(附代碼數(shù)據(jù))_第1頁
【原創(chuàng)】R語言生存分析可視化數(shù)據(jù)分析報告論文(附代碼數(shù)據(jù))_第2頁
【原創(chuàng)】R語言生存分析可視化數(shù)據(jù)分析報告論文(附代碼數(shù)據(jù))_第3頁
【原創(chuàng)】R語言生存分析可視化數(shù)據(jù)分析報告論文(附代碼數(shù)據(jù))_第4頁
【原創(chuàng)】R語言生存分析可視化數(shù)據(jù)分析報告論文(附代碼數(shù)據(jù))_第5頁
已閱讀5頁,還剩16頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、【原創(chuàng)】定制代寫開發(fā)輔導答疑r/python/spss/matlab/WEKA/sas/sql/C+/stata/eviews/Computerscienceassignment代寫/代做Project/數(shù)據(jù)挖掘和統(tǒng)計分析可視化調(diào)研報告/程序/PPT等/爬蟲數(shù)據(jù)采集服務(附代碼數(shù)據(jù)),咨詢QQ:3025393450歡迎登陸官網(wǎng):/datablogR語言生存分析可視化數(shù)據(jù)分析報告R中的生存分析安裝并加載所需的R包我們將使用兩個R包:生存用于計算存活分析用于總結(jié)和可視化生存分析結(jié)果的survminer安裝軟件包install.packages(c(survival,survminer)加載包lib

2、rary(survival)library(survminer)示例數(shù)據(jù)集我們將使用生存包中提供的肺癌數(shù)據(jù)。data(lung)有問題百度搜索“石屛*據(jù)”就可以了歡迎登陸官網(wǎng):/databloghead(lung)insttimestatusagesexph.ecogph.karnopat.karnomeal.calwt.loss3306234552310101521021883212102217411906810901090119060101007411501001175NA9012251590NA156011501190NA0805130機構(gòu):機構(gòu)代碼時間:以天為單位的生存時間狀態(tài):審查狀

3、態(tài)1=審查,2=失效年齡:歲性別:男=1女=2ph.ecog:ECOG成績得分(0=好5=死)ph.karno:醫(yī)師對Karnofsky績效評分(差=0-好=100)pat.karno:Karnofsky表現(xiàn)評分,按患者評分meal.cal:用餐時消耗的卡路里wt.loss:最近六個月的體重減輕計算生存曲線:survfit()我們要按性別計算生存率。函數(shù)survfit()在生存包中可用于計算kaplan-Meier生存估計。其主要論點包括:歡迎登陸官網(wǎng):/datablog使用Surv()函數(shù)創(chuàng)建的生存對象以及包含變量的數(shù)據(jù)集。要計算生存曲線,請輸入:fit-survfit(Surv(time,

4、status)sex,data=lung)print(fit)Call:survfit(formula=Surv(time,status)sex,data=lung)neventsmedian0.95LCL0.95UCLsex=1138112270212310sex=29053426348550默認情況下,函數(shù)print()顯示生存曲線的簡短摘要。它打印觀察值,事件數(shù),中位生存率和中位值的置信度限制。如果要顯示生存曲線的更完整摘要,請鍵入以下內(nèi)容:Summaryofsurvivalcurvessummary(fit)Accesstothesortsummarytablesummary(fit)

5、$table訪問survfit()返回的值函數(shù)survfit()返回變量列表,包括以下組件:n:每條曲線中的對象總數(shù)。時間:曲線上的時間點。有問題百度搜索“柘花站居”就可以了歡迎登陸官網(wǎng):/datablogn。風險:時間t處有風險的受試者人數(shù)n.event:在時間t發(fā)生的事件數(shù)。n。審查者:在時間t退出事件而不發(fā)生風險的審查者的數(shù)量。下,上:曲線的置信度上限和下限。分層:表示曲線估計的分層。如果地層不為NULL,則結(jié)果中有多條曲線。層次(因子)是曲線的標簽??梢园匆韵路绞皆L問組件:dns38(100)78(57)31(22)136(4)2(1)K(10066(73)26(29)11(12)2(

6、2)0(0)02004006003001000TimeindaysTimeindaysKaplan-Meier圖可以解釋如下:橫軸(x軸)表示以天為單位的時間,縱軸(y軸)表示生存的可能性或生存的人口比例。線代表兩組的存活曲線。曲線中的垂直下降表示事件。曲線上的垂直刻度線表示此時已對患者進行檢查。在零時,生存概率為1.0(或100%的參與者還活著)。歡迎登陸官網(wǎng):/datablog在時間250,性別=1的存活概率約為0.55(或55%),性別=2的存活概率約為0.75(或75%)。性別=2的中位生存期約為270天,性別=2的中位生存期約為426天,這表明性別=2的生存期高于性別=1可以使用以下

7、代碼獲得每組的中位生存時間:summary(fit)$tablerecordsn.maxn.startevents*rmean*se(rmean)median0.95LCL0.95UCLsex=1138138138112325.066322.59845270212310sex=290909053458.275733.78530426348550每組的中位生存時間代表生存概率S(t)為0.5的時間。性別=1(男性)的中位生存時間為270天,而性別=2(女性)則為426天。與男性相比,女性肺癌似乎具有生存優(yōu)勢。但是,要評估此差異是否具有統(tǒng)計學顯著性,需要進行正式的統(tǒng)計檢驗,這將在下一節(jié)中討論。注意

8、,置信極限在曲線的尾部很寬,很難進行有意義的解釋。這可以通過以下事實來解釋:在實踐中,通常有一些患者在隨訪結(jié)束時迷失了隨訪或存活。因此,明智的做法是在隨訪結(jié)束之前在x軸上縮短繪圖(Pocock等,2002)o可以使用參數(shù)xlim縮短生存曲線,如下所示:ggsurvplot(fit,=TRUE,risk.table.col=strata,#Changerisktablecolorbygroupsggtheme=theme_bw(),#Changeggplot2theme有問題百度搜索“匚石屛”就可以了歡迎登陸官網(wǎng):/datablogpalette=c(#E7B800,#2E9FDF),xlim=

9、c(0,600)O.OD-020040DTime600+注意,可以使用參數(shù)fun指定三個經(jīng)常使用的轉(zhuǎn)換:“l(fā)og”:幸存者功能的對數(shù)轉(zhuǎn)換,事件”:繪制累積事件(f(y)=1-y)。也稱為累積發(fā)生率“cumhaz:”繪制了累積危害函數(shù)(f(y)=-log(y)例如,要繪制累積事件,請鍵入:ggsurvplot(fit,=TRUE,risk.table.col=strata,#Changerisktablecolorbygroups【原創(chuàng)】定制代寫開發(fā)輔導答疑r/python/spss/matlab/WEKA/sas/sql/C+/stata/eviews/Computerscienceassig

10、nment代寫/代做Project/數(shù)據(jù)挖掘和統(tǒng)計分析可視化調(diào)研報告/程序/PPT等/爬蟲數(shù)據(jù)采集服務(附代碼數(shù)據(jù)),咨詢QQ:3025393450【原創(chuàng)】定制代寫開發(fā)輔導答疑r/python/spss/matlab/WEKA/sas/sql/C+/stata/eviews/Computerscienceassignment代寫/代做Project/數(shù)據(jù)挖掘和統(tǒng)計分析可視化調(diào)研報告/程序/PPT等/爬蟲數(shù)據(jù)采集服務(附代碼數(shù)據(jù)),咨詢QQ:3025393450有問題百度搜索“石踹丸訂居”就可以了歡迎登陸官網(wǎng):/datablogggtheme=theme_bw(),#Changeggplot2t

11、hemepalette=c(#E7B800,#2E9FDF),fun=event)Stratasex=1+56x=2三署pra-nujnuKaplan-Meier生命表:生存曲線摘要如上所述,您可以使用函數(shù)summary()來獲得生存曲線的完整摘要:summary(fit)有問題百度搜索“石屛*據(jù)”就可以了歡迎登陸官網(wǎng):/datablog還可以使用功能surv_summary()在survminer程序包中獲取生存曲線的摘要。與默認的summary()函數(shù)相比,surv_summary()創(chuàng)建一個包含來自survfit結(jié)果的摘要的數(shù)據(jù)框。res.sum-surv_summary(fit)hea

12、d(res.sum)timen.riskn.eventn.censorsurvstd.errupperlowerstratasex1113800.97826090.012689781.00000000.9542301sex=11213500.97101450.014707470.99941240.9434235sex=11313400.95652170.018148850.99115860.9230952sex=11513200.94927540.019677680.98660170.9133612sex=12613100.94202900.021117080.98183650.9038355

13、sex=13013000.93478260.022484690.97689890.8944820sex=1函數(shù)surv_summary()返回包含以下列的數(shù)據(jù)幀:時間:曲線有階躍的時間點。n。風險:處于t風險中的受試者人數(shù)。n.event:在時間t發(fā)生的事件數(shù)。n。審查者:審查事件的數(shù)量。surv:估計生存概率。std.err:生存標準誤差。upper:置信區(qū)間的上限較低:置信區(qū)間的下限分層:表示曲線估計的分層。層次(因子)是曲線的標簽?!驹瓌?chuàng)】定制代寫開發(fā)輔導答疑r/python/spss/matlab/WEKA/sas/sql/C+/stata/eviews/Computerscience

14、assignment代寫/代做Project/數(shù)據(jù)挖掘和統(tǒng)計分析可視化調(diào)研報告/程序/PPT等/爬蟲數(shù)據(jù)采集服務(附代碼數(shù)據(jù)),咨詢QQ:3025393450有問題百度搜索“柘花站居”就可以了【原創(chuàng)】定制代寫開發(fā)輔導答疑r/python/spss/matlab/WEKA/sas/sql/C+/stata/eviews/Computerscienceassignment代寫/代做Project/數(shù)據(jù)挖掘和統(tǒng)計分析可視化調(diào)研報告/程序/PPT等/爬蟲數(shù)據(jù)采集服務(附代碼數(shù)據(jù)),咨詢QQ:3025393450有問題百度搜索“柘花站居”就可以了歡迎登陸官網(wǎng):/datablog在生存曲線已擬合一個或多個

15、變量的情況下,surv_summary對象包含表示變量的額外列。這使得有可能按層次或某些因素組合來考慮ggsurvplot的輸出。surv_summary對象還有一個名為“表”的屬性,其中包含有關生存曲線的信息,包括具有置信區(qū)間的生存中位數(shù)以及每條曲線中受試者的總數(shù)和事件數(shù)。要訪問“表”屬性,請輸入以下內(nèi)容:attr(res.sum,table)比較生存曲線的Log-Rank檢驗:survdiff()對數(shù)秩檢驗是比較兩個或多個生存曲線的最廣泛使用的方法。零假設是兩組之間的生存率沒有差異。對數(shù)秩檢驗是一種非參數(shù)檢驗,它不對生存分布做出任何假設。本質(zhì)上,對數(shù)秩檢驗將每個組中觀察到的事件數(shù)與如果原假

16、設為真(即,生存曲線相同)時的預期事件數(shù)進行比較。對數(shù)秩統(tǒng)計量近似作為卡方檢驗統(tǒng)計量分布。函數(shù)survdiff()在生存包中可用于比較兩個或更多生存曲線的對數(shù)秩檢驗。survdiff()可以如下使用:surv_diff-survdiff(Surv(time,status)sex,data=lung)surv_diffCall:survdiff(formula=Surv(time,status)sex,data=lung)NObservedExpected(O-E)A2/E(O-E)A2/Vsex=113811291.64.5510.3sex=2905373.45.6810.3Chisq=10.

17、3on1degreesoffreedom,p=0.00131歡迎登陸官網(wǎng):/datablog該函數(shù)返回組件列表,包括:n:每組的科目數(shù)。obs:每組中事件的加權觀測數(shù)量。exp:每個組中加權的預期事件數(shù)。chisq:用于檢驗相等性的卡方統(tǒng)計量。階層:(可選)每個階層中包含的主題數(shù)。生存差異的對數(shù)秩檢驗給出p值為p=0.0013,表明性別群體的生存差異顯著。擬合復雜的生存曲線在本節(jié)中,我們將使用多個因素的組合來計算生存曲線。接下來,我們將結(jié)合多種因素來研究ggsurvplot()的輸出1-使用結(jié)腸數(shù)據(jù)集擬合(復雜)生存曲線require(survival)fit2-survfit(Surv(ti

18、me,status)sex+rx+adhere,data=colon)1-使用survminer可視化輸出。下圖顯示了根據(jù)rx&粘附力值按性別分面的生存曲線。#Plotsurvivalcurvesbysexandfacetbyrxandadhereggsurv-ggsurvplot(fit2,fun=event,=TRUE,ggtheme=theme_bw()ggsurv$plot+theme_bw()+theme(legend.position=right)+facet_grid(rxadhere)【原創(chuàng)】定制代寫開發(fā)輔導答疑r/python/spss/matlab/WEKA/sas/sql

19、/C+/stata/eviews/Computerscienceassignment代寫/代做Project/數(shù)據(jù)挖掘和統(tǒng)計分析可視化調(diào)研報告/程序/PPT等/爬蟲數(shù)據(jù)采集服務(附代碼數(shù)據(jù)),咨詢QQ:3025393450有問題百度搜索“柘花站居”就可以了【原創(chuàng)】定制代寫開發(fā)輔導答疑r/python/spss/matlab/WEKA/sas/sql/C+/stata/eviews/Computerscienceassignment代寫/代做Project/數(shù)據(jù)挖掘和統(tǒng)計分析可視化調(diào)研報告/程序/PPT等/爬蟲數(shù)據(jù)采集服務(附代碼數(shù)據(jù)),咨詢QQ:3025393450有問題百度搜索“刃端居”就可以了歡迎登陸官網(wǎng):/datablog0.250.00075*+0.75G.50J0.00JG.25-Stratab-stjx=irx-=Ltu+5FU,-adhtsrt+sqk=0.rx=Lo

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論