診斷試驗(yàn)評(píng)價(jià)與ROC分析方法_第1頁(yè)
診斷試驗(yàn)評(píng)價(jià)與ROC分析方法_第2頁(yè)
診斷試驗(yàn)評(píng)價(jià)與ROC分析方法_第3頁(yè)
診斷試驗(yàn)評(píng)價(jià)與ROC分析方法_第4頁(yè)
診斷試驗(yàn)評(píng)價(jià)與ROC分析方法_第5頁(yè)
已閱讀5頁(yè),還剩17頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

診斷試驗(yàn)評(píng)價(jià)與ROC分析方法第一節(jié)概述診斷試驗(yàn)包括各種實(shí)驗(yàn)室檢查診斷、影像診斷和儀器診斷(如X線、超聲波、CT掃描、磁共振及纖維內(nèi)鏡等),各種方法的診斷價(jià)值如何,必須通過(guò)診斷試驗(yàn)確定。傳統(tǒng)診斷試驗(yàn)評(píng)價(jià)方法有靈敏度(77)、特異度(1FP)、符合率(E)等,這些評(píng)價(jià)指標(biāo)為廣大的醫(yī)學(xué)研究工作者所使用,但是為了使用這些指標(biāo)必須將診斷試驗(yàn)分成“陰性”和“陽(yáng)性”兩種結(jié)果,由于這些指標(biāo)與所選擇的診斷標(biāo)準(zhǔn)或閾值有關(guān),評(píng)級(jí)結(jié)果可能出現(xiàn)不一致性情況。Harris曾對(duì)某文獻(xiàn)中的7篇診斷試驗(yàn)的文章進(jìn)行了分析,發(fā)現(xiàn)其中有5篇得到的靈敏度和特異度是明顯可以變化的,如果改變分類準(zhǔn)則會(huì)是另一評(píng)價(jià)結(jié)果,這很容易引導(dǎo)研究人員做出有利于自己的選擇。另一個(gè)問(wèn)題是,從臨床決策觀點(diǎn)看,無(wú)論對(duì)何種疾病的診斷,最終應(yīng)當(dāng)做出“是”或“非,,的回答,但實(shí)際中只有很少的情況能夠給出明確的診斷,多數(shù)情況只能根據(jù)檢查的結(jié)果做出一個(gè)不確定的判斷,如“正常、大致正常、可疑、非??梢伞惓?,一種新的診斷技術(shù)的產(chǎn)生尤為如此。如果在評(píng)價(jià)時(shí)按照實(shí)驗(yàn)樣本歸為兩類或丟棄中間狀態(tài)的數(shù)據(jù),很容易夸大診斷試驗(yàn)的結(jié)果。在實(shí)際工作中有相當(dāng)一些診斷技術(shù)由于缺乏準(zhǔn)確的評(píng)價(jià),在一開始出現(xiàn)時(shí)往往過(guò)分夸大其作用即與此有關(guān)。ROC分析方法則可以更客觀的對(duì)診斷試驗(yàn)做出評(píng)價(jià)。一、診斷試驗(yàn)的ROC分析方法ROC曲線即受試者工作特征曲線(Receiveroperatingcharacteristiccurve),ROC曲線及其分析已統(tǒng)計(jì)決策理論為基礎(chǔ),起源于電子信號(hào)觀測(cè)理論、用于雷達(dá)信號(hào)接受能力的評(píng)價(jià),目前已經(jīng)應(yīng)用于許多醫(yī)學(xué)、非醫(yī)學(xué)領(lǐng)域,如人類感知和決策研究、工業(yè)質(zhì)量控制、軍事監(jiān)控等。ROC曲線從二十世紀(jì)八十年代起廣泛應(yīng)用于醫(yī)學(xué)診斷試驗(yàn)的評(píng)價(jià)。美國(guó)生物統(tǒng)計(jì)百科全書中關(guān)于ROC曲線的定義是:“對(duì)于存在或可能存在混淆的兩種條件或自然狀態(tài),需要受試者、專業(yè)診斷學(xué)工作者以及預(yù)測(cè)工作者做出精確判斷,或者準(zhǔn)確決策的一種定量方法?!痹谠\斷試驗(yàn)的評(píng)價(jià)研究中,它是以每一個(gè)檢測(cè)結(jié)果作為可能的診斷界值(cut-offpoint),計(jì)算得到相應(yīng)的真陽(yáng)性率(TP)和假陽(yáng)性率(FP),以假陽(yáng)性率(即1-特異度)為橫坐標(biāo),以真陽(yáng)性率(即靈敏度)為縱坐標(biāo)繪制而成的曲線,ROC曲線可從直觀上表明診斷試驗(yàn)的準(zhǔn)確度。在醫(yī)學(xué)影像診斷實(shí)驗(yàn)研究中,一個(gè)突出的問(wèn)題表現(xiàn)在一些病例難以確定,另一個(gè)問(wèn)題是對(duì)不同的醫(yī)院或不同的觀察者(醫(yī)生),采用的診斷標(biāo)準(zhǔn)可能不一致,如何進(jìn)行相互間比較,怎樣把從不同觀察者得到的數(shù)據(jù)結(jié)合起來(lái)分析,使分析結(jié)果具有較好的一致性。從本質(zhì)上講,一個(gè)診斷或預(yù)后系統(tǒng)的優(yōu)劣,不應(yīng)該取決于觀察者在操作過(guò)程中對(duì)'診斷標(biāo)準(zhǔn)”的把握情況,而在與決策變量對(duì)疾病的區(qū)分能力。ROC分析是一種把靈敏度(TP)和特異度(1-FP)結(jié)合起來(lái)綜合評(píng)價(jià)診斷準(zhǔn)確度的一種方法。其基本思想是不固定診斷標(biāo)準(zhǔn)(閾值),把靈敏度和特異度看作一個(gè)連續(xù)變化的過(guò)程,用ROC曲線描述診斷系統(tǒng)的特性,用曲線下面積說(shuō)明診斷的準(zhǔn)確度。ROC分析有兩個(gè)基本的特點(diǎn):①允許診斷結(jié)果在“陰性”和“陽(yáng)性”之間的中間狀態(tài);②ROC分析結(jié)果與診斷標(biāo)準(zhǔn)無(wú)關(guān)。前一特點(diǎn)使診斷試驗(yàn)應(yīng)用范圍拓寬,并且能夠保持信息的完整性;后一特點(diǎn)則能保持診斷試驗(yàn)評(píng)價(jià)結(jié)果的一致性。事實(shí)上,實(shí)際中只有少數(shù)的臨床診斷結(jié)果具有明確的分類界限,如一個(gè)生化檢測(cè)可能是一個(gè)數(shù)量化的結(jié)果,選擇不同的分界點(diǎn),將會(huì)有不同的靈敏度和特異度;當(dāng)一個(gè)診斷結(jié)果主要有主觀判斷(如影像診斷),可以認(rèn)為醫(yī)生的診斷結(jié)果是通過(guò)對(duì)潛在的連續(xù)變量分組后做出的判斷。無(wú)論上面那一種情況,分類閾值的選擇對(duì)ROC曲線都無(wú)影響。從應(yīng)用角度看,ROC分析最大的特點(diǎn)在于可以暫時(shí)回避診斷標(biāo)準(zhǔn)的選擇問(wèn)題,并且能夠較好的保持信息的準(zhǔn)確和完整。理論上,當(dāng)診斷試驗(yàn)完全無(wú)診斷價(jià)值即完全憑機(jī)會(huì)區(qū)分患者和非患者時(shí),ROC曲線是一條由原點(diǎn)到右上角的對(duì)角線,這條線稱為機(jī)會(huì)線(chanceline),有時(shí)也稱為參照線(referenceline),如果獲得的ROC曲線落在這條機(jī)會(huì)線上,其曲線下面積為0.5;理想的診

斷試驗(yàn)ROC曲線是從原點(diǎn)垂直上升至左上角,然后水平到達(dá)右上角,其曲線下面積為1,該ROC曲線對(duì)應(yīng)的診斷試驗(yàn)可完全把患者判為陽(yáng)性、把非患者判為陰性。但實(shí)際上這樣的診斷試驗(yàn)極少或不存在,診斷試驗(yàn)的ROC曲線一般會(huì)位于機(jī)會(huì)線的上方,離機(jī)會(huì)線越遠(yuǎn)說(shuō)明診斷準(zhǔn)確度越高。ROC曲線下面積實(shí)際的取值范圍為0.5U1,而一般認(rèn)為對(duì)于一個(gè)診斷試驗(yàn),ROC曲線下面積在0.5LI0.7之間時(shí)診斷價(jià)值較低,在0.7LI0.9之間時(shí)診斷價(jià)值中等,在0.9以上時(shí)診斷價(jià)值較高。二、ROC曲線下面積的估計(jì)ROC曲線下面積估計(jì)的方法有參數(shù)法和非參數(shù)法,均適用于結(jié)果為連續(xù)性資料或有序資料的診斷試驗(yàn)準(zhǔn)確度的評(píng)價(jià),但計(jì)算均比較復(fù)雜,大多需要借助統(tǒng)計(jì)軟件實(shí)現(xiàn)。(1)ROC曲線下面積估計(jì)的非參數(shù)法非參數(shù)法是根據(jù)診斷試驗(yàn)的檢測(cè)結(jié)果直接計(jì)算繪制ROC曲線所需的工作點(diǎn)(真陽(yáng)性率,假陽(yáng)性率),由此繪制的ROC曲線稱為經(jīng)驗(yàn)ROC曲線,其曲線下的面積可由梯形規(guī)則計(jì)算得到;Bamber于1975年發(fā)現(xiàn):經(jīng)驗(yàn)ROC曲線下面積等價(jià)于患者組和非患者組實(shí)驗(yàn)結(jié)果秩和檢驗(yàn)的WilcoxonMann-Whitney檢驗(yàn)統(tǒng)計(jì)量,因而可由WilcoxonMann-Whitney統(tǒng)計(jì)量估計(jì)曲線下面積的大小。如果用七和'分別表示患病組和非患病組的診斷變量,七和七表示各自的取值,假定檢測(cè)值較大為異常,曲線下面積°的估計(jì)值可以利用下式計(jì)算:e=L堡%S3,j)(1-1)nn11an其中:,、疽A>JS(j,J)=(1/2,j=j(1-2)ANAN0,J<JANnA和nN為患病組和非患病組的檢測(cè)例數(shù)。其含義是將患病組的所有檢測(cè)值分別與正常組所有的檢測(cè)值比較,如果JA>JN得分為1,如果相等得分為0.5,否則不得分,然后計(jì)算平均得分即為e??梢钥闯觯琑OC曲線下的真實(shí)面積e是患病組檢測(cè)值大于正常組檢測(cè)值的概率,即e=p(y>Yn)。roc曲線下面積還有另一種解釋,即在各種不同診斷特異度下的平均靈敏度?!愕姆讲罟烙?jì)可以使用Delong方法計(jì)算:S2(1-3)YnVar(e)=—S2+1nYaAS2(1-3)Yn其中:1部2—^1必[V(七)-9]Aj=1S2Yn1n2—~1象[V(Yj-0]N1部2—^1必[V(七)-9]Aj=1S2Yn1n2—~1象[V(Yj-0]Nj=1AinAiNjNjnAiNjTOC\o"1-5"\h\zNj=1Ai=1對(duì)兩種診斷方式進(jìn)行比較時(shí),檢驗(yàn)公式為:u=,q*(1-4)<Var(0)+Var(0)-2Cov(B,0)'1212式中Var(0)和Var(0)為兩樣本ROC曲線下面積的方差;Cov(0,0)為兩樣本面積估計(jì)1212的協(xié)方差,也可以用Delong給出的非參數(shù)方法計(jì)算得到。在獨(dú)立試驗(yàn)樣本情況下,Cov(0,0)=0(2)ROC曲線下面積估計(jì)的參數(shù)法曲線下面積估計(jì)的參數(shù)法常常是通過(guò)擬合某種統(tǒng)計(jì)學(xué)模型來(lái)實(shí)現(xiàn)的,有學(xué)者檢查了ROC曲線與各種基本分布如冪、二項(xiàng)式、Poisson分布、卡方分布和伽瑪分布等,發(fā)現(xiàn)ROC曲線非常逼近雙正態(tài)模型所產(chǎn)生的曲線,因此擬合雙正態(tài)模型是目前ROC曲線分析中最常使用的方法。該法假設(shè)患者和非患者的實(shí)驗(yàn)結(jié)果均符合正態(tài)分布,根據(jù)實(shí)驗(yàn)結(jié)果擬合雙正態(tài)模型(binormaldistributionmodel),由模型擬合的ROC曲線稱為擬合ROC曲線或稱為光滑ROC曲線,該曲線可用兩個(gè)參數(shù)表示,一個(gè)參數(shù)用a表示,是患者組與非患者組實(shí)驗(yàn)結(jié)果的標(biāo)準(zhǔn)化均數(shù)之差;另一個(gè)參數(shù)可用均數(shù)b表示,是非患者組與患者組實(shí)驗(yàn)結(jié)果的標(biāo)準(zhǔn)差之比,兩個(gè)參數(shù)可由下式估計(jì)得到:a=^a一Jnb=H(1-5)ssAA其中n、jn分別是患者組和非患者組檢測(cè)結(jié)果的均數(shù),sA、sN分別是患者組和非患者組檢測(cè)結(jié)果的標(biāo)準(zhǔn)差。由兩個(gè)參數(shù)可得到繪制光滑ROC曲線所需的工作點(diǎn)及曲線下面積的估計(jì)值。曲線下面積可由下式估計(jì)得到:a、0=中(.]b)(1-6)①為標(biāo)準(zhǔn)正態(tài)分布函數(shù)。因?yàn)榛颊呓M和非患者組的檢測(cè)結(jié)果經(jīng)常不符合雙正態(tài)分布的條件,一般需經(jīng)過(guò)正態(tài)變換,所以雙正態(tài)模型的兩個(gè)參數(shù)一般不宜直接計(jì)算得到,可由最大似然估計(jì)法得到。參數(shù)法的應(yīng)用條件為:患者與非患者的實(shí)驗(yàn)結(jié)果均服從正態(tài)分布,但這是指ROC曲線的函數(shù)形式,而不是指檢驗(yàn)結(jié)果的基本分布,因?yàn)樽兞孔儞Q幾乎可使任何實(shí)驗(yàn)結(jié)果轉(zhuǎn)換為雙正態(tài)分布,而且實(shí)際上,當(dāng)檢測(cè)結(jié)果為有序資料時(shí),數(shù)據(jù)僅有幾個(gè)值或幾個(gè)分類,對(duì)這類數(shù)據(jù)可擬合許多不同的分布。Hajian-Tilaki等發(fā)現(xiàn),即使數(shù)據(jù)不服從雙正態(tài)時(shí),參數(shù)與非參數(shù)法估計(jì)的ROC曲線下面積及其方差也十分類似,這一結(jié)果提示,不必過(guò)分要求數(shù)據(jù)服從雙正態(tài),可根據(jù)應(yīng)用的方便性與實(shí)用性來(lái)選擇方法。參數(shù)法估計(jì)ROC曲線下面積的缺點(diǎn)是在極少數(shù)情況下,估計(jì)的ROC曲線下面積可能會(huì)出現(xiàn)位于機(jī)會(huì)線下的情況,或者當(dāng)資料遠(yuǎn)遠(yuǎn)偏離其應(yīng)用條件時(shí),估計(jì)的結(jié)果可能會(huì)嚴(yán)重偏離其真實(shí)值。在樣本量較大且想通知較少時(shí),參數(shù)法和非參數(shù)法估計(jì)的ROC曲線下面積常常近似相等。三、ROC分析方法研究進(jìn)展簡(jiǎn)述作為臨床診斷數(shù)據(jù)評(píng)價(jià)的一種有效技術(shù),ROC分析已經(jīng)逐漸為醫(yī)學(xué)研究人員所認(rèn)可,并引起了更多統(tǒng)計(jì)專業(yè)人員的注意,把現(xiàn)代發(fā)展起來(lái)的一些多元統(tǒng)計(jì)方法引入ROC分析,使之在理論上有了更穩(wěn)固的基礎(chǔ),應(yīng)用范圍不斷擴(kuò)大。雖然ROC分析技術(shù)在20世紀(jì)50年代就提出,但真正在醫(yī)學(xué)診斷領(lǐng)域應(yīng)用則在80年代;1989年Hanley給出一個(gè)綜合性的報(bào)告,引起更多的統(tǒng)計(jì)專業(yè)人員注意則是在90年代;2002年周曉華等出版了《StatisticalMethodsinDiagnosticMedicine》專著,其中對(duì)大量地文獻(xiàn)做了綜述,內(nèi)容十分豐富。下面簡(jiǎn)要敘述診斷試驗(yàn)ROC分析的有關(guān)內(nèi)容。ROC分析有參數(shù)和非參數(shù)兩類方法,最具代表性的參數(shù)方法是采用雙正態(tài)模型作ROC分析,對(duì)于連續(xù)和有序測(cè)量數(shù)據(jù),參數(shù)法的優(yōu)點(diǎn)是可以獲得ROC曲線方程,得到曲線下的全面積和部分面積,面積的估計(jì)值是無(wú)偏的,但對(duì)連續(xù)測(cè)量的數(shù)據(jù)分布有一定要求。典型的非參數(shù)法是Wilcoxon方法,它適合任何類型分布的數(shù)據(jù),但無(wú)法直接對(duì)有協(xié)變量的情況進(jìn)行分析和處理。由于實(shí)際中可能有協(xié)變量對(duì)診斷試驗(yàn)產(chǎn)生影響,如對(duì)某種疾病檢測(cè)方法進(jìn)行鑒定,各年齡組檢測(cè)對(duì)象的診斷標(biāo)準(zhǔn)不盡相同,其診斷的準(zhǔn)確度也可能存在差異,關(guān)鍵的問(wèn)題是對(duì)協(xié)變量的影響大小做出判斷,并將其影響在診斷試驗(yàn)評(píng)價(jià)中給予考慮,對(duì)此可以采用回歸模型的方法。相關(guān)結(jié)構(gòu)數(shù)據(jù)的ROC分析,典型的問(wèn)題是在影像學(xué)診斷試驗(yàn)中由多個(gè)閱片者和多種不同診斷方式得到的數(shù)據(jù),處理這類問(wèn)題最困難的是估計(jì)量的方差估計(jì),對(duì)此有相應(yīng)的非參數(shù)方法,但在考慮協(xié)變量的情況下,采用參數(shù)回歸模型會(huì)使分析更加靈活;模型的參數(shù)估計(jì)可以使用GEE(generalizedestimationequation)方法,也可以采用Jackknife和Bootstrap估計(jì)方法。還有一個(gè)類似的問(wèn)題是集群數(shù)據(jù)的問(wèn)題,例如在乳腺X線照相研究中,乳腺分為5個(gè)區(qū)域,從而可以從每個(gè)患者雙側(cè)乳房平片中獲得10個(gè)診斷數(shù)據(jù),即以乳腺分區(qū)為基本觀察單位,每一患者為一個(gè)群,Obuchowski(1997)詳細(xì)描述了其數(shù)據(jù)分析的非參數(shù)方法。ROC曲線下部分面積用于描述特殊情況下一種診斷方法的準(zhǔn)確性。例如,在影像診斷評(píng)價(jià)時(shí),不希望被比較的兩種診斷方法假陽(yáng)性率超過(guò)20%,即兩試驗(yàn)的特異度不得低于0.8,否則診斷將無(wú)實(shí)際意義,此時(shí)用假陽(yáng)性率為00.2的ROC曲線下部分面積對(duì)兩種診斷的準(zhǔn)確性進(jìn)行比較,要比用ROC曲線下全面積比較具有更高的靈敏性。使用ROC曲線下部分面積的優(yōu)點(diǎn)是,涉及此指標(biāo)的檢驗(yàn)統(tǒng)計(jì)量比涉及固定FPF靈敏度的檢驗(yàn)統(tǒng)計(jì)量檢驗(yàn)效能高,另外可以將曲線下部分面積轉(zhuǎn)換成人們熟悉的01刻度比例。在由“金標(biāo)準(zhǔn)”診斷為有許多分類的情況下,可以構(gòu)造類似于二分類的ROC評(píng)價(jià)診斷準(zhǔn)確度的指標(biāo),其非參數(shù)ROC分析方法已被提出。與此相似的是聯(lián)合診斷試驗(yàn)的ROC評(píng)價(jià)問(wèn)題,對(duì)同一觀察對(duì)象采取多項(xiàng)檢查措施進(jìn)行診斷,如何對(duì)其診斷效果進(jìn)行ROC評(píng)價(jià),是一個(gè)有待研究的問(wèn)題;我們正在考慮采用決策樹和支持向量機(jī)的方法,有效的計(jì)算ROC曲線下的面積及估計(jì)誤差;另一種考慮是將多維診斷測(cè)量降為二維,然后構(gòu)造二維測(cè)量的ROC模型和計(jì)算方法。ROC應(yīng)用越來(lái)越廣泛,1995年,美國(guó)臨床實(shí)驗(yàn)室標(biāo)準(zhǔn)化委員會(huì)(NCCLS)將ROC曲線引入其標(biāo)準(zhǔn)和指南文件,頒布了《使用ROC曲線評(píng)價(jià)臨床試驗(yàn)的準(zhǔn)確度》(GP10-A)批準(zhǔn)指南,將ROC分析作為實(shí)驗(yàn)室臨床診斷試驗(yàn)統(tǒng)計(jì)分析的標(biāo)準(zhǔn)。此外,ROC分析方法也可以用于Meta分析(SROC)、質(zhì)量控制、臨床藥物療效評(píng)價(jià)、基因表達(dá)數(shù)據(jù)分析等多個(gè)方面。關(guān)于ROC應(yīng)用軟件,目前一些大型商用統(tǒng)計(jì)軟件尚未包含ROC分析專用程序,多由一些大學(xué)的研究人員自己開發(fā)和使用,這些計(jì)算程序有的是用FORTRAN語(yǔ)言編寫,還有一部分是用S和R語(yǔ)言編寫,其中部分軟件可以免費(fèi)獲得,如ROCKIT、ROCANALYSIS和DBMMRMC;另外還有一部分是SAS宏程序,在SAS9.2版本以后,可使用logistic過(guò)程繪制ROC曲線并完成相應(yīng)的參數(shù)估計(jì)。有些簡(jiǎn)單的ROC計(jì)算可以借助SAS、SPSS等一些軟件,但對(duì)一些較新的ROC模型及算法不能直接完成,需要適當(dāng)?shù)木幊蹋瑥亩蛊鋺?yīng)用受到一定的限制,但隨著ROC分析的廣泛應(yīng)用和方法的成熟,相信會(huì)很快將相應(yīng)的軟件模塊加入通用統(tǒng)計(jì)軟件系統(tǒng)。本章后面涉及的主要內(nèi)容包括:帶有協(xié)變量和相關(guān)數(shù)據(jù)的ROC分析,樣本含量估計(jì)方法的診斷試驗(yàn)評(píng)價(jià)問(wèn)題。第二節(jié)具有協(xié)變量的ROC分析本節(jié)介紹使用回歸模型研究協(xié)變量對(duì)診斷試驗(yàn)準(zhǔn)確度影響的ROC分析方法,它允許在控制了可能的混雜因素后比較不同試驗(yàn)的準(zhǔn)確度,其重點(diǎn)在于構(gòu)建試驗(yàn)結(jié)果為連續(xù)型數(shù)據(jù)和有序數(shù)據(jù)的ROC曲線模型。文獻(xiàn)中已提出三種ROC分析的回歸模型:第一種方法是給出一個(gè)模型,診斷測(cè)量結(jié)果是關(guān)于疾病狀態(tài)和協(xié)變量的函數(shù),在估計(jì)協(xié)變量效應(yīng)的同時(shí),得到調(diào)整后的測(cè)量結(jié)果與疾病之間關(guān)系的參數(shù)方程,最后導(dǎo)出相應(yīng)的ROC曲線方程,其特點(diǎn)是程序較易實(shí)現(xiàn);第二種方法是對(duì)協(xié)變量組合計(jì)算試驗(yàn)準(zhǔn)確度指標(biāo),如用Wilcoxon方法計(jì)算ROC曲線下面積,然后應(yīng)用回歸模型評(píng)價(jià)協(xié)變量對(duì)試驗(yàn)準(zhǔn)確度的影響,其特點(diǎn)是可以直接比較不同的診斷試驗(yàn),但這種方法僅適合分類的協(xié)變量,一般需要較大的樣本;第三種方法是直接建立協(xié)變量影響ROC曲線的模型,其基本思想是在ROC曲線中直接加入?yún)f(xié)變量的效應(yīng),使用它可以直接擬合和比較不同的診斷試驗(yàn),是更一般化的ROC曲線回歸模型,但其計(jì)算程序相對(duì)不容易實(shí)現(xiàn)。本文使用的是第一種ROC分析方法。一、具有協(xié)變量的ROC回歸模型假定患病組和非患病組的診斷變量七和'服從任意分布,D表示按“金標(biāo)準(zhǔn)”診斷的結(jié)果,即實(shí)際的患病情況,D=0表示“正?!保珼=1表示“異常”;又假定兩組測(cè)量的均數(shù)卜(D=1,X)>卜(D=0,X),則用于診斷評(píng)價(jià)的ROC模型形式如下:JTP=S(a+P(D=1)+y'X+5'X(D=1))IFP=SD(a'+P(D=0)+y'X+5'X(D=0))(2-1)lcDROC曲線方程可以表示為:TP(FP)=SD{S-1(FP)}現(xiàn)具體說(shuō)明模型及參數(shù)的意義。在相同協(xié)變量的情況下,ROC曲線比較了“有病”與“無(wú)病”的實(shí)驗(yàn)結(jié)果。式中TP和FP分別表示以c點(diǎn)作為診斷標(biāo)準(zhǔn),診斷方法的真陽(yáng)性率(靈敏度)和假陽(yáng)性率(1-特異度);X=(X「X2,X3,,X,)'是與診斷有關(guān)的p個(gè)協(xié)變量,它可能是某些特征因素(如年齡)、其他檢查項(xiàng)目、疾病的亞型等。SD為患病組的生存分布函數(shù),SD為非患病組的生存分布函數(shù);P為疾病狀態(tài)的效應(yīng)參數(shù),間接反映診斷測(cè)量結(jié)果對(duì)疾病的區(qū)分能力;a是與診斷標(biāo)準(zhǔn)C有關(guān)的常數(shù)項(xiàng);參數(shù)Y=(y,Y,Y,,Y)',表示協(xié)變量c123p對(duì)診斷結(jié)果的影響,5=(%,52,,5p,0,00)',q<p,則表示協(xié)變量對(duì)診斷試驗(yàn)準(zhǔn)確性的干擾作用,即在協(xié)變量的不同水平上診斷效果存在差異。二、連續(xù)診斷變量的ROC模型假定診斷試驗(yàn)結(jié)果Y服從均值為口(D,X)和方差為。2(D)的分布,均值與協(xié)變量X之間呈線性關(guān)系,Y經(jīng)過(guò)標(biāo)準(zhǔn)化后的生存函數(shù)為S0([y-MD,X)]/b(D))。在無(wú)法確定誤差分布的情況下,如果測(cè)量值的均數(shù)可以寫成下面的形式:MD,X)=a+PD+Y'X+8'XD則ROC曲線模型為:TP(FP)=S{a+bS-1(FP)+cX+cX+cX}(2-2)

001122pp其中:?..a=-P/b(D=1),b=b(D=0)/b(D=1)匕二—々/b(D=1)k=1,2,p,模型中的參數(shù)可以利用擬似然(quasi-likelihood)方法進(jìn)行估計(jì):了切D,X)Y-MD,X)—(i——i~)(i——1)=0(2-3)「]gd(D)式中a表示口(D,X)中所要估計(jì)的參數(shù),兩組的方差則分別為:b2(D=0)=£[Y-MD=0,X)]2/nNi=1TOC\o"1-5"\h\z\o"CurrentDocument"b2(D=1)=£[Y-^(D=1,X.)]2/n(2-4)i=1其中nA和nN為兩組的檢測(cè)例數(shù)。ROC曲線的基礎(chǔ)生存函數(shù)S0的估計(jì),可以利用非參數(shù)方法獲得:\o"CurrentDocument"S(y)=n-1況I[Y-MD,X)/b(D)>y](2-5)0iiiii=1函數(shù)I取1或0值。由擬合出的ROC曲線能夠估計(jì)出曲線下的面積,其標(biāo)準(zhǔn)誤可采用Bootstrap方法進(jìn)行估計(jì)。特殊的,在正態(tài)分布的情況下,ROC曲線的模型為:TP(FP)=1—①{a+b①-1(1—FP)+cX+cX+cX}1122ppROC曲線下的面積為:...e(X)或火D=LX)P(D=0,X)]=——。+8'X](2-6)v'b2(D=0)+b2(D=1)頊b2(D=0)+b2(D=1)

其中①為標(biāo)準(zhǔn)正態(tài)的分布函數(shù)。在兩組方差相近情況下,線性模型參數(shù)估計(jì)的擬似然估計(jì)與最小二乘法相差不是很大,因此實(shí)際中也可以采用普通的線性回歸方法獲得近似的ROC曲線。最小二乘估計(jì)在兩組方差不同情況下得到的也是無(wú)偏估計(jì),但參數(shù)估計(jì)的標(biāo)準(zhǔn)誤偏大,因此最好使用擬似然法對(duì)參數(shù)進(jìn)行估計(jì)。三、有序診斷結(jié)果的ROC模型對(duì)于有序診斷試驗(yàn),可以采用有序回歸模型構(gòu)建ROC模型。其基本思想是,將實(shí)驗(yàn)結(jié)果Y=1,2,g看作由一個(gè)潛在的連續(xù)變量Y*在不同分組截?cái)帱c(diǎn)(cutpoints)上經(jīng)過(guò)分組后得到的結(jié)果,?在此基礎(chǔ)上通過(guò)包含位置參數(shù)和尺度參數(shù)的有序模型作為生存函數(shù),構(gòu)建合適的ROC模型。Toledano(1996)提出了基于正態(tài)分布的多變量ROC模型,并給出了相應(yīng)面積估計(jì)誤差公式,但使用這種方法需要特殊的計(jì)算程序。我們采用簡(jiǎn)單的有序logistic模型作為“生存函數(shù)”,相應(yīng)的ROC模型為:c1+exp[-(a+P(D=1)+y'X+5'X(D=c1+exp[-(a+P(D=1)+y'X+5'X(D=1))]、'c''['c=1,2,FP=八。c1+exp[-(a+P(D=0)+y'X+5'X(D=0))]其中X=(X,X,X,,X)',y=(,Y,Y,,Y)',5=(5,5,123p123p12由于ROC曲線與分類點(diǎn)的選擇無(wú)關(guān),消去以c得到ROC曲線方程:.TP=r——(2-8)1+(FP-1-1)exp[-(P+5'X)]ROC曲線下而積可以通過(guò)積分得到,即:6=1-—-袂豈(2-9)13(1-S)2其中&=exp[(P+5'X)]。參數(shù)估計(jì)時(shí)可以診斷測(cè)量的結(jié)果變量為應(yīng)變量,以由“金標(biāo)準(zhǔn)”得到的結(jié)果變量D和協(xié)變量X及交互項(xiàng)作為自變量,作有序logistic回歸,得到的參數(shù)即為模型(2-7)中的參數(shù)估計(jì)。根據(jù)實(shí)際資料得到參數(shù)估計(jì)值P和5'后,可由式(2-9)得到。的估計(jì)值6。6的方差估計(jì)為:m(6)=(華)2”(&)=[E羽3-1)]23(&)(2-10)d&(&-1)3財(cái)&)=(")2財(cái)(p)+£(;:)2財(cái)(8z)+2^[(言)(")]Cm(p,81)+TOC\o"1-5"\h\zi=1ii=1i江[(京)(京E(8i,8J)1豐JiJ=[exp(p+£8X)]2Var(p)+£[X2[exp(P+E8X)]2Var(8)]+kkikk1k=1i=1k=12£[X[exp(P+£8X)]2Cov(P,8,)]+i=1k=12£[XX.[exp(P+£8X)]2Cov(8r8p]詳jk=1關(guān)于0的可信區(qū)間估計(jì),有兩種方法:一是現(xiàn)根據(jù)模型參數(shù)的方差Var(p)、Var(8)和協(xié)方差Var(p,8)求出&的可信區(qū)間,然后再計(jì)算0的可信區(qū)間;二是直接根據(jù)Var(0)算出。由于P和8的正態(tài)性較好,使用前者效果更好一些。一般情況下,正態(tài)模型和logistic模型對(duì)數(shù)據(jù)擬合的結(jié)果相近。還有一些可供使用的擬合模型,如雙對(duì)數(shù)、負(fù)指數(shù)、Poisson、Gamma等模型。理論上講,用哪種模型,與診斷變量的隱變量Y*實(shí)際分布有關(guān),但有研究表明:實(shí)際中無(wú)需對(duì)其分布做出嚴(yán)格的假定,它基于兩個(gè)理由:①診斷變量即使真正服從正態(tài)分布,實(shí)際中選擇不同的分類截?cái)帱c(diǎn),可以使患病組與非患病組的分布形狀有很大的變化,ROC曲線自然也要發(fā)生變化,難以從有序分類結(jié)果推斷隱變量Y*的分布;②ROC曲線不能為已決定診斷變量的分布,如果對(duì)診斷變量實(shí)施一些單調(diào)變換,將會(huì)有不同的基礎(chǔ)分部,但ROC曲線的函數(shù)形式卻不改變。因此,用不同的有序模型通常差別不大,而僅僅是ROC曲線的數(shù)學(xué)表達(dá)形式不同。但要注意,理論上用參數(shù)較多的模型擬合的效果更好一些,如采用更一般化的有序logistic模型:logitP=a廣中、z)/ex頓Z,結(jié)果會(huì)更加準(zhǔn)確。四、實(shí)例分析例1臨床試驗(yàn)顯示,動(dòng)脈硬化患者的脈聲中高頻含量遠(yuǎn)比健康者多。根據(jù)這一原理有關(guān)專業(yè)人員在制作“電腦動(dòng)脈測(cè)試儀”時(shí),試驗(yàn)功率譜的相關(guān)值SER(5)對(duì)檢測(cè)動(dòng)脈硬化的區(qū)分能力。試驗(yàn)時(shí)對(duì)經(jīng)臨床診斷的108例動(dòng)脈硬化患者和198例正常人進(jìn)行測(cè)量,資料如表1.表1使用SER(5)檢測(cè)動(dòng)脈硬化的診斷試驗(yàn)數(shù)據(jù)編動(dòng)年齡SER編動(dòng)年齡SER編動(dòng)年齡SER號(hào)脈硬化(歲)(5)號(hào)脈硬化(歲)(5)號(hào)脈硬化(歲)(5)

1072543370403633011661080204336780399713021581059303812199049178330317997140481668????????????3041706150552784????????????3051651707605945173001565173061641026為使數(shù)據(jù)接近正態(tài)分布,對(duì)表1中SER(5)的數(shù)據(jù)作對(duì)數(shù)變換。然后為了確定ROC模型中的參數(shù)是否具有顯著意義,可以采用普通線性模型方法進(jìn)行檢驗(yàn),結(jié)果如表2??梢钥闯觯瑓f(xié)變量年齡及疾病狀態(tài)與年齡的交互作用都為顯著。注意:這里并沒(méi)有對(duì)數(shù)據(jù)模型的誤差作正態(tài)和等方差的假定,因此只是一個(gè)意向性的檢驗(yàn)。表2診斷試驗(yàn)的線性回歸參數(shù)估計(jì)變量自由度參數(shù)估計(jì)值標(biāo)準(zhǔn)誤t值P值截距11.558620.0908217.16<0.0001疾病10.450140.294261.530.1271年齡10.029590.0022613.11<0.0001疾病X年齡1-0.015530.00512-3.040.0026進(jìn)一步用擬似然的方法擬合線性模型,結(jié)果與最小一乘估計(jì)的結(jié)果相同,即有:R(D,X)=1.55862+0.4501D+0.02959X-0.01553XD根據(jù)(2-4)得到a(D=0)=0.42319,a(D=1)=0.47497,因此ROC曲線方程為:FP(1-特異度)TP(FP)=S0(-0.94771+0.89098S01(FP)+0.03270X)FP(1-特異度)表3對(duì)不同年齡SER(5)診斷動(dòng)脈硬化的ROC曲線下面積估計(jì)評(píng)價(jià)指標(biāo)30歲40歲50歲60歲70歲0(X)0.50500.61960.72280.80680.8665SE{e(X)}0.12450.08880.55200.04010.0395利用ROC曲線方程,可以采用梯形法計(jì)算出在不同協(xié)變量取值下的ROC曲線下面積(本例采用300個(gè)區(qū)間),同時(shí)利用1000個(gè)Bootstrap樣本計(jì)算出面積的標(biāo)準(zhǔn)誤。結(jié)果見表3,圖1給出了三個(gè)不同年齡段的經(jīng)驗(yàn)ROC曲線??梢钥闯?,用SER(5)診斷動(dòng)脈硬化對(duì)高年齡組更有意義。上面給出的多變量ROC模型,可以直接處理實(shí)際中診斷測(cè)量為連續(xù)型,具有協(xié)變量混雜或干擾的一些問(wèn)題。在評(píng)價(jià)SER(5)對(duì)檢測(cè)動(dòng)脈硬化例子中,由于不同年齡組的人本身SER(5)就有很大的差別,在評(píng)價(jià)SER(5)的診斷作用時(shí),必須考慮年齡對(duì)診斷的影響,某一水平的SER(5)對(duì)年輕人可能屬于正常范圍,而對(duì)老年人則可能是動(dòng)脈硬化的表現(xiàn),利用文中給出的模型可以較好地解決這一問(wèn)題。至于為什么SER(5)對(duì)不同年齡組的人

診斷效果不同(交互項(xiàng)作用),對(duì)低年齡組(如年齡V50歲)區(qū)分能力低的問(wèn)題,除測(cè)量方法外,也有可能由于所取樣本信息不足所致。例2采用X線診斷縱膈淋巴結(jié)腫大。先收集了3名放射醫(yī)生采用5分類評(píng)價(jià)方法得到的數(shù)據(jù),以病理分析結(jié)果作為診斷的金標(biāo)準(zhǔn),其中115例有縱膈淋巴結(jié)腫大,94例無(wú)蹤隔淋巴結(jié)腫大,結(jié)果見表4。本研究的目的是評(píng)價(jià)X線診斷縱膈淋巴結(jié)腫大的準(zhǔn)確度。表43名放射醫(yī)生采用X線診斷縱膈淋巴結(jié)腫大的數(shù)據(jù)閱片者疾病診斷的有序結(jié)果1234510188420111361519201385312125610133010974231256913注:疾病=0表示無(wú)縱膈淋巴結(jié)腫大;疾病=1表示有縱膈淋巴結(jié)腫大。本例需要考慮由于不同的閱片者是否有不同的X線診斷準(zhǔn)確度,如果不同,在估計(jì)ROC曲線時(shí)則必須考慮閱片者的影響。為此,先用有序logistic模型分析不同閱片者對(duì)估計(jì)ROC曲線的影響,即以診斷的有序結(jié)果作為應(yīng)變量,以疾病狀態(tài)和閱片者作為自變量進(jìn)行分析。閱片者作為協(xié)變量可以定義2個(gè)二分類指標(biāo)%和X2,用(X],X2)=(0,0)表示第一個(gè)閱片者,(X],X2)=(1,0)表示第二個(gè)閱片者,(%,X2)=(0,1)表示第三個(gè)閱片者,交互項(xiàng)為X3=XD和X4=X2D,模型參數(shù)的估計(jì)和檢驗(yàn)結(jié)果見表5。需要注意的是參數(shù)估計(jì)的正負(fù)號(hào),如果使用logistic程序,有些軟件定義的累計(jì)概率P(YMcID,X)(如SAS),有些軟件定義的是P(Y>cID,X),ROC模型使用的是后者,如果屬于前者,則需要將效應(yīng)參數(shù)的正負(fù)符號(hào)取相反。表5診斷試驗(yàn)的logistic回歸參數(shù)估計(jì)變量名變量意義自由度參數(shù)估計(jì)值標(biāo)準(zhǔn)誤X2值P值D疾病13.57440.489653.2887<0.0001X1閱片者210.57330.47931.43110.2316X2閱片者311.07110.47085.17650.0229X3疾病乂閱片者21-1.04720.63162.74900.0973

疾病X閱片者疾病X閱片者3-1.54590.62776.06490.0138注:表中未列出截距(a'的參數(shù)估計(jì)結(jié)果,Cov(P,《)=-0.20444,Cov(g,52)=-0.21075從檢驗(yàn)結(jié)果可以看出,閱片者的煮主效應(yīng)和交互作用顯著(P<0.05),說(shuō)明閱片者對(duì)估計(jì)ROC曲線產(chǎn)生影響,ROC曲線方程為:TP=1+(FP-1-1)exp[—(3.5744-1.0472X-1.5459X2)]根據(jù)前面給出的公式,可以得到3個(gè)閱片者的ROC曲線下面積和標(biāo)準(zhǔn)誤的估計(jì)值(見表6)。醫(yī)生面積9標(biāo)準(zhǔn)誤醫(yī)生面積9標(biāo)準(zhǔn)誤se(Q)95%可信限閱片者10.92280.0259閱片者20.84840.0437閱片者30.79770.0517(0.8721,0.9735)(0.7627,0.9340)(0.6965,0.8989)表63名放射醫(yī)生用X線診斷縱膈淋巴結(jié)腫大診斷的準(zhǔn)確度估計(jì)例3用有序測(cè)量的ROC模型對(duì)例1的數(shù)據(jù)進(jìn)行分析。由于診斷變量K是一個(gè)連續(xù)的測(cè)量指標(biāo),按P、P、P、P四個(gè)百分位數(shù)分成55257595個(gè)數(shù)量等級(jí),其截?cái)帱c(diǎn)值分別為56、194、1394、4077,分析結(jié)果見表7和表8。表7有序logistic回歸參數(shù)估計(jì)變量自由度參數(shù)估計(jì)值標(biāo)準(zhǔn)誤X2值P值疾病1-0.78441.29530.36670.5448年齡1-0.12980.0123112.1506<0.0001疾病X年齡10.05250.02255.44730.0196表8對(duì)不同年齡SER(5)診斷動(dòng)脈硬化的ROC曲線下面積估計(jì)評(píng)價(jià)指標(biāo)30歲40歲50歲60歲70歲9(X)0.6290.7070.7760.8330.879SE{9(X)}0.1050.0690.0440.0350.036由表可見交互項(xiàng)作用顯著,表示SER(5)對(duì)動(dòng)脈硬化診斷效果在不同年齡段有所不同,應(yīng)分別考慮。ROC曲線方程為:TP=——11+(FP-1-1)exp[-(-0.7844+0.0525X)]

可以看出,與前面的結(jié)果相比,用有序logist回歸計(jì)算出的ROC曲線下面積的估計(jì)值略為偏高。第三節(jié)相關(guān)診斷數(shù)據(jù)的ROC分析相關(guān)診斷數(shù)據(jù)是指測(cè)量結(jié)果在各觀察單位之間不完全獨(dú)立,由診斷試驗(yàn)設(shè)計(jì)本身產(chǎn)生,它主要包括兩種情況:第一種數(shù)據(jù)結(jié)構(gòu)來(lái)自同一觀察對(duì)象重復(fù)接受多次測(cè)量或診斷,誤差是隨機(jī)的,它不限于劑量診斷,也可以是按等級(jí)分類的實(shí)驗(yàn)結(jié)果,如影像診斷試驗(yàn)進(jìn)行多次讀片,同一觀察對(duì)象的試驗(yàn)結(jié)果間不獨(dú)立,存在組內(nèi)相關(guān)性。第二種數(shù)據(jù)結(jié)構(gòu)產(chǎn)生于同一觀察對(duì)象接受不同的試驗(yàn),由于診斷結(jié)果在同一患者身上得到,數(shù)據(jù)間彼此也不完全獨(dú)立,用數(shù)據(jù)獨(dú)立分析方法得到的估計(jì)誤差與實(shí)際不相符,獲得的參數(shù)區(qū)間估計(jì)和假設(shè)檢驗(yàn)結(jié)果不準(zhǔn)確。以往多是對(duì)影像學(xué)中多個(gè)閱片者的ROC研究,主要采用混合效應(yīng)的方差分析(ANOVA)模型,以及Jackknif和Bootstrap^法估計(jì)不同的方差成分。本節(jié)沿用獨(dú)立診斷數(shù)據(jù)的ROC回歸模型,但所用的參數(shù)估計(jì)方法更為復(fù)雜。本節(jié)采用廣義估計(jì)方程(GEE)和Bootstrap兩種方法估計(jì)誤差。一、連續(xù)診斷變量的ROC分析1.ROC曲線模型在獨(dú)立診斷數(shù)據(jù)的ROC模型基礎(chǔ)上進(jìn)行擴(kuò)展。連續(xù)診斷變量重復(fù)測(cè)量的ROC分析,亦有相應(yīng)的參數(shù)估計(jì)的方法。為了簡(jiǎn)單,先考慮只有一種試驗(yàn)的情況,假定對(duì)每一例觀察對(duì)象重復(fù)測(cè)量的最大次數(shù)為m,則對(duì)第1例觀察對(duì)象的測(cè)量結(jié)果可表示為mi1的向量,mj為第1例觀察對(duì)象重復(fù)測(cè)量的次數(shù)血]m)。診斷試驗(yàn)結(jié)果丫口服從均值為.(Dj,Xj)和方差為j(D「的正態(tài)分布,均值與協(xié)變量X之間呈線性關(guān)系,并記患病組總體標(biāo)準(zhǔn)差為1);非患病組總體標(biāo)準(zhǔn)差為卜。]°);患病組和非患病組的診斷變量Y和Y服從任意分布(.),n和n為兩組的試驗(yàn)例數(shù)。在任意誤差分布的jAjNjAjNAN情況下,測(cè)量值的均數(shù)可以寫成下面的形式:(D,X)jROC曲線模型為:TP(FP)F°{abF°(D,X)jROC曲線模型為:TP(FP)F°{abF°1其中:a/(DD'Xj'XjD(3-1)')cXcXcX}(3-2)1122pp???1),b(D0)/(D1)2.模型的參數(shù)估計(jì)按照Liang和Zeger(1986)給出的廣義估計(jì)方程(generalizedestimatingequat,icGEE)的方法,式(3-1)的GEE參數(shù)估計(jì)為:n((叩"1Y(D,X)0(3-3)iiiii1式中表示(D,X)中所要估計(jì)的參數(shù)向量;V1為Y(Y,Y,,Y)的協(xié)方差矩陣,iii1i2imi為得到這一矩陣,規(guī)定如下工作相關(guān)矩陣(workingcorrelation,matrix

P21P1P21P1miP2miV=。A1/2RA1/2(3-4)iiiii其中Ai是m_xm_階表示均數(shù)與方差間函數(shù)關(guān)系的對(duì)角陣,即:A1/2=Diagfv(日)1/2,v(p)1/2,,v(p)1/2]'1112m特殊地,在正態(tài)假定下^(匕)=1,W=6(D,X)。-參數(shù)a的估計(jì)值a可利用通過(guò)迭代獲得,具體步驟如下:(1)用普通線性模型給出a的初始估計(jì)值;(2)由模型的標(biāo)準(zhǔn)殘差對(duì)作業(yè)相關(guān)矩陣R進(jìn)行估計(jì);(3)對(duì)a的估計(jì)值進(jìn)行迭代,第r+1步迭代值為:a(‘+1a(‘+1)=a(r)+£加缸X嘩1-i=1—-V-1也daida1-i=1(3-5)(4)循環(huán)到第2步,直至滿足迭代條件進(jìn)行下一步:(5)參數(shù)估計(jì)的方差-協(xié)方差陣:Xdpv1dpiXdpv1dpiV-1idaidai=11X蟲V-1var(Y)V-1

L=1da,…da(3-6)其中var(Y)=(Y-p)(Y-p)-1。iiiiiROC模型的GEE算法,除能解決重復(fù)測(cè)量問(wèn)題外,還有一個(gè)很大的優(yōu)點(diǎn),即在有缺失數(shù)據(jù)的情況下,參數(shù)估計(jì)可以照常進(jìn)行。在應(yīng)用時(shí)需要注意兩個(gè)問(wèn)題:一是作業(yè)相關(guān)矩陣有多種形式可供選擇,由于GEE估計(jì)的穩(wěn)健性,相關(guān)陣R的選擇對(duì)模型系數(shù)參數(shù)估計(jì)的影響并不大,但為了能夠正確估計(jì)組內(nèi)的方差,根據(jù)診斷試驗(yàn)的數(shù)據(jù)特點(diǎn),一般情況可以選擇對(duì)稱的可交換(exchangeable)相關(guān)矩陣,即同一觀察對(duì)象的不同測(cè)量值具有相同的組內(nèi)相關(guān);二是GEE主要考慮的是固定效應(yīng)的分析,對(duì)模型隨機(jī)成分分析不夠,如沒(méi)有考慮協(xié)變量對(duì)方差的影響,對(duì)方差的分解也僅限于2個(gè)水平的情況,對(duì)于設(shè)計(jì)成多個(gè)水平的診斷試驗(yàn),如多中心、多個(gè)醫(yī)生、多次測(cè)量的診斷試驗(yàn),除需要得到ROC曲線外,常需要對(duì)不同水平的方差進(jìn)行估計(jì),這時(shí)最好采用混合效應(yīng)模型或多水平模型。3.ROC曲線下的面積的估計(jì)誤差為了簡(jiǎn)單,ROC曲線下面積的誤差估計(jì)使用Bootstrap法,其過(guò)程與步驟簡(jiǎn)述如下:(1)從原始“有病”實(shí)驗(yàn)樣本中又放回地抽取〃個(gè)觀察單位,從原始“無(wú)病”的試驗(yàn)A樣本中又放回的抽取nN個(gè)觀察單位,然后和在一起形成一個(gè)Bootstrap樣本。

對(duì)Bootstrap樣本的q個(gè)試驗(yàn),分別利用擬似然或GEE方法進(jìn)行參數(shù)估計(jì),獲得q個(gè)試驗(yàn)ROC曲線下面積七(j=1,2,,q)的Bootstrap估計(jì)值?!?r=1,2,,R)。重復(fù)前面兩個(gè)步驟R次,q?種試驗(yàn)各獲得R個(gè)ROC曲線下面積的估計(jì)值。計(jì)算q種試驗(yàn)的ROC曲線下面積的協(xié)方差矩陣:Cov(0.,0)=二龍(0*-0.*)(%*—&「)(3-7)jkR—1jrjkrki=1其中:0;=R—E0jri=1在獲得ROC曲線下面積的協(xié)方差矩陣后,可以采用正態(tài)理論得到O’.的區(qū)間估計(jì),也可以對(duì)各試驗(yàn)的ROC曲線下面積進(jìn)行假設(shè)檢驗(yàn)。二、有序診斷數(shù)據(jù)的ROC分析有序診斷數(shù)據(jù)的ROC模型同樣可以在獨(dú)立診斷數(shù)據(jù)的有序ROC基礎(chǔ)上進(jìn)行擴(kuò)展,可以有T種不同的診斷方法,每種方法有g(shù)個(gè)有序測(cè)量結(jié)果,每一例觀察對(duì)象重復(fù)測(cè)量的最大次數(shù)為m,為了表達(dá)簡(jiǎn)單僅考慮有一種實(shí)驗(yàn)的情況,如果采用簡(jiǎn)單的有序logistic模型作為“生存函數(shù)”,相應(yīng)的ROC模型為:TPc-1+exp[—(a+p(D=1)+Y'X+8'X(D=1))]<c1C=1,2,g—1(3-8)FPc—1+exp[-(a+0(D=0)+y'X+8'X(D=0))]??cX=(X,X,X,X)',Y=(Y,YJ,Y)',8=(8,8,8,0,0,0)',q<p。123p123p12pROC曲線方程為:…...TP(3-9)1TP(3-9)1+(FP-1—1)exp[—(0+8'X)]0=10=1(3-10)其中&=exp[(0+8'X)]。這種方法的最大優(yōu)點(diǎn)是,對(duì)于重復(fù)測(cè)量數(shù)據(jù)可以利用ROC模型中的效應(yīng)參數(shù)估計(jì),直接完成ROC曲線下面積及其誤差的估計(jì)。ROC模型參數(shù)估計(jì)的GEE估計(jì)假定診斷試驗(yàn)的有序反應(yīng)變量Y取值為c=1,2,g,由累計(jì)概率P(Y>c|D,X)可得丸=p(Y=c|D,X)的概率:C丸=p(Y>c|D,X)—p(Y>c+1|D,X)若假定對(duì)每一例觀察對(duì)象重復(fù)測(cè)量的最大次數(shù)為m,把變量Y化作只取0或1的g-1個(gè)二分類的指示變量,則對(duì)第i例觀察對(duì)象的測(cè)量結(jié)果可表示為gm_X1的向量,m.為第i例觀察對(duì)象的重復(fù)測(cè)量次數(shù)(m<m),診斷結(jié)果可以記作:iY=(Y,Y,,Y,Y,Y,,Y,,Y,Y,,Y)'iilli21i,g-1,1i12i22i,g-1,2ilri2ri(g-1)r.其中當(dāng)?shù)趖次測(cè)量%=h時(shí);丫血=1匕廣。.億主h),相應(yīng)的取值概率為:兀二(兀,兀,,兀,兀,兀,,兀,,兀,兀,,兀)'ii11i21i,g-1,1i12i22i,g-1,2i1ri2ri(g-1)r.兀.=?!觯╝),Y兀?=1;a是需要估計(jì)的參數(shù)向量,對(duì)于roc模型a=(P,y'力'),它c(diǎn)=1可由下面方程獲得:荒”氣(以)'V-1(Y—兀)=0(3-11)TOC\o"1-5"\h\z\o"CurrentDocument"daiii=1V為Y的作業(yè)方差矩陣,V應(yīng)盡可能選擇接近真實(shí)協(xié)方差矩陣,它是待估計(jì)參數(shù)a的函數(shù)。iii為得到這一矩陣,規(guī)定如下相關(guān)矩陣:Pi11Pi12Pi21Pi22P...i2m,iRi=Pi31Pi32?.p???13m.P.,_im,1?Pim,2?'■/im.m.」TOC\o"1-5"\h\zP舊是一個(gè)(g-1)X(g-1)階矩陣,對(duì)角線元素P誼=A-1/2V-tAz-1/2。其中:V=Diag(兀)—兀兀',Diag(兀)表示主對(duì)角元素為兀的對(duì)角矩陣ititititititA-i/2=Diag[{丸(1—丸)}-1/2,{丸(1—丸)}-1/2,,{丸(1—丸)}-1/2]Pst(s壬t)的確定有不同的方法,理論上講給出的相關(guān)矩陣愈接近實(shí)際,估計(jì)的效率愈高。給出相關(guān)矩陣后,相應(yīng)的作業(yè)協(xié)方差矩陣為:V=A1/2RA1/2iiii其中:Ai/2=Diag[{K11(1—兀]])}1/2,{兀21(1一兀21)}1/2,,{兀("-丸(")1/2,,{兀ilm(1一兀偵,)}心七m(1一兀i刊)",,{兀,5(1一L)m,)荷…參數(shù)a的估計(jì)值a可利用Fisher得分算法,通過(guò)迭代獲得,得到ROC模型參數(shù)的估計(jì)值。三、實(shí)例分析例4牙髓電活力測(cè)試儀可以對(duì)牙髓的“炎癥'和“變性壞死”進(jìn)行診斷。先對(duì)一種國(guó)內(nèi)新開發(fā)的數(shù)字測(cè)試以進(jìn)行試驗(yàn),與一種進(jìn)口的測(cè)試儀器進(jìn)行比較,試驗(yàn)對(duì)104名患者用兩種儀器進(jìn)行了測(cè)試(表9),每名患者重復(fù)測(cè)量2次,后經(jīng)病理學(xué)檢驗(yàn)其中85名為炎癥牙髓,29名患者屬壞死牙髓,試對(duì)兩種儀器的診斷性能進(jìn)行分析。表9兩種牙髓電活力測(cè)試儀檢測(cè)牙髓壞死的診斷試驗(yàn)數(shù)據(jù)編號(hào)病理診斷年齡(歲)自發(fā)痛進(jìn)口儀器(電壓)國(guó)產(chǎn)儀器(電流)第1次測(cè)第2次測(cè)第1次測(cè)第2次測(cè)量量量量1128180802002002020024245657303105960113110404002226646150590282757551110,42,022868688112035138117117116113016136120120123114128021163163166采用連續(xù)診斷變量模型,用GEE方法對(duì)回歸模型的參數(shù)估計(jì)進(jìn)行檢驗(yàn),交互項(xiàng)不顯著。不包含交互項(xiàng)的GEE參數(shù)估計(jì)值見表10。表10診斷試驗(yàn)線性回歸模型的GEE參數(shù)估計(jì)變量進(jìn)口儀器國(guó)產(chǎn)儀器參數(shù)估計(jì)標(biāo)準(zhǔn)誤Z值P值參數(shù)估計(jì)標(biāo)準(zhǔn)誤Z值P值截距1.51180.058825.69<0.00011.89820.098319.31<0.0001疾病(D)0.26110.04865.37<0.00010.42200.06406.59<0.0001年齡(X1)-0.00370.0015-2.400.0166-0.00670.0023-2.870.0041自發(fā)痛(X20.10390.05481.900.05800.18470.07322.520.0116進(jìn)口儀器:日(D,X)=1.5118+0.2611D—0.0037X1+0.1039X2國(guó)產(chǎn)儀器:日(D,X)=1.8982+0.4220D—0.0067X1+0.1847X2由式(3-2)給出ROC曲線方程:

進(jìn)口儀器:TP(FP)=F{-1.16036+1.04165F-1(FP))00國(guó)產(chǎn)儀器:TP(FP)=F{-1.51086+1.18578F-1(FP))00利用ROC曲線方程,可以采用梯形法計(jì)算出ROC曲線下面積(本例采用300個(gè)區(qū)間),同時(shí)利用1000個(gè)Bootstrap樣本計(jì)算出面積的標(biāo)準(zhǔn)誤,95%置信區(qū)間的估計(jì)利用正態(tài)原理算出,結(jié)果見表11和表12。表11兩種牙髓電活力測(cè)試儀診斷牙患的ROC模型參數(shù)估計(jì)值估計(jì)方法進(jìn)口儀器國(guó)產(chǎn)儀器Cov(9亍92)91SE(91)92SE(92)任意分布0.81550.04110.84440.04500.001207正態(tài)分布0.78670.04110.83130.04270.001161表12兩種牙髓電活力測(cè)試儀診斷牙患的ROC曲線下面積的95%置信區(qū)間估計(jì)方法進(jìn)口儀器國(guó)產(chǎn)儀器任意分布正態(tài)分布0.73500.89620.75630.93260.70610.86730.74760.91500.8444—0.8444—0.8156=0.79871)+Var(92)-2C“(0成2)氣'0.04112+0.04502—2x0.001207P>0.05,兩種電活力測(cè)試儀診斷炎癥牙髓和壞死牙髓無(wú)顯著差別。第四節(jié)診斷試驗(yàn)的樣本含量估計(jì)診斷試驗(yàn)評(píng)價(jià)可以是一種新的診斷方法與“金標(biāo)準(zhǔn)”比較,也可以是一種改進(jìn)的診斷方法與常規(guī)診斷方法進(jìn)行比較;受檢者可能接受的是生化檢查的實(shí)驗(yàn)室診斷,也可能接受的是影像檢查診斷,不同診斷試驗(yàn)設(shè)計(jì)對(duì)樣本含量要求不同,一般情況下配對(duì)設(shè)計(jì)所需的樣本量比成組設(shè)計(jì)所需的樣本含量小很多,重復(fù)測(cè)量比單次測(cè)量所需的樣本量小,連續(xù)試驗(yàn)數(shù)據(jù)比有序分類試驗(yàn)數(shù)據(jù)所需的樣本量小。目前診斷試驗(yàn)已提出多種樣本含量估計(jì)的公式,主要基于參數(shù)方法、非參方法和穩(wěn)健方法。一、單個(gè)診斷試驗(yàn)評(píng)價(jià)的樣本含量估計(jì)單個(gè)診斷試驗(yàn)評(píng)價(jià)是指一種新的診斷方法與“金標(biāo)準(zhǔn)”進(jìn)行比較,它所需的樣本量可因測(cè)量方式和試驗(yàn)數(shù)據(jù)類型等不同而不同,樣本量估計(jì)的常用方法有以下幾種。雙正態(tài)法假設(shè)實(shí)際診斷試驗(yàn)評(píng)價(jià)中,X,Y分別表示非患者和患者診斷試驗(yàn)測(cè)量結(jié)果,且XeN(),YeN(四人,bj,經(jīng)單調(diào)轉(zhuǎn)換服從正態(tài)分布,則可用兩個(gè)參數(shù)確定ROC曲線,即8=(旦一四)/b,。=b/b。令^>^,ROC曲線下面積9為:0ANA1NAAN0=j+8.[60+py]p(y)dv(4-1)其中①是正態(tài)分布概率累積函數(shù)。對(duì)診斷試驗(yàn)評(píng)價(jià)通常是將待評(píng)價(jià)試驗(yàn)的準(zhǔn)確性與事先規(guī)定的無(wú)效值0°比較,即H0^=0-00=0,此時(shí)患病組樣本量NA為;N=N疽Z6竺(0)(4-2)A2上式中口為I類錯(cuò)誤率,6為H類錯(cuò)誤概率,Z為標(biāo)準(zhǔn)正態(tài)分布的分位數(shù),響*/『0),var(9)是無(wú)效假設(shè)時(shí)6的方差估計(jì)值,值為0的1-a可信區(qū)間長(zhǎng)度,即9的1-a可信區(qū)間上限值與下限值之差,V(0)用下式計(jì)算:V(0)=f2(1+B2/R+A2/2)+g2[B2(1+R)/2R]+2fgAB(4-3)式中A,B分別為參數(shù)60,61的估計(jì)值,R為非患病組與患病組樣本量的比例。中間量f、g的計(jì)算方法如下:/exp[-A2/2(1+B2)]-(AB)exp[-A2/2(1+B2)]f=——?—,g=:e(1+B2)偵2兀(1+B2)3實(shí)際計(jì)算時(shí)使用下式取代公式(4-3):V(0)=f2(1+B2/R+A2/2)+g2[B2(1+R)/2R](4-4)其目的是使公式(3-4)中所隱含的A、B的協(xié)方差Cov(A,B)=AB/(2N)為零,得到0A較大的方差,保證估計(jì)結(jié)果更穩(wěn)健。實(shí)際應(yīng)用時(shí),通常假定非患病組與患病組的方差相同(B=1),A可以通過(guò)預(yù)期的曲線下面積0計(jì)算出來(lái),即A=、:'(1+B2)x①-1(0),也可以通過(guò)待評(píng)價(jià)試驗(yàn)預(yù)期的靈敏度TP和特異度1-FP計(jì)算A,即:A=B①-1(1—FP)—①-1(1-TP)。由上式可見,單一診斷試驗(yàn)準(zhǔn)確性ROC評(píng)價(jià),用雙正態(tài)法估計(jì)其所需樣本量,與下述條件有關(guān):①I類錯(cuò)誤概率,II類錯(cuò)誤概率;②非患病組和患病組標(biāo)準(zhǔn)差之比;③預(yù)期曲線下面積0,或待評(píng)試驗(yàn)預(yù)期靈敏度TP和特異度1-FP;④非患病組和患病組比例R;⑤預(yù)期曲線下面積0的1-a可信區(qū)間長(zhǎng)度。2.非參數(shù)法用非參數(shù)法對(duì)ROC估計(jì)時(shí),ROC曲線下面積估計(jì)值的標(biāo)準(zhǔn)誤SE(0)與0和樣本量間存在如下關(guān)系:SE(0)頊(1-0)+(氣T)(Qi項(xiàng))+氣一如項(xiàng))(4-5)式中Q1、Q2可通過(guò)。做近似估計(jì),即:Q=。/(2-0),Q=20/(1+0)12根據(jù)預(yù)期的ROC曲線下面積0及其標(biāo)準(zhǔn)誤SE(0)、患病組樣本量nA與非患病組樣本量n.的比例,即可導(dǎo)出所需樣本含量。3.穩(wěn)健法當(dāng)基本分布為連續(xù)分布時(shí),用x,r分別表示非患病組和患病組的診斷測(cè)量結(jié)果,此時(shí)ROC曲線下面積0=p(x<r),對(duì)此單一試驗(yàn)評(píng)價(jià)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論