版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
行業(yè)與FDA工作人員的指導(dǎo)原則
貝葉斯統(tǒng)計在醫(yī)療器械臨床試驗中應(yīng)用指南
文件發(fā)布日期:2010年2月5日
文件草稿于2006年5月23日發(fā)布
關(guān)于該文件的任何問題可以聯(lián)系GregCampbell博士(醫(yī)療器械和輻射健康中心,CDRH),
電話:301-796-5750;電子郵箱:一;您也可以聯(lián)系溝通、宣傳和發(fā)展辦公室(生物制品審
評與研究中心,CBER),電話:1-800-8354709或者301-827-1800。
美國衛(wèi)生和人類服務(wù)部
食品藥品管理局
器械和輻射健康中心
生物統(tǒng)計處
監(jiān)控與生物識別技術(shù)辦公司
CIB
生物制品審評與研究中心
包含非約束性建議
前吉
公眾意見
可以隨時向食品藥品管理局日程管理部提交書面意見和建議,該部位于馬里蘭州洛克維爾市
5630FishersLane,1061房間,(HFA-305),郵政編碼20852。
另外,電子留言還可以提交至一提交建議時請注明Docket2006D-0191號。直到機構(gòu)再版或修
訂更新文件時建議方可被采納。
副本
副本可從互聯(lián)網(wǎng)下載,下載地址:。您也可以發(fā)送郵件到郵箱.索要該指導(dǎo)原則的電子版或
者發(fā)傳真到240-276-3151索要紙質(zhì)版文件。索要指導(dǎo)原則時請注明您所需文件的文件號
(GGP代表辦公室將把文件號插入到括號中)。
您也可以從生物制品審評與研究中心(CBER)及溝通,宣傳和發(fā)展辦公室(HFM-40)
索要指導(dǎo)原則副本,辦公室位于1401RockvillePike,Suite200N,Rockville,MD
20852-1448,電話:1-800-835-4709或301-827-1800,E-mail:,互聯(lián)網(wǎng)地址:
包含非約束性建議
目錄
1.介紹..................................................................錯誤!未定義書簽。
2.序言..................................................................錯誤!未定義書簽。
2.1什么是貝葉斯統(tǒng)計?.................................................錯誤!未定義書簽。
2.2為什么使用貝葉斯方法進行醫(yī)療器械臨床試驗統(tǒng)計?...................錯誤!未定義書簽。
2.3為什么目前廣泛使用貝葉斯統(tǒng)計?....................................錯誤!未定義書簽。
2.4FDA應(yīng)該什么時候參加貝葉斯試驗規(guī)劃?..............................錯誤!未定義書簽。
2.5貝葉斯方法不能代替可靠的科學(xué)。....................................錯誤!未定義書簽。
2.6使用貝葉斯方法的潛在優(yōu)勢是什么?..................................錯誤!未定義書簽。
2.7使用貝葉斯方法的潛在挑戰(zhàn)是什么?..................................錯誤!未定義書簽。
2.8什么軟件程序可以進行貝葉斯分析?..................................錯誤!未定義書簽。
2.9什么途徑可以用于更多了解貝葉斯統(tǒng)計?..............................錯誤!未定義書簽。
3.貝葉斯統(tǒng)計............................................................錯誤!未定義書簽。
3.1結(jié)果和參數(shù)........................................................錯誤!未定義書簽。
3.2貝葉斯范式........................................................錯誤!未定義書簽。
3.3什么是先驗分布?...................................................錯誤!未定義書簽。
3.4什么是觀測數(shù)據(jù)的似然性?..........................................錯誤!未定義書簽。
3.5什么是后驗分布?...................................................錯誤!未定義書簽。
3.6什么是預(yù)測分布?.................................................錯誤!未定義書簽。
3.7什么是可交換性?...................................................錯誤!未定義書簽。
3.8似然原理是什么?...................................................錯誤!未定義書簽。
4.規(guī)劃貝葉斯臨床試驗....................................................錯誤!未定義書簽。
4.1貝葉斯試驗始于完善的臨床試驗設(shè)計..................................錯誤!未定義書簽。
4.2選擇相關(guān)的臨床試驗終點............................................錯誤!未定義書簽。
4.3選擇其它重要信息:協(xié)變量..........................................錯誤!未定義書簽。
4.4選擇對照:對照組.................................................錯誤!未定義書簽。
4.5試驗終點的先驗信息:先驗分布......................................錯誤!未定義書簽。
4.6從其他研究借力:層次模型..........................................錯誤!未定義書簽。
4.7確定樣本量.......................................................錯誤!未定義書簽。
4.8評估貝葉斯設(shè)計的可操作特性........................................錯誤!未定義書簽。
4.9貝葉斯多因素分析調(diào)整.............................................錯誤!未定義書簽。
4.10貝葉斯自適應(yīng)設(shè)計................................................錯誤!未定義書簽。
5.分析貝葉斯臨床試驗....................................................錯誤!未定義書簽。
5.1后驗分布概要......................................................錯誤!未定義書簽。
5.2假設(shè)檢驗.........................................................錯誤!未定義書簽。
5.3區(qū)間估計..........................................................錯誤!未定義書簽。
5.4預(yù)測概率..........................................................錯誤!未定義書簽。
5.5中期分析..........................................................錯誤!未定義書簽。
5.6模型校驗.........................................................錯誤!未定義書簽。
5.7敏感性分析.......................................................錯誤!未定義書簽。
5.8決策分析..........................................................錯誤!未定義書簽。
6.上市后監(jiān)管............................................................錯誤!未定義書簽。
7.技術(shù)細(xì)節(jié)..............................................................錯誤!未定義書簽。
7.1試驗計劃書中所包含的建議信息......................................錯誤!未定義書簽。
7.2模擬獲得工作特性.................................................錯誤!未定義書簽。
7.3模型選擇.........................................................錯誤!未定義書簽。
7.4應(yīng)用后驗預(yù)測校驗可交換性..........................................錯誤!未定義書簽。
7.5計算..............................................................錯誤!未定義書簽。
8.參考文獻..............................................................錯誤!未定義書簽。
行業(yè)與FDA工作人員的指導(dǎo)原則
在醫(yī)療器械臨床試驗中應(yīng)用
貝葉斯統(tǒng)計的指導(dǎo)原則
本指導(dǎo)原則代表了食品藥品管理局(FDA)關(guān)于該主題目前的想法。它不創(chuàng)造或賦予任何
人任何權(quán)利,其操作也不綁定FDA或公眾。在選擇的方法能夠滿足適用的法規(guī)和規(guī)章要求
的前提下,可以選擇使用貝葉斯統(tǒng)計之外的另一種方法。如果您想討論一種替代方法,可
以聯(lián)系FDA專門負(fù)責(zé)該指南實施的工作人員。如果您不能確定適當(dāng)?shù)腇DA工作人員,請撥
打本指導(dǎo)原則封面所列出的相應(yīng)的電話號碼。
1.介紹
該文件主要提供了應(yīng)用貝葉斯統(tǒng)計方法進行醫(yī)療器械臨床試驗設(shè)計及分析統(tǒng)計方面的指導(dǎo)。
本指導(dǎo)原則的目的是討論在醫(yī)療器械臨床試驗中應(yīng)用貝葉斯所遇到的重要統(tǒng)計問題,而并不
是描述醫(yī)療器械提交的內(nèi)容。而且,盡管本文件提供了在貝葉斯臨床試驗中所遇到的許多統(tǒng)
計學(xué)問題的指導(dǎo),但并非包羅萬象。關(guān)于貝葉斯統(tǒng)計的理論與方法有豐富的書籍與論文等統(tǒng)
計學(xué)文獻;為進一步討論具體議題已列出選定參考書目。
FDA的指導(dǎo)文件,包括本指導(dǎo)原則,不具任何強制性法律責(zé)任。相反,指導(dǎo)原則僅描述了機
構(gòu)關(guān)于本議題目前的想法,應(yīng)僅被視為建議,除非引用了具體的法規(guī)或法令要求。在機構(gòu)指
導(dǎo)原則中使用“應(yīng)該(should)”一詞表示某些事情是建議或推薦的,而非必需的。
2.序言
2.1什么是貝葉斯統(tǒng)計?
貝葉斯統(tǒng)計是一種從積累的證據(jù)中學(xué)習(xí)的方法。在臨床試驗中,傳統(tǒng)的(頻率論)統(tǒng)計
方法僅在試驗設(shè)計階段利用以往的研究信息。然后,在數(shù)據(jù)分析階段,從試驗中所獲得
的信息僅被認(rèn)為是正式分析的補充數(shù)據(jù)而不是其中一部分?jǐn)?shù)據(jù)。相反,貝葉斯方法使用
貝葉斯理論在考慮數(shù)量利益的前提下正式將之前的信息與當(dāng)前的信息結(jié)合。貝葉斯的想
法是將先驗信息和試驗結(jié)果均考慮作為連續(xù)數(shù)據(jù)流的一部分,因此,每當(dāng)有新數(shù)據(jù)產(chǎn)生,
推論就會更新。
在整個文件中,我們將使用術(shù)語“先驗分布”,”先驗概率",或簡單的“先驗”來指貝葉
斯計算中所用到的數(shù)學(xué)實體(概率分布)。術(shù)語“先驗信息”是指用以構(gòu)建先驗分布的
所有信息。
2.2為什么使用貝葉斯方法進行醫(yī)療器械臨床試驗統(tǒng)計?
有先驗的信息
當(dāng)某器械具有良好的臨床使用相關(guān)的經(jīng)驗性信息時,貝葉斯方法就將此信息納入臨床試
驗的統(tǒng)計分析。在某些情況下,器械的先驗信息很有可能僅是小規(guī)?;蚨虝r間的關(guān)鍵試
驗的理由。
良好的先驗信息往往由于其作用機制及進化發(fā)展而可用于醫(yī)療器械。醫(yī)療器械的作用機
制通常是物理的。因此,器械的影響通常是局部的,而不是系統(tǒng)的。在對現(xiàn)有器械僅進
行了較小改變的前提下,局部效應(yīng)有時是可以通過前幾代器械的先驗信息而預(yù)測的。良
好的先驗信息也可以從器械的國外臨床研究中獲得。在一項隨機對照試驗中,對照組的
先驗信息可以從歷史對照數(shù)據(jù)中獲得。
我們的經(jīng)驗是,如果先驗信息是基于諸如臨床試驗數(shù)據(jù)等經(jīng)驗數(shù)據(jù)而得來的,那么貝葉
斯方法通常爭議較少。但是,如果先驗信息主要是基于個人意見(往往來源于“專家”
的啟發(fā)),那么貝葉斯方法就會起爭議。
沒有先驗的信息
貝葉斯方法也經(jīng)常用在沒有先驗信息時。首先,該方法適用于適應(yīng)性試驗(例如,中期
分析,樣本量改變,或者隨機方案改變等),甚至是一些計劃外的但必須要做出調(diào)整的
試驗。第二,當(dāng)頻率論難以實施或者不存在時,貝葉斯方法可以用于復(fù)雜模型的分析。
貝葉斯方法的其他潛在用途包括丟失數(shù)據(jù)的調(diào)整,靈敏度分析,多重比較和最優(yōu)決策(貝
葉斯決策理論)。
減少麻煩
當(dāng)正確使用時,貝葉斯方法所產(chǎn)生的麻煩比頻率論方法要少得多I。聯(lián)邦食品、藥品和
化妝品法案(FFDCA)513(a)(3)部分規(guī)定,F(xiàn)DA在評價一種器械的效果并有可能導(dǎo)致該
器械批準(zhǔn)時應(yīng)考慮最小麻煩的恰當(dāng)方法(參見21U.S.C.360c(a)(3))。
2.3為什么目前廣泛使用貝葉斯統(tǒng)計?
貝葉斯分析常常計算強度很大。但是,最近計算算法和運算速度的突破使人們能夠?qū)崿F(xiàn)
對非常復(fù)雜和現(xiàn)實的貝葉斯模型進行計算。這些進展導(dǎo)致了貝葉斯方法普及的巨大增長
(cf.Malakoff,1999)?;镜挠嬎愎ぞ呤且环N叫MarkovChainMonteCarlo(MCMC)
采樣的方法,該方法可模擬隨機量分布。
2.4FDA應(yīng)該什么時候參加貝葉斯試驗規(guī)劃?
對于任何臨床試驗,我們都建議您安排會議,討論試驗設(shè)計和模型。對于貝葉斯設(shè)計,
我們建議您在研究開始前先與FDA討論先驗信息。如果需要器械臨床研究豁免(IDE),
我們建議您在遞交IDE之前先與FDA溝通。
2.5貝葉斯方法不能代替可靠的科學(xué)。
無論您是使用貝葉斯方法還是使用頻率論的方法,科學(xué)合理的臨床試驗規(guī)劃和嚴(yán)謹(jǐn)?shù)脑?/p>
驗實施均是非常重要的。我們建議您在考慮隨機,同期對照,前瞻性規(guī)劃,盲法,偏見,
精度和進入成功的臨床試驗的所有其他因素時保持警惕。見章節(jié)4.1:貝葉斯試驗始于
完善的臨床試驗設(shè)計。
1應(yīng)用貝葉斯方法進行醫(yī)療器械臨床試驗的兩個成功例子:
TRANSCAN().將先驗信息與之前.的研究結(jié)果結(jié)合起來,大大減少了可顯示有效性所需的樣本量。
INTERFIX().本試驗采用的是中期分析;基于貝葉斯方法對未來成功率的預(yù)測模型,試驗提前結(jié)束。未使用先驗
信息。
2.6使用貝葉斯方法的潛在優(yōu)勢是什么?
2.6.1更多的決策信息
在貝葉斯分析過程中結(jié)合先驗信息可以將從當(dāng)前試驗所獲得的信息放大,精確度提高。
貝葉斯分析還將承擔(dān)額外的,相關(guān)的,先驗信息,這可以幫助FDA做出決定。
2.6.2通過先驗信息可以減少試驗樣本量
在某些情況下,使用先驗信息可減少大規(guī)模臨床試驗的樣本量。
但是,貝葉斯分析結(jié)合先驗信息不一定能夠保證當(dāng)前試驗樣本量的減少。參見章節(jié)4.7,
本章節(jié)會進一步討論貝葉斯臨床試驗中所涉及的樣本量問題。
另外,如果先驗信息與臨床試驗結(jié)果不是十分一致,那么貝葉斯分析實際上可能就是不
結(jié)合先驗信息的相對保守的頻率論或者貝葉斯分析。
2.6.3通過適應(yīng)性試驗設(shè)計可以減少樣本量
適應(yīng)性設(shè)計使用積累的數(shù)據(jù),以決定如何根據(jù)預(yù)先指定的計劃來修改臨床試驗的某些方
面。若條件許可,他們經(jīng)常被用來提前結(jié)束試驗,從而潛在性地減少了臨床試驗樣本量。
有些時候,使用貝葉斯方法比頻率論的方法更容易實現(xiàn)適應(yīng)性試驗設(shè)計?。秉承似然原理,
貝葉斯方法可以提供靈活的適應(yīng)性臨床試驗的設(shè)計和分析(參見章節(jié)3.8和4.10)。
2.6.4.試驗設(shè)計的中段變化
通過適當(dāng)?shù)囊?guī)劃,貝葉斯方法也可以提供靈活的試驗設(shè)計的中段變化。一些可能性包括
刪除不利的治療裝備或修改隨機計戈I」。當(dāng)涉及倫理敏感性研究或者是治療裝備臨床試驗
入組困難時需要進行隨機方案的修改。貝葉斯方法在臨床試驗過程中可以特別靈活地改
變控制隨機化。討論參見Kadane(1996),
2.6.5其它潛在的優(yōu)勢
精確分析
當(dāng)相應(yīng)的頻率論分析僅能達(dá)到近似或者難以實現(xiàn)時,使用貝葉斯方法將可以獲得準(zhǔn)確的
分析。
漏失數(shù)據(jù)
貝葉斯方法在處理漏失數(shù)據(jù)方面具有更大的靈活性。使用這些貝葉斯方法的討論參見章
節(jié)5.4。
多因素分析
多因素分析在臨床試驗中很普遍。例如,多終點推論或者多亞群試驗(例如種族或者性
別)等都是多因素分析的實例。貝葉斯方法的多因素分析問題不同于頻率論,可能更有
優(yōu)勢。參見章節(jié)4.9關(guān)于貝葉斯方法多因素分析調(diào)整的討論。
2.7使用貝葉斯方法的潛在挑戰(zhàn)是什么?
廣泛的預(yù)計劃
從監(jiān)管的角度來看,對于任何臨床試驗來說,規(guī)劃設(shè)計,實施和分析數(shù)據(jù)始終都是非常
重要的,但是對于貝葉斯試驗來說顯得尤為重要。在貝葉斯試驗中,必須在實驗設(shè)計階
段就考慮到以下因素并作出決斷:
?先驗信息
?本次試驗所能獲得的信息,以及
?將二者有機結(jié)合所需的數(shù)學(xué)模型。
對于先驗信息的不同選擇或者對于模型的不同選擇將會產(chǎn)生不同的結(jié)論。因此,在監(jiān)管
的環(huán)境中,貝葉斯臨床試驗的設(shè)計涉及先驗信息和計算模型相關(guān)的規(guī)范和協(xié)議。由于達(dá)
成協(xié)議往往是一個反復(fù)的過程,所以我們建議您盡早與FDA溝通協(xié)調(diào)以便就貝葉斯臨床
設(shè)計的基本方面與FDA達(dá)成一致。2
在臨床試驗的后期改變先驗信息或者計算模型將可能危及試驗結(jié)果的科學(xué)有效性?;?/p>
此原因,在使用貝葉斯方法時提前召開正式的協(xié)議會是適當(dāng)?shù)摹?/p>
2聯(lián)邦食品、藥品和化妝品法案提供了兩種早期協(xié)作會議方式:協(xié)定會議和決定會議。
參見§§513(a)(3)(D),520(g)(7)。具體細(xì)節(jié),請通過互聯(lián)網(wǎng)參考FDA關(guān)于早期合作會議的
指導(dǎo)原則,。
具體來講,確證先驗信息可能是協(xié)議會議的適當(dāng)主題。
廣泛的建模工作
使用貝葉斯方法進行臨床試驗涉及廣泛的數(shù)學(xué)建模工作,包括:
?選擇能夠反映先驗信息的概率分布,
?多個先驗信息數(shù)據(jù)源之間的關(guān)系,
?協(xié)變量對于患者治療結(jié)果及漏失數(shù)據(jù)的影響,以及
?模型選擇的靈敏度分析。
關(guān)于數(shù)學(xué)模型的選擇,我們建議您通過與FDA以及統(tǒng)計學(xué)和臨床試驗專家進行密切合作
從而達(dá)成一致。
特殊的統(tǒng)計學(xué)和計算專家
貝葉斯方法往往涉及特殊的統(tǒng)計學(xué)專家進行貝葉斯分析和計算。常用的專門計算法如
MCMC可用于:
?分析臨床試驗數(shù)據(jù),
?檢查模型假設(shè),
?在設(shè)計階段評價先驗概率,
?通過模擬評估各種結(jié)果的概率,以及
?估計樣本量。
通過結(jié)合先驗信息或沒有先驗信息,或者通過靈活的貝葉斯的臨床試驗設(shè)計(例如,中
期分析所導(dǎo)致的預(yù)期較小樣本量)所獲得的器械性能精確度的提高可以抵消成功設(shè)計,
實施和分析貝葉斯試驗所涉及的技術(shù)和統(tǒng)計的成本。
考慮先驗分析的選擇
FDA顧問小組可能會質(zhì)疑您和FDA事先商定的先驗信息。我們建議您從臨床和統(tǒng)計兩方
面準(zhǔn)備證明您對于先驗信息的選擇。另外,我們還建議您通過進行靈敏性分析來檢驗?zāi)?/p>
所選擇的數(shù)學(xué)模型在選擇不同先驗分布時的穩(wěn)定性。
醫(yī)療器械的標(biāo)簽
貝葉斯試驗結(jié)果與器械標(biāo)簽慣常所描述的試驗結(jié)果有不同的表達(dá)。貝葉斯術(shù)語尚未在器
械標(biāo)簽中普及3。
與往常一樣,我們建議您確保醫(yī)療器械標(biāo)簽所反映的試驗結(jié)果簡單易懂。
核對計算
貝葉斯模型的靈活性以及貝葉斯分析計算技術(shù)的復(fù)雜性大大增加了錯誤和誤解發(fā)生的
可能性。對于任何提交的文件,F(xiàn)DA都會進行詳細(xì)的統(tǒng)計審查,包括使用相同的或者替
代的軟件進行結(jié)果驗證。FDA建議您以電子文檔的形式提交數(shù)據(jù)和使用統(tǒng)計分析程序獲
得的指令集。
貝葉斯分析和頻率論分析可能得出不同的結(jié)論
兩組研究人員,每組具有相同的數(shù)據(jù)及不同的預(yù)先計劃的分析方法(一種是貝葉斯分析,
一種是頻率論分析),可以想象,他們會得出不同的結(jié)論,而且每種結(jié)論都科學(xué)有效。
貝葉斯方法往往因其良好的先驗信息而對研究者有利,這種方法也比頻率論方法更為保
守。(例如,參見章節(jié):規(guī)劃貝葉斯臨床試驗)。
如果臨床試驗已經(jīng)啟動,我們就不建議從頻率論分析改變?yōu)樨惾~斯分析(反之亦然)。
這種事后分析不科學(xué)合理,往往會削弱提交材料的可信度。
2.8什么軟件程序可以進行貝葉斯分析?
一種名為WinBUGS的較常用的非商品化軟件包,可專用于進行貝葉斯計算4。BUGS是
“應(yīng)用吉布斯模型進行貝葉斯推理”的首字母縮略語,是MCMC采樣的一種常見類型。
WinBUGS催生了另外兩個軟件包,BRUGS和OpenBUGS。BRUGS使BUGS能夠在流
行的非商品化軟件包R運行。OpenBUGS是BUGS的開源版本,允許用戶修改軟件包的
編程代碼。不久的將來有望出現(xiàn)其它的貝葉斯軟件包。我們建議您在選擇特定的軟件產(chǎn)
品之前,應(yīng)就您提交材料時所采用的計算方法來咨詢FDA的統(tǒng)計學(xué)專家。
3但是,在下述網(wǎng)址的相關(guān)標(biāo)簽可以看到一個例子(SSE:).
4WinBUGS程序可以從劍橋醫(yī)學(xué)研究中心的網(wǎng)址下載:www.mrc-bsu.cam.ac.uk。
OpenBUGS程序可從下述網(wǎng)站下載:。
2.9什么途徑可以用于更多了解貝葉斯統(tǒng)計?
關(guān)于貝葉斯統(tǒng)計和他們在醫(yī)學(xué)方面應(yīng)用的非技術(shù)性介紹參考資料包括Malakoff(1999),
Hively(1996),Kadane(1995),Brophy&Joseph(1995),Lilford&Braunholtz(1996),
Lewis&Wears(1993),Bland&Altman(1998),和Goodman(1999a,1999b)。O'Malley&
Normand(2003)討論了關(guān)于醫(yī)療器械臨床試驗的FDA進程和貝葉斯方法。Berry(1997)
專門為FDA撰寫了關(guān)于貝葉斯醫(yī)療器械臨床試驗的介紹。
Brophy&Joseph(1995)提供了一個眾所周知的應(yīng)用貝葉斯方法進行的三個臨床試驗的
合成體。Spiegelhalter,Abrams,&Myles(2004)全面總結(jié)了使用貝葉斯方法進行設(shè)計和分
析臨床試驗或進行醫(yī)療評估。
Berry(1996),DeGroot(1986),Stern(1998),Lee(1997),Lindley(1985),Gelman等(2004)
和CarlinandLouis(2008)介紹了并不強調(diào)醫(yī)療應(yīng)用的貝葉斯統(tǒng)計。
Spiegelhalter等(2000),Spiegelhalter等(1994),Berry&Stangl(1996).Breslow(1990),
Stangl&Berry(1998)和Box&Tiao(1992)討論了貝葉斯方法的技術(shù)細(xì)節(jié)和統(tǒng)計學(xué)術(shù)
語。
Gamerman&Lopes(2006)和Gilks,RichardsonandSpiegelhalter(1996)第一章包含了貝
葉斯計算的馬爾科夫鏈蒙特卡羅方法的技術(shù)概述。
貝葉斯分析的實際應(yīng)用出現(xiàn)在包括Spiegelhalter等(2004),Congdon(2003),Broemeling
(2007),Congdon(2007),Congdon(2005),Albert(2007)和Gilks等(1996)許多優(yōu)秀的書
籍中。
最佳貝葉斯決策的優(yōu)秀書籍(又稱貝葉斯決策理論)包括Berger(1986),Robert(2007),
RaiffaandSchlaifer(2000)和MHDeGroot(1970)。
互聯(lián)網(wǎng)上的貝葉斯分析國際協(xié)會網(wǎng)站有一系列相關(guān)資源。5
3.貝葉斯統(tǒng)計
5
3.1結(jié)果和參數(shù)
統(tǒng)計關(guān)注的是針對感興趣的未知量做出推論。感興趣的變量可能包括:
?與患者或者一些其它的試驗或者研究單位相關(guān)的結(jié)果,或者
?一個參數(shù),一個描述樣本人群特征的變量。
例如,器械臨床試驗的結(jié)果包括:
?不良事件(例如:死亡,腎衰竭,出血,心肌梗塞,復(fù)發(fā)),
?有效性測量(例如心臟功能,視力,患者的滿意度)和診斷性試驗結(jié)果。
參數(shù)能夠描述:
?嚴(yán)重不良事件的發(fā)生率,
?器械對患者有效的概率,
?患者的存活概率,和
?診斷性器械的靈敏性和特異性。
3.2貝葉斯范式
貝葉斯范式規(guī)定概率是唯一可以衡量未知量的不確定性的方法。在貝葉斯臨床試驗中,
根據(jù)概率來描述感興趣變量的不確定性,這種概率會隨著從試驗中收集到的信息變化而
更新。
先驗分布
在貝葉斯試驗開始和獲得數(shù)據(jù)之前,感興趣未知量的概率可能是所有可能的值(或值的
范圍)。這些概率,綜合在一起,構(gòu)成了那個變量的先驗分布。.在接受監(jiān)管審查的臨
床試驗,先驗分布往往基于之前的臨床試驗(盡管從數(shù)學(xué)上講,他們實際上并不需要按
照時間排序)。
貝葉斯理論和后驗概率
根據(jù)貝葉斯學(xué)說,當(dāng)取得試驗數(shù)據(jù)之后,先驗分布即可更新。這種更新后的分布稱為后
驗分布,從中可以獲得未知變量的概率值。該方法將當(dāng)前數(shù)據(jù)與以往信息(先驗概率)
相結(jié)合,是一種科學(xué)有效的方法。
該方法可應(yīng)用于隨知識積累的迭代方式:今天的后驗概率可能成為明天的先驗概率。
貝葉斯推理基于后驗分布。例如,貝葉斯決策過程中可能會排除后驗概率較小的一組參
數(shù)值(給定的觀測數(shù)據(jù))。
決策規(guī)則
對于醫(yī)療器械的前期市場評估,主要目的是合理地證明新器械的安全性和有效性,往往
通過預(yù)先制定的決策規(guī)則。傳統(tǒng)的假設(shè)檢驗就是一種類型的決策規(guī)則。對于貝葉斯試驗
而言,一種常見類型的決策規(guī)則認(rèn)為如果后驗概率足夠大(稍后會討論“足夠大”)就
可以證明假說成立(有合理保證)。
貝葉斯方法包括許多重要概念,其中有一些不屬于傳統(tǒng)統(tǒng)計方法。下面,我們將簡單地
討論這些概念并對比貝葉斯方法與頻率論方法。
3.3什么是先驗分布?
假設(shè)希臘字母。(“theta”)在一項臨床試驗中代表一個參數(shù)。關(guān)于數(shù)據(jù)收集之前0的初始
知識用9的先驗分布表示,我們用符號P(0)表示。
作為一個例子,假設(shè)0代表嚴(yán)重不良事件發(fā)生率。其可能的值位于0與1之間。先驗分布
可能優(yōu)先考慮較低的0值。圖1展示了一個這種先驗分布的例子。任何特定數(shù)值下0的概
率是由該組數(shù)值的曲線下面積決定的。因此,不良事件發(fā)生率0大于0.4的概率(陰影面
積)大約是0.38。
圖1.嚴(yán)重不良事件發(fā)生率(表示為0)先驗分布的單峰,右偏示意圖。0值大于0.4的先驗概率(陰影
面積)大約為0.38。
此外,另一種先驗分布是均勻分布的,對于任何0值均無偏好(圖2)。對于均勻分布而
言,8值位于0.2與0.3之間的概率是0.10,與。值位于0.7與0.8之間,或者0.55與0.65之間,
或者任何間隔長度是0.1的兩個數(shù)值之間的概率相同。對于這種先驗分布來說,0值大于
0.4(也以陰影部分的面積表示)的先驗概率是0.6。
0.00.8
圖2.嚴(yán)重不良事件發(fā)生率(表示為8)先驗分布均勻分布示意圖。。大于0.4的先驗概率(陰影部分面
積)為0.60。
3.4什么是觀測數(shù)據(jù)的似然性?
現(xiàn)在,假設(shè)結(jié)果是從臨床試驗獲得的。似然函數(shù)是觀察到的結(jié)果和參數(shù)0之間關(guān)系的數(shù)
學(xué)表示。似然函數(shù)可用符號P(數(shù)據(jù)|0)表示,代表每個可能的。值,在給定具體數(shù)值后
其觀測數(shù)據(jù)的條件概率。
3.5什么是后驗分布?
最終目標(biāo)是得到后驗分布,在獲得觀測數(shù)據(jù)的前提下,參數(shù)??赡軘?shù)值的概率,用符號
P(9|數(shù)據(jù))表示。貝葉斯理論通過似然性P(數(shù)據(jù)|0)更新。的先驗分布P(0),獲得0的后驗
分布(P(0|數(shù)據(jù)))o0的信息通過后驗分布得知,貝葉斯推理也正是基于此。
舉一個例子,圖3展示的是如果我們以之前的圖1為基礎(chǔ),觀測數(shù)據(jù)顯示10例患者中有1
例發(fā)生不良事件,所得到的后驗分布。既然在這群患者中不良事件發(fā)生率是0.10,那么
曲線分布就應(yīng)該更向左偏移(也就是說,現(xiàn)在的。值更低)。。值大于0.4的后驗概率(陰
影部分面積)約為0.04。通過分析觀察到的試驗結(jié)果,0值大于0.4的不良事件發(fā)生率的
概率從約為0.38(先驗概率)降為0.04(后驗概率)。
圖3.嚴(yán)重不良事件發(fā)生率(表示為0)后驗分布的單峰,右偏示意圖。以圖1為基礎(chǔ),觀測到10例患
者中有1例發(fā)生不良事件,更新圖1的先驗概率所得。9值大于0.4的后驗概率(陰影部分面積)約為0.04。
當(dāng)收集到更多的數(shù)據(jù)之后,今天所獲得的后驗分布就可能成為今后的先驗分布。累計的
信息越多,。值后驗分布的不確定性越小。隨著收集數(shù)據(jù)的增多,初始先驗分布的影響
逐漸減小。如果收集的數(shù)據(jù)足夠多,那么與似然性相比,先驗分布的相對重要性就可以
被忽略。
3.6什么是預(yù)測分布?
貝葉斯方法允許推導(dǎo)出特殊類型的后驗概率;就是說,可以通過已觀測到的結(jié)果預(yù)測未
觀測到的結(jié)果(未來或漏失數(shù)據(jù))的概率。這種概率成為預(yù)測概率。總的來說,未觀測
到的結(jié)果的所有可能值的概率被稱為預(yù)測分布.預(yù)測分布有許多種用途,包括:
?決定停止試驗的時間(基于尚未觀測患者的預(yù)測結(jié)果),
?幫助醫(yī)生和患者通過預(yù)測患者的臨床結(jié)果而做出決定,給出臨床試驗中已觀測
患者的臨床結(jié)果,
通過早期的或者更容易測量的結(jié)果預(yù)測患者的臨床結(jié)果,
?為漏失數(shù)據(jù)充實臨床試驗結(jié)果(插補),
?模型校驗。
第5章“貝葉斯臨床試驗分析”中將更詳細(xì)地討論這些用途。
3.7什么是可交換性?
可交換性是一個基于統(tǒng)計推斷的基本概念,在貝葉斯試驗中非常重要。正式地,如果在
某一組人群或試驗觀測到某些特殊結(jié)果的概率與重新排序后的沒變化,我們會說這一組
群體被認(rèn)為是可交換的。通過一些實例可以把這個概念表述的更加清晰。
患者可交換性
在臨床試驗中,入組的患者常被假定為可交換。在可交換性基礎(chǔ)上,臨床試驗的結(jié)果就
不依賴于患者的入組順序,觀測結(jié)果順序或者患者的任何重新索引或重新編號。臨床試
驗中,如果入組患者可以與其來源群體(即預(yù)期用途人群)患者交換的話,那么就可以
基于試驗患者的觀測數(shù)據(jù)推斷出人群的結(jié)果。因此,代表性樣本的概念就可以用可交換
性表示。
試驗可交換性
對于貝葉斯臨床試驗而言,通常會假定另一層次的可交換性。也就是說,當(dāng)以前的試
驗具有良好的初始信息時,可假定當(dāng)前試驗可與之交換。盡管承認(rèn)試驗不是在所有方面
均相同,但試驗可交換性的假說使得當(dāng)前的試驗可以向以前的試驗“借力”。因此,試
驗可交換性對于將試驗數(shù)據(jù)與先驗信息相結(jié)合而發(fā)展現(xiàn)實模型是非常重要的。
假設(shè)在未來的貝葉斯試驗中可以評價器械不良事件發(fā)生率,幾個歷史試驗可被提出作為
先驗信息。假設(shè)不良事件發(fā)生率在任何試驗都不會比其他試驗更大或者更小,那么所有
的試驗就可以被認(rèn)為是可交換的。
也就是說,試驗結(jié)果預(yù)期不會依賴任何特殊順序及試驗的重新索引或重新編號。特別是,
未來試驗不良事件發(fā)生率不比歷史試驗更低或者更高。
例如,假定兩個歷史試驗的不良事件發(fā)生率分別為0.05和0.07。那么,如果我們沒有任
何信息提示未來試驗的不良事件發(fā)生率低于,高于或者在兩個歷史試驗發(fā)生率之間,那
么就支持試驗的可交換性。
試驗可交換性可以被認(rèn)為是臨床試驗超總體的代表性樣本。歷史試驗為超總體提供信
息,而這些信息反過來也為未來試驗提供信息。以這種方式,就可實現(xiàn)未來試驗向歷史
試驗借力。
在實踐中決定可交換性
從實用角度來看,關(guān)于可交換性的判斷應(yīng)該綜合從臨床,工程以及統(tǒng)計學(xué)角度考慮。
?如果臨床醫(yī)生看到當(dāng)前試驗在實驗設(shè)計與實施方面與作為初始信息的歷史試
驗足夠相似的話會很滿意的?先驗的,他們不應(yīng)該有任何理由相信在任何給定
方向上,這些試驗之間有系統(tǒng)差異。特別地,他們不應(yīng)該能夠預(yù)測在提議的試
驗與其他之前的試驗之間有方向上的差異。
?如果試驗器械之間在設(shè)計及制造方面的任何差異都不會顯著改變器械的預(yù)期
性能,至少在感興趣參數(shù)方面,那么工程師就會很滿意。
?統(tǒng)計學(xué)家對于使用適當(dāng)?shù)慕y(tǒng)計模型會達(dá)成一致。統(tǒng)計模型應(yīng)該咨詢臨床醫(yī)師和
工程師。在某些情況下,可以通過消除試驗之間系統(tǒng)的,方向性的差異來構(gòu)建
模型,這樣就可以通過調(diào)整這些差異來達(dá)到仍然假定試驗可交換性的目的(參
見章節(jié)4.6)。
在試驗中使用貝葉斯層次模型可完成臨床試驗可交換性和患者可交換性(參見第4章節(jié):
規(guī)劃貝葉斯臨床試驗)。
對于可交換性的入門討論,參見Gelman等(2004),Spiegelhalter等(2004)或Lad(1996)。
關(guān)于可交換性的技術(shù)定義請參見Bernardo&Smith(1995)。
3.8似然原理是什么?
似然原理是一個重要的統(tǒng)計學(xué)概念,是貝葉斯方法的中樞?該原則指出,從臨床試驗獲
得的感興趣參數(shù)0的所有信息均包含在似然函數(shù)中。在貝葉斯方法,。的先驗分布通過
似然函數(shù),使用臨床試驗所提供的信息更新,沒有別的。貝葉斯分析關(guān)于。的所有推論
僅基于由此方式所產(chǎn)生的后驗分布。
一項試驗可以在很多方面改變,但不會改變其似然函數(shù)。堅持似然原則可以靈活地進行
貝葉斯臨床試驗,特別是在以下幾方面:
?改變樣本量,
?適當(dāng)?shù)脑O(shè)計,
?中期查找可能提早停止試驗的目的,
?多因素分析。
需要注意的是,處于監(jiān)管考慮,臨床試驗的修改需要在設(shè)計階段預(yù)先指定。
如上面所概述,貝葉斯分析的所有推論均基于堅持似然原則的后驗分布,后者僅是先驗
函數(shù)和似然函數(shù)的產(chǎn)物。盡管頻率論方法也廣泛使用似然函數(shù),但頻率論分析卻不能始
終堅持似然原則。例如,P值是基于有可能發(fā)生的結(jié)果,而不是試驗中實際觀測到的結(jié)
果,也就是說,基于外部似然性。
欲了解更多的似然原則,請參見Berger&Wolpert(1988),Berger&Berry(1988),Irony
(1993)和Barlow等(1989)。
4.規(guī)劃貝葉斯臨床試驗
4.1貝葉斯試驗始于完善的臨床試驗設(shè)計
貝葉斯和頻率論關(guān)于良好的臨床試驗設(shè)計的原則是相同的。部分綜合臨床試驗設(shè)計包
括:
試驗?zāi)繕?biāo),
,評價終點,
,臨床試驗實施的條件,
?研究的人群,和
?計劃好的統(tǒng)計分析。
我們建議您遵循良好臨床試驗設(shè)計和實施原則,包括最大限度地減少偏差。在選擇患者
得到何種治療方面引入隨機化原則會大大減少偏差。隨機化取樣使得關(guān)于協(xié)變量失衡概
率的具體陳述僅歸于偶然。對于相當(dāng)大的樣本量,隨機化可以確保所有協(xié)變量一定程度
的平衡,包括那些研究中沒有測量的變量。
醫(yī)師的掩蔽(也被稱為盲法)可以避免偏差,這些偏差可以在有意或無意的情況下被
引入患者的護理中,或者是引入評價基于臨床試驗期間接受治療而得到的患者臨床結(jié)果
中?;颊叩难诒慰梢詼p少因獲益期望而帶來的偏差。
我們建議您事先選擇要使用的分析類型(貝葉斯或者頻率論)。在獲得臨床觀測數(shù)據(jù)之
后再改變分析方法使之能夠獲得更理想的結(jié)果是有問題的。在分析階段很難證明這樣的
轉(zhuǎn)變。在某些情況下,新臨床試驗的貝葉斯分析可能會挽救之前偏離初始協(xié)議的非貝葉
斯臨床試驗所獲得的某些信息。這樣的試驗所提供的信息可由前瞻性貝葉斯臨床試驗所
使用的先驗分布所代表。
對于規(guī)劃試驗的進一步信息,參見FDA的“非診斷醫(yī)療器械統(tǒng)計指南”。6
4.2選擇相關(guān)的臨床試驗終點
終點(在本文件中也稱作參數(shù))是指用于支持器械某種權(quán)利要求的安全性和有效性的措
施。理想的終點是:
?臨床相關(guān)性,
?直接觀察,
?與器械的權(quán)利要求相關(guān),和
6
對患者重要。
例如,終點可以衡量試驗中觀察到的一個重要結(jié)果(發(fā)病率,死亡率,生活質(zhì)量)的平
均變化。
臨床試驗的目的是從試驗受試者收集信息,從而對那些未知的終點或者參數(shù)做出推論。
4.3選擇其它重要信息:協(xié)變量
協(xié)變量,又稱致混淆因子,是可以影響試驗結(jié)果的受試者的特征。有許多統(tǒng)計技術(shù),包
括貝葉斯和頻率論,可以調(diào)整協(xié)變量。在通過隨機化不能確保某種程度協(xié)變量平衡的情
況下,調(diào)整協(xié)變量就顯得尤為重要,例如在貝葉斯試驗中使用了其他試驗的先驗信息。
如果調(diào)整無助于試驗之間協(xié)變量的差異,那么分析必然產(chǎn)生偏差。調(diào)整協(xié)變量也可以減
少變異,從而導(dǎo)致更有力的分析。
4.4選擇對照:對照組
為便于評價臨床試驗結(jié)果,我們建議您使用比較或者對照組作為參考??梢钥紤]的對照
組類型有:
?同期對照,
?自身對照,和
?歷史對照。
我們相信自身對照和歷史對照與同期對照相比具有更多潛在的偏差,因為:
?協(xié)變量調(diào)整存在的潛在問題,
?安慰劑效應(yīng),和
?回歸平均。
另一種表示對照類型的方法是區(qū)分有效的治療對照(陽性對照組)和不治療對照(無效
對照組)或者假器械對照(安慰劑對照)。貝葉斯方法在陽性對照試驗中尤其有用,可
以證明新器械不僅不遜于陽性對照組,同時還優(yōu)于不治療組或者假器械對照組。貝葉斯
試驗可以通過比較之前試驗陽性對照組與無效對照組的結(jié)果來研究這個問題。Gould
(1991)和Simon(1999)對貝葉斯方法的陽性對照問題進行了討論。
貝葉斯方法可以將歷史對照與同期對照很好地結(jié)合起來。歷史對照可以看作是同期對照
的先驗信息。Pocock(1976),Spiegelhalter等(2004)),O,Malley,Normand和Kuntz(2003)
等均就貝葉斯方法中利用歷史對照作為先驗信息進行了討論,他們將歷史對照方法應(yīng)用
于冠狀動脈支架臨床試驗。
4.5試驗終點的先驗信息:先驗分布
回想一下,我們在實施一項研究之前對于一系列感興趣問題的知識(或者是缺乏的)是
通過先驗分布描述的。要仔細(xì)篩選恰當(dāng)?shù)南闰炐畔⒉⒅_地納入分析中。就試驗設(shè)
計與FDA進行討論時,無疑會包含對將先驗信息納入分析所選用模型的評價。
選擇先驗信息的來源
我們建議對盡量多來源的良好先驗信息進行鑒別。對于先驗信息“好”的判斷是主觀的。
因為您試驗的目的是通過臨床試驗FDA會批準(zhǔn)您的醫(yī)療器械,因此,您應(yīng)該在研究開始
之前將您所選擇的先驗信息遞交給FDA的審查員(臨床的,工程的和統(tǒng)計的),并就相
關(guān)問題與他們展開討論。
先驗信息的可能來源包括:
?國外開展的同類臨床試驗,
?患者登記表,
?類似產(chǎn)品的臨床資料,和
?初步研究結(jié)果。
一旦需要器械臨床研究豁免(IDE),您就必須提交完整的早前研究報告。7除了報告,
我們建議您同時提交構(gòu)成先驗信息時分析所用到的任何附加信息。在某些情況下,某些
有效的先驗信息可能無法取得(例如,數(shù)據(jù)可能屬于某些人,他們不愿意自己的數(shù)據(jù)被
別人合法使用)。我們建議您在提交IDE之前,與FDA召開會議,就將來使用什么樣的
先驗信息和在分析時如何使用等問題達(dá)成一致。
直接基于其他研究數(shù)據(jù)的先驗分布最容易評估。雖然我們承認(rèn)從來沒有一模一樣的兩個
研究,我們?nèi)匀唤ㄗh在下列幾方面,
7See21CFR812.20(b)(2)和21CFR812.27.
可以借用與當(dāng)前研究類似的歷史研究所構(gòu)建的先驗信息:
?試驗計劃(終點,目標(biāo)人群,等),和
?收集數(shù)據(jù)的時間范圍(例如,確保醫(yī)療實踐與研究人群具有可比性)。
在某些情況下,如果研究者與研究場所也類似的話對實驗研究是有益的。
要納入有利的和不利的研究。只納入有利的研究會產(chǎn)生偏差。基于選擇研究所產(chǎn)生的偏
差可通過以下兩方面評估:
?納入的研究所具有的代表性,和
?納入或者排除每項研究的原因。
基于專家意見而不是試驗數(shù)據(jù)的先驗分布是由問題的。如果FDA咨詢小組成員或者其他
臨床評估員不同意之前專家意見所形成的先驗信息,那么,器械獲批將延遲或者陷于困
境。
有信息的和無信息的先驗分布
有信息先驗分布可以較其他先驗分布提供更多的感興趣參數(shù)的數(shù)值(例如圖1)。這些
參數(shù)選擇大多基于以往的研究。數(shù)值之間缺乏選擇或者缺乏信息可以通過無信息先驗分
布表示(例如圖2)。
納入有信息先驗分布
對新器械當(dāng)前研究的貝葉斯分析應(yīng)該包括來自于以下器械的先驗信息:
?新器械,
?對照器械,或
?這兩種器械。
當(dāng)納入先前研究的先驗信息時,很少認(rèn)為先前研究的受試者與當(dāng)前研究的受試者之間具
有可交換性。相反,經(jīng)常會使用層次模型從先前的研究“借力”。在第一級的層次結(jié)構(gòu)
中,模型假設(shè)同一研究內(nèi)部受試者具有可交換性,而不同研究之間受試者不具有可交換
性。在第二級的層次結(jié)構(gòu)中,假定先前的研究可與當(dāng)前的研究進行互換,但是承認(rèn)研究
之間的差異。欲了解更多的關(guān)于層次模型的細(xì)節(jié),參見章節(jié)4.6。
如果一項研究的先驗信息來源于較本次研究預(yù)計入組人群大得多的患者群體的話,那么
該先驗分布就更加有益了。
判斷由什么信息構(gòu)成非常有益信息是一項逐案決定。在這種情況下,可能有必要對研究
設(shè)計和分析計劃進行一些修改
無信息先驗分布
當(dāng)沒有先驗信息可用時,貝葉斯適應(yīng)性試驗常使用無信息先驗分布。作為另一個例子,
在結(jié)合研究的貝葉斯分層模型中,無信息先驗分布可被放置在一個可捕獲試驗之間不同
的參數(shù)上,因為,一般來說,該參數(shù)沒有可用的有信息先驗。
圍繞先驗分布的問題有大量的文獻報道,例如“無信息”的定義,測量尺度改變的影
響,等。對于這些問題的討論可參考Lee(1997),Kass&Wasserman(1996),Box&Tiao
(1973).Bernardo&Smith(1993),Bernardo,Berger和Sun(2008)等人的文獻。Irony&
Pennello(2001)討論了處于監(jiān)管審查的臨床試驗的先驗分布。
4.6從其他研究借力:層次模型
貝葉斯層次模型是一種特殊的方法論,可用于將多項研究的結(jié)果整合,從而獲得關(guān)于安
全性和有效性參數(shù)的評價。層次模型的名字來源于觀測與參數(shù)構(gòu)建的分層方式。一些貝
葉斯分析家將這種方法稱為“借力”。對于器械試驗而言,借力的強度可轉(zhuǎn)換為樣本量,
借力程度取決于當(dāng)前研究(感興趣的研究)結(jié)果反映先前研究(我們借力的根源;注意,
從數(shù)學(xué)角度講,這些不一定必然發(fā)生在較早的時間點)結(jié)果的密切性。
如果結(jié)果非常相似,當(dāng)前研究可以借到相當(dāng)?shù)膶嵙?。如果?dāng)前的結(jié)果與先前的信息差異
很大,那么當(dāng)前研究可借之力越來越少。完全不同的結(jié)果根本談不上借力,甚至產(chǎn)生潛
在的“負(fù)力”。在恰當(dāng)?shù)谋O(jiān)管環(huán)境下,層次模型可具有非凡的吸引力:他們對于有良好
先驗信息的獎勵是可以通過較小的負(fù)擔(dān)證明器械性能的安全性和有效性。同時,該方法
可以防止過分依賴以往的研究,發(fā)生關(guān)鍵研究參數(shù)過于樂觀的情況。
一個層次模型的例子
假定您希望將兩個已批準(zhǔn)器械的早期研究成功概率與新近研究的結(jié)果相結(jié)合。您可以決
定使用兩個水平的層次模型:患者層次和研究層次。
層次的第一水平(患者)假定在每項研究(當(dāng)前的或歷史的)中患者都是可交換的。
但是,來自先前研究的患者與當(dāng)前研究的患者是不可交換的,所以先前研究的患者資料
不能簡單地與當(dāng)前研究的混合。
層次的第二水平(研究)所用模型假定先前研究的成功概率與當(dāng)前研究的可以互換,但
是,成功概率可能有差別。這種假設(shè)的得出是很謹(jǐn)慎的,因為您不能確定先前研究的患
者是否可以與當(dāng)前研究的患者直接交換。但是,在假定它們之間具有可交換性的前提下,
所有三項研究的成功概率是相關(guān)的。其結(jié)果是,盡管不如將三項研究的患者混合所得到
信息多,先前的研究也為當(dāng)前研究的成功概率提供了一些信息。
先前研究與當(dāng)前研究的相似性
使用層次模型從先前研究借力的主要臨床問題是先前的研究與當(dāng)前的研究是否有足夠
的相似性從而被認(rèn)為是可交換的,如章節(jié)3.7中討論。
為實現(xiàn)研究可交換,有必要對使用患者水平數(shù)據(jù)獲得的人口統(tǒng)計和預(yù)后變量等協(xié)變量的
某些差異進行統(tǒng)計學(xué)的調(diào)整的。這稱為協(xié)變量條件可交換性。一般來說,準(zhǔn)確校準(zhǔn)您的
研究取決于患者水平具有與以往研究相同的協(xié)變量信息以及正確地納入這些信息。例
如,使用從歷史對照中獲得的先驗信息在同期對照組中擴大樣本量,但是協(xié)變量顯示同
期對照患者更健康,那么歷史對照和同期對照的可交換性只有在調(diào)整協(xié)變量后才合理
(Pennello和Thompson,2008,第3章;CXMalley,Normand和Kuntz,2003)。
僅僅基于協(xié)變量概要(例如來自文獻)的校準(zhǔn)是不充足的,因為協(xié)變量級別與結(jié)果之間
的關(guān)系是由當(dāng)前研究而不是以往研究所決定的。這就迫使得出了協(xié)變量的影響在您的研
究和以往的研究中是相同的這樣一個無法驗證的假設(shè);亦即,研究與協(xié)變量影響無關(guān).
以往應(yīng)用層次模型開展的大樣本研究可以提供大量信息。如我們將在章節(jié)7.1中討論到,
如果一項成功試驗的先驗概率太高的話,就有必要修改研究設(shè)計和分析計劃。
層次模型還可用于將多中心臨床試驗中不同中心的數(shù)據(jù)整合。例如,參見PMAP980048,
應(yīng)用SulzerSpine-Tech進行的BAK/頸椎椎體間融合術(shù)系統(tǒng)的安全性與有效性摘要。8
器械的結(jié)果因部位不同有很大的差別,原因在于存在下述差異:
?醫(yī)師培訓(xùn),
?操作技巧,
?對該器械的經(jīng)驗,
?患者管理,和
?受試對象。
多中心層次結(jié)構(gòu)模型假定感興趣參數(shù)在中心之間存在差異,但是該中心的具體參數(shù)可通
過可交換性達(dá)到相關(guān)。當(dāng)估計所有中心的參數(shù)時通過這種模型來校準(zhǔn)中心與中心之間的
差異。
Gelman等(2004)將涉及層次模型的入門討論及具體實施時的技術(shù)細(xì)節(jié)。Ibrahim&Chen
(2000)和Dey等(1998)將描述其他更為復(fù)雜的方法。
4.7確定樣本量
臨床試驗中的樣本量取決于以下幾方面:
?樣本的變異性,
?先驗信息,
?分析時所使用的數(shù)學(xué)模型,
?分析模型中參數(shù)的分布,和
?具體的決策標(biāo)準(zhǔn)。
如果結(jié)果高度可變,所需的樣本量就大。如果沒有變異性(即,群體中每個個體感興趣
參數(shù)的數(shù)值均相同),單一的觀察就足夠了。為臨床試驗設(shè)定樣本量是為了既能夠收集
到足夠多的信息以便得出結(jié)論,同時又不浪費資源或者為患者來帶不必要的風(fēng)險。
在傳統(tǒng)的頻率論臨床試驗設(shè)計中,樣本量是預(yù)先決定的。
8
作為預(yù)先指定固定樣本量的替代,貝葉斯方法(以及一些現(xiàn)代頻率論方法)可以指定特
定的標(biāo)準(zhǔn)從而終止試驗。恰當(dāng)?shù)慕K止原則基于有關(guān)參數(shù)信息的具體數(shù)量(例如,足夠窄
的置信區(qū)間,在第5章中定義:貝葉斯臨床試驗分析)或者是預(yù)先指定假設(shè)的適當(dāng)高概
率。
在貝葉斯臨床試驗之前或中間的任何時間點,您都可以獲得樣本大小的預(yù)測分布。因此,
在試驗的任何一點,您都能夠計算為滿足終止原則所需的預(yù)期額外觀測數(shù)量。換言之,
樣本大小的預(yù)期分布隨著試驗的進展在不斷更新。由于樣本大小不是明確終止試驗的一
部分內(nèi)容,因此,試驗終止的準(zhǔn)確時刻是在收集到足夠多信息用于回答重要問題之時。
估計貝葉斯臨床試驗驗本大小時的特殊考慮
當(dāng)估計貝葉斯臨床試驗樣本大小時,FDA建議您事先根據(jù)安全性和有效性終點決定最小
樣本量,因為安全性終點可能會產(chǎn)生更大的樣本量。FDA還建議,從目前的試驗獲得最
低層次的信息,以便能夠驗證模型假設(shè)和適當(dāng)使用先驗信息。這種做法也使得醫(yī)療界能
夠獲得器械相關(guān)經(jīng)驗。
當(dāng)使用層次模型時,我們也建議您提供最小樣本量,以便決定將從其他研究所“借”的
信息量。
我們建議根據(jù)經(jīng)濟、倫理和監(jiān)管考慮來確定最大樣本量。
Inoue等(2005),Katsis&Toman(1999),Rubin&Stem(1998),Lindley(1997)
和Joseph等(1995a,b)的文章中描述了各種估計貝葉斯試驗樣本量的方法。
4.8評估貝葉斯設(shè)計的可操作特性
由于貝葉斯臨床試驗設(shè)計的固有靈活性,徹底評估其可操作特性就成為試驗計劃的一部
分。評估的內(nèi)容包括:
?批準(zhǔn)無效或不安全器械的錯誤概率(I型錯誤率),
不批準(zhǔn)安全有效器械的錯誤率(II型錯誤率),
效能(逆向n型錯誤率:正確批準(zhǔn)安全有效器械的概率),
?樣本量分布(和預(yù)期樣本大?。?,
?器械權(quán)項先驗概率,和
?如果適用,終止在每個中期的概率。
在第7章(技術(shù)細(xì)節(jié))中有更為全面的討論。
“純粹”貝葉斯方法的統(tǒng)計不需要向傳統(tǒng)頻率論方法那樣同樣重視控制I型錯誤的概念。
但是,也有一些文獻建議貝葉斯方法需要進行“校準(zhǔn)”,以便具有良好的頻率論特性(例
如,Rubin,1984;Box,1980)?本著這一精神,以及遵守監(jiān)管機構(gòu)的實踐,F(xiàn)DA建議您
對提出的貝葉斯分析計劃提供I型和II型錯誤率(參見第7章“技術(shù)細(xì)節(jié)”)?
對于貝葉斯試驗,關(guān)于I型錯誤有幾點需要考慮:
FDA在評估報告提交時會考慮I型錯誤,連同實驗設(shè)計的其他工作特性。我們會爭取合
理地控制I型錯誤率。任何一個臨床試驗設(shè)計工作特性的充分描述都需要廣泛模擬。更
多討論,請參見章節(jié)7.4(技術(shù)細(xì)節(jié))。
有先驗信息可用時,對于I型錯誤控制較不嚴(yán)格可能比沒有先驗信息可用時恰當(dāng)。例如,
如果有良好的先驗信息,當(dāng)前的試驗就可能不需要提供盡可能多的關(guān)于安全性和有效性
的信息。我們放松控制I型錯誤的程度是一個逐案決定,取決于許多因素,主要是我們
從先驗信息所獲得的信心.
如果先驗分布相對當(dāng)前研究能提供太多信息,我們就建議對歷史/先驗信息打折扣。何
謂“太豐富”也是逐案決定。
4.9貝葉斯多因素分析調(diào)整
在臨床試驗中,多因素分析可能是重要的監(jiān)管考慮,因為機構(gòu)關(guān)注的是作出不正確的決
定;多因素分析能擴大不正確決定獲批的概率。
多因素分析可以極大地影響臨床試驗的統(tǒng)計解釋。例如,如果頻率論試驗的20個獨立亞
群,各重大器械效果測試I類錯誤水平為5%,那么,至少一項錯誤顯著結(jié)果的發(fā)生幾率
將iWj達(dá)64%o
經(jīng)典的頻率論方法可降低個別測試的誤差水平,使得整體虛假顯著結(jié)果的機會被控制在
合理水平,比如說5%。但是,這種方法也同時降低了檢測到實際效果的機會(即功效),
往往是本質(zhì)的效果。等價地,沒有檢測到真正效果的機會(即n型錯誤)也增加了。
相反的,在處理上述亞群問題時,可能的貝葉斯方法會通過使用層次模型將亞群看作是
可交換的,先驗的。這種模型使得可以通過從其他亞群借力來得出本亞群器械效果的貝
葉斯估計。如果觀測到某亞群器械效果大,那么將根據(jù)其他亞群是支持還是懷疑這一觀
測結(jié)果來調(diào)整貝葉斯評價。對于更多的討論,請參見Dixon和Simon(1991)及Pennello
和Thompson(2008)。
倘若分析計劃已預(yù)先指定,工作特點的分析足夠(參見章節(jié)4.8),那么,F(xiàn)DA可以接
受貝葉斯多因素分析調(diào)整。請盡早就包括貝葉斯多因素分析調(diào)整的統(tǒng)計分析計劃咨詢
FDA,.
關(guān)于貝葉斯多因素分析調(diào)整的參考文獻選自Scott和Berger(2006),Duncan和Dixon
(1983),Berry(1988),Gonen等(2003),Pennello(1997)及Lewis和Thayer(2004)。
4.10貝葉斯自適應(yīng)設(shè)計
介紹
自適應(yīng)設(shè)計利用積累的資料,根據(jù)預(yù)先制定的計?劃,在不破壞試驗有效性和完整性的基
礎(chǔ)上,決定如何修改試驗的某些方面。自適應(yīng)實驗設(shè)計具有提供最佳統(tǒng)計推斷,提高決
策質(zhì)量、速度和效率的潛能。
固有的貝葉斯方法似然原則,使自適應(yīng)設(shè)計及中期分析變得自然。自適應(yīng)貝葉斯臨床試
驗包含:
?中期注意適應(yīng)樣本量(終止或繼續(xù)患者的入選)
?中期尋找可能提前終止試驗的目的,或成功,或無益,或有害
?將非劣效性轉(zhuǎn)變?yōu)閮?yōu)效性或反之
?丟棄對照組或劑量
適用的隨機化法,即:試驗中修改隨機化率以增加患者被分配到最佳治療的概
率。
高效的決策
根據(jù)累計信息進行自適應(yīng)的實驗設(shè)計可高效作出決定。依據(jù)貝葉斯方法,只有當(dāng)被視為
足夠作出決定才開始收集試驗信息。但是,在試驗開始之前,對于能夠提供足夠信息作
出決定所學(xué)的樣本量具有很大的不確定性。如果樣本的差異性大于預(yù)期,就需要較大的
樣本量,反之,如果樣本的差異性小于預(yù)期,那么較小的樣本量就足夠了。當(dāng)采用自適
應(yīng)設(shè)計時,隨著試驗的進展,就會知道樣本的變異性,從而僅更少的信息會缺失或者浪
費。
舉一個例子,考慮主動控制試驗(非劣效性試驗),其終點即是器械成功率。這里,樣
本大小關(guān)鍵取決于對照和治療成功率。例如,考慮非劣效性限度為0」的情況。假設(shè)真
正對照組與治療組成功率均為0.6,那么所需樣本量為每組300名患者。如果治療組成功
率是0.65而不是0.6,那么每組的樣本量將減少到大約130名患者。很明顯,如果能夠適
應(yīng)這兩種情況則是最理想的,因為減少的樣本量是相當(dāng)大的。
監(jiān)管的思考
機構(gòu)承認(rèn),純粹的貝葉斯方法將允許在實驗過程中進行持續(xù)的設(shè)計適應(yīng)。但是,從監(jiān)管
角度考慮,為了在減少操作偏差的同時保持試驗的完整性,強烈建議提前計劃適應(yīng)性試
驗,在提交IDE的階段需要在各種場景下評估設(shè)計的工作特性(參見4.8)。換句話說,
貝葉斯自適應(yīng)試驗應(yīng)該是自適應(yīng)設(shè)計。
實際執(zhí)行
執(zhí)行自適應(yīng)設(shè)計可能具有挑戰(zhàn)性,因為要維持?jǐn)?shù)據(jù)的機密性以避免操作偏差,亦即研究
者偏倚,選擇偏倚和患者偏倚。例如,如果研究者在中期分析中知道一種治療方法更好,
那么在未來的試驗中他或她為患者分配該療法的概率更高。為了較少操作偏差,需提前
設(shè)計試驗計劃,預(yù)先指定自適應(yīng)算法。建議經(jīng)第三方分析并設(shè)置防火墻。盲法是確保無
偏性所必需的,自適應(yīng)設(shè)計能揭示不斷變化的治療差異,因此最好能就的設(shè)計細(xì)節(jié)向機
構(gòu)審查委員會(IRBs)咨詢,從而避免揭盲問題。
入組率大大影響適應(yīng)性試驗。當(dāng)相對于隨訪時間來說,入組率太高的話,自適應(yīng)就變得
不可能,因為當(dāng)中間結(jié)果出現(xiàn)時,所有的患者可能都已經(jīng)入組。其結(jié)果是,主辦方為了
從自適應(yīng)性設(shè)計中獲益而控制入組率。另外,在自適應(yīng)設(shè)計決定之前,要權(quán)衡快速入組
與慢速可控入組之間的利益
5.分析貝葉斯臨床試驗
5.1后驗分布概要
回憶一下,后驗分布包含了所有從先驗分布得來的信息,并結(jié)合了通過似然函數(shù)得到的
試驗結(jié)果。貝葉斯試驗的結(jié)論僅基于后驗分布。FDA建議將后驗分布總結(jié)為幾個數(shù)字(例
如,后驗均值,標(biāo)準(zhǔn)差,置信區(qū)間),尤其是當(dāng)有許多終點需要考慮的時候。FDA還建
議包括適當(dāng)分布的圖形表示。
5.2假設(shè)檢驗
統(tǒng)計推斷可能包括假設(shè)檢驗,區(qū)間估計,或者二者兼有。對于貝葉斯假設(shè)檢驗,您可以
根據(jù)給定的數(shù)據(jù),使用后驗分布計算某一特定假設(shè)正確的概率。
5.3區(qū)間估計
貝葉斯區(qū)間估計基于后驗分布,也稱為置信區(qū)間。如果終點落在區(qū)間的后驗概率為0.95,
那么這個區(qū)間就稱為95%置信區(qū)間。FDA強烈鼓勵在標(biāo)簽的貝葉斯試驗報告置信區(qū)間。
關(guān)于如何報告置信區(qū)間的例子,請參見InFuse骨移植/LT-CAG
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五版龍門吊租賃及吊裝作業(yè)風(fēng)險分擔(dān)協(xié)議3篇
- 二零二五年四人共同經(jīng)營民宿的合伙協(xié)議書
- 二零二五年度出租車車輛租賃與智能駕駛技術(shù)研發(fā)合同3篇
- 二零二五年度展會現(xiàn)場搭建及展品運輸合同3篇
- 2025年度高空作業(yè)安全防護施工合同范本4篇
- 二零二五年度城市綠化養(yǎng)護承包合同范本8篇
- 2025年度電動汽車充電樁安全檢測與維護服務(wù)合同3篇
- 2025年新媒體營銷活動合作協(xié)議范本2篇
- 2025年度泥瓦工勞務(wù)分包合同工期延誤責(zé)任協(xié)議
- 2025版農(nóng)業(yè)機械銷售訂購合同(年度版)3篇
- 2024年合肥市廬陽區(qū)中考二模英語試題含答案
- 質(zhì)檢中心制度匯編討論版樣本
- 藥娘激素方案
- 提高靜脈留置使用率品管圈課件
- GB/T 10739-2023紙、紙板和紙漿試樣處理和試驗的標(biāo)準(zhǔn)大氣條件
- 《心態(tài)與思維模式》課件
- C語言程序設(shè)計(慕課版 第2版)PPT完整全套教學(xué)課件
- 行業(yè)會計比較(第三版)PPT完整全套教學(xué)課件
- 高考英語語法填空專項訓(xùn)練(含解析)
- 危險化學(xué)品企業(yè)安全生產(chǎn)標(biāo)準(zhǔn)化課件
- 《美的歷程》導(dǎo)讀課件
評論
0/150
提交評論