人工智能在新藥研發(fā)中的應(yīng)用現(xiàn)狀與挑戰(zhàn)_第1頁(yè)
人工智能在新藥研發(fā)中的應(yīng)用現(xiàn)狀與挑戰(zhàn)_第2頁(yè)
人工智能在新藥研發(fā)中的應(yīng)用現(xiàn)狀與挑戰(zhàn)_第3頁(yè)
人工智能在新藥研發(fā)中的應(yīng)用現(xiàn)狀與挑戰(zhàn)_第4頁(yè)
人工智能在新藥研發(fā)中的應(yīng)用現(xiàn)狀與挑戰(zhàn)_第5頁(yè)
已閱讀5頁(yè),還剩8頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

人工智能在新藥研發(fā)中的應(yīng)用現(xiàn)狀與挑戰(zhàn)當(dāng)前,新藥研發(fā)面臨著成本高企、收益率下降的雙重困境。新藥研發(fā)具有技術(shù)難度大、投入資金多、研發(fā)風(fēng)險(xiǎn)大、回報(bào)率高和研發(fā)周期長(zhǎng)等特征,隨著疾病復(fù)雜程度的提升,新藥研發(fā)難度和成本迅速增加,全球新藥研發(fā)成功率呈明顯下降趨勢(shì)。2019年,艾昆緯(IQVIA)發(fā)布報(bào)告指出,新藥從臨床試驗(yàn)開(kāi)始到研發(fā)結(jié)束的平均開(kāi)發(fā)時(shí)間在過(guò)去10年里增加了26%,2018年達(dá)到12.5年;新藥開(kāi)發(fā)成功率不斷下降,2018年降至11.4%。據(jù)Nature雜志報(bào)道,新藥研發(fā)成本快速增長(zhǎng),2018年開(kāi)發(fā)的平均成本約為26億美元。新藥投資回報(bào)率不斷下滑,德勤發(fā)布的報(bào)告顯示,2017年全球前12大制藥公司的研發(fā)投資回報(bào)率僅為3.2%,較2010年的10.3%下降7個(gè)百分點(diǎn)。人工智能(artificialintelligence,AI)的發(fā)展,為新藥研發(fā)帶來(lái)了新的技術(shù)手段。通過(guò)機(jī)器學(xué)習(xí)(machinelearning,ML)、深度學(xué)習(xí)(deeplearning,DL)等方式賦能藥物靶點(diǎn)發(fā)現(xiàn)、化合物篩選等環(huán)節(jié),大大提升了新藥研發(fā)的效率,為降本增效提供了可能。應(yīng)用AI技術(shù),可縮短前期研發(fā)約一半時(shí)間,使新藥研發(fā)的成功率從當(dāng)前的12%提高到14%,每年為全球節(jié)約化合物篩選和臨床試驗(yàn)費(fèi)用約550億美元。提升新藥研發(fā)效率,對(duì)加快開(kāi)發(fā)臨床需求未被滿足的創(chuàng)新藥物,助力藥企搶占“best-in-class”和“first-in-class”藥物市場(chǎng)的機(jī)遇窗口期,從而提升藥企全球競(jìng)爭(zhēng)力具有重要意義。AI技術(shù)作為提升新藥研發(fā)效率的重要驅(qū)動(dòng)力量,正在加速對(duì)新藥研發(fā)各環(huán)節(jié)的滲透。本文通過(guò)對(duì)AI技術(shù)、AI賦能新藥研發(fā)應(yīng)用場(chǎng)景,以及應(yīng)用AI技術(shù)的企業(yè)主體進(jìn)行總結(jié)梳理,并展望AI技術(shù)未來(lái)發(fā)展趨勢(shì),為AI+新藥研發(fā)提供思路與參考。1人工智能+新藥研發(fā)的應(yīng)用模式與AI在其他場(chǎng)景的應(yīng)用類似,AI+新藥研發(fā)的實(shí)現(xiàn)路徑包括五大流程:1)獲取目標(biāo)訓(xùn)練數(shù)據(jù)集;2)AI自主學(xué)習(xí)算法建模;3)多次訓(xùn)練優(yōu)化模型;4)測(cè)試集應(yīng)用以評(píng)估模型性能;5)基于模型實(shí)現(xiàn)分子篩選、預(yù)測(cè)、分析等預(yù)定目標(biāo)。算法、數(shù)據(jù)集和模型這3個(gè)要素是必不可少的部分,其中,算法和數(shù)據(jù)是實(shí)現(xiàn)應(yīng)用的關(guān)鍵。1.1人工智能+新藥研發(fā)應(yīng)用算法AI技術(shù)涵蓋ML和DL,如表1所示。ML算法在新藥研發(fā)領(lǐng)域被廣泛用于分類和回歸預(yù)測(cè)等方面,常見(jiàn)的ML算法包括決策樹(shù)(decisiontree)、隨機(jī)森林(randomforest)、支持向量機(jī)(supportvectormachine)、k-最近鄰算法、樸素貝葉斯分類器等;DL算法包括深度神經(jīng)網(wǎng)絡(luò)(deepneuralnetwork,DNN)、卷積深度網(wǎng)絡(luò)(convolutionalneuralnetwork,CNN)、循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrentneuralnetwork,RNN)和自編碼器(autoencoder,AE)等。DL算法適合處理大數(shù)據(jù),模型也更為復(fù)雜。隨著計(jì)算機(jī)性能的提高和數(shù)據(jù)量的積累,DL算法在新藥研發(fā)中的應(yīng)用越來(lái)越廣。[7]DNN是最早應(yīng)用于藥物發(fā)現(xiàn)的DL算法之一,最早來(lái)源于1943年McCulloch等提出的計(jì)算模型。CNN是一種前饋神經(jīng)網(wǎng)絡(luò),它在圖像識(shí)別領(lǐng)[8]域的表現(xiàn)優(yōu)異。RNN是一類用于處理序列數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò),具有記憶能力,可[9]用于處理基因和蛋白序列數(shù)據(jù)等。自編碼器的目的在于重構(gòu)輸入數(shù)據(jù),可生成[10]學(xué)習(xí)模型,在藥物分子生成方面應(yīng)用前景廣闊。DNN、CNN、RNN等DL算[11]法模型通過(guò)定量結(jié)構(gòu)性質(zhì)關(guān)系(QSPR)或定量結(jié)構(gòu)活性關(guān)系(QSAR)等預(yù)測(cè)藥物分子的物理化學(xué)性質(zhì)以及藥物的吸收、分布、代謝、排泄和毒性(ADMET)。表1人工智能常見(jiàn)應(yīng)用算法Table1Commonapplicationalgorithmsofartificialintelligence|AI技術(shù)算法類型算法特點(diǎn)決策樹(shù)決策樹(shù)是-種將決策流程成樹(shù)我姑構(gòu)清1斷表京的對(duì)L方法,本屆上是逋過(guò)-系列加則對(duì)數(shù)行分類的過(guò)程。隨機(jī)森林隨機(jī)森林是通過(guò)枸建多個(gè)決策樹(shù)對(duì)樣本進(jìn)行訓(xùn)綠并頊刪的喇」分類器,其最終輸出的類別每個(gè)決策樹(shù)輸出的籠別的眾教而狹定言機(jī)器學(xué)習(xí)(ML)支持向怛機(jī)支持向ht機(jī)能夠處理小數(shù)國(guó)集中的括維變.止可以向K分類和問(wèn)踏但.更勞用在分類問(wèn)卜最近鄰算法4最近鄰算'法是一種用「分類和回歸的無(wú)監(jiān)督學(xué)習(xí)算法.是一個(gè)理論上比較成熟的方法、最簡(jiǎn)單的ML算法之一.樸素貝葉斯分類器樸素加葉斯分類器是應(yīng)用蟾為廣泛的分類算法之一,只需要少址的訓(xùn)綜數(shù)據(jù)即可估讓?出一要的參數(shù),能夠在許多復(fù)雜的條件中取得較好的效果口DNNr>NN由輸入層,】個(gè)隱獻(xiàn)層和輸出層這3個(gè)部分組成,每層都包含若?,個(gè)神經(jīng)元,是最早于藥物發(fā)現(xiàn)的DL算法Nr深度學(xué)習(xí)(UL)RNNRNN是一類用「處珅.序列數(shù)據(jù)的神經(jīng)網(wǎng)飴[例如時(shí)間.序列瓶據(jù)、屜因和蜜向序列數(shù)據(jù)誠(chéng)命性輸入字?符率(SMILES)等],具有記憶性、參數(shù)共享H圖靈完?翁':luringcompleteness)加因此在時(shí)序列的非戮性特征進(jìn)行學(xué)習(xí)時(shí)耳有一定優(yōu)勢(shì)。CNNCNN是一種前饋神經(jīng)網(wǎng)絡(luò)一其征圖像識(shí)別領(lǐng)域的表現(xiàn)優(yōu)異.AEAF.是--神翔于非監(jiān)督學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò),具有非常好的提取數(shù)據(jù)特征表示的能打,成型的卜用「數(shù)據(jù)降維,它是深屋置信網(wǎng)堞的里要組成部孫,在圖像重構(gòu)、聚類、機(jī)器翻i乍等方面廣泛的應(yīng)用。面向新藥研發(fā)的AI分子篩選技術(shù)入選《麻省理工學(xué)院技術(shù)評(píng)論》發(fā)布的2020年〃全球十大突破性技術(shù)”°AI技術(shù)的發(fā)展正從傳統(tǒng)的大樣本訓(xùn)練向小樣本學(xué)習(xí)、反饋學(xué)習(xí)的模式轉(zhuǎn)變,小樣本學(xué)習(xí)、零樣本學(xué)習(xí)將逐漸在藥物研發(fā)中應(yīng)用和推廣[12]1.2人工智能+新藥研發(fā)應(yīng)用數(shù)據(jù)新藥研發(fā)過(guò)程涉及大量的數(shù)據(jù),包括文獻(xiàn)資料、化合物數(shù)據(jù)、靶點(diǎn)數(shù)據(jù)、專利數(shù)據(jù)、臨床試驗(yàn)數(shù)據(jù)、真實(shí)世界數(shù)據(jù)、藥品審評(píng)審批數(shù)據(jù)、市場(chǎng)銷售數(shù)據(jù)等。面對(duì)海量、多源、異質(zhì)性的數(shù)據(jù),AI技術(shù)應(yīng)用已逐漸跳出以靶點(diǎn)和分子篩選為核心的傳統(tǒng)新藥研發(fā)模式,形成以數(shù)據(jù)為核心的研發(fā)模式。IBM公司開(kāi)發(fā)的Watson系統(tǒng),通過(guò)閱讀2500萬(wàn)篇文獻(xiàn)摘要、100萬(wàn)篇完整論文和400萬(wàn)篇專利文獻(xiàn)來(lái)預(yù)測(cè)RNA結(jié)合蛋白(RNAbindingprotein,RBP)與肌萎縮側(cè)索硬化(ALS)的相關(guān)性。英國(guó)生物科技公司BenevolentBio從全球范圍內(nèi)海量的學(xué)術(shù)論文、專利、臨床試驗(yàn)結(jié)果、患者記錄等數(shù)據(jù)中,提取對(duì)新藥研發(fā)有用的信息;Atomwise公司利用其核心技術(shù)平臺(tái)AtomNet識(shí)別重要的化學(xué)基團(tuán),如氫鍵、芳香度和單鍵碳,分析化合物的構(gòu)效關(guān)系,從而用于新藥發(fā)現(xiàn)和評(píng)估新藥風(fēng)險(xiǎn)。2人工智能+新藥研發(fā)的應(yīng)用企業(yè)近年來(lái),越來(lái)越多的企業(yè)布局AI+新藥研發(fā),探索如何用AI技術(shù)實(shí)現(xiàn)新藥研發(fā)的降本增效。據(jù)DeepPharmaIntelligence統(tǒng)計(jì),截至2020年,全球共有240家AI+新藥研發(fā)企業(yè),主要分布在美國(guó)、英國(guó)和加拿大,國(guó)內(nèi)也有一些從事此類工作的企業(yè)。目前,探索AI+新藥研發(fā)的企業(yè)主要有三類:一是AI藥物研發(fā)創(chuàng)新企業(yè),如Exscienta、BenevolentAI、Atomwise、RelayTherapeutcs、晶泰科技、燧坤智能等;二是IT巨頭,如Google、微軟、騰訊、阿里巴巴集團(tuán)等;三是大型制藥企業(yè),如羅氏、阿斯利康、強(qiáng)生、葛蘭素史克(GSK)等,見(jiàn)圖1。新藥研發(fā)IT巨頭傾向于利用自身的互聯(lián)網(wǎng)基礎(chǔ)與平臺(tái)優(yōu)勢(shì)進(jìn)行技術(shù)布局,進(jìn)入方式為自主研發(fā)相關(guān)產(chǎn)品,開(kāi)發(fā)相關(guān)領(lǐng)域針對(duì)性技術(shù)以賦能行業(yè)應(yīng)用,業(yè)務(wù)領(lǐng)域不斷下沉,或者通過(guò)外延并購(gòu)擴(kuò)張業(yè)務(wù)版圖,例如騰訊進(jìn)軍AI+新藥研發(fā)領(lǐng)域,發(fā)布首個(gè)AI驅(qū)動(dòng)的藥物發(fā)現(xiàn)平臺(tái)“云深智藥(iDrug)",谷歌計(jì)劃斥資4億美元收購(gòu)AI企業(yè)DeepMind。粉HUAWEI圖1人工智能+新藥研發(fā)企業(yè)圖譜Figure1MapofenterprisesapplyingartificialintelligenceinnewdrugR&DAI+新藥研發(fā)企業(yè)多以技術(shù)優(yōu)勢(shì)切入1個(gè)或多個(gè)應(yīng)用場(chǎng)景,如BenevolentAI構(gòu)建判斷加強(qiáng)認(rèn)知系統(tǒng)(judgmentaugmentedcognitionsystem,JACS)技術(shù)平臺(tái),針對(duì)包括阿爾茨海默病和罕見(jiàn)腫瘤在內(nèi)的4個(gè)不同領(lǐng)域的疾病進(jìn)行10多種藥物的研發(fā),晶泰科技組建RenovaAI新藥研發(fā)平臺(tái),提供“計(jì)算+實(shí)驗(yàn)”新模式下的藥物設(shè)計(jì)與固體形態(tài)研究服務(wù)。大型藥企則以自建AI研究團(tuán)隊(duì)、投資并購(gòu)或與AI技術(shù)公司合作的方式,布局AI新藥研發(fā)。輝瑞、GSK和諾華等制藥公司也在內(nèi)部建立了大量的AI研究團(tuán)隊(duì)。當(dāng)前全球十大制藥公司均已布局AI+新藥研發(fā),諸多大型制藥公司開(kāi)始與AI初創(chuàng)公司開(kāi)展合作,例如艾伯維與AiCure、阿斯利康與BergHealth、拜耳與SensyneHealth、百時(shí)美施貴寶(BMS)與。oncertoHealthAI,以及輝瑞與IBMWatson等。由于AI+新藥研發(fā)創(chuàng)新公司缺少新藥研發(fā)的相關(guān)數(shù)據(jù)、成熟的研發(fā)管線以及資深的藥物專家,而這恰好是傳統(tǒng)制藥巨頭所具備的優(yōu)勢(shì)。因此,大型藥企和AI+新藥研發(fā)的技術(shù)公司聯(lián)合是目前主要的業(yè)務(wù)模式。從開(kāi)展合作情況來(lái)看,隨著AI+新藥研發(fā)的發(fā)展,現(xiàn)有制藥生態(tài)系統(tǒng)正從執(zhí)行研發(fā)的傳統(tǒng)利益攸關(guān)方逐漸轉(zhuǎn)向更加多樣化的技術(shù)支持伙伴關(guān)系。[13]我國(guó)AI+新藥研發(fā)起步較晚,目前尚處在初期階段,據(jù)火石創(chuàng)造統(tǒng)計(jì),國(guó)內(nèi)涌現(xiàn)了晶泰科技、深度智藥、云勢(shì)軟件、望石智慧等一批創(chuàng)新企業(yè),主要分布在北京、上海、杭州和深圳等城市。然而,國(guó)內(nèi)AI+新藥研發(fā)企業(yè)并不多,總數(shù)不足20家。近年來(lái),隨著我國(guó)醫(yī)藥產(chǎn)業(yè)創(chuàng)新發(fā)展的加速推進(jìn),國(guó)內(nèi)的醫(yī)藥行業(yè)在AI+新藥研發(fā)領(lǐng)域的跨界合作也在增加:一、醫(yī)藥巨頭與AI+新藥研發(fā)技術(shù)公司合作,例如恒瑞醫(yī)藥與百奧知、豪森藥業(yè)與Atomwise的合作;二、藥企與IT巨頭合作,如正大天晴通過(guò)與阿里云合作獲得一種全新的化合物篩選方法;三、合同[14]研究組織(CRO)企業(yè)與AI+新藥研發(fā)技術(shù)公司合作,如藥明康德和Schrdinger合資成立了FaxianTherapeutics,將藥明康德的先導(dǎo)化合物優(yōu)化服務(wù)與Schrdinger的藥物設(shè)計(jì)軟件平臺(tái)相結(jié)合,從而加速新藥發(fā)現(xiàn);藥明康德和Insilico合作開(kāi)發(fā)了一種ML模型,用于從頭設(shè)計(jì)DDR1蛋白(一種與纖維化等疾病有關(guān)的激酶)的小分子抑制劑。3人工智能+新藥研發(fā)的郵實(shí)踐目前,從全球AI+新藥研發(fā)企業(yè)的應(yīng)用實(shí)踐來(lái)看,AI+新藥研發(fā)主要是將ML、DL等AI技術(shù),應(yīng)用到前期研究、靶點(diǎn)發(fā)現(xiàn)、化合物合成、化合物篩選、新適應(yīng)證發(fā)現(xiàn)、晶型預(yù)測(cè)、患者招募等新藥研發(fā)環(huán)節(jié)(見(jiàn)圖2)。例如,數(shù)據(jù)挖掘和分析有助于藥物靶標(biāo)的確立,進(jìn)而找到具有潛力的先導(dǎo)化合物,從而最大程度提[15]升新藥研發(fā)效率。與傳統(tǒng)新藥研發(fā)管線比,基于AI和生物計(jì)算的新藥研發(fā)管線平均1~2年就可以完成臨床前藥物研究。靶點(diǎn)識(shí)別、先導(dǎo)化合物確定、藥[16]物重定向被認(rèn)為是全球AI+新藥研發(fā)最具變革意義的研究領(lǐng)域,其中靶點(diǎn)發(fā)現(xiàn)[17]和化合物合成是企業(yè)布局的熱門(mén)方向。3.1前期研究前期研究主要是基于文獻(xiàn)分析和知識(shí)庫(kù)建設(shè),進(jìn)行疾病機(jī)制、靶點(diǎn)、藥物作用方式研究。AI的應(yīng)用主要在文獻(xiàn)數(shù)據(jù)整合分析、新藥研發(fā)知識(shí)庫(kù)建設(shè)、新藥研發(fā)數(shù)據(jù)集建設(shè)和基準(zhǔn)化合物庫(kù)設(shè)計(jì)等方面,可以借助AI自然語(yǔ)音處理、知識(shí)圖譜等技術(shù)實(shí)現(xiàn)海量信息的快速提取,從而對(duì)推動(dòng)新藥研發(fā)的眾多知識(shí)進(jìn)行聚類分析,幫助提出新的可以被驗(yàn)證的假說(shuō),進(jìn)而加快新藥研發(fā)的進(jìn)程。例如深度智耀整合了數(shù)百個(gè)開(kāi)放數(shù)據(jù)源,通過(guò)ML技術(shù),結(jié)合醫(yī)藥研發(fā)專家知識(shí),自動(dòng)提取醫(yī)藥實(shí)體、關(guān)系和屬性,構(gòu)建醫(yī)藥研發(fā)知識(shí)圖譜。臨床試驗(yàn)申隋藥品上市申請(qǐng)圖2人工智能+新藥研發(fā)應(yīng)用場(chǎng)景Figure2Scenariosofapplyingartificialintelligenceinnew圖2人工智能+新藥研發(fā)應(yīng)用場(chǎng)景Figure2ScenariosofapplyingartificialintelligenceinnewdrugR&DAl圓用場(chǎng)景藥物發(fā)現(xiàn)是關(guān)系新藥研發(fā)成功率的關(guān)鍵環(huán)節(jié),主要包括靶點(diǎn)選擇優(yōu)化、先導(dǎo)化合物的發(fā)現(xiàn)、先導(dǎo)化合物的篩選優(yōu)化,AI在藥物發(fā)現(xiàn)環(huán)節(jié)的應(yīng)用聚焦于靶點(diǎn)發(fā)現(xiàn)、晶型預(yù)測(cè)以及候選藥物分子的篩選優(yōu)化。在靶點(diǎn)發(fā)現(xiàn)和驗(yàn)證方面,可以利用自然語(yǔ)言處理技術(shù)檢索分析海量文獻(xiàn)、專利和臨床試驗(yàn)報(bào)告的非結(jié)構(gòu)化數(shù)據(jù)庫(kù)找出與疾病相關(guān)的潛在的、被忽視的通路、蛋白和機(jī)制,從而提出新的可供測(cè)試的假說(shuō),以發(fā)現(xiàn)新機(jī)制和新靶點(diǎn)。例如,[13]InsilicoMedicine利用自主研發(fā)的AI新藥靶點(diǎn)發(fā)現(xiàn)平臺(tái)PandaOmics和AI分子生成和設(shè)計(jì)平臺(tái)Chemistry42,獲得了全球首例完全由AI驅(qū)動(dòng)發(fā)現(xiàn)的特發(fā)性肺纖維化(IPF)疾病新靶點(diǎn)。在晶型預(yù)測(cè)方面,可以利用認(rèn)知計(jì)算實(shí)現(xiàn)高效動(dòng)態(tài)配置藥物晶型,預(yù)測(cè)小分子藥物所有可能的晶型。例如艾伯維(AbbVie)結(jié)合晶泰科技的晶型預(yù)測(cè)等技術(shù),設(shè)計(jì)了一套新集成模型,能夠以二維結(jié)構(gòu)作為輸入,預(yù)測(cè)得到分子的熱力學(xué)溶解度。相比于傳統(tǒng)藥物晶型研發(fā),采用AI技術(shù)的制藥企業(yè)能更加自如地面[18]對(duì)仿制藥企業(yè)的晶型專利挑戰(zhàn)。另外,晶型預(yù)測(cè)技術(shù)縮短了晶型開(kāi)發(fā)的時(shí)間,能更加高效地挑選出合適的藥物晶型,進(jìn)而縮短研發(fā)周期,控制成本。在化合物篩選和優(yōu)化方面,要從數(shù)以萬(wàn)計(jì)的化合物分子中篩選出對(duì)特定靶標(biāo)具有較高活性的化合物,往往需要較長(zhǎng)的時(shí)間和成本,可以利用AI技術(shù)建立虛擬藥物篩選模型,快速過(guò)濾〃低質(zhì)量”化合物,富集潛在有效分子,檢索更快、覆蓋范圍更廣,利用ML技術(shù),從海量化合物中挑選出高潛力候選藥物,從而減少研發(fā)新藥的時(shí)間和成本[19_20],加速先導(dǎo)化合物的發(fā)現(xiàn)和優(yōu)化,以及候選藥物分子的產(chǎn)生。例如BenevolentBio曾借助JACS技術(shù),標(biāo)記出100個(gè)或可用于治療ALS的潛在化合物,并成功篩選出5個(gè)化合物;BergHealth則篩選了多達(dá)25萬(wàn)個(gè)疾病組織樣本來(lái)尋找癌癥早期的新生物學(xué)指標(biāo)和生物標(biāo)記等。當(dāng)前來(lái)看,AI藥物發(fā)現(xiàn)在藥物靶點(diǎn)發(fā)現(xiàn)和藥物篩選環(huán)節(jié)的技術(shù)應(yīng)用相對(duì)成熟:研究層面,現(xiàn)有AI解決方案在藥物發(fā)現(xiàn)階段更具先進(jìn)性,例如阿斯利康作[13]為AI領(lǐng)域的探索者,僅在2019年就發(fā)布了65篇AI相關(guān)的新藥發(fā)現(xiàn)及研發(fā)的相關(guān)文獻(xiàn);專利層面,AI+新藥研發(fā)領(lǐng)域的專利發(fā)布數(shù)量盡管還較少,但主要技術(shù)指向還是集中分布在藥物發(fā)現(xiàn)的靶標(biāo)確定和化合物篩選這2個(gè)技術(shù)分支。[21]另外,也有研究指出使用目前的數(shù)據(jù)不太可能大幅度地提升AI藥物發(fā)現(xiàn)的性能,因?yàn)槟壳暗臄?shù)據(jù)沒(méi)有反映出藥物在體內(nèi)的情況,所以計(jì)算機(jī)僅利用這些數(shù)據(jù)并不能很好地做出決策,尤其是針對(duì)復(fù)雜的疾病。雖然目前有大量的描述化學(xué)特性的數(shù)據(jù),這些數(shù)據(jù)能夠使計(jì)算機(jī)生成相應(yīng)的配體,但配體發(fā)現(xiàn)不等于藥物發(fā)現(xiàn)。[22]3.3臨床前研究臨床前研究需要開(kāi)展藥效學(xué)、藥動(dòng)學(xué)和毒理學(xué)研究以及藥劑學(xué)研究,主要是提前預(yù)測(cè)候選藥物的ADMET在后續(xù)藥物開(kāi)發(fā)中起到關(guān)鍵作用的性質(zhì),評(píng)估候選藥物通過(guò)臨床試驗(yàn)的可能性,提高后續(xù)臨床試驗(yàn)的成功概率。在臨床前研究環(huán)節(jié),可以利用AI技術(shù)提升ADMET性質(zhì)預(yù)測(cè)的準(zhǔn)確度,以及幫助加速識(shí)別新適應(yīng)證。在藥物ADMET性質(zhì)研究方面,可利用深度神經(jīng)網(wǎng)絡(luò)算法有效提取結(jié)構(gòu)特征的預(yù)測(cè)方式,進(jìn)一步提升ADMET性質(zhì)預(yù)測(cè)的準(zhǔn)確度。例如,云深智藥采用“從頭折疊”的蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)方法幫助解析了SRD5A2晶體結(jié)構(gòu),并通過(guò)自研AIT具“tFold”有效提升了蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)精度,在科研突破中發(fā)揮了核心作用。[23]在新適應(yīng)證拓展方面,一是可以利用AI的DL能力和認(rèn)知計(jì)算能力,將已上市或處于研發(fā)管線的藥物與疾病進(jìn)行匹配,發(fā)現(xiàn)新靶點(diǎn),擴(kuò)大藥物的治療用途;二是借助公共領(lǐng)域的公開(kāi)大數(shù)據(jù)集資源,可以利用AI算法,選擇訓(xùn)練推導(dǎo)出預(yù)測(cè)跨目標(biāo)活動(dòng)的ML模型,應(yīng)用于藥物的再利用,實(shí)現(xiàn)對(duì)現(xiàn)有藥物識(shí)別新的適應(yīng)證;三是利用AI技術(shù)通過(guò)模擬隨機(jī)臨床試驗(yàn)發(fā)現(xiàn)藥物新用途。例如,燧坤智能[24]通過(guò)ML預(yù)測(cè),利用AI算法系統(tǒng)性整合疾病、靶點(diǎn)、藥物等多個(gè)維度的海量數(shù)據(jù),重建藥物-靶點(diǎn)相互作用網(wǎng)絡(luò),實(shí)現(xiàn)了對(duì)藥物-靶點(diǎn)相互作用的全景刻畫(huà),實(shí)現(xiàn)老藥新用、在研藥物二次開(kāi)發(fā)、失敗藥物再利用、天然產(chǎn)物開(kāi)發(fā)等。3.4臨床試驗(yàn)臨床試驗(yàn)是新藥研究中周期最長(zhǎng)、成本最高的環(huán)節(jié),由于患者隊(duì)列選擇和臨床試驗(yàn)期間對(duì)患者的監(jiān)測(cè)不力等原因,當(dāng)前的藥物臨床試驗(yàn)成功率不高,通常10種進(jìn)入臨床試驗(yàn)的化合物中只有1種能進(jìn)入市場(chǎng)。在臨床試驗(yàn)環(huán)節(jié),可以利用ML、自然語(yǔ)言處理等技術(shù)輔助臨床試驗(yàn)設(shè)計(jì)、患者招募和臨床試驗(yàn)數(shù)據(jù)處理。AI輔助臨床試驗(yàn)設(shè)計(jì)主要是利用自然語(yǔ)言處理技術(shù)快速處理同類研究、臨床數(shù)據(jù)和監(jiān)管信息,以及讀取臨床試驗(yàn)等數(shù)據(jù)。例如Trials.ai公司使用AI來(lái)優(yōu)化臨床試驗(yàn)設(shè)計(jì),使患者更容易參加臨床試驗(yàn),消除不必要的臨床操作負(fù)擔(dān)。AI患者招募主要利用自然語(yǔ)言處理、ML等技術(shù),對(duì)不同來(lái)源的受試者信息和臨床試驗(yàn)方案的入組/排除標(biāo)準(zhǔn)進(jìn)行識(shí)別和匹配,包括醫(yī)學(xué)資料的數(shù)字化、理解醫(yī)學(xué)資料的內(nèi)容、關(guān)聯(lián)數(shù)據(jù)集和模式識(shí)別、擴(kuò)大受試者范圍、開(kāi)發(fā)患者搜索臨床試驗(yàn)的簡(jiǎn)化工具等[25]例如梅奧診所與IBMWatson合作,基于自然語(yǔ)言處理L25」技術(shù),掃描臨床試驗(yàn)數(shù)據(jù)庫(kù),為臨床試驗(yàn)尋找合適的患者。在他們進(jìn)行的一項(xiàng)試點(diǎn)研究中,IBMWatson臨床試驗(yàn)匹配系統(tǒng)使乳腺癌試驗(yàn)的平均每月注冊(cè)人數(shù)增加了80%;零氪科技利用大數(shù)據(jù)整合患者資料,加快了招募患者參加臨床試驗(yàn)的速度。AI輔助臨床數(shù)據(jù)處理主要是利用云計(jì)算強(qiáng)大算力支快速處理臨床數(shù)據(jù)分析并及時(shí)調(diào)整優(yōu)化整個(gè)試驗(yàn)進(jìn)程,提升臨床試驗(yàn)風(fēng)險(xiǎn)控制能力。例如,太美醫(yī)療推出由病例報(bào)告表(CRF)設(shè)計(jì)平臺(tái)、臨床試驗(yàn)電子數(shù)據(jù)采集系統(tǒng)/數(shù)據(jù)管理系統(tǒng)(EDC)、數(shù)據(jù)分析技術(shù)組合構(gòu)成的自動(dòng)化臨床數(shù)據(jù)解決方案,可以幫助藥企應(yīng)對(duì)臨床項(xiàng)目中多變的需求,優(yōu)化數(shù)據(jù)處理的流程。表2介紹了AI主要應(yīng)用場(chǎng)景的代表企業(yè)。表2人工智能主要應(yīng)用場(chǎng)景代表企業(yè)Table2TypicalenterprisesapplyingartificialintelligenceinnewdrugR&D4人工智能+新藥研發(fā)面臨的挑戰(zhàn)AI+新藥研發(fā)目前已進(jìn)入快速成長(zhǎng)期,備受業(yè)界矚目;但其作為新興領(lǐng)域,也面臨著一些挑戰(zhàn)。一是生物學(xué)的復(fù)雜性,給數(shù)據(jù)獲取和AI算法設(shè)計(jì)帶來(lái)巨大挑戰(zhàn)。藥學(xué)是一個(gè)融合化學(xué)和生物學(xué)的學(xué)科,在數(shù)據(jù)層面,二者具有較大的差異性。一般來(lái)說(shuō),化學(xué)方面的數(shù)據(jù)更加穩(wěn)定、可控與易于計(jì)算;生物學(xué)數(shù)據(jù)涉及受體蛋白的構(gòu)象變化,平衡和偏置信號(hào)等難以定量計(jì)算?;衔锱c人體靶點(diǎn)的結(jié)合與反應(yīng)過(guò)程非常復(fù)雜,目前理論認(rèn)知不足,受環(huán)境影響因素很大,數(shù)據(jù)穩(wěn)定性和可重復(fù)性較差。二是當(dāng)前的AI算法模型只納入部分化學(xué)指標(biāo),生物學(xué)指標(biāo)不完整。我們能夠基于化學(xué)數(shù)據(jù)去設(shè)計(jì)AI算法,比如判斷小分子的各種體外物理化學(xué)性質(zhì)、晶型以及與靶點(diǎn)結(jié)合的親和力;但是對(duì)于小分子藥物在生物系統(tǒng)中的作用很難用一組有限的參數(shù)來(lái)定義,而化合物在體內(nèi)的其他特性在模型中被降級(jí)為次要的或可忽略部分,包括其前體化合物、代謝產(chǎn)物、濃度依賴性效應(yīng)等,這些被忽略的因素決定著藥物能否到達(dá)其預(yù)期的靶點(diǎn)、能否起到治療效果、以及其毒副作用是否在可以接受的范圍等。這使得AI在藥物發(fā)現(xiàn)和藥效評(píng)估中面臨著更大的不確定性。三是高質(zhì)量數(shù)據(jù)制約。我國(guó)的醫(yī)藥大數(shù)據(jù)存在數(shù)據(jù)量少、數(shù)據(jù)體系不完整、數(shù)據(jù)標(biāo)準(zhǔn)不統(tǒng)一、數(shù)據(jù)共享機(jī)制不完善等問(wèn)題。諸如病歷、隨訪記錄目前還很難標(biāo)準(zhǔn)化、數(shù)字化;由于涉及患者隱私,臨床數(shù)據(jù)的靈活運(yùn)用也受到了一定限制;國(guó)內(nèi)創(chuàng)新藥研發(fā)起步較晚,原始數(shù)據(jù)積累有限;國(guó)內(nèi)藥品數(shù)據(jù)存儲(chǔ)分散,存儲(chǔ)格式不一,完整藥物數(shù)據(jù)獲取比較困難;新藥研發(fā)領(lǐng)域的核心數(shù)據(jù)來(lái)源于藥企,考慮到商業(yè)機(jī)密的問(wèn)題,企業(yè)不愿公開(kāi)核心數(shù)據(jù)。醫(yī)藥數(shù)據(jù)的數(shù)量和質(zhì)量將成為制藥行業(yè)AI發(fā)展的主要障礙。四是高端復(fù)合型人才缺失。AI新藥研發(fā)兼具信息科技和醫(yī)藥雙重屬性,需要一批既掌握AI前沿技術(shù),又精通新藥研發(fā)的復(fù)合型人才,由于我國(guó)相關(guān)領(lǐng)域的教學(xué)科研起步較晚,人才問(wèn)題難以在短期內(nèi)得到解決。據(jù)統(tǒng)計(jì),全世界大約[26]有2.2萬(wàn)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論