中國AI制藥企業(yè)白皮書 2024_第1頁
中國AI制藥企業(yè)白皮書 2024_第2頁
中國AI制藥企業(yè)白皮書 2024_第3頁
中國AI制藥企業(yè)白皮書 2024_第4頁
中國AI制藥企業(yè)白皮書 2024_第5頁
已閱讀5頁,還剩137頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

WhitePaperonChineseAIPharmaceutical成都高投生物醫(yī)藥園區(qū)管理有限公司2023年11月30日免責(zé)聲明本報(bào)告基于本公司(藥融云數(shù)字科技(成都)有限公司)及其研究人員認(rèn)為可信的公開資料和文獻(xiàn),反映了研究人員的研究觀點(diǎn),結(jié)論不受任何第三方的授意或影響。但本公司對(duì)這些信息的真實(shí)性、準(zhǔn)確性、可靠性和完整性不作任何保證,且本報(bào)告中的資料、意見、預(yù)測均反映報(bào)告初次公開發(fā)布之前的判斷,可能會(huì)隨時(shí)調(diào)整。本公司可在不發(fā)出通本報(bào)告所有的信息或觀點(diǎn)僅作為讀者的參考,不構(gòu)成任何投資、法律、會(huì)在任何情況下,本公司不對(duì)任何人因使用本報(bào)告中的內(nèi)容所致的損本報(bào)告相關(guān)的知識(shí)產(chǎn)權(quán)歸本公司所有。未經(jīng)本公司事先授權(quán),任何人不得對(duì)本報(bào)告進(jìn)行任何形式的翻譯、發(fā)布或復(fù)制。如需引用,應(yīng)注明出處為“藥融云數(shù)字科技(成都)有限公司”以及“中國AI制藥企業(yè)白皮書”名稱,且不得對(duì)本報(bào)2編制說明作為近年來技術(shù)變革的重要力量,AI在生物醫(yī)藥領(lǐng)域展示了極大的應(yīng)用潛力。國家發(fā)改委2022年發(fā)布的《“十四五”生物經(jīng)濟(jì)發(fā)展規(guī)劃》提出,要利用云計(jì)算、大數(shù)據(jù)、人工智能等信息技術(shù),對(duì)治療適應(yīng)癥與新靶點(diǎn)驗(yàn)證、臨床前與臨床試驗(yàn)、產(chǎn)品設(shè)計(jì)優(yōu)化與產(chǎn)業(yè)化等新藥研制過程進(jìn)行全程監(jiān)管,實(shí)現(xiàn)藥物產(chǎn)業(yè)的精準(zhǔn)化研制與規(guī)?;l(fā)展。隨著AI浪潮席卷全球,生物制藥也被視為大模型有望率基于此,2023年10月,成都高投生物醫(yī)藥園區(qū)管理有限公司聯(lián)合藥融云數(shù)字科技(成都)有限公司,共同編寫了《中國AI制藥企業(yè)白皮書》,希望為業(yè)界廠商、政府機(jī)構(gòu)等相關(guān)方提供有益思考,由于時(shí)間倉促,水平所限,我們的工作還有不足之處。下一步,我們還將廣泛采納各方面的建議,進(jìn)一步深入相關(guān)研究,持續(xù)完善白皮書內(nèi)容,在已有版本的基礎(chǔ)上,適成都高投生物醫(yī)藥園區(qū)管理有限公司2023年11月3456目錄第一章人工智能(AI)制藥行業(yè)概覽人工智能的基本概念09AI制藥是AI產(chǎn)業(yè)化中重要的應(yīng)用場景10AI制藥行業(yè)發(fā)展歷史11AI制藥行業(yè)配套政策分析13AI制藥行業(yè)投融資現(xiàn)狀分析14第二章AI+藥物發(fā)現(xiàn)AI助力藥物發(fā)現(xiàn)階段概覽16AI助力藥物靶點(diǎn)發(fā)現(xiàn)與驗(yàn)證16AI驅(qū)動(dòng)藥物分子設(shè)計(jì)、優(yōu)化23AI輔助藥物分子篩選34第三章AI+臨床前研發(fā)AI助力藥物臨床前研發(fā)概覽38AI輔助藥物理化特性預(yù)測38AI輔助藥物劑型設(shè)計(jì)39AI助力藥物ADMET性質(zhì)預(yù)測40AI+臨床前研發(fā)國內(nèi)企業(yè)布局42第四章AI+臨床研發(fā)AI助力新藥臨床試驗(yàn)概覽46AI助力受試者招募管理50AI助力預(yù)測臨床試驗(yàn)效果53AI助力臨床試驗(yàn)數(shù)據(jù)管理57AI賦能藥物注冊(cè)申報(bào)59第五章AI+藥物生產(chǎn)及商業(yè)化AI賦能藥物生產(chǎn)支持61AI賦能藥物市場開拓與商業(yè)化65AI逐步應(yīng)用于藥物警戒領(lǐng)域67第六章AI制藥行業(yè)總結(jié)及未來展望現(xiàn)狀分析及展望70上市企業(yè)商業(yè)化模式73全球主要AI制藥上市企業(yè)747High-throughputSequDeepLearningNLPNaturalLanguageProcessingGenerativeAdversarialNetwoRecurrentNeuralNetworkVAEVariationalAutoencSimplifiedMolecularInputGenerativePre-TrainedQuantitativestructure-Activ8第一章人工智能(AI)制藥行業(yè)概覽9計(jì)算機(jī)視覺自然語言處理系統(tǒng)推薦系統(tǒng)多智能體系統(tǒng)進(jìn)化計(jì)算模糊邏輯專家系統(tǒng)知識(shí)表示無監(jiān)督式學(xué)習(xí)半監(jiān)督學(xué)習(xí)集成學(xué)習(xí)深度學(xué)習(xí)強(qiáng)化學(xué)習(xí)回歸分析分類聚合量度學(xué)習(xí)因果關(guān)系計(jì)算機(jī)視覺自然語言處理系統(tǒng)推薦系統(tǒng)多智能體系統(tǒng)進(jìn)化計(jì)算模糊邏輯專家系統(tǒng)知識(shí)表示無監(jiān)督式學(xué)習(xí)半監(jiān)督學(xué)習(xí)集成學(xué)習(xí)深度學(xué)習(xí)強(qiáng)化學(xué)習(xí)回歸分析分類聚合量度學(xué)習(xí)因果關(guān)系人工智能(ArtificialIntelligence,AI),是研究、開發(fā)用于模擬、延伸和擴(kuò)展人的智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的一門新的技術(shù)科學(xué)。人工智能是計(jì)算機(jī)科學(xué)的一個(gè)分支,它企圖了解智能的實(shí)質(zhì),并生產(chǎn)出一種新的能以人類智能相似的方式做出反應(yīng)的智能機(jī)器。人工智能是一個(gè)廣泛的領(lǐng)域,包括專家系統(tǒng)、多智能體系統(tǒng)、進(jìn)化計(jì)算、模糊邏輯、機(jī)器學(xué)習(xí)、知識(shí)表示、推薦系統(tǒng)、自然語言處理系統(tǒng)和計(jì)算機(jī)視覺等多個(gè)方面。其中,機(jī)器學(xué)習(xí)技術(shù)是應(yīng)用最廣泛的一種技術(shù),具體包括以下幾種方法:監(jiān)督式學(xué)習(xí)、無監(jiān)督式學(xué)習(xí)、半監(jiān)督學(xué)習(xí)、集成學(xué)習(xí)、深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí)、回歸分析、分類聚合、量度學(xué)習(xí)、因果關(guān)系等。各類機(jī)器學(xué)習(xí)技術(shù)在各個(gè)領(lǐng)域都有廣泛的應(yīng)用,推動(dòng)了人工智能的發(fā)展和應(yīng)用。人工智能作為新一輪產(chǎn)業(yè)變革的核心驅(qū)動(dòng)力,將進(jìn)一步釋放歷次科技革命和產(chǎn)業(yè)變革積蓄的巨大能量,并創(chuàng)造新的強(qiáng)大引擎,重構(gòu)生產(chǎn)、分配、交換、消費(fèi)等經(jīng)濟(jì)活動(dòng)各環(huán)節(jié),形成從宏觀到微觀各領(lǐng)域的智能化新需求,催生新技術(shù)、新產(chǎn)品、新產(chǎn)業(yè)、新業(yè)態(tài)、新模式,引發(fā)經(jīng)濟(jì)結(jié)構(gòu)重大變革,深刻改變?nèi)祟惿a(chǎn)生活方式和思維模式,實(shí)現(xiàn)社會(huì)生產(chǎn)力的整體躍升。監(jiān)督式學(xué)習(xí)[1]整理自藥融咨詢AI制藥(AIDD)是指利用AI技術(shù)在藥物研發(fā)、藥物設(shè)計(jì)、藥物篩選、臨床試驗(yàn)和藥物生產(chǎn)等各個(gè)環(huán)節(jié)中應(yīng)用的制藥領(lǐng)域。AI在藥物研發(fā)中可以通過數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)和深度學(xué)習(xí)等技術(shù),加速藥物發(fā)現(xiàn)和設(shè)計(jì)過程,提高研發(fā)效率和成功率。AI還可以在藥物篩選中幫助挑選出具有潛在療效的候選藥物,降低研發(fā)成本和時(shí)間。在臨床試驗(yàn)可以應(yīng)用于藥物生產(chǎn)中的質(zhì)量控制、流程優(yōu)化和智能化管理等方面,提高藥物的生產(chǎn)效率和質(zhì)量。藥物-測制理選隨著AI技術(shù)的發(fā)展,AI技術(shù)基本實(shí)現(xiàn)了藥物研發(fā)與市場化全流程的覆蓋,特別是在藥物發(fā)現(xiàn)和臨床前階段取得了顯著進(jìn)展。藥物發(fā)現(xiàn)和臨床前研發(fā)階段是AIDD的主要優(yōu)化環(huán)節(jié),也是AI制藥企業(yè)主要的研發(fā)及商業(yè)化方向。利用AI技術(shù),企業(yè)能夠在藥物發(fā)現(xiàn)和臨床前研發(fā)階段,節(jié)約大量濕試驗(yàn)成本與時(shí)間成本,并實(shí)現(xiàn)高通量篩選,助力更多新靶點(diǎn)的發(fā)現(xiàn)與“老藥新用”的適應(yīng)癥拓展。未來AI技術(shù)將持續(xù)發(fā)展,相信能夠在藥品臨床開發(fā)、上市后生產(chǎn)與商業(yè)化等方面更進(jìn)一步。AI制藥行業(yè)發(fā)展歷史7,0006,5002022年6,500AlphaFold能夠測所有已分類6,000蛋白質(zhì)的3D結(jié)構(gòu)6,0002000年2000年5,500-5,0005,0004,5002012年第一家AI第一家AI用于藥物研發(fā)商業(yè)3,5002023年2023年2006年2,000升2,0001,5001,000500019801982198419861988199019921994199619982000200220042006200820102012201420162018202020222024縱觀AIDD行業(yè)的發(fā)展,主要分為3個(gè)時(shí)期:1956年~1981年的技術(shù)積累期,該時(shí)期是相關(guān)概念的早期構(gòu)想階段,但由于技術(shù)限制未能成功實(shí)施;1981年~2012年計(jì)算機(jī)輔助藥物設(shè)計(jì)(CADD)研發(fā)時(shí)期,CADD的虛擬篩選,可用于尋找有希望成藥的苗頭化合物進(jìn)行藥物開發(fā),但CADD是藥物發(fā)現(xiàn)過程的支持部門,而不是核心部門。CADD僅縮短藥物發(fā)現(xiàn)時(shí)間,受限于工藝優(yōu)化、臨床、注冊(cè)等環(huán)節(jié),新藥數(shù)量并未出現(xiàn)激增。86420[1]數(shù)據(jù)來源自WebofScienceScienceCitationIndexExpanded數(shù)據(jù)庫2012年~至今的AIDD高速發(fā)展期,該時(shí)期迎來的AI技術(shù)的“井噴式”發(fā)展,AIDD相關(guān)論文數(shù)量迎來“指數(shù)級(jí)”增長,相關(guān)技術(shù)棧逐步豐富完善。在藥物發(fā)現(xiàn)及臨床前研究階段,基于從前的CADD技術(shù),結(jié)合人工智能、機(jī)器學(xué)習(xí)和深度學(xué)習(xí)等技術(shù),可以處理大量的生物數(shù)據(jù),從而在藥物開發(fā)全過程中減少時(shí)間和成本。制藥行業(yè)平均研發(fā)時(shí)長[2]5同時(shí),區(qū)別于CADD研發(fā)時(shí)期主要聚焦于藥物發(fā)現(xiàn)階段,AI技術(shù)逐步應(yīng)用于藥物開發(fā)全流程。如:臨床前研究中的劑型開發(fā)、工藝優(yōu)化等;臨床研究階段的受試者篩選及結(jié)果預(yù)測;藥物生產(chǎn)過程中的智能化生產(chǎn)管理、生產(chǎn)工藝優(yōu)化。AIDD行業(yè)相對(duì)起步較晚,但管線數(shù)量逐年增加,頭部AI藥企臨床前研究管線中藥物數(shù)量已接近傳統(tǒng)頭部藥企的50%,并已經(jīng)有多款藥物進(jìn)入臨床階段。[1]JayatungaMKP,XieW,RuderL,SchulzeU,MeierC.AIinsmall-moleculedrugdiscovery:acomingwave?.NatRevDrugDiscov.2022;21(3):175-176.[2]PaulSM,MytelkaDS,DunwiddieCT,etal.HowtoimproveR&Dproductivity:thepharmaceuticalindustry'sgrandchallenge.NatRevDrugDiscov.2010;9(3):203-214[3]根據(jù)公開資料整理AIDD行業(yè),是在近年才開始嶄露頭角的新興領(lǐng)域,相比傳統(tǒng)制藥行業(yè),它起步較晚。這主要是因?yàn)锳I技術(shù)的發(fā)展和應(yīng)用在醫(yī)藥領(lǐng)域的探索相對(duì)較新。然而,隨著人工智能技術(shù)的迅猛發(fā)展和在醫(yī)療領(lǐng)域的廣泛應(yīng)用,AIDD行業(yè)正逐漸嶄露出巨大的潛力。盡管AIDD行業(yè)發(fā)展迅速,但相關(guān)的配套政策相對(duì)較少。由于AI技術(shù)的復(fù)雜性和涉及的倫理、法律等問題,政府和監(jiān)管機(jī)構(gòu)需要時(shí)間來理解和評(píng)估其潛在影響,以制定相應(yīng)的政策和法規(guī)。美國、歐洲等國家及地區(qū),行業(yè)起步較早,經(jīng)過多年的發(fā)展及規(guī)劃初版的監(jiān)管政策于近年才推出。intheDevelopmentofDrugBiologicalProduct《ReflectionpaperontheuseofArtificialIntelligence(AI)inthemedicinal概述在整個(gè)藥品生命周期和基于風(fēng)險(xiǎn)的目前,國內(nèi)AIDD行業(yè)相關(guān)政策起始于“十四五”時(shí)期,主要以政府宏觀政策為主,相應(yīng)的執(zhí)行發(fā)展政策及監(jiān)管政策,還需要隨著國內(nèi)行業(yè)逐步深入發(fā)展而進(jìn)行細(xì)化、完善。《關(guān)于加快場景創(chuàng)新以人工智能高49.4 49.4 43.049.029.023.0201820192020202120222023H1各省都緊跟國家政策的方向,因地制宜出臺(tái)了各地的特色政策。以AIDD行業(yè)產(chǎn)業(yè)布局最密集的上海為例:《上海市計(jì)算生物學(xué)創(chuàng)新發(fā)2.發(fā)展AI藥物研發(fā)的原創(chuàng)性算法、模型與計(jì)算平臺(tái),開發(fā)小分子藥模型與設(shè)計(jì)平臺(tái),發(fā)展中藥復(fù)方藥理藥效預(yù)測模型《上海市生物醫(yī)藥產(chǎn)業(yè)數(shù)字化轉(zhuǎn)型實(shí)施方案(2023—2025年,推動(dòng)5個(gè)以上人工智能輔助研發(fā)藥物進(jìn)入臨床,實(shí)現(xiàn)3深化人工智能技術(shù)賦能醫(yī)藥創(chuàng)新研發(fā);提升近年來,AIDD行業(yè)曾短暫成為投資的熱點(diǎn),其中2021年行業(yè)融資金額達(dá)歷史高點(diǎn),超過290億美元。2022年以來,受資本環(huán)境影響,行業(yè)投資“熱潮”已經(jīng)有所退卻,回落至相對(duì)穩(wěn)定水平,預(yù)計(jì)融資金額將處于下行水平。AIDD資金回報(bào)周期長,全球投資者偏好選擇成長期(69.4%)和初創(chuàng)期(19.2%)企業(yè),中國投資者選擇初創(chuàng)期、成長期、成熟期比例分別為33.1%,42.6%,23.9%[1]。0201820192020202120222023H1806040 23.9%42.6%[1]整理自藥融咨詢,數(shù)據(jù)來源自藥融云投融資數(shù)據(jù)庫第二章AI+藥物發(fā)現(xiàn)AIAI輔助藥物分子設(shè)計(jì)、優(yōu)化藥物靶點(diǎn)發(fā)現(xiàn)與驗(yàn)證化合物篩選隨著微陣列、RNA-seq和高通量測序(HTS)技術(shù)的發(fā)展,高校、研究機(jī)構(gòu)及企業(yè)實(shí)驗(yàn)室產(chǎn)生大量的生物醫(yī)學(xué)數(shù)據(jù),當(dāng)代藥物發(fā)現(xiàn)也因此進(jìn)入了生物大數(shù)據(jù)時(shí)代。隨著生物大數(shù)據(jù)分析,藥物發(fā)現(xiàn)研究的重點(diǎn)逐漸轉(zhuǎn)向靶向藥物發(fā)現(xiàn),即以“基因-藥物-疾病”為中心,通過AI技術(shù)分析與疾病高度相關(guān)的靶點(diǎn),發(fā)現(xiàn)酶、蛋白質(zhì)或其他基因產(chǎn)物,以及針對(duì)該靶點(diǎn)的小分子。藥物靶點(diǎn)發(fā)現(xiàn)策略包括實(shí)驗(yàn)方法、多組學(xué)分析方法和AI計(jì)算方法。實(shí)驗(yàn)方法受限于通量和成本,而基于AI技術(shù)的多組學(xué)分析方法和AI計(jì)算方法能夠高效、有效地發(fā)掘具有潛力成為藥物靶點(diǎn)的分子。多組學(xué)分析方法整合生物學(xué)數(shù)據(jù),揭示疾病關(guān)鍵靶點(diǎn),而AI計(jì)算方法利用機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘技術(shù)篩選化合物庫,加速藥物靶點(diǎn)發(fā)現(xiàn)。這些方法在藥物研究和開發(fā)中具有重要作用,并在未來發(fā)展中將變得更加關(guān)鍵。用助[1]Pun,FrankW.,IvanV.Ozerov,andAlexZhavoronkov."AI-poweredtherapeutictargetdiscovery."TrendsinPharmacologicalSciences(2023).近年來,基于機(jī)器學(xué)習(xí)的算法,特別是深度學(xué)習(xí)方法,在制藥領(lǐng)域取得了顯著成果并引起了廣泛關(guān)注。深度學(xué)習(xí),也被稱為深度神經(jīng)網(wǎng)絡(luò),由多個(gè)隱藏層節(jié)點(diǎn)組成,通過級(jí)聯(lián)方式逐步進(jìn)行數(shù)據(jù)處理和特征提取。與傳統(tǒng)的機(jī)器學(xué)習(xí)方法相比,近期更加先進(jìn)的基于深度學(xué)習(xí)的架構(gòu),如生成對(duì)抗網(wǎng)絡(luò)(GANs)、循環(huán)神經(jīng)網(wǎng)絡(luò)和遷移學(xué)習(xí)技術(shù),在制藥方面廣泛應(yīng)用,例如新型小分子設(shè)計(jì)、衰老研究以及基于轉(zhuǎn)錄數(shù)據(jù)的藥物藥理預(yù)測。此外,利用公開可用的多組學(xué)數(shù)據(jù)和文本挖掘,深度學(xué)習(xí)還在未滿足臨床需求的疾病方面發(fā)揮著重要作用。研究機(jī)構(gòu)/公司Useofdeepneuralnetworkensemblestoidentifyembryonic-fetaltransitionmarkers:reCOX7A1inembryonicandcan利用>12,000個(gè)胚胎和成年細(xì)胞的轉(zhuǎn)Usingdeeplearningtoassocwithage-relateddisGCN-MF:Disease-GeneAssoIdentificationByGraphConvolutional提出了一種新的疾病-基因關(guān)聯(lián)任務(wù)[1]Pun,FrankW.,IvanV.Ozerov,andAlexZhavoronkov."AI-poweredtherapeutictargetdiscovery."TrendsinPharmacologicalSciences(2023).研究機(jī)構(gòu)/公司MolecularmodelingwithmachuniversalpotentialfAccuratepredictionofproteinstructuresandinteractionsusingathree-t報(bào)道了新蛋白結(jié)構(gòu)預(yù)測工具使整個(gè)DL能夠同時(shí)學(xué)習(xí)到蛋白一級(jí)/DeepMindAlphaFoldProteinStructureDatabaexpandingthestructuralcoverageofprotein-sequencespacewithHelixfold-Single:Msa-FreeProPredictionByUsingProteinAnAlternative基于大型語言模型的聊天功能,如微軟的BioGPT和InsilicoMedicineiv的ChatPandaGPT,通過對(duì)從數(shù)百萬論文中提取的大量文本數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練,可以將疾病、基因和生物過程聯(lián)系起來,從而快速識(shí)別疾病發(fā)生和進(jìn)展的生物學(xué)機(jī)制,并發(fā)現(xiàn)潛在的藥物靶點(diǎn)和生物標(biāo)志物。研究機(jī)構(gòu)/公司BioGPT:GenerativePre-trainedTrforBiomedicalTextGeneTransformer語言模型,在大規(guī)模BioGPT,并證明BioGPT在生物醫(yī)學(xué)文Contrastivelearninginpredictsinteractionsbetween法ConPLex,可以利用預(yù)先訓(xùn)練的蛋白質(zhì)語言模型(PLex),并采用蛋白質(zhì)錨“合成數(shù)據(jù)”是指通過人工生成的數(shù)據(jù),它可以模擬真實(shí)世界中的模式和特征。借助人工智能算法,能夠創(chuàng)建合成數(shù)據(jù),以模擬各種生物數(shù)據(jù),從而幫助研究人員探索和分析新藥物的可能。這種方法在實(shí)驗(yàn)數(shù)據(jù)稀缺或難以獲得的治療領(lǐng)域尤其有價(jià)值。舉例來說,在罕見疾病或患者數(shù)據(jù)有限的情況下,人工智能可以基于現(xiàn)有的知識(shí)和模式生成合成數(shù)據(jù)。然后,我們可以利用這些合成數(shù)據(jù)來訓(xùn)練人工智能模型,并識(shí)別可能被忽視的潛在治療靶點(diǎn)。研究機(jī)構(gòu)/公司MolecularGenerationfTranscriptomeChangesWitAutoencodersAdversarialgenerationofgeneexpression研究機(jī)構(gòu)/公司所networkbiologyAI靶點(diǎn)發(fā)現(xiàn)需要大量的生物數(shù)據(jù)來訓(xùn)練模型,并需要專業(yè)人員對(duì)數(shù)據(jù)進(jìn)行清洗、預(yù)處理,去除冗余和錯(cuò)誤數(shù)據(jù),并對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化和格式化。對(duì)于AIDD初創(chuàng)企業(yè)而言,與大型制藥企業(yè)相比,他們面臨著生物實(shí)驗(yàn)場景數(shù)據(jù)嚴(yán)重不足的挑戰(zhàn)。在短時(shí)間內(nèi)難以積累足夠的數(shù)據(jù)量。因此,AI靶點(diǎn)發(fā)現(xiàn)技術(shù)在初創(chuàng)企業(yè)中具有一定的門檻。國內(nèi)能夠進(jìn)行靶點(diǎn)發(fā)現(xiàn)的AIDD企業(yè)約32家[1],主要分布在北京、上海、深圳等地區(qū),具體企業(yè)名稱及布局技術(shù)領(lǐng)域如下表所示。值得注意的是,AI靶點(diǎn)發(fā)現(xiàn)技術(shù)具有一定的局限性,靶點(diǎn)發(fā)現(xiàn)的企業(yè)并非完全利用AI技術(shù):例如,水木未來能夠利用冷凍電鏡技術(shù)解析蛋白質(zhì)結(jié)構(gòu)進(jìn)而完成靶點(diǎn)的發(fā)現(xiàn);藥物牧場利用IDInvivo+轉(zhuǎn)座子靶點(diǎn)發(fā)現(xiàn)平臺(tái),結(jié)合Medchem5人工智能藥物化學(xué)平臺(tái)在藥物靶點(diǎn)發(fā)現(xiàn)上進(jìn)行開拓。能夠進(jìn)行靶點(diǎn)發(fā)現(xiàn)的AIDD企業(yè)主要分為3類:AIDDBiotech企業(yè)、具備AI技術(shù)的CRO企業(yè)、AIDD技術(shù)平臺(tái)企業(yè)。企業(yè)技術(shù)/投資背景Biotech/CROBiotech/CROBiotech/CROBiotechBiotechBiotechBiotechBiotechBiotech/CROBiotechBiotechBiotech/CROBiotechBiotech/CRO[1]公開資料整理BiotechBiotech/CROBiotechBiotechBiotechBiotechBiotech英矽智能是一家由生成式人工智能驅(qū)動(dòng)的臨床階段藥物研發(fā)公司,通過下一代人工智能系統(tǒng)連接生物學(xué)、化學(xué)和臨床試驗(yàn)分析,利用深度生成模型、強(qiáng)化學(xué)習(xí)、轉(zhuǎn)換模型等現(xiàn)代機(jī)器學(xué)習(xí)技術(shù),構(gòu)建強(qiáng)大且高效的人工智能藥物研發(fā)平臺(tái),識(shí)別全新靶點(diǎn)并生成具有特定屬性分子結(jié)構(gòu)的候選藥物。英矽智能聚焦癌癥、纖維化、免疫、中樞神經(jīng)系統(tǒng)疾病、衰老相關(guān)疾病等未被滿足醫(yī)療需求領(lǐng)域,推進(jìn)并加速創(chuàng)新藥物研發(fā)。英矽智能AI靶點(diǎn)發(fā)現(xiàn)技術(shù)全球領(lǐng)先,具有大量應(yīng)用實(shí)例。自主研發(fā)人工智能生物靶點(diǎn)發(fā)現(xiàn)平臺(tái)PandaOmics?,公司利用該平臺(tái)確定了許多此前從未報(bào)道過的肌萎縮側(cè)索硬化癥(ALS)潛在治療靶點(diǎn)[1]。藥物牧場成立于2015年,主要利用遺傳學(xué)和人工智能技術(shù)開發(fā)針對(duì)乙肝、腫瘤和自身免疫疾病的創(chuàng)新療法。利用IDInvivo+轉(zhuǎn)座子靶點(diǎn)發(fā)現(xiàn)平臺(tái),結(jié)合Medchem5人工智能藥物化學(xué)平臺(tái)在藥物靶點(diǎn)開拓的“卡脖子”領(lǐng)域攻關(guān)突破。前者基于轉(zhuǎn)座子進(jìn)行基因篩選,在具有完整免疫系統(tǒng)的活體動(dòng)物中直接發(fā)現(xiàn)新藥物靶點(diǎn);后者利用深度學(xué)習(xí)技術(shù)進(jìn)行藥物分子的設(shè)計(jì)。藥物牧場已經(jīng)發(fā)現(xiàn)20余個(gè)創(chuàng)新靶點(diǎn);結(jié)合專有的人工智能(AI)藥物發(fā)現(xiàn)平臺(tái),公司原創(chuàng)新藥DF-006已經(jīng)進(jìn)入I期國際多中心臨床。百圖生科是中國首家生物計(jì)算技術(shù)驅(qū)動(dòng)的生命科學(xué)平臺(tái)公司,致力于用高性能生物計(jì)算和多組學(xué)數(shù)據(jù)技術(shù)加速創(chuàng)新藥物和早篩早診等精準(zhǔn)生命科學(xué)產(chǎn)品的研發(fā)。業(yè)務(wù)將分為兩大階段,第一階段利用前沿AI技術(shù)構(gòu)建完整的生物計(jì)算平臺(tái),并與提供新的數(shù)據(jù)軸和新的數(shù)據(jù)分析、藥物設(shè)計(jì)工具的初創(chuàng)企業(yè)與研究機(jī)構(gòu)攜手,構(gòu)建生物計(jì)算生態(tài),為生命科學(xué)企業(yè)和科研用戶提供豐富的工具能力和完整的解決方案。第二階段,將深度參與或主導(dǎo)發(fā)起新型精準(zhǔn)藥物和精準(zhǔn)診斷產(chǎn)品的研發(fā),攜手合作伙伴,研發(fā)生命科學(xué)產(chǎn)品。百圖生物成果入選美國癌癥研究協(xié)會(huì)(AACR)2023年會(huì),研究內(nèi)容覆蓋全新抗體設(shè)計(jì)的蛋白結(jié)構(gòu)預(yù)測模型、靶點(diǎn)發(fā)現(xiàn)[2],以及高通量自動(dòng)化蛋白表達(dá)/表征平臺(tái)的構(gòu)建。予路乾行是一家以人工智能、量子力學(xué)及分子模擬算法為核心技術(shù),通過模擬運(yùn)算賦能新藥研發(fā)的交叉學(xué)科技術(shù)驅(qū)動(dòng)型生物醫(yī)藥公司。公司結(jié)合自主創(chuàng)新的AI技術(shù),結(jié)合高精度分子動(dòng)力學(xué)模擬核心算法,建立了國際領(lǐng)先的新一代人工智能藥物研發(fā)平臺(tái)。該AI研發(fā)平臺(tái)主要針對(duì)未解析靶點(diǎn)與高柔性靶點(diǎn)進(jìn)行高精度結(jié)構(gòu)解析及生理動(dòng)態(tài)過程還原模擬,從而實(shí)現(xiàn)難成藥靶點(diǎn)的新藥研發(fā)。[1]IdentificationofTherapeuticTargetsforAmyotrophicLateralSclerosisUsingPandaOmics-AnAI-EnabledBiologicalTargetDiscoveryPlatform[2]IdentificationofMolecularTargets2/NewNonclinicalModelsforTargets藥物設(shè)計(jì)的目標(biāo)是開發(fā)出具有特定性質(zhì)、符合特定標(biāo)準(zhǔn)的藥物,包括療效、安全性、合理的化學(xué)和生物特性以及結(jié)構(gòu)的新穎性。近年來,利用深度生成模型和強(qiáng)化學(xué)習(xí)算法進(jìn)行新藥設(shè)計(jì)被認(rèn)為是一種有效的藥物發(fā)現(xiàn)方法。這種方法能夠繞過傳統(tǒng)基于經(jīng)驗(yàn)的藥物設(shè)計(jì)模式的限制,讓計(jì)算機(jī)通過自主學(xué)習(xí)藥物靶點(diǎn)和分子特征,以更快的速度和更低的成本生成符合特定要求的化合物。這種新方法為藥物設(shè)計(jì)領(lǐng)域帶來了更多的創(chuàng)新和可能性。AI生成模型在全新藥物設(shè)計(jì)領(lǐng)域具有巨大的優(yōu)勢,因?yàn)樗鼈冊(cè)谏煞肿訒r(shí)不需要先驗(yàn)的化學(xué)知識(shí)。這些模型可以在更廣闊的未知化學(xué)空間中進(jìn)行搜索,超越現(xiàn)有分子結(jié)構(gòu)的限制,自動(dòng)設(shè)計(jì)新的分子結(jié)構(gòu)。在新藥設(shè)計(jì)中,廣泛使用的深度生成模型包括基于循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的生成模型、變分自編碼器(VAE)和生成對(duì)抗網(wǎng)絡(luò)(GAN)等。利用生成模型設(shè)計(jì)分子的過程具有高度的隨機(jī)性,生成的分子在結(jié)構(gòu)上呈現(xiàn)千變?nèi)f化,質(zhì)量也參差不齊。強(qiáng)化學(xué)習(xí)可以通過微調(diào)模型參數(shù)進(jìn)行有針對(duì)性的優(yōu)化,使生成的分子具備特定的藥物分子特性。這種結(jié)合生成模型和強(qiáng)化學(xué)習(xí)的方法為全新藥物設(shè)計(jì)提供了新的途徑和可能性。[1]Zeng,Xiangxiang,etal."Deepgenerativemoleculardesignreshapesdrugdiscovery."CellReportsMedicine(2022).基于RNN的生成模型可以生成具有全新結(jié)構(gòu)的化合物,同時(shí)保持與樣本化合物具有相似的生化特性。訓(xùn)練過程首先利用大型化學(xué)數(shù)據(jù)庫對(duì)RNN模型進(jìn)行訓(xùn)練,使其學(xué)習(xí)如何生成正確的化學(xué)結(jié)構(gòu)。然后使用強(qiáng)化學(xué)習(xí)算法對(duì)RNN參數(shù)進(jìn)行微調(diào),使模型能夠?qū)⑸傻幕瘜W(xué)結(jié)構(gòu)映射到指定的化學(xué)空間。強(qiáng)化學(xué)習(xí)使基于RNN的生成模型能夠生成具有良好藥理特性的新分子,并確保生成分子的結(jié)構(gòu)多樣性。研究機(jī)構(gòu)/公司Molecularde-novodesigntRNN模型,以學(xué)習(xí)活性分子的特征并基于RNN的生成模型藥物在先導(dǎo)化合物的優(yōu)化方面發(fā)揮著作用。研究者提出了一種名為“Scaffold-constrainedmoleculargeneration(SAMOA)”的新分子生成算法,用于解決先導(dǎo)化合物優(yōu)化問題中的支架約束問題:使用RNN生成模型生成新分子的SMILES序列,然后使用精細(xì)采樣程序?qū)崿F(xiàn)支架約束并生成分子。此外,還應(yīng)用了一種基于策略的強(qiáng)化學(xué)習(xí)算法來探索相關(guān)的化學(xué)空間,并生成與預(yù)期相匹配的新分子。研究機(jī)構(gòu)/公司DeepReinforcementLearningfMultiparameterOptimiz[1]Tang,Bowen,JohnEwalt,andHo-LeungNg."GenerativeAImodelsfordrugdiscovery."BiophysicalandComputationalToolsinDrugDiscovery.Cham:SpringerInternationalPublishing,2021.221-243.VAE已成為復(fù)雜數(shù)據(jù)分布的無監(jiān)督學(xué)習(xí)最流行的方法之一。VAE模型能夠完成小分子的全新設(shè)計(jì)和肽序列的生成。VAE有許多不同的變體,但其核心架構(gòu)始終不變(如下圖所示)。VAE的變體主要可以分為SMILES-VAE、Graph-VAE和3Dgrid-VAE三種類型。SMILES-VAE是應(yīng)用最為廣泛,因?yàn)槠淙菀讓?shí)現(xiàn),例如英矽智能構(gòu)建的GENTRL算法。盡管GENTRL生成的分子順利通過實(shí)驗(yàn)驗(yàn)證,但仍難以保證生成100%驗(yàn)證的SMILES。Graph-VAE和3Dgrid-VAE能夠解決這些問題,由于3D結(jié)構(gòu)訓(xùn)練數(shù)據(jù)有限,目前商業(yè)化應(yīng)用較少。3D技術(shù)將對(duì)未來的AIDD項(xiàng)目具有巨大價(jià)值。[1]Zeng,Xiangxiang,etal."Deepgenerativemoleculardesignreshapesdrugdiscovery."CellReportsMedicine(2022).[2]Tang,Bowen,JohnEwalt,andHo-LeungNg."GenerativeAImodelsfordrugdiscovery."BiophysicalandComputationalToolsinDrugDiscovery.Cham:SpringerInternationalPublishing,2021.221-243.研究機(jī)構(gòu)/公司novoDrugDesign),DDR1抑制劑。抑制劑在體內(nèi)/體外實(shí)驗(yàn)均得HierarchicalGenerationofMolecularGraphsusingStructuralMotifsMulti-ObjectiveMoleculusingInterpretableSubstrRationaleRL訓(xùn)練了一個(gè)基于圖的強(qiáng)化學(xué)習(xí)模ANovelScalarizedScaffoldAlgorithmwithGraphVariationalAutoencoderfoofJAK1Inhibitors),利用Graph-GMVAE研究者生成了更強(qiáng)效的DesignintoQuantumSpaDeepLearningGAN主要由生成器和鑒別器組成,它們相互博弈,互相對(duì)抗,通過對(duì)抗生成高質(zhì)量的數(shù)據(jù)。GAN能夠生成與真實(shí)數(shù)據(jù)分布相似的新樣本,并能夠使用網(wǎng)絡(luò)來辨別網(wǎng)絡(luò),刪除不需要的內(nèi)容。在AIDD領(lǐng)域,GAN通常與特征學(xué)習(xí)和強(qiáng)化學(xué)習(xí)等技術(shù)相結(jié)合,在蛋白質(zhì)功能預(yù)測、小分子生成等方面發(fā)揮了重要作用?;贕AN已經(jīng)構(gòu)建多種分子生成模型,如Mol-CycleGAN、ORGANIC、RANC。時(shí)間研究機(jī)構(gòu)/公司相關(guān)論文/成果相關(guān)工作及發(fā)現(xiàn)2017年哈佛大學(xué)AnObjective-ReinforcedGeneratAdversarialNetworkforInverse-designORGANIC是著名的分子生成模型,已成為其他模型的比較基準(zhǔn)模型。它結(jié)合了GAN模型和強(qiáng)化學(xué)習(xí)算法,可以生成新穎有效的分子。2018年英矽智能莫斯科物理技術(shù)學(xué)院ReinforcedAdversarialNeuralComputer基于生成對(duì)抗網(wǎng)絡(luò)(GAN)范式和強(qiáng)化學(xué)習(xí)(RL),研究者開發(fā)了RANC的深度神經(jīng)網(wǎng)絡(luò)(DNN)架構(gòu),用于新型小分子有機(jī)結(jié)構(gòu)的從頭設(shè)計(jì)。2020年ArdigenMol-CycleGAN:Agenerativem研究者開發(fā)了Mol-CycleGAN模型,它能生成與原始化合物結(jié)構(gòu)相似度高的優(yōu)化化合物。在給定一個(gè)分子的情況下,Mol-CycleGAN模型會(huì)能夠生成結(jié)構(gòu)相似的分子,并對(duì)所考慮的屬性值進(jìn)行優(yōu)化。AAE在VAE基礎(chǔ)上增加了判別模型,對(duì)采樣分子和真實(shí)樣本進(jìn)行區(qū)分,基于對(duì)抗的思想訓(xùn)練生成模型和判別模型,擴(kuò)展了分子的生成空間,一定程度上彌補(bǔ)了VAE在生成分子時(shí)結(jié)構(gòu)新穎性方面的缺陷。研究機(jī)構(gòu)/公司Mail.RuThecornucopiaofmeaningfulleads:Applyingdeepadversarialautoenewmoleculedevelopmentin特性的候選分子。EntangledConditionalAdAutoencoderfordeNovoDrugDisco強(qiáng)化學(xué)習(xí)(RL)通過智能體在與環(huán)境的交互過程中,不斷優(yōu)化人工智能模型,以最大限度地提高預(yù)期的累積回報(bào)。與有監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)不同,RL可以在不受人類先驗(yàn)知識(shí)和訓(xùn)練數(shù)據(jù)束縛的情況下達(dá)到驚人的表現(xiàn),例如最著名的應(yīng)用是AlphaGo。研究機(jī)構(gòu)/公司MolecularDe-NovoDesigntOptimizationofMoleculesviaDeepMolDQN是第一次在分子生成中使用標(biāo)Deepreinforcementlearningf研究機(jī)構(gòu)/公司AcceleratedrationalPROTAdeeplearningandmolePROTAC。在短短49天內(nèi)發(fā)現(xiàn)了具有高Denovodrugdesignbyitermultiobjectivedeepreinfowithgraph-basedmolecular),生成與生物靶蛋白DRD2結(jié)合的新型分研究機(jī)構(gòu)/公司Prototype-BasedCompoundDiscDeepGenerativeModChemistry42:AnAI-DrivenMolecularDesignandOpDiscoveryofPotent,Selective,andOrallBioavailableSmall-MoleculeInhibitorsofCDK8fortheTreatmentofCancer有選擇性的、口服CDK8抑制劑,有潛目前,國內(nèi)外的AI藥企主要專注于技術(shù)相對(duì)成熟的小分子藥物研發(fā),并且已經(jīng)有多款由AI設(shè)計(jì)或輔助優(yōu)化的小分子藥物進(jìn)入臨床階段。然而,近年來,隨著新藥物形式的興起,布局抗體藥物、核酸藥物、多肽藥物、基因細(xì)胞治療藥物、合成生物學(xué)等領(lǐng)域的企業(yè)比例也在不斷增加。這些新藥物形式帶來了新的治療理念和手段,為疾病的治療提供了更廣闊的前景。AI技術(shù)在這些領(lǐng)域的應(yīng)用也在逐漸發(fā)展,為新藥物形式的研發(fā)和優(yōu)化提供支持。隨著技術(shù)的進(jìn)一步發(fā)展和應(yīng)用的推廣,未來可以期待AI在大分子藥物領(lǐng)域的應(yīng)用為醫(yī)藥行業(yè)帶來更多的創(chuàng)新和突破。研究機(jī)構(gòu)/公司Denovoproteindesignbydeepn依托晶泰科技自主搭建的XupremAb?sequencedesignusiDesignofprotein-bindingproteinsfromtheTop-downdesignofproteinarchitectureswithreinforcementDenovodesignofproteinstructureandAIGeneratedProtein平臺(tái)國內(nèi)能夠進(jìn)行藥物分子發(fā)現(xiàn)、設(shè)計(jì)、優(yōu)化的AIDD企業(yè)60余家[1],主要分布在北京、上海、深圳、蘇州、杭州等地區(qū),具體企業(yè)名稱及布局技術(shù)領(lǐng)域如下表所示。國內(nèi)的藥物分子設(shè)計(jì)、優(yōu)化AI發(fā)展水平參差,具備藥物分子從頭設(shè)計(jì)的AI技術(shù)的企業(yè)數(shù)量較少,而大多數(shù)企業(yè)根據(jù)現(xiàn)有數(shù)據(jù)庫進(jìn)行/提供藥物發(fā)現(xiàn)或“老藥新用”服務(wù)。企業(yè)技術(shù)/投資背景BiotechBiotech/CROBiotechBiotechBiotech/CROBiotech/技術(shù)平臺(tái)Biotech/CROBiotechBiotechBiotechBiotechBiotech/CROBiotech[1]公開資料整理企業(yè)技術(shù)/投資背景BiotechBiotechBiotech/CROBiotechBiotech/CROBiotechBiotechBiotechBiotech/CROBiotech/CROBiotech/CROBiotechBiotechBiotechBiotech/CROBiotech/CROBiotechBiotechAurekaBiotech企業(yè)技術(shù)/投資背景BiotechBiotech/CROBiotechBiotechBiotech/技術(shù)平臺(tái)云深智藥是由騰訊自主研發(fā)的AI驅(qū)動(dòng)的藥物發(fā)現(xiàn)平臺(tái)。該公司開發(fā)的iDrug平臺(tái)能夠?qū)崿F(xiàn)小分子的從頭合成?,F(xiàn)有的模型通過對(duì)ZINCdrug-like中超過680萬個(gè)小分子數(shù)據(jù)進(jìn)行訓(xùn)練學(xué)習(xí),來達(dá)到學(xué)習(xí)分子空間的目的。目前支持對(duì)319個(gè)Kinase和52個(gè)GPCR靶點(diǎn)進(jìn)行分子生成。在分子生成這一過程中,騰訊的iDrug平臺(tái)的算法能夠針對(duì)不同靶點(diǎn)在分子空間中的映射進(jìn)行針對(duì)性采樣,從而生成新的可能對(duì)靶點(diǎn)有活性的分子。晶泰科技是一家以智能化、自動(dòng)化驅(qū)動(dòng)的藥物研發(fā)科技公司,為全球生物醫(yī)藥企業(yè)提供藥物發(fā)現(xiàn)一體化解決方案。晶泰科技首創(chuàng)智能計(jì)算、智能實(shí)驗(yàn)和專家經(jīng)驗(yàn)相結(jié)合的藥物研發(fā)新模式,致力于打造三位一體的研發(fā)平臺(tái),助力客戶縮短藥物研發(fā)的周期,提高藥物研發(fā)成功率。晶泰科技具備小分子藥物發(fā)現(xiàn)技術(shù),基于智能計(jì)算、自動(dòng)化實(shí)驗(yàn)和專家經(jīng)驗(yàn)的“三位一體”研究模式,以XtalCryo靶點(diǎn)確證、XcelaHit分子設(shè)計(jì)、XceptionOp成藥性優(yōu)化和XcelDev可開發(fā)性優(yōu)化四大技術(shù)平臺(tái)覆蓋新藥研發(fā)從靶點(diǎn)到獲得PCC的完整流程,提供一體化藥物研發(fā)服務(wù)。此外,晶泰科技具備大分子藥物發(fā)現(xiàn)技術(shù),將AI算法與濕實(shí)驗(yàn)進(jìn)行有機(jī)結(jié)合擁有從靶點(diǎn)識(shí)別到先導(dǎo)抗體藥發(fā)現(xiàn)的全流程一體化能力。星藥科技是一家從臨床需求出發(fā)、以AI為核心技術(shù)驅(qū)動(dòng)藥物研發(fā)的生物科技公司。星藥致力于使用人工智能驅(qū)動(dòng)藥物研發(fā),布局未成藥、難成藥靶點(diǎn)的藥物研發(fā)管線,解決未滿足臨床需求。以“AI驅(qū)動(dòng)的研發(fā)管線”和“AI賦能的計(jì)算平臺(tái)”為雙循環(huán),賦能藥物研發(fā)產(chǎn)業(yè)。星藥人工智能藥物發(fā)現(xiàn)平臺(tái)Pyxir?使用AI前沿算法,結(jié)合計(jì)算化學(xué)、藥物化學(xué)和生物學(xué)的工具及經(jīng)驗(yàn),全方位攻克小分子藥物早期研發(fā)流程中的疑難問題,快速發(fā)現(xiàn)活性高、成藥性好且結(jié)構(gòu)新穎的候選分子。星藥的智能計(jì)算平臺(tái)M1結(jié)合了AI與經(jīng)典物理學(xué)原理,可快速準(zhǔn)確地描述分子和蛋白間的相互作用、精確地計(jì)算目標(biāo)藥物分子與特定靶標(biāo)的結(jié)合自由能,突破經(jīng)典計(jì)算模擬方法,達(dá)到世界頂尖水平。除了傳統(tǒng)的實(shí)驗(yàn)方法,計(jì)算機(jī)輔助藥物設(shè)計(jì)(Computer-AidedDrugDesign,CADD)自問世以來在藥物研發(fā)階段發(fā)揮了巨大的作用。藥物-靶標(biāo)相互作用(DTI)是藥物發(fā)現(xiàn)的重要基礎(chǔ),準(zhǔn)確有效的DTI預(yù)測能極大地助力藥物研發(fā),加速先導(dǎo)或苗頭化合物發(fā)現(xiàn)。計(jì)算機(jī)模擬DTI并非全新技術(shù),世面已有許多成熟的開源程序或商業(yè)化軟件。將AI技術(shù)引入CADD中,能夠一定程度提高分子篩選的效率與覆蓋度。近年來基于機(jī)器學(xué)習(xí)/深度學(xué)習(xí)的預(yù)測DTI的方法陸續(xù)被報(bào)道。以已知化合物的活性和結(jié)構(gòu)信息作為訓(xùn)練數(shù)據(jù),并對(duì)數(shù)據(jù)進(jìn)行預(yù)處理和特征提取,通過選擇合適的機(jī)器學(xué)習(xí)算法進(jìn)行模型構(gòu)建和訓(xùn)練。后續(xù)利用已構(gòu)建的機(jī)器學(xué)習(xí)模型對(duì)新化合物進(jìn)行預(yù)測和篩選,并結(jié)合化學(xué)規(guī)則和藥物性質(zhì)等要求對(duì)化研究機(jī)構(gòu)/公司DeepAtom:aframeworkforprligandbindingaffi構(gòu)建了DeepAtom模型,用于預(yù)測藥物-親和力。除了具備三維CNN模型的各種優(yōu)Thecornucopiaofmeaningfulleads:ApplyingdeepadversarialautoeGANcon通過對(duì)抗性學(xué)習(xí)策略訓(xùn)練生成模型Layer-wiserelevancepropagationofInteractionNetexplainsprotein-ligand原子間聯(lián)系,用CNN模塊分別學(xué)習(xí)藥物和Pre-TrainingofEquivariantGraphMatchingNetworkswithConformation研究機(jī)構(gòu)/公司atrainedTransformerfoLanguageofProtein模型的參數(shù)量高達(dá)1000億,是目前蛋白國內(nèi)能夠進(jìn)行藥物分子設(shè)計(jì)、優(yōu)化的AIDD企業(yè)約55家,主要分布在北京、上海、深圳、蘇州、杭州等地區(qū),具體企中國AIDD行業(yè)起步較歐美等國家略有滯后,雖然并不缺乏新藥管線,但大多數(shù)管線僅處于早期研發(fā)階段,具有臨床管線的AIDD企業(yè)數(shù)量較少。由于交叉學(xué)科的特性,早期AIDD公司成立后一般需要經(jīng)歷漫長的團(tuán)隊(duì)建設(shè)、平臺(tái)完善和技術(shù)驗(yàn)證的時(shí)期,自主設(shè)計(jì)分子并推進(jìn)到后期臨床的公司鳳毛麟角。除“老藥新用”外,目前國內(nèi)研發(fā)進(jìn)現(xiàn)階段AI藥企普遍數(shù)據(jù)生產(chǎn)能力和干濕實(shí)驗(yàn)結(jié)合能力不足,這限制了新平臺(tái)的應(yīng)用。AI藥企在新治療方式領(lǐng)域同樣面臨數(shù)據(jù)稀缺性和孤島效應(yīng),而且生物藥的數(shù)據(jù)生產(chǎn)成本更高,兼具不同藥物形式和AI的人才儲(chǔ)備更少,所以未來AI藥企需要持續(xù)加強(qiáng)數(shù)據(jù)資產(chǎn)的挖掘和累積。企業(yè)技術(shù)/投資背景BiotechBiotech/CROBiotechBiotech/CROBiotech/CROBiotechBiotechBiotech/CROBiotech[1]公開資料整理企業(yè)技術(shù)/投資背景BiotechBiotechBiotech/CROBiotechBiotechBiotech/CROBiotechBiotechBiotechBiotech/CROBiotech/CROBiotech/CROBiotechDEL賦能藥物研發(fā)Biotech/CROBiotech/CROBiotechBiotechBiotechAurekaBiotechBiotechBiotech/CROBiotechBiotechBiotech第三章AI+臨床前研發(fā)AI在藥物臨床前研發(fā)側(cè)重于非臨床藥理學(xué)、藥動(dòng)學(xué)和毒理學(xué)研究。藥物的物理化學(xué)特性及其ADMET特性對(duì)于藥代動(dòng)力學(xué)和毒理學(xué)研究至關(guān)重要。候選藥物的不良特性可能導(dǎo)致昂貴的藥物開發(fā)階段失敗。利用AI技術(shù)通過對(duì)候選藥物的相關(guān)特性進(jìn)行早期評(píng)估,可以降低臨床研究候選藥物的ADMET特性直接受其物理化學(xué)特性的影響,對(duì)于藥物成功上市至關(guān)重要。例如,藥物分子的溶解度會(huì)嚴(yán)重影響藥物的制劑方法,而藥物分子在不同pH條件下的ADMET特性則深受其電荷狀態(tài)的影響。盡管并非所有具有潛在藥物價(jià)值的苗頭化合物最終都能成功上市,但通過對(duì)苗頭化合物理化特性的研究,能夠提供大量實(shí)驗(yàn)數(shù)據(jù),完善AI預(yù)測模型,助力藥物晶型的設(shè)計(jì)與改良,制劑的設(shè)計(jì)與優(yōu)化,并為其他藥物的設(shè)計(jì)提供經(jīng)驗(yàn)與靈感。多晶型現(xiàn)象是一種物質(zhì)可以存在多種不同晶體結(jié)構(gòu)中的現(xiàn)象,對(duì)于化學(xué)藥物分子,幾乎所有固體藥物都具有多態(tài)性。由于晶型的變化可以改變固體化學(xué)藥物的許多物理性質(zhì)和化學(xué)性質(zhì)。藥物發(fā)展史上,存在一些藥物由于晶型問題而導(dǎo)致上市失敗的情況。晶型預(yù)測(CSP)是指給定分子的二維結(jié)構(gòu)式通過計(jì)算模擬獲得它的所有可能的穩(wěn)定晶型。晶型預(yù)測在制藥工業(yè)中具有重要意義。使用AI有效地動(dòng)態(tài)配置藥物晶型可以完全預(yù)測小分子藥物的所有可能的晶型,與傳統(tǒng)的藥物晶型研發(fā)相比,制藥公司不必?fù)?dān)心缺少重要的晶型。此外,晶型預(yù)測技術(shù)大大縮短了晶體的發(fā)展周期,更有效地選擇了合適的藥物晶型,縮短了開發(fā)周期并且降低成本?,F(xiàn)常見的方法或工具有CrystallineSpongeMethod、Dimorphite、ChemML等。研究機(jī)構(gòu)/公司CurrentState-of-the-artBasedApplicationsofVirtualPolymorphScreeningofPharmaceuticalCompoundChallengingCaseofAZD1305EffectofPolymerAdditivesontheCrystalHabitofMetforminHCI利用AI技術(shù)能夠識(shí)別并預(yù)測新分子溶解度等理化性質(zhì),在確定研發(fā)成本或臨床前終止研發(fā)至關(guān)重要。實(shí)驗(yàn)中測量溶解度存在較大的不確定性,導(dǎo)致測得的溶解度可能被高估。基于物理模型的第一性原理計(jì)算預(yù)測溶解度需要高額的計(jì)算成本,可行性較低。利用人工智能技術(shù)建立基于物理模型的熱力學(xué)溶解度預(yù)測流程,實(shí)現(xiàn)了輕量級(jí)晶型預(yù)測技術(shù),這對(duì)于預(yù)測分子的熱力學(xué)溶解度具有重要意義。這些方法可以幫助提高溶解度預(yù)測的準(zhǔn)確性,加速藥物開發(fā)過程,并為決策提供更可靠的依據(jù)。研究機(jī)構(gòu)/公司AbbVieNovelPhysics-BasedEnsembleModelingApproachThatUtilizes3DMoleAqueousThermodynamicSolubiStudyofOrallyAvailableBromodomaina研究機(jī)構(gòu)/公司MinimizingPolymorphCooperativeComputa將最先進(jìn)的計(jì)算晶體結(jié)構(gòu)預(yù)測(CSP)ImpactAssessmentoftheVariablesAffectingtheDrugReleaseandExtofPolyethyleneOxideBasedTablets.AmachinelearningmethoddetectionandvisualizsinteringbasedoncnetworksReal-timecoatingthanddefectrecognitionoffilmcoatedwithmachinevisionanddeeplRF,XGBoost,ANN,CNNUV/VISimaging-basedPATtoolfordrugparticlesizeinspesupportedbypatternrecognitnetworks.MachinelearningapproachsurfacedesignincaRF,XGBoost,LightGBM,SVM,Theapplicationofmachinelearningalgorithmsinundercore/shelltechniqueANovelComputationalApCoupledwithMachineLearntheExtentofAgglomerationinParticulateProcessesRF,XGBoost,ANN,CNNAmicro-XRTimageanalysischaracterisationofmultiparticulatecapsuleArtificialIntelligenceTUpofHighShearWetGranulationAComputationalintelligencemodelingofgranulesizedistribmilling.AnovelAI-basedcomputationalADMET(藥物吸收,分配,代謝,排泄和毒性研究敗通常是由于藥物的ADMET問題,而不是缺乏療效。傳統(tǒng)的ADM很重要的條件。AI可提取化合物相關(guān)結(jié)構(gòu)特征,評(píng)估多個(gè)ADMET參數(shù)間的關(guān)系和趨勢,有效提升ADMET性質(zhì)預(yù)測的AI在藥物ADMET預(yù)測的原理主要基于機(jī)器學(xué)習(xí)算法。這些算法使用了大量已知藥物的ADMET數(shù)據(jù)來訓(xùn)練預(yù)測模型,并通過預(yù)測藥物分子的化學(xué)和物理屬性來推測其ADMET性質(zhì)。數(shù)據(jù)的質(zhì)量和數(shù)量是ADMET預(yù)測的巨大障礙。大多數(shù)預(yù)測模型由數(shù)百到數(shù)千個(gè)小型化學(xué)數(shù)據(jù)集組成,無法覆蓋足夠的化學(xué)空間。生物活性測定的數(shù)據(jù)受實(shí)驗(yàn)平臺(tái)的影響,容易產(chǎn)生實(shí)驗(yàn)誤差,導(dǎo)致后續(xù)的數(shù)據(jù)管理產(chǎn)生困難。當(dāng)前數(shù)據(jù)驅(qū)動(dòng)的ADMET預(yù)測研究依賴于文獻(xiàn)衍生數(shù)據(jù)及公開數(shù)據(jù)庫,數(shù)據(jù)量稀缺且數(shù)據(jù)質(zhì)量參差不齊。這既考驗(yàn)公司對(duì)數(shù)據(jù)管理能力,也考從人工智能中受益的藥物發(fā)現(xiàn)的關(guān)鍵領(lǐng)域之一是ADMET性質(zhì)預(yù)測,通過定量結(jié)構(gòu)活性關(guān)系(quantitativestructure-activityrelationship,QSAR)模型來預(yù)測多種性質(zhì),從簡單的物理化學(xué)性質(zhì)到復(fù)雜的藥代動(dòng)力學(xué)(PK)、藥效學(xué)(PD)和毒理學(xué)特性。重要的PK端點(diǎn)包括清除率、通透性和穩(wěn)定性;重要的藥效學(xué)端點(diǎn)包括藥物靶標(biāo)特異性和選擇性;重要的毒理學(xué)端點(diǎn)包括細(xì)胞色素P450誘導(dǎo)和hERG抑制等。hERGK+channels:structure,function,andcliniNewexperimentalmodelsoftheblood-brainbarrierforCNSdrugThedrugeffluxprotein,P-glycoprotein,additioresistanttumorcellsfrommultipleformsofcaspase-dependentLarge-scaleevaluationofcytochromeP4502C9mediateddruginterapotentialwithmachinelearning-basedconsMulti-DescriptorReadAcross(MuDRApproachforDevelopingAccurateQuantitativeStructADMETevaluationindrugdiscovery.Part17:quantitativeandqualitativepredictionInsilicopredictionofchemicaltoxicityfordrugdelearningmethodsandPost-marketingwithdrawalof462medicinalproductsbecauseofadversedrugreactions:asystematicreviewoftheworldliteratuMulti-descriptorreadacross(MuDRA):asimplefordevelopingaccuratequantitatiADMETevaluationindrugdiscovery.Part17:quantitativeandqualitativepredictionTowardsdeepneuralnetworkmodelsforthepredictionoftheblood-brainbarrierpermeabilityfordiv網(wǎng)絡(luò)(BPNN)結(jié)構(gòu)和重Modelingphysico-chemicalADMETendpoDeeplearningbaseddrugmetaboChemi-Net:AmoleculargraphconvolutionalnetworkforacpropertypredictionAI技術(shù)在藥物臨床前研發(fā)階段有著廣泛的應(yīng)用。主要包括晶型預(yù)測、劑型設(shè)計(jì)和藥物ADMET性質(zhì)預(yù)測等,其中能夠完成藥物ADMET性質(zhì)預(yù)測企業(yè)數(shù)量最多。由于技術(shù)發(fā)展時(shí)間長,相對(duì)技術(shù)成熟,市面具有多款藥物ADMET性質(zhì)預(yù)測CADD軟件免費(fèi)開源/商業(yè)化軟件,隨著AI技術(shù)的發(fā)展,相關(guān)軟件逐漸添加了AI功能輔助數(shù)據(jù)的提取與處理,承接相關(guān)業(yè)務(wù)門檻低,因此相關(guān)企業(yè)數(shù)量較多。但多數(shù)企業(yè)僅停留在對(duì)相關(guān)軟件的應(yīng)用,并未有創(chuàng)新的核心CADD的能力局限于對(duì)已有的知識(shí)和數(shù)據(jù)的篩選與優(yōu)化,相較之下,AIDD能夠充分探索未知的分子結(jié)構(gòu)空間,對(duì)更多未知的分子性質(zhì)進(jìn)行預(yù)測,給藥物研發(fā)帶來了顛覆性變革,但AIDD的發(fā)展需要高數(shù)量、高質(zhì)量的生物數(shù)據(jù)作為支撐。目前國內(nèi)企業(yè)的技術(shù)重點(diǎn)在于藥物ADMET性質(zhì)預(yù)測,布局晶型預(yù)測、劑型設(shè)計(jì)等方面國內(nèi)企業(yè)數(shù)量較少?!獭獭獭獭獭獭獭獭獭獭獭獭獭獭獭獭獭獭蘙1]公開資料整理具備臨床階段項(xiàng)目項(xiàng)目處于早期階段無項(xiàng)目披露/僅提供服務(wù)Resene具備臨床階段項(xiàng)目項(xiàng)目處于早期階段無項(xiàng)目披露/僅提供服務(wù)Resene利用AI技術(shù)主導(dǎo)或輔助藥物發(fā)現(xiàn)及臨床前研發(fā)階段是中國AIDD行業(yè)企業(yè)重點(diǎn)關(guān)注的技術(shù),超過90%的行業(yè)企業(yè)在該方面有所投入。基于行業(yè)理解,我們將中國AIDD行業(yè)的企業(yè)主要分為AIDDBiotech企業(yè)、具備AI技術(shù)的藥企/CRO企業(yè)、具備AI技術(shù)的藥企/CRO企業(yè)、AIDD技術(shù)平臺(tái)企業(yè)(分類不包括引進(jìn)AI技術(shù)的大型制藥企業(yè))。AIDDBiotech企業(yè):即AI技術(shù)貫穿于新藥發(fā)現(xiàn)全過程的企業(yè),該類企業(yè)以新藥管線研發(fā)為核心商業(yè)模式,此外部分Biotech企業(yè)與大型制藥企業(yè)開展合作,承接藥物篩選等服務(wù)工作。AI技術(shù)驅(qū)動(dòng)的CRO企業(yè):該類企業(yè)以CRO服務(wù)為核心商業(yè)模式,該類型公司無研發(fā)管線/管線數(shù)量較少,主要通過對(duì)外提供研發(fā)服務(wù)作為盈利模式。此外,該類型的公司也通過對(duì)外授權(quán)/售賣早期管線實(shí)現(xiàn)營收。AIDD技術(shù)平臺(tái)企業(yè):該類企業(yè)以軟件工具服務(wù)為核心商業(yè)模式。aurekaAIDD技術(shù)平臺(tái)企業(yè)AI技術(shù)驅(qū)動(dòng)的CRO企業(yè)AIDDBiotech企業(yè)[1]公開資料整理。MERCK④華北制藥)leman&&NeocuraDRUG薈FARM。MERCK④華北制藥)leman&&NeocuraDRUG薈FARMAI新藥研發(fā)的三要素是核心生物數(shù)據(jù)、基礎(chǔ)算力和核心算法,AIDD技術(shù)平臺(tái)企業(yè)基于本身在算法方面的優(yōu)勢,有望通過提供軟件產(chǎn)品實(shí)現(xiàn)商業(yè)模式;平臺(tái)型研發(fā)企業(yè)通過與大型藥企/Biotech企業(yè)合作,完成項(xiàng)目的積累和自主研發(fā)能力邊際的不斷拓寬,在數(shù)據(jù)積累上會(huì)有較大優(yōu)勢,也有望衍生出AI新藥研發(fā)的CRO企業(yè),專注于建立平臺(tái)提供服務(wù),為不具備AI新藥前端開發(fā)能力的企業(yè)提供支持;AI新藥研發(fā)最終走的也是新藥研發(fā)的邏輯,這也會(huì)催生一批在AI藥物管線開發(fā)上具有突出能力的Biotech企業(yè)。tevaAMGN安進(jìn)Innovent[1]公開資料整理第四章AI+臨床研發(fā)新藥開發(fā)是一個(gè)漫長、昂貴、高風(fēng)險(xiǎn)的過程,其中大約一半的時(shí)間和投資消耗在臨床試驗(yàn)階段,而臨床試驗(yàn)的高失敗率又使其成為新藥研發(fā)中最困難的一步。臨床試驗(yàn)是藥物開發(fā)的基石,成功的藥物開發(fā)依賴于準(zhǔn)確且有效的臨床試驗(yàn)。據(jù)研究,約有90%的藥物會(huì)在臨床試驗(yàn)階段被淘汰,進(jìn)入臨床Ⅱ期的化合物中,不到三分之一能進(jìn)入臨床III期[1],在進(jìn)入臨床Ⅲ期的化合物中,又有超過三分之一的化合物未能成功獲批上市[2]。由于Ⅱ、Ⅲ期臨床試驗(yàn)處于整個(gè)藥 物開發(fā)階段后期,且最復(fù)雜的III期試驗(yàn)成本約占整個(gè)試驗(yàn)的60%,因此,每項(xiàng)失敗的臨床試驗(yàn)均會(huì)造成巨額損失。一篇發(fā)表在Nature子刊《npjDigitalMedicine》,關(guān)于數(shù)字化臨床試驗(yàn)文章指出,目前傳統(tǒng)臨床試驗(yàn)存在參與率過低、臨床試驗(yàn)進(jìn)展緩慢等問題。在受試者招募、篩選、數(shù)據(jù)采集和質(zhì)控等方面的效率低下,會(huì)給受試者以及研發(fā)企業(yè)帶來經(jīng)濟(jì)和時(shí)間上的負(fù)擔(dān),且延長臨床試驗(yàn)時(shí)間[3]。[1]/10.1038/nbt.2786[2]doi:10.1093/biostatistics/kxx069[3]doi:10.1038/s41746-020-0302-y人工智能(artificialintelligence,AI)的發(fā)展,為新藥研發(fā)帶來了新的技術(shù)手段,盡管目前AI技術(shù)大多應(yīng)用于藥物發(fā)現(xiàn)及臨床前階段,但在臨床試驗(yàn)環(huán)節(jié),也可以利用ML、自然語言處理等技術(shù)輔助臨床試驗(yàn)設(shè)計(jì)、患者招募和臨床試驗(yàn)數(shù)據(jù)處理等。AI臨床試驗(yàn)方案設(shè)計(jì)是指利用人工智能技術(shù)輔助和優(yōu)化臨床試驗(yàn)設(shè)計(jì)的過程。它利用ML(機(jī)器學(xué)習(xí))、DL(深度學(xué)習(xí))、自然語言處理(NLP)、決策支持系統(tǒng)(DSS)等技術(shù),快速處理同類研究、臨床數(shù)據(jù)和監(jiān)管信息,以及讀取臨床試驗(yàn)等數(shù)據(jù),以提供更有效的臨床試驗(yàn)方案。歐美在臨床階段對(duì)AI技術(shù)的應(yīng)用起步較早,主要在應(yīng)用自然語言處理(NLP)、改進(jìn)病人分層、簡化臨床試驗(yàn)的操作流程三個(gè)大的層面。通過收到的超過300份AI臨床研究申請(qǐng),F(xiàn)DA歸納分析并對(duì)該技術(shù)進(jìn)行了總結(jié),將AI在臨床階段的應(yīng)用分成了“六大分析類型”與“九大分析目標(biāo)”。AIAI/ML在臨床研究中的分析類型與目標(biāo)患者風(fēng)險(xiǎn)分層/管理設(shè)計(jì)服藥依從性/遵循給藥方案評(píng)估終點(diǎn)/生物標(biāo)志物圖注:1.來源于FDA官網(wǎng)2.藥融咨詢分析整理近年來,AI在臨床研究中不乏成功案例。如:成立于2016年的美國企業(yè)Owkin,使用聯(lián)邦學(xué)習(xí)來訓(xùn)練和開發(fā)其機(jī)器學(xué)習(xí)模型,專門用于提高臨床試驗(yàn)效率,并已經(jīng)建立了一個(gè)高級(jí)模型目錄,使他們能夠從成像、基因組學(xué)和臨床數(shù)據(jù)中識(shí)別新的生物標(biāo)志物。Owkin致力于識(shí)別具有嚴(yán)重疾病進(jìn)展特征的患者,這些患者可能對(duì)開發(fā)中的治療反應(yīng)最好,目前該公司總共籌集了2.54億美元,其中包括賽諾菲、Bpifrance和Mubadala等投資機(jī)構(gòu)。另一家來自劍橋的公司GNShealthcare,成立于2000年,該公司的技術(shù)基于各種復(fù)雜的數(shù)據(jù)創(chuàng)建“虛擬患者”,這是一個(gè)準(zhǔn)確的疾病計(jì)算機(jī)模型。GNS專注于腫瘤學(xué)、免疫學(xué)、中樞神經(jīng)系統(tǒng)和心臟代謝疾病,他們的技術(shù)支持更好的病人分層,并能確定哪些病人應(yīng)該接受一線或二線治療。普瑞基準(zhǔn)零氪科技開心生活科技煥一生物至本醫(yī)療深度智耀AI普瑞基準(zhǔn)零氪科技開心生活科技煥一生物至本醫(yī)療深度智耀AI+Biotech科輝智藥哲源科技AI+CRO/Biotech埃格林醫(yī)藥未知君2022年8月,國家藥品監(jiān)督管理局藥品審評(píng)中心(CDE)連發(fā)三項(xiàng)意見稿,支持遠(yuǎn)程智能臨床試驗(yàn)方案的應(yīng)用和發(fā)展,強(qiáng)調(diào)在合規(guī)且可行的范圍內(nèi)提高患者參與臨床試驗(yàn)的便利度、減輕患者參與臨床試驗(yàn)的負(fù)擔(dān),并對(duì)數(shù)字化、智能化等新技術(shù)在臨床試驗(yàn)中的合規(guī)運(yùn)用進(jìn)行了細(xì)致的規(guī)定。而在此前,CDE已下發(fā)的2項(xiàng)建議中已強(qiáng)調(diào)ePRO在數(shù)據(jù)采集方面所體現(xiàn)出的高效性、實(shí)時(shí)性、靈活性、合規(guī)性、安全性和其在患者隱私保護(hù)等方面所具備的顯著優(yōu)幾項(xiàng)政策立足“以患者為中心”的理念,接軌國際諸多監(jiān)管機(jī)構(gòu)對(duì)臨床試驗(yàn)智能化的政策,為中國臨床試驗(yàn)進(jìn)一步實(shí)現(xiàn)從“紙”到“云”的發(fā)展變革提供了方向。緊隨技術(shù)發(fā)展趨勢,基于國家政策,我國AI+臨床試驗(yàn)企業(yè)迎來發(fā)展機(jī)遇。據(jù)藥融咨詢統(tǒng)計(jì),國內(nèi)目前涉足AI+臨床企業(yè)不多,截至2023.09.01,約16家,可大致分為AISaaS、AIBiotech、AICRO以及AIBiotech+CRO四種商業(yè)模式。白星花科技西湖歐米耀乘健康圖注:1.各企業(yè)官網(wǎng)2.藥融咨詢分析整理從十六家企業(yè)在臨床階段的具體業(yè)務(wù)類型來看,主要包括:臨床試驗(yàn)方案設(shè)計(jì),如患者篩選/招募等,以及臨床結(jié)果預(yù)測、臨床試驗(yàn)數(shù)據(jù)統(tǒng)計(jì)分析。從企業(yè)類型來看,可提供AI+臨床試驗(yàn)企業(yè)多為向藥企或CXO企業(yè)提供服務(wù)的企業(yè),此外,一部分企業(yè)實(shí)施“雙業(yè)態(tài)”運(yùn)營模式,僅在少數(shù)特定治療領(lǐng)域內(nèi)開發(fā)自有產(chǎn)品管線,而在大多數(shù)治療領(lǐng)域?qū)ν馓峁〢I賦能的臨床設(shè)計(jì)服務(wù)。患者招募是決定臨床試驗(yàn)是否成功的關(guān)鍵因素之一,臨床試驗(yàn)的入組標(biāo)準(zhǔn)通常有很嚴(yán)格的限制[1],研究顯示,大約80%的進(jìn)展期非小細(xì)胞肺癌(aNSCLC)患者不符合臨床試驗(yàn)的資格標(biāo)準(zhǔn),導(dǎo)致約86%的臨床試驗(yàn)由于無法按時(shí)招募足夠的受試者而終止[2]。而大樣本的隨機(jī)對(duì)照臨床試驗(yàn)(RCT)是臨床證據(jù)的主要來源,但受試者的招募往往因?yàn)樵囼?yàn)方案的入組標(biāo)準(zhǔn)嚴(yán)格而影響進(jìn)度。相關(guān)研究證明,結(jié)合真實(shí)世界數(shù)據(jù),AI可自動(dòng)篩選符合入組標(biāo)準(zhǔn)的患者,提高招募效率。AI輔助藥物臨床試驗(yàn)受試者招募,總體可以看作是利用自然語言處理、機(jī)器學(xué)習(xí)等技術(shù),對(duì)不同來源的受試者信息和臨床試驗(yàn)方案的入組/排除標(biāo)準(zhǔn)進(jìn)行識(shí)別和匹配的過程?!禢ature》發(fā)表的一項(xiàng)研究介紹了AI在簡化臨床試驗(yàn)入組標(biāo)準(zhǔn)方面的價(jià)值和應(yīng)用,通過使用開源的人工智能工具TrialPathfinder,從腫瘤患者的真實(shí)世界數(shù)據(jù)中學(xué)習(xí),來優(yōu)化入組標(biāo)準(zhǔn)的包容性,該工具可以使用EHR數(shù)據(jù)模擬臨床試驗(yàn),按照不同的入組標(biāo)準(zhǔn)自動(dòng)整合EHR數(shù)據(jù),并分析總體生存風(fēng)險(xiǎn)比率,同時(shí),使用逆概率加權(quán)法來調(diào)整基線混雜因素和模擬隨機(jī)化[3]。分析結(jié)果顯示,許多常見的入組標(biāo)準(zhǔn),對(duì)臨床試驗(yàn)的結(jié)果影響甚微。TrialPathfinder包括臨床試驗(yàn)?zāi)M和分析兩部分。在臨床實(shí)驗(yàn)?zāi)M中,TrialPathfinder將真實(shí)世界數(shù)據(jù)和目標(biāo)試驗(yàn)方案(治療和資格標(biāo)準(zhǔn))作為輸入,根據(jù)患者特征、診斷、實(shí)驗(yàn)室值、生物標(biāo)志物和先前的治療方法,以編程方式對(duì)不同的入組標(biāo)準(zhǔn)(從文本中提取)進(jìn)行編碼,并使用傾向評(píng)分的加權(quán)分析法進(jìn)行臨床試驗(yàn)?zāi)M。然后對(duì)模擬的治療組進(jìn)行生存分析,并報(bào)告符合條件的患者數(shù)和由此產(chǎn)生的風(fēng)險(xiǎn)比。在分析中,TrialPathfinder將標(biāo)準(zhǔn)的重要性分析與Shapley值相結(jié)合,評(píng)估了每個(gè)納入/排除標(biāo)準(zhǔn)如何影響合格受試者的數(shù)量和試驗(yàn)結(jié)果。研究表明,幾個(gè)常用的納入/排除標(biāo)準(zhǔn)不會(huì)對(duì)試驗(yàn)的總生存期的風(fēng)險(xiǎn)比產(chǎn)生實(shí)質(zhì)性影響,也不會(huì)潛在地降低試驗(yàn)的有效性。此外,一項(xiàng)回顧性分析全面了解了AI在臨床試驗(yàn)注冊(cè)登記中的應(yīng)用現(xiàn)狀[4],并評(píng)估該技術(shù)篩選患者的準(zhǔn)確性,這是第一項(xiàng)評(píng)估AI用于癌癥臨床試驗(yàn)登記的系統(tǒng)性回顧和meta分析。數(shù)據(jù)顯示,除一個(gè)數(shù)據(jù)集外,所有數(shù)據(jù)集的準(zhǔn)確性、靈敏度和特異性均超過80%,17個(gè)數(shù)據(jù)集中有5個(gè)的陽性預(yù)測值超過80%,所有數(shù)據(jù)集中的陰性預(yù)測值均超過80%,匯總敏感性為90.5%(95%CI:70.9%-97.4%總體特異性為99.3%(95%CI:81.8%—99.9%)??偟膩碚f,AI在患者篩選方面的表現(xiàn)似乎與人工篩查持平,且AI擁有更高的效率,可花費(fèi)更少的時(shí)間和資源。[1]doi/10.1200/jco.2009.27.15_suppl.6538[2]doi:10.1016/j.cct.2018.01.003[3]doi:10.1038/s41586-021-03430-5[4]doi:10.1093/jnci/djad013目前多家AI制藥企業(yè)在助力患者入組的研究上已取得一定成就。如IQVIA、Unlearn、ConcertAI等,ConcertAI的包括ECOG評(píng)分(癌癥研究中采用的標(biāo)準(zhǔn)衡量標(biāo)準(zhǔn)),使用的其他指標(biāo)包括癌癥分期、實(shí)驗(yàn)室結(jié)果和生命體征,平均預(yù)測準(zhǔn)確率超過99%。2020年,F(xiàn)DA同意MedidataSyntheticCont免疫治療公司MedicennaTherapeutics公司(“Medicenna”)一項(xiàng)MDNA55治療復(fù)發(fā)性中。在此試驗(yàn)中,Medidata成功幫助Medicenna在此三期臨床中減少招募了100個(gè)對(duì)照患者,這也是罕見病試驗(yàn)首次采用混合外部對(duì)照組,也開啟了III期臨床試驗(yàn)應(yīng)用混合外部對(duì)照組的先河。IQVIAIQVIA:IQVIACORE.IQVIACORE將其數(shù)據(jù)與機(jī)器學(xué)習(xí)相結(jié)合,來進(jìn)行準(zhǔn)確的患者匹配。Unlearn.AIUnlearn.AI:TwinRCT?.TwinRCT?結(jié)合了人工智能、數(shù)字雙胞胎和創(chuàng)新統(tǒng)計(jì)方法,可實(shí)現(xiàn)更靈活、更有效的試驗(yàn),有助于讓試驗(yàn)更加以患者為中心,縮短患者的入組時(shí)間。ConcertAIConcertAI:DTSeScreening.是一種基于機(jī)器學(xué)習(xí)的工具,旨在根據(jù)臨床試驗(yàn)入排標(biāo)準(zhǔn)對(duì)患者進(jìn)行排名。國內(nèi)企業(yè)運(yùn)用AI助力臨床試驗(yàn)患者招募/入組尚處于起步階段,代表企業(yè)包括普瑞基準(zhǔn)、埃格林、西湖歐米以及銳格醫(yī)藥等。這些企業(yè)并非專注于臨床階段或臨床試驗(yàn)患者招募,而多覆蓋藥物開發(fā)多個(gè)流程,如科輝智藥,其AI驅(qū)動(dòng)的研發(fā)平臺(tái)eLEAD是覆蓋研發(fā)全流程,AI篩選患者人群是其中一部分。銳格醫(yī)藥主要通過自主研發(fā)的rCARD?(計(jì)哲源科技可進(jìn)行虛擬臨床試驗(yàn),預(yù)測響應(yīng)患者。據(jù)哲源科技官網(wǎng)披露,其核心技術(shù)包括TWIRIS(生物醫(yī)學(xué)文獻(xiàn)處理算法-大規(guī)模生物醫(yī)學(xué)知識(shí)AI平臺(tái))、DAGG(基因組霰單槍損傷評(píng)估算法-細(xì)胞功能定量評(píng)估AI平臺(tái))、Dpverse(泛癌種功能數(shù)字化病人庫MOA虛擬平臺(tái))。在研管線中,為全新機(jī)制、全新靶點(diǎn)藥物管線共3條,ZY0001(胰腺癌、小分子)、ZY0002(泛癌種、大分子)、ZY0003(胰腺癌、小分子),均處于藥物合成階段。零氪科技提供第三方服務(wù),主要開展基于精準(zhǔn)生命科學(xué)解決方案(LinkSolutions)的臨床招募、真實(shí)世界研究、數(shù)據(jù)洞察等服務(wù)。其臨床研究招募主要采用機(jī)器學(xué)習(xí)算法將已知的信號(hào)通路和藥物靶點(diǎn)庫進(jìn)行匹配,以預(yù)測個(gè)性化治患者耐藥點(diǎn)的有效性,實(shí)現(xiàn)患者對(duì)特定臨床試埃格林是具有從靶點(diǎn)到臨床試驗(yàn)“端到端”能力的AI賦能創(chuàng)新藥企,埃格林采取自研+對(duì)外服務(wù)的模式,一方面,從事自有藥品管線的研發(fā),另一方面,對(duì)有人工智能研發(fā)需求的制藥企鑒于臨床試驗(yàn)的高失敗率,以及藥物開發(fā)的資金密集型性質(zhì),制藥公司只能承擔(dān)有限數(shù)量的項(xiàng)目,因此開發(fā)者通

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論