醫(yī)療GPT:讀懂數(shù)字醫(yī)療新紀元_第1頁
醫(yī)療GPT:讀懂數(shù)字醫(yī)療新紀元_第2頁
醫(yī)療GPT:讀懂數(shù)字醫(yī)療新紀元_第3頁
醫(yī)療GPT:讀懂數(shù)字醫(yī)療新紀元_第4頁
醫(yī)療GPT:讀懂數(shù)字醫(yī)療新紀元_第5頁
已閱讀5頁,還剩109頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

醫(yī)療GPT讀懂數(shù)字醫(yī)療新紀元目錄TOC\h\h現(xiàn)實篇\h第1章“人工智能+”醫(yī)療\h技術(shù)篇\h第2章“大數(shù)據(jù)+”醫(yī)療\h第3章“區(qū)塊鏈+”醫(yī)療\h第4章“云計算+”醫(yī)療\h產(chǎn)業(yè)篇\h第5章“GPT+”醫(yī)院\h第6章“GPT+”健康\h第7章“GPT+”醫(yī)藥\h第8章“GPT+”中醫(yī)\h第9章“GPT+”醫(yī)學教育\h未來篇\h第10章醫(yī)療GPT的未來挑戰(zhàn)\h第11章通向精準醫(yī)療新時代現(xiàn)實篇第1章“人工智能+”醫(yī)療1.1什么是“人工智能+”醫(yī)療?人工智能(ArtificialIntelligence,AI)的概念從首次提出到現(xiàn)在已近70年,經(jīng)歷了追捧和黯淡。近幾年,人工智能終于呈現(xiàn)出爆發(fā)的趨勢。當前,人工智能的勃興已經(jīng)成為推動社會經(jīng)濟發(fā)展的新動力之一,在提高社會生產(chǎn)效率、實現(xiàn)社會發(fā)展和經(jīng)濟轉(zhuǎn)型等方面發(fā)揮重要作用。作為主導新一代產(chǎn)業(yè)變革的核心力量,人工智能在醫(yī)療方面展示出了新的應用方式,在深度融合中又催生出新業(yè)態(tài)。今天,作為一項創(chuàng)新性技術(shù),醫(yī)療AI遍布在醫(yī)療領域的方方面面。人工智能在醫(yī)療健康領域廣泛應用正形成全球共識??梢哉f,人工智能以獨特的方式捍衛(wèi)著人類健康福祉,但這一切還要從人工智能與醫(yī)療的相逢開始說起。1.1.1國外醫(yī)療AI從哪里開始?20世紀70年代,國外開始出現(xiàn)了醫(yī)療領域的人工智能探索嘗試。1972年,利茲大學研發(fā)的AAPHelp能根據(jù)病人的癥狀判斷出產(chǎn)生劇烈腹痛可能的原因。1974年,資深醫(yī)生診斷的準確性已經(jīng)不如該系統(tǒng)。盡管AAPHelp運行耗時久,但在20世紀70年代的計算機硬件條件下,AAPHelp的產(chǎn)生仍具有突破性意義。在隨后的幾年內(nèi),不少新的人工智能醫(yī)療產(chǎn)品成果再次出現(xiàn)在人們的視野中。1974年,匹茲堡大學研發(fā)出INTERNIST-I內(nèi)科疾病的專家系統(tǒng),它主要用于輔助診斷內(nèi)科復雜疾病。1976年,斯坦福大學研發(fā)出MYCIN系統(tǒng),它能診斷出感染病患者并提供抗生素處方。MYCIN系統(tǒng)的內(nèi)部共有500條規(guī)則,只要按照MYCIN系統(tǒng)的提問依次進行回答,就能自動判斷出患者所感染細菌的類別并開出相應處方。此外,在20世紀70年代,還有斯坦福大學開發(fā)的ONCOCIN,麻省理工學院開發(fā)的PIP、ABEL,羅格斯大學開發(fā)的CASNET/Glaucoma等。20世紀80年代,一些商業(yè)化應用系統(tǒng)開始出現(xiàn),如QMR(QuickMedicalReference)和DXplain,主要是依據(jù)臨床表現(xiàn)提供診斷方案。20世紀90年代,計算機輔助診斷(ComputerAidedDiagnosis,CAD)系統(tǒng)問世,它是比較成熟的醫(yī)學影像計算機輔助應用,包括乳腺X射線CAD系統(tǒng)。進入21世紀,IBMWatson是人工智能醫(yī)療領域最知名的系統(tǒng),并且已經(jīng)取得了非凡的成績。例如,在癌癥治療方面,Watson能夠在幾秒內(nèi)對數(shù)十年癌癥治療歷史中的150萬份患者記錄進行篩選,并提出循證治療方案供醫(yī)生選擇。目前,癌癥治療領域排名前三的醫(yī)院都在使用Watson,并且中國也正式引進了Watson。2016年以來,美國、加拿大、日本、英國、歐盟、印度、韓國、俄羅斯等國家和地區(qū)相繼發(fā)布人工智能研發(fā)戰(zhàn)略。2016年10月,美國《國家人工智能研究和發(fā)展戰(zhàn)略計劃》提出,要在醫(yī)學診斷等領域開發(fā)有效的人類與人工智能協(xié)作的方法,當人類需要幫助時,人工智能系統(tǒng)能夠自動執(zhí)行決策和進行醫(yī)療診斷。日本將醫(yī)療健康及護理作為人工智能的突破口。為了應對快速老齡化,日本基于醫(yī)療、護理系統(tǒng)的大數(shù)據(jù)化,將建成以人工智能為依托、世界一流的醫(yī)療與護理先進國家。英國提出發(fā)展人工智能醫(yī)療的三大潛力領域:輔助診斷領域、早期預防控制流行病并追蹤其發(fā)病率領域和圖像診斷領域。2016年2月,谷歌DeepMind宣布成立DeepMindHealth部門,并與英國國家醫(yī)療服務體系(NationalHealthService,NHS)合作,輔助他們進行決策。DeepMind還參與NHS的一項利用深度學習開展頭頸癌患者放療療法設計的研究。同時,DeepMind與Moorfields眼科醫(yī)院開展將人工智能技術(shù)應用于及早發(fā)現(xiàn)和治療威脅視力的眼部疾病的合作。遺憾的是,2021年,谷歌健康部門GoogleHealth遭遇重大變故。該部門負責人大衛(wèi)·范伯格(DavidFeinberg)宣布于9月1日離職,并于10月1日起擔任美國最大電子健康記錄服務提供商之一Cerner的CEO兼總裁。之后,谷歌也決定解散GoogleHealth。1.1.2國內(nèi)醫(yī)療AI發(fā)展風云20世紀80年代初,我國開始進行人工智能醫(yī)療領域的開發(fā)研究,雖然起步落后于發(fā)達國家,但是發(fā)展迅猛。1978年,北京中醫(yī)醫(yī)院關(guān)幼波教授與計算機科學領域的專家合作開發(fā)了“關(guān)幼波肝病診療程序”,第一次將醫(yī)學專家系統(tǒng)應用到我國傳統(tǒng)中醫(yī)領域。此后,我國加快開展人工智能醫(yī)療產(chǎn)品的研發(fā),具有代表性的產(chǎn)品有“中國中醫(yī)治療專家系統(tǒng)”和“林如高骨傷計算機診療系統(tǒng)”,以及具有咨詢和輔助診斷性質(zhì)的“中醫(yī)計算機輔助診療系統(tǒng)”等。進入21世紀以來,我國人工智能在醫(yī)療的更多細分領域都取得了長足的發(fā)展。2016年10月,百度發(fā)布“百度醫(yī)療大腦”,對標谷歌和IBM的同類產(chǎn)品。“百度醫(yī)療大腦”作為百度大腦在醫(yī)療領域的具體應用,大量收集與分析醫(yī)學專業(yè)文獻和醫(yī)療數(shù)據(jù),通過模擬問診流程,基于用戶癥狀,給出診療的最終建議。2018年11月,百度發(fā)布人工智能醫(yī)療品牌“百度靈醫(yī)”,2019年品牌升級為“靈醫(yī)智惠”,主要產(chǎn)品有“臨床輔助決策支持系統(tǒng)”“醫(yī)療大數(shù)據(jù)解決方案”“眼底影像分析系統(tǒng)”“智能診前助手”。2017年7月,阿里健康發(fā)布醫(yī)療AI系統(tǒng)“DoctorYou”,包括臨床醫(yī)學科研診斷平臺、醫(yī)療輔助檢測引擎等。此外,阿里健康還與政府、醫(yī)院、科研院校等外部機構(gòu)合作,開發(fā)了20種常見、多發(fā)疾病的智能診斷引擎,包括糖尿病、肺癌預測和眼底篩查等。2018年9月,阿里健康和阿里云聯(lián)合宣布阿里醫(yī)療人工智能系統(tǒng)“ET醫(yī)療大腦”2.0版本問世。2018年11月,騰訊牽頭承擔的“數(shù)字診療裝備研發(fā)專項”啟動,該項目作為國家重點研發(fā)計劃首批啟動的6個試點專項之一,基于“AI+CDSS”(人工智能的臨床輔助決策支持系統(tǒng))探索和助力醫(yī)療服務升級。新冠疫情期間,人工智能在公共衛(wèi)生領域特別是傳染病的預防與控制方面發(fā)揮了重要作用,傳染病大數(shù)據(jù)分析預警系統(tǒng)、疫情排查系統(tǒng)、智能測溫機器人、消毒機器人、語音服務機器人等在戰(zhàn)“疫”一線被廣泛應用。在全球抗疫的背景下,人工智能從“云端”落地,在疫情之中出演關(guān)鍵角色,提高了抗疫防疫的整體效率。新冠疫情成為數(shù)字技術(shù)的試金石,人工智能作為新一輪科技革命和產(chǎn)業(yè)變革的重要驅(qū)動力量,體現(xiàn)了對社會的真正價值。1.2“人工智能+”怎么看上了醫(yī)療?1.2.1供需矛盾突出從需求端來看,當前,四十多年的工業(yè)化進程也帶來了不同程度的環(huán)境污染,疊加我國人口老齡化加劇,患慢性疾病(簡稱慢性病、慢病)人口數(shù)量增多,形成大量醫(yī)療需求。第七次全國人口普查結(jié)果顯示,我國60歲及以上人口為26402萬人,占18.70%。未來幾十年,老齡化程度還將持續(xù)加深,到2035年前后,我國老年人口占總?cè)丝诘谋壤龑⒊^四分之一,到2050年前后將超過三分之一。目前,中國已成為全世界老年人口數(shù)量最多、老齡化速度最快的大國。其中,東北三省的老齡化現(xiàn)象尤為明顯。2020年,東北三省總?cè)丝诒仁昵皽p少了1101萬人,而老齡化程度加深,65歲及以上人口比重為16.39%,提高7.26個百分點,高于全國平均水平。遼寧省65歲及以上人口比重為17.42%,為全國省市中最高。在人口老齡化背景下,現(xiàn)代生活節(jié)奏加快,患慢性疾病人口數(shù)量也隨之增加。我國已確診的患慢性疾病人口數(shù)量超過3億,同時患病率以每年5.8%的速度增長。2021年11月初,國際糖尿病聯(lián)合會(InternationalDiabetesFederation,IDF)在官網(wǎng)上更新了今年IDF全球糖尿病概覽的相關(guān)數(shù)據(jù),在中國,2011—2021年的十年間,糖尿病患病人數(shù)從9000萬增長到了1.4億,占全國人口數(shù)的十分之一,與世界范圍內(nèi)的發(fā)病率持平。在這1.4億人中,有51.7%的人群未被診斷,屬于“隱性”糖尿病群體。根據(jù)全國衛(wèi)生服務調(diào)查,65歲以上群體的慢性疾病患病率高達78.4%,是全部人口患病率的3.2倍,即老齡人口越多慢性疾病人群基數(shù)越大。如今,慢性疾病已成為健康的頭號威脅,占到了中國77%的健康生命年損失和85%的死亡誘因,占全部疾病負擔的60%以上。人口結(jié)構(gòu)的變化還將帶來診療以外的醫(yī)療健康需求的結(jié)構(gòu)性增加,包括疾病預防和治療、健康監(jiān)測和管理、養(yǎng)生和保健、臨終關(guān)懷等。以體檢為例,與美、日、德超過70%的覆蓋率相比,我國的健康管理市場還有巨大的發(fā)展空間。而健康管理借助人工智能可以極大地賦能,讓健康管理實時可見、可控。伴隨著生活水平的提高,以及國家政策對家庭醫(yī)生、慢病防治、健康生活等方面的支持,越來越多的人將主動參與健康管理。然而,從供給端來看,優(yōu)質(zhì)醫(yī)生及醫(yī)療資源不足,且醫(yī)療資源分布不均,難以承受快速增長的醫(yī)療需求。從總量上看,醫(yī)療資源供給增長落后于需求增長。我國醫(yī)生與總?cè)丝诘谋壤s為1∶343,而西方國家的這一比例約為1∶280。醫(yī)生資源缺口問題在影像科醫(yī)生、病理科醫(yī)生及全科醫(yī)生方面尤為嚴重。目前,我國醫(yī)學影像數(shù)據(jù)的年增長率約為30%,而影像科醫(yī)生數(shù)量的年增長率僅為4.1%,病理科醫(yī)生缺口達到10萬人。我國全科醫(yī)生數(shù)量約30萬人,占醫(yī)生總數(shù)的7.37%。這一比例還遠遠達不到建立真正的全科醫(yī)生制度體系的需求——德國、法國、日本的占比均在20%以上,美國在12%以上。由于醫(yī)生的培養(yǎng)周期很長,我國獨立上崗醫(yī)生的培養(yǎng)周期長達8年,較長的培養(yǎng)周期帶來醫(yī)療人力成本提高,難以滿足持續(xù)增長的醫(yī)療需求。從分布上看,醫(yī)療資源集中于三級醫(yī)院和發(fā)達地區(qū),基層醫(yī)院醫(yī)療水平低,醫(yī)生資源少。從配置上看,據(jù)統(tǒng)計,2018年我國醫(yī)院數(shù)量超過3.2萬家,三級醫(yī)院僅占總數(shù)量的19%,卻承接了全國49.8%的醫(yī)療需求。三級醫(yī)院長期超負荷運轉(zhuǎn),承擔了過多基礎診療工作,導致核心醫(yī)療資源無法發(fā)揮最大價值。供需結(jié)構(gòu)不匹配導致了醫(yī)院運營效率低、誤診率高、醫(yī)療體驗差等諸多問題??梢哉f,供給與需求矛盾突出,是我國醫(yī)療行業(yè)的根本問題。而這些問題,不論是醫(yī)生的培養(yǎng),還是醫(yī)生醫(yī)療技術(shù)水平的提升,借助人工智能技術(shù)都將有望得到改善。1.2.2人工智能技術(shù)不斷突破一直以來,算法、算力和數(shù)據(jù)被認為是人工智能發(fā)展的三駕馬車,也是推動人工智能發(fā)展的重要基礎。1.在算法層面在算法層面,超大規(guī)模預訓練模型等成為近兩年最受關(guān)注的熱點之一。自OpenAI于2020年推出GPT-3以來,谷歌、華為、智源研究院、中國科學院、阿里巴巴等企業(yè)和研究機構(gòu)相繼推出超大規(guī)模預訓練模型,包括SwitchTransformer、DALL·E、MT-NLG、盤古、悟道2.0、紫東太初和M6等,不斷刷新著各榜單紀錄。而OpenAI更是一舉將大模型的訓練之路打開了,讓大家看到了基于深度學習的路徑方向,基于參數(shù)優(yōu)化一旦正確,機器就能具備類人的智能邏輯。深度學習是人工智能技術(shù)的重要一脈,目前語音識別和計算機視覺都基于深度學習技術(shù)來完成。隨著圖像領域深度學習Resnet網(wǎng)絡結(jié)構(gòu)發(fā)展,計算機視覺和綜合圖像處理技術(shù)取得長足進步,醫(yī)學影像分析在診療過程中發(fā)揮更大作用。例如,應用計算機視覺技術(shù)進行結(jié)腸鏡檢查,可以獲得更為有效、可靠的數(shù)據(jù),以降低結(jié)腸癌死亡率;在外科手術(shù)中,計算機視覺對腦瘤病人進行三維頭骨建模,有利于后續(xù)神經(jīng)外科治療。此外,近年來,人工智能對海量數(shù)據(jù)的分析能力能夠讓研究者不再局限于常規(guī)的“推導定理式”研究,可以基于高維數(shù)據(jù)發(fā)現(xiàn)相關(guān)信息,繼而加速研究進程。2020年,DeepMind提出的AlphaFold2在國際蛋白質(zhì)結(jié)構(gòu)預測競賽(CriticalAssessmentofproteinStructurePrediction,CASP)中拔得頭籌,能夠精確地預測蛋白質(zhì)的三維結(jié)構(gòu),其準確性可以與使用冷凍電子顯微鏡等實驗技術(shù)解析的三維結(jié)構(gòu)相媲美。中美研究團隊使用人工智能的方法,在保證“從頭計算”高精度的同時,將分子動力學極限提升了數(shù)個量級,比過去同類工作計算空間尺度增大100倍,計算速度提高1000倍,獲得2020年國際計算機協(xié)會(AssociationforComputingMachinery,ACM)戈登貝爾獎。2.在算力層面在算力層面,當前,人工智能算力仍在持續(xù)突破,面向訓練用和推斷用的芯片仍在快速演進。這主要源于算力需求的驅(qū)動。一方面,體現(xiàn)在模型訓練階段,根據(jù)OpenAI數(shù)據(jù),模型計算量增長速度遠超人工智能硬件算力增長速度,存在萬倍差距;另一方面,由于推斷的泛在性,使得推斷用算力需求持續(xù)增長。與此同時,新的算力架構(gòu)也在不斷研究中,類腦芯片、存內(nèi)計算、量子計算等備受關(guān)注,但總體上處于探索階段。3.在數(shù)據(jù)層面在數(shù)據(jù)層面,以深度學習為代表的人工智能技術(shù)需要大量的標注數(shù)據(jù),這也催生出專門的技術(shù)乃至服務。隨著面向問題的不斷具體化和深入,數(shù)據(jù)服務走向精細化和定制化。此外,隨著知識在人工智能的重要性被廣泛提及,對知識集的構(gòu)建和利用不斷增多。人工智能的快速發(fā)展推動數(shù)據(jù)規(guī)模不斷提升。據(jù)互聯(lián)網(wǎng)數(shù)據(jù)中心(InternetDataCenter,IDC)測算,2025年全球數(shù)據(jù)規(guī)模將達到163ZB,其中80%~90%是非結(jié)構(gòu)化數(shù)據(jù)。數(shù)據(jù)服務進入深度定制化的階段,百度、阿里巴巴、京東等公司推出根據(jù)不同場景和需求進行數(shù)據(jù)定制的服務。企業(yè)需求的數(shù)據(jù)集從通用簡單場景向個性化復雜場景過渡。例如,語音識別數(shù)據(jù)集從普通話向小語種、方言等場景發(fā)展,智能對話數(shù)據(jù)集從簡單問答、控制等場景向應用場景、業(yè)務問答等方向發(fā)展。各方積極探索建立高質(zhì)量知識集,支撐未來知識驅(qū)動的人工智能應用發(fā)展。數(shù)據(jù)生成和共享速度迅速增長。在數(shù)據(jù)方面,我國擁有得天獨厚的優(yōu)勢,我國人口眾多,數(shù)據(jù)基數(shù)大,同時多樣性豐富,為大數(shù)據(jù)分析提供了豐富的數(shù)據(jù)來源,也為人工智能不斷訓練與優(yōu)化算法模型提供了廣泛數(shù)據(jù)集。盡管中國有比較龐大的人口數(shù)量與相對的數(shù)據(jù)優(yōu)勢,但醫(yī)療信息化與數(shù)據(jù)化普及程度不足,也制約著人工智能醫(yī)療產(chǎn)業(yè)的發(fā)展。但相比較而言,盡管美國的人口基數(shù)與數(shù)據(jù)樣本量沒有中國龐大,但美國有著比較健全的醫(yī)療數(shù)據(jù)化系統(tǒng),或者說醫(yī)療的信息化、數(shù)據(jù)化程度比較高,這就使得美國在人工智能醫(yī)療方面的訓練上,更容易基于數(shù)據(jù)化與標準化訓練出診斷準確性更高的人工智能醫(yī)生。1.2.3政策引導和支持近年來,我國出臺了一系列全國性政策及醫(yī)療人工智能專項政策,鼓勵“人工智能+”醫(yī)療產(chǎn)業(yè)發(fā)展。在政策引導下,醫(yī)療產(chǎn)業(yè)有望迎來真正的變革。2017年7月,國務院印發(fā)《新一代人工智能發(fā)展規(guī)劃》(以下簡稱《規(guī)劃》),這也是我國在人工智能領域進行系統(tǒng)部署的第一份文件?!兑?guī)劃》指出,到2030年,我國人工智能理論、技術(shù)與應用總體上要達到世界領先水平。在《規(guī)劃》提出的六大重點任務中,特別提出要在醫(yī)療領域發(fā)展便捷高效的智能服務,圍繞醫(yī)療等方面的迫切民生需求,加快人工智能創(chuàng)新應用,使精準化智能服務更加豐富多樣,使社會治理智能化水平大幅提升?!兑?guī)劃》提出發(fā)展智能醫(yī)療:“推廣應用人工智能治療新模式新手段,建立快速精準的智能醫(yī)療體系。探索智慧醫(yī)院建設,開發(fā)人機協(xié)同的手術(shù)機器人、智能診療助手,研發(fā)柔性可穿戴、生物兼容的生理監(jiān)測系統(tǒng),研發(fā)人機協(xié)同臨床智能診療方案,實現(xiàn)智能影像識別、病理分型和智能多學科會診。基于人工智能開展大規(guī)?;蚪M識別、蛋白質(zhì)組學、代謝組學等研究和新藥研發(fā),推進醫(yī)藥監(jiān)管智能化。加強流行病智能監(jiān)測和防控”。2018年,教育部印發(fā)《高等學校人工智能創(chuàng)新行動計劃》,國務院辦公廳印發(fā)《關(guān)于促進“互聯(lián)網(wǎng)+醫(yī)療健康”發(fā)展的意見》。2020年,中共中央政治局常務委員會召開會議時指出,要加大公共衛(wèi)生服務、應急物資保障領域投入,加快5G網(wǎng)絡、數(shù)據(jù)中心等新型基礎設施建設進度。2020年新冠疫情暴發(fā)之時,工信部網(wǎng)站發(fā)布了《充分發(fā)揮人工智能賦能效用協(xié)力抗擊新型冠狀病毒感染的肺炎疫情倡議書》,倡議進一步發(fā)揮人工智能賦能效用,組織科研和生產(chǎn)力量,把加快有效支撐疫情防控的相關(guān)產(chǎn)品攻關(guān)和應用作為優(yōu)先工作,進一步推動了“人工智能+”醫(yī)療的發(fā)展。2023年更是著重于電子病歷的推行。國家衛(wèi)健委在4月發(fā)布新版國家二級公立醫(yī)院績效考核操作手冊。對于二級公立醫(yī)院的電子病歷應用功能水平分級、患者滿意度等指標,新版手冊要求逐步提高。以電子病歷為核心的醫(yī)院信息化建設是深化醫(yī)改的重要內(nèi)容之一。電子病歷的推行,是數(shù)字化醫(yī)療的一個重要舉措,或者說是人工智能醫(yī)療向前發(fā)展的一個基礎條件。沒有數(shù)據(jù)就很難訓練出高質(zhì)量的人工智能醫(yī)生,而電子病歷的數(shù)據(jù)化,給人工智能的醫(yī)療變革奠定了基礎。1.3“人工智能+”下,醫(yī)療正進擊相對于制造業(yè)、通信、傳媒、零售、教育等人工智能應用領域,全球的人工智能醫(yī)療還處于早期階段,商業(yè)化程度相對較低,行業(yè)滲透率較低。但不可否認的是,人工智能在醫(yī)療領域的結(jié)合點響應了傳統(tǒng)醫(yī)療的諸多困境,具有廣泛的市場需求和多元業(yè)務趨向,擁有廣闊的發(fā)展空間。尤其是OpenAI大語言模型(也稱大型語言模型)的突破,將加速人工智能技術(shù)介入醫(yī)療的普及與應用速度。例如,訓練人工智能輔助醫(yī)生完成病歷的撰寫及診療過程的問題概述?;谟跋駥W與檢測指標的人工智能診斷,以及借助人工智能技術(shù)的??漆t(yī)生打造,都正在實現(xiàn)的路上。從具體應用層面來看,人工智能在醫(yī)療領域主要有5個應用方向:輔助診療、醫(yī)學影像、健康管理、藥物研發(fā)、疾病預測。1.3.1輔助診療人工智能輔助診療主要提供醫(yī)學影像、電子病歷、導診機器人、醫(yī)療助手、輔助醫(yī)療、臨床輔助決策等服務,利用機器學習+計算機視覺緩解病理專家稀缺的現(xiàn)狀,利用人工智能+大數(shù)據(jù)對患者進行系統(tǒng)化記錄和健康管理,利用人工智能+機器人技術(shù)分擔醫(yī)院從醫(yī)人數(shù)不足的壓力。(1)在電子病歷方面,人工智能普遍在病種專業(yè)化平臺、智能語音錄入、自然語言識別、臨床決策支持這4個場景開展服務。以語音電子病歷為例,人工智能基于脫敏的病歷數(shù)據(jù)和臨床使用不斷訓練模型、優(yōu)化算法,通過語音識別引擎實現(xiàn)人機交互和文本轉(zhuǎn)錄。(2)在導診機器人方面,我國機器人應用相對成熟,應用場景明晰,一般多為院內(nèi)導診環(huán)節(jié),使得醫(yī)療機器人具有相應的發(fā)展優(yōu)勢。醫(yī)療領域機器人主要基于人臉識別、語音識別等技術(shù),再通過后臺嫁接醫(yī)院信息等知識系統(tǒng),實現(xiàn)導診功能。(3)在醫(yī)療助手方面,智能問診是主要應用場景,通過建立疾病知識庫和歷史問診記錄,實現(xiàn)人機交互的智能問診功能。例如,在新冠疫情期間,入院問診存在交叉感染的風險,對有問診需求的患者造成不便,并且疫情給公眾帶來一定的心理恐慌,在線下醫(yī)療受阻,但又急需專業(yè)的醫(yī)學信息來解決問題的情況下,在線問診發(fā)展迅速。在在線問診的過程中,用戶在在線問診平臺輸入癥狀,人工智能系統(tǒng)將識別用戶輸入的文本,并完成分詞、詞性標注、句法解析、信息抽取等一系列工作,最終在知識庫中進行檢索,把類似信息推給用戶,完成精準的信息匹配。騰訊云基于醫(yī)療行業(yè)語料及醫(yī)療專業(yè)詞匯,打造醫(yī)療行業(yè)語音識別模型。醫(yī)生在門診、住院查房、交接班等場景下,均可使用語音輸入軟件,將傳統(tǒng)的手寫病歷轉(zhuǎn)換為語音輸入,大幅度縮短病歷錄入的時間,減輕工作負擔。(4)在輔助醫(yī)療方面,人工智能已經(jīng)形成了一些實質(zhì)性應用,手術(shù)機器人和醫(yī)療機器人就是比較活躍的嘗試。手術(shù)機器人已經(jīng)在胃腸外科、泌尿外科、婦科和心外科等的手術(shù)中滲透與應用。手術(shù)機器人通過高分辨率三維立體視覺及器械自由度,在狹小的手術(shù)空間內(nèi)提供超越人類的視覺系統(tǒng)、更大的操作靈活性與精準度,拓展了腹腔鏡手術(shù)的適應證,增強了手術(shù)效果。(5)人工智能技術(shù)還可用于臨床輔助決策。臨床輔助決策支持系統(tǒng)(ClinicalDecisionSupportSystem,CDSS)相當于一個不斷更新的醫(yī)學知識庫,是基于人機交互的醫(yī)療信息技術(shù)應用系統(tǒng),通過數(shù)據(jù)和模型輔助醫(yī)生完成臨床決策。CDSS的使用場景涵蓋診前決策、診中支持和診后評價全流程,幫助臨床醫(yī)生做出最為恰當?shù)脑\療決策,提高診斷效率與診斷質(zhì)量。目前,世界上絕大多數(shù)CDSS都由3個部分組成,即臨床知識庫、推理機和人機交流接口,其中龐大可靠的臨床知識庫是CDSS的行業(yè)壁壘。一個完整的臨床知識庫應當包含各種最新臨床指南、循證醫(yī)學證據(jù)、醫(yī)學文獻、醫(yī)學辭典、醫(yī)學圖譜計算工具、大量電子病歷等海量數(shù)據(jù),還應當交互良好,方便臨床醫(yī)生從中獲取信息。此外,臨床知識庫必須是開放的、動態(tài)更新的。1.3.2醫(yī)學影像作為輔助診療的一個細分領域,將人工智能技術(shù)應用于醫(yī)學影像診斷中,是醫(yī)療領域人工智能應用最為廣泛的場景。人工智能醫(yī)學影像得以率先爆發(fā)與落地應用,主要是由于影像數(shù)據(jù)的相對易獲取性和易處理性。相比于病歷等跨越三五年甚至更長時間的數(shù)據(jù)積累,影像數(shù)據(jù)僅需要單次拍攝,幾秒鐘即可獲取,一張影像片子即可反映病人的大部分病情狀況,成為醫(yī)生確定治療方案的直接依據(jù)。醫(yī)學影像龐大且相對標準的數(shù)據(jù)基礎,以及智能圖像識別等算法的不斷進步,為人工智能醫(yī)療在該領域的落地應用提供了堅實基礎。具體而言,醫(yī)學影像診斷主要依托圖像識別和深度學習這兩項技術(shù)。依據(jù)臨床診斷路徑,首先,將圖像識別技術(shù)應用于感知環(huán)節(jié),對非結(jié)構(gòu)化影像數(shù)據(jù)進行處理和分析,提取有用信息;其次,利用深度學習技術(shù),將大量臨床影像數(shù)據(jù)和診斷經(jīng)驗輸入人工智能模型,使神經(jīng)元網(wǎng)絡進行深度學習訓練;最后,基于不斷驗證與打磨的算法模型,進行影像診斷智能推理,輸出個性化的診療判斷結(jié)果。從落地方向來看,人工智能主要解決3種影像需求:第1種是病灶識別與標注,針對X射線影像(也稱X影像或X線片)、計算機斷層掃描(ComputedTomography,CT)影像(也稱CT片)、磁共振成像(MagneticResonanceImaging,MRI)影像等醫(yī)學影像進行圖像分割、特征提取、定量分析和對比分析,識別與標注病灶,幫助醫(yī)生發(fā)現(xiàn)肉眼難以發(fā)現(xiàn)的病灶,降低假陰性診斷發(fā)生率,提高醫(yī)生診斷效率;第2種是靶區(qū)自動勾畫與自適應放療,針對腫瘤放療環(huán)節(jié)進行影像處理,幫助影像科醫(yī)生對200~450張CT影像進行自動勾畫,時間縮短到30分鐘一套,在患者15~20次上機照射過程中不斷識別病灶位置變化以達到自適應放療,減少射線對患者健康組織的輻射與傷害;第3種是影像三維重建,基于灰度統(tǒng)計量的配準算法和基于特征點的配準算法,解決斷層圖像配準問題,有效節(jié)約配準時間,在手術(shù)環(huán)節(jié)有重要應用。從落地情況來看,目前中國人工智能醫(yī)學影像產(chǎn)品主要應用在疾病篩查方面,以腫瘤和慢性疾病領域為主。其中,肺癌和眼底篩查領域介入企業(yè)最多,近兩年乳腺癌也成為熱門布局領域之一。此外,不同企業(yè)針對客戶群體也有所差別,除三甲醫(yī)院和基層醫(yī)院外,也有面向C端和保險公司等的產(chǎn)品。1.3.3健康管理將人工智能技術(shù)應用到健康管理的具體場景,通常與互聯(lián)網(wǎng)醫(yī)療緊密結(jié)合,被視為互聯(lián)網(wǎng)醫(yī)療的深化發(fā)展階段。目前,人工智能技術(shù)主要應用于風險識別、虛擬護士、精神健康、移動醫(yī)療、可穿戴設備等健康管理領域。人工智能可實現(xiàn)精準健康管理。從技術(shù)驅(qū)動的角度看,人工智能能通過高效的計算和精準的決策分析,使個性化健康管理成為可能,推動健康管理的精準化,甚至未來營養(yǎng)師和運動專家可以基于人工智能系統(tǒng)生成精準健康干預方案,并探究數(shù)據(jù)背后的學科邏輯。例如,日本就將醫(yī)療健康管理和護理作為結(jié)合人工智能的突破口,旨在緩解本國嚴重的老齡化問題帶來的壓力。借助各種智能設備,如智能馬桶可以對尿液與糞便進行自動監(jiān)測與檢測,結(jié)合人工智能的健康管理系統(tǒng),不僅能實時地掌握健康狀況,同時還能推演出潛在的健康問題。我國的人工智能健康管理產(chǎn)業(yè)起步較晚,但隨著各種檢測技術(shù)(如可穿戴設備、基因檢測等)的發(fā)展,伴隨著物聯(lián)網(wǎng)大環(huán)境的促進,當前健康管理市場正在進入一個高速發(fā)展階段。盡管可穿戴設備產(chǎn)業(yè)之前已經(jīng)發(fā)展了十多年,但一直沒有獲得足夠的市場認同,其中兩大核心制約要素就是硬件與軟件。所謂的硬件,就是可穿戴設備產(chǎn)品本身,不論是傳感器還是其他的監(jiān)測技術(shù),其針對人體健康指標的健康精密度都還存在著優(yōu)化的空間。所謂的軟件,就是基于可穿戴設備所采集的大量健康數(shù)據(jù),我們需要借助人工智能的健康管理系統(tǒng),才能構(gòu)建實時的健康管理效果,否則可穿戴設備就只能停留在運動計步等初級運動數(shù)據(jù)的監(jiān)測,難以進入真正的健康管理領域。不過可以預見的是,在人工智能醫(yī)療技術(shù)的突破之下,可穿戴設備產(chǎn)業(yè)擁有更加廣闊的發(fā)展前景。尤其是在健康管理領域,可穿戴設備是不可或缺的實現(xiàn)載體。1.3.4藥物研發(fā)藥物研發(fā)主要包括藥物發(fā)現(xiàn)、臨床前研究、臨床研究及審批上市4個階段。目前,藥物研發(fā)的核心困難在于研發(fā)過程中存在諸多不確定性因素,如靶點有效性、模型有效性等問題,需要通過大量實驗予以確認。而在藥物研發(fā)過程中引入人工智能技術(shù),利用深度學習技術(shù)對分子結(jié)構(gòu)進行處理和分析,在不同研發(fā)環(huán)節(jié)建立擁有較高準確性的預測系統(tǒng),可以減少各個研發(fā)環(huán)節(jié)的不確定性,從而縮短研發(fā)周期,降低試錯成本,提高研發(fā)成功率。在新冠疫情期間,通過大數(shù)據(jù)處理、機器學習、深度學習等技術(shù),人工智能在藥物研發(fā)領域發(fā)揮了重要作用,這些應用主要集中在靶點發(fā)現(xiàn)、疾病網(wǎng)絡構(gòu)建和藥物篩選等方面。1.人工智能技術(shù)在智能藥物研發(fā)中的優(yōu)勢基于大語言模型人工智能技術(shù)的不斷發(fā)展,將會加速人工智能在醫(yī)療領域的應用,其中智能藥物研發(fā)必然是不可或缺的環(huán)節(jié)。人工智能技術(shù)在智能藥物研發(fā)中主要有以下3個方面的優(yōu)勢:首先是加速研發(fā)。傳統(tǒng)的藥物研發(fā)需要耗費大量的時間和人力、物力,而人工智能技術(shù)可以通過對海量數(shù)據(jù)的分析和挖掘,加快藥物篩選和優(yōu)化的過程,并且可以針對疾病配對出更加有效的藥物,就能在最大程度上縮短研發(fā)時間,降低研發(fā)成本。其次是提高成功率。人工智能技術(shù)可以通過對疾病與藥物數(shù)據(jù)的深度學習和模式識別,發(fā)現(xiàn)和分析隱藏在數(shù)據(jù)中的規(guī)律和特征,包括對不同藥物分子的合成模擬配對,最大程度地提高藥物研發(fā)的準確性與成功率。最后是提高效率。通常的藥物研發(fā)需要處理大量的數(shù)據(jù)、實驗和信息,而人工智能技術(shù)通過自動化的算法和模型,不僅可以對數(shù)據(jù)進行準確、快速的處理和分析,同時還可以模擬推演各種配對結(jié)果,讓實驗從實驗室走向人工智能虛擬實驗,從而提高研發(fā)效率。2.人工智能技術(shù)在智能藥物研發(fā)中的局限性目前,人工智能技術(shù)在智能藥物研發(fā)中還存在一些局限性,主要體現(xiàn)在以下3個方面。一是數(shù)據(jù)不足。人工智能驅(qū)動下的智能藥物研發(fā),顯然需要基于大量的數(shù)據(jù)和信息,但是目前可用的數(shù)據(jù)仍然相對有限,不論是臨床疾病的數(shù)據(jù),還是藥物數(shù)據(jù)庫的信息,這在很大程度上限制了人工智能技術(shù)在藥物研發(fā)領域的應用。二是算法不完善。尤其是在沒有大語言模型技術(shù)之前,人工智能的算法技術(shù)更像是數(shù)據(jù)統(tǒng)計分析,而不具備自研發(fā)的能力。但隨著大語言模型技術(shù)的突破,基于人工智能藥物研發(fā)的算法技術(shù)將會在最大程度上獲得優(yōu)化。三是涉及倫理和法律問題。人工智能技術(shù)的應用涉及一些倫理和法律問題。一方面是數(shù)據(jù)隱私保護與數(shù)據(jù)安全等方面的問題;另一方面則是人工智能技術(shù)驅(qū)動下的藥物研發(fā),需要相對應的監(jiān)管與審批流程,尤其是一些臨床測試環(huán)節(jié)在借助人工智能技術(shù)獲得了模擬與優(yōu)化之后。但總的來說,借助人工智能技術(shù)優(yōu)化藥物研發(fā),并推動藥物研發(fā)、監(jiān)管、審批等體系的變革與優(yōu)化,以及借助人工智能技術(shù)實現(xiàn)快速、高效、精準、個性化藥物配對、研發(fā)、生產(chǎn)、治療的時代正在到來。1.3.5疾病預測對公共衛(wèi)生領域來說,人工智能技術(shù)的疾病預測無疑具有重要意義。傳染病防控是目前人工智能在疾病預測領域的最大應用場景,人工智能主要在傳染病暴發(fā)預測、傳播與溯源排查、發(fā)展趨勢預測等方面發(fā)揮作用。(1)在傳染病暴發(fā)預測方面,利用網(wǎng)絡爬蟲技術(shù)、自然語言處理技術(shù)及其他人工智能技術(shù),持續(xù)收集并分析全球范圍內(nèi)關(guān)于疾病和重大公共衛(wèi)生事件的新聞、報告、評論和搜索引擎指數(shù),從海量數(shù)據(jù)中過濾并提取有效信息,對關(guān)鍵信息進行智能化分析,可對傳染病暴發(fā)做出可能性預測。(2)在傳染病傳播與溯源排查方面,利用深度學習技術(shù),根據(jù)出行軌跡流動信息、社交信息、消費信息、暴露接觸史等大量數(shù)據(jù)進行科學建模,結(jié)合感染者確診時間及其密切接觸者的空間位置信息確定可能存在交叉感染的時間點與具體傳播路徑,為傳染病溯源分析提供可靠依據(jù)。(3)在傳染病發(fā)展趨勢預測方面,基于高危人群感染數(shù)據(jù),結(jié)合新增確診病例、疑似病例、死亡病例與治愈病例數(shù)等,借助傳播動力學模型、動態(tài)感染模型、回歸模型等大數(shù)據(jù)分析模型,人工智能技術(shù)可以對發(fā)病熱力分布與密切接觸者的風險熱力分布進行分析與展示,并對疫情峰值與拐點等重要趨勢進行研判。在新冠疫情期間,基于人工智能技術(shù)的創(chuàng)新防疫應用在各地相繼落地。在韓國,基于地理位置和行動軌跡的大數(shù)據(jù)信息平臺成為控制病毒傳播的重要工具,當人們靠近疫情危險區(qū)時,會自動收到危險報警。在美國加州,科學家研發(fā)出針對易感者的健康預警系統(tǒng),能夠遠程監(jiān)控包括獨居老人在內(nèi)的易感人群的身體健康狀況,起到傳染病預警作用。在我國,人工智能在無接觸式體溫檢測、社區(qū)居民健康快速篩查、疫情宣教、流行病學數(shù)據(jù)采集與應用、智慧化管理平臺建設等方面展開應用。1.4ChatGPT如何影響醫(yī)療?從2022年底到2023年,聊天機器人程序ChatGPT火遍全網(wǎng)。推出才兩個月時,ChatGPT月活躍用戶數(shù)就已經(jīng)突破1億,成為互聯(lián)網(wǎng)歷史上用戶數(shù)增長最快的消費應用。而當初,抖音海外版TikTok在全球發(fā)布后,花了大約9個月的時間才達到這個成績。作為人工智能領域的“頂流”產(chǎn)品。ChatGPT的出現(xiàn)進一步加速了人工智能在醫(yī)療領域的落地,并展現(xiàn)出令人興奮的應用前景。1.4.1ChatGPT是個啥?ChatGPT是OpenAI發(fā)布的最新一代的AI語言模型,是自然語言處理(NaturalLanguageProcessing,NLP)中一項引人矚目的進展。這個當今最火爆的AI語言模型,與過去那些智能語音助手的回答模式有很大的不同,ChatGPT出人意料地聰明。與當前的一些人工智能客服相比,ChatGPT真正走向了人工智能,有了我們期待的模樣。很多人形容它是一個真正的“六邊形戰(zhàn)士”——不僅能聊天、搜索、做翻譯,還能撰寫詩詞、論文、代碼,甚至能開發(fā)小游戲、參加考試、干科研、當醫(yī)生等。外媒評論稱,ChatGPT會成為科技行業(yè)的下一個顛覆者。GPT的英文全稱為GenerativePre-trainedTransformer(生成式預訓練轉(zhuǎn)換器),是一種基于互聯(lián)網(wǎng)的、可用數(shù)據(jù)來訓練的、文本生成的深度學習模型。ChatGPT“脫胎”于OpenAI在2020年發(fā)布的GPT-3。GPT-3剛問世時,也曾引起相似的轟動。當時,GPT-3也展示出了答題、翻譯、寫文章,甚至數(shù)學計算和編寫代碼等多種能力。由GPT-3所寫的文章幾乎達到了以假亂真的地步。GPT-3被認為是當時最強大的語言模型,甚至在當時有網(wǎng)友評價GPT-3“無所不能”。但現(xiàn)在,ChatGPT所表現(xiàn)出來的能力比GPT-3還要強大,可以說是智商、情商都在線。ChatGPT不僅能進行天馬行空的長對話,可以回答問題,還能根據(jù)人們的要求撰寫各種書面材料,如商業(yè)計劃書、廣告宣傳材料、詩歌、笑話、計算機代碼和電影劇本等,甚至還可以進行化學用品的模擬研發(fā)。簡單來說,就是ChatGPT具備了類人的邏輯、思考與溝通的能力,并且它的溝通能力在一些領域表現(xiàn)得相當驚人。文學創(chuàng)作對ChatGPT而言,更是不在話下。例如,給ChatGPT一個主題,它就可以寫出小說框架。我們讓ChatGPT以“AI改變世界”為主題寫一個小說框架,ChatGPT就能清晰地給出故事背景、主要角色、故事情節(jié)和結(jié)局。若覺得小說框架還不夠完整,則可對ChatGPT進行適當提醒,ChatGPT就能在“調(diào)教”之下,繼續(xù)回答,補充完整。ChatGPT已經(jīng)具備了一定的記憶能力,能夠進行連續(xù)對話。有用戶體驗之后評價稱,“ChatGPT的語言組織能力、文本水平、邏輯能力,可以說已經(jīng)令人驚艷了”。甚至已經(jīng)有用戶打算把日報、周報、總結(jié)這些文字工作,交給ChatGPT來輔助完成了。普通的文本創(chuàng)作,只是最基本的。ChatGPT還能給程序員的代碼找Bug(Bug指的是計算機程序中出現(xiàn)的錯誤,也可以稱為缺陷、故障或漏洞)。一些開發(fā)者在試用中表示,ChatGPT針對他們的技術(shù)問題提供了非常詳細的解決方案,比一些搜索軟件的回答還要靠譜。美國代碼托管平臺Replit的首席執(zhí)行官AmjadMasad在推特上發(fā)文稱,ChatGPT是一個優(yōu)秀的“調(diào)試伙伴”,“它不僅解釋了錯誤,而且能夠修復錯誤,并解釋修復方法”。ChatGPT還敢于質(zhì)疑不正確的前提和假設,主動承認錯誤,主動拒絕一些無法回答的問題和不合理的問題,提升了對用戶意圖的理解,提高了答題結(jié)果的準確性。在醫(yī)學領域,美國《科學公共圖書館·數(shù)字健康》雜志在2023年2月9日刊載論文稱,ChatGPT在沒有經(jīng)過專門訓練或加強學習的情況下就能通過或接近通過美國執(zhí)業(yè)醫(yī)師資格考試(UnitedStatesMedicalLicensingExamination,USMLE)。此外,ChatGPT還在考試中表現(xiàn)出高度的一致性和洞察力。這些結(jié)果表明,基于大語言模型的人工智能技術(shù),可能有輔助醫(yī)學教育,甚至臨床診療、決策的潛力。1.4.2比ChatGPT更強大的版本ChatGPT的強悍已經(jīng)讓人們足夠震驚,而ChatGPT的下一代——GPT-4則讓人們進一步感受到,人工智能帶來的顛覆或許真的要來了。事實上,ChatGPT其實只是OpenAI匆忙推出的測試品。據(jù)美國媒體報道,2022年11月中旬,OpenAI員工被要求快速上線一款聊天機器人。一位高管稱,該聊天機器人將被稱為“ChatwithGPT-3.5”,兩周后將免費向公眾開放。這與原本安排不符。近兩年,OpenAI一直在開發(fā)名為“GPT-4”的更強大語言模型,并計劃于2023年發(fā)布。2022年,GPT-4還在進行內(nèi)部測試和微調(diào),做好上線前準備。但OpenAI的高管改變了主意。由于擔心競爭對手可能會在GPT-4之前搶先發(fā)布自己的AI聊天機器人超越他們,因此,OpenAI拿出了2020年推出的舊語言模型GPT-3的強化版本GPT-3.5,在此基礎上進行了微調(diào)。這才有了新款聊天機器人ChatGPT的誕生。與ChatGPT的匆忙發(fā)布不同,GPT-4是有所準備的結(jié)果。根據(jù)網(wǎng)傳的消息,GPT-4早在2022年8月就訓練完成了。之所以到2023年3月才面市,是OpenAI需要花6個月的時間讓它變得更安全。而圖像識別、高級推理、強大的文本處理能力,是GPT-4的三大特點。(1)就圖像識別功能來說,GPT-4可以分析圖像并提供相關(guān)信息。例如,它可以根據(jù)食材照片來推薦食譜,為圖片生成圖像描述和圖注等。但是,出于對潛在濫用的擔憂,OpenAI推遲了圖像描述功能的發(fā)布。也就是說,GPT-4的圖像輸入功能還處于尚未公開的預覽階段,目前僅能在OpenAI的直播中觀看效果。(2)就高級推理功能來說,GPT-4能夠針對3個人的不同情況做出一個會議的時間安排,回答存在上下文關(guān)聯(lián)性的復雜問題。GPT-4甚至可以講出一些質(zhì)量不怎么樣、模式化的冷笑話。雖然并不好笑,但至少,它已經(jīng)開始理解“幽默”這一人類特質(zhì)了。要知道,AI的推理能力,正是AI向人類思維慢慢進化的標志。(3)就文本處理能力來說,GPT-4能夠處理超過2.5萬個單詞的文本。GPT-4在文本處理能力上是ChatGPT的8倍,并可以用所有流行的編程語言寫代碼。其實,在隨意談話中,ChatGPT和GPT-4之間的區(qū)別是很細微的。但是,當任務的復雜性達到足夠的閾值時,差異就出現(xiàn)了,GPT-4比ChatGPT更可靠,更有創(chuàng)意,并且能夠處理更細微的指令。GPT-4還能以高分通過各種標準化考試:GPT-4在模擬律師考試中的成績超出90%的人類考生,在俗稱“美國高考”的SAT(ScholasticAptitudeTest)閱讀考試中超出93%的人類考生,在SAT數(shù)學考試中超出89%的人類考生。而同樣面對律師資格考試,ChatGPT背后的GPT-3.5排名在倒數(shù)10%左右,而GPT-4考到了前10%左右。1.4.3GPT-4意味著什么?自人工智能誕生以來,科學家們就在努力實現(xiàn)通用AI。而所謂的通用AI,其實就是指應對多種甚至泛化問題的人工智能技術(shù)。通用AI將擁有在事務中推理、計劃、解決問題、抽象思考、理解復雜思想、快速學習和從經(jīng)驗中學習的能力,能夠像人類一樣輕松地完成所有這些事情。ChatGPT和GPT-4的成功證明了大模型路線的有效性,這直接打開了通用AI發(fā)展的大門,讓AI終于完成了從0到1的突破,開啟了真正的AI時代。ChatGPT和GPT-4的成功,根本原因其實是技術(shù)路線的成功。在OpenAI的GPT模型之前,人們在進行自然語言處理時,都用的是循環(huán)神經(jīng)網(wǎng)絡(RecurrentNeuralNetwork,RNN),然后再加入注意力機制(AttentionMechanism)。所謂注意力機制,就是想將人的感知方式、注意力的行為應用在機器上,讓機器學會去感知數(shù)據(jù)中的重要和不重要的部分。例如,當我們要讓AI識別一張動物圖片時,最重要該關(guān)注的地方就是圖片中動物的面部特征,包括耳朵、眼睛、鼻子、嘴巴,而不用太關(guān)注背景的一些信息。注意力機制核心的目的就在于希望機器能在很多的信息中注意到對當前任務更關(guān)鍵的信息,而對于其他的非關(guān)鍵信息就不需要太多的注意力側(cè)重。換言之,注意力機制讓AI擁有了理解的能力。但RNN+Attention會讓整個模型的處理速度變得非常慢,因為RNN是一個詞一個詞處理的。所以,才有了2017年谷歌大腦團隊的那篇名為“AttentionIsAllYouNeed”(《自我注意力是你所需要的全部》)的論文的誕生。簡單來說,這篇論文的核心就是“不要RNN,只要Attention”。而這個沒有RNN只有Attention的自然語言模型就是Transformer,也就是今天ChatGPT能夠成功的技術(shù)基礎。這個只有Attention的Transformer模型不再是一個詞一個詞的處理,而是一個序列一個序列的處理,可以并行計算,所以計算速度大大加快,一下子讓訓練大模型、超大模型、巨大模型、超巨大模型成為可能。于是,OpenAI在一年之內(nèi)開發(fā)出了第一代GPT,第一代GPT在當時已經(jīng)是前所未有的巨大語言模型,具有1.17億個參數(shù)。而GPT的目標只有一個,就是預測下一個單詞。如果說過去的AI是遮蓋句子中的一個詞,讓AI根據(jù)上下文“猜出”那個詞,進行完形填空,那么GPT要做的,就是要“猜出”后面一堆的詞,甚至形成一篇通順的文章。事實證明,基于Transformer模型和龐大的數(shù)據(jù)集,GPT做到了。特別值得一提的是,在GPT誕生的同期,還有另一種更火的語言模型,那就是BERT。BERT是谷歌基于Transformer模型做的語言模型。BERT是一種雙向的語言模型,通過預測屏蔽子詞——先將句子中的部分子詞屏蔽,再令模型去預測被屏蔽的子詞——進行訓練,這種訓練方式在語句級的語義分析中取得了極好的效果。BERT模型還使用了一種特別的訓練方式——先預訓練,再微調(diào)。這種方式可以使一個模型適用于多個應用場景。這使得BERT模型刷新了11項NLP任務處理的紀錄。在當時,BERT直接改變了自然語言理解(NaturalLanguageUnderstanding,NLU)這個領域,引起了多數(shù)AI研究者的跟隨。面對BERT的大火,GPT的開發(fā)者們依然選擇了堅持做生成式模型,而不是去做理解。于是,就有了后來大火的GPT-3、ChatGPT和GPT-4。從GPT-1到GPT-4,OpenAI做了兩年多時間,用大力出奇跡的辦法證明了大模型的可行性,參數(shù)從1.17億個飆升至1.8萬億個甚至更多,也似乎證明了參數(shù)越多,AI能力越強。在這樣的模型下,開放端口給專業(yè)領域的組織合作,以GPT-4的學習能力,再結(jié)合參數(shù)與模型的優(yōu)化,將很快在一些專業(yè)領域成為專家級水平。人類發(fā)展到今天,已經(jīng)從世界歷史中吸收了大量數(shù)據(jù),這些數(shù)據(jù)以不可估量的方式改變了人類大腦中的神經(jīng)連接。就像我們?nèi)祟惖乃伎己蛯W習一樣,人工智能研究的大語言模型也能夠做類似的事情,并有效地引導它們自己的智能。當GPT-4廣泛地開放給大眾使用后,數(shù)以億計的人涌入與GPT-4進行互動,GPT-4就將獲得龐大又寶貴的數(shù)據(jù)。于是,憑借著比人類更為強大的學習能力,GPT-4的學習與進化速度正在超越我們的想象。未來,借助各種國際科研期刊與科研資料,AI就能基于這些前沿研究來為科學家的科研提供分析、建議、模型、推演,甚至可以進行模擬科研的推演。而一旦我們將人類社會所沉淀的醫(yī)療數(shù)據(jù)信息開發(fā)給GPT進行訓練,基于GPT的人工智能醫(yī)生在常規(guī)與標準化的診療方面超越我們?nèi)祟愥t(yī)生,將是指日可待的事情。1.4.4ChatGPT進軍醫(yī)療ChatGPT是Transformer、基于人類反饋的強化學習(ReinforcementLearningfromHumanFeedback,RLHF)和GPT等相關(guān)技術(shù)發(fā)展的集大成者。它可以被理解為NLP領域的結(jié)晶,也可以被理解為通過深度學習,進而理解文本,同時生成類似于人類所創(chuàng)造文本的人工智能模型。ChatGPT強悍的性能令世界震驚,在ChatGPT的熱潮席卷各行各業(yè)之時,它也來到了醫(yī)療行業(yè)。例如,美國執(zhí)業(yè)醫(yī)師資格考試以難度大著稱,而美國研究人員測試后卻發(fā)現(xiàn),聊天機器人ChatGPT無須經(jīng)過專門訓練或加強學習就能通過或接近通過這一考試。參與這項研究的研究人員主要來自美國醫(yī)療保健初創(chuàng)企業(yè)安西布爾健康公司(AnsibleHealth)。他們在美國《科學公共圖書館·數(shù)字健康》雜志刊載的論文中說,他們從美國執(zhí)業(yè)醫(yī)師資格考試官網(wǎng)2022年6月發(fā)布的376個考題中篩除基于圖像的問題,讓ChatGPT回答剩余的350道題。這些題類型多樣,既有要求考生依據(jù)已有信息給患者下診斷這樣的開放式問題,也有諸如判斷病因之類的選擇題。兩名評審人員負責閱卷打分。結(jié)果顯示,在3個考試部分,去除模糊不清的回答后,ChatGPT得分率在52.4%至75%之間。而得分率在60%左右即可視為通過考試。其中,ChatGPT有88.9%的主觀回答包括“至少一個重要的見解”,即見解較新穎、臨床上有效果且并非人人能看出來。研究人員認為,“在這個出了名難考的專業(yè)考試中達到及格分數(shù),且在沒有任何人為強化(訓練)的前提下做到這一點”,這是人工智能在臨床醫(yī)學應用方面“值得注意的一件大事”,顯示“大語言模型可能有輔助醫(yī)學教育,甚至臨床決策的潛力”。除通過醫(yī)考外,ChatGPT的問診水平也得到了業(yè)界的肯定?!睹绹t(yī)學會雜志》(TheJournaloftheAmericanMedicalAssociation,JAMA)發(fā)表研究性簡報,針對以ChatGPT為代表的在線對話人工智能模型在腦血管疾病預防建議方面的使用合理性進行探討,表示ChatGPT具有輔助臨床工作的潛力,有助于加強患者教育,減少醫(yī)生與患者溝通的壁壘和成本。過程中,根據(jù)現(xiàn)行指南對腦血管疾病三級預防保健建議和臨床醫(yī)生治療經(jīng)驗,研究人員設立了25個具體問題,涉及疾病預防概念、風險因素咨詢、檢查結(jié)果和用藥咨詢等。針對每個問題均向ChatGPT提問3次,記錄每次的回答內(nèi)容。每個問題的3次回答都由1名評審員進行評定,評定結(jié)果分為“合理”、“不合理”或“不靠譜”。3次回答中只要有1次回答有明顯的醫(yī)學錯誤,可直接評定為“不合理”。結(jié)果顯示,ChatGPT回答的合理概率為84%(21/25)。僅從這25個問題的回答來看,在線對話人工智能模型回答腦血管疾病預防問題的結(jié)果較好,具有輔助臨床工作的潛力。顯然,ChatGPT與其他人工智能工具不同。事實上,它很像醫(yī)生解決問題的方式:從一個大型數(shù)據(jù)庫開始(對醫(yī)生來說,數(shù)據(jù)來自課堂、已經(jīng)發(fā)表的研究和專業(yè)經(jīng)驗;對ChatGPT來說,數(shù)據(jù)是數(shù)字出版材料的總和),醫(yī)生會回憶或查找符合病人癥狀的相關(guān)信息,ChatGPT則使用大量參數(shù)來精確定位合適的文本。當然,ChatGPT在醫(yī)療場景中的應用遠不止于此。GPT是一項極具韌性的技術(shù),它本身可以有非常多的應用,只要稍經(jīng)改動便可以遷移到其他領域,同時產(chǎn)生良好的結(jié)果。盡管當前ChatGPT主要應用于文本對話領域,但未來融合語音、文本、圖像信號的多模態(tài)交互技術(shù)可能會成為未來行業(yè)研究的熱點方向。全球最快的圖像生成應用StableDiffusion便是一個成功的應用案例。StableDiffusion可以通過文字描述生成圖片,實現(xiàn)1秒出圖。如果在醫(yī)學影像AI上能夠應用類GPT技術(shù),通過建立起文本與圖像之間的聯(lián)系,反過來將圖像上的關(guān)鍵信息轉(zhuǎn)換為準確的文字信息,那么或許能進一步提升醫(yī)生檢測效率和檢測能力。從醫(yī)學教育的過程來看,醫(yī)學生和住院醫(yī)生是通過結(jié)合教科書、期刊論文、課堂指導和觀察熟練的臨床醫(yī)生來學習醫(yī)療技能的。而以ChatGPT為代表的AI大模型也能夠遵循同樣的方法。一旦ChatGPT連接到床邊的病人監(jiān)護系統(tǒng),就可以訪問實驗室數(shù)據(jù)并聽到醫(yī)患之間的互動,該應用程序?qū)㈤_始預測最佳的一系列臨床步驟。每次ChatGPT將這些決定與電子健康記錄中的臨床記錄和主治醫(yī)生的指令進行比較時,它都會學習和改進。大一的醫(yī)學生需要經(jīng)過十年以上時間的教育和培訓才能技術(shù)嫻熟。未來幾代的ChatGPT將在幾個月或更短的時間內(nèi)完成這一過程。隨著時間的推移,ChatGPT將不斷改進并解決越來越復雜的醫(yī)療問題。1.5從曲折前進到拐點之年隨著人工智能技術(shù)的加速成熟,人工智能在醫(yī)療領域的應用場景不斷豐富,為疾病檢測、診斷及治療模式帶來深刻變革,為提升居民健康質(zhì)量提供新方式。不過,一直以來,醫(yī)療AI的商業(yè)化難題也限制著醫(yī)療AI的進一步發(fā)展。而今天,對也曾經(jīng)歷波峰的醫(yī)療AI而言,ChatGPT和GPT-4的成功無疑是一個絕佳的機會。1.5.1醫(yī)療AI的起落1.醫(yī)療AI的發(fā)展事實上,很早之前,醫(yī)療AI就已經(jīng)啟動。(1)1978—2013年是醫(yī)療AI的萌芽階段,我國開始進行醫(yī)療AI領域的研究開發(fā),整體以臨床知識庫為主。1978年,“關(guān)幼波肝病診療程序”的開發(fā)被認為是我國首次將醫(yī)學專家系統(tǒng)應用到傳統(tǒng)中醫(yī)領域。此后,“中國中醫(yī)治療專家系統(tǒng)”“林如高骨傷計算機診療系統(tǒng)”“中醫(yī)計算機輔助診療系統(tǒng)”等醫(yī)療AI雛形產(chǎn)品相繼涌現(xiàn)。(2)2014—2019年是醫(yī)療AI的起步階段。2014年以來,我國醫(yī)療AI領域創(chuàng)投熱度持續(xù)升溫,2018年投資案例數(shù)達到近年來最多,有197起。2018年,HC3i盤點了超過120家中國醫(yī)療AI初創(chuàng)企業(yè),應用場景覆蓋醫(yī)學影像、輔助診斷、健康管理、藥物挖掘等八大領域。同時期,外媒也曾列舉過105家醫(yī)療AI初創(chuàng)企業(yè),其中包括IBM、谷歌等投資的企業(yè)。我國人工智能技術(shù)加速突破,AI醫(yī)學影像廠商陣營逐漸壯大,人工智能技術(shù)在新藥研發(fā)、基因檢測等領域的融合不斷加深,新產(chǎn)品相繼問世。頭部廠商憑借技術(shù)、資源等優(yōu)勢逐步構(gòu)筑競爭壁壘。(3)2020年至今,醫(yī)療AI則進入商業(yè)化探索階段。2020年1月,第一張醫(yī)療AI產(chǎn)品三類證落地頒發(fā),2020年醫(yī)療AI行業(yè)合計落地10張國家藥品監(jiān)督管理局(NationalMedicalProductsAdministration,NMPA)三類證,開啟醫(yī)療AI商業(yè)化元年。2021年,科亞方舟、推想醫(yī)療、數(shù)坤科技等企業(yè)相繼遞交招股書,醫(yī)渡科技、鷹瞳科技正式登陸港交所,醫(yī)療AI開始進入商業(yè)化探索階段。2.AI在醫(yī)療場景落地面臨的商業(yè)化困境在我國,雖然醫(yī)療AI近年來被資本熱捧,單是2020年一年,醫(yī)療AI領域的投資就高達64億元,但是資本熱捧改變不了AI在醫(yī)療場景落地面臨的商業(yè)化困境。究其原因,首先,系統(tǒng)標準化程度低。經(jīng)歷了30多年的發(fā)展,醫(yī)院信息系統(tǒng)(HospitalInformationSystem,HIS)逐漸迭代完善,走到今天,受到不同歷史時期技術(shù)的限制及不同體系醫(yī)院需求的影響,各廠商版本均有不同程度的差異,每家醫(yī)院的HIS都是不完全一樣的。對于醫(yī)療AI產(chǎn)品,進醫(yī)院的第一步就是先搞清楚每家醫(yī)院的HIS,包括功能、流程和數(shù)據(jù),再進行有針對性的開發(fā)。而這個過程耗時、費力,而且難度很大,需要醫(yī)療AI產(chǎn)品廠商消耗大量的人力成本和時間成本,彌合這個歷史帶來的必須要面對的行業(yè)現(xiàn)狀。其次,數(shù)據(jù)標準化程度低。近年來,醫(yī)院開始推進互聯(lián)互通,搭建數(shù)據(jù)中心,漸漸開始重視數(shù)據(jù)治理工作。然而,一千家醫(yī)院有一千種數(shù)據(jù)管理方式、數(shù)據(jù)存儲結(jié)構(gòu)、數(shù)據(jù)呈現(xiàn)方法,結(jié)果拿到的數(shù)據(jù)有不同的存儲格式、架構(gòu)和標準,數(shù)據(jù)一致性、完整性和準確性都很難保證。最后,交付能力弱,這也是最重要的原因所在。而導致交付能力弱的根本原因,還是在于人工智能依然停留在智能不智的層面。顯然,隨著人工智能技術(shù)的普及發(fā)展,人工智能不再需要諾貝爾獎級別的創(chuàng)新,而需要將現(xiàn)有的技術(shù)產(chǎn)品化、商業(yè)化,創(chuàng)造出真正的價值。但由于部分人工智能企業(yè)及媒體傳播的夸大,導致人工智能仍然青澀的能力在某些領域存在被夸大的情況。市場對人工智能寄予過高的期望,而實際的產(chǎn)品體驗卻往往欠佳。人們對人工智能能力、易用性、可靠性、體驗等方面的要求都給當前的人工智能技術(shù)帶來了更多的挑戰(zhàn)。目前,人工智能能夠真正商業(yè)化處理的還只是對數(shù)據(jù)或信息的歸類、識別,以及一些簡單特定問題的機器回復。例如,以交通事故來說,在全程監(jiān)控的道路上發(fā)生交通事故,人工智能需要的是能夠讀懂交通法規(guī),依據(jù)全程錄制的行車與道路情況做出識別,并依據(jù)交通法規(guī)做出判定,這樣的人工智能才是人工智能應該有的樣子。又如,雖然各種在線平臺都推出了人工智能客服,但是現(xiàn)在這種人工智能客服更直觀的理解是標準化問題的程序主動回復,超出標準化的問題,人工智能客服就不再智能,而需要人工。當前的人工智能高度依賴數(shù)據(jù),但數(shù)據(jù)積累、共享和應用的生態(tài)仍然比較初級,這直接阻礙著人工智能部分應用的實現(xiàn)。此外,人工智能作為一種新的技術(shù),在市場上的應用無疑需要長期與實體世界和商業(yè)社會進行磨合,避免意外的情況發(fā)生。1.5.2破局之路,行則將至醫(yī)療AI苦于商業(yè)化難題久矣,ChatGPT的成功無疑是一個機會。ChatGPT具有強大的信息整合能力和語言組織能力,并具有接近于人類的常識、認知和價值觀,這都讓用戶更愿意接納它。以ChatGPT和GPT技術(shù)為代表的AI大模型,將為醫(yī)療AI提供了新的機遇和突破口,推動醫(yī)療AI進入全新的智能階段。首先,醫(yī)院將成為未來醫(yī)療AI應用最為廣泛的領域之一。未來,隨著通用AI大模型的發(fā)展和應用,醫(yī)療AI將更好地為醫(yī)院提供智能化服務和支持。醫(yī)療AI將會對醫(yī)院的工作流程、醫(yī)療質(zhì)量和工作效率產(chǎn)生重要影響。醫(yī)療AI可以大大提高醫(yī)院的工作效率。例如,醫(yī)療AI可以通過自動化診斷流程減輕醫(yī)生的工作負擔,提高醫(yī)生的工作效率。醫(yī)療AI還可以提高醫(yī)院的醫(yī)療質(zhì)量。通過分析大量的醫(yī)療數(shù)據(jù)和知識,醫(yī)療AI可以為醫(yī)生提供更準確的診斷和治療建議。此外,醫(yī)療AI還可以為醫(yī)院提供智能化的管理和監(jiān)控服務,幫助醫(yī)院更好地管理和控制醫(yī)療過程,從而提高醫(yī)院的管理效率和醫(yī)療質(zhì)量。其次,醫(yī)療AI將給健康管理注入新的活力。未來,隨著通用AI大模型的發(fā)展和應用,醫(yī)療AI將在健康管理中發(fā)揮更為重要的作用。醫(yī)療AI可以通過分析個人的健康數(shù)據(jù)和行為,為健康管理提供更為智能和個性化的服務與支持。在今天,很多人患有兩種或兩種以上的慢性疾病,這些疾病每天都影響著他們的健康。這些患者需要的是持續(xù)的日常監(jiān)測和護理。但傳統(tǒng)的面對面醫(yī)療體系并沒有為他們提供這種服務。這就是未來人工智能可以發(fā)揮巨大作用的地方。未來,被改進過的GPT技術(shù)的加入,將能夠全天候監(jiān)測患者,并提供持續(xù)的醫(yī)療專業(yè)知識。這將有助于預防心臟病、高血壓和糖尿病等慢性疾病,并最大限度地減少致命的并發(fā)癥。GPT技術(shù)可以與可穿戴設備和支持性消費技術(shù)同步,提供全天候監(jiān)控,也可以將可穿戴設備的讀數(shù)與每個患者的醫(yī)生預先設定的預期范圍進行比較,從而在出現(xiàn)問題時向患者和醫(yī)生發(fā)出警報。另外,GPT技術(shù)還能提醒在家的患者何時應該進行預防性篩查、補充藥物或每日鍛煉。再次,藥物研發(fā)是醫(yī)療AI應用的另一個重要領域。未來,隨著通用AI大模型的發(fā)展和應用,醫(yī)療AI將在藥物研發(fā)中發(fā)揮更為重要的作用。醫(yī)療AI可以通過分析大量的醫(yī)療數(shù)據(jù)和知識,為藥物研發(fā)提供更加準確和高效的方法和工具。醫(yī)療AI可以通過分析大量的醫(yī)療數(shù)據(jù),發(fā)現(xiàn)疾病發(fā)展規(guī)律和治療方法的關(guān)聯(lián),從而為新藥研發(fā)提供更準確的方向和思路。醫(yī)療AI還可以通過模擬和仿真技術(shù),加速新藥研發(fā)的進程。此外,醫(yī)療AI還可以為藥物臨床試驗提供更加準確和高效的方法和工具,從而提高臨床試驗的效率和成功率。最后,醫(yī)療AI還可以為醫(yī)學教育提供全新的學習方式和教學工具。醫(yī)療AI可以通過智能化的學習和教育方式,幫助醫(yī)學生更好地掌握醫(yī)學知識和技能。醫(yī)療AI可以為醫(yī)學生提供智能化的學習輔助工具。例如,醫(yī)療AI可以通過自然語言處理技術(shù),幫助學生更好地理解醫(yī)學文獻和知識;醫(yī)療AI還可以通過模擬和虛擬現(xiàn)實技術(shù),為學生提供更真實的醫(yī)學實踐環(huán)境,幫助學生更好地掌握醫(yī)學技能和操作技巧。醫(yī)療AI還可以為醫(yī)學生提供智能化的評估和反饋服務,幫助學生了解自己的學習情況和不足之處,從而更好地提高自己的醫(yī)學水平。ChatGPT就像一道火光閃過,讓人們重新審視AI技術(shù),并學會如何與之進行對話。ChatGPT也為醫(yī)療AI提供了方向指引,ChatGPT對醫(yī)療AI的顛覆,是綜合而又全面的,是從醫(yī)療到醫(yī)藥、從診斷到治療的全過程的顛覆。技術(shù)篇第2章“大數(shù)據(jù)+”醫(yī)療2.1大數(shù)據(jù),大價值搭上人工智能的醫(yī)療,要走上發(fā)展快車道,離不開“大數(shù)據(jù)”這把金鑰匙。如果把醫(yī)療AI比作一幢大廈,那么,大數(shù)據(jù)就是這幢大廈的地基,萬丈高樓平地起,沒有堅固的地基,空中樓閣難以觸及;甚至,大數(shù)據(jù)還可以說是這幢大廈的磚瓦,沒有充足的磚瓦,海市蜃樓不長久。一個小小的比喻,讓大數(shù)據(jù)或者說醫(yī)療大數(shù)據(jù)的重要性不言而喻。這讓我們在探究醫(yī)療AI之前不得不先去認識一下如此風靡的大數(shù)據(jù)。2.1.1什么是大數(shù)據(jù)?大數(shù)據(jù),顧名思義,就是大量的數(shù)據(jù)。大數(shù)據(jù)技術(shù)是通過獲取、存儲、分析手段,從大容量數(shù)據(jù)中挖掘價值的一種全新的技術(shù)架構(gòu)。從數(shù)據(jù)的體量來看,傳統(tǒng)的個人計算機處理的是GB、TB級別的數(shù)據(jù),而大數(shù)據(jù)處理的是PB、EB、ZB級別的數(shù)據(jù)。如果一塊1TB的硬盤可以存儲大約20萬張照片或20萬首MP3音樂,那么1PB的大數(shù)據(jù)需要大約2個機柜的存儲設備,存儲約2億張照片或2億首MP3音樂。1EB的大數(shù)據(jù)則需要大約2000個機柜的存儲設備。當前,全球數(shù)據(jù)量仍在飛速增長。根據(jù)國際機構(gòu)Statista的統(tǒng)計和預測,2023年全球數(shù)據(jù)產(chǎn)生量預計達到93.8ZB,而到2035年,這一數(shù)字將達到2142ZB,全球數(shù)據(jù)量即將迎來更大規(guī)模的爆發(fā)。換言之,大數(shù)據(jù)時代已真正來臨。大量的數(shù)據(jù)增長來自每人每天的日常行為:查天氣、查股票、查地圖導航、網(wǎng)絡購物、網(wǎng)絡聊天、刷微信朋友圈、轉(zhuǎn)發(fā)、點贊等。2015年,每人每天的數(shù)據(jù)交互行為為218次,而到2025年,預計每人每天的數(shù)據(jù)交互行為將飆升到4785次。除了體量之大,大數(shù)據(jù)真正的“大”還在于其發(fā)揮的價值之大。早在1980年,美國著名未來學家阿爾文·托夫勒在他的著作《第三次浪潮》中,就明確提出“數(shù)據(jù)就是財富”,并且將大數(shù)據(jù)稱為“第三次浪潮的華彩樂章”。大數(shù)據(jù)的核心本質(zhì)就是價值。這種價值在人工智能時代的意義越來越重大,已經(jīng)不僅僅是用于大數(shù)據(jù)的用戶行為分析與商業(yè)價值挖掘,更重要的是用于人工智能應用的訓練。牛津大學互聯(lián)網(wǎng)研究所維克托·邁爾-舍恩伯格教授指出,大數(shù)據(jù)所代表的是當今社會所獨有的一種新型的能力——以一種前所未有的方式,通過對海量數(shù)據(jù)進行分析,獲得有巨大價值的產(chǎn)品、服務和見解。通過大數(shù)據(jù)處理和分析,人們就能獲得客戶、友商、產(chǎn)品、渠道在各個維度的信息情報,借此為創(chuàng)新應用模式及商業(yè)模式的設計提供研判線索和技術(shù)基礎。大數(shù)據(jù)的價值在新冠疫情防控中也得到體現(xiàn)。例如,在疫情趨勢研判、流行病學調(diào)查、輿情信息動態(tài)、人員遷徙和車輛流動、資源調(diào)配和物流運輸?shù)确矫?,通過政企合作開發(fā)大數(shù)據(jù)分析產(chǎn)品或服務,為政府、企業(yè)和公眾提供實時動態(tài)的信息以輔助決策;諸多大數(shù)據(jù)企業(yè)和互聯(lián)網(wǎng)平臺發(fā)揮大數(shù)據(jù)技術(shù)的優(yōu)勢,為人們提供線上教育、在線醫(yī)療、遠程辦公、無接觸外送、在線娛樂等服務,大批中小微企業(yè)開啟數(shù)字化轉(zhuǎn)型。當前,大數(shù)據(jù)正在給整個社會帶來從生活到思維上的革命性變化:企業(yè)和政府的管理人員在進行決策時,會出現(xiàn)從“經(jīng)驗即決策”到“數(shù)據(jù)輔助決策”再到“數(shù)據(jù)即決策”的變化;人們所接受的服務,將以數(shù)字化和個性化的方式呈現(xiàn),借助三維打?。ㄓ址Q3D打?。┘夹g(shù)和生物基因工程,零售業(yè)和醫(yī)療業(yè)亦將實現(xiàn)數(shù)字化和個性化的服務;以小規(guī)模實驗、定性或半定量分析為主要手段的科學分支,如社會學、心理學、管理學等,將向大規(guī)模定量化數(shù)據(jù)分析轉(zhuǎn)型;將會出現(xiàn)數(shù)據(jù)運營商和數(shù)據(jù)市場,以數(shù)據(jù)和數(shù)據(jù)產(chǎn)品為對象,通過加工和交易數(shù)據(jù)獲取商業(yè)價值;人類將在哲學層面重新思考諸如“物質(zhì)和信息誰更基礎?”“生命的本質(zhì)是什么?”“生命存在的最終形態(tài)是什么?”等本體論問題。作為一種商品,數(shù)據(jù)可以買賣,可以增值,更重要的是還可以用于訓練。這不僅是大數(shù)據(jù)時代的特征,更是人工智能時代的特征。國際市場上的數(shù)據(jù)交易大致開始于2008年,一些前瞻性的企業(yè)開始加大對數(shù)據(jù)業(yè)務的投入。初見端倪的數(shù)據(jù)應用新業(yè)態(tài)包括“數(shù)據(jù)市場”“數(shù)據(jù)銀行”“數(shù)據(jù)交易公約”等,知名數(shù)據(jù)服務商則有微軟數(shù)據(jù)市場、亞馬遜公共數(shù)據(jù)集、甲骨文在線數(shù)據(jù)交易等。國內(nèi)數(shù)據(jù)交易起步于2010年左右。2015年9月,我國發(fā)布的《促進大數(shù)據(jù)發(fā)展行動綱要》中明確提出,要引導培育大數(shù)據(jù)交易市場,開展面向應用的數(shù)據(jù)交易市場試點,探索開展大數(shù)據(jù)衍生產(chǎn)品交易,建立健全數(shù)據(jù)資源交易機制和定價機制。綜上所述,我們對大數(shù)據(jù)的概念基本能有一個全方面的認識。大數(shù)據(jù)不是數(shù)據(jù)量的簡單刻畫,也不是特定算法、技術(shù)或商業(yè)模式上的發(fā)展,而是從數(shù)據(jù)量、數(shù)據(jù)形態(tài)和數(shù)據(jù)分析處理方式到理念和形態(tài)上重大變革的總和。大數(shù)據(jù)具有大價值,這也是為什么今天社會各界如此關(guān)注大數(shù)據(jù)的原因所在。2.1.2大數(shù)據(jù)和人工智能在英國政府2017年發(fā)布的《在英國發(fā)展人工智能產(chǎn)業(yè)》報告中,對于大數(shù)據(jù)和人工智能的關(guān)系,用一句話進行了簡要概括:數(shù)據(jù)是為了開發(fā)人工智能,人工智能是為了管理數(shù)據(jù)(DatafordevelopingAI,AIformanagingdata)。該報告指出,正是數(shù)據(jù)的快速增長催生出人工智能,獲取大量數(shù)據(jù)和特定數(shù)據(jù)是成功訓練機器學習算法的關(guān)鍵。在有關(guān)機器學習的報告中,英國皇家學會指出,如果要在一個行業(yè)中使用人工智能,則必須使用與該行業(yè)相關(guān)的數(shù)據(jù)來培訓人工智能。如果缺乏相關(guān)性和高質(zhì)量的數(shù)據(jù),那么人工智能將無法得到發(fā)展。若訓練數(shù)據(jù)的可用性提高,則人工智能算法的準確性也會相應提高。日益增大的數(shù)據(jù)量使得人工智能變得尤為必要,有些部門的數(shù)據(jù)量已經(jīng)大到只有人工智能有能力處理的程度??梢哉f,大數(shù)據(jù)和人工智能是密不可分的兩項技術(shù)。一方面,人工智能的發(fā)展需要有大數(shù)據(jù)支撐。在過去,人工智能由于處理器的運行速度慢、數(shù)據(jù)量小而不能很好地工作。而今天,大數(shù)據(jù)為人工智能提供了海量的數(shù)據(jù),使得人工智能技術(shù)有了長足的發(fā)展,能夠?qū)崿F(xiàn)計算機數(shù)據(jù)信息分類存儲目標,擴展數(shù)據(jù)信息存儲容量,全面提升計算機網(wǎng)絡系統(tǒng)的活躍度。另一方面,大數(shù)據(jù)挖掘少不了人工智能技術(shù)的支持。大數(shù)據(jù)的“數(shù)據(jù)”可以分為結(jié)構(gòu)化數(shù)據(jù)、非結(jié)構(gòu)化數(shù)據(jù)與半結(jié)構(gòu)化數(shù)據(jù)。結(jié)構(gòu)化數(shù)據(jù)是指企業(yè)的客戶信息、經(jīng)營數(shù)據(jù)、銷售數(shù)據(jù)、庫存數(shù)據(jù)等存儲于普通數(shù)據(jù)庫之中的數(shù)據(jù),專指可作為數(shù)據(jù)庫進行管理的數(shù)據(jù)。例如,填寫的表格中的數(shù)據(jù)就是結(jié)構(gòu)化數(shù)據(jù)。非結(jié)構(gòu)化數(shù)據(jù)是指不存儲于數(shù)據(jù)庫之中的數(shù)據(jù),包括電子郵件、文本文件、圖像、視頻等數(shù)據(jù)。目前,非結(jié)構(gòu)化數(shù)據(jù)激增,企業(yè)數(shù)據(jù)的80%左右都是非結(jié)構(gòu)化數(shù)據(jù)。隨著社交媒體的興起,非結(jié)構(gòu)化數(shù)據(jù)更是迎來了爆發(fā)式增長。半結(jié)構(gòu)化數(shù)據(jù)則是指一些XML或HTML格式的數(shù)據(jù)。從大數(shù)據(jù)挖掘角度來看,大數(shù)據(jù)的分析并不簡單,尤其是非結(jié)構(gòu)化數(shù)據(jù)。文本挖掘需要自然語言處理技術(shù),圖像與視頻解析需要圖像解析技術(shù)。如今,語音識別技術(shù)也不可或缺。這些都是傳統(tǒng)意義上人工智能領域所研究的技術(shù)??偟膩碚f,大數(shù)據(jù)和人工智能二者相輔相成、相互連接,才有了今天人工智能的持續(xù)進化給人們帶來的驚喜。對于人工智能醫(yī)療,或者人工智能醫(yī)生的打造,數(shù)據(jù)與技術(shù)也同樣是相互驅(qū)動的要素。2.2當醫(yī)療接軌大數(shù)據(jù)隨著信息技術(shù)的快速發(fā)展,各類數(shù)據(jù)急劇增長,數(shù)據(jù)資源與自然資源一樣,已成為重要的戰(zhàn)略資源,人類社會進入大數(shù)據(jù)時代。大數(shù)據(jù)時代下的醫(yī)療活動,如就診治療、醫(yī)學研究、健康保健和衛(wèi)生管理等,時刻在產(chǎn)生大量的醫(yī)療數(shù)據(jù)。醫(yī)療大數(shù)據(jù)是醫(yī)生對患者進行診斷和治療過程中產(chǎn)生的數(shù)據(jù),包括患者基本數(shù)據(jù)、電子病歷、診療數(shù)據(jù)、醫(yī)學影像數(shù)據(jù)、醫(yī)學管理數(shù)據(jù)、經(jīng)濟數(shù)據(jù)、醫(yī)療設備和儀器數(shù)據(jù)等。不斷數(shù)據(jù)化的信息,在使醫(yī)院數(shù)據(jù)庫信息容量不斷膨脹的同時,也對疾病及病人的管理、控制和醫(yī)療研究起到了積極的作用,意義重大。通過對醫(yī)療大數(shù)據(jù)的分析和加工,就可以挖掘出疾病診斷和治療、公共衛(wèi)生服務等方面的重要價值。醫(yī)療大數(shù)據(jù)的應用并不僅僅是在信息化時代才出現(xiàn)的。早在19世紀,英國流行病學家、麻醉學家約翰·斯諾(JohnSnow)博士運用近代早期的數(shù)據(jù)科學,記錄每天的死亡人數(shù)和患病人數(shù),并將死亡者的地址標注在地圖上,繪制了倫敦霍亂暴發(fā)的“群聚”地圖?;魜y在過去被普遍認為是由“有害”空氣導致的。斯諾通過調(diào)查數(shù)據(jù)的匯總,確定了霍亂的元兇是被污染的公共水井,并同時奠定了疾病細菌理論的基礎??梢哉f,現(xiàn)代醫(yī)學就是基于數(shù)據(jù)的醫(yī)學,是基于大數(shù)據(jù)的醫(yī)學。2.2.1醫(yī)療數(shù)據(jù)從哪里來?隨著醫(yī)療衛(wèi)生信息化建設進程的不斷加快,醫(yī)療數(shù)據(jù)的類型和規(guī)模也在以前所未有的速度迅猛增長。醫(yī)療大數(shù)據(jù)主要由結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)構(gòu)成,且以非結(jié)構(gòu)化數(shù)據(jù)為主。不過,如此具有特殊性、復雜性的龐大的醫(yī)療大數(shù)據(jù),其搜集如果僅靠個人甚至個別機構(gòu),那基本是不可能完成的任務。那么這些數(shù)據(jù)到底是怎么產(chǎn)生的?又都來自哪里呢?經(jīng)過簡單的梳理,這些數(shù)據(jù)的來源大致可以分為4類。(1)患者就醫(yī)過程中產(chǎn)生的信息。從患者進入醫(yī)院開始,在掛號環(huán)節(jié)便將個人姓名、年齡、住址、電話等信息輸入數(shù)據(jù)庫;隨后在就醫(yī)環(huán)節(jié),患者的身體狀況、醫(yī)學影像等信息也將被錄入數(shù)據(jù)庫;看病結(jié)束后,在患者結(jié)算的過程中,費用信息、報銷信息、醫(yī)保使用情況等信息被添加到醫(yī)院的數(shù)據(jù)庫中。這將形成醫(yī)療大數(shù)據(jù)最基礎也是最龐大的原始資源。(2)臨床醫(yī)療研究和實驗室的數(shù)據(jù)。臨床醫(yī)療研究和實驗室的數(shù)據(jù)整合在一起,將形成龐大的醫(yī)療數(shù)據(jù)集。一張普通的CT影像含有大約150MB的數(shù)據(jù),一張標準病理圖的數(shù)據(jù)量則接近5GB。如果將這些數(shù)據(jù)量乘以人口數(shù)量和平均壽命,那么僅一個社區(qū)醫(yī)院累積的數(shù)據(jù)量就可達數(shù)萬億字節(jié)甚至數(shù)千萬億字節(jié)(PB)之多。(3)藥物研發(fā)產(chǎn)生的數(shù)據(jù)。藥物研發(fā)所產(chǎn)生的數(shù)據(jù)是相當密集的,從分子設計到臨床試驗,每個環(huán)節(jié)都會產(chǎn)生大量的數(shù)據(jù)。根據(jù)NatureBiotechnology發(fā)表的一篇論文,藥物研發(fā)過程中產(chǎn)生的數(shù)據(jù)量已經(jīng)遠遠超過了天文學、基因組學等領域。該論文中提到,到2020年,全球每年產(chǎn)生的生物醫(yī)學數(shù)據(jù)量已經(jīng)達到2.8ZB,其中大部分是藥物研發(fā)產(chǎn)生的數(shù)據(jù)。(4)智能可穿戴設備帶來的健康管理數(shù)據(jù)。隨著移動設備和移動互聯(lián)網(wǎng)的飛速發(fā)展,便攜式的可穿戴醫(yī)療設備正在普及。各種智能可穿戴設備的出現(xiàn),使得血壓、心率、體重、體脂、血糖、心電圖等健康體征數(shù)據(jù)的監(jiān)測都變?yōu)榭赡?,個體健康信息都可以直接連入互聯(lián)網(wǎng)。除健康體征數(shù)據(jù)外,還有其他智能設備收集的健康行為數(shù)據(jù),如每天的卡路里攝入量、喝水量、步行數(shù)、運動時間、睡眠時間等。由此將實現(xiàn)對個人健康管理數(shù)據(jù)隨時隨地的采集,而帶來的數(shù)據(jù)量將更是不可估量的。2.2.2醫(yī)療大數(shù)據(jù)有什么特性?1.大數(shù)據(jù)的特性規(guī)模巨大的臨床試驗數(shù)據(jù)、疾病診斷數(shù)據(jù)及居民健康管理數(shù)據(jù)等匯聚在一起所形成的醫(yī)療大數(shù)據(jù),已然呈現(xiàn)出其作為大數(shù)據(jù)的特性。(1)數(shù)據(jù)規(guī)模大。一張CT影像含有大約150MB的數(shù)據(jù),而一個基因組序列文件的大小約為750MB,一張標準的病理圖則大得多,接近5GB。(2)數(shù)據(jù)增長快速。一方面,醫(yī)療信息服務包含大量在線或?qū)崟r數(shù)據(jù)的分析處理,如臨床決策支持中的診斷和用藥建議、流行病分析報表生成、健康指標預警等;另一方面,得益于信息技術(shù)的發(fā)展,越來越多的醫(yī)療信息被數(shù)字化,而未來,醫(yī)療健康領域數(shù)據(jù)的增長速度還將更快。(3)數(shù)據(jù)價值巨大。毋庸置疑,數(shù)據(jù)是資源,是資產(chǎn)。醫(yī)療大數(shù)據(jù)與每個人的個人生活息息相關(guān),對這些數(shù)據(jù)的有效利用更關(guān)系到國家乃至全球的疾病防控、新藥研發(fā)和頑疾攻克的能力。2.醫(yī)療大數(shù)據(jù)將有的特性除大數(shù)據(jù)所具有的特性外,醫(yī)療大數(shù)據(jù)還具有多態(tài)性、不完整性、時間性及冗余性等醫(yī)療領域特有的一些特性。(1)多態(tài)性。醫(yī)療大數(shù)據(jù)包括純數(shù)據(jù)(如體檢結(jié)果、化驗結(jié)果)、信號(如腦電信號、心電信號等)、影像(如CT影像、MRI影像等)、文字(如主訴、現(xiàn)病史、既往史、過敏史、檢測報告等),以及用于科普、咨詢的動畫、語音和視頻信息等多種形態(tài)的數(shù)據(jù),這是區(qū)別于其他領域數(shù)據(jù)的最顯著特性。(2)不完整性。醫(yī)療數(shù)據(jù)的搜集和處理過程經(jīng)常相互脫節(jié),這使得醫(yī)療數(shù)據(jù)庫不可能對任何疾病信息都能全面反映。大量數(shù)據(jù)來源于人工記錄,導致數(shù)據(jù)記錄的偏差和殘缺,許多數(shù)據(jù)的表達、記錄本身也具有不確定性,病例和病案尤為突出。這些都造成了醫(yī)療大數(shù)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論