醫(yī)療大模型語(yǔ)料一體機(jī)應(yīng)用指南_第1頁(yè)
醫(yī)療大模型語(yǔ)料一體機(jī)應(yīng)用指南_第2頁(yè)
醫(yī)療大模型語(yǔ)料一體機(jī)應(yīng)用指南_第3頁(yè)
醫(yī)療大模型語(yǔ)料一體機(jī)應(yīng)用指南_第4頁(yè)
醫(yī)療大模型語(yǔ)料一體機(jī)應(yīng)用指南_第5頁(yè)
已閱讀5頁(yè),還剩14頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

Q/LB.□XXXXX-XXXXT/XXXXXXX—XXXX醫(yī)療大模型語(yǔ)料一體機(jī)應(yīng)用指南范圍本文件規(guī)定了醫(yī)療大模型語(yǔ)料一體機(jī)的能力要求,包括系統(tǒng)框架、應(yīng)用場(chǎng)景能力、軟硬件配置、語(yǔ)料配置等內(nèi)容。本文件適用于醫(yī)療大模型語(yǔ)料一體機(jī)的研發(fā)、配置、維護(hù)、采購(gòu)等工作。規(guī)范性引用文件下列文件中的內(nèi)容通過(guò)文中的規(guī)范性引用而構(gòu)成本文件必不可少的條款。其中,注日期的引用文件,僅該日期對(duì)應(yīng)的版本適用于本文件;不注日期的引用文件,其最新版本(包括所有的修改單)適用于本文件。GB/T41867-2022信息技術(shù)人工智能術(shù)語(yǔ)術(shù)語(yǔ)和定義GB/T41867-2022界定的術(shù)語(yǔ)和定義適用于本文件。醫(yī)療大模型語(yǔ)料一體機(jī)medical

largemodelintegratedmachine專(zhuān)門(mén)為醫(yī)療領(lǐng)域設(shè)計(jì)的高性能計(jì)算設(shè)備,以一體機(jī)服務(wù)器形式存在。醫(yī)療大模型largemedicalmodel基于深度學(xué)習(xí)等AI技術(shù),針對(duì)醫(yī)療領(lǐng)域特定問(wèn)題(如疾病診斷、藥物研發(fā)等)訓(xùn)練而成的大型神經(jīng)網(wǎng)絡(luò)模型,具備處理和分析復(fù)雜醫(yī)療數(shù)據(jù),提供精準(zhǔn)醫(yī)療決策支持等能力。醫(yī)療語(yǔ)料庫(kù)medicalCorpus醫(yī)療領(lǐng)域相關(guān)文本、圖片、音頻、視頻等數(shù)據(jù)的集合,可用于訓(xùn)練和優(yōu)化醫(yī)療大模型,以提升其在醫(yī)療領(lǐng)域的應(yīng)用效果。臨床決策支持clinicaldecisionsupport基于大量患者數(shù)據(jù),使用醫(yī)療大模型,為醫(yī)生提供診斷和治療建議的智能代理,旨在輔助醫(yī)生作出更加精準(zhǔn)和科學(xué)的醫(yī)療決策。算力動(dòng)態(tài)分配DynamicComputingPowerAllocation根據(jù)醫(yī)療大模型的實(shí)時(shí)需求和系統(tǒng)負(fù)載情況,動(dòng)態(tài)調(diào)整算力資源分配的智能化策略,以確保系統(tǒng)在高負(fù)載情況下仍能穩(wěn)定運(yùn)行,并可優(yōu)先處理關(guān)鍵任務(wù)。縮略語(yǔ)AEs:醫(yī)療不良事件(AdverseEvents)AI:人工智能(ArtificialIntelligence)API:應(yīng)用程序編程接口(ApplicationProgrammingInterface)ASR

:自動(dòng)語(yǔ)音識(shí)別(AutomaticSpeechRecognition)DICOM:醫(yī)學(xué)數(shù)字成像和通信(DigitalImagingandCommunicationsinMedicine)FPS:每秒幀數(shù)(FramesPerSecond)GPU:圖形處理單元(GraphicsProcessingUnit)IDE:集成開(kāi)發(fā)環(huán)境(IntegratedDevelopmentEnvironment)NIfTI:神經(jīng)影像信息學(xué)技術(shù)倡議(NeuroimagingInformaticsTechnologyInitiative)NPU:神經(jīng)網(wǎng)絡(luò)處理單元(NeuralProcessingUnit)SAEs:嚴(yán)重不良事件(SeverityAdverseEvents)TOPS:每秒萬(wàn)億次操作(TeraOperationsPerSecond)TPU:張量處理單元(TensorProcessingUnit)系統(tǒng)框架醫(yī)療大模型語(yǔ)料一體機(jī)通過(guò)集成醫(yī)療應(yīng)用區(qū)、醫(yī)療模型區(qū)、算力區(qū)、醫(yī)療語(yǔ)料區(qū)、智能體引擎區(qū)以及醫(yī)療一體機(jī)操作系統(tǒng)等關(guān)鍵功能模塊,實(shí)現(xiàn)醫(yī)療資源的優(yōu)化配置和醫(yī)療服務(wù)的高效提供。系統(tǒng)遵循實(shí)用性、可靠性、安全性、可擴(kuò)展性原則,確保設(shè)備安全、網(wǎng)絡(luò)安全及數(shù)據(jù)安全,并通過(guò)定時(shí)數(shù)據(jù)備份保障系統(tǒng)穩(wěn)定運(yùn)行。一體機(jī)總體功能宜按照“1+5”架構(gòu)部署,包括1個(gè)一體機(jī)操作系統(tǒng),醫(yī)療應(yīng)用區(qū)、模型區(qū)、智能體區(qū)、醫(yī)療語(yǔ)料區(qū)、算力區(qū)等5個(gè)功能區(qū),具體內(nèi)容如下圖所示:圖1醫(yī)療大模型語(yǔ)料一體機(jī)架構(gòu)圖一體機(jī)功能概述具體如下:醫(yī)療應(yīng)用區(qū):提供一系列與醫(yī)療相關(guān)的功能模塊,包括但不限于常見(jiàn)疾病/慢性疾病診斷、醫(yī)學(xué)知識(shí)科普、康復(fù)養(yǎng)老輔助、復(fù)雜疾病輔助診斷、診療流程優(yōu)化、藥物作用分析、疾病監(jiān)控與分析、醫(yī)學(xué)知識(shí)圖譜、文獻(xiàn)綜述生成等。模型區(qū):包含基礎(chǔ)模型、垂類(lèi)模型。算力區(qū):配置多種AI加速卡及其適配引擎。智能體區(qū):集成規(guī)劃引擎、工具引擎、執(zhí)行引擎、記憶引擎等關(guān)鍵組件。醫(yī)療語(yǔ)料區(qū):包括多個(gè)醫(yī)療語(yǔ)料庫(kù)、向量數(shù)據(jù)庫(kù)以及語(yǔ)料清洗、標(biāo)注工具。醫(yī)療一體機(jī)操作系統(tǒng):包括醫(yī)療模型管理、引擎調(diào)度、智能體管理、應(yīng)用管理、語(yǔ)料管理、算力調(diào)度管理及集群管理等模塊。應(yīng)用分類(lèi)和能力要求參考國(guó)家衛(wèi)健委《衛(wèi)生健康行業(yè)人工智能應(yīng)用場(chǎng)景參考指引》的內(nèi)容,以及醫(yī)療應(yīng)用本身復(fù)雜程度,將醫(yī)療大模型語(yǔ)料一體機(jī)的應(yīng)用分為一類(lèi)應(yīng)用、二類(lèi)應(yīng)用以及三類(lèi)應(yīng)用,本章對(duì)應(yīng)用的能力要求進(jìn)行解釋。一類(lèi)應(yīng)用6.1.1診療輔助應(yīng)具備根據(jù)患者癥狀、體檢結(jié)果和實(shí)驗(yàn)室數(shù)據(jù)提供初步診斷的能力;應(yīng)具備輔助醫(yī)生制定個(gè)性化治療方案的能力;應(yīng)具備實(shí)時(shí)更新醫(yī)學(xué)知識(shí),以提供最新的診療建議。6.1.2醫(yī)院管理應(yīng)具備輔助優(yōu)化醫(yī)院資源分配,提高醫(yī)療服務(wù)效率的能力;應(yīng)具備根據(jù)醫(yī)院運(yùn)營(yíng)數(shù)據(jù)輔助決策制定的能力;應(yīng)具備提供改善患者就醫(yī)流程建議的能力。6.1.3健康管理應(yīng)具備跟蹤個(gè)人健康數(shù)據(jù),提供健康風(fēng)險(xiǎn)評(píng)估的能力;應(yīng)具備根據(jù)個(gè)人健康狀況提供定制化的健康建議和干預(yù)措施。6.1.4養(yǎng)老托育服務(wù)應(yīng)具備為老年人和兒童提供個(gè)性化護(hù)理計(jì)劃的能力;應(yīng)具備根據(jù)老年人和兒童的健康狀況數(shù)據(jù),及時(shí)預(yù)警健康風(fēng)險(xiǎn);應(yīng)具備提供心理支持和社交互動(dòng),增強(qiáng)老年人和兒童的生活質(zhì)量。二類(lèi)應(yīng)用二類(lèi)應(yīng)用包括臨床專(zhuān)病輔助決策、基層全科醫(yī)生輔助決策、公共衛(wèi)生服務(wù)、臨床用藥輔助、藥物研發(fā)、中醫(yī)中藥輔助等應(yīng)用。6.2.1臨床專(zhuān)病輔助決策應(yīng)具備針對(duì)特定疾病提供深入的臨床知識(shí)支持的能力;應(yīng)具備輔助醫(yī)生進(jìn)行復(fù)雜病例分析和治療方案選擇的能力。6.2.2基層全科醫(yī)生輔助決策應(yīng)具備提供全面的基層醫(yī)療服務(wù)知識(shí)的能力;應(yīng)具備輔助全科醫(yī)生進(jìn)行常見(jiàn)病和多發(fā)病的診斷和治療建議。6.2.3公共衛(wèi)生服務(wù)應(yīng)具備根據(jù)公共衛(wèi)生數(shù)據(jù)預(yù)測(cè)疾病流行趨勢(shì)的能力;應(yīng)具備制定和實(shí)施公共衛(wèi)生干預(yù)措施的能力;應(yīng)具備提供公共衛(wèi)生教育和健康促進(jìn)知識(shí)的能力。6.2.4臨床用藥輔助應(yīng)具備藥物信息查詢和藥物相互作用分析的能力;應(yīng)具備輔助醫(yī)生進(jìn)行藥物劑量調(diào)整和用藥指導(dǎo)的能力;應(yīng)具備根據(jù)患者用藥反應(yīng)及時(shí)調(diào)整治療方案的能力。6.2.5藥物研發(fā)應(yīng)具備藥物設(shè)計(jì)和篩選的輔助能力;應(yīng)具備藥物效果預(yù)測(cè)和副作用評(píng)估的能力;應(yīng)具備臨床試驗(yàn)設(shè)計(jì)和數(shù)據(jù)分析的能力。6.2.6中醫(yī)中藥輔助應(yīng)具備中醫(yī)理論學(xué)習(xí)和應(yīng)用的能力;應(yīng)具備中藥方劑配伍和調(diào)整建議的能力;應(yīng)具備中醫(yī)診斷和治療建議的能力。三類(lèi)應(yīng)用三類(lèi)應(yīng)用包括醫(yī)學(xué)影像輔助診斷、手術(shù)輔助規(guī)劃、醫(yī)學(xué)教學(xué)、醫(yī)學(xué)科研等應(yīng)用。6.3.1醫(yī)學(xué)影像輔助診斷應(yīng)具備醫(yī)學(xué)影像的輔助識(shí)別和分析能力;應(yīng)具備輔助醫(yī)生進(jìn)行疾病診斷和病情評(píng)估的能力;6.3.2手術(shù)輔助規(guī)劃應(yīng)具備輔助手術(shù)方案設(shè)計(jì)和風(fēng)險(xiǎn)評(píng)估的能力;應(yīng)具備手術(shù)過(guò)程中的實(shí)時(shí)輔助和建議能力;應(yīng)具備制定術(shù)后恢復(fù)和并發(fā)癥預(yù)防規(guī)劃的能力。6.3.3醫(yī)學(xué)教學(xué)應(yīng)具備提供醫(yī)學(xué)教育資源和模擬訓(xùn)練的能力;應(yīng)具備輔助醫(yī)學(xué)生和醫(yī)生進(jìn)行專(zhuān)業(yè)知識(shí)學(xué)習(xí)的能力;應(yīng)具備評(píng)估學(xué)習(xí)效果和提供個(gè)性化教學(xué)建議的能力。6.3.4醫(yī)學(xué)科研應(yīng)具備醫(yī)學(xué)文獻(xiàn)檢索和分析的能力。應(yīng)具備輔助科研設(shè)計(jì)和實(shí)驗(yàn)方法建議的能力。模型要求基礎(chǔ)模型選型要求本節(jié)對(duì)醫(yī)療大模型語(yǔ)料一體機(jī)大模型選型進(jìn)行要求,包括性能與指標(biāo)、自然語(yǔ)言處理、知識(shí)儲(chǔ)備、價(jià)值對(duì)齊、安全與可靠性等方面。7.1.1模型基礎(chǔ)能力要求模型應(yīng)具備自然語(yǔ)言理解、知識(shí)推理、文本生成、跨語(yǔ)言處理、跨模態(tài)理解、跨模態(tài)生成等方面能力,其能力宜通過(guò)行業(yè)公認(rèn)的測(cè)評(píng)集測(cè)試;7.1.2長(zhǎng)文本處理能力要求模型應(yīng)能處理8k以上的文本輸入,宜能夠處理32k的連續(xù)文本輸入。7.1.3多模態(tài)數(shù)據(jù)處理能力要求模型應(yīng)能同時(shí)處理圖像數(shù)據(jù)(X射線圖像、CT圖像、MRI圖像、超聲圖像、病理切片圖像等)、文本數(shù)據(jù)(電子病歷、醫(yī)生診斷報(bào)告、醫(yī)學(xué)文獻(xiàn)等)、實(shí)驗(yàn)室檢查數(shù)據(jù)、基因數(shù)據(jù)、音頻數(shù)據(jù)(醫(yī)患溝通音頻、心音、肺音等)、視頻數(shù)據(jù)等多模態(tài)數(shù)據(jù)。7.1.4參數(shù)規(guī)模要求一類(lèi)應(yīng)用宜使用不大于13B參數(shù)的稠密模型或使用混合專(zhuān)家模型激活總參數(shù)在13B及以下;二類(lèi)應(yīng)用宜使用13B-30B參數(shù)的稠密模型或使用混合專(zhuān)家模型激活總參數(shù)在13B-30B;三類(lèi)應(yīng)用宜使用30B-72B參數(shù)的稠密模型或使用混合專(zhuān)家模型激活總參數(shù)在30B-72B;7.1.5性能與指標(biāo)要求在標(biāo)準(zhǔn)硬件配置下平均響應(yīng)時(shí)間應(yīng)小于500ms;在標(biāo)準(zhǔn)硬件配置下文本生成速度不小于10tokens/s;垂類(lèi)模型選型要求7.2.1專(zhuān)業(yè)性要求行業(yè)大模型應(yīng)根據(jù)醫(yī)療領(lǐng)域設(shè)計(jì),具備醫(yī)療知識(shí)問(wèn)答、醫(yī)學(xué)文本分類(lèi)、醫(yī)學(xué)信息抽取、醫(yī)學(xué)自然語(yǔ)言推理、醫(yī)學(xué)內(nèi)容生成、醫(yī)學(xué)多模態(tài)數(shù)據(jù)處理等能力,其能力宜通過(guò)行業(yè)公認(rèn)的測(cè)評(píng)集測(cè)試;7.2.2精準(zhǔn)性要求針對(duì)于醫(yī)療場(chǎng)景下的問(wèn)題,行業(yè)大模型應(yīng)提供更精準(zhǔn)的問(wèn)題解決方案,準(zhǔn)確率不低于95%;在醫(yī)療任務(wù)上的處理效率應(yīng)高于基礎(chǔ)大模型;應(yīng)能理解醫(yī)療行業(yè)特有術(shù)語(yǔ)和上下文;7.2.3知識(shí)庫(kù)更新要求應(yīng)支持根據(jù)具體業(yè)務(wù)需求進(jìn)行調(diào)整和優(yōu)化;應(yīng)該支持持續(xù)學(xué)習(xí),隨行業(yè)發(fā)展不斷更新知識(shí)庫(kù);7.2.4價(jià)值對(duì)齊要求生成的內(nèi)容應(yīng)符合公認(rèn)的醫(yī)療道德倫理規(guī)范和法律規(guī)定;生成的內(nèi)容應(yīng)符合社會(huì)主流價(jià)值觀,不得對(duì)某些社會(huì)群體產(chǎn)生不利影響;智能體要求智能體區(qū)應(yīng)具備智能體引擎和智能體開(kāi)發(fā)功能,要求如下:智能體引擎:應(yīng)具備規(guī)劃引擎、工具引擎、執(zhí)行引擎、記憶引擎功能。記憶引擎應(yīng)支持向量數(shù)據(jù)庫(kù)及外部數(shù)據(jù)訪問(wèn);智能體開(kāi)發(fā):應(yīng)支持低代碼或無(wú)代碼開(kāi)發(fā)智能體功能。語(yǔ)料要求語(yǔ)料對(duì)象與范疇醫(yī)療大模型語(yǔ)料一體機(jī)語(yǔ)料應(yīng)包含醫(yī)療通識(shí)語(yǔ)料、醫(yī)療行業(yè)知識(shí)語(yǔ)料、醫(yī)療臨床數(shù)據(jù)三部分,補(bǔ)充內(nèi)容可參見(jiàn)附錄。醫(yī)療通識(shí)語(yǔ)料要求醫(yī)療通識(shí)語(yǔ)料應(yīng)包括醫(yī)療領(lǐng)域的相關(guān)知識(shí),包括基礎(chǔ)醫(yī)學(xué)、臨床醫(yī)學(xué)、保健醫(yī)學(xué)、康復(fù)醫(yī)學(xué)、理療學(xué)、麻醉學(xué)、內(nèi)科學(xué)等,具體醫(yī)療領(lǐng)域詳見(jiàn)附錄A。醫(yī)療通識(shí)語(yǔ)料應(yīng)包含但不限于如下部分內(nèi)容,部分?jǐn)?shù)據(jù)源詳見(jiàn)附錄B:書(shū)籍:包括國(guó)內(nèi)外權(quán)威出版社獲取的醫(yī)療健康領(lǐng)域教科書(shū),及其他高質(zhì)量生命健康相關(guān)書(shū)籍。期刊論文:包括國(guó)內(nèi)外知名期刊或者從權(quán)威數(shù)字出版平臺(tái)獲取的醫(yī)療健康領(lǐng)域的學(xué)術(shù)論文。數(shù)據(jù)庫(kù):包括從醫(yī)學(xué)數(shù)據(jù)庫(kù)獲取的臨床試驗(yàn)、人類(lèi)疾病、基因序列、蛋白質(zhì)序列和功能信息、藥物藥理藥效等數(shù)據(jù)。知識(shí)庫(kù):包括從醫(yī)學(xué)知識(shí)庫(kù)中獲取的生物、疾病和基因等多維度之間的關(guān)聯(lián)知識(shí)數(shù)據(jù)。專(zhuān)利:包括從專(zhuān)利搜索引擎檢索得到的醫(yī)療健康領(lǐng)域的專(zhuān)利正文。循證醫(yī)學(xué)知識(shí)庫(kù):包括用于支持臨床決策、疾病預(yù)防、治療方案選擇和健康管理等信息,通過(guò)整合和分析大量的醫(yī)學(xué)研究數(shù)據(jù)和臨床實(shí)踐經(jīng)驗(yàn)構(gòu)建的循證醫(yī)學(xué)結(jié)構(gòu)化知識(shí)庫(kù)。臨床指南:包括官方機(jī)構(gòu)發(fā)布的關(guān)于某個(gè)疾病和專(zhuān)科領(lǐng)域內(nèi)容有關(guān)診斷、管理和治療的決策標(biāo)準(zhǔn)的文檔。藥品數(shù)據(jù)庫(kù):包括藥品的名稱(chēng)、成分、適應(yīng)癥、用法用量、不良反應(yīng)、藥物間相互作用、注意事項(xiàng)等信息的數(shù)據(jù)庫(kù)。醫(yī)療器械資料:如醫(yī)療設(shè)備的使用說(shuō)明書(shū)、操作手冊(cè)等,包括常見(jiàn)的診斷設(shè)備(如心電圖機(jī)、血糖儀等)和治療設(shè)備(如呼吸機(jī)、除顫儀等)的相關(guān)資料。專(zhuān)家共識(shí):包括由特定領(lǐng)域具有專(zhuān)業(yè)知識(shí)和經(jīng)驗(yàn)的專(zhuān)家共同討論、協(xié)商達(dá)成的統(tǒng)一意見(jiàn)或建議,一般發(fā)表于高水平的期刊論文中。中醫(yī)學(xué)典籍:包括中醫(yī)領(lǐng)域的經(jīng)典著作。藥材藥方:包括經(jīng)典中藥書(shū)籍中記錄的歷代中醫(yī)方劑,包括方劑的組成、用法、主治病癥等。相關(guān)法律法規(guī):收集國(guó)家和地方關(guān)于社區(qū)醫(yī)療的政策、指南和標(biāo)準(zhǔn),尤其是一些涉及醫(yī)療報(bào)銷(xiāo)方面的信息。健康宣教材料:涵蓋各類(lèi)健康教育和預(yù)防知識(shí),如疾病預(yù)防、健康生活方式等。其他結(jié)構(gòu)化數(shù)據(jù):包括疾病對(duì)應(yīng)的癥狀列表、疾病對(duì)應(yīng)的藥品列表、藥品通用名說(shuō)明書(shū)、癥狀的通俗叫法,同義詞等。醫(yī)療行業(yè)知識(shí)語(yǔ)料要求醫(yī)療行業(yè)知識(shí)語(yǔ)料應(yīng)包含但不限于如下部分內(nèi)容:專(zhuān)科專(zhuān)病數(shù)據(jù):結(jié)合醫(yī)療管理部門(mén)重點(diǎn)監(jiān)測(cè)的單病種(單病種清單詳見(jiàn)附錄C)形成的人工智能基地的行業(yè)專(zhuān)科專(zhuān)病語(yǔ)料集,賦能后續(xù)的臨床研究、臨床決策支持、醫(yī)院運(yùn)營(yíng)管理和患者管理等方面。醫(yī)學(xué)數(shù)據(jù)庫(kù):包含了海量的醫(yī)學(xué)文獻(xiàn)資源的權(quán)威醫(yī)學(xué)數(shù)據(jù)庫(kù)。醫(yī)學(xué)知識(shí)圖譜:醫(yī)學(xué)知識(shí)圖譜以圖結(jié)構(gòu)的形式表示醫(yī)學(xué)領(lǐng)域的知識(shí),包括疾病、癥狀、藥物、治療等實(shí)體以及它們之間的關(guān)系。醫(yī)療臨床數(shù)據(jù)要求醫(yī)療臨床數(shù)據(jù)應(yīng)包含但不限于如下部分內(nèi)容:電子病歷:包括針對(duì)個(gè)體的醫(yī)院門(mén)診、住院形成的電子病歷,含診斷、實(shí)驗(yàn)室檢驗(yàn)數(shù)據(jù)、影像檢查報(bào)告、治療方案等內(nèi)容。醫(yī)療住院數(shù)據(jù):包含入出院業(yè)務(wù)、轉(zhuǎn)科記錄業(yè)務(wù)、藥品醫(yī)囑業(yè)務(wù)、住院非藥品醫(yī)囑業(yè)務(wù)、住院費(fèi)用業(yè)務(wù)、住院費(fèi)用分類(lèi)業(yè)務(wù)、住院發(fā)票業(yè)務(wù)、住院退藥記錄等內(nèi)容。研發(fā)階段臨床試驗(yàn)數(shù)據(jù):記錄受試者在接受藥物治療期間發(fā)生的任何不良事件(AEs),以及嚴(yán)重不良事件(SAEs)。評(píng)估藥物達(dá)到預(yù)定療效指標(biāo)的情況,如緩解率、生存期延長(zhǎng)等。藥物在體內(nèi)吸收、分布、代謝和排泄的過(guò)程,以及藥物對(duì)機(jī)體的作用強(qiáng)度隨時(shí)間變化的關(guān)系。語(yǔ)料管理要求醫(yī)療通識(shí)語(yǔ)料應(yīng)至少每年更新一次;醫(yī)療行業(yè)知識(shí)語(yǔ)料至少半年更新一次;醫(yī)療臨床語(yǔ)料至少每月更新一次;語(yǔ)料庫(kù)應(yīng)存在定期審核和更新機(jī)制,可移除已被證偽的信息,保證語(yǔ)料庫(kù)的準(zhǔn)確性和完整性;語(yǔ)料數(shù)據(jù)應(yīng)以知識(shí)塊、知識(shí)對(duì)、三元組、知識(shí)圖譜等的方式存在;語(yǔ)料數(shù)據(jù)應(yīng)具有規(guī)范性、一致性、完整性、及時(shí)性、準(zhǔn)確性、有效性和及時(shí)性;語(yǔ)料數(shù)據(jù)應(yīng)遵從數(shù)據(jù)安全管理的相關(guān)法律法規(guī)、標(biāo)準(zhǔn)以及合同約定等,并不得損害國(guó)家利益、社會(huì)公共利益和他人合法權(quán)益;語(yǔ)料數(shù)據(jù)應(yīng)具有正確的價(jià)值導(dǎo)向,符合科技倫理和社會(huì)道德。語(yǔ)料工具鏈選型要求語(yǔ)料工具鏈選型要根據(jù)工具功能的不同屬性,分為清洗工具選型規(guī)范與標(biāo)注工具選型規(guī)范兩部分。9.6.1清洗工具選型要求9.6.1.1文本數(shù)據(jù)清洗工具文本數(shù)據(jù)清洗工具功能要求如下:應(yīng)具備對(duì)醫(yī)療文檔進(jìn)行格式標(biāo)準(zhǔn)化處理的能力;應(yīng)具備獲取醫(yī)療文檔基本信息,并進(jìn)行標(biāo)簽記錄的能力;應(yīng)具備識(shí)別醫(yī)療文檔語(yǔ)言類(lèi)型并進(jìn)行標(biāo)記的功能;應(yīng)具備清除轉(zhuǎn)換后醫(yī)療文本中無(wú)關(guān)信息的能力;應(yīng)具備檢測(cè)醫(yī)療文檔敏感數(shù)據(jù),并確保其符合隱私保護(hù)標(biāo)準(zhǔn)的能力。9.6.1.2視頻數(shù)據(jù)清洗工具視頻數(shù)據(jù)清洗工具功能要求如下:應(yīng)具備自動(dòng)獲取醫(yī)療視頻文件的幀率(fps)、時(shí)長(zhǎng)(duration)等信息的功能;應(yīng)具備使用算法模型自動(dòng)根據(jù)參數(shù)切分醫(yī)療視頻鏡頭的功能;應(yīng)具備使用算法與模型抽取醫(yī)療視頻文字信息,并提取音頻內(nèi)容轉(zhuǎn)換為文字信息的功能;應(yīng)支持自動(dòng)抽取醫(yī)療視頻中的關(guān)鍵幀,或根據(jù)邏輯判定抽取關(guān)鍵幀的功能;應(yīng)支持自動(dòng)識(shí)別醫(yī)療視頻中的單幀水印,并在相應(yīng)的幀數(shù)上進(jìn)行標(biāo)記記錄的功能。9.6.1.3圖片數(shù)據(jù)清洗工具圖片數(shù)據(jù)清洗工具功能要求如下:應(yīng)具備使用算法與模型抽取醫(yī)療圖片文字信息,或?qū)D片進(jìn)行醫(yī)療領(lǐng)域描述;應(yīng)具備使用深度學(xué)習(xí)模型對(duì)醫(yī)療圖像進(jìn)行分類(lèi),以區(qū)分不同的疾病類(lèi)型;應(yīng)具備使用算法與模型,在醫(yī)學(xué)圖像中識(shí)別并分割出所需區(qū)域的功能。9.6.1.4音頻數(shù)據(jù)清洗工具音頻數(shù)據(jù)清洗工具功能要求如下:應(yīng)具備對(duì)醫(yī)療音頻進(jìn)行ASR處理,并生成文本數(shù)據(jù)的能力;應(yīng)具備獲取醫(yī)療音頻基本信息,并進(jìn)行標(biāo)簽記錄的能力;應(yīng)具備識(shí)別醫(yī)療音頻語(yǔ)言類(lèi)型并進(jìn)行標(biāo)記的功能;應(yīng)具備清除轉(zhuǎn)換后醫(yī)療音頻中無(wú)關(guān)信息的能力;應(yīng)具備檢測(cè)醫(yī)療文檔敏感數(shù)據(jù),并確保其符合隱私保護(hù)標(biāo)準(zhǔn)的能力。9.6.2標(biāo)注工具能力要求標(biāo)注工具應(yīng)當(dāng)具備以下人工標(biāo)注能力:應(yīng)提供針對(duì)各個(gè)數(shù)據(jù)模態(tài)的數(shù)據(jù)標(biāo)注功能,包括文本、圖片、音頻、視頻等;宜提供標(biāo)注工具支持醫(yī)療領(lǐng)域的特殊數(shù)據(jù)要求,包括DICOM、NIfTI等格式。9.6.2.1文本數(shù)據(jù)標(biāo)注工具文本數(shù)據(jù)標(biāo)注工具應(yīng)具備文選區(qū)、工具區(qū)、標(biāo)簽區(qū)。標(biāo)注工具功能要求如下::支持針對(duì)醫(yī)療文本的主題分類(lèi)預(yù)標(biāo)注、情感傾向預(yù)標(biāo)注、關(guān)鍵詞提取預(yù)標(biāo)注、實(shí)體鏈接預(yù)標(biāo)注、語(yǔ)義角色預(yù)標(biāo)注等功能;支持多語(yǔ)種;數(shù)據(jù)導(dǎo)出格式多樣;支持基于插件的擴(kuò)展性(可選項(xiàng))。9.6.2.2圖像數(shù)據(jù)標(biāo)注工具圖像數(shù)據(jù)標(biāo)注工具應(yīng)具備畫(huà)選區(qū)、工具區(qū)、標(biāo)簽區(qū);標(biāo)注工具應(yīng)支持針對(duì)醫(yī)療圖片的目標(biāo)檢測(cè)預(yù)標(biāo)注、場(chǎng)景識(shí)別預(yù)標(biāo)注、圖像質(zhì)量評(píng)估預(yù)標(biāo)注等功能。9.6.2.3視頻數(shù)據(jù)標(biāo)注工具視頻數(shù)據(jù)標(biāo)注工具應(yīng)具備視頻選區(qū)、工具區(qū)、標(biāo)簽區(qū);標(biāo)注工具應(yīng)支持針對(duì)醫(yī)療視頻的鏡頭分割預(yù)標(biāo)注、關(guān)鍵幀提取預(yù)標(biāo)注、行為識(shí)別預(yù)標(biāo)注等功能。9.6.2.4音頻數(shù)據(jù)標(biāo)注工具音頻數(shù)據(jù)標(biāo)注工具應(yīng)具備音頻選區(qū)、工具區(qū)、標(biāo)簽區(qū)標(biāo)注工具應(yīng)具備支持針對(duì)醫(yī)療音頻的聲音事件檢測(cè)預(yù)標(biāo)注、語(yǔ)音識(shí)別預(yù)標(biāo)注(方言)、語(yǔ)音識(shí)別預(yù)標(biāo)注(外語(yǔ))、音頻信號(hào)源分離預(yù)標(biāo)注、語(yǔ)調(diào)模式識(shí)別預(yù)標(biāo)注等功能。向量數(shù)據(jù)庫(kù)選型要求向量數(shù)據(jù)庫(kù)提供語(yǔ)料向量形式存儲(chǔ),要求如下:應(yīng)支持多種向量類(lèi)型,能夠存儲(chǔ)和處理多種類(lèi)型的向量數(shù)據(jù);應(yīng)具備向量索引機(jī)制,應(yīng)支持快速的相似性檢索和范圍查詢;應(yīng)提供查詢功能;應(yīng)提供API接口,支持多種編程語(yǔ)言和框架;應(yīng)提供數(shù)據(jù)加密功能與訪問(wèn)控制機(jī)制;數(shù)據(jù)庫(kù)應(yīng)提供數(shù)據(jù)備份和恢復(fù)機(jī)制。應(yīng)支持不少于100W向量規(guī)模;應(yīng)提供不多于300ms返回速度。算力要求一體機(jī)硬件配置要求可分為智能算力配置要求、普通算力配置要求以及算力分配和調(diào)度要求。具體分類(lèi)如下圖所示:智能算力配置要求智能算力提供AI加速能力,包括GPU、NPU、TPU等架構(gòu),其配置要求如下:(a)使用稠密模型參數(shù)在13B及以下或使用混合專(zhuān)家模型激活總參數(shù)在13B及以下,并發(fā)請(qǐng)求數(shù)不大于5,F(xiàn)P16浮點(diǎn)總算力宜不低于280(TFlops/s),AI加速卡總內(nèi)存宜不低于64GB,配置4張AI加速卡情況下,單卡FP16浮點(diǎn)總算力配置宜不低于70(TFlops/s),單卡內(nèi)存宜不低于16GB。 (b)使用稠密模型參數(shù)在13B以上30B及以下或使用混合專(zhuān)家模型激活總參數(shù)在13B以上30B及以下,并發(fā)請(qǐng)求數(shù)不大于10,F(xiàn)P16浮點(diǎn)總算力宜不低于640(TFlops/s),AI加速卡總內(nèi)存宜不低于96GB,配置4張AI加速卡情況下,單卡FP16浮點(diǎn)總算力配置宜不低于160(TFlops/s),單卡內(nèi)存宜不低于24GB。(c)使用稠密模型參數(shù)在30B以上72B及以下或使用混合專(zhuān)家模型激活總參數(shù)在30B以上72B及以下,并發(fā)請(qǐng)求數(shù)不大于15,F(xiàn)P16浮點(diǎn)總算力宜不低于1600(TFlops/s),AI加速卡總內(nèi)存宜不低于192GB,配置8張AI加速卡情況下,單卡FP16浮點(diǎn)總算力配置宜不低于200(TFlops/s),單卡內(nèi)存宜不低于24GB。普通算力配置要求普通算力提供通用的CPU算力,其配置要求如下:當(dāng)AI加速卡在4卡及以下時(shí),CPU核心數(shù)不宜少于24,內(nèi)存宜按照CPU核心數(shù)進(jìn)行1:4適配。當(dāng)AI加速卡在8卡及以上時(shí),CPU核心數(shù)宜不低于64,內(nèi)存宜按照CPU核心數(shù)進(jìn)行1:4適配。表1普通算力配置要求表一體機(jī)卡數(shù)配置要求4卡及以下8卡及以上CPU核心數(shù)宜不少于24宜不少于64內(nèi)存按照核心數(shù)進(jìn)行1:4適配一體機(jī)操作系統(tǒng)要求一體機(jī)操作系統(tǒng)應(yīng)配置提供對(duì)整體資源管理和調(diào)度。具體參考要求如下:應(yīng)用管理:應(yīng)支持應(yīng)用的安裝部署、啟用、停止、升級(jí)、卸載。智能體管理:應(yīng)支持智能體及引擎的安裝、升級(jí)、啟用、停用、卸載。模型管理:應(yīng)支持模型、推理引擎和微調(diào)引擎的裝載、加載、卸載。語(yǔ)料管理:應(yīng)支持提示詞、微調(diào)數(shù)據(jù)集、知識(shí)庫(kù)數(shù)據(jù)集、測(cè)評(píng)數(shù)據(jù)集的存儲(chǔ)、啟用、更新、備份、刪除功能,應(yīng)支持向量數(shù)據(jù)庫(kù)的安裝部署、啟用、停止、升級(jí)、卸載、備份。算力管理:應(yīng)支持對(duì)AI加速卡的資源分配、回收、搶占等調(diào)度功能,可依據(jù)醫(yī)療大模型的實(shí)時(shí)需求進(jìn)行動(dòng)態(tài)分配,以適應(yīng)工作負(fù)載的變化和不同的服務(wù)優(yōu)先級(jí)。高可用性能力:醫(yī)療大模型的算力分配和調(diào)度系統(tǒng)應(yīng)采用高可用性架構(gòu)。容錯(cuò)能力:系統(tǒng)應(yīng)集成容錯(cuò)機(jī)制。故障處理能力:系統(tǒng)應(yīng)在AI加速卡單點(diǎn)故障發(fā)生時(shí),對(duì)應(yīng)資源隔離。監(jiān)控能力:系統(tǒng)應(yīng)配備監(jiān)控系統(tǒng),可實(shí)時(shí)跟蹤算力資源的使用情況和系統(tǒng)性能指標(biāo)。運(yùn)維能力:應(yīng)包含定期維護(hù)和更新機(jī)制。部署環(huán)境要求機(jī)房及類(lèi)機(jī)房環(huán)境部署要求工作溫度應(yīng)保持在5℃至35℃之間。應(yīng)控制環(huán)境溫度變化率不超過(guò)20℃/小時(shí)。工作濕度應(yīng)維持在8%至90%的相對(duì)濕度范圍內(nèi)。宜控制環(huán)境濕度變化率不超過(guò)20%/小時(shí)。應(yīng)保持機(jī)房?jī)?nèi)空氣清潔,無(wú)腐蝕性氣體和過(guò)多塵埃。宜定期清潔機(jī)房,使用空氣凈化設(shè)備。應(yīng)提供穩(wěn)定、符合設(shè)備規(guī)格的電源供應(yīng),并確保良好接地。宜配備UPS和/或發(fā)電機(jī)作為備用電源。非機(jī)房及非類(lèi)機(jī)房環(huán)境部署要求工作溫度應(yīng)保持在5℃至35℃之間。應(yīng)控制環(huán)境溫度變化率不超過(guò)20℃/小時(shí)。工作濕度應(yīng)維持在8%至90%的相對(duì)濕度范圍內(nèi)。宜控制環(huán)境濕度變化率不超過(guò)20%/小時(shí)。應(yīng)保持環(huán)境通風(fēng)良好,減少有害物質(zhì)積聚。應(yīng)定期清潔設(shè)備周?chē)鷧^(qū)域,減少塵埃和污垢。應(yīng)提供穩(wěn)定、可靠的電源供應(yīng),并確保良好接地。

參考文獻(xiàn)T/SAIAS015—2024語(yǔ)料庫(kù)建設(shè)導(dǎo)則《衛(wèi)生健康行業(yè)人工智能應(yīng)用場(chǎng)景參考指引》

附錄A(資料性附錄)醫(yī)療通識(shí)語(yǔ)料醫(yī)療領(lǐng)域醫(yī)療通識(shí)語(yǔ)料應(yīng)包括醫(yī)療領(lǐng)域的相關(guān)知識(shí),包括但不限于如下領(lǐng)域知識(shí):基礎(chǔ)醫(yī)學(xué)、臨床醫(yī)學(xué)、保健醫(yī)學(xué)、康復(fù)醫(yī)學(xué)、理療學(xué)、麻醉學(xué)、內(nèi)科學(xué)、外科學(xué)、婦產(chǎn)科學(xué)、兒科學(xué)、眼科學(xué)、耳鼻咽喉科學(xué)、口腔醫(yī)學(xué)、皮膚病學(xué)、性醫(yī)學(xué)、神經(jīng)病學(xué)、精神病學(xué)、急診醫(yī)學(xué)、核醫(yī)學(xué)、腫瘤學(xué)、護(hù)理學(xué)、預(yù)防醫(yī)學(xué)與衛(wèi)生學(xué)、藥學(xué)、中醫(yī)學(xué)、民族醫(yī)學(xué)、中西醫(yī)結(jié)合醫(yī)學(xué)、生物學(xué)、生理學(xué)、遺傳學(xué)、放射生物學(xué)、分子生物學(xué)、生態(tài)學(xué)、神經(jīng)生物學(xué)、植物學(xué)、昆蟲(chóng)學(xué)、動(dòng)物學(xué)、微生物學(xué)、病毒學(xué)、人類(lèi)學(xué)、生物工程、心理學(xué);

附錄B(資料性附錄)語(yǔ)料數(shù)據(jù)源范圍醫(yī)療通識(shí)語(yǔ)料部分?jǐn)?shù)據(jù)源選取參考如下:書(shū)籍包括但不限于從人民衛(wèi)生出版社、高等教育出版社、科學(xué)出版社、Elsevier、Springer等國(guó)內(nèi)外出版社獲取的醫(yī)療健康領(lǐng)域教科書(shū),及其他高質(zhì)量生命健康相關(guān)書(shū)籍;期刊論文包括但不限于《中華醫(yī)學(xué)雜志》《中國(guó)藥學(xué)雜志》《中國(guó)公共衛(wèi)生》

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論