《醫(yī)療大數(shù)據(jù)》讀書筆記_第1頁
《醫(yī)療大數(shù)據(jù)》讀書筆記_第2頁
免費預(yù)覽已結(jié)束,剩余5頁可下載查看

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、在我國,由于國家信息化戰(zhàn)略的側(cè)重與新一輪醫(yī)療制度改革的催生,從歷史沿革角度看,醫(yī)療設(shè)備和醫(yī)療服務(wù)的信息化是被涵蓋在醫(yī)療機(jī)構(gòu)信息化之內(nèi)。結(jié)合國際上統(tǒng)一的醫(yī)療信息化劃分標(biāo)準(zhǔn)與我國特色,醫(yī)療機(jī)構(gòu)信息化由以下部分組成。1)醫(yī)院管理信息系統(tǒng)。醫(yī)院管理信息系統(tǒng),指以收費為中心,對門急診的掛號、劃價、收費、配藥,住院患者的醫(yī)囑、配藥、記賬,以及醫(yī)院的人、財、物等工作,實施計算機(jī)網(wǎng)絡(luò)管理,對由各信息點采集的數(shù)據(jù)進(jìn)行初步統(tǒng)計分析,并提供管理人員查詢、管理和決策。臨床信息系統(tǒng),指以患者為中心,使用影像存檔和傳輸系統(tǒng)(PACS)、放射信息系統(tǒng)(radiologyinformationsysteiRIS)、檢驗信息系

2、統(tǒng)(laboratoryinformationmanagementsystemLIS)、病理信息系統(tǒng)(pathologyinformationsystemPIS)、手術(shù)室信息系統(tǒng)(operatingroominformationsystemORIS)等,用來全面收集患者的臨床信息,并通過醫(yī)生工作站提供給醫(yī)生。醫(yī)生可使用電子醫(yī)囑錄入系統(tǒng)(computerizedphysicianorderentryCPOE)錄入處方、醫(yī)囑和檢查申請單,查詢檢查結(jié)果,以醫(yī)療文件“無紙化”來提高診治的“三長一短”現(xiàn)象:掛號、候診、收費隊伍長,看病時間短。電子病歷并非是患者傳統(tǒng)紙質(zhì)病歷單純的電子化,而是實現(xiàn)病歷信息的

3、采集、存儲、傳遞、表現(xiàn)和加工利用。挖掘電子病歷數(shù)據(jù),能從臨床路徑上用數(shù)據(jù)循證醫(yī)學(xué)證據(jù),建立起有關(guān)臨床治療的多種常規(guī)模式,并最終起到規(guī)范醫(yī)療行為的作用,減少變異、降低成本、提高質(zhì)量,這無疑是有重要價值的。上醫(yī)治未病之病,謂之養(yǎng)生;中醫(yī)治欲病之病,謂之保??;下醫(yī)治已病之病,謂之醫(yī)療”,醫(yī)療大數(shù)據(jù)的來源主要有以下4個方面:(1)制藥企業(yè)、生命科學(xué)藥物研發(fā)所產(chǎn)生的數(shù)據(jù)是相當(dāng)密集的,對于中小型的企業(yè)也在百億字節(jié)(TB)以上的。(2)臨床醫(yī)療、實驗室數(shù)據(jù)臨床和實驗室數(shù)據(jù)整合在一起,使得醫(yī)療機(jī)構(gòu)面臨的數(shù)據(jù)增長非常快,一張普通CT圖像含有大約150MB的數(shù)據(jù),一個標(biāo)準(zhǔn)的病理圖則接近5GB。(3)費用、醫(yī)療保險

4、、利用率患者就醫(yī)過程中產(chǎn)生的費用信息、報銷信息、新農(nóng)合基金使用情況等。(4)健康管理、社交網(wǎng)絡(luò)隨著移動設(shè)備和移動互聯(lián)網(wǎng)的飛速發(fā)展,便攜化的生理設(shè)備正在普及,如果個體健康信息都能連入互聯(lián)網(wǎng),那么由此產(chǎn)生的數(shù)據(jù)量將不可估量。醫(yī)院信息系統(tǒng)(HIS)數(shù)據(jù)、檢驗信息系統(tǒng)(LIS)數(shù)據(jù)、醫(yī)學(xué)影像存檔和傳輸系統(tǒng)(PACS)數(shù)據(jù)和電子病歷(EMR)數(shù)據(jù)。HIS是醫(yī)院的核心系統(tǒng),是對醫(yī)院及其所屬各部門的人流、物流、財流進(jìn)行綜合管理的系統(tǒng),圍繞著醫(yī)療活動的各個階段產(chǎn)生相關(guān)數(shù)據(jù),包括各門診數(shù)據(jù)及病房數(shù)據(jù)兩大主流數(shù)據(jù)流。LIS是HIS的一個重要組成部分,其主要功能是將實驗儀器傳出的檢驗數(shù)據(jù)經(jīng)分析后,生成檢驗報告,通過

5、網(wǎng)絡(luò)存儲在數(shù)據(jù)庫中,使醫(yī)生能夠方便、及時地看到患者的檢驗結(jié)果。PACS數(shù)據(jù)主要是將數(shù)字化醫(yī)院影像科室日常核磁、CT、超聲、各種X線機(jī)、各種紅外儀等設(shè)備產(chǎn)生的圖像存儲起來。EMR不同于以醫(yī)療機(jī)構(gòu)為中心的門診或住院病歷,是真正以患者為中心的診斷和其他檢驗數(shù)據(jù)的“數(shù)據(jù)池”,它將患者診斷過程中生成的影像和信號,女口X線檢查、CT掃描等納入電子病歷中,并以統(tǒng)一的形式組織起來。醫(yī)療大數(shù)據(jù)定義女下。隨著醫(yī)療衛(wèi)生信息化建設(shè)進(jìn)程的不斷加快,醫(yī)療數(shù)據(jù)的類型和規(guī)模正以前所未有的速度快速地增長,以至于無法利用目前主流軟件工具,在合理的時間內(nèi)達(dá)到擷取、管理并整合成為能夠幫助醫(yī)院進(jìn)行更積極目的經(jīng)營決策的有用信息。規(guī)模巨大

6、的臨床實驗數(shù)據(jù)、疾病診斷數(shù)據(jù)以及居民行為健康數(shù)據(jù)等匯聚在一起形成了醫(yī)療大數(shù)據(jù),并呈現(xiàn)出大數(shù)據(jù)的特性:(1)數(shù)據(jù)規(guī)模大(volume)(2)數(shù)據(jù)結(jié)構(gòu)多樣(variety(3)數(shù)據(jù)增長快速(velocit)(4)數(shù)據(jù)價值巨大(value)除了大數(shù)據(jù)所具有的特征(即volume,varietyvalue,velocity夕卜,醫(yī)療大數(shù)據(jù)還具有多態(tài)性、不完整性、時間性及冗余性等醫(yī)療領(lǐng)域特有的一些特征。根據(jù)大數(shù)據(jù)在醫(yī)療行業(yè)的主要應(yīng)用場景醫(yī)療大數(shù)據(jù)可分為以下3類。1)醫(yī)藥研發(fā)大數(shù)據(jù)大數(shù)據(jù)技術(shù)的戰(zhàn)略意義在于對各方面醫(yī)療衛(wèi)生數(shù)據(jù)進(jìn)行專業(yè)化處理,可以使對患者甚至大眾的行為和情緒的細(xì)節(jié)化測量成為可能,挖掘其癥狀特

7、點、行為習(xí)慣和喜好等,找到更符合其特點或癥狀的藥品和服務(wù),并針對性地調(diào)整和優(yōu)化。醫(yī)藥公司在新藥品研發(fā)階段,可以通過大數(shù)據(jù)建模和分析,確定最有效的投入產(chǎn)出比,從而配備最佳資源組合。除了研發(fā)成本,醫(yī)藥公司還可以更快地得到回報。同樣通過數(shù)據(jù)建模和分析,醫(yī)藥公司可以將藥物更快推向市場,生產(chǎn)更有針對性的藥物,獲得更高潛在市場回報和治療成功率的藥物。2)疾病診療大數(shù)據(jù)采集健康數(shù)據(jù),居民可以隨時查閱,了解自身健康程度。同時,提供專業(yè)的在線專家咨詢系統(tǒng),由專家對居民健康程度做出診斷,提醒可能發(fā)生的健康問題,避免高?;颊咿D(zhuǎn)為慢性病患者,避免慢性病患者病情惡化,減輕個人和醫(yī)保負(fù)擔(dān),實現(xiàn)疾病科學(xué)管理。另外,通過對大

8、型數(shù)據(jù)集(如基因組數(shù)據(jù))的分析提供個性化醫(yī)療方案。個性化醫(yī)療可以改善醫(yī)療保健效果,如在患者發(fā)生疾病癥狀前,就提供早期的檢測和診斷。3)公共衛(wèi)生大數(shù)據(jù)大數(shù)據(jù)可以連續(xù)整合和分析公共衛(wèi)生數(shù)據(jù),提高疾病預(yù)報和預(yù)警能力,防止疫情爆發(fā)。公共衛(wèi)生部門則可以通過覆蓋區(qū)域的衛(wèi)生綜合管理信息平臺和居民健康信息數(shù)據(jù)庫,快速檢測傳染病,進(jìn)行全面疫情監(jiān)測,并通過集成疾病檢測和響應(yīng)程序,進(jìn)行快速響應(yīng),這些都將減少醫(yī)療索賠支出,降低傳染病感染率。通過提供準(zhǔn)確和及時的公共健康咨詢,將會大幅提高公眾健康風(fēng)險意識,同時也將降低傳染病感染元數(shù)據(jù)描述數(shù)據(jù)的產(chǎn)生、并隨時間推移而演化的整個過程的信息,為數(shù)據(jù)提供了一個參考框架,用于讓使用

9、者更好地獲取、使用和管理信息資源。元數(shù)據(jù)與傳統(tǒng)關(guān)系數(shù)據(jù)庫的數(shù)據(jù)字典類似,它描述所屬數(shù)據(jù)集的物理組織、數(shù)據(jù)模型、表結(jié)構(gòu)、用戶權(quán)限等信息。但元數(shù)據(jù)的描述功能遠(yuǎn)不止這些,它包括了來自內(nèi)外部的所有物理的和知識性的信息,包括物理數(shù)據(jù)的格式、技術(shù)和業(yè)務(wù)規(guī)則、數(shù)據(jù)組成和約束以及所使用的數(shù)據(jù)結(jié)構(gòu)等方面。元數(shù)據(jù)分為技術(shù)元數(shù)據(jù)、業(yè)務(wù)元數(shù)據(jù)和過程元數(shù)據(jù)。元數(shù)據(jù)猶如數(shù)據(jù)集合的DNA,它描述了數(shù)據(jù)集中各要素的組成、結(jié)構(gòu)、來源以及彼此之間如何協(xié)作。采用元數(shù)據(jù)知識庫進(jìn)行存儲是目前公認(rèn)的元數(shù)據(jù)收集組織方式。在醫(yī)療信息化的過程中,主要面臨的問題是如何實現(xiàn)區(qū)域內(nèi)異構(gòu)醫(yī)療機(jī)構(gòu)間醫(yī)療衛(wèi)生數(shù)據(jù)互聯(lián)互通,以及醫(yī)療衛(wèi)生信息語義互操作,即兩

10、個或多個醫(yī)療機(jī)構(gòu)間交換信息和對所交換信息進(jìn)行使用的能力。被公認(rèn)是醫(yī)療大數(shù)據(jù)主要來源的有3種,分別是電子病歷數(shù)據(jù)、基因數(shù)據(jù)和互聯(lián)網(wǎng)數(shù)據(jù)。醫(yī)學(xué)領(lǐng)域內(nèi)的數(shù)據(jù)資源,按照類型來分大致有電子病歷、醫(yī)學(xué)影像、臨床檢驗和醫(yī)患行為這4種。這些醫(yī)療行業(yè)相關(guān)數(shù)據(jù)資源應(yīng)包括醫(yī)保政務(wù)、醫(yī)學(xué)文獻(xiàn)、制藥行業(yè)和醫(yī)藥銷售等4部分內(nèi)容。生命科學(xué)現(xiàn)在有兩個分支,即計算生物學(xué)和生物信息學(xué),前者是模擬生物系統(tǒng)怎樣運(yùn)轉(zhuǎn),如一個細(xì)胞的代謝路徑,或是一個蛋白生成的方法;而后者則從許多不同的實驗中收集和分析數(shù)據(jù)。憑借大數(shù)據(jù)技術(shù)分析基因數(shù)據(jù),是未來醫(yī)學(xué)個性化醫(yī)療模式和“治未病”的起點。這是因為,數(shù)據(jù)挖掘無需假設(shè),是一種無預(yù)先假設(shè)(hypothe

11、se-fre©,這種研究有著特別的作用,即能讓某一個特定的基因或一組“候選”基因無偏向性地讓這些基因數(shù)據(jù)自己“闡述”自身的作用。電子健康紀(jì)錄(electronichealthrecoiHERs)整合了不同來源的病患健康資訊,包括病患所有的電子病歷,理想的電子健康記錄應(yīng)該具有互動性、互用性、安全性、持續(xù)性和即時更新的特性。非結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù)現(xiàn)在主要包括醫(yī)生醫(yī)囑、出院小結(jié)和各種描述性質(zhì)的分析報告。針對這些數(shù)據(jù),首先需要進(jìn)行分詞,之后再利用醫(yī)學(xué)領(lǐng)域的知識庫對分詞結(jié)果進(jìn)行概念的識別,最終形成一個機(jī)器可讀的數(shù)據(jù)。這個流程中,系統(tǒng)對數(shù)據(jù)的處理并不是完全自動化的過程。一些不能自動識別的文本將由

12、人工進(jìn)行識別處理,之后作為一個用戶字典規(guī)則,加入到系統(tǒng)標(biāo)準(zhǔn)識別過程中。用到的工具包括:(1)文本分詞在醫(yī)療衛(wèi)生領(lǐng)域,需要結(jié)合醫(yī)療衛(wèi)生領(lǐng)域的本體知識庫的建模,建立業(yè)務(wù)詞典,提高分詞的準(zhǔn)確率。(2)文本挖掘(3)語義分析醫(yī)療數(shù)據(jù)的共享、整合成為迫切需要。第一階段是以傳統(tǒng)的數(shù)據(jù)交換整合,即基于EAI/E技術(shù)來實現(xiàn),主要實現(xiàn)在廣域網(wǎng)范圍內(nèi)醫(yī)療衛(wèi)生數(shù)據(jù)采集和交換,實現(xiàn)在區(qū)域的整合,形成區(qū)域級別的健康檔案,主要在數(shù)據(jù)層面實現(xiàn)整合;第二階段在此基礎(chǔ)上以面向服務(wù)的架構(gòu)(serviceorientedarchitSeOcAt)為中心,從數(shù)據(jù)整合上升到應(yīng)用整合和業(yè)務(wù)協(xié)同;第三階段在前兩個階段的基礎(chǔ)上基于HL和IH

13、等國際標(biāo)準(zhǔn)實現(xiàn)開放性和可互操作的信息共享和業(yè)務(wù)協(xié)同。數(shù)據(jù)清洗(ETL),是英文extracttransfo的縮寫o,ad用來描述將資料從來源端經(jīng)過抽?。╡xtra)c、t轉(zhuǎn)換(transfo)r、m裝載(loa)d至目的端的過程。數(shù)據(jù)抽取具體包含如下幾種實現(xiàn)方式。(1)全量抽?。?)增量抽取面向醫(yī)療大數(shù)據(jù)應(yīng)用的邏輯參考架構(gòu)主要分為五個層次,分別是醫(yī)療大數(shù)據(jù)管理層、醫(yī)療大數(shù)據(jù)整合層、醫(yī)療大數(shù)據(jù)處理層、醫(yī)療大數(shù)據(jù)應(yīng)用支撐管理層及醫(yī)療大數(shù)據(jù)應(yīng)用服務(wù)層。醫(yī)療大數(shù)據(jù)資源種類繁多、結(jié)構(gòu)復(fù)雜,主要包括:1)診療數(shù)據(jù)2)藥品數(shù)據(jù)3)健康數(shù)據(jù)4)醫(yī)療知識庫5)外源數(shù)據(jù)多源數(shù)據(jù)匯集后,還需進(jìn)行有效的融合處理,才能

14、進(jìn)行有序組織,構(gòu)成醫(yī)療大數(shù)據(jù)核心資源。1)醫(yī)療大數(shù)據(jù)主數(shù)據(jù)管理2)患者身份交叉索引(PIX)處理患者標(biāo)識號(patientidentifli)er3)融合診療事件形成醫(yī)療事件時間序列目前的大數(shù)據(jù)服務(wù)技術(shù)主要針對結(jié)構(gòu)化數(shù)據(jù)和基于KeyVal的文本數(shù)據(jù),而對于序列數(shù)據(jù)、圖數(shù)據(jù)這些類型沒有很好的支持技術(shù)。針對不同的數(shù)據(jù)源、不同的數(shù)據(jù)格式、不同的數(shù)據(jù)邏輯關(guān)系,醫(yī)療健康大數(shù)據(jù)處理平臺提供了實時數(shù)據(jù)庫、關(guān)系數(shù)據(jù)庫、NoSQ數(shù)據(jù)存儲、HDFS文件存儲等多種專用的存儲服務(wù)和系統(tǒng),為數(shù)據(jù)的高效存儲和有效管理提供了保障。1)離線批處理計算方式(MapReduc)e2)在線實時分析計算框架(Spar)k3)流式計算

15、框架(Stor)m在醫(yī)療大數(shù)據(jù)分析層,將著重解決兩個層面的分析工作。一是面向醫(yī)療大數(shù)據(jù)分析的分析挖掘,將傳統(tǒng)的通用數(shù)據(jù)挖掘工具進(jìn)行優(yōu)化改造及并行化實現(xiàn),在醫(yī)療領(lǐng)域本體的支持下,為醫(yī)療大數(shù)據(jù)應(yīng)用服務(wù)提供專用的分析模型庫。二是對醫(yī)療大數(shù)據(jù)挖掘利用的基礎(chǔ)上,輔以領(lǐng)域知識構(gòu)建技術(shù),建立生物醫(yī)學(xué)本體知識庫模型。(1)研究構(gòu)建生物學(xué)和臨床醫(yī)學(xué)融合的生物醫(yī)學(xué)本體知識庫,使之成為能與臨床電子病歷應(yīng)用集成的多本體融合模型。醫(yī)療大數(shù)據(jù)應(yīng)用支撐管理層包括了以下幾部分功能支撐。(1)醫(yī)療大數(shù)據(jù)服務(wù)總線(2)醫(yī)療大數(shù)據(jù)數(shù)據(jù)安全服務(wù)(3)醫(yī)療大數(shù)據(jù)數(shù)據(jù)管理服務(wù)為通用分析服務(wù)提供數(shù)據(jù)的訪問控制、數(shù)據(jù)資源目錄管理、元數(shù)據(jù)管理、大數(shù)據(jù)分析任務(wù)的托管運(yùn)行服務(wù)以及托管運(yùn)行任務(wù)的查看和訪問服務(wù)支撐。(4)運(yùn)營管理服務(wù)系統(tǒng)對大數(shù)據(jù)應(yīng)用支撐平臺上運(yùn)行的分析服務(wù)提供公共服務(wù)資源發(fā)現(xiàn)、查找、調(diào)用、回調(diào)的支撐,并提供對分析服務(wù)運(yùn)行狀態(tài)的監(jiān)管監(jiān)控功能。通過醫(yī)療領(lǐng)域大數(shù)據(jù)的整合和深度分析利用,針對居民、醫(yī)生、科研和衛(wèi)生管理機(jī)構(gòu),開展健康

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論