版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
DBXX/TXXX—XXXX
江西省醫(yī)療大數(shù)據(jù)平臺技術規(guī)范第四部分:數(shù)據(jù)存儲規(guī)范
1范圍
本規(guī)范規(guī)定了醫(yī)療大數(shù)據(jù)平臺中數(shù)據(jù)存儲的術語、定義進行約束,包含了醫(yī)療大數(shù)據(jù)主題層模型存
儲規(guī)范、開放表存儲、對象存儲、過程數(shù)據(jù)存儲、結構化數(shù)據(jù)存儲等技術要求。
本規(guī)范適用于醫(yī)療大數(shù)據(jù)平臺的設計、開發(fā)、選型和實施,可作為醫(yī)療大數(shù)據(jù)平臺建設時的評測依
據(jù)。
2規(guī)范性引用文件
下列文件中的內容通過文中的規(guī)范性引用而構成本文件必不可少的條款。其中,注日期的引用文件,
僅該日期對應的版本適用于本文件;不注日期的引用文件,其最新版本(包括所有的修改單)適用于本
文件。
GB/T18391.1—2009信息技術元數(shù)據(jù)注冊系統(tǒng)(MDR)第1部分:框架
GB/T34960.5—2018信息技術服務治理第5部分:數(shù)據(jù)治理規(guī)范
GB/T35294-2017信息技術科學數(shù)據(jù)引用
GB/T35295-2017信息技術大數(shù)據(jù)術語
WS445.1-2014電子病歷基本數(shù)據(jù)集第1部分:病歷概要
WS445.2-2014電子病歷基本數(shù)據(jù)集第2部分:門(急)診病歷
WS445.3-2014電子病歷基本數(shù)據(jù)集第3部分:門(急)診處方
WS445.4-2014電子病歷基本數(shù)據(jù)集第4部分:檢查檢驗記錄
WS445.5-2014電子病歷基本數(shù)據(jù)集第5部分:一般治療處置記錄
WS445.6-2014電子病歷基本數(shù)據(jù)集第6部分:助產(chǎn)記錄
WS445.7-2014電子病歷基本數(shù)據(jù)集第7部分:護理操作記錄
WS445.8-2014電子病歷基本數(shù)據(jù)集第8部分:護理評估與計劃
WS445.9-2014電子病歷基本數(shù)據(jù)集第9部分:知情告知信息
WS445.10-2014電子病歷基本數(shù)據(jù)集第10部分:住院病案首頁
WS445.11-2014電子病歷基本數(shù)據(jù)集第11部分:中醫(yī)住院病案首頁
WS445.12-2014電子病歷基本數(shù)據(jù)集第12部分:入院記錄
WS445.13-2014電子病歷基本數(shù)據(jù)集第13部分:住院病程記錄
WS445.14-2014電子病歷基本數(shù)據(jù)集第14部分:住院醫(yī)囑
WS445.15-2014電子病歷基本數(shù)據(jù)集第15部分:出院小結
WS445.16-2014電子病歷基本數(shù)據(jù)集第16部分:轉診(院)記錄
WS445.17-2014電子病歷基本數(shù)據(jù)集第17部分:醫(yī)療機構信息
WS446-2014居民健康檔案醫(yī)學檢驗項目常用代碼
WS/T447-2014基于電子病歷的醫(yī)院信息平臺技術規(guī)范
WS/T448-2014基于居民健康檔案的區(qū)域衛(wèi)生信息平臺技術規(guī)范
WS/T303-2009衛(wèi)生信息數(shù)據(jù)元標準化規(guī)則
WS/T304-2009衛(wèi)生信息數(shù)據(jù)模式描述指南
1
DBXX/TXXX—XXXX
WS/T305-2009衛(wèi)生信息數(shù)據(jù)集元數(shù)據(jù)規(guī)范
WS/T306-2009衛(wèi)生信息數(shù)據(jù)集分類與編碼規(guī)則
3術語和定義
GB/T18391.1—2009、GB/T34960.5—2018、GB/T35294-2017、GB/T35295-2017、WS445、WS446、
WS447、WS448界定的以及下列術語和定義適用于本文件。
3.1
主題層存儲
為實現(xiàn)數(shù)據(jù)解耦而設計的數(shù)據(jù)存儲方式,根據(jù)數(shù)據(jù)之間的依賴性和業(yè)務關聯(lián),進行數(shù)據(jù)主題域劃分,
降低使用時數(shù)據(jù)跨表查詢復雜度。
3.2
結構化數(shù)據(jù)存儲
面向海量分析型數(shù)據(jù)的存儲方式,支持標準SQL接口,采用基于分布式計算的數(shù)據(jù)倉庫技術,可以
實現(xiàn)數(shù)據(jù)的分布式存儲和處理,以及大數(shù)據(jù)挖掘分析。
3.3
實時數(shù)據(jù)存儲
面向實時性、海量的流式數(shù)據(jù)的存儲方式,采用分布式流式處理技術,可以實現(xiàn)實時流式數(shù)據(jù)存儲
和處理。
3.4
對象數(shù)據(jù)存儲
面向醫(yī)療影像數(shù)據(jù)、文本文件、json對象、XML文件等對象數(shù)據(jù)的存儲方式,采用分布式的、面向
列的、多維的NoSQL數(shù)據(jù)庫系統(tǒng),可以實現(xiàn)對像數(shù)據(jù)的快速檢索和存儲。
4縮略語
下列縮略語適用于本文件:
——TTL:TimeToLive(生存時間價值);
——MPP:MassivelyParallelProcessing(大規(guī)模并行處理技術);
——SDK:SoftwareDevelopmentKit(軟件開發(fā)工具包);
——API:ApplicationProgrammingInterface(應用程序接口);
——ETL:Extract-Transform-Load(抽取、轉換、加載);
——HDFS:HadoopDistributedFileSystem(分布式文件系統(tǒng));
——Redis:RemoteDictionaryServer(遠程字典服務);
——SQL:StructuredQueryLanguage(結構化查詢語言)。
5數(shù)據(jù)存儲規(guī)范
2
DBXX/TXXX—XXXX
5.1數(shù)據(jù)存儲架構
由于醫(yī)療大數(shù)據(jù)平臺需要存儲的數(shù)據(jù)量大、類別多且復雜,在存儲時應采用分層分域的存儲架構,
降低數(shù)據(jù)之間的耦合性,應建立包含主題層、匯總層、應用層的數(shù)據(jù)存儲架構。
主題層是在接口層采集的原始數(shù)據(jù)基礎上進行主題劃分,形成關聯(lián)性強的主題域表,應包括但不限
于:
——病人信息;
——就診信息;
——醫(yī)囑信息;
——費用;
——診斷;
——過敏;
——檢查;
——檢驗;
——手術;
——護理;
——病案;
——病歷文書;
——腫瘤;
——報告卡;
——體檢;
——其他。
匯總層是在主題層基礎上,根據(jù)不同數(shù)據(jù)使用需求,對不同粒度的數(shù)據(jù)進行一定匯總處理,提高數(shù)
據(jù)使用效率,便于后續(xù)使用。其設計應滿足如下原則:
——應保障匯總數(shù)據(jù)的共用性;
——應能夠提高數(shù)據(jù)使用效率;
——應與原始事實表維度保持一致;
應用層是在匯總層基礎上,通過構建指標集、標簽集、應用寬表等數(shù)據(jù)存儲形式,以滿足各類數(shù)據(jù)
應。其在醫(yī)療機構主要支撐建立科研大數(shù)據(jù)應用平臺、人工智能應用平臺、運營管理系統(tǒng)等基于大數(shù)據(jù)
的智慧應用。
5.2醫(yī)療大數(shù)據(jù)主題層數(shù)據(jù)表存儲目錄
5.2.1數(shù)據(jù)標準化
5.2.1.1原則
醫(yī)療數(shù)據(jù)中心中的醫(yī)療數(shù)據(jù)應遵循統(tǒng)一的數(shù)據(jù)標準并優(yōu)先采用國家、衛(wèi)生行業(yè)已經(jīng)制定的相關數(shù)據(jù)
標準作為基準,對非標準數(shù)據(jù)進行轉換處理。若沒有相應的國家或衛(wèi)生行業(yè)數(shù)據(jù)標準可以引用,應按照
國家衛(wèi)生信息標準制定的有關要求完成數(shù)據(jù)標準制定工作。
5.2.1.2通用電子病歷數(shù)據(jù)標準
對于醫(yī)療機構的主要業(yè)務斷面和相關數(shù)據(jù),應符合WS445-2014(所有部分)《電子病歷基本數(shù)據(jù)
集》里的有關規(guī)定。
5.2.1.3未標準數(shù)據(jù)的標準化
3
DBXX/TXXX—XXXX
對于國家或者衛(wèi)生行業(yè)尚未制定標準的數(shù)據(jù),醫(yī)療大數(shù)據(jù)平臺數(shù)據(jù)集應按照WS/T303-2009、WS/T
304-2009、WS/T305-2009、WS/T306-2009的要求形成標準化數(shù)據(jù)元,并按照附錄A要求構建數(shù)據(jù)集
及標準化存儲。
5.3結構化數(shù)據(jù)存儲技術要求
結構化數(shù)據(jù)存儲計算面向的是從結構化數(shù)據(jù)庫采集的海量數(shù)據(jù),主要應用于海量結構化數(shù)據(jù)分析,
應用時需滿足以下技術要求:
——結構化數(shù)據(jù)存儲應基于MPP架構實現(xiàn)分布式列式數(shù)據(jù)倉庫;
——應提供標準的SQL接口,減少傳統(tǒng)數(shù)據(jù)應用遷移成本,降低開發(fā)運維人員使用門檻;
——應提供準實時的數(shù)據(jù)插入,以滿足用戶對實時數(shù)據(jù)的實時交互式分析;
——應提供壓縮存儲,以有效節(jié)約存儲成本,并基于分布式文件系統(tǒng)的多副本機制實現(xiàn)數(shù)據(jù)安全
存儲;
——應提供基于多種編程語言(如python、R、Java等)編寫的Map/Reduce程序或自定義函數(shù)的
上傳接口,支持定制化數(shù)據(jù)處理需求;
——應支持多租戶管理,便于將大數(shù)據(jù)平臺計算存儲資源進行合理劃分,提高資源使用效率;
——應支持多種計算引擎(如HiveSQL、Spark算子、SparkSQL、Map/Reduce等計算引擎)。
5.4實時數(shù)據(jù)存儲技術要求
實時數(shù)據(jù)存儲主要應用于接收醫(yī)療生命體征監(jiān)測儀器、物聯(lián)網(wǎng)可穿戴設備采集的海量實時數(shù)據(jù),由
于需要的數(shù)據(jù)吞吐能力、處理能力更高,傳統(tǒng)數(shù)據(jù)庫及處理方式難以滿足需求,實時數(shù)據(jù)存儲應基于當
前流行的開源大數(shù)據(jù)處理技術,實現(xiàn)分布式流數(shù)據(jù)處理服務,使其具有高可靠、高可用、高性能和動態(tài)
擴展的特性,以滿足醫(yī)療大數(shù)據(jù)的存儲要求,應用時需滿足以下技術要求:
——應集成通信網(wǎng)關實現(xiàn)數(shù)據(jù)采集,并通過數(shù)據(jù)采集網(wǎng)關對接多種醫(yī)療/可穿戴監(jiān)測設備,實現(xiàn)設
備海量數(shù)據(jù)的自動存??;
——應提供實時數(shù)據(jù)和歷史數(shù)據(jù)的存儲服務,兩者均應采用分布式架構,以滿足海量數(shù)據(jù)的存儲;
——應通過分布式消息隊列和分布式流式計算框架,以確保數(shù)據(jù)得到快速處理。
5.5對象數(shù)據(jù)存儲技術要求
對象數(shù)據(jù)存儲技術底層是基于分布式的、面向列的、多維的NoSQL數(shù)據(jù)庫系統(tǒng),它具備高容錯性和
高可擴展性。傳統(tǒng)的關系型數(shù)據(jù)庫,如Oracle和MySQL等,如果數(shù)據(jù)記錄在億級別,則查詢和寫入的性
能都會呈指數(shù)級下降,所以更大的數(shù)據(jù)量級并不適用于傳統(tǒng)數(shù)據(jù)庫,而對象數(shù)據(jù)存儲技術對于存儲百億、
千億甚至更多的數(shù)據(jù)都不存在任何問題。應用時需滿足以下技術要求:
——對象數(shù)據(jù)存儲應提供海量、安全和高可靠的云端對象存儲服務,以解決海量圖片文件的存儲
與檢索問題;
——應支持多租戶模式,為每個租戶提供獨立的底層表存儲,租戶之間應相互隔離;
——應提供基本的分類管理功能,每個租戶應可創(chuàng)建若干個不同的Bucket,不同的Bucket存儲不
同類型或用途的對象文件;
——每個Bucket中存儲的Object數(shù)據(jù)對象,應以Object和Bucket的名稱作為單行記錄主鍵,
并以此作為檢索條件;
——每個Bucket中應支持存儲百億級的Object;
——存儲Object在縱向維度上支持的數(shù)據(jù)量級應能彈性擴展;
——用戶應可通過調用API,在任何應用、任何時間及任何地點上傳和下載圖片數(shù)據(jù),也可通過
Web控制臺管理界面對數(shù)據(jù)進行管理;
4
DBXX/TXXX—XXXX
——存儲在對象存儲中的圖片文件,應可直接通過圖片鏈接方式進行分享;
——用戶應可直接將圖片鏈接嵌入至HTML頁面,并作為頁面的組成部分進行發(fā)布。
5.6數(shù)據(jù)存儲安全技術要求
為保障大數(shù)據(jù)平臺數(shù)據(jù)存儲安全,應按照數(shù)據(jù)分級分類原則制定不同等級的安全策略,實施時需滿
足以下技術要求:
——數(shù)據(jù)存儲應支持多副本備份,保障數(shù)據(jù)存儲安全;
——涉及數(shù)據(jù)分級分類的,宜按照GB∕T39725-2020信息安全技術健康醫(yī)療數(shù)據(jù)安全指南執(zhí)行;
——涉及網(wǎng)絡和系統(tǒng)安全的,宜按照GB/T22081-2016、GB/T22239-2019執(zhí)行;
——涉及基礎安全和數(shù)據(jù)服務安全的,宜按照GB/T35274-2017執(zhí)行;
——涉及云計算安全的,宜按照GB/T31168執(zhí)行;
——應建立數(shù)據(jù)存儲安全應急處置方案,以應對數(shù)據(jù)存儲突發(fā)情況,快速恢復備份數(shù)據(jù);
——數(shù)據(jù)存儲應按照最小權限原則管理,對各數(shù)據(jù)使用用戶進行權限管理,降低數(shù)據(jù)泄露風險。
5.7數(shù)據(jù)存儲管理要求
5.7.1數(shù)據(jù)存儲管理包括數(shù)據(jù)的分類和標準的命名方法,數(shù)據(jù)的存儲、數(shù)據(jù)的保密規(guī)范和數(shù)據(jù)的備份
要求等。
5.7.2管理要求應包括以下內容:
——應指定專人負責數(shù)據(jù)的管理,明確職責;安排專人負責涉密數(shù)據(jù)資源的傳輸、存儲、共享和
使用;
——應對存儲數(shù)據(jù)的設備及基礎設施重點做好安全防護,包括落實數(shù)據(jù)存儲設備的操作終端安全
管控措施及接入鑒權機制;
——應設置訪問控制策略,定期實施安全風險評估,配置安全基線、部署必要的安全存儲技術手
段等;
——應對不同安全等級的數(shù)據(jù)采用差異化安全存儲;
——應根據(jù)數(shù)據(jù)備份制度和策略,按照操作規(guī)程進行系統(tǒng)和數(shù)據(jù)日常備份,在出現(xiàn)異常時根據(jù)備
份策略進行恢復操作;
——應根據(jù)維護計劃定期進行數(shù)據(jù)資源目錄、數(shù)據(jù)庫系統(tǒng)維護;
——應加強數(shù)據(jù)備份介質的管理,對各類介質進行控制和保護;
——應根據(jù)所承載的數(shù)據(jù)和軟件的重要程度對介質實行分類和標識,并實行存儲環(huán)境專人管理。
5
DBXX/TXXX—XXXX
A
A
附錄A
(規(guī)范性)
醫(yī)療大數(shù)據(jù)主題層數(shù)據(jù)表存儲目錄
表A.1HDR(HospitalDataRepository)表集合
業(yè)務域表名描述
organization機構信息
company公司信息
standard_system標準系統(tǒng)信息
system系統(tǒng)信息
patient_id_type病人標識類型表
standard_class基準分類表
code_domain代碼域
code_system代碼系統(tǒng)表
code_set通用代碼集合
code_map通用代碼對照表
department科室信息
dept_category科室分類表
mdm(主數(shù)據(jù))employee員工信息
medical_group醫(yī)療組信息
medical_group_empl醫(yī)療組人員
drug藥品字典
item項目字典表
order_item_class開單項目分類表
order_item_relationship開單項目關系表
diagnose診斷字典表
operation手術字典表
bed床位字典表
lis_item檢驗項目信息
lis_item_map檢驗項目對照表
mdm_map主數(shù)據(jù)對照表
6
DBXX/TXXX—XXXX
unit_conversion單位轉換表
mdm_drug_property森億藥品屬性表
mdm_drug_map藥品標準化對照表
patient_master_info病人主信息
patient_identifier病人標識信息
patient(病人信息)
patient_id_relationship病人標識關系表
patient_base_info病人基本信息
visit_record就診總表
outpatient_record門診就診記錄
visit(就診信息)inpat_record住院就診記錄
inpat_baby_info住院嬰兒信息
inpat_shift_dept住院轉科記錄
outpat_recipe門診處方
outpat_recipe_detail門診處方明細
orders(醫(yī)囑信息)
inpat_drug_order住院用藥醫(yī)囑
inpat_undrug_order住院非藥品醫(yī)囑
outpat_fee門診費用匯總表
outpat_fee_detail門診費用明細表
fee(費用)
inpat_balance住院結算表
inpat_fee_detail住院費用明細表
diag(診斷)patient_diagnose病人診斷記錄
allergy(過敏)patient_allergy病人過敏記錄
radiology_report放射學報告
radiology_report_item放射學報告檢查項目
ecg_report心電報告
ecg_result_detail心電報告結果明細
checks(檢查)
ecg_report_item心電報告檢查項目
endoscopy_report內窺鏡報告
endoscopy_report_item內窺鏡報告檢查項目
ultrasound_report超聲報告
7
DBXX/TXXX—XXXX
ultrasound_report_item超聲報告檢查項目
ultrasound_result_detail超聲報告檢查結果報告
pathology_report病理報告
pathology_report_item病理報告檢查項目
other_report其他檢查報告
other_report_item其他檢查報告檢查項目
lab_report檢驗報告
lab_report_result檢驗報告結果
microbe_report微生物報告
bacteria_result細菌結果
lab(檢驗)
antibiotic_result藥敏結果
lab_result_show檢驗結果展示表
lis_report_item檢驗報告項目
microbe_report_item微生物報告項目
preoperative_visit_record術前訪視記錄
operation_record手術記錄
operation_employee手術人員
operation_detail手術明細
operation_diagnose手術診斷明細
operation(手術)
operation_document手麻文書
operation_document_detail手術文書數(shù)據(jù)明細
anesthesia_record麻醉記錄
operation_vital_sign手術體征記錄
operation_event手術事件
vital_sign體征記錄
nurse(護理)nurse_record_sheet護理記錄單
nurse_data_record護理數(shù)據(jù)記錄
case_base病案首頁
cases(病案)
case_diagnose病案診斷表
8
DBXX/TXXX—XXXX
case_operation病案手術表
case_baby病案嬰兒表
inpat_medical_record住院病歷
nurse_record
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度瓦工裝修綠色施工認證合同3篇
- 二零二五版?;饭愤\輸安全監(jiān)管服務合同2篇
- 二零二五版攪拌站輪胎專用備品備件供應合同3篇
- 二零二五版智能辦公樓深度清潔及保養(yǎng)服務合同2篇
- 二零二五版辦公室文員工作環(huán)境優(yōu)化合同3篇
- 二零二五年度高端房地產(chǎn)項目個人連帶責任保證擔保合同2篇
- 二零二五年度互聯(lián)網(wǎng)數(shù)據(jù)中心(IDC)設施租賃合同3篇
- 2025年度中式烹飪技藝傳承與創(chuàng)新合同協(xié)議3篇
- 屋頂防水施工合同(2篇)
- 二零二五年救生員水上安全培訓與勞動合同3篇
- 廣東省惠州市2024-2025學年高一上學期期末考試英語試題(含答案)
- 醫(yī)院骨科2025年帶教計劃(2篇)
- 環(huán)境保護應急管理制度執(zhí)行細則
- 2024-2030年中國通航飛行服務站(FSS)行業(yè)發(fā)展模式規(guī)劃分析報告
- 機械制造企業(yè)風險分級管控手冊
- 地系梁工程施工方案
- 藏文基礎-教你輕輕松松學藏語(西藏大學)知到智慧樹章節(jié)答案
- 2024電子商務平臺用戶隱私保護協(xié)議3篇
- 安徽省蕪湖市2023-2024學年高一上學期期末考試 英語 含答案
- 醫(yī)學教程 常見體表腫瘤與腫塊課件
- 內分泌系統(tǒng)異常與虛勞病關系
評論
0/150
提交評論