數(shù)據(jù)元標(biāo)準化基本方法_第1頁
數(shù)據(jù)元標(biāo)準化基本方法_第2頁
數(shù)據(jù)元標(biāo)準化基本方法_第3頁
數(shù)據(jù)元標(biāo)準化基本方法_第4頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、數(shù)據(jù)元標(biāo)準化基本方法計算機世界/2019年/10月/16日/第B20版行業(yè)主題公共衛(wèi)生數(shù)據(jù)元的標(biāo)準化 , 不僅要對數(shù)據(jù)自身進行“名、型、值”的定義 , 還要找出 數(shù)據(jù)之間內(nèi)在與外在間的關(guān)聯(lián)關(guān)系 , 對構(gòu)建高效穩(wěn)健的公共衛(wèi)生數(shù)據(jù)模型起到積極的作用。數(shù)據(jù)元標(biāo)準化基本方法劉麗華 金水高 王駿 胡凱數(shù)據(jù)標(biāo)準化工作是信息系統(tǒng)建設(shè)的基礎(chǔ)工作。數(shù)據(jù)工作的無規(guī)則性,必然會導(dǎo)致系統(tǒng) 的低效能和資源的浪費。長期以來,我國公共衛(wèi)生信息系統(tǒng)的建設(shè)缺乏整體規(guī)劃,在國家 層面上缺乏對公共衛(wèi)生數(shù)據(jù)的標(biāo)準定義與規(guī)范,導(dǎo)致了不同系統(tǒng)之間的數(shù)據(jù)難以交換、共 享,也造成了資源的極大浪費。公共衛(wèi)生數(shù)據(jù)元的標(biāo)準化,不僅要對數(shù)據(jù)自身進行

2、“名、型、值”的定義,還要找出 數(shù)據(jù)之間內(nèi)在與外在間的關(guān)聯(lián)關(guān)系,對構(gòu)建高效穩(wěn)健的公共衛(wèi)生數(shù)據(jù)模型起到積極的作用。數(shù)據(jù)元基本概念與結(jié)構(gòu)數(shù)據(jù)元可定義為通過標(biāo)識、定義、表示以及允許值等一系列屬性描述的數(shù)據(jù)單元,在 特定的語義環(huán)境中被認為是不可再分的最小數(shù)據(jù)單元,一般由對象類詞、特性類詞和表示 三部分組成。( 1 )對象類詞 : 是指人們希望研究、搜集和存儲其相關(guān)數(shù)據(jù)的事物,如 : 人、家庭、 醫(yī)療機構(gòu)、觀察與干預(yù)等。( 2)特性類詞 : 是某個對象的一個特征。例如,人這個對象類可以具有很多特征, 如性別、出生日期、身高、職業(yè)或患病情況等。(3)表示是值域、數(shù)據(jù)類型的組合,必要時也包括度量單位或字符集

3、。它所表達的 是數(shù)據(jù)元概念的數(shù)據(jù)類型及可能的取值范圍。表示類詞可以是一個編碼,如國際疾病分類 (ICD-1 0 ),也可能是一個取值范圍,如身高的取值。對象往往有多個特性,對象與其任何一個有意義的特性的結(jié)合就組成一個數(shù)據(jù)元概念。 例如,人這個“對象”可以有性別、身高、出生日期等多個“特性”,將它與其中的某一 個特性結(jié)合在一起就組成一個“數(shù)據(jù)元概念”,如人性別、人身高和人出生日期等 都是數(shù)據(jù)元概念的例子。數(shù)據(jù)元是數(shù)據(jù)元概念與值域的結(jié)合。即一個特定的數(shù)據(jù)元概念與一個特定的值域結(jié)合 創(chuàng)建一個數(shù)據(jù)元。例如在兒童營養(yǎng)監(jiān)測中,定義的一個數(shù)據(jù)元概念“兒童身高”,與身高的表示值域結(jié)合,構(gòu)成數(shù)據(jù)元“兒童身高的測

4、量值” ; 而與兒童身高的平均水平值域結(jié)合, 則構(gòu)成“兒童身高的平均值”這個數(shù)據(jù)元。顯然,這是兩個不同的數(shù)據(jù)元。數(shù)據(jù)元概念與 數(shù)據(jù)元之間存在一對多的關(guān)系,即一個數(shù)據(jù)元概念與不同的表示組合后可以生成不同的數(shù) 據(jù)元。數(shù)據(jù)元標(biāo)準化的重要作用(1)規(guī)范和統(tǒng)一數(shù)據(jù)的采集與應(yīng)用 ; ( 2)構(gòu)筑數(shù)據(jù)共享的基礎(chǔ),為不同系統(tǒng)多種模 式的數(shù)據(jù)存取和數(shù)據(jù)共享提供數(shù)據(jù)轉(zhuǎn)換格式和編程接口 ; ( 3)實現(xiàn)對公共衛(wèi)生數(shù)據(jù)在 “元數(shù)據(jù)”層面上的管理,從而使“應(yīng)用軟件”真正與“數(shù)據(jù)”分家,使應(yīng)用軟件的開發(fā) 更具靈活性 ; (4)為公共衛(wèi)生內(nèi)部數(shù)據(jù)交換及公共衛(wèi)生與外部數(shù)據(jù)交換在“數(shù)據(jù)”這一 層上提供統(tǒng)一的、各學(xué)科可以共同遵守

5、的數(shù)據(jù)交換規(guī)范 ; ( 5)是構(gòu)建統(tǒng)一、集成、高效 的公共衛(wèi)生數(shù)據(jù)模型的基礎(chǔ)。數(shù)據(jù)元標(biāo)準化方法1. 數(shù)據(jù)元的提取公共衛(wèi)生數(shù)據(jù)元的提取采用以下步驟:業(yè)務(wù)需求分析。包括流程分析,業(yè)務(wù)建模。基本數(shù)據(jù)集設(shè)置。將必需收集的數(shù)據(jù)按照特性分成不同數(shù)據(jù)集,確定每個數(shù)據(jù)集中的數(shù) 據(jù)項;數(shù)據(jù)元構(gòu)建。對抽取的數(shù)據(jù)項,按對象類詞、特性類詞及表示類詞構(gòu)建數(shù)據(jù)元。2. 數(shù)據(jù)元的規(guī)范化描述數(shù)據(jù)元的規(guī)范化描述是指按照國際或國家標(biāo)準對于所提取的數(shù)據(jù)元的屬性進行描述。 國家公共衛(wèi)生數(shù)據(jù)元的屬性的規(guī)范化描述遵循的標(biāo)準為ISO/IEC 11179-3:2002 和國家標(biāo)準 GB/T 18391.3-2001 (信息技術(shù) / 數(shù)據(jù)元的

6、規(guī)范與標(biāo)準化 / 第三部分 : 數(shù)據(jù)元的基本屬 性),基本屬性的模型如圖所示。該標(biāo)準要求對數(shù)據(jù)元的 22 個屬性進行描述。內(nèi)容包括標(biāo)識類屬性、定義類屬性、關(guān) 系類屬性、表示類屬性、管理類屬性及附加類屬性。數(shù)據(jù)元其中還說明了屬性的出現(xiàn)次數(shù) 以及可選屬性之間的綁定關(guān)系。結(jié)合實際,在公共衛(wèi)生數(shù)據(jù)元的規(guī)范化的描述中,增加了 英文名稱及英文簡稱兩個新的屬性。以“傷害發(fā)生原因”數(shù)據(jù)元規(guī)范化描述為例說明如下。標(biāo)識類屬性標(biāo)識符 : PH0802019名稱 : 傷害發(fā)生原因版本號 : 0.1英文名稱 : cause of injury英文簡稱 : cause of injury同義名稱 :注冊機構(gòu) : 標(biāo)準化研

7、究總體組相關(guān)環(huán)境 : 該數(shù)據(jù)元用以收集傷害發(fā)生的原因。該數(shù)據(jù)元用于傷害監(jiān)測數(shù)據(jù)集。定義類屬性定義 : 填寫造成傷害的起始原因,即在傷害發(fā)生鏈中最前面的原因。表示類屬性表示類別 : 代碼法表示形式 : 代碼數(shù)據(jù)元值的數(shù)據(jù)類型 : CV數(shù)據(jù)元值的最大長度 : 2數(shù)據(jù)元值的最小長度 : 1表示格式 : n數(shù)據(jù)元允許值 : 傷害原因代碼表管理類屬性主管機構(gòu) : 中國疾病預(yù)防控制中心注冊狀態(tài) : 已登錄提交機構(gòu) : 中國疾控中心慢病中心備注:數(shù)據(jù)元著錄工具為了便于對數(shù)據(jù)元進行著錄于管理而編制的公共衛(wèi)生數(shù)據(jù)元著錄與管理系統(tǒng)是參照中 華人民共和國國家質(zhì)量監(jiān)督檢驗檢疫總局發(fā)布的數(shù)據(jù)元的規(guī)范與標(biāo)準化國家標(biāo)準(G

8、B/T18391 )進行設(shè)計開發(fā)的,其主要功能包括數(shù)據(jù)元著錄、管理、查詢和調(diào)用等。目 的是以軟件工具作為輔助手段建立一套符合數(shù)據(jù)元標(biāo)準化的工作程序,保證用戶在可操作 性比較強的方式下,以標(biāo)準化的方式進行數(shù)據(jù)元的著錄和管理。系統(tǒng)設(shè)計為帶有客戶端軟 件的WEB服務(wù)模式,用戶通過INTERNET或局域網(wǎng)絡(luò)下載本系統(tǒng)的客戶端軟件,然后通過 客戶端界面與網(wǎng)絡(luò)連接進行錄入與管理功能,權(quán)限級別不同的用戶可進行操作的范圍不同。系統(tǒng)具有如下主要功能1. 數(shù)據(jù)元著錄功能 : 數(shù)據(jù)元著錄分為三個主要環(huán)節(jié) : 術(shù)語條目庫建立、數(shù)據(jù)元生成和 數(shù)據(jù)元屬性著錄。在具體操作中,用戶可直接進入數(shù)據(jù)元生成環(huán)節(jié)進行操作,也可以在有 完整數(shù)據(jù)元的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論