PC環(huán)境下大型醫(yī)學(xué)數(shù)據(jù)的處理_第1頁
PC環(huán)境下大型醫(yī)學(xué)數(shù)據(jù)的處理_第2頁
PC環(huán)境下大型醫(yī)學(xué)數(shù)據(jù)的處理_第3頁
PC環(huán)境下大型醫(yī)學(xué)數(shù)據(jù)的處理_第4頁
PC環(huán)境下大型醫(yī)學(xué)數(shù)據(jù)的處理_第5頁
免費(fèi)預(yù)覽已結(jié)束,剩余1頁可下載查看

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、PC環(huán)境下大型醫(yī)學(xué)數(shù)據(jù)的處理【關(guān)鍵詞】 微型計(jì)算機(jī) 數(shù)據(jù)收集 自動(dòng)數(shù)據(jù)處理大型醫(yī)學(xué)數(shù)據(jù)的計(jì)算機(jī)處理工作是一個(gè)復(fù)雜的過程,需要具備一定規(guī)模的硬件和軟件條件。如何在辦公室PC機(jī)較為簡單的設(shè)備條件下,完成較大型醫(yī)學(xué)數(shù)據(jù)的計(jì)算機(jī)處理工作,是值得研究的課題。張正武1曾提出輸入數(shù)據(jù)正確性的方法,本研究提出了從數(shù)據(jù)預(yù)處理到動(dòng)態(tài)二維表數(shù)據(jù)生成,確保數(shù)據(jù)處理質(zhì)量的切實(shí)可行的方法與步驟,并在Visual Foxpro 6.0平臺(tái)上開發(fā)了相應(yīng)的數(shù)據(jù)處理系統(tǒng)。1 資料和方法11 資料 1990年“貴州省嬰兒、孕產(chǎn)婦死亡回顧調(diào)查分析”抽樣調(diào)查數(shù)據(jù)卡片130 000張,計(jì)算機(jī)錄入數(shù)據(jù)量達(dá)144萬項(xiàng)。項(xiàng)目設(shè)計(jì)通過數(shù)據(jù)整理分

2、析,期望獲得全省嬰兒、圍產(chǎn)兒、孕產(chǎn)婦死亡率、死亡原因及其多種相關(guān)數(shù)據(jù)分析。 12 數(shù)據(jù)處理 該項(xiàng)目數(shù)據(jù)處理分為數(shù)據(jù)預(yù)處理、數(shù)據(jù)錄入、復(fù)錄比較校驗(yàn)、數(shù)據(jù)庫文件的建立和管理,隨機(jī)動(dòng)態(tài)表格的設(shè)計(jì)和產(chǎn)出。13 數(shù)據(jù)錄入 131 數(shù)據(jù)錄入預(yù)處理人工編碼調(diào)查數(shù)據(jù)卡片130 000張中,有4種卡片類型,平均每張卡片有16個(gè)數(shù)據(jù)項(xiàng)。這些數(shù)據(jù)項(xiàng)中,少數(shù)是可直接進(jìn)機(jī)的數(shù)字,而大多數(shù)據(jù)是文字(例如死亡的病因等),不能直接錄入進(jìn)機(jī),必須事先將這些文字項(xiàng)進(jìn)行“編碼”處理,即按專門制定的編碼表和編碼規(guī)則進(jìn)行人工轉(zhuǎn)換,編成數(shù)字填寫在調(diào)查表上,方可錄入進(jìn)機(jī)。以07歲兒童死亡調(diào)查表為例,該表共24個(gè)數(shù)據(jù)項(xiàng),其中就有“縣,鄉(xiāng),村

3、名”、“籍貫”、“民族”、“死亡原因”、“死前癥狀”等需要進(jìn)行編碼。為使編碼標(biāo)準(zhǔn)化,盡可能采用已有的國家編碼標(biāo)準(zhǔn)(如行政區(qū)劃碼、民族碼、職業(yè)碼等),無國家標(biāo)準(zhǔn)的編碼,則自行設(shè)計(jì),采用自編碼。編碼處理是錄入進(jìn)機(jī)前的很重要的環(huán)節(jié),對(duì)編碼員提出了嚴(yán)格的要求,隨時(shí)抽查編碼質(zhì)量,要求編碼錯(cuò)誤率控制在允許的3.3范圍內(nèi)2。 132 數(shù)據(jù)錄入預(yù)處理預(yù)審檢查數(shù)據(jù)錄入預(yù)審檢查對(duì)調(diào)查表的調(diào)查區(qū)劃有序排列,檢查人工編碼是否有錯(cuò),編碼書寫是否規(guī)范,是否有漏登漏填項(xiàng)目等。從預(yù)審檢查發(fā)現(xiàn),至少1張調(diào)查表有1項(xiàng)錯(cuò)誤或遺漏,約占調(diào)查表總數(shù)的45。 133 數(shù)據(jù)錄入方法本研究依托普通辦公室PC機(jī)環(huán)境,采用人工鍵盤輸入法進(jìn)行數(shù)據(jù)

4、輸入。3人1機(jī),1人操作,2人觀察、檢查、整理錄入調(diào)查表;可輪換操作,減少較長時(shí)間操作造成的疲倦和出錯(cuò)。 14 數(shù)據(jù)錄入質(zhì)量的控制措施復(fù)錄比較校驗(yàn) 本研究設(shè)計(jì)了“復(fù)錄比較校驗(yàn)”程序模塊,進(jìn)行錄入質(zhì)量控制。首先將所有調(diào)查表排序,其次由不同的錄入人員在不同的計(jì)算機(jī)上將已經(jīng)錄入的調(diào)查表重新再錄入一遍,形成A、B兩套調(diào)查表排序的數(shù)據(jù)文件。最后由復(fù)錄比較校驗(yàn)程序?qū)纱武浫胭Y料逐項(xiàng)逐字進(jìn)行比較,并將不一致的數(shù)據(jù)項(xiàng)按調(diào)查表的格式顯示在屏幕上,再與有序排列的調(diào)查表原始數(shù)據(jù)進(jìn)行核對(duì),以判斷不一致的數(shù)據(jù)項(xiàng)出錯(cuò)原因,及時(shí)進(jìn)行改正。 15 數(shù)據(jù)統(tǒng)計(jì)匯總處理中的隨機(jī)動(dòng)態(tài)表樣設(shè)計(jì) 130 000抽樣調(diào)查卡片數(shù)據(jù)的統(tǒng)計(jì)匯總

5、產(chǎn)出兩大類統(tǒng)計(jì)表,整理表和分析表600余張,項(xiàng)目繁多,有橫向、縱向統(tǒng)計(jì),按條件分類等。為解決整理表和分析表的統(tǒng)計(jì)打印,該研究設(shè)計(jì)了具一定智能功能的隨機(jī)動(dòng)態(tài)字段表格生成模塊。2 結(jié)果 上述數(shù)據(jù)處理環(huán)節(jié)在Visual Foxpro平臺(tái)上通過數(shù)據(jù)處理程序系統(tǒng)實(shí)現(xiàn),其系統(tǒng)結(jié)構(gòu)分為錄入模塊和處理模塊,見圖1和圖2。3 討論在數(shù)據(jù)錄入階段中,采用何種方法確保錄入數(shù)據(jù)的正確性,控制數(shù)據(jù)錄入誤差在規(guī)定范圍內(nèi),對(duì)于后一階段的數(shù)據(jù)分析至關(guān)重要。復(fù)錄比較校驗(yàn)是控制錄入數(shù)據(jù)質(zhì)量的關(guān)鍵步驟,其原理是基于人工擊鍵錄入數(shù)據(jù)時(shí)出現(xiàn)的擊鍵差錯(cuò),而這種差錯(cuò)完全是“隨機(jī)的”3。同一數(shù)據(jù)分兩次由不同錄入員錄入,在校驗(yàn)時(shí)發(fā)生不一致的字

6、符至少有一方是錯(cuò)的,而兩次錄入都相同的數(shù)據(jù)字符,則可認(rèn)為是正確的。當(dāng)然,也不排除兩次錄入時(shí)在同一字符上出現(xiàn)完全相同的擊鍵錯(cuò)誤,但這種概率極小。根據(jù)概率論原理,如果兩個(gè)數(shù)據(jù)錄入者各自的出錯(cuò)率為百分之一,則復(fù)錄比較輸入的出錯(cuò)率僅為萬分之一。因此,復(fù)錄比較校驗(yàn)法是大批量數(shù)據(jù)錄入可采用的較好的錄入質(zhì)量控制措施。雖然數(shù)據(jù)錄入的工作量增大了一倍,但對(duì)于大型醫(yī)學(xué)數(shù)據(jù)的錄入質(zhì)量控制是行之有效的好方法。這種校驗(yàn)方法的查錯(cuò)能力很強(qiáng),可靠性很高,可以檢查出幾乎所有的錄入擊鍵差錯(cuò),可以有效地確保原始錄入數(shù)據(jù)的正確性。 通過隨機(jī)抽查兩個(gè)調(diào)查地區(qū)的調(diào)查表各300張,人工與復(fù)錄比較,結(jié)果是一組300張調(diào)查表數(shù)據(jù)完全正確,另

7、一組300張調(diào)查表數(shù)據(jù)約15 000個(gè)字符,僅錯(cuò)4個(gè),錯(cuò)誤率為027 ,完全符合專業(yè)錄入3.3的質(zhì)量2控制要求。 數(shù)據(jù)分析統(tǒng)計(jì)匯總階段,生成數(shù)百張統(tǒng)計(jì)表格。本研究設(shè)計(jì)了隨機(jī)動(dòng)態(tài)表樣模塊,能方便打印出數(shù)百種整理表和分析表,其原理是表格絕大多數(shù)是標(biāo)準(zhǔn)二維關(guān)系表,只要表格打印前輸入不同的字段組合,程序就能生成多種形式的表格及數(shù)據(jù),這樣節(jié)省了處理時(shí)間,大大提高了數(shù)據(jù)分析處理產(chǎn)出表格的效率。 大型醫(yī)學(xué)數(shù)據(jù)處理的全過程,對(duì)今后PC機(jī)環(huán)境下大型數(shù)據(jù)的處理積累了經(jīng)驗(yàn)。大規(guī)模調(diào)查數(shù)據(jù)的計(jì)算機(jī)處理,牢牢把握住原始數(shù)據(jù)的質(zhì)量關(guān),整個(gè)處理流程從錄入前的預(yù)處理至最后報(bào)表數(shù)據(jù)的打印,都必須有嚴(yán)格的質(zhì)量控制措施,否則將得不到正確結(jié)論;數(shù)據(jù)處理程序的設(shè)計(jì)要通用性強(qiáng),動(dòng)態(tài)二維統(tǒng)計(jì)表的程序設(shè)計(jì)思路值得繼續(xù)研究,并不斷完善和優(yōu)化?!緟⒖嘉墨I(xiàn)】 1張正武.談?wù)勌岣咻斎霐?shù)據(jù)正確性的方法EB/OL.2006-0906I.Theor

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論