醫(yī)學(xué)數(shù)據(jù)信息和知識(shí)_第1頁
醫(yī)學(xué)數(shù)據(jù)信息和知識(shí)_第2頁
醫(yī)學(xué)數(shù)據(jù)信息和知識(shí)_第3頁
醫(yī)學(xué)數(shù)據(jù)信息和知識(shí)_第4頁
醫(yī)學(xué)數(shù)據(jù)信息和知識(shí)_第5頁
已閱讀5頁,還剩22頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

醫(yī)學(xué)數(shù)據(jù)信息和知識(shí)第一頁,共二十七頁,編輯于2023年,星期二醫(yī)學(xué)數(shù)據(jù)和計(jì)量癥狀學(xué)醫(yī)學(xué)數(shù)據(jù)

醫(yī)學(xué)數(shù)據(jù)與信息

醫(yī)療數(shù)據(jù)的變異

醫(yī)療數(shù)據(jù)的解釋

計(jì)量癥狀學(xué)

檢查的診斷價(jià)值

癥狀的情報(bào)價(jià)值

癥狀預(yù)測價(jià)值的評(píng)估方法

教學(xué)要求通過本課學(xué)習(xí),學(xué)生應(yīng)該能夠:區(qū)分醫(yī)學(xué)數(shù)據(jù)和信息描述醫(yī)學(xué)數(shù)據(jù)的變異來源

醫(yī)學(xué)信息的類型及其量的計(jì)算

第二頁,共二十七頁,編輯于2023年,星期二數(shù)據(jù)(Data):為分析所預(yù)備的單個(gè)條目。

一條數(shù)據(jù)(Adatum):在這里是指對(duì)病人的一項(xiàng)觀察。醫(yī)學(xué)數(shù)據(jù)(medicaldata):有關(guān)一個(gè)病人的觀察的集合。信息(Information):帶有某種解釋或者附加含義的成

組的數(shù)據(jù)。從數(shù)據(jù)中抽出的有意義或者有用的事實(shí)。簡稱之為解釋過

的數(shù)據(jù)(interpreteddata)。知識(shí)(Knowledge):一組用于從數(shù)據(jù)和信息中創(chuàng)造信息的

規(guī)則、公式或者探索方法。第三頁,共二十七頁,編輯于2023年,星期二醫(yī)療過程中

數(shù)據(jù)、信息與知識(shí)病人推理觀察計(jì)劃信息知識(shí)治療數(shù)據(jù)第四頁,共二十七頁,編輯于2023年,星期二小結(jié):

三者的區(qū)別在于加工與抽象的不同數(shù)據(jù)信息知識(shí)醫(yī)療過程的知識(shí)生產(chǎn)特點(diǎn)知識(shí)增量是目的第五頁,共二十七頁,編輯于2023年,星期二敘述(narrative):由醫(yī)生紀(jì)錄。測量數(shù)值(numericalmeasurements):血壓、體溫、

化驗(yàn)值等。編碼數(shù)據(jù)(codeddata):文本數(shù)據(jù)(textualdata):某些以文本形式報(bào)告的結(jié)果。記錄的信號(hào)(recordedsignals):心電圖、腦電圖等等。圖像(

image)

:X線等。第二節(jié)醫(yī)學(xué)數(shù)據(jù)醫(yī)學(xué)數(shù)據(jù)的類型

(從表現(xiàn)形式劃分)第六頁,共二十七頁,編輯于2023年,星期二

計(jì)量資料(measurementdata):對(duì)每個(gè)觀察對(duì)象的觀察指標(biāo)用定量的方法測定該指標(biāo)的數(shù)值大小所得的資料。一般用度量衡單位表示,如身高、體重、濃度等等。

計(jì)數(shù)資料(enumerationdata):先將觀察對(duì)象的觀察指標(biāo)按性質(zhì)或者類別進(jìn)行分組,然后計(jì)數(shù)各組該觀察指標(biāo)的數(shù)目所得的資料。如人群的血型分布。

等級(jí)分組資料:具有計(jì)數(shù)資料的性質(zhì),同時(shí)又兼有半定量的性質(zhì)。如化驗(yàn)結(jié)果的加號(hào)。上述的資料可以轉(zhuǎn)化。醫(yī)學(xué)數(shù)據(jù)的類型(從分布角度劃分)第七頁,共二十七頁,編輯于2023年,星期二

此外,還有一種類似的對(duì)變量(被觀察單位的特征或指標(biāo))的分類方法:分類變量(categoricalvariable):定性變量,有兩個(gè)或多個(gè)互不相容的類別或?qū)傩?。又進(jìn)一步分為無序分類和有序分類。無序分類包括二項(xiàng)分類和多項(xiàng)分類。數(shù)值變量(numericalvariable):定量變量,也就是計(jì)量資料。以連續(xù)形式存在的,如生理信號(hào)、ECG、EKG等。有時(shí)可以數(shù)值化的數(shù)據(jù)與一段自由文本存放在一起。在計(jì)算機(jī)病歷中往往存儲(chǔ)這種混合式的數(shù)據(jù)(文字和數(shù)據(jù))。固定和活動(dòng)圖像是另一類的混合數(shù)據(jù),有時(shí)還附有自由文本式的文字評(píng)述。醫(yī)學(xué)數(shù)據(jù)的類型(變量分類)第八頁,共二十七頁,編輯于2023年,星期二變量類型變量值表現(xiàn)實(shí)例資料類型數(shù)量變量定量(具體數(shù)值)身高(cm)計(jì)量資料分類變量無序二分類對(duì)立的兩類屬性性別(男,女)計(jì)數(shù)資料多分類不相容的多類屬性血型(A,B,O)有序多分類類間有程度差異的屬性(又稱等級(jí)資料)文化程度(初中、高中、大學(xué)...)醫(yī)學(xué)數(shù)據(jù)和變量的分布類型第九頁,共二十七頁,編輯于2023年,星期二

每一條醫(yī)療數(shù)據(jù)至少應(yīng)當(dāng)包括4種元素: 病人姓名(如韋小寶) 問題的屬性或參數(shù)(如年齡) 參數(shù)的值(如40) 觀察的時(shí)間(如1999年9月5日9:12)醫(yī)學(xué)數(shù)據(jù)的組成姓名屬性屬性值觀察時(shí)間趙大寶診斷抑郁性精神病2003-2-12趙大寶年齡402003-2-12第十頁,共二十七頁,編輯于2023年,星期二儀器內(nèi)儀器間觀察者總變異生物學(xué)上分析或方法性上個(gè)體儀器個(gè)體內(nèi)個(gè)體間觀察者間觀察者內(nèi)醫(yī)學(xué)數(shù)據(jù)的變異—變異的來源變異(variation)

同值個(gè)體同指標(biāo)之間的差異叫變異。第十一頁,共二十七頁,編輯于2023年,星期二醫(yī)學(xué)數(shù)據(jù)變異程度的測量

醫(yī)療數(shù)據(jù)通常不能提供完全的信息。也不能用肯定程度來確認(rèn)病人。一條數(shù)據(jù)可能因?yàn)椴痪_和或不準(zhǔn)確而偏離實(shí)際值。對(duì)其變異程度的測量可以有以下指標(biāo):精密度:同一對(duì)象反復(fù)測量值的一致性。正確度:被測值與其“真值”的接近程度。

精確度:一致性以及與其“真值”的接近程度。

從測量誤差的角度來說,精確度是測得值的隨機(jī)誤差和系統(tǒng)誤差的綜合反映。第十二頁,共二十七頁,編輯于2023年,星期二第三節(jié)醫(yī)學(xué)信息

有關(guān)信息的定義至今多達(dá)百余種。從信息論的角度出發(fā),目前大多數(shù)學(xué)者接受的定義是:“信息具有物質(zhì)屬性,是物質(zhì)的存在方式及運(yùn)動(dòng)的規(guī)律和特點(diǎn)的表征,是事物及其現(xiàn)象的內(nèi)外特征、相互聯(lián)系及作用的反映?!睆牟煌嵌瓤傻贸霾煌亩x。我們介紹幾種具有代表性的觀點(diǎn)。第十三頁,共二十七頁,編輯于2023年,星期二R.V.L.Hartley.TransmissionofInformation.BellSystemTechnicalJournal,7(4):535--563,1928.1928《信息傳輸》:“信息”是符號(hào)。發(fā)信者所發(fā)出的信息,就是從通信符號(hào)表中選擇符號(hào)的具體方式。不管符號(hào)所代表的意義是什么,只要選擇的符號(hào)數(shù)目一定,發(fā)信者發(fā)出的信息的數(shù)量也就確定了。

信息是指有新內(nèi)容、新知識(shí)的消息。首次從通信的角度(1888-1970)

哈特萊第十四頁,共二十七頁,編輯于2023年,星期二香農(nóng)《通信的數(shù)學(xué)理論》——信息論誕生的標(biāo)志信息是通信的內(nèi)容,是“用來消除未來的某種不確定性的東西”,信息的多少反映了消除了的不確定性的大小,即信息是二次不定性之差。不定性就是對(duì)事物認(rèn)識(shí)不清楚,不知道。信息就是消除人們認(rèn)識(shí)上的不定性。

不確定性:對(duì)客觀事物的不了解、不肯定。通信的直接目的就是要消除接受端(信宿)對(duì)于發(fā)出端(信源)可能會(huì)發(fā)出哪些消息的不確定性。1916--2001AMathematicalTheoryofCommunicationintheBellSystemTechnicalJournal(1948).第十五頁,共二十七頁,編輯于2023年,星期二維納NorbertWiener(1894-1964)《人有人的用處—控制論與社會(huì)》1950維納(N.Wiener)將人與外部環(huán)境交換信息的過程看成是一種廣義的通信過程,認(rèn)為信息是人們?cè)谶m應(yīng)客觀世界的過程中與客觀世界進(jìn)行交換的內(nèi)容的名稱,是人與外部世界的中介。如果沒有信息作為中介,人就會(huì)同外部世界隔絕,就不能認(rèn)識(shí)世界和改造世界。信息既不是物質(zhì)又不是能量,信息就是信息。第十六頁,共二十七頁,編輯于2023年,星期二鐘義信信息是事物存在方式或運(yùn)動(dòng)狀態(tài),以及這種方式/狀態(tài)的直接的或間接的表述。從本質(zhì)上講,信息是事物自身顯示其存在方式和運(yùn)動(dòng)狀態(tài)的屬性,是客觀存在的事物現(xiàn)象。信息與認(rèn)知主體有著密切的聯(lián)系,信息必須通過主體的主觀認(rèn)知才能被反映和揭示。第十七頁,共二十七頁,編輯于2023年,星期二信息的性質(zhì)(9個(gè)):

信息的內(nèi)涵及特性很多,一般可以從以下九個(gè)方面描述其信息的性質(zhì)與內(nèi)涵。

(1)信息的相對(duì)性:一方面對(duì)于同一事物,不同的觀察者獲得的信息量是不同的。另一方面,不同的用戶對(duì)信息的認(rèn)識(shí)和需求也是不同的。因此,對(duì)信息系統(tǒng)的開發(fā)既要考慮共性的應(yīng)用,也要考慮個(gè)性化需求。

(2)信息的事實(shí)性:

事實(shí)性是信息最基本的屬性。如果在信息系統(tǒng)中收集的信息不符合事實(shí),則信息毫無價(jià)值。(3)信息的轉(zhuǎn)移性:信息在時(shí)間上或空間上可以從一點(diǎn)轉(zhuǎn)移到另一點(diǎn)。時(shí)間上的轉(zhuǎn)移稱之為儲(chǔ)存,而空間上的轉(zhuǎn)移稱之為通信。第十八頁,共二十七頁,編輯于2023年,星期二(4)信息的變換性:

信息是可以變換的,它可以由不同的載體和不同的方法來載荷。信息的變換性可以根據(jù)不同用戶的不同需求,采用不同的信息表現(xiàn)方式和方法來加工處理。例如,可以采用數(shù)據(jù)二維表的結(jié)構(gòu)方式表達(dá),也可以采用直方圖等直觀方式來表達(dá)。(5)信息的有序性:

信息的有序性,一方面信息可以用來消除系統(tǒng)的不穩(wěn)定性,增加系統(tǒng)的有序性;另一方面信息本身也可根據(jù)一定的規(guī)則進(jìn)行編碼。編碼質(zhì)量的好壞,直接影響系統(tǒng)的穩(wěn)定性和整體質(zhì)量。

(6)信息的動(dòng)態(tài)性:

信息是隨事物變化而改變的客觀反映。這種變化大多數(shù)表現(xiàn)為信息本身內(nèi)容的變化,對(duì)于信息系統(tǒng)來講,就是增加記錄、修改記錄或者刪除記錄。進(jìn)而要求整個(gè)信息系統(tǒng)也要做相應(yīng)的調(diào)整和對(duì)信息進(jìn)行加工處理。第十九頁,共二十七頁,編輯于2023年,星期二(7)信息的時(shí)效性:信息是有壽命的。脫離了事物源的信息,因?yàn)椴辉倌軌蚍从匙兓说氖挛锏男碌臓顟B(tài)和本質(zhì),它的效用就會(huì)逐漸減低,直至信息效用完全喪失。在開發(fā)信息系統(tǒng)時(shí),要充分注意信息系統(tǒng)的響應(yīng)速度,以保證處理信息的同步,確保信息的真實(shí)有效性。例如,天氣預(yù)報(bào)信息就必須保證提前獲知,才會(huì)產(chǎn)生社會(huì)的和經(jīng)濟(jì)的價(jià)值。(8)信息的共享性:信息可以被無限制的復(fù)制、傳播或分配給眾多用戶,為大家而共享?;谶@一特點(diǎn),就要求信息的錄入、加工、傳輸、存儲(chǔ)、復(fù)制等所有的處理環(huán)節(jié)確保信息的準(zhǔn)確性,又要求信息系統(tǒng)處理的高效率。這樣真實(shí)有效的信息才能夠?yàn)楦嗟挠脩艄蚕怼?/p>

(9)信息的可轉(zhuǎn)化性:信息在一定的條件下,可以轉(zhuǎn)化為物質(zhì)、能量、時(shí)間或其他,其中最主要的條件是被人們合理而有效的利用,達(dá)到知而獲智。信息的利用才能產(chǎn)生知識(shí)的積累,才能轉(zhuǎn)化成為知識(shí)經(jīng)濟(jì)。

第二十頁,共二十七頁,編輯于2023年,星期二為了更好地掌握信息的內(nèi)涵,我們需要引進(jìn)一個(gè)概念--全信息:即同時(shí)考慮到事物存在方式和運(yùn)動(dòng)狀態(tài)的外在形式、內(nèi)在含義和效用價(jià)值的認(rèn)識(shí)論層次上的信息。僅考慮形式因素的信息——語法信息僅考慮內(nèi)容因素的信息——語義信息僅考慮效用因素的信息——語用信息第二十一頁,共二十七頁,編輯于2023年,星期二包括兩種基本的類型:病人信息(patient-specific):信息來自于病人治療。如數(shù)值、文本、圖像。知識(shí)信息(knowledge-based):有關(guān)于醫(yī)療保健的科學(xué)文獻(xiàn)。即以研究和實(shí)踐為基礎(chǔ)的科學(xué)知識(shí)紀(jì)錄。

一、醫(yī)學(xué)信息的類型2023/6/822第二十二頁,共二十七頁,編輯于2023年,星期二二、信息量的計(jì)算根據(jù)香農(nóng)的定義,一條消息的信息含量的計(jì)算公式

I=log(I/p)=-logP0≤P≤II是一條消息的信息含量,以比特(bit)方式表示P表示的是一條信息發(fā)生的概率第二十三頁,共二十七頁,編輯于2023年,星期二三個(gè)概念比特(bit):英語Binarydigit(二進(jìn)制數(shù))位的縮寫,是

數(shù)學(xué)家JohnWilderTukey提議的術(shù)語。這個(gè)術(shù)語第一次被正式使用,是在香農(nóng)著名的《信息論》,即《通信的數(shù)學(xué)理論》(AMathematicalTheory

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論