版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
中醫(yī)藥學(xué)語言系統(tǒng)賈李蓉中國中醫(yī)科學(xué)院中醫(yī)藥信息研究所Email:jialr@163.com前言從20世紀(jì)80年代起,由于生物醫(yī)學(xué)信息量不斷增加,且分散于各個(gè)數(shù)據(jù)庫系統(tǒng),因此要檢索完整而新穎的信息很不容易,于是統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)應(yīng)運(yùn)而生。1986年美國國立醫(yī)學(xué)圖書館(NationalLibraryofMedicine,NLM)主持了一項(xiàng)長期研究和開發(fā)計(jì)劃,即統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)(UnifiedMedicalLanguageSystem,UMLS)。其目的是在于提升系統(tǒng)之能力,使系統(tǒng)能了解讀者在生物醫(yī)學(xué)方面的問題,并進(jìn)而幫助讀者檢索及整合相關(guān)信息。近年來,由于中醫(yī)藥學(xué)信息量的不斷增多,且各種概念不規(guī)范不統(tǒng)一,因而給中醫(yī)藥信息查詢帶來了多重的困難。在此形勢下,中國中醫(yī)研究院主持開發(fā)了中醫(yī)藥學(xué)語言系統(tǒng)。
統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)(UnifiedMedicalLanguageSystem,UMLS)中醫(yī)藥學(xué)語言系統(tǒng)(TCMLanguageSystem,TCMLS)2.背景:統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)2.1.統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)研制的目的和意義2.2.統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)的發(fā)展階段2.3.統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)的組成2.4.統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)的發(fā)展策略與開發(fā)原則2.5.統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)的應(yīng)用2.1.統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)研制的目的和意義美國國立醫(yī)學(xué)圖書館自1986年開始研制統(tǒng)一的醫(yī)學(xué)語言系統(tǒng),其目的在于克服計(jì)算機(jī)生物醫(yī)學(xué)信息檢索中相同的概念具有不同的表達(dá)方式、有用的信息分散在不同的數(shù)據(jù)庫系統(tǒng)中所造成的查詢困難。統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)是計(jì)算機(jī)化的情報(bào)檢索語言集成系統(tǒng),它不僅是語言翻譯、自然語言處理及語言規(guī)范化的工具,而且是實(shí)現(xiàn)跨數(shù)據(jù)庫檢索的詞匯轉(zhuǎn)換系統(tǒng),它可以幫助用戶在聯(lián)接情報(bào)源,包括數(shù)字化的病案記錄、書目數(shù)據(jù)庫、事實(shí)數(shù)據(jù)庫以及專家系統(tǒng)的過程中,對其中的電子式生物醫(yī)學(xué)情報(bào)作統(tǒng)一的檢索。
2.2.統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)的發(fā)展階段1986~1988年統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)的初始階段1989~1991年統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)的發(fā)展階段
1992年至今統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)的應(yīng)用階段1986~1988年為統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)的初始階段,其研究和開發(fā)的重點(diǎn)是調(diào)查用戶需求、開發(fā)研究工具、確定統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)的性能及其實(shí)施方案、界定系統(tǒng)組成等。在此階段主要界定了統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)的三個(gè)組成部分即超級(jí)敘詞表、語義網(wǎng)絡(luò)、情報(bào)源圖譜,并且進(jìn)行了包括MeSH(MedicalSubjectHeadings)、SNOMED(SystematizedNomenclatureofMedicine)、CMIT(CurrentMedicalInformationandTerminology)和PDQ(Physicians'DataQuery)詞表在內(nèi)的聯(lián)接試驗(yàn)。1989~1991年為統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)的發(fā)展階段其開發(fā)的重點(diǎn)是迅速研制和發(fā)行三個(gè)統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)產(chǎn)品的試驗(yàn)版,同時(shí)繼續(xù)開展用戶調(diào)查和統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)功能開發(fā)。1990年秋,美國國立醫(yī)學(xué)圖書館發(fā)行了超級(jí)敘詞表和語義網(wǎng)絡(luò)第一版的CD-ROM;一年后,發(fā)行了試驗(yàn)版的情報(bào)源圖譜和更新版的超級(jí)敘詞表和語義網(wǎng)絡(luò),同時(shí)獲得了大量的反饋信息,促進(jìn)了統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)的研究與開發(fā)。1992年至今為統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)的應(yīng)用階段其研究的重點(diǎn)是圍繞統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)所進(jìn)行應(yīng)用開發(fā),不斷擴(kuò)展和修訂統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)的三個(gè)組成部分,發(fā)行修訂統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)三個(gè)組成部分的年度版,建立健全產(chǎn)品體系。
1996年統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)新增了一個(gè)組成部分,即“專家詞典”(SpecialistLexicon)。在此階段,許多研究機(jī)構(gòu)利用統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)進(jìn)行了基于Internet的應(yīng)用開發(fā),如決策支持系統(tǒng)(DXplain)、文獻(xiàn)檢索系統(tǒng)(WebMedline)、臨床Web搜索系統(tǒng)(Clinweb)、醫(yī)學(xué)世界檢索(medicalworldsearch)以及集成化的
Medweave等。除了以CD-ROM方式發(fā)行其產(chǎn)品外,1995年美國國立醫(yī)學(xué)圖書館在Internet上建立了統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)知識(shí)源服務(wù)器,通過Internet,加強(qiáng)國際交流與合作。從此,統(tǒng)一的醫(yī)學(xué)語言系統(tǒng)由試驗(yàn)階段進(jìn)入到產(chǎn)品發(fā)行、維護(hù)和應(yīng)用的階段。2.3.統(tǒng)一的醫(yī)學(xué)學(xué)語言系統(tǒng)統(tǒng)的組成超級(jí)敘詞表表(Metathesaurus)語義網(wǎng)絡(luò)(SemanticNetwork)專家詞典(SpecialistLexicon)情報(bào)源圖譜(InformationSourcesMap,ISM)多元系統(tǒng)(MetamorphoSys)超級(jí)敘詞表超級(jí)敘詞表可可視為一個(gè)概概念名詞的知知識(shí)庫,是由由生物醫(yī)學(xué)領(lǐng)領(lǐng)域中許多不不同索引典或或分類表中所所抽取出來的的詞目所組成成。超級(jí)敘詞表是是生物醫(yī)學(xué)概概念、術(shù)語、、詞匯及其等等級(jí)范疇的廣廣泛集成。1997年第第8版的超級(jí)級(jí)敘詞表收錄錄了來源于30多種生物物醫(yī)學(xué)詞表和和分類表的、、能表達(dá)33萬多個(gè)概念念的739439個(gè)詞匯匯;到目前超級(jí)敘敘詞表收錄了了100多萬個(gè)個(gè)生物醫(yī)學(xué)概概念、共500多萬個(gè)個(gè)詞。這些概念和和詞來自100多個(gè)生生物醫(yī)學(xué)受控控詞表、術(shù)語語表、分類表表、專家系統(tǒng)統(tǒng)中的詞匯、、詞典及工具具性詞表等,如醫(yī)學(xué)主主題詞詞表((MedicalSubjectHeadings,MeSH)及及其葡萄牙語語、西班牙語語、法語、德德語、俄語等等各種譯本、、醫(yī)學(xué)系統(tǒng)術(shù)術(shù)語表(SystematizedNomenclatureofMedicine,SNOMED)、國國際疾病分類類修訂第10版(InternationalClassificationofDiseases,10thRevision,ICD-10)及其其他各版、LOINC((LogicalObservationIdentifiersNamesandCodes)、臨臨床藥物標(biāo)準(zhǔn)準(zhǔn)術(shù)語(RxNorm))等。超級(jí)敘詞表是是依據(jù)概念((concept)或涵義義(meaning)組組織起來的,,其根本目的的是將相同概概念的交替名名稱和不同形形式聯(lián)系在一一起,并識(shí)別別不同概念之之間的聯(lián)系。。因此,可以以說概念是超超級(jí)敘詞表組組織系統(tǒng)的中中心。對于同一概念念的不同術(shù)語語以及不同的的變異形式,,超級(jí)敘詞表表采用三級(jí)結(jié)結(jié)構(gòu)模式,即即概念(I級(jí)級(jí))→術(shù)語(II級(jí))→詞串(III級(jí)),,將一個(gè)概念念的多種不同同術(shù)語連同多多個(gè)變異詞串串有序地組織織在一起。對對于不同的概概念,超級(jí)敘敘詞表采用多多種“關(guān)系”概念念如相關(guān)概念念、組配概念念、共現(xiàn)概念念等來描述不不同概念之間間的關(guān)系。語義網(wǎng)絡(luò)語義網(wǎng)絡(luò)是為為建立概念、、術(shù)語間錯(cuò)綜綜復(fù)雜的關(guān)系系而設(shè)計(jì)的,,它為超級(jí)敘敘詞表中所有有概念提供了了語義類型、、語義關(guān)系和和語義結(jié)構(gòu)。。語義網(wǎng)絡(luò)包包括了135種語義義類型和54種語義關(guān)系系。語義網(wǎng)絡(luò)是通通過135種種語義類型,為出現(xiàn)在超超級(jí)敘詞表中中的所有概念念提供一種目目錄組織結(jié)構(gòu)構(gòu)。語義類型型之間的54種連接關(guān)系系為這種組織織結(jié)構(gòu)提供構(gòu)構(gòu)架,并代表表生物醫(yī)學(xué)領(lǐng)領(lǐng)域中的重要要相互關(guān)系。。語義網(wǎng)網(wǎng)絡(luò)為為超級(jí)級(jí)敘詞詞表提提供了了指定定給每一個(gè)個(gè)概念念至少少一種種語義義類型型的信息息,同時(shí)時(shí)語義義類型型也指指定給給情報(bào)報(bào)源圖圖譜中中特定定的數(shù)數(shù)據(jù)庫庫,以以表達(dá)達(dá)情報(bào)報(bào)資源源之間間的內(nèi)內(nèi)在聯(lián)聯(lián)系。。也就就是說說,語義網(wǎng)網(wǎng)絡(luò)是是試圖圖建立立一種種語義義類型型及其其相互互關(guān)系系的權(quán)權(quán)威規(guī)規(guī)則,用以標(biāo)標(biāo)引每每一個(gè)個(gè)超級(jí)級(jí)敘詞詞概念念,或表表達(dá)概概念之之間可可能存存在的的相互互關(guān)系系。語義義網(wǎng)絡(luò)絡(luò)的這這種權(quán)權(quán)威規(guī)規(guī)則,既在在文字字上,也從從等級(jí)級(jí)關(guān)系系或非非等級(jí)級(jí)關(guān)系系上界界定語語義類類型及及其相相互間間可能能存在在的關(guān)關(guān)系與與內(nèi)在在涵義義。語義類類型是是通過過計(jì)算算機(jī)程程序指指定的的或在在人工工復(fù)審審過程程中增增加的的,它它既是是超級(jí)級(jí)敘詞詞表與與語義義網(wǎng)絡(luò)絡(luò)之間間的連連接,,也是是超級(jí)級(jí)敘詞詞表與與情報(bào)報(bào)源圖圖譜的的連接接之一一。目目前語語義類類型主主要分分為生生物體體、解解剖結(jié)結(jié)構(gòu)、、生物物功能能、化化學(xué)、、事件件、客客觀物物體、、概念念和觀觀念等等。各各類范范疇深深度不不一。。在實(shí)實(shí)際應(yīng)應(yīng)用中中,語語義類類型不不斷完完善和和擴(kuò)展展。UI:T048STY:MentalorBehavioralDysfunction((心心理或或行為為功能能失調(diào)調(diào))Definition:Aclinicallysignificantdysfunctionwhosemajormanifestationisbehavioralorpsychological.Thesedysfunctionsmayhaveidentifiedorpresumedbiologicaletiologiesormanifestations.表現(xiàn)為為行為為性或或精神神性的的具有有臨床床意義義的功功能失失調(diào),,這些些功能能失調(diào)調(diào)可能能曾被被認(rèn)為為或被被假定定為生生物學(xué)學(xué)病因因或生生物學(xué)學(xué)表現(xiàn)現(xiàn)。Examples:MemoryDisorders(記憶混混亂);Agoraphobia(廣場恐怖怖癥);Hallucinations(幻覺));CyclothymicDisorder(循環(huán)情情感性精精神障礙礙)語義類型型是語義義網(wǎng)絡(luò)的的節(jié)點(diǎn),,節(jié)點(diǎn)與與節(jié)點(diǎn)之之間的關(guān)關(guān)系即為為語義關(guān)關(guān)系。最最基本的的語義關(guān)關(guān)系是“isa”關(guān)系系,通過過它建立立了節(jié)點(diǎn)點(diǎn)與節(jié)點(diǎn)點(diǎn)之間的的一種等等級(jí)關(guān)系系,這種種等級(jí)關(guān)關(guān)系的最最大特性性是它的的繼承性性,即下下一級(jí)節(jié)節(jié)點(diǎn)對上上一級(jí)節(jié)節(jié)點(diǎn)的繼繼承關(guān)系系。除了了‘isa”關(guān)系系外,還還有53種語語義關(guān)系系,它們們均是非非等級(jí)關(guān)關(guān)系,這這些關(guān)系系可以出出現(xiàn)在任任何一級(jí)級(jí)節(jié)點(diǎn)上上,表示示一種可可能、允允許的關(guān)關(guān)系。等級(jí)關(guān)系系鏈isa相關(guān)關(guān)系系鏈associated_with物理上相相關(guān)(physicallyrelatedto))功能上相相關(guān)(functionallyrelatedto)概念上相相關(guān)(conceptuallyrelatedto)空間上相相關(guān)(Spatiallyrelatedto)時(shí)間上相相關(guān)(temporallyrelatedto))H.等級(jí)關(guān)系鏈isa
R.相關(guān)關(guān)系鏈
(1)物理上相關(guān)
1.…的部分
2.由…組成
3.包含
4.與…相連
5.分開
(2.)空間上相關(guān)
1.位于…
2.與…相鄰
3.包圍,周圍
4.穿過
(3)功能上相關(guān)
1.影響
1.1管理
1.2治療1.3干擾
1.4并發(fā)
1.5與…相互作用
1.6預(yù)防
2.帶來、造成
2.1產(chǎn)生
2.2引起
3.執(zhí)行
3.1實(shí)施
3.2展示
3.3練習(xí)
4.發(fā)生于…情況下
4.1.…的進(jìn)程
5.使用
6.現(xiàn)象表達(dá)
7.證實(shí)
8.…的結(jié)果、效果(4)時(shí)間上相關(guān)
1.與…同時(shí)發(fā)生
2.先于…發(fā)生
(5)概念上相關(guān)
1.…的評價(jià)
2.…的程度、等級(jí)
3.分析
3.1分析評估…的影響
4.…的測量值
5.測量
6.診斷
7.…的特性
8.…衍生的
9.…的發(fā)育階段
10.…的方法
11.…的概念部分
12.…之中的焦點(diǎn)問題語義類型型和語義義關(guān)系構(gòu)構(gòu)成網(wǎng)狀狀的語義義結(jié)構(gòu),,它起著著統(tǒng)領(lǐng)超超級(jí)敘詞詞表概念念的作用用。因?yàn)闉槌?jí)敘敘詞表的的概念來來自許多多不同的的詞表,,它們有有各自的的結(jié)構(gòu)體體系,語語義網(wǎng)絡(luò)絡(luò)將全部部概念劃劃分成許許多組,,每一組組共享幾幾種特定定的語義義類型,,語義類類型又共共享幾種種語義關(guān)關(guān)系,這這樣概念念不僅高高度結(jié)構(gòu)構(gòu)化而且且廣泛聯(lián)聯(lián)系。語義關(guān)系系的等級(jí)級(jí)繼承規(guī)規(guī)則和繼繼承阻斷斷在語義類類型等級(jí)級(jí)結(jié)構(gòu)的的高層節(jié)節(jié)點(diǎn)之間間的語義義關(guān)系,,在任何何可能的的情況下下都是固固定的,,正如語語義關(guān)系系“影響響”鏈接接的這些些高層語語義類型型節(jié)點(diǎn)。。而且高高層語義義類型之之間的語語義關(guān)系系,一般般地可通通過等級(jí)級(jí)結(jié)構(gòu)(isa鏈)繼承給這這些節(jié)點(diǎn)點(diǎn)的所有有子類。。在有些情情況下,,如果按按照語義義類型的的等級(jí)結(jié)結(jié)構(gòu)及鏈鏈的繼承承規(guī)則,,會(huì)使語語義類型型與語義義關(guān)系的的連接產(chǎn)產(chǎn)生歧義義。例如如,語義義關(guān)系““…的進(jìn)程””存在于于語義類類型“生生物體功功能”和和“生物物體”之之間,““生物體體功能””有一個(gè)個(gè)子類是是“心理理功能””,而植植物也是是一種““生物體體”,按按照繼承承規(guī)則,,心理過過程也是是一種““植物的的活動(dòng)、、功能或或狀態(tài)””,顯然然,植物物不可能能有“心心理過程程”。不不能繼承承的鏈稱稱為阻斷斷。語義網(wǎng)絡(luò)絡(luò)使概念念之間語語義關(guān)系系的準(zhǔn)確確細(xì)致表表達(dá)MeSH樹狀范圍圍表所表表達(dá)的MeSH上位詞與與下位詞詞之間的的關(guān)系,,只是簡簡單的較較泛指與與較專指指關(guān)系。。例如,,MeSH“羊水”(Amnioticfluid)是MeSH“胚胎”(Embryo)的一個(gè)下下位詞::EmbryoA16.254
AmnioticfluidA16.254.72在UMLS語義網(wǎng)絡(luò)絡(luò)中,Embryo標(biāo)引的語語義類型型是“胚胚胎結(jié)構(gòu)構(gòu)”(Embryonicstructure),Amnioticfluid標(biāo)引的語語義類型型是“機(jī)機(jī)體物質(zhì)質(zhì)”(BodySubstance),語義關(guān)關(guān)系標(biāo)引引的是““周圍””(Surround)。所以““羊水””與“胚胚胎”之之間的關(guān)關(guān)系就被被確切地地表達(dá)為為“胚胎胎結(jié)構(gòu)周周圍的機(jī)機(jī)體物質(zhì)質(zhì)”。專家詞典典專家詞典典是一個(gè)個(gè)包含眾眾多生物物醫(yī)學(xué)詞詞匯的英英語詞典典。它是是在美國國國立醫(yī)醫(yī)學(xué)圖書書館自然然語言處處理專家家系統(tǒng)項(xiàng)項(xiàng)目基礎(chǔ)礎(chǔ)上開發(fā)發(fā)出來的的。專家家詞典約約有183000條條詞匯記記錄,共共292000多個(gè)詞詞。每條詞匯匯記錄均均記錄了了它的句句法、詞詞法和字字法信息息。詞條條由詞或或詞組組組成。所所有詞條條均共享享它們的的基本形形式和拼拼寫變異異。詞的的基本形形式包括括詞的不不變形式式、名詞詞的單數(shù)數(shù)形式、、動(dòng)詞的的原形以以及形容容詞和副副詞的原原級(jí)形式式。詞匯信息息包括句句法分類類、詞形形變異以以及詞的的補(bǔ)充成成份。詞詞形變異異有名詞詞的單復(fù)復(fù)形式、、動(dòng)詞的的規(guī)則與與不規(guī)則則變化形形式、形形容詞和和副詞的的原級(jí)、、比較級(jí)級(jí)、最高高級(jí)形式式等。專專家詞典典能識(shí)別別11種種句法分分類和引引語部分分:動(dòng)詞詞、名詞詞、形容容詞、副副詞、助助詞、語語氣詞、、代詞、、介詞、、連詞、、補(bǔ)語、、定語。。專家詞典典包括一一組詞典典程序,,它們可可以確定定英語詞詞匯的范范圍以及及識(shí)別生生物醫(yī)學(xué)學(xué)術(shù)語和和文本詞詞的詞形變變異。還還包括三三個(gè)索引引:①超級(jí)敘敘詞表中中所有詞詞串的單單個(gè)詞索索引;②②標(biāo)準(zhǔn)詞詞索引;;③標(biāo)準(zhǔn)準(zhǔn)詞串索索引。專家詞典典包括四四個(gè)詞匯匯數(shù)據(jù)庫庫:①已已知詞源源變異文文檔,如如“aphasic[?’feizik]n.adj.患失語癥癥者失失語癥的的”與“aphasia[?’’feizi??]n.失語癥癥”;②密切切相關(guān)關(guān)詞文文檔。。密切切相關(guān)關(guān)詞是是意義義相同同但句句法分分類不不同的的詞,,如肝細(xì)胞胞“hepatocellular””與“l(fā)ivercells”;;③拼寫寫變異異文檔檔,如如“foetal[‘fi:tl]”與“fetal”;;④意義義相近近但構(gòu)構(gòu)詞形形式不不同的的詞文文檔,,如““heart”與與“cardi(o)”。情報(bào)源源圖譜譜情報(bào)源源圖譜譜是一一個(gè)關(guān)關(guān)于生生物醫(yī)醫(yī)學(xué)機(jī)機(jī)讀情情報(bào)資資源的的數(shù)據(jù)據(jù)庫,,其目目的是是利用用超級(jí)級(jí)敘詞詞表和和語義義網(wǎng)絡(luò)絡(luò)實(shí)現(xiàn)現(xiàn)以下下功能能:測測度情情報(bào)源源與特特定提提問的的相關(guān)關(guān)性,,以便便選取取最合合適的的情報(bào)報(bào)源;;為用用戶提提供特特定情情報(bào)源源的范范圍、、功能能和檢檢索條條件等等人工工可讀讀的信信息;;自動(dòng)動(dòng)連接接相關(guān)關(guān)情報(bào)報(bào)源;;在一一個(gè)或或多個(gè)個(gè)情報(bào)報(bào)源中中自動(dòng)動(dòng)檢索索并自自動(dòng)組組織檢檢索的的結(jié)果果。在情報(bào)報(bào)源圖圖譜中中,從從4個(gè)個(gè)方面面對情情報(bào)源源進(jìn)行行標(biāo)引引:①超級(jí)級(jí)敘詞詞表中中的MeSH詞詞表;;②超級(jí)級(jí)敘詞詞表中中的主主題詞詞和副副主題題詞組組配;;③統(tǒng)統(tǒng)一的的醫(yī)學(xué)學(xué)語言言系統(tǒng)統(tǒng)語義義網(wǎng)絡(luò)絡(luò)的語語義類類型;;④統(tǒng)統(tǒng)一的的醫(yī)學(xué)學(xué)語言言系統(tǒng)統(tǒng)語義義網(wǎng)絡(luò)絡(luò)的語語義關(guān)關(guān)系。。多元系系統(tǒng)((MetamorphoSys)多元系系統(tǒng)是是統(tǒng)一一的醫(yī)醫(yī)學(xué)語語言系系統(tǒng)新新建立立的一一個(gè)可可以為為用戶戶提供供個(gè)性性化服服務(wù)的的系統(tǒng)統(tǒng)。它它包含含統(tǒng)一一的醫(yī)醫(yī)學(xué)語語言系系統(tǒng)的的所有有版本本。可可以安安裝一一個(gè)或或多個(gè)個(gè)統(tǒng)一一的醫(yī)醫(yī)學(xué)語語言系系統(tǒng)的的知識(shí)識(shí)資源源。如如果用用戶選選擇統(tǒng)統(tǒng)一的的醫(yī)學(xué)學(xué)語言言系統(tǒng)統(tǒng)的超超級(jí)敘敘詞表表,用用戶可可以指指定一一個(gè)用用戶化化的超超級(jí)敘敘詞表表的子子集。。系統(tǒng)統(tǒng)可以以排除除不必必要的的或者者是本本地用用戶不不許可可的詞詞匯,,還可可以從從大量量的數(shù)數(shù)據(jù)中中進(jìn)行行選擇擇和過過濾。。2.4.統(tǒng)一的醫(yī)學(xué)學(xué)語言系統(tǒng)統(tǒng)的發(fā)展策策略與開發(fā)發(fā)原則多學(xué)科、多多研究小組組協(xié)同開發(fā)發(fā)原則集中開發(fā)與與分散開發(fā)發(fā)相結(jié)合的的原則資金保障原原則2.5.統(tǒng)一的醫(yī)學(xué)學(xué)語言系統(tǒng)統(tǒng)的應(yīng)用電子數(shù)據(jù)處處理系統(tǒng)管理信息系系統(tǒng)決策支持系系統(tǒng)統(tǒng)一的醫(yī)學(xué)學(xué)語言系統(tǒng)統(tǒng)可將分散散的情報(bào)源源集成為統(tǒng)統(tǒng)一的機(jī)讀讀生物醫(yī)學(xué)學(xué)信息資源源,大大提高高了信息檢檢索系統(tǒng)的的效率。目目前已被廣廣泛應(yīng)用于于信息系統(tǒng)統(tǒng)的智能化化檢索、自自然語言系系統(tǒng)研究、、專業(yè)詞表表的編制、、自動(dòng)標(biāo)引引、醫(yī)學(xué)專專業(yè)搜索引引擎的開發(fā)發(fā)、醫(yī)學(xué)圖圖像的描述述及獲取、、課程分析析等方面。。統(tǒng)一的醫(yī)學(xué)學(xué)語言系統(tǒng)統(tǒng)在電子數(shù)數(shù)據(jù)處理系系統(tǒng)的應(yīng)用用主要表現(xiàn)現(xiàn)在電子病病案系統(tǒng)。。荷蘭Erasmus大學(xué)(Rotterdam)ErikMvanMulligen計(jì)劃開開發(fā)一個(gè)通通過統(tǒng)一的的醫(yī)學(xué)語言言系統(tǒng)獲取取CPR((TheCenterForPublicResources))數(shù)據(jù)的系系統(tǒng)。美國國護(hù)理學(xué)會(huì)會(huì)(TheAmericanNursesAssociation,ANA)開開發(fā)了一個(gè)個(gè)基于統(tǒng)一一的醫(yī)學(xué)語語言系統(tǒng)的的CPR數(shù)數(shù)據(jù)系統(tǒng)。。UMLS地址:3.中醫(yī)藥學(xué)語語言系統(tǒng)簡簡介3.1.背景3.2.設(shè)計(jì)思想及及原則3.3.組成語言系統(tǒng)的的建立是自自然語言處處理的基礎(chǔ)礎(chǔ)研究,國國外從20世紀(jì)90年代起進(jìn)入入高峰研究究期,并取取得了重大大的進(jìn)展。。美國國家家圖書館建建立的語言言支持系統(tǒng)統(tǒng),為醫(yī)學(xué)學(xué)信息數(shù)字字化及其利利用創(chuàng)造了了條件。中醫(yī)藥學(xué)的的發(fā)展同樣樣需要語言言系統(tǒng)的支支持,因此此建立中醫(yī)醫(yī)藥語言系系統(tǒng)是中醫(yī)醫(yī)藥信息學(xué)學(xué)需要研究究的主要問問題之一。。3.1.中醫(yī)藥語言言系統(tǒng)背景景中醫(yī)藥語言現(xiàn)狀(現(xiàn)代文獻(xiàn)獻(xiàn)收詞已超過60萬條)多樣性(同同名異物))(異物同名名)無標(biāo)準(zhǔn)化((缺少國標(biāo)標(biāo))無統(tǒng)一機(jī)讀讀詞庫缺少系統(tǒng)結(jié)結(jié)構(gòu)中醫(yī)藥學(xué)科科歷經(jīng)千年年,產(chǎn)生了了大量的概念與術(shù)語語,多種語義義詞匯差異異,阻礙了了中醫(yī)藥數(shù)數(shù)字化的發(fā)發(fā)展。數(shù)據(jù)DATA知識(shí)KNOWLEDGE挖掘MINING百科全書及及中英詞典典等術(shù)語、、名詞。中醫(yī)藥學(xué)科科收詞:中中醫(yī)藥學(xué)教教材、辭典典、專家詞詞典。臨床病例與與臨床用語語收詞。相關(guān)學(xué)科::名詞委與與醫(yī)學(xué)、生生物、化學(xué)學(xué)等相關(guān)收收詞。古文獻(xiàn)收詞詞:中醫(yī)藥藥學(xué)科古文文獻(xiàn)中收詞詞。中醫(yī)藥及中中醫(yī)藥相關(guān)關(guān)的可控詞詞表。國家標(biāo)準(zhǔn)中中的中醫(yī)與與中藥相關(guān)關(guān)名詞與術(shù)術(shù)語。國際醫(yī)學(xué)相相關(guān)標(biāo)準(zhǔn)及及國際專業(yè)業(yè)與中醫(yī)藥藥相關(guān)的可可控詞表。。痛苦:太多同物異異名、同名名異物,無無法作出正正確判斷??!為什么要建建立TCMLS?國際醫(yī)學(xué)詞詞典等。3.2設(shè)計(jì)思想中醫(yī)藥學(xué)語語言系統(tǒng)是是依照中醫(yī)醫(yī)藥語言特特點(diǎn)及學(xué)科科體系、按按照本體論論原理設(shè)計(jì)計(jì)而研制的的語言系統(tǒng)統(tǒng),其目的的是為中醫(yī)醫(yī)藥學(xué)科的的數(shù)字化與與標(biāo)準(zhǔn)化提提供必要的的工具,解解決相同的的概念具有有不同的表表達(dá)方式,,同樣的表表達(dá)形式表表示不同的的概念;同同時(shí)利用本本系統(tǒng),進(jìn)進(jìn)一步提示示中醫(yī)藥學(xué)學(xué)概念間的的相互關(guān)聯(lián)聯(lián)。中醫(yī)藥藥學(xué)一體化化語言系統(tǒng)統(tǒng)是個(gè)繁雜雜龐大的系系統(tǒng),其基基本設(shè)計(jì)思思路是借鑒鑒美國統(tǒng)一一的醫(yī)學(xué)語語言系統(tǒng)的的原理與構(gòu)構(gòu)架,將中中醫(yī)藥學(xué)概概念中隱含含的各種語語義關(guān)系全全部提取出出來,形成成關(guān)系表,,并以此為為中心,建建立學(xué)科術(shù)術(shù)語概念與與概念、概概念與名詞詞、概念與與含義、名名詞與名詞詞之間的內(nèi)內(nèi)在聯(lián)系,,形成一個(gè)個(gè)網(wǎng)狀的信信息表示結(jié)結(jié)構(gòu)。方法:從四方方面入手研究究中醫(yī)藥一體化語言中醫(yī)藥一體化化語言系統(tǒng)系統(tǒng)中醫(yī)藥為核心心以中醫(yī)藥為核核心,其他學(xué)學(xué)科疊加:中中醫(yī)藥信息化化過程中使用與與利用的所有有相關(guān)的學(xué)科科與概念、術(shù)術(shù)語中醫(yī)藥語言結(jié)結(jié)構(gòu)體系一體體化:建立、、融入中醫(yī)藥術(shù)語表表達(dá)方式一體體化:詞條屬屬性中醫(yī)藥概念定定義與釋義形形式一體化::回答是什什么、關(guān)聯(lián)關(guān)系是什什么、學(xué)科中中的位置是什什么相同概念詞一一體化:無論論文字、圖表表、正名與異名、正確與與誤用海量語言術(shù)語語集成為基礎(chǔ)礎(chǔ):制定收詞詞范圍、順序序規(guī)范化網(wǎng)狀結(jié)結(jié)構(gòu)解釋概念念的語義歸類類與關(guān)聯(lián):多水平控制::詞匯、形態(tài)態(tài)、語義、語語用;本體論與詮釋釋論相結(jié)合設(shè)計(jì)分層結(jié)構(gòu)構(gòu)與網(wǎng)狀立體體結(jié)構(gòu);符合語言體系系,限定與約約定復(fù)雜度;;采用歸納定性性,將同類事事物合并;參照UMLS的整體結(jié)構(gòu),,保持兼容性性與包容性;;系統(tǒng)保持靈活活性與可擴(kuò)展展性;Protégé程序3.2設(shè)計(jì)原則系統(tǒng)設(shè)計(jì)以中中醫(yī)藥學(xué)科為為核心,保持持中醫(yī)藥學(xué)科科的特性系統(tǒng)設(shè)計(jì)體現(xiàn)現(xiàn)學(xué)科相關(guān)性性與包容性系統(tǒng)設(shè)計(jì)符合合語言體系系統(tǒng)設(shè)計(jì)采用用語義歸納方方法,將同類類事物合并定定性系統(tǒng)設(shè)計(jì)參照照統(tǒng)一的醫(yī)學(xué)學(xué)語言系統(tǒng)的的結(jié)構(gòu),保持持系統(tǒng)的兼容容性系統(tǒng)保持靈活活性與可擴(kuò)展展性研究內(nèi)容:設(shè)計(jì)詞條屬性結(jié)構(gòu)總體系統(tǒng)設(shè)計(jì)概念詞屬性定義四種可控詞表的結(jié)構(gòu)比較中醫(yī)藥概念的的語義類型設(shè)計(jì)計(jì)(127種)建立中醫(yī)藥一級(jí)分類體系系(16)中醫(yī)藥語義的的關(guān)聯(lián)關(guān)系(58種)事件與物質(zhì)二大類的結(jié)構(gòu)構(gòu)展開以中醫(yī)五、六六版教材的學(xué)科分分類為依據(jù)立體表達(dá)關(guān)系系等級(jí)關(guān)系相關(guān)關(guān)系(時(shí)時(shí)間、空間、概概念、功能、物物理)完成概念詞屬性設(shè)計(jì)語料庫(收詞40萬)語義關(guān)聯(lián)關(guān)系系(127萬)中醫(yī)學(xué)科結(jié)構(gòu)構(gòu)標(biāo)準(zhǔn)詞典教材臨床術(shù)語其他定義實(shí)現(xiàn)語義表達(dá)語言集成與規(guī)規(guī)范建立數(shù)據(jù)庫庫基礎(chǔ)語言平平臺(tái)共享平臺(tái)檢索索查詢應(yīng)用工工具數(shù)據(jù)挖掘與知知識(shí)再現(xiàn)支撐撐條件數(shù)據(jù)分發(fā)(十十三家)Templates數(shù)據(jù)加工DATADATADATA合并整理學(xué)科分類語義提取數(shù)據(jù)查詢LogTCMLS平臺(tái)選取數(shù)據(jù)....標(biāo)準(zhǔn)、教材、、辭典、工具具書、臨床術(shù)術(shù)語…設(shè)計(jì)結(jié)構(gòu)TCMLS的建立流程圖圖中醫(yī)藥一體化化語言系統(tǒng)一一級(jí)學(xué)科分類類(16)1.中醫(yī)基礎(chǔ)理論(包括中醫(yī)生理、心理)BasicmaterialinhumanbodyinChinesemedicine2.中醫(yī)學(xué)說與相關(guān)學(xué)科(包括中醫(yī)各家學(xué)說、中醫(yī)流派、學(xué)術(shù)思想、學(xué)術(shù)觀點(diǎn))RelatedcourseinChinesemedicine3.病因病機(jī)與診斷EtiologicalfactorsandpathogenesisandDiagnosis4.疾?。òㄗC候、癥狀)Chinesemedicinedisease5.治則治法Curativeprinciplesandtherapeuticmethods6.中藥學(xué)(包括藥劑學(xué)、調(diào)劑學(xué)、制劑學(xué)、制藥工藝、工程。注:此類下只包括單味藥)Chineseherbs7.方劑學(xué)(包括中成藥)Prescriptions8.中藥化學(xué)TCDchemical9.藥用動(dòng)植物學(xué)(包括礦物藥、海洋藥、真菌藥等)Medicinalanimalsandplants10.預(yù)防與養(yǎng)生學(xué)(只包括古代氣功部分,不要現(xiàn)代氣功部分)Chinesemedicineprevention11.針灸學(xué)(包括腧穴學(xué)、經(jīng)絡(luò)學(xué))AcupunctureandMoxibustion12.人文科學(xué)Humanities13.醫(yī)學(xué)信息學(xué)與文獻(xiàn)學(xué)MedicalInformaticsandLiteratures14.自然科學(xué)、物理科學(xué)PhysicalSciencesandPhysics15.衛(wèi)生醫(yī)療機(jī)構(gòu)管理OrganizationandAdministration16.地理學(xué)Geography3.3.組成基礎(chǔ)詞庫系統(tǒng)統(tǒng)語義系統(tǒng)基礎(chǔ)詞庫系統(tǒng)統(tǒng)這個(gè)系統(tǒng)是整整個(gè)中醫(yī)藥學(xué)學(xué)語言系統(tǒng)的的核心及最基基本的素材,,是在對現(xiàn)存存各種主題詞詞表、分類表表、數(shù)據(jù)庫、、工具書中有有關(guān)詞匯進(jìn)行行分析、選擇擇和組織的基基礎(chǔ)上產(chǎn)生的的一個(gè)大型詞詞庫。本系統(tǒng)統(tǒng)基礎(chǔ)詞庫涵涵蓋可控詞表表與中醫(yī)藥學(xué)學(xué)科系統(tǒng)及與與中醫(yī)藥學(xué)科科相關(guān)聯(lián)的生生物、植物、、化工等自然然與人文科學(xué)學(xué)專業(yè)詞匯。?;A(chǔ)詞庫建建立在全面、、廣泛、準(zhǔn)確確、嚴(yán)謹(jǐn)?shù)幕A(chǔ)上,最終終形成超級(jí)基基礎(chǔ)詞庫。詞條屬性符合合中醫(yī)藥學(xué)科科自然語言與與可控詞的雙雙重屬性。用用準(zhǔn)確、完整整的方式揭示示與表達(dá)中醫(yī)醫(yī)藥學(xué)科及相相關(guān)術(shù)語。這這個(gè)系統(tǒng)可以以相當(dāng)于統(tǒng)一一的醫(yī)學(xué)語言言系統(tǒng)的超級(jí)級(jí)敘詞表和專專家詞典。其中超級(jí)敘詞詞表部分的收收詞范圍是中中醫(yī)藥及相關(guān)關(guān)的可控詞表表:包括“中國中醫(yī)藥藥學(xué)主題詞表表”、“醫(yī)學(xué)學(xué)主題詞表((MeSH詞表表)”、“《中國圖書館館圖書分類法法·醫(yī)學(xué)專業(yè)分分類表》(第四版))”、“中醫(yī)藥藥學(xué)主題詞表表”等。詞典部分的收收詞范圍包括括:中醫(yī)藥學(xué)學(xué)教材、辭典典、標(biāo)準(zhǔn)、專專家詞典;相相關(guān)學(xué)科(包包括醫(yī)學(xué)、生生物、化學(xué)等等)收詞;中中醫(yī)藥學(xué)古代代文獻(xiàn)收詞;;臨床病例與與臨床用語收收詞;國家標(biāo)標(biāo)準(zhǔn)中的中醫(yī)醫(yī)與中藥相關(guān)關(guān)名詞與術(shù)語語;百科全書書及中英詞典典中的相關(guān)術(shù)術(shù)語、名詞;;國際醫(yī)學(xué)相相關(guān)標(biāo)準(zhǔn)及國國際專業(yè)可控控詞表中相關(guān)關(guān)詞語;國際際醫(yī)學(xué)詞典等等。詞語屬性:概概念為詞條基基本單位,形形成概念(正正名)、字符符串(術(shù)語詞詞)二級(jí)結(jié)構(gòu)構(gòu),分成兩個(gè)個(gè)不同的域值值。不同術(shù)語語表達(dá)同一概概念的詞語要要能連結(jié)在一一起,形成二二者的關(guān)聯(lián)。。例如,“肺”與““華蓋”;““心腎不交””與“水火不不濟(jì)”等同一一概念的兩種種表達(dá)方法。。另外,當(dāng)同同一個(gè)術(shù)語表表示不同的概概念時(shí),采取取的是用定義義區(qū)別,根據(jù)據(jù)定義分類的的原則。如,,“太陽”一一詞,在中醫(yī)醫(yī)藥學(xué)里既可可指太陽穴,,又可指太陽陽經(jīng)。這類詞詞在中醫(yī)藥學(xué)學(xué)的基礎(chǔ)詞庫庫里就根據(jù)定定義區(qū)別并進(jìn)進(jìn)行分類。語義系系統(tǒng)中醫(yī)藥藥學(xué)語語言系系統(tǒng)綜綜合各各類可可控表表的結(jié)結(jié)構(gòu)特特征,,以中中醫(yī)藥藥學(xué)科科及相相關(guān)學(xué)學(xué)科知知識(shí)為為主干干,同同時(shí)對對照統(tǒng)統(tǒng)一的的醫(yī)學(xué)學(xué)語言言系統(tǒng)統(tǒng)的結(jié)結(jié)構(gòu)特特點(diǎn),,設(shè)計(jì)計(jì)中醫(yī)醫(yī)藥學(xué)學(xué)語言言系統(tǒng)統(tǒng)詞表表的結(jié)結(jié)構(gòu)。。整體體結(jié)構(gòu)構(gòu)設(shè)計(jì)計(jì)原則則必須須符合合中醫(yī)醫(yī)藥學(xué)學(xué)結(jié)構(gòu)構(gòu)特點(diǎn)點(diǎn),同同時(shí)能能滿足足現(xiàn)有有中醫(yī)醫(yī)藥數(shù)數(shù)字化化需求求。以以中醫(yī)醫(yī)藥學(xué)學(xué)為基基礎(chǔ),,涉及及與其其相關(guān)關(guān)聯(lián)的的學(xué)科科,如如醫(yī)學(xué)學(xué)、生生物學(xué)學(xué)、制制藥工工藝等等等語義類類型::以統(tǒng)統(tǒng)一的的醫(yī)學(xué)學(xué)語言言系統(tǒng)統(tǒng)(135種語語義類類型))為基基礎(chǔ)原原型,,重新新設(shè)計(jì)計(jì),并并重點(diǎn)點(diǎn)增加加中醫(yī)醫(yī)藥語語義類類型。。中醫(yī)醫(yī)藥語語義類類型標(biāo)標(biāo)準(zhǔn)以以中醫(yī)醫(yī)藥教教材體體系為為主,,共形形成108種語語義類類型。。語義義分為為二大大類::事與與物,,并由由此展展開其其樹形形結(jié)構(gòu)構(gòu)。語義關(guān)關(guān)系::語義義關(guān)系系共58種種。(見文檔檔)將中醫(yī)醫(yī)藥學(xué)學(xué)概念念詞語語進(jìn)行行規(guī)范范
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024網(wǎng)絡(luò)安全防護(hù)技術(shù)合同
- 二零二五年度綠色環(huán)保安置房交易合同范本3篇
- 2025年度能源項(xiàng)目居間合作合同范本3篇
- 2025年房屋交換與回遷協(xié)議3篇
- 2024版中外合資企業(yè)運(yùn)營管理合同書版B版
- 2024版政維護(hù)合同范本
- 中信證券2024年證券交易服務(wù)協(xié)議版A版
- 二零二五年度機(jī)場擴(kuò)建項(xiàng)目吊車租賃合同及吊機(jī)操作資質(zhì)要求3篇
- 事業(yè)單位2024版臨時(shí)聘用人員協(xié)議樣本版B版
- 二零二五年度專業(yè)攝影棚場地租賃服務(wù)協(xié)議2篇
- 老年人意外事件與與預(yù)防
- 預(yù)防艾滋病、梅毒和乙肝母嬰傳播轉(zhuǎn)介服務(wù)制度
- 集裝箱貨運(yùn)碼頭的火災(zāi)防范措施
- 《高速鐵路客運(yùn)安全與應(yīng)急處理》課程標(biāo)準(zhǔn)
- 七年級(jí)數(shù)學(xué)上冊專題1.14數(shù)軸與絕對值綜合問題大題專練(重難點(diǎn)培優(yōu))-【講練課堂】2022-2023學(xué)年七年級(jí)數(shù)學(xué)上冊尖子生同步培優(yōu)題典(原卷版)【人教版】
- 社會(huì)保險(xiǎn)職工增減表
- 小學(xué)語文低年級(jí)寫話 鴿子
- 仁愛英語八年級(jí)上冊詞匯練習(xí)題全冊
- 通用BIQS培訓(xùn)資料課件
- 報(bào)價(jià)單模板及范文(通用十二篇)
- 鈑金部品質(zhì)控制計(jì)劃
評論
0/150
提交評論