




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、從中醫(yī)古籍?dāng)?shù)據(jù)庫建立看中醫(yī)古籍?dāng)?shù)字化李兵,劉國(guó)正,符永馳,裘儉,張偉娜【關(guān)鍵詞】中醫(yī)古籍;數(shù)字化;古籍?dāng)?shù)據(jù)庫中醫(yī)古籍是中醫(yī)藥學(xué)傳承和生長(zhǎng)的載體,既具有緊張的學(xué)術(shù)代價(jià),又具有相稱的文物代價(jià)。最新出書的?中國(guó)中醫(yī)古籍總目?共收錄中醫(yī)古籍13455種,根本上反響了當(dāng)前我國(guó)中醫(yī)古籍的存世和漫衍近況。如安在庇護(hù)的底子上更好地利用這些貴重的中醫(yī)藥資源是中醫(yī)藥研究職員的汗青任務(wù)。通過數(shù)字化處置懲罰,既實(shí)現(xiàn)了對(duì)中醫(yī)古籍的永世保存,又可為便利、快捷、無損地開拓和利用這些名貴資源搭建起研究平臺(tái)。中國(guó)中醫(yī)科學(xué)院中醫(yī)藥信息研究所自2002年始,對(duì)館藏中醫(yī)文籍舉行了數(shù)字化再生性庇護(hù)和利用研究,如今,已建成“中醫(yī)藥珍善本
2、古籍多媒體數(shù)據(jù)庫、“中醫(yī)藥古籍資源數(shù)據(jù)庫,實(shí)現(xiàn)了部門中醫(yī)古籍的數(shù)字化庇護(hù)與利用。1“中醫(yī)藥古籍資源數(shù)據(jù)庫建立1.1研究配景中醫(yī)古籍是中華民族幾千年來防病治病名貴履歷的結(jié)晶,是中華民族的良好文化遺產(chǎn)。中醫(yī)藥古籍文獻(xiàn)中所收載的理法方藥、養(yǎng)生保健知識(shí)是取之不勁用之不竭的寶庫,具有極高的有用代價(jià)。古籍屬于不成再生的文化資源,比年來,只管我國(guó)加大了對(duì)付古籍的庇護(hù)力度,使古籍的保存情況得到改進(jìn),但隨著汗青的推進(jìn),古籍照舊會(huì)悄無聲氣、不成制止地出現(xiàn)損毀,以致滅亡。中醫(yī)古籍團(tuán)體保存情況較差,各藏館保存條件良莠不一,中醫(yī)古籍庇護(hù)和傳承令人擔(dān)憂。鑒于此,用數(shù)字化本領(lǐng)對(duì)中醫(yī)古籍舉行處置懲罰,既可以使中醫(yī)古籍的原圖原
3、貌永世保存,又可以通過數(shù)據(jù)庫和網(wǎng)絡(luò)普及利用,制止閱讀原書對(duì)古籍造成的損傷。因此,中醫(yī)古籍?dāng)?shù)字化是中醫(yī)古籍庇護(hù)和利用的抱負(fù)方法。中國(guó)中醫(yī)科學(xué)院圖書館所藏中醫(yī)古籍占存世中醫(yī)古籍?dāng)?shù)目的一半以上,此中中醫(yī)珍善本古籍就達(dá)2萬余冊(cè)。中國(guó)中醫(yī)科學(xué)院中醫(yī)藥信息研究所利用該資源上風(fēng),構(gòu)建了“中醫(yī)藥古籍資源數(shù)據(jù)庫,現(xiàn)已收錄1500種中醫(yī)古籍的元數(shù)據(jù)信息和此中的850種中醫(yī)古籍的原文圖像,已經(jīng)可以通過中醫(yī)古籍閱覽體系實(shí)現(xiàn)電子閱覽,為中醫(yī)古籍?dāng)?shù)字化庇護(hù)和利用開拓了途徑。1.2“中醫(yī)藥古籍資源數(shù)據(jù)庫建庫流程按照中醫(yī)古籍的年代、版本代價(jià)、文獻(xiàn)代價(jià)、庇護(hù)品級(jí)等確定收錄尺度,對(duì)破壞嚴(yán)峻的珍善本古籍優(yōu)先舉行數(shù)字化處置懲罰。思量
4、到對(duì)古籍的再生性庇護(hù),我們以古籍原文圖像作為重要數(shù)據(jù)泉源,部門古籍實(shí)現(xiàn)全文本化。由于圖像要求的存儲(chǔ)空間較大,我們接納支持多媒體數(shù)據(jù)的rale9i數(shù)據(jù)庫體系,并對(duì)體系布局舉行優(yōu)化,根本辦理了運(yùn)行速率題目。按照古籍文獻(xiàn)的特點(diǎn),按中醫(yī)古籍的分類、題名、責(zé)任者、出書年代、出書者、版本項(xiàng)、版式、卷數(shù)、館藏地、冊(cè)本特性、保存狀態(tài)、復(fù)制狀態(tài)等舉行著錄,著錄規(guī)矩拜見“我國(guó)數(shù)字圖書館尺度范例建立工程研究結(jié)果古籍元數(shù)據(jù)著錄規(guī)矩(dls-s05-014),對(duì)收錄古籍撰寫提要,力圖創(chuàng)立完備的古籍書目數(shù)據(jù)庫。包羅古籍的掃描、質(zhì)檢、圖像處置懲罰、文本錄入等。為實(shí)現(xiàn)保存和利用雙重目的,掃描時(shí)接納全彩形式,300dpi,jp
5、eg格式保存,按頁碼挨次重定名,對(duì)掃描后圖像的挨次、偏歪度、完備性、清楚度舉行查抄,并舉行糾偏、去污、裁邊等處置懲罰。對(duì)部門古籍舉行文本錄入,實(shí)現(xiàn)圖文比較。接納自主開拓的古籍編纂器對(duì)文中有用的檢索點(diǎn)舉行抽取和xl格式標(biāo)引,如病證方藥的名稱、索引信息、各級(jí)標(biāo)題等,力圖實(shí)現(xiàn)圖像的全文檢索,制止標(biāo)引過繁或過簡(jiǎn),影響檢索結(jié)果。對(duì)標(biāo)引后數(shù)據(jù)舉行考核。將圖像數(shù)據(jù)、元數(shù)據(jù)、標(biāo)引數(shù)據(jù)、文本數(shù)據(jù)合成、入庫,形成中醫(yī)古籍電子書,公布到閱覽體系后舉行數(shù)據(jù)庫測(cè)試,實(shí)現(xiàn)中醫(yī)古籍的數(shù)字化庇護(hù)與利用。1.3接納技能數(shù)據(jù)庫接納rale9i,數(shù)據(jù)搜刮接納raletext技能。整個(gè)體系接納基于java的eb應(yīng)用技能,結(jié)合基于j2
6、ee的struts和實(shí)現(xiàn)數(shù)據(jù)長(zhǎng)期化的hibernate框架的v方案形式,構(gòu)建了高內(nèi)聚、弱藕合、可維護(hù)和可擴(kuò)展的中醫(yī)古籍?dāng)?shù)字化體系1。2中醫(yī)古籍?dāng)?shù)字化存在的停滯2.1中醫(yī)古籍中生僻漢字的處置懲罰漢字從產(chǎn)生至今履歷了漫長(zhǎng)的演變歷程,由此也產(chǎn)生了大量的繁簡(jiǎn)字、異體字、古今字、通假字等。中醫(yī)古籍?dāng)?shù)字化歷程中碰到的字體停滯有兩個(gè)方面,一個(gè)是對(duì)字體的認(rèn)知停滯,生僻漢字的正確錄入必要很深的中醫(yī)文獻(xiàn)學(xué)功底,而對(duì)付一樣平常的操縱職員很難辦到;一個(gè)是技能停滯,unide字符集固然可以辦理字庫題目,但是很多軟件不支持,常用的輸入法和搜刮引擎不支持大字符集,很多生僻字仍不克不及準(zhǔn)確表現(xiàn)和檢索。用造字的要領(lǐng)費(fèi)時(shí)費(fèi)力,并
7、且很難共享和檢索,生僻漢字的處置懲罰還是中醫(yī)古籍?dāng)?shù)字化歷程中的一大停滯。2.2天下古籍?dāng)?shù)字化尺度尚待創(chuàng)立如今,固然到場(chǎng)中醫(yī)古籍?dāng)?shù)字化事情的單元較多,但險(xiǎn)些都處于各自為戰(zhàn)的狀態(tài),所接納的途徑多樣,因此產(chǎn)生的數(shù)字化結(jié)果情勢(shì)多樣,倒霉于中醫(yī)古籍?dāng)?shù)字化生長(zhǎng),也倒霉于中醫(yī)古籍?dāng)?shù)字化資源共享。究其緣故原由,除了缺乏同一的和諧方案外,沒有可參照的行業(yè)尺度也是此中緊張的緣故原由。2.3中醫(yī)古籍?dāng)?shù)字化軟件有待革新軟件成效是否強(qiáng)盛對(duì)中醫(yī)古籍?dāng)?shù)字化歷程和結(jié)果具有直接影響,選擇符合的軟件可以起到事半功倍的結(jié)果。如今,可供選擇的數(shù)字化加工體系很多,掃描和圖像處置懲罰技能已較為成熟。而r軟件對(duì)古籍中部門繁體字和不規(guī)矩用字
8、的識(shí)別結(jié)果很差,輔以人工校對(duì)那么必要大量的時(shí)間和人力,怎樣進(jìn)步r在古籍字符識(shí)別上的正確率是古籍?dāng)?shù)字化面對(duì)的一浩劫題;數(shù)據(jù)加工軟件在批處置懲罰、大字符集、內(nèi)容辦理等方面存在缺陷;檢索體系怎樣按照中醫(yī)古籍的特點(diǎn)進(jìn)步檢索速率和精準(zhǔn)度也是值得進(jìn)一步研究的題目。2.4古籍信息的精準(zhǔn)檢索快速、正確地檢索到所必要的內(nèi)容是古籍?dāng)?shù)字化應(yīng)有的根本成效,也是評(píng)價(jià)其優(yōu)劣的緊張指標(biāo)。全文本的數(shù)字化古籍可以實(shí)現(xiàn)恣意字符的檢索,但是數(shù)據(jù)正確度孝檢索噪音大的題目尚待進(jìn)一步辦理;圖像版可以包管信息的正確無誤,但在全文檢索上存在必然缺陷,通過對(duì)有用檢索點(diǎn)的標(biāo)引可以在必然程度上補(bǔ)充上述不敷,但仍不成制止地要遺漏某些信息。由于中醫(yī)古
9、籍中并證、方、藥的同名異義、異名同義征象普及存在,使內(nèi)容的正確檢索越發(fā)困難。怎樣創(chuàng)立后控詞表,實(shí)現(xiàn)關(guān)聯(lián)檢索也是中醫(yī)古籍?dāng)?shù)字化面對(duì)的一個(gè)困難。2.5研究支持成效尚不美滿研究支持成效是指可以或許提供有關(guān)古籍內(nèi)容自己科學(xué)、正確的統(tǒng)計(jì)與計(jì)量信息,提供與古籍內(nèi)容相干的參考數(shù)據(jù)、幫助東西,這些信息、數(shù)據(jù)或東西都是古籍內(nèi)容的增值或增補(bǔ)2。中醫(yī)古籍具有極高的研究代價(jià),其研究支持成效應(yīng)更強(qiáng)盛。除常用的中醫(yī)古籍研究幫助東西外,還應(yīng)具有差異版本和相干數(shù)據(jù)的鏈接。對(duì)并證、方、藥的參考數(shù)據(jù)舉行會(huì)聚,對(duì)生僻字舉行注解,創(chuàng)立學(xué)術(shù)論壇等,都是研究支持成效的緊張構(gòu)成部門,而如今的中醫(yī)古籍?dāng)?shù)字化結(jié)果在此方面尚顯薄弱。2.6深度開
10、拓不敷中醫(yī)古籍?dāng)?shù)字化不該僅僅滿意于對(duì)古籍的閱覽和查詢。古代中醫(yī)藥文獻(xiàn)是一個(gè)知識(shí)寶庫,在數(shù)字化的底子上開掘古籍中的名貴知識(shí)財(cái)產(chǎn),實(shí)現(xiàn)知識(shí)創(chuàng)造和知識(shí)拓展,更好地為中醫(yī)藥奇跡的生長(zhǎng)和人類康健辦事是中醫(yī)古籍?dāng)?shù)字化的最高目的。3中醫(yī)古籍?dāng)?shù)字化建立的發(fā)起3.1圖文關(guān)聯(lián)是實(shí)現(xiàn)中醫(yī)古籍?dāng)?shù)字化的較好方法圖文關(guān)聯(lián)是將古籍文獻(xiàn)別離存儲(chǔ)為圖像、文本兩種情勢(shì)。圖文關(guān)聯(lián)是將文本對(duì)應(yīng)放在與之相匹配的圖像之下,并創(chuàng)立索引干系,實(shí)現(xiàn)圖文比較。此種方法可以補(bǔ)充“圖像在檢索和內(nèi)容編纂上的不敷,又可以校對(duì)“文本的正確性,使讀者既能看到原書原貌的古籍文獻(xiàn),又可以快速正確地查到所必要的內(nèi)容。尤其對(duì)付研究者,對(duì)原始版本信息和文本的正確性要
11、求更高,而通過圖文比較便可很好地辦理這一題目。3.2中醫(yī)文獻(xiàn)與盤算機(jī)專業(yè)職員的通力協(xié)作中醫(yī)古籍?dāng)?shù)字化是古典文化與當(dāng)代技能的結(jié)合,必要有醒目中醫(yī)古籍整理、目次學(xué)和版本學(xué)知識(shí)的人才與把握盤算機(jī)網(wǎng)絡(luò)知識(shí)和多媒體技能的專業(yè)職員通力協(xié)作。中醫(yī)古籍?dāng)?shù)字化雖屬新的古籍整理方法,但仍歸于中醫(yī)文獻(xiàn)整理領(lǐng)域,離不開文獻(xiàn)整理的知識(shí)。在整個(gè)歷程中,中醫(yī)知識(shí)不成或缺;同時(shí),在數(shù)據(jù)處置懲罰、數(shù)據(jù)庫方案、應(yīng)用平臺(tái)構(gòu)建等方面都必要盤算機(jī)專業(yè)職員到場(chǎng)。中醫(yī)文獻(xiàn)專家的需求和發(fā)起能引導(dǎo)盤算機(jī)技能職員對(duì)整個(gè)體系的方案,進(jìn)而改進(jìn)中醫(yī)古籍?dāng)?shù)字化體系的成效。上述兩方面職員的深化互助是創(chuàng)立抱負(fù)中醫(yī)古籍?dāng)?shù)字化形式的條件。3.3器重同一尺度的研
12、究和訂定創(chuàng)立完備的中醫(yī)古籍資源庫必要全行業(yè)的互助。因此,有需要?jiǎng)?chuàng)立同一的尺度,包羅中醫(yī)古籍的分類法、著錄規(guī)矩、軟件和數(shù)據(jù)庫的利用、數(shù)字化加工尺度、加工和利用平臺(tái)等。同一的尺度是實(shí)現(xiàn)中醫(yī)古籍?dāng)?shù)字化資源共享的底子,也是促進(jìn)中醫(yī)古籍?dāng)?shù)字化建立歷程的有力保障3。3.4同一方案,共建共享中醫(yī)古籍?dāng)?shù)字化是對(duì)中華文化遺產(chǎn)的庇護(hù)和弘揚(yáng),具有猛烈的公益色彩。各單元必要在同一的和和諧向?qū)?創(chuàng)立一個(gè)團(tuán)體的方案。團(tuán)體方案應(yīng)包羅數(shù)字化東西的內(nèi)容,確定事情重點(diǎn)和互助分工,同時(shí)包羅相干尺度、范例的同一,而恰恰這兩方面題目在如今的事情中較為突出4。辦理了這兩方面題目,就制止了重復(fù)建立和資源白費(fèi),才氣實(shí)現(xiàn)共建共享。4結(jié)語中醫(yī)古籍?dāng)?shù)字化是一項(xiàng)恒久的體系工程,必要中醫(yī)藥科研職員支付恒久的艱辛和積極。固然在建立歷程中另有很多題目有待辦理,但隨著研究的深化,信息技能的飛速生長(zhǎng),中醫(yī)古籍?dāng)?shù)據(jù)庫建立和利用將出現(xiàn)遼闊的遠(yuǎn)景
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 信息化項(xiàng)目可行性研究報(bào)告編制規(guī)范
- 2025年度保健食品個(gè)性化定制配送與市場(chǎng)推廣服務(wù)合同
- 低空經(jīng)濟(jì)未來產(chǎn)業(yè)
- 光伏發(fā)電項(xiàng)目 可行性研究報(bào)告
- 三農(nóng)產(chǎn)品綠色有機(jī)認(rèn)證認(rèn)證標(biāo)準(zhǔn)操作手冊(cè)
- 揚(yáng)塵治理專項(xiàng)施工方案(完整)
- 基于zigbee的智能家居系統(tǒng)設(shè)計(jì)
- 數(shù)據(jù)分析統(tǒng)計(jì)學(xué)試題及答案
- 游戲音樂創(chuàng)作與編輯手冊(cè)
- 三農(nóng)扶貧政策執(zhí)行手冊(cè)
- 《大氣污染物控制工程》-揮發(fā)性有機(jī)物污染控制
- 國(guó)家職業(yè)技術(shù)技能標(biāo)準(zhǔn) 6-28-01-14 變配電運(yùn)行值班員 人社廳發(fā)2019101號(hào)
- 2024-2030年冷凍面團(tuán)產(chǎn)品行業(yè)市場(chǎng)現(xiàn)狀供需分析及投資評(píng)估規(guī)劃分析研究報(bào)告
- 【課件】人居與環(huán)境-詩意的棲居+課件高中美術(shù)人美版(2019)+必修+美術(shù)鑒賞
- LED基礎(chǔ)知識(shí)題庫100道及答案(完整版)
- 抖音本地生活商家直播培訓(xùn)
- 新版高中物理必做實(shí)驗(yàn)?zāi)夸浖捌鞑?(電子版)
- 涉密項(xiàng)目保密工作方案
- 危險(xiǎn)貨物道路運(yùn)輸規(guī)則第7部分:運(yùn)輸條件及作業(yè)要求(JTT617.7-2018)
- 思政課課題國(guó)內(nèi)外研究現(xiàn)狀
- 泌尿外科管道護(hù)理規(guī)范
評(píng)論
0/150
提交評(píng)論