(論文)基于XML的圖書館網(wǎng)絡(luò)信息資源整合研究_第1頁
(論文)基于XML的圖書館網(wǎng)絡(luò)信息資源整合研究_第2頁
(論文)基于XML的圖書館網(wǎng)絡(luò)信息資源整合研究_第3頁
全文預覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第3 9 卷第7 期 20O7 年7 月 哈爾濱工業(yè)大學學報 J O U R N A LO FH A R B I NI N S T I T U T EO FT E C H N O L O G Y V 0 1 3 9N o 7 J u l 2 0 0 7 基于X I L 的圖書館網(wǎng)絡(luò)信息資源整合研究 唐振宇1 ”,陳鳳巖1 ”,馮玉強1 ( 1 哈爾濱T 業(yè)大學管理學院,哈爾濱1 5 0 0 0 1 E 一眥i l :z h e n y u t a n 酌9 1 6 3 c o m ; 2 哈爾濱工業(yè)大學罔書館,哈爾濱1 5 0 0 0 1 ) 摘要:為提高圖書館大量的數(shù)字信息資源的整體使用效率,實現(xiàn)信息資源的共享,提出了基于X M L 的圖 書館網(wǎng)絡(luò)信息資源的整合模型,設(shè)計并構(gòu)建了哈工大圖書館館藏文獻信息資源和本地其他信息資源整合的 原型系統(tǒng),采用J S P + x M L 開發(fā)跨庫檢索系統(tǒng),對不同來源、不同類型的文獻信息資源進行整合,為用戶提供 統(tǒng)一的檢索平臺和檢索方法,使檢索過程方便快捷,檢索結(jié)果更趨理想 關(guān)鍵詞:資源整合;x M L ;圖書館 中圖分類號:G 2 5 0 7 3文獻標識碼:A文章編號:0 3 6 7 6 2 3 4 ( 2 0 0 7 ) 0 7 1 1 3 5 一0 3 R 姻嘲暇mo fH b I 哪壤炯吣i I l 緬I n 磁岫1 1 e 舳咖c I 陷i 1 1 晚罌咖k l s e d 眥X 幾 T A N G Z h e n y u1 一,C H E NF e n g y a n l ”,F(xiàn) E N GY u q i a n 9 1 ( 1 S c h o o lo fM a n a g e m e n t ,H 如i n I n s t i t u t eo fT e c h n o l 9 9 y ,H a r b i n 1 5 0 0 0 l ,C h i n a ,E m a i l :z h e n y u t a n 酌9 1 6 3 c o m ; 2 | l h en 岫0 ;i fH a r b i nI n s t i t u t e0 f1 b h 赫I o g y ,H 曲i I l 1 5 0 0 0 1 ,C h i n a ) A b s 咖c t :I n o r d e rt oi m p r 0 V et h eo V e r a e 毋c i e n c y0 fu s i l l gl i b r a r yd 遮i t a li n f o n n a t i o nr e s o u r c e sa n da c h i e V e t h e 曲赫甥o f i n 南獅a t i 嘲r e s I 吣托e 8 島e 嗽e e n t h el i b 嫩i e s 。AX M L 6 a d o n l i B r 哆n e t w o r k i n f o H I l a t i o nr e s o u r c e i n t e 鏟a t i o nm o d e l w a s p u t f o r w a r d T h e l i b r a r y c o l l e c t i o no f d o c u m e n t a t i o na n di n f o 硼a t i o nr e s o u r c e s a n do t h e r l o c a li n f 0 珊a t i o nr e s o u r c e s i n t e g m t i n gs y s t e mp m t o t y p e o fH I ,I ( H a r b i nI n s t i t u t e o f7 r e c h n o l o g y ) h a s b e e n d e s i g n e d a n d b u i l t U s i n g t h eJ S P + X M L t e c h n i q u e ,a c I D s s d a t a b a s e i n q u i r i n gs y s t e m w a s d e v e l o p e d t o i n t e 鏟a t e d i f k r e n t t y p e s o fd o c u m e n ti n f o 邢a t i o n r e s o u r c e ,w h i c h o f 托r e d t h eu s e r sau n m e dd a t a b a s e i n q u i r i n g p l a d o 瑚a n d m e t h o d sw i t h c o n V e n i e n tr e t r i e v a l p m c e s s ,m o r es a t i s 每i n gs e a r c h i n g r e s u l t s K e y w o r d s :r e s o u r c e s i n t e g r a t i o n ;X M L ;l i b r a r y 近年來,高校圖書館通過集團采購、自主購 買、自建數(shù)據(jù)庫等多種形式,引進和建設(shè)了一批高 質(zhì)量的數(shù)據(jù)庫,使得圖書館的電子圖書、電子期 刊、網(wǎng)絡(luò)數(shù)據(jù)庫等數(shù)字化信息資源顯著增加,為讀 者提供了更多的信息來源和獲取信息的途徑圖 書館大量的數(shù)字信息資源往往由不同的數(shù)據(jù)商提 供,軟硬件系統(tǒng)、運行環(huán)境各不相同,數(shù)據(jù)庫的檢 索界面存在差異性和復雜性不同的數(shù)據(jù)庫使用 不同的檢索軟件,每個數(shù)據(jù)庫支持的檢索算符和 使用的檢索語言也不盡相同當用戶在檢索某 收稿日期:2 0 0 5 一1 2 一0 5 基金項目:黑龍江省科技攻關(guān)計劃項目( 2 0 0 5 R 9 1 0 0 ) 作者簡介:唐振宇( 1 9 6 3 一) ,女,博士研究牛,副研究館員; 馮玉強( 1 9 6 l 一) ,女,教授,博士生導師 個課題時,為提高查全率,用戶不但需要了解在圖 書館提供的眾多數(shù)據(jù)庫中哪些數(shù)據(jù)庫涵蓋的學科 內(nèi)容與自己的檢索課題有關(guān),而且還需要逐一登 陸所有相關(guān)數(shù)據(jù)庫分別進行檢索而在檢索時,還 要掌握不同數(shù)據(jù)庫的檢索方法,以便正確地檢索; 最后,各個數(shù)據(jù)庫的檢索結(jié)果又具有不同的全文 數(shù)據(jù)格式( 如c a j 、p d f 、p 咄等) ,需要安裝各自相 應的閱讀器,才能閱讀全文使檢索效率低下,增 加了用戶檢索的難度,浪費了用戶大量的時間和 精力,給使用者帶來諸多不便因此,圖書館迫切 需要對其擁有的數(shù)字信息資源進行統(tǒng)一的組織和 處理,即在引進、自建數(shù)據(jù)庫的同時,對這些信息 資源進行整合,讓使用者可以通過一個檢索人口 檢索到幾乎所有的信息資源,從而提高信息資源 整體使用效率,有利于實現(xiàn)信息資源的共享 哈爾濱工業(yè)大學學報第3 9 卷 1整合模式分析 信息資源的整合是指由計算機網(wǎng)絡(luò)及相關(guān)技 術(shù)構(gòu)成的系統(tǒng),實現(xiàn)信息資源的集中管理及跨平 臺、跨數(shù)據(jù)庫檢索國內(nèi)圖書館的信息資源整合模 式主要有兩種:對數(shù)據(jù)源的整合及對不同信息資 源檢索接口的整合嵋J 1 1 數(shù)據(jù)源的整合 數(shù)據(jù)源的整合是對不同數(shù)據(jù)資源信息庫進行 整合整合方法是建立一個數(shù)據(jù)存貯倉庫,將參與 整合的各種數(shù)據(jù)源的數(shù)據(jù)裝入其中,把不同數(shù)據(jù) 結(jié)構(gòu)的內(nèi)容轉(zhuǎn)換為相同的數(shù)據(jù)格式,用單一的檢 索引擎檢索所有的資源這是一種最徹底、最完全 意義上的整合,完全脫離了各種異構(gòu)系統(tǒng)原有的 服務(wù)平臺通過對不同數(shù)據(jù)源的集成,構(gòu)建新的數(shù) 據(jù)倉庫,用戶通過數(shù)據(jù)倉庫提供的統(tǒng)一的檢索入 口進行查詢bJ 在這種模式下,數(shù)據(jù)重復存儲,整 合后的系統(tǒng)需要維護一個與數(shù)據(jù)源中的數(shù)據(jù)一致 的副本因為查詢不再訪問源數(shù)據(jù),所以響應一般 較快,但維護代價較高 1 2 檢索接口的整合 檢索接口的整合是指在統(tǒng)一的用戶查詢接口 與信息反饋的形式下,共享多個數(shù)據(jù)庫資源的索引 和檢索技術(shù),它以代理的角色接受用戶的請求,通 過轉(zhuǎn)換程序把查詢請求轉(zhuǎn)換成相應數(shù)據(jù)庫的查詢 語言和檢索方法,分別對各個數(shù)據(jù)庫發(fā)出檢索請 求,再將來自各個數(shù)據(jù)庫的命中結(jié)果集成在一個界 面中顯示給用戶對源數(shù)據(jù)的訪問方法有兩種”J : 1 ) 利用數(shù)據(jù)庫接口訪問源數(shù)據(jù) 這種方法是借助于數(shù)據(jù)庫開發(fā)商所提供的數(shù) 據(jù)接口,直接訪問本地的數(shù)據(jù)源通過各數(shù)據(jù)庫管 理系統(tǒng)的現(xiàn)有查詢執(zhí)行引擎和語言,將數(shù)據(jù)從各 數(shù)據(jù)源中提取出來,不需要設(shè)計和實現(xiàn)專用的查 詢語言和執(zhí)行引擎,應用開發(fā)工作量小這種方法 通常建立在通用數(shù)據(jù)庫平臺和開放系統(tǒng)之上,由 于很多數(shù)據(jù)廠商不愿意開放其數(shù)據(jù)庫權(quán)限,公開 其數(shù)據(jù)訪問接口,使這種方法受到限制 2 ) 通過應用程序訪問源數(shù)據(jù) 這種方法應用的查詢首先被重構(gòu)、分解成面 向各個數(shù)據(jù)源的查詢,然后由查詢引擎調(diào)用包裝 器實時抓取各個數(shù)據(jù)源站點的頁面,抽取其中的 數(shù)據(jù)元素,再由執(zhí)行引擎將返回的數(shù)據(jù)集成、轉(zhuǎn)化 為統(tǒng)一的結(jié)構(gòu)化形式后返回給用戶這種方法的 優(yōu)點是不需要數(shù)據(jù)廠商的數(shù)據(jù)開放,具有良好的 現(xiàn)實操作性而且查詢的結(jié)果能保證始終是最薪 的,適用于數(shù)據(jù)源自治程度高、變化頻繁的情況 但這種方法需要設(shè)計和實現(xiàn)特定的查詢執(zhí)行引擎 和查詢語言,需要復雜的查詢生成器 無論哪種方式訪問源數(shù)據(jù),當數(shù)據(jù)從數(shù)據(jù)源 中抽取出來以后,都需要對數(shù)據(jù)進行整合,形成統(tǒng) 一的數(shù)據(jù)中間模式由于數(shù)據(jù)在提供應用之前經(jīng) 過了處理,使返回給用戶的數(shù)據(jù)更加規(guī)范化x M L ( e X t e n s i b l eM a r k u p L a n g u a g e ) 具有自定義性及其 可擴展性等優(yōu)勢,便于表達各種類型的數(shù)據(jù),數(shù)據(jù) 的呈現(xiàn)與處理可分離操作,可實現(xiàn)數(shù)據(jù)跨平臺傳 輸、交換和共享,以應用的中間數(shù)據(jù)形式,解決數(shù) 據(jù)的統(tǒng)一接口問題 2 圖書館信息資源整合原型系統(tǒng)設(shè)計 2 1 系統(tǒng)模型設(shè)計 本系統(tǒng)設(shè)計的目標:整合哈工大圖書館的館 藏書目數(shù)據(jù)資源和本地的其他信息資源,建立一 個異構(gòu)數(shù)據(jù)庫信息共享平臺,構(gòu)建統(tǒng)一的檢索系 統(tǒng)和用戶界面,實現(xiàn)用戶單一的檢索表達,在一個 涵蓋各種不同信息資源的集合中得到響應,從而 實現(xiàn)多個異構(gòu)信息資源庫的統(tǒng)一檢索采用J s P + X M L 開發(fā)這個跨庫檢索系統(tǒng),開發(fā)模型如圖1 所示 應用服務(wù)器數(shù)據(jù)源 圖1 系統(tǒng)開發(fā)模型 本系統(tǒng)用J s P 與s e n ,l e t 聯(lián)合實現(xiàn)動態(tài)內(nèi)容服 務(wù),吸取了兩種技術(shù)各自的突出優(yōu)點,用J s P 生成 表示層的任務(wù),讓S e r v l e t 完成深層次的處理任 務(wù),J a v a B e a n 完成數(shù)據(jù)的提取功能在擴展系統(tǒng) 時,只需修改業(yè)務(wù)邏輯和控制部分( J a v a B e a n 和 S e r v l e t ) 即可,無需修改顯示的J S P 系統(tǒng),很容易 對些新購買的數(shù)據(jù)庫進行整合 2 2 系統(tǒng)體系結(jié)構(gòu)設(shè)計 在B s 模式的基礎(chǔ)上結(jié)合x M L 和J s P 的特 點和工作原理,將本系統(tǒng)分為4 層體系結(jié)構(gòu):第l 層是表示層,接受用戶的信息請求并返回請求結(jié) 果;第2 層是W e b 服務(wù)層,實現(xiàn)信息的發(fā)布、交互 和處理的功能;第3 層是應用服務(wù)層,用于數(shù)據(jù)的 處理及與數(shù)據(jù)庫的交互,獲取各個異構(gòu)數(shù)據(jù)源的 接口數(shù)據(jù),并整合成統(tǒng)一的中間數(shù)據(jù)格式x M L ; 第4 層是數(shù)據(jù)服務(wù)層“ j 基于x M L 的多層系統(tǒng)體 系結(jié)構(gòu)如圖2 所示 第7 期唐振宇,等:基于x M L 的圖書館網(wǎng)絡(luò)信息資源整合研究 表示層 w “服務(wù)層 用服務(wù)層 數(shù)據(jù)服務(wù)層 圖2 系統(tǒng)體系結(jié)構(gòu) 客戶端通過瀏覽器向w e b 服務(wù)器發(fā)出請求 后,由S e n ,l e t 負責接收,然后S e r v l e t 根據(jù)用戶的 動作調(diào)用相應的J s P 頁面與J a v a B e a n ,而與數(shù)據(jù) 庫交互工作由J a v a B e a n 負責,J S P 頁面生成動態(tài) x M L 反饋給客戶,在客戶端用x S L 處理器對檢索 結(jié)果進行處理J 2 3 程序設(shè)計 本系統(tǒng)通過統(tǒng)一的檢索平臺,實現(xiàn)對3 個異 構(gòu)數(shù)據(jù)庫的同時檢索,生成集成的檢索結(jié)果系統(tǒng) 體系結(jié)構(gòu)見圖2 系統(tǒng)檢索的數(shù)據(jù)源分別是館藏 書目數(shù)據(jù)庫( x M L 格式) 和關(guān)系型數(shù)據(jù)庫( s Y B A S E 和O R A C L E ) 限于篇幅,X M L 格式以及關(guān) 系型數(shù)據(jù)庫的數(shù)據(jù)結(jié)構(gòu)未列出系統(tǒng)運行環(huán)境是 w i n d o w s 2 0 0 0 ,J 2 S D K ,T 0 m c a t 系統(tǒng)實現(xiàn)方法是先 把館藏書目數(shù)據(jù)( 原M A R C 格式) 經(jīng)過后臺程序 處理轉(zhuǎn)換成x M L 格式p ,通過查詢程序S e a r c h j s p 同時檢索上述3 種數(shù)據(jù)庫,并將檢索結(jié)果通過 J a v a B e a n 集成為一個統(tǒng)一的x M L 數(shù)據(jù),再用x s L 對x M L 數(shù)據(jù)進行處理 J a v a B e a n 程序部分代碼如下: p a c k a g ec o m o 五e n t q u e r y ; i m p o no 唱w 3 c d o m 水; i m p o r to 昭a p a c h e x e r c e s d o m 術(shù); i m p o r to 唱a p a c h e x e r c e s d o m 術(shù); i m p o r to 曙a p a c h e x m l s e “a l i z e 水; i m p o r tj a V a u t i l 米; p u b l i c c l a s sC o n t m l s e a r c h L o a d M a r c X m ll o a d M a r c X m l = n e wL o a d M a r c X m l ( ) ; S e a r c h X m l R e c o r ds e a r c h X m l R e c o r d = n e w S e a r c h X m l R e c o r d ( ) ; p r i v a t e S t I - i n g6 l e N a m e = ”; p u b l i cC o n t r o l S e a r c h ( ) I p u b l i c D o c u m e n tm a k e S e a r c h (H a s h t a b l e s e a r c h T a b l e ) V e c t o re x i s t R e c o r d = n e w V e c t o r ( ) ; e x i s t R e c o r d = d o S e a r e h i n g ( s e a I h T a b l e ) ; S y s t e m o u t p r i n t l n ( ”e x i s t R e ( :( 1 r d :”+ e x i s t R e c o r d s i z e ( ) ) ; i f ( e x i s t R e c o r d s i z e ( ) = = 0 ) r e t u m q u e r y e d N o E x i s t R e c o r d ( ) ; e l s e r e t u m q u e r y e d E x i s t R e e o r d ( e x i s t R e c o r d ) ; 該系統(tǒng)的各個組成部分具有自身的自治性, 在實現(xiàn)數(shù)據(jù)共享的同時,每個數(shù)據(jù)庫系統(tǒng)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論