


全文預(yù)覽已結(jié)束
下載本文檔
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第3 9 卷第7 期 20O7 年7 月 哈爾濱工業(yè)大學(xué)學(xué)報(bào) J O U R N A LO FH A R B I NI N S T I T U T EO FT E C H N O L O G Y V 0 1 3 9N o 7 J u l 2 0 0 7 基于X I L 的圖書館網(wǎng)絡(luò)信息資源整合研究 唐振宇1 ”,陳鳳巖1 ”,馮玉強(qiáng)1 ( 1 哈爾濱T 業(yè)大學(xué)管理學(xué)院,哈爾濱1 5 0 0 0 1 E 一眥i l :z h e n y u t a n 酌9 1 6 3 c o m ; 2 哈爾濱工業(yè)大學(xué)罔書館,哈爾濱1 5 0 0 0 1 ) 摘要:為提高圖書館大量的數(shù)字信息資源的整體使用效率,實(shí)現(xiàn)信息資源的共享,提出了基于X M L 的圖 書館網(wǎng)絡(luò)信息資源的整合模型,設(shè)計(jì)并構(gòu)建了哈工大圖書館館藏文獻(xiàn)信息資源和本地其他信息資源整合的 原型系統(tǒng),采用J S P + x M L 開發(fā)跨庫(kù)檢索系統(tǒng),對(duì)不同來(lái)源、不同類型的文獻(xiàn)信息資源進(jìn)行整合,為用戶提供 統(tǒng)一的檢索平臺(tái)和檢索方法,使檢索過(guò)程方便快捷,檢索結(jié)果更趨理想 關(guān)鍵詞:資源整合;x M L ;圖書館 中圖分類號(hào):G 2 5 0 7 3文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):0 3 6 7 6 2 3 4 ( 2 0 0 7 ) 0 7 1 1 3 5 一0 3 R 姻嘲暇mo fH b I 哪壤炯吣i I l 緬I n 磁岫1 1 e 舳咖c I 陷i 1 1 晚罌咖k l s e d 眥X 幾 T A N G Z h e n y u1 一,C H E NF e n g y a n l ”,F(xiàn) E N GY u q i a n 9 1 ( 1 S c h o o lo fM a n a g e m e n t ,H 如i n I n s t i t u t eo fT e c h n o l 9 9 y ,H a r b i n 1 5 0 0 0 l ,C h i n a ,E m a i l :z h e n y u t a n 酌9 1 6 3 c o m ; 2 | l h en 岫0 ;i fH a r b i nI n s t i t u t e0 f1 b h 赫I o g y ,H 曲i I l 1 5 0 0 0 1 ,C h i n a ) A b s 咖c t :I n o r d e rt oi m p r 0 V et h eo V e r a e 毋c i e n c y0 fu s i l l gl i b r a r yd 遮i t a li n f o n n a t i o nr e s o u r c e sa n da c h i e V e t h e 曲赫甥o f i n 南獅a t i 嘲r e s I 吣托e 8 島e 嗽e e n t h el i b 嫩i e s 。AX M L 6 a d o n l i B r 哆n e t w o r k i n f o H I l a t i o nr e s o u r c e i n t e 鏟a t i o nm o d e l w a s p u t f o r w a r d T h e l i b r a r y c o l l e c t i o no f d o c u m e n t a t i o na n di n f o 硼a t i o nr e s o u r c e s a n do t h e r l o c a li n f 0 珊a t i o nr e s o u r c e s i n t e g m t i n gs y s t e mp m t o t y p e o fH I ,I ( H a r b i nI n s t i t u t e o f7 r e c h n o l o g y ) h a s b e e n d e s i g n e d a n d b u i l t U s i n g t h eJ S P + X M L t e c h n i q u e ,a c I D s s d a t a b a s e i n q u i r i n gs y s t e m w a s d e v e l o p e d t o i n t e 鏟a t e d i f k r e n t t y p e s o fd o c u m e n ti n f o 邢a t i o n r e s o u r c e ,w h i c h o f 托r e d t h eu s e r sau n m e dd a t a b a s e i n q u i r i n g p l a d o 瑚a n d m e t h o d sw i t h c o n V e n i e n tr e t r i e v a l p m c e s s ,m o r es a t i s 每i n gs e a r c h i n g r e s u l t s K e y w o r d s :r e s o u r c e s i n t e g r a t i o n ;X M L ;l i b r a r y 近年來(lái),高校圖書館通過(guò)集團(tuán)采購(gòu)、自主購(gòu) 買、自建數(shù)據(jù)庫(kù)等多種形式,引進(jìn)和建設(shè)了一批高 質(zhì)量的數(shù)據(jù)庫(kù),使得圖書館的電子圖書、電子期 刊、網(wǎng)絡(luò)數(shù)據(jù)庫(kù)等數(shù)字化信息資源顯著增加,為讀 者提供了更多的信息來(lái)源和獲取信息的途徑圖 書館大量的數(shù)字信息資源往往由不同的數(shù)據(jù)商提 供,軟硬件系統(tǒng)、運(yùn)行環(huán)境各不相同,數(shù)據(jù)庫(kù)的檢 索界面存在差異性和復(fù)雜性不同的數(shù)據(jù)庫(kù)使用 不同的檢索軟件,每個(gè)數(shù)據(jù)庫(kù)支持的檢索算符和 使用的檢索語(yǔ)言也不盡相同當(dāng)用戶在檢索某 收稿日期:2 0 0 5 一1 2 一0 5 基金項(xiàng)目:黑龍江省科技攻關(guān)計(jì)劃項(xiàng)目( 2 0 0 5 R 9 1 0 0 ) 作者簡(jiǎn)介:唐振宇( 1 9 6 3 一) ,女,博士研究牛,副研究館員; 馮玉強(qiáng)( 1 9 6 l 一) ,女,教授,博士生導(dǎo)師 個(gè)課題時(shí),為提高查全率,用戶不但需要了解在圖 書館提供的眾多數(shù)據(jù)庫(kù)中哪些數(shù)據(jù)庫(kù)涵蓋的學(xué)科 內(nèi)容與自己的檢索課題有關(guān),而且還需要逐一登 陸所有相關(guān)數(shù)據(jù)庫(kù)分別進(jìn)行檢索而在檢索時(shí),還 要掌握不同數(shù)據(jù)庫(kù)的檢索方法,以便正確地檢索; 最后,各個(gè)數(shù)據(jù)庫(kù)的檢索結(jié)果又具有不同的全文 數(shù)據(jù)格式( 如c a j 、p d f 、p 咄等) ,需要安裝各自相 應(yīng)的閱讀器,才能閱讀全文使檢索效率低下,增 加了用戶檢索的難度,浪費(fèi)了用戶大量的時(shí)間和 精力,給使用者帶來(lái)諸多不便因此,圖書館迫切 需要對(duì)其擁有的數(shù)字信息資源進(jìn)行統(tǒng)一的組織和 處理,即在引進(jìn)、自建數(shù)據(jù)庫(kù)的同時(shí),對(duì)這些信息 資源進(jìn)行整合,讓使用者可以通過(guò)一個(gè)檢索人口 檢索到幾乎所有的信息資源,從而提高信息資源 整體使用效率,有利于實(shí)現(xiàn)信息資源的共享 哈爾濱工業(yè)大學(xué)學(xué)報(bào)第3 9 卷 1整合模式分析 信息資源的整合是指由計(jì)算機(jī)網(wǎng)絡(luò)及相關(guān)技 術(shù)構(gòu)成的系統(tǒng),實(shí)現(xiàn)信息資源的集中管理及跨平 臺(tái)、跨數(shù)據(jù)庫(kù)檢索國(guó)內(nèi)圖書館的信息資源整合模 式主要有兩種:對(duì)數(shù)據(jù)源的整合及對(duì)不同信息資 源檢索接口的整合嵋J 1 1 數(shù)據(jù)源的整合 數(shù)據(jù)源的整合是對(duì)不同數(shù)據(jù)資源信息庫(kù)進(jìn)行 整合整合方法是建立一個(gè)數(shù)據(jù)存貯倉(cāng)庫(kù),將參與 整合的各種數(shù)據(jù)源的數(shù)據(jù)裝入其中,把不同數(shù)據(jù) 結(jié)構(gòu)的內(nèi)容轉(zhuǎn)換為相同的數(shù)據(jù)格式,用單一的檢 索引擎檢索所有的資源這是一種最徹底、最完全 意義上的整合,完全脫離了各種異構(gòu)系統(tǒng)原有的 服務(wù)平臺(tái)通過(guò)對(duì)不同數(shù)據(jù)源的集成,構(gòu)建新的數(shù) 據(jù)倉(cāng)庫(kù),用戶通過(guò)數(shù)據(jù)倉(cāng)庫(kù)提供的統(tǒng)一的檢索入 口進(jìn)行查詢bJ 在這種模式下,數(shù)據(jù)重復(fù)存儲(chǔ),整 合后的系統(tǒng)需要維護(hù)一個(gè)與數(shù)據(jù)源中的數(shù)據(jù)一致 的副本因?yàn)椴樵儾辉僭L問(wèn)源數(shù)據(jù),所以響應(yīng)一般 較快,但維護(hù)代價(jià)較高 1 2 檢索接口的整合 檢索接口的整合是指在統(tǒng)一的用戶查詢接口 與信息反饋的形式下,共享多個(gè)數(shù)據(jù)庫(kù)資源的索引 和檢索技術(shù),它以代理的角色接受用戶的請(qǐng)求,通 過(guò)轉(zhuǎn)換程序把查詢請(qǐng)求轉(zhuǎn)換成相應(yīng)數(shù)據(jù)庫(kù)的查詢 語(yǔ)言和檢索方法,分別對(duì)各個(gè)數(shù)據(jù)庫(kù)發(fā)出檢索請(qǐng) 求,再將來(lái)自各個(gè)數(shù)據(jù)庫(kù)的命中結(jié)果集成在一個(gè)界 面中顯示給用戶對(duì)源數(shù)據(jù)的訪問(wèn)方法有兩種”J : 1 ) 利用數(shù)據(jù)庫(kù)接口訪問(wèn)源數(shù)據(jù) 這種方法是借助于數(shù)據(jù)庫(kù)開發(fā)商所提供的數(shù) 據(jù)接口,直接訪問(wèn)本地的數(shù)據(jù)源通過(guò)各數(shù)據(jù)庫(kù)管 理系統(tǒng)的現(xiàn)有查詢執(zhí)行引擎和語(yǔ)言,將數(shù)據(jù)從各 數(shù)據(jù)源中提取出來(lái),不需要設(shè)計(jì)和實(shí)現(xiàn)專用的查 詢語(yǔ)言和執(zhí)行引擎,應(yīng)用開發(fā)工作量小這種方法 通常建立在通用數(shù)據(jù)庫(kù)平臺(tái)和開放系統(tǒng)之上,由 于很多數(shù)據(jù)廠商不愿意開放其數(shù)據(jù)庫(kù)權(quán)限,公開 其數(shù)據(jù)訪問(wèn)接口,使這種方法受到限制 2 ) 通過(guò)應(yīng)用程序訪問(wèn)源數(shù)據(jù) 這種方法應(yīng)用的查詢首先被重構(gòu)、分解成面 向各個(gè)數(shù)據(jù)源的查詢,然后由查詢引擎調(diào)用包裝 器實(shí)時(shí)抓取各個(gè)數(shù)據(jù)源站點(diǎn)的頁(yè)面,抽取其中的 數(shù)據(jù)元素,再由執(zhí)行引擎將返回的數(shù)據(jù)集成、轉(zhuǎn)化 為統(tǒng)一的結(jié)構(gòu)化形式后返回給用戶這種方法的 優(yōu)點(diǎn)是不需要數(shù)據(jù)廠商的數(shù)據(jù)開放,具有良好的 現(xiàn)實(shí)操作性而且查詢的結(jié)果能保證始終是最薪 的,適用于數(shù)據(jù)源自治程度高、變化頻繁的情況 但這種方法需要設(shè)計(jì)和實(shí)現(xiàn)特定的查詢執(zhí)行引擎 和查詢語(yǔ)言,需要復(fù)雜的查詢生成器 無(wú)論哪種方式訪問(wèn)源數(shù)據(jù),當(dāng)數(shù)據(jù)從數(shù)據(jù)源 中抽取出來(lái)以后,都需要對(duì)數(shù)據(jù)進(jìn)行整合,形成統(tǒng) 一的數(shù)據(jù)中間模式由于數(shù)據(jù)在提供應(yīng)用之前經(jīng) 過(guò)了處理,使返回給用戶的數(shù)據(jù)更加規(guī)范化x M L ( e X t e n s i b l eM a r k u p L a n g u a g e ) 具有自定義性及其 可擴(kuò)展性等優(yōu)勢(shì),便于表達(dá)各種類型的數(shù)據(jù),數(shù)據(jù) 的呈現(xiàn)與處理可分離操作,可實(shí)現(xiàn)數(shù)據(jù)跨平臺(tái)傳 輸、交換和共享,以應(yīng)用的中間數(shù)據(jù)形式,解決數(shù) 據(jù)的統(tǒng)一接口問(wèn)題 2 圖書館信息資源整合原型系統(tǒng)設(shè)計(jì) 2 1 系統(tǒng)模型設(shè)計(jì) 本系統(tǒng)設(shè)計(jì)的目標(biāo):整合哈工大圖書館的館 藏書目數(shù)據(jù)資源和本地的其他信息資源,建立一 個(gè)異構(gòu)數(shù)據(jù)庫(kù)信息共享平臺(tái),構(gòu)建統(tǒng)一的檢索系 統(tǒng)和用戶界面,實(shí)現(xiàn)用戶單一的檢索表達(dá),在一個(gè) 涵蓋各種不同信息資源的集合中得到響應(yīng),從而 實(shí)現(xiàn)多個(gè)異構(gòu)信息資源庫(kù)的統(tǒng)一檢索采用J s P + X M L 開發(fā)這個(gè)跨庫(kù)檢索系統(tǒng),開發(fā)模型如圖1 所示 應(yīng)用服務(wù)器數(shù)據(jù)源 圖1 系統(tǒng)開發(fā)模型 本系統(tǒng)用J s P 與s e n ,l e t 聯(lián)合實(shí)現(xiàn)動(dòng)態(tài)內(nèi)容服 務(wù),吸取了兩種技術(shù)各自的突出優(yōu)點(diǎn),用J s P 生成 表示層的任務(wù),讓S e r v l e t 完成深層次的處理任 務(wù),J a v a B e a n 完成數(shù)據(jù)的提取功能在擴(kuò)展系統(tǒng) 時(shí),只需修改業(yè)務(wù)邏輯和控制部分( J a v a B e a n 和 S e r v l e t ) 即可,無(wú)需修改顯示的J S P 系統(tǒng),很容易 對(duì)些新購(gòu)買的數(shù)據(jù)庫(kù)進(jìn)行整合 2 2 系統(tǒng)體系結(jié)構(gòu)設(shè)計(jì) 在B s 模式的基礎(chǔ)上結(jié)合x M L 和J s P 的特 點(diǎn)和工作原理,將本系統(tǒng)分為4 層體系結(jié)構(gòu):第l 層是表示層,接受用戶的信息請(qǐng)求并返回請(qǐng)求結(jié) 果;第2 層是W e b 服務(wù)層,實(shí)現(xiàn)信息的發(fā)布、交互 和處理的功能;第3 層是應(yīng)用服務(wù)層,用于數(shù)據(jù)的 處理及與數(shù)據(jù)庫(kù)的交互,獲取各個(gè)異構(gòu)數(shù)據(jù)源的 接口數(shù)據(jù),并整合成統(tǒng)一的中間數(shù)據(jù)格式x M L ; 第4 層是數(shù)據(jù)服務(wù)層“ j 基于x M L 的多層系統(tǒng)體 系結(jié)構(gòu)如圖2 所示 第7 期唐振宇,等:基于x M L 的圖書館網(wǎng)絡(luò)信息資源整合研究 表示層 w “服務(wù)層 用服務(wù)層 數(shù)據(jù)服務(wù)層 圖2 系統(tǒng)體系結(jié)構(gòu) 客戶端通過(guò)瀏覽器向w e b 服務(wù)器發(fā)出請(qǐng)求 后,由S e n ,l e t 負(fù)責(zé)接收,然后S e r v l e t 根據(jù)用戶的 動(dòng)作調(diào)用相應(yīng)的J s P 頁(yè)面與J a v a B e a n ,而與數(shù)據(jù) 庫(kù)交互工作由J a v a B e a n 負(fù)責(zé),J S P 頁(yè)面生成動(dòng)態(tài) x M L 反饋給客戶,在客戶端用x S L 處理器對(duì)檢索 結(jié)果進(jìn)行處理J 2 3 程序設(shè)計(jì) 本系統(tǒng)通過(guò)統(tǒng)一的檢索平臺(tái),實(shí)現(xiàn)對(duì)3 個(gè)異 構(gòu)數(shù)據(jù)庫(kù)的同時(shí)檢索,生成集成的檢索結(jié)果系統(tǒng) 體系結(jié)構(gòu)見(jiàn)圖2 系統(tǒng)檢索的數(shù)據(jù)源分別是館藏 書目數(shù)據(jù)庫(kù)( x M L 格式) 和關(guān)系型數(shù)據(jù)庫(kù)( s Y B A S E 和O R A C L E ) 限于篇幅,X M L 格式以及關(guān) 系型數(shù)據(jù)庫(kù)的數(shù)據(jù)結(jié)構(gòu)未列出系統(tǒng)運(yùn)行環(huán)境是 w i n d o w s 2 0 0 0 ,J 2 S D K ,T 0 m c a t 系統(tǒng)實(shí)現(xiàn)方法是先 把館藏書目數(shù)據(jù)( 原M A R C 格式) 經(jīng)過(guò)后臺(tái)程序 處理轉(zhuǎn)換成x M L 格式p ,通過(guò)查詢程序S e a r c h j s p 同時(shí)檢索上述3 種數(shù)據(jù)庫(kù),并將檢索結(jié)果通過(guò) J a v a B e a n 集成為一個(gè)統(tǒng)一的x M L 數(shù)據(jù),再用x s L 對(duì)x M L 數(shù)據(jù)進(jìn)行處理 J a v a B e a n 程序部分代碼如下: p a c k a g ec o m o 五e(cuò) n t q u e r y ; i m p o no 唱w 3 c d o m 水; i m p o r to 昭a(bǔ) p a c h e x e r c e s d o m 術(shù); i m p o r to 唱a p a c h e x e r c e s d o m 術(shù); i m p o r to 曙a p a c h e x m l s e “a l i z e 水; i m p o r tj a V a u t i l 米; p u b l i c c l a s sC o n t m l s e a r c h L o a d M a r c X m ll o a d M a r c X m l = n e wL o a d M a r c X m l ( ) ; S e a r c h X m l R e c o r ds e a r c h X m l R e c o r d = n e w S e a r c h X m l R e c o r d ( ) ; p r i v a t e S t I - i n g6 l e N a m e = ”; p u b l i cC o n t r o l S e a r c h ( ) I p u b l i c D o c u m e n tm a k e S e a r c h (H a s h t a b l e s e a r c h T a b l e ) V e c t o re x i s t R e c o r d = n e w V e c t o r ( ) ; e x i s t R e c o r d = d o S e a r e h i n g ( s e a I h T a b l e ) ; S y s t e m o u t p r i n t l n ( ”e x i s t R e ( :( 1 r d :”+ e x i s t R e c o r d s i z e ( ) ) ; i f ( e x i s t R e c o r d s i z e ( ) = = 0 ) r e t u m q u e r y e d N o E x i s t R e c o r d ( ) ; e l s e r e t u m q u e r y e d E x i s t R e e o r d ( e x i s t R e c o r d ) ; 該系統(tǒng)的各個(gè)組成部分具有自身的自治性, 在實(shí)現(xiàn)數(shù)據(jù)共享的同時(shí),每個(gè)數(shù)據(jù)庫(kù)系統(tǒng)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 醫(yī)療試劑的標(biāo)準(zhǔn)化采購(gòu)與質(zhì)量控制
- 醫(yī)療品牌形象在患者決策中的影響
- 區(qū)塊鏈技術(shù)重塑產(chǎn)業(yè)互聯(lián)網(wǎng)的新引擎
- 區(qū)塊鏈安全技術(shù)的醫(yī)療應(yīng)用探索
- 區(qū)塊鏈技術(shù)在農(nóng)業(yè)科技的應(yīng)用前景
- 亞惠美食合同范例
- 醫(yī)療信息泄露風(fēng)險(xiǎn)分析與防范
- epc合同范例有些
- 免疫介導(dǎo)性腎臟病的臨床護(hù)理
- 公司施工勞務(wù)合同范例
- 跨鐵路橋施工方案
- 建筑裝飾專業(yè)中級(jí)職稱理論考試題庫(kù)-建設(shè)工程專業(yè)中級(jí)職稱理論考試題庫(kù)
- 風(fēng)管制作標(biāo)準(zhǔn)
- 小學(xué)六年級(jí)數(shù)學(xué)總復(fù)習(xí)講座(課堂PPT)
- 混凝土凝結(jié)時(shí)間電子計(jì)算表
- 西北院火力發(fā)電廠汽水管道支吊架設(shè)計(jì)手冊(cè)_圖文
- 人行天橋鋼結(jié)構(gòu)施工方案
- 年產(chǎn)76萬(wàn)噸乙醛裝置工藝設(shè)計(jì)
- ISO9001、ISO14001、QC080000質(zhì)量體系程序文件大全
- 城鎮(zhèn)污水處理廠工藝設(shè)計(jì)(活性污泥法) 1
- 發(fā)動(dòng)機(jī)冷卻系統(tǒng)的匹配設(shè)計(jì)畢業(yè)論文
評(píng)論
0/150
提交評(píng)論