發(fā)現(xiàn)系統(tǒng)的應(yīng)用及其發(fā)展趨勢研究_第1頁
發(fā)現(xiàn)系統(tǒng)的應(yīng)用及其發(fā)展趨勢研究_第2頁
發(fā)現(xiàn)系統(tǒng)的應(yīng)用及其發(fā)展趨勢研究_第3頁
發(fā)現(xiàn)系統(tǒng)的應(yīng)用及其發(fā)展趨勢研究_第4頁
發(fā)現(xiàn)系統(tǒng)的應(yīng)用及其發(fā)展趨勢研究_第5頁
已閱讀5頁,還剩23頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

發(fā)現(xiàn)系統(tǒng)的應(yīng)用及發(fā)展趨勢研究目錄

背景概述

123發(fā)現(xiàn)系統(tǒng)的應(yīng)用

發(fā)現(xiàn)系統(tǒng)的發(fā)展趨勢1.背景概述隨著信息數(shù)量的急劇膨脹,如何有效利用大量結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化的復(fù)雜數(shù)據(jù)逐漸成為以圖書館為代表的信息服務(wù)機(jī)構(gòu)的當(dāng)務(wù)之急。圖書館、信息中心、數(shù)據(jù)公司等作為一個面向大眾的知識服務(wù)機(jī)構(gòu),不僅需要了解用戶需要什么服務(wù),更需要通過信息的產(chǎn)—供—消的聯(lián)動關(guān)系去挖掘正在發(fā)生什么、預(yù)測和分析將來會發(fā)生什么。知識發(fā)現(xiàn)(Knowledge-DiscoveryinDatabases,簡稱KDD):從大量數(shù)據(jù)中提取出可信的、有效的、新穎的以及最終可理解的模式的高級處理過程?!壳爸R發(fā)現(xiàn)比較公認(rèn)的概念是由Fayyad等人提出來的。1.背景概述KDD在研究和應(yīng)用方面發(fā)展迅速,尤其是在商業(yè)和銀行領(lǐng)域的應(yīng)用比研究的發(fā)展速度更快KDD在學(xué)術(shù)界和工業(yè)界的影響越來越大,國際KDD組委會把專題討論會更名為國際會議知識發(fā)現(xiàn)的概念最早源于知識工程和人工智能(AI)領(lǐng)域在加拿大蒙特利爾召開了第一屆KDD國際學(xué)術(shù)會議,以后每年召開一次1989年首次出現(xiàn)數(shù)據(jù)庫中的知識發(fā)現(xiàn)的概念2015年現(xiàn)在KDD技術(shù)在商業(yè)應(yīng)用中已經(jīng)可以馬上投入使用2.發(fā)現(xiàn)系統(tǒng)的應(yīng)用發(fā)現(xiàn)系統(tǒng)2.1發(fā)現(xiàn)系統(tǒng)簡介2.3發(fā)現(xiàn)系統(tǒng)可用性評估2.2中外文發(fā)現(xiàn)系統(tǒng)2.1發(fā)現(xiàn)系統(tǒng)簡介背景:依托圖書館等信息機(jī)構(gòu)的服務(wù)系統(tǒng)、海量數(shù)字資源及各類信息的邏輯關(guān)系等,創(chuàng)建服務(wù)于信息用戶的新一代知識發(fā)現(xiàn)系統(tǒng)已成為大數(shù)據(jù)時代信息服務(wù)機(jī)構(gòu)的必然選擇。定義:發(fā)現(xiàn)系統(tǒng):通過一個簡單的檢索接口,對預(yù)先索引好的元數(shù)據(jù)倉庫進(jìn)行檢索,并返回統(tǒng)一檢索結(jié)果的一類檢索服務(wù)系統(tǒng)。——NFAIS CodeofPracticeDraft:DiscoveryServices

[EB/OL],(2012-01-30).[2013-07-04].

發(fā)現(xiàn)系統(tǒng)原理圖

發(fā)現(xiàn)系統(tǒng)解決了什么問題

用戶:眾多的數(shù)據(jù)庫給用戶帶來困惑——資源發(fā)現(xiàn)冗余、超載信息的數(shù)據(jù)關(guān)聯(lián)與情報分析——知識發(fā)現(xiàn)館藏資源得到了有效利用資源發(fā)現(xiàn)(淺發(fā)現(xiàn))→知識發(fā)現(xiàn)(深發(fā)現(xiàn))2.2中外文發(fā)現(xiàn)系統(tǒng)國外四大資源發(fā)現(xiàn)系統(tǒng)1、Proquest旗下SerialsSolution公司在2009年7月推出了第一款網(wǎng)絡(luò)級發(fā)現(xiàn)系統(tǒng)Summon。2、2009年7月,ExLibris公司公開了PrimoCentral元數(shù)據(jù)倉儲的建設(shè)進(jìn)展情況,其統(tǒng)一資源發(fā)現(xiàn)系統(tǒng)Primo測試版也于2010年1月發(fā)布,同時將原有的Primo架構(gòu)集成到PrimoCentral和館藏目錄系統(tǒng)之上。3、OCLC于2007年11月推出全球第一款WorldcatLocal系統(tǒng),提供館藏資源和電子資源的一站式檢索,隨著OCLC與數(shù)據(jù)庫商的不斷合作,WorldcatLocal集成了元搜索功能,并于2010年開始提供網(wǎng)絡(luò)級發(fā)現(xiàn)服務(wù)。4、EBSCO公司也發(fā)布了發(fā)現(xiàn)系統(tǒng),名稱為EBSCODiscoveryService(簡稱EDS)。

國外4大發(fā)現(xiàn)系統(tǒng)資源比較

系統(tǒng)元數(shù)據(jù)總量及資源范圍中文資源覆蓋SummonSummon涵蓋了7000多個出版商,80多種資源類型,包含了大約7.5億條數(shù)據(jù)記錄,其中39個開放獲取檔案和257個機(jī)構(gòu)資源庫中的4000萬條記錄多半都是全文索引。與Calis達(dá)成協(xié)議,允許其利用其學(xué)術(shù)論文的元數(shù)據(jù);與Apabi達(dá)成相關(guān)數(shù)據(jù)使用協(xié)議PrimoCentralPrimoCentral已經(jīng)收錄超過5億條索引記錄,整合了世界上大部分的外文電子期刊文章、電子書元數(shù)據(jù)、部分報紙。已與重慶維普公司達(dá)成相關(guān)數(shù)據(jù)使用協(xié)議EDS截至2012年6月,EDS涵蓋了大約2萬個期刊出版社和大約7萬個圖書出版社,包括大約64000種期刊,82.5萬CD&DVD,600萬種圖書,3.2億報紙文章,40萬會議記錄,還有幾十萬種其它類型的信息資源。與Apabi達(dá)成協(xié)議,Apabi大量的電子書元,數(shù)據(jù)可以被EDS利用WCL截至2012年9月1日,WCL.可一站式搜索超過9.69億數(shù)據(jù)記錄,其中期刊91495篇,文章7.31億篇,數(shù)字內(nèi)容資料3200萬部,電子圖書1390萬冊,機(jī)構(gòu)資料庫記錄2200萬冊,碩博士論文1800萬冊?!獌?nèi)容國內(nèi)資源發(fā)現(xiàn)系統(tǒng)我國發(fā)現(xiàn)系統(tǒng)研究和應(yīng)用雖然起步較晚,但是國內(nèi)的很多高校圖書館已經(jīng)陸續(xù)開展針對自身實際的資源探索發(fā)現(xiàn)系統(tǒng)建設(shè)和應(yīng)用實踐。也有部分知名高校部分釆用直接引進(jìn)國外成熟的發(fā)現(xiàn)系統(tǒng)的方式來進(jìn)行建設(shè)。國內(nèi)相關(guān)的檢索系統(tǒng)提供商中,主要的服務(wù)商也開始提供發(fā)現(xiàn)系統(tǒng)或發(fā)現(xiàn)平臺的服務(wù)。2.3發(fā)現(xiàn)系統(tǒng)可用性評估發(fā)現(xiàn)系統(tǒng)的評估主體:發(fā)現(xiàn)系統(tǒng)的評價主體是指在資源發(fā)現(xiàn)系統(tǒng)考察試用、引進(jìn)和使用等各階段發(fā)揮領(lǐng)導(dǎo)、組織和實施作用的組織和個人。發(fā)現(xiàn)系統(tǒng)一般由圖書館直接購買和引進(jìn),因此圖書館和讀者是發(fā)現(xiàn)系統(tǒng)的評價主體。發(fā)現(xiàn)系統(tǒng)的評估內(nèi)容:發(fā)現(xiàn)系統(tǒng)的評價內(nèi)容主要圍繞發(fā)現(xiàn)系統(tǒng)這一評價對象展開。(發(fā)現(xiàn)系統(tǒng)的功能評價、系統(tǒng)提供商的服務(wù)、用戶的使用評價、系統(tǒng)的使用量和使用效益)檢索功能和用戶界面產(chǎn)品功能評估評估點

界面體系設(shè)計結(jié)果保存/導(dǎo)出默認(rèn)檢索界面高級檢索界面分面檢索檢索結(jié)果顯示、排序獲?。ㄩ_放鏈接等)

檢索功能檢索速度檢索精度(糾錯、人名識別、自然語言檢索等)檢索深度(摘要、全文索引等)檢索相關(guān)度(算法)檢索結(jié)果去重歸組讀者服務(wù)個性化設(shè)置個人賬戶資源推送

Web2.0服務(wù)(評論、分享等)讀者評估評估點讀者測試評估檢索的測評結(jié)果第一輪測評第二輪測評元數(shù)據(jù)評估評估點元數(shù)據(jù)數(shù)量和覆蓋率元數(shù)據(jù)數(shù)量對我館紙質(zhì)資源的覆蓋對我館電子資源的覆蓋元數(shù)據(jù)質(zhì)量元數(shù)據(jù)質(zhì)量和厚度(規(guī)范性、豐富性)元數(shù)據(jù)來源元數(shù)據(jù)來源資源更新頻率資源整合產(chǎn)品功能評估評估點與其它系統(tǒng)/資源的整合與支持與本館鏈接類產(chǎn)品配合度與本館OPAC系統(tǒng)的融合度文獻(xiàn)元數(shù)據(jù)導(dǎo)出接口電子期刊與紙本期刊資源的整合與WOS、Scopus的集成與CrossRefDOI的合作對館藏資源的整合(數(shù)據(jù)導(dǎo)入格式、數(shù)據(jù)上傳方式)對鏈接服務(wù)器的支持對移動平臺的支持市場情況收費與服務(wù)模式市場占有情況、發(fā)展態(tài)勢對中文和中國市場的支持程度后續(xù)系統(tǒng)可擴(kuò)展性與可維護(hù)性評估點運營維護(hù)運營維護(hù)方便程度運維人力成本低運維物力及財力成本低可擴(kuò)展性靈活性——系統(tǒng)可定制程度應(yīng)用接口及接口協(xié)議發(fā)現(xiàn)系統(tǒng)評價指標(biāo)體系發(fā)現(xiàn)系統(tǒng)可用性評估作用發(fā)現(xiàn)系統(tǒng)可用性評估有助于圖書館選擇合適的發(fā)現(xiàn)系統(tǒng),可以有力地支持圖書館與系統(tǒng)提供商的談判。促使系統(tǒng)提供商不斷完善發(fā)現(xiàn)系統(tǒng)產(chǎn)品,滿足用戶豐富和多樣化的信息獲取需求。現(xiàn)在系統(tǒng)提供商-般都提供發(fā)現(xiàn)系統(tǒng)試用服務(wù),在試用階段圖書館和用戶可以根據(jù)已制定的評價指標(biāo)對資源發(fā)現(xiàn)系統(tǒng)進(jìn)行充分的測試、使用和評估,以保證評價結(jié)果的客觀性和最后決策的科學(xué)性。3.發(fā)現(xiàn)系統(tǒng)的發(fā)展趨勢更廣的資源覆蓋范圍更高的應(yīng)用程度更髙的占有率功能會日益發(fā)展Earlyresourcediscoverysystemfocusedontechnology,andnowtheresourcediscoverysystemarerequiredpayattentiontoconsideringdevelopingresourcesandimprovingtheusers’experienceasthemaintask.Breeding認(rèn)為早期資源發(fā)現(xiàn)系統(tǒng)專注于技術(shù),而現(xiàn)在的資源發(fā)現(xiàn)系統(tǒng)則需要轉(zhuǎn)移注意力,把發(fā)展資源內(nèi)容和增強(qiáng)用戶體驗作為主要任務(wù)?!狹arshallB.Nextgenerationlibraryautomationanditsimplicationsforresourcesharing[EB/OL].[2011-03-20]

給予不同格式的資源被公平獲取的權(quán)利

在以后的發(fā)展中要更加注重對多媒體資源的集成

更深層次的內(nèi)容索引

用戶在搜索時,文獻(xiàn)中的每個詞或詞組都有可能成為檢索,而不僅僅是關(guān)鍵詞、題目、作者等幾個有限的檢索點

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論