國內(nèi)外圖書館數(shù)字信息訪問研討論文_第1頁
國內(nèi)外圖書館數(shù)字信息訪問研討論文_第2頁
國內(nèi)外圖書館數(shù)字信息訪問研討論文_第3頁
國內(nèi)外圖書館數(shù)字信息訪問研討論文_第4頁
國內(nèi)外圖書館數(shù)字信息訪問研討論文_第5頁
已閱讀5頁,還剩3頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、國內(nèi)外圖書館數(shù)字信息訪問研討論文編者按:本文主要從圖書館數(shù)字資源訪問統(tǒng)計(jì)的現(xiàn)狀;圖書館數(shù)字資源訪問統(tǒng)計(jì)的方式;圖書館數(shù)字資源訪問統(tǒng)計(jì)的指標(biāo);圖書館數(shù)字資源訪問統(tǒng)計(jì)存在的問題幾個(gè)方面進(jìn)行論述。其中,主要包括:典型的研究計(jì)劃、相關(guān)標(biāo)準(zhǔn)、國內(nèi)圖書館數(shù)字資源訪問統(tǒng)計(jì)的研究和應(yīng)用、WEB日志方式、通過對(duì)訪問時(shí)間進(jìn)行統(tǒng)計(jì),可以得到服務(wù)器在某些時(shí)段的訪問情況、對(duì)訪問請(qǐng)求的錯(cuò)誤進(jìn)行統(tǒng)計(jì)和分析,可以找出有問題的頁面加以改正、資源提供商提供、通過網(wǎng)絡(luò)代理proxy、利用腳本語言自行開發(fā)、國際圖書館聯(lián)盟的統(tǒng)計(jì)指標(biāo)指南、E-Metrics推薦的統(tǒng)計(jì)指標(biāo)、我國圖書館常用的數(shù)字資源訪問統(tǒng)計(jì)指標(biāo)、資料庫不在館內(nèi),正確及時(shí)的

2、統(tǒng)計(jì)數(shù)據(jù)不易取得、缺乏標(biāo)準(zhǔn)的統(tǒng)計(jì)指標(biāo)等,具體請(qǐng)?jiān)斠姟?1圖書館數(shù)字資源訪問統(tǒng)計(jì)的現(xiàn)狀 1.1典型的研究計(jì)劃 美國和歐盟針對(duì)圖書館數(shù)字資源的訪問統(tǒng)計(jì)已經(jīng)展開了一些針對(duì)性的研究計(jì)劃,比如,由美國研究圖書館協(xié)會(huì)資助的E-Metric項(xiàng)目、美國多個(gè)機(jī)構(gòu)(包括ARL、JISC、NISO等)資助的COUNIER項(xiàng)目、歐盟TelematicsforLibrariesProgramme支持的EQUINOX項(xiàng)目等,這些項(xiàng)目多為研究制定描述電子信息服務(wù)和資源的統(tǒng)計(jì)指標(biāo)和績效測(cè)度及其方法。 1.2相關(guān)標(biāo)準(zhǔn) 在相關(guān)的標(biāo)準(zhǔn)方面,面對(duì)新的信息環(huán)境和圖書館形態(tài),一些組織開始嘗試將新的電子資源績效評(píng)估標(biāo)準(zhǔn)融入原有相關(guān)標(biāo)準(zhǔn)指南

3、的框架。例如NISO在2004年批準(zhǔn)了圖書館和信息提供者信息服務(wù)和利用的測(cè)度和統(tǒng)計(jì)數(shù)據(jù)字典(NISOZ39.7-2004InformationServicesandUse:Metrics&statisticsforlibrariesandinfomationproviders-DataDictionary),該標(biāo)準(zhǔn)在傳統(tǒng)圖書館工作的基礎(chǔ)上,還特別增加了網(wǎng)絡(luò)服務(wù)、網(wǎng)絡(luò)資源、網(wǎng)絡(luò)運(yùn)行的新的測(cè)度方法,這套數(shù)據(jù)字典將逐漸納入美國圖書館統(tǒng)計(jì)工作,成為美國圖書館統(tǒng)計(jì)工作的參考依據(jù), ICOLC1998年制定的網(wǎng)上索引、文摘和全文資源使用統(tǒng)計(jì)測(cè)度指南(GuidelinesforStatisticalMeaS

4、uresofUsageofWeb-BasedIndexed,AbstractedandFullTextResources)提供了一套網(wǎng)絡(luò)化信息資源使用的績效測(cè)度指南。2001年的修訂版明確了網(wǎng)絡(luò)信息使用數(shù)據(jù)統(tǒng)計(jì)的最基本要求,并提供在隱私、保密、獲取、傳遞和報(bào)告形式方面的指導(dǎo)。 ISOISO/CD11620也在傳統(tǒng)服務(wù)統(tǒng)計(jì)指標(biāo)的基礎(chǔ)上,結(jié)合ICOLC和COUNTER的研究,進(jìn)行了圖書涫數(shù)字資源測(cè)度及其定義、方法的描述。 1.3國內(nèi)圖書館數(shù)字資源訪問統(tǒng)計(jì)的研究和應(yīng)用 國內(nèi)隨著公共圖書館、大學(xué)圖書館、科學(xué)圖書館系統(tǒng)圖書館評(píng)估工作的進(jìn)行,圖書館界開始逐步重視對(duì)圖書館數(shù)字館藏、圖書館數(shù)字化信息服務(wù)的評(píng)估

5、。 參考文獻(xiàn)2中提出了數(shù)字資源后評(píng)估的概念,但是對(duì)圖書館數(shù)字資源訪問統(tǒng)計(jì)等后評(píng)估的方法和指標(biāo)體系尚未全面展開評(píng)論。一些圖書館自行開發(fā)了基于jsp或者asp的圖書館網(wǎng)站訪問統(tǒng)計(jì)軟件,一些數(shù)字圖書館系統(tǒng),如清華同方的TPI、北京拓爾思的TRS、浙江天宇的CGRS等等也提供了相應(yīng)的統(tǒng)計(jì)功能,但是尚沒有一款商業(yè)化的軟件針對(duì)圖書館的各種類型的數(shù)字資源提供一攬子的訪問統(tǒng)計(jì)方案。 2圖書館數(shù)字資源訪問統(tǒng)計(jì)的方式 2.1WEB日志方式 web服務(wù)器在工作時(shí),時(shí)刻將WWW訪問的結(jié)果記錄在一些log(日志)文件中,通過對(duì)服務(wù)器日志的分析可以得到以下信息 (1)通過對(duì)訪問時(shí)間進(jìn)行統(tǒng)計(jì),可以得到服務(wù)器在某些時(shí)段的訪問

6、情況; (2)對(duì)訪問者的IP進(jìn)行統(tǒng)計(jì),從中可以判斷主要是那些用戶在訪問Web服務(wù)器; (3)對(duì)訪問請(qǐng)求的錯(cuò)誤進(jìn)行統(tǒng)計(jì)和分析,可以找出有問題的頁面加以改正; (4)對(duì)訪問者清求的URL進(jìn)行統(tǒng)計(jì),就可以判斷出讀者對(duì)那些頁面的內(nèi)容最感興趣,對(duì)哪些頁面的內(nèi)容不感興趣。 各種web服務(wù)器日志文件的格式和內(nèi)容大致相同。根據(jù)W3C的際準(zhǔn)2,一般Web日志都包括諸如用戶的IP地址、請(qǐng)求時(shí)間、方法(GET/POST等)、被請(qǐng)求網(wǎng)頁或文件的URL、發(fā)送接收字節(jié)數(shù)、協(xié)議版本等信息。表1列出了幾種不同類型的Web日志。 但這些日志文件信息量很大,用戶難以直接從log文件獲得直觀的結(jié)果。對(duì)日志文件的分析,可以借助一些商

7、業(yè)性的或者源代碼開放的軟件完成。其中比較好的開放源代碼的日志分析軟件有:AWStats、webalizer等。 從日志文件提供的信息進(jìn)行統(tǒng)計(jì)和分析,就可以對(duì)整個(gè)網(wǎng)站有一個(gè)數(shù)字化、精確的認(rèn)識(shí),從而對(duì)網(wǎng)站的設(shè)計(jì)和內(nèi)容進(jìn)行改善和調(diào)整,使圖書館網(wǎng)站更好地為讀者提供服務(wù)。 2.2資源提供商提供 數(shù)據(jù)庫的使用情況屬于后評(píng)估指標(biāo),主要用于更新、續(xù)訂數(shù)據(jù)庫時(shí)使用,一般在圖書館購買資源提供商的數(shù)字資源時(shí),應(yīng)該要求由出版商或數(shù)據(jù)庫商提供使用報(bào)告,再據(jù)此進(jìn)行各類分析。 目前出版商數(shù)據(jù)庫商提供的統(tǒng)計(jì)報(bào)告常用的相關(guān)統(tǒng)計(jì)指標(biāo)有: 檢索次數(shù)(searfh/query):用戶在某一個(gè)數(shù)據(jù)庫中提出檢索式的次數(shù)。 登錄次數(shù)(se

8、ssion/signon):用戶打開某個(gè)數(shù)據(jù)庫的次數(shù)。 下載文摘全文(abstract/fulltextpage/image):用戶在某一個(gè)數(shù)據(jù)庫中下載到本地客戶機(jī)中的文摘或全文篇數(shù)。 2.3通過網(wǎng)絡(luò)代理proxy 代理服務(wù)器(ProxyServer)是一種服務(wù)器軟件,它的主要功能有:設(shè)置用戶驗(yàn)證和記帳功能,可按用戶進(jìn)行記帳,沒有登記的用戶無權(quán)通過代理服務(wù)器訪問Internet網(wǎng),可以對(duì)用戶的訪問時(shí)間、訪問地點(diǎn)、信息流量進(jìn)行統(tǒng)計(jì)。 目前代理服務(wù)器軟件產(chǎn)品十分成熟,功能也很強(qiáng)大,可供選擇的服務(wù)器軟件很多。主要的服務(wù)器軟件有WinGate公司的WinGatePro、微軟公司的MicrosoftPr

9、oxy、Netscape的NetscapeProxy、SybergenNetworks公司的SyGate等,這些代理軟件不僅可以為局域網(wǎng)內(nèi)的PC機(jī)提供代理服務(wù),還可以為基于Novell網(wǎng)絡(luò)的用戶,甚至UNLX的用戶提供代理服務(wù)。目前絕大部分Intemet的應(yīng)用都可以通過代理方式實(shí)現(xiàn)。大多數(shù)代理服務(wù)器軟件產(chǎn)品具有登記內(nèi)部網(wǎng)用戶訪問外部網(wǎng)的日志記錄,有些產(chǎn)品還可以直接將日志記錄到數(shù)據(jù)庫中。根據(jù)日志記錄文件或數(shù)據(jù)庫,可以統(tǒng)計(jì)內(nèi)部網(wǎng)每個(gè)用戶的網(wǎng)絡(luò)流量以及上網(wǎng)時(shí)間,甚至可以按服務(wù)網(wǎng)絡(luò)類型(如:HTTP、SMTP、FTP等)分別進(jìn)行統(tǒng)計(jì)。 2.4利用腳本語言自行開發(fā) 通過web服務(wù)器的日志可以獲得用戶訪問

10、圖書館網(wǎng)站信息的情況,但是,這種方式需要對(duì)日志的格式進(jìn)行了解,然后用相應(yīng)的工具軟件或者進(jìn)行一定的開發(fā)來完成。還有一種獲取網(wǎng)站訪問情況的方法是利用asp或者isp等網(wǎng)絡(luò)腳本語言,利用它們內(nèi)置的server、session、request對(duì)象等獲取相關(guān)的信息,獲取數(shù)據(jù)進(jìn)行統(tǒng)計(jì)。比如:利用Jsp我們可以用Jsp的內(nèi)置request對(duì)象的獲取參數(shù)方法request.getParameter(“userid”),獲取用戶名;用(request.getRemoteAddr)獲取訪問者的IP地址;通過request.getHeader(“User-Agent”)獲取包含瀏覽器和操作系統(tǒng)的信息,然后用字符串分

11、割substring()方法來分別得到瀏覽器和操作系統(tǒng);通過Jsp的內(nèi)置對(duì)象session的方法session,getCreation-Time()返回Session被創(chuàng)建的時(shí)間,而session.getLastAccessedTime()則返回當(dāng)前Session對(duì)象最后被客戶發(fā)送的時(shí)間,兩者之差為停留時(shí)間。 主要分以下幾個(gè)開發(fā)步驟: (1)確定將要統(tǒng)計(jì)的信息; (2)建立數(shù)據(jù)庫; (3)實(shí)時(shí)的訪問信息紀(jì)錄,記錄每次點(diǎn)擊的信息,包括頁面信息、用戶信息、訪問IP、訪問時(shí)間; (4)實(shí)時(shí)信息的分類存儲(chǔ); (5)顯示方式的選擇。可以用Windows的表格系統(tǒng),也可以自行編制表格顯示。 利用這種方法相

12、對(duì)比較簡單,但是可獲得的統(tǒng)計(jì)指標(biāo)也有限。 除了上述幾種統(tǒng)計(jì)方式外,還有基于路由器的流量統(tǒng)計(jì)、基于防火墻的流量統(tǒng)計(jì)、基于以太網(wǎng)廣播特性的流量統(tǒng)計(jì)。但是這些方法所提供的簡單流量的統(tǒng)計(jì)功能,不能完全滿足圖書館數(shù)字資源訪問統(tǒng)計(jì)的目標(biāo)。 3圖書館數(shù)字資源訪問統(tǒng)計(jì)的指標(biāo) 3.1國際圖書館聯(lián)盟的統(tǒng)計(jì)指標(biāo)指南 國際圖書館聯(lián)盟認(rèn)為,信息資源提供商對(duì)他們提供的特定的電子信息資源所提供的統(tǒng)計(jì)數(shù)據(jù)應(yīng)該滿足以下的最低需求。 必須提供的數(shù)據(jù)元素是: a)會(huì)話(session)數(shù)量(或者登陸數(shù)量)numberofsessions。為了滿足政府機(jī)構(gòu)和專業(yè)組織的報(bào)告的需要,應(yīng)該提供會(huì)話數(shù)量或者登陸數(shù)量。在沒有國界的網(wǎng)絡(luò)環(huán)境中,

13、會(huì)話數(shù)量的統(tǒng)計(jì)是一個(gè)粗糙的指標(biāo)。 b)提問數(shù)(numberofqueries),即經(jīng)過分類的提問數(shù)量。一次檢索是一次獨(dú)立的知識(shí)查詢。典型地,一次檢索被記錄為向服務(wù)器提交的一個(gè)檢索表單,之后的瀏覽行為或者選定一個(gè)單獨(dú)條目的行為沒有表現(xiàn)為額外的檢索,除非通過提交二次檢索。立即進(jìn)行重復(fù)的檢索、雙擊或者其他用戶的無意識(shí)行為都不應(yīng)計(jì)入其內(nèi)。 c)菜單的選擇數(shù)(numberofmenuselections),如果數(shù)據(jù)的顯示需要通過使用菜單來進(jìn)行瀏覽,則應(yīng)該提供這個(gè)指標(biāo)(如一個(gè)電子期刊網(wǎng)站提供的基于音序和主體的菜單選擇)。 d)全文的數(shù)量(打開的、下載的或者提供給用戶的全文,這些全文都是由服務(wù)器控制的而不是

14、由瀏覽器控制的): 期刊文章按照期刊名稱列出刊名和issn; 電子書按照書名列出書名和isbn; 參考資料按照改資源的內(nèi)容單元(如字典的定義、百科全書的文章、傳記等); 非文本型資源按照自愿的文獻(xiàn)類型(如圖像、音頻、視頻等)。 上述的每個(gè)數(shù)據(jù)元素應(yīng)該按照每個(gè)特定的數(shù)據(jù)庫提供商、按照每一組機(jī)構(gòu)的IP地址或其他特別的元素(如賬號(hào)),以及機(jī)構(gòu)名稱、協(xié)會(huì)名稱和時(shí)間跨度(每月或者每年)分組描述,供應(yīng)商還應(yīng)該提供每天、每小時(shí)的統(tǒng)計(jì)數(shù)據(jù),并且還應(yīng)該可以動(dòng)態(tài)地集成幾個(gè)月或者某一段時(shí)間的數(shù)據(jù),而不用限制是當(dāng)年數(shù)據(jù)還是由供應(yīng)商限定的時(shí)間段。 3.2E-Metrics推薦的統(tǒng)計(jì)指標(biāo) 為了了解圖書館數(shù)字資源的使用情況

15、,確定數(shù)字資源的花費(fèi)是否合理,MRL的E-Metrics項(xiàng)目推薦的指標(biāo)如下: (1)用戶可檢索的電子資源。包括:R1電子全文期刊種數(shù)、R2電子參考資源種數(shù)、R3電子書的種數(shù)。 (2)對(duì)網(wǎng)絡(luò)資源和服務(wù)的使用情況。包括:U1電子參考事務(wù)的數(shù)量、U2登錄電子數(shù)據(jù)庫的數(shù)量(會(huì)話session數(shù))、U3電子數(shù)據(jù)庫的提問和檢索數(shù)量、U4電子數(shù)據(jù)庫的請(qǐng)求條數(shù)、U5對(duì)圖書館網(wǎng)站和書目的遠(yuǎn)程訪問次數(shù)。 (3)網(wǎng)絡(luò)資源和相關(guān)設(shè)備的花費(fèi)。包括:C1全文電子期刊的成本、C2電子參考資源的成本、C3電子書的成本、C4圖書館對(duì)書目設(shè)備、網(wǎng)絡(luò)環(huán)境等相關(guān)設(shè)備的花費(fèi)、C5對(duì)書目設(shè)備、網(wǎng)絡(luò)環(huán)境等相關(guān)設(shè)備的外部花費(fèi)。 (4)圖書館

16、數(shù)字化活動(dòng)。包括:D1數(shù)字館藏的大小、D2數(shù)字館藏的使用、D3數(shù)字館藏建設(shè)和管理的成本。 E-Metrics的統(tǒng)計(jì)指標(biāo),既考慮了數(shù)字資源和數(shù)字化服務(wù)的訪問量,還考慮了數(shù)字資源及其支持成本,便于從成本效益的角度進(jìn)行分析。 3.3我國圖書館常用的數(shù)字資源訪問統(tǒng)計(jì)指標(biāo) 對(duì)于圖書館數(shù)字資源訪問統(tǒng)計(jì)的指標(biāo),在我們常見的統(tǒng)計(jì)分忻工作中,統(tǒng)計(jì)指標(biāo)圍繞什么被使用?誰在使用?如何使用?什么時(shí)候使用?為什么使用?哪些資料經(jīng)常被下載?哪些資料被檢索最頻繁?資料檢索來自哪些單位?哪個(gè)單位使用量最多等問題,通常采用數(shù)字資源提供商提供的訪問統(tǒng)計(jì)數(shù)據(jù)與對(duì)圖書館網(wǎng)站及自建數(shù)字資源的訪問統(tǒng)計(jì)相結(jié)合的方式,除了資源提供商提供的數(shù)

17、據(jù)外,往往采用網(wǎng)站訪問流量、訪問者的IP、網(wǎng)站點(diǎn)擊次數(shù)、數(shù)字資源的點(diǎn)擊次數(shù)、下載的篇數(shù)等指標(biāo)。 與國外相比,我國圖書館的數(shù)字資源訪問統(tǒng)計(jì)指標(biāo)設(shè)定相對(duì)比較粗略,沒有統(tǒng)一的、針對(duì)各種類型數(shù)字資源的一致的標(biāo)準(zhǔn),而且統(tǒng)計(jì)指標(biāo)往往僅僅反映了訪問情況,未能與數(shù)字資源的購買和管理成本掛鉤進(jìn)行成本效益分析。 4圖書館數(shù)字資源訪問統(tǒng)計(jì)存在的問題 4.1資料庫不在館內(nèi),正確及時(shí)的統(tǒng)計(jì)數(shù)據(jù)不易取得 隨著各個(gè)圖書館在數(shù)字資源建設(shè)方面的積累和發(fā)展,圖書館數(shù)字資源的來源多樣,既有通過遠(yuǎn)程鏡像或者資源提供商服務(wù)器訪問的數(shù)據(jù),也有在本地鏡像的數(shù)據(jù),還有圖書館自建的數(shù)字資源。尤其對(duì)于資料庫不在館內(nèi)的情況,需要廠商配合協(xié)助,但是

18、最大的問題在于沒有辦法從廠商那里得到充分的數(shù)據(jù),或是廠商提供的數(shù)據(jù)不標(biāo)準(zhǔn),或是提供的資料不是圖書館想要的,而且由于統(tǒng)計(jì)數(shù)據(jù)是由資源提供商提供,其客觀性和真實(shí)性的保障機(jī)制弱。這樣,正確及時(shí)的統(tǒng)計(jì)數(shù)據(jù)不易取得。 4.2缺乏標(biāo)準(zhǔn)的統(tǒng)計(jì)指標(biāo) 由于資源來源多樣,統(tǒng)計(jì)指標(biāo)不規(guī)范,不同的系統(tǒng)提供的統(tǒng)計(jì)報(bào)告五花八門,沒有統(tǒng)一指標(biāo)。統(tǒng)計(jì)指標(biāo)定義混亂、不明確,例如“search”在大多數(shù)系統(tǒng)內(nèi)被定義為用戶發(fā)送檢索式的次數(shù),但有些數(shù)據(jù)庫卻用“query”來表示同樣含義的指標(biāo),而CSA數(shù)據(jù)庫則同時(shí)使用了“search”和“query”,二者的含義和區(qū)別并不明確。沒有一致、標(biāo)準(zhǔn)、科學(xué)的統(tǒng)計(jì)指標(biāo)體系,對(duì)用戶訪問統(tǒng)計(jì)的分析及其對(duì)圖書館決策的支持可信度就會(huì)降

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論