版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
精選優(yōu)質(zhì)文檔-----傾情為你奉上精選優(yōu)質(zhì)文檔-----傾情為你奉上專心---專注---專業(yè)專心---專注---專業(yè)精選優(yōu)質(zhì)文檔-----傾情為你奉上專心---專注---專業(yè)圖書館大數(shù)據(jù)模型“大數(shù)據(jù)(BigData)”是繼Web2.0之后和云計算一起被媒體最關(guān)注的詞匯組合,并正在引起信息科技領(lǐng)域越來越多的關(guān)注熱潮。IBM、EMC、Oracle、Microsoft等IT巨頭幾乎都已投身到了大數(shù)據(jù)的軟硬件技術(shù)整合、大數(shù)據(jù)信息處理的技術(shù)供應(yīng)研究開發(fā)之中,力求在新一輪的信息競爭環(huán)境中占據(jù)主動,并搶得戰(zhàn)略先機(jī)與技術(shù)制高點。圖書館作為社會的知識信息服務(wù)中心,使得社會對圖書館所提供的服務(wù)要求更為苛刻,潛在的知識挖掘、知識評價、數(shù)據(jù)分析等增值服務(wù)需求已經(jīng)開始顯現(xiàn)。利用大數(shù)據(jù)技術(shù)去挖掘、識別、組織與分析隱含在讀者行為中的結(jié)構(gòu)化、半結(jié)構(gòu)化數(shù)據(jù)信息,尋找他們的隱形訴求進(jìn)而改進(jìn)圖書館的服務(wù),達(dá)到圖書館資源、服務(wù)與讀者需求的雙向理想控制已成為大數(shù)據(jù)時代圖書館提高服務(wù)體系的組織水平、推動行業(yè)發(fā)展與制度建設(shè)的捷徑之一。一、大數(shù)據(jù)概念(一)大數(shù)據(jù)的定義維基百科的定義是:“大數(shù)據(jù)(BigData),或稱巨量數(shù)據(jù)、海量數(shù)據(jù)、大資料,指的是所涉及的數(shù)據(jù)量規(guī)模巨大到無法通過人工,在合理時間內(nèi)達(dá)到截取、管理、處理、并整理成為人類所能解讀的信息?!盵1]也就是說,由于所涉及的數(shù)據(jù)規(guī)模巨大,以至于利用目前的主要軟件工具,在可允許的時間范圍內(nèi),達(dá)到查詢檢索、下載獲取、加工處理、數(shù)據(jù)管理,并有效的整理成為對用戶有用的數(shù)據(jù)資源已經(jīng)變的非常困難。美國互聯(lián)網(wǎng)中心指出,互聯(lián)網(wǎng)上的數(shù)據(jù)每年將增長50%,每兩年便將翻一番,而目前世界上90%以上的數(shù)據(jù)都是近幾年產(chǎn)生的。大數(shù)據(jù)時代最大的轉(zhuǎn)變就是人們放棄對事物因果關(guān)系的渴求,取而代之的是更加關(guān)注相關(guān)關(guān)系,對人類的認(rèn)知方式和與世界交流的方式都提出了全新的挑戰(zhàn)。在大數(shù)據(jù)時代,數(shù)據(jù)就是資產(chǎn)已經(jīng)成為人們的共識。(二)大數(shù)據(jù)的特點分析員道格.萊尼(DougLaney)曾在麥塔集團(tuán)(METAGroup,現(xiàn)為高德納)的一份研究報告中指出大數(shù)據(jù)的三個特點:量(Volume,數(shù)據(jù)大小)、速(Velocity,數(shù)據(jù)輸入輸出的速度)與多變(Variety,多樣性),合稱“3V”。另外,以IDC為代表的業(yè)界認(rèn)為滿足“4V”(Volume、Velocity、Variety、Value,即種類多、流量大、容量大、價值高)指標(biāo)的數(shù)據(jù)才可稱為大數(shù)據(jù)。但無論是“3V”還是“4V”,其本質(zhì)都是對大數(shù)據(jù)中的“大”的理解與闡釋。大數(shù)據(jù)的單條數(shù)據(jù)并無太多價值,但匯集龐大的單條數(shù)據(jù)集則蘊含著巨大的財富,將已有?Y構(gòu)化(如關(guān)系型數(shù)據(jù)庫、面向?qū)ο髷?shù)據(jù)庫中的數(shù)據(jù)),半結(jié)構(gòu)化數(shù)據(jù)與非結(jié)構(gòu)化數(shù)據(jù)(如文檔、文本、圖片、XML、HTML、各類報表、圖像和音頻/視頻信息等)進(jìn)行融合和分析后,會挖掘出很多新的業(yè)務(wù)信息。二、圖書館大數(shù)據(jù)(一)圖書館的大數(shù)據(jù)類型進(jìn)行大數(shù)據(jù)分析首先要擁有大數(shù)據(jù),圖書館本身擁有的大數(shù)據(jù)主要包括:1.圖書館的數(shù)字化資源。經(jīng)過數(shù)字圖書館的多年建設(shè),圖書館擁有大量的數(shù)據(jù)庫資源、電子書資源紙質(zhì)圖書電子化的數(shù)字資源,以及各種音頻、視頻資源,這些資源在總量上很大而且增長速度也比較快,它們是圖書館大數(shù)據(jù)的重要組成部分。[2]2.社交網(wǎng)絡(luò)時代出現(xiàn)的大量非結(jié)構(gòu)化數(shù)據(jù)。在門戶網(wǎng)站、搜索引擎時代之后,社交網(wǎng)絡(luò)時代已經(jīng)到來。隨之而來產(chǎn)生了大量的非結(jié)構(gòu)化數(shù)據(jù),通過大數(shù)據(jù)分析技術(shù)可以將這些數(shù)據(jù)進(jìn)行收集分析,得出讀者的興趣偏好。伴隨著社交網(wǎng)絡(luò)、移動圖書館、物聯(lián)網(wǎng)等概念的興起,今后來自讀者的各種信息將越來越多,我們將在讀者使用圖書館服務(wù)的過程中收集讀者的地理位置、搜索歷史、搜索時間等信息,這些很多是非結(jié)構(gòu)化和半結(jié)構(gòu)化的數(shù)據(jù),挖掘讀者偏好,為其提供最有用的信息。3.讀者使用歷史所形成的非結(jié)構(gòu)化數(shù)據(jù)。在圖書館里不管是各種數(shù)據(jù)庫資源,還是紙質(zhì)資源,以及各種學(xué)生的信息都是我們的大數(shù)據(jù)。但是這些并不是大數(shù)據(jù)的全部,只是其中的一部分。比如他們對于數(shù)據(jù)庫的檢索歷史、瀏覽歷史、數(shù)據(jù)使用方向及使用方法等信息。伴隨著移動互聯(lián)時代的到來,將從手機(jī)、平板電腦、筆記本等諸多移動終端中收集到讀者的個人信息、方位信息、瀏覽信息等各種不同的數(shù)據(jù),這才真正構(gòu)成了圖書館完整的大數(shù)據(jù)采集。(二)圖書館大數(shù)據(jù)的幾個主要來源1.RFID射頻數(shù)據(jù):RFID嵌入到圖書館相關(guān)資源中,實現(xiàn)資源的跟蹤及分析。比如圖書芯片和借閱卡芯片的相關(guān)數(shù)據(jù),來優(yōu)化圖書布局和館藏結(jié)構(gòu)。什么資源使用的多,哪個時段流通更頻繁,資源的處理效率如何等,都對圖書館資源的利用率和采購渠道至關(guān)重要。2.傳感器數(shù)據(jù):通過分布在圖書館不同位置或環(huán)境中的傳感器對所處環(huán)境和資源進(jìn)行的感知,不斷生成的數(shù)據(jù),由于長時間積累所產(chǎn)生的數(shù)據(jù)量也非常巨大。結(jié)合物聯(lián)網(wǎng)技術(shù),可以提升自動化設(shè)備的智能化處理能力。3.社交網(wǎng)絡(luò)交互數(shù)據(jù):隨著社交網(wǎng)絡(luò)應(yīng)用的逐步推廣,社交網(wǎng)絡(luò)所產(chǎn)生的數(shù)據(jù)量遠(yuǎn)遠(yuǎn)超過以往任何一個信息傳播媒介,毫無疑問,它將會成為未來很長一段時間內(nèi),大數(shù)據(jù)最為主要的來源之一。該渠道可以更多地結(jié)合第三方商業(yè)數(shù)據(jù)接口,來完成數(shù)據(jù)匯集。4.移動互聯(lián)數(shù)據(jù):移動互聯(lián)網(wǎng)及移動互聯(lián)技術(shù)的不斷完善,使得圖書館可以通過WIFI定位、流量監(jiān)控等方式,靈活獲取移動電子設(shè)備、人員、資源、用戶行為和需求等信息,并對這些信息進(jìn)行實時分析,從而幫助我們開展有效的智能輔助決策。[3]三、大數(shù)據(jù)應(yīng)用(一)實現(xiàn)針對不同讀者的個性化服務(wù)圖書館讀者具有人數(shù)眾多、年齡不同、專業(yè)方向不同等特點給圖書館提出了不同的個性化要求。而大數(shù)據(jù)的應(yīng)用就在于加強(qiáng)用戶研究與交互數(shù)據(jù)的利用,并基于對用戶數(shù)據(jù)的分析,從中提取有價值的信息,建立用戶模型,針對不同用戶提供針對性服務(wù)。[4]圖書館里大量的用戶行為產(chǎn)生的數(shù)據(jù),如用戶查詢書目產(chǎn)生的OPAC日志,用戶流通日志,電子資源檢索瀏覽下載產(chǎn)生的日志及流量數(shù)據(jù),這些數(shù)據(jù)中除了用于記錄讀者的個人信息外,還隱藏著許多重要的信息,因此可通過對這些數(shù)據(jù)進(jìn)行挖掘分析、知識發(fā)現(xiàn)、只能代理等技術(shù),描述用戶的行為,準(zhǔn)確定位讀者需求,向讀者提供主動式推送服務(wù),滿足其個性化的智能服務(wù)。(二)提供研究動向以及研究熱點的變化圖書館可以通過對讀者數(shù)據(jù)的收集匯總,進(jìn)行大數(shù)據(jù)分析,可以在宏觀上分析相關(guān)領(lǐng)域科研熱點的動向,為科研人員、科研部門的決策者服務(wù),讓他們更快的洞察最新的科研走向,以及相關(guān)研究領(lǐng)域其他科研人員的研究進(jìn)展。通過大數(shù)據(jù)的分析,提升圖書館在科研領(lǐng)域中的作用,與此同時為科研人員提供更多有價值的研究策略信息。(三)為采編部門和數(shù)據(jù)庫采購部門提供資源評價意見(四)用戶流失分析及價值分析在當(dāng)今信息技術(shù)發(fā)展的洪流中,價值質(zhì)疑、技術(shù)障礙、管理僵化、人員隊伍適應(yīng)變化敏感性低等重大問題已經(jīng)嚴(yán)重困制約著圖書館的發(fā)展,圖書館的社會地位與存在價值正在不斷的弱化,用戶正在向其他文化信息機(jī)構(gòu)流失。我們通過大數(shù)據(jù)分析能夠讓圖書館清晰把握用戶的信息需求及意愿,分析出用戶的信息行為及其知識應(yīng)用能力,有利于圖書館對用戶的信息需求以及信息行為偏好進(jìn)行預(yù)測,架構(gòu)以讀者個性化服務(wù)為核心的信息服務(wù)體系。[5]大數(shù)據(jù)技術(shù)加強(qiáng)了圖書館對于讀者研究與交互數(shù)據(jù)分析、利用的能力,從海量數(shù)據(jù)中挖掘有用信息,建立用戶檔案與模型,在精確劃分讀者類別的基礎(chǔ)上,進(jìn)行跟蹤服務(wù)、知識關(guān)聯(lián)服務(wù)、先覺性服務(wù),提高用戶體驗,增加圖書館信息服務(wù)的競爭力,從而留住用戶。(五)建立新型知識服務(wù)引擎技術(shù)引擎是圖書館信息服務(wù)的技術(shù)核心,如何利用大數(shù)據(jù)技術(shù)構(gòu)建圖書館的新型知識服務(wù)引擎,將會是未來幾年內(nèi)圖書館情報領(lǐng)域信息技術(shù)研究的主要內(nèi)容。[6]新型知識服務(wù)引擎包括資源及學(xué)術(shù)搜索引擎、資源及服務(wù)推薦引擎、知識服務(wù)社區(qū)實體(包括用戶及資源)行為智能分析引擎、用戶知識需求預(yù)測引擎、及多維度信息資源獲取、組織、分析及決策引擎等。例如美國Hiptype公司將大數(shù)據(jù)分析技術(shù)來分析電子書讀者閱讀習(xí)慣和喜好,這也是國內(nèi)外圖書情報領(lǐng)域首例利用大數(shù)據(jù)技術(shù)構(gòu)建知識服務(wù)社區(qū)實體(包括用戶及資源)行為智能分析引擎。(六)建立知識服務(wù)及業(yè)務(wù)建設(shè)的風(fēng)險模型通過分析資源,包括知識資源、網(wǎng)絡(luò)資源、信息資源、軟件資源及服務(wù)資源等的實時狀態(tài)來預(yù)測未來可能出現(xiàn)的故障及?稻葑試純贍艸魷值耐槐溆氬ǘ?,幫助圖書館預(yù)先制訂好應(yīng)對措施、策略以及圖書館的各類風(fēng)險評估模型。同時,如前所述,傳感器數(shù)據(jù)也是未來大數(shù)據(jù)的主要來源之一,此類數(shù)據(jù)將為圖書館獲取大量的圖書館人文環(huán)境、自然環(huán)境以及技術(shù)環(huán)境的多維度數(shù)據(jù),借助大數(shù)據(jù)技術(shù)分析、預(yù)測建立有針對性的各類圖書館風(fēng)險評估模型,實現(xiàn)圖書館管理的優(yōu)化升級,保持圖書館穩(wěn)定的運行狀態(tài)。四、概念轉(zhuǎn)變數(shù)字
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五版農(nóng)家樂生態(tài)農(nóng)業(yè)合作開發(fā)合同4篇
- 2024年度青海省公共營養(yǎng)師之二級營養(yǎng)師題庫附答案(基礎(chǔ)題)
- 2025年度工業(yè)園區(qū)車位租賃與配套服務(wù)合同4篇
- 2025年度個人住宅水電改造與裝修合同
- 家居環(huán)境舒適度與室內(nèi)空氣質(zhì)量研究
- 2025版高端技術(shù)培訓(xùn)保密條款標(biāo)準(zhǔn)合同3篇
- 二零二五年度電梯安裝工程勞務(wù)人員健康體檢合同3篇
- 二零二四年度校園食堂食品安全管理服務(wù)合同范本下載3篇
- 小學(xué)生學(xué)習(xí)與休息的平衡之道
- 綠色學(xué)校生態(tài)教育理論與實踐的融合
- 2024年南京鐵道職業(yè)技術(shù)學(xué)院高職單招(英語/數(shù)學(xué)/語文)筆試歷年參考題庫含答案解析
- 暴發(fā)性心肌炎查房
- 口腔醫(yī)學(xué)中的人工智能應(yīng)用培訓(xùn)課件
- 工程質(zhì)保金返還審批單
- 【可行性報告】2023年電動自行車項目可行性研究分析報告
- 五月天歌詞全集
- 商品退換貨申請表模板
- 實習(xí)單位鑒定表(模板)
- 機(jī)械制造技術(shù)-成都工業(yè)學(xué)院中國大學(xué)mooc課后章節(jié)答案期末考試題庫2023年
- 數(shù)字媒體應(yīng)用技術(shù)專業(yè)調(diào)研方案
- 2023年常州市新課結(jié)束考試九年級數(shù)學(xué)試卷(含答案)
評論
0/150
提交評論