中國(guó)知識(shí)圖譜發(fā)展現(xiàn)狀及未來(lái)行業(yè)發(fā)展趨勢(shì)_第1頁(yè)
中國(guó)知識(shí)圖譜發(fā)展現(xiàn)狀及未來(lái)行業(yè)發(fā)展趨勢(shì)_第2頁(yè)
中國(guó)知識(shí)圖譜發(fā)展現(xiàn)狀及未來(lái)行業(yè)發(fā)展趨勢(shì)_第3頁(yè)
中國(guó)知識(shí)圖譜發(fā)展現(xiàn)狀及未來(lái)行業(yè)發(fā)展趨勢(shì)_第4頁(yè)
中國(guó)知識(shí)圖譜發(fā)展現(xiàn)狀及未來(lái)行業(yè)發(fā)展趨勢(shì)_第5頁(yè)
已閱讀5頁(yè),還剩2頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

中國(guó)知識(shí)圖譜發(fā)展現(xiàn)狀及未來(lái)行業(yè)發(fā)展趨勢(shì)一、知識(shí)圖譜的定義及分類知識(shí)圖譜本質(zhì)上是一種把世界實(shí)體和實(shí)體關(guān)系進(jìn)行相互關(guān)聯(lián)的語(yǔ)義網(wǎng)絡(luò),其中的節(jié)點(diǎn)表示實(shí)體,邊則代表實(shí)體之間的各種語(yǔ)義關(guān)系。在學(xué)術(shù)論文中,則根據(jù)應(yīng)用場(chǎng)景和技術(shù)背景等,對(duì)于知識(shí)圖譜提出了很多不同的定義。總體來(lái)看,雖然知識(shí)圖譜沒(méi)有統(tǒng)一的定義,但是公認(rèn)的知識(shí)圖譜的概念應(yīng)該包括如下幾個(gè)基本要素:知識(shí)節(jié)點(diǎn)(從實(shí)際對(duì)象抽象而來(lái))、邊(節(jié)點(diǎn)間的關(guān)系,由實(shí)際關(guān)系抽象而來(lái))和對(duì)象的數(shù)量(節(jié)點(diǎn)和邊的數(shù)量要足夠大)。知識(shí)圖譜可以從不同的角度可以將其分為不同的類型,比如從構(gòu)建方法、構(gòu)建技術(shù)、使用方式等。目前比較常用的分類方法是從應(yīng)用目標(biāo)出發(fā),將其分為通用知識(shí)圖譜和垂直知識(shí)圖譜。通用知識(shí)圖譜不面向特定的領(lǐng)域,強(qiáng)調(diào)的是知識(shí)的廣度,包含了大量的常識(shí)性知識(shí);而垂直知識(shí)圖譜則面向特定領(lǐng)域,強(qiáng)調(diào)的是知識(shí)的深度,包含的某個(gè)領(lǐng)域的特色知識(shí)。通用知識(shí)圖譜與垂直知識(shí)圖譜比較二、知識(shí)圖譜的架構(gòu)1、邏輯架構(gòu)知識(shí)圖譜的邏輯結(jié)構(gòu)可以分為模式層和數(shù)據(jù)層兩部分。模式層在數(shù)據(jù)層之上,存儲(chǔ)的是經(jīng)過(guò)提煉的知識(shí),通常采用本體等技術(shù)來(lái)管理。模式層借助本體庫(kù)對(duì)公理、規(guī)則和約束條件的支持能力來(lái)規(guī)范實(shí)體、關(guān)系以及實(shí)體類型和屬性等對(duì)象之間的聯(lián)系。數(shù)據(jù)層則主要由一系列的事實(shí)組成,知識(shí)則是以事實(shí)為單位進(jìn)存儲(chǔ)。在知識(shí)圖譜的數(shù)據(jù)層,知識(shí)可以用事實(shí)為單位進(jìn)行存儲(chǔ),也可以采用“實(shí)體-關(guān)系-實(shí)體”或者“實(shí)體-屬性-性值”的三元組作為存儲(chǔ)方式。知識(shí)圖譜的邏輯架構(gòu)2、技術(shù)架構(gòu)知識(shí)圖譜的構(gòu)建方式可以分為自頂向下和自底向上兩種。自頂向下的構(gòu)建方式從結(jié)構(gòu)化資源出發(fā),通過(guò)從資源中抽取本體和模式信息,不斷地加入到知識(shí)庫(kù)中;自底向上的構(gòu)建方法則是從公開(kāi)的資源中采取技術(shù)手段獲取資源,并對(duì)資源進(jìn)行人工審核后再加入知識(shí)庫(kù)中。對(duì)于通用知識(shí)圖譜的構(gòu)建來(lái)講,因?yàn)榫哂写罅堪倏祁惥W(wǎng)址資源的存在,為其提供了高質(zhì)量的數(shù)據(jù)源,可以首先建立起良好的體系架構(gòu),然后從數(shù)據(jù)源中抽取所需的數(shù)據(jù),將其填充到合理的位置中即可。目前通用的知識(shí)圖譜都非常依賴這種方法,也非常依賴高質(zhì)量的數(shù)據(jù)源。而自底向上的構(gòu)建方法首先面對(duì)的可能是大量的結(jié)構(gòu)不良甚至是無(wú)結(jié)構(gòu)的數(shù)據(jù),這在實(shí)際處理中是非常困難的。后來(lái)隨著知識(shí)抽取技術(shù)的發(fā)展,自底向上的構(gòu)建方式才逐漸流行起來(lái)。但是由于垂直領(lǐng)域知識(shí)具有更為嚴(yán)格的層次結(jié)構(gòu)和表達(dá)形式,傳統(tǒng)的自頂向下或者自底向上方式都不適合直接用來(lái)構(gòu)建知識(shí)圖譜。阮彤等人提出了基于數(shù)據(jù)驅(qū)動(dòng)的增量式知識(shí)圖譜構(gòu)建方法。該方法通過(guò)自頂向下的方式構(gòu)建知識(shí)圖譜的模式圖,采用自底向上的方式構(gòu)建數(shù)據(jù)圖,即保證了知識(shí)的層次性,又為數(shù)據(jù)抽取的質(zhì)量提供了保障。三、知識(shí)圖譜的關(guān)鍵技術(shù)無(wú)論圖譜的構(gòu)建模式如何(自頂向下或者自底向上),其中的關(guān)鍵技術(shù)都是相同的。從下圖中可以看出,知識(shí)抽取、知識(shí)融合、知識(shí)推理和知識(shí)應(yīng)用等都是知識(shí)圖譜體系中的關(guān)鍵技術(shù)。需要指出的是,垂直領(lǐng)域知識(shí)圖譜是源于通用知識(shí)圖譜且根植于特定行業(yè),所以其構(gòu)建中的關(guān)鍵技術(shù)與通用知識(shí)圖譜相對(duì)比,既具有類似性也具有獨(dú)特的特點(diǎn)。知識(shí)圖譜關(guān)鍵技術(shù)四、國(guó)內(nèi)垂直領(lǐng)域知識(shí)圖譜現(xiàn)狀知識(shí)圖譜作為一種基礎(chǔ)性資源,在促進(jìn)國(guó)民經(jīng)濟(jì)各個(gè)行業(yè)的知識(shí)化方面具有重要的意義。國(guó)內(nèi)目前對(duì)于知識(shí)圖譜的應(yīng)用種類繁多,在電商平臺(tái)、企業(yè)信息、科技情報(bào)、創(chuàng)業(yè)投資、農(nóng)林科技、醫(yī)療衛(wèi)生、工業(yè)應(yīng)用、影音娛樂(lè)等不同領(lǐng)域均有應(yīng)用。國(guó)內(nèi)企業(yè)界對(duì)于知識(shí)圖譜的研究目前非?;钴S,特別是一些大型的互聯(lián)網(wǎng)企業(yè),對(duì)于知識(shí)圖譜的需求是非常強(qiáng)烈的。例如百度的知識(shí)圖譜自從2014年上線開(kāi)始,業(yè)務(wù)規(guī)模三年間增長(zhǎng)了大約160倍;搜狗借助基于知識(shí)圖譜的AI技術(shù),使得其移動(dòng)端的搜索流量取得了快速增長(zhǎng);騰訊則利用自己的數(shù)據(jù)優(yōu)勢(shì)構(gòu)建了自己的社交知識(shí)圖譜,服務(wù)于眾多的產(chǎn)品;基于知識(shí)圖譜的個(gè)性化推薦系統(tǒng)則為阿里的營(yíng)收增長(zhǎng)起到了至關(guān)重要的作用。相比較于與BAT(百度、騰訊、阿里巴巴)這類大公司而言,垂直知識(shí)領(lǐng)域則是國(guó)內(nèi)創(chuàng)業(yè)公司的首選。為了彌補(bǔ)自己的專業(yè)領(lǐng)域數(shù)據(jù)不足等劣勢(shì),國(guó)內(nèi)的創(chuàng)業(yè)公司往往選擇和相關(guān)領(lǐng)域的企業(yè)合作,以垂直領(lǐng)域作為市場(chǎng)切入點(diǎn),以行業(yè)數(shù)據(jù)和知識(shí)圖譜相關(guān)技術(shù)(如自然語(yǔ)言處理,大數(shù)據(jù)等)作為壁壘來(lái)保證企業(yè)的成長(zhǎng)。各類企業(yè)的積極參與,使得國(guó)內(nèi)業(yè)界的知識(shí)圖譜可以形成一個(gè)良性的閉環(huán)發(fā)展模式,進(jìn)一步促進(jìn)了知識(shí)圖譜本身的發(fā)展。垂直領(lǐng)域知識(shí)圖譜應(yīng)用案例五、基于CiteSpace軟件的研究相比較而言,更多的研究人員將CiteSpace作為一個(gè)工具,對(duì)不同領(lǐng)域的問(wèn)題進(jìn)行了多視角的分析探討。經(jīng)過(guò)統(tǒng)計(jì)分析,目前管理科學(xué)領(lǐng)域,如圖書情報(bào)學(xué)、管理科學(xué)與工程、公共管理與工商管理等,占據(jù)了應(yīng)用領(lǐng)域的大部分,其余的則分布在人文社科等領(lǐng)域。但是隨著該工具的應(yīng)用的普及,在自然科學(xué)領(lǐng)域的應(yīng)用也在迅速發(fā)展。從應(yīng)用方式上看,主要表現(xiàn)選擇特定領(lǐng)域,采用CNKI或者WebofScience的數(shù)據(jù)庫(kù),搜集數(shù)據(jù),然后對(duì)該領(lǐng)域進(jìn)行分析。CiteSpace研究流程基于CiteSpace的研究案例六、知識(shí)圖譜行業(yè)發(fā)展展望國(guó)民經(jīng)濟(jì)的各個(gè)垂直領(lǐng)域?qū)τ谥R(shí)圖譜的需求是非常強(qiáng)烈的,知識(shí)圖譜可以應(yīng)用的范圍也是非常廣闊的,因此建設(shè)垂直領(lǐng)域知識(shí)圖譜對(duì)于經(jīng)濟(jì)社會(huì)發(fā)展是非常有必要的。目前在垂直領(lǐng)域,知識(shí)圖譜應(yīng)用的范圍還是較窄的,集中在一些可以迅速見(jiàn)到效益的領(lǐng)域(如電商、搜索等),且應(yīng)用的深度不夠,多是集中在圖譜的構(gòu)建上,還未在行業(yè)中真正形成使用和建設(shè)的良性循環(huán)。在未來(lái),知識(shí)圖譜應(yīng)該作為和國(guó)家標(biāo)準(zhǔn)一樣的基

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論