基于ciespace的語(yǔ)義網(wǎng)研究熱點(diǎn)可視化分析_第1頁(yè)
基于ciespace的語(yǔ)義網(wǎng)研究熱點(diǎn)可視化分析_第2頁(yè)
基于ciespace的語(yǔ)義網(wǎng)研究熱點(diǎn)可視化分析_第3頁(yè)
基于ciespace的語(yǔ)義網(wǎng)研究熱點(diǎn)可視化分析_第4頁(yè)
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

基于ciespace的語(yǔ)義網(wǎng)研究熱點(diǎn)可視化分析

網(wǎng)絡(luò)正義網(wǎng)由互聯(lián)網(wǎng)創(chuàng)始人simodhyberrys提出,1998年,網(wǎng)絡(luò)創(chuàng)始人phe。2000年12月的XML(可擴(kuò)展標(biāo)記語(yǔ)言)會(huì)議上正式提出語(yǔ)義網(wǎng)的概念和體系結(jié)構(gòu)。隨后大量學(xué)術(shù)研究機(jī)構(gòu)和團(tuán)體舉辦了多次關(guān)于語(yǔ)義網(wǎng)的學(xué)術(shù)討論會(huì),開始關(guān)注語(yǔ)義網(wǎng)的研究,語(yǔ)義網(wǎng)開始成為情報(bào)學(xué)的研究熱點(diǎn)。TimothyBerners-Lee最初將語(yǔ)義網(wǎng)定義為:某種定義Web上的數(shù)據(jù)和鏈接的方式,從而使WWW上的內(nèi)容可獲取并且可解釋。Wikipedia(維基百科)對(duì)語(yǔ)義網(wǎng)的定義是:通過給萬維網(wǎng)上的文檔(如HTML)添加能夠被計(jì)算機(jī)所理解的語(yǔ)義,從而使整個(gè)互聯(lián)網(wǎng)成為一個(gè)通用的信息交換媒介。因此,對(duì)國(guó)外語(yǔ)義網(wǎng)研究的演進(jìn)軌跡、發(fā)展格局、熱點(diǎn)領(lǐng)域及前沿趨勢(shì)等進(jìn)行定量與定性分析,總結(jié)其發(fā)展規(guī)律與特征,對(duì)于推進(jìn)我國(guó)情報(bào)學(xué)的研究具有重要意義。1知識(shí)圖譜的建立本文采用美國(guó)德雷賽爾大學(xué)陳超美教授開發(fā)的CiteSpace3.7.R8進(jìn)行可視化分析,在對(duì)國(guó)外研究語(yǔ)義網(wǎng)論文進(jìn)行計(jì)量分析的基礎(chǔ)上,結(jié)合相關(guān)文獻(xiàn)主題分析,利用CiteSpace軟件繪制知識(shí)圖譜。數(shù)據(jù)來源于ISI(美國(guó)科學(xué)情報(bào)研究所)WebofScience(簡(jiǎn)稱WoS)統(tǒng)一文獻(xiàn)檢索平臺(tái)。根據(jù)本文研究?jī)?nèi)容,設(shè)定以下檢索式:(TI(標(biāo)題)=(“SemanticWeb”)ANDLG(文獻(xiàn)語(yǔ)言)=“English”;檢索WoS的四大索引庫(kù)(檢索時(shí)間:2013.12.23)。選擇期刊論文和會(huì)議論文兩種研究性文獻(xiàn)類型(排除國(guó)內(nèi)論文),共得到1900-2013年國(guó)外發(fā)表的語(yǔ)義網(wǎng)相關(guān)論文數(shù)據(jù)2644條,其中會(huì)議論文2098篇,期刊論文1069篇(部分會(huì)議論文發(fā)表后又在期刊發(fā)表)。2國(guó)外意義網(wǎng)絡(luò)的研究2.1語(yǔ)義網(wǎng)研究年際變化從發(fā)文量看:2000年以前發(fā)文量較少,此后呈穩(wěn)步增長(zhǎng)趨勢(shì);2005-2008年進(jìn)入高產(chǎn)階段,年均保持在300篇以上;從2009年起,發(fā)文量逐年遞減。統(tǒng)計(jì)結(jié)果表明,國(guó)外語(yǔ)義網(wǎng)研究自20世紀(jì)90年代末起步,自2002年語(yǔ)義網(wǎng)-ISWC會(huì)議召開后,發(fā)文量不斷上升,相關(guān)研究日益成熟,應(yīng)用領(lǐng)域不斷擴(kuò)展;經(jīng)過許多學(xué)者的努力研究和實(shí)驗(yàn),語(yǔ)義網(wǎng)在理論研究和實(shí)際應(yīng)用上都有很大的進(jìn)步。2.2“語(yǔ)義網(wǎng)”頻次分布從國(guó)家/地區(qū)分布來看,美國(guó)發(fā)文量最高,為457篇,其次為德國(guó)和英國(guó)。在CiteSpace軟件中繪制國(guó)家/地區(qū)共現(xiàn)網(wǎng)絡(luò)圖譜。圖譜中共有52個(gè)節(jié)點(diǎn),15個(gè)連接。對(duì)“語(yǔ)義網(wǎng)”出現(xiàn)頻次在50次以上和中心度0.01以上的進(jìn)行統(tǒng)計(jì)(見表1),可以看出,頻次較高的來自美國(guó),即其發(fā)文數(shù)最多,在該領(lǐng)域內(nèi)具有很強(qiáng)的研究實(shí)力;英格蘭、德國(guó)、西班牙、意大利等節(jié)點(diǎn)的頻次也較高,表明這些國(guó)家的研究成果較多,也具有較強(qiáng)的研究實(shí)力。總體上,各國(guó)間在發(fā)文量與學(xué)術(shù)水平之間存在著不同程度的差異。中心度最高的國(guó)家為德國(guó),其中心度達(dá)到0.27,美國(guó)位列第二,中心度為0.19。2.3語(yǔ)義網(wǎng)研究的核心領(lǐng)域從學(xué)科類別分布來看,語(yǔ)義網(wǎng)的研究主要集中在計(jì)算機(jī)領(lǐng)域。在CiteSpace中繪制學(xué)科主題共現(xiàn)網(wǎng)絡(luò)圖譜,可以看出國(guó)外對(duì)語(yǔ)義網(wǎng)的研究主要集中在計(jì)算機(jī)學(xué)科?;陬l次(取30次以上)和中心度統(tǒng)計(jì),頻次最高的為計(jì)算機(jī)科學(xué)(為2474次),遠(yuǎn)高于其他學(xué)科領(lǐng)域;其次為工程技術(shù)和通信。這表明,計(jì)算機(jī)與工程技術(shù)科學(xué)是國(guó)外對(duì)語(yǔ)義網(wǎng)研究的核心領(lǐng)域。其他中心度較高的學(xué)科節(jié)點(diǎn)有數(shù)學(xué)、運(yùn)籌學(xué)、信息科學(xué)等,與其他學(xué)科也有著較廣泛的關(guān)聯(lián)。2.4知識(shí)產(chǎn)權(quán)在線保護(hù)和利用技術(shù)研究關(guān)鍵節(jié)點(diǎn)文獻(xiàn)在不同聚類網(wǎng)絡(luò)的演進(jìn)過程中起著重要的過渡性作用,有助于識(shí)別和探測(cè)某一領(lǐng)域研究的動(dòng)態(tài)演進(jìn)和發(fā)展趨勢(shì)。CiteSpace中針對(duì)各個(gè)時(shí)間段的關(guān)鍵節(jié)點(diǎn)論文,基于中間中心度(0.1及其以上)和被引頻次(30次及其以上)進(jìn)行統(tǒng)計(jì)排序。被引頻次最高的是2001年Berners-leeT的論文,被引用高達(dá)266次,在Google學(xué)術(shù)搜索中的被引頻次為16408次(2013年12月27日檢索)。其次是1993年GruberTR發(fā)表的論文,他把本體定義成“共享概念化的形式地、明確地規(guī)范”。1993年McilraithSA提出網(wǎng)絡(luò)服務(wù)標(biāo)記———語(yǔ)義網(wǎng)標(biāo)記語(yǔ)言DAML,被引頻次為120次。該標(biāo)記使多種Web服務(wù)自動(dòng)發(fā)現(xiàn)代理技術(shù)能夠?qū)崿F(xiàn)、執(zhí)行、組合和互操作。作者提出這樣一種自動(dòng)化Web服務(wù)組合技術(shù)。2003年Baader提出描述邏輯是知識(shí)表示的形式化語(yǔ)言,他的這個(gè)判斷非常適合對(duì)數(shù)據(jù)庫(kù)/數(shù)據(jù)倉(cāng)庫(kù)概念模型的推理。擴(kuò)展描述邏輯(如整數(shù)和有理數(shù)),其中包括聚合函數(shù)在這些領(lǐng)域(如最小值、最大值、計(jì)數(shù)和總和),這通常用于數(shù)據(jù)庫(kù)系統(tǒng)。證明了聚合函數(shù)的存在容易導(dǎo)致的(故意)推斷問題。2004年McguinnessDL認(rèn)為OWLWeb本體語(yǔ)言是表示信息的過程。2004年HorrocksI在語(yǔ)義Web規(guī)則語(yǔ)言(SWRL)的基礎(chǔ)上,提出將OWLWeb本體語(yǔ)言的OWLDL和OWLLite與規(guī)則標(biāo)記語(yǔ)言的一元/二進(jìn)制數(shù)據(jù)記錄RuleML子語(yǔ)言相結(jié)合的建議,給出了基于RuleML和OWL的XML表示語(yǔ)法和基于OWL的RDF/XML交換語(yǔ)法。2.5語(yǔ)義網(wǎng)服務(wù)的認(rèn)知在CiteSpace中繪制共詞聚類網(wǎng)絡(luò)圖譜。關(guān)鍵詞是對(duì)文獻(xiàn)主題內(nèi)容的高度概括或集中描述。詞頻分析是一種重要的基于內(nèi)容的定性分析方法,而高頻詞分析有助于考察某一科學(xué)領(lǐng)域的研究熱點(diǎn)。基于詞頻進(jìn)行統(tǒng)計(jì)與排序,國(guó)外在語(yǔ)義網(wǎng)研究領(lǐng)域的高頻詞如表2所示。根據(jù)關(guān)鍵詞頻次分析總結(jié)出以下研究熱點(diǎn)。(1)本體研究。本體(Ontology)原本是哲學(xué)研究中的一個(gè)分支。1991年Neches等人最早給出本體在信息科學(xué)中的定義:“給出構(gòu)成相關(guān)領(lǐng)域詞匯的基本術(shù)語(yǔ)和關(guān)系,以及利用這些術(shù)語(yǔ)和關(guān)系構(gòu)成的規(guī)定這些詞匯外延規(guī)則的定義?!?993年,美國(guó)斯坦福大學(xué)知識(shí)系統(tǒng)實(shí)驗(yàn)室(KSL)的Gruber給出了第一個(gè)在信息科學(xué)領(lǐng)域被廣泛接受的本體正式定義:“概念模型的明確的規(guī)范說明?!?997年Borst對(duì)其進(jìn)一步完善,表述為:“共享概念模型的形式化規(guī)范說明?!盨tuder等人認(rèn)為本體包含4層含義,即概念模型、明確、形式化和共享。本體強(qiáng)調(diào)實(shí)體本質(zhì)的概念化與抽象化,強(qiáng)調(diào)概念及概念間的關(guān)聯(lián),并通過多種知識(shí)表示元素將這些關(guān)聯(lián)反映出來,這些知識(shí)表示基本元素主要包括:概念、屬性、關(guān)系(對(duì)象屬性)、函數(shù)、公理和實(shí)例。(2)語(yǔ)義網(wǎng)服務(wù)及Web服務(wù)研究。語(yǔ)義網(wǎng)服務(wù)(SWS)是用本體作為數(shù)據(jù)模型,在語(yǔ)義描述框架的基礎(chǔ)上,提供機(jī)器可理解的語(yǔ)義描述。語(yǔ)義網(wǎng)服務(wù)的支撐技術(shù)有3個(gè):Web服務(wù)描述本體,用來描述Web服務(wù)和相關(guān)方面的完整的描述框架;以本體作為底層的數(shù)據(jù)模型以支持機(jī)器對(duì)Web數(shù)據(jù)的解釋;為Web服務(wù)使用過程的自動(dòng)化定義語(yǔ)義驅(qū)動(dòng)。(3)OWL-S研究。OWL-S(OntologyWebLanguageforServices,網(wǎng)絡(luò)服務(wù)的本體語(yǔ)言)最早由S.McIlraith于2001年5月提出,用于描述語(yǔ)義Web服務(wù),在特定的約束下能夠讓用戶和代理自動(dòng)發(fā)現(xiàn)、調(diào)用、編寫和監(jiān)控網(wǎng)絡(luò)資源,提供服務(wù)。2.6語(yǔ)義網(wǎng)的前沿研究領(lǐng)域突現(xiàn)詞(burstterm)是指頻次出現(xiàn)增長(zhǎng)快速的研究前沿術(shù)語(yǔ)。由于突現(xiàn)詞的詞頻時(shí)間分布和動(dòng)態(tài)變化特性,突現(xiàn)詞比關(guān)鍵詞更能準(zhǔn)確地揭示與反映研究前沿領(lǐng)域。在CiteSpace中進(jìn)行突現(xiàn)詞探測(cè),從大量的術(shù)語(yǔ)與關(guān)鍵詞集合中析取出13個(gè)專業(yè)突現(xiàn)術(shù)語(yǔ),如表3所示。從表3可以看出,2001年“邏輯”和“檢索”是語(yǔ)義網(wǎng)領(lǐng)域最早的研究前沿。邏輯是語(yǔ)義網(wǎng)的基礎(chǔ),語(yǔ)義網(wǎng)的研究主要是由邏輯學(xué)和人工智能研究者發(fā)展來的;2003年,“系統(tǒng)”“Web服務(wù)”“DAML”成為語(yǔ)義網(wǎng)的前沿研究領(lǐng)域。Webservice是一個(gè)平臺(tái)獨(dú)立的、松耦合的、自包含的、基于可編程的Web的應(yīng)用程序,可使用開放的XML標(biāo)準(zhǔn)來描述、發(fā)布、發(fā)現(xiàn)、協(xié)調(diào)和配置這些應(yīng)用程序,用于開發(fā)分布式的互操作應(yīng)用程序。美國(guó)國(guó)防高級(jí)設(shè)計(jì)研究署代理置標(biāo)語(yǔ)言(DAML)是美國(guó)國(guó)防高級(jí)設(shè)計(jì)研究組(DARPA)使用的一種標(biāo)記語(yǔ)言,它是一種基于擴(kuò)展標(biāo)記語(yǔ)言(XML);2004年“語(yǔ)義Web服務(wù)”詞頻增長(zhǎng)較快,語(yǔ)義Web被賦予解決智能搜索引擎、智能信息代理、智能交易代理等基于Web個(gè)性化、智能化的服務(wù)等問題的任務(wù),利用本體來改進(jìn)WebServices,即語(yǔ)義Web服務(wù)(SemanticWebServices);2005年“OWL-S”成為研究前沿,OWL-S是Web服務(wù)和語(yǔ)義Web的結(jié)合,主要是為了解決Web服務(wù)描述和發(fā)現(xiàn)以及業(yè)務(wù)組合的語(yǔ)義表示;2008年“Web2.0”成為研究熱點(diǎn);2011年“LinkedData”是主要研究前沿,描述了發(fā)布能夠交互鏈接的結(jié)構(gòu)數(shù)據(jù)的方法,信息共享的方式擴(kuò)展到能被自動(dòng)讀取,能夠連接并查詢不同的數(shù)據(jù)源;2012年“SemanticSensorWeb”(SSW)成為研究熱點(diǎn),SSW是結(jié)合傳感和語(yǔ)義網(wǎng)的技術(shù),SSW用空間、時(shí)間和主題語(yǔ)義元數(shù)據(jù)標(biāo)注傳感器數(shù)據(jù),建立在開放地理空間聯(lián)盟的傳感器網(wǎng)絡(luò)賦能(SWE)內(nèi),并利用語(yǔ)義Web技術(shù)來提供更好的描述和傳感數(shù)據(jù)并進(jìn)行擴(kuò)展。3語(yǔ)義網(wǎng)領(lǐng)域的核心研究領(lǐng)域綜上所述,本文總結(jié)出以下結(jié)論:①目前國(guó)外在語(yǔ)義網(wǎng)領(lǐng)域的研究處于相對(duì)成熟與深化變革階段;②美國(guó)在該領(lǐng)域的研究發(fā)文量最高,其次為德國(guó)和英國(guó);③計(jì)算

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論