信息可視化在科技監(jiān)測(cè)上的應(yīng)用.doc_第1頁(yè)
信息可視化在科技監(jiān)測(cè)上的應(yīng)用.doc_第2頁(yè)
信息可視化在科技監(jiān)測(cè)上的應(yīng)用.doc_第3頁(yè)
信息可視化在科技監(jiān)測(cè)上的應(yīng)用.doc_第4頁(yè)
信息可視化在科技監(jiān)測(cè)上的應(yīng)用.doc_第5頁(yè)
已閱讀5頁(yè),還剩4頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

信息可視化在科技監(jiān)測(cè)上的應(yīng)用中圖分類號(hào):tp3912011年第1期文獻(xiàn)標(biāo)識(shí)碼:a文章編號(hào):10092552(2011)0l一015003信息可視化在科技監(jiān)測(cè)上的應(yīng)用李麗萍(邯鄲職業(yè)技術(shù)學(xué)院,邯鄲056001)摘要:科技監(jiān)測(cè)是科研人員進(jìn)行科學(xué)活動(dòng)的重要步驟,信息時(shí)代的到來,網(wǎng)絡(luò)科技文獻(xiàn)的迅猛增長(zhǎng),龐大的數(shù)據(jù)量使人們?cè)谛畔⒌暮Q笾忻院?傳統(tǒng)的科技監(jiān)測(cè)方法不再能滿足新信息時(shí)代下科技監(jiān)測(cè)的需要,將信息可視化與科技監(jiān)測(cè)結(jié)合起來進(jìn)行分析研究,探討傳統(tǒng)方法在海量數(shù)據(jù)的面前地瓶頸問題,從領(lǐng)域研究角度為科研人員提供更好的科技監(jiān)測(cè)方法,使其能夠深刻把握海量數(shù)據(jù)間的內(nèi)在關(guān)聯(lián)關(guān)系.關(guān)鍵詞:信息可視化;科技監(jiān)測(cè);域分析方法applicationofinformationvisualizationintechnologymonitoringliliping(handaninstituteofvocationandtechnology,handan056001,china)abstract:technologymonitoringisthemostimportantpartofdoingscientificresearchforscientists.meanwhile,scientistsfinditishardtogettherightinformationforresearches.thispaperbandstogetherinformationvisualizationandtechnologymonitoringtostudy,tryingtofindabetterideadealingwiththenewproblems.itputsforwordthedomainpointofview,whichoffersanewwaytodowiththetechnologymonitoringinsuchnewcircumstance.thisnewmethodscanhelpreseaehersandscientistsdealwithlargeinformationanddata,andbuildtherelationshipbetweenthem.keywords:informationvisualization;technologymonitoring;domainanalysis1信息可視化和科技監(jiān)測(cè)概述信息可視化(informationvisualization,縮寫為infovis或iv),最早出現(xiàn)在1989年美國(guó)學(xué)會(huì)組織的重要國(guó)際會(huì)議用戶界面軟件與技術(shù)(uist)的報(bào)告中,重點(diǎn)研究如何把抽象信息交互地,可視地表示出來.對(duì)于信息可視化的概念,眾多學(xué)者沒有一致的說法.通過參考其他學(xué)者的觀點(diǎn),作者認(rèn)為信息可視化的實(shí)質(zhì)是一個(gè)從抽象到形象,從一維數(shù)據(jù)向多維圖像的轉(zhuǎn)變過程.所謂科技監(jiān)測(cè),是指對(duì)過去,現(xiàn)在和未來的科學(xué),技術(shù),經(jīng)濟(jì)和社會(huì)發(fā)展所進(jìn)行的系統(tǒng)研究,在科學(xué)技術(shù)信息,數(shù)據(jù)分析的基礎(chǔ)上,利用數(shù)據(jù)挖掘,數(shù)據(jù)可視化技術(shù),信息萃取,知識(shí)發(fā)現(xiàn)等信息技術(shù)手段,綜合國(guó)內(nèi)外各領(lǐng)域?qū)<业膽?zhàn)略性智利,對(duì)科學(xué)技術(shù)活動(dòng)進(jìn)行動(dòng)態(tài)的監(jiān)視,測(cè)量,分析及評(píng)估的方法.把信息可視化技術(shù)即:數(shù)據(jù)獲取與數(shù)據(jù)預(yù)處理,一150一數(shù)據(jù)挖掘與分析,知識(shí)展示使用到科技監(jiān)測(cè)上.可以使用搜索技術(shù)對(duì)sci,spring等數(shù)據(jù)庫(kù),網(wǎng)絡(luò)知識(shí)平臺(tái)獲取各種期刊,專著,專利,報(bào)告,專家知識(shí)等有益信息,還可附加人工查找的方法到相應(yīng)機(jī)構(gòu)查詢獲取數(shù)據(jù)源.將獲取的數(shù)據(jù)除去無關(guān)數(shù)據(jù)和冗余數(shù)據(jù),進(jìn)行數(shù)據(jù)清洗,并將過濾后的數(shù)據(jù)轉(zhuǎn)換成有效形式.選擇特定的數(shù)據(jù)挖掘算法(如技術(shù)組自動(dòng)識(shí)別,技術(shù)創(chuàng)新指標(biāo),自然語(yǔ)言處理和競(jìng)爭(zhēng)分析,模糊聚類等),在數(shù)據(jù)庫(kù)中提取數(shù)據(jù)模式,并用一定的方法表達(dá)成某種易于用戶理解的模式.根據(jù)某種興趣度度量,對(duì)發(fā)現(xiàn)的模式進(jìn)行價(jià)值評(píng)定,必要時(shí)返回前面處理中的某些步驟以反復(fù)提取.將上一階段所得到的數(shù)據(jù)集即知識(shí),以可視化的圖形或圖象展收稿日期:20100926作者簡(jiǎn)介:李麗萍(1963一),女,教授,工程碩:,現(xiàn)從事科研和教學(xué)1:作.示給特定用戶,增強(qiáng)視覺感知,用以輔助科學(xué)研究,挖掘深層知識(shí).2海量科技文獻(xiàn)傳統(tǒng)監(jiān)測(cè)方法面臨的挑戰(zhàn)2.1處理海量的數(shù)據(jù)能力有限傳統(tǒng)的科技監(jiān)測(cè)主要依靠人工統(tǒng)計(jì)分析的方法,來挖掘科技文獻(xiàn),數(shù)據(jù)之間的關(guān)系,近年來又有多種第三方軟件輔助分析數(shù)據(jù),它們?cè)诿鎸?duì)海量數(shù)據(jù)的處理上比較困難.2.2與決策者的交互性不強(qiáng)傳統(tǒng)的科技監(jiān)測(cè)方法,所得到的分析結(jié)果直接給出決策方案,但是是否真正的滿足決策者的需求,這還需要專家人員,系統(tǒng)設(shè)計(jì)人員和決策者之間不斷的反饋與溝通,決策者也應(yīng)該充分參與到分析與決策的過程中.目前的監(jiān)測(cè)方法多是將決策直接提供給決策者,在專家人員,系統(tǒng)設(shè)計(jì)人員和決策者之間的交互方面比較困難,使決策者很難理解其所提供的決策.2.3對(duì)海量數(shù)據(jù)間的關(guān)聯(lián)信息揭示有一定困難傳統(tǒng)的科技監(jiān)測(cè)方法針對(duì)一定量的數(shù)據(jù)可以揭示其之問的關(guān)聯(lián)信息,但是面對(duì)海量的數(shù)據(jù)信息,對(duì)其關(guān)聯(lián)信息的揭示還有一定困難.并且對(duì)于數(shù)據(jù)間的關(guān)聯(lián)信息之間的隱含信息的揭示,傳統(tǒng)的科技檢測(cè)方法就更加困難了.2.4不能很好地滿足用戶需求傳統(tǒng)監(jiān)測(cè)方法的使用者即決策者多為具體領(lǐng)域的專家,但是他們可能對(duì)軟件本身不甚了解,這樣在使用起來用戶對(duì)決策的認(rèn)知有一定困難.而且目前用戶的信息需求日趨專業(yè)化,學(xué)科化,期望較為全面的深入了解某一學(xué)科領(lǐng)域的多種變化類型,深入獲取其內(nèi)在規(guī)律和知識(shí).當(dāng)然這些無論是傳統(tǒng)的人工統(tǒng)計(jì)方法還是第三方輔助軟件都只是揭示一層表面的數(shù)據(jù)關(guān)系,不能很好滿足用戶的需求.3信息可視化在科技監(jiān)測(cè)上的應(yīng)用域分析方法域分析方法以海量科技文獻(xiàn)為研究對(duì)象,基于信息可視化技術(shù),將海量抽象數(shù)據(jù)(半結(jié)構(gòu),非結(jié)構(gòu)化數(shù)據(jù))結(jié)構(gòu)化,挖掘和揭示數(shù)據(jù)之間的各種關(guān)聯(lián)關(guān)系,從領(lǐng)域研究角度來揭示數(shù)據(jù)之問的各種關(guān)聯(lián)關(guān)系,從領(lǐng)域研究角度來對(duì)海量科技文獻(xiàn)進(jìn)行分析,處理,從而對(duì)學(xué)科內(nèi)的科技熱點(diǎn),發(fā)展態(tài)勢(shì)進(jìn)行監(jiān)測(cè)和對(duì)未來趨勢(shì)進(jìn)行預(yù)測(cè).3.1域分析方法的優(yōu)勢(shì)(1)能夠處理海量文獻(xiàn)數(shù)據(jù).域分析方法的研究對(duì)象即是抽象的海量數(shù)據(jù),利用可視化技術(shù)能夠揭示數(shù)據(jù)問的內(nèi)在關(guān)系,監(jiān)測(cè)結(jié)果更加科學(xué)性,客觀性.(2)能夠挖掘和呈現(xiàn)海量數(shù)據(jù)內(nèi)部的隱含信息及相應(yīng)關(guān)聯(lián).域分析方法重在研究如何挖掘海量數(shù)據(jù)間關(guān)聯(lián)關(guān)系,以及顯性關(guān)聯(lián)關(guān)系背后所隱含的相應(yīng)關(guān)聯(lián).利用信息可視化映射技術(shù)和信息顯示技術(shù)發(fā)現(xiàn)更多不易被人理解的信息.(3)增強(qiáng)交互性和動(dòng)態(tài)性.交互性是信息可視化的基本特性,采用可視化技術(shù)建立人機(jī)交互界面,增強(qiáng)決策者與系統(tǒng)分析人員,專家人員的溝通.域分析系統(tǒng)可以階段性的監(jiān)測(cè)學(xué)科領(lǐng)域的發(fā)展?fàn)顩r,動(dòng)態(tài)地進(jìn)行科技監(jiān)測(cè).(4)減弱了傳統(tǒng)方法專家主觀因素影響.域分析方法在數(shù)據(jù)采集與預(yù)處理,數(shù)據(jù)挖掘與分析,以及最后的可視化展示每一階段全部自動(dòng)化形成,無需專家人員的參與,減弱了專家人員主觀因素.(5)對(duì)使用者的要求不高.域分析方法最后的知識(shí)展現(xiàn)更強(qiáng)調(diào)給人以視覺感觸,對(duì)使用者的計(jì)算機(jī)技術(shù)要求不高.3.2域分析方法的主要步驟根據(jù)陳朝美教授多年來對(duì)信息可視化域分析的研究成果,可以簡(jiǎn)要的把域分析方法歸為以下9步:(1)識(shí)別知識(shí)域.盡量廣泛的選擇詞來表示某一個(gè)知識(shí)域,再?gòu)闹刑暨x出特征詞即術(shù)語(yǔ),所選擇的特征詞要可以覆蓋這一知識(shí)域的所有主要元素.(2)數(shù)據(jù)采集.用上一步所確定的下的特征詞在數(shù)據(jù)庫(kù)中檢索符合要求的數(shù)據(jù),即收集涵蓋知識(shí)域的數(shù)據(jù)文獻(xiàn).(3)抽取前沿術(shù)語(yǔ).從上步所收集到的文獻(xiàn),數(shù)據(jù)中定位所有的特征詞,統(tǒng)計(jì)特征詞在文章的標(biāo)題,文摘和表述中出現(xiàn)的頻率,以來確定哪些詞是前沿?zé)狳c(diǎn)詞匯.(4)確定時(shí)間片斷.進(jìn)行研究不是針對(duì)時(shí)間點(diǎn),應(yīng)該是某一段時(shí)間內(nèi)的科技動(dòng)態(tài)監(jiān)測(cè).所以應(yīng)由用戶確定整個(gè)時(shí)間間隔的范圍和單個(gè)時(shí)間片斷的長(zhǎng)度.(5)選擇起始標(biāo)準(zhǔn).在可視化的展示知識(shí)時(shí)允許用戶指定特征詞的引用數(shù)量和共引數(shù)量,以及共引文獻(xiàn)的數(shù)量.它們的起始標(biāo)準(zhǔn)也限定,如citespace2中將指定的限定運(yùn)用在三個(gè)時(shí)間片斷中,也就是早期片斷,中間片斷和結(jié)束片斷.(6)修剪,合并.最后檢索統(tǒng)計(jì)出來的關(guān)聯(lián)詞比較多的時(shí)候,根據(jù)實(shí)際情況刪除不必要的詞,適當(dāng)?shù)暮喜⒁恍╆P(guān)聯(lián)詞.一1l(7)視圖呈現(xiàn).確定最終以怎樣的方式來呈現(xiàn)結(jié)果.例如citespace2中用了一個(gè)標(biāo)準(zhǔn)的圖表視圖和一個(gè)時(shí)區(qū)視圖來顯示結(jié)果.(8)可視特征檢查.就指定知識(shí)領(lǐng)域的信息用戶可以和可視化系統(tǒng)進(jìn)行交互,用戶可以自主地控制算法和參數(shù),控制可視的特征顯示.(9)檢驗(yàn)拐點(diǎn).這是重要的一步,需要學(xué)科領(lǐng)域?qū)<覍?duì)相關(guān)度高的特征詞即節(jié)點(diǎn)或拐點(diǎn)進(jìn)行分析檢驗(yàn),這個(gè)拐點(diǎn)有可能就是這一學(xué)科領(lǐng)域的未來研究熱點(diǎn)和發(fā)展方向,系統(tǒng)應(yīng)該具備自動(dòng)統(tǒng)計(jì)拐點(diǎn)的值的功能.這一步應(yīng)該盡可能的反復(fù)檢驗(yàn).從目前的研究來看,可視化的數(shù)據(jù)挖掘域分析方法能夠較為滿意的解決現(xiàn)在的問題,并且在域分析方面也有了一些可喜的成就,但是筆者在參閱了多方文獻(xiàn)后,認(rèn)為還有以下需解決的問題:第一,可視化對(duì)象.系統(tǒng)是否可以處理多種數(shù)據(jù)格式的能力.vxlnsight,inspire等大多數(shù)的系統(tǒng)可以處理txt文本數(shù)據(jù)和html,xml等數(shù)據(jù)格式,但是其他的數(shù)據(jù)格式需要人工轉(zhuǎn)化才可以進(jìn)行.不僅給研究帶來了麻煩,而且限制了部分?jǐn)?shù)據(jù),如圖片格式的數(shù)據(jù).第二,分析力度不夠.很多系統(tǒng)的數(shù)據(jù)處理對(duì)象僅限于引文文獻(xiàn),沒有深入文獻(xiàn)的內(nèi)部主題及核心問題,在數(shù)據(jù)的挖掘深度上還是不夠.第三,系統(tǒng)不易學(xué)習(xí).現(xiàn)在大部分的域分析系統(tǒng)需學(xué)習(xí)后才能掌握使用,而且有的系統(tǒng)非常的復(fù)雜但又缺少幫助信息,這對(duì)于非計(jì)算機(jī)領(lǐng)域的用戶(上接第149頁(yè))人為主,憑以往的經(jīng)驗(yàn)判斷往往會(huì)走人誤區(qū).應(yīng)該更多的借助儀器儀表的科技手段來分析解決問題.圖2小學(xué)周邊測(cè)試頻譜(1)使用直放站作為實(shí)現(xiàn)小容量,大覆蓋目一152一來說,也是一個(gè)不小的挑戰(zhàn).因此如何曾強(qiáng)界面的可理解性,友好性,是我們研究人員在研發(fā)系統(tǒng)時(shí)需要考慮的問題.目前,對(duì)于這一領(lǐng)域國(guó)外將研究重點(diǎn)深人到采用多種不同的引用模式,例如共著作者關(guān)系,作者共引關(guān)系,來改進(jìn)系統(tǒng)對(duì)文獻(xiàn)之間的關(guān)系進(jìn)行分析.我國(guó)在域分析研究方面還處于對(duì)國(guó)外研究的追蹤階段.希望本文能夠引起業(yè)內(nèi)學(xué)者的廣泛關(guān)注,共同探討域分析領(lǐng)域的問題,推動(dòng)我國(guó)科學(xué)研究的進(jìn)步.參考文獻(xiàn):1soso百科eb/ol.http:/baike.soso.com/v7337339.htm.20091228.2劉凱.信息可視化概念的深入探討j.情報(bào)雜志,2004,12:1.3周寧,張弛,張會(huì)平.信息可視化與知識(shí)檢索系統(tǒng)設(shè)計(jì)j.情報(bào)科學(xué),2006,4:1.4張海營(yíng).信息可視化芻議j.科學(xué)情報(bào)開發(fā)與經(jīng)濟(jì),2005,15(8):12.5朱東華,袁軍鵬.基于數(shù)據(jù)挖掘的科技監(jiān)測(cè)方法研究j.管理工程,20o4(4):3.6汪雪峰,朱東華,胡望斌.促進(jìn)技術(shù)監(jiān)測(cè)在政府科研管理中的應(yīng)用j.科研管理,2006,5:1.7朱東華,袁軍鵬.技術(shù)監(jiān)測(cè)指標(biāo)及其實(shí)證分析j.科學(xué)學(xué)研究,2003(8):12.8吳茵茵.文獻(xiàn)計(jì)量學(xué)方法在網(wǎng)絡(luò)計(jì)量學(xué)應(yīng)用中的局限性j.情報(bào)資料工作,2004,4:23.9百度百科eb/ol./view/40540.htm?fr=alao一1,2009,4.10劉國(guó)棟,羅長(zhǎng)坤,吳培紅.科學(xué)計(jì)量學(xué)的研究現(xiàn)狀及發(fā)展趨勢(shì)j.中華醫(yī)學(xué)科研管理雜志,2005(6):34.責(zé)任編輯:劉新影標(biāo)的必要手段之一,主要是由于使用直放站一是在不增加基站數(shù)量的前提下保證網(wǎng)絡(luò)覆蓋,二是其造價(jià)遠(yuǎn)遠(yuǎn)低于有同樣

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論