人工智能在信息檢索中應(yīng)用技術(shù)模式_第1頁(yè)
人工智能在信息檢索中應(yīng)用技術(shù)模式_第2頁(yè)
人工智能在信息檢索中應(yīng)用技術(shù)模式_第3頁(yè)
已閱讀5頁(yè),還剩2頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、人工智能在信息檢索中的應(yīng)用模式-工程論文人工智能在信息檢索中的應(yīng)用模式聞偉WEN Wei(中國(guó)電子科技集團(tuán)公司第四十七研究所,沈陽(yáng)110032 )(47th In stitute of Chi na Electro nics Tech no logyGroup Compa ny,Shenyang 110032, China)摘要:概括了信息檢索的概念,給出了計(jì)算機(jī)信息檢索的發(fā)展現(xiàn)狀和趨勢(shì),歸納分析了人工智能在信息檢索中的應(yīng)用,包括信息過(guò)濾中的應(yīng)用、信息管理?xiàng)l形碼檢索中的應(yīng)用、智能代理在信息檢索中的應(yīng)用以及組合神經(jīng)網(wǎng)絡(luò)/專家系統(tǒng)在信息檢索中的應(yīng)用。Abstract: This paper sum

2、marized the con cept of in formati on retrieval, and gave the developmentstatus and trend of computer informationretrieval. The application of artificial intelligence in information retrieval was an alyzed,in cludi ng in the in formatio n filteri ng,in formatio nman ageme nt bar code retrieval, i nt

3、ellige nt age nt in in formatio n retrieval, and comb iningn eural n etwork and expertsystem in in formatio nretrieval.關(guān)鍵詞:信息檢索;人工智能;神經(jīng)網(wǎng)絡(luò);專家系統(tǒng)Key words: informationretrieval ; artificialintelligence; neuralnetwork ; expert system文獻(xiàn)標(biāo)識(shí)中圖分類號(hào):TP391 碼:A文章編號(hào):1006-4311(2015 ) 02-0187-020引言信息檢索工作,起源于對(duì)圖書館中的圖

4、書、文獻(xiàn)進(jìn)行索引編排以方便查閱。傳統(tǒng)的信息檢索方法主要是依靠圖書管理員的手工,但隨著計(jì)算機(jī)技術(shù)和智能技術(shù)的發(fā)展,傳統(tǒng)的信息檢索方式正逐漸被計(jì)算機(jī)依靠人工智能的推理機(jī)制而取 代。人工智能用于信息檢索主要體現(xiàn)在信息過(guò)濾、圖像識(shí)別、智能代理、神經(jīng)網(wǎng) 絡(luò)等幾個(gè)方面。1信息檢索的概念信息檢索是指從以任何方式組成的信息集合中,查找特定用戶在特定時(shí)間和 條件下所需信息的方法。其方法主要包括四種:布爾法、詞位法、截詞法、限制 法。目前,比較廣泛的是布爾檢索方法,這是因?yàn)椴紶枡z索具有四個(gè)主要特征: 思維方式類似于人、表達(dá)直觀和結(jié)構(gòu)化強(qiáng)、有利于“擴(kuò)檢和縮檢”、易于計(jì)算機(jī) 編程實(shí)現(xiàn)。2計(jì)算機(jī)信息檢索的現(xiàn)狀計(jì)算機(jī)檢索

5、是指讓計(jì)算機(jī)訪問(wèn)各種數(shù)據(jù)庫(kù)查找所需文獻(xiàn)的方法,在整個(gè)檢索 過(guò)程,依靠人控制計(jì)算機(jī)完成,其信息匹配是由計(jì)算機(jī)自動(dòng)完成。在檢索過(guò)程中, 人是整個(gè)檢索方案的計(jì)設(shè)者和操縱者。計(jì)算機(jī)檢索是在計(jì)算機(jī)技術(shù)、人工智能技 術(shù)、通信技術(shù)和網(wǎng)絡(luò)技術(shù)迅猛發(fā)展的基礎(chǔ)上建立起來(lái)的,它產(chǎn)生于20世紀(jì)50年代,發(fā)展于80年代中期,廣泛應(yīng)用于90年代后期。到2000年后,隨著人 工智能技術(shù)和互聯(lián)網(wǎng)技術(shù)的發(fā)展,又進(jìn)入了一個(gè)嶄新的時(shí)期,在信息服務(wù)領(lǐng)域具 有劃時(shí)代的意義。3智能技術(shù)在信息檢索的應(yīng)用模式人工智能技術(shù)在信息檢索系統(tǒng)的廣泛應(yīng)用,是人工智能技術(shù)與信息技術(shù)的成 功結(jié)合的結(jié)果,例如信息檢索技術(shù)與推理技術(shù)的結(jié)合、數(shù)據(jù)庫(kù)技術(shù)與知識(shí)庫(kù)

6、技術(shù) 的結(jié)合、數(shù)據(jù)處理與知識(shí)處理的結(jié)合等。在應(yīng)用過(guò)程中,通常是按照用戶需求, 進(jìn)行信息特征提取,即根據(jù)用戶需求進(jìn)行信息篩選;當(dāng)用戶的查詢請(qǐng)求不具有不 確定性時(shí),智能推理機(jī)利用知識(shí)庫(kù)和數(shù)據(jù)庫(kù)進(jìn)行推斷, 給出潛在的用戶需求信息 (如圖1所示)。圖I饕能技術(shù)在信息椅索中應(yīng)用的結(jié)構(gòu)框架智能信息檢索系統(tǒng)的歸納起來(lái)主要有如下幾種應(yīng)用模式:3.1智能技術(shù)在信息過(guò)濾中的應(yīng)用利用智能技術(shù),設(shè)計(jì)過(guò)濾軟件,對(duì)接收信息進(jìn)行合法檢測(cè),決定信息內(nèi)容是濾除還是允許通過(guò),將垃圾信息加以標(biāo)注, 將可疑的信息送往隔離區(qū)域。于是人們可以很快地瀏覽信息并判定是否是垃圾信 息。3.2智能技術(shù)信息檢索視頻圖像檢索將人工智能算法應(yīng)用于視頻

7、圖像的分類索引與檢索中,系統(tǒng)將對(duì)視頻圖像的特征進(jìn)行選取,包括了顏色直方圖的計(jì)算、 紋理的分析及應(yīng)用運(yùn)動(dòng)跟蹤,系統(tǒng)將會(huì)根據(jù)這些特征向量對(duì)視頻片斷進(jìn)行分類和 檢索。3.3智能代理在信息檢索中的應(yīng)用應(yīng)用人工智能,計(jì)算機(jī)檢索系統(tǒng)根據(jù)用戶需要,代替用戶進(jìn)行各種復(fù)雜的工作,如信息查詢篩選及管理,并能推測(cè)用戶 的意圖,自主制定、調(diào)整和執(zhí)行工作計(jì)劃具有智能性, 是可進(jìn)行高級(jí)復(fù)雜的自動(dòng) 處理的代理軟件,智能代理可應(yīng)用于廣泛的領(lǐng)域,是人工智能領(lǐng)域近年來(lái)研究的 一個(gè)熱點(diǎn),應(yīng)用于信息檢索領(lǐng)域之后,成為開(kāi)發(fā)智能化個(gè)性化信息檢索的重要技 術(shù)之一,以智能搜索代理技術(shù)為主,結(jié)合搜索引擎面向主題的檢索模式, 在密切 關(guān)注個(gè)體需

8、求提高信息與用戶需求相關(guān)系統(tǒng),彼此之間可以通過(guò)統(tǒng)一的傳輸協(xié)議 進(jìn)行溝通,交換信息,從而使更多的信息得以挖掘,以彌補(bǔ)智能代理信息搜索范 圍有限的缺陷,這種模式充分利用了智能搜索代理的流動(dòng)性交互性智能性特點(diǎn), 同時(shí)又吸取了搜索引擎的主題相關(guān)的思想,為高質(zhì)量的信息個(gè)性化檢索服務(wù)提供 了新的模式。3.4神經(jīng)網(wǎng)絡(luò)算法在信息檢索中的應(yīng)用神經(jīng)網(wǎng)絡(luò)信息檢索專家系統(tǒng)將邏輯推理與數(shù)值運(yùn)算相結(jié)合,利用神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)功能、聯(lián)想記憶功能、分布式并行 信息處理功能,來(lái)解決檢索系統(tǒng)的不確定性知識(shí)的表示與并行推理。其常用的網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示。對(duì)于神經(jīng)網(wǎng)絡(luò)信息檢索專家系統(tǒng),其信息檢索知識(shí)表示為顯式與隱式兩種形 式。面向領(lǐng)域?qū)<?/p>

9、、知識(shí)工程師和用戶的顯式表示是有關(guān)信息對(duì)象的特征關(guān)系的 產(chǎn)生式規(guī)則以及規(guī)則的前提和結(jié)論的可信度組成的可信度矩陣,面向神經(jīng)網(wǎng)絡(luò)推理機(jī)的隱式表示是由產(chǎn)生式規(guī)則轉(zhuǎn)化而來(lái)的以內(nèi)部編碼形式存在的學(xué)習(xí)樣本以 及學(xué)習(xí)后得到的權(quán)值矩陣。任何知識(shí)規(guī)則都可通過(guò)對(duì)范例的學(xué)習(xí)存儲(chǔ)于神經(jīng)網(wǎng)絡(luò) 的各連接權(quán)值中,便于知識(shí)庫(kù)的組織與管理,通用性強(qiáng),知識(shí)容量大。其信息特 征基本原理為:把信息特征集按一定的順序編碼,分別賦予神經(jīng)網(wǎng)絡(luò)的輸入層和 輸出層,通過(guò)特定的學(xué)習(xí)算法對(duì)樣本進(jìn)行學(xué)習(xí), 把信息管理專家求解特征問(wèn)題的 啟發(fā)式經(jīng)驗(yàn)知識(shí)分布到網(wǎng)絡(luò)的連接權(quán)值上, 神經(jīng)網(wǎng)絡(luò)通過(guò)自身的學(xué)習(xí)與推理功能 來(lái)完成信息特征專家系統(tǒng)的知識(shí)獲取過(guò)程。神經(jīng)網(wǎng)絡(luò)信息椅囂專家系統(tǒng)結(jié)構(gòu)神蜒網(wǎng)緒4 結(jié)語(yǔ)人工智能技術(shù)在信息檢索領(lǐng)域的成功應(yīng)用,一方面使檢索智能化成為可能,另一方面當(dāng)前海量的數(shù)字信息資源為人工智能提供了一個(gè)類型齊全、內(nèi)容豐富的 綜合信息知識(shí)環(huán)境、各類信息知識(shí)與技術(shù)的學(xué)習(xí)集成和創(chuàng)新成為可能,從而避開(kāi)了與離散的物理世界打交道的許多困難,為實(shí)現(xiàn)分布式信息資源的智能化管理開(kāi)拓新的途徑。也就是說(shuō)人工智能為智能信息系統(tǒng)提供了強(qiáng)大的理論基礎(chǔ),反過(guò)來(lái) 智能信息系統(tǒng)的應(yīng)用促進(jìn)了人工智能學(xué)科的新發(fā)展,兩者相輔相成、相得益彰。

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論