淺談圖像識(shí)別技術(shù)的原理及應(yīng)用_第1頁(yè)
淺談圖像識(shí)別技術(shù)的原理及應(yīng)用_第2頁(yè)
淺談圖像識(shí)別技術(shù)的原理及應(yīng)用_第3頁(yè)
淺談圖像識(shí)別技術(shù)的原理及應(yīng)用_第4頁(yè)
淺談圖像識(shí)別技術(shù)的原理及應(yīng)用_第5頁(yè)
免費(fèi)預(yù)覽已結(jié)束,剩余1頁(yè)可下載查看

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、    淺談圖像識(shí)別技術(shù)的原理及應(yīng)用    曹成志摘  要:隨著人工智能的飛速發(fā)展,一系列新興技術(shù)不斷興起,而圖像識(shí)別技術(shù)作為其中最有潛力的方向之一,在醫(yī)療、交通、農(nóng)業(yè)等領(lǐng)域都有十分廣泛的應(yīng)用。本文闡述了圖像識(shí)別的基本概念和技術(shù)原理,并結(jié)合深度學(xué)習(xí)具體實(shí)例,對(duì)圖像識(shí)別技術(shù)的應(yīng)用進(jìn)行初步研究,最后指出該技術(shù)存在的問(wèn)題并對(duì)發(fā)展前景進(jìn)行展望。關(guān)鍵詞:人工智能;圖像識(shí)別;深度學(xué)習(xí)引言:圖像,是人類歷史中最為重要的信息源之一,它通過(guò)觀測(cè)系統(tǒng)從客觀世界中獲得,可以直觀地表達(dá)事物的特征。近年來(lái),隨著大數(shù)據(jù)時(shí)代的到來(lái)和計(jì)算機(jī)技術(shù)的蓬勃發(fā)展,圖像的數(shù)據(jù)量呈現(xiàn)指數(shù)

2、型增長(zhǎng),圖像識(shí)別技術(shù)的應(yīng)用也越來(lái)越廣泛,并在衛(wèi)生醫(yī)療、科學(xué)研究、故障診斷、交通運(yùn)輸?shù)阮I(lǐng)域取得了一定的成績(jī),并改變著人們的日常生活。本文簡(jiǎn)要介紹了圖像識(shí)別技術(shù)的含義、原理和應(yīng)用領(lǐng)域,并分析該技術(shù)的問(wèn)題和發(fā)展前景。一、圖像識(shí)別技術(shù)概述1.圖像識(shí)別的含義及發(fā)展圖像識(shí)別,是模式識(shí)別技術(shù)在圖像領(lǐng)域的具體應(yīng)用,是對(duì)輸入的圖像信息建立數(shù)學(xué)模型,對(duì)圖像進(jìn)行預(yù)處理操作,分析并提取圖像特征,然后根據(jù)特征建立合適的分類器,進(jìn)行分類識(shí)別的技術(shù)1。其主要目的是對(duì)圖像等可視化信息進(jìn)行處理和識(shí)別,來(lái)解決計(jì)算機(jī)與外部環(huán)境的直接通信過(guò)程。圖像識(shí)別起源于20世紀(jì)40年代,在當(dāng)時(shí)由于計(jì)算能力的限制和硬件設(shè)施的缺失,并沒(méi)有得到很好的

3、發(fā)展。主要經(jīng)歷了三個(gè)階段:文字識(shí)別、數(shù)字圖像處理與識(shí)別、物體識(shí)別。直到20世紀(jì)90年代,伴隨著人工神經(jīng)網(wǎng)路的興起和計(jì)算機(jī)技術(shù)的發(fā)展,圖像識(shí)別技術(shù)得到廣泛應(yīng)用,并涌現(xiàn)出很多不同的算法,涉及邊緣檢測(cè)、區(qū)域提取、閾值分割等多個(gè)部分。2.圖像識(shí)別原理圖像中包含了豐富的數(shù)字信息,識(shí)別過(guò)程主要包括圖像預(yù)處理、特征提取和圖像分類三個(gè)部分。1)圖像預(yù)處理對(duì)圖像預(yù)處理的目的是減少后續(xù)過(guò)程中的復(fù)雜度并提高識(shí)別效率。通過(guò)各種降低噪聲的手段,將圖像中蘊(yùn)含的數(shù)字信息進(jìn)行適當(dāng)簡(jiǎn)化,便于對(duì)特征進(jìn)行提取2。在該過(guò)程中,圖像分割的質(zhì)量對(duì)最終結(jié)果具有較大影響。如何高效地將特征目標(biāo)從源圖像中分割出來(lái),是解決問(wèn)題的關(guān)鍵。由此衍生出了

4、一系列圖像分割法,例如基于方向圖的分割法、三級(jí)分割法等等。每一種分割法都有優(yōu)點(diǎn)和不足,在進(jìn)行處理時(shí),往往需要將多種方法結(jié)合起來(lái)并進(jìn)行適當(dāng)修改,才能獲得最優(yōu)的分割效果。2)特征提取特征提取是將圖像上的特征點(diǎn)劃分為不同特征子集的過(guò)程,這些子集往往是點(diǎn)集、曲線集或連通的的區(qū)域集3。一般來(lái)說(shuō),提取的圖像特征主要包括顏色、形狀、紋理和空間四種。顏色特征能夠很好地描述不同顏色在整個(gè)圖像的所占比例,適合用于難以自動(dòng)分割的圖像,但是無(wú)法對(duì)空間位置進(jìn)行描述;形狀特征需要對(duì)圖像的某個(gè)特定目標(biāo)進(jìn)行研究,但是如果圖像上的目標(biāo)發(fā)生變形,準(zhǔn)確度就會(huì)大大下降;紋理特征具有全局性質(zhì),對(duì)區(qū)域性的特征描述具有較好的 穩(wěn)定性,但是

5、當(dāng)分辨率變化明顯時(shí),得到的特征偏差也會(huì)隨之增加4;空間特征對(duì)靜止圖像的描述效果很好,可是一旦圖像進(jìn)行縮放、旋轉(zhuǎn)等操作,特征變化會(huì)非常明顯。3)圖像分類圖像分類,主要是從一張或者多張圖像總識(shí)別出與模板圖像相似的區(qū)域,用來(lái)預(yù)測(cè)出對(duì)應(yīng)的類別。在實(shí)際應(yīng)用中,由于拍攝環(huán)境等因素的影響,圖像的質(zhì)量會(huì)受到各種因素的干擾,導(dǎo)致失真和扭曲等。如何提高匹配率,加強(qiáng)抗干擾能力并提高匹配速度,成為圖像匹配的主要研究方向。由此出現(xiàn)了很多基于圖像特征的匹配方法,例如幾何圖元法、傅氏形狀描述法等。近年來(lái),深度學(xué)習(xí)的興起,為圖像匹配提供更多思路和方案。二.圖像識(shí)別技術(shù)的應(yīng)用目前,識(shí)別技術(shù)已經(jīng)廣泛應(yīng)用于醫(yī)療、交通、農(nóng)業(yè)等領(lǐng)域,

6、為人們的日常生活帶來(lái)極大便利。1.醫(yī)學(xué)圖像識(shí)別醫(yī)學(xué)圖像種類眾多,清晰度容易受到成像環(huán)境的干擾,這些問(wèn)題在一定程度上會(huì)影響醫(yī)生對(duì)病情的判斷結(jié)果。而借助圖像識(shí)別技術(shù)對(duì)患病部位進(jìn)行檢測(cè)和診斷可以顯著提高工作效率,診斷準(zhǔn)確率有時(shí)甚至可以超過(guò)人工診斷準(zhǔn)確率?,F(xiàn)階段,該技術(shù)的應(yīng)用主要集中在眼部、胸部、腦部等,可以用于診斷肺癌、乳腺癌、阿爾本次海默癥等,在這些方面取得了一定的研究成果5。但是目前為止,由于不具備大量相關(guān)的數(shù)據(jù)集,圖像識(shí)別技術(shù)對(duì)很多病變部位還無(wú)法做出判斷。2.交通識(shí)別在公共交通領(lǐng)域,圖像識(shí)別技術(shù)主要應(yīng)用于交通標(biāo)志識(shí)別、車牌識(shí)別等,在自動(dòng)駕駛、智能停車、交通控制等領(lǐng)域發(fā)揮著舉足輕重的作用。近年來(lái)

7、,一些學(xué)者將卷積神經(jīng)網(wǎng)絡(luò)、循環(huán)神經(jīng)網(wǎng)絡(luò)等深度學(xué)習(xí)算法運(yùn)用到交通標(biāo)志識(shí)別,可以有效提高識(shí)別的準(zhǔn)確度,并提升訓(xùn)練速度。另外,圖像識(shí)別技術(shù)還可以用來(lái)檢測(cè)路況和行人等物體,為無(wú)人駕駛汽車的興起具有顯著推動(dòng)作用。3.農(nóng)業(yè)病蟲(chóng)害識(shí)別農(nóng)業(yè)是我國(guó)最重要的基礎(chǔ)產(chǎn)業(yè)之一,在現(xiàn)代經(jīng)濟(jì)體系中具有十分重要的地位,農(nóng)作物的產(chǎn)量和質(zhì)量直接影響人民的生活水平。而農(nóng)業(yè)病蟲(chóng)害的爆發(fā)往往會(huì)造成農(nóng)作物大幅度減產(chǎn),對(duì)國(guó)民經(jīng)濟(jì)造成不可逆轉(zhuǎn)的損失,因此對(duì)病蟲(chóng)害的防治工作就顯得十分必要。如何對(duì)蟲(chóng)害進(jìn)行準(zhǔn)確有快速的識(shí)別和處理,是保證農(nóng)作物正常生長(zhǎng)的有效措施。而依靠人工識(shí)別方法比較浪費(fèi)人力物力,而且出錯(cuò)率較高,工作繁瑣,越來(lái)越不能滿足農(nóng)業(yè)生產(chǎn)的

8、需求。圖像識(shí)別技術(shù)具有準(zhǔn)確、實(shí)時(shí)和快速的特點(diǎn),可以很好地輔助農(nóng)民檢測(cè)和發(fā)現(xiàn)病蟲(chóng)害,大大提高工作效率。目前為止,已經(jīng)實(shí)現(xiàn)了對(duì)玉米螟、棉鈴蟲(chóng)等農(nóng)業(yè)害蟲(chóng)的圖像識(shí)別與檢測(cè),準(zhǔn)確率較高,同時(shí)也降低了農(nóng)業(yè)生產(chǎn)的成本。三.問(wèn)題與展望現(xiàn)階段,圖像識(shí)別技術(shù)已經(jīng)具備了一定的應(yīng)用價(jià)值,但在該技術(shù)上的理論研究還不夠完善,依然存在一些問(wèn)題丞待解決。1.圖像分割算法的性能評(píng)估沒(méi)有特定的標(biāo)準(zhǔn),這就為方法的選擇和使用造成一定困難。2.識(shí)別效果主要依賴于大樣本數(shù)據(jù)集,因此會(huì)為數(shù)據(jù)采集工作提出更高的要求。3.訓(xùn)練模型越復(fù)雜,計(jì)算量越大,訓(xùn)練時(shí)間也會(huì)越長(zhǎng)。由此可見(jiàn),如何在保證準(zhǔn)確率的同時(shí),減少模型的計(jì)算量并提高計(jì)算效率,是圖像識(shí)別

9、技術(shù)研究的關(guān)鍵之一。為了進(jìn)一步改善該技術(shù),我們應(yīng)注重算法的原理,不斷優(yōu)化模型結(jié)構(gòu),減少訓(xùn)練參數(shù),提高準(zhǔn)確率。四.結(jié)束語(yǔ)圖像識(shí)別技術(shù)的出現(xiàn),為人民的生產(chǎn)和生活帶來(lái)極大便利,并推動(dòng)醫(yī)療、交通、農(nóng)業(yè)等領(lǐng)域的建設(shè),但依然還有很大的開(kāi)發(fā)空間,需要更多學(xué)者和研究人員的投入。在將來(lái),還會(huì)出現(xiàn)更成熟、更方便、更快捷的識(shí)別技術(shù),不斷促進(jìn)人民生活水平的提高。參考文獻(xiàn)1  豐曉霞. 基于深度學(xué)習(xí)的圖像識(shí)別算法研究d.太原理工大學(xué),2015.2  陳勇濤,郭曉穎,陶慧杰.基于深度學(xué)習(xí)的圖像識(shí)別模型研究綜述j.電子世界,2018(04):65-66.3  王志瑞,閆彩良.圖像特征提取方法的綜述j.

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論