機器視覺技術(shù)發(fā)展現(xiàn)狀文獻(xiàn)綜述_第1頁
機器視覺技術(shù)發(fā)展現(xiàn)狀文獻(xiàn)綜述_第2頁
機器視覺技術(shù)發(fā)展現(xiàn)狀文獻(xiàn)綜述_第3頁
機器視覺技術(shù)發(fā)展現(xiàn)狀文獻(xiàn)綜述_第4頁
機器視覺技術(shù)發(fā)展現(xiàn)狀文獻(xiàn)綜述_第5頁
已閱讀5頁,還剩2頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、機器視覺技術(shù)發(fā)展現(xiàn)狀人類認(rèn)識外界信息的 80%來自于視覺, 而機器視覺就是用機器代替人眼來做測量和判斷, 機器視覺的最終目標(biāo)就是使計算機像人一樣, 通過視覺觀察和理解世界,具有自主適應(yīng)環(huán)境的能力。作為一個新興學(xué)科,同時也是一個交叉學(xué)科, 取“信息”的人工智能系統(tǒng),其特點是可提高生產(chǎn)的柔性和自動化程度。目前機 器視覺技術(shù)已經(jīng)在很多工業(yè)制造領(lǐng)域得到了應(yīng)用,并逐漸進(jìn)入我們的日常生活。機器視覺是通過對相關(guān)的理論和技術(shù)進(jìn)行研究,從而建立由圖像或多維數(shù)據(jù)中獲機器視覺簡介機器視覺就是用機器代替人眼來做測量和判斷。 機器視覺主要利用計算機來 模擬人的視覺功能, 再現(xiàn)于人類視覺有關(guān)的某些智能行為, 從客觀事物的

2、圖像中 提取信息進(jìn)行處理, 并加以理解, 最終用于實際檢測和控制。 機器視覺是一項綜 合技術(shù),其包括數(shù)字處理、機械工程技術(shù)、控制、光源照明技術(shù)、光學(xué)成像、傳 感器技術(shù)、 模擬與數(shù)字視頻技術(shù)、 計算機軟硬件技術(shù)和人機接口技術(shù)等, 這些技 術(shù)相互協(xié)調(diào)才能構(gòu)成一個完整的工業(yè)機器視覺系統(tǒng) 1 。機器視覺強調(diào)實用性, 要能適應(yīng)工業(yè)現(xiàn)場惡劣的環(huán)境, 并要有合理的性價比、 通用的通訊接口、 較高的容錯能力和安全性、 較強的通用性和可移植性。 其更強 調(diào)的是實時性,要求高速度和高精度,且具有非接觸性、實時性、自動化和智能 高等優(yōu)點,有著廣泛的應(yīng)用前景 1 。一個典型的工業(yè)機器人視覺應(yīng)用系統(tǒng)包括光源、 光學(xué)成像

3、系統(tǒng)、 圖像捕捉系 統(tǒng)、圖像采集與數(shù)字化模塊、 智能圖像處理與決策模塊以及控制執(zhí)行模塊。 通過CCD或 CMOS攝像機將被測目標(biāo)轉(zhuǎn)換為圖像信號,然后通過A/D轉(zhuǎn)換成數(shù)字信號 傳送給專用的圖像處理系統(tǒng), 并根據(jù)像素分布、 亮度和顏色等信息, 將其轉(zhuǎn)換成 數(shù)字化信息。圖像系統(tǒng)對這些信號進(jìn)行各種運算來抽取目標(biāo)的特征, 如面積、數(shù) 量、位置 和長度等,進(jìn)而根據(jù)判別的結(jié)果來控制現(xiàn)場的設(shè)備動作 1 。機器視覺一般都包括下面四個過程:被測物體光學(xué)系統(tǒng)相機 圖像采集卡計算機機器視覺系統(tǒng)組成機器視覺的發(fā)展歷史機器視覺是在20世紀(jì)50年代從統(tǒng)計模式識別開始,當(dāng)時的工作主要集中 在二維圖像分析、識別和理解上。從 2

4、0世紀(jì)70年代才真正開始發(fā)展,并涌現(xiàn) 出了主動視覺理論框架、基于感知特征群島物體識別理論框架等新的概念、方法 及理論。Marr視覺計算機理論是視覺研究迄今較為完善的理論,其使視覺研究 有了一個較為明確的體系2。Marr視覺理論從計算視覺理論出發(fā), 將立體視覺分為自上而下的三個階段, 即早期的二維視覺數(shù)據(jù)獲取、中期的要素處理和后期三維信息的形成和表達(dá)。經(jīng)歷這單個階段即可完成二維到三維的轉(zhuǎn)換工作圖象早盼E中期視覺處理和,覺處理e期視 處理 要素E工維罔圖2 Marr理論框架的三個階段早期階段的“要素圖” (Primarysketch )是由二維圖像中的點、直線、曲線和紋理等特征組成,早期階段的處理

5、是從圖像中獲取這些特征。 中期階段的處理 是處理特征要素的位置和相互關(guān)系,從而完成對物體的識別、運動分析和形狀恢 復(fù)等操作,該階段處理的結(jié)果僅僅是對空間場景的二維半描述。 如若要完成對空 間場景的真正三維描述,還需第三階段的后期視覺處理,將物體自身坐標(biāo)統(tǒng)一到 一個世界坐標(biāo)系中3。作為立體視覺的基礎(chǔ)理論, Marr 理論具有極其重要的指導(dǎo)作用,但 Marr 理 論自身有缺陷,如單向性(視覺處理只能從前至后處理) 、被動性(視覺處理只 能是給什么圖像處理什么圖像) 、目的單一性(視覺處理的目標(biāo)一般只是恢復(fù)空 間場景中的物體形狀和位置) 等。經(jīng)過幾十年的發(fā)展, 許多學(xué)者紛紛提出了 Marr 理論的改

6、進(jìn)框架, 如在框架前增加圖像拾取模塊, 使其能根據(jù)分析要求和分析結(jié) 果自主獲取圖像; 增加反饋環(huán)節(jié), 使視覺處理結(jié)果能反向指導(dǎo)圖像獲取環(huán)節(jié), 前 后互動;增加高層指導(dǎo)模塊和視覺目的模塊, 使整個視覺處理按照視覺目的的要求,之,在高層指導(dǎo)模塊的指導(dǎo)下完成不同的視覺處理操作,實現(xiàn)其功能多樣化 . 總 改進(jìn)的 Marr 理論框架使立體視覺趨于自動化、智能化和多功能化 3 。機器視覺相關(guān)技術(shù)1、圖像采集技術(shù)機器視覺的基礎(chǔ)圖像采集部分一般由光源、 鏡頭、數(shù)字?jǐn)z像機和圖像采集卡構(gòu)成。 采集過程 可簡單描述為在光源提供照明的條件下, 數(shù)字?jǐn)z像機拍攝目標(biāo)物體并將其轉(zhuǎn)化為 圖像信號,最后通過圖像采集卡傳輸給圖像

7、處理部分。在設(shè)計圖像采集部分時, 要考慮到多方面的問題,主要是關(guān)于數(shù)字?jǐn)z像機、 圖像采集卡和光源方面的問題。1)光源照明照明是影響機器視覺系統(tǒng)輸入的重要因素, 其直接影響輸入數(shù)據(jù)的質(zhì)量和應(yīng) 用效果。到目前為止, 還未有哪種機器視覺照明設(shè)備能通用各種應(yīng)用, 因此在 實 際應(yīng)用中, 需針對應(yīng)用選擇相應(yīng)的照明設(shè)備以滿足特定需求。 在光源照明方案選 擇過程中, 應(yīng)盡可能地突出物體特征, 在物體需要檢測的部分與不重要部分之間 盡量產(chǎn)生明顯的區(qū)域, 增加對比度, 同時還應(yīng)保證足夠的整體亮度, 而物體位置 的變化不應(yīng)影響成像的質(zhì)量。照明系統(tǒng)按其照射方法可分為 : 背向照明、前向照明、結(jié)構(gòu)光和頻閃光照明 等。

8、其中,背向照明是指將被測物放在光源和攝像機之間, 以提高圖像的對比度。前向照明是光源和攝像機位于被測物的同側(cè), 其優(yōu)點是便于安裝。 結(jié)構(gòu)光照明是 將光柵或線光源等投射到被測物上, 并根據(jù)其產(chǎn)生的畸變, 解調(diào)出被測物的三維 信息。頻閃光照明是將高頻率的光脈沖照射到物體上, 攝像機拍攝要求與光源同1 步。2)光學(xué)攝像頭光學(xué)攝像頭的任務(wù)就是進(jìn)行光學(xué)成像, 一般在測量領(lǐng)域都又專門的用于測量 的攝像鏡頭, 因為其對成像質(zhì)量有著關(guān)鍵性的作用。 攝像頭需要注意的一個問題 是畸變。這個就需要使用相應(yīng)的畸變校正方法, 目前也開發(fā)出了很多自動畸變自 動校正系統(tǒng)。(3) CCD攝像機及圖像采集卡CCD(Charge

9、 Coupled Device) 攝像機及圖像采集卡共同完成對目標(biāo)圖像的采集與數(shù)字化。目前CCD CMOS固體器件的應(yīng)用技術(shù),線陣圖型敏感器件, 像元尺寸不斷減小, 陣列像元數(shù)量不斷增加, 像元電荷傳輸速率也得到大幅提高。在基于PC機的機器視覺系統(tǒng)中,圖像采集卡是控制攝像機拍照來完成圖像的采集與數(shù)字化,并協(xié)調(diào)整個系統(tǒng)的重要設(shè)備。 圖像采集卡直接決定了攝像頭的接口為 : 黑白、彩色、模擬、數(shù)字等形式。2、 圖像處理與分析機器視覺的核心用于機器視覺的圖像處理與分析方法的核心是,解決目標(biāo)的檢測識別問題。為此,提出方法的思想中心是如何獲得可正確描述目標(biāo)物與非目標(biāo)物的特征。 當(dāng)所需要識別的目標(biāo)比較復(fù)雜時

10、, 就需要通過幾個環(huán)節(jié), 從不同的側(cè)面綜合來實現(xiàn)。 對目標(biāo)進(jìn)行識別提取的時候, 首先是要考慮如何自動地將目標(biāo)物從背景中分離出來。目標(biāo)物提取的復(fù)雜性一般就在于目標(biāo)物與非目標(biāo)物的特征差異不是很 大,在確定了目標(biāo)提取方案后, 就需要對目標(biāo)特征進(jìn)行增強。 增強方法有顏色特 征的增強、累計特征的增強等。經(jīng)過特征增強后,最后就是目標(biāo)物的提取了。這 里也有很多不同的方法, 比如偽目標(biāo)刪除方法、 自適應(yīng)閾值方法、 逐步驟類方法、 多信息融合方法等 4 。隨著計算機技術(shù)、 微電子技術(shù)以及大規(guī)模集成電路的發(fā)展, 圖像信息處理工 作越來越多地借助硬件完成,如 DSP 芯片、專用的圖像信號處理卡等。軟件部 分主要用來

11、完成算法中并不成熟又較復(fù)雜或需不斷完善改進(jìn)的部分。 這一方面提 高了系統(tǒng)的實時性,同時又降低了系統(tǒng)的復(fù)雜度。四、機器視覺的發(fā)展現(xiàn)狀及應(yīng)用目前,最先進(jìn)的機器視覺技術(shù)仍然由歐美、 日本等國家掌握, 發(fā)達(dá)國家針對 工業(yè)現(xiàn)場的應(yīng)用開發(fā)出了相應(yīng)的機器視覺軟硬件產(chǎn)品。 中國目前正處于由勞動密 集型向技術(shù)密集型轉(zhuǎn)型的時期, 對提高生成效率、 降低人工成本的機器視覺方案長三角有著旺盛的需求, 中國正在成為機器視覺技術(shù)發(fā)展最為活躍的地區(qū)之一。和珠三角成為國際電子和半導(dǎo)體技術(shù)的轉(zhuǎn)移地, 同時也就成為了機器視覺技術(shù)的 聚集地。許多具有國際先進(jìn)水平的機器視覺系統(tǒng)進(jìn)入了中國, 國內(nèi)的機器視覺企 業(yè)也在與國際機器視覺企業(yè)

12、的良性競爭中不斷茁壯成長, 許多大學(xué)和研究所都在 致力于機器視覺技術(shù)的研究。在國外,機器視覺主要應(yīng)用在半導(dǎo)體及電子行業(yè),其中,半導(dǎo)體行業(yè)占 40%50%。例如,PCB印刷電路、SMT表面貼裝、電子生產(chǎn)加工設(shè)備等。此外 機器視覺還在質(zhì)量檢測的各方面及其他領(lǐng)域均有著廣泛應(yīng)用。1) 在工業(yè)檢測方面近幾十年來,在工業(yè)檢測中利用視覺系統(tǒng)的非接觸、速度快、精度合適、現(xiàn) 場抗干擾能力強等突出的優(yōu)點, 使機器視覺技術(shù)得到了廣泛的應(yīng)用, 取得了巨大 的經(jīng)濟與社會效益。自動視覺識別檢測目前已經(jīng)用于產(chǎn)品外形和表面缺陷檢驗,如木材加工檢 測、 金屬表面視覺檢測、二極管基片檢查、印刷電路板缺陷檢查、焊縫缺陷自 動識別等

13、。 這些檢測識別系統(tǒng)屬于二維機器視覺,技術(shù)已經(jīng)較為成熟,其基本 流程是 用一個攝像機獲取圖像,對所獲取的圖像進(jìn)行處理及模式識別,檢測出 所需的內(nèi)容 5。2) 在醫(yī)學(xué)上的應(yīng)用在醫(yī)學(xué)領(lǐng)域,機器視覺主要用于醫(yī)學(xué)輔助診斷。 首先采集核磁共振、 超聲波、 激光、X射線、丫射線等對人體檢查記錄的圖像,再利用數(shù)字圖像處理技術(shù)、 信 息融合技術(shù)對這些醫(yī)學(xué)圖像進(jìn)行分析、 描述和識別, 最后得出相關(guān)信息, 對輔助 醫(yī)生診斷人體病源大小、 形狀和異常, 并進(jìn)行有效治療發(fā)揮了重要的作用。 不同 醫(yī)學(xué)影像設(shè)備得到的是不同特性的生物組織圖像,如X射線反映的是骨骼組織, 核磁共振影像反映的是有機組織圖像, 而醫(yī)生往往需要考

14、慮骨骼 有機組織的關(guān) 系,因而需要利用數(shù)字圖像處理技術(shù)將兩種圖像適當(dāng)?shù)丿B加起來, 以便于醫(yī)學(xué)分 析5。3) 交通監(jiān)控領(lǐng)域中的應(yīng)用智能交通監(jiān)控領(lǐng)域中, 在重要的十字路口安放攝像頭, 就可以利用攝像頭的 快速拍照功能,實現(xiàn)對違章、逆行等車牌的車牌進(jìn)行自動識別、存貯,以便相關(guān)的工作人員進(jìn)行查看。(4) 在橋梁檢測領(lǐng)域中的應(yīng)用 人工檢測法和橋檢車法都是依靠人工用肉眼對橋梁表面進(jìn)行檢測,其速度慢,效率低,漏檢率高,實時性差,影響交通,存在安全隱患,很難大幅應(yīng)用; 無損檢測包括激光檢測、超聲波檢測 以及聲發(fā)射檢測等多種檢測技術(shù),它們儀 器昂貴,測量范圍小, 不能滿足日益發(fā)展的橋梁檢測要求; 智能化檢測有基

15、于導(dǎo) 電性材料的混凝土裂縫分布式自動檢測系統(tǒng)和智能混凝土技術(shù), 也有最前沿的基 于機器視覺的檢測方法。導(dǎo)電性材料技術(shù)雖然使用方便,設(shè)備簡單,成本低廉, 但是均需要事先在混凝土結(jié)構(gòu)上涂刷或者埋設(shè)導(dǎo)電性材料進(jìn)行檢測, 而且智能混 凝土技術(shù)還無法確定裂縫位置、裂縫寬度等一系列問題距實用化還有較長的距 離;而基于機器視覺的檢測方法是利用 CCD相機獲取橋梁表觀圖片,然后運用計 算機處理后自動識別出裂縫圖像, 并從背景中分離出來然后進(jìn)行裂縫參數(shù)的計算 的方法,它具有便捷、直觀、精確、非接觸、再現(xiàn)性好、適應(yīng)性強、靈活性高、成本低廉的優(yōu)點,能解放勞動力,排除人為干擾,具有很好的應(yīng)用前景6。據(jù)統(tǒng)計,混凝土橋梁

16、的損壞有 90%以上都是由裂縫引起的,因此對橋梁的健 康檢測主要是對橋梁表觀的裂縫進(jìn)行檢測與測量。 基于機器視覺的橋梁檢測技術(shù) 主要包括三部分內(nèi)容: 橋梁表觀圖像的獲取技術(shù)、 基于圖像的裂縫自動識別理論 與算法以及基于圖像的裂縫寬度等病害程度定量化測量方法?;跈C器視覺的自動化、 智能化檢測技術(shù)已經(jīng)在道路、 隧道上得到了成功應(yīng)還無法應(yīng)用用,在橋梁上也得到了初步的應(yīng)用, 但主要集中在視線開闊的高空混凝土構(gòu)件表 觀圖像獲取技術(shù)上, 在病害的自動識別方面仍停留在理論研究階段, 于實際工程當(dāng)中。 針對量大面廣的混凝土梁體, 智能化視頻橋梁檢測車進(jìn)入理論 與關(guān)鍵部件模型的研制階段, 但是受到橋梁細(xì)小裂縫

17、自動識別與清晰圖像快速化 獲取難度大的限制,目前離達(dá)到實用化程度的要求還相距甚遠(yuǎn) 6。五、機器視覺技術(shù)發(fā)展遇到的問題對于人類來說, 識別和理解周圍場景是件非常容易的事, 但對于機器人來說,卻是一件很困難的事。主要困難有一下幾個方面:1) 穩(wěn)定性問題現(xiàn)實中的環(huán)境因素是多變的,場景中的諸多因素,包括照明、物體形狀、表面顏色、攝像機以及空間關(guān)系變化都會對生成的圖像有影響。比如用于智能交通 檢測的設(shè)備,如何保證其在惡劣天氣下依舊保持較高的穩(wěn)定性就是一個很難解決 的問題。(2)構(gòu)造出性能良好的識別算法圖像處理與分析技術(shù)是機器視覺的核心,所以構(gòu)造出一個良好的、適應(yīng)相關(guān) 領(lǐng)域應(yīng)用的識別算法顯得尤為重要。而且

18、現(xiàn)在的應(yīng)用領(lǐng)域越來越要求檢測設(shè)備具 有準(zhǔn)確、高速地識別出目標(biāo)的能力,如果我們不能構(gòu)造出一個更好的識別算法, 就不能適應(yīng)不斷增長的需求。(3)數(shù)據(jù)量大機器視覺所獲取的數(shù)據(jù)量非常非常大的。比如用于手機上的人臉識別功能, 識別一次要投射多大幾萬個紅外線點,這是一個龐大的數(shù)據(jù)。再比如交通檢測方天累積下來的數(shù)據(jù)量也是驚人的。 所以如何處理如此大的信息量是個難題。不過隨著硬件技術(shù)的發(fā)展,這個問題將來會逐步得到解決。六、結(jié)束語機器視覺的誕生和應(yīng)用,大幅解放了人類勞動力,同時提高了生產(chǎn)自動化水 平,裝備的使用效率、可靠性及穩(wěn)定性等。隨著新技術(shù)、新理論在機器視覺系統(tǒng) 中的應(yīng)用,機器視覺將在國民經(jīng)濟的各領(lǐng)域申發(fā)揮更大作用,其應(yīng)用前景廣闊, 并為社會的發(fā)展帶來了新的技術(shù)革命。 郭靜,羅華,張濤.機器視覺與應(yīng)用J.電子科技,2014, 27(7): 185-

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論