論視覺模擬的應(yīng)用與發(fā)展_第1頁
論視覺模擬的應(yīng)用與發(fā)展_第2頁
論視覺模擬的應(yīng)用與發(fā)展_第3頁
論視覺模擬的應(yīng)用與發(fā)展_第4頁
論視覺模擬的應(yīng)用與發(fā)展_第5頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、論視覺模擬技術(shù)的應(yīng)用與發(fā)展摘要:視覺模擬技術(shù)是自二十世紀(jì)六十年代中期迅速發(fā)展起來的一門新學(xué)科視覺模擬技術(shù)是使用計(jì)算機(jī)及相關(guān)設(shè)備對生物視覺的一種模擬。它的主要任務(wù)就是通過對采集的圖片或視頻進(jìn)行處理以獲得相應(yīng)場景的三維信息,就 像人類和許多其他類生物每天所做的那樣。由于算機(jī)視覺學(xué)在工農(nóng)業(yè)生產(chǎn)、 地質(zhì)學(xué)、天文學(xué)、氣象學(xué)、醫(yī)學(xué)及軍事并學(xué)等領(lǐng)域有著極大的潛在應(yīng)用價(jià)值,所以它在國際上越來越受人重視。本文簡要地介紹了視覺模擬技術(shù)的研究內(nèi)容,它同附近學(xué)科的關(guān)系,視覺模擬技術(shù)研究中面臨的技術(shù)難點(diǎn)以及視覺模擬技術(shù)的 歷史,現(xiàn)狀和研究動(dòng)向。關(guān)鍵字:視覺模擬技術(shù) 圖像分割研究視覺模擬技術(shù)的研究Abstract the

2、 visual simulatio n tech no logy is since the middle of 1960's rapidly develop a new subject. Visual simulatio n tech no logy is to use computer and related equipme nt for the biological visual a simulati on .It is through the main task of gatheri ng pictures or video processed to obta in corres

3、p onding scene 3 d information, like humans and many other sort of do every day like that. Because the mach ine visi on to lear n in the in dustry and agriculture product ion, geology, astro nomy, meteorology, medical and military and lear n fields has a great potential application value, so it is m

4、ore and more people in the world by the attention. This article briefly introduced the research content of visual simulati on tech no logy, it n ear the relatio nship with discipli ne, visual simulatio n tech no logy research faced with in the tech ni cal difficulties and visual simulati on tech no

5、logy of history, prese nt situati on and tren ds.Key word :visual simulatio n tech no logy, image segme ntati on research, visual simulatio n tech no logy research1緒論視覺模擬技術(shù)既是工程領(lǐng)域,也是科學(xué)領(lǐng)域中的一個(gè)富有挑戰(zhàn)性重要研究領(lǐng) 域。視覺模擬技術(shù)是一門綜合性的學(xué)科,它已經(jīng)吸引了來自各個(gè)學(xué)科的研究者參 加到對它的研究之中。其中包括計(jì)算機(jī)科學(xué)和工程、信號處理、物理學(xué)、應(yīng)用數(shù) 學(xué)和統(tǒng)計(jì)學(xué),神經(jīng)生理學(xué)和認(rèn)知科學(xué)等。視覺模擬技術(shù)學(xué)所研究

6、的對象,簡單地說就是研究如何讓計(jì)算機(jī)通過圖象傳 感器或其它光傳感器來感知、分析和理解周圍環(huán)境。人類感知外界環(huán)境主要通過視覺 ,聽覺和觸覺等四大感覺系統(tǒng)。其中視覺系 統(tǒng)是最復(fù)雜的。人類從外界獲得的信息中視覺信號量最大。模仿人類的視覺系統(tǒng) ,視覺模擬技術(shù)系統(tǒng)中信息的處理和分析大致可以分成 兩個(gè)階段: 圖象處理階段又稱視覺處理中的低水平和中水平階段; 圖象分析、理 解階段又稱視覺處理中的高水平處理階段。2 圖像分割研究圖像分割是圖像處理與機(jī)器視覺的基本問題之一。其要點(diǎn)是 : 把圖像劃分成 若干互不交迭區(qū)域的集合。這些區(qū)域要么對當(dāng)前的任務(wù)有意義,要么有助于說明它們與實(shí)際物體或物體的某些部分之間的對應(yīng)關(guān)

7、系。圖像分割的應(yīng)用十分廣泛 , 幾乎出現(xiàn)在有關(guān)圖像處理的所有領(lǐng)域 ,并涉及各種類型的圖像。 例如 ,在遙感應(yīng)中 , 合成孔徑雷達(dá)圖像中目標(biāo)的分割 ;遙感云圖中不同云系和背景分布的分割 ;在交通 圖像分析中 ,把車輛目標(biāo)從背景中分割出來。在這些應(yīng)用中 ,分割通常是為了進(jìn)一 步對圖像進(jìn)行分析、識別、壓縮編碼 ,分割的準(zhǔn)確性直接影響后續(xù)任務(wù)的有效性。一般來講 ,分割出的區(qū)域需同時(shí)滿足均勻性和連通性的條件。其中均勻性是 指在該區(qū)域中的所有象素點(diǎn)都滿足基于灰度、 紋理、彩色等特征的某種相似性準(zhǔn) 則;連通性是指在該區(qū)域內(nèi)存在任意兩點(diǎn)的路徑。盡管圖像處理和機(jī)器視覺界的 研究者們?yōu)榇烁冻隽碎L期的努力 ,符合以

8、上兩點(diǎn)的通用性分割仍面臨著巨大的困 難;大部分研究成果都是針對某一類型圖像、某一具體應(yīng)用的分割??梢愿爬?以下內(nèi)容。3 視覺模擬技術(shù)的研究人類很多研究都是以延伸人類能力為目的的 ,早期的工作是在體力上延伸 ,計(jì) 算機(jī)發(fā)明以來 ,就拓展到對人類腦力和感知能力的延伸上。對人類視覺感知能力 的計(jì)算機(jī)模擬導(dǎo)致了視覺模擬技術(shù)的產(chǎn)生。 視覺模擬技術(shù)也經(jīng)常被稱為圖像理解 是指研究完成一項(xiàng)任務(wù)所需的視覺信息及如何從圖像中獲取這些信息的研究領(lǐng) 域。其基本目的有三個(gè) :(1) 根據(jù)一幅或多幅二維投影圖像計(jì)算出觀察點(diǎn)到目標(biāo)物體的距離;(2) 根據(jù)一幅或多幅二維投影圖像計(jì)算出觀察點(diǎn)到目標(biāo)物體的運(yùn)動(dòng)參數(shù) ;(3) 根

9、據(jù)一幅或多幅二維投影圖像計(jì)算出觀察點(diǎn)到目標(biāo)物體的表面物理特 性。要達(dá)到的最終目的是實(shí)現(xiàn)對于三維景物世界的理解,即實(shí)現(xiàn)人的視覺系統(tǒng)的某些功能。也就是利用二維投影圖像來重構(gòu)三維物體的可視部分。3.1 視覺模擬技術(shù)的應(yīng)用領(lǐng)域視覺模擬技術(shù)的應(yīng)用領(lǐng)域主要包括對照片、 視頻資料如航空照片、 衛(wèi)星照片、 視頻片段等的解釋、精確制導(dǎo)、移動(dòng)機(jī)器人視覺導(dǎo)航、醫(yī)學(xué)輔助診斷、工業(yè)機(jī)器 人的手眼系統(tǒng)、地圖繪制、物體三維形狀分析與識別及智能人機(jī)接口等。 早期進(jìn)行數(shù)字圖像處理的目的之一就是要通過采用數(shù)字技術(shù)提高照片的質(zhì) 量,輔助進(jìn)行航空照片和衛(wèi)星照片的讀取判別與分類。由于需要判讀的照片數(shù)量 很多 ,于是希望有自動(dòng)的視覺系統(tǒng)

10、進(jìn)行判讀解釋 ,在這樣的背景下 ,產(chǎn)生了許多航 空照片和衛(wèi)星照片判讀系統(tǒng)與方法。 自動(dòng)判讀的進(jìn)一步應(yīng)用就是直接確定目標(biāo)的 性質(zhì) ,進(jìn)行實(shí)時(shí)的自動(dòng)分類 ,并與制導(dǎo)系統(tǒng)相結(jié)合。目前常用的制導(dǎo)方式包括激光 制導(dǎo)、電視制導(dǎo)和圖像制導(dǎo) ,在導(dǎo)彈系統(tǒng)中常常將慣性制導(dǎo)與圖像制導(dǎo)結(jié)合 ,利用 圖像進(jìn)行精確的末制導(dǎo)。工業(yè)機(jī)器人的手眼系統(tǒng)是視覺模擬技術(shù)應(yīng)用最為成功的領(lǐng)域之一 ,由于工業(yè) 現(xiàn)場的諸多因素 ,如光照條件、 成像方向均是可控的 ,因此使得問題大為簡化 ,有利 于構(gòu)成實(shí)際的系統(tǒng)。與工業(yè)機(jī)器人不同 ,對于移動(dòng)機(jī)器人而言 ,由于它具有行為能 力 ,于是就必須解決行為規(guī)劃問題 ,即是對環(huán)境的了解。 隨著移動(dòng)式機(jī)

11、器人的發(fā)展 , 越來越多地要求提供視覺能力 ,包括道路跟蹤、回避障礙、特定目標(biāo)識別等。目 前移動(dòng)機(jī)器人視覺系統(tǒng)研究仍處于實(shí)驗(yàn)階段 ,大多采用遙控和遠(yuǎn)視方法。在醫(yī)學(xué)上采用的圖像處理技術(shù)大致包括壓縮、存儲、傳輸和自動(dòng) /輔助分類 判讀 ,此外還可用于醫(yī)生的輔助訓(xùn)練手段。 與視覺模擬技術(shù)相關(guān)的工作包括分類、 判讀和快速三維結(jié)構(gòu)的重建等方面。長期以來 ,地圖繪制是一件耗費(fèi)人力、物力 和時(shí)間的工作。以往的做法是人工測量 ,現(xiàn)在更多的是利用航測加上立體視覺中 恢復(fù)三維形狀的方法繪制地圖 ,大大提高了地圖繪制的效率。同時(shí) ,通用物體三維 形狀分析與識別一直是視覺模擬技術(shù)的重要研究目標(biāo) ,并在景物的特征提取、

12、表 示、知識的存儲、檢索以及匹配識別等方面都取得了一定的進(jìn)展 ,構(gòu)成了一些用 于三維景物分析的系統(tǒng)。近年來,基于生物特征(biometrics)的鑒別技術(shù)得到了廣泛重視,主要集中在對 人臉、虹膜、指紋、聲音等特征上 ,這其中大多都與視覺信息有關(guān)。與生物特征 識別密切相關(guān)的另一個(gè)重要應(yīng)用是用于構(gòu)成智能人機(jī)接口。 現(xiàn)在計(jì)算機(jī)與人的交 流還是機(jī)械式的 ,計(jì)算機(jī)無法識別用戶的真實(shí)身份 ,除鍵盤、鼠標(biāo)外,其他輸入手段 還不成熟。 利用視覺模擬技術(shù)技術(shù)可以使計(jì)算機(jī)檢測到用戶是否存在、 鑒別用戶 身份、識別用戶的體勢 (如點(diǎn)頭、搖頭 ) 。此外,這種人機(jī)交互方式還可推廣到一切 需要人機(jī)交互的場合 ,如入口安

13、全控制、過境人員的驗(yàn)放等。4 對視覺模擬技術(shù)研究的認(rèn)識視覺模擬技術(shù)研究經(jīng)歷了近 40 年的過程 ,仍面臨許多問題。 主要由于這一方 向是多學(xué)科的交叉與結(jié)合 ,同時(shí)視覺是一個(gè)涉及生理、心理的復(fù)雜過程 ,不僅與眼 睛有關(guān),還和大腦的推理、學(xué)習(xí)有關(guān)。研究視覺模擬技術(shù)的目的是要實(shí)現(xiàn)對人類 視覺的模擬和延伸。對于人類而言 ,視覺是一個(gè)輕而易舉的功能 ,對機(jī)器卻不同。 視覺過程很難用類似于問題求解的方法符號化。 隨著計(jì)算機(jī)科學(xué)領(lǐng)域中對定量研 究的重視 ,這種狀況會得到改善。在視覺模擬技術(shù)的研究過程中 ,應(yīng)考慮將功能模 擬與認(rèn)知模擬相結(jié)合。人類延伸其他能力的過程中 ,功能模擬起到了主要作用 ,但 視覺是涉及

14、心理和生理兩方面的過程 , 因此必須在功能模擬的同時(shí)重視認(rèn)知模 擬。計(jì)算理論的進(jìn)步與感知手段的改進(jìn)有助于視覺模擬技術(shù)的研究。 在視覺模擬 技術(shù)中計(jì)算理論占有十分重要的地位 ,計(jì)算理論的進(jìn)步 ,新的計(jì)算模型的提出可以 解決以往一些困難的問題 ;另一方面 ,感知手段的進(jìn)步也可以起到同樣的作用。采 用主動(dòng)視覺可從另一個(gè)側(cè)面去處理面對的視覺問題。要實(shí)現(xiàn)完整的視覺系統(tǒng),視覺知識的獲取、 管理和利用是必不可少的。 一個(gè)相對完備的視覺系統(tǒng)同時(shí)也是一 個(gè)知識管理系統(tǒng) ,在視覺過程中對一幅圖像的理解需要大量的關(guān)于任務(wù)領(lǐng)域的知 識 ,這些知識不同于問題求解中的知識可以明確的顯性表示 ,而且人類獲取信息的 80%是

15、通過視覺得到的 ,因而這些知識涉及面之廣難以預(yù)測 ,因此視覺系統(tǒng)中的知 識管理是一個(gè)重要問題。從以往的研究看 ,過去的幾十年雖然提出、解決了一些問題 ,但是由于視覺問 題的特殊性和復(fù)雜性 ,還有大量的問題需要研究。研究的重點(diǎn)包括對新方法、新 手段的探索。當(dāng)然 ,在原有問題上采用新的描述方法、求解手段也是一個(gè)可能的 突破點(diǎn)。在視覺領(lǐng)域中多數(shù)的問題不是問題本身正確與否 ,而是描述是否恰當(dāng)以 及求解是否有效的問題 ,因而描述方式、求解手段的探索是十分重要的??傊?,隨 著對定量研究的重視 ,新的描述方式、 求解手段的研究 ,以及感知手段的改進(jìn) ,視覺 模擬技術(shù)的研究必將迎來一個(gè)更加繁榮的時(shí)代。參考文獻(xiàn) :1 陳熙霖. 視覺模擬技術(shù):算法與系統(tǒng)原理 , 清華大學(xué)出版社 ,20002 高滿屯. 視覺模擬技術(shù)研究中的投影理

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論