第二講 計(jì)算機(jī)視覺_第1頁
第二講 計(jì)算機(jī)視覺_第2頁
第二講 計(jì)算機(jī)視覺_第3頁
第二講 計(jì)算機(jī)視覺_第4頁
第二講 計(jì)算機(jī)視覺_第5頁
已閱讀5頁,還剩30頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

計(jì)算機(jī)視覺

computervision課程設(shè)置:計(jì)算機(jī)視覺視覺基礎(chǔ)底層處理中層處理高層處理視覺基礎(chǔ)理論:神經(jīng)生理學(xué)、認(rèn)知科學(xué);色度學(xué)、光學(xué);射影幾何、矩陣?yán)碚?。圖像處理:空域圖像處理;頻域圖像處理;圖像特征提取。圖像分割;相機(jī)標(biāo)定;深度估計(jì);

運(yùn)動(dòng)估計(jì)。三維重建;目標(biāo)識(shí)別。智能機(jī)器:能夠模擬人類的功能,感知外部世界并有效解決人所能解決問題的系統(tǒng)。在人類的感知器官中,視覺獲取的信息量最大,大約80%,因此對(duì)于發(fā)展智能機(jī)器而言,賦予機(jī)器以人類視覺功能是十分重要的。計(jì)算機(jī)視覺:研究用計(jì)算機(jī)來模擬生物外顯或宏觀視覺功能的技術(shù)學(xué)科。計(jì)算機(jī)視覺的任務(wù)是用圖像創(chuàng)建或恢復(fù)現(xiàn)實(shí)世界模型,然后認(rèn)知現(xiàn)實(shí)世界。具體來說,讓計(jì)算機(jī)具有對(duì)周圍世界的空間物體進(jìn)行傳感、抽象、判斷的能力,從而達(dá)到識(shí)別、理解的目的。

1.計(jì)算機(jī)視覺的意義2.視覺的過程2.視覺的過程2.視覺的過程2.視覺的過程2.視覺的過程2.視覺的過程計(jì)算機(jī)視覺過程分為三個(gè)階段特征提取和區(qū)域分割基于輪廓,紋理,顏色…建模與模式表達(dá)基于各種物體的抽象化模型描述和理解基于景物的結(jié)構(gòu)知識(shí)2.視覺的過程底層處理中層處理高層處理知識(shí)少多恢復(fù)場景的深度、表面法線方向、輪廓等有關(guān)場景的2.5維信息,并在此基礎(chǔ)上恢復(fù)物體的完整三維圖,建立物體三維描述.根據(jù)機(jī)器預(yù)先存貯的模型知識(shí)以及形狀、色彩等特征,對(duì)于圖像中各種物體進(jìn)行識(shí)別,確定它們用于哪一類物體.建立各個(gè)圖像中物體的拓?fù)潢P(guān)系圖,給出圖像所反映景物的結(jié)構(gòu)描述.體系結(jié)構(gòu)(systemarchitecture),涉及一系列相關(guān)的課題,并行結(jié)構(gòu)、分層結(jié)構(gòu)、信息流結(jié)構(gòu)、拓?fù)浣Y(jié)構(gòu)以及從設(shè)計(jì)到實(shí)現(xiàn)的途徑.3.計(jì)算機(jī)視覺的研究內(nèi)容圖像多義性:三維場景被投影為二維圖像,深度和不可見部分的信息被丟失,因而會(huì)出現(xiàn)不同形狀的三維物體投影在圖像平面上產(chǎn)生相同圖像的問題.另外,在不同角度獲取同一物體的圖像會(huì)有很大的差異.環(huán)境因素影響:場景中的諸多因素,包括照明、物體形狀、表面顏色、攝像機(jī)以及空間關(guān)系變化都會(huì)對(duì)成像有影響.知識(shí)導(dǎo)引:同樣的圖像在不同的知識(shí)導(dǎo)引下,將會(huì)產(chǎn)生不同的識(shí)別結(jié)果.大量數(shù)據(jù):灰度圖像,彩色圖像,深度圖像的信息量十分巨大,巨大的數(shù)據(jù)量需要很大的存貯空間,同時(shí)不易實(shí)現(xiàn)快速處理.4.視覺面臨的困難上世紀(jì)50年代,從統(tǒng)計(jì)模式識(shí)別開始,主要集中在二維圖像分析與識(shí)別,主要應(yīng)用包括字符識(shí)別、工件表面檢測等等。上世紀(jì)60年代,拓展到三維結(jié)構(gòu),對(duì)物體的形狀,物體的空間關(guān)系進(jìn)行描述。通過對(duì)積木世界的研究,引出了邊緣、角點(diǎn)等特征提取,圖像明暗、紋理、運(yùn)動(dòng)以及成像幾何等研究工作。上世紀(jì)70年代,Marr計(jì)算視覺理論,建立一個(gè)十分重要的理論框架。5.計(jì)算機(jī)視覺的發(fā)展(before1970s)5.計(jì)算機(jī)視覺的發(fā)展(after1970s)Marr視覺計(jì)算理論——三種層次計(jì)算理論,主要解決視覺系統(tǒng)的計(jì)算目的和策略是什么?輸入輸出是什么?用什么策略根據(jù)系統(tǒng)的輸入求出輸出?該層次的任務(wù)就是研究如何建立輸入輸出之間的約束和關(guān)系。表示和算法,解決輸入輸出信息如何來表示?如何實(shí)現(xiàn)計(jì)算理論所對(duì)應(yīng)的功能的算法?以及如何由一種表示轉(zhuǎn)換成另一種表示?硬件實(shí)現(xiàn),就是具體的計(jì)算裝置和一些細(xì)節(jié)配置5.計(jì)算機(jī)視覺的發(fā)展(1982)5.計(jì)算機(jī)視覺的發(fā)展(1990s)(a)factorization-based

structurefrommotion(TomasiandKanade1992),(b)densestereomatching

(Boykov,Veksler,andZabih2001),(c)multi-viewreconstruction(SeitzandDyer1999)

(d)facetracking(Matthews,Xiao,andBaker2007),(e)imagesegmentation

(Belongie,Fowlkes,Chungetal.2002)(f)facerecognition(Turkand

Pentland1991a).5.計(jì)算機(jī)視覺的發(fā)展(2000s)(a)imagestitching:merging

differentviews(SzeliskiandShum1997)(b)exposurebracketing:merging

differentexposures;(c)morphing:blendingbetweentwophotographs(Gomes,Darsa,Costa

etal.1999(d)turningacollectionofphotographsintoa3D

model(Sinha,Steedly,Szeliskietal.2008)圖像處理:圖像處理通常是把一幅圖像變換成另外一幅圖像,也就是說,圖像處理系統(tǒng)的輸入是圖像,輸出仍然是圖像,信息恢復(fù)任務(wù)則留給人來完成計(jì)算機(jī)圖形學(xué):通過幾何基元,如線、圓和自由曲面,來生成圖像,它在可視化(Visualization)和虛擬現(xiàn)實(shí)(VirtualReality)中起著很重要的作用.計(jì)算機(jī)視覺正好是解決相反的問題,即從圖像中估計(jì)幾何基元和其它特征.因此,計(jì)算機(jī)圖形學(xué)屬于圖像綜合,計(jì)算機(jī)視覺屬于圖像分析.模式識(shí)別:模式一般指一類事物區(qū)別于其它事物所具有的共同特征。6.計(jì)算機(jī)視覺與其它學(xué)科領(lǐng)域的關(guān)系人工智能(AI):涉及到智能系統(tǒng)的設(shè)計(jì)和智能計(jì)算的研究.在經(jīng)過圖像處理和圖像特征提取過程后,接下來要用人工智能方法對(duì)場景特征進(jìn)行表示,并分析和理解場景.人工智能有三個(gè)過程:感知、認(rèn)知和行動(dòng)..神經(jīng)生理學(xué)與認(rèn)知科學(xué):將人類視覺作為主要的研究對(duì)象.計(jì)算機(jī)視覺中已有的許多方法與人類視覺極為相似.許多計(jì)算機(jī)視覺研究者對(duì)研究人類視覺計(jì)算模型比研究計(jì)算機(jī)視覺系統(tǒng)更感興趣,希望計(jì)算機(jī)視覺更加自然化,更加接近生物視覺計(jì)算機(jī)視覺與其它學(xué)科領(lǐng)域的關(guān)系

零件識(shí)別與定位產(chǎn)品檢驗(yàn)移動(dòng)機(jī)器人導(dǎo)航遙感圖像分析醫(yī)學(xué)圖像分析安全鑒別、監(jiān)視與跟蹤國防系統(tǒng)(目標(biāo)自動(dòng)識(shí)別ATR與目標(biāo)跟蹤)其它(體育、考古、動(dòng)畫)7.計(jì)算機(jī)視覺的應(yīng)用Sojourner火星車前部圖,中部的兩個(gè)小突出

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論