《計(jì)算機(jī)視覺》教學(xué)大綱_第1頁
《計(jì)算機(jī)視覺》教學(xué)大綱_第2頁
《計(jì)算機(jī)視覺》教學(xué)大綱_第3頁
《計(jì)算機(jī)視覺》教學(xué)大綱_第4頁
《計(jì)算機(jī)視覺》教學(xué)大綱_第5頁
已閱讀5頁,還剩8頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

《計(jì)算機(jī)視覺》教學(xué)大綱

前B

《計(jì)算機(jī)視覺》課程是信息與計(jì)算科學(xué)專業(yè)的選修課程.《計(jì)算機(jī)視

覺》以視覺技術(shù)為邏輯起點(diǎn),以信息與計(jì)算科學(xué)專業(yè)的學(xué)生為講授對

象.計(jì)算機(jī)視覺(MachineVision)是基于視覺技術(shù)的一門邊緣科學(xué),

其核心技術(shù)是視覺處理,并通過對視覺處理來執(zhí)行進(jìn)一步的檢測與控

制等.它的研究內(nèi)容非常廣泛,涉及計(jì)算機(jī)、圖像處理.、模式識別、

人工智能、信號處理、光學(xué)、機(jī)械等多個領(lǐng)域.用簡單的一句話來概

括就是用機(jī)器代替人眼來做各種測量和判斷.本課程有助于開闊學(xué)生

視野、使學(xué)生了解本專業(yè)的發(fā)展前沿,是集理論性與應(yīng)用性為一體的

學(xué)科.

設(shè)置本課程的目的是:使學(xué)習(xí)者在全面了解視覺技術(shù)的歷史、現(xiàn)狀與

發(fā)展趨勢的基礎(chǔ)上,系統(tǒng)掌握計(jì)算機(jī)視覺圖像基本處理的理論、方法、

技術(shù),運(yùn)用計(jì)算機(jī)視覺基本理論、實(shí)驗(yàn)裝置和圖像處理軟件,加深理

解計(jì)算機(jī)視覺的基本概念,具備在計(jì)算機(jī)上利用圖像處理軟件進(jìn)行相

關(guān)操作的實(shí)際技能,培養(yǎng)學(xué)生的動手能力和分析問題解決問題的能力,

把學(xué)生培養(yǎng)成面向二十一世紀(jì)的復(fù)合型人才.

學(xué)習(xí)木課程的要求是:學(xué)習(xí)者應(yīng)掌握計(jì)算機(jī)視覺的基礎(chǔ)理論、基木方

法和實(shí)用算法,如:二值圖像分析、圖像預(yù)處理、圖像增強(qiáng)、邊緣檢

測、圖像分割、紋理分析、明暗分析、深度圖與立體視覺.并掌握一

定的科學(xué)研究方法與技能,為有潛力成為研究型人才的學(xué)生打下一定

基礎(chǔ).

先修課程要求:MATLAB編程,空間解析幾何,數(shù)學(xué)分析,高等代數(shù).

本課程計(jì)劃72學(xué)時課堂教學(xué)+36學(xué)時實(shí)驗(yàn),3學(xué)分,每周4+2個課時.

選用教材:(美)杰恩(Jain.R)等著,計(jì)算機(jī)視覺(英文版),機(jī)械工業(yè)出

版社,2003年

教學(xué)手段:課堂講授為主,習(xí)題課,試驗(yàn)為輔

考核方法:閉卷書面考試

教學(xué)進(jìn)程安排表

周次學(xué)時數(shù)教學(xué)主要內(nèi)容教學(xué)方法備注

計(jì)算機(jī)視覺的定義,視覺系統(tǒng)所包含的部分,視覺

13所面臨的問題;計(jì)算機(jī)視覺的應(yīng)用:對圖像的簡單講課

處理,與其它學(xué)科的關(guān)系.

成像和圖像表示.介紹成像原理,成像過程產(chǎn)生的

23變形和各種感應(yīng)器,特別是CCD攝像機(jī);目前流行講課

的圖像表示技術(shù).討論圖像與空間的關(guān)系.

二值圖像處理(一).二值圖像中的拓?fù)涠x,圖像講課與習(xí)題

33

的基本算法的表示,標(biāo)志算法,物體的性質(zhì)提取.課相結(jié)合

二值圖像處理(二).形態(tài)學(xué),物體的性質(zhì)提??;閥

43講課

值化方法.

模式識別(一).基本概念,類別的表示,分類器,

53講課

決策樹.

講課與習(xí)題

63模式識別(二).Bayes分類和人工神經(jīng)網(wǎng)絡(luò).

課相結(jié)合

濾波和圖像增強(qiáng)(一).濾波和圖像增強(qiáng)的原因,灰

73講課

度值的映射(含直方圖的均衡化),小塊噪聲去除.

濾波和圖像增強(qiáng)(二).平滑處理,中值濾波器,邊

83講課

緣檢測.

濾波和圖像增強(qiáng)(三).Canny邊緣檢測,卷積,矩講課與習(xí)題

93

陣空間的基,Fouier變換.課相結(jié)合

彩色和陰影.色彩的物理性質(zhì),彩色的RGB基和其

103講課

它基表示,彩色直方圖,彩色圖像分割.

113紋理分析.紋理分析和紋理分割.講課

基于圖像內(nèi)容的圖像恢復(fù).圖像庫,圖像查詢,圖講課與習(xí)題

123

像距離和圖像數(shù)據(jù)庫的結(jié)構(gòu).課相結(jié)合

基于2D圖像序列的運(yùn)動分析(一).運(yùn)動現(xiàn)象和應(yīng)

133講課

用,運(yùn)動向量的計(jì)算.

143基于2D圖像序列的運(yùn)動分析(二).運(yùn)動點(diǎn)的路徑講課

2

計(jì)算,檢測視頻中的顯著變化.

講課與習(xí)題

153圖像分割(一).區(qū)域的確定和表示,輪廓的確定.

課相結(jié)合

圖像分割(二).對分割的擬合,確定高層次的結(jié)構(gòu),

163講課

基于運(yùn)動關(guān)聯(lián)性的分割.

2D圖像匹配(一).2D數(shù)據(jù)的配準(zhǔn),點(diǎn)的表示,仿

173講課

射映射.

2D圖像匹配(二).最好二維仿射變換,基于仿射

講課與習(xí)題

183變換的2D物體識別,基于關(guān)系匹配的2D物體識別,

課相結(jié)合

非線性變形.

基于2D圖像的3D理解(一).特征圖像,基于方

193講課

塊的直線標(biāo)記,2D圖像中的三維線索.

基于2D圖像的3D理解(二).透視成像模型,基講課與習(xí)題

203

于立體圖像的深度感知,薄棱鏡方程.課相結(jié)合

第一章緒論

一、學(xué)習(xí)目的

通過本章的學(xué)習(xí),熟練掌握計(jì)算機(jī)視覺的定義,視覺系統(tǒng)所包含的部

分,視覺所面臨的問題;計(jì)算機(jī)視覺的應(yīng)用;對圖像的簡單處理,與

其它學(xué)科的關(guān)系.緒論計(jì)劃6學(xué)時.

二、課程內(nèi)容

§1.1Marr的視覺計(jì)算理論

簡要地介紹Marr的視覺理論的基本思想及其理論框架.

§1.2計(jì)算機(jī)視覺的應(yīng)用

計(jì)算機(jī)視覺技術(shù)正廣泛地應(yīng)用于各個方面,從醫(yī)學(xué)圖像到遙感圖像,

從工業(yè)檢測到文件處理,從毫微米技術(shù)到多媒體數(shù)據(jù)庫,不一而足.可

以說,需要人類視覺的場合兒乎都需要計(jì)算機(jī)視覺.應(yīng)該指出的是,

許多人類視覺無法感知的場合,如精確定量感知、危險場景感知、不

可見物體感知等,計(jì)算機(jī)視覺更突顯其優(yōu)越性.

3

§1.3計(jì)算機(jī)視覺研究內(nèi)容與面臨的困難

計(jì)算機(jī)視覺研究可以分為如下五大研究內(nèi)容:輸入設(shè)備、低層視覺、

中層視覺、高層視覺、體系結(jié)構(gòu).識別和理解周圍場景是一件非常容

易的事,但對于機(jī)器來說,卻是一件很困難的事.

§1.4計(jì)算機(jī)視覺與其它學(xué)科領(lǐng)域的關(guān)系

與計(jì)算機(jī)視覺有關(guān)的學(xué)科有許多.本節(jié)主要討論一些與計(jì)算機(jī)視覺密

切相關(guān)的領(lǐng)域.關(guān)于計(jì)算機(jī)視覺與其它學(xué)科的關(guān)系,我們不作詳盡的

討論.

§15成像幾何基礎(chǔ)

這里我們只考慮三維空間到二維空間的兩種常用映射:透視投影變換

和正交投影變換.

三、重點(diǎn)、難點(diǎn)提示和教學(xué)手段

(―)重點(diǎn)、難點(diǎn)

1、計(jì)算機(jī)視覺研究內(nèi)容與面臨的困難;

2、計(jì)算機(jī)視覺與其它學(xué)科領(lǐng)域的關(guān)系;

3、成像幾何基礎(chǔ).

(-)教學(xué)手段

課堂講授與習(xí)題課相結(jié)合.

四、思考與練習(xí)

(注:思考與練習(xí)的形式有教師自行確定)

第二章二值圖像分析

一、學(xué)習(xí)目的

4

二值視覺系統(tǒng)的輸入一般是灰度圖像,通常使用閾值法首先將圖像變

成二值圖像,以便把物體從背景中分離出來,其中的閾值取決于照明

條件和物體的反射特性.二值圖像可用來計(jì)算特定任務(wù)中物體的幾何

和拓?fù)涮匦?,在許多應(yīng)用中,這種特性對識別物體來說是足夠的.二

值視覺系統(tǒng)已經(jīng)在光學(xué)字符識別、染色體分析和工業(yè)零件的識別中得

到了廣泛應(yīng)用.通過本章的學(xué)習(xí),熟練掌握二值圖像中的拓?fù)涠x,

圖像的基本算法的表示,標(biāo)志算法,物體的性質(zhì)提取.形態(tài)學(xué),物體

的性質(zhì)提??;閥值化方法.本章計(jì)劃6學(xué)時.

二、課程內(nèi)容

§2.1閾值

從圖像中識別代表物體的區(qū)域(或子圖像),這種對人來說是件非常

容易的事,對計(jì)算機(jī)來說卻是令人吃驚的困難.為了將物體區(qū)域同圖

像其它區(qū)域分離出來,需要首先對圖像進(jìn)行分割.把圖像劃分成區(qū)域

的過程稱為分割.

§2.2幾何特性

通過閾值化方法從圖像中檢測出物體后,下一步就要對物體進(jìn)行識別

和定位.在大多數(shù)工業(yè)應(yīng)用中,攝像機(jī)的位置和環(huán)境是已知的,因此

通過簡單的幾何知識就可以從物體的二維圖像確定出物休的三維位

置.在大多數(shù)應(yīng)用中,物體的數(shù)量不是很多,如果物體的尺寸和形狀

完全不同,則可以利用尺度和形狀特征來識別這些物體.實(shí)際上在許

多工業(yè)應(yīng)用中,經(jīng)常使用區(qū)域的一些簡單特征,如大小、位置和方向,

來確定物體的位置并識別它們.

5

§2.3投影

給定一條直線,用垂直該直線的一簇等間距直線將一幅二值圖像分割

成若干條,每一條內(nèi)像素值為1的像素個數(shù)為該條二值圖像在給定直

線上的投影(projection).

§2.4游程長度編碼

游程長度編碼(run-lengthencoding)是另一種二值圖像的簡潔表示方

法,它是用圖像像素值連續(xù)為1的個數(shù)(像素1的長度)來描述圖像.這

種編碼已被用于圖像傳輸.另外,圖像的某些性質(zhì),如物體區(qū)域面積,

也可以從游程長度編碼直接計(jì)算出來.

三、重點(diǎn)、難點(diǎn)提示和教學(xué)手段

(一)重點(diǎn)、難點(diǎn)

1、閾值;

2、幾何特性;

3、投影;

4、游程長度編碼.

(二)教學(xué)手段

課堂講授與習(xí)題課相結(jié)合.

四、思考與練習(xí)

(注:思考與練習(xí)的形式有教師自行確定)

第三章區(qū)域分析

一、學(xué)習(xí)目的

6

圖像中的區(qū)域是指相互連結(jié)的具有相似特性的一組像素.由于區(qū)域可

能對應(yīng)場景中的物體,因此,區(qū)域的檢測對于圖像解釋十分重要.一

幅圖像可能包含若干個物體,而每一個物體又可能包含對應(yīng)于物體不

同部位的若干個區(qū)域.為了精確解釋一幅圖像,首先要把一幅圖像劃

分成對應(yīng)于不同物體或物體不同部位的區(qū)域.本章計(jì)劃6學(xué)時.

二、課程內(nèi)容

§3.1區(qū)域和邊緣

圖像區(qū)域劃分有兩種方法:一種是基于區(qū)域的方法,另一種是使用邊

緣檢測的輪廓預(yù)估方法.

§3.2分割

把一幅灰度圖像轉(zhuǎn)換成二值圖像是圖像分割的最簡單形式.用于求取

二值圖像的閾值算法可以推廣到求取多值圖像,其中的閾值算法已經(jīng)

在第三章中討論過了.為了在各種變化的場景中都能得到魯棒的圖像

分割,閾值分割算法應(yīng)能根據(jù)圖像強(qiáng)度取樣來自動選取合適的閾

值.閾值分割法不要過分依賴于物體的灰度知識,且使用有關(guān)灰度值

的相對特性來選取合適的閾值.

§3.3區(qū)域表示

區(qū)域有許多應(yīng)用,也有許多種表示方法.不同的表示方法有著不同的

應(yīng)用.一些應(yīng)用只需計(jì)算單個區(qū)域,而另一些則需要計(jì)算圖像各區(qū)域

的關(guān)系.本節(jié)將討論幾種區(qū)域表示方法并研究它們的特性.大多數(shù)區(qū)

域表示方法可以歸納為下面三種類型:陣列表示,層級表示,基于特

征的區(qū)域表示.

7

§3.4分裂和合并

使用分裂和合并的組合算法可以實(shí)現(xiàn)自動細(xì)化分割運(yùn)算.分裂和合并

運(yùn)算是通過合并屬于同一物體的鄰接區(qū)域來消除錯誤的邊界和虛假

的區(qū)域,同時可以通過分裂屬于不同物體的區(qū)域來增添丟失的邊界.

§3.5區(qū)域增長

尋找初始區(qū)域核,并從區(qū)域核開始,逐漸增長核區(qū)域,形成滿足一定

約束的較大的區(qū)域.例如,一致性謂詞是基于區(qū)域灰度的平面或二次

曲面函數(shù)擬合.然而,在一般情況下,一致性謂詞是基于圖像區(qū)域的

特征,如,平均強(qiáng)度、方差、紋理和顏色等.

三、重點(diǎn)、難點(diǎn)提示和教學(xué)手段

(一)重點(diǎn)、難點(diǎn)

1、分割;

2、區(qū)域表示;

3、分裂和合并;

4、區(qū)域增長.

(二)教學(xué)手段

課堂講授與習(xí)題課相結(jié)合

四、思考與練習(xí)

(注:思考與練習(xí)的形式有教師自行確定)

第四章圖像預(yù)處理

一、學(xué)習(xí)目的

8

通過本章的學(xué)習(xí),熟練掌握圖像增強(qiáng)技術(shù)的兩種方法:空間域法云口頻

率域法.空間域方法主要是在空間域內(nèi)對圖像像素直接運(yùn)算處理,頻

率域方法就是在圖像的某種變換域,對圖像的變換值進(jìn)行運(yùn)算,如先

對圖像進(jìn)行傅立葉變換,再對圖像的頻譜進(jìn)行某種計(jì)算(如濾波等),

最后將計(jì)算后的圖像逆變換到空間域.本章計(jì)劃9學(xué)時.

二、課程內(nèi)容

§4.1直方圖修正

直方圖均衡化是一種通過重新均勻地分布各灰度值來增強(qiáng)圖像對比

度的方法.經(jīng)過直方圖均衡化的圖像對二值化閾值選取十分有利.一

般來說,直方圖修正能提高圖像的主觀質(zhì)量,因此在處理藝術(shù)圖像時

非常有用.

§4.2圖像線性運(yùn)算

熟練掌握線性系統(tǒng)和傅立葉變換.

§4.3線性濾波器

熟練掌握均值濾波器,高斯平滑濾波.

§4.4非線性濾波

熟練掌握中值濾波,邊緣保持濾波器.

三、重點(diǎn)、難點(diǎn)提示和教學(xué)手段

(一)重點(diǎn)、難點(diǎn)

1、直方圖修正.

2、圖像線性運(yùn)算,線性系統(tǒng)和傅立葉變換.

3、線性濾波器,均值濾波器,高斯平滑濾波.

9

4、非線性濾波,中值濾波,邊緣保持濾波器.

(二)教學(xué)手段

課堂講授與習(xí)題課相結(jié)合,計(jì)算機(jī)試驗(yàn).

四、思考與練習(xí)

(注:思考與練習(xí)的形式有教師自行確定)

第五章邊緣檢測

一、學(xué)習(xí)目的

邊緣(edge)是指圖像局部強(qiáng)度變化最顯著的部分.邊緣主要存在于目

標(biāo)與目標(biāo)、目標(biāo)與背景、區(qū)域與區(qū)域(包括不同色彩)之間,是圖像分

割、紋理特征和形狀特征等圖像分析的重要基礎(chǔ).圖像分析和理解的

第一步常常是邊緣檢測(edgedetection).本章計(jì)劃9學(xué)時.

二、課程內(nèi)容

§5.1梯度

邊緣檢測是檢測圖像局部顯著變化的最基本運(yùn)算.在一維情況下,階

躍邊緣同圖像的一階導(dǎo)數(shù)局部峰值有關(guān).梯度是函數(shù)變化的一種度量,

而一幅圖像可以看作是圖像強(qiáng)度連續(xù)函數(shù)的取樣點(diǎn)陣列.因此,同一

維情況類似,圖像灰度值的顯著變化可用梯度的離散逼近函數(shù)來檢測.

§5.2邊緣檢測算法

熟練掌握邊緣檢測算法有如下四個步驟:濾波,增強(qiáng),檢測,定位.熟

練掌握Roberts算子、Sobel算子、Prewitt算子.

§5.3二階微分算子

10

熟練掌握二階導(dǎo)數(shù)有兩種算子:拉普拉斯算子和二階方向?qū)?shù).

§5.4LOG算法

將高斯濾波和拉普拉斯邊緣檢測結(jié)合在一起,形成LOG(Laplacianof

Gaussian,LOG)算法,也稱之為拉普拉斯高斯算法.了解LOG邊緣

檢測器的基本特征.

§

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論