版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1.1多媒體的基本概念1.2音d頻信息處理基礎(chǔ)1.3圖像信息處理基第1章多媒體信息處理基礎(chǔ)1.1.1媒體的概念1.1.2多媒體與多媒體技術(shù)1.1多媒體的基本概念1.媒體(medium)按傳統(tǒng)的說法,媒體指的是信息的載體,如:報紙、雜志、電視、廣播、因特網(wǎng)…在計算機領(lǐng)域有兩種含義:信息的存儲實體,如磁盤、光盤、磁帶、半導(dǎo)體存儲器等,中文常譯為媒質(zhì)或媒介;傳遞信息的基本元素,如文字、聲音、圖形、動畫和圖像等。1.1.1媒體的概念2.媒體的分類國際電話電報咨詢委員會(CCITT)把媒體分成如下5類。(1)感知媒體(PerceptionMedium)感知媒體就是指能直接作用于人的感覺器官,使人直接產(chǎn)生感覺(視、聽、嗅、味、觸覺)的一類媒體,如語言、音樂、圖形、動畫、數(shù)據(jù)、文字、文件等都是感知媒體。(2)表示媒體(RepresentationMedium)表示媒體是為了更有效地加工、處理和傳輸感知媒體而人為研究和構(gòu)造出來的一種媒體。它包括上述感知媒體的各種編碼,諸如語言編碼、靜止和活動圖像編碼,以及文本編碼等。1.1.1媒體的概念(3)呈現(xiàn)媒體(PresentationMedium)呈現(xiàn)媒體是感知媒體與用于通信的電信號之間在轉(zhuǎn)換中用于信息輸入和輸出的媒體??煞譃檩斎氤尸F(xiàn)媒體(如鍵盤、攝像機、話筒、掃描儀等)和輸出呈現(xiàn)媒體(如顯示器、揚聲器、打印機等)兩種。(4)存儲媒體(StorageMedium)存儲媒體用于存儲表示媒體,即存放感知媒體數(shù)字化后的代碼的媒體稱為存儲媒體,如磁盤、光盤、磁帶、半導(dǎo)體存儲器等。(5)傳輸媒體(TransmissionMedium)傳輸媒體是指用來將表示媒體從一處傳遞到另一處的物理傳輸介質(zhì),如同軸電纜、雙絞線、光纖及其他通信信道。1.1.1媒體的概念
在多媒體技術(shù)中所說的媒體一般指感知媒體。常見的感知媒體包括:(1)視覺媒體:圖像、圖形、符號、視頻、動畫等。(2)聽覺媒體:聲音、語音、音樂和音響。(3)觸覺媒體:通過直接或間接與人體接觸,使人能感覺到對象的位置、大小、方向、方位、質(zhì)地等性質(zhì)。
1.1.1媒體的概念1.多媒體關(guān)于多媒體(Multimedium)的定義或說法多種多樣,從不同的角度出發(fā)對多媒體給出了不同的描述,目前仍沒有統(tǒng)一的標(biāo)準(zhǔn)。通常所說的多媒體就是各種媒體的綜合,也就是聲音、圖像、動畫、視頻、文本等各種媒體的綜合?!岸嗝襟w”常被當(dāng)作“多媒體技術(shù)”的同義詞。2.多媒體技術(shù)多媒體技術(shù)就是利用計算機技術(shù)把文本、圖像、圖形、動畫、音頻及視頻等多種媒體有機地集成起來,使人們能以更加自然的方式使用信息,并與計算機進行交互,且使表現(xiàn)的信息圖、文、聲并茂。簡言之,多媒體技術(shù)就是計算機綜合處理聲、文、圖信息的技術(shù),具有集成性、實時性和交互性。1.1.2多媒體與多媒體技術(shù)1.2.1聲音的基本特性1.2.2聲音的主觀感覺1.2.3音頻信號的數(shù)字化
1.2音頻信息處理基礎(chǔ)聲音是機械振動或氣流振動引起周圍傳播媒質(zhì)(氣體、液體、固體等)發(fā)生波動的現(xiàn)象,通常將產(chǎn)生聲音的發(fā)聲體稱為聲源。當(dāng)聲源產(chǎn)生振動時,引起鄰近空氣的振動。這樣空氣就隨著聲源體所振動幅度的不同,而產(chǎn)生密或稀的振動,空氣的這種振動被稱為聲波。聲波可以用一條連續(xù)的曲線來表示,它可以分解成一系列正弦波的線性疊加。1.2.1聲音的基本特性1.頻率單位時間內(nèi)信號振動的次數(shù),單位是赫茲(Hz)。聲音的音調(diào)由頻率決定。聲音尖細(xì)表示頻率高,聲音低粗表示頻率低。1.2.1聲音的基本特性次聲波音頻信號超聲波<20Hz20~20000Hz>20000Hz聲音信號按頻率劃分:2.頻譜
聲音信號按頻率成分組成來分,可分為:純音:頻率單一、振幅隨時間按正弦函數(shù)規(guī)律變化的聲音復(fù)音:由不同頻率和不同振幅的聲波組合而成的聲音基音:復(fù)音中頻率最低的成分(分音)諧音:復(fù)音中頻率與基音成整數(shù)倍的分音聲音的頻譜結(jié)構(gòu)是用基音、諧音數(shù)目、各諧音振幅大小及相位關(guān)系來描述的。聲音的音色就是由其頻譜成分決定的。1.2.1聲音的基本特性聲壓由聲波引起的交變壓強稱為聲壓,一般用P表示,單位是帕(Pa)。聲壓的大小反映了聲音振動的強弱,同時也決定了聲波的幅度大小。聲壓級
用聲壓的相對大小(稱聲壓級或聲強)來表示聲壓的強弱。聲壓級用符號SPL
表示,單位是分貝(dB):
式中,P為聲壓有效值;Pref為參考聲壓,一般取Pa,這個數(shù)值是人耳所能聽到的1kHz聲音的最低聲壓,低于這一聲壓,人耳就無法覺察出聲波的存在了。3.聲壓及聲壓級
1.2.1聲音的基本特性
人對聲音的感知有響度、音調(diào)和音色三個主觀聽感要素。響度:與聲波振動的幅度有關(guān)音調(diào):取決于聲波的基音頻率音色:由聲波的的頻譜成分決定1.2.2聲音的主觀感覺1.響度:是人耳對聲音強弱的主觀感覺程度。在客觀的度量中,聲音的強弱是由聲波的振幅(聲壓)決定的。但響度與聲波的振幅并不完全一致。響度不僅取決于振幅的大小,還取決于頻率的高低。響度用符號N表示,單位是宋(sone)。國際上規(guī)定,頻率為1kHz的純音在聲壓級為40dB時的響度為1宋(sone)。另外,響度的大小與距聲源的距離有關(guān),同一聲音離聲源越近,響度越大。
1.2.2聲音的主觀感覺2.響度級:人耳對聲音強弱的主觀感覺還可以用響度級來表示。響度級的單位為方(phon)。規(guī)定1kHz純音聲壓級的分貝數(shù)定義為響度級的數(shù)值。響度/sone1248163264128256聲壓級/dB405060708090100110120響度級/phon405060708090100110120表1-1聲壓級與響度、響度級的關(guān)系1.2.2聲音的主觀感覺3.聽閾與痛閾聽閾:當(dāng)聲音減弱到人耳剛剛可以聽見時,此時的聲音強度稱為最小可聽閾值,簡稱為“聽閾”或“聞閾”。一般以1kHz純音為準(zhǔn)進行測量,人耳剛能聽到的聲壓級為0dB(通常大于0.3dB即有感受)。痛閾:當(dāng)聲音增強到使人耳感到疼痛時,這個聽覺閾值稱為“痛閾”。仍以1kHz純音為準(zhǔn)來進行測量,使人耳感到疼痛時的聲壓級約達到130~140dB左右。1.2.2聲音的主觀感覺4.音調(diào)音調(diào)也稱音高,表示人耳對聲音調(diào)子高低的主觀感受。聲音越低沉,音調(diào)越低;聲音越尖細(xì),音調(diào)越高。音調(diào)的高低是由發(fā)聲體振動的頻率決定的,頻率越高,音調(diào)越高;頻率越低,音調(diào)越低。物體的振動頻率與發(fā)聲體的結(jié)構(gòu)有關(guān),一般而言,大而長的物體振動頻率低,小而短的物體振動頻率高;物體繃得越緊,振動頻率越高;物體越薄、越細(xì),振動頻率越高。音調(diào)單位是“美(Mel)”。頻率為1kHz、聲壓級為40dB的純音所產(chǎn)生的音調(diào)就定義為1Mel。音調(diào)大體上與頻率的對數(shù)成正比。1.2.2聲音的主觀感覺聲音信號是典型的連續(xù)信號,不僅在時間上是連續(xù)的,而且在幅度上也是連續(xù)的。數(shù)字化實際上就是對模擬信號進行采樣、量化和編碼。模/數(shù)轉(zhuǎn)換1101110011001101把聲音(模擬量)按照固定時間間隔,轉(zhuǎn)換成有限個數(shù)字表示的離散序列1.2.3音頻信號的數(shù)字化采樣(Sampling):每隔一定的時間間隔,抽取信號的一個瞬時幅度值(樣本值),即在時間上將模擬信號進行離散化。采樣后所得到的一系列在時間上離散的樣本值稱為樣值序列。1.2.3音頻信號的數(shù)字化量化(Quantization):對每個樣值的連續(xù)幅度進行離散化,即用有限個幅度值近似原來連續(xù)變化的幅度值,把模擬信號的連續(xù)幅度變?yōu)橛邢迶?shù)量、有一定間隔的離散值。均勻量化(線性量化):量化器的每個量化間隔都相等,量化電平取各量化區(qū)間的中間值。非均勻量化(非線性量化):量化器的各個量化間隔是不相等的。1.2.3音頻信號的數(shù)字化編碼(Encoding):采樣、量化后的信號還不是數(shù)字信號,需要把它轉(zhuǎn)換成數(shù)字編碼脈沖,這一過程稱為編碼。最簡單的編碼方式是二進制編碼。具體說來,就是用n比特二進制碼來表示已經(jīng)量化了的樣值,每個二進制數(shù)對應(yīng)一個量化電平,然后把它們排列,得到由二值脈沖組成的數(shù)字信息流。1.2.3音頻信號的數(shù)字化1.2.4人耳聽覺效應(yīng)人耳的聽覺系統(tǒng)人耳聽覺的特性1)掩蔽效應(yīng)2)雙耳效應(yīng)3)顱骨效應(yīng)4)雞尾酒會效應(yīng)5)回音壁效應(yīng)6)多普勒效應(yīng)7)哈斯效應(yīng)1.2.5音頻信號質(zhì)量評價頻帶寬度動態(tài)范圍信噪比主觀度量法表格1-1聲音質(zhì)量和數(shù)據(jù)率質(zhì)量采樣頻率(kHz)樣本精度(b/s)聲道數(shù)數(shù)據(jù)率(kb/s)頻率范圍(Hz)頻寬(kHz)電話88單聲道64200~34003.2AM11.0258單聲道88.250~70007FM22.0516立體聲705.620~1500015CD44.116立體聲1411.220~2000020DAT4816立體聲1536.020~2000020
表格1-2幾種音頻業(yè)務(wù)的動態(tài)范圍音頻效果AMFM數(shù)字電話CD、DAT動態(tài)范圍(dB)4060501001.1多媒體的基本概念1.2音頻信息處理基礎(chǔ)1.3圖像信息處理基礎(chǔ)第1章多媒體信息處理基礎(chǔ)1.3.1圖像信號的數(shù)字化
1.3.2三基色原理1.3.3典型的顏色空間模型及轉(zhuǎn)換關(guān)系1.3圖像信息處理基礎(chǔ)
彩色圖像信號一般表示為式中,x、y、z
表示空間某個點的坐標(biāo);λ為光的波長;t為時間軸坐標(biāo)。當(dāng)
t=t0(常數(shù))時,則表示靜態(tài)圖像;當(dāng)
z=z0
(常數(shù))時,則表示二維圖像;當(dāng)λ=λ0(常數(shù))時,則表示單色圖像。由三基色原理知,其中
1.3.1圖像信號的數(shù)字化1.圖像信號的表示1.3.1圖像信號的數(shù)字化2.圖像信號的采樣圖像采樣就是將二維空間上模擬的連續(xù)亮度(即灰度)或彩色信息,轉(zhuǎn)化為一系列有限的離散數(shù)值來表示。采樣就是對圖像在水平方向和垂直方向上進行等間隔的采樣,每個采樣點組成圖像的基本單位,稱為像素(pixel)。在進行采樣時,采樣點間隔的選取是一個重要的問題,它決定了采樣后的圖像是否能真實地反映原圖像的程度。一般來說,采樣間隔越大,所得圖像像素數(shù)越少,空間分辨率低,圖像質(zhì)量差,嚴(yán)重時出現(xiàn)馬賽克效應(yīng);采樣間隔越小,所得圖像像素數(shù)越多,空間分辨率高,圖像質(zhì)量好,但數(shù)據(jù)量大。(a)256×256(b)128×128(c)32×32(d)16×16
采樣點數(shù)與圖像質(zhì)量之間的關(guān)系1.3.1圖像信號的數(shù)字化模擬圖像經(jīng)過采樣后,在時間和空間上離散化為像素。
p.s.采樣所得的像素值(灰度級)仍是一個有無窮多個取值的連續(xù)量。量化是指將具有無限多個取值的樣值用有限個離散值來表示的過程。3.圖像信號的量化1.3.1圖像信號的數(shù)字化
用有限個離散灰度值表示無窮多個連續(xù)灰度的量必然引起誤差,稱為量化誤差,有時也稱為量化噪聲。量化分層越多,則量化誤差越小。對于不同的圖像,量化方法分為兩種:等間隔量化(均勻量化或線性量化)非等間隔量化
等間隔量化就是簡單地把采樣值的灰度范圍等間隔地分割并進行量化。對于像素灰度級在黑-白范圍分布較均勻的圖像,這種量化方法可以得到較小的量化誤差。1.3.1圖像信號的數(shù)字化一幅圖像在采樣時,行、列的采樣點與量化時每個像素量化的級數(shù),既影響數(shù)字圖像的質(zhì)量,也影響到該數(shù)字圖像數(shù)據(jù)量的大小。假定圖像取M×N個采樣點,每個像素量化后的灰度二進制位數(shù)為Q,一般Q總是取為2的整數(shù)冪,即Q=2k,則存儲一幅數(shù)字圖像所需的字節(jié)數(shù)B為4.采樣與量化精度對圖像質(zhì)量的影響
1.3.1圖像信號的數(shù)字化對一幅圖像,當(dāng)量化級數(shù)Q一定時,采樣點數(shù)M×N對圖像質(zhì)量有著顯著的影響。采樣點數(shù)越多,圖像質(zhì)量越好;當(dāng)采樣點數(shù)減少時,圖上的塊狀效應(yīng)就逐漸明顯。(a)256×256(b)128×128(c)32×32(d)16×16
采樣點數(shù)與圖像質(zhì)量之間的關(guān)系1.3.1圖像信號的數(shù)字化當(dāng)圖像的采樣點數(shù)一定時,采用不同量化級數(shù)的圖像質(zhì)量也不一樣。量化級數(shù)越多,所得圖像層次越豐富,圖像質(zhì)量越好,但數(shù)據(jù)量大;量化級數(shù)越少,圖像層次欠豐富,圖像質(zhì)量越差,會出現(xiàn)假輪廓現(xiàn)象,但數(shù)據(jù)量小。量化級數(shù)最小的極端情況就是二值圖像(即非黑即白,灰度級沒有中間過渡的圖像)。1.3.1圖像信號的數(shù)字化
從數(shù)字圖像的獲取過程可以知道,一幅采樣圖像由M(行)、N(列)個采樣點組成,每個采樣點(像素)是組成圖像的基本單位。黑白圖像的像素只有1個亮度值,彩色圖像的像素是矢量,它由多個彩色分量組成,一般有3個分量:R(紅)、G(綠)、B(藍),因此,采樣圖像在計算機中的表示方法是:單色圖像用一個矩陣來表示;彩色圖像用一組(一般是3個)矩陣來表示,矩陣的行數(shù)稱為圖像的垂直分辨率,列數(shù)稱為圖像的水平分辨率,矩陣中的元素是像素顏色分量的亮度值,使用整數(shù)表示。1.3.1圖像信號的數(shù)字化
一幅M×N的數(shù)字圖像可用矩陣表示為
數(shù)字圖像中的每個像素都對應(yīng)于矩陣中相應(yīng)的元素。把數(shù)字圖像表示成矩陣的優(yōu)點在于,能應(yīng)用矩陣?yán)碚搶D像進行分析處理。數(shù)字圖像的表示1.3.1圖像信號的數(shù)字化
(a)256級灰度圖象(b)子圖(c)子圖對應(yīng)的量化數(shù)據(jù)
數(shù)字圖像實例1.3.1圖像信號的數(shù)字化1.3.2三基色原理三種基色必須是相互獨立的,即任一種基色都不能由其他兩種基色混合得到。自然界中絕大多數(shù)的彩色可以分解為三基色,三基色按一定比例混合,可得到自然界中絕大多數(shù)彩色?;旌仙纳{(diào)和飽和度由三基色的混合比例決定,混合色的亮度等于三種基色亮度之和。1.RGB顏色空間模型在RGB模型中,顏色空間里所有的顏色都是由R、G、B
(紅、綠、藍)三種光依不同的比例相加而成。RGB的每一色光,含有亮度成分,例如R的成分越多,表示越紅越亮。各色光混合后,會比原來單獨的色光還亮,稱為相加混色;適合在以主動光源顯示影像的場合使用,如電視、電腦、投影等。1.3.3典型的顏色空間模型及轉(zhuǎn)換綠(0,1,0)青(0,1,1)黃(1,1,0)黑(0,0,0)藍(0,0,1)品紅(1,0,1)白(1,1,1)紅(1,0,0)1.3.3典型的顏色空間模型及轉(zhuǎn)換相加混色RGB顏色000黑001藍010綠011青100紅101品紅110黃111白2.CMY/CMYK顏色空間模型在彩色印刷、彩色膠片和繪畫中的混色采用相減混色。彩色印刷或彩色打印的紙張是不能發(fā)射光線的,因而印刷機或彩色打印機就只能使用一些能夠吸收特定的光波而反射其他光波的油墨或顏料。任何一種由顏料呈現(xiàn)的顏色都可以用青(Cyan)、品紅(Magenta)和黃(Yellow)這三種基色按不同的比例混合而成,我們稱這種顏色空間為CMY顏色空間。由于彩色墨水和顏料的化學(xué)特性,用等量的CMY三基色得到的黑色不是真正的黑色,因此在印刷術(shù)中常加一種真正的黑色墨水(BlackInk),于是CMY顏色空間也稱為CMYK顏色空間。1.3.3典型的顏色空間模型及轉(zhuǎn)換CYMRGB相減混色C(青色)M(品紅)Y(黃色)顏色000白001黃010品紅011紅100青101綠110藍111黑YUV是PAL制彩色電視系統(tǒng)所采用的一種顏色空間模型,其中Y表示亮度,U表示藍色色差(即B-Y),V代表紅色色差(R-Y)。
采用YUV色彩空間的重要性:亮度信號Y和色度信號U、V是分離的,解決彩色電視和黑白電視兼容的問題??梢岳萌搜蹖Σ噬拿舾卸鹊陀趯α炼鹊拿舾卸鹊囊曈X特性,用較窄的頻帶傳送U、V信號,優(yōu)化彩色電視信號的傳輸。3.YUV顏色空間模型1.3.3典型的顏色空間模型及轉(zhuǎn)換
YIQ顏色空間是由YUV推導(dǎo)而來,是NTSC制彩色電視系統(tǒng)所采用的一種顏色空間模型;I代表“同相”,Q代表“正交”:指的是用于發(fā)射顏色信息的調(diào)制方法;I、Q是通過將U、V軸逆時針旋轉(zhuǎn)33度獲得的。4.YIQ顏色空間模型1.3.3典型的顏色空間模型及轉(zhuǎn)換由人眼彩色視覺的特性表明,人眼分辨紅、黃之間顏色變化的能力最強,而分辨藍、紫之間顏色變化的能力最弱。I對應(yīng)于人眼最敏感的色度,而Q對應(yīng)于人眼最不敏感的色度。這樣,傳送Q可以用較窄的頻帶,而傳送分辨率較強的I信號時,可以用較寬的頻帶。1.3.3典型的顏色空間模型及轉(zhuǎn)換由YUV顏色空間派生的一種顏色空間模型。主要用于數(shù)字電視系統(tǒng),是YUV顏色空間的縮放和偏移版本。5.YCbCr顏色空間模型1.3.3典型的顏色空間模型及轉(zhuǎn)換第二章
數(shù)字音頻處理2.1數(shù)字音頻數(shù)字化和預(yù)處理語音信號是一個非穩(wěn)態(tài)的、時變的信號帶寬約5KHz,主要能量聚集在低頻段??傮w為非平穩(wěn)時變信號。但在10~30ms的短時間范圍內(nèi)可以認(rèn)為語音信號是穩(wěn)態(tài)的、時不變的。說話的聲音可以分為清音和濁音濁音:聲帶振動,時域上有明顯的周期性,其短時能量大,短時平均幅度大,短時過零率低;清音:聲帶不震動,其短時能量小,短時平均幅度小,短時過零率高。2.1數(shù)字音頻數(shù)字化和預(yù)處理在按幀進行語音分析、提取語音參數(shù)之前,必須進行語音信號的數(shù)字化和預(yù)處理。語音信號的數(shù)字化一般包括放大及增益控制、反混疊濾波、采樣、A/D轉(zhuǎn)換及編碼。預(yù)處理包括預(yù)加重、加窗和分幀。2.2語音信號分析語音特性和人耳感知特性語音特征:任何語言的語音都有元音和輔音兩種音素。人耳感知特性:人耳對于聲波頻率高低的感覺于實際頻率的高低不呈現(xiàn)關(guān)系,人耳對語音信號的幅度譜較為敏感,對相位不敏感2.2語音信號分析語音信號的時域分析短時能量和短時平均幅度短時過零率--一幀語音信號波形穿過橫軸的次數(shù)短時相關(guān)--用于測定兩個信號的時域相似性2.2語音信號分析語音信號的頻域分析語音短時譜:通過傅里葉變換可以變換到頻域;但是無時域信息,無法看到時頻關(guān)系。語譜圖:從語譜圖中可以看出基頻、共振峰隨時間變化的過程2.2語音信號分析語譜圖不同的窗長同時得到兩種語譜圖,分別為寬帶語譜圖及窄帶語譜圖。寬帶語譜圖:高時間分辨率,寬帶300Hz帶通濾波器,語音的共振峰頻率及清輔音的能量匯集區(qū)窄帶語譜圖:高頻率分辨率,窄帶為45Hz帶通濾波器,時間坐標(biāo)方向表示基音及各次諧波;而寬帶聲譜圖給出2.2語音信號分析梅爾譜和梅爾倒譜(b)等高梅爾濾波器(a)等面積梅爾濾波器2.3語音增強噪聲特性沖激噪聲:時域波形類似沖激函數(shù)的窄脈沖-->閾值時域剔除周期噪聲:離散的窄譜-->陷波器方法濾除寬帶噪聲:噪聲頻譜普遍分布于語音信號頻譜-->非線性處理方法語音干擾:干擾語音信號和待傳語音信號同時在一個信道中-->梳狀濾波器提取基音和各次諧波后再恢復(fù)傳輸噪聲:電路噪聲,時域內(nèi)是語音和噪聲的卷積-->同態(tài)處理的方法,非加性噪聲變換為加性噪聲2.3語音增強濾波器法固定濾波器在干擾平穩(wěn)情況下,周期性噪聲可采用固定濾波器法。自適應(yīng)濾波器:最重要的特性是能有效地在未知環(huán)境下中跟蹤時變的輸入信號,使輸出信號達到最優(yōu)濾波器系數(shù)用最小均方誤差(LeastMeanSquare,LMS)準(zhǔn)則估計2.3語音增強基于相關(guān)特性的語音增強減譜法:在假定加性噪聲與短時平穩(wěn)的語音信號相互獨立的條件下,從帶噪語音的功率譜中減去噪聲功率譜,從而得到較為純凈的語音頻譜。基于維納濾波的語音增強:若語音為平穩(wěn)過程,則維納濾波對應(yīng)時域的最小均方差估計基于信號子空間分解的語音增強:將帶噪語音信號映射到兩個正交的子空間中-->一個是信號子空間,其主要部分是語音信號;另一個是噪聲子空間,只包含噪聲。再用信號子空間中的語音信號分量重構(gòu)原始語音信號。3.1引言3.2圖像的灰度變換3.3圖像平滑3.4圖像銳化3.5圖像的同態(tài)濾波第3章圖像增強圖像增強:
根據(jù)一定的要求將圖像中感興趣的部分加以處理或突出有用的圖像特征(如邊緣、輪廓、對比度等),抑制不需要的信息,以改善圖像的主觀視覺效果或便于后續(xù)的圖像分析和識別。圖像復(fù)原:
針對圖像降質(zhì)的具體原因,設(shè)法補償降質(zhì)因素,從而使改善后的圖像盡可能地逼近原始圖像。改善降質(zhì)圖像(退化圖像)的方法:3.1引言
(1)空間域法:是在空間域內(nèi)直接對圖像的像素值進行運算操作。點運算處理法:是指直接對圖像的各像素點逐一進行灰度變換的處理方法。例如,圖像的灰度變換、直方圖修正等都采用點運算處理法。鄰域運算處理法:是對圖像像素的某一鄰域進行處理的方法。例如,圖像平滑、圖像銳化等都采用鄰域運算處理法。
圖像增強算法分類圖像增強算法分類(2)頻率域法:在頻率域上對圖像的變換系數(shù)進行處理,增強感興趣的頻率分量,然后再進行反變換到空間域,得到增強后的圖像。常用的方法包括低通濾波、高通濾波以及同態(tài)濾波等。3.2灰度的線性變換
假定原圖像f(x,y)的灰度范圍為[a,b],變換后圖像g(x,y)的灰度范圍擴為[c,d],則采用線性變換:
灰度的線性變換(a)原圖像(b)變換后的圖像
若圖像灰度在[0,Mf]
范圍內(nèi),其中大部分像素的灰度級分布在區(qū)間[a,b],很小部分的灰度級超出了此區(qū)間,為改善增強的效果,可令3.2灰度的線性變換
為了突出感興趣的目標(biāo)或灰度區(qū)間,相對抑制那些不感興趣的灰度區(qū)域,可采用分段線性變換,如常用的三段線性變換法。分段線性變換3.2灰度的線性變換采用非線性變換函數(shù)(例如對數(shù)函數(shù)、冪指數(shù)函數(shù)等)
對數(shù)變換式
a、b、c是調(diào)整曲線的位置和形狀的參數(shù)。指數(shù)變換式
a、b、c
是調(diào)整曲線的位置和形狀的參數(shù)。3.2灰度的非線性變換3.3直方圖修正1.直方圖的概念如果將圖像中像素亮度(灰度級)看成是一個隨機變量,則其分布情況就反映了圖像的統(tǒng)計特性?;叶戎狈綀D是灰度級的函數(shù),它表示圖像中具有某種灰度級的像素的個數(shù),反映了圖像中每種灰度級出現(xiàn)的概率。
圖像的灰度直方圖2.直方圖的概念3.3直方圖修正設(shè)圖像總像素個數(shù)為n,共有L
級灰度,rk
為圖像的第k級灰度值,并且具有灰度級rk
的像素數(shù)為nk,則:2.灰度直方圖的定義3.3直方圖修正(1)直方圖是一幅圖像中各像素灰度值出現(xiàn)的頻數(shù)的統(tǒng)計結(jié)果,它只反映該圖像中不同灰度值出現(xiàn)的次數(shù),而未反映某一灰度值像素所在的位置。(2)任一幅圖像,都能唯一地確定出一幅與它對應(yīng)的直方圖,但不同的圖像,可能有相同的直方圖。(3)如果一幅圖像由兩個不連續(xù)的區(qū)域組成,并且每個區(qū)域的直方圖已知,則整幅圖像的直方圖是這兩個區(qū)域的直方圖之和。3.直方圖的性質(zhì)圖像與直方圖間的多對一關(guān)系直方圖均衡化:將原圖像的直方圖通過變換函數(shù)修正為均勻的直方圖,從而增加像素灰度值的動態(tài)范圍,達到增強圖像整體對比度的效果。直方圖均衡化后,圖像的直方圖是平直的,即各灰度級具有相同的出現(xiàn)頻數(shù),那么由于灰度級具有均勻的概率分布,圖像看起來就更清晰了。4.直方圖均衡化霧、霾等惡劣天氣對比度下降清晰度下降顏色改變
圖片質(zhì)量下降是否有消除輕度霧霾的方法3.3直方圖修正02004006008001000050100150200250偏灰偏白,灰度值集中分布100~2553.3直方圖修正75
變換函數(shù)s=T(r)在0≤r≤1中,T(r)是單調(diào)遞增函數(shù),且0≤T(r)≤1;反變換r=T-1(s),T-1(s)也為單調(diào)遞增函數(shù),0≤s≤1。r1rkssk1s=T(r)r1rkssk13.3直方圖修正76假設(shè)連續(xù)隨機變量r的概率密度函數(shù)為p(r),且變換函數(shù)s=T(r),變換后的圖像灰度級概率密度函數(shù)上限積分導(dǎo)數(shù),
變換函數(shù)=原圖像累積積分原圖像累積積分
概率密度均勻化3.3直方圖修正為使變換后的灰度仍保持從黑到白的單一變化順序,且變換范圍與原先一致,以避免整體變亮或變暗。必須規(guī)定:(1)在0≤r≤1中,T(r)是單調(diào)遞增函數(shù),且0≤T(r)≤1;(2)反變換r=T-1(s),T-1(s)也為單調(diào)遞增函數(shù),0≤s≤1。
用累計分布函數(shù)(CumulativeDistributionFunction,CDF)作為灰度變換函數(shù)s=T(r),
從而將原始圖像的關(guān)于灰度r
的分布直方圖,轉(zhuǎn)換為關(guān)于灰度s
的均勻分布。3.3直方圖修正78-0.200.20.40.60.811.201234567歸一化灰度級概率灰度值r的概率密度函數(shù)為p(r)變換函數(shù)3.3直方圖修正79直方圖修正步驟-0.200.20.40.60.811.201234567歸一化灰度級概率歸一化灰度級,并求灰度級rk的概率密度函數(shù),累計積分-0.200.20.40.60.811.200.10.20.30.40.50.60.70.80.91歸一化灰度級累積積分3.3直方圖修正80-0.200.20.40.60.811.21-0.200.20.40.60.811.201234567歸一化灰度級概率按照近似原則,sk轉(zhuǎn)化為標(biāo)準(zhǔn)灰度級求新圖像的各灰度級的像素數(shù)目求新圖像中各灰度級的分布概率3.3直方圖修正
s012345678910ps(s)1/72/73/74/75/76/77/7步驟81均衡前直方圖均衡后直方圖修正后灰度值均勻分布-0.200.20.40.60.811.201234567歸一化灰度級概率s012345678910ps(s)1/72/73/74/75/76/77/73.3直方圖修正直方圖均衡化的實現(xiàn)步驟1.統(tǒng)計原始圖像的直方圖: 其中,是歸一化的輸入圖像灰度級。2.計算直方圖累積分布曲線3.用累積分布函數(shù)作變換函數(shù)進行圖像灰度變換:根據(jù)計算得到的累積分布函數(shù),建立輸入圖像與輸出圖像灰度級之間的對應(yīng)關(guān)系,即重新定位累計分布函數(shù)(與歸一化灰度等級比較,尋找最接近的一個作為原灰度級k變換后的新灰度級)。84修正后對比05001000150005010015020025085修正后對比—灰度圖3.3圖像平滑3.2.1模板操作和卷積運算
模板操作實現(xiàn)了一種鄰域運算,即某個像素點的運算結(jié)果不僅與本像素灰度有關(guān),而且與其鄰域點的值有關(guān)。模板操作的數(shù)學(xué)含義是卷積(或互相關(guān))運算。常用的模板有:建立一個含有由系數(shù)矩陣或權(quán)重因子矩陣構(gòu)成的移動窗口。這些矩陣被認(rèn)為是算子(operators)或內(nèi)核(kernels),且它們的大小一般為奇數(shù)個像元內(nèi)核在原始圖像上移動,而且另一幅輸出圖像的內(nèi)核中心灰度值,可以用原始圖像中相對應(yīng)的像元灰度值乘以內(nèi)核內(nèi)的對應(yīng)系數(shù),然后再將所有結(jié)果相加而得到針對原始圖像中的每一個像元值進行3.2.1模板操作和卷積運算針對原始圖像中的每一個像元值,內(nèi)核在原始圖像上移動,輸出圖像的內(nèi)核中心灰度值,用原始圖像中相對應(yīng)的像元灰度值乘以內(nèi)核內(nèi)的對應(yīng)系數(shù),然后再將所有結(jié)果相加而得到算子(operators)或內(nèi)核(kernels):含有由系數(shù)矩陣或權(quán)重因子矩陣構(gòu)成的移動窗口
鄰域平均法是一種局部空間域處理的算法。
基本思想:用鄰域像素灰度的平均值代替每個像素的灰度值。假定有一幅N×N像素的圖像f(x,y),平滑處理后得到一幅圖像g(x,y):
式中,x,y=0,1,2,…,N-1;S是以點(x,y)為中心的鄰域的集合,但不包括點(x,y);M是集合內(nèi)坐標(biāo)點的總數(shù)。3.2.2鄰域平均法鄰域平均法優(yōu)點:算法簡單,計算速度快。缺點:在降低噪聲的同時容易模糊圖像邊沿和細(xì)節(jié)處。改進:采用閾值法
式中T是一個非負(fù)閾值,當(dāng)一些點和它們鄰值的差值小于T
時,保留這些點的像素灰度值。3.2.2鄰域平均法原圖(部分)噪聲圖(部分)去噪圖(部分)原圖(部分)噪聲圖(部分)去噪圖(部分)(a)原始圖像(b)鄰域平均后的結(jié)果圖2-20采用鄰域平均法的效果(a)W=3(b)W=5圖2-20采用鄰域平均法的效果(a)Salt&Pepper噪聲圖像(a)Salt&Pepper噪聲圖像(b)鄰域平均后的結(jié)果原始圖像均值平滑為克服簡單局部平均法的弊病,目前已提出許多保邊緣、細(xì)節(jié)的局部平滑算法。它們的出發(fā)點都集中在如何選擇鄰域的大小、形狀和方向、參加平均的點數(shù)以及鄰域各點的權(quán)重系數(shù)等160157158161160159160161162160157160162161159158160157255001592551610002551621610158160157158161160255160161162160157160162161159158d=0.4d=0.013.2.3中值濾波Salt&PepperNoise(脈沖噪聲)101椒鹽噪聲隨機分布概率密度函數(shù)每次只改變一個像素黑/白14714915214814515115014614615014713614914613711414725515214814515101461461501471361491461371143.2.3中值濾波102中值濾波的定義為其中median表示取中值。其輸出結(jié)果是滑動窗口內(nèi)的像素大小排序后的中值。3.2.3中值濾波
中值濾波是對一個滑動窗口內(nèi)的諸像素灰度值排序,用中值代替窗口中心像素的原來灰度值,因此它是一種非線性的圖像平滑法。在一定的條件下,中值濾波可以克服線性濾波器所帶來的圖像細(xì)節(jié)模糊,而且對濾除脈沖干擾及圖像椒鹽噪聲非常有效;但是,對一些細(xì)節(jié)多,特別是點、線、尖頂細(xì)節(jié)較多的圖像則不宜采用中值濾波的方法。中值濾波的作用是在保護圖像邊緣的同時,去除噪聲。3.2.3中值濾波中值濾波步驟(一維):610258input3.2.3中值濾波選擇一個奇數(shù)長度的窗口610258inputm-1mm+1中值濾波步驟(一維):3.2.3中值濾波2.按照從小到大的順序排列610258m-1mm+1inputSort2510中值濾波步驟(一維):3.2.3中值濾波3.用排列后中間的數(shù)值代替原來窗口中心的數(shù)值610258m-1mm+1inputSort2510Replace610558output3.2.3中值濾波Replace66558outputinputSort2610610258m-1mm+13.2.3中值濾波Replace66558outputSort610258inputm-1mm+12583.2.3中值濾波中值濾波(二維)13914114414914725515214813712114014514915414515101461271042551651721621461501471361137418019925517114914613711492542042112051931691471298964472152182192162071761137047422132162202212212021486342422142172172182180184803435226226226218218210184803838233232231227220220215159482553.2.3中值濾波20717611370221202113632180184802182101848006370801131481761842022071761137022120214863218018480218210184801483.2.3中值濾波2071761137022120211363218202184802182101848001481841842022182182022212071761137022120214863218018480218210184803.2.3中值濾波202169129702161841137021820214880218212184112207176113702212021486321801848021821018480受椒鹽噪聲污染的矩陣中值濾波后的矩陣3.2.3中值濾波202169129702161841137021820214880218212184112207176113702212021486321801848021821018480受椒鹽噪聲污染的矩陣中值濾波后的矩陣3.2.3中值濾波受椒鹽噪聲污染的矩陣中值濾波后的矩陣3.2.3中值濾波原圖濾波后的圖回頭看中值濾波算法各步驟1.選擇奇數(shù)長度的窗口---必須是奇數(shù)2.將窗口所包含的數(shù)字按照從小到大的順序排列---“從小到大”還是“從大到小”選個你喜歡的3.將排列后的中間值替換算子覆蓋的中心值1.如果窗口變長,會怎么樣回頭看中值濾波算法各步驟610258input610258input610658output610558output回頭看中值濾波算法各步驟中值濾波中窗口大小至關(guān)重要!中值濾波的依據(jù):噪聲以孤立點的形式出現(xiàn),這些點對應(yīng)的像素數(shù)很少,而圖像則是由像素數(shù)較多、面積較大的塊構(gòu)成。中值濾波的目的就是要把這些孤立的點去除掉。中值濾波方法:選一個含有奇數(shù)點的窗口W,將這個窗口在圖像上移動,把該窗口中所含的像素點按灰度值進行升(或降)序排列,取位于中間的灰度值,來代替該點的灰度值。將原圖像中所有的像素點都執(zhí)行上述操作后就得到中值濾波的結(jié)果圖像。3.2.3中值濾波Salt&Peppernoise
中值濾波
鄰域濾波3.3圖像銳化概述圖像變模糊原因:成像系統(tǒng)聚焦不好或者信道過窄平均或積分運算使目標(biāo)物輪廓變模糊,細(xì)節(jié)輪廓不清楚目的:加重目標(biāo)物輪廓,使圖像變清楚方法:空域微(差)分法—模糊圖像的實質(zhì)是受到平均或積分運算,故對其進行逆運算(微分)頻域高通濾波法–模糊圖像的實質(zhì)是高頻分量被減弱突出邊緣和輪廓、線性目標(biāo)或某些亮度變化率大的部分,可以采用銳化的方法。銳化使圖像上邊緣與線性目標(biāo)的反差提高,因此也稱為邊緣增強平滑——使圖像邊緣模糊銳化——使圖像邊緣突出、清晰3.3圖像銳化概述3.3.1梯度運算水平方向的銳化非常簡單,通過一個可以檢測出水平方向上的像素值的變化模板來實現(xiàn)。一階微分:基本定義----差值1232121262308761278623269000000-3-13-2000-6-13-130011250000001*1+2*2+1*3-1*3-2*0-1*8=-3問題:計算結(jié)果中出現(xiàn)了小于零的像素值3.3.1梯度運算垂直銳化算法的設(shè)計思想與水平銳化算法相同,通過一個可以檢測出垂直方向上的像素值的變化模板來實現(xiàn)。3.3.1梯度運算1232121262308761278623269000000-7-17400-16-25500-17-22-30000001*1+2*2+1*3-1*3-2*2-1*8=-7問題:計算結(jié)果中出現(xiàn)了小于零的像素值3.3.1梯度運算單方向銳化的后處理方法1:整體加一個正整數(shù),以保證所有的像素值均為正。這樣做的結(jié)果是:可以獲得類似浮雕的效果。2020202020201770202014772020213225202020202020000000-3-13-2000-6-13-130011250000003.3.1梯度運算方法2:將所有的像素值取絕對值。這樣做的結(jié)果是,可以獲得對邊緣的有方向提取。000000313200061313001125000000000000-3-13-2000-6-13-130011250000003.3.1梯度運算梯度定義:對于圖像f(x,y),它在點(x,y)處的梯度是一個二維列向量,定義為方向:132(x,y)(x,y+1)(x+1,y)幅度:3.3.1梯度運算梯度算子:對于圖像f(x,y),離散梯度可以表示為-1100-1010梯度算子1333.3.1梯度運算椒鹽噪聲無噪聲目標(biāo)圖像梯度算子1343.3.1梯度運算中心點對稱性質(zhì),采用3×3像素窗口-101-101-101-1-1-1000111135
3.3.2Prewitt算子椒鹽噪聲無噪聲梯度算子136Prewitt算子3.3.2Prewitt算子-101-101-101-1013.3.3索貝爾算子137111垂直方向Prewitt算子缺點的根源-101121-101-202-101138-101-202-101-1-2-1000121采用3×3像素窗口3.3.3索貝爾算子由梯度的計算可知:在灰度變化平緩的區(qū)域其梯度值較小,圖像中灰度變化較大的邊緣區(qū)域其梯度值大,而在灰度均勻區(qū)域其梯度值為零。
注意:以上兩種梯度近似算法在圖像的最后一行和最后一列的各像素的梯度無法求得,一般就用前一行和前一列的梯度值近似代替。一階算子小結(jié)拉普拉斯運算也是偏導(dǎo)數(shù)運算的線性組合運算。f(x,y)的拉普拉斯運算定義為:二階微分算子3.3.4Laplacian算子二階微分:基本定義----差值為此,拉普拉斯算子
可見,
數(shù)字圖像在(i,j)點的拉普拉斯算子,可以由(i,
j)點灰度值減去該點鄰域平均灰度值來求得。0101-41010拉普拉斯算子模板3.3.4Laplacian算子3.3.4Laplacian算子為了改善銳化效果,可以脫離微分的計算原理,在原有的算子基礎(chǔ)上,對模板系數(shù)進行改變,獲得Laplacian變形算子如下所示。
3.3.4Laplacian算子h1h2h3h43.3.4Laplacian算子
原圖像拉普拉斯算子銳化0101-410100-10-14-10-10
把原圖像和拉普拉斯圖像疊加在一起的簡單方法可以保護拉普拉斯銳化處理的效果,同時又能復(fù)原背景信息。如果拉普拉斯掩模中心系數(shù)為負(fù)如果拉普拉斯掩模中心系數(shù)為正如果所使用的定義具有負(fù)的中心系數(shù),那么就必須將原始圖像減去經(jīng)拉普拉斯變換后的圖像而不是加上它,從而得到銳化的結(jié)果。去模糊掩模:0-10-15-10-10-1-1-1-19-1-1-1-13.3.4Laplacian算子
原圖像拉普拉斯算子銳化拉普拉斯算子銳化+原圖像0-10-15-10-103.3.4Laplacian算子考慮到人的視覺特性中包含一個對數(shù)環(huán)節(jié),因此在銳化時,加入對數(shù)處理的方法來改進。3.3.4Laplacian算子改進-Wallis算子算法特點:
Wallis算法考慮了人眼視覺特性,因此,與Laplacian等其他算法相比,可以對暗區(qū)的細(xì)節(jié)進行比較好的銳化。3.3.4Laplacian算子改進-Wallis算子3.3.4Laplacian算子改進-Wallis算子Wallis算法Laplacian算法3.3.4Laplacian算子改進-Wallis算子小結(jié):一階銳化v.s.二階銳化
一階微分會產(chǎn)生較寬的邊緣二階微分對細(xì)節(jié)有較強的響應(yīng),比如細(xì)線和孤立點一階微分對灰度階梯有較強的響應(yīng)二階微分對灰度階梯變化產(chǎn)生雙響應(yīng)一階銳化v.s.二階銳化Sobel銳化Laplacian銳化
原圖像羅伯茨梯度銳化(一階微分理)拉普拉斯算子銳化(二階微分處理)一階銳化v.s.二階銳化羅伯茨梯度銳化拉普拉斯算子銳化
原圖像一階銳化v.s.二階銳化圖像和其他信號一樣,既能在空間域處理,也能在頻率域處理。把圖像信息從空間域變換到頻率域,可以更好地分析、加工和處理圖像信息的頻率域處理具有如下特點:能量守恒,但能量重新分配有利于提取圖像的某些特征頻率域有快速算法,可大大減少運算量,提高處理效率3.3.5頻率域濾波3.3.5頻率域濾波圖像的平滑除了在空間域中進行外,也可以在頻率域中進行。卷積理論是頻率域技術(shù)的基礎(chǔ)。設(shè)函數(shù)f(x,y)與算子h(x,y)的卷積結(jié)果是g(x,
y),即g(x,y)=h(x,y)
*f(x,y),那么根據(jù)卷積定理,在頻率域有: 其中G(u,v),H(u,v),F(xiàn)(u,v)分別是g(x,y),h(x,y),
f(x,y)的傅立葉(或其它)變換H(u,v)是傳遞函數(shù)
3.3.5頻率域濾波由于噪聲主要集中在高頻部分,為去除噪聲改善圖像質(zhì)量,可采用低通濾波器H(u,v),來抑制F(u,v)的高頻分量,濾波得到G(u,v),然后再進行傅立葉反變換獲得濾波圖像,就可達到平滑圖像的目的。3.3.5頻率域濾波1.理想低通濾波器(ILPF)設(shè)傅立葉平面上理想低通濾波器離開原點的截止頻率為D0,則理想低通濾波器(ILPF)的傳遞函數(shù)為:含義:以D0為半徑的圓內(nèi)所有頻率分量無損的通過,圓外的所有頻率分量完全衰減。由于高頻成分包含有大量的邊緣信息,因此,采用該濾波器在去噪聲的同時將會導(dǎo)致邊緣信息損失而使圖像邊模糊。3.3.5頻率域濾波-低通濾波理想低通濾波器3.3.5頻率域濾波2.Butterworth低通濾波器
它的特性是連續(xù)性衰減,而不象理想濾波器那樣陡峭變化,即明顯的不連續(xù)性。因此采用該濾波器濾波在抑制噪聲的同時,圖像邊緣的模糊程度大大減小,沒有振鈴效應(yīng)產(chǎn)生;但計算量大于理想低通濾波器。n階Butterworth濾波器的傳遞函數(shù)為:3.3.5頻率域濾波-低通濾波3.高斯低通濾波器Gauss濾波器的傳遞函數(shù)為:高斯低通濾波器的傅立葉反變換也是高斯的,這意味著反變換后高斯濾波器將沒有振鈴現(xiàn)象產(chǎn)生。
3.3.5頻率域濾波-低通濾波4.梯形低通濾波器3.3.5頻率域濾波-低通濾波3.3.5頻率域濾波-高通濾波圖像中的邊緣或線條等細(xì)節(jié)部分與圖像頻譜的高頻分量相對應(yīng)。采用高通濾波使圖像的邊緣或線條等細(xì)節(jié)變得清楚,實現(xiàn)圖像的銳化。頻率域高通濾波的實現(xiàn),有3種常見的濾波器:理想高通濾波器巴特沃斯高通濾波器高斯高通濾波器理想高通濾波器巴特沃斯高通濾波器高斯高通濾波器3.3.5頻率域濾波-高通濾波理想高通濾波器巴特沃思高通濾波器高斯高通濾波器3.3.5頻率域濾波-高通濾波圖a:D0=15圖b:D0=30圖c:D0=80結(jié)論:圖a和b的振鈴問題十分明顯3.3.5頻率域濾波-高通濾波理想高通濾波器二階巴特沃思高通濾波器圖a:D0=15圖b:D0=30圖c:D0=80結(jié)論:BHPF的結(jié)果比IHPF的結(jié)果平滑得多3.3.5頻率域濾波-高通濾波高斯高通濾波器圖a:D0=15圖b:D0=30圖c:D0=80結(jié)論:GHPF的結(jié)果比BHBF和IHPF的結(jié)果更平滑3.3.5頻率域濾波-高通濾波3.4同態(tài)濾波(Homomorphicfiltering)消除不均勻照度的影響,增強圖像細(xì)節(jié)。如果圖像的動態(tài)范圍很大,黑的部分很黑,白的地方很白,就分不清物體的灰度層次和細(xì)節(jié),可以采取同態(tài)濾波的方法。由于光源照射的不均勻性總是漸變的,所以照度分量的頻譜處于低頻處;而反射分量的變化相對而言較為劇烈,因此,可粗略的看成高頻。為使圖像中景物更為清晰,應(yīng)盡量抑制前者,而增強后者。同態(tài)濾波為解決光照不均勻的影響,是一種在頻域中同時將圖像亮度范圍進行壓縮和將圖像對比度進行增強的方法。同態(tài)濾波就是指在壓縮動態(tài)范圍的同時,增強圖像的對比度,既增強暗區(qū)的圖像細(xì)節(jié),同時又不損失亮區(qū)的圖像細(xì)節(jié)。3.4同態(tài)濾波(Homomorphicfiltering)模型原理:隨空間位置不同的光強分量。特點:緩慢變化,頻率集中在低頻部分。景物反射到眼睛的圖象。特點:包含景物各種信息,高頻分量豐富。3.4同態(tài)濾波(Homomorphicfiltering)成像模型(照度和反射):f(x,y)=i(x,y)r(x,y)(1)兩邊取對數(shù):(2)兩邊取傅立葉變換:(3)用一頻域函數(shù)
H(u,v)處理
F(u,v):壓縮i(x,y)分量的變化范圍,削弱I(u,v),增強r(x,y)分量的對比度,提升R(u,v),增強細(xì)節(jié) (4)反變換到空域:(5)兩邊取指數(shù):3.4同態(tài)濾波(Homomorphicfiltering)H(u,v)設(shè)計壓縮照度分量i增強反射分量rD03.4同態(tài)濾波(Homomorphicfiltering)同態(tài)濾波:是把頻率過濾和灰度變換結(jié)合起來的一種圖像處理方法,它依靠圖像的照度/反射率模型作為頻域處理的基礎(chǔ),利用壓縮亮度范圍和增強對比度來改善圖像的質(zhì)量。
同態(tài)系統(tǒng):是將非線性問題,轉(zhuǎn)化為線性問題處理。即對非線性混雜信號,做某種數(shù)學(xué)運算,變換成加性的,而后采用線性濾波方法進行處理。3.4同態(tài)濾波(Homomorphicfiltering)窗內(nèi)細(xì)節(jié)變得清晰;窗外的灰度得到平衡
增強對比度可以使掩體內(nèi)部被墻外的光所掩蔽的細(xì)節(jié)顯示
出來,并且平衡墻外的灰度;增強后的圖像同樣更加銳化。3.4同態(tài)濾波(Homomorphicfiltering)第4章形態(tài)學(xué)圖像處理1834.1數(shù)學(xué)形態(tài)學(xué)的基本概念形態(tài)學(xué):通常指生物學(xué)中對動植物的形狀和結(jié)果進行處理的一個分支。數(shù)學(xué)形態(tài)學(xué)(mathematicalmorphology,MM):是根據(jù)形態(tài)學(xué)概念發(fā)展而來具有嚴(yán)格數(shù)學(xué)理論基礎(chǔ)的科學(xué),并在圖像處理和模式識別領(lǐng)域得到了成功應(yīng)用。1844.1.1數(shù)學(xué)形態(tài)學(xué)的定義和分類基本思想是:用具有一定形態(tài)的結(jié)構(gòu)元素去度量和提取圖像中的對應(yīng)形狀以達到對圖像分析和識別的目的形態(tài)學(xué)圖像處理表現(xiàn)為一種鄰域運算形式;一種特殊定義的鄰域稱之為“結(jié)構(gòu)元素”(StructureElement),在每個像素位置上它與二值圖像對應(yīng)的區(qū)域進行特定的邏輯運算,邏輯運算的結(jié)果為輸出圖像的相應(yīng)像素。形態(tài)學(xué)運算的效果取決于結(jié)構(gòu)元素的大小、內(nèi)容以及邏輯運算的性質(zhì)。用途是:簡化圖像數(shù)據(jù),保持它們基本的形狀特性,并除去不相干的結(jié)構(gòu)基本的運算包括:二值腐蝕和膨脹、二值開閉運算MM方法比其他空域或頻域圖像處理方法有一些明顯的優(yōu)勢:在恢復(fù)處理中,形態(tài)濾波可借助先驗的幾何特征信息,利用形態(tài)學(xué)算子有效濾除噪聲,又可保留圖像的原有信息;MM算法易于用并行處理方法有效實現(xiàn),且硬件實現(xiàn)容易;基于MM的邊緣信息提取由于基于微分的提取算法,也不象微分算法對噪聲那樣敏感,同時提取的邊緣較光滑;基于MM方法提取的圖像骨架較連續(xù),斷點少。4.1.1數(shù)學(xué)形態(tài)學(xué)的定義和分類4.1.2數(shù)學(xué)形態(tài)學(xué)的邏輯運算和基本概念集合論的一些基本概念集合:具有某種性質(zhì)的、確定的、有區(qū)別的事物的全體元素:構(gòu)成集合的每個事物屬于、不屬于、空集令A(yù)是Z2中的一個集合,如果a=(a1,a2)是A中的一個元素,稱a屬于A,并記作:aA,否則,稱a不屬于A,記為:aA,如A中沒有任何元素,稱A為空集:子集:當(dāng)且僅當(dāng)集合A中的元素都屬于集合B時,稱A為B的子集,記為AB187二值圖像的邏輯運算對于二值圖像而言,習(xí)慣上認(rèn)為取值為1的點對應(yīng)于景物(前景),而取值為0的點構(gòu)成背景三種基本的邏輯運算:與、或、非4.1.2數(shù)學(xué)形態(tài)學(xué)的邏輯運算和基本概念000000000000000001111000011110000111100000000000111111111111111110000111100001111000011111111111000000000000111000001110000011100000000000000000000000000000111001111110011111100111100000000000000000000000111000001110000011100000000000000000000000000000000000001000000010000000100000000000189邏輯運算0000000000000000011110000111100001111000000000000000000000000000011110000111100001111000000000004.1.2數(shù)學(xué)形態(tài)學(xué)的邏輯運算和基本概念平移012356412345601235641234566012354123456Ab反射
012341234-5-4-3-2-1-1-2-3
4.1.2數(shù)學(xué)形態(tài)學(xué)的邏輯運算和基本概念表3.1形態(tài)學(xué)圖像處理中的集合論基本概念4.1.2數(shù)學(xué)形態(tài)學(xué)的邏輯運算和基本概念目標(biāo)和結(jié)構(gòu)元素(structureelement)二值形態(tài)學(xué)中的運算對象是集合。設(shè)A為圖像集合,B為結(jié)構(gòu)元素,數(shù)學(xué)形態(tài)學(xué)運算是用B對A進行操作結(jié)構(gòu)元素本身也是一個圖像集合。對每個結(jié)構(gòu)元素必須指定一個原點,它是結(jié)構(gòu)元素參與形態(tài)學(xué)運算的參考點在每個像素位置上,結(jié)構(gòu)元素與二值圖像對應(yīng)的區(qū)域進行特定的邏輯運算,邏輯運算的結(jié)果為輸出圖像的相應(yīng)像素。形態(tài)學(xué)運算的效果取決于結(jié)構(gòu)單元的大小、內(nèi)容以及運算的性質(zhì)1924.1.2數(shù)學(xué)形態(tài)學(xué)的邏輯運算和基本概念目標(biāo)圖像被考察的圖像結(jié)構(gòu)元素收集信息的“探針”小的圖像原點形態(tài)學(xué)運算參考點000000000111110001111100011111000111110000000000111111111目標(biāo)圖像A結(jié)構(gòu)元素B1934.1.2數(shù)學(xué)形態(tài)學(xué)的邏輯運算和基本概念結(jié)構(gòu)元素SE=strel(shape,parameters)194SE=strel(‘diamond’,3)SE=strel('square',3)4.1.2數(shù)學(xué)形態(tài)學(xué)的邏輯運算和基本概念4.2二值形態(tài)學(xué)基本運算腐蝕(erosion)膨脹(dilation)開和閉(openingandclosing)擊中與否變換(hit-or-miss)定義算法結(jié)構(gòu)元素B掃描圖像的每一個元素用結(jié)構(gòu)元素與其覆蓋的目標(biāo)圖像做與運算B被A包含,原點覆蓋原圖位置1B不被A包含,原點覆蓋原圖位置04.2.1腐蝕1961974.2.1腐蝕1984.2.1腐蝕1994.2.1腐蝕2004.2.1腐蝕1111111111110000100(a)目標(biāo)圖像A(b)結(jié)構(gòu)元素B(c)腐蝕運算結(jié)果圖像圖腐蝕運算實例
舉例:4.2.1腐蝕腐蝕IM2=imerode(IM,SE)2024.2.1腐蝕1111利用腐蝕算法消除物體之間的粘連示例舉例:
4.2.1腐蝕定義算法用結(jié)構(gòu)元素的反射掃描圖像的每一個元素用結(jié)構(gòu)元素與其覆蓋的二值圖像做并運算反射B被A包含,原點覆蓋原圖位置1B不被A包含,原點覆蓋原圖位置02044.2.2膨脹注意:(1)當(dāng)結(jié)構(gòu)元素中原點位置的值是0時,仍把它看作是0;而不再把它看作是1。(2)當(dāng)結(jié)構(gòu)元素在目標(biāo)圖像上平移時,允許結(jié)構(gòu)元素中的非原點像素超出目標(biāo)圖像范圍。
算法用結(jié)構(gòu)元素的反射掃描圖像的每一個元素用結(jié)構(gòu)元素與其覆蓋的二值圖像做與運算如果結(jié)果都為0,則結(jié)果圖像對應(yīng)像素點的值為0,否則為14.2.2膨脹206B的反射的平移與A的交集不為空4.2.2膨脹207膨脹4.2.2膨脹2084.2.2膨脹2094.2.2膨脹膨脹應(yīng)用:連接圖像中的鄰近目標(biāo)210形態(tài)學(xué)方法對比低通濾波方法的優(yōu)點:形態(tài)學(xué)方法可以在一幅二值圖像中直接得到結(jié)果4.2.2膨脹膨脹IM2=imdilate(IM,SE)2114.2.2膨脹小結(jié)腐蝕和膨脹是對白色部分(高亮部分)而言的,不是黑色部分膨脹就是圖像中的高亮部分進行膨脹,“領(lǐng)域擴張”,效果圖擁有比原圖更大的高亮區(qū)域腐蝕就是原圖中的高亮部分被腐蝕,“領(lǐng)域被蠶食”,效果圖擁有比原圖更小的高亮區(qū)域。
膨脹和腐蝕運算的對偶性可分別表示為:也即:對目標(biāo)圖像的膨脹運算,相當(dāng)于對圖像背景的腐蝕運算操作;對目標(biāo)圖像的腐蝕運算,相當(dāng)于對圖像背景的膨脹運算操作。腐蝕運算與膨脹運算的對偶性
小結(jié)11111111腐蝕運算與膨脹運算的對偶性-實例驗證
(a)目標(biāo)圖像A
(b)結(jié)構(gòu)元素B(c)膨脹結(jié)果(d)腐蝕結(jié)果(e)A的補
(b)B的反射(c)膨脹(d)腐蝕小結(jié)4.2.2開運算與閉運算閉操作(closing)先膨脹、后腐蝕作用填充對象內(nèi)細(xì)小空洞連接鄰近對象在不明顯改變面積的前提下,平滑對象邊緣IM2=imclose(IM,SE)2154.2.2開運算與閉運算閉操作216閉操作的幾何解釋2174.2.2開運算與閉運算閉操作2184.2.2開運算與閉運算219練習(xí):用圖b中的結(jié)構(gòu)元素(+表示原點位置)對圖a進行閉操作(陰影部分像素值為1,白色部分為0)圖a圖b4.2.2開運算與閉運算閉操作的性質(zhì)A是閉運算結(jié)果的子集如C是D的子集,則C與B閉運算結(jié)果是D與B閉運算結(jié)果的子集對同樣的A,多次閉運算的結(jié)果與一次閉運算的結(jié)果是一樣的2204.2.2開運算與閉運算開操作(opening)先腐蝕,后膨脹作用消除細(xì)小對象在細(xì)小粘連處分離對象在不明顯改變形狀的前提下,平滑對象的邊緣IM2=imopen(IM,SE)2214.2.2開運算與閉運算222開操作的幾何解釋4.2.2開運算與閉運算2234.2.2開運算與閉運算開操作2244.2.2開運算與閉運算開操作的性質(zhì)開的結(jié)果是A的子集如C是D的子集,則C與B開的結(jié)果是D與B開運算結(jié)果的子集對同樣的A,多次開運算的結(jié)果與一次開運算的結(jié)果是一樣的2254.2.2開運算與閉運算2264.2.2開運算與閉運算開閉運算的綜合實例
橋接部分、對象最右邊兩部分消失;方向向外的角變圓滑了,而方向向內(nèi)的角沒有影響;結(jié)構(gòu)元素?zé)o法擬合的突出部分被消除掉了。左邊侵入部分在尺寸上明顯減少;方向向內(nèi)的角變圓滑,方向向外的角沒有受影響。開運算閉運算4.2.2開運算與閉運算228開操作和閉操作的應(yīng)用:先開操作再閉操作,構(gòu)成噪聲濾波器圖9.11(a)是受噪聲污染的指紋二值圖像,噪聲為黑色背景上的亮元素和亮指紋部分的暗元素(b)為結(jié)構(gòu)元素(c)是使用結(jié)構(gòu)元素對圖(a)腐蝕的結(jié)果,黑色背景噪聲消除了,指紋中的噪聲尺寸增加(d)是結(jié)構(gòu)元素對圖(c)膨脹的結(jié)果,包含于指紋中
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 《無機化學(xué)》教學(xué)大綱
- 玉溪師范學(xué)院《數(shù)學(xué)課程與教學(xué)論》2022-2023學(xué)年第一學(xué)期期末試卷
- 智能樓宇整體解決方案-智能停車場
- 2024年運載火箭遙測系統(tǒng)檢測設(shè)備項目成效分析報告
- 2023年制劑仿制藥項目評價分析報告
- 2023年泌尿系統(tǒng)用藥項目評價分析報告
- 2024年血管栓塞劑及栓塞材料項目評價分析報告
- 采購面包、糕點的合同
- 不生孩子合同
- 北京大學(xué)承澤園建筑修繕工程合同
- 中小學(xué)-消防安全知識教育-課件
- 2024年導(dǎo)游資格證基礎(chǔ)知識考試題庫(附含答案)
- 2023年中國人民銀行清算總中心招聘考試真題
- 職業(yè)院?!敖鹫n”建設(shè)方案
- 新質(zhì)生產(chǎn)力-講解課件
- 商城開發(fā)合同
- 220千伏變電站現(xiàn)場運行通用規(guī)程
- 海綿城市建設(shè)難點與對策
- 幼兒園《交通工具(火車篇)家長代課》PPT課件
- 我的叔叔于勒(劇本)精編版
- 視頻監(jiān)控系統(tǒng)質(zhì)量檢查表(完整版)
評論
0/150
提交評論