數(shù)字圖像處理技術(shù)的研究現(xiàn)狀及其發(fā)展方向_第1頁(yè)
數(shù)字圖像處理技術(shù)的研究現(xiàn)狀及其發(fā)展方向_第2頁(yè)
數(shù)字圖像處理技術(shù)的研究現(xiàn)狀及其發(fā)展方向_第3頁(yè)
數(shù)字圖像處理技術(shù)的研究現(xiàn)狀及其發(fā)展方向_第4頁(yè)
數(shù)字圖像處理技術(shù)的研究現(xiàn)狀及其發(fā)展方向_第5頁(yè)
已閱讀5頁(yè),還剩11頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、目錄緒論11 數(shù)字圖像處理技術(shù)11.1 數(shù)字圖像處理的主要特點(diǎn)11.2 數(shù)字圖像處理的優(yōu)點(diǎn)21.3 數(shù)字圖像處理過(guò)程32 數(shù)字圖像處理的研究現(xiàn)狀42.1 數(shù)字圖像的采集與數(shù)字化42.2 圖像壓縮編碼52.3 圖像增強(qiáng)與恢復(fù)82.4 圖像分割92.5 圖像分析103 數(shù)字圖像處理技術(shù)的發(fā)展方向13參考文獻(xiàn)14緒論圖像處理技術(shù)基本可以分成兩大類:模擬圖像處理和數(shù)字圖像處理。數(shù)字圖像處理是指將圖像信號(hào)轉(zhuǎn)換成數(shù)字信號(hào)并利用計(jì)算機(jī)進(jìn)行處理的過(guò)程。其優(yōu)點(diǎn)是處理精度高,處理內(nèi)容豐富,可進(jìn)行復(fù)雜的非線性處理,有靈活的變通能力,一般來(lái)說(shuō)只要改變軟件就可以改變處理內(nèi)容。困難主要在處理速度上,特別是進(jìn)行復(fù)雜的處理。

2、數(shù)字圖像處理技術(shù)主要包括如下內(nèi)容:幾何處理、算術(shù)處理、圖像增強(qiáng)、圖像復(fù)原、圖像重建、圖像編碼、圖像識(shí)別、圖像理解。數(shù)字圖像處理技術(shù)的發(fā)展涉及信息科學(xué)、計(jì)算機(jī)科學(xué)、數(shù)學(xué)、物理學(xué)以及生物學(xué)等學(xué)科,因此數(shù)理及相關(guān)的邊緣學(xué)科對(duì)圖像處理科學(xué)的發(fā)展有越來(lái)越大的影響。數(shù)字圖像處理的早期應(yīng)用是對(duì)宇宙飛船發(fā)回的圖像所進(jìn)行的各種處理。到了70 年代,圖像處理技術(shù)的應(yīng)用迅速?gòu)挠詈筋I(lǐng)域擴(kuò)展到生物醫(yī)學(xué)、信息科學(xué)、資源環(huán)境科學(xué)、天文學(xué)、物理學(xué)、工業(yè)、農(nóng)業(yè)、國(guó)防、教育、藝術(shù)等各個(gè)領(lǐng)域與行業(yè),對(duì)經(jīng)濟(jì)、軍事、文化及人們的日常生活產(chǎn)生重大的影響。數(shù)字圖像處理技術(shù)發(fā)展速度快、應(yīng)用范圍廣的主要原因有兩個(gè)。最初由于數(shù)字圖像處理的數(shù)據(jù)量

3、非常龐大,而計(jì)算機(jī)運(yùn)行處理速度相對(duì)較慢,這就限制了數(shù)字圖像處理的發(fā)展。現(xiàn)在計(jì)算機(jī)的計(jì)算能力迅速提高,運(yùn)行速度大大提高,價(jià)格迅速下降,圖像處理設(shè)備從中、小型計(jì)算機(jī)迅速過(guò)渡到個(gè)人計(jì)算機(jī),為圖像處理在各個(gè)領(lǐng)域的應(yīng)用準(zhǔn)備了條件。第二個(gè)原因是由于視覺(jué)是人類感知外部世界最重要的手段。據(jù)統(tǒng)計(jì),在人類獲取的信息中,視覺(jué)信息占60,而圖像正是人類獲取信息的主要途徑,因此,和視覺(jué)緊密相關(guān)的數(shù)字圖像處理技術(shù)的潛在應(yīng)用范圍自然十分廣闊。近年來(lái),數(shù)字圖像處理技術(shù)日趨成熟,它廣泛應(yīng)用于空間探測(cè)、遙感、生物醫(yī)學(xué)、人工智能以及工業(yè)檢測(cè)等許多領(lǐng)域,并促使這些學(xué)科產(chǎn)生了新的發(fā)展。1 數(shù)字圖像處理技術(shù)1.1 數(shù)字圖像處理的主要特點(diǎn)

4、(1) 目前數(shù)字圖像處理的信息大多是二維信息,處理信息量很大,因此對(duì)計(jì)算機(jī)的計(jì)算速度、存儲(chǔ)容量等要求較高。(2) 數(shù)字圖像處理占用的頻帶較寬,與語(yǔ)言信息相比,占用的頻帶要大幾個(gè)數(shù)量級(jí)。 所以在成像、傳輸、存儲(chǔ)、處理、顯示等各個(gè)環(huán)節(jié)的實(shí)現(xiàn)上,技術(shù)難度較大,成本也高,這就對(duì)頻帶壓縮技術(shù)提出了更高的要求。(3) 數(shù)字圖像中各個(gè)像素是不獨(dú)立的,其相關(guān)性大。因此,圖像處理中信息壓縮的潛力很大。(4) 由于圖像是三維景物的二維投影,一幅圖像本身不具備復(fù)現(xiàn)三維景物的全部幾何信息的能力,很顯然三維景物背后部分信息在二維圖像畫(huà)面上是反映不出來(lái)的。因此,要分析和理解三維景物必須作合適的假定或附加新的測(cè)量。在理解三

5、維景物時(shí)需要知識(shí)導(dǎo)引,這也是人工智能中正在致力解決的知識(shí)工程問(wèn)題。(5) 數(shù)字圖像處理后的圖像一般是給人觀察和評(píng)價(jià)的,因此受人的因素影響較大。由于人的視覺(jué)系統(tǒng)很復(fù)雜,受環(huán)境條件、視覺(jué)性能、人的情緒愛(ài)好以及知識(shí)狀況影響很大,作為圖像質(zhì)量的評(píng)價(jià)還有待進(jìn)一步深入的研究。另一方面,計(jì)算機(jī)視覺(jué)是模仿人的視覺(jué),人的感知機(jī)理必然影響著計(jì)算機(jī)視覺(jué)的研究,這些都是心理學(xué)和神經(jīng)心理學(xué)正在著力研究的課題。1.2 數(shù)字圖像處理的優(yōu)點(diǎn)(1) 再現(xiàn)性好 數(shù)字圖像處理與模擬圖像處理的根本不同在于,它不會(huì)因圖像的存儲(chǔ)、傳輸或復(fù)制等一系列變換操作而導(dǎo)致圖像質(zhì)量的退化,只要圖像在數(shù)字化時(shí)準(zhǔn)確地表現(xiàn)了原稿,則數(shù)字圖像處理過(guò)程始終能

6、保持圖像的再現(xiàn)。 (2) 處理精度高 按目前的技術(shù),幾乎可將一幅模擬圖像數(shù)字化為任意大小的二維數(shù)組,現(xiàn)代掃描儀可以把每個(gè)像素的灰度等級(jí)量化為16 位甚至更高,這意味著圖像的數(shù)字化精度可以達(dá)到滿足任一應(yīng)用需求。(3) 適用面寬 圖像可以來(lái)自多種信息源,從圖像反映的客觀實(shí)體尺度看,可以小到電子顯微鏡圖像,大到航空照片、遙感圖像甚至天文望遠(yuǎn)鏡圖像。這些來(lái)自不同信息源的圖像只要被變換為數(shù)字編碼形式后,均是用二維數(shù)組表示的灰度圖像組合而成,因而均可用計(jì)算機(jī)來(lái)處理。 (4) 靈活性高 數(shù)字圖像處理不僅能完成線性運(yùn)算,而且能實(shí)現(xiàn)非線性處理,即凡是可以用數(shù)學(xué)公式或邏輯關(guān)系來(lái)表達(dá)的一切運(yùn)算均可用數(shù)字圖像處理實(shí)現(xiàn)

7、。1.3 數(shù)字圖像處理過(guò)程由于數(shù)字圖像處理的靈活性和方便性,所以數(shù)字圖像處理已成為圖像處理的主流。常見(jiàn)的數(shù)字圖像處理有:圖像的采集、數(shù)字化、編碼、增強(qiáng)、恢復(fù)、變換、壓縮、存儲(chǔ)、傳輸、分析、識(shí)別、分割等,其處理流程如圖1 所示。圖像輸入設(shè)備A/D鍵盤(pán)顯示器主計(jì)算機(jī)D/A監(jiān)視器圖1 數(shù)字圖像處理流圖(1) 圖像數(shù)字化 通過(guò)取樣和量化將一個(gè)以自然形式存在的圖像變換為適合計(jì)算機(jī)處理的數(shù)字形式,圖像在計(jì)算機(jī)內(nèi)部被表示為一個(gè)數(shù)字矩陣,矩陣中每一元素稱為像素。(2) 圖像的編碼 編碼的目的是壓縮圖像的信息量(但圖像質(zhì)量幾乎不變) ,以滿足傳輸和存儲(chǔ)的要求,為此,可以采用模擬處理技術(shù),再通過(guò)模-數(shù)轉(zhuǎn)換得到編碼

8、,不過(guò)多數(shù)是采用數(shù)字編碼技術(shù),其編碼方法可以對(duì)圖像逐點(diǎn)進(jìn)行加工,也可以對(duì)圖像施加某種變換或基于區(qū)域、特征進(jìn)行編碼。(3) 圖像增強(qiáng) 圖像增強(qiáng)目的是使圖像清晰或?qū)⑵滢D(zhuǎn)換為更適合人或機(jī)器分析的形式,常用的圖像增強(qiáng)方法有:灰度等級(jí)直方圖處理、干擾抵制、邊緣銳化、偽彩色處理。 (4) 圖像恢復(fù) 其目的是除去或減少在獲得圖像過(guò)程中因各種原因產(chǎn)生的退化,可能是光學(xué)系統(tǒng)的像差或離焦、攝像系統(tǒng)與被攝物之間的相對(duì)運(yùn)動(dòng)、電子或光學(xué)系統(tǒng)的噪聲和介于攝像系統(tǒng)與被攝像物間的大氣湍流。 (5) 圖像分割 將圖像劃分為一些互不重疊的區(qū)域,每一區(qū)域是像素的一個(gè)連續(xù)集,通常采用把像素分入特定區(qū)域的區(qū)域法和尋求區(qū)域之間邊界的境界

9、法,這2 種方法都可以利用圖像的紋理特性實(shí)現(xiàn)圖像分割。(6) 圖像分析 從圖像中抽取某些有用的度量、數(shù)據(jù)或信息,其目的是得到某種數(shù)值結(jié)果。圖像分析的內(nèi)容和模式識(shí)別、人工智能的研究領(lǐng)域有交叉,但圖像分析與典型的模式識(shí)別有區(qū)別。 圖像分析需要用圖像分割方法抽取出圖像的特征,然后對(duì)圖像進(jìn)行符號(hào)化的描述,這種描述不僅能對(duì)圖像中是否存在某一特定對(duì)象作出回答,還能對(duì)圖像內(nèi)容作出詳細(xì)描述。圖像處理的各個(gè)內(nèi)容是互相有聯(lián)系的,一個(gè)實(shí)用的圖像處理系統(tǒng)往往結(jié)合幾種圖像處理技術(shù)才能得到所需要的結(jié)果,圖像數(shù)字化是將一個(gè)圖像變換為適合計(jì)算機(jī)處理的形式的第1 步,圖像編碼可用以傳輸和存儲(chǔ)圖像。圖像增強(qiáng)和復(fù)原可以是圖像處理的

10、最后目的,也可以是為進(jìn)一步的處理作準(zhǔn)備。通過(guò)圖像分割得出的圖像特征可以作為最后結(jié)果,也可以作為下一步圖像分析的基礎(chǔ)。2 數(shù)字圖像處理的研究現(xiàn)狀2.1 數(shù)字圖像的采集與數(shù)字化圖像的采集是數(shù)字圖像處理的第1 步,采集并不局限于對(duì)人眼視覺(jué)功能的模仿,更是對(duì)人類認(rèn)識(shí)、分析手段的拓展。在醫(yī)學(xué)、天文學(xué)、自動(dòng)字體識(shí)別、機(jī)器視覺(jué)、軍事識(shí)別、指紋自動(dòng)處理和血樣分類處理等多個(gè)方面都不同程度地運(yùn)用了圖像提取技術(shù)。圖像提取技術(shù)源自于電影和視頻產(chǎn)品的發(fā)展。其中,最具影響力的研究是由Porter 和Duff 提出的通道概念,對(duì)圖像提取技術(shù)的離散特性進(jìn)行了規(guī)范,為這一研究領(lǐng)域奠定了基礎(chǔ),使其成為圖像處理領(lǐng)域一個(gè)較獨(dú)立的重要

11、分支。20 世紀(jì)60 年代,由于當(dāng)時(shí)的圖像提取技術(shù)還未成形,人們主要依賴于用拍攝技巧彌補(bǔ)后期制作的不足。隨著當(dāng)時(shí)計(jì)算機(jī)應(yīng)用的發(fā)展,圖像處理技術(shù)獲得了更加廣闊的發(fā)展空間,各種各樣的處理技術(shù)和方法也相應(yīng)而生。如四元組像素的提出以及Blinn 對(duì)計(jì)算機(jī)領(lǐng)域所運(yùn)用到的像素進(jìn)行的全面詮釋。 20 世紀(jì)90 年代初期,學(xué)者們逐漸認(rèn)識(shí)到要實(shí)現(xiàn)信息的精確提取是非常困難和費(fèi)時(shí)的,對(duì)于稍復(fù)雜的圖像或視頻,其代價(jià)十分巨大。所以學(xué)者們開(kāi)始考慮借助數(shù)學(xué)和概率統(tǒng)計(jì)學(xué)的原理來(lái)尋求更優(yōu)解,而不再?gòu)?qiáng)調(diào)最優(yōu)解。圖像提取技術(shù)的發(fā)展過(guò)程經(jīng)歷了以下4 個(gè)發(fā)展階段:(1) 萌芽階段 通過(guò)拍攝時(shí)的布景實(shí)現(xiàn)提取條件。(2) 初期階段 以四元

12、像素和數(shù)字化為基礎(chǔ),建立了獨(dú)立的分支學(xué)科(3) 飛躍階段 以概率統(tǒng)計(jì)學(xué)原理為基礎(chǔ)的提取。(4) 分化階段 認(rèn)識(shí)到視頻中幀與幀之間存在相關(guān)性,產(chǎn)生了專門(mén)用于視頻提取的方案。但由于自然色彩分布的復(fù)雜性,至今沒(méi)有被廣泛認(rèn)可的模型,也沒(méi)有系統(tǒng)的、統(tǒng)一的評(píng)價(jià)標(biāo)準(zhǔn)。所以說(shuō),圖像提取技術(shù)的成熟還有待時(shí)日,并依賴于其它學(xué)科及計(jì)算機(jī)硬件技術(shù)的發(fā)展。由于圖像提取涉及的學(xué)科領(lǐng)域比較廣泛,學(xué)者們對(duì)待該問(wèn)題的研究角度和出發(fā)點(diǎn)各不相同,目前已有的概念和模型有:Porter & Duff 模型、Blinn 模型、Knockout 模型、Ruzon & Tomasi 模型、Bayesian 模型、Poisson 模型、Chu

13、ang& Agarwala 模型、Yin Li & Jian Sun 模型。比較分析上述模型、可以發(fā)現(xiàn):Porter & Duff 模型、Blinn 模型將圖像提取問(wèn)題規(guī)范化,是后續(xù)研究的重要基礎(chǔ);Knockout 模型是對(duì)Porter & Duff 模型、Blinn 模型的有益擴(kuò)展,使之實(shí)用意義更大,在實(shí)際運(yùn)用中效率更高。雖然Ruzon & Tomasi 模型、Bayesian 模型、Poisson 模型采用的具體概率統(tǒng)計(jì)方法各異,但這些模型都是先對(duì)圖像進(jìn)行初始化,生成Trimap 前景、背景、交界區(qū)域,研究對(duì)象都是交界區(qū)域的值。 Chuang & Agarwa2la 模型、Yin Li &

14、 Jian Sun 模型以視頻提取為研究目的,引人了幀間信息相關(guān)性的概念,實(shí)現(xiàn)了視頻的半自動(dòng)提取。目前為止,圖像提取技術(shù)根據(jù)需求的不同出現(xiàn)了2 種研究思路:一種更注重提高值的精確度,追求精確完美的效果;另一種則更注重提高提取的效率、實(shí)時(shí)性及自動(dòng)化程度。 目前,圖像提取技術(shù)的研究活動(dòng)主要集中在以下5 個(gè)方面: (1) 拍攝設(shè)備、拍攝方法及技巧;(2) 分割技術(shù);(3) 人機(jī)交互操作接口;(4) 面向?qū)ο蟮奶崛〖夹g(shù);(5) 前景與背景間交界區(qū)域估計(jì)模型。2.2 圖像壓縮編碼作為通信、介質(zhì)存貯、數(shù)據(jù)發(fā)送、多媒體計(jì)算機(jī)等技術(shù)的關(guān)鍵環(huán)節(jié),圖像壓縮編碼算法的研究是信息技術(shù)中最活躍的研究領(lǐng)域之一。尤其是進(jìn)入

15、21 世紀(jì)以后,電子技術(shù)和通信技術(shù)的發(fā)展使可視電話、會(huì)議電視、數(shù)字電視、高清晰度電視、多媒體計(jì)算機(jī)、信息高速公路等的生產(chǎn)和建立成為可能。 在這一背景下,探索高效圖像壓縮編碼算法無(wú)疑將成為主要任務(wù)之一,對(duì)其研究也將成為國(guó)際公認(rèn)的熱點(diǎn)之一。為了使有限的符號(hào)表達(dá)更多的信息量,圖像壓縮既非常必要,也有可能,因此產(chǎn)生了各種各樣的圖像壓縮方法。圖像壓縮編碼用盡可能少的數(shù)據(jù)表示信源發(fā)出的圖像信號(hào),以減少容納給定消息集合的信號(hào)空間。通過(guò)對(duì)圖像數(shù)據(jù)的壓縮減少數(shù)據(jù)占用的存儲(chǔ)空間,從而減少傳輸圖像數(shù)據(jù)所需的時(shí)間和信道帶寬。圖2 為圖像壓縮系統(tǒng)模型,圖像壓縮編碼算法的研究歷程可分為如下2 個(gè)階段。信源信源編碼信道編碼

16、噪聲調(diào)制傳輸信道信道譯碼解調(diào)信源譯碼用戶圖2 圖像壓縮系統(tǒng)模型(1) 第1 代圖像壓縮編碼階段(1985 年以前) 。圖像壓縮編碼算法的研究起源于傳統(tǒng)的數(shù)據(jù)壓縮理論,有些學(xué)者認(rèn)為始于18 世紀(jì)末Sheppards 所做的“實(shí)數(shù)舍入為十進(jìn)制數(shù)”的研究,也有人認(rèn)為19 世紀(jì)末研制的莫爾斯代碼是數(shù)據(jù)壓縮的第一次嘗試。1939 年Dudley 研制了聲碼器,他把聲音頻譜的能量劃分為有限數(shù)目的頻帶,并且在每個(gè)頻帶內(nèi)傳輸相應(yīng)的能級(jí),因此能夠達(dá)到較高的壓縮。 比較系統(tǒng)的研究始于20 世紀(jì)40 年代初形成的信息論,盡管當(dāng)時(shí)數(shù)字計(jì)算機(jī)尚未出現(xiàn),但其研究與當(dāng)今數(shù)字計(jì)算機(jī)所使用的壓縮技術(shù)有著密切的聯(lián)系,許多算法,如

17、Huffman 編碼等仍有很大的應(yīng)用價(jià)值。近年來(lái),由于模式識(shí)別、圖像處理、計(jì)算機(jī)視覺(jué)等技術(shù)的發(fā)展,促進(jìn)了數(shù)據(jù)壓縮的研究。1997 年以前基于符號(hào)頻率統(tǒng)計(jì)的Huffman 編碼具有良好的壓縮性能,一直占據(jù)重要的地位,并不斷有基于其改進(jìn)的算法提出。1977 年以色列科學(xué)家J acob Ziv 和Abra2ham Lempel 提出了不同于以往的基于字典的壓縮編碼算法L Z 77 ,1978 年又推出了改進(jìn)算法L Z 78,把無(wú)損壓縮編碼算法的研究推向了一個(gè)全新的階段。近年來(lái),隨著神經(jīng)網(wǎng)絡(luò)理論的興起,有人采用BP 網(wǎng)進(jìn)行非線性預(yù)測(cè)的嘗試,取得了較好的效果。 自1969 年在美國(guó)舉行首屆“圖像編碼會(huì)議

18、”以來(lái),圖像壓縮編碼算法的研究有了很大進(jìn)展,其中變換壓縮編碼與量化壓縮編碼是研究熱點(diǎn)。(2) 第2 代圖像壓縮編碼階段(1985 年以后) 。為了克服第1 代圖像壓縮編碼存在的壓縮比小、圖像復(fù)原質(zhì)量不理想等弱點(diǎn),1985 年Kunt 等人充分利用人眼視覺(jué)特性提出了第2 代圖像壓縮編碼的概念。 20 世紀(jì)80 年代中后期,人們相繼提出了在多個(gè)分辨率下表示圖像的方案,主要方法有子帶壓縮編碼、金字塔壓縮編碼等,利用不同類型的線性濾波器,將圖像分解到不同的頻帶中,然后對(duì)不同頻帶的系數(shù)采用不同的壓縮編碼方法。 這些方法均在不同程度上有如下優(yōu)點(diǎn):多分辨率的信號(hào)表示有利于圖形信號(hào)的漸進(jìn)式傳輸;不同分辨率的信

19、號(hào)占用不同的頻帶,便于引入視覺(jué)特性。1988 年,Barnsley 和Sloan 共同提出了分形圖像編碼壓縮方案,該方案利用圖像中固有的自相似性來(lái)構(gòu)造一個(gè)緊縮變換,并使原圖像成為該緊縮變換的吸引子,編碼時(shí)只需存儲(chǔ)變化的參數(shù),解碼時(shí)需要利用該變化對(duì)任一幅圖像不斷進(jìn)行迭代變換。此方案具有思路新穎、壓縮潛力大、解碼分辨率無(wú)關(guān)性等特點(diǎn),是一種很有潛力的編碼方法。1987 年,Mallat 首次巧妙地將計(jì)算機(jī)視覺(jué)領(lǐng)域內(nèi)的多尺度分析思想引入到小波變換中,統(tǒng)一了在此之前的各種小波的構(gòu)造方法。之后,他又研究了小波變換的離散形式,并將相應(yīng)的算法應(yīng)用于圖像的分解與重構(gòu)中,為隨后的小波圖像壓縮編碼奠定了基礎(chǔ)。進(jìn)入9

20、0 年代,又取得了一系列圖像壓縮編碼研究的階段性新成果。 其中EZW編碼算法、SPIHT 編碼算法被認(rèn)為是目前世界上比較先進(jìn)的圖壓縮編碼算法,這2 種算法均具有結(jié)構(gòu)簡(jiǎn)單、無(wú)需任何訓(xùn)練、支持多碼率、圖像復(fù)原質(zhì)量較理想等優(yōu)點(diǎn),但同時(shí)又都不同程度地存在算法時(shí)間復(fù)雜度和空間復(fù)雜度過(guò)高的弱點(diǎn)。而小波變換的圖像壓縮編碼算法已成為目前圖像壓縮研究領(lǐng)域的一個(gè)主要方向。小波變換是20 世紀(jì)80 年代后期發(fā)展起來(lái)的一種新的信息處理方法,因其本質(zhì)是多分辨分析信號(hào),在時(shí)域和頻域都具有分辨率,對(duì)高頻分量采用逐漸精細(xì)的時(shí)域或空域步長(zhǎng),可以聚焦到分析對(duì)象的任意細(xì)節(jié),對(duì)于劇烈變換的邊緣,比常規(guī)的傅里葉變換具有更好的適應(yīng)性,故

21、特別適用于分析非平穩(wěn)信號(hào)。2.3 圖像增強(qiáng)與恢復(fù)圖像增強(qiáng)是按照特定的要求突出一幅圖像中的某些信息,同時(shí)削弱或去除某些不需要的信息處理方法,其主要目的是使處理后的圖像對(duì)某種特定的應(yīng)用來(lái)說(shuō),以原來(lái)圖像更適用,它是為了某種應(yīng)用目的去改善圖像質(zhì)量,使圖像更適合于人的視覺(jué)特性或機(jī)器的識(shí)別系統(tǒng)。目前增強(qiáng)方法主要有直方圖修改處理、圖像平滑化處理、圖像尖銳化處理及彩色處理技術(shù)等,由于各種圖像增強(qiáng)算法的特點(diǎn)不同,對(duì)圖像增強(qiáng)的側(cè)重點(diǎn)也不同。在對(duì)圖像進(jìn)行處理之前,首先分析不同圖像增強(qiáng)方法的優(yōu)缺點(diǎn),再對(duì)具體圖像問(wèn)題進(jìn)行具體分析,然后選擇幾種增強(qiáng)方法結(jié)合使用,也許就可能達(dá)到預(yù)期的增強(qiáng)效果。圖像在獲取、傳輸和存儲(chǔ)過(guò)程中由

22、于受多種原因如模糊、失真、噪聲等的影響,會(huì)造成圖像質(zhì)量的下降,即圖像的退化。引起圖像退化的原因很多,在圖像的獲取(數(shù)字化過(guò)程) 和傳輸過(guò)程,如使用CCD 攝像機(jī)獲取圖像,光照程度和傳感器溫度是造成圖像退化的主要因素。圖像在傳輸過(guò)程中主要由于所用的傳輸信道的干擾受到噪聲污染,也會(huì)造成圖像質(zhì)量的下降。圖像恢復(fù)技術(shù)以獲取視覺(jué)質(zhì)量得到某種程度改善為目的,根據(jù)指定的圖像退化模型來(lái)對(duì)在某種情況下退化或降質(zhì)了的退化圖像進(jìn)行恢復(fù),以獲取到原始的、未經(jīng)退化的原始圖像。圖像恢復(fù)首先要建立圖像退化/ 復(fù)原模型,當(dāng)不知道圖像本身的性質(zhì)時(shí),可以建立退化源的數(shù)學(xué)模型,然后施行恢復(fù)算法除去或減少退化源的影響。當(dāng)有了關(guān)于圖像

23、本身的先驗(yàn)知識(shí)時(shí),模型以建立原始圖像的模型,然后在觀測(cè)到的退化圖像中通過(guò)檢測(cè)原始圖像而復(fù)原圖像。常見(jiàn)的圖像恢復(fù)模型有4 種:通用圖像模型,光學(xué)系統(tǒng)模型,攝影過(guò)程模型,離散圖像恢復(fù)模型。在成像系統(tǒng)中一個(gè)通常的缺點(diǎn)是在傳感器和顯示器系統(tǒng)中存在有害的非線性,傳感器信號(hào)的處理后修正和顯示器信號(hào)的處理前修正可以充分減少退化。這種恢復(fù)處理實(shí)現(xiàn)起來(lái)通常相對(duì)簡(jiǎn)單,最常見(jiàn)的圖像恢復(fù)任務(wù)是為了補(bǔ)償圖像模糊和消除噪聲影響而進(jìn)行的空間圖像恢復(fù)。目前通常有以下恢復(fù)技術(shù):傳感器和顯示點(diǎn)的非線性修正,連續(xù)圖像的空間濾波恢復(fù),偽逆空間圖像恢復(fù),SVD 偽逆空間圖像恢復(fù),統(tǒng)計(jì)學(xué)估計(jì)空間圖像恢復(fù),約束圖像恢復(fù),盲目圖像恢復(fù)。2.

24、4 圖像分割圖像分割是圖像處理中的一項(xiàng)關(guān)鍵技術(shù),自20 世紀(jì)70 年代起一直受到人們高度重視,并在醫(yī)學(xué)、工業(yè)、軍事等領(lǐng)域得到了廣泛應(yīng)用。常用的分割方法主要分為基于區(qū)域的分割方法和基于邊緣的分割方法2 類。此外,隨著各學(xué)科的發(fā)展出現(xiàn)了一些結(jié)合某種特定理論的分割方法。2.4.1 基于區(qū)域的分割方法這類方法的基本思想是將圖像分割成若干不重疊的區(qū)域,使各區(qū)域內(nèi)部特征的相似性大于區(qū)域間特征的相似性,各區(qū)域內(nèi)像素都滿足基于灰度、紋理等特征的某種相似性準(zhǔn)則。其常見(jiàn)的方法:閾值法;區(qū)域生長(zhǎng)法;分裂合并法。2.4.2 基于邊緣的分割方法邊緣的主要表現(xiàn)為圖像局部特征的不連續(xù)性,該方法首先檢出圖像中局部特性的不連續(xù)

25、性或突變性,然后將它們連成邊界,這些邊界把圖像分成不同的區(qū)域。 傳統(tǒng)的圖像邊緣檢測(cè)方法大多可歸結(jié)為圖像高頻分量的增強(qiáng)過(guò)程,微分運(yùn)算自然成為邊緣檢測(cè)與提取的主要手段。常用的邊緣檢測(cè)算子有以下幾種:Robert 算子、Sobel 算子、Pre2witt 算子、Canny 算子和拉普拉斯算子。微分算子法的優(yōu)點(diǎn)是計(jì)算簡(jiǎn)單、速度較快,缺點(diǎn)是對(duì)噪聲的干擾都比較敏感。邊界跟蹤法的基本思想是從梯度圖中的一邊緣點(diǎn)出發(fā),依次搜索并連接相鄰邊緣點(diǎn),從而實(shí)現(xiàn)對(duì)圖像邊界的檢測(cè),先確定搜索起點(diǎn),接著采取合適的數(shù)據(jù)結(jié)構(gòu)和搜索機(jī)理,并在已發(fā)現(xiàn)的邊界點(diǎn)上確定新的邊界點(diǎn),最后按照搜索的終結(jié)準(zhǔn)則和終結(jié)條件完成邊界的跟蹤,從而實(shí)現(xiàn)邊

26、緣的提取。圖像分割至今尚無(wú)通用的自身理論,隨著各學(xué)科的不斷發(fā)展,提出了許多新理論和新方法,于是出現(xiàn)了許多與一些特定理論、方法相結(jié)合的圖像分割技術(shù)。 遺傳算法最初由美國(guó)Michigan 大學(xué)的Holland 教授于1975 年提出的,其基本思想是將問(wèn)題域中的可能解視為群體的一個(gè)個(gè)體或染色體,并將每一個(gè)體編碼成符號(hào)串形式,對(duì)種群反復(fù)進(jìn)行選擇、交叉和變異操作,根據(jù)預(yù)定的目標(biāo)適應(yīng)度函數(shù)對(duì)每個(gè)個(gè)體進(jìn)行評(píng)價(jià),適應(yīng)值高的染色體被選中概率較高,以全局并行搜索方式來(lái)搜索優(yōu)化群體中的最優(yōu)個(gè)體。 該方法具有全局搜索能力,是一種迭代式的優(yōu)化算法,在分割圖像時(shí)常用來(lái)幫助確定最佳分割閾值。小波變換是在傅里葉分析基礎(chǔ)上發(fā)展

27、起來(lái)的,具有良好的時(shí)域和頻域局部化特性,而且還具有多分辨分析的特點(diǎn)。基于小波分析的邊緣檢測(cè)方法的突出優(yōu)點(diǎn)是它的多尺度性,圖像的每個(gè)尺度的小波變換都提供了一定的邊緣信息。小尺度下,圖像的邊緣細(xì)節(jié)信息豐富,邊緣定位精度較高,但易受噪聲干擾,大尺度下,邊緣穩(wěn)定,抗噪性好,但定位精度差。利用小波的多尺度性可實(shí)現(xiàn)在大尺度下抑制噪聲,可靠地識(shí)別邊緣,在小尺度下精確定位。Snake 模型最初是由Kass 等人在1987 年第1 屆計(jì)算機(jī)國(guó)際視覺(jué)會(huì)議上提出的,其基本思想是首先通過(guò)人的識(shí)別能力,在圖像中目標(biāo)邊界附近確定初始輪廓線,然后對(duì)曲線進(jìn)行能量最小化變形,使其鎖定在待分割目標(biāo)的邊界上。 Snake 算法能夠

28、有效地利用圖像局部與整體的信息,實(shí)現(xiàn)對(duì)邊界的準(zhǔn)確定位,具有良好的提取和跟蹤特定區(qū)域內(nèi)目標(biāo)輪廓的能力。由于圖像的千變?nèi)f化,在實(shí)際應(yīng)用中,通常將多種分割算法有效地結(jié)合在一起使用以獲得更好的分割效果。2.5 圖像分析圖像分析從圖像中抽取某些有用的度量、數(shù)據(jù)或信息,目的是得到某種數(shù)值結(jié)果,它主要是提供關(guān)于被分析圖像的一種描述,既要利用模式識(shí)別技術(shù),又要利用關(guān)于圖像內(nèi)容的知識(shí)庫(kù),即人工智能中關(guān)于知識(shí)表達(dá)方面的內(nèi)容。 圖像分析需要用圖像分割方法抽取出圖像的特征,然后對(duì)圖像進(jìn)行符號(hào)化的描述,這種描述不僅對(duì)圖像中是否存在某一特定對(duì)象作出回答,還要對(duì)圖像內(nèi)容作出詳細(xì)描述。 圖像分割綜述已上述所述,現(xiàn)分別從描繪和

29、紋理分析這2 個(gè)方面加以闡述。2.5.1 圖像描繪經(jīng)過(guò)圖像分割后,得到的是若干區(qū)域和邊界。 為了有效地識(shí)別目標(biāo),必須要描述這些目標(biāo)即提供它們的有用信息和相互關(guān)系,通常有區(qū)域內(nèi)部描述、區(qū)域邊界描述和關(guān)系描述。(1) 區(qū)域內(nèi)部描述(i) 矩描述子 該描述子是基于帕普里斯( Papoulis) 唯一性定理。M K Hu 在1961 年首先提出不變矩的概念,并將幾何矩用于圖像描述。M R Teague 在1979 年基于正交多項(xiàng)式理論提出的Zernike 矩,從噪聲靈敏度、信息冗余度和圖像描述能力等方面來(lái)說(shuō)都具有很好的性能。Y LSheng 和L X Shen 于1994 年提出了正交傅里葉梅林矩,平

30、子良等定義了一種新的圖像矩切比雪夫圖像矩描述圖像,這種矩可以得到比較理想的描述效果。矩方法是一種經(jīng)典的區(qū)域形狀分析方法,但于它的計(jì)算量較大且受噪聲干擾,缺乏實(shí)用價(jià)值。 (ii) 拓?fù)涿枋鲎?帶有孔的圖形,如果把區(qū)域中的孔洞數(shù)作為拓?fù)涿枋鲎?,顯然這個(gè)性質(zhì)不受伸長(zhǎng)或旋轉(zhuǎn)變換的影響。但是如果撕裂或折疊時(shí),孔洞數(shù)就要變化了,區(qū)域描述的另一種有用的拓?fù)涮匦允沁B接部分的個(gè)數(shù)。(iii) 投影與截痕 圖像在任意方向上的投影可以定義為該圖像諸像素在該方向上對(duì)應(yīng)投影之和,和投影相類似的另一種描述圖像中的對(duì)象方向特性的參數(shù)是截痕,截痕和投影有著同樣的用途。 ()模板匹配(2) 區(qū)域的外形邊界描述方法(i) 傅里葉

31、描述子 當(dāng)一個(gè)區(qū)域邊界上的點(diǎn)已被確定時(shí),可以從這些點(diǎn)中提取信息。這些信息就可以用來(lái)鑒別不同區(qū)域的形狀,Kauppien比較了各種典型形狀識(shí)別方法,實(shí)驗(yàn)表明基于物體輪廓坐標(biāo)序列的傅里葉描述子具有最佳的形狀識(shí)別性能。通過(guò)連續(xù)型傅里葉變換代替離散傅里葉變換的計(jì)算方法,可以減少由于邊界曲線等間距離散化引起的誤差,而且可以大大減少傅里葉變換計(jì)算的工作量。 (ii) 小波輪廓描述子 小波變換是一一對(duì)應(yīng)的映射,所以一個(gè)給定的輪廓對(duì)應(yīng)一組唯一的描述符。小波輪廓描述符比較適合描述輪廓的基本特征并用來(lái)進(jìn)行基于輪廓的圖像檢索。從描述精度、穩(wěn)定性各方面來(lái)看,它比傅里葉描述子更為優(yōu)越。(iii) 霍夫變換 霍夫( Ho

32、ugh) 變換是一種線描述方法,它可以將笛卡爾坐標(biāo)空間的線變換為極坐標(biāo)空間的點(diǎn),霍夫變換使不同坐標(biāo)系中的線和點(diǎn)建立了一種對(duì)應(yīng)關(guān)系。(iiii) 曲線擬合 任何一個(gè)二維圖像目標(biāo)或?qū)ο蟮倪吔缍际瞧矫嬷械囊粭l曲線。對(duì)曲線擬合一個(gè)函數(shù)可用于描述該目標(biāo)的邊界(形狀) 。對(duì)于所擬合函數(shù),總存在一定的擬合誤差。Duda 和Hart 提出一種簡(jiǎn)單的分段線性曲線擬合方法,即重復(fù)端點(diǎn)擬合方法,這種方法類似于采用分裂方法逼近多邊形邊界的技術(shù)。 該方法的優(yōu)點(diǎn)是計(jì)算簡(jiǎn)單,缺點(diǎn)是噪聲數(shù)據(jù)點(diǎn)將引起擬合誤差。多數(shù)情況下,擬合后的曲線只是一種近似,可借助許多方法進(jìn)行調(diào)整,以使邊界更加精確,其中利用高層知識(shí)的處理也是常用的方法。

33、另外,Ho - Keun Song 和Eung - KwaKang 提出了用圓形掃描的方法來(lái)描述圖像。(3) 關(guān)系描述關(guān)系描述的任務(wù)就是把被分割后的區(qū)域或部分組成為有意義的關(guān)系結(jié)構(gòu),一般是以文法概念為基礎(chǔ)的,通??煞譃榇姆ê透呔S文法,其中高維。文法又包括樹(shù)文法、網(wǎng)文法、表結(jié)構(gòu)44 。2.5.2紋理分析結(jié)構(gòu)法、統(tǒng)計(jì)法、頻譜法和模型法是常用的紋理研究方法。 結(jié)構(gòu)法從紋理的基元形態(tài)及其排布規(guī)則角度分析,適用于研究規(guī)則紋理;統(tǒng)計(jì)法從宏觀角度對(duì)紋理進(jìn)行統(tǒng)計(jì)分析,適用于隨機(jī)紋理;頻譜法利用頻域信號(hào)處理方法分析紋理的數(shù)字特征;模型法將紋理看做某種數(shù)學(xué)模型進(jìn)行分析。(1) 結(jié)構(gòu)法結(jié)構(gòu)分析法從紋理圖像的結(jié)構(gòu)角度分析紋理基元形狀和排列分布特征。 紋理基元存在面積、周長(zhǎng)、偏心度、方向、延伸度、歐拉數(shù)、矩、幅度、緊支性等特征。該方法通常首先確定紋理基元,然后根據(jù)句法模式識(shí)別理論,利用形式語(yǔ)言對(duì)紋理的排列規(guī)則進(jìn)行描述。其優(yōu)點(diǎn)是有利于對(duì)紋理構(gòu)成的理解和高層檢索使用,適合于描述人工規(guī)則紋理。對(duì)于自然紋理,由于基元本身提取困難以及基元之間的排布規(guī)則不易用確定

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論