




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、數(shù)字圖象處理概論數(shù)字圖象處理概論1.1 數(shù)字圖像處理及其特點數(shù)字圖像處理及其特點1.1.1 數(shù)字圖像與數(shù)字圖像處理數(shù)字圖像與數(shù)字圖像處理 1. 數(shù)字圖像數(shù)字圖像 用計算機進行圖像處理的前提是圖像必須以數(shù)字格式存儲, 我們把以數(shù)字格式存放的圖像稱之為數(shù)字圖像。常見的各種照片、 圖片、海報、廣告畫等均屬模擬圖像,要將模擬圖像數(shù)字化后生成數(shù)字圖像,需要利用數(shù)字化設備。目前,將模擬圖像數(shù)字化的主要設備是掃描儀,將視頻畫面數(shù)字化的設備有圖像采集卡。當然,也可以利用數(shù)碼照相機直接拍攝以數(shù)字格式存放的數(shù)字圖像。模擬圖像經(jīng)掃描儀進行數(shù)字化或由數(shù)碼照相機拍攝的自然景物圖像,在計算機中均是以數(shù)字格式存儲的。既然是
2、數(shù)字, 計算機當然可以方便地進行各種處理,以達到視覺效果和特殊效果。 第1頁/共66頁 在計算機中,圖像被分割成圖1-1所示的像素(Pixel),各像素的灰度值用整數(shù)表示。一幅MN個像素的數(shù)字圖像,其像素灰度值可以用M行、N列的矩陣G表示: MNMMNNgggggggggG212222111211(1-1)第2頁/共66頁圖1-1 數(shù)字圖像灰度信息數(shù)字化數(shù)字化像素1124421112788721158558611685686116875421158416611483166112611111第3頁/共66頁 2. 數(shù)字圖像處理數(shù)字圖像處理 1) 數(shù)字圖像處理 數(shù)字計算機最擅長的莫過于處理各種數(shù)據(jù)
3、, 數(shù)字化后的圖像可以看成是存儲在計算機中的有序數(shù)據(jù),當然可以通過計算機對數(shù)字圖像進行處理。我們把利用計算機對圖像進行去除噪聲、 增強、復原、分割、提取特征等的理論、 方法和技術稱為數(shù)字圖像處理(Digital Image Processing)。一般, 圖像處理是用計算機和實時硬件實現(xiàn)的, 因此也稱之為計算機圖像處理(Computer Image Processing)。 第4頁/共66頁 在日常生活中,圖像處理已經(jīng)得到廣泛應用。例如, 電腦人像藝術, 電視中的特殊效果,自動售貨機鈔票的識別, 郵政編碼的自動識別和利用指紋、 虹膜、 面部等特征的身份識別等。在醫(yī)學領域,很早以前就采用X射線透
4、視、 顯微鏡照片等來診斷疾病?,F(xiàn)在,計算機圖像處理已成為疾病診斷的重要手段, 用一般攝影方法不能獲取的身體內部的狀況,也能由特殊的圖像處理裝置獲取, 最具有代表性的就是X射線CT(Computed Tomograph, 計算機斷層攝像)。 第5頁/共66頁 2) 數(shù)字圖像處理的重要意義數(shù)字圖像處理的重要意義 數(shù)字圖像處理的產生和迅速發(fā)展主要受如下三個方面的影響。 一是計算機的發(fā)展。早期的計算機無論在計算速度或存儲容量方面,難于滿足對龐大圖像數(shù)據(jù)進行實時處理的要求。隨著計算機硬件技術及數(shù)字化技術的發(fā)展,計算機、內存及外圍設備的價格急劇下降,而其性能卻有了大幅度的提高。過去只能用大型計算機完成的龐
5、大處理,現(xiàn)在,在個人計算機(PC機)上也能夠輕而易舉地實現(xiàn)。 二是數(shù)學的發(fā)展, 特別是離散數(shù)學理論的創(chuàng)立和完善,為數(shù)字圖像處理奠定了理論基礎。 第6頁/共66頁 三是軍事、醫(yī)學和工業(yè)等方面應用需求的不斷增長。自20世紀20年代,圖像處理首次應用于改善倫敦和紐約之間海底電纜發(fā)送的圖片質量以來,經(jīng)過幾十年的研究與發(fā)展,數(shù)字圖像處理的理論和方法進一步完善,應用范圍更加廣闊,已經(jīng)成為一門新興的學科,并在向更高級的方向發(fā)展。如在景物理解和計算機視覺(機器視覺)方面,圖像處理已由二維處理發(fā)展到三維理解或解釋。特別是在景物理解和機器視覺方面, 圖像也已由二維處理變成三維解釋。近幾年來, 隨著計算機和各個相關
6、領域研究的迅速發(fā)展, 科學計算可視化、 多媒體技術等研究和應用的興起, 數(shù)字圖像處理從一個專門領域的學科, 變成了一種新型的科學研究和人機界面的工具。第7頁/共66頁1.1.2 數(shù)字圖像處理的特點數(shù)字圖像處理的特點 數(shù)字圖像處理是利用計算機的計算, 實現(xiàn)與光學系統(tǒng)模擬處理相同效果的過程。數(shù)字圖像處理具有如下特點: (1) 處理精度高,再現(xiàn)性好。利用計算機進行圖像處理, 其實質是對圖像數(shù)據(jù)進行各種運算。由于計算機技術的飛速發(fā)展,計算精度和計算的正確性勿庸置疑; 另外,對同一圖像用相同的方法處理多次,也可得到完全相同的效果,具有良好的再現(xiàn)性。 (2)處理的多樣性。由于圖像處理是通過運行程序進行的,
7、 因此,設計不同的圖像處理程序,可以實現(xiàn)各種不同的處理目的。 第8頁/共66頁 (3) 圖像數(shù)據(jù)量龐大。圖像中包含有豐富的信息,可以通過圖像處理技術獲取圖像中包含的有用的信息,但是,數(shù)字圖像的數(shù)據(jù)量巨大。一幅數(shù)字圖像是由圖像矩陣中的像素(Pixel)組成的,通常每個像素用紅、 綠、 藍三種顏色表示, 每種顏色用8 bit表示灰度級。則一幅10241024不經(jīng)壓縮的真彩色圖像, 數(shù)據(jù)量達3 MB(即102410248 bit3=24 Mb)。X射線照片一般用64256 Kb的數(shù)據(jù)量,一幅遙感圖像為32402340430 Mb。如此龐大的數(shù)據(jù)量給存儲、傳輸和處理都帶來巨大的困難。如果精度及分辨率再
8、提高,所需處理時間將大幅度增加。 第9頁/共66頁 (4) 處理費時。由于圖像數(shù)據(jù)量大,因此處理比較費時。特別是處理結果與中心像素鄰域有關的處理過程(如第四章介紹的區(qū)處理方法)花費時間更多。 (5) 圖像處理技術綜合性強。數(shù)字圖像處理涉及的技術領域相當廣泛,如通信技術、計算機技術、電子技術、電視技術等, 當然,數(shù)學、物理學等領域更是數(shù)字圖像處理的基礎。 第10頁/共66頁1.2 數(shù)字圖像處理的目的和主要內容數(shù)字圖像處理的目的和主要內容 1.2.1 數(shù)字圖像處理的目的數(shù)字圖像處理的目的 一般而言, 對圖像進行加工和分析主要有如下三方面的目的: (1) 提高圖像的視感質量, 以達到賞心悅目的目的。
9、如去除圖像中的噪聲, 改變圖像的亮度、顏色,增強圖像中的某些成份、 抑制某些成份,對圖像進行幾何變換等,從而改善圖像的質量, 以達到或真實的、或清晰的、或色彩豐富的、或意想不到的藝術效果。 第11頁/共66頁 (2) 提取圖像中所包含的某些特征或特殊信息, 以便于計算機分析,例如,常用作模式識別、計算機視覺的預處理等。這些特征包括很多方面, 如頻域特性、灰度顏色特性、邊界區(qū)域特性、 紋理特性、 形狀拓撲特性以及關系結構等。 (3) 對圖像數(shù)據(jù)進行變換、 編碼和壓縮, 以便于圖像的存儲和傳輸。 第12頁/共66頁1.2.2 數(shù)字圖像處理的主要內容數(shù)字圖像處理的主要內容 不管圖像處理是何種目的,都
10、需要用計算機圖像處理系統(tǒng)對圖像數(shù)據(jù)進行輸入、加工和輸出,因此數(shù)字圖像處理研究的內容主要有以下7個過程。 1. 圖像獲取、表示和表現(xiàn)(圖像獲取、表示和表現(xiàn)(Image Acquisition, Representation and Presentation) 該過程主要是把模擬圖像信號轉化為計算機所能接受的數(shù)字形式,以及把數(shù)字圖像顯示和表現(xiàn)出來(如打?。_@一過程主要包括攝取圖像、 光電轉換及數(shù)字化等幾個步驟。 第13頁/共66頁 2. 圖像復原(圖像復原(Image Restoration) 當造成圖像退化(圖像品質下降)的原因已知時, 復原技術可以對圖像進行校正。圖像復原最關鍵的是對每種退化
11、都需要有一個合理的模型。例如,掌握了聚焦不良成像系統(tǒng)的物理特性, 便可建立復原模型,而且對獲取圖像的特定光學系統(tǒng)的直接測量也是可能的。退化模型和特定數(shù)據(jù)一起描述了圖像的退化,因此, 復原技術是基于模型和數(shù)據(jù)的圖像恢復,其目的是消除退化的影響, 從而產生一個等價于理想成像系統(tǒng)所獲得的圖像。 第14頁/共66頁 3. 圖像增強(圖像增強(Image Enhancement) 圖像增強是對圖像質量在一般意義上的改善。當無法知道圖像退化有關的定量信息時,可以使用圖像增強技術較為主觀地改善圖像的質量。所以,圖像增強技術是用于改善圖像視感質量所采取的一種方法。因為增強技術并非是針對某種退化所采取的方法,
12、所以很難預測哪一種特定技術是最好的, 只能通過試驗和分析誤差來選擇一種合適的方法。有時可能需要徹底改變圖像的視覺效果,以便突出重要特征的可觀察性,使人或計算機更易觀察或檢測。在這種情況下, 可以把增強理解為增強感興趣特征的可檢測性,而非改善視感質量。電視節(jié)目片頭或片尾處的顏色、輪廓等的變換, 其目的是得到一種特殊的藝術效果,增強動感和力度。 第15頁/共66頁 4. 圖像分割(圖像分割(Image Segmentation) 把圖像分成區(qū)域的過程就是圖像分割。圖像中通常包含多個對象, 例如, 一幅醫(yī)學圖像中顯示出正常的或有病變的各種器官和組織。圖像處理為達到識別和理解的目的,幾乎都必須按照一定
13、的規(guī)則將圖像分割成區(qū)域, 每個區(qū)域代表被成像的一個物體(或部分)。 圖像自動分割是圖像處理中最困難的問題之一。人類視覺系統(tǒng)的優(yōu)越性, 使得人類能夠將所觀察的復雜場景中的對象分開, 并識別出每個物體。但對計算機來說, 這卻是一個難題。目前,大部分圖像的自動分割還需要人工提供必需的信息來幫助,只有一部分領域(如印刷字符自動識別(OCR)、 指紋識別等)開始使用。由于解決和分割有關的基本問題是特定領域中圖像分析實用化的關鍵一步,因此,將各種方法融合在一起并使用知識來提高處理的可靠性和有效性是圖像分割的研究熱點。 第16頁/共66頁 5. 圖像分析圖像分析 圖像處理應用的目標幾乎均涉及到圖像分析, 即
14、對圖像中的不同對象進行分割、 特征提取和表示,從而有利于計算機對圖像進行分類、 識別和理解。 在工業(yè)產品零件無缺陷且正確裝配檢測中, 圖像分析是對圖像中的像素轉化成一個“合格”或“不合格的判定。在有的應用中,如醫(yī)學圖像處理,不僅要檢測出物體(如腫瘤)的存在, 而且還要檢查物體的大小。 第17頁/共66頁 6. 圖像重建圖像重建 圖像重建與上述的圖像增強、 圖像復原等不同。圖像增強、 圖像復原的輸入是圖像,處理后輸出的結果也是圖像,而圖像重建是指從數(shù)據(jù)到圖像的處理,即輸入的是某種數(shù)據(jù),而經(jīng)過處理后得到的結果是圖像, CT就是圖像重建處理的典型應用實例。目前,圖像重建與計算機圖形學相結合,把多個二
15、維圖像合成三維圖像,并加以光照模型和各種渲染技術,能生成各種具有強烈真實感的高質量圖像。 第18頁/共66頁 7. 圖像壓縮編碼圖像壓縮編碼 數(shù)字圖像的特點之一是數(shù)據(jù)量龐大。盡管現(xiàn)在有大容量的存貯器, 但仍不能滿足對圖像數(shù)據(jù)(尤其是動態(tài)圖像、高分辨率圖像)處理的需要, 因此在實際應用中圖像壓縮是必需的。如果數(shù)據(jù)不壓縮,則在存儲和傳輸中就需要占很大的容量和帶寬, 因而增加了成本。圖像壓縮的目的就是壓縮數(shù)據(jù)量。 第19頁/共66頁 圖像編碼主要是利用圖像信號的統(tǒng)計特性及人類視覺的生理學及心理學特性,對圖像信號進行高效編碼,即研究數(shù)據(jù)壓縮技術,目的是在保證圖像質量的前提下壓縮數(shù)據(jù),便于存儲和傳輸,以
16、解決數(shù)據(jù)量大的矛盾。一般來說,圖像編碼的目的有三個: 減少數(shù)據(jù)存儲量;降低數(shù)據(jù)率以減少傳輸帶寬; 壓縮信息量, 便于特征提取,為后續(xù)識別作準備。 第20頁/共66頁 從編碼技術發(fā)展來看,Kunt提出第一代、第二代編碼的概念。第一代編碼是以去除冗余為基礎的編碼方法,如PCM、 DPCM、 M、 亞取樣編碼法、DFT、DCT、 W-H變換編碼法以及以此為基礎的混合編碼法。第二代編碼法多為20世紀80年代以后提出的,如金字塔編碼法、Fractal編碼法、小波變換編碼法、基于神經(jīng)網(wǎng)絡的編碼法、模型基編碼法等。這些編碼方法有如下特點: 充分考慮人的視覺特性; 恰當?shù)乜紤]對圖像信號的分解與表述; 采用圖像
17、的合成與識別方案壓縮數(shù)據(jù)。 第21頁/共66頁1.3 圖像工程與相關學科圖像工程與相關學科 1.3.1 圖像工程的內涵圖像工程的內涵 圖像工程的內容非常豐富,根據(jù)抽象程度和研究方法等的不同,可分為圖像處理、圖像分析和圖像理解三個層次,如圖1-2所示。換句話說,圖像工程是既有聯(lián)系又有區(qū)別的圖像處理、 圖像分析及圖像理解三者的有機結合, 另外還包括它們的工程應用。 第22頁/共66頁圖1-2 圖像工程三層次示意圖 圖像理解符號目標像素高層中層低層高低抽象程度數(shù)據(jù)量操作對象小大語義圖像分析圖像處理第23頁/共66頁 2. 圖像分析圖像分析 圖像分析主要是對圖像中感興趣的目標進行檢測和測量, 以獲得它
18、們的客觀信息,從而建立對圖像的描述。如果說圖像處理是一個從圖像到圖像的過程,則圖像分析就是一個從圖像到數(shù)據(jù)的過程。這里的數(shù)據(jù)可以是目標特征的測量結果, 或是基于測量的符號表示,它們描述了目標的特點和性質。 第24頁/共66頁 3. 圖像理解圖像理解 圖像理解的重點是在圖像分析的基礎上, 進一步研究圖像中各目標的性質和它們之間的相互聯(lián)系,并得出對圖像內容含義的理解以及對原來客觀場景的解釋, 從而指導決策。如果說圖像分析主要是以觀察者為中心研究客觀世界,那么圖像理解在一定程度上就是以客觀世界為中心,借助知識、經(jīng)驗等來把握整個客觀世界(包括沒有直接觀察到的事物)。 第25頁/共66頁 可見,圖像處理
19、、圖像分析和圖像理解是處在三個抽象程度和數(shù)據(jù)量各有特點的不同層次上。圖像處理是比較低層的操作, 它主要在圖像像素級上進行處理, 處理的數(shù)據(jù)量非常大。圖像分析則進入了中層,分割和特征提取把原來以像素描述的圖像轉變成比較簡潔的非圖像形式的描述。圖像理解主要是高層操作, 基本上是對從描述抽象出來的符號進行運算,其處理過程和方法與人類的思維推理有許多類似之處。 根據(jù)本課程的任務和目標,本書重點放在圖像處理上,并學習圖像分析的基本理論和方法。第26頁/共66頁1.3.2 相關學科和領域相關學科和領域 圖像工程是一門系統(tǒng)地研究各種圖像理論、技術和應用的交叉學科。從它的研究方法來看,它可以與數(shù)學、物理學、生
20、理學、心理學、電子學、計算機科學等許多學科相互借鑒。從它的研究范圍來看,它與模式識別、 計算機視覺、 計算機圖形學等多個專業(yè)互相交叉。另外,圖像工程的研究進展與人工智能、神經(jīng)網(wǎng)絡、 遺傳算法、模糊邏輯等理論和技術都有密切的聯(lián)系,它的發(fā)展應用與醫(yī)學、遙感、通信、文檔處理和工業(yè)自動化等許多領域也是密不可分的。 第27頁/共66頁 圖像工程與計算機圖形學(Computer Graphics)、 模式識別(Pattern Recognition)、 計算機視覺(Computer Vision)等的關系如圖1CD*23所示。計算機圖形學研究的是用計算機技術生成圖形的理論、方法和技術,即由非圖像形式的數(shù)據(jù)
21、描述來生成逼真的圖像。它可以生成現(xiàn)實世界中已經(jīng)存在的物體的圖形,也可以生成虛構物體的圖形, 它和圖像分析的對象和輸出結果正好對調。圖像模式識別與圖像分析則比較相似,只是前者試圖把圖像分解成可用符號較抽象地描述的類別。計算機視覺主要強調用計算機實現(xiàn)人的視覺功能, 要用到圖像工程三個層次的許多技術, 但目前的研究內容主要與圖像理解相結合。 第28頁/共66頁圖1-3 圖像工程與相關學科的聯(lián)系和區(qū)別 圖像(轉換)圖像理解圖像分析計算機視覺模式識別計算機圖形學客觀世界圖像理解圖像處理人圖像符號數(shù)據(jù)新理論新概念新工具第29頁/共66頁1.4 數(shù)字圖像處理系統(tǒng)數(shù)字圖像處理系統(tǒng) 1.4.1 數(shù)字圖像處理系統(tǒng)
22、硬件數(shù)字圖像處理系統(tǒng)硬件 早期的數(shù)字圖像處理系統(tǒng)為了提高處理速度、增加容量都采用大型機。隨著計算機性價比(性能價格比)日新月異的提高,以小型機為主的微型圖像處理系統(tǒng)得到發(fā)展。主機為PC機, 配以圖像采集卡及顯示設備就構成了最基本的微型圖像處理系統(tǒng)。目前,國產的CA540、VP32、FGCT11010N8、 CA-CPE-1000、CA-CPE-3000等圖像板研制成功并已商品化。微型圖像處理系統(tǒng)成本低、應用靈活、便于推廣。特別是微型計算機的性能逐年提高,使得微型圖像處理系統(tǒng)的性能也不斷升級,加之軟件配置豐富,使其更具實用意義。 第30頁/共66頁圖1-4 圖像處理系統(tǒng)示意圖 圖像數(shù)字化 設 備
23、輸入圖像圖像處理計 算 機輸出圖像圖像輸出設備第31頁/共66頁 1) 電視攝像機電視攝像機(Video Camera) 電視攝像機是目前使用最廣泛的圖像獲取設備。電視攝像機的核心部件是光電轉換裝置,也稱為固態(tài)陣。目前大多數(shù)感光基元多為電荷耦合器件CCD(Charge Coupled Device),CCD可以將照射在其上的光信號轉換為對應的電信號。該設備小巧、 速度快、成本低、靈敏度高,多作為實時圖像輸入設備應用。但灰度層次較差、非線性失真較大、有黑斑效應,在使用中需要校正。目前,CCD攝像機可達19201035的高分辨率,快門速度可達10-4s。 第32頁/共66頁 2) 掃描儀(掃描儀(
24、Scanner) 掃描儀是將各種形式的圖像信息(如圖片、 照片、 膠片及文稿資料等)輸入計算機的重要工具,特點是精度和分辨率高。目前,1200DPI(Dot Per Inch)以上精度的掃描儀很常見。而且掃描儀的成本很低,一臺平板式掃描儀的價格在千元左右。由于掃描儀良好的精度和低廉的價格,已成為當今應用最為廣泛的圖像數(shù)字化設備。但用掃描儀獲取圖像信息速度較慢,不能實現(xiàn)實時輸入。 第33頁/共66頁 3) 數(shù)碼照相機(數(shù)碼照相機(Digital Camera) 數(shù)碼照相機也叫數(shù)字相機, 是一種能夠進行景物拍攝, 并以數(shù)字格式存放拍攝圖像的特殊照相機。它的核心部件是CCD圖像傳感器, 主流機型分辨
25、率已在400萬像素以上。數(shù)碼照相機的感光器件也是CCD陣列。CCD可以對亮度進行分級,但并不能識別顏色。為此,數(shù)碼照相機用紅、綠和藍三個彩色濾鏡,當光線從紅、 綠、 藍濾鏡中穿過時,就可以得到每種色光的反應值,再通過軟件對得到的數(shù)據(jù)進行處理,從而確定每一個像素點的顏色。CCD生成的數(shù)字圖像被傳送到照相機的一塊內部芯片上。該芯片負責把圖像轉換成相機內部的存儲格式(通常為JPEG格式)。最后, 把生成的圖像保存在存儲卡中。 數(shù)碼照相機可通過USB接口與計算機相連,將拍攝的圖像下載到計算機中,以便處理或插到文檔Web頁面中,或用彩色打印機輸出。 第34頁/共66頁 4) 遙感圖像獲取設備遙感圖像獲取
26、設備 遙感中常用的圖像獲取設備有光學攝影設備, 如攝像機、 多光譜像機等; 紅外攝影設備,如紅外輻射計、 紅外攝像儀、 多通道紅外掃描儀、 多光譜掃描儀(MSS);微波設備,如微波輻射計、 側視雷達、 真空孔徑雷達、 合成孔徑雷達(SAR)。第35頁/共66頁 2. 圖像輸入卡(采集卡圖像輸入卡(采集卡) 通常圖像輸入卡安裝于計算機主板擴展槽中, 主要包括圖像存儲器單元、 顯示查找表(LUT)單元、 CCD攝像頭接口(A/D)、 監(jiān)視器接口(D/A)和PC機總線接口單元。工作過程如下:攝像頭實時或準實時采集圖像數(shù)據(jù), 經(jīng)A/D變換后將圖像存放在圖像存儲單元的一個或三個通道中,D/A變換電路自動
27、將圖像顯示在監(jiān)視器上。通過主機發(fā)出指令, 將某一幀圖像靜止在存儲通道中, 即采集或捕獲一幀圖像,然后可對圖像進行處理或存盤。高檔卡還包括卷積濾波、FFT(快速傅立葉變換)等圖像處理專用的快速部件?,F(xiàn)在有的圖像采集卡將圖像和圖形功能合為一體,如北京大恒圖像視覺有限公司開發(fā)的VIDEO-PCI-C真彩色圖像采集卡。該卡基于PCI總線設計,它將圖像和VGA的圖形功能合為一體, 可在計算機屏幕上實時顯示彩色活動圖像, 其分辨率為768576。 第36頁/共66頁 3. 顯示卡顯示卡 顯示卡是記憶和保存圖像的地方, 通常, 存貯的圖像要隨時顯示在顯示器上。PC機多采用800600或1024768個像素點
28、。通常在圖像處理裝置中, 灰度值紅(R)、 綠(G)、 藍(B)各占8位(bit), 共計24位,可以表示1670萬種顏色, 這種顯示卡稱為真彩色顯示卡。 第37頁/共66頁 4. 計算機計算機 圖像處理的主要特點是數(shù)據(jù)量大、運算時間長,因而對系統(tǒng)硬件配置要求較高。目前,在PC機上配置奔騰P4 2.4 G以上CPU、512 MB內存、 80 G以上硬盤的計算機已屬常見,計算速度大幅度提高,可與幾年前的大型機媲美。為了加快圖像的顯示和處理速度,用于圖像處理的PC機配置應盡可能高一些。當然,有條件時最好采用圖形工作站進行圖像處理。 第38頁/共66頁 5. 圖像存貯裝置圖像存貯裝置 圖像數(shù)據(jù)量龐大
29、,早期其存儲成為問題。到目前為止, 除了大容量磁盤可供存儲圖像數(shù)據(jù)之外,MO、CD、DVD等光學存儲裝置以及SAN、NAS等網(wǎng)絡存儲系統(tǒng),為存儲海量圖像數(shù)據(jù)提供了極好的支持。 第39頁/共66頁1.4.2 高速圖像處理卡高速圖像處理卡 實用圖像處理系統(tǒng)分為在線處理系統(tǒng)和離線處理系統(tǒng)兩種形式。在研究中,多采用離線圖像處理系統(tǒng),主要用于開發(fā)和驗證圖像處理與分析的算法。在線圖像處理系統(tǒng)除上述設備外, 還需用圖像處理專用硬件代替圖像采集卡,以構成自動處理系統(tǒng), 可以對生產現(xiàn)場采集的圖像進行實時處理,并對其處理結果進行監(jiān)控。下面簡要介紹夏普公司研發(fā)的GPB-K高速圖像處理卡。 第40頁/共66頁 GPB
30、-K可以安裝在計算機的PCI擴展槽上,是一種高速、 高性能的圖像處理板卡。操作系統(tǒng)為Windows NT或MS-DOS。圖像的輸入可從圖像文件調用,也可由攝像機輸入。板卡上的視頻輸入端有6路,最多可同時輸入3路信號,可通過函數(shù)進行選擇。當輸入視頻圖像時, 可選擇GPB-K的內部和外部的輸入同步信號,輸出圖像能在標準的VGA監(jiān)視器上顯示,輸入和輸出與GPB-K的其他處理不必同步,所以對攝像機的幀頻也沒有限制。GPB-K在板卡上固化了包含約300個函數(shù)的圖像處理庫。GPB-K函數(shù)由Microsoft VC+ 5.0版本做成。對于像素灰度為8 bit的灰度圖像而言,能處理的圖像最大尺寸為102410
31、24,但處理視頻圖像的最大尺寸為640480。GPB-K可以根據(jù)目標區(qū)域ROI(Region Of Interest)來指定處理的區(qū)域。處理區(qū)域設定得越小, 處理時間相應就越短。 第41頁/共66頁 GPB-K中使用了夏普公司的通用圖像處理大規(guī)模集成電路SALA, 具有高速、 高性能的特點, 圖像處理的速度達一個像素40 ns??梢酝ㄟ^硬件實現(xiàn)圖像灰度變換、圖像間的運算、濾波處理、 特征提取等。 圖1-5給出了GPB-K的整體硬件結構方框圖。GPB-K板卡由SALA-LSI,攝像機的輸入、顯示、擴展連接、模板匹配(MAP)、 各單元的圖像存儲器及PCI總線組成,由于各個單元分別與4根8 bit
32、的圖像總線連接, 因此可處理圖像數(shù)據(jù)。 GPB-K主要應用于制造業(yè)的檢測等領域,例如,尺寸的測量(導桿寬度、 螺距), 外觀檢查(裂紋檢查、 根據(jù)顏色判別優(yōu)劣), 文字識別(制造年月日、 產品批號),印刷電路板檢查(跨接線、 過孔、 焊盤)等。 第42頁/共66頁圖1-5 GPB-K硬件結構方框圖 擴展口圖像存儲器8個圖像存儲器8個圖像存儲器8個圖像存儲器8個BUS-SWITCHBUS-SWITCH圖像存儲器VGA3圖像存儲器3個A/DSALA2MAPD/APCIBUSVGA監(jiān)視器視頻輸入黑白:6 CH彩色:2 CH圖像總線8 bit4第43頁/共66頁1.4.3 圖像處理系統(tǒng)軟件圖像處理系統(tǒng)
33、軟件 微型圖像處理系統(tǒng)既包含硬件設備,也需要一定的軟件環(huán)境支持。目前,圖像處理系統(tǒng)平臺多為Microsoft Windows或X-Windows,開發(fā)的主流工具為Microsoft公司的VC+。這是因為VC+是一種具有高度綜合性能的軟件開發(fā)工具, 用它開發(fā)出來的程序有著運行速度快、可移植能力強等優(yōu)點。本書中實例也是在Windows平臺下,用VC+ 6.0實現(xiàn)的。此外,各國的科學家和研究機構開發(fā)了不少專用的圖像處理軟件環(huán)境,下面僅對主要的幾種作一簡單介紹。 第44頁/共66頁 1. MATLAB的圖像處理工具箱的圖像處理工具箱 MATLAB是由美國MathWorks公司推出的用于數(shù)值計算的有力工
34、具, 它具有相當強大的矩陣運算和操作功能, 并且MATLAB圖像處理工具箱提供了豐富的圖像處理函數(shù),靈活運用這些函數(shù)幾乎可以完成所有的圖像處理工作,從而大大節(jié)省編寫低層算法代碼的時間, 避免程序設計中的重復勞動,達到事半功倍的效果。但是,MATLAB強大的功能只能在安裝有MATLAB系統(tǒng)的機器上使用圖像處理工具箱中的函數(shù)或自編的m文件來實現(xiàn),實際應用極為不便,且MATLAB使用行解釋方式執(zhí)行代碼, 執(zhí)行速度很慢。 第45頁/共66頁 為將MATLAB的強大功能融入各種應用程序中,通過高級語言編譯器編譯為二進制代碼已逐漸成為研究熱點。MathTools公司推出的MatCom可以把MATLAB語言
35、翻譯成為或C+語言, 但其翻譯的代碼不夠簡捷。更直接的方法是利用MatCom提供的MatrixC+庫實現(xiàn)MATLAB與C+的接口。該方法細節(jié)請參考本書第七章。 第46頁/共66頁 2. AVS和和SPIDER 1) AVS(Application Visualization System) AVS是對龐大的數(shù)據(jù)量進行可視化處理的通用系統(tǒng)之一。最初,該系統(tǒng)是為了對科學計算的結果進行可視化(Scientific Visualization)處理而開發(fā)的系統(tǒng),現(xiàn)在已經(jīng)在如下領域中廣泛使用。 醫(yī)學圖像、 有限元法分析、 流體力學、 檢測實驗結果的表示; 資源探索、 環(huán)境科學、 遙感、 一般圖像處理;
36、量子力學、 分子設計、 CAD數(shù)據(jù)表示、 OR分析; 金融數(shù)據(jù)分析、 一般科學分析。 第47頁/共66頁AVS作為應用軟件具有如下強大的功能: 數(shù)據(jù)顯示: Pointer和Clicker類型數(shù)據(jù)的可視化應用。幾何顯示: 可以進行人機對話的三維幾何數(shù)據(jù)的顯示。圖像顯示: 可以進行人機對話的二維圖像的顯示。圖形顯示: 完成畫圖功能。超函數(shù): 圖像處理、 聲音波形圖。 第48頁/共66頁 2) SPIDER Viewer SPIDER(Subroutine Package for Image Data Enhancement and Recognition)是由日本通產省工業(yè)技術院電子技術綜合研究所
37、開發(fā)的圖像處理程序庫, 如表1-1所示。它包含了圖像處理領域中的基本算法和實現(xiàn)方法,因此得到了很高的評價,之后又追加了基本的圖像分析算法,立體圖像、距離圖像、文本、畫面處理等領域的算法, 稱之為SPIDER II, 目前已經(jīng)得到了廣泛的應用。 第49頁/共66頁第50頁/共66頁第51頁/共66頁第52頁/共66頁 3. IUE 對圖像處理和圖像理解算法優(yōu)劣的評價是非常困難的。為此, 世界范圍內的圖像工程科研人員就評價問題進行了研討,以構建可重復利用的軟件開發(fā)環(huán)境。IUE(Image Understanding Environment)就是以美國為主,日本和歐洲共同參加開發(fā)的圖像處理系統(tǒng)。該系
38、統(tǒng)可以實現(xiàn)圖像理解計算模型的確立,進行嚴密的幾何學描述,能應用于各種類型的圖像,從而提高研究效率, 促進技術積累和技術轉移。 針對上述目標,IUE有效利用現(xiàn)有軟件,開發(fā)了運行在UNIX工作站上(SunOS、 Linux)的面向對象的程序(C+),并從LaTeX自動生成C+源代碼,以滿足實際需要。 第53頁/共66頁 IUE不僅提供函數(shù)庫和數(shù)據(jù)庫,為了能正確地描述有關光源、 物體、傳感器等幾何學和光學的關系,還提供了類的分層結構關系。并且也提供了坐標系和坐標變換的類,它是用矢量圖來表示的。這種類有600個,還有400個模板及類成員, 可以說它是一個巨大的資源庫。IUE系統(tǒng)不單是圖像處理系統(tǒng),而且
39、還是由輸入圖像轉換為三維場景描述的圖像理解的信息環(huán)境。在此環(huán)境中,可以處理圖像數(shù)據(jù),線段、區(qū)域、面等幾何數(shù)據(jù), 以及對于認識、理解的高級處理時的知識表達、幾何數(shù)據(jù)之間關系的符號數(shù)據(jù)等。 第54頁/共66頁1.5 數(shù)字圖像處理的應用數(shù)字圖像處理的應用 數(shù)字圖像處理主要應用于下面的幾個領域。 1) 通訊 通訊包括圖像傳輸、電視電話、 電視會議等, 主要是進行圖像壓縮甚至理解基礎上的壓縮。 2)宇宙探測 由于太空技術的發(fā)展,需要用數(shù)字圖像處理技術處理大量的星體照片。 第55頁/共66頁 3) 遙感遙感 航空遙感和衛(wèi)星遙感圖像需要用數(shù)字技術加工處理,并提取有用的信息。主要用于地形地質,礦藏探查, 森林
40、、 水利、 海洋、 農業(yè)等資源調查, 自然災害預測預報,環(huán)境污染監(jiān)測, 氣象衛(wèi)星云圖處理以及地面軍事目標的識別。 第56頁/共66頁 4) 生物醫(yī)學領域中的應用 圖像處理在醫(yī)學界的應用非常廣泛,無論是臨床診斷還是病理研究都大量采用圖像處理技術。它的直觀、無創(chuàng)傷、安全方便等優(yōu)點備受青睞。圖像處理首先應用于細胞分類、染色體分類和放射圖像等。70年代數(shù)字圖像處理在醫(yī)學上的應用有了重大突破, 1972年X射線斷層掃描CT得到實用;1977年白血球自動分類儀問世;1980實現(xiàn)了CT的立體重建。有人認為計算機圖像處理在醫(yī)學上應用最成功的例子就是X射線CT, 其中主要研制者Hounsfeld(英)和Comm
41、ack(美)獲得了1979年的諾貝爾生理醫(yī)學獎。 第57頁/共66頁 5) 工業(yè)生產中的應用 在生產線中對產品及部件進行無損檢測是圖像處理技術的重要應用領域。該領域的應用從70年代起取得了迅速的發(fā)展,主要有產品質量檢測、生產過程的自動控制、CADCAM等。在產品質量檢測方面,如食品、水果質量檢查,無損探傷,焊縫質量或表面缺陷。又如,金屬材料的成分和結構分析,紡織品質量檢查, 光測彈性力學中應力條紋的分析等。在電子工業(yè)中,可以用來檢驗印刷電路板的質量、監(jiān)測零件部件的裝配等。在工業(yè)自動控制中,主要使用機器視覺系統(tǒng)對生產過程進行監(jiān)視和控制, 如港口的監(jiān)測調度、交通管理、流水生產線的自動控制等。在計算機輔助設計和輔助制造方面,已獲得越來越廣泛的應用,并和基于圖形學的模具、機械零件、服裝、印染花型CAD結合。目前二維圖紙自動輸入和理解,根據(jù)3D實物建立CAD模型等越來越引起重視。 第58頁/共66頁 6) 軍事、軍事、 公安等
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 河北省邯鄲市三龍育華中學2024-2025學年高二下學期第二次月考(文化班)歷史試卷(含答案)
- 南通科技職業(yè)學院《大學生職業(yè)生涯規(guī)劃與創(chuàng)業(yè)基礎》2023-2024學年第二學期期末試卷
- 遼寧省葫蘆島錦化高中2025屆高三下學期第2次月考數(shù)學試題含解析
- 云南省江川一中2024-2025學年高三入學摸底考試物理試題理試題含解析
- 浙江省湖州市德清縣2025年五下數(shù)學期末考試試題含答案
- 焦作市2024-2025學年初三下第二次檢測試題英語試題含答案
- 江西省南昌市十四校2024-2025學年初三第一次模擬考試(三診)英語試題含答案
- 山西大學《系統(tǒng)工程基礎》2023-2024學年第一學期期末試卷
- 江西理工大學《正書創(chuàng)作與研究》2023-2024學年第二學期期末試卷
- 中國海洋大學《數(shù)字軟件設計1》2023-2024學年第一學期期末試卷
- HYT 191-2015 海水冷卻水中鐵的測定(正式版)
- 煤礦職工應知應會知識考試題庫(含答案)
- 行政復議法-形考作業(yè)2-國開(ZJ)-參考資料
- 深基坑開挖與支護施工監(jiān)理實施細則
- 中班-社會語言-好鄰居-課件(互動版)
- MSDS中文版(鋰電池電解液)
- 2024年新鄉(xiāng)職業(yè)技術學院單招職業(yè)適應性測試題庫及答案解析
- 中國綜合設施管理(IFM)市場發(fā)展現(xiàn)狀和未來五年前景分析
- 小細胞肺癌的治療方案
- 新生兒吸入性肺炎的護理課件
- 工作進度保證措施
評論
0/150
提交評論