基于聚類的智能圖像分析算法畢業(yè)(論文)設計論文_第1頁
基于聚類的智能圖像分析算法畢業(yè)(論文)設計論文_第2頁
基于聚類的智能圖像分析算法畢業(yè)(論文)設計論文_第3頁
基于聚類的智能圖像分析算法畢業(yè)(論文)設計論文_第4頁
基于聚類的智能圖像分析算法畢業(yè)(論文)設計論文_第5頁
已閱讀5頁,還剩61頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、基于聚類的智能圖像分析算法畢業(yè)設計論文基于聚類的智能圖像分析算法摘要智能圖像處理技術在眾多領域得到了廣泛應用。在具有監(jiān)控、報警等功能的安防系 統(tǒng)中,在自然基因顯微系統(tǒng)中,在模式識別系統(tǒng)中等,智能圖像處理技術都起到了不可 小覷的作用。目前基于內(nèi)容的智能圖像識別與分類技術在準確性具體應用方面還面臨著許多難 題。本文通過介紹智能圖像分析方法及相關算法理論,重點研究以SVM算法為代表的監(jiān)督分類算法及以k-means聚類算法為代表的費監(jiān)督分類算法,并結(jié)合 Hu圖像矩不變 特征,對圖像進行聚類分析及分類。在理論學習的基礎上,運用MatLab實現(xiàn)算法并驗證應用效果。有監(jiān)督分類方面,本文采用了提取能夠較好的保

2、持圖像的邊緣、形狀等特性的Hu矩不變特征作為訓練特征,分類方法采用了基于聚類的SVM算法。在提取出訓練樣本的特征值后,將其輸入SVM的訓練網(wǎng)絡進行訓練。最后將待分類圖片輸入即可得到分 類結(jié)果。本文計算出了該非監(jiān)督分類方式分類結(jié)果的準確性,并對其進行了分析與討論。無監(jiān)督分類方面,本文采用了 k-mea ns分類方法。預先設定好分類的類別數(shù)后,輸 入待分類圖片,則系統(tǒng)通過調(diào)用分類函數(shù),將自動分類的結(jié)果輸出。在算法研究的基礎上,設計并實現(xiàn)了水果圖像智能分析應用系統(tǒng),具有創(chuàng)建特征值 數(shù)據(jù)庫、創(chuàng)建訓練網(wǎng)絡、圖像有監(jiān)督分類和圖像無監(jiān)督分類等功能。當進行圖像有監(jiān)督 分類,即SVM算發(fā)分類時,準確率可達到將近

3、 70%。關鍵詞 SVM k-means圖像分類Intelligent Image Analysis Based on Clustering AlgorithmABSTRACTIn tellige nt image process ing tech no logy has bee n widely applied in many fields. In mon itori ng and alarm security system, in n atural gene microscope, and in the middle pattern recog niti on system, in tel

4、lige nt image process ing tech no logy has played highly importa nt role.Curre ntly conten t-based image recog niti on and classificati on of in tellige nt tech no logy are facing many problems in specific application for accuracy. This paper will describes in tellige nt image an alysis method and a

5、lgorithm theory, mea nwhile comb ines with the same characteristics of HU image mome nts, and focuses on the SVM algorithm for classificati on and supervisi on of represe ntatives of the costs of supervised classificati on algorithms. In the theoretical study, verify the applicati on of results base

6、d on the use of MatLab algorithm.In the phase of supervis ing classificati on, this paper used Hu mome nts in varia nt feature as a trai ning feature that can keep the extracted image edge, shape and other characteristics using SVM-based clustering algorithm. After extracting samples characteristic

7、value, put into SVMs trai ning n etwork to have trai ning. Fi nally the in put image can be classified by the classification results. This paper concludes the approach to the classification of non-supervised classificatio n accuracy of the results mean while an alyzes and discussesthe accuracy.This

8、paper used K-me nas classificatio n method in the field of un supervised classificati on. After pre-configuring data, put into classified image, and then by calling the classification fun cti on, the system will output the results of automatic classificati on.Based on algorithm, design and implement

9、ation of fruit intelligent image analysis applicati on system with a characteristic value database,trai ning n etwork, image supervised classificati on and image un supervised classificati on features. Whe n the image has supervised classificatio n, the SVM classificati on count classificati on, the

10、 accuracy rate can reach n early 70%.KEY WORDS SVM k-means Image classification II目錄 TOC o 1-5 h z HYPERLINK l bookmark6 o Current Document 第一章 緒論 1 HYPERLINK l bookmark8 o Current Document 1.1 智能圖像分析概述 11.1.1 課題背景 11.1.2 國內(nèi)外研究現(xiàn)狀 2 HYPERLINK l bookmark10 o Current Document 聚類分析 3 HYPERLINK l bookmar

11、k12 o Current Document 課題目標及本文研究內(nèi)容 31.3.1預期目標 3主要研究內(nèi)容 31.3.3系統(tǒng)方案 41.3.4本文的結(jié)構(gòu) 4 HYPERLINK l bookmark14 o Current Document 第二章 技術基礎 5圖像特征 52.2圖像分類方法 5圖像分類概念 5圖像分類原理 6圖像分類方法 6 HYPERLINK l bookmark16 o Current Document MatLab 及圖像智能處理工具箱 7 HYPERLINK l bookmark18 o Current Document 第三章 圖像矩不變特征提取 9 HYPERLI

12、NK l bookmark20 o Current Document 3.1圖像矩不變特征介紹 11 HYPERLINK l bookmark22 o Current Document 3.2圖像矩不變特征提取 12 HYPERLINK l bookmark24 o Current Document 第四章 分類算法 144.1SVM 分類算法 14k-mea ns 分類算法16 HYPERLINK l bookmark26 o Current Document 第五章 基于 MatLab 的圖像分析軟件實現(xiàn) 19 HYPERLINK l bookmark28 o Current Docume

13、nt 5.1軟件功能及系統(tǒng)流程 19 HYPERLINK l bookmark30 o Current Document 關鍵函數(shù)詳述 195.2.1圖像灰度化 195.2.2圖像平滑與圖像銳化 205.2.2.1中值濾波 205.2.2.2圖像銳化 215.2.3 Hu 矩不變特征值 215.2.4 SVM 神經(jīng)網(wǎng)絡的建立和訓練 22525 k-mea ns 分類函數(shù)24 HYPERLINK l bookmark36 o Current Document 第六章 系統(tǒng)測試 26 HYPERLINK l bookmark38 o Current Document 6.1 系統(tǒng)界面 26 HYP

14、ERLINK l bookmark40 o Current Document 6.2 功能測試及統(tǒng)計 306.2.1 訓練樣本 306.2.2 結(jié)果與分析 30 HYPERLINK l bookmark42 o Current Document 第七章 結(jié)論與展望 33 HYPERLINK l bookmark44 o Current Document 結(jié)果與結(jié)論 33 HYPERLINK l bookmark46 o Current Document 問題與展望 33 HYPERLINK l bookmark48 o Current Document 7.3心得體會 33 HYPERLINK

15、 l bookmark50 o Current Document 參考文獻 35致 謝 36北京郵電大學本科畢業(yè)設計(論文) 第一章緒論1.1智能圖像分析概述隨著我國人民生活水平的提高,數(shù)碼相機、DV機等攝影器材得到了極大范圍的普 及,數(shù)字圖像的數(shù)量也在飛速增長,同時,互聯(lián)網(wǎng)的普及使得人們對于圖像檢索的需求 大大增加。近年來,為了滿足人們?nèi)找嬖鲩L的生活、學習、工作、娛樂等各方面的需要 數(shù)字圖書館中儲存了數(shù)以萬計的圖像。圖像處理技術從一開始就是一個基于線性代數(shù)、統(tǒng)計理論和物理學之上,具有很強 理論背景的研究領域,它需要廣泛的基礎知識,包括計算機科學、數(shù)字信號處理、隨機 過程和統(tǒng)計數(shù)學、矩陣分析、

16、信息論、控制論和最優(yōu)化理論等。同時,圖像處理又是一 門與應用緊密結(jié)合的學科,應用領域涉及計算機視覺、地理、氣象、航空航天、醫(yī)療保 健、刑事偵查等。1.1.1 課題背景在20世紀初,運用機器來處理圖片是一件非常困難的事。但隨著計算機硬件、圖 像獲取設備、顯示設備的不斷改進和各種高性能能工作站的出現(xiàn),圖像處理技術迅猛發(fā) 展。而信息時代的到來,又無疑使圖像處理技術進入了一個更加蓬勃發(fā)展的階段,特別 是以多媒體技術、通信技術、信息存儲技術和以In ternet為代表的計算機網(wǎng)絡技術的加速發(fā)展以及高清晰度電視的深入應用研究,圖像處理技術研究和應用前景更為廣闊。數(shù)字圖像處理所涉及的知識非常廣泛,具體的研究

17、方法種類繁多。傳統(tǒng)的圖像處理 技術主要集中在圖像的獲取、變換、增強、恢復(還原)、壓縮編碼、分割與邊緣提取等方面,并且隨著新工具、新方法的不斷出現(xiàn),這些圖像處理技術也一直在更新與發(fā)展。 近十多年來,隨著信息技術的發(fā)展,圖像特征分析、圖像配準、圖像融合、圖像分類、 圖像識別、基于內(nèi)容的圖像檢索與圖像數(shù)字水印等領域取得長足的進展。這些圖像處理 技術反映了人類的智力活動,它在計算機上模仿、延伸和擴展了人的智能,具有智能化 處理功能,因而稱之為智能圖像處理技術。其中最具代表性的是圖像分類技術以及基于 內(nèi)容的圖像檢索。圖像分類就是利用計算機對圖像進行定量分析,把圖像中的每個像元或區(qū)域劃歸為若干個類別中的

18、一種,以代替人的視覺判讀。圖像分類的過程就是模式識別的過程,是 目視判讀的延伸和發(fā)展。圖像分類主要用于遙感、醫(yī)學與軍事等領域。以遙感圖像分析為例,遙感技術是通 過對遙感傳感器接收到的電磁波輻射信息特征的分析來識別地物類型的,這可以通過人工目視解釋來實現(xiàn),或是用計算機進行自動分類處理,也可以用人工目視解釋與計算機 自動分類處理相結(jié)合來實現(xiàn)。用計算機對遙感圖像進行地物類型識別是遙感圖像數(shù)字處理的一個重要內(nèi)容,也是模式識別技術在遙感技術領域中的具體應用?;趦?nèi)容的圖像檢索就是根據(jù)圖像的語義和感知特征進行檢索,具體實現(xiàn)就是從圖像數(shù)據(jù)中提取出特定的信息線索(或特征指標),然后根據(jù)這些線索從大量存儲在圖像

19、 數(shù)據(jù)庫的圖像中進行查找,檢索出具有相似特征的圖像數(shù)據(jù)。與傳統(tǒng)的基于關鍵詞的數(shù) 據(jù)庫檢索相比,具有相似度檢索、近似檢索和要求給出檢索結(jié)果的集合限制等特點。人們常說“物以類聚,人以群分”。面對數(shù)量龐大的圖像信息,尋找一種方便快捷、 直接有效的對圖像進行分類方法已經(jīng)成為進行圖像處理工作的重要基礎和必不可少的 重要環(huán)節(jié),尤其是對于基于內(nèi)容的圖像檢索具有極其重要的作用。聚類分析分類方法是 先對圖像按照某種相似性原則進行聚類,把相似的圖像聚合為一類,檢索過程在類內(nèi)進 行,從而大大的縮小圖像檢索范圍,就能夠達到快速、準確檢索圖像的目的。1.1.2 國內(nèi)外研究現(xiàn)狀人類從一出生,人眼就在不斷地接受、分析和理解

20、周圍的景物,這是人類的一種本 能活動。在計算機技術的不斷發(fā)展中,人類更是將這一本能發(fā)揮的淋漓盡致。在20世紀70-80年代,圖像處理的研究方向主要集中于用圖像變換和數(shù)學模型來表征圖像信號。 20世紀80年代中期,各種高性能的工作站和個人電腦應用的普及使圖像處理研究和應 用不再僅僅是大機構(gòu)和大型學術團體的“專利”?,F(xiàn)在隨著In ternet的廣泛普及。圖像處 理技術和應用前景將更為廣闊。從應用的角度來看,數(shù)字照相技術、電子影像、數(shù)字化電視機、圖像數(shù)據(jù)庫和多媒 體技術的出現(xiàn)都在推動這一領域不斷地向前發(fā)展。總的來說,圖像處理技術將不再局限 于電子工程研究領域,它已設計到其他學科,如計算機科學、地理、

21、醫(yī)療保健、刑事偵 查等領域。另外,除了處理位于可視頻譜范圍的圖像信號外,在過去的20年里,對射電望遠鏡形成的圖像、紅外圖像、合成孔徑雷達(Synthetic Aperture Radar.SAR)圖像的研究都非常活躍。特別是 CT和核磁共振的利用都極大地豐富了這一領域研究的內(nèi) 容。除了上述這些研究領域外,圖像處理技術研究人員還積極地眷力于紋理和圖形形狀 的分析與識別、運動檢測與估計、圖像處理并行系統(tǒng)、圖像處理技術的軟硬兼研究等工 作。由于圖像處理技術從一開始就具有很強的理論背景,因此一些具有高魯棒性的圖像處理算法已經(jīng)應用到消費類型的產(chǎn)品中,一些較成熟的算法也已逐步形成公認的標準。如在20世紀8

22、0年代末逐步規(guī)劃形成、20世紀90年代全面公布的H.263,JEPG,MPEG-2 等圖像壓縮與傳輸標準使圖像處理技術在產(chǎn)業(yè)化方面取得巨大的成功。最近的成果也將在JPEG2000標準中體現(xiàn)一一標準中將用近年來圖像變換研究的新成果:小波變換來取 代原來的DCT變換,這是因為小波變換克服了傅里葉變換不具有時頻局部性質(zhì)的缺陷, 并且和DCT 一樣具有快速算法。圖像處理技術發(fā)展非???,隨著基礎理論研究的不斷推前、更新,各種新穎的圖像 處理技術層出不窮。就近年來產(chǎn)生了大量研究結(jié)果的圖像分類算法來說,從有無監(jiān)督的監(jiān)督劃分為有監(jiān)督分類和無監(jiān)督分類。無監(jiān)督分類方法中K-mea ns分類方法得到了廣泛的研究,P

23、aredes等利用K-means算法對訓練圖像塊區(qū)生成的 KD樹進行類似類別搜索, 得到了不錯的分類效果。但傳統(tǒng)K-means算法搜索匹配效率低,特別是對于高維的大型 數(shù)據(jù)集,搜索分類非常費時。Stefan Berchtold等提出了一種預先計算 K-means不相似 測度的動態(tài)解空間的方法,簡化了計算,提高了搜索分類效率。Bin Zhang等采用基于聚類的樹算法加速K-means,而不用預先計算K-means不相似測度的特性和矩陣式,從 而更大的加快了算法的速度,并減小了計算準確性的損失。另一類在圖像分類中廣泛使 用的有監(jiān)督分類方法是支持向量機(SVM )分類。何靈敏等采用基于徑向基核函數(shù)的

24、 SVM方法對遙感圖像分類,并證實采用一對多的SVM分類方法比BP神經(jīng)網(wǎng)絡方法更適合于對復雜小樣本多原數(shù)據(jù)的分類,蔣蕓等將粗糙集理論與SVM結(jié)合起來,利用粗糙集理論處理大數(shù)據(jù)量、消除冗余信息等方面的優(yōu)勢,減少訓練數(shù)據(jù),提高了 SVM的 分類能力。大部分SVM方法都采用單一的核函數(shù)的類型,當采用局部核函數(shù)則學習能 力強、泛化性能較弱,采用全局性核函數(shù)則泛化性能強、學習能力較弱。1.2聚類分析聚類分析(cluster analysis)是一種將研究對象分為相對同質(zhì)的群組(clusters)的統(tǒng)計分 析技術。聚類分析也叫分類分析 (classification analysis)或數(shù)值分類(nume

25、rical taxonomy), 是用數(shù)學的方法來研究和處理給定對象的分類,即對同類型對象抽象出其共性,從而形成 類。聚類分析是一種數(shù)值分類方法(即完全是根據(jù)數(shù)據(jù)關系)。要進行聚類分析就要首先建立一個由某些事物屬性構(gòu)成的指標體系,或者說是一個變量組合。入選的每個指標 必須能刻畫事物屬性的某個側(cè)面,所有指標組合起來形成一個完備的指標體系,它們互 相配合可以共同刻畫事物的特征。所謂完備的指標體系,是說入選的指標是充分的,其 它任何新增變量對辨別事物差異無顯著性貢獻。如果所選指標不完備,則導致分類偏差。簡單地說,聚類分析的結(jié)果取決于變量的選擇和變量值獲取的兩個方面。變量選擇 越準確、測量越可靠,得到

26、的分類結(jié)果越是能描述事物各類間的本質(zhì)區(qū)別。13課題目標及本文研究內(nèi)容預期目標本論文擬將智能分類技術應用于圖像的自動識別,以水果圖像分類為目標,研究其特征提取方法及智能分類算法,實現(xiàn)基于Matlab平臺的水果圖像智能分析軟件。主要研究內(nèi)容論文主要研究內(nèi)容包括:圖像特征提取方法研究:分析圖像的典型特征,并研究Hu矩不變特征值的計算方法。分類算法研究:在理解算法原理的基礎上運用算法,實現(xiàn)算法功能并分析比較算法 性能。智能圖像分析軟件實現(xiàn):系統(tǒng)以MatLab為平臺,通過用戶界面形式實現(xiàn)了基于聚 類的智能圖像分類軟件,具有建立根據(jù)現(xiàn)有圖庫訓練網(wǎng)絡、對任一圖像實現(xiàn)分類并以圖 文結(jié)合方式展現(xiàn)分類結(jié)果等功能。

27、1.3.3 系統(tǒng)方案論文以水果圖像的分類為目標,通過圖像的預處理、特征提取與分類,基于MatLab 實現(xiàn)圖像的智能分析。在圖像預處理階段,系統(tǒng)將對輸入圖像進行灰度化、中值濾波以 及銳化并提取圖像邊緣的操作。特征提取階段,系統(tǒng)將計算出輸入圖像的圓度、拉伸度、 周長等中間值,將這些必要的中間值帶入 Hu特征迭代計算公式,即可獲得后續(xù)處理所 需要的特征值向量。分類階段,系統(tǒng)為用戶提供了選擇界面。當使用者選擇SVM分類方法時,系統(tǒng)將通過使用圖庫訓練學習的方式得到分類結(jié)果。當使用者選擇K-means分類時,系統(tǒng)將得到自主聚類的分類結(jié)果。1.3.4 本文的結(jié)構(gòu)本文分為七個部分,各部分的內(nèi)容依次如下:第一章

28、,緒論。介紹要解決的主要問題問題。第二章,技術基礎。介紹本文涉及到的知識以及使用的工具。第三章,圖像矩不變特征提取。對本文采用的訓練特征進行詳細介紹。第四章,分類算法。對本文用到的兩類不同的分類算法進行詳細介紹。第五章,算法軟件實現(xiàn)。對系統(tǒng)涉及的核心算法、關鍵函數(shù)以及系統(tǒng)界面進行詳細 的介紹。第六章,系統(tǒng)測試。第七章,結(jié)論與展望。論文的成果總結(jié)及不足展望。第章技術基礎2.1圖像特征圖像特征指的是圖像場中可用作圖像標志的屬性,通??梢苑譃榻y(tǒng)計特征與視覺特征兩大類。統(tǒng)計特征包括直方圖、頻譜和矩等,是人為特征,需要經(jīng)過變換才能得到。 視覺特征指的是具有直觀意義的圖像的形狀與顏色特征,如顏色、紋理、形

29、狀等。圖像 特征的提取和分析是智能圖像分析的關鍵步驟。近年來,隨著多媒體技術的發(fā)展,許多 圖像特征被研究人員發(fā)掘并利用,為進一步的圖像處理提供了極大地便利。對于某幅特定圖像,根據(jù)不同的需要,通常要提取其不同的特征,因而一幅圖像又 有了許多不同的表達方式。也就是說,圖像的不同特征從各個角度反映了圖像在這個特 定維度中的特點。在圖像統(tǒng)計特征中,直方圖描述的是圖片顯示范圍內(nèi)的灰度分布曲線,它的橫軸從 左到右代表照片從黑(暗部)到白(亮度)的像素數(shù)量。頻譜是以橫軸縱軸的波紋方式, 記錄畫出圖像中包含的各種信號頻率的圖形資料,是圖像信號的頻域表征。矩特征表征 了圖像區(qū)域的幾何特征,又稱為幾何矩,其具有平

30、移、旋轉(zhuǎn)、尺度等特性的不變特征,又 稱其為不變矩。也是本文中應用到得特征。在視覺特征中,顏色特征是一種全局特征,表征了圖像區(qū)域所對應的景物的表面性 質(zhì),是基于像素點的特征。紋理特表征了圖像區(qū)域所對應景物的表面性質(zhì)征,也是一種 全局特征,但是紋理特征不是基于像素點的特征,它需要在包含多個像素點的區(qū)域中進 行統(tǒng)計計算。形狀特征由其集合屬性(長短、距離、面積、凹凸)、統(tǒng)計屬性(投影)、拓撲屬性(歐拉數(shù)、連通)表征,是圖像最本質(zhì)的特征反映。不變矩特征由于其在圖像 平移、伸縮、旋轉(zhuǎn)時均保持不變,而且具有全局性,是圖像識別的主要方法,廣泛的應 用于機器視覺、目標識別與分類、紋理分析等等。Hu首先提出了七個

31、幾何不變矩用于圖像識別,利用不變矩進行形狀識別獲得了廣泛的應用。 后來人們進行了多方面的研究, 發(fā)現(xiàn)不變矩還具有絕對的獨立性,沒有信息冗余現(xiàn)象,抽樣性能好,抗噪能力強,更適 合用于幾何不變圖像描述和識別。本文就將使用到 Hu的不變矩特征。2.2圖像分類方法2.2.1 圖像分類概念從人眼角度看,提高圖像對比對、增加視覺維度、進行空間變換或濾波,其目的就 是讓人們能夠憑借知識和經(jīng)驗,根據(jù)圖像色調(diào)、亮度、位置、紋理以及結(jié)構(gòu)等特征,準 確的對圖像類型或者目標,做出正確的判斷和解釋,并根據(jù)當下的需求,對所需圖像進 行繪制處理。圖像分類就是通過計算機對圖像進行定量的分析的過程,把圖像中的各個像素或者 區(qū)域

32、劃歸到若干類別中的一類去,以代替人眼的視覺判讀。圖像分類的過程其實是一個 模式識別的過程,是人眼目視判讀的延續(xù)以及發(fā)展。圖像分類具有計算精度高、速度快、 圖像測量準確度高等特點。222 圖像分類原理圖像分類的理論依據(jù)是:圖像中的同類景物在相同條件下,應具有相同或類似的光 譜信息特征,從而體現(xiàn)出某種同類景物的某種內(nèi)在相似性,即同類景物像素的特征向量 將聚類于同一特征的空間區(qū)域,從而不同的景物的光譜信息特征和空間信息特征不同, 它們將聚類于不同特征的空間區(qū)域。從統(tǒng)計決策理論來看,圖像分類在數(shù)學上就是對呈現(xiàn)統(tǒng)計可變的數(shù)據(jù)作出決策的過 程。將一個像素歸入任一類別的決策,可以說是統(tǒng)計上的一種明智的“猜測

33、”。統(tǒng)計決策比較成熟,對模式不太復雜的應用已經(jīng)相當?shù)某晒Γ荒芊从衬J浇Y(jié)構(gòu)特性,概率 表示形式使使用上也存在局限性。神經(jīng)網(wǎng)絡分類方法是只能信息處理的重要內(nèi)容,它可以處理一些環(huán)境復雜、背景不 清楚、推理規(guī)則不明確的問題。2.2.3 圖像分類方法用統(tǒng)計方法進行圖像分類時,首先從待分類對象中提取能夠反映對象屬性的特征向 量,并將這些向量定義在一個特征空間之中。之后運用統(tǒng)計決策的方法對特征空間進行 劃分,用以區(qū)分不同特征對應的對象,進而達到分類的目的。同時,在分類的過程中, 按照有無樣本學習可以分為非監(jiān)督分類法和監(jiān)督分類法。監(jiān)督分類就是用已知的類別樣本選擇特征參數(shù)和建立判別函數(shù),對各個像素進行分類。

34、通常意義上的監(jiān)督分類包含以下兩個具體的分類方法。1.最小距離分類法最小距離分類法是最簡單的監(jiān)督分類方法。這種方法的基本思想是:從訓練樣本中 提取各個類別對應的均值向量并求出待測向量到各個均值向量的距離,比較后將待測類別歸入距離最小的一類中。設待分類像素X二伙必2.人丁到類別的距離為di=|x-z|( i =1,2,,m)式(2-1)其中,m為類別數(shù),乙為類的中心。當di二河監(jiān)心2.最大似然分類(多類分類)最大似然分類建立在貝葉斯準則上,其分類正確率最高,是風險最小的判決分析。 在n維特征空間中,待測像素=以律2.人對于類的條件概率密度函數(shù)P(X/i)和類 打的先驗概率P(均已知,則最大似然分類

35、法建立的判別函數(shù)集為:Dj(x)=P( i)P(x/ J( i=1,2,.m)式(2-2)若則X三當x服從咼維正態(tài)分布時,有P(xr i)二n1 exp - (x - zj i (x - Zi)式(2-3)0)2|匚|22而非監(jiān)督分類則需要在進行分類之前獲得類別的先驗屬性,通過這個屬性求出判別函數(shù)中的未知參數(shù)。在先驗屬性未知的情況下將所有樣本就將所有樣本劃分為若干個類 別的方法稱為費監(jiān)督分類,這種方法是根據(jù)像素間的相似度大小進行聚類。在聚類過程 中,通常是按照某種相似性準則來對樣本進行合并或分離。像素聚類有兩種途徑:迭代法與非迭代法。迭代法先給定一個初始分類,然后通過 迭代算法找到能夠使準則函

36、數(shù)取極值的最優(yōu)聚類結(jié)果,因此這是一個動態(tài)聚類分析過 程。常用動態(tài)聚類法有K-means算法、LBG算法和分裂算法。2.3 MatLab及圖像智能處理工具箱MatLab是Matrix Laboratory (矩陣實驗室)的縮寫,是一款由美國 Math Works公 司出品的商業(yè)數(shù)學軟件。MatLab是一款用于數(shù)據(jù)可視化、算法開發(fā)、數(shù)據(jù)分析以及數(shù) 值計算的高級技術計算語言和交互式環(huán)境。除了矩陣運算、繪制函數(shù)/數(shù)據(jù)圖像等常用功 能外,MatLab還可以用來創(chuàng)建用戶界面及與調(diào)用其它語言(包括C,C+和FORTRAN)編寫的程序。盡管MatLab主要用于數(shù)值運算,但利用為數(shù)眾多的附加工具箱(Toolbo

37、x)它也適 合不同領域的應用,例如圖像處理、控制系統(tǒng)設計與分析、信號處理與通訊、金融建模 和分析等。另外還有一個配套軟件包 Simulink,提供了一個可視化開發(fā)環(huán)境,常用于系 統(tǒng)模擬、動態(tài)/嵌入式系統(tǒng)開發(fā)等方面。本系統(tǒng)的功能實現(xiàn)就是是借助 MatLab的工具箱完成的。Vapnik經(jīng)過多年研究,提 出了統(tǒng)計學理論和一種新的經(jīng)驗建模工具:支持向量機(Support Vector Mach in e,SVM)。SVM的訓練是依據(jù)統(tǒng)計學理論中的結(jié)構(gòu)風險最小化原則,在最小化經(jīng)驗風險的同時最 小化SVM的模型復雜度,提高了模型的泛化能力。盡管如此,SVM訓練為一個有約束的二次規(guī)劃問題,其約束條件數(shù)等于訓

38、練樣本容量,因此在用于大訓練樣本容量的建模北京郵電大學本科畢業(yè)設計(論文) 問題時,會導致訓練時間過長。針對SVM這一缺點,Suykens提出了損失函數(shù)為二次函數(shù),約束條件為等式形式的支持向量機:最小二乘支持向量機( Least Squares Support Vector Machine,LSSVM)。LSSVM的訓練問題為一個線性方程組求解問題,相對于SVM訓練的二次規(guī)劃問題求解,其計算量有了很大的降低。此次系統(tǒng)所用的工具包為由比利時魯汶大學的K.Pelckmans以及J.A.K.Suykens等開發(fā)的LS-SVMlab Toolbox( Version 1.5)。此工具箱實現(xiàn)了基于 SV

39、M算法的多類分類。 此外,在展現(xiàn)運行結(jié)果時用到了MatLab中的GUI用戶界面設計。圖形用戶界面(Graphical User In terface簡稱GUI,又稱圖形用戶接口)是指采用圖形方式顯示的計 算機操作用戶接口。北京郵電大學本科畢業(yè)設計(論文) 第三章圖像矩不變特征提取常用的圖像特征有顏色特征、紋理特征、形狀特征、空間關系特征。一顏色特征(一)特點:顏色特征是一種全局特征,描述了圖像或圖像區(qū)域所對應的景物的表面性質(zhì)。 一般顏色特征是基于像素點的特征, 此時所有屬于圖像或圖像區(qū)域的像素都有各自的貢 獻。由于顏色對圖像或圖像區(qū)域的方向、大小等變化不敏感,所以顏色特征不能很好地 捕捉圖像中

40、對象的局部特征。(二)常用的特征提取與匹配方法顏色直方圖。其優(yōu)點在于:它能簡單描述一幅圖像中顏色的全局分布,即不同色彩 在整幅圖像中所占的比例,特別適用于描述那些難以自動分割的圖像和不需要考慮物體 空間位置的圖像。其缺點在于:它無法描述圖像中顏色的局部分布及每種色彩所處的空 間位置,即無法描述圖像中的某一具體的對象或物體。(三)常用的顏色空間:RGB顏色空間、HSV顏色空間。顏色直方圖特征匹配方法:直方圖相交法、距離法、中心距法、參考顏色表法、累 加顏色直方圖法。二紋理特征(一)特點:紋理特征也是一種全局特征,它也描述了圖像或圖像區(qū)域所對應景物的表 面性質(zhì)。但由于紋理只是一種物體表面的特性,并

41、不能完全反映出物體的本質(zhì)屬性,所 以僅僅利用紋理特征是無法獲得高層次圖像內(nèi)容的。與顏色特征不同,紋理特征不是基 于像素點的特征,它需要在包含多個像素點的區(qū)域中進行統(tǒng)計計算。在模式匹配中,這 種區(qū)域性的特征具有較大的優(yōu)越性,不會由于局部的偏差而無法匹配成功。作為一種統(tǒng) 計特征,紋理特征常具有旋轉(zhuǎn)不變性,并且對于噪聲有較強的抵抗能力。但是,紋理特 征也有其缺點,一個很明顯的缺點是當圖像的分辨率變化的時候,所計算出來的紋理可能會有較大偏差。另外,由于有可能受到光照、反射情況的影響,從2-D圖像中反映出來的紋理不一定是3-D物體表面真實的紋理。(二)常用的特征提取與匹配方法紋理特征描述方法分類(1)統(tǒng)

42、計方法統(tǒng)計方法的典型代表是一種稱為灰度共生矩陣的紋理特征分析方法Gotlieb和Kreyszig等人在研究共生矩陣中各種統(tǒng)計特征基礎上,通過實驗,得出灰度共生矩陣的四個關鍵特征:能量、慣量、熵和相關性。統(tǒng)計方法中另一種典型方法,則是從圖像的自相關函數(shù)(即圖像的能量譜函數(shù))提取紋理特征,即通過對圖像的能量譜 函數(shù)的計算,提取紋理的粗細度及方向性等特征參數(shù)(2)幾何法所謂幾何法,是建立在紋理基元(基本的紋理元素)理論基礎上的一種紋理特征分析方法。紋理基元理論認為,復雜的紋理可以由若干簡單的紋理基元以一定的有規(guī)律的 形式重復排列構(gòu)成。在幾何法中,比較有影響的算法有兩種:Voronio棋盤格特征法和結(jié)

43、構(gòu)法。(3)模型法模型法以圖像的構(gòu)造模型為基礎,采用模型的參數(shù)作為紋理特征。典型的方法是隨 機場模型法,如馬爾可夫(Markov)隨機場(MRF)模型法和 Gibbs隨機場模型法(4)信號處理法紋理特征的提取與匹配主要有:灰度共生矩陣、Tamura紋理特征、自回歸紋理模型、小波變換等?;叶裙采仃囂卣魈崛∨c匹配主要依賴于能量、慣量、熵和相關性四個參數(shù)。Tamura 紋理特征基于人類對紋理的視覺感知心理學研究,提出6種屬性,即:粗糙度、對比度、方向度、線像度、規(guī)整度和粗略度。自回歸紋理模型(simultaneous auto-regressive, SAR 是馬爾可夫隨機場(MRF )模型的一種

44、應用實例。三形狀特征(一)特點:各種基于形狀特征的檢索方法都可以比較有效地利用圖像中感興趣的目標 來進行檢索,但它們也有一些共同的問題,(二)常用的特征提取與匹配方法通常情況下,形狀特征有兩類表示方法,一類是輪廓特征,另一類是區(qū)域特征。圖 像的輪廓特征主要針對物體的外邊界,而圖像的區(qū)域特征則關系到整個形狀區(qū)域。幾種典型的形狀特征描述方法:(1) 邊界特征法該方法通過對邊界特征的描述來獲取圖像的形狀參數(shù)。其中Hough變換檢測平行直線方法和邊界方向直方圖方法是經(jīng)典方法。Hough變換是利用圖像全局特 性而將邊緣像素連接起來組成區(qū)域封閉邊界的一種方法,其基本思想是點一線的對偶性;邊界方向直方圖法首

45、先微分圖像求得圖像邊緣,然后,做出關于邊緣大小和方向的 直方圖,通常的方法是構(gòu)造圖像灰度梯度方向矩陣。(2)傅里葉形狀描述符法傅里葉形狀描述符(Fourier shape descriptors基本思想是用物體邊界的傅里葉變換作 為形狀描述,利用區(qū)域邊界的封閉性和周期性,將二維問題轉(zhuǎn)化為一維問題。由邊界點 導出三種形狀表達,分別是曲率函數(shù)、質(zhì)心距離、復坐標函數(shù)。(3)幾何參數(shù)法形狀的表達和匹配采用更為簡單的區(qū)域特征描述方法,例如采用有關形狀定量測度(如矩、面積、周長等)的形狀參數(shù)法(shape facto)在QBIC系統(tǒng)中,便是利用圓 度、偏心率、主軸方向和代數(shù)不變矩等幾何參數(shù),進行基于形狀特

46、征的圖像檢索。四空間關系特征特點:所謂空間關系,是指圖像中分割出來的多個目標之間的相互的空間位置或相 對方向關系,這些關系也可分為連接/鄰接關系、交疊/重疊關系和包含/包容關系等。通 ??臻g位置信息可以分為兩類:相對空間位置信息和絕對空間位置信息。前一種關系強 北京郵電大學本科畢業(yè)設計(論文) 北京郵電大學本科畢業(yè)設計(論文) 調(diào)的是目標之間的相對情況,如上下左右關系等,后一種關系強調(diào)的是目標之間的距離 大小以及方位。顯而易見,由絕對空間位置可推出相對空間位置,但表達相對空間位置 信息常比較簡單。空間關系特征的使用可加強對圖像內(nèi)容的描述區(qū)分能力,但空間關系特征常對圖像或目標的旋轉(zhuǎn)、反轉(zhuǎn)、尺度變

47、化等比較敏感。另外,實際應用中,僅僅利用空間信息往往是 不夠的,不能有效準確地表達場景信息。為了檢索,除使用空間關系特征外,還需要其 它特征來配合。常用的特征提取與匹配方法:提取圖像空間關系特征可以有兩種方法:一種方法是首先對圖像進行自動分割,劃 分出圖像中所包含的對象或顏色區(qū)域,然后根據(jù)這些區(qū)域提取圖像特征,并建立索引; 另一種方法則簡單地將圖像均勻地劃分為若干規(guī)則子塊,然后對每個圖像子塊提取特 征,并建立索引。3.1圖像矩不變特征介紹矩特征主要表示了圖像區(qū)域內(nèi)的幾何特征,又稱為幾何矩,由于其具有平移、旋轉(zhuǎn)、 尺度等特性的不變特征,所以又稱其為矩不變。在圖像處理中,幾何矩不變可以被用來 當做

48、一個重要的特征來表示物體,可以據(jù)此特征來對圖像進行分類等操作。幾何矩是在在 1962 年被 Hu(Visual pattern recognition by moment invariants)提出的, 矩不變的主要思想是通過使用對變換不敏感的基于區(qū)域的幾個矩作為形狀特征。矩是描述圖像特征的算子,在圖像分析與模式識別領域中有重要的應用。迄今為止,常見的矩 描述子可以分為以下幾種:正交矩、幾何矩、旋轉(zhuǎn)矩和復數(shù)矩。其中幾何矩最早被提出 并且形式最簡單,所以對它的研究最為充分。幾何矩對簡單圖像有一定的描述能力,雖 然在區(qū)分度上不如其他三種矩,但與其他算子比較起來,較為簡單,一般通過一個數(shù)字 就可表達

49、。矩不變特征的優(yōu)越性,特別是其具有的旋轉(zhuǎn)不變形、圖形的扭曲伸縮等不變形,對 于本系統(tǒng)的分類訓練具有極其重要的作用。比如,輸入系統(tǒng)的待分類圖片中的感興趣區(qū) 域很可能由于拍攝角度的問題扭曲、拉伸、變形等,但是矩不變特征的這一特性很好的 避免了此類操作造成的誤差,提高了系統(tǒng)的分類準確度。以下是兩個矩不變特征的圖像 檢索實例。示洌國像示例圖像蜓索詰果V Aj J圖3-2扭曲、伸縮性變不變性從圖3-1中的圖像檢索結(jié)果可以看出,形狀檢索算法對于圖像的旋轉(zhuǎn)具有不變性。 圖3-2檢索的結(jié)果證明形狀檢索算法對于圖像的扭曲。伸縮形變具有不變性,并對圖像 的基本形狀特性具有魯棒性,在具有一定形變的干擾情況下,仍能得

50、出較好的圖像檢索 結(jié)果。3.2圖像矩不變特征提取數(shù)字圖像是通過一個數(shù)字矩陣表征的。圖像f(x,y)的(p+q)階幾何矩定義為:式中f(x,y)是圖像的灰度。矩在統(tǒng)計學中通常被用來反映隨機變量的分布情況,當被推廣到力學中,它用作描 述空間物體的質(zhì)量分布。同理,如果我們將圖像的灰度值看作是一個二維或三維的密度 分布函數(shù),則矩方法就可用于圖像分析領域并且用作圖像特征的提取。最常用的,物體 的零階矩顯示了圖像的 質(zhì)量”:OO Q0式(3-1)m。 i , i f(x, y)dxdy一階矩(m01,mi0)用于確定圖像質(zhì)心(Xc,Yc):若將坐標原點移至qXc和M Nx經(jīng)y THu在文中提出了Xc =m

51、io/moo;Yc moi/m。丫C處,就得到了對于圖像位移不變的中心矩gx屮小叫y)dxdy(p,q = ,i2.)7個幾何矩的不變量,這些不變量滿足于圖像平移、(3-2)(3-3)伸縮和旋轉(zhuǎn)不變。如果定義pq = %/pqr =( p q)/2, p q =2,3,Hu的7種矩為:1 = 20 022 =( 20 - 02)2 V 2113=( 30 -3 J 2 21 - 03)2 TOC o 1-5 h z =(30* 12)* (21*03)=(303 12)(30*12)(3012)3(21,03)(3 21 _:03)(21,03)3(30,12)_(21,03)- (20_02

52、)(30*12)一3(21*03)4 11( 30,12)(21,03)=(3 21 - 03)(30*12)(30J -3(21,03)2-( 30一312)(203)3(30,J-(203)2在本系統(tǒng)中,使用SVM神經(jīng)網(wǎng)絡對圖像進行分類時,需要提取圖像的Hu矩不變特征。特征提取具體步驟如下:(1)對初始圖庫圖像和待分類圖像進行二圖像濾波、直方圖均衡、圖像均衡、邊 緣檢測、二值法銳化等預處理,將目標從背景中分割出來。經(jīng)過以上步驟后,目標被突 出,圖像背景被弱化,從而使目標更容易辨識;圖3-3圖像分割與特征提?。?) 通過MatLab中的自有函數(shù)對初始圖庫圖像和待分類圖像進行提取面積、矩形度、

53、原型度、拉伸度以及周長等特征值,為之后的Hu矩不變特征做好準備;(3)通過帶入步驟(2)的運算結(jié)果計算出初始圖庫圖像和待分類圖像的面積、矩形度和伸長度。并按照上文提到的算法計算出每幅圖像的7個矩不變特征。這樣一來每幅圖像就包含了 10個特征值,建立一個數(shù)組,將特征值存儲進去即可。第四章分類算法本系統(tǒng)在圖像分類的功能上,既使用到了監(jiān)督分類方法,又使用到了非監(jiān)督分類方 法。一下就將這兩種分類方法對應的具體算法進行主要介紹。本文使用到了支持向量機 分類算法(SVM )以及K-means分類算法。4.1 SVM分類算法算法簡介支持向量機(SVM, Support Vector Machin是在高維特征

54、空間使用線性函數(shù)假設 空間的學習系統(tǒng)。它將向量映射到一個更高維的空間里,在這個空間里建立有一個最大 間隔超平面。在分開數(shù)據(jù)的超平面的兩邊建有兩個互相平行的超平面。分隔超平面使兩 個平行超平面的距離最大化。假定平行超平面間的距離或差距越大,分類器的總誤差越 小。支持向量機由一個來自最優(yōu)化理論的學習算法訓練,該算法實現(xiàn)了一個由統(tǒng)計學習 理論導出的學習偏置1。算法詳述(1)二類分類SVM是從線性可分情況下的最優(yōu)分類面發(fā)展而來的,主要思想可用圖1的兩維情況說明。圖4-1最優(yōu)分類面圖中,實心點和空心點代表兩類樣本, H為分類線,H1、H2分別為過各類中離分類線最近的樣本且平行于分類線的直線,它們之間的距

55、離叫做分類間隔(margin)。所謂最優(yōu)分類線就是要求分類線不但能將兩類正確分開(訓練錯誤率為0),而且使分類間 隔最大。分類線方程為 x w 0。對于二類模式分類問題,設有訓練樣本S1:xi, yi, i =1,2,n,其中Xj 血P為模 式向量,yj1,1為類別標號,n為樣本容量,則將SVM優(yōu)化問題約束條件由不等 式改為等式,并將經(jīng)驗風險函數(shù)改為二次函數(shù),則可得如式(4-1)所示約束優(yōu)化問題:min J (w,b,e)we22vs.t.式( 4-1)y wT(Xi) b =1 -e,i =1,2,.,n式中,w(Xi) b為高維特征空間中的分類超平面,w和b為分類超平面的參數(shù);nU 2ei

56、為第i個樣本點的訓練誤差,則仝 為經(jīng)驗風險;wT |w|2衡量了學習機器的復雜 性; 0為懲罰因子,作用是在訓練中平衡學習的復雜性和經(jīng)驗風險。根據(jù)約束優(yōu)化理論,式(4-1)的解由其對應的如式(4-3)所示的Lagrange泛函數(shù) 的鞍點給出:n3用(心廿皿愀式(4-3)式中ai為Lagrange乘子,取值為一切實數(shù)。根據(jù)式(4-3)的鞍點條件,可得下式:cL=0二twnW 八:iYi :(Xi)i cLcLce2L?: i=0= yi wT :化)b = 1 -e,i = 1,2,.,n式(4-4)從式(4-4)的第三式可知,X正比于其對應的樣本上的訓練誤差。將上述式子合 并,可通過如下式所示

57、的線性方程組求解出i和b0式(4-5)_y式(4-5)中,I為n維的單位矩陣,1為n維的元素全是1的列向量,門為n維對 稱方陣,其元素為 J-yiyj (xi)T (xj),其中 心)T二仏)*佻“),而k(為核函 數(shù),因此J,廠必兇)為的第)行j列元素。求解(2.20)得到a和b之后,貝U可以得到如下的分類函數(shù):ny(x)八:jyjk(x,Xj) b匕式(4-6)模式向量x的類別由判別函數(shù)c(x) =sgn(?(x)決定,其中sgn()為符號函數(shù)北京郵電大學本科畢業(yè)設計(論文) 多類分類顯然上述分類只能應用于二類模式分類問題,當minJ(Wi,b)云TWiLSSVM應用于多類問題時,n 1

58、2Wiek,i2 k4 t J假設給定I類分類問題的訓練樣本 S :Xi,yj, i =1,2,.n,其中y為丨維的由-1和+1組成的 I維向量,當Xi為第j類時,yj的第j個元素為-1,其余皆為+1。將訓練樣本S2存儲為 兩個數(shù)據(jù)矩陣X和丫,它們的第i行分別為Xi和y。根據(jù)SRM原則可得到式(4-7)所 示的約束優(yōu)化問題: 0.由于只有支持向量處的系數(shù)-0(參考附錄),表達式(14)只是w0的一種簡寫形式要求出參數(shù)向量:i:凡=0,1 IM)J需要求解以下二次規(guī)劃問題:AW(t)1- 一上T D TOC o 1-5 h z 2(15)其中.J =( 5川,1),且滿足限制:上 0,(16)A

59、T Y = 0,(17)1T = (1,.,1) 是維的單位向量,丫丁二卜1,)是維的類標簽向量,D是,X-的對稱矩陣其元素Dj =%Xi xj, i,j=1,.,l(18)不等式(16)表示非負象限.因此,問題變?yōu)樵诜秦撓笙拗凶畲蠡问?15),并服從 約束條件(17).當訓練數(shù)據(jù)可完全無錯地分開時,在附錄A中我們證明了在最大泛函(15)、(上0,)和式(13)的最大間隔0之間有以下關系:WC;0)=如果存在某個 J和某個較大的常數(shù)W0使得不等式(20)w(J) W0成立,則所有把訓練集(8)分開的超平面其間隔都滿足如果訓練集(8)不能被超平面完全分開,則兩個類的樣本間的間隔變的任意小,使

60、得 泛函W(上)的值變得任意大.因此,要在約束條件(16)和(17)下最大化泛函(15),要么能 求得最大值(這種情況需要構(gòu)造最大間隔為訂的最優(yōu)超平面),要么求出超過某個給定的常數(shù)W的最大值(這種情況下不可能以大于2/W0的間隔分開訓練數(shù)據(jù)).在約束條件(16)和(17)下最大化泛函(15)的問題如下方法可有效地解決.將訓練數(shù) 據(jù)集劃分為幾部分,使每部分占有合理的少量數(shù)據(jù).先求解由第一部分訓練數(shù)據(jù)決定的 二次規(guī)劃問題.對于該問題,會有兩個結(jié)果:其一,這部分數(shù)據(jù)不能被任何超平面分開(這 種情況下整個數(shù)據(jù)集都不能被任何超平面分開);其二,找到了能分開這部分數(shù)據(jù)的最優(yōu)超平面.假設對第一部分數(shù)據(jù)泛函(

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論