版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領
文檔簡介
1、海 南 大 學畢 業(yè) 論 文(設計)題 目: 圖像檢索系統(tǒng)的設計與研究 學 號: vv 姓 名: www 年 級: 2010級 學 院: vv 系 別: vv 專 業(yè): vv 指導教師: 完成日期: 年 月 日 摘 要本次研究主要是基于顏色和形狀兩種特征的圖像檢索系統(tǒng)的設計,其包括特征提取和相似度計算兩個主要的技術(shù),當顏色、形狀等圖像特征被提取后,形成了特征向量,圖像檢索系統(tǒng)的關鍵在于計算出數(shù)據(jù)庫圖像特征與圖像檢索的距離,當下使用較為廣泛的相似度提取技術(shù)是基于歐氏距離函數(shù)來測度的。 圖像檢索系統(tǒng)采用visual c+ 6.0運行環(huán)境下開發(fā)實現(xiàn),設置幾種檢索途徑,顏色、形狀以及綜合兩種物理特征的
2、三種方法,輸入待檢索圖像利用上述特征從圖像庫里面預先存在的多種圖像檢索出與之相似的圖像,并按一定順序排列出一組結(jié)果,將結(jié)果顯示出來。關鍵字:顏色空間轉(zhuǎn)換;顏色特征;形狀特征;不變矩;歐氏距離;otsu法abstract this research is mainly about color and shape of image retrieval system ,which is designed based on two kinds of features, including feature extraction and similarity calculation of two main
3、 technology, when the color, shape and other image features are extracted to form the feature vector, image retrieval system, the key is to calculate the database image features and image retrieval distance at present, using similarity extraction techniques are widely used to measure based on euclid
4、ean distance function. image retrieval system using visual c+ 6 runtime environment development environment, set several retrieval approach, three kinds of method of color, shape and two physical characteristics, input to the variety of image retrieval using the features from the image repository of
5、 pre-existing images are similar, and are arranged according to a certain order of a group the results, the results are displayed. key words:color space conversion;color feature;shape feature;invariant moment ;euclidean distance;otsu method目錄1.緒論(1)1.1選題背景(1)1.2圖像檢索新方法的研究(2)1.2.1基于內(nèi)容的檢索方法概述(2)1.2.2基
6、于內(nèi)容的查詢方法和基于文本的查詢方法相比(2)2. cbir系統(tǒng)的核心技術(shù)原理(3)2.1圖像特征提取技術(shù)(3)2.1.1.基于顏色特征(3)2.1.2.基于形狀特征(7)2.1.3紋理特征(8)2.1.4.空間關系特征(8)2.1.5圖像特征提取的性能評價標準(8)2.2相似度計算技術(shù)(9)3. 系統(tǒng)分析(9)3.1需求分析(9)3.2實現(xiàn)環(huán)境(10)3.3系統(tǒng)的功能(10)3.4總體結(jié)構(gòu)與流程(10)3.4.1總體結(jié)構(gòu)圖(10)3.4.2主要流程圖(11)4.系統(tǒng)實現(xiàn)(12)4.1系統(tǒng)設置模塊(12)4.1.1需要檢索用戶圖像模塊設置(13)4.1.2檢索庫掃描模塊設置(13)4.2 圖像
7、檢索模塊 (系統(tǒng)核心部分)(14)4.2.1檢索引導模塊(15)4.2.2特征提取模塊(16)4.2.3相似度計算模塊(17)4.2.4結(jié)果處理和顯示模塊(18)5.程序調(diào)試及界面效果(18)6.個人總結(jié)和體會(22)致謝(23)參考文獻(23)1.緒論1.1選題背景 如今信息技術(shù)發(fā)展十分迅速,各種形式的信息數(shù)量也在迅速增長中,人們對圖像信息的需求也不斷擴大,日常生活當中充斥著豐富多樣的圖像信息,那么,人們應該如何做到在這么多選擇中快速地找到自己需要的圖像信息,這也漸漸的引起了越來越多人們關注。怎樣提供一種快速有效的方法來檢索這些內(nèi)容豐富的圖像信息的方法或者途徑,儼然,這已經(jīng)成為當今圖像檢索領
8、域的一個至關重要的研究熱點。 縱觀傳統(tǒng)的圖像檢索技術(shù),大多都是基于文本的檢索技術(shù)。文本檢索技術(shù)可以追溯到70年代末,它依靠人工對圖像進行手工注解,然后根據(jù)關鍵字對圖像進行檢索,用對圖像的一些描述信息來作為檢索時的關鍵字,如作者、標題、大致內(nèi)容、創(chuàng)作時間等。廣泛流行的商用搜索引擎,如g00gle、百度。目前很多大型圖像數(shù)據(jù)庫以及web上大部分的圖像搜索引擎使用的都是這種技術(shù)。在這些圖像庫或搜索引擎中,圖像只被松散地按類組織在一起,比如:人體、動物、自然場景等等。所有這些圖像的索引都由人工標注,在標注過程中,標注者列出他認為重要的或用戶可能會感興趣的物體以及對圖像的描述。這種基于文本的圖像檢索方式
9、的缺陷在于:一是要對規(guī)模不斷龐大的圖像庫一一進行人工標注,代價和工作量太大;二是由于圖像中包含著極為豐富的信息,而不同的人對于圖像會有不同的感知與理解,因此難以避免標注過程中的主觀性和不精確性。將基于文本關鍵字的檢索方法直接應用到圖像檢索中會存在很多局限性1。本次研究主要是在傳統(tǒng)文本檢索方式的基礎上,引出如今使用廣泛的檢索技術(shù),基于內(nèi)容的檢索方式(content based image retrieval,cbir)。 采用cbir方法開發(fā)的第一個功能較為齊全的系統(tǒng)是ibm公司almadell研究中心開發(fā)的基于圖像內(nèi)容查詢(query by image content,qbic)系統(tǒng),它利用顏
10、色、形狀、紋理和草圖等多種方法進行檢索,給出用戶示例圖像或草圖,可在圖像庫中找到相似的圖像來。 美國加州大學伯克利分校與加州水資源部合作進行了chabot計劃,開發(fā)系統(tǒng)用于檢索水資源部大量的水資源方面的圖片。另外,密歇根州立大學也開發(fā)了一種商標、圖標圖像檢索系統(tǒng),該系統(tǒng)通過計算歸一化的顏色直方圖之間的歐氏距離,并用canny算子提取邊緣點,用邊緣點的方向直方圖來表示形狀,從而綜合了顏色和形狀兩種特征,使得檢索精確度有較大的提高。 目前,國內(nèi)也有很多研究機構(gòu)和人員在積極參與研究與cbir的圖像檢索方法,并有許多成果出現(xiàn),本次研究主要是本著學習的態(tài)度探索綜合顏色與形狀特征的檢索方法。1.2圖像檢索
11、新方法的研究 由于各個領域?qū)D像信息的大量需求,這樣就不得不使研究人員不斷創(chuàng)新、思考,實現(xiàn)更加有效的、快速并且準確的檢索辦法,如今,圖像檢索的方法主要是基于內(nèi)容的檢索。1.2.1基于內(nèi)容的方法概述 基于內(nèi)容的圖像檢索(cbir)是基于內(nèi)容檢索技術(shù)的一種側(cè)重于提取圖像本身特征的一種檢索方法。利用圖像特征來表征的圖像的內(nèi)容,而基于內(nèi)容的檢索就是將兩幅不同圖片的特征按照一定的方法進行比較、匹配,一般采用相似性度量來實現(xiàn)的,顯然,圖像特征的提取是圖像特征匹配的首要任務。 圖像的特征分為低層物理特征和高層語意特征兩大類,前者主要是依據(jù)圖像的視覺特征,例如顏色、形狀、紋理、輪廓以及空間關系等。后者主要是對
12、物體進行識別和解釋,往往要借助人類的知識推理,如對圖像的個人感受等。高層特征大多是通過人工注釋的方法來實現(xiàn),即基于文本的檢索的傳統(tǒng)方法,此方法不易實現(xiàn)自動化且主觀色彩太強,不利于標準化的實現(xiàn)。相比之下,低層次的特征更加容易提取,能夠更客觀地反映出兩幅圖像之間的異同之處。1.2.2基于內(nèi)容的查詢方法和基于文本的查詢方法相比前者的擁有的優(yōu)勢如下:(l)將圖像中提取出來的顏色、形狀、紋理等真實特征作為檢索的依據(jù),而不是根據(jù)的圖片的名稱、文字信息和索引關系;(2)采用近似查詢的方法對視覺特征進行相似性度量。(3)可使用實例查詢語言qbe(query by example),創(chuàng)建示例表來編寫查詢。即給出
13、示例圖像,從圖庫中查找與之相似的結(jié)果圖像來。 cbir并不需要計算機識別出具體的目標是什么,計算機可以在完全不了解具體內(nèi)容的意義的情況下,而找出若干幅類似的圖像來,另外,圖像檢索是模糊的相似性判斷,檢索結(jié)果應盡可能包含圖像庫中的所有相關圖像,并且允許在結(jié)果中存在不相關的圖像。2. cbir系統(tǒng)的核心技術(shù)原理 cbir的核心是利用圖像的視覺特征對圖像進行檢索。它是一種近似匹配技術(shù),融合了計算機視覺、圖像處理、圖像理解和數(shù)據(jù)庫等多個領域的技術(shù)成果,其中的特征提取和索引的建立可由計算機自動完成,避免了人工描述的主觀性。因此,基于內(nèi)容的圖像檢索是一個綜合的學科領域,而實現(xiàn)一個cbir系統(tǒng)也必須要考慮以
14、下幾個關鍵的步驟:(1)確定研究的的圖像特征或幾種綜合特征。(需要考慮適當?shù)念伾臻g);(2)選擇有效的特征提取算法;(3)根據(jù)相似性度計算方法確定相似圖像結(jié)果;2.1基于內(nèi)容的幾種圖像特征提取技術(shù) 2.1.1.基于顏色特征 基于顏色特征的檢索是圖像最底層、最直觀的統(tǒng)計圖像的一種全局物理特性,很多情況下,顏色是描述一幅圖像最簡單、最有效的特征,具有旋轉(zhuǎn)不變性、平移不變性和尺度不變性的特點,具有一定的穩(wěn)定性。顏色的表示取決于色彩空間的選擇,不同的場合采用的方式也是不同,在大多數(shù)彩色圖形顯示器使用紅、綠、藍三原色,但rgb色彩空間中不能與人的感知顏色相聯(lián)系。在所有的色彩空間中,hsv模型(hue,
15、saturation,value)對應于畫家配色模型,具有與人觀察顏色方式相一致的特點,能較好反映人對色彩的感知和鑒別能力。rgb顏色空間模型 此模型也稱為基色混合型顏色空間,彩色圖像可以分解成紅(r)、綠(g)、藍(b)三個單色圖像,任何一種顏色都可以由這三種顏色混合構(gòu)成。用基色光單位來表示光的量,則在rgb色彩空間,任意色光f都可以用r、g、b三色不同分量的相加混合而成: 其中:(r,g,b) 分別是一個顏色的紅、綠和藍坐標,它們的值是在 0 到 1 之間的實數(shù)。圖21 rgb顏色空間模型六角錐體模型(hexcone model) hsv(hue saturation value)模型的三
16、維表示從rgb立方體演化而來。設想從rgb沿立方體對角線的白色頂點向黑色頂點觀察,就可以看到立方體的六邊形外形。六邊形邊界表示色彩,水平軸表示純度,明度沿垂直軸測量。參數(shù):色調(diào)(h),用角度度量,取值范圍為0°360°; 飽和度(s),取值范圍為0.01.0;亮度(v),取值范圍為0.0(黑色)1.0(白色)。 圖22 hsv顏色空間模型 rgb空間模型轉(zhuǎn)換到hsv色彩空間 rgb顏色模型都是面向硬件的,而hsv顏色模型是面向用戶的。 rgb圖像到hsv色彩空間的轉(zhuǎn)化方程如下:常用的顏色特征提取方法主要有顏色直方圖、累計直方圖、顏色矩。(1) 顏色直方圖 對于一幅數(shù)字圖像,
17、統(tǒng)計每一種顏色在該圖像中出現(xiàn)的像素點數(shù),以顏色為橫坐標,以顏色出現(xiàn)的像素點數(shù)為縱坐標:顏色直方圖h定義如下: 第k種顏色在圖像中出現(xiàn)的像素點頻數(shù)如下: 其中和表示圖像中的寬和高。 (2)累計直方圖 如果圖像特征向量不能取到所有可能值,許多零值會出現(xiàn)在顏色直方圖中,從而影響直方圖相交運算,導致匹配結(jié)果不能合理地反映圖像間的顏色差別。 (3)顏色矩 這種方法的數(shù)學基礎在于圖像中任何的顏色分布可以用它的矩來表示,其實顏色的分部信息主要集中在低階矩中,因此,采用顏色的一階矩、二階矩和三階矩就足夠表示圖像的顏色分布。2.1.2.基于形狀特征形狀特征符合人對圖像的認識是駐要集中在某個目標區(qū)域這個事實,具有
18、不受目標顏色、紋理及背景變化影響等特點,主要是對位移、旋轉(zhuǎn)和尺度變換的不變性,以圖像的分割為前提,經(jīng)常要依靠人工或半人工的方法勾勒目標形狀邊界,操作繁復。對于形狀的描述有兩種方法,一是基于邊界,只利用形狀的外部邊緣。二是基于區(qū)域,利用形狀的全部區(qū)域。本論文采用第二種,最常用的的是不變矩來描述形狀的區(qū)域特征: 不變矩是圖像的一種統(tǒng)計特征,她利用圖像灰度分布的各階矩來描述圖像灰度的分布特性。(1)對于離散的數(shù)字圖像f(x,y)的p+q普通階矩和中心矩定義為:的一階矩用于確定圖像質(zhì)心,也作為圖像區(qū)域中心(2)當圖像發(fā)生變化時,中心矩會改變,而中心矩具有平移不變性,但對旋轉(zhuǎn)比較敏感,就此提出歸一化中心
19、矩,這樣圖像特征就具有了平移、旋轉(zhuǎn)以及比例的不變性。 (3)基于標準化的二階和三階中心矩提出了7個幾何矩的不變量,這些不變量滿足于圖像平移、伸縮和旋轉(zhuǎn)不變,hu不變矩的公式:2.1.3紋理特征 紋理是一種不依賴于顏色或亮度變化的視覺特征,描述了圖像像素鄰域灰度空間分布的規(guī)律,可以從微觀上區(qū)分圖像中不同的物體,它是所有物體表面固有的內(nèi)在特性,不同物體具有不同的紋理,如花、草、樹木、云彩等都有各自的紋理特征。具有旋轉(zhuǎn)不變性,并且對于噪聲有較強的抵抗能力。2.1.4空間關系特征 顏色、形狀和紋理等多種特征反映的都是圖像的整體特征,而無法體現(xiàn)圖像中所包含的對象或物體。空間關系是指圖像中分割出來的多個目
20、標之間互相的空間位置或相對方向關系,例如,連接/領接、交疊/重疊以及包含/包容關系等。 因此,得到不同分塊目標之間的空間位置對于圖像辨別也是比較重要的手段之一,就像藍色的天空和蔚藍的海洋的在顏色直方圖上是非常接近而難以辨別。但如果指明是“處于圖像上半部分的藍色區(qū)域”,就可以大概區(qū)分天空和海洋了。2.1.5.圖像特征提取的性能評價標準 首先,檢索的目的是發(fā)現(xiàn)和提取需要的圖像。為了判定各種檢索算法的優(yōu)劣,要求我們考慮所檢索出來的相似圖像的數(shù)量和排列次序,下面兩個重要的參數(shù)作為性能指標和計量準則:查全率和準確率。查全率=檢索出來的有關聯(lián)的結(jié)果/圖像庫中所有關聯(lián)的結(jié)果(1-1)查準率=檢索出來的有關聯(lián)
21、的結(jié)果/檢索出來的所有結(jié)果(1-2) 綜上所述,查全率反映了檢索算法找到關聯(lián)結(jié)果的全面程度,它涉及到漏檢的問題;而查準率則反映了算法每次檢索出來有效關聯(lián)結(jié)果的能力,它涉及到誤檢的問題。顯而易見的,查全率和查準率的計算都需要知道圖庫中真實的存儲內(nèi)容,所以這兩個參數(shù)可用于實驗系統(tǒng)的研究,而對實際系統(tǒng)的評價則不適用。2.2相似度計算技術(shù) 當圖像特征提取出來后,形成了特征向量,圖像檢索的關鍵在于判斷檢索圖像同數(shù)據(jù)庫中圖像的相似度,即確定檢索庫圖像與數(shù)據(jù)庫圖像特征向量間的距離,目前在圖像檢索中常用到方法都是基于向量空間模型,就是把視覺特征視為向量空間中的某個點,計算兩點之間的距離來度量圖像特征間的相似度
22、。本文主要采用歐氏距離:歐氏距離具有簡單、有清晰的物理意義,其計算復雜較小,具有空間旋轉(zhuǎn)不變性的特點。3. 系統(tǒng)分析3.1需求分析 本系統(tǒng)的最大的目標是為用戶提供高效率、快捷的服務,減少了人工處理的繁瑣與誤差,準確快速地反映圖像檢索的結(jié)果,盡可能滿足人們檢索工作的需求,根據(jù)市場的需求具體的目標包括:(1)對圖像的輸入和顯示處理(2)對圖像進行變動處理(3)不同模式下的特征提取實現(xiàn)(4)相似度計算的實現(xiàn)(5)觀察和分析結(jié)果(6)退出程序其中(3)和(4)能是圖形檢索系統(tǒng)的核心部分,它是一個可以用多種方法實現(xiàn)彩色圖像檢索的系統(tǒng),其主要的檢索方法有:(1)基于顏色特征的查詢(2)基于形狀特征的查詢(
23、3)基于顏色和形狀綜合特征的查詢3.2實現(xiàn)環(huán)境 從目前比較流行的數(shù)據(jù)庫開發(fā)、管理軟件來看,對于比較簡單的中小型數(shù)據(jù)庫,visual c+ 6.0和sql的結(jié)合無疑是在實際應用中較為成功的一種解決方案。前者為用戶提供了windows所一貫堅持的非常友好、操作簡單的用戶界面.;后者則可對數(shù)據(jù)庫實施操作、維護和權(quán)限識別功能,也可通過與語句的結(jié)合對數(shù)據(jù)庫進行更為復雜的操作。對本系統(tǒng)而言,上述的結(jié)合方式是可行的。3.3系統(tǒng)的功能(1)在顏色特征模式下,選擇顏色直方圖、累計直方圖、顏色矩其中一種進行檢索(2)在形狀特征模式下,采用不變矩方法進行檢索(3)在顏色和形狀綜合特征模式下,選擇顏色和形狀各自所占百
24、分比所得綜合特征進行檢索3.4總體結(jié)構(gòu)與流程3.4.1總體結(jié)構(gòu)圖 圖31 圖像檢索系統(tǒng)總體結(jié)構(gòu)3.4.2主要流程圖 圖32 圖像檢索系統(tǒng)主要流程4. 系統(tǒng)實現(xiàn)本次圖像檢設計與研究利用vc+6.0開發(fā)軟件實現(xiàn)4.1系統(tǒng)設置模塊 由圖像檢索系統(tǒng)總體結(jié)構(gòu)中可知,首先進入的是系統(tǒng)設置模塊,該模塊主要提供使用者輸入需要檢索的圖像、參與檢索的圖像和圖庫的路徑接口建立,建立兩個全局變量cstring strfile 和cstring m_strpath 分別作為需要檢索圖像和檢索庫的保存路徑,還需對檢索庫圖像進行掃描設置。重要的兩個標志位以及五個常用全局變量:1) 需要檢索的用戶圖像標志位bool open
25、_pic2)檢索庫圖像標志位bool_dir3)需要檢索的用戶圖像路徑和檢索庫路徑:cstring strfile 和cstring m_strpath4)檢索庫中所有圖像的路徑:cstring *temp1005)檢索庫圖像計數(shù)器和臨時的檢索庫圖像計數(shù)器:int counts和int tempi4.1.1需要檢索用戶圖像模塊設置輸入用戶待檢索圖像 通過點擊按鈕 進入函數(shù) cimagetrievaldlg:on open()對輸入圖像進行設置的。void cimagetrievaldlg:onopen() cfiledialog fileopendlg(true);if (fileopendl
26、g.domodal () != idok) return;open_pic=true; /標志位設置為true,表示待檢索圖像已設置cwnd* pwnd = getdlgitem(idc_view);cdc* pdc = pwnd->getdc();pwnd->invalidate();pwnd->updatewindow();position pos = fileopendlg.getstartposition();/對于選擇了多個文件的情況得到第一個文件位置strfile = fileopendlg.getnextpathname(pos);/得到待檢索圖像的路徑show
27、pic(strfile,idc_view);/顯示待檢索圖像 本模塊中調(diào)用了顯示待檢索用戶圖像函數(shù)cimagetrievaldlg:showpic(cstring pathfile, int idc),函數(shù)的參數(shù)pathfile為待顯示的文件路徑,idc為圖像顯示控件的id號4.1.2檢索庫掃描模塊設置選擇檢索庫路徑點擊按鈕 進入函數(shù)cimagetrievaldlg:onpath() 實現(xiàn)該模塊設置:本模塊主要向用戶提供設置檢索庫的接口的功能,通過掃描檢索庫得到庫中的圖像個數(shù)和每個圖像的保存的詳細路徑,為了方便其他模塊使用,將它們分別保存在counts、temp100中。void cimage
28、trievaldlg:onpath() /打開通用對話框,browseinfo結(jié)構(gòu)中包含有用戶選中目錄的重要信息browseinfo browse;zeromemory(&browse,sizeof(browse);/fills a block of memory with zeros.browse.hwndowner = null;browse.pszdisplayname = m_strpath.getbuffer(max_path);browse.lpsztitle = "請選擇一個圖像目錄"/shbrowseforfolder函數(shù)返回一個itemidlist
29、結(jié)構(gòu)的指針,包含了用戶選擇文件夾的信息lpitemidlist lpitem = shbrowseforfolder(&browse);if(lpitem = null) return ;m_strpath.releasebuffer();/shgetpathfromidlist把項目標志符列表轉(zhuǎn)換為文檔系統(tǒng)路徑if(shgetpathfromidlist(lpitem,m_strpath.getbuffer(max_path) = false) return;m_strpath.releasebuffer();dir=true; /標志位設置為true,表示待檢索圖像已設置afxme
30、ssagebox("您選擇的目錄為:"+m_strpath,mb_iconinformation|mb_ok);/掃描檢索庫,得到圖像目錄下文件的路徑cstring tempath;cstring temps;tempath=m_strpath;tempath.trimright();tempath.trimleft(); /去除前后多余cstring strfilepath=tempath;tempi=0;counts=0;/計數(shù)器清零/檢索庫中圖像個數(shù)放入counts中,其路徑放入temp100中startdir(strfilepath); temps.format(&
31、quot;該目錄下共有%d幅圖像!",counts); afxmessagebox(temps,mb_iconinformation|mb_ok);4.2 圖像檢索模塊 (系統(tǒng)核心部分)主要涉及兩個核心技術(shù):圖像特征提取技術(shù)、相似度計算技術(shù)包括三種檢索模式:顏色特征提取模式、形狀特征提取模式、顏色和形狀綜合特征提取模式。其中,顏色特征模式有三種方法:顏色直方圖、累計直方圖、顏色矩;基于形狀特征模式采用不變矩的方法;系統(tǒng)中所有的特征的相似度計算均采用歐氏距離。1)本模塊中兩個重要標志位:如果標志位值為true,說明此方法在當前檢索庫、待檢索圖像下已經(jīng)使用過?;陬伾卣髂J綑z索的狀態(tài)標
32、志位:bool_color基于形狀特征模式檢索的狀態(tài)標志位:bool_shape2) 主要的全局變量如下:1 圖像特征提取模式int method:值為1、2、3分別對應三種檢索模式2 顏色特征模式 int c_method:值為1、2、3分別表示采用顏色直方圖、累計值直方圖、顏色矩double pix10001000 :當前分析圖像的像素double feature_shape8 :待檢索圖像的形狀特征double feature_shape_18:當前分析圖像的形狀特征double feature_color312:待檢索圖像的顏色特征double feature_color_1312:當
33、前分析圖像的顏色特征picture image_color_1:基于顏色特征顏色直方圖模式下的檢索信息picture image_color_2:基于顏色特征累計直方圖模式下的檢索信息picture image_color_3:基于顏色特征顏色矩模式下的檢索信息picture image_color_temp:臨時的基于顏色特征模式下的檢索信息picture image_shape:基于形狀特征模式下的檢索信息picture image_shape_temp:臨時的基于形狀特征模式下的檢索信息picture image:基于顏色和形狀綜合特征模式下的檢索信息4.2.1檢索引導模塊開始檢索點擊按
34、鈕 進入函數(shù)cimagetrievaldlg:onstart() ,首先檢查是否設置了待檢索圖像和檢索庫路徑,其次設置待檢索圖像及其檢索庫路徑,再根據(jù)所選擇的的具體模式,先調(diào)用特征提取函數(shù),得到待檢索圖像的特征,然后調(diào)用所提取特征的相似度計算函數(shù)。4.2.2特征提取模塊(包括4個特征函數(shù))每個函數(shù)都含有兩個傳遞參數(shù):cstring pathfile 圖像路徑 、int mode模式狀態(tài),當mode=1時,說明計算的是待檢索圖像,并且,將提取出來的顏色特征值、形狀特征值分別保存在feature_color312、feature_shape8中,當mode=2時,說明計算的是檢索庫中的圖像,并且,
35、將提取出來的顏色特征值、形狀特征值分別保存在feature_color312、feature_shape8中feature_color_1312、feature_shape_18中。由于所有顏色特征均是在hsv空間中進行的,因此,首先要將rab顏色空間轉(zhuǎn)換成hsv顏色空間模型,利用函數(shù):rgbtohsv(getrvalue(color),getgvalue(color),getbvalue(color),&h,&s,&v);void cimagetrievaldlg:rgbtohsv(int r,int g,int b,double *h,double *s,doubl
36、e *v)*h=acos(r-g+r-b)/(2.0*sqrtf(float)(r-g)*(r-g)+(float)(r-b)*(g-b);if(b>g)*h=2*pi-*h; *s=(mymax(r,g,b)-mymin(r,g,b)/(float)mymax(r,g,b);*v=mymax(r,g,b)/255.0;int cimagetrievaldlg:mymax(int a,int b,int c)/尋找最大int cimagetrievaldlg:mymin(int a,int b,int c)/尋找最?。?) 顏色直方圖提取函數(shù) 計算顏色直方圖:pathfile為圖像的路徑
37、,mode為模式狀態(tài)位,為1時,表示計算的是待檢索圖像,為2時,表示計算的是檢索庫中的圖像void cimagetrievaldlg:general(cstring pathfile,int mode)(2)累計直方圖提取函數(shù) 計算累計直方圖:pathfile為圖像的路徑,mode=1,表示計算的是待檢索圖像;mode=2,表示計算的是檢索庫中的圖像;void cimagetrievaldlg:succession(cstring pathfile,int mode)(3) 顏色矩提取函數(shù) 計算顏色矩:pathfile為圖像的路徑,mode為模式狀態(tài)位,為1時,表示計算的是待檢索圖像;為2時,
38、表示計算的是檢索庫中的圖像;void cimagetrievaldlg:centerm(cstring pathfile,int mode)(4) 形狀不變矩提取函數(shù)cimagetrievaldlg:torque(cstring pathfile,int mode) 本系統(tǒng)基于圖像的區(qū)域分割,函數(shù)采用基于otsu的閾值分割法:基本原理:通過設定不同的特征閾值k,將圖像的像素點進行分類,其中,大于k的像素為0,小于k的像素為1,使圖像成為二值圖像,主要是利用otsu計算出最佳的k值,再對圖像進行分割。 otsu重要式子,g值意義在于,從最小灰度值遍歷閾值k,使得g值取到最大時的k值,找到了最佳分割閾值:最佳k值把圖像分割成了兩部分,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年-江蘇省安全員A證考試題庫
- 2025年四川省建筑安全員《B證》考試題庫及答案
- 機械設計教學課件-樣章
- 《眼保健操》課件
- 《急診影像病例》課件
- 湯姆索亞歷險記教學課件
- 【課件】體育產(chǎn)業(yè)發(fā)展的概述與日照市體育產(chǎn)業(yè)發(fā)展的現(xiàn)狀及建議
- 《IPTV播控平臺綜述》課件
- 單位人力資源管理制度佳作合集十篇
- 單位人力資源管理制度合并合集十篇
- 2025年浙江舟山國家遠洋漁業(yè)基地建設發(fā)展集團有限公司招聘筆試參考題庫附帶答案詳解
- 2024秋新商務星球版地理7年級上冊教學課件 第5章 地球表層的人文環(huán)境要素 第3節(jié) 世界文化的多樣性
- 人教版三年級數(shù)學上冊 期末測試
- 《跨境電子商務基礎》課件-阿里巴巴國際站概述
- 政治-湖南省名校教育聯(lián)盟2025屆高三12月大聯(lián)考試題和答案
- 2025年上半年四川省成都市大數(shù)據(jù)中心招聘3人易考易錯模擬試題(共500題)試卷后附參考答案-1
- 外研版一年級上冊新交際英語(2024)全冊教案(單元整體教學設計)
- 國家安全概論學習通超星期末考試答案章節(jié)答案2024年
- 翻譯技術(shù)實踐智慧樹知到期末考試答案章節(jié)答案2024年山東師范大學
- 110kv各類型變壓器的計算單
- 水泥罐抗傾覆驗算7頁
評論
0/150
提交評論