




已閱讀5頁,還剩55頁未讀, 繼續(xù)免費(fèi)閱讀
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
河南理工大學(xué)畢業(yè)設(shè)計(jì)(論文)說明書摘要近年來,隨著多媒體技術(shù)和計(jì)算機(jī)網(wǎng)絡(luò)的飛速發(fā)展,全世界的數(shù)字圖像的容量正以驚人的的速度增長(zhǎng)。這些數(shù)字圖像中包含了大量有用的信息。然而,由于這些圖像是無序地分布在世界各地,圖像中包含的信息無法被有效的訪問和利用。一般的文字搜索引擎對(duì)于圖像數(shù)據(jù)來說,幾乎束手無策,這就要求有一種能夠快速而且準(zhǔn)確的查找訪問圖像的技術(shù),也就是所謂的圖像檢索技術(shù)。基于內(nèi)容的圖像檢索(Content-Based Image Retrieval,CBIR)指的是查詢條件本身就是一幅圖像,它建立索引的方式是通過提取圖像特征,然后通過計(jì)算比較這些特征和查詢條件之間的距離,來決定兩幅圖像的相似程度。本文主要對(duì)基于內(nèi)容的圖像檢索系統(tǒng)進(jìn)行設(shè)計(jì),系統(tǒng)設(shè)計(jì)的重點(diǎn)在于圖像的低層特征提取。本系統(tǒng)設(shè)計(jì)主要包括:圖像低層特征(顏色、紋理等特征)的提取及描述,多特征融合技術(shù)和特征匹配技術(shù)等方面。本文首先論述了國內(nèi)外基于內(nèi)容的圖像檢索技術(shù)的研究現(xiàn)狀、檢索特點(diǎn)以及應(yīng)用領(lǐng)域,然后從圖像檢索系統(tǒng)的基本原理入手,實(shí)現(xiàn)了圖像的預(yù)處理,圖像顏色特征、紋理特征的提取,以及圖像庫、特征庫的構(gòu)成,接著通過歐式距離進(jìn)行相似度匹配。最后,本系統(tǒng)為查詢接口提供一個(gè)友好的用戶界面,采用MATLAB GUI(Graphical User Interface)設(shè)計(jì)實(shí)現(xiàn)了一個(gè)基于內(nèi)容的圖像檢索系統(tǒng),并對(duì)系統(tǒng)的各個(gè)模塊及其功能進(jìn)行了介紹。通過仿真實(shí)驗(yàn),對(duì)Corel圖像庫中的500幅圖像進(jìn)行了檢索實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果表明,本系統(tǒng)計(jì)算簡(jiǎn)單、有效,能夠取得較好的檢索效果。關(guān)鍵詞:圖像檢索; 顏色特征; 紋理特征; 相似性度量; GUI設(shè)計(jì)AbstractIn recent years, with the development of multimedia technology and the rapid development of computer network, the worldwide digital image capacity is increasing at an alarming rate. These digital image contains a lot of useful information. However, these images are randomly distributed throughout the world, the image contains information cannot be accessed and used effectively. General text search engine for the image data seems almost incapable, this requires a fast and accurate image searching technology, also known as the image retrieval technology.Content based image retrieval ( Content-Based Image Retrieval, CBIR ) itself is a pair of images, it is indexed by the image feature extraction, then determine the degree of similarity of two images through the calculation and comparison of the features and the distance between the query conditions.This paper focuses on the CBIR system design,. This design is focused on low-level feature extraction.of image .The system design mainly includes: low level image features ( color, texture feature extraction and description ) extraction and description, multiple features fusion and feature matching technology and so on. This paper first discusses the domestic and foreign content based image retrieval technology research status, characteristics and application field of retrieval, and then from the image retrieval system basic principle, realization of image preprocessing, image color feature, texture feature extraction, and image library, characteristic database, and then through the Euclidean distance similarity matching. Finally, the system for the query interface provides a friendly user interface, using MATLAB GUI ( Graphical User Interface ) design and implementation of a content-based image retrieval system, and of the various modules of the system and its function are introduced. Through the simulation test, the Corel image database of 500 images retrieval experiment. The experimental results show that, this system has the advantages of simple calculation, effective, can obtain good retrieval results.Keywords:Image retrieval; Color feature; Texture feature; Similarity measurement; GUI design目 錄摘要IAbstractII目 錄III1 緒論11.1 選題背景及研究意義11.2 圖像檢索技術(shù)發(fā)展歷程11.2.1 基于文本的圖像檢索21.2.2 基于內(nèi)容的圖像檢索系統(tǒng)21.3 CBIR技術(shù)應(yīng)用31.4 經(jīng)典CBIR系統(tǒng)介紹41.5 論文結(jié)構(gòu)62 圖像特征分析82.1 圖像顏色特征分析82.1.1 顏色空間及轉(zhuǎn)換82.1.2 顏色量化102.1.3 顏色特征的提取方法112.2 圖像紋理特征分析132.2.1圖像紋理特征描述132.2.2紋理特征的提取方法143 特征提取算法選擇193.1 顏色特征提取算法193.1.1 顏色的量化193.1.2 顏色特征的提取193.2 紋理特征提取算法203.2.1 圖像預(yù)處理203.1.2 紋理特征的提取214 圖像特征匹配算法224.1 相似度量定理224.2 常用的匹配算法224.3 本系統(tǒng)的匹配算法245 CBIR的設(shè)計(jì)與實(shí)現(xiàn)255.1 開發(fā)工具及系統(tǒng)運(yùn)行環(huán)境255.1.1 開發(fā)工具255.1.2 運(yùn)行環(huán)境265.2 系統(tǒng)結(jié)構(gòu)設(shè)計(jì)、系統(tǒng)功能265.2.1 系統(tǒng)的結(jié)構(gòu)265.2.2系統(tǒng)實(shí)現(xiàn)的功能描述275.3 系統(tǒng)運(yùn)行方法及設(shè)計(jì)結(jié)果275.3.1 系統(tǒng)運(yùn)行示例275.3.2 設(shè)計(jì)運(yùn)行結(jié)果315.4 性能評(píng)價(jià)335.4.1 性能評(píng)價(jià)準(zhǔn)則335.4.2 性能分析346 總結(jié)與展望36致謝37參考文獻(xiàn)38附錄 A39附錄 B5555河南理工大學(xué)畢業(yè)設(shè)計(jì)(論文)說明書1 緒論1.1 選題背景及研究意義隨著多媒體技術(shù)、計(jì)算機(jī)通信技術(shù)及Internet網(wǎng)絡(luò)的迅速發(fā)展,圖像多媒體信息來源不斷擴(kuò)大。圖像作為一種內(nèi)容豐富,表現(xiàn)直觀的多媒體信息,長(zhǎng)期以來一直受到人們的親睞。每天人們熟知的天氣預(yù)報(bào)離不開衛(wèi)星云圖的幫助,公安人員迅速破案需要大量的罪犯圖像信息作為輔助,網(wǎng)上時(shí)興的電子購物,也多半是以圖像的形式向用戶展現(xiàn)商品的。各種各樣的應(yīng)用需求的出現(xiàn),使圖像信息資源的管理和檢索顯得日益重要?;趦?nèi)容的圖像檢索技術(shù)正是在這種背景下,成為近10年的研究熱點(diǎn)之一。這項(xiàng)技術(shù)的主要思想是根據(jù)圖像中物體(或區(qū)域)的顏色、形狀、紋理,空間位置關(guān)系等特征以及這些特征的組合來查詢圖像。研究該項(xiàng)技術(shù)既有深遠(yuǎn)的意義,也將面臨著巨大的挑戰(zhàn)。隨著我國社會(huì)經(jīng)濟(jì)的發(fā)展,使得從公共媒體到家庭娛樂、從自然科學(xué)到社會(huì)科學(xué),每一個(gè)領(lǐng)域都滲透著對(duì)多媒體技術(shù)和因特網(wǎng)技術(shù)的應(yīng)用,都要求對(duì)各種資料的智能化的管理。國內(nèi)較有代表性的系統(tǒng)有:浙江大學(xué)計(jì)算機(jī)系研究的基于圖像顏色的檢索系統(tǒng)Photo Navigator、清華大學(xué)的Internet上靜態(tài)圖像的基于圖像內(nèi)容檢索的原形系統(tǒng)、中科院計(jì)算技術(shù)研究所數(shù)字化技術(shù)研究室開發(fā)的Image Hunter系統(tǒng)、南京郵電學(xué)院研制的基于紋理和顏色特征的實(shí)驗(yàn)系統(tǒng)等。這些系統(tǒng)的框架和查詢的處理過程都很相似,只是采用的特征和搜索方法各具特色,性能也互有差異。國外著名系統(tǒng)如:IBM公司的QBIC系統(tǒng),是IBM公司與20世紀(jì)90年代開發(fā)制作的圖像和動(dòng)態(tài)景象檢索系統(tǒng),是第一個(gè)商用基于內(nèi)容的圖像檢索系統(tǒng),它的系統(tǒng)結(jié)構(gòu)及所采用的技術(shù)對(duì)后來的檢索系統(tǒng)有很深遠(yuǎn)的影響。QBIC支持基于示例圖像、用戶構(gòu)造的略圖、選擇顏色、紋理等的查詢。另外國外其他典型系統(tǒng)代表有:Virage公司的VIR工程系Photo book系統(tǒng)、哥倫比亞大學(xué)的Visual SEEK和WEB SEEK查詢系統(tǒng)以及美國伊利諾斯大學(xué)的MARS系統(tǒng)等。1.2 圖像檢索技術(shù)發(fā)展歷程隨著數(shù)據(jù)庫管理技術(shù)和計(jì)算機(jī)視覺的發(fā)展,圖像檢索技術(shù)自20世紀(jì)70年代依賴,一直成為人們研究的熱門課題。從圖像檢索技術(shù)發(fā)展的過程來看,主要經(jīng)歷了兩個(gè)階段:基于文本的圖像檢索階段和基于內(nèi)容的圖像檢索階段。1.2.1 基于文本的圖像檢索基于文本的圖像檢索技術(shù)(Text-Based Image Retrieval,TBIR)屬于傳統(tǒng)的圖像檢索技術(shù),它的歷史可以追溯到20世紀(jì)70年代末。它主要是對(duì)圖像進(jìn)行人工分析,對(duì)圖像的物理特征、內(nèi)容特征進(jìn)行文本注錄或標(biāo)引,建立類似于文本文獻(xiàn)注錄的索引數(shù)據(jù)庫,并通過檢索這些數(shù)據(jù)庫獲得圖像編號(hào),繼而利用這些編號(hào)索引實(shí)際圖像。TBIR的技術(shù)廣泛應(yīng)用,如google、baidu、sohu、yahoo等搜索引擎目前均采用這種方式來檢索圖像。但是,這種采用對(duì)圖像建立關(guān)鍵詞等文本描述信息的方式已經(jīng)越來越不適應(yīng)圖像信息檢索的要求,究其原因主要是存在以下幾個(gè)局限性:(1)對(duì)圖像加注文本信息是由手工完成,費(fèi)時(shí)費(fèi)力。(2)文本描述信息是非常主觀的,不同的人對(duì)同一幅圖像可能有不同的理解,這樣就使得文本描述信息存在二義甚至是多義性,因此當(dāng)用戶在查詢時(shí)輸入的關(guān)鍵詞和數(shù)據(jù)庫中的關(guān)鍵詞不一致就會(huì)導(dǎo)致查詢失敗。(3)一幅圖像所表達(dá)的意思是不可能用幾個(gè)關(guān)鍵詞表達(dá)清楚的。(4)不同國家不同民族很難用同一種語言對(duì)圖像加注標(biāo)志,而且對(duì)圖像語義理解的差異很大。為了突破基于文本的圖像檢索技術(shù)的諸多弊端,人們轉(zhuǎn)向研究將圖像中所包含的內(nèi)容信息來作為圖像的索引。1.2.2 基于內(nèi)容的圖像檢索系統(tǒng)基于內(nèi)容的圖像檢索技術(shù)的主要思想是根據(jù)圖像的一些低級(jí)視覺特征,如顏色、紋理、圖像對(duì)象的形狀以及它們之間的空間關(guān)系等內(nèi)容特征作為圖像的索引,計(jì)算基準(zhǔn)查詢圖像和圖像數(shù)據(jù)庫中圖像的相似距離,按照相似度匹配進(jìn)行檢索?;趦?nèi)容的圖像檢索技術(shù)的研究涉及到人工智能、計(jì)算機(jī)視覺、信號(hào)處理、模式識(shí)別、認(rèn)知心理學(xué)、數(shù)據(jù)庫、人機(jī)交互等諸多學(xué)科領(lǐng)域,具有重要的理論意義。同時(shí),它也是理論和實(shí)踐緊密結(jié)合的一項(xiàng)研究,其最終目的就是幫助人們更方便、更快捷和更準(zhǔn)確地去找到鎖需要的多媒體資源,因此該技術(shù)具有巨大的應(yīng)用前景?;趦?nèi)容的圖像檢索系統(tǒng)的主要目的還是要克服基于文本圖像檢索技術(shù)的局限性?;趦?nèi)容的圖像檢索技術(shù)具有如下的特點(diǎn):(1)直接從圖像的內(nèi)容中提取線索。正是由于這一特點(diǎn),使得基于內(nèi)容的圖像檢索技術(shù)突破了傳統(tǒng)的基于關(guān)鍵詞檢索的局限,直接對(duì)圖像本身進(jìn)行分析并提取特征,使得檢索能夠更加接近目標(biāo)。(2)提取特征的方法多種多樣。從圖像中可以提取的特征包括顏色、紋理、形狀、目標(biāo)輪廓等。(3)檢索是人機(jī)交互的。一般來講,人對(duì)于目標(biāo)的特征比較敏感,能夠迅速分辯出目標(biāo)的顏色、形狀等信息,但是對(duì)于大量的對(duì)象,一方面難以記住這些特征,另一方面人工從大量數(shù)據(jù)中查找目標(biāo)效率非常低,而這正是計(jì)算機(jī)的長(zhǎng)處。因此,在基于內(nèi)容的圖像檢索中,人和計(jì)算機(jī)相互分工配合進(jìn)行檢索。(4)基于內(nèi)容的圖像檢索是一種近似匹配。在檢索中,可以采取逐步求精的算法,每一層中間結(jié)果都是一個(gè)集合,不斷減小集合的范圍,直到定位到近似目標(biāo)。這一點(diǎn)和傳統(tǒng)數(shù)據(jù)庫的精確匹配算法有明顯的不同。CBIR的一般框架如圖1-1所示。特征提?。伾?、紋理等)圖像數(shù)據(jù)庫建立用 戶索引機(jī)制相似圖像匹配機(jī)制查詢接口圖像特征庫數(shù)據(jù)庫查詢圖1-1 CBIR一般框架1.3 CBIR技術(shù)應(yīng)用CBIR技術(shù)將對(duì)大規(guī)模圖像信息的管理和訪問提供有力的支持。它可以應(yīng)用于信息檢索服務(wù)、犯罪預(yù)防、醫(yī)療診斷、新聞和廣告、商標(biāo)和知識(shí)產(chǎn)權(quán)、地理信息和遠(yuǎn)程遙感、教育培訓(xùn)和軍事等領(lǐng)域,目前比較成熟的應(yīng)用有指紋識(shí)別、人臉識(shí)別和圖像搜索引擎等。CBIR應(yīng)用非常廣泛,如:(1)知識(shí)產(chǎn)權(quán)保護(hù)科技的飛速發(fā)展使得人們?cè)絹碓疥P(guān)注知識(shí)產(chǎn)權(quán)的保護(hù)問題。許多知識(shí)產(chǎn)權(quán)的載體都是圖像,最明顯的是商標(biāo)和藝術(shù)作品。商標(biāo)知識(shí)產(chǎn)權(quán)體現(xiàn)在專用的文字描述和專用的圖形標(biāo)記兩個(gè)方面。為了防止侵權(quán),需要通過嚴(yán)格的商標(biāo)審查程序來確認(rèn)新申請(qǐng)的候選商標(biāo)是否與己注冊(cè)商標(biāo)過分相似。毫無疑問,利用基于內(nèi)容的圖像檢索技術(shù)實(shí)現(xiàn)商標(biāo)的專用圖形標(biāo)記的自動(dòng)審查具有非?,F(xiàn)實(shí)的意義。(2)新一代網(wǎng)上搜索網(wǎng)絡(luò)正逐漸滲透到人們的日常生活中,除了文本資源外,網(wǎng)上還存在非常豐富的圖像資源。新一代網(wǎng)上搜索引擎應(yīng)該具有協(xié)助用戶從海量而且無序的網(wǎng)上圖像資源中尋找符合要求的圖像的能力。(3)醫(yī)學(xué)和遙感圖像的分析和處理盡管傳統(tǒng)的圖像處理領(lǐng)域早就開始涉足醫(yī)學(xué)和遙感圖像的分析和處理的研究,但它們?nèi)匀皇且粋€(gè)開放的研究課題,無論是民用還是軍事,醫(yī)學(xué)和遙感圖像的分析和處理都具有非常重大的現(xiàn)實(shí)意義。特別當(dāng)圖像規(guī)模增加時(shí),準(zhǔn)確有效的圖像分析手段以及快速的圖像識(shí)別和檢索技術(shù)將凸現(xiàn)其重要性。(4)犯罪與安全預(yù)防當(dāng)將圖像的內(nèi)容限制在特定領(lǐng)域時(shí),基于內(nèi)容的圖像檢索技術(shù)將找到更為具體的應(yīng)用。例如,安全部門可以將人的主要特征(如指紋和臉部)的圖像存儲(chǔ)在數(shù)據(jù)庫中,通過指紋識(shí)別和人臉識(shí)別就有可能從大量的指紋庫或者人臉庫中自動(dòng)識(shí)別出特定的目標(biāo)。毫無疑問,這具有重大的社會(huì)價(jià)值。除此以外,基于內(nèi)容的圖像檢索技術(shù)還可以應(yīng)用到設(shè)計(jì)(時(shí)裝、裝演和結(jié)構(gòu))、遠(yuǎn)程教育以及個(gè)人相冊(cè)管理等方面。綜上所述,基于內(nèi)容的圖像檢索技術(shù)涉及多個(gè)研究領(lǐng)域,有著廣泛的應(yīng)用前景。1.4 經(jīng)典CBIR系統(tǒng)介紹迄今為止,已經(jīng)有許多比較成功的基于內(nèi)容的圖像檢索系統(tǒng)問世。這些系統(tǒng)在一定范圍內(nèi)都得到比較理想的效果,下面對(duì)圖像檢索系統(tǒng)方面的研究成果進(jìn)行介紹。(1)QBIC:國際商用機(jī)器公司IBM公司的QBIC(Query by Image Content)系統(tǒng)是第一個(gè)商用的基于內(nèi)容的圖像檢索系統(tǒng)。QBIC的系統(tǒng)結(jié)構(gòu)由圖像入庫、特征計(jì)算和查詢階段三部分構(gòu)成。QBIC支持在大型圖像數(shù)據(jù)庫中基于視覺特征的檢索,這些特征包括顏色百分比、顏色分布、紋理特征等。在檢索時(shí),用戶可以使用例子圖像、用戶草圖、所選顏色、紋理模式等方式進(jìn)行查詢。QBIC使用的顏色特征有平均(R,G,B)、(Y,I,Q)、(L,A,B)和MTM(Mathematical Transform to Mussel)坐標(biāo),及元顏色直方圖,對(duì)于黑白商標(biāo)還提供了分形檢索方法。紋理特征用的是Tamura紋理描述的改進(jìn)版本,也就是粗糙度,對(duì)比度和方向性的結(jié)合。形狀特征則采用形狀的面積、圓形度、離心率、主軸方向以及一組變換無關(guān)矩等描述方法。QBIC的索引子系統(tǒng)中,對(duì)于維數(shù)比較高的特征,如形狀特征,采用KLT(Karhunen Loeve transform)變換或?qū)⒅鞣至孔儞Q降維至2到3維,然后用樹組織多維索引結(jié)構(gòu)。在檢索時(shí),為了提高匹配效率,在執(zhí)行真正的匹配算法前將先通過快速濾波器(fast filter)來產(chǎn)生最優(yōu)的一些分量來參與后續(xù)比較慢的匹配算法。在它的新系統(tǒng)中,結(jié)合了基于文本的關(guān)鍵詞檢索和基于內(nèi)容的相似性檢索。QBIC結(jié)合了多種查詢方式,如標(biāo)準(zhǔn)的系統(tǒng)查詢方式、選擇特征查詢和草圖查詢等,界面比較友好,其系統(tǒng)構(gòu)架對(duì)后來的圖像檢索系統(tǒng)有深遠(yuǎn)影響。(2)Virage系統(tǒng)是由Virage公司開發(fā)的一個(gè)基于內(nèi)容的圖像檢索引擎。系統(tǒng)分層表示:圖像表達(dá)層、圖像對(duì)象層、領(lǐng)域?qū)ο髮雍皖I(lǐng)域事件層,支持基于顏色、顏色布局、紋理和結(jié)構(gòu)(對(duì)象邊界信息)的可視化查詢。Virage在QBIC的基礎(chǔ)上所作的改進(jìn)在于它還支持上面提到的4種基本檢索的任意組合的檢索方式,用戶可以根據(jù)自己的需要,調(diào)節(jié)各項(xiàng)特征的權(quán)重。在Virage系統(tǒng)中圖像索引的提取需要經(jīng)過圖像的預(yù)處理,然后提取圖像的特征索引,它將這些特征稱為原語,并進(jìn)一步把原語分為通用型原語和特定領(lǐng)域原語。Virage技術(shù)的核心是Virage Engine以及在圖像對(duì)象層上的操作。Virage Engine主要有三個(gè)方面的功能:圖像分析、圖像比較和圖像管理,它將搜索引擎作為一個(gè)插件,既可以應(yīng)用到通用的圖像查詢,也可對(duì)其進(jìn)行擴(kuò)展并應(yīng)用到特定領(lǐng)域。(3)Photobook是麻省理工學(xué)院(MIT,Massachusetts Institute of Technology)多媒體實(shí)驗(yàn)室開發(fā)的交互式圖像瀏覽和檢索工具,它包含4種應(yīng)用領(lǐng)域的示范:紋理識(shí)別、形狀識(shí)別、人臉識(shí)別和大腦形狀識(shí)別。紋理識(shí)別主要針對(duì)以紋理為主體內(nèi)容的圖像;形狀識(shí)別給出了一些具有簡(jiǎn)單形狀物體的檢索示例;人臉識(shí)別是MIT基于其研究技術(shù)基礎(chǔ)上開發(fā)的新的應(yīng)用領(lǐng)域;大腦形狀識(shí)別則是Photobook的一個(gè)新的應(yīng)用領(lǐng)域,它在檢索過程中處理圖像的3D數(shù)據(jù)。Photobook系統(tǒng)的主要思想是保留語義的圖像壓縮,將圖像信息壓縮到對(duì)感知重要的一組系數(shù)。它的最新版本為FourEyes,在圖像注解和檢索過程中加入了人的因素。它突出了交互式語義查詢及系統(tǒng)學(xué)習(xí)能力,并且還應(yīng)用了相關(guān)反饋的技術(shù)。系統(tǒng)可以保留用戶的記錄,使用一個(gè)代理設(shè)施來進(jìn)行學(xué)習(xí),通過分析選擇出較好的匹配模式,以改進(jìn)識(shí)別功能。(4)VisualSEEK/WebSEEK:VisualSEEK為視覺特征檢索引擎,WebSEEK是面向網(wǎng)絡(luò)的文本和圖像檢索引擎,二者均由哥倫比亞大學(xué)(Columbia University)開發(fā)。VisualSEEK系統(tǒng)由4個(gè)部分構(gòu)成:圖形用戶界面、服務(wù)器應(yīng)用、圖像檢索服務(wù)器和圖像歸檔。系統(tǒng)采用的圖像特征是全局顏色直方圖、區(qū)域的二進(jìn)制顏色集和基于小波變換的紋理特征,其主要特點(diǎn)是圖像區(qū)域的空間關(guān)系檢索和視覺特征從壓縮域提取。WebSEEK是面向Web的檢索工具,主要包括三個(gè)主要模塊:圖像、視頻收集模塊,對(duì)象分類索引模塊,檢索瀏覽和查找模塊。它支持基于關(guān)鍵詞和視覺內(nèi)容的檢索。系統(tǒng)采用了先進(jìn)的特征提取技術(shù),用戶界面方便友好,查詢途徑豐富,結(jié)果輸出畫面生動(dòng),支持用戶直接下載信息。(5)Netra系統(tǒng)是由加利福尼亞大學(xué)(University of California)的亞歷山大數(shù)字圖書館(ADL,Alexandria Digital Library)開發(fā)的一個(gè)基于內(nèi)容的圖像檢索原型系統(tǒng)。Netra使用顏色、紋理、形狀和分割圖像區(qū)域中的空間關(guān)系信息來檢索。它著重從已分割的圖像中查找相似區(qū)域進(jìn)行匹配,使用基于紋理分析的Gabor濾波器,基于神經(jīng)網(wǎng)絡(luò)的圖像庫構(gòu)造以及圖像邊緣基于流的區(qū)域分割。此外,NETRA還使用了一些特殊的特征表述,便于快速完成用戶的一些特殊的查詢,如檢索包含A的顏色、B的形狀和C的紋理的圖像,并將它們分類列出。NetraII是Netra的新版本,是一個(gè)基于區(qū)域和顏色特征的圖像檢索系統(tǒng),主要采用了一些在彩色圖像分割算法和局部顏色特征描述方面所做出的成果,如色彩量化、特征的距離化度量等,使得圖像分割更加快速。(6)MARS(Multimedia Analysis and Retrieval System)是由伊利諾伊大學(xué)厄巴納-香檳分校(University of Illinois at Urbana-Champaign)開發(fā)的多媒體分析和檢索系統(tǒng)。它是一個(gè)多學(xué)科共同研究的成果,內(nèi)容涉及計(jì)算機(jī)視覺、數(shù)據(jù)庫管理系統(tǒng)和信息檢索。MARS的主要特點(diǎn)是數(shù)據(jù)庫管理系統(tǒng)(DBMS,Database Management System)和信息檢索技術(shù)(IR,Information Retrieval)的結(jié)合,包括如何進(jìn)行分級(jí)的精確匹配:索引和檢索技術(shù)的結(jié)合,包括檢索算法如何發(fā)揮底層索引結(jié)構(gòu)的優(yōu)點(diǎn);以及計(jì)算機(jī)和人的結(jié)合,包括相關(guān)反饋技術(shù)。MARS系統(tǒng)并不集中于要找到單一最優(yōu)的圖像描述特征,而在于根據(jù)應(yīng)用的實(shí)際環(huán)境和用戶的需要在檢索框架中動(dòng)態(tài)的組合調(diào)整各種不同的圖像特征。MARS在圖像檢索領(lǐng)域正式提出了相關(guān)反饋的體系結(jié)構(gòu),相關(guān)反饋的各種技術(shù)被用在各個(gè)層次的檢索過程中,包括查詢向量的優(yōu)化,相似度算法的自動(dòng)選擇,以及圖像特征權(quán)重的自動(dòng)調(diào)整。1.5 論文結(jié)構(gòu)本文的內(nèi)容構(gòu)架介紹如下:第1章 作為本文的緒論,首先概括論述了本系統(tǒng)設(shè)計(jì)的背景,簡(jiǎn)述了圖像檢索技術(shù)的發(fā)展,其次闡述了CBIR技術(shù)的應(yīng)用場(chǎng)合,并對(duì)國內(nèi)外經(jīng)典的CBIR系統(tǒng)做了簡(jiǎn)單的介紹。最后,明確了本文所研究的重點(diǎn)內(nèi)容。第2章 首先描述了圖像顏色特征的提取。通過比較顏色空間的異同,將圖像轉(zhuǎn)換成符合人類視覺特征的顏色空間。通過顏色量化以達(dá)到減少計(jì)算量,最后描述了幾種顏色特征的提取方法。對(duì)于紋理特征先進(jìn)行了簡(jiǎn)單的敘述,然后描述了紋理特征的幾種提取方法。第3章 本章節(jié)主要描述了該系統(tǒng)所使用的特征提取算法。在HSV顏色空間進(jìn)行非等間隔量化。采用顏色直方圖來提取顏色特征。在灰度圖像進(jìn)行灰度級(jí)壓縮,然后采用灰度共生矩陣來提取紋理特征。第4章 主要介紹了圖像匹配所采用的幾種相似性度量方法。并闡述了本系統(tǒng)所使用的歐式距離方法,實(shí)現(xiàn)了多特征相似度融合。第5章 實(shí)現(xiàn)了MATLAB下基于內(nèi)容的圖像檢索系統(tǒng)。本系統(tǒng)使用的算法實(shí)現(xiàn)了基本功能。介紹了系統(tǒng)實(shí)現(xiàn)的軟硬件環(huán)境和軟件界面,說明了系統(tǒng)的使用步驟,并通過系統(tǒng)實(shí)驗(yàn)根據(jù)其檢索效果進(jìn)行了比較和性能分析。2 圖像特征分析2.1 圖像顏色特征分析顏色特征是在圖像檢索中應(yīng)用最為廣泛的視覺特征。一方面,由于顏色往往和圖像中所包含的物體或場(chǎng)景十分相關(guān);另一方面,相對(duì)于紋理和形狀等特征,顏色特征對(duì)圖像本身的尺寸、方向、視角、平移、旋轉(zhuǎn)等方面的依賴性較小,具有較強(qiáng)的魯棒性。本系統(tǒng)是從顏色空間及轉(zhuǎn)換與顏色量化入手,通過顏色直方圖來進(jìn)行圖像顏色特征的提取。2.1.1 顏色空間及轉(zhuǎn)換(1)RGB顏色空間RGB顏色模型又稱RGB顏色空間,它是一種色光表示模式,是使用最多、最熟悉的顏色模型。計(jì)算機(jī)定義R、G、B三種顏色成分的取值范圍是0-255,0表示沒有刺激量,255表示刺激量達(dá)最大值。R、G、B均為255時(shí)就合成了白光,R、G、B均為0時(shí)就形成了黑色。R、G、B為三原色,各個(gè)原色混合在一起可以產(chǎn)生復(fù)合色,如圖2-1所示。絕大部分的可見光可以用R、G和B三色光按不同比例和強(qiáng)度的混合來表示。在顏色重疊的位置,產(chǎn)生青色、洋紅和黃色。因?yàn)镽GB顏色合成產(chǎn)生其它顏色,它們也稱為加色。圖2-1 RGB三原色混合效果RGB顏色空間的缺點(diǎn)是:改變一個(gè)顏色時(shí),三個(gè)通道上的顏色全部需要修改:它不是均勻視覺的顏色空間,顏色空間上的距離,并不代表人眼視覺上的顏色相似性。(2)HSV顏色空間HSV顏色空間是一種面向視覺感知的顏色模型,HSV空間能夠較好的反映人眼對(duì)色彩的感知和鑒別能力。它直接對(duì)應(yīng)于人眼顏色視覺特性三要素,即色調(diào)H、飽和度S和亮度V,通道間各自獨(dú)立。色調(diào)H表示從一個(gè)物體反射過來的或透過物體的光波長(zhǎng),即是光的顏色,不同波長(zhǎng)的光呈現(xiàn)不同的顏色,具有不同的色調(diào)。飽和度S表示顏色的深淺程度,飽和度高顏色深,如深藍(lán)。飽和度低則顏色淺,如淺藍(lán)。飽和度的深淺與顏色中加入白色的比例有關(guān),它反映了某種顏色被白色沖淡的程度,白色成分為0,則飽和度為100%,只有白色,則飽和度為0。亮度V表示人眼感覺到的光的明暗程度,與物體的反射率成正比。用一個(gè)三維空間錐體可以將色調(diào)、飽和度、亮度表示出來如圖2-2示:色調(diào)H被表示為繞圓錐中心軸的角度,飽和度S被表示為從圓錐的橫截面的圓心到這個(gè)點(diǎn)的距離,亮度V被表示為從圓錐的橫截面的圓心到頂點(diǎn)的距離。圖 2-2 HSV顏色模型(3)顏色空間的轉(zhuǎn)換HSV顏色空間是一個(gè)均勻顏色空間,其轉(zhuǎn)換是一個(gè)非線性變換。一幅圖像中的RGB值(R,G,B)通過非線性轉(zhuǎn)換可轉(zhuǎn)換到HSV空間值(H,S,V)。一般情況下獲取的圖像都是在RGB空間描述的,但是RGB空間結(jié)構(gòu)并不符合人們對(duì)顏色相似性的主觀判斷,所計(jì)算出來的兩種顏色之間的距離無法正確表征人們實(shí)際所感知到的兩種顏色的真實(shí)差異。而HSV顏色空間由色調(diào)(H)、飽和度(S)、亮度(V)三個(gè)分量組成,與人眼的視覺特性比較接近,其中亮度表示顏色的明暗程度,主要受光源強(qiáng)弱影響;色調(diào)表示不同顏色,如紅、綠、黃;而飽和度表示顏色的深淺如深紅、淺紅。顯然,HSV空間要比RGB空間更直觀,更容易接受。因此,為了更符合人眼的視覺特征,經(jīng)常需要做顏色空間的轉(zhuǎn)換,將RGB顏色空間轉(zhuǎn)換為HSV顏色空間,轉(zhuǎn)換公式如下:(2-1)(2-2)(2-3)給定RGB顏色空間的值,則轉(zhuǎn)換到HSV空間的值計(jì)算如下:設(shè),定義為:(2-4)則(2-5)(2-6)需要說明的是,在時(shí),即的情況下,沒有意義,這時(shí)可定義:,。在Matlab里面通過該指令h,s,v = rgb2hsv(Image);來進(jìn)行RGB到HSV的空間轉(zhuǎn)換。其中rgb2hsv是一個(gè)把rgb圖像轉(zhuǎn)化為hsv圖像的函數(shù),這兩種圖像都是索引圖像。2.1.2 顏色量化顏色量化是圖像工程中的一項(xiàng)基本而重要的技術(shù),它是進(jìn)行圖像分割和對(duì)象提取的基礎(chǔ)。自然界具有無限豐富的顏色,真彩色圖像具有種顏色,而在某些情況下(如圖像檢索、印染等),對(duì)顏色的數(shù)目有一定的限制。如何選取有代表性的若干種顏色,并把各種顏色都?xì)w并到這些代表色上,就是顏色量化需要解決的問題。顏色量化的定義為確定一組顏色以代表圖像的顏色空間,然后確定從顏色空間到選定顏色集合的映射。顏色量化技術(shù)一般可分為均勻和非均勻量化兩類。在均勻量化方法中,變量的范圍被分為相等的空間。顏色空間的均勻量化比非均勻量化計(jì)算速度快,但是,量化后的顏色空間中的許多部分都是沒用的,這是因?yàn)閳D像中可能不含有這些量化區(qū)間中的顏色。在非均勻量化中,變量的范圍被隨即地剖分成一系列區(qū)間。通過采用基于圖像統(tǒng)計(jì)的顏色查找表,可保證量化顏色空間中的每個(gè)區(qū)間都非空,從而使所顯示的圖像獲得更好的視覺效果。目前常用的顏色量化方法大體可分為分割算法和聚類算法兩大類。代表性的分割算法有頻度序列法、中值分裂發(fā)、八叉樹法等,其基本思想是將圖像中出現(xiàn)的頻率最高的K種色彩作為調(diào)色板,然后將其余顏色按照最小距離準(zhǔn)則映射到調(diào)色板中。聚類算法則先選擇若干聚類中心,然后按某種準(zhǔn)則對(duì)顏色進(jìn)行迭代聚合,知道合適的分類為止。典型的有K均值聚類算法、模糊c均值聚類算法、學(xué)習(xí)向量法等。2.1.3 顏色特征的提取方法(1)顏色直方圖顏色直方圖就是根據(jù)圖像中每個(gè)像素出現(xiàn)在色彩空間的概率統(tǒng)計(jì)而成的,計(jì)算顏色直方圖需要將顏色空間劃分為若干個(gè)小的顏色區(qū)間,每個(gè)區(qū)間成為直方圖的一個(gè)柄(bin)。然后,通過計(jì)算顏色落在每個(gè)小區(qū)間的像素?cái)?shù)量可以得到顏色直方圖。橫坐標(biāo)表示顏色的色彩的值,縱坐標(biāo)表示每個(gè)小的顏色區(qū)間中所對(duì)應(yīng)的圖像像素的總和。它的優(yōu)點(diǎn)就在于它能簡(jiǎn)單描述一幅圖像中顏色的全局分布,即不同色彩在整幅圖像中所占的比例,特別適用于描述那些難以自動(dòng)分割的圖像和不需要考慮物體空間位置的圖像。顏色直方圖是在許多圖像檢索系統(tǒng)中被廣泛采用的顏色特征表示法。在RGB顏色空間中,顏色直方圖可以看成是一個(gè)離散函數(shù),即(2-7)其中,k表示圖像的特征取值,L表示特征可取值的個(gè)數(shù),表示圖像中具體征值為k的像素個(gè)數(shù),n表示圖像像素的總個(gè)數(shù)。(2)顏色累加直方圖當(dāng)圖像中的特征并不能取遍所有可取值時(shí),統(tǒng)計(jì)直方圖中會(huì)出現(xiàn)一些零值。這些零值的出現(xiàn)會(huì)對(duì)相似性度量的計(jì)算帶來影響,從而使得相似性度量并不能正確反映圖像之間的顏色差別。為解決這個(gè)問題,在全局直方圖的基礎(chǔ)上,Stricker和Orengo進(jìn)一步提出了使用“累加顏色直方圖”的概念。在累加直方圖中,相鄰顏色在頻數(shù)上是相關(guān)的。相比一般直方圖,雖然累加直方圖的存儲(chǔ)量和計(jì)算量有很小的增加,但是累加直方圖消除了一般直方圖中常見的零值,也克服了一般直方圖量化過細(xì)過粗檢索效果都會(huì)下降的缺陷。圖像特征統(tǒng)計(jì)的累積直方圖也是一個(gè)一維的離散函數(shù),即對(duì)原有統(tǒng)計(jì)直方圖作迭代累加。顯然,當(dāng)k = L-1時(shí),累積直方圖的縱坐標(biāo)值為1,因?yàn)楦鶕?jù)所有條件概率求全概率的值為1。對(duì)彩色圖像,可對(duì)其3個(gè)分量分別做累積直方圖。(3) 顏色矩另一種非常簡(jiǎn)單而有效的顏色特征表示方法是由Stricker和Rengo所提出的顏色矩(ColorMoments)。這種方法的基礎(chǔ)在于圖像中任何的顏色分布均可以用它的矩來表示。此外,由于顏色分布信息主要集中在低階矩中,因此僅采用顏色的一階矩、二階矩和三階矩就足以表達(dá)圖像的顏色分布。與顏色直方圖相比,該方法的另一個(gè)好處在于無需對(duì)特征進(jìn)行向量化。顏色的三個(gè)低階矩在數(shù)學(xué)上可以用公式,表達(dá):(2-8)(2-9)(2-10)顏色矩己經(jīng)成功地應(yīng)用于許多基于內(nèi)容的圖像檢索系統(tǒng)(如QBIC),特別是對(duì)于圖像中只包括一個(gè)目標(biāo)的時(shí)候非常有效,由于采用9個(gè)數(shù)值(三個(gè)顏色坐標(biāo)軸,每個(gè)坐標(biāo)軸包括三個(gè)顏色矩),所以相對(duì)于其它顏色特征而言,采用顏色矩表示顏色特征是一個(gè)非常有效的表示方法。雖然傳統(tǒng)的顏色直方圖方法與其他方法相比不能很好的表達(dá)圖像的空間特征,但卻是最簡(jiǎn)單、最廣泛使用的方法。2.2 圖像紋理特征分析紋理是一種不依賴于顏色和亮度的反映圖像同質(zhì)現(xiàn)象的視覺特征,體現(xiàn)了物體表面共有的內(nèi)在特性;同時(shí),紋理還包含了物體表面組織結(jié)構(gòu)排列的重要信息以及它們與周圍環(huán)境的聯(lián)系。正因?yàn)槿绱?,紋理特征在基于內(nèi)容的圖像檢索中得到了廣泛的應(yīng)用。本節(jié)介紹了四類(統(tǒng)計(jì)法、結(jié)構(gòu)法、頻譜法、模型法)經(jīng)典的紋理描述算法,在此基礎(chǔ)上,詳細(xì)討論了灰度共生矩陣的描述方法。2.2.1圖像紋理特征描述(1)紋理及紋理特征的定義紋理是自然界中常見的現(xiàn)象,是任何事物構(gòu)成成分的分布或特征。習(xí)慣上認(rèn)為紋理是表現(xiàn)在視覺圖像上灰度或顏色分布的某種規(guī)律性,這種規(guī)律性在不同類別的事物中有著不同的特點(diǎn)。人們常將那些在圖像局部區(qū)域內(nèi)呈現(xiàn)不規(guī)則性,而在整體上表現(xiàn)出某種規(guī)律性的特征成為紋理。它具有層次性、尺度性、平移不變性和確定與隨即二重性。與其他圖像特征相比,紋理反映了圖像灰度模式的空間分布,包含了圖像的表面信息及其與周圍環(huán)境的關(guān)系,更好地兼顧了圖像的宏觀信息與微觀結(jié)構(gòu),紋理分析便成為圖像分析的重要手段。由于人們對(duì)紋理的感受是與心里效果相結(jié)合的,用語言或文字來描述紋理通常很困難,因此,盡管人們的視覺系統(tǒng)能很方便的識(shí)別紋理,但對(duì)于問題圖像卻很難下一個(gè)確切的定義。紋理特征,是指利用計(jì)算機(jī)技術(shù)從數(shù)字圖像中計(jì)算出來的,可以定量描述人對(duì)紋理的定性的感知的某些參數(shù),它對(duì)區(qū)域內(nèi)部灰度變化或色彩變化的某種規(guī)律進(jìn)行量化,這些紋理特征能夠盡可能的縮小紋理的類內(nèi)差距,同時(shí)盡可能增大紋理的類間差距。紋理的視覺特征一般有三個(gè)基本兩:周期性、方向性和隨機(jī)性,其中周期性和方向性是兩個(gè)高層次紋理特征,可以用來知道紋理圖像的知覺感知。不同的應(yīng)用問題和不同的圖像類型都給圖像紋理特征提出了不同的需求,一方面,紋理定義的不統(tǒng)一性使得紋理分析中的問題更為復(fù)雜,更具有挑戰(zhàn)性;另一方面也由于紋理本身具有的多種屬性使得研究者可以引入多種模型來描述紋理特征。(2)常用的紋理分析方法紋理分析,是指通過一定的圖像處理技術(shù)提取紋理特征,從而獲得紋理的定量或定性描述的處理過程。一般包括兩方面的內(nèi)容,即檢測(cè)出紋理基元和獲得有關(guān)紋理基元的排列分布方式的信息。其基本過程是:先從像素出發(fā),在紋理圖像中提取出一些辨識(shí)能力比較強(qiáng)的特征,作為檢測(cè)出的紋理基元,并找出紋理基元排列的信息,簡(jiǎn)歷紋理基元模型;然后再利用這些紋理基元模型對(duì)紋理圖像進(jìn)行分割、分或識(shí)別處理。目前已經(jīng)有不少紋理特征提取算法,但是由于在實(shí)際處理的圖像中紋理的隨機(jī)性非常大,因此很難找到一種廣泛適用的紋理模型。概括起來說,圖像紋理特征的提取方法主要有四大類:統(tǒng)計(jì)法、結(jié)構(gòu)法、模型法和頻譜法。 統(tǒng)計(jì)法統(tǒng)計(jì)法是利用像素的統(tǒng)計(jì)特性來建立紋理的特征參數(shù),主要思想是通過圖像中灰度級(jí)分布的隨機(jī)屬性來描述紋理特征,主要適用于分析像木紋、森林、山脈、草地那樣的紋理細(xì)膩而且不規(guī)則的物體。 結(jié)構(gòu)法紋理的結(jié)構(gòu)特征可以通過圖像紋理基元的排列規(guī)律來描述,假定紋理基元以一定規(guī)律重復(fù)排列組合成紋理模式,那么就可以通過分析這些紋理基元的排列規(guī)則來提取特征。紋理基元理論認(rèn)為,復(fù)雜的紋理可以由若干簡(jiǎn)單的紋理基元以一定的有規(guī)律的形式重復(fù)排列構(gòu)成。 模型法模型法假設(shè)紋理按某種模型分布,采用模型的參數(shù)作為紋理特征。典型的方法是隨即場(chǎng)模型法,如馬爾可夫隨即場(chǎng)(MRF)模型法、Gibbs隨即場(chǎng)模型法、Wold模型、分形模型法等。這類方法的關(guān)鍵是如何為待處理圖像選擇合適的模型以及如何估計(jì)所選模型的參數(shù)。該類方法存在計(jì)算量大,自然紋理很難用單一模型表達(dá)的缺點(diǎn)。 頻譜法統(tǒng)計(jì)方法和基于模型的方法與人類視覺機(jī)理脫節(jié),難以進(jìn)行更精確的紋理描述,因此,在分析紋理圖像時(shí),常常采用頻譜法。頻譜法就是將紋理圖像看作二維信號(hào),使用濾波方法對(duì)紋理圖像進(jìn)行分析的一種方法。頻譜法包括傅里葉分析法和Gabor、塔式、樹式等小波變換方法,主要是利用頻率特性來表示紋理特征。2.2.2紋理特征的提取方法(1)直方圖的矩直方圖的表示方法:用橫軸代表灰度值,縱軸代表像素?cái)?shù),統(tǒng)計(jì)一幅圖像的像素按灰度分布的圖形就是該幅圖像的灰度直方圖,也可用縱軸代表該灰度值像素?cái)?shù)對(duì)整幅畫面上的總像素?cái)?shù)的比率,這種直方圖又稱灰度概率分布圖。這里采用的是灰度概率分布圖。假設(shè)用表示一個(gè)灰度直方圖,則其n階矩可表示為最簡(jiǎn)單的統(tǒng)計(jì)法借助于灰度直方圖的矩來描述紋理。把直方圖的包絡(luò)看作一條曲線,則可把它表示成函數(shù),這里是任意變量,取遍曲線上所有點(diǎn)。對(duì)這條曲線可通過矩來定量描述。如用表示的均值,即(2-11)則對(duì)均值n階矩為:(2-12)這里與的形狀有直接關(guān)系,也叫方差,是灰度對(duì)比度的度量,表達(dá)了曲線相對(duì)于均值的分布情況,描述了直方圖的相對(duì)平滑程度,進(jìn)一步描述了圖像中灰度的分散程度。可定義偏度,它表達(dá)了曲線相對(duì)于均值的對(duì)稱性,描述了直方圖的偏斜度(skewness),即直方圖分布對(duì)稱與否的情況,描述了圖像中紋理灰度的起伏分布??啥x峰度,它表示了直方圖的相對(duì)平坦性,即直方圖分布聚集于均值附近還是接近兩端的情況,描述了圖像中紋理灰度的反差。需指出這些矩與紋理在空間的絕對(duì)位置是無關(guān)的。(2) 二維灰度直方圖描述紋理特征的另一種簡(jiǎn)單方法是二維灰度直方圖方法。二維直方圖體現(xiàn)了部分位置信息,用像素周圍鄰域的灰度差值作為當(dāng)前像素會(huì)妒忌。定義相鄰像素的距離或位移向量為(2-13)式中,和是整數(shù)。相距為d的像素灰度差為(2-14)對(duì)于不同的d可得到一組,對(duì)給定的d統(tǒng)計(jì)得到差值直方圖,該直方圖體現(xiàn)了一定的圖像紋理信息。如果圖像中的紋理較粗,距離d與紋理基元尺寸相比較小,直方圖將聚集在低端;如果紋理較細(xì),距離d與紋理基元相近,則直方圖的分布將會(huì)擴(kuò)展開來。從二維直方圖提取的紋理屬性特征有:對(duì)比度、角的二階矩、熵、均值。(3)灰度共生矩陣僅借助灰度直方圖的矩來描述紋理沒能利用像素相對(duì)位置的空間性信息。為利用這些信息,可建立區(qū)域灰度共生矩陣,即表示圖像灰度級(jí)空間相關(guān)的矩陣。在20世紀(jì)后期,Haralick等提出了紋理特征的灰度共生矩陣(gray-level co-occurrence matrix,GLCM)表示。灰度共生矩陣不僅是分析紋理特征的經(jīng)典方法,也被證明是一種行之有效的方法,該方法從數(shù)學(xué)角度研究了圖像紋理中灰度級(jí)的空間依賴關(guān)系?;叶裙采仃囃ㄟ^灰度值不等的像素的分布反映了灰度的分布特性,也反映了這些像素對(duì)之間的位置關(guān)系和分布特性。基本步驟是先利用像素對(duì)之間的方向和距離參數(shù)構(gòu)造共生矩陣,然后從矩陣中提取能量、對(duì)比度等有意義的統(tǒng)計(jì)量來表示紋理特征。這樣做能夠在保證檢索準(zhǔn)確度比較高的條件下,明顯的降低計(jì)算量,即提高檢索速度和效率。所以本系統(tǒng)采用此方法來提取紋理特征?;叶裙采仃嚩x為圖像中相距為的兩個(gè)灰度像素同時(shí)出現(xiàn)的聯(lián)合概率分布,它不僅反映亮度的分布特性,也反映了具有同樣亮度或接近亮度的像素之間的位置分布特性,是有關(guān)圖像亮度變化的二階統(tǒng)計(jì)特征。它是定義一組紋理特征的基礎(chǔ)。灰度共生矩陣中各元素可以定義為:(2-15)式中是圖像像素點(diǎn)坐標(biāo);是圖像的灰度,#表示集合中元素的個(gè)數(shù),為目標(biāo)區(qū)域中具有特定空間聯(lián)系的像素對(duì)的集合,元素的值表示距離為的兩個(gè)灰度級(jí)分別為和的像素出現(xiàn)的聯(lián)合概率密度,這樣得到的是歸一化的。定義中的取值范圍從到,共有個(gè)共生矩陣,每個(gè)矩陣的維數(shù)為。直接用公式(3-5)來計(jì)算灰度共生矩陣是不現(xiàn)實(shí)的,工作量和信息量會(huì)很大。由于是一個(gè)對(duì)稱矩陣,因此在實(shí)際紋理特征估計(jì)時(shí),一般選取位置關(guān)系為四個(gè)固定值,即,令=1,就相當(dāng)于取0,45,90,135這四個(gè)方向上的共生矩陣來表示圖像的紋理特征,計(jì)算量大大減少,簡(jiǎn)化后的計(jì)算公式定義如下:(2-16)由于上式只包括了空間中一半的信息,且是一個(gè)對(duì)稱矩陣,所以只需要將上式計(jì)算得到的共生矩陣翻轉(zhuǎn)后進(jìn)行疊加,即加上其轉(zhuǎn)置矩陣,就可以得到整個(gè)空間域中的灰度分布信息?;谏鲜龌叶裙采仃嚳梢远x諸如紋理二階矩,熵,對(duì)比度和均勻性等14個(gè)紋理特征向量。下面給出常用的最有效的,也是本系統(tǒng)所使用的幾個(gè)紋理特征向量。(1)能量(Energy)(2-17)能量也稱為二階角距,可以反映圖像中紋理的粗細(xì)和灰度分布的均勻程度。其值越大說明紋理越細(xì)、圖像越均勻,當(dāng)值為1時(shí)表明圖像灰度分布完全均勻;反之,值越小說明紋理越粗糙、灰度越不均勻。(2)熵(Entropy)(2-18)熵是圖像信息量的度量,描述了圖像中灰度變化的復(fù)雜程度。熵值越大表明圖像的復(fù)雜程度越高;熵值越小表明圖像復(fù)雜程度越低。(3)對(duì)比度(Contrast)(2-19)對(duì)比度也稱慣性矩。對(duì)比度描述了圖像的灰度變化情況,反映了紋理的強(qiáng)弱和圖像的清晰度。對(duì)比度越大表示相鄰像素間的灰度差異越大紋理越明顯;對(duì)比度值越小表示紋理越不明顯,當(dāng)對(duì)比度值為0時(shí)圖像沒有紋理。(4)相關(guān)(Correlation)(2-20)其中,分別是和的均值和標(biāo)準(zhǔn)差;是共生矩陣中每行之和,同樣的,是共生矩陣中每列之和。相關(guān)反映了共生矩陣的行和列上元素的相似程度,在紋理方向上的值大于其他方向上的值,所以可以通過比較四個(gè)方向的共生矩陣的相關(guān)值的大小來得到紋理的方向。由于這些參量表示了圖像紋理特征某一方面的性質(zhì),因此通過比較這些參量,可反映出不同圖像紋理特征的差異,實(shí)現(xiàn)圖像檢索。(4)圖像紋理譜紋理譜方法的主要思想是利用局部紋理模式作為紋理單元來進(jìn)行紋理分析,通過刻畫圖像像素點(diǎn)鄰域內(nèi)灰度的變化來描述圖像的紋理結(jié)構(gòu)特征。紋理譜直方圖是對(duì)局部紋理結(jié)構(gòu)的統(tǒng)計(jì)方法。紋理譜與以往的方法相比概念清楚,所需的計(jì)算量較小,近年來越來越受到重視。數(shù)字圖像的每一個(gè)像素(除邊界像素外)都由8個(gè)相鄰像素圍著,單個(gè)像素的紋理可從其周圍的33鄰域中提取,這個(gè)33鄰域表示其中心像素所有8個(gè)方向的最小完整單元。對(duì)于圖像中的一個(gè)33鄰域,如圖2-3所示,該鄰域內(nèi)的九個(gè)像素記為,其中表示中心像素灰度值。同時(shí)定義一個(gè)紋理單元,包含8個(gè)像素,。定義的值為:(2-21)其中,表示一個(gè)正常量,與像素對(duì)應(yīng)。對(duì)于中的每個(gè)元素均有三種取值可能,所以對(duì)于8個(gè)單元共有38=6561個(gè)可能取值。因此,紋理單元的個(gè)數(shù)為:。上述定義的一組6561個(gè)紋理單元描述的是給定像素的紋理特征,即中心像素與其周圍鄰域像素之間的相對(duì)灰階關(guān)系。對(duì)圖像的所有紋理單元的發(fā)生頻數(shù)進(jìn)行統(tǒng)計(jì),這個(gè)發(fā)生頻數(shù)函數(shù)就表征了所要分析的圖像的紋理信息。我們稱這個(gè)所有紋理單元的頻數(shù)發(fā)生函數(shù)為紋理譜。一幅圖像通常由兩部分組成,紋理基元和隨機(jī)噪聲或背景。紋理組分相對(duì)于背景的百分比越大,紋理特征就越容易被人的視覺所覺察。就紋理譜而言,一幅圖像的紋理組分的百分比越大,就會(huì)導(dǎo)致特殊的峰分布,而且,不同的紋理是由具有不同紋理譜的特殊的紋理單元所組成。從這一點(diǎn)上看,一幅圖像的紋理信息可以由紋理譜來描述。圖2-3 圖像中一個(gè)33像素鄰域3 特征提取算法選擇3
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 宿州學(xué)院《德語會(huì)話(4)》2023-2024學(xué)年第一學(xué)期期末試卷
- 2025至2031年中國珠繡內(nèi)衣行業(yè)投資前景及策略咨詢研究報(bào)告
- 微型計(jì)算機(jī)原理與接口技術(shù):第一章 概述
- 婚前購房的協(xié)議書
- 神經(jīng)根病變的臨床護(hù)理
- 新質(zhì)生產(chǎn)力音樂行業(yè)
- 人教版語文二年級(jí)上冊(cè)《秋天的圖畫》教學(xué)設(shè)計(jì)
- 年度工作計(jì)劃的調(diào)整與優(yōu)化
- 創(chuàng)業(yè)與就業(yè)社團(tuán)工作計(jì)劃
- 現(xiàn)代化生產(chǎn)設(shè)施的規(guī)劃與設(shè)計(jì)計(jì)劃
- 機(jī)械制造及非標(biāo)零部件加工項(xiàng)目突發(fā)環(huán)境事件應(yīng)急預(yù)案
- 2025年裝維智企工程師(三級(jí))復(fù)習(xí)模擬100題及答案
- 國家管網(wǎng)集團(tuán)西南管道昆明輸油氣分公司突發(fā)環(huán)境事件綜合應(yīng)急預(yù)案
- 施工現(xiàn)場(chǎng)臨時(shí)用電安全
- 停送電培訓(xùn)課件
- 醫(yī)院培訓(xùn)課件:《核心制度-護(hù)理值班和交接班制度》
- 解題秘籍05 圓的綜合問題(9種題型匯-總+專題訓(xùn)練)(解析版)-2025年中考數(shù)學(xué)重難點(diǎn)突破
- 無線網(wǎng)絡(luò)施工方案
- 電商平臺(tái)居間合同
- 阮樂器美術(shù)課件
- 中國大唐集團(tuán)有限公司陸上風(fēng)電工程標(biāo)桿造價(jià)指標(biāo)(2023年)
評(píng)論
0/150
提交評(píng)論