




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
緒論1.1研究背景和意義商標(biāo)是在生產(chǎn)、制造、加工、揀選或者經(jīng)銷的商品上或者服務(wù)的提供者在其商品或者提供的服務(wù)上采用的,用于區(qū)別商品或服務(wù)來源的標(biāo)志。商標(biāo)由文字、圖形、字母、數(shù)字、三維標(biāo)志、聲音、顏色組合等元素構(gòu)成,它是一種具有顯著特征的標(biāo)志,它也是經(jīng)濟(jì)迅速發(fā)展的一個(gè)產(chǎn)物。我國(guó)是世界第一商標(biāo)大國(guó),商標(biāo)注冊(cè)申請(qǐng)量和審查量等均位居世界第一。因此,高效、準(zhǔn)確地從商標(biāo)庫中檢索出潛在的近似商標(biāo)成為一個(gè)重要研究方向[1]。商標(biāo)作為一種特殊的并且具有商業(yè)價(jià)值和法律效力的圖片,為了凸顯它的價(jià)值,應(yīng)該具有外形唯一性。因此應(yīng)當(dāng)避免申請(qǐng)注冊(cè)商標(biāo)和已注冊(cè)商標(biāo)相似。為了避免與已經(jīng)注冊(cè)的商標(biāo)相似,需要在商標(biāo)注冊(cè)之前對(duì)已注冊(cè)的商標(biāo)進(jìn)行檢索[1]。傳統(tǒng)的商標(biāo)檢索的那種先通過人工對(duì)商標(biāo)進(jìn)行分類,再根據(jù)人工分配的分類碼來檢索商標(biāo)圖像的方法,既耗時(shí)又主觀主義[2],一般只能適用于幾乎全用文本的商標(biāo),對(duì)于那種沒有多少文本而是用圖片為內(nèi)容的商標(biāo),這種檢索準(zhǔn)確率很低。所以在商標(biāo)檢索過程中,如何探測(cè)現(xiàn)代用戶需求,提供最能滿足用戶意圖的個(gè)性化檢索結(jié)果成為當(dāng)前圖像檢索技術(shù)中急需解決的課題。目前最近幾年出現(xiàn)的尺度不變特征變換算法SIFT及相關(guān)算法PCA-SIFT[4]和SUFR[4]算法,這幾種局部特征算法能提取出比較穩(wěn)定的特征點(diǎn),并且對(duì)光照、旋轉(zhuǎn)、尺度甚至是仿射變化都具有很好的魯棒性,但是這類算法在進(jìn)行特征匹配時(shí)采用的方法比較耗時(shí),無法應(yīng)用于大量圖像的快速檢索。使利用SIFT提供個(gè)性化智能檢索成為具有實(shí)踐性和創(chuàng)新性的研究方向。本文以Zernike矩、偽Zernike矩、Hu矩和模糊方向以及Legendre矩算法作為特征分別進(jìn)行了檢索,并用SIFT算法對(duì)結(jié)果進(jìn)行了匹配檢驗(yàn)。1.2傳統(tǒng)的商標(biāo)檢索技術(shù)1.2.1基于文本的商標(biāo)檢索技術(shù)基于文本的商標(biāo)圖像檢索沿用了傳統(tǒng)文本檢索技術(shù),回避對(duì)圖像可視化元素的分析,而是從圖像名稱、圖像尺寸、壓縮類型、作者、年代等方面標(biāo)引圖像,一般以關(guān)鍵詞形式的提問查詢圖像,或者是根據(jù)等級(jí)目錄的形式瀏覽查找特定類目下的圖像,如GettyAAT使用近133,000個(gè)術(shù)語來描述藝術(shù)、藝術(shù)史、建筑以及其它文化方面的對(duì)象,并推出30多個(gè)等級(jí)目錄,從7方面描述圖像的概念、物理屬性、類型和刊號(hào)等。又如Gograph將圖像分為動(dòng)態(tài)圖像、照片、圖標(biāo)、背景、藝術(shù)剪輯圖、插圖、壁紙、界面、成套圖像8個(gè)一級(jí)類,下設(shè)數(shù)量不等的子類。在圖像數(shù)字化之前,檔案管理者、圖書管理員都是采用這種方式組織和管理圖像?;谖谋镜纳虡?biāo)圖形檢索典型的的操作方法是將我們想要的商標(biāo)圖像用某一種查詢語言描述,檢索的過程就是匹配標(biāo)注和描述,然后將商標(biāo)圖形數(shù)據(jù)庫中相似的圖像返回。目前廣泛使用的如Google,百度的圖片搜索就是應(yīng)用的這種模式。1.2.2基于分類的商標(biāo)檢索技術(shù)目前,基于分類的商標(biāo)檢索技術(shù)是實(shí)踐中使用最為普遍的方式之一,通過等級(jí)式分類目錄對(duì)不同行業(yè)不同領(lǐng)域的商標(biāo)進(jìn)行分類和組織,并提供基于分類的瀏覽查找。著名的商標(biāo)國(guó)際分類通用標(biāo)準(zhǔn)有《有關(guān)商標(biāo)注冊(cè)用商品和服務(wù)國(guó)際分類的尼斯協(xié)定》(簡(jiǎn)稱《尼斯協(xié)定》,NiceClassification)[3],我國(guó)在1988年以前采用的是國(guó)內(nèi)分類法,自1988年11月開始采用尼斯國(guó)際分類。尼斯分類包括45個(gè)大類,其中商品34類,服務(wù)項(xiàng)目11類,共包含一萬多個(gè)商品和服務(wù)項(xiàng)目。同時(shí)為了對(duì)包括圖形要素的商標(biāo)建立分類,另有《建立商標(biāo)圖形要素國(guó)際分類的維也納協(xié)定》(簡(jiǎn)稱《維也納協(xié)定》,ViennaClassification)[5],用于對(duì)圖形要素進(jìn)行編碼分類顯示,該分類由商標(biāo)圖形要素按大類、小類及組分類的一覽表組成,并根據(jù)情況加以注釋。1.2.3傳統(tǒng)商標(biāo)檢索技術(shù)的缺點(diǎn) (1)基于文本的商標(biāo)檢索技術(shù)的缺點(diǎn)由于對(duì)商標(biāo)圖像的標(biāo)注的深度不夠和查詢方式的單一,基于文本的商標(biāo)檢索技術(shù)就不能達(dá)到很好的效果,無法令人真正滿意,用戶需要在返回的很多商標(biāo)中一個(gè)個(gè)再次查找,導(dǎo)致檢索的效率不高,這些問題的出現(xiàn)使得基于文本的商標(biāo)檢索的應(yīng)用出現(xiàn)障礙,從而促進(jìn)了基于內(nèi)容的商標(biāo)檢索技術(shù)的發(fā)展。(2)基于分類的商標(biāo)檢索技術(shù)的缺點(diǎn)基于分類的商標(biāo)檢索方法大量依賴人工處理,面對(duì)日益增加的大量待注冊(cè)商標(biāo),分類和標(biāo)記太慢;分類方法一旦確定后,就難以更改,對(duì)于大家制定的標(biāo)準(zhǔn)中出現(xiàn)的不合理的地方很難去修改,也很難在分類標(biāo)準(zhǔn)中更新標(biāo)準(zhǔn),因?yàn)檫@樣做的話需要對(duì)重新分類已有的所有圖像。由于以上原因,傳統(tǒng)的商標(biāo)檢索技術(shù)已經(jīng)日益落后于人們對(duì)于商標(biāo)檢索的需求,而基于內(nèi)容的商標(biāo)檢索技術(shù)日益成為人們研究的熱點(diǎn)。1.3基于內(nèi)容的商標(biāo)檢索技術(shù)基于內(nèi)容的圖像檢索技術(shù),即CBIR[5](Content-basedimageretrieval),是計(jì)算機(jī)視覺領(lǐng)域中關(guān)注大規(guī)模數(shù)字圖像內(nèi)容檢索的研究分支。典型的CBIR系統(tǒng),允許用戶輸入一張圖片,查找具有相同或相似內(nèi)容的其他圖片。而商標(biāo)檢索技術(shù)是這些技術(shù)的應(yīng)用方向之一。T.Kato在1992年提出基于內(nèi)容的圖像檢索技術(shù)這一概念。他構(gòu)建了一個(gè)基于色彩與形狀的圖像數(shù)據(jù)庫,然后提供了一定的檢索功能進(jìn)行實(shí)驗(yàn)。此后,基于圖像特征提取以實(shí)現(xiàn)圖像檢索的過程以及CBIR這一概念,被廣泛應(yīng)用于各種研究領(lǐng)域,如統(tǒng)計(jì)學(xué)、模式識(shí)別、信號(hào)處理和計(jì)算機(jī)視覺。目前,該技術(shù)已成功應(yīng)用于人臉識(shí)別技術(shù);針對(duì)商標(biāo)與設(shè)計(jì)專利類的圖像進(jìn)行檢索,防止專利糾紛的產(chǎn)生。圖1.1CBIR檢索流程示意圖因?yàn)閳D像的信息量一般要大于純粹的文本信息,所以基于內(nèi)容的圖像檢索在檢索的速度和效率上要求更高。目前已有不少應(yīng)用于實(shí)踐環(huán)境的基于內(nèi)容圖像檢索系統(tǒng),如由IBM公司開發(fā)的最早商業(yè)化QBIC系統(tǒng),以及由哥倫比亞大學(xué)研發(fā)的WebSeek系統(tǒng)、麻省理工學(xué)院研發(fā)的Photobook系統(tǒng)等[5]。1.4基于內(nèi)容的商標(biāo)檢索技術(shù)的現(xiàn)狀和分析商標(biāo)圖像特征一般包括顏色、形狀以及版面等特征,與其它圖像相比,作為人工圖像的商標(biāo)圖像,其形狀特征較顏色特征更為顯著,而且許多商標(biāo)圖像屬于單色無紋理的二值圖像,因此一般利用形狀特征進(jìn)行檢索,而形狀特征的表達(dá)必須以對(duì)圖像中物體或區(qū)域的劃分為基礎(chǔ)。對(duì)于一般的圖像,當(dāng)前的技術(shù)無法做到準(zhǔn)確而魯棒的自動(dòng)圖像分割,對(duì)于商標(biāo)圖像,其包含的物體或區(qū)域可以直接獲得,所以形狀特征能很好地應(yīng)用于商標(biāo)圖像檢索。為方便對(duì)圖像進(jìn)行形狀特征提取。先將商標(biāo)圖像轉(zhuǎn)換成二值商標(biāo)圖像。二值商標(biāo)圖像僅僅由白色和黑色兩種像素組成,本文默認(rèn)黑色為目標(biāo)像素,白色為背景像素。基于內(nèi)容的圖像檢索方法,就是指先提取出圖像中物體的顏色、形狀、紋理等圖像特征,以及這些特征的組合,再生成特征向量,用特征向量來表征圖像內(nèi)容,通過對(duì)特征向量進(jìn)行相似性度量,來查詢檢索圖像的方法。從定義就可以知道,基于內(nèi)容的圖像檢索技術(shù)的關(guān)鍵就是特征提取和匹配,主要包括:圖像的特征提取、相似性度量和相關(guān)性反饋等方面[6]。1.4.1國(guó)外基于內(nèi)容的商標(biāo)檢索技術(shù)現(xiàn)狀QBIC[5](QueryByImageContent)是IBM公司的推出的世界上第一個(gè)商業(yè)化的基于內(nèi)容的圖像檢索系統(tǒng),它的出現(xiàn)對(duì)后來的圖像檢索技術(shù)發(fā)展有著深遠(yuǎn)的影響。T.Kato在1992年提出這一概念。他構(gòu)建了一個(gè)基于色彩與形狀的圖像數(shù)據(jù)庫,然后提供了一定的檢索功能進(jìn)行實(shí)驗(yàn)。此后,基于圖像特征提取以實(shí)現(xiàn)圖像檢索的過程以及CBIR這一概念,被廣泛應(yīng)用于各種研究領(lǐng)域,如統(tǒng)計(jì)學(xué)、模式識(shí)別、信號(hào)處理和計(jì)算機(jī)視覺。目前,該技術(shù)已成功應(yīng)用于人臉識(shí)別技術(shù);針對(duì)商標(biāo)與設(shè)計(jì)專利類的圖像進(jìn)行檢索,防止專利糾紛的產(chǎn)生。STAR[7](SystemforTrademarkArchivalandRetrieval)是由新加坡國(guó)立大學(xué)開發(fā)的商標(biāo)圖像檢索系統(tǒng),它結(jié)合顏色和形狀特征,而且同時(shí)使用了商標(biāo)圖像的三種主要的特征,商標(biāo)形狀和結(jié)構(gòu)、商標(biāo)文字和商標(biāo)含義,而不同于其它的系統(tǒng)通常只采用圖像的形狀特征,使得在計(jì)算圖像相似性時(shí)的判斷更加靈活。主要采用基于邊界的Fourier描述子、不變矩和研究比較成熟的灰度投影這些商標(biāo)圖像的形狀特征來描述,而且使用多特征融合可以提取商標(biāo)圖像不同側(cè)重的特征點(diǎn),實(shí)際上起到了取長(zhǎng)補(bǔ)短的作用。系統(tǒng)還支持相關(guān)反饋來提取商標(biāo)圖像中的重要部分,將這些部分從圖像中分割出來,然后通過計(jì)算并存儲(chǔ)這些部分的形狀特征,并將它們分類為既定的類別中的一個(gè)或多個(gè),這種方法能夠反映整個(gè)商標(biāo)圖像的整體形狀。除此之外,STAR系統(tǒng)采用一種基于詞典的模糊辭典技術(shù)。1.4.2國(guó)內(nèi)基于內(nèi)容的商標(biāo)檢索技術(shù)現(xiàn)狀我國(guó)在1988年以前采用的是國(guó)內(nèi)分類法,自1988年11月開始采用尼斯國(guó)際分類。尼斯分類包括45個(gè)大類,其中商品34類,服務(wù)項(xiàng)目11類,共包含一萬多個(gè)商品和服務(wù)項(xiàng)目。同時(shí)為了對(duì)包括圖形要素的商標(biāo)建立分類,另有《建立商標(biāo)圖形要素國(guó)際分類的維也納協(xié)定》(簡(jiǎn)稱《維也納協(xié)定》,ViennaClassification)[4],用于對(duì)圖形要素進(jìn)行編碼分類顯示,該分類由商標(biāo)圖形要素按大類、小類及組分類的一覽表組成,并根據(jù)情況加以注釋。MIRES[11]是中科院計(jì)算所智能信息處理重點(diǎn)實(shí)驗(yàn)室,在國(guó)家863計(jì)劃支持下研制的,可以完成示例圖像、關(guān)鍵詞或兩種模式交互混合三種方式的檢索,允許用戶設(shè)置各種特征的權(quán)重因子,支持相關(guān)反饋。在MIRES系統(tǒng)中,用戶在客戶端可以上傳檢索樣本圖像,也可以提供樣本圖像的語義關(guān)鍵詞,對(duì)于專業(yè)用戶還可以設(shè)置一些重要參數(shù)和對(duì)結(jié)果進(jìn)行相關(guān)反饋。MIRES系統(tǒng)在服務(wù)器端的工作,主要是接收用戶上傳的檢索要求,通過對(duì)數(shù)據(jù)和參數(shù)進(jìn)行分析,來選擇最佳的查詢策略,并啟動(dòng)相應(yīng)的檢索引擎,進(jìn)行檢索。最后將查詢結(jié)果按照?qǐng)D像的相似度降序排列后返回給用戶。另外MIRES系統(tǒng)還提供了分布式的系統(tǒng)運(yùn)行平臺(tái),使用戶和服務(wù)器有著更好的通信方式。1.5本文的研究工作本文主要研究了基于內(nèi)容的商標(biāo)檢索技術(shù),針對(duì)于Zernike矩、偽Zernike矩、Legendre矩、模糊方向和Hu矩算法進(jìn)行了商標(biāo)檢索實(shí)驗(yàn),然后用SIFT算法對(duì)用傳統(tǒng)算法檢索出的結(jié)果進(jìn)行匹配,然后比較了Zernike矩、偽Zernike矩、Legendre矩、模糊方向和Hu矩算法的優(yōu)劣,并就SIFT算法的性能進(jìn)行了研究。首先我通過實(shí)驗(yàn)分析了Zernike矩、偽Zernike矩、Legendre矩、模糊方向和Hu矩算法的優(yōu)劣,并對(duì)其進(jìn)行了分析,然后運(yùn)用SIFT對(duì)匹配出的圖像進(jìn)行匹配,算出匹配的特征點(diǎn)數(shù),然后與之前得到的結(jié)果進(jìn)行對(duì)比,分析結(jié)果的差異。最后在結(jié)合前人研究成果和現(xiàn)在的發(fā)展趨勢(shì),以及自己的一些淺薄觀點(diǎn),對(duì)基于內(nèi)容的商標(biāo)檢索技術(shù)的發(fā)展和改善提出了自己的一些看法和意見。1.6本文的內(nèi)容安排首先介紹了論文研究的背景和研究意義,并就現(xiàn)有的商標(biāo)檢索方法進(jìn)行分析。針對(duì)現(xiàn)有的商標(biāo)檢索方法的弊端,介紹了基于內(nèi)容的商標(biāo)檢索的研究意義和必要性,另外還介紹了基于內(nèi)容的商標(biāo)檢索技術(shù)的發(fā)展以及目前的研究現(xiàn)狀,最后概括了本文的主要研究?jī)?nèi)容和文章結(jié)構(gòu)安排。主要介紹了常見的傳統(tǒng)特征提取方法:基于點(diǎn)的特征提取、基于輪廓的特征提取、基于區(qū)域的特征提取,并對(duì)這三種算法進(jìn)行了分析。然后著重分析了SIFT算法以及該算法的運(yùn)算步驟。主要介紹了基于內(nèi)容的商標(biāo)檢索技術(shù)的性能檢測(cè)的主要方法。主要介紹了基于內(nèi)容的商標(biāo)檢索技術(shù)的實(shí)驗(yàn)步驟和實(shí)驗(yàn)思路,然后就實(shí)驗(yàn)過程和實(shí)驗(yàn)得到的結(jié)果進(jìn)行了簡(jiǎn)單的分析。主要對(duì)當(dāng)前比較流行的方法和新興的基于內(nèi)容的商標(biāo)檢索技術(shù)進(jìn)行一些展望,并就檢索性能的改善提出自己的一些看法。
2基于內(nèi)容的商標(biāo)檢索中的特征提取2.1引言一般來說,圖像的特征主要是指圖像的紋理特征、顏色特征、形狀特征。提取紋理特征的常用的方法有:小波變換、灰度共生矩陣、Tamura紋理等;提取顏色特征的常用方法有:顏色矩、顏色直方圖等;提取形狀特征的常用方法有:傅里葉描述子、Hu不變矩、小波輪廓描述子等。商標(biāo)的特征提取是基于內(nèi)容的商標(biāo)檢索的重要組成部分,后面的商標(biāo)檢索和匹配精度很大程度上取決于商標(biāo)特征的優(yōu)劣性。商標(biāo)圖像與一般圖像比較,有圖像簡(jiǎn)單,紋理信息比較少,而且顏色信息和空間信息也不足以判別兩個(gè)商標(biāo)是否相似。所以基于內(nèi)容的商標(biāo)檢索中,形狀特征是相對(duì)而言更加重要的特征。傳統(tǒng)的基于內(nèi)容的商標(biāo)檢索的特征提取方法主要是基于輪廓和基于區(qū)域的特征提取方法。一般來說,傳統(tǒng)的許多特征提取算法存在計(jì)算復(fù)雜、可靠性低,或者算法思想簡(jiǎn)單、應(yīng)用性差等問題。而且會(huì)對(duì)圖像中如光照,仿射變化等屬性非常敏感。最近幾年,隨著DavidG.Lowe在2004年完整提出SIFT算法以來,利用圖像的局部特征來表征圖像已經(jīng)越來越成為研究的熱點(diǎn)。相比于傳統(tǒng)方法,SIFT及相關(guān)算法不僅能提取出對(duì)旋轉(zhuǎn)變化、放縮變化、光照變化、仿射變化變現(xiàn)穩(wěn)定的特征點(diǎn),而且能夠提取出圖像的局部區(qū)域特征相似點(diǎn),匹配能力很強(qiáng),甚至對(duì)三維物體也具有非常好的效果。為了能選擇出一個(gè)適合商標(biāo)圖像的特征提取方法,首先我們將介紹現(xiàn)有的特征提取方法和SIFT相關(guān)算法,然后用實(shí)驗(yàn)去檢驗(yàn)各自的效果,最后進(jìn)行分析和比較。2.2現(xiàn)有的基于內(nèi)容商標(biāo)檢索的特征提取方法商標(biāo)圖像一般是二值圖像,所以形狀特征是其主要的特征。Hu在1962年提出了關(guān)于圖像識(shí)別的不變矩理論,用7個(gè)Hu不變矩來表征圖像的形狀。7個(gè)Hu不變矩對(duì)于旋轉(zhuǎn)、縮放、平移的變化不敏感,反映了區(qū)域的共有特性,已經(jīng)在圖像形狀特征提取中得到廣泛應(yīng)用??偟膩碚f,目前比較常見的商標(biāo)特征提取方法有三種,一是基于點(diǎn)特征的特征提取方法,它一般是基于圖像灰度的;二是基于輪廓的特征提取方法,它一般是基于物體輪廓坐標(biāo)序列的;三是基于區(qū)域的特征提取方法,它一般是基于統(tǒng)計(jì)矩的。下面我就主要介紹一下這三種常見的商標(biāo)特征提取方法。2.2.1基于點(diǎn)的特征提取方法在實(shí)際的商標(biāo)檢索應(yīng)用中,商標(biāo)圖像可能受到平移、視角、光照、尺度等因素的影響,選擇對(duì)這些變化不敏感的點(diǎn)是最佳代表這圖圖像某塊區(qū)域的特征點(diǎn),也稱為角點(diǎn),通過圖像像素的灰度或者梯度信息進(jìn)行特征點(diǎn)提取,可以很好的從嘈雜的一些背景中檢測(cè)出圖像的邊緣特征點(diǎn),現(xiàn)在應(yīng)用得比較廣泛的是Moravec算子和Harris算子,它們已經(jīng)被很多商標(biāo)檢索研究人員應(yīng)用到實(shí)際場(chǎng)合中。下面我將主要介紹一下這兩個(gè)描述子。(1)Moravec算子Moravec在1981年提出了著名的Moravec角點(diǎn)算子,它是一種基于灰度方差的角點(diǎn)檢測(cè)算法,該算子計(jì)算圖像中某個(gè)像素點(diǎn)沿著水平、垂直、對(duì)角線、反對(duì)角線四個(gè)方向的灰度方差,其中的最小值選為該像素點(diǎn)的角點(diǎn)響應(yīng)值CRF(Corner
Response
Function),再通過局部非極大值抑制來檢測(cè)是否為角點(diǎn)。圖2-1Moravec算子步驟對(duì)一個(gè)像素點(diǎn)進(jìn)行角點(diǎn)測(cè)度是以圖像中該點(diǎn)為中心,設(shè)定一個(gè)3×3矩形窗口,并讓該點(diǎn)沿著窗口另外八個(gè)主方向進(jìn)行平移,最后計(jì)算在平移方向后的對(duì)應(yīng)像素點(diǎn)灰度差的平方和,Moravec定義為灰度變化。通過這種角點(diǎn)測(cè)度后,能很好的檢測(cè)出角點(diǎn)。公式中的表示未平移的矩形框中第i個(gè)像素的灰度值,表示未平移的矩形框中第i個(gè)像素的灰度值。(2-1)Moravec通過把計(jì)算出來的灰度變化的極值作為該像素點(diǎn)的興趣值,同時(shí)人為地設(shè)定一個(gè)經(jīng)驗(yàn)閾值,將那些興趣閾值大于這個(gè)經(jīng)驗(yàn)閾值的點(diǎn)構(gòu)成候選點(diǎn)集,而小于的點(diǎn)全部設(shè)置為0。最后求出“修正圖像”的局部極大值,即保留一定區(qū)域中興趣值為最大的候選點(diǎn),這樣剩下來的那些極大值點(diǎn)就構(gòu)成了這個(gè)圖像的角點(diǎn)集。(1)Harris算子雖然Moravec算子計(jì)算簡(jiǎn)單直觀,而且速度很快,但是最大的問題是沒有考慮到孤立點(diǎn)處的測(cè)度也有可能成為局部最大值,也就是邊緣上也會(huì)有非角點(diǎn)的極大值,于是Moravec算子對(duì)噪聲比較敏感。針對(duì)這些問題,1988年Harris提出了著名的并且至今也廣泛使用的Harris算子。Harris算子是對(duì)Moravec算子的改進(jìn),主要體現(xiàn)在兩個(gè)方面:一是用像素的變化梯度代替像素值直接相減并且引入高斯窗函數(shù),二是推廣出了一個(gè)公式,這樣可以計(jì)算任意方向上的像素值變化,而不在是8個(gè)固定的方向進(jìn)行計(jì)算。這種描述子受信號(hào)處理中自相關(guān)函數(shù)的啟發(fā),得出與自相關(guān)函數(shù)相聯(lián)系的矩陣M。M陣的特征值是自相關(guān)函數(shù)的一階曲率,如果兩個(gè)曲率值都高,則認(rèn)為該點(diǎn)是角點(diǎn)。Harris算子的表達(dá)式如下:(2-2)其中:(2-3)為方向的梯度,為方向的梯度;為高斯濾波模板,為圖像的卷積操作,為每個(gè)點(diǎn)的興趣值,為矩陣的行列式,為矩陣的跡,為默認(rèn)常數(shù)。2.2.2基于輪廓的特征提取方法形狀特征是商標(biāo)圖像比較明顯的視覺特征,而各種形狀的商標(biāo)具有不同的圖像邊緣輪廓,這成為基于輪廓的商標(biāo)檢索的研究思路。通過研究一些算法商標(biāo)圖像的邊緣處提取相應(yīng)的特征,并作進(jìn)一步的相似性匹配。一般首先提取圖像的邊緣點(diǎn),然后連接邊緣點(diǎn),得到一系列的曲線,最后用這些曲線去表征所提取的形狀。本文介紹的目前比較常見的邊緣特征算子提取方法主要有:canny算子邊緣檢測(cè)、hough變換、傅里葉邊緣描述子、Gabor邊緣描述子和小波變換描述子等。下面主要介紹一下小波變換描述子。小波分析是從1986年興起的一個(gè)嶄新的數(shù)學(xué)分析工具。大量實(shí)驗(yàn)數(shù)據(jù)表明,基于小波變換的多尺度邊緣檢測(cè)算法在對(duì)有噪圖像進(jìn)行檢測(cè)時(shí),比經(jīng)典的邊緣檢測(cè)算法有更好的性能[14]。而且小波變換的尺度越大,得到的圖像輪廓就越清晰。下面簡(jiǎn)單描述一下小波變換的運(yùn)算步驟:設(shè)為二維平滑函數(shù),而且滿足條件:,把它沿和兩個(gè)方向上的導(dǎo)數(shù)作為兩個(gè)基本小波:(2-4)再令:(2-5)(2-6)式中:(2-7)則對(duì)于任意的二維函數(shù),它的小波分量有兩個(gè)分量:1.沿方向:(2-8)2.沿方向:(2-9)式中為二次卷積。2.2.3基于區(qū)域的特征提取方法基于區(qū)域的特征提取方法主要是利用區(qū)域的統(tǒng)計(jì)矩來描述圖像區(qū)域征,通過把一個(gè)歸一化的灰度級(jí)函數(shù)理解為一個(gè)二維隨機(jī)變量的概率密度。主要是對(duì)圖像的不變特征信息的進(jìn)行統(tǒng)計(jì),將這些統(tǒng)計(jì)矩來表征該圖像的特征。目前常用的基于區(qū)域的矩描述子主要包括:Hu不變矩描述子、Zernike矩描述子、偽-Zernike矩描述子、Legendre矩描述子等。本文主要介紹一下Hu不變矩描述子和Zernike矩描述子以及偽Zernike矩描述子。(1)Hu不變矩描述子
矩特征主要表征了圖像區(qū)域的幾何特征,又稱為幾何矩,由于其具有旋轉(zhuǎn)、平移、尺度等特性的不變特征,所以又稱其為不變矩。在圖像處理中,幾何不變矩可以作為一個(gè)重要的特征來表示物體,可以據(jù)此特征來對(duì)圖像進(jìn)行分類等操作。
幾何矩是由Hu(Visualpatternrecognitionbymomentinvariants)在1962年提出的,具有平移、旋轉(zhuǎn)和尺度不變性。在連續(xù)情況下,圖像函數(shù)為,那么圖像的階幾何矩(標(biāo)準(zhǔn)矩)定義為:(2-10)階中心距定義為:(2-11)其中和代表圖像的重心,(2-12)(2-13)對(duì)于離散的數(shù)字圖像,采用求和號(hào)代替積分:(2-14)(2-15)和分別是圖像的高度和寬度;歸一化的中心距定義為:;其中(2-16)利用二階和三階歸一化中心距構(gòu)造了7個(gè)不變矩:(2-17)(2-18)(2-19)(2-20)(2-22)(2-23)(2-24)這7個(gè)不變矩構(gòu)成一組特征量,Hu.M.K在1962年證明了他們具有旋轉(zhuǎn),縮放和平移不變性。(2)Zernike矩描述子Zernike矩描述子是Zernike在1934年引入了一組定義在單位圓上的復(fù)數(shù)函數(shù)集,具有完備性和正交性,使得它可以定義在單位圓內(nèi)的任何平方可積函數(shù)。其定義為:(2-25)表示原點(diǎn)到點(diǎn)的矢量長(zhǎng)度;表示矢量與軸逆時(shí)針方向的夾角。是實(shí)值徑向多項(xiàng)式:(2-26)稱為Zernike多項(xiàng)式。Zernike多項(xiàng)式滿足正交性:(2-27)其中為克羅內(nèi)克符號(hào),由于Zernike多項(xiàng)式的政教完備性,所以在單位圓內(nèi)的任何圖像都可以用下面式子展開:(2-28)式中就是Zernike矩,其定義為:(2-29)注意式子中和采用不同的坐標(biāo)系,在計(jì)算的時(shí)候要注意坐標(biāo)轉(zhuǎn)換。(3)偽Zernike矩描述子偽Zernike其實(shí)和Zernike矩很相似,它也是一種正交矩,只不過兩者之間的正交多項(xiàng)式不一樣。兩者相比,偽Zernike矩在抑制噪聲方面比Zernike矩效果更好。階重的復(fù)數(shù)偽Zernike矩被定義為:(2-30)式中,,是圖像函數(shù),而則表示復(fù)數(shù)共軛,是整數(shù),是偶數(shù)并滿足:。它的極坐標(biāo)表示形式為:(2-31)式中,;。偽Zernike多項(xiàng)式在極坐標(biāo)中表示為:(2-32)式中,,定義在單位圓上,是實(shí)值向偽Zernike多項(xiàng)式,定義為:(2-33)如果數(shù)字圖像是離散的,那么幾分可以用求和來替代:,(2-34)(4)Legendre矩Tegue運(yùn)用Legendre多項(xiàng)式作為核函數(shù)[21],提出了正交的Legendre矩,這種算法克服了幾何矩[22],重建困難以及對(duì)噪聲敏感的缺點(diǎn),所以它的應(yīng)用在模式識(shí)別比較廣泛。在商標(biāo)檢索中,我們也可以應(yīng)用Legendre算法。對(duì)于一個(gè)密度函數(shù)為的二維圖像,它的階Legendre正交矩定義為:(2-35)式中為p階的Legendre多項(xiàng)式,其定義為:,(2-36)(5)Fuzzy算法FuzzyC-Means聚合算法在圖像分割(segmentation)和圖像視覺處理中常常被用到聚合算法之一。FuzzyC-means算法主要是比較RGB空間的每個(gè)像素值與Cluster中的每個(gè)中心點(diǎn)值,最終給每個(gè)像素指派一個(gè)值(0-1之間)說明該像素更接近于哪里Cluster的中心點(diǎn),模糊規(guī)則是該像素對(duì)所有cluster的值之和為1。簡(jiǎn)單的舉例:假設(shè)圖像中有三個(gè)聚類cluster1,cluster2,cluster3,像素A對(duì)三個(gè)聚類的值分別為,,,根據(jù)模糊規(guī)則。更進(jìn)一步,,如果最大,則該像素比較接近于Cluster1。計(jì)算總的對(duì)象值:(2-37)當(dāng)?shù)膬纱尾钪敌∮谥付ǖ木葧r(shí),停止計(jì)算,輸出分割后的圖像結(jié)果。其中是指第個(gè)像素點(diǎn)與第個(gè)聚類之間的歐式距離。指第個(gè)像素與第個(gè)聚類模糊值,是個(gè)輸入?yún)?shù),這里的默認(rèn)值為2。計(jì)算的公式如下:(2-38)計(jì)算的公式如下:(2-39)2.3現(xiàn)有的特征提取方法性能分析隨著國(guó)內(nèi)外基于內(nèi)容的商標(biāo)圖像檢索技術(shù)的不斷發(fā)展,越來越多的研究者對(duì)圖像的形狀視覺特征進(jìn)行了研究。現(xiàn)有的特征提取方法都不盡完美。小波變換描述子是在傅里葉描述子基礎(chǔ)上的改進(jìn),它的特點(diǎn)是具有多分辨率,在時(shí)、頻兩域都具有表征信號(hào)局部特征的能力,使得小波變換具有對(duì)信號(hào)的自適應(yīng)性,這是傳統(tǒng)傅里葉描述子所不具備的[6]。它最大的缺點(diǎn)是計(jì)算復(fù)雜,對(duì)圖像的輪廓要求較高,而且算法也不太穩(wěn)定?;趨^(qū)域的一些算法主要是利用圖像區(qū)域的不變矩來描述圖像的區(qū)域特征,相比基于輪廓的算法,具有算法簡(jiǎn)單易行,穩(wěn)定并實(shí)用的優(yōu)點(diǎn)。Hu不變矩的低階矩能很好的刻畫圖像的整體特征,但不具有太多的圖像細(xì)節(jié)信息,而高階矩又容易受到噪聲影響,不穩(wěn)定,因此很難簡(jiǎn)單的利用Hu不變矩進(jìn)行大量商標(biāo)的檢索。Zernike矩通過正交理論,可以很容易的構(gòu)造出任意的高階矩,還可以用比較少的矩信息去恢復(fù)圖像,是眾多矩特征描述子中,效果比較好的。除常見的這些方法外,黃等人最近又提出了利用特征點(diǎn)平均矩特征的商標(biāo)圖像檢索方法[30],雖然基于區(qū)域的算法比較穩(wěn)定也容易計(jì)算,但大都比較粗糙,不能真正的反映物體的形狀,最重要的是商標(biāo)圖像一般很少出現(xiàn)整體相似的情況,大部分情況是出現(xiàn)在圖像的局部相似,而基于區(qū)域的方法卻很難撲捉到圖像的局部詳細(xì)信息,而針對(duì)這些情況,基于點(diǎn)特征的算法具有不錯(cuò)的效果。Moravec算法通過計(jì)算圖像中那些灰度變化的極值點(diǎn),并且人為地設(shè)定一個(gè)經(jīng)驗(yàn)閾值來過濾這些極值點(diǎn),雖然能很好的找出圖像中一些能代表某塊區(qū)域的角點(diǎn),但算法太多粗糙,對(duì)噪聲點(diǎn)和邊緣點(diǎn)敏感。針對(duì)這個(gè)問題,Harris算法改進(jìn)了Moravec算法,使其對(duì)噪聲點(diǎn)和邊緣點(diǎn)有著很好的效果,但同時(shí)保留了一個(gè)最大的問題就是Harris算法不是尺度不變的,當(dāng)尺度發(fā)生變化時(shí),原來的特征點(diǎn)就不見了[29],為了解決這種尺度變換問題,G.Lowe教授提出了尺度不變特征變換算法SIFT(ScaleInvariantFeatureTransform),并成為目前應(yīng)用最廣泛的特征描述子。2.4SIFT特征提取算法及其過程2.4.1SIFT特征提取算法概述尺度不變特征轉(zhuǎn)換(Scale-invariantfeaturetransform或SIFT)是一種電腦視覺的算法用來偵測(cè)與描述影像中的局部性特征,它在空間尺度中尋找極值點(diǎn),并提取出其位置、尺度、旋轉(zhuǎn)不變量,此算法由
DavidLowe在1999年所發(fā)表,2004年完善總結(jié)。其應(yīng)用范圍包含物體辨識(shí)、機(jī)器人地圖感知與導(dǎo)航、影像縫合、模型建立、手勢(shì)辨識(shí)、影像追蹤和動(dòng)作比對(duì)。此算法有其專利,專利擁有者為英屬哥倫比亞大學(xué)。局部影像特征的描述與偵測(cè)可以幫助辨識(shí)物體,SIFT
特征是基于物體上的一些局部外觀的興趣點(diǎn)而與影像的大小和旋轉(zhuǎn)無關(guān)。對(duì)于光線、噪聲、些微視角改變的容忍度也相當(dāng)高。基于這些特性,它們是高度顯著而且相對(duì)容易擷取,在母數(shù)龐大的特征數(shù)據(jù)庫中,很容易辨識(shí)物體而且鮮有誤認(rèn)。使用SIFT特征描述對(duì)于部分物體遮蔽的偵測(cè)率也相當(dāng)高,甚至只需要3個(gè)以上的SIFT物體特征就足以計(jì)算出位置與方位。在現(xiàn)今的電腦硬件速度下和小型的特征數(shù)據(jù)庫條件下,辨識(shí)速度可接近即時(shí)運(yùn)算。SIFT特征的信息量大,適合在海量數(shù)據(jù)庫中快速準(zhǔn)確匹配。Lowe將SIFT算法分解為如下四步:圖2-2SIFT算法流程1.尺度空間極值檢測(cè):搜索所有尺度上的圖像位置。通過高斯微分函數(shù)來識(shí)別潛在的對(duì)于尺度和旋轉(zhuǎn)不變的興趣點(diǎn)。2.關(guān)鍵點(diǎn)定位:在每個(gè)候選的位置上,通過一個(gè)擬合精細(xì)的模型來確定位置和尺度。關(guān)鍵點(diǎn)的選擇依據(jù)于它們的穩(wěn)定程度。3.方向確定:基于圖像局部的梯度方向,分配給每個(gè)關(guān)鍵點(diǎn)位置一個(gè)或多個(gè)方向。所有后面的對(duì)圖像數(shù)據(jù)的操作都相對(duì)于關(guān)鍵點(diǎn)的方向、尺度和位置進(jìn)行變換,從而提供對(duì)于這些變換的不變性。4.關(guān)鍵點(diǎn)描述:在每個(gè)關(guān)鍵點(diǎn)周圍的鄰域內(nèi),在選定的尺度上測(cè)量圖像局部的梯度。這些梯度被變換成一種表示,這種表示允許比較大的局部形狀的變形和光照變化。本文沿著Lowe的步驟,詳解SIFT算法的實(shí)現(xiàn)過程。2.4.2高斯模糊SIFT算法是在不同的尺度空間上查找關(guān)鍵點(diǎn),而尺度空間的獲取需要使用高斯模糊來實(shí)現(xiàn),Lindeberg等人已證明高斯卷積核是實(shí)現(xiàn)尺度變換的唯一變換核,并且是唯一的線性核。本節(jié)先介紹高斯模糊算法。(1)二維高斯函數(shù)高斯模糊是一種圖像濾波器,它使用正態(tài)分布(高斯函數(shù))計(jì)算模糊模板,并使用該模板與原圖像做卷積運(yùn)算,達(dá)到模糊圖像的目的。N維空間正態(tài)分布方程為:(2-40)其中,是正態(tài)分布的標(biāo)準(zhǔn)差,值越大,圖像越模糊(平滑)。r為模糊半徑,模糊半徑是指模板元素到模板中心的距離。如二維模板大小為m*n,則模板上的元素(x,y)對(duì)應(yīng)的高斯計(jì)算公式為:(2-41)(2)圖像的二維高斯模糊根據(jù)的值,計(jì)算出高斯模板矩陣的大小(),使用公式(2-41)計(jì)算高斯模板矩陣的值,與原圖像做卷積,即可獲得原圖像的平滑(高斯模糊)圖像。為了確保模板矩陣中的元素在[0,1]之間,需將模板矩陣歸一化。5*5的高斯模板如表2.1所示。表2.15*5的高斯模板6.5857-0060.0004247810.001703540.0004247816.5857-0060.0004247810.02739840.1098780.02739840.0004247810.001703540.1098780.4406550.1098780.001703540.0004247810.02739840.1098780.02739840.0004247816.5857-0060.0004247810.001703540.0004247816.5857-006下圖是5*5的高斯模板卷積計(jì)算示意圖。高斯模板是中心對(duì)稱的。圖2-3高斯模板卷積計(jì)算示意圖(a)原圖(b)=0.6(c)=10.0圖2-4二維高斯模糊效果圖2.4.3尺度空間極值點(diǎn)檢測(cè)尺度空間理論的基本思想是:在圖像信息處理模型中引入一個(gè)被視為尺度的參數(shù),通過連續(xù)變化尺度參數(shù)獲得多尺度下的尺度空間表示序列,對(duì)這些序列進(jìn)行尺度空間主輪廓的提取,并以該主輪廓作為一種特征向量,實(shí)現(xiàn)邊緣、角點(diǎn)檢測(cè)和不同分辨率上的特征提取等。尺度空間方法將傳統(tǒng)的單尺度圖像信息處理技術(shù)納入尺度不斷變化的動(dòng)態(tài)分析框架中,更容易獲取圖像的本質(zhì)特征。尺度空間中各尺度圖像的模糊程度逐漸變大,能夠模擬人在距離目標(biāo)由近到遠(yuǎn)時(shí)目標(biāo)在視網(wǎng)膜上的形成過程。在SIFT算法的第一步中,主要是在多分辨率技術(shù)的基礎(chǔ)上SIFT算法采用高斯差分函數(shù)卷積核來做濾波,最后計(jì)算出尺度空間下的圖像極值。(1)尺度空間的表示方法一個(gè)圖像的尺度空間,定義為一個(gè)變化尺度的高斯函數(shù)與原函數(shù)的卷積。(2-42)其中,表示卷積運(yùn)算,(2-43)m,n表示高斯模板的維度,表示圖像的像素位置。是尺度空間因子,值越小表示圖像被平滑的越少,相應(yīng)的尺度也就越小。大尺度對(duì)應(yīng)于圖像的概貌特征,小尺度對(duì)應(yīng)于圖像的細(xì)節(jié)特征。(2)高斯金字塔的構(gòu)建尺度空間在是實(shí)現(xiàn)時(shí)使用高斯金字塔表示,高斯金字塔的構(gòu)建分為兩個(gè)部分:1.對(duì)圖像做不同尺度的高斯模糊2.對(duì)圖像做降采集(隔點(diǎn)采樣)。圖2-5高斯金字塔(來源:/zddblog/article/details/7521424)圖像的金字塔模型是指,將原始圖像不斷降階采樣,得到一系列大小不一的圖像,由大到小構(gòu)成的塔狀模型。原圖像為金字塔的第一層,每次降采樣所得到的新圖像為金字塔的一層(每層一張圖像),每個(gè)金字塔共n層。金字塔的層數(shù)根據(jù)圖像的原始大小和塔頂圖像的大小共同決定,其計(jì)算公式如下:(2-44)其中M,N為原圖像的大小,t為塔頂圖像的最小維數(shù)的對(duì)數(shù)值。比如說對(duì)于大小為512*512的圖像,金字塔上各層圖像的大小如表所示,當(dāng)塔頂圖像為4*4時(shí),n=7,當(dāng)塔頂圖像為2*2時(shí),n=8。表2.2515*512金字塔頂層圖像大小與層數(shù)的關(guān)系圖像大小51221612864168421金字塔層數(shù)123456789為了讓尺度體現(xiàn)其連續(xù)性,高斯金字塔在簡(jiǎn)單降采樣的基礎(chǔ)上加上了高斯濾波。如圖3.1所示,將圖像金字塔每層的一張圖像使用不同參數(shù)做高斯模糊,使得金字塔的每層含有多張高斯模糊圖像,將金字塔每層多張圖像合稱為一組(Octave),金字塔每層只有一組圖像,組數(shù)和金字塔層數(shù)相等,使用公式(3-3)計(jì)算,每組含有多張(也叫層Interval)圖像。另外,降采樣時(shí),高斯金字塔上一組圖像的初始圖像(底層圖像)是由前一組圖像的倒數(shù)第三張圖像隔點(diǎn)采樣得到的。(3)高斯差分金字塔Lindeberg早在1994年就發(fā)現(xiàn)高斯差分函數(shù)(DifferenceofGaussian
,簡(jiǎn)稱DOG算子)與尺度歸一化的高斯拉普拉斯函數(shù)非常相似。其中和的關(guān)系可以從如下公式推導(dǎo)到:(2-45)利用差分近似代替積分,則有:(2-46)因此有:(2-47)其中k-1是常數(shù),不影響極值點(diǎn)位置的求取。在實(shí)際計(jì)算時(shí),使用高斯金字塔每組中相鄰上下兩層圖像相減,得到高斯差分圖像,如圖3.3所示,進(jìn)行極值檢測(cè)。圖2-6高斯差分金字塔的生成(來源:/zddblog/article/details/7521424)(4)空間極值點(diǎn)檢測(cè)(關(guān)鍵點(diǎn)的初步探查)關(guān)鍵點(diǎn)是由DOG空間的局部極值點(diǎn)組成的,關(guān)鍵點(diǎn)的初步探查是通過同一組內(nèi)各DoG相鄰兩層圖像之間比較完成的。為了尋找DoG函數(shù)的極值點(diǎn),每一個(gè)像素點(diǎn)要和它所有的相鄰點(diǎn)比較,看其是否比它的圖像域和尺度域的相鄰點(diǎn)大或者小。如圖3.4所示,中間的檢測(cè)點(diǎn)和它同尺度的8個(gè)相鄰點(diǎn)和上下相鄰尺度對(duì)應(yīng)的9×2個(gè)點(diǎn)共26個(gè)點(diǎn)比較,以確保在尺度空間和二維圖像空間都檢測(cè)到極值點(diǎn)。
圖2-7DOG空間極值檢測(cè)(來源:/zddblog/article/details/7521424)由于要在相鄰尺度進(jìn)行比較,如圖3.3右側(cè)每組含4層的高斯差分金子塔,只能在中間兩層中進(jìn)行兩個(gè)尺度的極值點(diǎn)檢測(cè),其它尺度則只能在不同組中進(jìn)行。為了在每組中檢測(cè)S個(gè)尺度的極值點(diǎn),則DOG金字塔每組需S+2層圖像,而DOG金字塔由高斯金字塔相鄰兩層相減得到,則高斯金字塔每組需S+3層圖像,實(shí)際計(jì)算時(shí)S在3到5之間。這樣產(chǎn)生的極值點(diǎn)并不全都是穩(wěn)定的特征點(diǎn),因?yàn)槟承O值點(diǎn)響應(yīng)較弱,而且DOG算子會(huì)產(chǎn)生較強(qiáng)的邊緣響應(yīng)。2.4.4關(guān)鍵點(diǎn)的定位以上方法檢測(cè)到的極值點(diǎn)是離散空間的極值點(diǎn),以下通過擬合三維二次函數(shù)來精確確定關(guān)鍵點(diǎn)的位置和尺度,同時(shí)去除低對(duì)比度的關(guān)鍵點(diǎn)和不穩(wěn)定的邊緣響應(yīng)點(diǎn)(因?yàn)镈OG算子會(huì)產(chǎn)生較強(qiáng)的邊緣響應(yīng)),以增強(qiáng)匹配穩(wěn)定性、提高抗噪聲能力。(1)關(guān)鍵點(diǎn)的精確定位離散空間的極值點(diǎn)并不是真正的極值點(diǎn),圖4.1顯示了二維函數(shù)離散空間得到的極值點(diǎn)與連續(xù)空間極值點(diǎn)的差別。利用已知的離散空間點(diǎn)插值得到的連續(xù)空間極值點(diǎn)的方法叫做子像素插值(Sub-pixel
Interpolation)。圖2-8離散空間與連續(xù)空間極值點(diǎn)的區(qū)別為了提高關(guān)鍵點(diǎn)的穩(wěn)定性,需要對(duì)尺度空間DoG函數(shù)進(jìn)行曲線擬合。利用DOG函數(shù)在尺度空間的Taylor展開式(擬合函數(shù))為:(2-48)其中,。求導(dǎo)并讓方程等于零,可以得到極值點(diǎn)的偏移量為:(2-49)對(duì)應(yīng)極值點(diǎn),方程的值為:(2-50)其中,代表相對(duì)插值中心的偏移量,當(dāng)它在任一維度上的偏移量大于0.5時(shí)(即x或y或),意味著插值中心已經(jīng)便宜到它的鄰近點(diǎn)上,所以必須改變當(dāng)前關(guān)鍵點(diǎn)的位置。同時(shí)在新的位置上反復(fù)插值直到收斂;也有可能超出所設(shè)定的迭代次數(shù)或者超出圖像邊界的范圍,此時(shí)這樣的點(diǎn)應(yīng)該刪除,在Lowe中進(jìn)行了5次迭代。另外,過小的點(diǎn)易受噪聲的干擾而變得不穩(wěn)定,所以將小于某個(gè)經(jīng)驗(yàn)值(Lowe論文中使用0.03,RobHess等人實(shí)現(xiàn)時(shí)使用0.04/S)的極值點(diǎn)刪除。同時(shí),在此過程中獲取特征點(diǎn)的精確位置(原位置加上擬合的偏移量)以及尺度(和)。(2)關(guān)鍵點(diǎn)的精確定位一個(gè)定義不好的高斯差分算子的極值在橫跨邊緣的地方有較大的主曲率,而在垂直邊緣的方向有較小的主曲率。DOG算子會(huì)產(chǎn)生較強(qiáng)的邊緣響應(yīng),需要剔除不穩(wěn)定的邊緣響應(yīng)點(diǎn)。獲取特征點(diǎn)處的Hessian矩陣,主曲率通過一個(gè)2
的Hessian矩陣H求出:(2-51)的特征值和代表和方向的梯度,(2-52)(2-53)表示矩陣對(duì)角線元素之和,表示矩陣的行列式。假設(shè)是較大的特征值,而是較小的特征值,令,則(2-54)D的主曲率和的特征值成正比,令為最大特征值,β為最小的特征值,則公式的值在兩個(gè)特征值相等時(shí)最小,隨著的增大而增大。值越大,說明兩個(gè)特征值的比值越大,即在某一個(gè)方向的梯度值越大,而在另一個(gè)方向的梯度值越小,而邊緣恰恰就是這種情況。所以為了剔除邊緣響應(yīng)點(diǎn),需要讓該比值小于一定的閾值,因此,為了檢測(cè)主曲率是否在某域值r下,只需檢測(cè)(2-55)式(2-55)成立時(shí)將關(guān)鍵點(diǎn)保留,不成立則剔除。這樣,我們就得到了能夠表征整個(gè)圖像的特征點(diǎn),而且這些特征點(diǎn)在多尺上既有不變性,而且將很多不穩(wěn)定的特征點(diǎn)剔除了。圖2-9圖像的特征點(diǎn)的采集2.4.5關(guān)鍵點(diǎn)的方向分配為了使描述符具有旋轉(zhuǎn)不變性,需要利用圖像的局部特征為給每一個(gè)關(guān)鍵點(diǎn)分配一個(gè)基準(zhǔn)方向。使用圖像梯度的方法求取局部結(jié)構(gòu)的穩(wěn)定方向。對(duì)于在DOG金字塔中檢測(cè)出的關(guān)鍵點(diǎn)點(diǎn),采集其所在高斯金字塔圖像3鄰域窗口內(nèi)像素的梯度和方向分布特征。梯度的模值和方向如下:(2-56)(2-57)L為關(guān)鍵點(diǎn)所在的尺度空間值,按Lowe的建議,梯度的模值按的高斯分布加成,按尺度采樣的原則,鄰域窗口半徑為。在完成關(guān)鍵點(diǎn)的梯度計(jì)算后,使用直方圖統(tǒng)計(jì)鄰域內(nèi)像素的梯度和方向。梯度直方圖將0~360度的方向范圍分為36個(gè)柱(bins),其中每柱10度。如圖5.1所示,直方圖的峰值方向代表了關(guān)鍵點(diǎn)的主方向,(為簡(jiǎn)化,圖中只畫了八個(gè)方向的直方圖)。圖2-10關(guān)鍵點(diǎn)的方向分配方向直方圖的峰值則代表了該特征點(diǎn)處鄰域梯度的方向,以直方圖中最大值作為該關(guān)鍵點(diǎn)的主方向。為了增強(qiáng)匹配的魯棒性,只保留峰值大于主方向峰值80%的方向作為該關(guān)鍵點(diǎn)的輔方向。因此,對(duì)于同一梯度值的多個(gè)峰值的關(guān)鍵點(diǎn)位置,在相同位置和尺度將會(huì)有多個(gè)關(guān)鍵點(diǎn)被創(chuàng)建但方向不同。僅有15%的關(guān)鍵點(diǎn)被賦予多個(gè)方向,但可以明顯的提高關(guān)鍵點(diǎn)匹配的穩(wěn)定性。實(shí)際編程實(shí)現(xiàn)中,就是把該關(guān)鍵點(diǎn)復(fù)制成多份關(guān)鍵點(diǎn),并將方向值分別賦給這些復(fù)制后的關(guān)鍵點(diǎn),并且,離散的梯度方向直方圖要進(jìn)行插值擬合處理,來求得更精確的方向角度值。圖2-11關(guān)鍵點(diǎn)的方向分配實(shí)驗(yàn)2.4.5關(guān)鍵點(diǎn)特征描述通過以上步驟,對(duì)于每一個(gè)關(guān)鍵點(diǎn),擁有三個(gè)信息:位置、尺度以及方向。接下來就是為每個(gè)關(guān)鍵點(diǎn)建立一個(gè)描述符,用一組向量將這個(gè)關(guān)鍵點(diǎn)描述出來,使其不隨各種變化而改變,比如光照變化、視角變化等等。這個(gè)描述子不但包括關(guān)鍵點(diǎn),也包含關(guān)鍵點(diǎn)周圍對(duì)其有貢獻(xiàn)的像素點(diǎn),并且描述符應(yīng)該有較高的獨(dú)特性,以便于提高特征點(diǎn)正確匹配的概率。
SIFT描述子是關(guān)鍵點(diǎn)鄰域高斯圖像梯度統(tǒng)計(jì)結(jié)果的一種表示。通過對(duì)關(guān)鍵點(diǎn)周圍圖像區(qū)域分塊,計(jì)算塊內(nèi)梯度直方圖,生成具有獨(dú)特性的向量,這個(gè)向量是該區(qū)域圖像信息的一種抽象,具有唯一性。Lowe建議描述子使用在關(guān)鍵點(diǎn)尺度空間內(nèi)4*4的窗口中計(jì)算的8個(gè)方向的梯度信息,共4*4*8=128維向量表征。表示步驟如下:圖2-12SIFT特征描述向量的生成完成上面一系列步驟后,SIFT特征描述向量生成。2.5本章小結(jié)本章主要闡述了商標(biāo)圖像特征提取的方法,包括基于紋理、基于輪廓和基于形狀的特征提取方法;主要說明了基于形狀的特征提取方法:包括Zernike矩、偽Zernike矩、Hu不變矩、模糊方向以及Legendre矩。然后著重分析了SIFT算法的實(shí)現(xiàn)步驟,并進(jìn)行了相應(yīng)實(shí)現(xiàn)。
3基于內(nèi)容的商標(biāo)檢索中的性能檢測(cè)3.1引言商標(biāo)檢索式CBIR系統(tǒng)的一個(gè)分支,而作為CBIR的一個(gè)非常重要的研究?jī)?nèi)容,性能檢測(cè)準(zhǔn)則對(duì)于CBIR系統(tǒng)的發(fā)展有著非常重要的作用。CBIR系統(tǒng)性能主要考慮兩個(gè)方面的因素:準(zhǔn)確度和檢索速度。檢索的準(zhǔn)確度主要取決于選取的圖像特征的區(qū)分能力和相似度量算法的有效性,檢索的速度主要取決于選取的圖像特征相似性度量的復(fù)雜度。一般來說,準(zhǔn)確度是人們比較關(guān)注的指標(biāo),所以我們一般指CBIR系統(tǒng)的性能是指它的檢索準(zhǔn)確度。如何評(píng)價(jià)一個(gè)系統(tǒng)檢索的性能,暫時(shí)還沒有一個(gè)統(tǒng)一的評(píng)價(jià)準(zhǔn)則。有的檢索系統(tǒng)使用找到正確圖像的“耗費(fèi)時(shí)間”來評(píng)價(jià)系統(tǒng)性能[36];也有的用前N幅圖像中檢索出測(cè)試圖像的百分比的方法[37]。這些性能雖然能在一定程度上評(píng)價(jià)系統(tǒng)的性能,但并不能滿足我們的需求。另外,由于圖像檢索具有很強(qiáng)的主觀性,所以評(píng)價(jià)一個(gè)圖像檢索算法性能的好壞并不是一件容易的事情。為了評(píng)價(jià)圖像檢索算法的有效性,我們需要一個(gè)評(píng)價(jià)方法。對(duì)此,人們提出了一些評(píng)價(jià)尺度,大致可以分為三類:第一類是用戶評(píng)價(jià),這種尺度是讓用戶評(píng)價(jià)和比較性能;第二類是用一些特征指標(biāo)來度量,比如檢索精度和回召率等;第三類使用圖表的方式進(jìn)行評(píng)價(jià)。3.2用戶評(píng)價(jià)定義“檢索結(jié)果與視覺判斷的一致程度”為檢索準(zhǔn)確度。用戶評(píng)價(jià)就是依靠用戶在檢索完成后直接觀察檢索是否成功,或者在系統(tǒng)返回的前后對(duì)比的兩個(gè)或者多個(gè)檢索結(jié)果,讓用戶選擇最優(yōu)的。這種方法不僅具有很強(qiáng)的主觀性,而且耗時(shí)耗人力,因此很難大規(guī)模進(jìn)行。3.3指標(biāo)評(píng)價(jià)——檢索精度和檢索回召率檢索精度和檢索回召率都是信息檢索中標(biāo)準(zhǔn)的性能分析方法,可以比較好地反映系統(tǒng)的性能,是CBIR中得到了比較廣泛的評(píng)價(jià)準(zhǔn)則。表3.1檢索精度與檢索回召率指標(biāo)分類相關(guān)無關(guān)檢索出A(一次檢索過程中檢索到的相關(guān)圖像數(shù)目)B(一次檢索過程中檢索到的不相關(guān)圖像數(shù)目)未檢索出C(圖像庫中和檢索圖像相關(guān)但在檢索中違背檢索到的圖像數(shù)目)D(正確排除掉的無關(guān)圖像)由表3.1,我們可以定義檢索精度和檢索回召率為:(3-1)(3-2)有效圖像指在檢索中與測(cè)試圖像相似的圖像,檢索精度是指返回有效圖像的數(shù)量與總數(shù)的比率;檢索回召率指返回有效圖像數(shù)與有效圖像總數(shù)的比率。從這里可以看出,檢索的全面性由檢索回召率反映,檢索的準(zhǔn)確性由檢索精度反映。如果我們只選擇其中的一個(gè)來衡量系統(tǒng)的有效性,那么包含的信息是不夠全面的。比如說給出的結(jié)果圖像的數(shù)量越多,那么系統(tǒng)的回召率就越高,但是系統(tǒng)的檢索精度會(huì)下降。同樣的,為了提高精度,我們可以通過只給出少量的結(jié)果圖像。所以,我們應(yīng)該同時(shí)使用檢索精度和檢索回召率,在給出檢索精度時(shí)需要指出相應(yīng)的檢索回召率,在使用檢索精度或者回召率時(shí)需要指出檢索返回的結(jié)果圖像的個(gè)數(shù)。3.4圖表表示——檢索精度回召率曲線用檢索精度P作為y軸,檢索回召率R作為x軸,繪制一條檢索精度—檢索回召率曲線,簡(jiǎn)稱PVR曲線[37](如圖3.1(a)所示)。設(shè)PVR曲線為,則與x-y軸圍成的面積為,稱為PVR指數(shù),將之計(jì)作E(如圖3.2(b)所示)。由,可得。越大,圖像檢索性能越好;反之圖像檢索性能越差。若,那么檢索性能是最好的,它的PVR曲線是。(a)(b)(c)圖3-1圖像檢索性能評(píng)價(jià)準(zhǔn)則3.5本章小結(jié)本章主要說明了圖像檢索性能的檢測(cè)方法。圖像檢索性能的檢測(cè)方法主要包括以下幾種:用戶評(píng)價(jià)、指標(biāo)評(píng)價(jià)——檢索精度和檢索回召率、圖表表示——檢索精度回召率曲線。本文使用的主要方法是指標(biāo)評(píng)價(jià)。
4基于內(nèi)容的商標(biāo)檢索的實(shí)驗(yàn)及分析本文實(shí)驗(yàn)的第一部分工具運(yùn)用的是MatlabR2014a,采用的商標(biāo)數(shù)據(jù)庫都是BMP格式的二值圖像,每個(gè)商標(biāo)圖像的尺度大小都是128*128,存儲(chǔ)容量大約為2.b。商標(biāo)圖像庫中共有1500幅圖像,其中有100幅是將前10幅圖像進(jìn)行變形得到的圖像。4.1商標(biāo)圖像變形圖像變形的具體步驟:利用Photoshop濾鏡對(duì)圖像進(jìn)行擠壓30%、擠壓-30%、旋轉(zhuǎn)扭曲70%、旋轉(zhuǎn)扭曲-70%、水波圍繞中心15%、世博從中心向外15%、水波水池波紋15%、球面正常70%、球面化水平有限70%和球面化垂直有限70%等處理。變形模板如圖5.1。(擠壓-30%)(擠壓30%)(旋轉(zhuǎn)扭曲70%)(旋轉(zhuǎn)扭曲-70%)(圍繞中心15%)(中心向外15%)(垂直優(yōu)先)(正常70%)(水平優(yōu)先70%)(水池15%)圖4-1幾何變形示意圖這樣可以分別得到原圖像的10幅變形后的圖像,包含10種、每種10幅圖像,一個(gè)100幅商標(biāo)圖像。抽取的原圖如圖4.2所示。圖4-2抽取的商標(biāo)原圖將原圖變形后得到的10組共100幅商標(biāo)圖像,在這里只列舉其中的三組。如圖5.3所示。圖4-3變形后的商標(biāo)圖像4.2商標(biāo)圖像檢索進(jìn)行檢索時(shí),我們選出一幅商標(biāo)圖像作為測(cè)試圖像,通過讀入不同的特征數(shù)據(jù)庫,選擇不同的特征進(jìn)行檢索。在運(yùn)用Zernike矩、偽Zernike矩和Legendre矩、模糊方法、Hu矩進(jìn)行檢索時(shí),圖像間的相似性用特征向量間的歐式距離進(jìn)行度量。設(shè)圖像是待檢索圖像,分別計(jì)算出的Zernike矩特征向量,的偽Zernike矩特征向量,以及的Legendre矩特征向量。的模糊方向特征向量,的Hu特征向量。匹配算法如下:計(jì)算與Zernike特征庫中各幅圖像的Zernike矩特征向量之間的距離,得到前10個(gè)最小值輸出。計(jì)算與偽Zernike特征庫中各幅圖像的偽Zernike矩特征向量之間的距離,得到前10個(gè)最小值輸出。計(jì)算與Legendre矩特征庫中各幅圖像的Legendre矩特征向量之間的距離,得到前10個(gè)最小值輸出。計(jì)算與模糊方向特征庫中各幅圖像的模糊方向特征向量之間的距離,得到前10個(gè)最小值輸出。計(jì)算與Hu矩特征庫中各幅圖像的Hu矩特征向量之間的距離,得到前10個(gè)最小值輸出。我們隨機(jī)抽取一副圖像作為測(cè)試圖像進(jìn)行檢索,下面是檢索結(jié)果:(a)基于Zernike矩的檢索結(jié)果(b)基于偽Zernike矩的檢索結(jié)果(c)基于Legendre矩的檢索結(jié)果(d)基于模糊方向特征的檢索結(jié)果(e)基于Hu矩的檢索結(jié)果圖4-4四種特征檢索的實(shí)驗(yàn)結(jié)果對(duì)比圖4.5給出了基于四種特征圖像檢索方法的實(shí)驗(yàn)結(jié)果,檢索結(jié)果按歐式距離的順序排列,輸出了包括原圖在內(nèi)的6幅商標(biāo)圖像,(a)、(b)、(c)、(d)大部分圖像看起來還是比較相似的,(e)中由于Hu矩僅由低階矩構(gòu)成,不足以充分的描述形狀特征,所以導(dǎo)致部分形狀不完全相同的圖像也在檢索結(jié)果中。接下來我們用10幅測(cè)試圖像分別進(jìn)行基于Zernike矩、偽Zernike矩、Legendre矩、Hu矩和模糊方向的特征檢索,每幅圖像基于5種,10幅測(cè)試圖像對(duì)應(yīng)50次檢索過程。將相應(yīng)的PVR指數(shù)繪制成表格,如表4.1所示:表4.1利用單個(gè)特征檢索的PVR指數(shù)(單位:%)圖像特征圖像特征Zernike矩偽Zernike矩Legendre矩模糊方向Hu矩36維7維188.3591.4456.8463.1255.09280.3487.2866.8569.5263.64370.6196.9152.0366.7263.3498.0999.0995.185.7568.72588.6589.4679.8278.2581.79689.8897.1489.0982.9577.49785.8281.2672.9868.5967.54891.3984.4750.4566.4662.14988.5180.4871.6669.2564.461084.0492.6499.0973.9869.18平均86.56890.01773.39172.45967.336理論上來說,Hu不變矩存在的主要問題是:由于只由二階和三階矩構(gòu)成,包含的信息不足以充分地描述形狀特征。與之相比,36維的Zernike矩、偽Zernike矩和Legendre矩分別由11階、8階、6階的高階矩構(gòu)成,識(shí)別能力明顯高于Hu矩。從表4.1可以看出,Hu的平均PVR指數(shù)最低,為67.336,偽Zernike矩的平均PVR指數(shù)最高,為90.017%,我們可以看出Hu矩的檢索效果相比于其他四種是比較低的,而在其他四種中,同維度情況下,偽Zernike矩的檢索效果是最好的。在檢索結(jié)果的對(duì)比實(shí)驗(yàn)中,結(jié)果表明:基于Zernike矩,偽Zernike矩、Legendre矩和模糊方向特征檢索的性能高于Hu矩;在相同維數(shù)情況下,基于偽Zernike矩的商標(biāo)檢索性能優(yōu)于其他幾種算法,它的檢索結(jié)果符合人的視覺感受。4.3運(yùn)用SIFT對(duì)檢索結(jié)果的匹配然后我想是不是可以用SIFT對(duì)檢索出的商標(biāo)圖像進(jìn)行特征匹配來觀察商標(biāo)圖像的匹配程度呢?于是我對(duì)檢索出的商標(biāo)圖像運(yùn)用SIFT算法進(jìn)行了一系列運(yùn)算,因?yàn)橐\(yùn)用到Opencv和GSL,所以我選擇了VisualStdio2010作為了以下實(shí)驗(yàn)的工具,首先我配置了工程的實(shí)驗(yàn)環(huán)境(將Opencv和GSL的一些頭文件以及庫文件配置到工程中等),然后進(jìn)行了代碼的編寫。將之前變形后的圖像取出后,我們?cè)龠\(yùn)用前面的各種特征算法進(jìn)行特征編碼入庫,進(jìn)行商標(biāo)檢索。對(duì)于檢索出的圖像,我用SIFT算法中的特征提取方法依次提取他們的特征并建立它們的特征向量、顯示各自的特征個(gè)數(shù),如圖4.6所示。圖4-5檢索出的SIFT特征提取與個(gè)數(shù)顯示當(dāng)兩幅圖像的特征向量通過SIFT算法生成后,運(yùn)用與之前一樣的歐式距離作為兩幅圖片的特征匹配的度量因子,當(dāng)距離小于某個(gè)閥值時(shí)就認(rèn)為兩個(gè)點(diǎn)匹配上,雖然由于采用的商標(biāo)圖像源大多比較簡(jiǎn)單,所以所能提取到的特征向量并不多,但通過實(shí)驗(yàn)我們可以發(fā)現(xiàn),實(shí)驗(yàn)結(jié)果同樣能夠說明一些問題。圖4.7分別是原圖與原圖以及原圖與檢索出的商標(biāo)圖像之間提取的特征的匹配個(gè)數(shù)的實(shí)驗(yàn)結(jié)果示意圖。我按照前面的順序,在不同的特征提取方法(Zernike矩、偽Zernike矩、Legendre矩、模糊方向和Hu矩)中分別將檢索出的商標(biāo)圖像用SIFT算法與原圖進(jìn)行比較,得出匹配的特征點(diǎn)數(shù)并求出它們的特征值。原圖與原圖之間的特征匹配數(shù)(b)檢索出的圖像與原圖的特征匹配數(shù)圖4-6商標(biāo)圖像的SIFT匹配由表中我們可以得出與前面用檢索精度——回召率基本一致的結(jié)果,Hu矩的結(jié)果是最差的,平均特征匹配個(gè)數(shù)為0.8;而偽Zernike矩的匹配效果是相對(duì)較好的,平均匹配個(gè)數(shù)是1.9。
表4.2不同的特征提取方法的SIFT特征匹配數(shù)對(duì)比特征圖像特征圖像Zernike矩偽Zernike矩Legendre矩模糊方向Hu矩原圖1414141414匹配圖112000匹配圖225210匹配圖342132匹配圖422201匹配圖513322匹配圖620110匹配圖701021匹配圖811220匹配圖902111匹配圖1010101平均特征匹配個(gè)數(shù)1.20.8我們可以發(fā)現(xiàn),運(yùn)用SIFT算法對(duì)傳統(tǒng)算法匹配出來的結(jié)果進(jìn)行匹配時(shí),得到的結(jié)果大致與檢索精度——回召率基本一致,這說明SIFT算法在商標(biāo)圖像檢索中的應(yīng)用是具有前景的,但是我們可以發(fā)現(xiàn)運(yùn)用SIFT匹配到的特征數(shù)并不多,這可能是由于商標(biāo)圖像過于簡(jiǎn)單以及算法本身的緣故。4.4本章小結(jié)本章對(duì)基于形狀的特征提取方法進(jìn)行了實(shí)驗(yàn):包括基于Zernike矩、偽Zernike矩、Hu不變矩、模糊方向和Legendre矩。并分析了他們的優(yōu)劣。然后用SIFT算法對(duì)這些算法檢索出的結(jié)果進(jìn)行了匹配,驗(yàn)證了之前得到的結(jié)果,并分析了SIFT算法用于商標(biāo)檢索中的可行性。
5總結(jié)與展望5.1本文總結(jié)隨著我國(guó)經(jīng)濟(jì)的飛速發(fā)展,各行各業(yè)對(duì)商標(biāo)的需求不斷增加。我國(guó)商標(biāo)注冊(cè)申請(qǐng)量、審查量和有效注冊(cè)商標(biāo)量均位居世界第一,成為世界第一商標(biāo)大國(guó)。商標(biāo)是一個(gè)具有法律效力和商業(yè)價(jià)值的特殊圖片,為了避免新注冊(cè)的商標(biāo)與海量的已注冊(cè)商標(biāo)相似,因此,高效、準(zhǔn)確地從商標(biāo)庫中檢索出潛在的近似商標(biāo)成為一個(gè)重要研究方向[1]。隨著商標(biāo)注冊(cè)量的不斷增多,傳統(tǒng)的檢索方法本身的檢索耗時(shí)太長(zhǎng)、人工分類具有很強(qiáng)的主觀性、分類方法固定死板并且難以更新等問題日益明顯。因此,基于內(nèi)容的商標(biāo)檢索技術(shù)就應(yīng)運(yùn)而生,這種新的檢索方法是利用計(jì)算機(jī)視覺技術(shù),并結(jié)合其他如模式識(shí)別、人工智能等輔助知識(shí)對(duì)商標(biāo)圖像本身提取出能代表該圖像特點(diǎn)的特征向量,最后通過不同圖像的特征向量的匹配計(jì)算來判斷圖像間是否相似,為目前商標(biāo)檢索領(lǐng)域的窘境提供了一個(gè)很好的解決思路。特征提取和特征匹配是基于內(nèi)容的商標(biāo)檢索方法的兩個(gè)關(guān)鍵技術(shù),前者影響商標(biāo)檢索的效果,后者則影響效率。本文為了探討常見的幾種算法的效果,分別對(duì)傳統(tǒng)的基于Zernike矩、偽Zernike矩、Hu矩和模糊方向等算法進(jìn)行了分析,并用SIFT算法對(duì)檢索結(jié)果進(jìn)行了匹配。最后我們發(fā)現(xiàn)偽Zernike和模糊方向算法具有比較好的效果,而Hu矩的效果由于Hu矩由低階矩組成,不足以描述圖像的特征,所以效果較差。同時(shí),我們還發(fā)現(xiàn),用SIFT對(duì)上面實(shí)驗(yàn)結(jié)果的驗(yàn)證是與之前得到的結(jié)果一致的,這說明SIFT矩在商標(biāo)圖片匹配的應(yīng)用上有很好的發(fā)展空間。但是我們也可以發(fā)現(xiàn)一些問題,可能是由于選取的商標(biāo)圖像數(shù)據(jù)庫的商標(biāo)比較簡(jiǎn)單,運(yùn)用SIFT提取到的特征總數(shù)并不是很多。這可能會(huì)造成如果實(shí)驗(yàn)次數(shù)較少的話,實(shí)驗(yàn)結(jié)果具有偶然性??偟膩碚f,本文得到的結(jié)果反映了如下幾個(gè)問題:7維的Hu矩因?yàn)橛傻碗A矩不足以描述圖像的特征,相對(duì)于其他的算法效果較差。36維的Zernike矩、偽Zernike矩和Legendre矩分別由11階、8階、6階的高階矩構(gòu)成,識(shí)別能力明顯高于Hu矩。在這些算法中,偽Zernike矩具有最好的效果。SIFT提取的特征點(diǎn)數(shù)偏少。由于商標(biāo)圖像一般比較簡(jiǎn)單,導(dǎo)致運(yùn)用SIFT算法提取的特征點(diǎn)數(shù)較少,甚至有些商標(biāo)一個(gè)特征點(diǎn)都無法提取,這樣會(huì)導(dǎo)致檢索的覆蓋面窄,出現(xiàn)不少的漏檢情況。缺少相關(guān)反饋處理。計(jì)算機(jī)永遠(yuǎn)無法理解人的思維,我們一般都需要相關(guān)反饋,通過相關(guān)知識(shí)讓計(jì)算機(jī)在處理的同時(shí)按照我們的需求有思想的選擇結(jié)果[18],成為目前基于內(nèi)容的商標(biāo)檢索領(lǐng)域研究熱點(diǎn)。一個(gè)完整的基于內(nèi)容的商標(biāo)檢索缺少相關(guān)反饋是不完整的。5.2展望基于內(nèi)容的商標(biāo)檢索技術(shù)目前大都停留在研究階段,雖然出現(xiàn)了不少應(yīng)用實(shí)例系統(tǒng),但是大都無法應(yīng)對(duì)海量商標(biāo)圖像的現(xiàn)狀。要想將基于內(nèi)容的商標(biāo)檢索技術(shù)由研究轉(zhuǎn)向應(yīng)用,綜合高效的特征提取方法和快速的特征匹配算法是必須要解決的問題。另外,目前大部分特征提取方法的目光都處于低層,而基于我們?nèi)祟惖恼Z義的特征提取方法缺乏。通過對(duì)基于內(nèi)容的商標(biāo)檢索技術(shù)研究,并結(jié)合本文的總結(jié),未來的研究會(huì)更多的關(guān)注于如下3個(gè)方向。(1)多特征提取方法融合[17]。雖然目前已經(jīng)有不少基于多特征融合的圖像檢索技術(shù),但是針對(duì)具體的商標(biāo)圖像,并提取出高效能滿足人類語義的多特征融合方法很少,同時(shí)這些多特征提取方法怎樣進(jìn)行融合才能很好的方便后面特征編碼過程,也是一個(gè)很大的研究領(lǐng)域。(2)靈活高效的特征編碼思想。由于對(duì)海量商標(biāo)圖像進(jìn)行檢索,離線創(chuàng)建圖像特征庫是不可避免的,通過對(duì)圖像特征庫中的數(shù)據(jù)進(jìn)行編碼不僅能大大提高特征匹配的速度,而且能方便特征匹配的處理和對(duì)特征的理解。離線創(chuàng)建圖像特征庫的最大問題是不同特征提取方法會(huì)有不同的特征庫,造成信息的冗余。怎樣對(duì)不同特征庫中的數(shù)據(jù)進(jìn)行融合處理和研究也成為目前需要解決的問題。(3)圖像檢索的相關(guān)反饋及優(yōu)化。計(jì)算機(jī)永遠(yuǎn)無法理解人類思想,只有人類通過讓計(jì)算機(jī)有思想才能讓計(jì)算機(jī)理解人類。怎樣設(shè)計(jì)相關(guān)反饋才能有效自適應(yīng)改變特征提取、特征編碼、特征匹配的過程,也成為一個(gè)很大的研究領(lǐng)域。雖然目前基于內(nèi)容的商標(biāo)檢索技術(shù)有不少的需要解決的問題,但是隨著計(jì)算機(jī)視覺領(lǐng)域和其他各種領(lǐng)域的不斷發(fā)展,基于內(nèi)容的商標(biāo)檢索技術(shù)會(huì)成為將來國(guó)內(nèi)外商標(biāo)領(lǐng)域的不可缺少的一部分,將發(fā)揮傳統(tǒng)檢索方法所不具備的誘人優(yōu)勢(shì)。
參考文獻(xiàn)章文.基于內(nèi)容的商標(biāo)檢索技術(shù)[D].南京:南京航空航天大學(xué),2011.洪志令.基于形狀匹配的商標(biāo)圖像檢索技術(shù)研究[D].浙江:廈門大學(xué),2008.馬偉陽.《尼斯協(xié)定》在中國(guó)的實(shí)踐[J].中華商標(biāo),2010.國(guó)際法規(guī)./fagui/07/003.htm(AccessedNov.12,2003)韋虎,張麗艷,劉勝蘭.基于SIFT圖像特征匹配的多視角深度圖配準(zhǔn)算法[J].計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào),2010,22(4):654-661.劉瑞.基于SIFT的商標(biāo)圖像檢索技術(shù)研究[D].西安:西北大學(xué),2010.郭麗.基于內(nèi)容的商標(biāo)圖像檢索研究[D].南京:南京理工大學(xué),2003.李伯宇.圖像紋理分析及分類方法研究[D].上海:復(fù)旦大學(xué),2007.韋娜.基于內(nèi)容的圖像檢索關(guān)鍵技術(shù)的研究[D].西安:西北大學(xué),2006.詹越.基于BP人工神經(jīng)網(wǎng)絡(luò)的知識(shí)管理戰(zhàn)略選擇研究[J].圖書情報(bào)工作,2008,53(6):92-95.趙偉,張秀華,張曉青.基于BP算法的網(wǎng)絡(luò)信息資源有效性評(píng)價(jià)研究[J].現(xiàn)代圖書情報(bào)技術(shù),2006(7):52-55.龔平,劉相濱,周鵬.一種改進(jìn)的Harris角點(diǎn)檢測(cè)算法[J].計(jì)算機(jī)工程與應(yīng)用,2010.46(11):173-175.高光來.基于深度學(xué)習(xí)的圖像檢索研究[D].內(nèi)蒙古大學(xué),2014.芮松艷.商標(biāo)行政案件審理情況綜合分析[J].中國(guó)專利與商標(biāo),2010.周明全,耿國(guó)華,韋娜.《基于內(nèi)容圖像檢索技術(shù)》,北京:清華大學(xué)出版社,2007.周斌,林喜榮,賈惠波.多特征融合的手背血管識(shí)別算法[J].清華大學(xué)學(xué)報(bào)(自然科學(xué)版),2007,47(2):194~197.蔣曉紅.基于查詢向量轉(zhuǎn)移和聚類相結(jié)合的相關(guān)反饋技術(shù)研究[D].山東:中國(guó)石油大學(xué),2008.StrangKD.Examiningeffectivetechnologyprojectleadershiptraitsandbehaviors[D].ComputersinHumanBehavior,2007,23(1):424-462.EkvallG.Orgnizationclimateforcreativityandinnovation[J].EuropenJournalofWork&OrganizationalPsychology,1983,5(1):105-123.WestMA.Sparklingfountainsorstagnantponds:Anintegrativemodelofcreativityandinnovationimplementationinworkgroups[J].AppliedPsychology:AnInternationalReview,2002,51(3):355-424.SuJahwung,HuangaYuting,YehHsinho,eta1.Effectivecontent-basedvideoretrievalusingpattern—indexingandmatchingtechniques[F].ExpertSystemswithApplications,July2010,37(7):5068—5085.BelcherC.DuYingzi.Re#on-basedSIFTapproachtoirisrecognition[D].OpticsandLasersinEngineering,2009,47:139-147.Huang,S.,Wu,X.:Multi-featureTrademarkImageRetrievalBasedonIntegratedDistanceFunction[M].ManufacturingInformationEngineeringofChina38(7),74-78(2009).Z.Jin,I.King,X.Q.Li,Content-basedimageretrievalbyrelevancefeedback,in:ProceedingsoftheFourthInternationalConferenceonVisualInformationSystems,LectureNotesinComputerScience,Vol.1929,Lyon,France[C].November2–4Springer,Berlin,2000.J.Ashley,R.Barber,M.Flickner,J.Hafner,D.Lee,W.Niblack,D.Petkovic,Automaticandsemiautomaticmethodsforimageannotationandretrievalinqbic,in:ProceedingsofStorageandRetrievalforImageandVideoDatabaseIII[D],Vol.2420,February1995,pp.24–35.SanchezMarinFJ.Automaticrecognitionofbiologicalshapeswithandwithoutrepresentationsofshape[J].ArtificialIntelligenceinMedicine,2000,18(2):173-186.AkiKobayashi,ToshiyukiYoshida,YoshinoriSakai.ImageRetrievalbyEstimatingParametersofDistanceMeasureSPI
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 養(yǎng)殖合作協(xié)議合同范本
- 加工及測(cè)試合同范本
- 2025年錫林郭勒盟c1貨運(yùn)從業(yè)資格證模擬考試題
- 東莞物業(yè)服務(wù)合同范本
- 六座車買賣合同范本
- 買賣貨款利息合同范本
- 勞動(dòng)關(guān)系托管合同范本
- 勞務(wù)服務(wù)費(fèi)合同范本
- 萬瑞地產(chǎn)合同范本
- 辦公商品采購合同范本
- 蚌埠介紹-蚌埠簡(jiǎn)介課件(經(jīng)典版)
- GB/T 15561-2024數(shù)字指示軌道衡
- 探究煙花爆竹知識(shí)產(chǎn)權(quán)-洞察分析
- 網(wǎng)絡(luò)保險(xiǎn)風(fēng)險(xiǎn)評(píng)估-洞察分析
- 呼吸機(jī)濕化的護(hù)理
- 2025-2030年中國(guó)旅居康養(yǎng)行業(yè)全國(guó)市場(chǎng)開拓戰(zhàn)略制定與實(shí)施研究報(bào)告
- 2024“五史”全文課件
- 食品檢驗(yàn)員聘用合同樣本
- 六年級(jí)信息技術(shù)下冊(cè)教學(xué)計(jì)劃
- 2025年九年級(jí)數(shù)學(xué)中考復(fù)習(xí)計(jì)劃
- 2024屆江西省南昌市高三一模英語試卷(解析版)
評(píng)論
0/150
提交評(píng)論