本科畢業(yè)設(shè)計論文-基于綜合概率函數(shù)和相關(guān)反饋的圖像檢索-開題報告

上傳人：俠*** IP屬地：江西上傳時間：2023-05-10 格式：DOC 頁數(shù)：13 大?。?34KB 積分：12 舉報 版權(quán)申訴

本科畢業(yè)設(shè)計論文-基于綜合概率函數(shù)和相關(guān)反饋的圖像檢索-開題報告_第2頁

本科畢業(yè)設(shè)計論文-基于綜合概率函數(shù)和相關(guān)反饋的圖像檢索-開題報告_第3頁

本科畢業(yè)設(shè)計論文-基于綜合概率函數(shù)和相關(guān)反饋的圖像檢索-開題報告_第4頁

本科畢業(yè)設(shè)計論文-基于綜合概率函數(shù)和相關(guān)反饋的圖像檢索-開題報告_第5頁

已閱讀5頁，還剩8頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

基于內(nèi)容的商標(biāo)檢索技術(shù)摘要：隨著我國經(jīng)濟(jì)的迅速發(fā)展，商標(biāo)圖像不斷增加，傳統(tǒng)的基于分類碼和文本的商標(biāo)檢索技術(shù)由于效率不高以及對特征標(biāo)注的繁瑣等缺點已經(jīng)逐漸落后于人們對于商標(biāo)檢索的性能需求，基于內(nèi)容的圖形檢索技術(shù)日益成為人們研究的熱點。本文將結(jié)合前人研究的內(nèi)容，首先對基于內(nèi)容的商標(biāo)檢索技術(shù)進(jìn)行介紹和分析，然后將人工神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí)算法進(jìn)行結(jié)合，運(yùn)用AUTO-ENCODER算法通過深度信念網(wǎng)絡(luò)訓(xùn)練圖形特征，然后運(yùn)用訓(xùn)練出來的特征通過BP神經(jīng)網(wǎng)絡(luò)對圖形進(jìn)行檢索，得出結(jié)果，并對結(jié)果進(jìn)行誤差分析。最后對改進(jìn)深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)模型提出自己的建議。關(guān)鍵詞：商標(biāo)檢索；基于內(nèi)容；神經(jīng)網(wǎng)絡(luò)；深度學(xué)習(xí)1研究背景商標(biāo)是商品的生產(chǎn)者、經(jīng)營者在其生產(chǎn)、制造、加工、揀選或者經(jīng)銷的商品上或者服務(wù)的提供者在其提供的服務(wù)上采用的，用于區(qū)別商品或服務(wù)來源的，由文字、圖形、字母、數(shù)字、三維標(biāo)志、聲音、顏色組合，或上述要素的組合，具有顯著特征的標(biāo)志，是現(xiàn)代經(jīng)濟(jì)的產(chǎn)物。在商業(yè)領(lǐng)域而言，商標(biāo)包括文字、圖形、字母、數(shù)字、三維標(biāo)志和顏色組合，以及上述要素的組合，均可作為商標(biāo)申請注冊。經(jīng)國家核準(zhǔn)注冊的商標(biāo)為“注冊商標(biāo)”，受法律保護(hù)。商標(biāo)通過確保商標(biāo)注冊人享有用以標(biāo)明商品或服務(wù)，或者許可他人使用以獲取報酬的專用權(quán)，而使商標(biāo)注冊人受到保護(hù)。我國商標(biāo)注冊申請量、審查量和有效注冊商標(biāo)量均位居世界第一，成為世界第一商標(biāo)大國。因此，高效、準(zhǔn)確地從商標(biāo)庫中檢索出潛在的近似商標(biāo)成為一個重要研究方向[1]。商標(biāo)作為一種特殊的并且具有商業(yè)價值和法律效力的圖片，為了凸顯它的價值，應(yīng)該具有外形唯一性。因此應(yīng)當(dāng)避免申請注冊商標(biāo)和已注冊商標(biāo)相似。為了避免與已經(jīng)注冊的商標(biāo)相似，需要在商標(biāo)注冊之前對已注冊的商標(biāo)進(jìn)行檢索[1]。傳統(tǒng)的商標(biāo)檢索的那種先通過人工對商標(biāo)進(jìn)行分類，再根據(jù)人工分配的分類碼來檢索商標(biāo)圖像的方法，既耗時又主觀主義[2]，一般只能適用于幾乎全用文本的商標(biāo)，對于那種沒有多少文本而是用圖片為內(nèi)容的商標(biāo)，這種檢索準(zhǔn)確率很低。所以在商標(biāo)檢索過程中，如何探測現(xiàn)代用戶需求，提供最能滿足用戶意圖的個性化檢索結(jié)果成為當(dāng)前圖像檢索技術(shù)中急需解決的課題。目前對人工智能與人工神經(jīng)網(wǎng)絡(luò)(ArtificialNeuralNetwork，簡稱ANN)的研究已較為廣泛，但將人工智能中的神經(jīng)網(wǎng)絡(luò)算法應(yīng)用于個性化圖像搜索的相關(guān)研究還十分有限，在國內(nèi)外關(guān)于個性化檢索的研究中，應(yīng)用深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)算法進(jìn)行檢索結(jié)果個性化處理的研究較少，分析原因主要是由于深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)對計算的硬件要求極高，運(yùn)算速度較慢，實現(xiàn)困難。近年來，隨著云計算技術(shù)的發(fā)展和神經(jīng)網(wǎng)絡(luò)專業(yè)硬件設(shè)備的開發(fā)，使利用深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)算法提供個性化智能檢索成為具有實踐性和創(chuàng)新性的研究方向。本文以深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)算法(DeepLearning)為基礎(chǔ)構(gòu)建個性化圖像檢索模型，在應(yīng)用過程中實現(xiàn)動態(tài)學(xué)習(xí)和動態(tài)跟蹤，且泛化(或推廣)能力強(qiáng)，為用戶提供更符合其目標(biāo)的檢索結(jié)果。2文獻(xiàn)綜述2.1傳統(tǒng)的商標(biāo)檢索技術(shù)商標(biāo)圖像的檢索方法眾多，傳統(tǒng)的商標(biāo)檢索方法按照檢索的機(jī)理不同來劃分，主要包括兩種：基于文本標(biāo)注的商標(biāo)檢索和基于分類的商標(biāo)檢索[2]。下面分別對這兩種技術(shù)進(jìn)行介紹。2.2.1基于文本的商標(biāo)檢索技術(shù)基于文本的商標(biāo)圖像檢索沿用了傳統(tǒng)文本檢索技術(shù)，回避對圖像可視化元素的分析，而是從圖像名稱、圖像尺寸、壓縮類型、作者、年代等方面標(biāo)引圖像，一般以關(guān)鍵詞形式的提問查詢圖像，或者是根據(jù)等級目錄的形式瀏覽查找特定類目下的圖像，如GettyAAT使用近133,000個術(shù)語來描述藝術(shù)、藝術(shù)史、建筑以及其它文化方面的對象，并推出30多個等級目錄，從7方面描述圖像的概念、物理屬性、類型和刊號等。又如Gograph將圖像分為動態(tài)圖像、照片、圖標(biāo)、背景、藝術(shù)剪輯圖、插圖、壁紙、界面、成套圖像8個一級類，下設(shè)數(shù)量不等的子類。在圖像數(shù)字化之前，檔案管理者、圖書管理員都是采用這種方式組織和管理圖像?；谖谋镜纳虡?biāo)圖形檢索典型的的操作方法是將我們想要的商標(biāo)圖像用某一種查詢語言描述，檢索的過程就是匹配標(biāo)注和描述，然后將商標(biāo)圖形數(shù)據(jù)庫中相似的圖像返回。目前廣泛使用的如Google，百度的圖片搜索就是應(yīng)用的這種模式。2.2.2基于分類的商標(biāo)檢索技術(shù)目前,基于分類的商標(biāo)檢索技術(shù)是實踐中使用最為普遍的方式之一,通過等級式分類目錄對不同行業(yè)不同領(lǐng)域的商標(biāo)進(jìn)行分類和組織,并提供基于分類的瀏覽查找。著名的商標(biāo)國際分類通用標(biāo)準(zhǔn)有《有關(guān)商標(biāo)注冊用商品和服務(wù)國際分類的尼斯協(xié)定》(簡稱《尼斯協(xié)定》,NiceClassification)[3],我國在1988年以前采用的是國內(nèi)分類法,自1988年11月開始采用尼斯國際分類。尼斯分類包括45個大類,其中商品34類,服務(wù)項目11類,共包含一萬多個商品和服務(wù)項目。同時為了對包括圖形要素的商標(biāo)建立分類,另有《建立商標(biāo)圖形要素國際分類的維也納協(xié)定》(簡稱《維也納協(xié)定》,ViennaClassification)[4],用于對圖形要素進(jìn)行編碼分類顯示,該分類由商標(biāo)圖形要素按大類、小類及組分類的一覽表組成,并根據(jù)情況加以注釋。2.2.3傳統(tǒng)商標(biāo)檢索技術(shù)的缺點（1）基于文本的商標(biāo)檢索技術(shù)的缺點由于對商標(biāo)圖像的標(biāo)注的深度不夠和查詢方式的單一，基于文本的商標(biāo)檢索技術(shù)就不能達(dá)到很好的效果，無法令人真正滿意，用戶需要在返回的很多商標(biāo)中一個個再次查找，導(dǎo)致檢索的效率不高，這些問題的出現(xiàn)使得基于文本的商標(biāo)檢索的應(yīng)用出現(xiàn)障礙，從而促進(jìn)了基于內(nèi)容的商標(biāo)檢索技術(shù)的發(fā)展。（2）基于分類的商標(biāo)檢索技術(shù)的缺點基于分類的商標(biāo)檢索方法大量依賴人工處理，面對日益增加的大量待注冊商標(biāo)，分類和標(biāo)記太慢；分類方法一旦確定后，就難以更改，對于大家制定的標(biāo)準(zhǔn)中出現(xiàn)的不合理的地方很難去修改，也很難在分類標(biāo)準(zhǔn)中更新標(biāo)準(zhǔn)，因為這樣做的話需要對重新分類已有的所有圖像。由于以上原因，傳統(tǒng)的商標(biāo)檢索技術(shù)已經(jīng)日益落后于人們對于商標(biāo)檢索的需求，而基于內(nèi)容的商標(biāo)檢索技術(shù)日益成為人們研究的熱點。2.2

基于內(nèi)容的商標(biāo)檢索技術(shù)基于內(nèi)容的圖像檢索技術(shù)，即CBIR[5](Content-basedimageretrieval)，是計算機(jī)視覺領(lǐng)域中關(guān)注大規(guī)模數(shù)字圖像內(nèi)容檢索的研究分支。典型的CBIR系統(tǒng)，允許用戶輸入一張圖片，查找具有相同或相似內(nèi)容的其他圖片。而商標(biāo)檢索技術(shù)是這些技術(shù)的應(yīng)用方向之一。T.Kato在1992年提出基于內(nèi)容的圖像檢索技術(shù)這一概念。他構(gòu)建了一個基于色彩與形狀的圖像數(shù)據(jù)庫，然后提供了一定的檢索功能進(jìn)行實驗。此后，基于圖像特征提取以實現(xiàn)圖像檢索的過程以及CBIR這一概念，被廣泛應(yīng)用于各種研究領(lǐng)域，如統(tǒng)計學(xué)、模式識別、信號處理和計算機(jī)視覺。目前，該技術(shù)已成功應(yīng)用于人臉識別技術(shù)；針對商標(biāo)與設(shè)計專利類的圖像進(jìn)行檢索，防止專利糾紛的產(chǎn)生。因為圖像的信息量一般要大于純粹的文本信息，所以基于內(nèi)容的圖像檢索在檢索的速度和效率上要求更高。目前已有不少應(yīng)用于實踐環(huán)境的基于內(nèi)容圖像檢索系統(tǒng)，如由IBM公司開發(fā)的最早商業(yè)化QBIC系統(tǒng)，以及由哥倫比亞大學(xué)研發(fā)的WebSeek系統(tǒng)、麻省理工學(xué)院研發(fā)的Photobook系統(tǒng)等[5]。2.3

基于內(nèi)容的商標(biāo)檢索技術(shù)現(xiàn)狀和分析商標(biāo)圖像特征一般包括顏色、形狀以及版面等特征，與其它圖像相比，作為人工圖像的商標(biāo)圖像，其形狀特征較顏色特征更為顯著，而且許多商標(biāo)圖像屬于單色無紋理的二值圖像，因此一般利用形狀特征進(jìn)行檢索，而形狀特征的表達(dá)必須以對圖像中物體或區(qū)域的劃分為基礎(chǔ)。對于一般的圖像，當(dāng)前的技術(shù)無法做到準(zhǔn)確而魯棒的自動圖像分割，對于商標(biāo)圖像，其包含的物體或區(qū)域可以直接獲得，所以形狀特征能很好地應(yīng)用于商標(biāo)圖像檢索。為方便對圖像進(jìn)行形狀特征提取。先將商標(biāo)圖像轉(zhuǎn)換成二值商標(biāo)圖像。二值商標(biāo)圖像僅僅由白色和黑色兩種像素組成，本文默認(rèn)黑色為目標(biāo)像素，白色為背景像素?；趦?nèi)容的圖像檢索方法，就是指先提取出圖像中物體的顏色、形狀、紋理等圖像特征，以及這些特征的組合，再生成特征向量，用特征向量來表征圖像內(nèi)容，通過對特征向量進(jìn)行相似性度量，來查詢檢索圖像的方法。從定義就可以知道，基于內(nèi)容的圖像檢索技術(shù)的關(guān)鍵就是特征提取和匹配，主要包括：圖像的特征提取、相似性度量和相關(guān)性反饋等方面[6]。2.3.1國外基于內(nèi)容的商標(biāo)檢索技術(shù)現(xiàn)狀QBIC[5](QueryByImageContent)是IBM公司的推出的世界上第一個商業(yè)化的基于內(nèi)容的圖像檢索系統(tǒng)，它的出現(xiàn)對后來的圖像檢索技術(shù)發(fā)展有著深遠(yuǎn)的影響。T.Kato在1992年提出這一概念。他構(gòu)建了一個基于色彩與形狀的圖像數(shù)據(jù)庫，然后提供了一定的檢索功能進(jìn)行實驗。此后，基于圖像特征提取以實現(xiàn)圖像檢索的過程以及CBIR這一概念，被廣泛應(yīng)用于各種研究領(lǐng)域，如統(tǒng)計學(xué)、模式識別、信號處理和計算機(jī)視覺。目前，該技術(shù)已成功應(yīng)用于人臉識別技術(shù)；針對商標(biāo)與設(shè)計專利類的圖像進(jìn)行檢索，防止專利糾紛的產(chǎn)生。STAR[7](SystemforTrademarkArchivalandRetrieval)是由新加坡國立大學(xué)開發(fā)的商標(biāo)圖像檢索系統(tǒng)，它結(jié)合顏色和形狀特征，而且同時使用了商標(biāo)圖像的三種主要的特征，商標(biāo)形狀和結(jié)構(gòu)、商標(biāo)文字和商標(biāo)含義，而不同于其它的系統(tǒng)通常只采用圖像的形狀特征，使得在計算圖像相似性時的判斷更加靈活。主要采用基于邊界的Fourier描述子、不變矩和研究比較成熟的灰度投影這些商標(biāo)圖像的形狀特征來描述，而且使用多特征融合可以提取商標(biāo)圖像不同側(cè)重的特征點，實際上起到了取長補(bǔ)短的作用。系統(tǒng)還支持相關(guān)反饋來提取商標(biāo)圖像中的重要部分，將這些部分從圖像中分割出來，然后通過計算并存儲這些部分的形狀特征，并將它們分類為既定的類別中的一個或多個，這種方法能夠反映整個商標(biāo)圖像的整體形狀。除此之外，STAR系統(tǒng)采用一種基于詞典的模糊辭典技術(shù)。2.3.2國內(nèi)基于內(nèi)容的商標(biāo)檢索技術(shù)現(xiàn)狀我國在1988年以前采用的是國內(nèi)分類法,自1988年11月開始采用尼斯國際分類。尼斯分類包括45個大類,其中商品34類,服務(wù)項目11類,共包含一萬多個商品和服務(wù)項目。同時為了對包括圖形要素的商標(biāo)建立分類,另有《建立商標(biāo)圖形要素國際分類的維也納協(xié)定》(簡稱《維也納協(xié)定》,ViennaClassification)[4],用于對圖形要素進(jìn)行編碼分類顯示,該分類由商標(biāo)圖形要素按大類、小類及組分類的一覽表組成,并根據(jù)情況加以注釋。MIRES[11]是中科院計算所智能信息處理重點實驗室，在國家863計劃支持下研制的，可以完成示例圖像、關(guān)鍵詞或兩種模式交互混合三種方式的檢索，允許用戶設(shè)置各種特征的權(quán)重因子，支持相關(guān)反饋。在MIRES系統(tǒng)中，用戶在客戶端可以上傳檢索樣本圖像，也可以提供樣本圖像的語義關(guān)鍵詞，對于專業(yè)用戶還可以設(shè)置一些重要參數(shù)和對結(jié)果進(jìn)行相關(guān)反饋。MIRES系統(tǒng)在服務(wù)器端的工作，主要是接收用戶上傳的檢索要求，通過對數(shù)據(jù)和參數(shù)進(jìn)行分析，來選擇最佳的查詢策略，并啟動相應(yīng)的檢索引擎，進(jìn)行檢索。最后將查詢結(jié)果按照圖像的相似度降序排列后返回給用戶。另外MIRES系統(tǒng)還提供了分布式的系統(tǒng)運(yùn)行平臺，使用戶和服務(wù)器有著更好的通信方式。清華大學(xué)的基于Internet上靜態(tài)圖像的CBIR的原型系統(tǒng)，不僅能很快的檢索Internet上大量數(shù)據(jù)，而且具有較好的檢索效果。2.4

商標(biāo)圖像預(yù)處理傳統(tǒng)圖像預(yù)處理方法沒有對圖像進(jìn)行分析，忽略了某些總體信息（例如是否符合圖像中物體的輪廓）另外傳統(tǒng)方法幾乎無法對有小部分損壞或者遮擋的圖片進(jìn)行恢復(fù)。深度學(xué)習(xí)的概念由Hinton等人于2006年提出。基于深信度網(wǎng)(DBN)提出非監(jiān)督貪心逐層訓(xùn)練算法，為解決深層結(jié)構(gòu)相關(guān)的優(yōu)化難題帶來希望，隨后提出多層自動編碼器深層結(jié)構(gòu)。此外Lecun等人提出的卷積神經(jīng)網(wǎng)絡(luò)是第一個真正多層結(jié)構(gòu)學(xué)習(xí)算法，它利用空間相對關(guān)系減少參數(shù)數(shù)目以提高訓(xùn)練性能。

深度學(xué)習(xí)是機(jī)器學(xué)習(xí)研究中的一個新的領(lǐng)域，其動機(jī)在于建立、模擬人腦進(jìn)行分析學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)，它模仿人腦的機(jī)制來解釋數(shù)據(jù)，例如圖像，聲音和文本。同機(jī)器學(xué)習(xí)方法一樣，深度機(jī)器學(xué)習(xí)方法也有監(jiān)督學(xué)習(xí)與無監(jiān)督學(xué)習(xí)之分．不同的學(xué)習(xí)框架下建立的學(xué)習(xí)模型很是不同．例如，卷積神經(jīng)網(wǎng)絡(luò)（Convolutionalneuralnetworks，簡稱CNNs）就是一種深度的監(jiān)督學(xué)習(xí)下的機(jī)器學(xué)習(xí)模型，而深度置信網(wǎng)（DeepBeliefNets，簡稱DBNs）就是一種無監(jiān)督學(xué)習(xí)下的機(jī)器學(xué)習(xí)模型。稀疏編碼的去噪能力，抗部分丟失性和重建能力（SparsemodelforImageReconstruction），使其提供了一個完美的統(tǒng)一的解決方案來對圖像進(jìn)行處理。這些處理使得后續(xù)的特征提取更加可靠。稀松編碼算法：如果我們把輸出必須和輸入相等的限制放松，同時利用線性代數(shù)中基的概念，即，是基，是系數(shù)，我們可以得到這樣一個優(yōu)化問題：，其中I表示輸入，O表示輸出。

通過求解這個最優(yōu)化式子，我們可以求得系數(shù)和基，這些系數(shù)和基就是輸入的另外一種近似表達(dá)。 (2-1)因此，它們可以用來表達(dá)輸入I，這個過程也是自動學(xué)習(xí)得到的。如果我們在上述式子上加上L1的Regularity限制，得到： (2-2)2.5商標(biāo)圖像的特征提取特征提取一直都是圖像處理的核心，好的特征能夠表達(dá)一幅圖像的某些內(nèi)容。2.5.1顏色特征及其提取方法顏色特征是一種全局特征,描述了圖像或圖像區(qū)域所對應(yīng)的景物的表面性質(zhì)。一般顏色特征是基于像素點的特征，此時所有屬于圖像或圖像區(qū)域的像素都有各自的貢獻(xiàn)。由于顏色對圖像或圖像區(qū)域的方向、大小等變化不敏感，所以顏色特征不能很好地捕捉圖像中對象的局部特征。常用提取方法：顏色集。顏色直方圖法是一種全局顏色特征提取與匹配方法，無法區(qū)分局部顏色信息。顏色集是對顏色直方圖的一種近似首先將圖像從RGB顏色空間轉(zhuǎn)化成視覺均衡的顏色空間（如HSV空間），并將顏色空間量化成若干個柄。然后，用色彩自動分割技術(shù)將圖像分為若干區(qū)域，每個區(qū)域用量化顏色空間的某個顏色分量來索引，從而將圖像表達(dá)為一個二進(jìn)制的顏色索引集。在圖像匹配中，比較不同圖像顏色集之間的距離和色彩區(qū)域的空間關(guān)系。2.5.2紋理特征及其提取方法紋理特征也是一種全局特征，它也描述了圖像或圖像區(qū)域所對應(yīng)景物的表面性質(zhì)。但由于紋理只是一種物體表面的特性，并不能完全反映出物體的本質(zhì)屬性，所以僅僅利用紋理特征是無法獲得高層次圖像內(nèi)容的。與顏色特征不同，紋理特征不是基于像素點的特征，它需要在包含多個像素點的區(qū)域中進(jìn)行統(tǒng)計計算。在模式匹配中，這種區(qū)域性的特征具有較大的優(yōu)越性，不會由于局部的偏差而無法匹配成功。作為一種統(tǒng)計特征，紋理特征常具有旋轉(zhuǎn)不變性，并且對于噪聲有較強(qiáng)的抵抗能力。但是，紋理特征也有其缺點，一個很明顯的缺點是當(dāng)圖像的分辨率變化的時候，所計算出來的紋理可能會有較大偏差。另外，由于有可能受到光照、反射情況的影響，從2-D圖像中反映出來的紋理不一定是3-D物體表面真實的紋理。

常用提取方法：幾何法，信號處理法。所謂幾何法，是建立在紋理基元（基本的紋理元素）理論基礎(chǔ)上的一種紋理特征分析方法。紋理基元理論認(rèn)為，復(fù)雜的紋理可以由若干簡單的紋理基元以一定的有規(guī)律的形式重復(fù)排列構(gòu)成。在幾何法中，比較有影響的算法有兩種：Voronio棋盤格特征法和結(jié)構(gòu)法。紋理特征的提取與匹配主要有：灰度共生矩陣、Tamura紋理特征、自回歸紋理模型、小波變換等。灰度共生矩陣特征提取與匹配主要依賴于能量、慣量、熵和相關(guān)性四個參數(shù)。Tamura紋理特征基于人類對紋理的視覺感知心理學(xué)研究，提出6種屬性，即：粗糙度、對比度、方向度、線像度、規(guī)整度和粗略度。自回歸紋理模型（simultaneousauto-regressive,SAR）是馬爾可夫隨機(jī)場（MRF）模型的一種應(yīng)用實例。2.5.3形狀特征及其提取方法特點：各種基于形狀特征的檢索方法都可以比較有效地利用圖像中感興趣的目標(biāo)來進(jìn)行檢索，但它們也有一些共同的問題，包括：①目前基于形狀的檢索方法還缺乏比較完善的數(shù)學(xué)模型；②如果目標(biāo)有變形時檢索結(jié)果往往不太可靠；③許多形狀特征僅描述了目標(biāo)局部的性質(zhì)，要全面描述目標(biāo)常對計算時間和存儲量有較高的要求；④許多形狀特征所反映的目標(biāo)形狀信息與人的直觀感覺不完全一致，或者說，特征空間的相似性與人視覺系統(tǒng)感受到的相似性有差別。另外，從2-D圖像中表現(xiàn)的3-D物體實際上只是物體在空間某一平面的投影，從2-D圖像中反映出來的形狀常不是3-D物體真實的形狀，由于視點的變化，可能會產(chǎn)生各種失真。常用提取方法：形狀不變矩法，傅里葉形狀描述符法。形狀不變矩法利用目標(biāo)所占區(qū)域的矩作為形狀描述參數(shù)，傅里葉形狀描述符[15](Fouriershapedeors)基本思想是用物體邊界的傅里葉變換作為形狀描述，利用區(qū)域邊界的封閉性和周期性，將二維問題轉(zhuǎn)化為一維問題。2.6現(xiàn)有的檢索算法傅里葉邊緣描述子利用傅里葉變換將二維問題轉(zhuǎn)化為一維問題，通過傅里葉的高頻信息和低頻信息的特點可以很好的對物體的形狀進(jìn)行描述。小波變換描述子實際上是對傅里葉描述子的改進(jìn)，具有多分辨率的特點，在時、頻兩域都具有表征信號局部特征的能力，使得小波變換具有對信號的自適應(yīng)性，這是傳統(tǒng)傅里葉描述子所不具備的[14]。但這兩種算法和其他的基于輪廓的算法一樣，最大的缺點是計算復(fù)雜，難以實現(xiàn)，對圖像的輪廓要求較高，算法不穩(wěn)定?；趨^(qū)域的一些算法主要是利用圖像區(qū)域的不變矩來描述圖像的區(qū)域特征，相比基于輪廓的算法，具有算法簡單易行，穩(wěn)定并實用的優(yōu)點。Hu不變矩[1]的低階矩能很好的刻畫圖像的整體特征，但不具有太多的圖像細(xì)節(jié)信息，而高階矩又容易受到噪聲影響，不穩(wěn)定，因此很難簡單的利用Hu不變矩進(jìn)行大量商標(biāo)的檢索。Zernike矩通過正交理論，可以很容易的構(gòu)造出任意的高階矩，還可以用比較少的矩信息去恢復(fù)圖像，是眾多矩特征描述子中，效果比較好的。除常見的這些方法外，黃等人最近又提出了利用特征點平均矩特征的商標(biāo)圖像檢索方法[23]，雖然基于區(qū)域的算法比較穩(wěn)定也容易計算，但大都比較粗糙，不能真正的反映物體的形狀，最重要的是商標(biāo)圖像一般很少出現(xiàn)整體相似的情況，大部分情況是出現(xiàn)在圖像的局部相似，而基于區(qū)域的方法卻很難撲捉到圖像的局部詳細(xì)信息，而針對這些情況，基于點特征的算法具有不錯的效果。3技術(shù)路線本文主要探索如何運(yùn)用人工神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)算法實現(xiàn)基于內(nèi)容的商標(biāo)檢索，我們首先使用大量圖形數(shù)據(jù)訓(xùn)練一個深度信念網(wǎng)絡(luò)得到圖形特征，這樣做的話可以減少手工操作量，而且效果好使用方便。我們將通過以下的步驟實現(xiàn)商標(biāo)檢索。深度神經(jīng)網(wǎng)絡(luò)是一個比較強(qiáng)大的學(xué)習(xí)器，它能夠比較準(zhǔn)確的反映人腦對圖像的識別，因此訓(xùn)練得到的深度神經(jīng)網(wǎng)絡(luò)能夠為圖像提供一個類似人類的語義描述來實現(xiàn)商標(biāo)檢索。3.1對圖形進(jìn)行雙線性插值本文將運(yùn)用雙線性插值進(jìn)行圖片預(yù)處理。在數(shù)學(xué)上，雙線性插值是有兩個變量的插值函數(shù)的線性插值擴(kuò)展，其核心思想是在兩個方向分別進(jìn)行一次線性插值。假如我們想得到未知函數(shù)f在點P(x,y)的值，假設(shè)我們已知函數(shù)f在，，，四個點的值。如下圖所示：圖3-1雙線性插值首先在x進(jìn)行線性插值，得到兩個點與： (3-1) (3-2)然后在y方向進(jìn)行線性插值，得到所要求的點P(x,y)，點P(x,y)的值由下式給出：,其中，(3-3)這樣就得到了未知函數(shù)f在點P(x,y)的值，以下式子給出： (3-4)3.2對圖形進(jìn)行深度網(wǎng)絡(luò)訓(xùn)練過程Auto-encoder[22]嘗試學(xué)習(xí)一個的函數(shù)。也就是說auto-encoder嘗試逼近一個恒等函數(shù)，使得輸出接近于輸入。當(dāng)然為了使這個函數(shù)有意義，需要加入一些限制條件（比如說限制隱藏神經(jīng)元的數(shù)目），就可以發(fā)現(xiàn)一些有意義的結(jié)構(gòu)。Auto-encoder可以學(xué)習(xí)到數(shù)據(jù)的一些壓縮表示。例如如果輸入數(shù)據(jù)為100維，隱藏層為50個，那么就需要從這50維的數(shù)據(jù)中重構(gòu)出100維的輸出，使這個輸出接近于100維的輸入。圖3-1深度學(xué)習(xí)模型所以我們可以取輸入節(jié)點為原商標(biāo)進(jìn)行圖像預(yù)處理后的結(jié)果，假設(shè)為32*32=1024維的輸入，隱藏層為100個，用100維的數(shù)據(jù)來重構(gòu)1024維的輸出，這樣我們就可以用隱藏層的100維數(shù)據(jù)來表征1024維的數(shù)據(jù)信息。如果在增加隱藏層，我們可以做到進(jìn)一步降維。具體步驟如下：（1）利用原始輸入數(shù)據(jù)訓(xùn)練第一層，得到參數(shù),,,,得激活值A(chǔ)。（2）將激活值A(chǔ)作為第二層的輸入，訓(xùn)練，，，。（3）對后面的層采取同樣的策略。（4）訓(xùn)練每一層參數(shù)時，固定其它層的參數(shù)不變。（5）對訓(xùn)練完的神經(jīng)網(wǎng)絡(luò)進(jìn)行Fine-Tuning。3.3對訓(xùn)練完的神經(jīng)網(wǎng)絡(luò)進(jìn)行Fine-Tuning過程前向傳播，得到各層的激活值。對于輸出層，計算 (3-5)對于的各層，計算 (3-6)計算最終的偏導(dǎo)數(shù)值 (3-7) (3-8)3.4特征值檢索算法將要檢索的圖片進(jìn)行訓(xùn)練，得到相應(yīng)降維之后的數(shù)據(jù)，然后將這個數(shù)據(jù)與商標(biāo)數(shù)據(jù)庫里面的圖片的數(shù)據(jù)進(jìn)行比對，計算： (3-9)得到最接近的10組商標(biāo)并把它們輸出。3.5準(zhǔn)確率檢驗用來衡量搜索引擎效率的主要指標(biāo)是準(zhǔn)確率，檢索準(zhǔn)確率計算公式如下:準(zhǔn)確率= (3-10)其中，是在查詢過程中所檢索出的全部頁面數(shù)，則是檢索出的所有符合用戶查詢需求的頁面數(shù)。準(zhǔn)確率越高，則說明系統(tǒng)檢索性能越好。4進(jìn)度安排第1~2周查閱文獻(xiàn)，進(jìn)行翻譯文獻(xiàn)；第3~5周進(jìn)一步熟悉課題，修改完善文獻(xiàn)翻譯，撰寫開題報告并進(jìn)行交流；第6~7周查閱遺傳算法和模糊神經(jīng)網(wǎng)絡(luò)的相關(guān)文獻(xiàn)資料，學(xué)習(xí)故障診斷方法及其仿真技術(shù)；第8~10周進(jìn)行特征數(shù)據(jù)提取研究，編寫深度算法和圖像檢索算法。參加中期交流和考核；第11~13周進(jìn)行商標(biāo)圖像檢索實驗并檢驗結(jié)果對算法進(jìn)行優(yōu)化，分析實驗結(jié)果；第13~14周完善課題內(nèi)容，與傳統(tǒng)方法進(jìn)行比較；第14~15周撰寫論文、論文修改、完善；論文打印、裝訂，論文答辯。5參考文獻(xiàn)章文．基于內(nèi)容的商標(biāo)檢索技術(shù)[D].南京：南京航空航天大學(xué)，2011.洪志令．基于形狀匹配的商標(biāo)圖像檢索技術(shù)研究[D]．浙江：廈門大學(xué)，2008．馬偉陽．《尼斯協(xié)定》在中國的實踐[J]．中華商標(biāo)，2010．國際法規(guī)．/fagui/07/003.htm(AccessedNov.12,2003)韋虎，張麗艷，劉勝蘭．基于SIFT圖像特征匹配的多視角深度圖配準(zhǔn)算法[J]．計算機(jī)輔助設(shè)計與圖形學(xué)學(xué)報，2010，22(4):654-661．劉瑞．基于SIFT的商標(biāo)圖像檢索技術(shù)研究[D].西安：西北大學(xué)，2010.郭麗．基于內(nèi)容的商標(biāo)圖像檢索研究[D]．南京:南京理工大學(xué),2003．李伯宇．圖像紋理分析及分類方法研究[D]．上海：復(fù)旦大學(xué)，2007.韋娜．基于內(nèi)容的圖像檢索關(guān)鍵技術(shù)的研究[D]．西安：西北大學(xué)，2006.詹越．基于BP人工神經(jīng)網(wǎng)絡(luò)的知識管理戰(zhàn)略選擇研究[J]．圖書情報工作，2008，53(6):92－95．趙偉，張秀華，張曉青．基于BP算法的網(wǎng)絡(luò)信息資源有效性評價研究[J].現(xiàn)代圖書情報技術(shù)，2006(7):52-55．龔平，劉相濱，周鵬．一種改進(jìn)的Harris角點檢測算法[J]．計算機(jī)工程與應(yīng)用，2010.46(11):173-175.高光來.基于深度學(xué)習(xí)的圖像檢索研究[D].內(nèi)蒙古大學(xué)，2014.芮松艷．商標(biāo)行政案件審理情況綜合分析[J]．中國專利與商標(biāo)，2010．周明全，耿國華，韋娜．《基于內(nèi)容圖像檢索技術(shù)》，北京：清華大學(xué)出版社，2007．周斌，林喜榮，賈惠波．多特征融合的手背血管識別算法[J]．清華大學(xué)學(xué)報(自然科學(xué)版)，2007，47(2):194~197．蔣曉紅．基于查詢向量轉(zhuǎn)移和聚類相結(jié)合的相關(guān)反饋技術(shù)研究[D]．山東：中國石油大學(xué)，2008．StrangKD.Examiningeffectivetechnologyprojectleadershiptraitsandbehaviors[D]．ComputersinHumanBehavior，2007，23(1):424-462．EkvallG．Orgnizationclimateforcreativityandinnovation[J]．EuropenJournalofWork＆OrganizationalPsychology，1983，5(1):105-123．WestMA．Sparklingfountainsorstagnantponds:Anintegrativemodelofcreativityandinnovationimplementationinworkgroups[J].AppliedPsychology:AnInternationalReview，2002，51(3):355-424．SuJahwung，HuangaYuting，YehHsinho，eta1．Effectivecontent-basedvideoretrievalusingpattern—indexingandmatchingtechniques[F].ExpertSystemswithApplications，July2010，37(7)：5068—5085.BelcherC．DuYingzi．Re#on-basedSIFTapproachtoirisrecognition[D]．OpticsandLasersinEngineering，2009，47：139-147.Huang,S.,Wu,X.:Multi-featureTrademarkImageRetrievalBasedonIntegratedDistanceFunction[M].ManufacturingInformationEngineeringofChina38(7),74-78(2009).Z.Jin,I.King,X.Q.Li,Content-basedimageretrievalbyrelevancefeedback,in:ProceedingsoftheFourthInternationalConferenceonVisualInformationSystems,LectureNotesinComputerScience,Vol.1929,Lyon,France[C].November2–4Springer,Berlin,2000.J.Ashley,R.Barber,M.Flickner,J.Hafner,D.Lee,W.Niblack,D.Petkovic,Automaticandsemiautomaticmethodsforimageannotationandretrievalinqbic,in:ProceedingsofStorageandRetrievalforImageandVideoDatabaseIII[D],Vol.2420,February1995,pp.24–35.SanchezMarinFJ.Automaticrecognitionofbiologicalshapeswithandwithoutrepresentationsofshape[J].ArtificialIntelligenceinMedicine,2000,18(2):173-186.AkiKobayashi,ToshiyukiYoshida,YoshinoriSakai.ImageRetrievalbyEstimatingParametersofDistanceMeasureSPIE[Z].2000,3972:432-441.Shao,J.,Ma,D.:ANewMethodforComparingZernikeCircularpolynomialswithZernikeAnnularpolynomialsinAnnularPupils.In:2010InternationalConferenceonComputer,Mechatronics,ControlandElectronicEngineering(CMCE)[C].2010,pp.229-232.Jerome,R.,Guillaume,L.,Atilla,B.:ImprovingZernikeMomentsComparisonforOptimalSimilarityandRotationAngleRetrieval.IEEETransactionsonPatt

人人文庫> 全部分類> 辦公材料 > 辦公文檔

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

本科畢業(yè)設(shè)計論文-基于綜合概率函數(shù)和相關(guān)反饋的圖像檢索-開題報告

文檔簡介

溫馨提示

最新文檔

評論

本科畢業(yè)設(shè)計論文-基于綜合概率函數(shù)和相關(guān)反饋的圖像檢索-開題報告

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔