




下載本文檔
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
千里之行,始于足下讓知識帶有溫度。第第2頁/共2頁精品文檔推薦數(shù)字圖像處理讀書報告Efficientobjectdetectionandsegmentationforfine-grainedrecognition細粒度識別的有效目標檢測與分割
李其信202220952信號與信息處理
1
我們的辦法是在檢測的時候基于感愛好類的識別。在這里,為對象的超類,如鳥類,這個主意是建立基于特征的初步檢測。這些檢測器是對象的指示器,可以協(xié)助指出對象可能的位置。我們進一步應用基于拉普拉斯操作數(shù)的傳揚辦法,這種辦法可以在低級別的線索中分割完整的對象。這里的關鍵是,這個傳輸過程是由最初檢測到區(qū)域來引導,但在同一時光能夠保存對象的邊界,從而有效地分割完整對象。此外,所得到的分割是用來定位對象,折扣的背景的影響。我們的試驗顯示,這對于終于的識別是相當有益的。
3過程
論文第3節(jié)介紹如何在一個圖像中檢測和分割對象。第一步,3.1節(jié)中完成一系列基本的基于區(qū)域的部分對象檢測。然后,在3.2節(jié)中提出,使用這些區(qū)域作為初始化條件,利用拉普拉斯傳揚辦法。最后,第4節(jié)中,將分割后的圖像(它包含檢測到的和分段對象,可能被裁剪或者大小已被調節(jié))和輸入圖像,通過該功能特征提取和分類管道(第4節(jié)),終于得到分類的結果。3.1對象的特定區(qū)域檢測
我們的辦法是首先初始搜尋可能屬于超類的對象區(qū)域。為容易,我們使用超像素分割辦法把圖像分割成相干的小塊區(qū)域。每個超級像素區(qū)域利用文獻[3]中提到的一組特征描述符描述。利用上述特點,在脫機條件下訓練一個分類模型去打算一個區(qū)域是屬于超類(如全部花)還是屬于背景。該模型的一個優(yōu)點就是其通用性,可以再不同類別的數(shù)據(jù)集上舉行訓練,不是針對一個超類別的特征。對于花鳥貓狗的檢測和模型的訓練,使用的是同一樣的算法。
3.2全對象分割
3.2.1用
jI表示圖像第j個像素,jf表示它的特征表示。分割任務的目標是找到每個像素點
jI的標簽jX,當像素屬于分割的對象時,1jX=,否則0jX=。利用每個像素點的特征if組成相像矩陣W。
惟獨相鄰的像素點之間的關系矩陣ijW是非零的,出于計算的速度或者其它的可能挑選,我們將iiW設為0,if為像素的色彩值。
目標是最小化成本函數(shù)C(X)
(1)
,Y是對于一些或者所有像素點,期望的標簽時
這些卷標約束對于強加什么是對象什么是背景這種先驗學問是十分實用的。這是一種標準的拉普拉斯標簽傳揚的制定,上面的公式通常寫成一種更便利的等價公式:
其中,S定義:
3.2.2優(yōu)化.方程式1的優(yōu)化問題是可以用文獻[28]的迭代來解決。另外,它可以作為一個線性的系統(tǒng)方程來解決,我們挑選這種辦法,對方程1求導后,我們得到一個最優(yōu)解X。
在我們的實現(xiàn)中,我們使用共軛梯度辦法舉行預處理,實現(xiàn)了十分迅速的收斂性。因為前景的蔓延特性和不同的圖像的背景(和數(shù)據(jù))可能會有所不同,我們分離單獨考慮惟獨前景或者惟獨背景的檢測。這是因為對其中一個舉行的分割可能是好的但是相對于其它結合結果的前景和背景的分割產生更全都的分割和利用功能的互補性。表示釔鐵石榴石=Y的時候y>0和0,否則,?YBG=Y初乳<0和0,否則,我們解決了:
定義Yfg=Y當Y>0時,否則Yfg=-Y
在實踐中,這兩個分割通過應用下列規(guī)范標簽同時舉行
由于它避開了單獨優(yōu)化,這使得算法更快。同時,對個人的前景背景分割辦法也給出了相同的結果,這也更穩(wěn)定。為了獲得終于的分割,Xsegm的閾值為0。
圖3顯示的卷標傳揚算法和終于的分割的結果。右上方的圖像顯示每個超級像素區(qū)域的得分(在這里我們用分類間隔)。右下方的圖像顯示拉普拉斯操作數(shù)的擴展的解決計劃,給出了初步的地區(qū)(即方程2的解)。注重不是全部的目標區(qū)域的最初都能獲得高得分。這也是真切的背景區(qū)域。拉普拉斯擴展后,前景和背景之間的分割通過強分別獲得。圖4顯示了示例分割圖像。請注重,并非全部的細分都是勝利的,特殊是鳥類。然而,在試驗后見,即使是局部的分割是實用的,我們的辦法提供了性能的改善。
3.3細粒度的識別與分割
本節(jié)介紹了在最后的細粒度的識別任務中如何使用分割圖像。為容易起見,我們首先描述基線算法。我們應用特征提取和分類管道,首先提取4個不同尺度的HOG特征,這些特征利用文獻25中提到的LLC辦法舉行8K維的全局編碼。我們的分類管道使用線性SVM分類器的1-vs-all策略,使用線性SVM的變形。對于578類花這種十分大的數(shù)據(jù)集,我們使用一個隨機的梯度下降算法,由于線性的無法加載囫圇數(shù)據(jù)到內存。分割后的圖像是通過相同的特征加工提取管道再作為原始圖像,然后我們通過銜接來結合兩組提取的特征。這種辦法分割時光較其他算法快無數(shù)。
4結果
試驗過程中在不同的標準數(shù)據(jù)集上舉行,與其他的算法舉行比較。除此之外,還在含有578類的花的大型數(shù)據(jù)集上舉行試驗。
4.1牛津花卉102種數(shù)據(jù)集
在這個數(shù)據(jù)集上,本文的辦法對象檢測率為80.66%,比其他文獻中提到的算法優(yōu)越4%到8%,在我們的基線算法是約4%,兩者之間的唯一區(qū)分是增強了分割算法和從分割圖像舉行特征提取。
4.2加州理工學院分校的200種鳥類的數(shù)據(jù)集
在相同的設置下,我們的算法相對于文獻27實現(xiàn)了30.17%的分類性能提升。即使不適用基線算法,我們的算法也實現(xiàn)27.60%的性能提升。
4.3牛津貓狗數(shù)據(jù)集
我們的辦法優(yōu)于普通或一些特定的算法。同時,我們在分割中,沒有像其他算法一樣使用某些特定的對象解釋貨特征。
4.4包含578類花的大規(guī)模特別數(shù)據(jù)集
我們測試我們的基線算法與基于分割的算法舉行對照,我們的算法改進了4.4%。這里自動分割算法在提高性能上的優(yōu)勢是很重要的。假如針對不同的數(shù)據(jù)集,對分割算法舉行調節(jié),就可以進一步提升分割性能。
本文件提出了一種結合基于感愛好對象區(qū)域檢測和傳揚全局檢測的算法。在面向具有挑戰(zhàn)性的數(shù)據(jù)集時,此算法的分割時光得到改善,性能得到3-4%的改善。。
5啟發(fā)
5.1本文在基線方面的改進促使在分割對象中體現(xiàn)出很好的價值。然而,我們試驗的數(shù)據(jù)集可能不具有普遍代表性,這要求我們在今后的工作中去討論
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 災難心理健康教育
- 脊柱結核的主要護理要點
- 母嬰行業(yè)營養(yǎng)食品
- 2025年安全培訓試題:交通安全事故原因分析與安全行車知識問答
- 2025年注冊會計師考試《會計》特殊業(yè)務會計處理押題密卷模擬試題及答案
- 山鬼民宿創(chuàng)業(yè)開店計劃
- 2025年消防安全設施維護與管理考試題庫應急處理試題集
- 2025年人工智能工程師專業(yè)知識考核試卷:人工智能與大數(shù)據(jù)融合技術試題
- 安全知識和心理健康教育
- 腳手架安全技術知識
- 中國國際航空內蒙古有限公司2025屆空中乘務員航空安全員高校畢業(yè)生校園招聘筆試參考題庫附帶答案詳解
- 2025江蘇省安全員考試題庫附答案
- 4.2 明確概念的方法 課件高中政治統(tǒng)編版選擇性必修三邏輯與思維
- 2024年國網陜西省電力有限公司招聘筆試真題
- 腰椎ODI評分完整版
- DB13T 5542-2022 水利水電工程施工組織設計編制指南
- 二期6KV系統(tǒng)1
- 研究生面試復試英語+常問問題
- 安徽省教育科學研究項目課題申請書【模板】
- 參考文獻的標注規(guī)范
- 幼年特發(fā)性關節(jié)炎.
評論
0/150
提交評論