




版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、圖像中的文本檢測(cè)與圖像中的文本檢測(cè)與定位定位應(yīng)用應(yīng)用網(wǎng)絡(luò)過(guò)濾智能交通數(shù)字圖書(shū)館圖像、視頻檢索文本定位主要方法基于區(qū)域(同一行字符顏色相似,不適用于字符含多種顏色)基于邊緣(文本與背景對(duì)比度較大,筆畫(huà)邊緣突出,背景邊緣少)基于紋理(可檢測(cè)字符與背景對(duì)比度較小、背景復(fù)雜的文本,但計(jì)算量大,算法比較耗時(shí))基于學(xué)習(xí)(神經(jīng)網(wǎng)絡(luò),SVM,Adaboost等)文本定位流程圖像文本分割方法直方圖閾值法:通常是對(duì)每個(gè)區(qū)域色彩空間的各個(gè)分量計(jì)算閾值,將各個(gè)分量與閾值比較,得到圖像分割結(jié)果。 (1)基于RGB 用88大小的均勻網(wǎng)格將圖像分成互不相交的子圖 像,在每個(gè)子圖像中分別求R、G、B的局部閾值。公式如 下:圖
2、像文本分割方法圖像文本分割方法(2)基于HSV HSV顏色空間示意圖中,H參數(shù)表示色彩信息,該參數(shù)用角度量表示;S參數(shù)為飽和度,它表示色彩的純度,數(shù)值大小為0到1,數(shù)值越高表示色彩越純;V參數(shù)表示色彩的明亮程度,范圍從0到1。圖像文本分割方法 基于HSV比基于RGB效果好些,因?yàn)镠SV的色彩空間更符合人眼的視覺(jué)特性。圖像文本分割方法K均值聚類(lèi)圖像分割(1)輸入要分類(lèi)的數(shù)據(jù)集合,設(shè)置類(lèi)別數(shù)K(2)隨機(jī)選取K個(gè)數(shù)據(jù)作為初始聚類(lèi)中心(3)逐個(gè)將需分類(lèi)的數(shù)據(jù)樣本按最小距離準(zhǔn)則分配給K個(gè)聚 類(lèi)中心的某一個(gè)(4)各個(gè)聚類(lèi)中心重新計(jì)算(5)聚類(lèi)中心再次移動(dòng)到它所在的類(lèi)別中心(6)重復(fù)步驟(3)-(5),直到
3、收斂圖像文本分割方法圖像文本分割方法基于均值漂移圖像分割算法(1)邊緣保持平滑(2)彩色邊緣檢測(cè)(3)RGB顏色空間的二次采樣(4)RGB空間轉(zhuǎn)換為L(zhǎng)UV空間(5)均值漂移過(guò)程(6)將分類(lèi)后的數(shù)據(jù)還原為圖像圖像文本分割方法文本候選區(qū)域生成圖像分層,分割后的圖像被分成若干層,將每層顏色提取出來(lái),并進(jìn)行二值化。對(duì)分層后的各子圖進(jìn)行連通區(qū)域提取 采用深度優(yōu)先搜索思想提取連通區(qū)域,獲得每個(gè)子圖像中連通區(qū)域的位置、面積。結(jié)合文本本身的一些幾何特征、角點(diǎn)信息以及其他一些規(guī)則剔除一些很明顯的非文本區(qū)域。角點(diǎn)檢測(cè) 連通區(qū)域分析連通區(qū)域鑒定 (1)圖像中文本的寬和高不會(huì)太小,也不會(huì)太大,并且高度比通常在一定范圍
4、內(nèi)。 (2)文本區(qū)域的面積一般呈現(xiàn)某種規(guī)則。 (3)利用文本區(qū)域角點(diǎn)信息剔除一些非文本區(qū)域。 (4)文本區(qū)域向X軸的投影曲線(xiàn)特性與非文本區(qū)域向X軸的投影曲線(xiàn)特性相差較大。 (5)通常情況下,文本圖像中的文本不會(huì)出現(xiàn)在圖像的邊界區(qū)域。連通區(qū)域分析連通區(qū)域合并生成候選文本區(qū)域AdaBoost算法AdaBoost算法AdaBoost舉例Adaboost舉例第一步,根據(jù)分類(lèi)的正確率,得到一個(gè)新的樣本分布D2,一個(gè)子分類(lèi)器h1。第二步,根據(jù)分類(lèi)的正確率,得到一個(gè)新的樣本分布D3,一個(gè)子分類(lèi)器h2。Adaboost舉例第三步,得到一個(gè)子分類(lèi)器h3。整合所有子分類(lèi)器:特征提取HOG特征LBP特征其他紋理特征
5、(均值、方差、熵等)HOG特征生成過(guò)程:HOG特征HOG特征HOG特征HOG特征(4)基于基于梯度幅值的方向權(quán)重投影梯度幅值的方向權(quán)重投影 HOG結(jié)構(gòu):通常使用的HOG結(jié)構(gòu)大致有三種:矩形HOG(簡(jiǎn)稱(chēng)為R-HOG),圓形HOG和中心環(huán)繞HOG。它們的單位都是Block(即塊)。Dalal的試驗(yàn)證明矩形HOG和圓形HOG的檢測(cè)效果基本一致,而環(huán)繞形HOG效果相對(duì)差一些。HOG特征 矩形HOG塊的劃分:一般一個(gè)塊(Block)都由若干單元(Cell)組成,一個(gè)單元都有若干個(gè)像素點(diǎn)組成。HOG特征(5)HOGHOG特征向量特征向量歸一化歸一化:對(duì)block塊內(nèi)的HOG特征向量進(jìn)行歸一化。對(duì)block
6、塊內(nèi)特征向量的歸一化主要是為了使特征向量空間對(duì)光照,陰影和邊緣變化具有魯棒性。還有歸一化是針對(duì)每一個(gè)block進(jìn)行的,一般采用的歸一化函數(shù)有以下四種:LBP特征原始的LBP算子定義為在3*3的窗口內(nèi),以窗口中心像素為閾值,將相鄰的8個(gè)像素的灰度值與其進(jìn)行比較,若周?chē)袼刂荡笥谥行南袼刂?,則該像素點(diǎn)的位置被標(biāo)記為1,否則為0。這樣,3*3鄰域內(nèi)的8個(gè)點(diǎn)經(jīng)比較可產(chǎn)生8位二進(jìn)制數(shù)(通常轉(zhuǎn)換為十進(jìn)制數(shù)即LBP碼),即得到該窗口中心像素點(diǎn)的LBP值,并用這個(gè)值來(lái)反映該區(qū)域的紋理信息。如下圖所示:改進(jìn)的改進(jìn)的LBPLBP(一)(一)基本的 LBP算子只覆蓋了一個(gè)固定半徑范圍內(nèi)的小區(qū)域,為了適應(yīng)不同尺度的紋
7、理特征,并達(dá)到灰度和旋轉(zhuǎn)不變性的要求,Ojala等對(duì) LBP 算子進(jìn)行了改進(jìn)。圓形LBP算子:將 33鄰域擴(kuò)展到任意鄰域,并用圓形鄰域代替了正方形鄰域,改進(jìn)后的 LBP 算子允許在半徑為 R 的圓形鄰域內(nèi)有任意多個(gè)像素點(diǎn)。從而得到了半徑為R的圓形區(qū)域內(nèi)含有P個(gè)采樣點(diǎn)的LBP算子。改進(jìn)的改進(jìn)的LBPLBP(二)(二)LBP旋轉(zhuǎn)不變模式:從 LBP 的定義可以看出,LBP 算子是灰度不變的,但卻不是旋轉(zhuǎn)不變的。圖像的旋轉(zhuǎn)就會(huì)得到不同的 LBP值。Maenpaa等人又將 LBP算子進(jìn)行了擴(kuò)展,提出了具有旋轉(zhuǎn)不變性的 LBP 算子,即不斷旋轉(zhuǎn)圓形鄰域得到一系列 初始定義的 LBP值, 取其最小值作為該 鄰域的 LBP 值。改進(jìn)的改進(jìn)的LBPLBP(三)(三)一個(gè)LBP算子可以產(chǎn)生不同的二進(jìn)制模式,對(duì)于半徑為R的圓形區(qū)域內(nèi)含有P個(gè)采樣點(diǎn)的LBP算子將會(huì)產(chǎn)生P2種模式。很顯然,隨著鄰域集內(nèi)采樣點(diǎn)數(shù)的增加,二進(jìn)制模式的種類(lèi)是急劇增加的。為了解決二進(jìn)制模式過(guò)多的問(wèn)題,提高統(tǒng)計(jì)性,Ojala提出了采用一種“等價(jià)模式”來(lái)對(duì)LBP算子的模式種類(lèi)進(jìn)行降維。Ojala將“等價(jià)模式”定義為:當(dāng)某個(gè)LBP所對(duì)應(yīng)的循環(huán)二進(jìn)制數(shù)從0到1或從1到0最多有兩次跳變時(shí),該LBP所對(duì)應(yīng)的二進(jìn)制就稱(chēng)為一個(gè)等價(jià)模式類(lèi)。通過(guò)這樣的改進(jìn),二進(jìn)制模式的種類(lèi)大大減少,而不會(huì)丟失任何信息。模式數(shù)量由原來(lái)的
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于農(nóng)業(yè)資源整合的現(xiàn)代農(nóng)業(yè)發(fā)展協(xié)議
- 項(xiàng)目進(jìn)度統(tǒng)計(jì)表-互聯(lián)網(wǎng)項(xiàng)目進(jìn)度監(jiān)控
- 公司前臺(tái)接待與咨詢(xún)工作表格
- 以科技創(chuàng)新推動(dòng)農(nóng)業(yè)現(xiàn)代化智能化發(fā)展的路徑探索
- 歷史文物保護(hù)修復(fù)技術(shù)考試試題集
- 山中訪(fǎng)友:六年級(jí)自然美文欣賞教案
- 員工培訓(xùn)與技能評(píng)估記錄表
- 醫(yī)院場(chǎng)地租賃合同
- 中國(guó)古詩(shī)詞故事的欣賞感受
- 彩虹魚(yú)的顏色故事解讀
- 自行車(chē)的力學(xué)知識(shí)研究報(bào)告
- 腦梗動(dòng)脈取栓護(hù)理查房課件
- 泊松過(guò)程與應(yīng)用
- 溫室氣體盤(pán)查培訓(xùn)-(課件)
- 中華人民共和國(guó)憲法應(yīng)知應(yīng)會(huì)試題
- 民間醫(yī)學(xué)視角下的清代祝由術(shù)研究
- 骨髓穿刺PPT完整版
- 宿舍衛(wèi)生值日表
- 人力資源服務(wù)機(jī)構(gòu)年檢申請(qǐng)報(bào)告
- 石油化工行業(yè)檢修工程預(yù)算定額說(shuō)明
- 落實(shí)中央八項(xiàng)規(guī)定改進(jìn)干部作風(fēng)建設(shè)課程
評(píng)論
0/150
提交評(píng)論