




版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
基于攝像表的圖像分析處理以及識別算法研究黃振亞(蘇州自來水表業(yè)有限公司)0引言隨著網(wǎng)絡技術的發(fā)展,科技的進步,人們的生產(chǎn)生活方式得到了很大的改善。對于所有的傳統(tǒng)行業(yè)而言,都面臨著巨大的挑戰(zhàn)和機遇,相對于傳統(tǒng)的水表行業(yè)也同樣面臨著諸多問題比如說:抄表難,人情難,智能抄表可能與用戶的讀數(shù)不符而導致的核對麻煩?,F(xiàn)在市場上存在著脈沖表以及直讀表等智能水表,功能上比原有的水表進步很多,但是仍然存在著讀數(shù)不準確,易受干擾等問題。本文提出一種新的方案,旨在增加一個攝像頭以及含有單片機的主板的新型智能識別讀數(shù)的。以解決供水公司以及用戶之間讀數(shù)不相符以及智能識別的等問題。識別方法簡介 本方案中主要對于的是智能遠傳水表。本文著重講述智能識別水表部分,智能遠傳水表現(xiàn)階段主要分為脈沖式和直讀式。水表識別方式國內(nèi)遠傳水表從上世紀80年代開始研制,早期水表結(jié)構為以磁鐵和干簧管為主,水表轉(zhuǎn)動一定流量,磁鐵吸引干簧管,從而產(chǎn)生一個信號脈沖,將這個脈沖采集后累加從而得到讀數(shù),行業(yè)中稱之為分線制遠傳水表。后來又發(fā)展了脈沖式和直讀式兩種方式。脈沖式遠傳水表原理主要有干簧管,光耦,以及磁感應元件,當水流流過時這些都能產(chǎn)生脈沖信號,這種水表要求電路對脈沖信號實時采集后者不斷休眠——喚醒后采集狀態(tài)——休眠,才能大道計數(shù)的目的;光電只讀方式水表是把水表的字輪做出較大的調(diào)整,通過光電管的發(fā)射和接收或者電阻值的大小來判斷字輪的狀態(tài),根據(jù)字輪的狀態(tài)即可讀出水表的讀數(shù),即通過直接讀取的方式采集水表的數(shù)據(jù),該方式平時不工作,旨在讀取時瞬時工作。攝像表以原來的機械機構統(tǒng)統(tǒng)不變,只是在字面上方加裝攝像模塊,然后單片機對圖像進行處理識別。MATLAB算法介紹該設計主要研究基于MATLAB軟件的字輪窗設別系統(tǒng)設計,系統(tǒng)主要包括圖像采集、圖像預處理、字輪數(shù)字定位、字符分割、字符識別五大核心部分。系統(tǒng)的圖像預處理模塊是將圖像經(jīng)過圖像灰度化、圖像增強、邊緣提取、二值化等操作,轉(zhuǎn)換成便于字輪數(shù)字定位的二值化圖像;利用字輪數(shù)字的邊緣、形狀等特征,再結(jié)合Rberts算子邊緣檢測、數(shù)字圖像、形態(tài)學等技術對字輪數(shù)字進行定位;字符的分割采用的方法是將二值化后的字輪數(shù)字部分進行尋找連續(xù)有文字的塊,若長度大于設定的閾值則切割,從而完成字符的分割;字符識別運用模板匹配算法完成。以上每個功能模塊用MATLAB軟件實現(xiàn),最后識別出字輪數(shù)字,在研究設計的同時對其中出現(xiàn)的問題進行具體分析、處理,并尋求更優(yōu)的方法。詳細算法介紹識別系統(tǒng)采集圖片主要是利用攝像模塊拍攝獲得的。拍攝照片時應注意一下幾點:拍攝的圖片應包含字輪窗。閃光燈位置居中,字面不得太光滑攝像頭與字輪盡量平行圖像預處理流程綜述為了更能夠準確的進行字輪窗的定位和分割,字符識別必須經(jīng)過圖像預處理,圖像預處理可以提高圖片的適用性。原始圖像不只是包括字輪窗,還有字面本身和其他一些背景,所以必須去掉這些非字輪窗圖像的影響,才有可能正確的提取出字輪窗的區(qū)域,為進行下面的字輪字符識別打下基礎。由于本系統(tǒng)設計使用的圖片是生產(chǎn)線上制作完成,攝像機與字面的矩離和角度等因素的影響,使圖片存在各種各樣的噪聲。字輪圖片可能出現(xiàn)模糊、歪斜和缺損等嚴重問題,因此需要對原始圖片進行預處理,以改善圖像的質(zhì)量,提高字符識別率[1]。下圖3.1流程圖簡要的概述了圖像預處理的基本步驟:讀取圖片讀取圖片平滑處理圖像灰度化提取邊緣圖3.1圖像預處理流程圖圖片灰度化未經(jīng)處理的原始圖片包含著大量的顏色信息,不但占用存儲內(nèi)存很大,而且在運行過程中也會降低系統(tǒng)的速度,因此要將彩色圖片轉(zhuǎn)變?yōu)榛叶葓D片,以加快系統(tǒng)執(zhí)行速度。由彩色轉(zhuǎn)換為灰度的過程叫做灰度化處理,灰度圖是指只包含亮度信息,不包含色彩信息的圖像。經(jīng)過灰度變換后的圖片,像素的動態(tài)范圍增加,圖像的對比度增強,使圖像變得更加清晰、細膩、容易識別。彩色圖片分為R、G、B三個分量,分別顯示紅、綠、藍等各種顏色,灰度化就是使彩色的R、G、B分量相等的過程。灰度值大的像素點比較亮(像素值最大為255,為白色),反之比較暗(像素值最小為0,是黑色)。本設計的灰度圖片變換的實現(xiàn)采用了rgb2gray函數(shù),代碼為I1=rgb2gray(I)。原始圖像、灰度圖和直方圖如下:RGBRGB灰度變換圖3.2.1原始圖像、灰度圖和直方圖圖像增強圖像增強的目的是對圖像進行加工,得到更能準確提取字輪邊緣,從而準確定位字輪的圖像。對圖像進行灰度化處理之后,字輪部分和非字輪部分圖像的對比度并不是很高,由于字輪界限較為模糊,難以提取出字輪邊緣。為了增強字輪部分圖像和其他部分圖像的對比度,使其明暗鮮明,有利于提高識別率,需要將圖像進行增強。圖片3.3.1先進行的灰度拉伸對比增強圖像的方法有很多,如灰度變換、圖像平滑處理和線性濾波等,根據(jù)處理圖像域又可分為空間增強與頻域增強。目前用于字輪圖像增強的方法有:灰度拉伸、直方圖均衡、中值濾波、高斯濾波、鄰域濾波、圖像腐蝕、多圖像平均、同態(tài)濾波等[2]。圖像的獲取和傳輸過程中原始圖像會受到各種噪聲的干擾,由于噪聲點多在頻域中映射為高頻分量,使圖像質(zhì)量下降。為了抑制噪聲、改善圖像質(zhì)量,要對圖像進行平滑處理。圖像平滑處理的方法主要有空域中求鄰域平均值,鄰域平均值的平滑處理會使得圖象灰度急劇變化的地方,尤其是物體邊緣區(qū)域和字符輪廓等部分產(chǎn)生模糊作用。為了克服這種平均化引起的圖象模糊現(xiàn)象,我們給中心點像素值與其鄰域平均值的差值設置一固定的閾值,只有大于該閾值的點才能替換為鄰域平均值,而差值不大于閾值時,仍保留原來的值,從而減少由于平均化引起的圖像模糊。圖像平滑的目的是為了消除噪聲。噪聲消除的方法又可以分為空間域或頻率域,亦可以分為全局處理或局部處理,亦可以按線性平滑、非線性平滑和自適應平滑來區(qū)別。圖像的平滑是一種實用的數(shù)字圖像處理技術,一個較好的平滑處理方法應該既能消除圖像噪聲,又不使圖像邊緣輪廓和線條變模糊,這就是研究數(shù)字圖像平滑處理要追求的目標。一般情況下,減少噪聲的方法可以在空間域或頻率域進行處理,主要有鄰域平均法、中值濾波法、低通濾波法等,鄰域平均法即通過提高信噪比,取得較好的平滑效果;空間域低通濾波采用低通濾波的方法去除噪聲;以及頻域低通濾波法通過除去其高頻分量就能去掉噪聲,從而使圖像得到平滑[1]。定位與分割以及圖片歸一化由于攝像模塊對于字面一旦安裝完成就不再改變,字輪窗相對的像素位置也就固定了,也就是攝像表一旦安裝完成之后只需要定點切割就可以了。對圖像橫方向象素點累加,就可以明顯看到字輪窗的起始位置以及終止為止的縱坐標, 圖3.4.1行方向象素點灰度值累加和有圖可以明顯看出字輪窗縱坐標起始位置92終止位置163,然后進行圖片分割圖3.4.2圖像分割結(jié)束之后的二值圖像以及原圖像圖3.4.3選取圖像分割點對圖像縱方向象素點累加,就可以明顯看到字輪窗的起始位置以及終止為止的橫坐標,由圖可以看出五個字輪的橫坐標其實以及終止位置圖3.4.4圖像歸一化字符識別目前已經(jīng)提出的字輪字符識別的方法[3]有以下幾種:(1)模板匹配字符識別算法。模板匹配字符識別算法的實現(xiàn)方法是計算輸入模式與樣本之間的相似性,取相似性最大的樣本為輸入模式所屬類別。該方法識別速度快,但是對噪點比較敏感。在實際應用中,為了提高正確率往往需要使用大的模板或多個模板進行匹配,處理時間則隨著模板的增大以及模板個數(shù)的增加而增加。(2)統(tǒng)計特征匹配法。統(tǒng)計特征匹配法的要點是先提取待識別模式的一組統(tǒng)計特征,然后按照一定的準則所確定的決策函數(shù)進行分類判決。實際應用中,當字符出現(xiàn)字符模糊、筆畫融合,斷裂、部分缺失時,此方法效果不理想,魯棒性較差。(3)神經(jīng)網(wǎng)絡字符識別算法。主要有兩種方法:一種方法是先對待識別字符進行特征提取,然后用所獲得的特征來訓練神經(jīng)網(wǎng)絡分類器。其中,字符特征的提取是研究的關鍵,特征參數(shù)過多會增加訓練時間,過少會引起判斷上的歧義。另一種方法是充分利用神經(jīng)網(wǎng)絡的特點,直接把待處理圖像輸入網(wǎng)絡,由網(wǎng)絡自動實現(xiàn)特征提取直至識別。這種網(wǎng)絡互連較多,待處理信息量大,抗干擾性能好,識別率高。但是產(chǎn)生的網(wǎng)絡結(jié)構比較復雜,輸入模式維數(shù)的增加可能導致網(wǎng)絡規(guī)模龐大。(4)支持向量機模式識別算法。支持向量機(SupprtVectrMachine,SVM)是Vapnik及其研究小組對于二類別的分類問題提出的一種分類技術,其基本思想是在樣本空間或特征空間,構造出最優(yōu)平面使超平面與不同類樣本集之間的距離最大,從而達到最大的泛化能力。主要有兩種方法應用于字符識別:一種是先對待識別字符進行特征提取,然后用所獲得的特征來訓練SVM分類器。另一種是直接將每個字符的整幅圖像做為一個樣本輸入,不需要進行特征提取,節(jié)省了識別時間[4]。這四種方法中,模板匹配是字輪字符識別最簡單的方法之一,神經(jīng)網(wǎng)絡字符識別算法是目前比較流行的算法,本系統(tǒng)設計是采用模版匹配算法進行字符識別?;谀0迤ヅ涞淖址R別基本過程是:首先對待識別字符進行二值化并將其尺寸大小縮放為字符數(shù)據(jù)庫中模板的大小,然后與所有的模板進行匹配,最后選最佳匹配作為結(jié)果。模板匹配的主要特點是實現(xiàn)簡單,當字符較規(guī)整時對字符圖像的缺損、污跡干擾適應力強且識別率相當高。建立自動識別的代碼表建立自動識別的代碼表讀取分割出來的字符第一個字符與模板中的模板進行匹配第二個字符與模板中的模板進行匹配待識別字符與模板字符相減,值越小相似度越大,找到最小的一個即為匹配的比較好的識別完成,輸出此模板對應值依次進行后三個字輪的匹配結(jié)束語隨著人工成本提高以及國家提出的經(jīng)濟增長方式的轉(zhuǎn)變,對于水表智能化的采集提出了更高的要求,高性能的采集高可靠性的方法成為了必然,圖像采集處理以及識別不僅可以運用在大口徑水表同樣可以運用于小口徑水表,小口徑水表一般情況下只是傳輸識別后的數(shù)字一般不傳輸圖像文件,當對水表讀數(shù)產(chǎn)生疑義的時候可采用后續(xù)傳輸圖片的方式進行核對,而大口徑水表在傳輸數(shù)字的同時把分割好的圖片傳輸,這樣既減少了傳輸數(shù)據(jù)的信息量大大提高
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 專利侵權檢索合同標準文本
- 公司合同樣本易懂
- 二零二五簡單贈與合同范例
- 二零二五版股東退股協(xié)議書模板
- 商鋪分租合同范例二零二五年
- 保暖內(nèi)衣經(jīng)銷合同樣本
- 合伙人退出協(xié)議二零二五年
- 人工挖孔樁勞務分包合同
- 二零二五版股份股權轉(zhuǎn)讓協(xié)議
- 中國果品購銷合同范例
- 2024年義務教育階段國家質(zhì)量監(jiān)測模擬測試
- 纏論-簡單就是美
- 兒童神話故事-女媧補天
- 2024車輛掛靠證明
- DL∕T 2138-2020 電力專利價值評估規(guī)范
- JT-T-1039-2016公路橋梁聚氨酯填充式伸縮裝置
- 航空航天概論智慧樹知到期末考試答案章節(jié)答案2024年西安航空學院
- 人教版七年級下冊生物重點知識提綱(填空版)
- 2024年河南水利與環(huán)境職業(yè)學院單招職業(yè)適應性測試題庫審定版
- 地板防火檢驗報告
- 報表模板-土地增值稅清算申報表(自動計算申報表)可填寫數(shù)據(jù)
評論
0/150
提交評論