




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
緒論1.1課題研究背景與意義等課題研究背景在這個飛速發(fā)展的時代里,人人都離不開電網(wǎng),這近年來國家也對電力的需求明顯增大,電力設(shè)備的種類以及數(shù)量明顯增多,所以電力在我們生活中的作用非常大且很重要。電力設(shè)備名牌簡單的定義為記錄設(shè)備基本電路信息與身份信息,而我們對這個信息進行巡檢,進行管理等工作時需要名牌信息,以及方便對名牌設(shè)備圖像進行采集工作。家家做到供電安全是國家十分重視的課題之一。我國電網(wǎng)的規(guī)模也比較廣泛,慢慢走向智能化與大容量的高電壓。電力名牌是由額定電壓,額定電流,額定容量,額定頻率等一些內(nèi)容組成。但我國對各種電力設(shè)備的安全及有效性,以及可靠性非常重視,對其要求也高。用電過程中,某個電力設(shè)備出故障了,會引起“鏈?zhǔn)椒磻?yīng)”,導(dǎo)致電路不能正常工作以及帶來一些不必要的麻煩。因為電力變壓器在長時間在室外且會收到一些雷擊,暴雨,刮風(fēng),冰雹等自然因素帶來的侵害。因此,這些因素可能會將把電力設(shè)備的各種設(shè)備元件發(fā)生氧化,腐蝕等現(xiàn)象嚴重到引起各種災(zāi)害,或者人員死亡,其實通過一些研究形成電力設(shè)備故障的原因是一些性能發(fā)生惡化,比如絕緣性等。其實電力設(shè)備長期處于高電壓,還有磁場強的情況下,同時會遭受一些外來因素侵襲。也有可能發(fā)生電力設(shè)備放電等情況。如果我們不能及時處理這些電力設(shè)備存在的各種故障,否則對電力設(shè)備的安全性和可靠性帶來威脅。為了提防電力設(shè)備發(fā)生一些故障或者嚴重事故,一定要及時檢查電路設(shè)備,做好安全工作,且及時對電力進行檢查,將做好一些防備工作,從而達到電網(wǎng)可靠高效地運行。最近這些年,隨著我國經(jīng)濟水平的飛速發(fā)展,整個電力設(shè)備技術(shù)得到改革,通過深入研究,我國電力設(shè)備的科技發(fā)展也得到了飛速發(fā)展的機會,并且各種技術(shù)變得更加智能化,自動化了。而且電力設(shè)備巡檢方式也得到了改革,根本用不著人工操作了,一切都機器自動操作。電力變壓器一般在室外。隨著科技發(fā)展,人們供電需求也明顯增加。每個設(shè)備狀態(tài)準(zhǔn)確率與設(shè)備的檢修遇到一些麻煩。主要表現(xiàn)在以下幾個方面:1.電力設(shè)備發(fā)生故障的情況下,沒有專家專門分析,那么工作效率更加低。還加上最近檢測數(shù)據(jù)的越來越快速增長,與電網(wǎng)的正常運行,氣象環(huán)境數(shù)據(jù)量比較高,若人工進行分析那么效率很低。2.各種業(yè)務(wù)系統(tǒng)包括電力設(shè)備狀態(tài)信息,有多種多樣的數(shù)據(jù)結(jié)構(gòu),數(shù)據(jù)的接口也不一樣,從從而導(dǎo)致了電力設(shè)備狀態(tài)信息與資源比較分散,數(shù)據(jù)質(zhì)量也面臨困難,影響了電力設(shè)備狀態(tài)的診斷的結(jié)果以及工作效率。最近年來,電力設(shè)備名牌涉及到的所有巡檢工作都是有管理電力設(shè)備機器人的幫助下完成的,如果我們采用人工巡檢的方法,進行人工巡檢,會有存在一些缺陷。比如:工作效率不高,因為整個管理系統(tǒng)的內(nèi)部網(wǎng)絡(luò)線比較復(fù)雜,運用到的電力設(shè)備也比較多,若用人工巡檢,必須親手一個個記錄設(shè)備的名牌,再對性能進行對比,由于人工工作量也較大。操作不方便,一般我們所看到是電力設(shè)備安裝在高處,平時進行人工巡檢,必須用梯子上去,帶來操作不方便等一些問題,還有些電力設(shè)備名牌安裝在地下通道,必須工作人員下井檢查,也有帶來不方便操作。人工進行巡檢時候記錄數(shù)據(jù)過程中也有可能出差錯,如遺漏信息或者輸錯數(shù)據(jù)等導(dǎo)致數(shù)據(jù)缺陷。在機器人進行巡查的電力設(shè)備通過傳感器可以得到電力設(shè)備參數(shù),因為機器人一般會自動攜帶傳感器,并這個傳感器還幫助機器人規(guī)劃巡檢路線等。比如:對電力設(shè)備名牌進行圖像采集我們可以用攝像機操作,讓電力設(shè)備儀器達到自動識別的目的,還運用傳感器可以檢查設(shè)備的紅外檢測,并按時做到正確無誤的設(shè)備信息記錄,及時發(fā)現(xiàn)遺漏或出錯的參數(shù),并及時給工作人員反映出現(xiàn)的異常。而且工作人員在室內(nèi)就可以解決異常參數(shù),隨時掌握電力設(shè)備信息并解決出現(xiàn)的問題。最終做到一流的電力設(shè)備巡檢工作。從而可知,這種方式大大提高了電力設(shè)備名牌的工作效率與工作質(zhì)量安全,為整個電力設(shè)備系統(tǒng)提供安全可靠的用電服務(wù)。這么先進的電力服務(wù),對經(jīng)濟發(fā)展與社會發(fā)展的影響很好。課題的研究意義機器人電力設(shè)備技術(shù)多用于傳感技術(shù),智能導(dǎo)航,規(guī)劃電力電路路線,還包括計算機圖像視覺技術(shù)與數(shù)字圖像技術(shù)于都是一體的復(fù)雜的系統(tǒng)。目前在電力設(shè)備名牌識別與分析參數(shù)過程中,專家們對圖像視頻技術(shù)和圖像數(shù)據(jù)流進行分析的不夠好,不夠透徹,現(xiàn)在處于最起階段,如何去利用媒體的數(shù)據(jù)信息,并對這些數(shù)據(jù)進行進一步分析與采納,找出其中的特點,并把它提取出來,運用到圖像設(shè)別技術(shù)當(dāng)中,并及時解決這些問題。圖像識別技術(shù)是巡檢機器人的一部分,運用計算機圖像視覺技術(shù)可以在很遠的距離對電力設(shè)備名牌進行設(shè)別,記錄電力設(shè)備的狀態(tài)信息,可以判斷是否處于健康狀態(tài),并及時更換巡檢信息的記錄。若我們運用人工提取和選擇來進行計算機圖像視覺的顏色特征,形狀特點來對電力設(shè)備圖像進行描述,那么在整個過程中出現(xiàn)的參數(shù)也有限制,不能得到圖像和視頻的內(nèi)在信息,而且還可能影響到圖像識別的準(zhǔn)確性。若運用機器人那就更方便了,機器人有導(dǎo)航的功能,它在資料庫中存著電力設(shè)備電站的地圖,通過這個地圖基本可以確定電力設(shè)備位置,而且還可以知道自身所處的位置。對非結(jié)構(gòu)化圖像數(shù)據(jù)流的圖像進行檢測與自動識別。還能解決電力長時間依賴的人工處理,效率低,轉(zhuǎn)化率較弱等一系列問題。計算機視覺技術(shù)在電力設(shè)備的應(yīng)用中存在以下場合:范圍廣泛,比較自由,并且可及時監(jiān)視。需要一整天落實電力的重要設(shè)備與場合。人的視覺做不到識別圖像以及分析,總會出現(xiàn)一些漏洞。而這里存在的技術(shù)難處有以下幾個:1.受到自然因素,如:天氣變化等,會引起圖像采集質(zhì)量不好,在明暗程度不一樣也會影響所拍出來的圖像效果不好,不清楚。2.有時不能識別漢字,可知識別效率低。3.在機器人操作過程中,拍攝的圖像角度不固定,導(dǎo)致圖像產(chǎn)生傾斜等狀況,甚至不能識別圖像。為了解決上述存在的問題進行解決。所以本次課題主要研究電力設(shè)備名牌的通過計算機視覺技術(shù)特征提取,對圖像參數(shù)目標(biāo)的檢測,以及圖像設(shè)別方法。采用C/S結(jié)構(gòu),用攝像頭采集電力設(shè)備名牌圖片,然后識別圖像角度,首先進行圖像預(yù)處理,然后進行灰度化,二值化處理,高斯去噪點等一些列操作,然后把圖像識別結(jié)果傳給巡檢模塊,如電力設(shè)備名牌的信息模塊,獲取設(shè)備參數(shù),從而和別的傳感器一起完成巡檢工作。并且為后續(xù)的電力設(shè)備系統(tǒng)巡檢提供了理論基礎(chǔ)。研究現(xiàn)狀分析很早之前的電力設(shè)備的巡檢工作是由人工完成的,它工作效率較低,而且還會需要大量人力還有物力等,還有時候遭受大自然的環(huán)境因素引起的影響,尤其是走向高壓線路過程中,光靠人工無法檢測準(zhǔn)確信息,還會出現(xiàn)供電故障,所以,隨著社會與經(jīng)濟的發(fā)展,電力設(shè)備系統(tǒng)自動巡檢也有成為可能。電力設(shè)備巡檢對于電網(wǎng)的設(shè)備在遠處進行操控,監(jiān)視一級控制一個系統(tǒng)。是現(xiàn)代是視覺技術(shù),計算機機器視覺在電網(wǎng)上監(jiān)督與控制上的運用。目前,有些西方的國家也推廣這門技術(shù)。隨著各個電力部門對電力設(shè)備系統(tǒng)工作的高度重視,巡檢的自動化已經(jīng)成為目前國家電力行業(yè)的技術(shù)進步的重要部分。目的就是提高電力設(shè)備工作效率,設(shè)備的管理水平以及質(zhì)量,增強供電的安全性,有效提高電能質(zhì)量。在國外的電力設(shè)備巡檢工作很早就開始實行了。巡檢自動化工作已經(jīng)構(gòu)成了饋線分段開關(guān)的檢測,電容器組元件的調(diào)節(jié),電力用戶負荷調(diào)整,還有電力數(shù)據(jù)采集等一些列的配電網(wǎng)管理系統(tǒng)(簡稱DMS),有一百多種功能。1.3課題的主要研究內(nèi)容電力設(shè)備名牌自動識別涉及圖像預(yù)處理與文字識別等工作。本文主要針對電力設(shè)備名牌圖像的特點,著重對識別前圖像預(yù)處理做深入的研究,具體包括:1、電力名牌結(jié)構(gòu)比較復(fù)雜。其中作用也比較重要,通過電力名牌識別才能可以清楚這個設(shè)備的基本情況。從而我們對電力名牌圖像進行預(yù)處理工作,才能改善圖像質(zhì)量,有效改變圖像識別效果。預(yù)處理內(nèi)容包括圖像灰度化,二值化,高斯去噪點等。2、圖像名牌自動識別也是電力名牌識別當(dāng)中主要的內(nèi)容之一。文字識別是電力名牌圖像抽取了特征之后進行進一步處理得到的圖像結(jié)果。在圖像文字識別大部分運用到模板匹配法,神經(jīng)網(wǎng)絡(luò)以及基于支持向量機的分類等一些方法。在這個課題中第一步用模板匹配法,在圖像預(yù)處理的過程上,進一步把待識別圖像與模板進行匹配,然后距離較短的作為本次識別的結(jié)果。然后依次待識別圖像再與提取出來的十三網(wǎng)絡(luò)特征進行匹配。從而達到分類目的。3、電力名牌識別要做好怎么與電力站的設(shè)備信息,設(shè)備安裝具體位置以及廠家的聯(lián)絡(luò)信息等一些列信息關(guān)聯(lián)起來,做到信息正確無誤,可靠,然后再通過網(wǎng)絡(luò)以及圖像模式識別技術(shù)對電力名牌進行處理,然后提高設(shè)備的質(zhì)量安全程度,還提高對設(shè)備全面維護工作,提高整個電網(wǎng)安全工作效率。1.4論文組織結(jié)構(gòu)這次論文分為五個部分,每個章節(jié)進行概括描述為以下幾個部分:緒論主要介紹了本次課題研究的意義以及背景,電力設(shè)備在目前國內(nèi)現(xiàn)狀分析,以及組織結(jié)構(gòu)等。圖像識別處理相關(guān)環(huán)境,簡單介紹Opencv和Python環(huán)境,以及對比總結(jié)特點和Opencv的幾個模塊等。還介紹了Opencv和Python的基本圖像處理過程。如:載入圖像,保存圖像,顯示圖像等。識別圖像預(yù)處理理論。對電力設(shè)備名牌進行圖像預(yù)處理。圖像灰度處理,二值化處理,高斯去噪過程的相關(guān)理論的介紹。還有邊緣檢測,Canny算法的簡單介紹,以及實現(xiàn)圖像霍夫變換。名牌識別介紹文字識別最基本的過程。并且實現(xiàn)電力設(shè)備名牌灰度化,二值化,圖像邊框檢測,去邊框,去噪點過程。對本次電力設(shè)備名牌自動進行總結(jié),指出論文當(dāng)中不足之處,提些建議,以及對今后的展望。第二章識別處理相關(guān)環(huán)境2.1opencv與Python的簡介2.1.1Python的來歷Python語言由世界著名的荷蘭人吉多·范羅蘇姆GuidovanRossum在20世紀(jì)80年代的某一個圣誕節(jié),他為了打發(fā)時間而編寫的一個計算機編程語言編譯器,并且把這個程序叫作Python(大蟒蛇),有一個喜劇團隊叫MontyPython,他是這個團體的愛好者之一。Python程序設(shè)計語言是目前最受歡迎的語言。Python語言是由很多其他語言的逐步發(fā)展而產(chǎn)生的,這其中包括ABC、Modula-3、C、C++、Algol-68、Unixshell和一些其他的腳本語言組成等等。Python語言源代碼遵循GPL(GNUGeneralPublicLicense)協(xié)議?,F(xiàn)在的Python在一個核心開發(fā)團隊的維護中,在python語言中GuidovanRossum的占據(jù)作用極其大,他主要負責(zé)指導(dǎo)其進展。Python語言涉及到的領(lǐng)域很廣泛,比如在金融,人工智能,科學(xué)運算,各種軟件開發(fā),云計算等當(dāng)中。Python語言的特點是:1.優(yōu)美,非常明確,簡單。2.可移植,可擴展,可嵌入性。3.免費并且開發(fā)效率高。Python是一種很優(yōu)秀且簡潔易懂的程序設(shè)計語言,與C語言和c++語言相比起來更簡單,易于使用。它語法與設(shè)計也比較簡單;運用過程中Python不需要建立main()函數(shù),直接可以輸出字符串或一些語句。與c++語言相比雖然Python的性能會有一些差別,不過開發(fā)的相率相當(dāng)高。之所以Python比較簡潔,而且比起javac++,它代碼的大小也占不了很多;Python具有跨平臺性,用途領(lǐng)域范圍非常廣泛。2.1.2Opencv的來歷OpenCV技術(shù)是在網(wǎng)絡(luò)研究中心開發(fā)的一種視頻處理和圖像處理技術(shù),OPENCV為算是大型的計算機視覺開源庫。其是一個開放的源碼組成的,引用了計算機技術(shù),形成了一個跨越平臺的計算機視覺開源庫。它的全稱是OpenSourceComputerVisionLibrary。Opencv是1999年由世界頂級的Inter研究中心開發(fā)的。openCV在各種領(lǐng)域和商業(yè)中免費運用,而且opencv優(yōu)化的源代碼是對外開放的。OpenCV在進行圖像處理的過程中,使用的是C語言和一些c++的編寫構(gòu)成,簡潔易懂且高效,有效地實現(xiàn)了圖像處理的各種算法。opencv兼容性高,運用在不同的接口,不同的系統(tǒng)的操作運行,還在各種的平臺上運用。OpenCV軟件中的函數(shù)大約有500多個,并且在全國計算機圖像處理領(lǐng)域中廣泛使用,并且成為了流行的圖像處理的軟件。opencv在學(xué)術(shù)界和工業(yè)界的影響力也也比較大,它具有巨大的功能。Opencv隨著時代計算機視覺技術(shù)擴展到每個計算機視覺領(lǐng)域,其功能也很強大,實現(xiàn)一些二位卷積,形態(tài)學(xué)圖像處理等各種圖像處理算法,opencv主要的擴展庫cv2通過圖像處理的函數(shù)Numpy數(shù)組進行一些處理,然后編寫圖像,實現(xiàn)圖像各種操作,讓計算機視覺變動簡潔易懂,豐富。幾乎覆蓋每個研究的方向,其中實現(xiàn)的一些算法隨著計算機視覺技術(shù)的發(fā)展,將把最新的算法加入其中。Opencv應(yīng)用擴展。在計算機視覺領(lǐng)域中也廣泛運用。如:人臉識別,制作機器人,圖像分割技術(shù)等。還可以在計算機圖像操作底層也運用廣泛。如:數(shù)字圖像處理技術(shù):高斯濾波,邊緣檢測,直方圖等等。各種數(shù)據(jù)結(jié)構(gòu):樹,圖,線性表等。Opencv的特點總結(jié)以下是幾個;1.Opencv技術(shù)具有兼容性,可移植性等特點,還有可以跨過平臺運用。2.OpenCV能夠進行跨約平臺使用,可以在windows,Linux平臺上運行,opencv在桌面軟件上使用,也可以在Web后臺也運行。3.Opencv支持各種編譯器上運行,比如C/c++等??梢暬约耙渍{(diào)整代碼。4.Opencv對外開放免費,其源代碼是公開的,使用opencv不需要開源其他項目。5.提高開發(fā)工作效率,適量減少了開發(fā)者的工作量,保證程序可靠的運行。有多種功能,比如:包含了數(shù)據(jù)結(jié)構(gòu)當(dāng)中的樹,圖,以及線性表。6.運用的用戶接口靈活且方便,大部分用C語言,C++語言編寫。7.Opencv運行程序速度相當(dāng)快。它有效提高了計算機編程速度。8.Oencv具有獨立性。Opencv可以在各種操作系統(tǒng)上運行如:LINUX,windows等,與python,matlab等接口也有密切聯(lián)系。Opencv(python)使用中存在的缺點:1.文檔不完善,很難找到關(guān)于opencv文檔。2.技術(shù)比較落后。3.與C++相比運行速度比較慢。4.進行修改比較麻煩,若修改opencv,那么一定要首先修改源文件。2.1.3OpenCV的幾個模塊概述Opencv內(nèi)部是通過模塊來組成的,每個模塊都能完成相應(yīng)的功能。這里對Opencv內(nèi)部的幾個主要模塊進行簡單介紹。打開Opencv官方手冊,我們可以看到它包括如下主要模塊:1、TheCoreFunctionality這模塊在Opencv當(dāng)中的基礎(chǔ)的數(shù)據(jù)結(jié)構(gòu),包含Mat,稱為opencv的基石,其作用是保存儲圖像,還有一些點結(jié)構(gòu)、長寬形狀結(jié)構(gòu)等等。而這個Mat包含了一些矩陣運算的算法與方式,其實可以認為利用Mat類來操作矩陣運算。2、ImageProcessing這個模塊是進行圖像各種運行操作的,有高斯濾波去噪、直方圖、灰度化,特征檢測等一些功能。在這些圖像處理領(lǐng)域中運用Opencv算法的實現(xiàn)比較靠譜的。3、High-levelGUIandMediaI/O一般用到簡單的Opencv界面,用來載入,顯示、輸出數(shù)據(jù),保存圖片,創(chuàng)建窗口等等。4、video.VideoAnalysis視頻處理分析圖像視頻分析模塊,包括運動分析和物體跟蹤。5、MachineLearningOpencv當(dāng)中還包括機器學(xué)習(xí)的模塊,有統(tǒng)計學(xué)習(xí)模型,隨機森林等等許多機器等各種算法模塊組成的。6、Contributed/ExperimentalStuff這是個實驗?zāi)K是在圖像處理中比較前沿。但是功能上有差別,功能比較落后??梢詫崿F(xiàn)立體視覺、人臉識別等圖像處理功能。2.2OpenCV-Python基本圖像處理操作Opencv為python提供了使用的接口。Opencv在一些系統(tǒng)上可得到有效應(yīng)用,比如在Windows操作系統(tǒng),Linux操作系統(tǒng)等。Opencv在計算機視覺圖像處理中廣泛的使用。要做圖像各種處理,那就首先配置python環(huán)境搭配工作。環(huán)境搭配先要等python的網(wǎng)站,下載下來。使用3.6版本的python下載。因為3.6版本的python實用性,可拓展性比較強。Opencv一般在WindowsCMD模式下可以安裝運行。2.2.1imread載入圖像我們在讀入圖像第一個做的工作是插入opencv包,importcv2。再調(diào)試函數(shù)cv2對采用的NumPy數(shù)組進行圖像處理操作。然后再使用函數(shù)img=cv2.imread來實現(xiàn)讀入圖像操作。Python載入圖片過程中不需要聲明變量。img=cv2.imread("d:\\tupian\\5.jpg")在這個文件夾中讀取的圖片格式用jpg,png,等來表示。這其中有兩個參數(shù),第一個參數(shù)表示該程序的基本工作流程,2后面的參數(shù)表示怎么獲取圖像。img=Image.open('d:\\tupian\\5.jpg'再使用open打開圖片。2.2.2imshow顯示圖像cv2.imshow("Image",image)使用imshow來顯示指定圖像,Image為表示窗口標(biāo)題,image所顯示的圖片。我們還可以創(chuàng)建窗口來顯示圖片dWindow("Img"),用namedWindow函數(shù)來表示。而這個窗口的功能是可以調(diào)節(jié)圖像尺寸的比例??梢越⒁粋€或多個窗戶。后面加這個函數(shù)cv2.waitKey(0),其作用是在執(zhí)行代碼過程中響應(yīng)窗口。cv2.waitKey()函數(shù)為等待用戶按鍵操作,若用戶沒有按,那就接著循環(huán)。也有更新圖像的功能。最后使用函數(shù)cv2.destroyAllWindows()來釋放窗口。2.2.3保存圖像保存圖片比較簡潔,只需要cv2.imwrite函數(shù)即可。代碼為cv2.imwrite("d:\\tupian\\5.jpg",img)來保存一個圖像。包括兩個參數(shù),前面參數(shù)表示文件名或文件的具體地址,第二個參數(shù)表示保存的圖像。還可以用第三個參數(shù)表示圖片的。2.3Tessract介紹Tessrac本身代碼是由C語言和C++語言混合編寫而成的。Tesseract的OCR引擎一開始由20世紀(jì)80年代期間HP實驗室開發(fā)出的。后面十年之后被成為OCR業(yè)里最準(zhǔn)確的識別引擎之一。后面HP放棄了與OCR業(yè)的合作,從此被Tesseract覆蓋了。到了21世紀(jì)Tesseract由美國內(nèi)某一個信息研究所得知,并且讓Google對它進行改造優(yōu)化等工作。目前Tesseract比較前進狀態(tài)的開源項目,它還發(fā)布了GoogleProject,并且與Leptonica圖片處理庫互相結(jié)合,可以識別出各種格式的圖像并且將它們轉(zhuǎn)化很多種語言的文本,它還不斷操作當(dāng)前自己的庫,有效加強了圖像文本轉(zhuǎn)換的能力。如果后面還需要的話,還可以把它做成模板,便于開發(fā)令自己滿意的并且達到自己需求的OCR引擎。第三章識別預(yù)處理相關(guān)理論3.1OpenCV-Python進行圖像預(yù)處理圖像預(yù)處理是有效提高運算效率,改善圖像的設(shè)別效果與圖像視感質(zhì)量,刪除無關(guān)的數(shù)據(jù)量。減少無關(guān)信息(減少圖像中的噪聲),恢復(fù)有用信息以及提高可檢測性與化簡數(shù)據(jù),從而改變圖像分割,匹配與圖像亮度,顏色空間。用增強,平滑,濾波,還有轉(zhuǎn)換,二值化等方式除去噪點,將原來的圖像變化成計算機特征提取的形式。圖像預(yù)處理包含圖像灰度化處理,圖像二值化處理,圖像過濾處理,以及除去噪點,霍夫變換等。3.1.1OpenCV-Python圖像灰度處理灰度處理簡單的說就是帶顏色圖像轉(zhuǎn)換為黑白圖像的過程。平時彩色的圖像彩金大量顏色信息,若不及時進行處理,那么有可能影響到圖像設(shè)別的效率。Opencv中灰度處理可以直接使用CV::Cvtcolor來實現(xiàn)?;叶却a為:gray=cv2.cvtColor(img,cv2.COLOR_RGB2GRAY)。彩色圖像Red,Green,Blue三個顏色表示的矩陣,其中每個像素點由三個分量共同決定的,三個分量同時決定圖像的深度,分量的取值范圍為0-255種。0表示黑色,而255表示白色。圖像灰度和色彩圖像都能反映出圖像整體和局部的亮度等級分布與形態(tài)特征。圖像灰度處理指的是圖像的亮度信息,而不是彩色的信息的顯示圖像。它一般有黑和白兩個顏色組成的,但點與點之間的顏色程度有差別,這就是圖像深度?;叶茸儞Q也可以叫作圖像的點運算。圖像處理中最簡潔的方法。變換公式以下:S=T(r)這里面,T是灰度的變換函數(shù),r表示的是變換之前的圖像灰度,S表示的是變換后的圖像像素。圖像灰度的主要作用有改善圖像的像素質(zhì)量,能夠更清楚地顯示圖像各種特征,提高圖像的亮度(對比度)。選出圖像當(dāng)中的有用的像素特征。還可以改善圖片的分布圖,使得像素分布的更加均勻,直觀。灰度變換函數(shù)一般分為三個,線性函數(shù),冪律函數(shù)以及對數(shù)函數(shù)等。輸入的灰度值與輸出的灰度值之間的聯(lián)系由灰度變換來表示?;叶群瘮?shù)的各種性質(zhì)確定圖像灰度變換能達到的最佳效果。下圖為灰度變換函數(shù)的曲線圖,根據(jù)下面的各種曲線形狀,可知圖像灰度變換能所得到的效果。冪律函數(shù)更清楚地表示下圖灰度級擴展或者壓縮的效果。圖3.1灰度級擴展或縮圖灰度線性變換公式s=x·r+y當(dāng)中r表示變換之前的灰度,s表示變換之后的灰度。X表示直線的斜率,而y表示直線與坐標(biāo)軸y的截距。公式當(dāng)中1.如果x>1,會增加圖像灰度的對比值。2.如果x<1,會減少圖像灰度對比值。3.x=1,y不等于0,那么整個圖像的灰度值上升或下降,圖像像素變亮或者變暗。但是圖像對比度不會發(fā)生變化。4.x<0,y=0,那么圖像最亮的地方變暗,要么最暗的地方變亮。5.x=1,y=0,圖像像素不會發(fā)生變化。6.x=-1,y=255那么圖像發(fā)生反。對數(shù)變換公式:s=clog(1+r),其中,c是一個常數(shù),假設(shè)r等于0,根據(jù)對數(shù)函數(shù)的曲線明顯看出灰度值的范圍發(fā)生改變。對數(shù)函數(shù)去曲線與反對數(shù)函數(shù)的曲線都是對稱的,在運用到圖像變換時候結(jié)果就相反了,壓縮與擴展灰度值區(qū)間是反對數(shù)函數(shù)的作用。通過對數(shù)函數(shù)進行圖像變換時,通過圖像灰度值的變化,得出的圖像也發(fā)生變化,變換后的圖像變得更明亮,還能夠壓縮像素的動態(tài)范圍。冪律變換冪律變換的公式是s=crv公式當(dāng)中c和v表示常數(shù)。當(dāng)v>1時,窄灰度值變范圍為寬灰度值。而當(dāng)v<1時,v的值變得越小,灰度值相當(dāng)明顯,寬灰度值映射變?yōu)檎瓐D3.2灰度值函數(shù)曲線圖3.3RGB三種顏色空間表示圖下面顯示原圖和灰度圖對比結(jié)果:圖3.4原圖與灰度圖3.1.2OpenCV-Python二值化處理圖像二值化是指圖像由黑和白兩個顏色組成的,圖像上的像素點灰度值為0和255.電力設(shè)備名牌中圖像背景區(qū)域淡化,存在一些外界噪聲,此時需要對圖像寬度進行變換。從而達到圖像的字符與圖像背景獨立開來,還能夠減少計算量,達到明顯的黑白效果。進行二值化處理后圖像特征很明顯,數(shù)據(jù)量也變少。二值化一般分為兩種,一種是全局二值化,另一種是局部適應(yīng)二值化等。圖像二值化用函數(shù)cv2.threshold(image,140,255,0,img)中第一個參數(shù)image表示—源圖片,第二個參數(shù)表示—閾值(取值范圍0-255),第三個參數(shù)表示—填充色(取值范圍0-255),第四個參數(shù)img表示閾值類型。顯示圖片效果:原圖1和二值化圖片2圖3.5原圖與二值化結(jié)果3.2灰度圖像濾波去噪
噪聲是在圖像上常見的視覺效果的像素點。噪聲一般會擾亂圖片信息,使得圖片變得模糊。由于噪聲影響圖片質(zhì)量,對圖像造成一些干擾,使圖像亮與暗點不清楚,影響后續(xù)圖像特征提取,圖像識別等工作的正常運行。噪聲的來源更多種,1.圖像獲取中產(chǎn)生的噪聲。如外界因素的干擾,獲取的圖像會收到一些光照強度變化,天氣環(huán)境原因,遮擋等一些因素引起。2.圖像信號傳輸過程中產(chǎn)生的噪聲。還有我們采集到的電力設(shè)備名牌圖像也因為外界因素弱光噪點等,設(shè)備出現(xiàn)干擾,也有因為本身原因造成的圖像噪聲。為了減少電力設(shè)備名牌圖像的噪聲信息對后續(xù)處理的干擾,使用簡單且頻率高的圖像處理方法,對圖像進行改造,得到清晰的圖像。因此,需要消除圖像噪聲,提高圖像識別率。為了減少不必要圖像噪聲,需要對圖像進行去噪處理。去噪的方法挺多的,圖像平滑處理,也可稱模糊處理,平率相當(dāng)高的圖像噪點處理方法,還有低通濾波,可以達到使得圖像噪點減少,邊界模糊效果。一般常用的濾波方法有統(tǒng)計排序濾波、自適應(yīng)維納濾波器,中值濾波、均值濾波,形態(tài)學(xué)濾波等。線性濾波與非線性濾波構(gòu)成空瓶濾波,這里的線性濾波對圖像中的傅立葉變換進行操作,而非線性變換基于領(lǐng)域。一般來說,圖像的噪聲具有隨機性,服從正態(tài)分布,對圖像進行去噪濾波處理的同時,并且能夠更多的保存原來圖像的灰度總體分布特征。在圖像預(yù)處理中一種常用的去噪濾波方法。高斯濾波能夠很好地消除高斯噪聲的同時不會對圖像邊緣造成明顯的模糊,因此這次采用的高斯濾波方法作為圖像預(yù)處理階段的去噪方法。 高斯濾波可定義為是一種通過函數(shù)形狀來選擇加權(quán)值的線性平滑濾波,對于消除高斯噪聲有較強的抑制作用。高斯濾波的工作原理是通過一個卷積核掃描圖像的每一個像素點,對核內(nèi)的每個像素進行加權(quán)平均灰度值求和與區(qū)域內(nèi)各個像素值來替代模板中心像素點值,因為圖像的噪聲一般服從高斯分布,其中高斯濾波分布參數(shù)決定濾波器寬度,而高斯濾波的過程就是將圖像和正態(tài)分布進行卷積操作,因此高斯濾波器在圖像預(yù)處理減少噪聲過程中普遍使用。高斯函數(shù)的一維和二維表達式如下:GG 其中,a是模糊半徑,在二維表達式中a2=b2+c2,在圖像處理過程中高斯濾波實現(xiàn)兩個功能。第一,離散化窗口卷積操作。二,傅里葉變化的實現(xiàn)。高斯核主要用于離散化窗口卷積操作,高斯核一般用奇數(shù)來表示大小。在覆蓋區(qū)域輸出結(jié)果。下面用矩陣表示3×3的窗口,如下:1下面是用來表示矩陣5×5的窗口,如下:1下面顯示3×3大小的高斯濾波器的對灰度化的銘牌圖像進行高斯濾波處理,其實驗結(jié)果如下圖所示:圖3.6原圖與高斯濾波結(jié)果圖3.3邊緣檢測邊緣檢測在計算機圖像處理與計算機視覺技術(shù)中最基礎(chǔ)的問題。邊緣檢測簡單地說就是用各種算法提取圖像中物體與背景之間交際線。邊緣檢測主要功能是刪除一些不必要的信息,保存了圖像結(jié)構(gòu)屬性。在計算機存儲和處理圖像的單位為基于像素信息。,這個像素信息也跟原來的信息沒區(qū)別。如果我們直接對像素信息進行處理,那么給計算機帶來運算量大,運算困難等麻煩。但是我們可以在像素中直接取得對計算機有用的信息。為了達到讓計算機清楚地“認識”電力設(shè)備銘牌圖像,做好特征匹配以及有效處理圖像。計算機視覺領(lǐng)域中一個普遍研究問題是計算機視覺技術(shù)的研究特征。,在1960年的時候人們就提出要讓圖像光譜信息作為圖像的特征進行處理,但當(dāng)時提出的特征信息受到一些限制。在圖像處理中特征提取方法相對比較簡單,所能夠有限的表達圖像的信息。不過隨著圖像技術(shù)的發(fā)展最近科學(xué)家們對計算機視覺特征的研究越來越深入,同時計算機硬件不斷更新,其中運算能力不斷加強,一些原理變得復(fù)雜、不斷的提出了一些有效的表達信息更豐富的視覺特征方法,圖像邊緣檢測最重要的目標(biāo)是提取圖像中有用的特征信息與感興趣的圖像區(qū)域,放棄不重要的圖像信息,并保存圖像的原有的屬性。邊緣檢測是計算機視覺和圖像處理中的常用提取圖像視覺特征的方法,我們根據(jù)對圖像邊緣的定義,邊緣檢測的原理可以分成為求梯度值的局部最大值和方向:f公式當(dāng)中,?f?r表示的是圖像沿r處的梯度,圖像梯度方向一般用θ來表示,而圖像的梯度幅值在橫坐標(biāo)與縱坐標(biāo)上的分量值一般用fx和fy表示。當(dāng)公式當(dāng)中滿足?f?r?在公式當(dāng)中,計算梯度幅值一般常用絕對值之和來替換原本平方根。邊緣檢測的二階導(dǎo)數(shù)的梯度幅值計算公式如下:?3.4Canny邊緣算子Canny算子在20世紀(jì)80年代被CannyJohn提出的,canny算法是比較先進的算法。Canny算子是一種梯度型邊緣檢測算子,它由圖像降噪,計算圖像梯度,非極大值抑制,閾值篩選等四個步驟組成的,由于Canny算子能夠有效地抑制噪聲干擾,減少噪聲敏感度,同時梯度上檢測表現(xiàn)十分優(yōu)秀,也是目前研究最多的一種邊緣檢測算子。Canny算子的實現(xiàn)步驟如下:圖像去噪:采用二維高斯濾波器對原始圖像作高斯濾波;求一階導(dǎo)數(shù)梯度值:根據(jù)求一階導(dǎo)數(shù)公式Gu,v=G非極大值抑制:運用非極大值抑制算法,將像素為局部非極大值的幅值設(shè)為0,極大值則保持不變;雙閾值處理:設(shè)定兩個閾值X1和X2,并且X1<X2,遍歷圖像中的每個梯度幅值與V1和V2做比較:假設(shè)當(dāng)前遍歷梯度幅值為G弱邊緣處理:對步驟4)檢測的弱邊緣做進一步判斷,若弱邊緣像素點周圍的八鄰域中出現(xiàn)強像素點,則轉(zhuǎn)化為強像素點并設(shè)置幅值為1;若周圍無強像素點,則設(shè)置為0。在上述的Canny算子實現(xiàn)步驟中,非極大值抑制是實現(xiàn)的關(guān)鍵步驟,其作用是在于“瘦邊”。計算圖像梯度信息之后,直接根據(jù)梯度值來提取圖像邊緣效果依然模糊,Canny算子中采用非極大值抑制方法則可以有效地抑制局部最大值之外的梯度信息。從以上對Canny算子的實現(xiàn)步驟以及關(guān)鍵思想分析中不難看出,Canny算子在實現(xiàn)上主要遵循一下三個原則:精確的邊緣檢測標(biāo)準(zhǔn)。在保證重要邊緣信息不丟失前提下,盡量抑制“假”邊緣的產(chǎn)生;保證準(zhǔn)確判斷邊緣檢測位置。保證所判斷提取的邊緣與實際圖像中邊緣定位偏移量最低;單邊緣相應(yīng)原則。為了抑制檢測過程中出現(xiàn)雙邊緣線效應(yīng),Canny算子將若干各相鄰響應(yīng)降低為單邊緣響應(yīng)。下面電力名牌設(shè)備圖片的左邊是原圖,右邊是canny圖效果:圖3.7Canny邊緣效果圖3.5霍夫變換霍夫變換是一個用來檢驗圖片形狀的比較先進的技術(shù),若要用數(shù)字的形式展現(xiàn)一個圖像的形狀,即是它是不完美的或者有漏洞的,照樣也會檢測出來的。那就我來介紹下通過直線表達的形式。若用一次函數(shù)y=ax+b表示直線或者數(shù)學(xué)坐標(biāo)系的形式表達p=xcosθ+ysinθ,其中p是從原點到直線的垂直距離,θ是垂直線和水平坐標(biāo)軸的夾角。任何直線都可以表示成(ρ,θ).首先它創(chuàng)建一個2D數(shù)組或者是收集器(拿著兩個參數(shù))初始化是0。用行來代表ρ列代表θ.數(shù)組的大小由你需要的準(zhǔn)確率來決定。假設(shè)你想要角度的準(zhǔn)確率是1度,你需要180列。對于ρ,最大的可能距離是圖的對角線的距離。所以對于一個像素的精確度來說,行數(shù)就是圖像對角線的長度。
圖3.8灰度圖結(jié)果第四章銘牌識別4.1文字識別的最基本過程電力設(shè)別名牌自動識別過程一般包含圖像預(yù)處理,文字識別,還有一些最后的處理。圖像的預(yù)處理過程可以表示為:文字識別流程圖這里的文字識別主要由以上三個部分構(gòu)成。圖像處理過程中文字識別部分非常重要,其次是預(yù)處理也很重要。第四章主要對圖像預(yù)處理和文字識別做進一步的研究。電力設(shè)備名牌一般因為一些自然因素的影響或者其他外部因素引起(環(huán)境光照等)
,得到的圖像不清楚(圖像模糊),質(zhì)量方面存在問題。為了更好的解決這一些列問題我們對圖像進行灰度化,二值化,邊框檢測,去框,高斯去噪點等一系列處理工作。其主要的目的就是減少這些外部環(huán)境引起的干擾和噪聲,使獲取的圖像質(zhì)量得到改善,圖像變得更清楚,分割文字識別的圖像,以方便圖像特征提取。然后人和機器更容易識別圖像。電力設(shè)備名牌的文字識別指的是,在制定的模板庫中找出待識別文字相似度較高的字符的過程。4.1.1圖像灰度化過程灰度化是指將彩色的圖像(像素由紅色,綠色,藍色)三個部分組成的圖像轉(zhuǎn)化為無顏色的圖像。像素每個顏色分量值為255,且每個像素點可以一千多萬中變化的范圍,在灰度圖像顯示的像素點三個顏色可以取同樣的值,像素點灰度值越來越高,圖像就越來越明顯,亮度也大,反之則顯示的圖像越暗。通過圖像灰度變化可以看出整個圖像的色度和亮度分布與特點。一般原圖像轉(zhuǎn)化為灰度圖的過程中圖像的計算量也變得更簡單。在圖像的灰度處理中先把像素點的平均值求出來,然后把平均值分配給三個分量。4.1.2圖像二值化處理對圖像進行灰度處理時,可知每個圖像像素點有一個值,那就叫作灰度值?;叶戎狄话銜Q定得到圖像的亮度?;叶戎翟酱髨D像越亮,灰度值越小,圖像越暗。在進行文字識別圖像之前,首先把待識別的文字與它的背景進行圖像分割,然后對圖像灰度化需要進行二值化處理。這樣方便減少了圖像數(shù)據(jù)存儲的容量大小。圖像二值化處理一般分為三種,(整體閾值選擇法)整體閾值二值化處理,局部二值化處理,動態(tài)閾值二值化處理等。整體閾值選擇法的功能是保存圖像的有用信息,并且較少外部環(huán)境因素帶來的干擾。4.1.3圖像邊框檢測電力設(shè)備名牌的圖像中為了做好圖像特征和文字識別的方便,為了提高效率和釋放空間,將電力設(shè)備名牌圖像由灰度化轉(zhuǎn)換為二值化圖像。先定位電力設(shè)備名牌準(zhǔn)確位置,所以定位之后的電力名牌圖像有邊框,這樣影響電力設(shè)備后續(xù)的圖像分割和圖像識別的功能。所以電力設(shè)備名牌進行圖像分割之前必要進行圖像邊框檢測并且去邊框。需要處理圖像分割前需邊框帶來的干擾。4.1.4圖像去噪點處理噪點可以定義為平時影響人們接受外界信息時候的妨礙點。如果對一個圖像亮度可以用函數(shù)f(x,y)表示,那么在這過程中起到影響作用的函數(shù)用R(x,y)表示。這一系列過程可以稱為圖像噪聲。噪聲一般分為四種由加性噪聲,乘性噪聲,量化噪聲以及椒鹽噪聲等等。噪聲模型也一般分為幾種。去噪點技術(shù)就是減少這些噪聲的干擾。圖像去噪技術(shù)是圖像處理過程中一個最重要的部分。噪聲一般會影響圖像的載入,采集和處理工作。去噪效果的程度也會影響后面的圖像分割,還有邊緣檢測等工作。圖像去噪處理中高斯噪聲是最有效的方法之一。通過高斯去噪達到滿意的效果。 圖4.1原圖與灰度化圖4.2二值化與邊框檢測圖4.3去邊框與去噪點4.2圖像文字識別處理圖像文字識別處理功能是由tesseract-orc軟件實現(xiàn)的。Tesseract軟件其實就是ORC的一個庫。一直由酷
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2019-2025年二級注冊建筑師之法律法規(guī)經(jīng)濟與施工題庫檢測試卷A卷附答案
- 鄉(xiāng)村庭院收購合同樣本
- 內(nèi)勤聘任合同樣本
- 如何與家人溝通財務(wù)問題計劃
- 公司車貸合同樣本
- 推廣綠色醫(yī)院建設(shè)的計劃
- 隧道涂裝鋼管架施工方案
- 產(chǎn)權(quán)車位定金合同標(biāo)準(zhǔn)文本
- 價格保護合同樣本
- 2025年鋼材購銷(訂貨)合同范文
- 《曹沖稱象課件》課件
- 【MOOC】宇宙簡史-南京大學(xué) 中國大學(xué)慕課MOOC答案
- 餐廳經(jīng)營管理方案 餐廳的經(jīng)營與管理計劃
- 公民基本權(quán)利課件
- 深度學(xué)習(xí)及自動駕駛應(yīng)用 課件 第1、2章 汽車自動駕駛技術(shù)概述、深度學(xué)習(xí)基礎(chǔ)
- 糖尿病診治發(fā)展史
- 美團合作商騎手協(xié)議書范文模板
- 2024年湖北省高考化學(xué)試卷真題(含答案解析)
- 機器學(xué)習(xí) 課件 第7章 集成學(xué)習(xí)
- 視頻剪輯課件范文
- 健身房健身器材使用手冊
評論
0/150
提交評論