基于智能視頻分析的特定車輛識(shí)別研究-檢重通過(guò)稿_第1頁(yè)
基于智能視頻分析的特定車輛識(shí)別研究-檢重通過(guò)稿_第2頁(yè)
基于智能視頻分析的特定車輛識(shí)別研究-檢重通過(guò)稿_第3頁(yè)
基于智能視頻分析的特定車輛識(shí)別研究-檢重通過(guò)稿_第4頁(yè)
基于智能視頻分析的特定車輛識(shí)別研究-檢重通過(guò)稿_第5頁(yè)
已閱讀5頁(yè),還剩33頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

基于智能視頻分析的特定車輛識(shí)別研究摘要本課題的出發(fā)點(diǎn)是基于現(xiàn)有的、已經(jīng)覆蓋全市幾乎所有交通路口、停車場(chǎng)等各類現(xiàn)有視頻監(jiān)控系統(tǒng),利用路口等處的大量監(jiān)控探頭所提供的視頻,運(yùn)用視頻和圖像處理分析技術(shù),實(shí)現(xiàn)對(duì)某些特定車輛的自動(dòng)識(shí)別方法的研究探討,再通過(guò)監(jiān)控視頻的聯(lián)網(wǎng),實(shí)現(xiàn)對(duì)某些特定車輛的位置和行車軌跡等信息進(jìn)行記錄和查詢,為某些特定的業(yè)務(wù)工作快速確定和定位某些特定車輛提供技術(shù)手段。在本文中對(duì)系統(tǒng)中涉及到的圖像預(yù)處理、HOG特征提取、特征庫(kù)建立、SVM分類器的訓(xùn)練,以及對(duì)算法的改良都做了詳細(xì)的論述,同時(shí)針對(duì)有代表性的算法做了認(rèn)真的分析學(xué)習(xí),主要從以下幾個(gè)方面開(kāi)展論文的書(shū)寫(xiě)。第一章,主要介紹了國(guó)內(nèi)外在運(yùn)用視頻監(jiān)控系統(tǒng)對(duì)車輛識(shí)別檢測(cè)的研究現(xiàn)狀,認(rèn)識(shí)到該課題的研究?jī)r(jià)值及實(shí)際意義;第二章,對(duì)圖片特征的提取方法做了比擬分析,最后選取HOG特征作為車輛的特征;第三章,就目前通用的分類器訓(xùn)練方法做了簡(jiǎn)要分析,通過(guò)比擬各自的優(yōu)缺點(diǎn),再結(jié)合本課題目標(biāo)對(duì)象的特征,選取SVM作為分類器;第四章,對(duì)現(xiàn)有HOG特征在灰度域中提取的方法進(jìn)行改良,將其在顏色域里提取,在HOG特征中含有顏色信息,同時(shí)對(duì)算法進(jìn)一步的改良,結(jié)合視頻的多角度識(shí)別處理方法,得到改善后的算法,并實(shí)驗(yàn)驗(yàn)證算法有效;第五章,對(duì)本課題取得的成果做一總結(jié),并確定之后的研究方向。關(guān)鍵詞:特定車輛,車輛識(shí)別,HOG特征提取,顏色域HOG特征提取,SVM,多角度識(shí)別SPEACIFICVEHICLEIDENTIFICATIONBASEDONINTELLIGENTVIDEOANALYSISABSTRACTThepointofthisprojectisbasedonvariousexistingvideosurveillancesystems,hascoveredalmostallthecity'strafficjunctionsandparkinglotsandsoon.Theuseofalargenumberofvideoswhichareprovidedbyvideosurveillancecameras,andtheuseofvideoandimageprocessingandanalysistechniques,toachievecertainspecificvehicleautomaticidentificationmethodofstudywastoinvestigate.Alsothroughsurveillancevideonetworking,toachievecertainspecificvehicleinformationsuchasthelocationanddrivingtrackrecordandqueryforspecificoperationalworkquicklyidentifyandlocatecertainvehiclestechnicalmeans.Inthispaper,thesysteminvolvesimagepreprocessing,HOGfeatureextraction,featuredatabasecreation,SVMclassifiertraining.Alsoontheimprovementofthealgorithmhasdiscussedindetail,andhaslearnedandanalyzedrepresentativealgorithmscarefully,mainlyfromthefollowingaspectstowritepapers.Thefirstchapter,theresearchstatusofuseofvideomonitoringsystemondetectionofvehicleidentificationathomeandabroadwasintroduced,andknowingthevaluesandpracticalmeaningsofthesubject;thesecondchapter,analyzevariouspicturefeaturesextractionmethods,finallyselectHOGfeaturesasvehiclesfeatures;thethirdchapter,analyzethecurrentgeneralclassificationforthetrainingmethod,bycomparisontheirrespectiveadvantagesanddisadvantages,againcombinationofthesubjecttargetobjectfeatures,selectSVMasclassification;thefourthchapter,improveexistinghogfeaturesextractioningraygamuttocolorgamut,andthenewHOGfeaturescontainscolorinformation,atthesametimecombineidentificationofmulti-angletoimprovethealgorithmandexperimentalverificationtheeffectiveofalgorithms;thefifthchapter,sumtheresultsachievedonthissubject,anddetermineresearchdirections.KEYWORDS:specificvehicle,vehicleidentification,HOGfeatureextraction,colorgamutHOGfeatureextraction,SVM,identificationofmulti-angle目錄摘要IABSTRACTII第一章緒論11.1研究背景及研究意義11.2車輛檢測(cè)識(shí)別技術(shù)2對(duì)已有的車輛檢測(cè)技術(shù)進(jìn)行介紹2車輛識(shí)別技術(shù)進(jìn)行介紹3國(guó)內(nèi)外車輛檢測(cè)識(shí)別的研究現(xiàn)狀介紹31.3本文的主要研究工作51.4論文的組織結(jié)構(gòu)5第二章基于HOG特征的特定車輛檢測(cè)62.1車輛檢測(cè)的主要方法62.2面包車的主要特點(diǎn)及檢測(cè)方案8輪廓特征明顯8檢測(cè)方案:HOG92.3基于HOG特征的面包車HOG特征提取實(shí)現(xiàn)102.4本章小結(jié)12第三章基于SVM的面包車分類識(shí)別133.1車輛識(shí)別常用的分類器介紹133.2基于SVM的面包車分類器183.2.1SVM分類器原理18最優(yōu)分類超平面19內(nèi)積函數(shù)21車輛庫(kù)的建立223.2.5SVM分類器的訓(xùn)練243.3基于SVM的面包車分類識(shí)別實(shí)驗(yàn)243.4本章小結(jié)25第四章基于顏色+HOG的面包車檢測(cè)識(shí)別274.1顏色特征27彩色圖像27面包車的顏色特征284.2基于顏色特征的檢測(cè)識(shí)別預(yù)處理28常用的顏色特征提取方法有:28彩色空間29針對(duì)顏色對(duì)HOG算法的改良32實(shí)驗(yàn)結(jié)果及分析344.3多角度識(shí)別354.4本章小結(jié)35第五章總結(jié)與展望375.1主要研究成果375.2進(jìn)一步工作37致謝39參考文獻(xiàn)40緒論研究背景及研究意義今年來(lái)隨著電子技術(shù)、計(jì)算機(jī)視覺(jué)理論及智能理論的開(kāi)展,視頻監(jiān)控技術(shù)應(yīng)用變得越來(lái)越普及,無(wú)論是在城市街道兩側(cè)、銀行營(yíng)業(yè)廳、機(jī)場(chǎng)車站還是在學(xué)校校園都可看到監(jiān)控?cái)z像頭的身影。視頻監(jiān)控已逐漸融入人們的日常生活過(guò)程中,特別為人們生命財(cái)產(chǎn)平安提供了一種有效的平安保障。通常視頻監(jiān)控技術(shù)常用于平安指數(shù)較高場(chǎng)所,能夠?qū)崿F(xiàn)無(wú)人值班情況利用監(jiān)視監(jiān)控系統(tǒng)獲得重要地點(diǎn)平安信息,這對(duì)于降低犯罪率及犯罪證據(jù)獲得有十分重要意義,實(shí)踐說(shuō)明視頻監(jiān)控技術(shù)逐漸普以及為公安司法系統(tǒng)快速偵破各種形式案件起到重大作用;常見(jiàn)于監(jiān)控系統(tǒng)常用于公路等場(chǎng)合實(shí)現(xiàn)車速以及車流量的檢查,通過(guò)建立城市道路檢測(cè)網(wǎng)絡(luò)實(shí)現(xiàn)交通的智能疏導(dǎo)和意外事故檢查等功能,為城市交通的平安運(yùn)行保駕護(hù)航。視頻監(jiān)控技術(shù)先后開(kāi)展先后經(jīng)過(guò)模擬視頻監(jiān)控、數(shù)字視頻監(jiān)控、智能視頻監(jiān)控三個(gè)重要階段。第一代視頻監(jiān)控系統(tǒng)設(shè)備采用模擬攝像頭收集圖像信息,利用同軸電纜傳輸,由處于不同地方攝像機(jī)采集圖像后,分別通過(guò)多路電纜輸送到監(jiān)控室內(nèi),根據(jù)先后順序通過(guò)在顯示器上交替顯示,監(jiān)控人員必須時(shí)刻觀看監(jiān)視器,按照人工判斷是否會(huì)出現(xiàn)異常事件的方法,因此消耗了較大的人力,因?yàn)殚L(zhǎng)時(shí)間人工監(jiān)視容易產(chǎn)生視覺(jué)疲勞,很難保證判斷的準(zhǔn)備率。受到電纜制造技術(shù)限制,傳輸距離很短,又因?yàn)槟M信號(hào)傳輸通常要求帶寬較大,所以導(dǎo)致在帶寬分配靈活性上變得較差。同時(shí)還存在采集到的視頻圖像難以保存等缺點(diǎn)。有關(guān)數(shù)據(jù)統(tǒng)計(jì),英國(guó)目前攝像機(jī)總數(shù)到達(dá)了500多萬(wàn)個(gè),按照有關(guān)數(shù)據(jù)計(jì)算顯示:在倫敦居住的居民平均每個(gè)人每天將要被攝像機(jī)拍攝300次。然而目前視頻監(jiān)控大局部都是由人來(lái)完成,攝像機(jī)增加后,既沒(méi)有足夠的屏幕供顯示觀看,也不可能安排足夠的人員24小時(shí)盯著屏幕看,這為居民人身財(cái)產(chǎn)帶來(lái)很大的平安隱患,于是公安系統(tǒng)2004年在全國(guó)范圍內(nèi)確定了22城市作為首示范城市,2005年先后確定中了西部地區(qū)多個(gè)城市以及江蘇、浙江、山東、廣東四省等23個(gè)城市作為第二批示范城市,至到2023年全國(guó)范圍內(nèi)示范城市到達(dá)180個(gè),示范建設(shè)為視頻監(jiān)控技術(shù)開(kāi)展及快速普及提供有力條件?,F(xiàn)在大約400萬(wàn)個(gè)監(jiān)控?cái)z系統(tǒng)用于城市道路監(jiān)控與報(bào)警系統(tǒng),國(guó)內(nèi)已建有130多萬(wàn)不同級(jí)別安防系統(tǒng),每年增加各類安防系統(tǒng)超過(guò)了30萬(wàn)個(gè),其中銀行金融方面所就有5萬(wàn)多個(gè),車輛及車道檢測(cè)系統(tǒng)超過(guò)2萬(wàn)多個(gè);2023北京奧運(yùn)會(huì)期間,我國(guó)己完整開(kāi)發(fā)出一套"隨著視頻監(jiān)控規(guī)模逐漸擴(kuò)大,通過(guò)安保人員進(jìn)行人工實(shí)時(shí)監(jiān)控所暴露出來(lái)的局限性越發(fā)突出,經(jīng)過(guò)30多年開(kāi)展,視頻監(jiān)控系統(tǒng)盡管在功能及性能上得到很大程度增強(qiáng),但是很多地方還具有一定局限性:(l)人類本性的缺點(diǎn)大多數(shù)情況下,人類并不是值得一位完全信用的觀察者,不僅在視頻觀看還是視頻回放的情況下,因?yàn)槿祟惐旧砉逃腥秉c(diǎn),常常使我們發(fā)覺(jué)不到威脅存在,從而時(shí)常會(huì)導(dǎo)致漏報(bào)現(xiàn)象出現(xiàn)。(2)監(jiān)控器上視頻停留時(shí)間過(guò)短大多情況下,除了一些特殊要求的的監(jiān)控系統(tǒng)外,視頻監(jiān)控系統(tǒng)會(huì)絕大多數(shù)不會(huì)按照1:1的比例進(jìn)行攝像機(jī)配置監(jiān)視器配置,即很多視頻監(jiān)控系的各個(gè)監(jiān)控點(diǎn)不能時(shí)刻處在監(jiān)控者的監(jiān)視范圍內(nèi)。(3)誤報(bào)及漏報(bào)問(wèn)題存在誤報(bào)和漏報(bào)為視頻監(jiān)視系統(tǒng)中最常出現(xiàn)的兩大問(wèn)題,誤報(bào)指主要是將監(jiān)控點(diǎn)中平安動(dòng)作誤認(rèn)為具有威脅的活動(dòng),進(jìn)而產(chǎn)生錯(cuò)誤報(bào)警,漏報(bào)那么反之。(4)對(duì)視頻數(shù)據(jù)處理困難較大隨著現(xiàn)在車輛增減,交通事故發(fā)生次數(shù)也與日劇增,經(jīng)常被要求交通找出與肇事者有關(guān)錄像視頻資料,從而進(jìn)一步確定事故責(zé)任及評(píng)估該事件存在的平安威脅,傳統(tǒng)視頻監(jiān)控系統(tǒng)缺乏智能分析技術(shù),大量錄像視頻數(shù)據(jù)不能按照一定分別標(biāo)準(zhǔn)進(jìn)行有效的分類存儲(chǔ),面對(duì)海量視頻數(shù)據(jù)進(jìn)行分析時(shí),使交通工作人員的工作量變得極其很大且耗時(shí),很多情況下還不能獲得有效相關(guān)信息,而且還會(huì)出現(xiàn)誤判誤報(bào)等情況,使數(shù)據(jù)分析困難進(jìn)一步加大,從而給交通或警察人員處理交通時(shí)間帶很大的困難。(5)響應(yīng)周期長(zhǎng)視頻監(jiān)控系統(tǒng)時(shí)常由監(jiān)控人員對(duì)存在平安威脅作出響應(yīng)和處理,對(duì)響應(yīng)時(shí)間要求低的情況來(lái)說(shuō)根本能夠滿足。但絕大情況下由于平安系統(tǒng)的需要多個(gè)功能局部,聯(lián)合配合處理時(shí),這就要求監(jiān)控系統(tǒng)的響應(yīng)速度較快,這和用戶的身或財(cái)產(chǎn)的損失情況密切相關(guān)。現(xiàn)在的視頻監(jiān)控系統(tǒng)向著數(shù)字化、智能化和網(wǎng)絡(luò)化的方向開(kāi)展。利用圖像壓縮手段等數(shù)字化技術(shù),能夠進(jìn)一步改善信息量及帶寬問(wèn)題,借助于計(jì)算機(jī)視覺(jué)技術(shù)實(shí)現(xiàn)視頻的智能監(jiān)控,進(jìn)而實(shí)現(xiàn)目標(biāo)識(shí)別、報(bào)警等根本功能。數(shù)字化技術(shù)增強(qiáng)了抗干擾能力,傳輸段的問(wèn)題且?guī)捿^小,采用視頻智能技術(shù),實(shí)現(xiàn)視頻自動(dòng)監(jiān)控,很大限度的節(jié)約人力物力。數(shù)字化后的視頻圖像易于保存,可將視頻圖像數(shù)據(jù)建立數(shù)據(jù)庫(kù)對(duì)以后檢索、查閱提供方便。計(jì)算機(jī)網(wǎng)絡(luò)和便攜式網(wǎng)絡(luò)終端廣泛應(yīng)用,使遠(yuǎn)程監(jiān)控逐漸成為現(xiàn)實(shí)。智能視頻監(jiān)重要作用之一為視頻圖像處理和分析程序,其中計(jì)算機(jī)視覺(jué)技術(shù)在其擔(dān)任著重要角色。車輛檢測(cè)識(shí)別技術(shù)對(duì)已有的車輛檢測(cè)技術(shù)進(jìn)行介紹半個(gè)世界以來(lái)視頻車輛檢測(cè)技術(shù)的研究,無(wú)論在理論及實(shí)踐方面都取得豐碩成果,目前在視頻車輛檢測(cè)技術(shù)中核心技術(shù)為,圖像處理。即為得到圖像分析準(zhǔn)確結(jié)果,檢測(cè)算法為關(guān)鍵環(huán)節(jié)。所以,如何設(shè)計(jì)交通流檢測(cè)算法是需要解決視屏車輛檢測(cè)中主要問(wèn)題方式之一。通常分為:知識(shí)型、運(yùn)動(dòng)型、立體視覺(jué)型和像素強(qiáng)度型4類。(1)知識(shí)型。目的為檢測(cè)車輛的形狀、顏色、對(duì)稱性等常識(shí)信息。(2)運(yùn)動(dòng)型。主要借助于序列圖像之間大量信息,主流方法為:光流法和運(yùn)動(dòng)能量法。(3)立體視覺(jué)。借助于兩個(gè)或多個(gè)攝像機(jī)對(duì)同一景物從不同位置成像獲得立體像對(duì),通過(guò)各種算法匹配出相應(yīng)像點(diǎn),從而恢復(fù)深度(距離)信息。(4)基于像素強(qiáng)度的方法直接檢測(cè)幀間變化,有時(shí)間差分法和背景差分法。通常視頻車輛檢測(cè)技術(shù)分為兩大類:基于虛擬傳感器(虛擬點(diǎn)、虛擬線、虛擬線圈)的非模型交通信息檢測(cè)技術(shù)及基于目標(biāo)提取和模型跟蹤交通信息檢測(cè)技術(shù)。(1)非模型交通信息檢測(cè)技術(shù)1982年,Takaba等提出以虛擬點(diǎn)為處理單元的交通參數(shù)提取方法,為交通參數(shù)的視頻檢測(cè)奠定重要根底。非模型交通信息檢測(cè)技術(shù)能夠檢測(cè)指定區(qū)內(nèi)移動(dòng)像素群,優(yōu)點(diǎn)之處不需要理解像素群具體含義。主要工作原理為車道上設(shè)置一些虛擬傳感器,當(dāng)車輛經(jīng)過(guò)傳感器時(shí),引起圖像中局部區(qū)域內(nèi)容的變化,處理該變化信號(hào),可以提取所需信息。(2)基于跟蹤交通信息檢測(cè)技術(shù)該類技術(shù)有如下優(yōu)勢(shì)不僅能夠?qū)崿F(xiàn)非模型檢測(cè)系統(tǒng)功能,還可以提取諸如車輛形狀、屬性等信息。該技術(shù)目前的研究主要針對(duì)于多運(yùn)動(dòng)目標(biāo)的檢測(cè)方面,BenjaminCoifmana等提出一種基于特征跟蹤的交通參數(shù)提取方法,該方法以相機(jī)校正為根底,通過(guò)特征跟蹤提取出車流量、車速及車流密度等參數(shù)。Young-KeeJung等提出利用背景差分的視頻分割方法提取出運(yùn)動(dòng)車輛,然后通過(guò)基于Kalman濾波跟蹤運(yùn)動(dòng)車輛,獲取車流量和車速等參數(shù)。Daniel等對(duì)交通參數(shù)提取問(wèn)題進(jìn)行了研究,并于2000年提出一種先利用邊緣提取,獲取差分圖像中運(yùn)動(dòng)車輛的約束框,進(jìn)而跟蹤車輛,獲取車長(zhǎng)和平均車速的方法。SurendraGupte等長(zhǎng)期致力于交通圖像處理的研究。車輛識(shí)別技術(shù)進(jìn)行介紹目前車輛識(shí)別方法很多,主要圖像識(shí)別及雷達(dá)檢測(cè)兩種主要方法,由于現(xiàn)在圖像識(shí)別車輛精度較低,還不能準(zhǔn)確地識(shí)別出大卡車和小轎車。Tan等[1]提出一種無(wú)須進(jìn)行顯式特征符號(hào)提取與匹配的車輛識(shí)別方法,直接根據(jù)圖像梯度數(shù)據(jù)來(lái)確定目標(biāo)車輛尋找圖像中準(zhǔn)備位置,缺點(diǎn)之處為提前獲取交通場(chǎng)景中的先驗(yàn)知識(shí),且基于灰度的相關(guān)匹配算法對(duì)場(chǎng)景類型的適應(yīng)能力不強(qiáng),這直接限制了該算法的廣泛適用性。vanLeuven等[2]利用圖像序列跟蹤車輛,將圖像中的模型與每個(gè)觀測(cè)到的車輛進(jìn)行匹配,通過(guò)Kalman濾波器控制模型的位和比例,依據(jù)多假設(shè)策略來(lái)過(guò)濾跟模型具有相似局部特征的對(duì)象,而現(xiàn)實(shí)中車輛圖像模式有多樣性,有時(shí)會(huì)出現(xiàn)圖像畸變,增加了圖像匹配的復(fù)雜性。車輛識(shí)別本身就存在一定難度,要對(duì)車型再行細(xì)分必然使車輛識(shí)別更加困難、復(fù)雜。而車輛前方盲區(qū)及ROI[3]區(qū)域〔駕駛員感興趣區(qū)域〕內(nèi)不同類型車輛對(duì)駕駛員駕駛行為影響不同,因此,識(shí)別出前前方車輛且對(duì)被識(shí)別車輛進(jìn)行大小檢測(cè),準(zhǔn)確確定前前方車輛的位置及大小最為重要。國(guó)內(nèi)外車輛檢測(cè)識(shí)別的研究現(xiàn)狀介紹計(jì)算機(jī)視覺(jué)及圖像處理技術(shù)不斷改良,使視頻在智能交通系統(tǒng)應(yīng)用成為可能。國(guó)外對(duì)視頻檢測(cè)技術(shù)從上世紀(jì)70年代視頻車輛檢測(cè)技術(shù)的開(kāi)始研究,并在理論和實(shí)踐方面取得很大研究成果,經(jīng)過(guò)幾十年的開(kāi)展逐漸商業(yè)化。1978年美國(guó)JPT(加州帕薩迪納市的噴氣推進(jìn)實(shí)驗(yàn)室)首先提出運(yùn)用機(jī)器視覺(jué)來(lái)進(jìn)行車輛的檢測(cè)[4],它是傳統(tǒng)檢測(cè)方法的一種可行的替代方案。后來(lái)ISS公司(ImageSensingSystem,INC)在1987年研制為第一代,驗(yàn)證了交通領(lǐng)域中應(yīng)用視頻檢測(cè)技的可行性。NEWCAST大學(xué)的RourkeA,BellMGH和運(yùn)輸工作研究組(TORG)提出基于圖像中的車輛的多窗口技術(shù)研究。后來(lái)對(duì)濾波器到沿圖形的邊界線擴(kuò)展得到圖形檢測(cè)器,之后車輛檢測(cè)相當(dāng)于檢測(cè)平行四邊形,在車輛停車場(chǎng)的圖像檢測(cè)中結(jié)果ChoiandYang[5]使用基于均值偏移的聚類算法提取具有對(duì)稱特性的車輛候選塊,用塊的幾何和輻射度特征對(duì)每個(gè)候選塊進(jìn)行分類,Zheng[6]用多形態(tài)預(yù)處理得到候選車輛,這個(gè)過(guò)程用神經(jīng)網(wǎng)絡(luò)進(jìn)行分類,這樣的兩步法系統(tǒng)的分割階段會(huì)產(chǎn)生誤差,ZhaoandNevatia[7]將車輛檢測(cè)視為一個(gè)三維目標(biāo)識(shí)別問(wèn)題,他們利用人類知識(shí)構(gòu)建典型車輛的的幾何模型。然而,效率來(lái)說(shuō),由于需要大量的人為建模,這個(gè)算法不容易檢測(cè)其他目標(biāo)。Hinz[8]andSchlosseretal[9]應(yīng)用三維模型構(gòu)建車輛幾何模型進(jìn)行車輛檢測(cè)和計(jì)數(shù)。AniruddhaKembhavi[10]等提出基于偏最小二乘法在車輛檢測(cè)應(yīng)用研究。東南大學(xué)的肖旺新[11]等基于小波變換的多尺度自適應(yīng)閉值圖像邊緣檢測(cè)的新方法應(yīng)用于交通圖像邊緣檢測(cè)。車輛檢測(cè)及識(shí)別是基于各種圖像處理算法,目前的車輛檢測(cè)方法主要有地感線圈車輛檢測(cè)法、波頻檢測(cè)法、智能視頻檢測(cè)法等。地感線圈檢測(cè)法是比擬傳統(tǒng)的車輛檢測(cè)方法[12]。其原理是電磁感應(yīng)的原理,而利用此種方法制成的車輛檢測(cè)器為線圈檢測(cè)器,它通常在同一車道的道路路基下埋設(shè)環(huán)形線圈,并讓線圈通過(guò)一定的工作電流,使其作為傳感器使用,當(dāng)車輛通過(guò)此線圈或停在上面時(shí),車輛自身的鐵質(zhì)就會(huì)使線圈里面的磁通改變,從而導(dǎo)致線圈回路的電感量的改變,檢測(cè)器將檢測(cè)得到的電感量的變化作為判斷正在通行的車輛狀態(tài)的依據(jù)。而不同車型本身的鐵質(zhì)分布不同,導(dǎo)致提取的車輛特征不同,所以采用模式識(shí)別的方法對(duì)特征[13]進(jìn)行識(shí)別,從而判決出通過(guò)線圈的車輛類型。這種方法的優(yōu)點(diǎn)是靈敏度和識(shí)別準(zhǔn)確率都很高,且投入少,易于掌握。是其剖路施工量較大、后期維護(hù)難度也大。且由于地埋,易受路面環(huán)境等因素影響,而且入線圈的路面容易受損,尤其是在十字路口的路面。波頻檢測(cè)方法用微波[14]、紅外線[15]或超聲波[16]裝置對(duì)車輛發(fā)出電磁波,并將感應(yīng)信息返回給裝置進(jìn)行識(shí)別分析的一種檢測(cè)方法。這種方法可以用在城市道路的交通監(jiān)控中。其優(yōu)點(diǎn)是受氣候溫度影響較小,已在我國(guó)東北地區(qū)成為主流應(yīng)用,在深圳等大型城市也因?yàn)榧軜?gòu)較為簡(jiǎn)便有占有率上升的趨勢(shì)。靈敏度和捕獲率不及地感線圈檢測(cè)法,且因?yàn)榛谖⒉夹g(shù),故可能存在一定錯(cuò)誤率。智能視頻檢測(cè)[17]方法是直接集成在攝像機(jī)內(nèi)部或者構(gòu)建在前端工控機(jī)內(nèi)的一個(gè)功能強(qiáng)大的綜合事件檢測(cè)“軟件〞,對(duì)道路視頻信息進(jìn)行實(shí)時(shí)識(shí)別檢測(cè)[18],一旦在分析過(guò)程中發(fā)現(xiàn)“車輛〞,便進(jìn)行視頻跟蹤,當(dāng)視頻檢測(cè)到相應(yīng)的車輛進(jìn)入到最正確的拍照范圍時(shí),便觸發(fā)相應(yīng)抓拍及后續(xù)的車型識(shí)別行為,其優(yōu)點(diǎn)是硬件易于安裝,維護(hù)方便,不會(huì)破壞路面,比擬靈活,能夠做到實(shí)檢測(cè)及更新。目前視頻中的車輛檢測(cè)方法[19]已經(jīng)在交通監(jiān)控管理系統(tǒng)中得到了廣泛的應(yīng)用,而且隨著物聯(lián)網(wǎng)技術(shù)的應(yīng)用及圖像處理、特征提取、模式識(shí)別等技術(shù)的不斷完善,智能視頻交通監(jiān)控的應(yīng)用前景將更加廣闊。目前,車輛檢測(cè)的根本方法是通過(guò)檢測(cè)視頻中明顯運(yùn)動(dòng)的目標(biāo)檢測(cè)車輛。其中包括:背景相減法[20],幀差法[21],光流場(chǎng)法[22],高斯混合模型法[23]等等。但是這些方法中,背景的消除是一大難點(diǎn),而且受到攝像機(jī)的抖動(dòng)、光照變化、陰等的影響很大。后來(lái),L.Anan[24]、L.Li[25]、NafiUrRashid[26,27]等人提出了基于虛擬檢測(cè)線[28,29](VirtualDetectionLine,VDL)的方法。這種方法的優(yōu)點(diǎn)是不用考慮背景的影響,在每幀圖的固定位置設(shè)置一條虛擬線,而提取每一幀在這條虛擬線上的信息,然后按照時(shí)間順序排列來(lái)就形成了一幅關(guān)于整個(gè)視頻的時(shí)空?qǐng)D〔Time-SpatialImage,TSI〕。時(shí)空?qǐng)D中每一個(gè)圖像塊表示一輛車的縮減信息。通過(guò)計(jì)算圖形塊在時(shí)空?qǐng)D中的位置可得出要進(jìn)行特征提取的關(guān)鍵幀。本文的主要研究工作本課題致力于研究在海量的標(biāo)清和高清視頻資料中,運(yùn)用動(dòng)目標(biāo)檢測(cè)跟蹤算法,在低清晰度的情況下,較為準(zhǔn)確的對(duì)特定車輛〔面包車、渣土車〕進(jìn)行檢測(cè),面包車輪廓HOG特征提取,同時(shí)利用基于SVM等分類識(shí)別模型根底上,進(jìn)行單一顏色面包車識(shí)別。目的是開(kāi)發(fā)出一套低清晰度情況下特定車輛〔面包車、渣土車〕的實(shí)時(shí)檢測(cè)識(shí)別算法,為公安監(jiān)控實(shí)戰(zhàn)中對(duì)這類車倆的排查監(jiān)控和標(biāo)準(zhǔn)管理,提供智能化自動(dòng)化的解決方案。本文主要研究?jī)?nèi)容如下:1.對(duì)基于視頻的車輛識(shí)別算法的研究學(xué)習(xí)。通過(guò)對(duì)HAAR-LINK、邊緣檢測(cè)法和基于梯度方向直方圖〔HOG〕等基于視頻的車輛算法的學(xué)習(xí),比擬不同算法優(yōu)點(diǎn)和適用領(lǐng)域。2.通過(guò)對(duì)基于梯度方向直方圖〔HOG〕算法的深入研究,闡述本課題利用該算法并結(jié)合顏色根底上,實(shí)現(xiàn)對(duì)車輛輪廓進(jìn)行HOG特征提取,實(shí)現(xiàn)對(duì)某類特定車輛、單一顏色識(shí)別及管理。3.利用基于梯度方向直方圖〔HOG〕算法,實(shí)現(xiàn)對(duì)視頻中的面包車進(jìn)行識(shí)別,經(jīng)過(guò)實(shí)驗(yàn)驗(yàn)證,由實(shí)驗(yàn)仿真結(jié)果說(shuō)明該基于智能視頻的車輛識(shí)別系統(tǒng)在實(shí)際管理中有效性。論文的組織結(jié)構(gòu)本論文主要內(nèi)容分為五個(gè)章:第1章論述本課題的研究背景及意義,介紹智能視頻車輛檢測(cè)和識(shí)別算法在國(guó)內(nèi)外的開(kāi)展及研究現(xiàn)狀,以及本文所要研究的主要內(nèi)容。第2章,重點(diǎn)介紹基于HOG特征的特定車輛檢測(cè),包括車輛檢測(cè)的主要方法:除對(duì)常用方法進(jìn)行一般性介紹外,重點(diǎn)分析面包車的主要特點(diǎn)及檢測(cè)方案,其中包含輪廓特征明顯檢測(cè)方案,基于HOG特征的面包車檢測(cè)等。第3章著重分SVM的面包車分類識(shí)別進(jìn)行分析,介紹了車輛識(shí)別常用的分類器,重點(diǎn)分析基于SVM的面包車分類器應(yīng)用,主要包括:SVM分類器原理、車輛庫(kù)的建立以及SVM分類器的訓(xùn)練,最后利用基于SVM的面包車分類識(shí)別進(jìn)行實(shí)驗(yàn)分析,給出比擬結(jié)果。第4章建立顏色和HOG的面包車檢測(cè)識(shí)別系統(tǒng),首先分析了面包車的顏色特征,即為白色單一性,然后利用基于顏色區(qū)分輪廓類似的車輛〔SUV等〕、顏色特征的檢測(cè)識(shí)別預(yù)處理等根底上,最后通過(guò)提取其主顏色或顏色分布,并判斷是否符合面包車的主顏色或顏色分別,從而通過(guò)實(shí)驗(yàn)進(jìn)一步驗(yàn)證該算法的有效性。第5章最后對(duì)論文進(jìn)行總結(jié),說(shuō)明對(duì)本文算法缺乏之處,以及本文你研究工作展望趨勢(shì)?;贖OG特征的特定車輛檢測(cè)車輛檢測(cè)的主要方法利用檢測(cè)算法檢測(cè)出運(yùn)動(dòng)車輛的運(yùn)動(dòng)范圍、輪廓等數(shù)據(jù)信息。車輛識(shí)別主要是通過(guò)對(duì)輪廓等信息進(jìn)一步提取特征分析,識(shí)別出運(yùn)動(dòng)車輛的具體位置以及車輛本身相關(guān)信息。目前對(duì)運(yùn)動(dòng)車輛檢測(cè)和識(shí)別常用方法介紹如下:(1)背景差分法背景差分法是指采用當(dāng)前與背景圖像進(jìn)行相減方式來(lái)確定運(yùn)動(dòng)物體的檢測(cè)方法,為視頻檢測(cè)常用檢測(cè)方法。其中主要特點(diǎn):圖像像素差,假設(shè)差值大于閾值那么說(shuō)明該點(diǎn)是運(yùn)動(dòng)物體上的像素點(diǎn),并標(biāo)識(shí)出來(lái);假設(shè)差值閾值那么說(shuō)明是背景像素?zé)o需標(biāo)識(shí)。關(guān)鍵之處如何有效性提取背景圖像。目前無(wú)運(yùn)動(dòng)物體的情況下拍攝一幅只含有背景下進(jìn)行有效提取,該方法只適用于背景不變化或者變化甚微且無(wú)外界干擾很小情況下,應(yīng)用范圍小。該檢測(cè)算法的實(shí)時(shí)性差,且對(duì)急劇變化的外界干擾因素非常敏感。(2)光流法光流是指運(yùn)動(dòng)物體在觀測(cè)成像面上像素運(yùn)動(dòng)的瞬時(shí)速度。這種運(yùn)動(dòng)模式是指一個(gè)物體的外表和邊緣在一個(gè)視角條件下由攝像機(jī)和背景形成明顯的移動(dòng)。假設(shè)沒(méi)有運(yùn)動(dòng)物體經(jīng)過(guò),整個(gè)視場(chǎng)中的光流變化是均勻流動(dòng)的,假設(shè)視場(chǎng)中存在運(yùn)動(dòng)物體,對(duì)速度光流場(chǎng)與及周圍的光流產(chǎn)生影響變化,可檢測(cè)出運(yùn)動(dòng)物體大量信息。(3)幀差法幀差法是指將待測(cè)圖像與前一幅圖像相減,當(dāng)灰度值大于設(shè)定的閾值時(shí)那么認(rèn)為該點(diǎn)運(yùn)動(dòng)體,假設(shè)小于閾值那么認(rèn)為是背景。幀差法檢測(cè)關(guān)鍵之處是如何選幀間數(shù)量。假設(shè)選取的值較大、車速過(guò)快,幀差后的結(jié)果將大于運(yùn)動(dòng)區(qū)域,會(huì)帶來(lái)很多問(wèn)題。假設(shè)選取的值較小、車速較慢,那么兩幀之間幾乎沒(méi)有位移,相減之后可能無(wú)法檢測(cè)出運(yùn)動(dòng)物體,這就是不能檢測(cè)出靜止物體或者接近于靜止物體原因所在。以上方法都存在缺乏之處,對(duì)圖像進(jìn)行分類時(shí),如何選擇適宜的方法對(duì)顏色、紋理、形狀等特征進(jìn)行訓(xùn)練,直接提取這些特征將會(huì)產(chǎn)生大量的高維數(shù)據(jù),從這些高維的特征中如何選取出最重要的特征具有十分重要意義。常見(jiàn)的基于視頻的車輛識(shí)別技術(shù),主要有以下幾種:1.梯度方向直方圖HOG最早由Dalal于2005年提出,最初被用于行人檢測(cè)中,取得了較好的效果。根據(jù)圖像的形狀、外觀等特征信息,能夠很好描述梯度或邊緣的方向密度分布原理,能夠快速隨外界光照變化和目標(biāo)旋轉(zhuǎn)而變化。主要特征為:HOG主要先將圖像劃分為小細(xì)胞單元〔稱為cell〕,再計(jì)算所有細(xì)胞單元中各像素點(diǎn)的梯度或邊緣的方向直方圖。將假設(shè)干個(gè)細(xì)胞單元組成一個(gè)區(qū)間〔稱為block〕,然后在這些區(qū)間內(nèi)對(duì)各細(xì)胞單元的梯度進(jìn)行歸一化,最后取得梯度方向向量。圖像的梯度方向向量數(shù)由圖像大小、cell大小、每個(gè)cell所取梯度維數(shù)等因素所決定。其計(jì)算方法為:〔2.1〕其中,——表示維數(shù);——表示block大??;——表示cell大??;——表示block移動(dòng)步長(zhǎng);W、h——分別表示圖像寬與高。因此可以在應(yīng)用中根據(jù)實(shí)際情況調(diào)整片尺寸、cell維數(shù)等參數(shù),以降低特征向量維數(shù)。HOG特征為基于梯度方向的分布直方圖具有優(yōu)勢(shì),既可描述運(yùn)動(dòng)車輛中輪廓特征,又會(huì)減弱光照及小量的偏移不敏感現(xiàn)象。2.邊緣檢測(cè)法邊緣檢測(cè)方法是在不同的光線條件下利用車體的不同部件、顏色等提供的邊緣信息有效的提取車輛的邊緣,從而進(jìn)行靜止和運(yùn)動(dòng)車輛的檢測(cè)。相對(duì)于背景消減法,由于車輛的外表、形狀及顏色不同,邊緣檢測(cè)法所能提供的信息相當(dāng)顯著。即便車輛與路面的顏色相同,因?yàn)檐囕v要比地面反射更多的光線所以車輛仍能被檢測(cè)出來(lái)。在邊緣檢測(cè)算法中有很多的經(jīng)典算子,但是每種算子都存在不一樣的缺陷,有的抗噪聲能力強(qiáng),但檢測(cè)精度達(dá)不到要求,有的正好相反,還有就是能夠很好的實(shí)現(xiàn)抗噪聲能力弱,檢測(cè)精度也可以滿足需求,但是算法復(fù)雜運(yùn)行時(shí)間長(zhǎng),可見(jiàn),任何單一的邊緣檢測(cè)算法都有一定的缺陷在實(shí)現(xiàn)某一特定目標(biāo)的檢測(cè)時(shí)。3.Harr-like矩形特征算法最早的Haar-like矩形特征庫(kù)是PapageorgiouC.等提出,ViolaP.等的快速人臉識(shí)別系統(tǒng)采用了3種類型5種形式的矩形特征,分別為:2矩形特征、3矩形特征和4矩形特征。其特征值的定義為黑色矩形內(nèi)所有像素值的和減去白色矩形內(nèi)所有像素值的和。LienhartR.等對(duì)Haar-like矩形特征庫(kù)作了進(jìn)一步擴(kuò)展,參加了旋轉(zhuǎn)45度角的矩形特征。擴(kuò)展后的特征大致分為4種類型:邊緣特征、線特征環(huán)、中心環(huán)繞特征、和對(duì)角線特征。Haar特征一共有4類,15種形式,其中包括4種形式的邊緣特征,8種形式的線性特征,2種形式的點(diǎn)特征和1種形式的對(duì)角線特征。每一種特征模板內(nèi)都有白色和黑色兩種矩形,計(jì)算白色矩形像素和,減去黑色矩形像素和,記作該特征模板的特征值。每一種特征模板都可以在垂直和水平方向各自縮放生成一個(gè)完整的特征集。對(duì)于每一種特征值,計(jì)算公式如下:〔2.2〕其中:N——表示矩形ri的個(gè)數(shù);——表示權(quán)重;——表示矩形ri的像素和。面包車的主要特點(diǎn)及檢測(cè)方案輪廓特征明顯特性1,車型Figure1Model’sdifferences圖1車型的區(qū)別如上圖所示,面包車為中大車型,在外形輪廓方面明顯區(qū)別于出租車及轎車等嬌小型的車輛。特性2,輪廓一致性Figure2Silhouetteconsistency圖2輪廓一致性由圖片及統(tǒng)計(jì)可知:盡管顏色與品牌相異,但是從外形輪廓具有統(tǒng)一的相識(shí)性。特征3,外表顏色Figure3Exteriorcolor圖3外表顏色由上圖可知,在我們生活中,常用面包車外形輪廓顏色大局部為白色或偏白色。檢測(cè)方案:HOG基于HOG特征的檢測(cè)算法主要由兩局部組成:HOG特征計(jì)算及提取。HOG特征計(jì)算步驟具體如下:1)輸入圖像:輸入圖像為樣本庫(kù)中的某一個(gè)樣本圖像或者是前面在檢測(cè)階段得到的某個(gè)RoIs。2)梯度計(jì)算:將采集視頻圖像按照[-101]和[-101]進(jìn)行濾波計(jì)算出該圖像的垂直梯度和水平梯度,最后求出梯度方向及梯度大小。3)將輸入圖像平局分成的小格,由幾個(gè)小格合組成一個(gè)小塊。4)方向通道確定:將0°~180°或者0°~360°均勻分成n個(gè)通道。5)直方圖獲?。航y(tǒng)計(jì)每個(gè)小格中中每個(gè)像素的梯度方向直方圖,取直方圖用步驟3中選取的n個(gè)方向通道最為橫坐標(biāo),直方圖的縱坐標(biāo)取某個(gè)方向通道的像素的梯度累加和。最終獲得一組向量。6)歸一化處理:以小塊為單位,利用向量進(jìn)行歸一化處理,目前常用的歸一化方法有以下3種:,,〔2.3〕其中,V——表示歸一化之前的特征向量;——表示它的k階范數(shù)(k=1,2);——表示一個(gè)很小的常數(shù)(它的值不會(huì)影響結(jié)果,目的是為了防止分母為0)。7)形成HOG特征:將經(jīng)過(guò)處理后所有的向量合理連接起來(lái),構(gòu)成組向量組,為HOG特征。HOG特征的提取思想HOG特征的提取思想:梯度方向直方圖(HOG)為基于圖像形狀邊緣提取算法,根本思想:優(yōu)點(diǎn)是對(duì)圖像相關(guān)梯度和邊緣位置的精確信息依賴性很小,可通過(guò)局部梯度大小和邊緣信息將圖像局部外觀和形狀進(jìn)行特征化。在HOG特征提取的過(guò)程中,以下一些參數(shù)對(duì)檢測(cè)的結(jié)果有很重要的影響:不同尺度的參數(shù)模板,梯度方向的選擇,重疊塊、單元格的大小及歸一化因子。HOG特征過(guò)程如下:為減小光照因素的影響,所以進(jìn)行圖像的顏色空間進(jìn)行歸一化;將檢測(cè)窗口劃分成大小相同的單元格(cell),在每個(gè)單元格中分別提取相應(yīng)的梯度直方圖,將相鄰的單元格組合成相互有重疊的塊(block),利用有效的重疊邊緣信息,進(jìn)行整塊的直方圖特征統(tǒng)計(jì),并進(jìn)行歸一化,最后對(duì)整個(gè)窗口收集所有塊的HOG特征,并以特征向量的形式來(lái)表示整個(gè)目標(biāo)窗口的HOG。該特征提取的全部流程如下圖:Figure4HOGfeatureextractionprocess圖4HOG特征提取流程基于HOG特征的面包車HOG特征提取實(shí)現(xiàn)根據(jù)上述HOG提取流程圖可知,其主要步驟如下:1.標(biāo)準(zhǔn)化gamma空間及顏色空間為減少外界因素對(duì)HOG特征的影響,首先圖像進(jìn)行標(biāo)準(zhǔn)化。在圖像的紋理強(qiáng)度中,因?yàn)榫植康谋韺悠毓夥瞰I(xiàn)的比重較大,所以這種壓縮處理方式能夠有效地降低圖像局部的陰影和光照等外界因素變化,通常先轉(zhuǎn)化為灰度圖。Gamma壓縮公式:〔2.4〕比方可以取Gamma=1/2。2.計(jì)算梯度計(jì)算圖像的一階梯度。求導(dǎo)操作不僅能夠捕獲輪廓,人影和一些紋理信息,還能進(jìn)一步弱化光照的影響。梯度大?。骸?.5〕梯度方向:〔2.6〕3.單元格梯度投影主要目的為局部圖像區(qū)域提供一個(gè)良好的編碼,能保持對(duì)圖像中運(yùn)動(dòng)車運(yùn)動(dòng)姿勢(shì)和外觀弱敏感性。先把圖像窗口分成假設(shè)干個(gè)小區(qū)域,稱這個(gè)區(qū)域被稱為“單元格〞。然后將每個(gè)單元格中所有象素的一維梯度直方圖累加到其中,最后按照根本的方向直方圖映射到特定角度上,構(gòu)成了最終的特征。4.塊內(nèi)歸一化梯度直方圖比照度進(jìn)行歸一化,能夠進(jìn)一步將對(duì)光照、陰影和邊緣進(jìn)行壓縮。通常每個(gè)單元格由多個(gè)不同的塊共享,歸一化根本原理是基于不同塊的,導(dǎo)致計(jì)算結(jié)果各不相同。因此,一個(gè)單元格的特征會(huì)以不同的結(jié)果形式出現(xiàn)在最后的向量中。我們將歸一化之后的塊描述符就稱之為HOG描述符。5.收集HOG特征最將所用將檢重疊的塊進(jìn)行HOG特征的收集,由計(jì)算出它們共同合成總的特征向量供輸入到分類進(jìn)一步處理。例如對(duì)于一個(gè)80*80的訓(xùn)練圖片,單元格=16*16像素,塊=4*4單元格塊,每次滑動(dòng)一個(gè)單元格為,那么特征維數(shù)=8*8*〔4*4*9〕=576維。為了方便給可以看出各種車輛HOG特征的差異,在此分別提取128*128車輛圖片的HOG特征進(jìn)行比照,如圖5所示:taxi’sHOGfeatureextraction(a)出租車的HOG特征提取〔b〕Jeep’sHOGfeatureextraction(b)Jeep車的HOG特征提取〔c〕Van’sHOGfeatureextraction(c)面包車的HOG特征提取Figure5HOGfeaturecomparisonofdifferentvehicles圖5不同車輛HOG特征比照如下圖,可以很明顯的看出,面包車輛的HOG特征與其他車輛的HOG特征的區(qū)別,因此將HOG特征作為面包車輛的識(shí)別特征是可行的。本章小結(jié)通過(guò)對(duì)各種車輛檢測(cè)算法的學(xué)習(xí)分析,最后選取HOG特征算法,作為面包車輛的特征進(jìn)行提取,為后續(xù)的識(shí)別做準(zhǔn)備。同時(shí)通過(guò)實(shí)驗(yàn)比擬分析可知,各種車輛的HOG特征存在差異性,所以將HOG算法運(yùn)用到車輛檢測(cè)是合理有效的?;赟VM的面包車分類識(shí)別識(shí)別〔分類〕主要任務(wù)就是對(duì)特征空間進(jìn)行一種合理的劃分。分類器就是用標(biāo)記為類別的決策區(qū)域表征特征空間,理想適宜且唯一的分類結(jié)果是,這些決策區(qū)域完全覆蓋整個(gè)特征空間且任意兩個(gè)決策區(qū)域互不相交,對(duì)特征矢量分類就是為其找到適宜的決策區(qū)域且不同屬于其他決策區(qū)域。運(yùn)用特征提取的方法對(duì)車輛存在的區(qū)域提取統(tǒng)計(jì)特征以構(gòu)造分類器,從而在車輛識(shí)別過(guò)程中應(yīng)用訓(xùn)練好的分類器實(shí)現(xiàn)對(duì)車輛和背景的分類識(shí)別。車輛識(shí)別常用的分類器介紹一般模式識(shí)別問(wèn)題可以描述如下:對(duì)某一類樣本的收集整理,并對(duì)收集到的樣本集合訓(xùn)練,很明顯此時(shí)訓(xùn)練樣本明確知道所屬類別的。將訓(xùn)練樣本按照如圖6(a)所示的訓(xùn)練過(guò)程進(jìn)行分類器的訓(xùn)練過(guò)程,就得出分類器的判決表示。然后將待測(cè)樣本按照經(jīng)過(guò)訓(xùn)練得到的分類器進(jìn)行分類識(shí)別,此過(guò)程如圖6(b)所示。(a)Trainingprocess〔a〕訓(xùn)練過(guò)程(b)Classificationprocess〔b〕分類識(shí)別過(guò)程Figure6Trainingandclassificationprocess圖6訓(xùn)練和分類識(shí)別過(guò)程現(xiàn)階段常用的分類器有人工神經(jīng)網(wǎng)絡(luò)、K-近鄰分類器、貝葉斯網(wǎng)絡(luò)、AdaBoost分類器和〔SupportVectorMachine〕SVM,文章就對(duì)這幾種方法進(jìn)行詳盡的介紹。人工神經(jīng)網(wǎng)絡(luò)人工神經(jīng)網(wǎng)絡(luò)〔ArtificalNeuralNetworks,ANN〕工作原理是基于考人腦的大腦神經(jīng)元網(wǎng)絡(luò)及神經(jīng)元決策原理根底上建立的,只是借鑒了人腦反射工作方式原理而不是人腦組織結(jié)構(gòu)真實(shí)模擬反響。因此換一種說(shuō)法就是人工神經(jīng)元模型是對(duì)生物神經(jīng)元模擬及抽象出來(lái)的數(shù)學(xué)描述,其模擬神經(jīng)元根本組成局部包括:的細(xì)胞體、樹(shù)突、軸突、突觸。如圖7所示:Figure7Artificialneuronmodel圖7人工神經(jīng)元模型它采用感知算法對(duì)決策區(qū)域進(jìn)行分類,在這種模型中,分類決策知識(shí)被隱式地存儲(chǔ)在連接的權(quán)值上,權(quán)值向量運(yùn)用迭代算法來(lái)確定,當(dāng)通過(guò)網(wǎng)絡(luò)的輸出判別為正確時(shí),權(quán)值向量保持不變,反之,當(dāng)輸出為錯(cuò)誤時(shí),權(quán)值向量做增加或降低的調(diào)整,因此這種算法也稱為獎(jiǎng)懲法。通常情況下,神經(jīng)網(wǎng)絡(luò)分類法由訓(xùn)練局部和測(cè)試局部組成,將樣本的特征項(xiàng)構(gòu)造輸入神經(jīng)元,特征項(xiàng)的數(shù)量即為該神經(jīng)網(wǎng)絡(luò)輸入神經(jīng)元的數(shù)量,至于隱含層數(shù)量和該層神經(jīng)元的數(shù)目要以實(shí)際情況而定。在訓(xùn)練局部需要通過(guò)對(duì)大量的訓(xùn)練樣本的訓(xùn)練,以便得到訓(xùn)練樣本輸入與輸出之間存在確實(shí)定關(guān)系,即在不斷的訓(xùn)練中通過(guò)迭代算法,調(diào)整過(guò)程中得到連接權(quán)值矩陣,從而得到最適宜的連接權(quán)值矩陣;測(cè)試局部那么是主要針對(duì)用戶輸入的待測(cè)樣本的特征得到相應(yīng)輸出值,即該樣本所屬類別。K-最近鄰分類器最近鄰分類方法以獨(dú)特簡(jiǎn)單的性質(zhì)優(yōu)點(diǎn)在目前模式識(shí)別及類別推理方面中仍占有一席之地。如今在各種人工智能的問(wèn)題上也廣泛運(yùn)用到最近鄰規(guī)那么,如模式識(shí)別,數(shù)據(jù)挖掘,后驗(yàn)概率的估計(jì),基于相似性的分類,計(jì)算機(jī)視覺(jué)和生物信息學(xué)等領(lǐng)域。最近鄰算法的開(kāi)展涵蓋多方面,不僅在算法提出創(chuàng)新、對(duì)理論深入研究分析,而且還有跟可視化的結(jié)合。K-最近鄰分類算法〔k-NearestNeighbour,KNN〕,從字意上的簡(jiǎn)單理解就是,在給定新樣本后,在訓(xùn)練樣本集中只尋找與該新樣本距離最近(最相似)的K個(gè)樣本,忽略其他相距較遠(yuǎn)的樣本,由這K個(gè)樣本所屬類別就可以確定新樣本所屬類別。具體說(shuō)就是:在N個(gè)己知訓(xùn)練樣本集中找出待測(cè)樣本x的k個(gè)近鄰,如圖8所示。設(shè)這N個(gè)己經(jīng)訓(xùn)練樣本中,來(lái)自ω1的樣本有Nl個(gè),來(lái)自ω2的樣本有N2個(gè),……,來(lái)自ωc的樣本有Nc個(gè),假設(shè)kl,k2,……,kc分別是k個(gè)近鄰中屬于ω1,ω2,……,ωc類的樣本數(shù),那么我們可以定義判別函數(shù)為,i=1,2,……,c。決策規(guī)那么為:假設(shè),那么決策。在N足夠大且貝葉斯理論誤差足夠小前提下,K-最近鄰分類算法和貝葉斯分類器的性能及其相當(dāng)。只有N取值足夠大條件下,新樣本x附近范圍內(nèi),含k個(gè)樣本數(shù)的超球面半徑(歐幾里德距離)都趨于無(wú)窮小時(shí),此時(shí)樣本空間認(rèn)為是致密填充的。當(dāng)x與k之間距離會(huì)非常小及k足夠大時(shí),可以用(假設(shè)是連續(xù)的)來(lái)表示為x附近超球面所以范圍內(nèi)條件概率。那么x附近超球面內(nèi)為最大條件概率相應(yīng)類大多數(shù)點(diǎn)。因此,K最近鄰分類器趨向于貝葉斯分類器,誠(chéng)然,所有這些都是漸進(jìn)于真值的。K-最近鄰分類算法在定類決策上,只利用了訓(xùn)練樣本空間的個(gè)數(shù)信息,而沒(méi)有利用其他距離信息等,即只與少量的鄰近的訓(xùn)練樣本有關(guān)。這種投票機(jī)制使得KNN有一個(gè)主要的缺乏:當(dāng)訓(xùn)練樣本不均衡時(shí),比方某些類的樣本容量很大,而只有少量的其余類樣本時(shí),在待測(cè)樣本的k個(gè)近鄰中非常有可能大容量類的樣本數(shù)量多于其它類樣本,從而導(dǎo)致誤分類的情況;另外,KNN只利用了訓(xùn)練樣本空間的個(gè)數(shù)信息,而忽略了其他距離信息等,從而使得識(shí)別率不高。Figure8KNNdecision-makingprocess圖8KNN的決策過(guò)程貝葉斯網(wǎng)絡(luò)貝葉斯網(wǎng)絡(luò)〔BayesianNetworks,BNs〕是近年來(lái)人工智能學(xué)科最活潑的領(lǐng)域之一。以有向圖來(lái)對(duì)事件間因果關(guān)系直觀表達(dá)方式。利用貝葉斯概率描述事件發(fā)生可能性的程度大小。貝葉斯網(wǎng)絡(luò)信息特征主要包括定量及定性兩方面:1〕定性方面通過(guò)條件信息獨(dú)立網(wǎng)絡(luò)結(jié)構(gòu)G相互連接,可用結(jié)構(gòu)點(diǎn)描述為某領(lǐng)域中具體量,結(jié)構(gòu)點(diǎn)連接方式〔有向弧〕表示變量間相關(guān)性大小來(lái)表達(dá)的;2〕定量方面是通過(guò)節(jié)點(diǎn)間及相關(guān)節(jié)點(diǎn)變量間條件概率及分布函數(shù)〔條件概率表〕來(lái)表達(dá)的。由此可見(jiàn)貝葉斯網(wǎng)絡(luò)通過(guò)統(tǒng)計(jì)節(jié)點(diǎn)參數(shù)以及結(jié)構(gòu)知識(shí)獲得,具有標(biāo)準(zhǔn)性、數(shù)字化優(yōu)點(diǎn)。實(shí)際應(yīng)用過(guò)程中需要假設(shè)屬性間條件為互補(bǔ)影響的,在此條件下貝葉斯分類器星形結(jié)構(gòu)可由如圖9所示。Figure9ThestarstructureofBayesianclassifier圖9貝葉斯分類器星形結(jié)構(gòu)其中Xi表示屬性結(jié)點(diǎn),C表示類結(jié)點(diǎn)。屬性之間沒(méi)有直接相連的邊,表示屬性之間條件獨(dú)立。貝葉斯分類主要特征:1〕貝葉斯分類是通過(guò)比擬對(duì)象概率值的方式確定屬于那一種對(duì)象類,因此對(duì)應(yīng)最大概率類就是該對(duì)象所屬類;2〕每個(gè)對(duì)象屬性都提供奉獻(xiàn)值,即所有對(duì)象屬性都參與分類;3〕貝葉斯分類對(duì)象的屬性形式?jīng)]有統(tǒng)一要求可為:離散的、連續(xù)的及混合的。主要目的提供最小化誤差的最優(yōu)解決方法來(lái)分類和預(yù)測(cè)。實(shí)際工程應(yīng)用中,貝葉斯分類主要依據(jù)某類分布概率來(lái)描述對(duì)象屬性所示不能直接被利用,實(shí)際當(dāng)中很多情況下都無(wú)法準(zhǔn)確求出證據(jù)的概率分布。因此通過(guò)對(duì)分類方法提出某種假來(lái)逼近貝葉斯定理使用條件。AdaBoost分類器AdaBoost算法具有能夠顯著改善子分類器預(yù)測(cè)精度,不需要先驗(yàn)知識(shí),理論扎實(shí)等優(yōu)點(diǎn)[30],一經(jīng)提出就受到不同領(lǐng)域研究人員的關(guān)注,在解決各行業(yè)應(yīng)用問(wèn)題中都獲得了極大的成功。在更好地了解Adaboost方法之前,先了解一下Boosting方法。對(duì)一個(gè)是與否的問(wèn)題作出判斷,隨機(jī)猜想有50%的正確率,如果一種方法能夠使準(zhǔn)確率稍微高于50%的正確率,那么可以稱得到這個(gè)方法的過(guò)程為弱學(xué)習(xí);如果一種方法能夠使準(zhǔn)確率顯著提高,那么稱獲取該方法的過(guò)程為強(qiáng)學(xué)習(xí)。1994年,Kearns和Valiant證明,在Valiant的PAC〔ProbablyApproximatelyCorrect〕模型中,只要數(shù)據(jù)足夠多,就完全有可能將弱學(xué)習(xí)算法通過(guò)不斷地學(xué)習(xí)的方式提高到任意精度,從而獲得強(qiáng)學(xué)習(xí)算法。實(shí)際上,1990年,Schapire就首先構(gòu)造出一種多項(xiàng)式級(jí)的算法,將弱學(xué)習(xí)算法提升為強(qiáng)學(xué)習(xí)算法,就是最初的Boosting算法。Boosting意思為提升、加強(qiáng),現(xiàn)在一般指將弱學(xué)習(xí)提升為強(qiáng)學(xué)習(xí)的一類算法。1993年,Drucker和Schapire首次提出將神經(jīng)網(wǎng)絡(luò)作為弱學(xué)習(xí)器,利用Boosting算法解決實(shí)際問(wèn)題。1994年Kearns和Valiant[31證明將弱學(xué)習(xí)算法通過(guò)集成學(xué)習(xí)的方式可以提高到任意精度;雖然Boosting方法在1990年已經(jīng)提出,但其理論的真正成熟,也是在1994年之后才開(kāi)始的。1995年,F(xiàn)reund提出了一種效率更高的Boosting算法。1995年,F(xiàn)reund和Schapire提出了Adaboost算法,這是對(duì)Boosting算法理論一次質(zhì)的飛躍。Adaboost是Boosting家族的代表算法之一[31],全稱為AdaptiveBoosting。主要依據(jù)弱學(xué)習(xí)反響對(duì)假設(shè)錯(cuò)誤率相應(yīng)調(diào)整,因此Adaboost主要特點(diǎn):不對(duì)錯(cuò)誤率下限有什么依賴,對(duì)任何弱學(xué)習(xí)器先驗(yàn)知識(shí)都沒(méi)要求,而具有和Boosting算法具有同樣好的效率,為此得到廣泛應(yīng)用。Adaboost是一種由級(jí)聯(lián)分類模型構(gòu)成的分類器。級(jí)聯(lián)分類模型如圖10表示,其主要特征;由多個(gè)弱分類器組成且每一級(jí)結(jié)構(gòu)復(fù)雜性逐漸遞增。每一級(jí)分類器具有通正例阻負(fù)例的共性。因此這樣檢測(cè)好處在于每一級(jí)逐漸遞減,減少大量非檢測(cè)量,進(jìn)而增強(qiáng)了目標(biāo)檢測(cè)速度。Figure10AdaBoostcascademodel圖10AdaBoost級(jí)聯(lián)模型其次,Adaboost是一種迭代算法[32]。初始時(shí),所有訓(xùn)練樣本的權(quán)重都被設(shè)為相等,在此樣本分布下訓(xùn)練出一個(gè)弱分類器。在第i〔i=1,2,3,…T,T為迭代次數(shù)〕次迭代中,樣本的權(quán)重由第i-1次迭代的結(jié)果而定。在每次迭代的最后,都有一個(gè)權(quán)重的調(diào)整過(guò)程,在此過(guò)程分類錯(cuò)誤的樣本的權(quán)重將會(huì)增加,這樣錯(cuò)分的樣本將被突出表現(xiàn)出來(lái),得到一個(gè)新的樣本分布。首先在新樣本分布條件下,每次對(duì)樣本進(jìn)行訓(xùn)練,可獲得一個(gè)弱分類器。以循環(huán)的方式進(jìn)行T次,就可得到一系列T個(gè)弱分類器,然后在把這T個(gè)弱分類器通過(guò)一定的權(quán)重從新疊加,最終可獲得強(qiáng)分類器。AdaBoost算法的重要意義在于為研究和實(shí)際問(wèn)題的解決帶來(lái)了新的思想,在絕大多數(shù)集成學(xué)習(xí)算法通關(guān)構(gòu)造越來(lái)越復(fù)雜的分類器來(lái)提高預(yù)測(cè)精度時(shí),AdaBoost主要特色:以最簡(jiǎn)單方式,通過(guò)在功能上實(shí)現(xiàn)比隨機(jī)猜想略好分類器從弱到強(qiáng)方法,AdaBoost在訓(xùn)練子分類器思想方法中進(jìn)行改革:在打破已有樣本分布根底上,使分類器注意力主要集中于難學(xué)習(xí)樣本上。在算法使用上,僅需要指定迭代次數(shù),不需要任何先驗(yàn)知識(shí),一切運(yùn)行過(guò)程中的參數(shù)由算法自適應(yīng)地調(diào)整,因此被評(píng)價(jià)為最接近“拿來(lái)即用〞[33]的算法。與此同時(shí),AdaBoost算法也存在缺點(diǎn)以及一些尚未解決的問(wèn)題:例如提高算法抗噪聲能力、停止迭代條件確實(shí)定是不可防止的問(wèn)題、增加子分類器多樣性。SVM分類器支持向量機(jī)〔supportvectormachine,SVM〕屬于一種解決二分類問(wèn)題的模型,如圖11所示,是定義在輸入樣本的特征空間上的間隔最大化的分類器,間隔最大化優(yōu)化方法使支持向量機(jī)與感知機(jī)之間〔perceptron〕有所區(qū)別[34],也成為支持向量機(jī)的理論根底之一。(c)(c)Figure11Withthetwo-dimensionalfeaturevectorclassificationexamplefigure圖11具有二維特征向量的二分類例如圖隨著模式識(shí)別技術(shù)的開(kāi)展,支持向量機(jī)得到廣泛應(yīng)用,逐漸被用在機(jī)器學(xué)習(xí)數(shù)據(jù)挖掘方面,使理論研究及實(shí)際應(yīng)用方面得到快速開(kāi)展。因?yàn)橹С窒蛄繖C(jī)能夠很好解決復(fù)雜線性回歸及復(fù)雜識(shí)別中分類等諸多問(wèn)題,還經(jīng)常應(yīng)用預(yù)測(cè)和綜合評(píng)價(jià)等領(lǐng)域[35][36]。支持向量機(jī)實(shí)現(xiàn)原理為:首先把某種事非線性輸入向量x轉(zhuǎn)化到高維特征空間映射Z,并在該空間尋找到最優(yōu)分類超平面[37]。SVM主要采用行非線性變換方式,對(duì)輸入量進(jìn)行處理,通過(guò)策規(guī)那么集合的超平面權(quán)值合成結(jié)構(gòu),再?gòu)慕Y(jié)構(gòu)中選擇最好元素及該元素最好函數(shù),實(shí)現(xiàn)最小化錯(cuò)誤率最低,進(jìn)而進(jìn)一步保證結(jié)構(gòu)風(fēng)險(xiǎn)最小化原那么??紤]到SVM分類器在解決小樣本學(xué)習(xí)、非線性以及高維模式識(shí)別等問(wèn)題中表現(xiàn)出的良好分類性能,因此本文的研究使用SVM作為分類器。基于SVM的面包車分類器支持向量機(jī)的實(shí)現(xiàn)原理是:通過(guò)某種事先選擇的非線性映射(核函數(shù))將輸入向量映射到一個(gè)高維特征空間,然后在這個(gè)新空間中求取最優(yōu)線性分類面[38],而這種非線性變換是通過(guò)定義適當(dāng)?shù)膬?nèi)積函數(shù)實(shí)現(xiàn)的。SVM分類器原理為了說(shuō)明SVM是怎么的一個(gè)分類器,首先給出一個(gè)簡(jiǎn)單的線性可分的分類問(wèn)題.所謂數(shù)據(jù)集線性可分是指,給定一個(gè)特征空間上的訓(xùn)練數(shù)據(jù)集〔3.1〕其中:;——表示第i個(gè)數(shù)據(jù)的特征向量;——為的類標(biāo)記,當(dāng)時(shí),表示為正例;當(dāng)時(shí),表示為負(fù)例,稱為樣本。如果存在某個(gè)超平面S使得〔3.2〕能夠?qū)?shù)據(jù)集的正實(shí)例點(diǎn)和負(fù)實(shí)例點(diǎn)完全正確地劃分到超平面的兩側(cè),即對(duì)所有的的實(shí)例,有,對(duì)所有的的實(shí)例,有,那么稱數(shù)據(jù)集T為線性可分?jǐn)?shù)據(jù)集;否那么稱數(shù)據(jù)集T線性不可分[34]。線性可分的支持向量機(jī)是定義在線性可分的數(shù)據(jù)集的根底之上的。例如對(duì)圖11〔a〕中黑點(diǎn)和白點(diǎn)所呈現(xiàn)的就是一個(gè)線性可分的數(shù)據(jù)集,需要用一條直線,將圖11〔a〕中黑色的點(diǎn)和白色的點(diǎn)完美的分割開(kāi),很顯然,圖上的這條直線就是要求的直線之一。而這個(gè)分類問(wèn)題中所有的樣本點(diǎn)剛好可以用一條直線完全正確的別離開(kāi)來(lái),這種假設(shè)下建立的支持向量機(jī)稱之為線性可分的支持向量機(jī)。假設(shè)令黑色的點(diǎn)記為-1,白色的點(diǎn)記為+1,直線,這里的x、w都是向量,這種形式等價(jià)于〔3.3〕其中:;。前者表示的是構(gòu)建的模型參數(shù)〔例如局部可形變目標(biāo)檢測(cè)模型的參數(shù)〕,后者表示的是輸入模式〔例如目標(biāo)檢測(cè)中的圖像〕的特征向量,n表示的是特征向量的維數(shù),是一個(gè)實(shí)數(shù),表示的是特征向量的第i個(gè)元素。當(dāng)向量x的維度n=2的時(shí)候,在二維空間中f(x)表示一條直線,當(dāng)n=3的時(shí)候,在三維空間中f(x)表示一個(gè)平面,當(dāng)n>3時(shí),表示n維空間中的n維超平面。令白色黑色兩類的點(diǎn)分別為+1,-1,當(dāng)對(duì)一個(gè)新樣本點(diǎn)x做預(yù)測(cè)分類時(shí),用符號(hào)函數(shù)就可以進(jìn)行預(yù)測(cè)。當(dāng)f(x)>0的時(shí)候,,當(dāng)f(x)<0的時(shí)候,之后令。最優(yōu)分類超平面支持向量機(jī)進(jìn)行訓(xùn)練的目的主要是在輸入的特征空間中找到一個(gè)超平面,該超平面能將實(shí)例〔圖11中的黑點(diǎn)和白點(diǎn)〕分到不同的類別中去。超平面對(duì)應(yīng)于方程為,它由法向量w和截距b決定,可用〔w,b〕來(lái)表示。超平面將特征空間劃分為兩個(gè)局部,一局部為正類,即,一局部為負(fù)類,即。法向量w指向的一側(cè)為正類,另一側(cè)為負(fù)類。而問(wèn)題在于,當(dāng)訓(xùn)練數(shù)據(jù)集線性可分時(shí),存在無(wú)窮個(gè)超平面可將兩類數(shù)據(jù)正確分開(kāi)。例如能將圖11〔a〕中黑點(diǎn)和白點(diǎn)分開(kāi)的直線有無(wú)數(shù)條,如圖11〔b〕所示的直線根本都能滿足要求,怎樣才能得到一個(gè)最優(yōu)的劃分直線f(x)。感知機(jī)利用了誤分類數(shù)最小的優(yōu)化策略,求得所需的超平面,不過(guò)這時(shí)的超平面有無(wú)窮多個(gè)。線性可分支持向量機(jī)采用了一個(gè)叫做間隔最大化的理論求取最優(yōu)超平面,這樣做時(shí),能保證解是唯一的。在圖11〔c〕中,有A,B,C三個(gè)點(diǎn),表示3個(gè)樣本實(shí)例,它們均在超平面+1類一側(cè),在預(yù)測(cè)它們屬于哪一類時(shí),點(diǎn)A距離超平面較遠(yuǎn),假設(shè)預(yù)測(cè)該點(diǎn)為+1類,就能比擬確信預(yù)測(cè)是正確的;點(diǎn)C距離超平面較近,假設(shè)預(yù)測(cè)該點(diǎn)為+1類就不那么確信;點(diǎn)B介于點(diǎn)A與C之間,預(yù)測(cè)其為屬于+1類確實(shí)信度也在A與C之間。一般來(lái)說(shuō),一個(gè)點(diǎn)距離超平面的遠(yuǎn)近可以代表分類預(yù)測(cè)確實(shí)信度。在超平面確定的情況下,〔3.4〕可以表示點(diǎn)x離超平面距離值大小,利用及類標(biāo)記y符號(hào)一致性判定分類正確性。因此采用y〔〕描述分類的正確性及確信度大小,這種說(shuō)法稱為間隔〔functionalmargin〕??梢岳斫鉃殚g隔最大化的直線具有特征:在黑白兩類點(diǎn)正確分開(kāi)前提下,兩類點(diǎn)中不但滿足最近原那么還要離直線之間距離最大。在數(shù)據(jù)集線性條件下具有直線唯一性。Figure12SVMoptimalseparatinghyperplane圖12SVM最優(yōu)分類超平面使用間隔最大化的前提是正確分類,對(duì)于一個(gè)點(diǎn)x,在正確分類時(shí),離直線的距離可以表示為,其中,由于y和f(x)始終同號(hào),所以g(x)始終為正。此時(shí),容易注意到,對(duì)于上式的決策函數(shù),權(quán)值和b同時(shí)放大或者縮小相同的倍數(shù)都不會(huì)影響樣本到分類面的距離,因此上面定義的最優(yōu)分類面沒(méi)有唯一解,而是有無(wú)數(shù)個(gè)等價(jià)的解。為了使著個(gè)問(wèn)題有唯一解,就需要把和b的尺寸定下來(lái)。一種解決方法就是令離分類面最近的樣本點(diǎn)到分類面的距離為1,這樣,對(duì)所有的樣本點(diǎn),有。由于在分類面兩側(cè)各有這樣的樣本點(diǎn),因此間隔最大化就可描述成:,約束條件是〔3.5〕等價(jià)的描述是:,約束條件是〔3.6〕這樣,就構(gòu)建了能得到最優(yōu)化直線或者超平面的數(shù)學(xué)表達(dá),通過(guò)優(yōu)化這個(gè)式子,就能得到間隔最大化理論下的最優(yōu)化的結(jié)果,這個(gè)式子稱之為目標(biāo)函數(shù)。使用SVM對(duì)不能使用線性分類的分類工作的過(guò)程:第一步,運(yùn)用預(yù)先選定的非線性映射將輸入空間映射到高維特征空間,使得輸入訓(xùn)練樣本可以在高維屬性空間中有可能實(shí)現(xiàn)超平面的分割,從而防止了在原輸入空間中進(jìn)行非線性曲面分割計(jì)算。SVM通過(guò)訓(xùn)練得出的分類函數(shù)具有這樣的性質(zhì):它是一組以SV為參數(shù)的非線性函數(shù)的線性組合,因此分類函數(shù)的表達(dá)式僅和SV的數(shù)量有關(guān)[39],而獨(dú)立于空間的維度。非線性可分模型映射到高維空間以后,分類的示意圖為:Figure13SVMclassificationmodelinhigh-dimensionaldiagram圖13SVM高維分類模型圖支持向量機(jī)求得的分類函數(shù)形式上類似于一個(gè)神經(jīng)網(wǎng)絡(luò),其輸出時(shí)假設(shè)干個(gè)中間層節(jié)點(diǎn)的線性組合,而每一個(gè)中間層節(jié)點(diǎn)對(duì)應(yīng)于輸入樣本與一個(gè)支持向量的內(nèi)積,因此也叫做支持向量網(wǎng)絡(luò)[40],如圖14所示。Figure14SupportVectorMachineSchematic圖14支持向量機(jī)示意圖內(nèi)積函數(shù)采用適當(dāng)?shù)牡膬?nèi)積函數(shù)就可以獲得滿足需要的支持向量機(jī),運(yùn)用不同的內(nèi)積函數(shù)將導(dǎo)致不同的支持向量機(jī)算法;目前得到研究的內(nèi)積函數(shù)形式主要有以下幾類[41],在以下幾式中x表示測(cè)試樣本,xi表示訓(xùn)練樣本:采用線性關(guān)系表示的最簡(jiǎn)單內(nèi)積函數(shù),即〔3.7〕內(nèi)積函數(shù)選擇利用多項(xiàng)式進(jìn)行描述為:〔3.8〕計(jì)算結(jié)果為具有q階多項(xiàng)式的分類器。(3)利用核函數(shù)表示內(nèi)積函數(shù)的表達(dá)式為:〔3.9〕可得到徑向基函數(shù)分類器是支持向量機(jī),基函數(shù)中心與支持向量具有相對(duì)應(yīng),算法自動(dòng)獲得輸出權(quán)值起著決定作用。(4)利用S形函數(shù)描述內(nèi)積函數(shù)表達(dá)式為:〔3.10〕此刻該表達(dá)式結(jié)果為具有兩層的多層感知器神經(jīng)網(wǎng)絡(luò)的支持向量機(jī),不但能輸出網(wǎng)絡(luò)的權(quán)值,而且還能得出網(wǎng)絡(luò)的隱層節(jié)點(diǎn)具體數(shù)目。車輛庫(kù)的建立車輛標(biāo)準(zhǔn)庫(kù)是車型正確分類的關(guān)鍵。先建立標(biāo)準(zhǔn)模板庫(kù),然后根據(jù)Hog特征表達(dá)式,計(jì)算得到車標(biāo)特征庫(kù)。顯然,這種基于特征的匹配識(shí)別算法,可以降低模版庫(kù)對(duì)存儲(chǔ)空間的要求,相比儲(chǔ)存一副圖像,只儲(chǔ)存局部數(shù)據(jù)還能夠極大提高匹配的識(shí)別速度。車輛特征庫(kù)的建立,一般常用的方法有兩種方法:一種是從大量的訓(xùn)練樣本中,提取識(shí)別效果最理想的一個(gè)來(lái)進(jìn)行特征計(jì)算,并作為模板的特征值,這種方法操作簡(jiǎn)單,但比擬依賴人的主觀判斷;另一種方法是對(duì)多個(gè)樣本逐一進(jìn)行特征計(jì)算,通過(guò)求平均值得出模板特征值。這種方法效果比擬好,能降低采集過(guò)程中的人為因素的影響,但是實(shí)現(xiàn)較為復(fù)雜。由于受環(huán)境影響,所以采集車形計(jì)算特征量需要先對(duì)車輛樣本預(yù)處理。車輛標(biāo)準(zhǔn)特征庫(kù)的建立流程如圖15所示:Figure15Theflowchartsofvanlibrariescreate圖15面包車庫(kù)建立流程圖在實(shí)驗(yàn)中,我們從收集到的大量圖片中選擇不同型號(hào)、大小、光照等,盡可能的是樣式涵蓋最全的圖片作為模板樣本,局部的正樣本圖像如圖16〔a〕;局部負(fù)樣本,如圖16〔b〕所示:〔a〕Positivesamplespictures〔a〕正樣本圖片(b)Negativesampleimage〔b〕負(fù)樣本圖片F(xiàn)igure16Somesamplespictures圖16局部樣本圖片在算法一定的情況下,樣本庫(kù)的大小和典型性共同決定著SVM分類器的準(zhǔn)確性。所以本次設(shè)計(jì)在構(gòu)建訓(xùn)練樣本庫(kù)的過(guò)程中投入了大量的時(shí)間,一共找到了正樣本負(fù)樣本各550多張,總共樣本1100多張,這也為SVM分類器的準(zhǔn)確性奠定了根底。通過(guò)種種渠道,我找到了交通監(jiān)控錄像,為樣本的真實(shí)性,多樣性提供了保障。為了方便SVM的訓(xùn)練,統(tǒng)一將圖片的尺寸調(diào)整到64╳128。從上述樣本可以看出,樣本的選擇具有了全面型,典型性,包含了各種車型,各種天氣。正是這樣全面的樣本庫(kù),使得SVM分類器的準(zhǔn)確性得到了保證。SVM分類器的訓(xùn)練在進(jìn)行SVM分類器訓(xùn)練之前,需要做好各種準(zhǔn)備工作,最重要的就是正負(fù)樣本的HOG特征提取,之后將獲取到的HOG特征數(shù)據(jù)庫(kù)即車輛特征庫(kù)送入SVM中進(jìn)行分類訓(xùn)練,從而獲得用于識(shí)別面包車的SVM分類器。其具體訓(xùn)練過(guò)程如下:〔1〕將所有車輛圖片分為數(shù)量相等的正負(fù)樣本:在實(shí)際獲取收集到的車輛圖片中,都比提取特征的圖片要大且大小不統(tǒng)一,首先將所有照片統(tǒng)一到一樣的尺寸并符合實(shí)驗(yàn)需求的大小64╳128,選取各種情況下的各種型號(hào)面包車的圖片作為訓(xùn)練的正樣本;用和正樣本相等數(shù)量的其他車輛、和面包車不相關(guān)的圖片作為負(fù)樣本;〔2〕提取正負(fù)樣本的HOG特征:在OpenCV中實(shí)現(xiàn)HOG特征的提?。弧?〕將在上一步中提取到的HOG特征投入到SVM中訓(xùn)練,得到初始分類器;〔4〕利用上一步獲取到的初始分類器的支持向量和對(duì)應(yīng)的權(quán)值加權(quán)得到檢測(cè)面包車的檢測(cè)子,再加上一維的偏移。但是,這個(gè)初始檢測(cè)子,檢測(cè)效果很不理想,有很多錯(cuò)檢的結(jié)果,由于錯(cuò)檢太多,需要對(duì)分類器繼續(xù)訓(xùn)練加以完善;〔5〕利用這個(gè)初始的檢測(cè)子對(duì)負(fù)樣本的原圖進(jìn)行檢測(cè),這次需要對(duì)尺度不統(tǒng)一的圖片進(jìn)行檢測(cè),此時(shí)可以使用cv-HOG的多尺度檢測(cè)方法,獲得hardexample區(qū)域;〔6〕將第5步中hardexample區(qū)域分割出來(lái),之后提取該局部的的HOG特征;〔7〕將在hardexample提取到的HOG特征和第2步中正負(fù)樣本的HOG特征綜合起來(lái),再重新訓(xùn)練SVM分類器,這樣得到的SVM分類器的分類效果得以改善。如果效果不理想,可以從第〔5〕步開(kāi)始繼續(xù)重復(fù)訓(xùn)練。基于SVM的面包車分類識(shí)別實(shí)驗(yàn)對(duì)上一章節(jié)獲取到的SVM分類器進(jìn)行分類識(shí)別實(shí)驗(yàn),驗(yàn)證該分類器的真實(shí)可用性,具體驗(yàn)證流程如圖17所示:Figure17TheprocessofvanidentificationwiththeSVMclassifier圖17用SVM分類器識(shí)別面包車流程其具體實(shí)驗(yàn)結(jié)果如圖18所示,有實(shí)驗(yàn)結(jié)果可以看出,通過(guò)此方法獲得的SVM分類器對(duì)面包車的識(shí)別率根本可以滿足實(shí)際需求。Figure18VanidentifieswiththeSVMclassifier圖18用SVM分類器對(duì)面包車的識(shí)別本章小結(jié)本章主要針對(duì)面包車分類識(shí)別中分類器的建立做了分析介紹,首先將目前在圖像分類識(shí)別上廣泛使用的分類器做一簡(jiǎn)單了解認(rèn)識(shí),在比擬各分類算法的優(yōu)缺點(diǎn)之后,針對(duì)本文的研究對(duì)象,選用SVM分類器;其次,對(duì)SVM分類器做了深入的研究認(rèn)識(shí),并對(duì)其算法認(rèn)真學(xué)習(xí),最后通過(guò)MATLAB將其實(shí)現(xiàn);最后,為了獲得關(guān)于面包車輛的SVM分類器,建立車輛特征庫(kù),并對(duì)其進(jìn)行分類訓(xùn)練,將獲得SVM分類器進(jìn)行實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果較為理想?;陬伾?HOG的面包車檢測(cè)識(shí)別顏色信息作為檢測(cè)目標(biāo)、檢測(cè)道路非常有用的檢測(cè)方法,很多監(jiān)控系統(tǒng)運(yùn)用顏色信息來(lái)實(shí)現(xiàn)道路險(xiǎn)跟蹤、車輛分割等的有用信息。顏色特征是一個(gè)全局特征,所以目標(biāo)或目標(biāo)所在區(qū)域的外表性質(zhì)可以用顏色特征加以描述。因此面包車的顏色特征也是區(qū)別其他車輛的重要信息。通常情況下,顏色特征是基于像素點(diǎn)的特征,所有屬于圖像或圖像區(qū)域的像素對(duì)圖像的整體特征都有各自的奉獻(xiàn),由于顏色對(duì)圖像或圖像區(qū)域的方向、大小等變化不敏感,因此顏色特征更能很好的刻畫(huà)對(duì)象的整體特征。車輛顏色信息也是運(yùn)動(dòng)車輛識(shí)別系統(tǒng)中一個(gè)重要輔助特征,它由車身的主要顏色成分確定。面包車的顏色一般是純色,無(wú)需對(duì)局部環(huán)節(jié)進(jìn)行區(qū)別,只是確定特征區(qū)域的分布就可,所以,在顏色空間中計(jì)算的HOG特征更有利于面包車的識(shí)別。顏色特征彩色圖像在圖像的眾多特征中,顏色特征可以直觀、清晰的表達(dá)出來(lái),是圖像視覺(jué)重要的感知特性之一。其不僅表征出圖像中目標(biāo)對(duì)象和周邊環(huán)境的關(guān)系,而且對(duì)圖像自身的尺寸、方向、視角的依賴性較小,因此基于顏色特征的圖像查詢?cè)趫D像檢索中最根本和最重要的方法[42]。經(jīng)過(guò)大量的理論研究和實(shí)踐證明,人類已經(jīng)根本掌握了顏色的物理本質(zhì)。詳細(xì)的實(shí)驗(yàn)研究數(shù)據(jù)說(shuō)明,人眼錐狀細(xì)胞是接受彩色視覺(jué)信息的主要細(xì)胞,人眼中大概擁有六七百萬(wàn)錐狀細(xì)胞,其中可將其分為三個(gè)主要的彩色信息感知類別。分別是紅、綠、藍(lán),其中大約65%的細(xì)胞對(duì)紅色光源敏感,33%對(duì)綠色光源敏感,只有2%對(duì)藍(lán)色光源敏感[43],眼睛對(duì)紅、綠、藍(lán)吸收的平均實(shí)驗(yàn)曲線如圖19所示。由于人眼對(duì)光源信息的吸收特性,所以通常認(rèn)為被眼睛看到的彩色是由三種原色,紅〔red〕、綠〔green〕和藍(lán)〔blue〕通過(guò)眼睛接收量的多少組合得到。Figure19Thefunctionofconeseyesabsorbthered,green,andbluewavelengths圖19人眼中錐狀細(xì)胞對(duì)紅、綠、藍(lán)三色的波長(zhǎng)吸收函數(shù)T.Young在1802年提出三色原理,其根本內(nèi)容是:任何顏色都可以用3種不同的根本顏色按照不同比例混合得到,即〔4.1〕式中:C1、C2、C3——為三種原色〔又稱為三基色〕,a、b、c≥0,為3種原色的權(quán)值或者比例,通過(guò)改變a、b、c即可得到不同的色彩。三原色原理在色度學(xué)中占有重要地位,是其他原理的根底。為了統(tǒng)一標(biāo)準(zhǔn),1931年,國(guó)際照明委員會(huì)〔CIE〕規(guī)定各種顏色用紅、綠、藍(lán)三原色按照比例混合得到,其配色方程為:〔4.2〕其中:C為任意一種顏色,R代表紅色,G代表綠色,B代表藍(lán)色,a、b、c≥0,為3種原色的權(quán)值或者比例。三原色原理的應(yīng)用,同時(shí)國(guó)際標(biāo)準(zhǔn)的推出,各種顏色用統(tǒng)一標(biāo)準(zhǔn)的表示,使得彩色圖像的獲取、表示、傳輸和復(fù)制不再是空想。經(jīng)常使用亮度、色調(diào)和飽和度來(lái)區(qū)分顏色。如無(wú)彩色圖像就只有亮度一個(gè)特性量的變化;色調(diào)主要表現(xiàn)光波混合中,和主波長(zhǎng)相關(guān)的屬性,表示觀察者觀察到的主要顏色;色調(diào)的純度的對(duì)飽和度有一定的影響,當(dāng)完全飽和時(shí)代表著純光譜色的,隨著白光的不斷參加飽和度逐漸減少。色調(diào)和飽和度合稱為彩色,因此,顏色用亮度和彩色表征。面包車的顏色特征從視覺(jué)上區(qū)分一件物體時(shí),多數(shù)情況下從兩方面入手,首先,先從其外觀,從外表確定其大概屬于什么類,進(jìn)行粗劃分之后,再進(jìn)行仔細(xì)的劃分,例如顏色、環(huán)境、聲音等等特點(diǎn)。在現(xiàn)有的車輛中,車輛輪廓和車輛顏色都是描述一輛車的主要特征。就以面包車為例,在輪廓有稍微的變化的情況下,還有一個(gè)顯著特征:顏色。隨著三原色原理的提出,彩色空間的運(yùn)用成為現(xiàn)實(shí),通過(guò)監(jiān)視器獲得畫(huà)面不再是單純的黑白兩色,而是展現(xiàn)出一個(gè)多姿多彩的畫(huà)面,從而從顏色特征上區(qū)分車輛也不再是空想。由第三章中的車輛庫(kù)中的各類面包車的圖片可以得出,面包車外表顏色相對(duì)固定、車輛類型相對(duì)單一,這也是區(qū)別其他車輛的重要特征。面包車都是以某種純色為主,很少有混合色。同時(shí)可以看到,有一局部的面包車的車型和現(xiàn)在比擬流行的SUV外形輪廓很是相似,但是SUV的顏色較為龐雜,有純色、混合色等,相對(duì)顏色大多是乳白色或銀灰色的面包車,用顏色特征將會(huì)更好的識(shí)別面包車。基于顏色特征的檢測(cè)識(shí)別預(yù)處理常用的顏色特征提取方法有:顏色直方圖顏色直方圖可以描述一幅圖像中顏色的全局分布,即不同色彩在整幅圖像色彩分布中各自所占的比例;對(duì)于無(wú)法自動(dòng)分割的圖像和無(wú)需考慮物體空間位置的圖像非常適用[45],該方法存在著缺點(diǎn),即很難確定圖像局部局部的顏色分布及每種色彩所在的圖像位置。在日常生活中及圖像處理中,常用的顏色空間主要有以下幾種:RGB顏色空間、HSV顏色空間、HSI顏色空間等。顏色集顏色集是類似于顏色直方圖的一種方法。首先,將圖像從RGB顏色空間轉(zhuǎn)化到視覺(jué)均衡的顏色空間〔如HSI空間〕,并將顏色空間用假設(shè)干個(gè)區(qū)間〔bin〕加以量化;然后,用色彩自動(dòng)分割技術(shù)對(duì)圖像進(jìn)行分割,將其分為假設(shè)干區(qū)域,在對(duì)每個(gè)區(qū)域中的某個(gè)顏色分量量化作為該局部顏色空間的索引[44],從而可以用一個(gè)二進(jìn)制的顏色索引集來(lái)表示圖像。顏色矩顏色矩是在數(shù)學(xué)方法上建立的,顏色的分布用矩來(lái)描述。圖像中任何顏色的分布均可以用它的矩來(lái)表示。顏色矩可以直接在RGB顏色空間計(jì)算,由于顏色分布信息主要集中在低階矩。因此,僅采用顏色的一階矩、二階矩和三階矩就足以表達(dá)圖像的顏色分布[45],它們的定義分別為:〔4.3〕〔4.4〕〔4.5〕其中:Pij——是第j個(gè)像素的第i個(gè)顏色分量;N——是像素集。事實(shí)上,一階矩i表征每個(gè)顏色分量的平均強(qiáng)度[44],二階和三階矩分別表征了顏色分量的方差和偏斜度。彩色空間彩色空間〔也稱彩色模型或彩色系統(tǒng)〕的用途主要是在某些標(biāo)準(zhǔn)下,或圖像處理要求上用通??山邮芑蚶趫D像處理的方式簡(jiǎn)化彩色標(biāo)準(zhǔn)。事實(shí)上,彩色空間就是坐標(biāo)系統(tǒng)和子空間的標(biāo)準(zhǔn)[46],位于系統(tǒng)中任意顏色都由坐標(biāo)系統(tǒng)中的某個(gè)點(diǎn)來(lái)表示。現(xiàn)在所用的大多數(shù)彩色空間都是為了更好地滿足硬件或?qū)嶋H應(yīng)用需求,RGB〔紅、綠、藍(lán)〕空間是最通用的面向硬件的彩色空間,主要用于彩色監(jiān)視器或彩色視頻攝像機(jī);CMY〔青、深紅、黃〕、CMYK〔青、深紅、黃、黑〕空間主要用于彩色打印機(jī);HSI〔色調(diào)、飽和度、亮度〕空間符合人類對(duì)彩色信息的描述和顏色的解釋方式,用彩色信息和亮度信息兩局部來(lái)描述圖像;CIE顏色空間〔CIELuv、CIELab〕是另一種符合人類描述和解釋顏色的方式;由于彩色科學(xué)涉及到的應(yīng)用領(lǐng)域很寬廣,所以還有很多應(yīng)用的彩色空間,但在此只對(duì)以下幾種作簡(jiǎn)要介紹:RGB彩色空間RGB顏色空間作為最常用的色度空間,廣泛運(yùn)用在計(jì)算圖形學(xué)、數(shù)字圖像處理中。該顏色空間模型是基于笛卡爾坐標(biāo)系統(tǒng)建立的,用一個(gè)RGB彩色立方體對(duì)模型以圖解展示[47],如圖20所示,這個(gè)立方體的各頂點(diǎn)分別代表光的原色〔紅、綠、藍(lán)〕和三種典型合成色〔青、品紅、黃〕。Figure20RGBcolorspacemodel圖20RGB顏色空間模型在RGB彩色空間中,每一幅圖像都由三個(gè)圖像分量組成,即每幅圖像可以向三個(gè)原色面進(jìn)行投影,每一個(gè)面的投影獲得一個(gè)圖像分量,每一個(gè)分量圖像代表著該圖像在該原色面上的分布,用像素深度表示每一像素的比特[46];在這個(gè)彩色空間中,每幅圖像可以用三個(gè)圖像分量表示,所以,在此空間中可以用一個(gè)mn3的矩陣來(lái)表示一幅mn〔m,n為正整數(shù),分別表示圖像的高度和寬帶〕的RGB彩色圖像??梢杂眉t、綠、藍(lán)三個(gè)分量組成的三元組表示圖像中的每一個(gè)像素點(diǎn);三個(gè)分量不僅含有色彩和亮度的信息,而且三個(gè)分量之間存在著很大的相關(guān)性[48]。HSI彩色空間HIS彩色空間是基于人的視覺(jué)系統(tǒng)建立的,用色調(diào)〔Hue〕、飽和度〔Saturation〕和亮度〔Intensity〕共同來(lái)描述色彩。HIS顏色空間由兩局部組成:一個(gè)垂直的亮度軸和與此軸垂直的一個(gè)平面上的彩色點(diǎn)的軌跡,平面沿著亮度軸上下移動(dòng),那么由平面和立方體外表相交形成的邊界有可能是三角形,也有可能是六邊形,甚至也有可能是圓形。假設(shè)從立方體的亮度軸看去,如圖21〔a〕所示,在這個(gè)平面上,各原色之間都相隔120,合成色與原色相關(guān)60,合成色之間的角度也是120。圖21〔b〕顯示了六邊形和一個(gè)任意的彩色點(diǎn),這個(gè)點(diǎn)的色調(diào)是由其和參考點(diǎn)的連線與,參考點(diǎn)和紅色軸連線之間的夾角決定,即定義參考點(diǎn)與平面和紅色軸的交點(diǎn)之間的夾角為0,求彩色點(diǎn)與參考點(diǎn)之間的夾角,夾角從0逆向增加;飽和度指的是該點(diǎn)到亮度軸的距離,也就是從原點(diǎn)到該點(diǎn)的向量的模長(zhǎng),原點(diǎn)即為該彩色平面與垂直亮度軸的交點(diǎn);亮度即為該彩色平面在亮度軸上的位置。所以,HSI彩色空間主要包括垂直亮度軸、到彩色點(diǎn)的向量長(zhǎng)度以及該向量與紅色軸之間的夾角三個(gè)分量[49],因此用六邊形或者三角形〔如圖21〔c〕〕、圓形〔如圖21〔d〕〕,來(lái)定義一個(gè)HSI平面是可以的,選擇哪種形狀是不重要的,因?yàn)槿我鈨煞N形狀都可以相互轉(zhuǎn)換。(a)Coloredhexagons〔a〕彩色六邊形〔b〕〔c〕

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論