行人檢測方法研究_第1頁
行人檢測方法研究_第2頁
行人檢測方法研究_第3頁
行人檢測方法研究_第4頁
行人檢測方法研究_第5頁
已閱讀5頁,還剩17頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1緒論1.1研究背景在信息高速發(fā)展的今天,幾乎全部領(lǐng)域都離不開計算機,在滿足人們的習(xí)慣方式和生活習(xí)慣下,讓計算機進行較好的通信,是計算機智能的一種必備的條件。其中,計算機智能視覺是其應(yīng)用的重要方向,它是研究使用多個成像輸入設(shè)備替代人類視覺器官的領(lǐng)域叫智能視覺,并使用智能設(shè)備來替代人們完畢識別和分析。讓智能設(shè)備能夠像人類同樣觀察和理解是人們研究計算機視覺,并且智能設(shè)備還能隨著環(huán)境的變化而做出對應(yīng)的變化。行人檢測是計算機視覺的一種具體體現(xiàn)形式,并應(yīng)用在下列方面:智能監(jiān)控現(xiàn)在,為了避免財產(chǎn)安全和留下有效的證據(jù),大部分的公眾場合都裝備了攝像監(jiān)控設(shè)備。但是,這些監(jiān)控設(shè)備大部分還是有專人進行的查看的,這會造成下列問題的出現(xiàn),首先長時間的監(jiān)控,監(jiān)控人員很可能出現(xiàn)疲倦,可能造成某些重要信息的遺漏,另首先不能充足的把監(jiān)控信息運用起來。然而人工的局限性能夠運用行人檢測有關(guān)技術(shù)較好的解決,這樣不僅能夠減少多個資源的投入,又能夠讓監(jiān)控的精確度得到較好的改善,當(dāng)碰到緊急狀況有能夠及時預(yù)警。車輛輔助系統(tǒng)隨著社會的發(fā)展,人民的經(jīng)濟水平不停提高,汽車逐步走入了千家萬戶,然而汽車數(shù)量的急劇增加也造成了頻繁的交通事故,無情的奪去了人們的生命財產(chǎn)安全。如果我們將行人檢測系統(tǒng)加入到汽車控制系統(tǒng)中,這樣在行駛過程中車輛附近的人們能夠被識別出來,極大了避免的交通事故的發(fā)生。這樣不僅能夠有效的減少交通事故,并且這也能夠帶來汽車行業(yè)的革命式變化。事實上,現(xiàn)在有許多公司已經(jīng)研制出了無人駕駛的汽車,這些車的使用都需要行人檢測技術(shù),固然現(xiàn)在的能智能還沒進入市場,現(xiàn)在還在實驗當(dāng)中。高級人機接口在21世紀(jì),計算機技術(shù)得到了迅猛發(fā)展,并且更加趨于智能化的特點,極大地變化了我們的生活方式。我們不僅規(guī)定計算機能夠快速精確的接受到外界輸入的信息,并且能夠高效地對信息進行解決并得到最適宜的輸出信息,作出的對應(yīng)的反映。人臉識別技術(shù)和物體檢測技術(shù)的發(fā)展,能夠較好的協(xié)助計算機去獲取和解決外界的信息。這不僅需要良好的智能設(shè)備,同時也需要行人檢測技術(shù)去協(xié)助完畢。1.2研究現(xiàn)狀行人檢測在汽車領(lǐng)域含有很大的應(yīng)用前景,近年來是模式識別領(lǐng)域研究的熱點課題方向之一。并且國內(nèi)外也有了諸多了研究成果,如由本田公司研發(fā)的基于紅外攝像機的行人檢測系統(tǒng)[1];CMU[2]、MIT[3]等國外的大學(xué)在這方面獲得了很大的進步,清華大學(xué)[4]等也進行了有關(guān)方面的研究。行人檢測技術(shù)事實上為圖像解決技術(shù)的分支,其核心思想就是運用計算機視覺技術(shù)和數(shù)字圖像解決技術(shù),去分析監(jiān)控設(shè)備獲取的信息,分析解決行人的行為。行人檢測的成功開發(fā)含有很大的應(yīng)用前景,能夠在各個領(lǐng)域得到發(fā)展。并且由于檢測的行人外形不同,加上周邊的復(fù)雜混亂的環(huán)境,給行人檢測系統(tǒng)的運行帶來了很大的挑戰(zhàn)。早期的行人檢測以靜態(tài)圖像解決中的分割、邊沿提取、運動檢測等辦法為主。例如:(1)以Gavrila為代表的全局模板辦法[5];(2)以Broggi為代表的局部模板辦法[6];(3)以Lipton為代表的光流檢測辦法[7];(4)以Heisele為代表的運動檢測辦法[8];(5)以Wohler為代表的神經(jīng)網(wǎng)絡(luò)辦法[9];但是這些辦法的檢測速度很慢,并且普遍存在著誤報、漏檢率高的特點。行人檢測的現(xiàn)狀:大致能夠分為兩類:(1)基于背景建模的辦法:分割出前景,提取運動目的,在進一步提取特性,分類鑒別。然而這個辦法構(gòu)建了很復(fù)雜的模型,因此系統(tǒng)很容易受到干擾。(2)基于統(tǒng)計學(xué)習(xí)的辦法:根據(jù)大量訓(xùn)練樣原來構(gòu)建行人檢測分類器,提取樣本的特性,普通分類器涉及SVM[10],AdaBoost[11]?,F(xiàn)在,基于學(xué)習(xí)的行人檢測辦法得到了很大的發(fā)展,如基于AdaBoost、基于SVM、基于HOG等行人檢測辦法。首先,這些辦法都是學(xué)習(xí)正樣本和負(fù)樣本的變化,再根據(jù)大量的訓(xùn)練樣本對不同的特性進行分類,因此,基于統(tǒng)計學(xué)習(xí)的辦法有廣泛的合用性。在行人檢測系統(tǒng)中,目的記別和ROIs分割是兩個重要的部分。目的記別根據(jù)監(jiān)測信息的不同分為基于形狀的辦法和基于運動的辦法。ROIs分割可分為基于運動、基于距離、基于圖像特性和基于攝像機參數(shù)四種辦法。在具體操作中,普通將這四種辦法綜合起來使用,能獲得更加好的成果。研究難點現(xiàn)在行人檢測技術(shù)面臨著以下的技術(shù)難點:(a)每個人都有各自的姿態(tài),著裝各異;(b)特性空間的待提取的特性分布不集中;(c)受訓(xùn)練的樣本變化大,造成系統(tǒng)分類效果的好壞;(d)受訓(xùn)練的樣本很難包含多個復(fù)雜的真實環(huán)境;現(xiàn)在的行人檢測技術(shù)正處在發(fā)展的核心時期,已經(jīng)獲得了某些可喜的進步,但許多難點問題急待解決。在某些環(huán)境背景良好的狀況下,行人檢測算法檢測效果較好,但是實際中諸多環(huán)境是很復(fù)雜的,檢測的效果并不能滿足規(guī)定。另外,檢測時會有延時也減少了系統(tǒng)的實用性,并且現(xiàn)在還缺少原則的測試辦法和數(shù)據(jù)庫的建立。本文研究的重要內(nèi)容首先,本文簡要地介紹了現(xiàn)在的多個算法,并互相對比,指出其中的優(yōu)點和存在的問題。另首先,介紹本文研究的重要算法HOG算法原理,并進行改善,并比較改善前后,算法性能的變化。最后,本文提出HOG+SVM算法,通過將現(xiàn)有的HOG算法和SVM分類器,巧妙的將兩者結(jié)合改善,使之滿足多個復(fù)雜條件。本文的創(chuàng)新之處在于,通過將HOG和SVM算法結(jié)合并加以改善,使檢測效率大大提高,并且實時性更強。本文構(gòu)造:第一章是緒論,介紹了行人檢測的背景和意義,并敘述了其研究現(xiàn)狀,給出了本文的研究內(nèi)容;第二章具體介紹了行人檢測重要算法,并互相比較,得到其中的優(yōu)缺點;第三章重要介紹HOG算法原理以及該算法的優(yōu)缺點;第四章研究了基于HOG和SVM算法的行人檢測算法,并進行了改善得到實驗成果,具體分析后得到結(jié)論;第五章重要是對本文研究的總結(jié)以及將來技術(shù)發(fā)展的展望。2行人檢測重要辦法介紹及比較2.1引言現(xiàn)在,隨著智能交通的發(fā)展,行人檢測這方面的算法的研究也在不停的進一步,每年都會涌現(xiàn)出諸多優(yōu)秀的文論,有的是對行人檢測進行全新的研究,或者是對原有算法進行進一步的改善,提高檢測的精確度以及檢測的速度,加緊了行人檢測的實用化進程。下列是對兩類算法的具體介紹:第一類為基于特性的算法。在將矩形框范疇內(nèi)的行人作為一種整體的前提下,它的核心在于找到能夠代表框內(nèi)行人的特性信號參數(shù),然后運用機器學(xué)習(xí)算法將這種參數(shù)進行分類,這樣就能夠分辨行人和非行人,達(dá)成識別的目的。從這個過程中,我們能夠懂得基于特性的算法分為分類器的學(xué)習(xí)和特性的提取,因此一種好的特性提取算法變得很重要。例如HOG特性、wavelet特性、shapelet特性,LBP等。該類辦法的實現(xiàn)的算法比較簡樸,架構(gòu)容易,當(dāng)使用不同特性辦法時,也不用更改原來的架構(gòu),且易于實現(xiàn)。然而能夠使用分類效果好的特性,就能夠較好地從被檢測目的較好的檢測出行人目的。前面我們提到行人都有各自的特點,因此現(xiàn)在很難找到一種完美的算法來描述行人的特性。特別是在行人行走過程中,行人的姿勢不停變化、監(jiān)控設(shè)備的視角也在變化、同時行人也會被其它物體遮掩。現(xiàn)在的全部特性參數(shù)不能獲得較好的效果?,F(xiàn)在,被研究人員認(rèn)為最穩(wěn)定的特性是行人的輪廓,因此諸多研究人員都將重點放在了提取行人的輪廓信息。第二類為基于多部位的辦法,就是分別取檢測人的各個部位,然后綜合起來判斷與否是行人。通過一定的算法,來分析各個部位的關(guān)系,從而判斷與否為行人目的。當(dāng)行人在行走過程中發(fā)生部分遮掩,使用該類辦法能夠較好的解決,并且解決效果要比第一類辦法好許多。但是,該類辦法的核心在于,如何通過一種有效的機制,將各部分的檢測成果合成一種整體,來判斷與否為檢測的目的。受到人臉識別的啟發(fā),將人臉的正側(cè)面分別作為訓(xùn)練樣本,減少類內(nèi)差別,能夠使訓(xùn)練難度減少。在這里,我們能夠?qū)⑿腥朔譃檎婧蛡?cè)面,按照類似的解決辦法,同樣得到了一定的成果。但是,在無形之中需要增加諸多的訓(xùn)練樣本值,使得工作量變大諸多。但是解決效果較好。2.2基于特性的辦法2.2.1wavelet特性在1997年,機器學(xué)習(xí)的思想被Oren[18]第一次引進到行人檢測領(lǐng)域,該辦法的大致是通過大量的訓(xùn)練樣本,然后對樣本進行學(xué)習(xí),形成適宜的模型,使得機器能夠通過自動學(xué)習(xí)來建立模型。這種辦法使行人檢測獲得了很大的突破,開創(chuàng)了行人檢測的新局面。但是隨著時間的變化,行人檢測的技術(shù)在不停的發(fā)展,該算法的效果并不能滿足人們的規(guī)定。理解它,能夠協(xié)助我們較好的學(xué)習(xí)后續(xù)的復(fù)雜的算法。該辦法的提出重要有下列的奉獻:第一,該辦法實驗成果表明,在行人檢測領(lǐng)域引入機器學(xué)習(xí)是很有必要的通過吧某些簡樸的特性進行分類訓(xùn)練,然后加以分類是一種較好的方案。第二,該辦法對負(fù)樣本的規(guī)范定義,在Oren提出該辦法之前,負(fù)樣本還沒用統(tǒng)一的原則。如何選用精確的負(fù)樣本,是許多研究人員關(guān)心的問題,但是始終都沒有找到較好的方案。由于這種辦法的出現(xiàn),負(fù)樣本的訓(xùn)練對系統(tǒng)的益處大大地增加。在此之后,許多研究人員沿著這一方向繼續(xù)研究,并出現(xiàn)了新算法。2.2.2Adaboost算法Adaboost算法是通過變化數(shù)據(jù)的分布實現(xiàn)的,是一種迭代算法。在每次進行訓(xùn)練之前,都會對之前全部訓(xùn)練的樣本進行初始化權(quán)重,判斷上一輪分類器的總體精確率。在對樣本就行訓(xùn)練時,對完全能夠精確分類的樣本,就減少它的權(quán)值。在下一輪訓(xùn)練時,被選中的概率就會減少。與之相反的是,如果被判斷錯誤的分類樣本,在下一次訓(xùn)練時,被選中作為樣本的概率就會變大。這樣,在每次訓(xùn)練時,都會訓(xùn)練上一次被判斷為錯誤分類的樣本,學(xué)習(xí)了對的的樣本。最后由各個弱分類器級聯(lián)成強分類器。Adaboost算法不僅有計算效率高,弱分類器的兼容性好、參數(shù)少等特點被廣泛應(yīng)用。2.2.3shapelet特性該算法是基于boosting算法進行兩次解決。第一次提取某些簡樸的的特性,然后對提取出的特性進行訓(xùn)練,將訓(xùn)練的成果進行加權(quán),得到shapelet。接下來第二次,是將得到的shapelet通過訓(xùn)練器再進行訓(xùn)練,得到最后的訓(xùn)練分類器。該算法的優(yōu)點在于,通過簡樸的特性作為基礎(chǔ),通過學(xué)習(xí)、訓(xùn)練得到比較好的訓(xùn)練分類器。因此該算法的性能比較良好,在檢測效率上,shapelet也高于與之相似的edgelet算法,應(yīng)用也很廣泛。2.3基于多部位的辦法2.3.1自適應(yīng)組合分類器首先,該算法將人分為頭肩、左肩、右肩和下半身四個部分,然后運用算法分別訓(xùn)練出每個部位的模型,得到各自的分類器。該算法使用了基于小波的算法,但是特性的維數(shù)更高,因此性能也有了一定的提高。然后將這四個分類器的參數(shù)作為最后分類器的參數(shù)輸入,運用算法再做訓(xùn)練,得到最后分類器的模型。需要指出的是,必須在一定范疇內(nèi)對四個部位的分類器進行搜索,得到最優(yōu)的返回值。2.3.2基于貝葉斯推斷的組合算法基于貝葉斯推斷的辦法是由BoWu從概率角度出發(fā)提出的,然后通過一系列計算,得到最大概率解。在這個算法中,將人分成頭肩、軀干、腿部三個重要部分。類似于2.3.1的辦法,首先,對檢測對象的三個部位進行訓(xùn)練,得到訓(xùn)練分類器,并進行檢測。最后,將各個部分得到的實驗成果比較分析,以貝葉斯為根據(jù)來判斷與否出現(xiàn)了行人。2.3.3隱式形狀模型該算法在訓(xùn)練階段,首先建立圖片塊字典,也就是為全部的圖片塊建一種索引。隨即,要得到圖片塊的任何信息時,通過前面建立的索引,進行查詢。首先,我們需要獲得在愛好點附近的圖片信息,并在對應(yīng)的字典中找到對應(yīng)的匹配項,通過比對有關(guān)信息,對中心位置進行分析即投票。毋庸置疑,那些得到票數(shù)最高將作為成果。最后,分析實驗數(shù)據(jù),擬定實驗成果。2.4基于多視角的辦法基于多視角的辦法在人臉識別的領(lǐng)域應(yīng)用很廣泛,但是將該辦法引入行人檢測方向的辦法現(xiàn)在還不是諸多。這是由于在不同視角下,人臉的差別是很大,但是對于行人來講該特性確要小諸多。另外,現(xiàn)在的訓(xùn)練樣本還不夠充足,不能得到抱負(fù)的實驗效果?,F(xiàn)在多視角的辦法有下列幾個:第一種辦法是對于視角的差別,我們并不做不同解決,而是將它們統(tǒng)一解決。正由于這樣解決,這種辦法的難點是如果不同的視角的物體差別很大,那將造成類間差別很大,使得訓(xùn)練出來的分類器是無效的。對于行人來說,有些狀況很特殊,即使各個視角的行人也有差別。但是那些差別還局限性以造成訓(xùn)練無法正常進行,例如某些基于特性的辦法,并沒有考慮多視角問題,但是檢測效果和識別效果同樣較好。第二種辦法是通過視角將樣本進行分開,將不同分組的樣本分別訓(xùn)練成一種個分類器,并分別檢測全部的分類器。這個辦法的弊端在于,視角分的越多復(fù)雜度就越大,并且大大增加了人工的負(fù)擔(dān)。第三種辦法是提取不同視角之間的共同特點,這樣能夠減少算法的復(fù)雜度,提高速度。這類辦法不僅考慮了多視角的行人特性的不同,也考慮到了視角分類太多類內(nèi)變化大的缺點。因此,第三種辦法是現(xiàn)在研究的大趨勢?,F(xiàn)在,基于樹的構(gòu)造的分類器已經(jīng)受到了越來越多人的關(guān)注,由于它能夠解決不同的實驗樣本,提高了系統(tǒng)的性能。這樣既能夠有效的避免類內(nèi)變化大的缺點,又能夠解決視角特性不同帶來的誤差,這樣的能夠大大縮減算法的復(fù)雜度。

3基于HOG特性的行人檢測3.1引言行人檢測的目的是將每一幀圖像中行人識別出來,并得到其空間位置。由于描述行人的辦法不同,普通將行人檢測算法分為下列三類:基于特性表述的辦法、基于模板匹配的辦法、基于紋理和形狀結(jié)合的辦法。另一種劃分方式是根據(jù)將行人與否作為整體進行檢測,能夠分為基于整體的檢測和基于部位的檢測。前面我們在第二章已經(jīng)學(xué)習(xí)到了HOG算法,在這一章,我們將進一步研究HOG算法。首先,我們需要對每幀圖像進行特性提取,然后將提取的特性訓(xùn)練生成分類器。根據(jù)提取特性的映射分類不同,分類器模型有能夠分為鑒別模型和生成模型。由于運用的是特性之間的近似性,生成模型重要從統(tǒng)計分類學(xué)角度計算特性的聯(lián)合概率。它所針對的是特性之間的相似性,與之相反的是鑒別模型,鑒別模型是根據(jù)特性之間的差別性進行的。在訓(xùn)練分類的過程中,不停尋找不同特性所對應(yīng)的最優(yōu)分類辦法。鑒別模式最典型的代表是SVM算法,該辦法從樣本學(xué)習(xí)帶檢測,目的的有關(guān)分類特性。通過樣本學(xué)習(xí)、樣本訓(xùn)練之后,生成最優(yōu)的分類面,在不同環(huán)境條件下,SVM都有比較好的適應(yīng)性。現(xiàn)在,針對SVM算法進行改善的算法諸多,該算法的優(yōu)越性使之越來越流行。3.2HOG特性原理3.2.1HOG特性算法思想,Dalal在CVPR會議上提出方向梯度直方圖(HOG),該算法的特性是通過統(tǒng)計和計算圖像局部區(qū)域的HOG來獲取的,在圖像解決與識別領(lǐng)域被稱為描述物體的特性算子。該算法的核心思想為:假設(shè)訓(xùn)練的樣本大小為64*64像素。第一步,將該64*64像素的樣本劃分成小的連通區(qū)域即cell,每個cell的大小不妨設(shè)為8*8像素,這樣樣本圖像就被劃分成8×8=64個cell。二步將每個cell中的各像素點的邊沿或者梯度的直方圖采集出來。接下來把這些采集來的直方圖進行整合形成特性描述算子。然而為了提高HOG算法的性能,普通將相鄰的4個cell劃分為一種block。圖3-1為HOG特性模板,其中寬W:H之比為1:1。圖3-1HOG特性模板隨著每個細(xì)胞單元的滑動而形成block,block每一次滑動一種cell的寬度,對于一種64*64的圖我們能夠得到49個block。圖3-2是描述block與cell的關(guān)系:圖3-2block與cell的關(guān)系在劃分大小為8*8像素的cell后,接下來采用9個bin的直方圖去統(tǒng)計cell的每個像素的梯度信息。用梯度方向?qū)ell內(nèi)每個像素在直方圖中進行加權(quán)投影,就得到了該cell的梯度方向直方圖,如圖3-3所示。最后將各個cell組合成大的、連通的blocks。就這樣,在一種block內(nèi)四個cell的特性向量能夠串聯(lián)起來就能夠得到該block的HOG特性。因此,每個cell的特性以不同的特性出現(xiàn)在最后的HOG特性向量中。歸一化之后的block描述符就是HOG特性描述算子。圖3-3梯度劃分3.2.2HOG特性算法的實現(xiàn)HOG特性算法實現(xiàn)用下面流程圖如圖3-4表達(dá)圖3-4HOG算法流程圖首先第一步將圖片進行歸一化解決,由于圖片的顏色信息作用并不大,加上壓縮解決能夠有效的改善圖片局部陰影和光照的影響。普通首先將待檢測的圖片轉(zhuǎn)化為灰度圖,壓縮公式為:3-(1)其中g(shù)amma=1/2;接下來計算進一步計算梯度方向值,這樣不僅能夠進一步減小光照的影響,并且能夠獲得圖像的各個輪廓,各個像素點的梯度計算公式為:3-(2)3-(3)式中Gx(x,y)、Gy(x,y)、H(x,y)分別表達(dá)輸入圖片的像素的水平梯度、垂直梯度、和像素點。像素點(x,y)處得幅度值和梯度方向分別為:3-(4)3-(5)第三步是計算每個cell的梯度直方圖,并進行規(guī)定的權(quán)重投影。第四步是將單一的cell合成大的block,并計算塊內(nèi)梯度直方圖。用來進一步解決部分關(guān)照的變化以及對比度的變化。并且歸一化形成HOG描述符。第五步是對于每一種重疊block塊內(nèi)cell進行對比度歸一化,并把全部block內(nèi)的直方圖向量一起組合成一種大的HOG特性向量3.2.3HOG特性算法的實驗成果實驗一:在正常條件下,行人特性比較明顯的條件下,使用原則庫的HOG算法對輸入圖片進行解決,成果如圖:圖3-5HOG檢測實驗一從圖中可知,在特性明顯的條件下,HOG算法檢測效果較好,圖中全部人都能夠檢測出來。實驗二:行人特性為側(cè)面時,HOG算法檢測成果如圖:圖3-6HOG檢測實驗二從圖3-6中的檢測成果能夠看出,當(dāng)行人側(cè)面出現(xiàn),并且身體部分遮掩時,hog算法出現(xiàn)漏檢現(xiàn)象。這與檢測的精確度有關(guān)同時也與樣本數(shù)量以及行人特性的多樣性有關(guān)。實驗三:夜間圖片檢測,檢測成果如圖:圖3-7HOG檢測實驗三從圖中檢測成果可知在夜間行人特性不明顯的條件下,hog算法檢測效果不太好,這由于夜間環(huán)境復(fù)雜,行人的特性與周邊的環(huán)境背景很相似,很容易造成漏檢的狀況?,F(xiàn)在這些都是諸多學(xué)者正在解決的問題。實驗四:當(dāng)圖像像素含糊,但特性明顯的狀況下,檢測的成果,如圖所示圖3-8HOG檢測實驗四從圖中的檢測成果可知,及時像素不太好的狀況下,只要行人特性明顯,hog檢測效果明顯。3.3HOG特性算法的優(yōu)缺點

HOG特性算法想對于其它特性描述算法有諸多優(yōu)點。首先,在圖片的局部細(xì)胞單元格上操作是HOG的一大特點,這樣它對圖片的光學(xué)和幾何的變化都有較好的適應(yīng)性,因此,HOG算法對這兩種形變的解決是其它算法無法比擬的。另首先,在某些特定環(huán)境條件下,只要行人的特性大致上比較明顯,即使行人在動作特性上有某些細(xì)小的變化,檢測成果也同樣不會受到任何的影響。因此,HOG特性算法在行人檢測領(lǐng)域特別受歡迎,但是HOG算法設(shè)計復(fù)雜,訓(xùn)練時間較長,檢測時間也很長,給檢測帶來很大的延時,不符合行人檢測實時性的規(guī)定。

4基于HOG和SVM的行人檢測4.1引言 通過前兩章的介紹,我們對HOG算法和SVM算法有了初步的理解。在這一章,我們將要進一步學(xué)習(xí)HOG算法和SVM算法。在前兩章,我們學(xué)習(xí)到,HOG算法和SVM算法都有各自的優(yōu)點和缺點,那么這一章我們將研究如何將兩者巧妙的結(jié)合,發(fā)揮各自的優(yōu)勢,較好的解決在多個條件下,行人檢測的效果。使檢測的效果更加精確,實時性更高,算法實現(xiàn)更容易。4.2SVM分類器的介紹在機器學(xué)習(xí)中,支持向量機(SVM)是與有關(guān)的學(xué)習(xí)算法有關(guān)的監(jiān)督學(xué)習(xí)模型,重要用于分類和回歸分析。例如現(xiàn)在在一種p維的空間中有兩個由一系列的數(shù)據(jù)形成的數(shù)據(jù)集合,每個數(shù)據(jù)僅屬于其中一種集合,為了擬定新的數(shù)據(jù)點事屬于哪一種集合,支持向量機會將將每一種數(shù)據(jù)都當(dāng)作一種p維向量,然后通過計算分類,找出能夠?qū)蓚€數(shù)據(jù)集合分開的p-1維的超平面。因此支持向量機也叫做線性分類器。尚有許多超平面,可能對數(shù)據(jù)進行分類。如果存在一種超平面使全部的數(shù)據(jù)不出錯地分類,同時每類數(shù)據(jù)與超平面的距離近來的向量距離最大,那么這個超平面稱之為最優(yōu)超平面?;赟VM的算法不僅有運算速度快的優(yōu)點,并且實現(xiàn)較容易、運算效率高的特點,但是SVM算法也有某些局限性之處:(1)普通,行人檢測中的正樣本和負(fù)樣本在數(shù)量上有很大的不同,就會出現(xiàn)樣本不均衡的問題,分類器的分類面偏向于樣本少的一方,而過于關(guān)注樣本多的一方,這樣會使分類器的精度大大減少。(2)由于過于關(guān)注弱分類器的精度,這樣造成過擬合現(xiàn)象。4.3HOG和SVM的改善及結(jié)合 普通SVM算法關(guān)注的是在正樣本和負(fù)樣本數(shù)量相隔不大條件下的問題,但是當(dāng)正樣本和負(fù)樣本數(shù)量相差很大時,直接使用SVM算法,會造成降分類器的分類精度減少諸多。針對這一問題,本文做的的解決是,首先通過HOG特性提取足夠的正負(fù)樣本,通過大量HOG提取的樣本并使用SVM進行分類,這樣能夠解決分類器解決精度,進而提高行人檢測的精度。通過HOG特性提取的訓(xùn)練樣本能夠較好適應(yīng)多個狀況下檢測和識別。 另首先,通過HOG特性提取的樣本投入SVM分類器進行樣本訓(xùn)練。通過將大量的正負(fù)樣本進行訓(xùn)練,能夠得到model,然后由得到的model生成檢測因子,接下來使用生成的檢測因子去檢測負(fù)樣本,得到hardexample,最后提取hardexample中的hog特性,并與hog特性的負(fù)樣本一起投入訓(xùn)練生成最后的檢測因子。 改善的hog+svm算法,通過增加訓(xùn)練的樣本、改善hog算法的多個參數(shù),以及改善svm分類器的各個參數(shù),這樣能夠達(dá)成兩種算法結(jié)合的最優(yōu)狀態(tài)。檢測的效果能夠適應(yīng)多個環(huán)境,并且檢測速度也更加緊速,實時性更強。4.4實驗過程及解決整個實驗過程大致如圖4-1所示:圖4-1實驗成果流程圖實驗過程中的部分正負(fù)樣本如圖4-2、圖4-3,實驗過程中的代碼部分見附錄。圖4-2訓(xùn)練的正樣本圖4-3訓(xùn)練的負(fù)樣本4.5實驗成果及分析實驗一:在正常條件下,行人特性比較明顯的條件下,使用本文算法對圖片就行檢測得到以下成果:圖4-4實驗一成果從圖中我們能夠看到,檢測矩形窗口較好地識別了每一位行人,固然,在這里全部人的特性比較明顯,并且背景干擾也比較小。因此在整個解決效果上是非常好的,并且也比較符合普通的行人特性。同時也闡明了本文所涉及的算法的檢測效果是非常好的,在正常狀況下,不會產(chǎn)生錯誤的識別或者遺漏某些行人。并且訓(xùn)練時間比HOG算法短了許多,檢測時間實時性更高。實驗二:行人側(cè)面特性檢測效果。從圖中我們看到,被攝像頭側(cè)面抓拍的行人,在通過HOG+SVM算法解決之后,能夠精確的識別出來。同時,我們也能注意到距離較遠(yuǎn)的兩個行人并未識別。這與算法本身精度有關(guān),以及那兩位行人距離較遠(yuǎn)特性識別不明顯,造成漏檢。圖4-5實驗二成果圖實驗三:在圖片清晰度不高的條件下,訓(xùn)練特性對圖片的檢測效果。圖4-6實驗三成果圖從圖中檢測的成果,我們能夠容易的看出即使在圖片清晰度不高的條件下,只要行人的特性比較明顯,本文的算法檢測顯示了極大的優(yōu)勢,在較短時間里就能完全識別全部行人。HOG+SVM顯示了其良好的性能及解決的效果。比較符合實際生活中多個狀況下的行人檢測,因此該算法兼?zhèn)淞薍OG和SVM特性的優(yōu)點,同時,我在設(shè)計算法時巧妙的選用適宜的參數(shù),是的解決精度更加完善。實驗四:在此實驗中,我選獲得圖片是一張夜間行人圖片,用于對比分析白天的解決效果。在夜間,圖像的亮度和光度較差,很容易造成誤檢以及漏檢,夜間的背景環(huán)境也比白天復(fù)雜的多。解決效果如圖所示:圖4-7實驗四成果圖從圖中能夠看到,左邊兩個人被樓檢了,分析其因素,有兩點。第一,在夜間燈光不明顯,圖片本身效果比較差,造成訓(xùn)練樣本在檢測圖片時出現(xiàn)了漏檢。第二,兩個均穿的黑色的衣服,整體效果與左邊墻體相融,造成特性判斷出現(xiàn)錯誤,誤將行人當(dāng)成墻體。對于解決這一類問題,現(xiàn)在有許多研究人員正在進行研究,都在嘗試找到最佳的解決辦法去改善特性不明顯,被誤判漏檢的狀況。將改善的HOG+SVM算法在INRIA庫上進行測試,測試成果如圖4-8:圖4-8HOG+SVM在INRIA庫上測試成果 通過多次實驗,通過本文改善的算法檢測多個環(huán)境下大量的行人圖片,我們通過對比,我們會發(fā)現(xiàn),改善后的HOG+SVM,不僅在精確度上有了較好的改善并且在檢測時間大大減小。改善后的算法在檢測精確度上為95%,基本處在誤差允許范疇內(nèi),充足闡明本文改善的算法的性能較好。

5總結(jié)與展望 隨著計算機科學(xué)技術(shù)與計算機視覺技術(shù)的發(fā)展,行人檢測技術(shù)會越來越成熟。在計算機技術(shù)高速發(fā)展的今天,機器學(xué)習(xí)更加智能,在生活各個方面,都會應(yīng)用行人檢測技術(shù)。例如,智能交通方面、交通安全領(lǐng)域、公共場合的智能監(jiān)控等各個領(lǐng)域都會涉及行人檢測技術(shù)。因此,行人檢測技術(shù)會不停發(fā)展,識別和檢測的精度會越來越高,解決的速度會越來越快,這必將是一種趨勢,行人檢測技術(shù)必將更加好的造福于我們每一種人。 在本文中,我們首先介紹了行人檢測的有關(guān)技術(shù),以及現(xiàn)在存在的主流算法,以及研究的成果。接著,我介紹了現(xiàn)在行人檢測的重要有關(guān)算法,并對各個算法進行了比較。隨即,我們介紹了HOG+SVM算法,并在本文中進行了改善。最后使用我們改善的算法解決含有多個特性的行人圖片,并對解決成果進行了分析與對比。 簡樸來講,本論文的創(chuàng)新點在于下列幾點:1、在本文中,通過使用HOG特性,SVM分類器結(jié)合的辦法來實現(xiàn)行人檢測。2、通過改善HOG特性與SVM分類器,是結(jié)合的算法有更加好的兼容性,并發(fā)揮各自算法的優(yōu)點,使得識別效果與檢測效果更加良好。3、改善后的算法不僅含有檢測精度高,整體的識別效果也更加完備,實時性更強,檢測時間和訓(xùn)練時間都有減短。但是,本文所研究的HOG+SVM算法仍有某些局限性,即使這一改善的算法在解決速度和精度上有了較好的提高,但是在某些條件下,例如對黑夜里拍攝的圖片,會出現(xiàn)漏檢現(xiàn)象,這些問題仍需要進一步解決。接下來需要進一步的研究有兩個方面,一是找到更加好的特性算法,以提供檢測的精度,能夠較好的解決漏檢現(xiàn)象;二是找到更加好的的算法,在檢測之后,使用更加好的算法來判斷和評定特性與否符合。

參考文獻[1]XuFL,LiuX,FujimuraK.Pedestriandetectionandtrackingwithnightvision[J].IEEETransactionsonIntelligentTransportationSystems,,6(1):63-71[2]ZhaoL,ThorpeC.Stereoandneuralnetwork2basedpedestriandetection[J].IEEETransactionsonIntelligentTransportationSystems,,1(3):148-154[3]MohanA,PapageorgiouC,PoggioT.Example2basedobjectdetectioninimagesbycomponents[J].IEEETransactionsonPatternAnalysisandMachineIntelligence,,23(4):349–361[4]賈慧星,章毓晉.車輛輔助駕駛系統(tǒng)中基于計算機視覺的行人檢測研究綜述[J].自動化學(xué)報,,33(1):84-90[5]GavrilaDM.Pedestriandetectionfromamovingvehicle[A].ProceedingsofEuropeanconferenceonComputerVision[C].London,UK:Springer,.1843.37-49[6]BertozziM,BroggiA,LasagniA,RoseMD.Infraredstereovision-basedpedestriandetection[A].ProceedingsofIEEEInternationalConferenceonIntelligentVehiclesSymposium[C].LasVegas,USA:IEEE,.24-29[7]LiptonA.Localapplicationofopticflowtoana

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論