




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、1.緒論1.1研究背景及意義當(dāng)今社會是一個人口密集,高度復(fù)雜的社會,面臨的突發(fā)事件和異常事件越來越多,其監(jiān)測的難度和重要性也越來越突出?,F(xiàn)有的視頻監(jiān)測系統(tǒng)大多數(shù)只是進(jìn)行場景內(nèi)運動目標(biāo)的監(jiān)測和跟蹤,進(jìn)行進(jìn)一步識別與行為理解等很少,雖然人們不斷建立越來越大的視頻監(jiān)控系統(tǒng),但這些監(jiān)控系統(tǒng)也幾乎淪為一種提供事后取證錄像的工具。然而,監(jiān)控的目的就是對監(jiān)視場景中的異常事件或監(jiān)控對象的行為進(jìn)行檢測與分析。在長時間視頻序列中采用人工處理此類工作既不實用也不經(jīng)濟(jì),因此在視頻監(jiān)控序列中進(jìn)行一場檢測十分重要而且必要。群體異常事件檢測作為一種應(yīng)現(xiàn)實迫切需求而產(chǎn)生的研究領(lǐng)域,正受到越來越廣泛的關(guān)注。群體異常事件檢測旨在
2、從視頻數(shù)據(jù)中發(fā)現(xiàn)隱藏著的、能刻畫群體異常事件的特有的信息,并通過學(xué)習(xí)的方法訓(xùn)練檢測模型,當(dāng)下次有類似異常事件發(fā)生的時候,能夠自動并及時的發(fā)出警報,以幫助人們及時的決策處理異常事件,避免事態(tài)進(jìn)一步的擴(kuò)大。該領(lǐng)域的研究具有廣泛的應(yīng)用前景,己成為當(dāng)前研究的熱點之一。群體異常事件檢測系統(tǒng)的漏報與錯報必然會給人們帶來巨大的困擾和損失。目前已有的各種群體異常檢測算法大都在檢測的準(zhǔn)確率和時間效率上不盡人意,都不能應(yīng)用于實際應(yīng)用。因此,有必要對群體異常檢測算法進(jìn)行更深入研究,開拓新思路,提出新算法,以提高準(zhǔn)確率和時間效率,降低漏報錯報率,進(jìn)而能夠更加快速高效地檢測出聚集場景中的異常行為,提供更有價值的信息。國
3、內(nèi)外研究動態(tài)及主要研究方法人類行為分析這一方向早已引起了人們的關(guān)注,1850年,E.J.MareyandE.Muybridge等拍攝運動的目標(biāo),并發(fā)現(xiàn)了人類及動物的運動中出現(xiàn)的許多令人驚喜的現(xiàn)象。近年來,隨著相關(guān)學(xué)科的發(fā)展,人類的運動分析作為計算機視覺的一個熱點方向,吸引了大量的研究人員,美國、英國等發(fā)達(dá)國家,已經(jīng)開始了大量人類行為識別項目的研究。1997年美國國防高級研究項目署(DefenseAdvancedResearchProjectsAgency)與卡內(nèi)基梅隆大學(xué)、麻省理工學(xué)院等諸多高校合作研究視覺監(jiān)控的重大項目VSAM(VisualSurveillanceAndMonitoring)
4、,主要是研究對戰(zhàn)場及普通民用場景下的目標(biāo)行為識別技術(shù);美國賓夕法尼亞州大學(xué)研究的三維人體頭部及臉部跟蹤系統(tǒng),采用了有限元素模型對人臉動作進(jìn)行實時跟蹤;Microsoft公司也推出了3D體感攝影機Natal,逐步將基于視覺的人機交互接口應(yīng)用到商業(yè)領(lǐng)域中。人類群體異常行為的檢測是人類行為識別的重要組成部分,這一領(lǐng)域的研究最近成為了熱點。RaminMehran等提出在圖像中建立粒子,利用SFM(SocialForceModel)描述粒子與周圍空間的相互作用力,用力的強度來描述視頻圖像中行人行為,然后構(gòu)建局部時空立方體并建立Bag-of-words模型,達(dá)到了較好的效果;ShandongWu等也采用了
5、一種粒子流動的方式,利用粒子的軌跡來描述局部的軌跡運動,實現(xiàn)了異常行為的檢測與定位;針對極端擁擠場景中的異常行為檢測問題,Louis和Kratz使用基于梯度的時空模型描述場景運動信息,并用HMM來捕獲時空模型之間的關(guān)系;VijayMahadevan等人用MDT模型化視頻序列,然后分別檢測模型在時空和空間上的異常,整合后判斷異常行為是否出現(xiàn);RaminMehran等人提出用脈線來表征擁擠的場景,清晰的描述了復(fù)雜場景下的人群行為。目前,國外比較有代表性的實時系統(tǒng)有:(1)MIT的Plinder系統(tǒng)這個系統(tǒng)能用來實時地跟蹤人,并分析理解人的行為,通過固定的攝像頭,它可以適應(yīng)不同類型的場景,但只能處理
6、單個沒有被遮擋的人體,并且要求人是站立的CMU的VSAM系統(tǒng)1997年美國國防高級研究部署DARPA(DefenseAdevancedResearchProjectsAgency)設(shè)立了以卡內(nèi)基梅隆大學(xué)(CarnegieMellonUniversity)為首,麻省理工學(xué)院(MassachusettsInstituteofTechnology)等高校參與的視覺監(jiān)控重大項目VSAM(VisualSurveillanceandMonitoring),主要研究用于戰(zhàn)場一普通民用場景進(jìn)行監(jiān)控的自動視頻理解技術(shù)。利用虛擬場景中的虛擬物體來代替人力監(jiān)控費用昂貴,非常危險或者人力無法實現(xiàn)等場合的監(jiān)控Haril
7、aoglu的W4系統(tǒng)Maryland大學(xué)的Haritaolu等人開發(fā)了W(What,Where,When,Who)系統(tǒng)。是一個全面的人體動作的實時視覺監(jiān)控系統(tǒng),W不僅能夠定位人和分割出人的身體部分,而且能夠通過家里外觀模型來實現(xiàn)多人的跟蹤,并可以檢測人是否攜帶物體簡單行為,還可以進(jìn)行人的標(biāo)準(zhǔn)姿勢,如:站,做,躺,臥的行為識別。此外,美國的雷丁大學(xué)(UniversityofReading)已經(jīng)開展了對車輛和行人的跟蹤機器交互作用識別的相關(guān)研究:IBM與Microsoft等公司也正逐步將基于視覺的手勢識別技術(shù)應(yīng)用于商業(yè)領(lǐng)域中,當(dāng)前,國際上一些權(quán)威期刊將人的運動分析研究作為主題內(nèi)容之一,為該領(lǐng)域研究
8、人員提供更多的交流機會。在國內(nèi),目前開展這方面研究的單位主要有中國科學(xué)院計算技術(shù)研究所、中國科學(xué)院自動化研究所、浙江大學(xué)人工智能研究所等。雖然人類運動分析還屬于一個新興的研究領(lǐng)域,但卻取得了良好的成績。例如,由中國科學(xué)院計算所研究的“三維人體運動仿真技術(shù)的定量輔助分析系統(tǒng)”“數(shù)字化三維人體運動的計算機仿真和分析技術(shù)”和“基于視頻分析的技術(shù)”。這些科研成果在雅典奧運會上得到了實際的應(yīng)用,并且取得了巨大的成就。中國科學(xué)院自動化研究所對人類的步態(tài)進(jìn)行分析識別,進(jìn)而判定人類的身份。浙江大學(xué)主要研究人體動畫,從視頻流提取動畫信息,替代傳統(tǒng)運動捕捉設(shè)備。微軟亞洲研究院多媒體研究高級人機交互手段。例如,通過
9、對手勢語言的理解,還可以進(jìn)行聾人與計算機之間的手語交流。盡管在人類簡單行為研究中取得了一定成果,但國內(nèi)的人類群體異常行為研究還處于一個發(fā)展的階段,隨著這一領(lǐng)域研究的深入及需求的提升,必然會有更多的研究者將精力投入到這一方向。人的行為分析研究在視頻監(jiān)控系統(tǒng)中的應(yīng)用往往關(guān)注與人的異常行為,目前,異常行為檢測的實現(xiàn)方法通常有兩類:(1)把小概率行為或與先驗規(guī)則相反的行為看作異常行為(2)把與已知正常行為的模式不匹配的行為看作異常行為1.3論文的主要內(nèi)容及結(jié)構(gòu)安排本文研究群體異常行為的檢測,提出了一種具有一定創(chuàng)新意義并可行的方法。本文重點對群體異常行為識別中的關(guān)鍵技術(shù)進(jìn)行了如下研究:(1)根據(jù)人類群體
10、運動的視頻中存在時間和空間方向上劇烈變化的位置的特點及時空特征點方法在簡單人體行為識別中取得的成功,提出了用時空特征點來描述人類群體的運動,選擇了魯棒方法Gabor小波函數(shù)方法用來提取時空特征點,通過實驗驗證了這種方法可以有效的解決人類群體異常行為檢測問題。在時空特征點的描述符建立階段,引入了時空Haar特征構(gòu)建描述符利用高斯混合模型對正常行為的特征點集建立模型,為每個關(guān)鍵詞分配不同的概率權(quán)重,并且準(zhǔn)確的描述了不同類別出現(xiàn)的概率和輸入的時空特征屬于各個類別的概率。(2)為正常行為以及異常行為中的每個視頻片段建立視頻向量,將生成的視頻向量對SVM進(jìn)行訓(xùn)練以及學(xué)習(xí),輸入已知類別的測試視頻,利用已訓(xùn)
11、練好的SVM對視頻進(jìn)行群體異常行為的測試,根據(jù)已知數(shù)據(jù)和得出的結(jié)果分析研究,得出SVM的識別率,并根據(jù)實際的結(jié)果對SVM進(jìn)行參數(shù)調(diào)整和進(jìn)一步的完善。對已經(jīng)完善的SVM分類器進(jìn)行未知視頻的預(yù)測,初步用于檢測群體行為是正?;蚴钱惓U撐母髡聝?nèi)容安排如下:第一章緒論,研究背景意義、國內(nèi)外研究現(xiàn)狀、論文的主要內(nèi)容及文章的結(jié)構(gòu)安排。第二章時空特征點的提取與描述符的構(gòu)建,利用基于高斯和Gabor小波響應(yīng)函數(shù)時空特征點檢測方法提取時空特征點:然后闡述了對時空特征點的描述,采用了基于時空Haar特征描述符建立方法,通過描述符聚類建模,產(chǎn)生輸入向量,第三章詳細(xì)介紹了SVM的理論,闡述SVM的應(yīng)用。對描述符聚類建模
12、生成描述向量,將正常行為視頻和異常行為視頻分別以時間為單位劃分為N幀,分別對每幀進(jìn)行聚類生成描述向量并生成視頻向量,這章中主要介紹了EM方法,混合高斯模型方法的基本原理,以及如何用基于EM的混合高斯模型估計模型的參數(shù),輸入視頻向量對SVM進(jìn)行訓(xùn)練,對已知的視頻作為輸入視頻對SVM進(jìn)行分辨率的檢測,達(dá)到較高的分辨率后,對未知視頻進(jìn)行檢測第四章實驗數(shù)據(jù)結(jié)果與分析。分別闡述了時空特征點的提取,描述符的構(gòu)建,并對試驗結(jié)果進(jìn)行分析。第五章總結(jié),本章總結(jié)了本文所做的工作,成果和不足之處。2.視頻底層運動特征的提取及聚類建模2.1時空特征點對人體運動進(jìn)行特征提取是行為識別的關(guān)鍵。人體運動特征存在于視頻圖像中
13、時間和空間方向像素值發(fā)生劇烈變化的位置,因為它們往往包含了豐富的信息,同時也具有較強的穩(wěn)定性。通過離散的特征點捕獲表征這些位置就可以有效的描述人體行為,通常這些點我們稱作為特征點。基于高斯和Gabor小波函數(shù)提取時空特征點時空特征點有能力捕獲視頻中人體的劇烈運動,并已經(jīng)應(yīng)用于簡單行為識別中,因此我們可以將其合理的應(yīng)用于群體異常行為檢測中。如何提取時空特征點是進(jìn)行群體異常行為檢測的關(guān)鍵。本章選用的是基于高斯和Gabor小波函數(shù)的檢測方法。Dollar等人提出任何進(jìn)行非勻速運動的人體區(qū)域都可以看作是時空特征點,使用簡單的檢測器也可以獲得稠密的時空特征點。Dollar方法未直接擴(kuò)展二維空間檢測器,而
14、是提出了一種新的檢測器,這種檢測器基于高斯和Gabor小波函數(shù),在本質(zhì)上借鑒了Gabor小波在圖像分析中取得的成功。在這種方法中,通過計算視頻流時空中每一個像素點處的二維空間高斯和一維時間Gabor小波函數(shù)響應(yīng)值來確定時空特征點,若視頻三維空間中某點響應(yīng)值為局部極值且大于某一閾值,則認(rèn)為該極值點為時空特征點。響應(yīng)函數(shù)定義為:R=(I*g*h)2+(I*g*h)2(2-1)evod其中,I為視頻流圖像,g(x,y;J為二維空域高斯平滑濾波器,h和h為一維Gabor時域濾波器,evod定義分別為:h(t;T,)=cos(2兀te)e-12/t2ev(2-2)h(t;T,)=sin(2兀te)e-1
15、2t2odb和t分別為空域和時域尺度,二4弋。在時空特征點的尺度選擇問題上,Dollar認(rèn)為基于這種響應(yīng)函數(shù)的時空特征點檢測器受尺度變化的影響較小,可以忽略。而以該方法為基礎(chǔ)進(jìn)行人類簡單行為識別的研究中,研究者一般都采用在時間和空間上離散的取多尺度進(jìn)行組合,用有限的固定尺度近似所有可能出現(xiàn)的尺度,因此來解決尺度問題。圖2-1為根據(jù)Dollar方法對簡單場景下不同行人走路行為提取的時空特征點分布圖,盡管人類的性別、背景、尺度不同,但他們的時空特征點分布具有相似性,都出現(xiàn)在運動較為劇烈的腿部,而產(chǎn)生平移運動的身體上半部分幾乎不出現(xiàn)時空特征點。由此可知,人類行為產(chǎn)生的劇烈變化可以用Dollar方法提
16、取時空特征點來描述。(c)圖2-1根據(jù)Dollar方法對不同行人走路行為提取的時空特征點分布圖Fig.2-1DifferentpersonSTIPsextractionresultsinwalkingactionbasedonDollar2.3時空特征點的描述時空特征點雖然反映了人體運動空間結(jié)構(gòu)發(fā)生顯著變化的位置,但它們只是一些孤立的點,只有這些點的位置信息很難判斷人類的行為。因此,通常需要利用特征點周圍的時空信息對這些點進(jìn)行描述,描述的過程即為時空特征點的描述符構(gòu)建過程。描述符為從時空特征點為中心的小立方體中提取的具有描述意義的一維向量,一般包含了局部的梯度、光流等信息。正常行為與異常行為的
17、時空特征點分布有一定差別,其描述符也必然存在較大不同。因此,充分的利用時空特征點描述符包含的信息是區(qū)分正常行為與異常行為的關(guān)鍵。本文使用的是時空Haar特征進(jìn)行描述符的構(gòu)建。時空Haar特征Haar特征是一種有效圖像特征,它克服了傳統(tǒng)的灰度特征計算速度慢的缺點,時空Haar特征的使用是基于視頻空間中存在灰度變化的區(qū)域,如人抬手時,在圖像平面上和時間軸上都會發(fā)生灰度值的改變。YanKe等的成功說明時空Haar特征有能力捕獲人類行為運動,他們使用的三種時空Haar特征如圖2-2所示。圖2-2三種時空Haar特征Fig.3-6Threetypesofspatial-temporalHaarfeatu
18、re為了計算描述符,GeertWillems方法使用了三種時空Haar特征,這種描述符各分量與時空特征點之間是位置相關(guān)的,在簡單人類行為識別中獲得較好的效果。但我們研究的人類群體行為中,人類的行為往往不一致,運動方向也不盡相同,而且,人與人之間有可能存在重疊與遮擋。因此,描述符各分量與時空特征點之間最好具有位置無關(guān)性,且能捕獲一定范圍內(nèi)的運動變化信息。為了更加準(zhǔn)確、豐富的描述時空特征點的時空信息,采用了XinyiCui使用的L,L,L,L,L,L,L7種時空Haar特征,特征結(jié)構(gòu)如圖2-3所示。xytytxtxyxyt圖2-37種時空Haar特征Fig.2-3Seventypesofspati
19、al-temporalHaarfeature為了構(gòu)建時空Haar特征描述符,以每個時空特征點為中心選取一個時空立方體,即在時空特征點周圍M*M*N范圍內(nèi)計算各點的Haar特征,每個點都用一個7維向量Q,L,L,L,L,L,L)來描述。在所有點的特征計算后,將所xytytxtxyxyt有點的特征向量進(jìn)行直接求和操作,則得到7維的描述符向量。描述符向量D為:2-3)D=EL,工L,工L,工L,工L,工L,工LxytytxtxyxytD為7維向量。為了使描述符使應(yīng)不同的尺度、光照等,在計算各維Haar特征值時,都采用了最大最小值歸一化。最終的描述符D的各維為:D=D/Normiii其中,Norm=m
20、ax(D)-min(D),i=l,27。iii下面詳細(xì)介紹了對描述符聚類原理和高斯混合模型建模。2.4混合模型聚類原理混合模型建模實質(zhì)上是將給定數(shù)據(jù)集X=x,X中的數(shù)據(jù)劃分到它最ln可能歸屬的類中去(或成分中去),首先要確定數(shù)據(jù)集X的可能性最大的標(biāo)簽向量集Z=Z,Z,設(shè)X的標(biāo)簽向量記為Z=(z,z)t,若X的所在的類已lniiiliGi1X在第k類中經(jīng)被確定(如X在第k類中),則z=ti在第類中。iik0其匕一般認(rèn)為Z為相互獨立的隨機變量,并且有p(z=1卩)=兀,因此Z服從多iikki項分布,記為ZM(兀兀),(i=1,n,k=1,G)。想要獲得數(shù)據(jù)集X的可iG1G能性最大的標(biāo)簽向量集,就要
21、合理的從數(shù)據(jù)集中估計出模型的參數(shù)值0,使得VXeX都能確定它可能性最大的標(biāo)簽。i標(biāo)簽向量集Z可以看作是隱含在數(shù)據(jù)集X中的變量集,若混合模型中各混合成分的類型是明確的(如高斯類型),并且對數(shù)據(jù)學(xué)習(xí)后可知0的極大似然估計為小,就可以得到數(shù)據(jù)集X中觀察數(shù)據(jù)X歸屬于某一類的概率t,計算表示iik式如公式(2-4)所示:t(X10)=p(z=11X;0)=兀kh(X5(1in),(1k0;兀kkkk=1若f(x0)服從多元正態(tài)分布,即高斯分布,則這種混合模型就稱為高斯混ki、k合模型(GMM)?;旌夏P偷腉個成分就是G個獨立同分布的高斯分布,模型中參數(shù)0包含均值卩和協(xié)方差矩陣工兩部分。概率密度函數(shù)f(x
22、0)的形式kkkkrk為:因此式(2-7)所示exp(2兀)p/21.)TT2i*kkik1/22-6)k該概率分布可以用G個高斯概率密度函數(shù)的加權(quán)平均來描述,如公ki2-7)P(x0)=f(x卜,)kk1kkk=1其中,兀為混合模型中高斯概率密度函數(shù)的權(quán)重。高斯混合模型的構(gòu)成如k圖2-4所示。p(九IX)卩1,卩2GG圖2-4高斯混合模型示意圖Fig.2-4Gaussianmixturemodeldiagram由此可見,高斯混合模型中的各個分量p可通過均值向量卩和協(xié)方差矩陣kk進(jìn)行描述,因此高斯混合模型可用參數(shù)集進(jìn)行表示,其形式為九二,工(k=1,2,kkk,G)。聚類是以均值巴為中心的橢圓
23、體的分布。其它的幾何學(xué)性質(zhì)(方向,體積,形狀)是由協(xié)方差矩陣工決定的。Banfield和Raftery等人提出了分解工的kk特征值的模型聚類的框架為:工二九DADt。kkkkk2.6EM算法的含義及原理EM算法是一種迭代算法,基本原理可以表述為3:把可以被觀察到的數(shù)據(jù)看作Y,缺失數(shù)據(jù)看作Z,則完全數(shù)據(jù)X二(Y,Z)。設(shè)模型的參數(shù)為。,0關(guān)于Y的后驗分布p(0|Y)具有較高的復(fù)雜度,如果缺失數(shù)據(jù)Z已知,則可以得到一個關(guān)于0的后驗分布p(0|y,z),然后考慮Z,又可以對Z的假設(shè)作進(jìn)一步的檢查和調(diào)整。如此循環(huán)計算,就會將復(fù)雜的極大化抽樣問題轉(zhuǎn)化成簡單的極大化或抽樣問題。EM算法的循環(huán)迭代中包含兩個
24、步驟,即E步和M步。E步(ExpectationStep)為期望步,M步(MaximumLikelihoodStep)為極大似然步。2.7聚類的EM算法假設(shè)存在完整數(shù)據(jù)集Y二(X,Z),其中X=x,x是觀察到的不完整的數(shù)1n據(jù)集,Z為代表著缺失數(shù)據(jù)集的隱含變量。在Z中,Zwl,2,M,其中M為i有限正整數(shù)。若完整數(shù)據(jù)集Y=(x,z),(x,z),則完整數(shù)據(jù)集的似然函數(shù)可11nnTOC o 1-5 h z以表示為:L(0|X,Z)=p(X,Z|0)fp(x,z0)Z=(z,z)(2-8)ii1ni=1該似然函數(shù)的期望值為:E(L(0|X,Z)=Jp(X,Z|0)f(Z)dZ(2-9)Z假設(shè)初始參
25、數(shù)為0o,在每次循環(huán)中都會產(chǎn)生新的參數(shù)0;EM算法的每次迭代都由E步和M步兩步組成:E-step:引入輔助函數(shù)Q(0,0(i-1),定義為:Q(0,0(i-1)=E(logL(0|X,Z)=JlogL(0|X,Z)f(Z0(i-i)dZ(2-10)Z其中,0(i-1)是上一步迭代運算所求出的參數(shù)值。根據(jù)公式中可知輔助函數(shù)Q(0,0(i-1)為0的函數(shù),并且它的值就是logL(0|X,Z)的期望值。M-step:求解0*,使得Q(0*,0(i-1)獲得極大值,即:0*=0*=0(i)=argmaxQ(0,0(i-1)顯然,EM算法能夠保證0*0*及算法的收斂性質(zhì)。i(i-1)在高斯混合模型(GM
26、M)中,設(shè)y=(x,z)為完整數(shù)據(jù),iii變量,z=(z,z)為隱含變量,則:ii1,ziGZik設(shè)z的概率分別為兀,i1的概率密度為:Wf(x|0kik=12-11)x為可觀察到的iifxbelongstogroupkiotherwise2-12)且與G類獨立同分布,通過觀察變量x給出的zii,兀G)嘆。完整數(shù)據(jù)的對數(shù)似然函數(shù)可以表示為:L(0,兀,zx)=茨zlog兀f(xp)(2-13)kkikikkkiki=1k=1在混合模型參數(shù)求解中應(yīng)用聚類的EM算法需要在E-step和M-step之間進(jìn)行迭代。在E-step中,通過觀察變量x和當(dāng)前的參數(shù)估計,可以計算出完整數(shù)據(jù)對數(shù)似然函數(shù)的條件期
27、望z;在M-step中,根據(jù)E-step獲得的值,計算參數(shù)估ik計,即權(quán)重,均值,協(xié)方差矩陣,使得似然函數(shù)值達(dá)到最大。下面給出了高斯混合模型建模中EM算法的計算公式:atki=112-14)p(kx,0t)i兀t=(XtkNk|LXt+1=Nxkati=1i工t+1=丄工Nxkati=1ik兀tp(kx,)其中,p(kx,0t)=ikp(kx,0t)(x-卩t+1)(x-卩t+i)tiivivkk兀tp(kx,0t)工Kj=1J將新的參數(shù),即均值、方差、歸屬類別的先驗概率,帶入E步,循環(huán)迭代計算,直到樣本集合不引起各個類別的似然函數(shù)明顯的變化為止,此時已經(jīng)收斂或滿足結(jié)束條件,算法執(zhí)行結(jié)束。2.
28、8本章小結(jié)本章提出了通過提取時空特征點來描述運動人體的特征,對描述符進(jìn)行建模,是進(jìn)行群體異常行為檢測的關(guān)鍵步驟,通過時空Haar特征構(gòu)建描述符,本文詳細(xì)闡述了使用gabor小波函數(shù)來提取時空特征點,通過時空haar特征實現(xiàn)的是對描述符的構(gòu)建,EM方法的高斯混合模型對描述符建模方法,然后根據(jù)實驗充分驗證了EM的高斯混合模型的準(zhǔn)確性和合理性。3.SVM的基本原理概述3.1支持向量機(SVM)理論支持向量機(SupportVectorMachine,SVM)是近年來在模式識別與機器學(xué)習(xí)領(lǐng)域中出現(xiàn)的新工具,SVM以統(tǒng)計學(xué)習(xí)理論為基礎(chǔ),有效地避免經(jīng)典學(xué)習(xí)方法中過學(xué)習(xí),維數(shù)災(zāi)難,局部極小等傳統(tǒng)分類存在的問
29、題,在小樣本條件下仍然具有良好的泛化能力,因此受到了廣泛的關(guān)注,而且在語音字符識別領(lǐng)域獲得了目前為止最好的性能,在美國的科學(xué)雜志上,支持向量機被稱為“機器學(xué)習(xí)領(lǐng)域中的一個令人矚目的發(fā)展方向”。統(tǒng)計學(xué)習(xí)理論統(tǒng)計學(xué)習(xí)理論(StatisticalLearningTheory)是Vapnik等人在20世紀(jì)70年代末提出并在20世紀(jì)90年代逐漸完善的一種針對小樣本的機器學(xué)習(xí)理論。它的核心問題是尋找一種歸納原則以實現(xiàn)最小風(fēng)險泛函,從而實現(xiàn)最佳的推廣能力。對于二類模式識別問題,設(shè)存在l個學(xué)習(xí)樣本(X,y),(X,y),.,(X,y)11iillyg(-1,+1),學(xué)習(xí)的目的是從一組函數(shù)f(X,W)中求出一個
30、最優(yōu)函數(shù)if(X,W),使在對未知樣本進(jìn)行估計時,期望風(fēng)險0R(W)=JL(y,f(X,W)dF(X,y)最小。VC維數(shù)論統(tǒng)計學(xué)習(xí)理論的一個核心概念就是VC維(VCDimension)概念,它是描述函數(shù)集或?qū)W習(xí)機器的復(fù)雜性或者說是學(xué)習(xí)能力(Capacityofthemachine)的一個重要指標(biāo)一般來說,VC維數(shù)越大則學(xué)習(xí)機器越復(fù)雜.VC維數(shù)是用來度量一個函數(shù)集合的容量的尺度值.它定義為,當(dāng)一個函數(shù)集合的VC維數(shù)為n時,那么存在一個點集x,它的所有可能的(兩類)組合全部n可用該函數(shù)集合分割開,而對于任何大于x的點集x(mn)都不滿足該上述條nm件,即用該函數(shù)不能將其所有可能的組合分割開。例如在
31、平面上的三個點的任意組合都可以用直線分割開,因此平面上直線函數(shù)集合的VC維數(shù)是3。如果對任意數(shù)目的樣本都有函數(shù)能將它們分隔開,則函數(shù)集的VC維是無窮大3.1.3結(jié)構(gòu)風(fēng)險理論統(tǒng)計學(xué)習(xí)理論從vc維的概念出發(fā),推導(dǎo)出了關(guān)于經(jīng)驗風(fēng)險和實際風(fēng)險之間關(guān)系的重要結(jié)論,稱作泛化誤差的邊界。如下的估計真實風(fēng)險的不等式,對于任意ael(I是抽象參數(shù)集合),以至少1-n的概率滿足以下不等式R(a)1,i=1,li點x到超平面(w,b)的距離d(w,b;x)是:d(w,b;x)=3-6)最優(yōu)超平面是在滿足(3-4)的條件下使如下的邊界距離p(w,b)達(dá)到最大的超平面.2p(w,b)=mmd(w,b;x)+mmd(w,
32、b;x)=-(3-7)IIwIIx./y=1.x./y.=1即使下式最小的超平面是最優(yōu)的:0(w)=IIwII-(3-8)-可見在滿足(3-5)的條件下,這時對應(yīng)于超平面,上式與b無關(guān)。改變b只會使該超平面沿自身的法線方向移動,其邊界距離沒有變化,但是這時的超平面不是最優(yōu)的了,因為它離其中某一類會更近些。在滿足(3-5)的條件下求最解優(yōu)化問題(3-7),可根據(jù)Lagrange乘數(shù)法轉(zhuǎn)化為下式的鞍點過程:L(w,b,a)=IIwII-一工a(x*w)+by1(3-9)-.=1其中,a是Lagrange乘子.需要將上式相對于w,b參數(shù)最小化并且相對于.a0最大化.根據(jù)Lagrange對偶原理,該問
33、題可以轉(zhuǎn)換為其對偶問題如下,3-10).maxW(a)=maxminL(w,b,a)相對于w,b使L最小化的方法如下,qly=0nyay=0dbii.=1=0nw=qwyaxy.所以,問題的解是:a=argminyy(x*x)ILaa-.j.j.j.a.=1j=1.=1求出優(yōu)化問題的解,就可以得到最優(yōu)分割超平面如下:圖3-4松弛變量的引入_w=axyiiii=11b=一一wx+x(312)2rs其中x,x是滿足下列條件的任何支持向量.rsf(x)=sgnHa*y(x-x)+b*(313)iii如下圖所示:i=1o圖3-2支持Hi比、Fig.3-2supportvectordomargin=2|
34、m1圖注:被圈定的實心點和空心點為不為零的支持向量的訓(xùn)練點。(2)支持向量機模型概括說,支持向量機就是首先通過用內(nèi)積函數(shù)定義的非線性變換將輸入空間變換到一個高維空間,在這個空間中求廣義最優(yōu)分類面。SVM分類函數(shù)形式上類似于一個神經(jīng)網(wǎng)絡(luò),輸出是中間節(jié)點的線性組合,每個中間節(jié)點對應(yīng)一個支持向量。算法最終將轉(zhuǎn)化成為一個二次型尋優(yōu)問題,從理論上說,得到的將是全局最優(yōu)點,解決了在神經(jīng)網(wǎng)絡(luò)方法中無法避免的局部極值問題;算法將實際問題通過非線性變換轉(zhuǎn)換到高維的特征空間(FeatureSpace),在高維空間中構(gòu)造線性判別函數(shù)來實現(xiàn)原空間中的非線性判別函數(shù),特殊性質(zhì)能保證機器有較好的推廣能力,同時它巧妙地解決
35、了維數(shù)問題,其算法復(fù)雜度與樣本維數(shù)無關(guān);SVM分類問題大致有三種:線性可分問題、線性不可分問題。對于線性可分問題的解決:根據(jù)最優(yōu)解a*二(a,a,,a)T計算w*=yax選擇a*的一個正分量a,并12liiiji=1據(jù)此計算b=y-Yya(x,x)構(gòu)造分劃超平面和決策函數(shù),事實上,jiiija*的每一個分量a都與一個訓(xùn)練點相對應(yīng),而分劃超平面僅僅依賴于a不為零的ii訓(xùn)練點,而與為零的訓(xùn)練點無關(guān)。Fig.3-3supportvectorsx為支持向量。i圖注:被圈定的點為支持向量。對于線性不可分問題,有兩種解決途徑:1.一是一般線性優(yōu)化方法,引入松弛變量此時的優(yōu)化問題為(i=1,2,,n)(3.
36、14)min0(w)=(w,w)+CYs,2ii=1y(w,x)+b-1+s0ii如下圖所示:Fig.3-4relaxedvariableintroduction(3-17)i=1二是V.Vapnik引入的核空間理論7將低維輸入空間中的數(shù)據(jù)通過非線性函數(shù)映射到高維屬性空間H(也稱為特征空間),將分類問題轉(zhuǎn)化到屬性空間進(jìn)行??梢宰C明,如果選用合適的映射函數(shù),輸入空間線性不可分問題在屬性空間中將轉(zhuǎn)化為線性可分問題。屬性空間中向量的點積運算與輸入空間的核函數(shù)對應(yīng)。從理論上講,滿足Mercer條件的對稱函數(shù)K(x,x)都可以作為核函數(shù)。目前研究最多的核函數(shù)主要有三類:多項式內(nèi)核k(x,x)=(x-x)
37、+cq得到q階多項式分類器TOC o 1-5 h zii徑向基函數(shù)內(nèi)核RBFk(x,x)=exp-乞i2每個基函數(shù)中心對應(yīng)一個支持向量,它們及其輸出權(quán)值由算法自動決定。Sigmoind內(nèi)核k(x,x)=tanh(v(x-x)+c)ii包含一個隱層的多層感知器,隱層節(jié)點數(shù)由算法自動決定。引入核函數(shù)后,向量的內(nèi)積都由核函數(shù)來代替:iji=1minQ(a)=1藝aayyK(x,x)-藝2ijiji,jT(315)(316)a0,i藝ya=0iii=1分類函數(shù)式變?yōu)椋篺(x)=sgn蘭a*yK(x,x)+b*iiii=1根據(jù)KT條件有:對于非支持向量滿足a二0,上式只需要對支持向i進(jìn)行。任意選一支持向
38、量x,式中的b*由下述方程式給出:iyQa*yK(x,x)+b*=1iiii通常,在上式中也會引入松弛變量,此時該式的第一個約束條件為ag0,C,其他各式?jīng)]有變化。式(3-16)所示即為所謂的SVM模型。從上i面的討論中不難看出,在模式識別領(lǐng)域具體應(yīng)用SVM的步驟為:選擇適當(dāng)?shù)暮撕瘮?shù);求解優(yōu)化方程,獲得支持向量及相應(yīng)的Lagrange算子;寫出最優(yōu)分界面方程。(3)非線性向量機與廣義最優(yōu)分類面實際上,多數(shù)模式識別分類問題在原始的樣本空間內(nèi)樣本點都是線性不可分的,SVM采用的做法是:用一非線性映射函數(shù):Rd-F,把原始空間的樣本,映射到高維特征空間F(也可能是無窮維的),然后在此高維特征空間構(gòu)造
39、最優(yōu)分類面。由于訓(xùn)練算法只用到空間中的點積,即(x)(x),如果能夠?qū)ふ乙粋€核函ij數(shù)k(),使得k(x,x)二(x)(x),這樣,在高維空間的運算僅僅是內(nèi)積的計算,ijij并且這種內(nèi)積的計算可以在原始空間中實現(xiàn)的,沒有必要知道具體的形式。但是并不是所有的核函數(shù)K都滿足這個要求,根據(jù)Hilbert-Schimidt原理,只要這種核函數(shù)滿足Mercer條件,它就可以作為內(nèi)積使用。用核函數(shù)k(x,x)代替最ij優(yōu)分類面的點積就可以實現(xiàn)某一非線性變換后的線性分類,并且沒有增加計算的復(fù)雜度。這樣處理以后就可以克服所謂“維數(shù)災(zāi)難”問題。3.2支持向量機在群體異常行為檢測中的應(yīng)用當(dāng)一幅視頻圖像進(jìn)入系統(tǒng)后,
40、我們首先按第二章中介紹的方法得到該視頻的時空特征點,建立描述符,聚類建模,根據(jù)描述符,將描述符聚類,看屬于高斯模型的概率,如此對所有的訓(xùn)練視頻進(jìn)行特征點提取,儲存訓(xùn)練基,最后將所存取的每幅圖像的每段視頻的視頻向量連同該幅圖像所代表的分類(在二分類中,即為1或T)一同輸入進(jìn)行svm分類器訓(xùn)練,在訓(xùn)練過程中,正常行為作為正樣本,異常行為作為負(fù)樣本。對于正樣本,系統(tǒng)輸出為+1,對于負(fù)樣本則輸出為-1。測試時,將測試樣本出入到經(jīng)過訓(xùn)練得到的分類器中,如果輸出為+1,則該樣本該行為為正常行為;否則,該行為是異常行為。為了評價分類結(jié)果,引入正確分類率PCR作為評價標(biāo)準(zhǔn),正確識別率的定義如下:正確識別率二識
41、別正確的樣本數(shù)T/總測試樣本數(shù)N。3.2.1異常行為檢測實例及分析1)視頻庫本實驗中共選取了25幅視頻作訓(xùn)練樣本,其中正常行為為13張,異常行為視頻圖像為12張(2)程序?qū)崿F(xiàn)及結(jié)果分析對視頻圖像進(jìn)行檢測,其程序?qū)崿F(xiàn)框圖可以歸納如下:圖3-5訓(xùn)練的流程圖Fig.3-5proceedureoftraining圖3-6檢測的流程圖Fig.3-6proceedureofpredicting前期訓(xùn)練機過程處理:輸入訓(xùn)練樣本圖像:對樣本視頻進(jìn)行底層運動特征提取處理后,進(jìn)行聚類和建模,生成視頻向量,依次對所有的視頻樣本進(jìn)行上述操作,每一幅都會得到一組視頻矢量,所有樣本圖像進(jìn)行svm高斯徑核函數(shù)訓(xùn)練,訓(xùn)練機器
42、完成。SVM的訓(xùn)練和測試將上述訓(xùn)練好的SVM進(jìn)行已知的視頻圖像的異常行為測試,計算準(zhǔn)確率,如果準(zhǔn)確率大于80%,則SVM就可用于未知視頻的異常行為的檢測中去。其中,正確率=正確樣本視頻數(shù)T/參與測試的總的樣本視頻數(shù)N利用SVM去進(jìn)行群體異常行為的檢測利用已經(jīng)完善的SVM進(jìn)行群體異常行為的檢測,判斷未知視頻是否是異常行為。本章主要介紹了支持向量機SVM的一些基本的原理以及統(tǒng)計學(xué)習(xí)理論,闡述了SVM的核心算法,為后續(xù)工作做一些相關(guān)的鋪墊,對后面將要進(jìn)行的利用SVM來進(jìn)行群體異常行為檢測有很好的幫助,闡述了如何使用SVM進(jìn)行群體異常行為的檢測,SVM的訓(xùn)練,并利用完善的SVM進(jìn)行群體異常行為的檢測試
43、驗。3.3本章小結(jié)本章我們介紹了SVM的基本原理和一些算法和SVM的應(yīng)用,用SVM完成正常行為和異常行為的訓(xùn)練和學(xué)習(xí),在此之前,我們首先要介紹的是對描述符進(jìn)行聚類和建模,聚類我們選用的EM參數(shù)估計方法,建模我們選用的高斯混合模型,在實驗過程中,我們對散步,慢走等行為和逃跑行為分別進(jìn)行訓(xùn)練和識別。在訓(xùn)練過程中,正常行為作為正樣本,異常行為作為負(fù)樣本。對于正樣本,系統(tǒng)輸出為+1,而對于負(fù)樣本則輸出為-1。測試時,將測試樣本出入到經(jīng)過訓(xùn)練得到的分類器中,如果輸出為+1,則該樣本為正樣本,即該行為為正常行為;否則,該行為是異常行為。同樣對待識別的視頻進(jìn)行異常行為檢測判別時,對視頻處理后,利用分類器(實
44、際是生成的判別函數(shù))進(jìn)行分類,得到異常行為的識別。4.實驗數(shù)據(jù)以及結(jié)果4.1引言本章中出現(xiàn)得實驗的結(jié)果,主要包括三個方面,時空特征點的提取實驗和構(gòu)建描述符實驗聚類實驗,下面我們將對實驗結(jié)果進(jìn)行總結(jié)與分析。實驗結(jié)果本次試驗中我們選取的delta和tao均為2.5,目的是在最合適的范圍內(nèi),選擇最佳的效果,時空特征點截取的視頻如圖所示(1)時空特征點的提取:三種場景下的逃跑異常行為提取的時空特征點(2)描述符的部分?jǐn)?shù)據(jù)如下:0.0517810.0435800.0126400.0330780.0059630.0078630.0089460.0517810.0435800.0126400.0330780.0059630.0078630.0089460.0514860.0315140.0082550.0324480.0063430.0074160.0084980.0514860.0315140.0082550.0324480.0063430.0074160.0084980.0539280.0326000.013
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 【正版授權(quán)】 IEC TR 63558:2025 EN Automatic speech recognition: Classification according to acoustic and linguistic indicators in real-life applications
- 廠房長期租賃合同書
- 大數(shù)據(jù)智能營銷服務(wù)合同
- 環(huán)保設(shè)施建設(shè)施工合同
- 智慧物流園區(qū)運營服務(wù)協(xié)議
- 院校與企業(yè)戰(zhàn)略合作協(xié)議書
- 房屋交易居間合同
- 合同資料員勞動合同
- 做時間的主人活動方案
- 個人勞務(wù)分包合同協(xié)議書
- 2025年中華工商時報社事業(yè)單位招聘12人歷年高頻重點模擬試卷提升(共500題附帶答案詳解)
- 安全生產(chǎn)事故調(diào)查與案例分析(第3版)課件 呂淑然 第1-4章 緒論-應(yīng)急預(yù)案編制與應(yīng)急管理
- 《教育強國建設(shè)規(guī)劃綱要(2024-2035年)》解讀講座
- 2024-2025學(xué)年廣東省深圳市寶安區(qū)高一(上)期末數(shù)學(xué)試卷(含答案)
- 同濟(jì)大學(xué)《線性代數(shù)》-課件
- 申請兩癌補助申請書
- 香港審計合同范例
- 2024年事業(yè)單位考試(面試)試題與參考答案
- 《高層建筑結(jié)構(gòu)》課件
- 校園安全形勢會商研判制度(4篇)
- 連鑄應(yīng)急預(yù)案
評論
0/150
提交評論