![[碩士論文精品]圖像的運動目標檢測與跟蹤算法研究_第1頁](http://file.renrendoc.com/FileRoot1/2017-12/8/b11ab640-c345-4404-af19-74c654695045/b11ab640-c345-4404-af19-74c6546950451.gif)
![[碩士論文精品]圖像的運動目標檢測與跟蹤算法研究_第2頁](http://file.renrendoc.com/FileRoot1/2017-12/8/b11ab640-c345-4404-af19-74c654695045/b11ab640-c345-4404-af19-74c6546950452.gif)
![[碩士論文精品]圖像的運動目標檢測與跟蹤算法研究_第3頁](http://file.renrendoc.com/FileRoot1/2017-12/8/b11ab640-c345-4404-af19-74c654695045/b11ab640-c345-4404-af19-74c6546950453.gif)
![[碩士論文精品]圖像的運動目標檢測與跟蹤算法研究_第4頁](http://file.renrendoc.com/FileRoot1/2017-12/8/b11ab640-c345-4404-af19-74c654695045/b11ab640-c345-4404-af19-74c6546950454.gif)
![[碩士論文精品]圖像的運動目標檢測與跟蹤算法研究_第5頁](http://file.renrendoc.com/FileRoot1/2017-12/8/b11ab640-c345-4404-af19-74c654695045/b11ab640-c345-4404-af19-74c6546950455.gif)
已閱讀5頁,還剩68頁未讀, 繼續(xù)免費閱讀
[碩士論文精品]圖像的運動目標檢測與跟蹤算法研究.pdf 免費下載
版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
大連理工大學碩士學位論文摘要視頻監(jiān)控系統(tǒng)以其直觀、方便、信息內(nèi)容豐富而成為現(xiàn)代安防系統(tǒng)發(fā)展的主流,被廣泛應用于國防建設、交通管制、智能保安等需要實時監(jiān)控的場所?,F(xiàn)有的大多數(shù)視頻監(jiān)控系統(tǒng)仍依賴于監(jiān)控人員的現(xiàn)場操作,造成了人力資源的浪費,也影響了整個工作系統(tǒng)的效率。因此,研究智能視頻監(jiān)控系統(tǒng)中的關鍵技術并提高智能視頻監(jiān)控系統(tǒng)的性能具有重要的意義。運動目標檢測與跟蹤是視頻監(jiān)控系統(tǒng)中一個重要組成部分,對計算機視覺的其他研究領域有著重要的推動作用。因此如何實現(xiàn)對運動目標實時、穩(wěn)定和有效地檢測與跟蹤,是一個需要關注和研究的重要問題。本文在目前該領域研究成果的基礎上,系統(tǒng)研究了智能視頻監(jiān)控中人體目標的檢測,分割和跟蹤方面的理論和方法。在運動目標檢測算法中,詳細介紹了幾種常用的目標前景檢測方法,并對它們的檢測性能進行了評價。在運動人體目標的定位與分割方面,以人體的頭部研究為出發(fā)點,針對人體頭部運動信息的輪廓近似圓形的特征,結合FREEMAN鏈碼和RANSAC算法,進行多圓檢測來實現(xiàn)多目標頭部的定位,進而較快地確定人體目標的準確位置。在目標跟蹤算法中,針對目前MEANSHIIT跟蹤算法存在的問題,本文提出了采用目標的顏色信息、紋理信息和運動信息的改進KALMAN和MEANSHIFT跟蹤算法,跟蹤效果得到較大改進。針對單個目標運動時姿勢的顯著變化,本文在機器學習理論知識的基礎上,提出了一種基于RGB直方圖特征、LBP直方圖特征和PPBTF直方圖特征的半監(jiān)督學習對單目標進行跟蹤的方法,使跟蹤效果更具魯棒性。算一T波濾M蹤跟NM位定部頭測檢標目耐法詞鍵關基于視頻圖像的運動目標檢測與跟蹤算法研究RESEARCHONMOVINGOBJECTDETECTIONANDTRACKINGALGORITHMSBASEDONVIDEOIMAGEABSTRACTVIDEOSURVEILLANCESYSTEMVSSISTHEMAINTRENDOFMODEMDEFENCESYSTEMBECAUSEOFITSVISIBILITY,CONVENIENCEANDABUNDANCEINCONTENTANDHASBEENWIDELYUSEDINMANYFIELDSWHEREAREALTIMESURVEILLANCEISNEEDED,SUCHASNATIONALDEFENSE,TRA銜CCONTROL,THEINTELLIGENTPUBLICSECURITYANDSOONNOWADAYS,VSSSTILLDEPENDSONMANUALOPERATION,WHICHWASTESRESOURCESANDAFFECTSTHEEFFICIENCY,SOSTUDYINGTHETYPICALALGORITHMSUSEDINVIDEOSURVEILLANCEANDDESIGNINGANINTELLIGENTVIDEOSURVEILLANCESYSTEMISVERYIMPORTANTMOVINGOBJECTDETECTIONANDTRACKINGAREIMPORTANTPARTSOFVIDEOMONITORSYSTEMANDPLAYIMPORTANTROLESTOOTHERTOPICSPROGRESSINCOMPUTERVISIONSOHOWTODETECTANDTRACKOBJECTSTEADILY,REALTIMELYANDEFFECTIVELY,BECOMESANIMPORTANTPROBLEMTHATNEEDSTOBEPAIDATTENTIONANDRESEARCHEDNEPAPERSTUDIEDTHEKEYTECHNOLOGIESOFTHEFIELDBASEDONTHECURRENTRESEARCHACHIEVEMENTSANDMAINLYSTUDIEDABOUTTHETECHNOLOGIESONHUMANOBJECTDETECTION,SEGMENTATIONANDTRACKINGDURINGOBJECTDETECTION,SEVERALOBJECTFOREGROUNDDETECTIONALGORITHMSWIDELYUSEDALEINTRODUCED,ANDTHEIRPERFORMANCESAREANALYZEDDURINGOBJEETLOCALIZATIONANDSEGMENTATION,DUETOHEADCONTOURSSIMILARTOCIRCLESSEENFROMTHEVIDEOSEQUENCESCAPTUREDFROMVERTICALANGULARCAMERA,THEPAPERCOMBINESFREEMANCHAINCODEANDRANDOMSAMPLECONSENSUSRANSACALGORITHMTOESTIMATECIRCLEPARAMETERSANDTHENLOCALIZESTHEHUMANOBJECTQUICKLYANDACCURATELYDURINGOBJECTTRACKING,INTHELIGHTOFCURRENTMEANSHIFTTRACKINGALGORITHMSDRAWBACKS,KALMANFILTERANDMEANSHIFTTRACKINGALGORITHMINTEGRATINGWITHCOLOR,TEXTUREANDMOTIONINFORMATIONISPROPOSEDANDITSTRACKINGPERFORMANCEHASBEENIMPROVEDTHANBEFOREAIMINGATTHEPOSTURESSIGNIFICANTCHANGEOFASINGLEOBJECT,ANOVELTRACKINGALGORTHIMBASED011RGBHISTOGRAMFEATURE,LBPLOCALBINARYPATTERNHISTOGRAMFEATUREANDPPB邗PIXELPATTERNBASEDTEXTUREFEATUREHISTOGRAMFEATURE,USINGTHESEMISUPERVISEDLEARNINGISPROPOSEDONTHEBASISOFMACHINELEARNINGTHEORYKEYWORDSMOVINGOBJECTDETECTION;HEADLOCALIZATION;MEANSHIFTTRACKING;KALMANFILTER;TRITRACKINGALGORITHM大連理工大學學位論文獨創(chuàng)性聲明作者鄭重聲明所呈交的學位論文,是本人在導師的指導下進行研究工作所取得的成果。盡我所知,除文中已經(jīng)注明引用內(nèi)容和致謝的地方外,本論文不包含其他個人或集體已經(jīng)發(fā)表的研究成果,也不包含其他已申請學位或其他用途使用過的成果。與我一同工作的同志對本研究所做的貢獻均已在論文中做了明確的說明并表示了謝意。若有不實之處,本人愿意承擔相關法律責任。學位論文題目墓壬翅絲圖焦曲量盈魚筮絲巡當望籃鰱盛作者簽名整趟煎日期塑年墾月日大連理工大學碩士研究生學位論文大連理工大學學位論文版權使用授權書本人完全了解學校有關學位論文知識產(chǎn)權的規(guī)定,在校攻讀學位期間論文工作的知識產(chǎn)權屬于大連理工大學,允許論文被查閱和借閱。學校有權保留論文并向國家有關部門或機構送交論文的復印件和電子版,可以將本學位論文的全部或部分內(nèi)容編入有關數(shù)據(jù)庫進行檢索,可以采用影印、縮印、或掃描等復制手段保存和匯編本學位論文。學位論文題目差孟猢凰壤魚墾麴冒塹幽塹壁啦墮班密作者簽名毯趲日期型墮年L月日鋤獬斗斗嗍旦年上月一日大連理工大學碩士學位論文1緒論11引言隨著視頻分析技術及人工智能技術的發(fā)展,從圖像處理與模式識別發(fā)展起來的計算機視覺在近三十年得到了突飛猛進的發(fā)展。盡管目前計算機視覺的理論發(fā)展仍然不夠成熟,但已經(jīng)得到了廣泛的應用,在智能視頻監(jiān)控系統(tǒng)、機器人視覺導航、醫(yī)學輔導診斷、工業(yè)機器人視覺系統(tǒng)、地圖繪制,物理的三維重建與識別、智能人機接口等領域得到廣泛的發(fā)展,其中智能化的視頻監(jiān)控系統(tǒng)是近年來計算機視覺領域的一個備受關注的前沿課題。從圖像處理與模式識別發(fā)展起來的計算機視覺研究方向主要是如何利用二維投影圖像恢復三維景物世界。計算機視覺使用的理論方法主要是基于幾何、概率、運動學與三維重構的視覺計算理論,它的理論基礎包括射影幾何學、剛體運動力學、概率與隨機過程、圖像處理、人工智能等。計算機視覺要達到的最終目的是實現(xiàn)計算機對三維景物世界的理解,即實現(xiàn)人類視覺系統(tǒng)的某些功能。視頻圖像是對客觀事物形象、生動的描述,是直觀而具體的信息表達形式,是人類最重要的信息載體。人類主要通過視覺感知外界信息,據(jù)統(tǒng)計,人類對外界信息的感知有80以上是通過視覺得到的。在今天的信息社會,隨著網(wǎng)絡、通信和微電子技術的快速發(fā)展和人民物質(zhì)生活水平的提高,視頻監(jiān)控以其直觀方便和內(nèi)容豐富等特點日益受到人們的青睞,監(jiān)控產(chǎn)品也正經(jīng)歷著從最初的模擬化走向數(shù)字化、網(wǎng)絡化、智能化的革命。視頻監(jiān)控是實施安全監(jiān)控的重要技術手段,它是計算機視覺領域一個新興的應用方向和備受關注的前沿課題。它涉及信號與視頻處理、通信和計算機視覺等多個學科的研究領域。視頻通信、處理和理解是視頻監(jiān)測技術的三大核心技術。盡管成像設備、視頻壓縮、通信以及數(shù)據(jù)存儲等方面的技術發(fā)展迅速并且日趨成熟,監(jiān)控系統(tǒng)功能日益強大,但是視頻內(nèi)容的分析和理解工作目前仍然主要依靠人工完成,工作量繁重,因此計算機視覺和應用研究者提出新一代監(jiān)控一視頻監(jiān)控的概念【L】,監(jiān)控在不需要人為干預情況下,利用計算機視覺和視頻分析的方法對攝像機拍攝的圖像序列進行自動分析,實現(xiàn)對動態(tài)場景中目標的定位、識別和跟蹤,并在此基礎上分析和判斷目標的行為,從而既能完成日常管理又能在異常情況發(fā)生時及時做出反應。計算機視頻監(jiān)控系統(tǒng)不僅符合信息產(chǎn)業(yè)的未來發(fā)展趨勢,而且代表了監(jiān)控行業(yè)的未來發(fā)展方向,蘊含著巨大的商機和經(jīng)濟效益,受到了學術界、產(chǎn)業(yè)界和管理部門的高度重視?;谝曨l圖像的運動目標檢測與跟蹤算法研究12視頻監(jiān)控相關研究計算機視頻監(jiān)控是指通過攝像頭采集監(jiān)控區(qū)域的圖像,然后將視頻信號通過相應的傳輸網(wǎng)絡同軸電纜、光纖、無線或以太網(wǎng)等,傳到指定的監(jiān)控中心或是監(jiān)控點,進行存儲、顯示、分析。具體分析過程是利用計算機視覺和圖像處理方法對圖像序列進行運動檢測、運動目標分類、運動目標跟蹤以及監(jiān)視場景中目標行為的理解與描述。運動檢測、目標分類和目標跟蹤屬于視覺中的低級處理部分,行為理解與描述則屬于視覺中的高級處理部分。運動檢測、目標分類與跟蹤是視頻監(jiān)控中研究最多的三個問題,而行為理解與描述則是近年被廣泛關注的研究熱點。它是指對人的運動模式進行分析和識別,并用自然語言等加以描述。下面對視頻監(jiān)控系統(tǒng)有關發(fā)展狀況及主要理論做簡要概述。121國內(nèi)外研究現(xiàn)狀智能視頻監(jiān)控是多學科交叉的前沿研究領域,并且具有廣泛的應用前景和龐大的市場需求,有很多科研人員、科研機構及企業(yè)單位多年來從事這方面的研究、開發(fā),并且取得了很多優(yōu)秀的成果。1997年,美國國防高級研究項目署DARPA設立了以卡內(nèi)基梅隆大學為首聯(lián)合十幾家高等院校和研究機構參加的視頻監(jiān)控重大項目VSAMVIDEOSURVEILLANCEANDMONITORINGT2,列,主要研究對戰(zhàn)場及普通民用場景進行監(jiān)控的自動視頻理解技術。2000年,DARPA又資助了MDOJUMANIDENTIFICATIONATADISTANCE遠距離人臉識別項目;由STEVEJMAYBANK和譚鐵牛組織的IEEE視覺監(jiān)控專題討論會S,IEEEINTERNATIONALWORKSHOPONVISUALSURVEILLANCE也已經(jīng)成功地舉辦了三屆,收錄了大量視覺監(jiān)控領域內(nèi)的最新研究成果。佛羅里達中央大學UNIVERSITYOFCEN打ALFLORIDA的KNIGHT智能監(jiān)控系統(tǒng)13,4利用計算機視覺技術能檢測出監(jiān)視區(qū)域目標的變化,并能標注重要事件和描述人的行為,系統(tǒng)對光照變化有較好的魯棒性。英國雷丁大學【5】已開展了對車輛和行人的跟蹤及其交互作用識別的相關研究。計算機視覺領域中的權威期刊“國際計算機視覺期刊0JCV,INTERNATIONALJOURNALOFCOMPUTERVISION和“IEEE模式分析和機器智能匯刊”PAMI,IEEETRANSACTIONONPATTEMANALYSISANDMACHINEINTELLIGENCE相繼在2000年6月和2000年8月出版了關于視覺監(jiān)控的???。MARYLAND大學的實時視覺監(jiān)控系統(tǒng)W461不僅能夠定位人和分割出人的身體部分,而且通過建立外觀模型來實現(xiàn)多人的跟蹤,可以檢測和跟蹤室外環(huán)境中的人并對他們之間簡單的交互進行監(jiān)控。IBM的智能監(jiān)控系統(tǒng)【7】不僅能夠自動監(jiān)視某個現(xiàn)場,還能夠監(jiān)視數(shù)據(jù),執(zhí)行基于事件的檢索,通過標準的網(wǎng)絡設施進行實時報警,并且能提取出某項活動的長期的統(tǒng)計模型。一2一大連理工大學碩士學位論文國內(nèi)有一些視頻監(jiān)控方面的產(chǎn)品,如黃金眼、行者貓王等,應用于交通控制,監(jiān)獄管理等方面。另外,國內(nèi)產(chǎn)品還有數(shù)字硬盤錄像系統(tǒng)DVG,將監(jiān)控區(qū)域內(nèi)有運動對象出現(xiàn)的情況錄制下來,以備查詢,該系統(tǒng)只是簡單的檢測出有無運動對象,而沒有對運動對象做任何分析。由于國內(nèi)的研究起步較晚,技術還不夠完善,開發(fā)出的產(chǎn)品距離智能化還有一定差距,在實際的應用中,受到很多限制,還有待于進一步的完善。122主要任務人運動的視覺分析主要是針對包含人的運動圖像序列進行分析處理,它通常涉及到運動檢測、目標分類、人的跟蹤及行為理解與描述幾個過程,其一般性處理框架如圖11所示。其中,運動檢測、目標分類、人體跟蹤屬于視覺中的低級和中級處理部分LOWLEVELANDINTERMEDIATE1EVELVISION,而行為理解和描述則屬于高級處理HIGH1EVELVISION釓當然,它們之間也可能存在交叉。下面從幾個方面對視頻處理主要任務進行探討。圖11人運動分析的一般處理框架FIG11GENERALFRAMEWORKOFHUMANMOTIONANALYSIS1運動目標檢測基于視頻圖像的運動目標檢測與跟蹤算法研究運動檢測是指從視頻流中提取出目標,一般是確定目標的區(qū)域或顏色等。它必須從連續(xù)的視頻流或圖像序列中提取目標。目標檢測的目的是從序列圖像中將感興趣的區(qū)域一般為運動目標區(qū)域從背景圖像中抽取出來。運動區(qū)域的有效分割對于目標分類、跟蹤和行為理解等后期處理是非常重要的,因為以后的處理過程僅僅考慮圖像中對應于運動區(qū)域的像素。然而,由于背景動態(tài)變化,如天氣、光照、影子及混亂干擾等的影響,使得運動檢測成為一項相當困難的工作。目前幾種常用的方法有背景減除【51、時間差分I1,12、光流【13】、擴展的EM算法、能量運動檢測、基于數(shù)學形態(tài)學的場景變化檢測等。其中背景減除和時間差分均屬于求差法,即都采用當前圖像與參考圖像進行相減的方法來完成運動目標的檢測。2運動目標分類目標分類的目的是識別運動目標所屬的類別,不同的運動區(qū)域可能對應于不同的運動目標,比如交通道路上監(jiān)控攝像機所捕捉的序列中可能包含行人、車輛及其他諸如飛鳥、流云、搖動的樹枝等運動物體,為了便于進一步對行人進行跟蹤和行為分析,運動目標的正確分類是完全必要的。目前的分類方法主要有基于形狀信息的分類、基于運動特征的分類以及時間共生矩陣進行分層分類的方法等。3運動目標跟蹤目標跟蹤是計算機視覺領域中一個極具挑戰(zhàn)性的課題,除視頻監(jiān)控外,其還被廣泛地應用在人機交互、視頻壓縮、醫(yī)學圖像處理等領域中。所謂運動目標跟蹤則指對目標進行連續(xù)的跟蹤以確定其運動軌跡。它等價于在連續(xù)的圖像幀間創(chuàng)建基于位置、速度、形狀、紋理、色彩等有關特征的對應匹配問題。目標跟蹤的關鍵在于得到圖像檢測中提取的靜態(tài)目標與被跟蹤運動目標的對應關系。從運動檢測得到的一般是人的投影,要進行跟蹤首先要給需要跟蹤的對象建立一個模型。對象模型可以是整個人體,這時候形狀、顏色、位置、速度、步態(tài)等都是可以利用的信息;也可以是人體的一部分如上臂、頭部或手掌等,這時需要對這些部分單獨進行建模。之后,將運動檢測到的投影匹配到這個模型上去。一旦匹配工作完成,那么就得到了最終有用的人體的信息了。常用的數(shù)學工具有卡爾曼濾波【14CKALMANFILTERING、CONDENSATION算、法【U】及動態(tài)貝葉斯網(wǎng)絡【16】等。4行為識別與理解運動檢測、目標分類與人的跟蹤是人運動分析中研究較多的三個問題,而人的行為理解與描述是近年來被廣泛關注的研究熱點。人體行為識別與理解是指對人的行為模式進行分析和識別,并用自然語音加以描述,這種技術包含從視頻序列中抽取相關的視覺信息并用一種合適的方法進行表達,然后解釋這些視覺信息以實現(xiàn)識別和學習人的行大連理工大學碩士學位論文為。通常,人體行為識別是在成功實現(xiàn)圖像序列中的人體檢測和跟蹤、完成特征提取的基礎上進行的,屬于更高一層的視覺任務,是當前計算機視覺研究領域備受關注并最具挑戰(zhàn)的研究方向之一。從模式識別的角度來看,行為識別可以看作為一個基于時變特征數(shù)據(jù)之上的分類問題,在獲取人體目標的特征數(shù)據(jù)后,識別也就成為一個將未知類型數(shù)據(jù)序列與已知運動數(shù)據(jù)序列相匹配的過程。目前人行為識別的研究主要有頭部運動、手勢識別、下肢運動等,方法主要有模板匹配方法與狀態(tài)空間方法兩種。采用模板匹配技術的行為識別方法首先將圖像序列轉換為一組靜態(tài)形狀模式,然后在識別過程中和預先存儲的行為標本相比較?;跔顟B(tài)空間模型方法是定義每個靜態(tài)姿勢作為一個狀態(tài),這些狀態(tài)之間通過某種概率聯(lián)系起來。任何運動序列可以看作為這些靜態(tài)姿勢的不同狀態(tài)之間的一次遍歷過程,在這些遍歷期間計算聯(lián)合概率,其最大值被選擇作為分類行為的標準。目前,狀態(tài)空間模型已經(jīng)被廣泛地應用于時間序列的預測、估計和檢測。123技術難點智能視頻源于計算機視覺技術,其技術實現(xiàn)主要存在于以下幾個方面問題1視頻監(jiān)控系統(tǒng)的魯棒性要求很高,即要求自動、連續(xù)工作。而從實際情況來看,視頻監(jiān)控系統(tǒng)的應用環(huán)境往往相當復雜,環(huán)境的不斷變化給計算機視覺技術應用帶來了更高的要求。2由于運動目標的多樣性,如何對多種目標進行運動分析、分類甄別,尤其是對非剛性目標的運動分析尚存在一定難度。3對于大范圍的視頻監(jiān)控需要大量的攝像機協(xié)同工作,在多臺攝像機之間對運動目標進行連續(xù)一致的視覺分析現(xiàn)在實現(xiàn)起來十分困難。4如何建立有效的視頻數(shù)據(jù)庫,實現(xiàn)視頻監(jiān)控系統(tǒng)中海量視頻信息的存儲、檢索和查詢,目前還處于研究起步階段。以上這些問題表明,視頻監(jiān)控系統(tǒng)的智能化還有相當長的路要走。124應用現(xiàn)狀與發(fā)展趨勢視頻監(jiān)控系統(tǒng)是多媒體技術、計算機網(wǎng)絡、工業(yè)控制和人工智能等技術的綜合運用的產(chǎn)物,它正向著音視頻的數(shù)字化、系統(tǒng)的網(wǎng)絡化和管理的智能化方向不斷發(fā)展。從視頻監(jiān)控技術的發(fā)展歷程來看,視頻監(jiān)控系統(tǒng)在過去的二十多年里大致經(jīng)歷了三代。第一代模擬視頻監(jiān)控系統(tǒng),第二代數(shù)字視頻監(jiān)控系統(tǒng),第三代分布式視頻監(jiān)控系統(tǒng)【17】?;谝曨l圖像的運動目標檢測與跟蹤算法研究第一代視頻監(jiān)控系統(tǒng)是以模擬信號、圖像的處理和傳輸為基礎的,多路模擬攝像機產(chǎn)生的模擬信號通過同軸電纜傳輸?shù)奖O(jiān)控室,然后通過預置好的順序輪流顯示,監(jiān)控人員通過監(jiān)視器來判斷監(jiān)視場景的情況。第二代監(jiān)控系統(tǒng)主要依賴于混合模數(shù)或全數(shù)字的視頻傳輸和處理方法,采用H263,MPEG等多媒體數(shù)字壓縮技術將視頻圖像完全數(shù)字化,節(jié)省了帶寬資源。在視頻監(jiān)控中可以利用視頻分析算法,讓監(jiān)控者只注意感興趣的事物從而實現(xiàn)自動報警。第三代監(jiān)控系統(tǒng)利用低價位高性能的計算機網(wǎng)絡、移動網(wǎng)絡和固定的多媒體通信網(wǎng)絡傳輸監(jiān)控信號。視頻信號在前端進行自動分析處理,然后將有價值的信息通過無線或有線網(wǎng)絡傳輸?shù)奖O(jiān)控中心,實現(xiàn)自動視頻監(jiān)控。第三代的研究熱點主要放在魯棒性的圖像傳輸,彩色圖像的處理,基于事件的和基于模式的序列圖像的理解上,目前對這些技術的應用已經(jīng)獲得了很多有價值的結果。與此同時,由于無線和有線的多媒體數(shù)字通信的發(fā)展,特別是隨著超寬帶網(wǎng)絡的接入,第三代監(jiān)控系統(tǒng)將在不同的領域中大范圍使用。隨著人運動分析研究和其它相關技術的發(fā)展,下述幾個方面已經(jīng)成為未來智能視頻監(jiān)控的發(fā)展趨勢1音頻與視覺相結合的多模態(tài)接口人的相互交流主要是依據(jù)語言,過去的許多工作是語音理解,但語音識別受距離和環(huán)境噪聲的限制,尤其在機場等高噪聲環(huán)境,將會嚴重影響語音識別的性能。人的可視化描述與語音解釋一樣重要,研究者們正逐漸將語音與視覺信息集成起來以產(chǎn)生更加自然的高級接口。目前音頻和視頻的信號處理相對獨立,如何更好地集成音頻和視頻信息用于多模態(tài)用戶接口是一個嚴峻的挑戰(zhàn)。2人的運動分析與生物特征識別相結合在智能房間的門禁系統(tǒng)、軍事安全基地的視覺監(jiān)控系統(tǒng)、高級人機交互等應用中,人的運動分析與生物特征識別相結合的研究日益顯得重要。在人機交互中不僅需要機器知道人是否存在、人的位置和行為,而且還需要利用特征識別技術來識別與其交流的人是誰。遠距離的身份識別已經(jīng)越來越重要,比如,2000年,DARPA贊助的重大項目一MHIDHUMANIDENTIFICATIONATADISTANCE計劃。由于人的步態(tài)具有易于感知、非侵犯性、難于偽裝等優(yōu)點,近年來已引起了計算機視覺研究者濃厚的研究興趣。3人的運動分析向行為理解與描述高層處理的轉變?nèi)说男袨槔斫馐切枰鸶叨茸⒁獠⑶沂亲罹咛魬?zhàn)的研究方向,因為觀察人的最終目標就是分析和理解人的個人行為、人與人之間及人與其它目標的交互行為等。目前人的運動理解還是集中于人的跟蹤、標準姿勢識別、簡單行為識別等問題,如人的一組最通常的行為跑、蹲、站、跳、爬、指等的定義和分類。近年來利用機器學習工具構建大連理工大學碩士學位論文人行為的統(tǒng)計模型的研究有了一定的進展,但行為識別仍舊處于初級階段,連續(xù)特征的典型匹配過程中常引入人運動模型的簡化約束條件來減少歧義性,而這些限制與一般的圖像條件卻是不吻合的,因此行為理解的難點仍是在于特征選擇和機器學習。另外,如何借助于先進的視覺算法和人工智能等領域的成果,將現(xiàn)有的簡單的行為識別與語義理解推廣到更為復雜場景下的自然語言描述,是將計算機視覺低、中層次的處理推向高層抽象思維的關鍵問題。13本文的主要工作與章節(jié)安排131本文的主要工作本文要研究的問題是如何從視頻圖像序列中提取出運動目標,并對其進行跟蹤處理。視頻監(jiān)控根據(jù)攝像頭的放置位置,大致分為兩類一類是攝像頭隨運動目標移動,運動對象始終保持在圖像的中心位置;另一類是攝像頭固定只對視場內(nèi)的對象進行監(jiān)控和跟蹤。根據(jù)攝像頭的數(shù)目可分為多攝像頭協(xié)同監(jiān)控和單攝像頭監(jiān)控。本文要研究的是垂直固定單攝像頭的情況,這是多攝像頭協(xié)同監(jiān)控的基礎。本文主要對運動區(qū)域的檢測、運動人體目標的分割定位和運動人體目標的跟蹤這三個方面進行了研究。本文工作內(nèi)容及創(chuàng)新點簡要介紹如下1運動目標檢測深入研究了當前各種目標檢測算法,詳細介紹了幀間差分法、基于梯度建模前景提取法以及利用幀間二階差分SODP與邊緣檢測相結合進行運動目標分割方法的基本原理,并進行了相關的實驗性能分析。在幀間差分法的基礎上,本文采用了一種基于均值統(tǒng)計的自適應閾值方法來進行運動區(qū)域分割【18】,較好地把人體的運動區(qū)域提取出來。2運動目標定位以人體頭部為出發(fā)點對人體目標的定位進行了研究,在攝像頭的角度為垂直的條件下,根據(jù)提取出的頭部運動信息輪廓具有近圓形這一關鍵特征,本文采用FREEMAN鏈碼和RANSAC算法相結合的方法,進行人體頭部的檢測識別,較快地完成了多目標的定位。3多目標跟蹤研究了MEANSHIFT算法的基本原理,介紹了MEANSHIFT算法在目標跟蹤中的應用。結合當前MEANSHIFT跟蹤算法的優(yōu)點,針對目標顏色相似與快速運動目標之間可能跟蹤失敗的情況,本文提出了一種融合目標顏色信息、紋理信息和運動信息KALMAN濾波等特征的目標跟蹤方法,較好的完成了對人體目標的跟蹤處理。4單目標跟蹤對機器學習的發(fā)展進行了論述,對機器學習中的半監(jiān)督學習進行了探討,然后介紹了一種新的描述目標特征的PPBTF特征,對支持向量機給予了研究。針對目前跟蹤算法建立模型描述目標的缺陷,利用半監(jiān)督學習理論,提出了一種新的基于視頻圖像的運動目標檢測與跟蹤算法研究TRITRACKING單目標跟蹤算法,較好地解決了當運動目標外觀顯著變化時跟蹤失敗的問題。132論文章節(jié)安排本論文分為五章,各章內(nèi)容安排如下第一章為緒論,闡述了智能視頻監(jiān)控的研究意義和國內(nèi)外研究現(xiàn)狀,討論了計算機智能視頻監(jiān)控的主要任務、技術難點和應用現(xiàn)狀及未來發(fā)展趨勢,最后給出本文的主要工作和論文結構。第二章對計算機智能視頻監(jiān)控中運動目標檢測關鍵技術進行了研究。介紹了幀間差分法、基于梯度建模前景提取法以及利用幀間二階差分SODP與邊緣檢測相結合進行運動目標分割方法的基本原理,并進行了相關的實驗性能分析。本文在幀間差分法的基礎上,采用了基于均值統(tǒng)計的自適應閾值方法【L引,從而判斷出人體目標的運動區(qū)域。第三章針對計算機智能視頻監(jiān)控中主要任務之一目標定位進行了研究。介紹了頭部檢測時采用的FREEMAN鏈碼和RANSAC算法,結合兩者對運動區(qū)域內(nèi)人體目標頭部進行定位。第四章引入了描述運動目標的紋理特征,介紹了預測運動目標軌跡的KALMAN濾波器,給出了MEANSHIFT理論及其在跟蹤中的應用,然后提出了一種融合目標顏色信息、紋理信息和運動信息的改進的KALMAN和MEANSHIR跟蹤算法,實現(xiàn)對運動EL標的良好跟蹤。第五章分析了傳統(tǒng)跟蹤算法的現(xiàn)狀,介紹了機器學習理論,針對建立模型進行跟蹤的不足之處,本文利用機器學習的方法,提出了一種半監(jiān)督學習跟蹤算法一一TRIQRACKING跟蹤算法,對姿勢顯著變化的單個目標進行魯棒性跟蹤,并對提出的算法做了大量實驗,同時給出了定性的分析。最后對本論文進行了總結,指出了不足之處,并對今后工作進行了展望。大連理工大學碩士學位論文2運動目標檢測技術研究21引言運動目標檢測是應用視覺研究領域的一個重要課題,在軍事和工業(yè)等領域如軍事目標跟蹤、交通自動導航、視頻信號傳輸和機器人視覺等領域應用廣泛。目前,視頻信號的智能化處理需求日益增加,正確地從視頻流中提取運動目標、判斷運動方向是許多智能視頻系統(tǒng)的基礎部分。運動目標檢測是智能視頻監(jiān)控系統(tǒng)中非常關鍵的一步,它的目的就是提取監(jiān)控場景中的運動目標,為運動物體的識別跟蹤提供必備條件。它的基本任務是從圖像序列中檢測出運動信息,簡化圖像處理過程,得到所需的運動矢量,從而能夠識別與跟蹤物體。然而由于天氣、光照、影子及混亂干擾等的影響,使得運動檢測成為一項相當困難的工作。根據(jù)視頻序列圖像中攝像機和場景之間是否運動將目標的運動劃分為四種模式1攝像機靜LE目標靜止。這是靜態(tài)場景,對其處理方法就是靜態(tài)圖像中的處理方法。2攝像機靜止目標運動。這是一類非常重要的動態(tài)場景,對其處理一般包括運動目標檢測、目標特性估計等,主要用于預警、監(jiān)視、目標跟蹤等場合。3攝像機運動目標靜止。這主要用于機器人視覺導航、電子地圖的自動生成以及三維場景理解等。4攝像機運動目標運動,這是運動目標的檢測和跟蹤最復雜的一種情況,但也最普通的情況。目前關于這方面的研究還比較少,理論還沒有成熟。本文的目標檢測算法研究是在垂直固定攝像頭的前提下,綜合考慮了室內(nèi)和室外的監(jiān)控算法,在下面的章節(jié)中將對常用的前景檢測方法進行介紹并給出實際的檢測結果和性能分析。22靜態(tài)背景下的運動目標檢測221基于背景建模的方法基于背景建模的方法是目前運動目標檢測中最常用的一種方法,它的基本思想是輸入圖像與背景圖像進行比較,通過判定灰度等特征的變化,或用直方圖等統(tǒng)計信息的變化來判斷異常情況的發(fā)生和分割運動目標。簡單常用的方式為直接抽取視頻序列中某一幅圖像,或計算多幅圖像的平均值作為背景。它一般能夠提供最完全的特征數(shù)據(jù),而對于動態(tài)場景的變化,如光照和外來無關事件的干擾等特別敏感,最簡單的背景模型是基于視頻圖像的運動目標檢測與跟蹤算法研究時間平均圖像,這種方法有一些問題并且需要在沒有前景物體時的一段訓練周期。訓練周期后背景物體的運動或是訓練過程中前景物體將會認為是用舊的前景物體。此外,這種方法還不能處理場景中的梯度的亮度變化。大部分研究人員目前都致力于開發(fā)不同的背景模型和自適應算法,以期減少動態(tài)場景變化對于運動分割的影響。HARITAOGLUSL等利用最小、最大強度值和最大時間差分值為場景中每個像素進行統(tǒng)計建模,并且進行周期性的背景更新;MCKENNAB9等利用像素色彩和梯度信息相結合的自適應背景模型來解決影子和不可靠色彩線索對于分割的影響;KARMANN與BRANDT201和KILGER211采用基于卡爾曼濾波KALMANFILTERING的自適應背景模型以適應天氣和光照的時間變化;STAUFFER與GRIM0N22利用自適應的混合高斯背景模型即對每個像素利用混合高斯分布建模,并且利用在線估計來更新模型,從而可靠地處理了光照變化、背景混亂運動的干擾等影響。A背景差分法背景差法首先對背景建立模型,選取背景中的一幅或幾幅圖像的平均作為背景圖像,然后把以后的序列圖像和背景圖像相減,進行背景消除。若所得到的像素值大于某一閾值,則判定監(jiān)視場景中有運動物體,從而得到運動目標。用公式表示如下DLX,Y,力一吃墨力I21FDDF覡,Y,D,、,22【U口Q式中觀是背景幀差圖;既是背景的亮度分量;,表示幀數(shù)BL,2,;G為閾值。B背景模型的建立按照所處理背景的自身特性,背景模型可分為單模態(tài)和多模態(tài)兩種。前者在每個背景點上的顏色分布比較集中,可以用單體概率分布模型來描述即只有一個模態(tài),后者的分布則比較分散,需要多個分布模型來共同描述具有多個模態(tài)。最常用的描述背景點顏色分布的概率分布是高斯分布正態(tài)分布,下面就單模態(tài)和多模態(tài)兩種情況下的背景模型分別加以說明和討論。以下用刁X,來表示均值為、協(xié)方差為的高斯分布的概率密度函數(shù)。1單高斯分布背景模型單高斯分布背景模型適用于單模態(tài)背景情形,它為每個圖象點的顏色分布建立了高斯分布表示的模型RX,其中下標T表示時間。設圖象點的當前顏色度量為置,若RTX,鸕中“乙這里耳為概率閾值,則該點被判定為前景點,否則為背景點這時又稱為置與RX,鸕一,相匹配。在實際應用中,可以用等價的閾值替代概率閾值。大連理工大學碩士學位論文如記匾五IT,,以Q表示均方差,則常根據(jù)4Q的取值設置前景檢測閾值T如設410,T,則該點被判定為前景點,否則為背景點。單高斯更新快慢的常數(shù)稱為更新率口,則該點高斯分布參數(shù)的更新可表示為肛1一口以L口五23砰1一口I口五一鸕12。242多高斯分布背景模型多模態(tài)背景的情形則需要多個分布來共同描述一個圖像點上的顏色分布。STAUFFER等提出了一種自適應混合高斯模型,對每個圖像點采用了多個高斯的混合表示。設用來描述每個點顏色分布的高斯分布共有K個,分別記為OX,4U,IL,2,K。各高斯分布分別具有不同的權值Q。J哆,1,它們總是按照權值從高到低的次序排序。在檢測前景點時,按照權值從大到小的次序?qū)⒅门c各高斯分布逐一匹配,若沒有表示背景分布的高斯分布與置匹配,則判定該點為前景點,否則為背景點。多高斯分布背景模型的更新較為復雜,因為它不但要更新高斯分布自身的參數(shù),還要更新各分布的權重等。若檢測時沒有找到任何高斯分布與其匹配,則將權值最小的一個高斯分布取出,并引入一個新的均值為當前值的高斯分布,賦予較小的權值和較大的方差,然后對所有高斯分布重新進行權值歸一化處理。若第M個高斯分布與之匹配,則對第F個高斯分布的權值更新如下I1一歷L,IM吼511_歷其它25其中是另一個表示背景更新快慢的常數(shù)權值更新率。以上公式表明只有與五匹配的高斯分布的權值才得到提高,其他分布的權值都被降低。另外,未匹配的高斯分布的均值和均方差盯保持不變,相匹配的高斯分布的參數(shù)也按照式23和式24進行更新。在更新完高斯分布的參數(shù)和各分布權值后,還要對各個分布重新進行排序。222基于光流場的方法光流【231是空間運動物體對觀測面上的像素點運動產(chǎn)生的瞬時速度場,包含了物體表面結構和動態(tài)行為的重要信息,一般情況下,光流有相機運動、場景中目標運動、或是兩者的共同運動產(chǎn)生。光流的計算方法大致可分為三類基于匹配的、頻域的或梯度的方法。1基于匹配的光流計算方法包括基于特征和基于區(qū)域的兩種?;谔卣鞯姆椒ú换谝曨l圖像的運動目標檢測與跟蹤算法研究斷地對目標主要特征進行定位和跟蹤,對大目標的運動和亮度變化具有魯棒性。存在的問題是光流通常很稀疏,而且特征提取和精確匹配也非常困難。基于區(qū)域的方法先對類似的區(qū)域進行定位,然后通過相似區(qū)域的位移計算流量。這種方法在視頻編碼中得到廣泛的應用,然而計算的光流仍不稠密。2基于頻域的方法利用速度可調(diào)的濾波組輸出頻域或相位信息。雖然能獲得很高精度的初始光流估計,但往往涉及復雜的計算。另外,進行可靠評價也非常困難。3基于梯度的方法利用圖像序列的時空微分計算2D速度場光流。由于計算簡單和較好的實驗結果,基于梯度的方法得到了廣泛研究。雖然很多基于梯度的光流估計方法取得了較好的效果,但是在計算光流時涉及到可調(diào)參數(shù)的人工選取、可靠性評價因子的選擇困難,以及預處理對光流計算結果的影響,在應用光流對目標進行實時監(jiān)測與自動跟蹤時仍然存在很多問題??偟恼f來,光流法的優(yōu)點是能夠檢測獨立運動的對象,不需要預先知道場景的任何信息,并且可用于攝像機運動的情況,但是由于噪聲、多光源、陰影、透明性和遮擋性等原因,使得計算出的光流場分布不是十分可靠和精確;而且多數(shù)光流法計算復雜、耗時多,除非有特殊的硬件支持,否則很難實現(xiàn)實時檢測洲。日本大阪大學的RYUZOOKADA瞄】等人對此方法作了深入的研究,并已研制出比較成熟的系統(tǒng)。借助于多個數(shù)字信號處理器,這些系統(tǒng)都實現(xiàn)了實時目標檢測和跟蹤,處理速度可以達到15幀S。223基于時間差分的方法時間差分方法是將前后兩幀或三幀圖像相減,將差值大于某一閾值的部分判為運動對象。例如LIPTON【LLJ等利用兩幀差分方法從實際視頻圖像中檢測出運動目標,進而用于目標的分類與跟蹤;一個改進的方法是利用三幀差分代替兩幀差分,如VSAME2,3】開發(fā)了一種自適應背景減除與三幀差分相結合的混合算法,它能夠快速有效地從背景中檢測出運動目標。時域差分法的優(yōu)點是魯棒性較好,能夠適應各種動態(tài)環(huán)境,其缺點是只能提取出邊界點,不能提取出對象的完整區(qū)域。另外,當運動對象速度緩慢時,則可能檢測不到,而運動速度較快時,將把部分背景也檢測為運動對象。23常用檢測方法及其性能分析分析圖像序列,對運動目標進行檢測是圖像處理系統(tǒng)的重要內(nèi)容,通過運動檢測,可以得到目標在視頻圖像中的位置、方向、大小等信息。如何有效快速地檢測出運動目標,是其他后續(xù)目標分類和目標跟蹤的基礎,因此,運動檢測對后續(xù)目標跟蹤的正確完成具有極其重要的作用。本文對常用的相鄰幀間差方法、基于梯度建模提取前景法和利大連理工大學碩士學位論文用幀間二階差分SODP與邊緣檢測相結合進行運動目標分割方法進行了詳細介紹,并利用相關視頻圖像對幾種方法進行了性能分析比較。231相鄰幀間差方法相鄰幀差法又稱為圖像序列差分法、幀間差法,當監(jiān)控場景中出現(xiàn)運動目標時,幀與幀圖像之間會出現(xiàn)比較明顯的差別,兩幀相減,得到兩幀圖像亮度差的絕對值,判斷它是否大于閾值來分析視頻或圖像序列的運動特性,確定圖像序列中有無運動的目標,對圖像序列逐幀進行差分,相當于對圖像序列進行時域上的高通濾波。當前有很多研究者在幀間差上進行了改進21,這里本文從最基本的相鄰幀差法進行介紹和分析。其表達公式如下GI,F(xiàn)。以J,戶K“Y一?!癥L26一1盞GT,_LX,Y口丘熙卜1O,12判斷該圓參數(shù)C與其他圓參數(shù)CC,巴,C。I的相似度。若與其它圓相似,C不為新出現(xiàn)的圓參數(shù),若幣相似E為新圓,加入C,重復2、3進基于視頻圖像的運動目標檢測與跟蹤算法研究行下一曲線段厶。檢測。若進行最B乘法不能使擬合的圓參數(shù)與從厶1FS功計算的圓參數(shù)配準,則仍從厶1IS刀開始,重復2、3。4若IN,則當前區(qū)域冠內(nèi)圓檢測結束,同時保存單元集C。對當前圖像中運動區(qū)域窗口序列形中所有其它區(qū)域的邊緣圖像重復1、2、3步操作進行處理。5若當前圖像中所有投影區(qū)域檢測結束,輸出單元集C中所有的圓參數(shù),同時進行下一幀圖像的處理,重復15操作。35實驗結果與分析本文對不同光照和場合下的圖像序列進行了測試,結果表明該方法在人體遮擋較嚴重的情況下,若目標的頭部沒有被其他運動目標長時間的遮擋,可以準確的對頭部進行檢測識別。351檢測結果在實驗中,視頻圖像序列中各個參數(shù)取值分別為K30,三22,以70,P倒L,圖34為四組視頻圖像序列的頭部圓檢測定位結果,藍框為初步檢測到的運動區(qū)域,紅色的圓代表在藍框運動區(qū)域內(nèi)檢測到的頭部位置和大小。大連理工大學碩士學位論文視顫1983視頻卜I462視頻卜1572桃額2126FI罔34頭部定位結果FIG34TILERESU虹OFHEADLOCALIZATION352實驗分析本文在PC機24G,256M上進行丁實驗,對不同視頻圖像FLO000幀進行了測試,結果表明該算法對身體運動邊緣的T擾有一定的抑制作用,具有較高的檢測速度和正確率。當人體的頭部尺寸相對較小時,檢測和定位的速度能達到每秒18幀,可以達基于視額圖像的運動目標檢測與跟蹤算法研究到實時的效果,由十RANSAC算法本身參數(shù)較多現(xiàn)在參數(shù)基本依據(jù)大量實驗來定參數(shù)不能白適應化,這是將來研究的個力向。叫毒劐罔35誤檢情況示意圖FIG35LLLMTRATIONOFEORDETECTION當人體其他部分的運動邊緣輪廓較清晰且近似圓形時,如肩膀與頭部輪廓具有很大的相似性時,人體的肩部被誤判為頭部,會造成了誤檢如圖35A所示當頭部顏色信息與周|背景較相似時,幀問差會失去頭部輪廓,造成漏檢,如圖35B1。為了減小這種誤檢率的發(fā)生,可以對圖像采取別的處理辦法消除干擾,同時加入別的特征提取H標頭部,這也是本文令后的努力方向。36小結運動11標的定位與分割足計算機智能視頻監(jiān)控的一個基礎環(huán)節(jié),也是計算機視覺的一個主要部分和研究熱點。本章在對FREEMAN鏈碼和RANSAC算法理論知識研究的基礎上,針對每個運動區(qū)域內(nèi)人體頭部運動信息的邊緣輪廓具有近圓形圓弧的關鍵特征,采用丁融臺鏈碼和RANSAC算法的J種頭部檢測定位方法。該算法能較快速的對多個人體頭部進行定位,從而較好地定位M多人體目標,達到了比較好的檢測效果。大連理工大學碩士學位論文4KAIMAN濾波器和MEANSHIFT相關理論及其在跟蹤中的應用41引言運動目標跟蹤是近期視覺領域內(nèi)一個備受關注的課題,它是在視頻圖像序列的每一幀圖像中確定出我們感興趣的運動目標的位置,來實現(xiàn)目標的跟蹤。在機器視覺研究領域里,隨著技術不斷發(fā)展,自動目標跟蹤越來越受到研究者的重視,具有廣闊的應用前景。運動目標的跟蹤在醫(yī)學研究、視頻監(jiān)控、交通流量觀測監(jiān)控等很多領域都有重要的實用價值。跟蹤的難點在于如何快速而準確的在每一幀圖像中實現(xiàn)目標定位。目標跟蹤技術在二戰(zhàn)之前就已經(jīng)在軍事上得到應用,1937年世界上出現(xiàn)第一部跟蹤雷達站SCR28。之后,隨著科技的進步,各種跟蹤系統(tǒng)的相繼出現(xiàn)與不斷完善,跟蹤理論和方法在各國學者的努力下也獲得了很大的發(fā)展。1955年WAX提出了多目標跟蹤的基本概念,目標跟蹤研究有了一定的發(fā)展。但直到70年代,卡爾曼濾波理論【4L】被成功地應用在目標跟蹤領域【42】之后,目標跟蹤技術才真正引起人們的普遍關注和極大興趣。近二十年來,研究學者在此領域進行了大量的研究,同時隨著其它新技術的出現(xiàn),比如擴展卡爾曼濾波EXTENDEDKALMANFILTER、粒子濾波PARTICLEFILTER、均值遷移MEANSHILL、多模型、多速率處理等技術,結合這些技術提出了許多方法,取得了長足的進步。就跟蹤的方法而言,目標的跟蹤主要包括基于運動MOTIONBASED和基于模型MODELBASED這兩種方法。美國卡內(nèi)基一梅隆大學研究開發(fā)的“實時視頻中動目標識別分類與跟蹤系統(tǒng)”MOVINGTARGETCLASSIFICATIONANDTRACKINGFROMREALTIMEVIDEO就采用了基于模型和運動相結合的方法對視頻中的目標實時監(jiān)控與跟蹤,并識別兩種目標人和汽車【431。本章的研究內(nèi)容是典型視頻監(jiān)控系統(tǒng)中的多運動目標跟蹤,是建立在第三章的多人體目標定位基礎上完成的,首先對描述運動目標的紋理特征進行了介紹,然后重點對MEANSHIFT理論及其在跟蹤中的應用進行了論述,最后給出了一種融合目標顏色、紋理和運動信息的改進的KALMAN和MEANSHIFT跟蹤方法。在現(xiàn)有的目標跟蹤方法中,有一種算法建立在魯棒統(tǒng)計與概率分析基礎之上的MEANSHIFT算法。這種算法通過非參數(shù)估計,沿著圖像梯度方向查找運動目標的概率分布,從而在視頻圖像中跟蹤目標。該算法要選擇上一次確定的目標位置結果作為當前幀圖像中目標的初始位置,本文就利用本算法來實現(xiàn)對運動目標的跟蹤?;谝曨l圖像的運動目標檢測與跟蹤算法研究42紋理特征局部二進制模式LBPLOCALBINARYPATTERN是近年來提出的一種基于灰度圖像有效的紋理描述方法,它是通過比較圖像中每個像素與其鄰域內(nèi)像素灰度值的大小,并利用二進制模式表示的比較結果來描述圖像的紋理。近年來LBP紋理在人臉識別、表情識別以及背景建模等計算機視覺應用領域中表現(xiàn)出良好的性能,但在運動目標跟蹤方面的應用剛剛起步,QUANG等洲提出了利用圖像灰度值和LBP對單色熱度視頻進行跟蹤的算法,對單色的視頻圖像序列達到較好跟蹤效果。王永忠等【451提出基于LBP紋理特征的紅外成像目標跟蹤方法,將LBP紋理特征集成到核跟蹤方法中,構造目標及候選目標的特征模型,利用MEANSHIFT方法實現(xiàn)基于紋理特征的紅外成像目標的跟蹤。寧紀鋒和吳成柯提出用LBP;紋理模型中表示邊界和角的5種基本模式表示目標,并將之成功嵌入MEANSHIFT算法進行目標跟蹤。紋理特征不僅能充分表達圖像的紋理,而且算法具有復雜度低、計算速度快和一定程度上不受光照變化的影響等良好特性,越來越受到目標跟蹤研究領域研究者的重視。421基本局部二進制模式LBP算子是由OJALA等人于1996年提出的M,最初被稱為基本的LBP算子。對圖像中的每個像素,通過計算以其為中心的33鄰域內(nèi)各像素和中心像素的大小關系,把像素的灰度值轉化為一個八位二進制序列。對,處灰度值為Q的像素,它的LBP值為8腳五GAJA,X2H41JLAJ為XJ八鄰域像素集中索引為J,1,2,8的像素灰度值,GAJQ是一個函數(shù)定義為ILI7R口,一Q0G巳一島210D如M洫42大連理工大學碩士學位論文進制垮弼為,I1010011H閼踟羝2LL圖41基本LBP算子FIG41BASICLBPOPERATOR具體計算過程如圖41所示,對于圖像的任意一點厶,其LBP特征計算為,以露為中心,取與厶相鄰的8個點,按照順時針的方向記為而,五,易;以厶點的象素值為閾值,如果五點的象素值小于厶,則五被二值化為0,否則為L;將序列看成一個8位二進制數(shù),將該二進制數(shù)轉化為十進制就可得到厶點處LBP算子的值。422擴展局部二進制模模式基本的LBP算子只局限在33的鄰域內(nèi),對于較大圖像大尺度的結構不能很好的提取需要的紋理特征,因此研究者們對LBP算子進行了擴展【48】。新的LBP算子三碑??梢杂嬎悴煌霃洁徲虼笮『筒煌袼攸c數(shù)的特征值,其中P表示周圍像素點個數(shù),R表示鄰域半徑,同時把原來的方形鄰域擴展到了圓
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度合作社土地流轉項目實施合同
- 二零二五年度園林綠化工程預算咨詢服務協(xié)議
- 二零二五年度醫(yī)院陪護人員就業(yè)保障與福利合同
- 2025年度超齡員工用工免責協(xié)議書(高科技產(chǎn)業(yè)適用)
- 二零二五年度生豬養(yǎng)殖廢棄物資源化利用合作協(xié)議
- 2025年股權代持協(xié)議范本與股權變更流程
- 二零二五年度網(wǎng)絡安全合伙人股權配置與防護體系建設協(xié)議
- 二零二五年土地抵押個人土地使用權轉讓協(xié)議
- 二零二五年度加盟分公司品牌保護及侵權糾紛處理合同
- 二零二五年度車輛出借免責協(xié)議:車輛租賃合同違約責任及賠償規(guī)定合同
- (完整版)小學生心理健康教育課件
- 戶口遷回原籍申請表
- 人教版因數(shù)和倍數(shù)說課
- 小學語文用好交流平臺-以五年級下冊《語文園地一“交流平臺”》的教學設計為例
- 鐵路基本建設工程設計概(預)算編制辦法-國鐵科法(2017)30號
- 餐飲企業(yè)日管控、周排查、月調(diào)度表格模板
- GB/T 17640-2023土工合成材料長絲機織土工布
- (2023)壓力管道考試題庫及參考答案(通用版)
- 細菌的人工培養(yǎng)實驗報告
- 路基路面工程完整全套課件
- 旅游大數(shù)據(jù)理論、技術與應用課程方案、案例分析
評論
0/150
提交評論