計算機視覺在各個方面的應(yīng)用.doc_第1頁
計算機視覺在各個方面的應(yīng)用.doc_第2頁
計算機視覺在各個方面的應(yīng)用.doc_第3頁
計算機視覺在各個方面的應(yīng)用.doc_第4頁
免費預(yù)覽已結(jié)束,剩余1頁可下載查看

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

計算機視覺在各個方面的應(yīng)用摘要計算機視覺是一門研究如何使機器“看”的科學(xué),更進一步的說,就是是指用攝影機和電腦代替人眼對目標(biāo)進行識別、跟蹤和測量等機器視覺,并進一步做圖形處理,用電腦處理成為更適合人眼觀察或傳送給儀器檢測的圖像。作為一個科學(xué)學(xué)科,計算機視覺研究相關(guān)的理論和技術(shù),試圖建立能夠從圖像或者多維數(shù)據(jù)中獲取信息的人工智能系統(tǒng)。這里所 指的信息指Shannon定義的,可以用來幫助做一個“決定”的信息。因為感知可以看作是從感官信號中提 取信息,所以計算機視覺也可以看作是研究如何使人工系統(tǒng)從圖像或多維數(shù)據(jù)中“感知”的科學(xué)。關(guān)鍵詞:圖像處理,模式識別,圖像理解。正文1.1序言計算機視覺是使用計算機及相關(guān)設(shè)備對生物視覺的一種模擬。它的主要任務(wù)就是通過對采集的圖片或視頻進行處理以獲得相應(yīng)場景的三維信息,就像人類和許多其他類生物每天所做的那樣。 計算機視覺既是工程領(lǐng)域,也是科學(xué)領(lǐng)域中的一個富有挑戰(zhàn)性重要研究領(lǐng)域。計算機視覺是一門綜合性的學(xué)科,它已經(jīng)吸引了來自各個學(xué)科的研究者參加到對它的研究之中。其中包括計算計科學(xué)和工程、信號處理、物理學(xué)、應(yīng)用數(shù)學(xué)和統(tǒng)計學(xué),神經(jīng)生理學(xué)和認知科學(xué)等。所需要的知識儲備以及相關(guān)課程如下, 圖1-1 圖1-21.1.2 現(xiàn)階段的形式視覺是各個應(yīng)用領(lǐng)域,如制造業(yè)、檢驗、文檔分析、醫(yī)療診斷,和軍事等領(lǐng)域中各種智能/自主系統(tǒng)中不可分割的一部分。由于它的重要性,一些先進國家,例如美國把對計算機視覺的 圖1-3計算機視覺與其他領(lǐng)域的關(guān)系研究列為對經(jīng)濟和科學(xué)有廣泛影響的科學(xué)和工程中的重大基本問題,即所謂的重大挑戰(zhàn)(grand challenge)。計算機視覺的挑戰(zhàn)是要為計算機和機器人開發(fā)具有與人類水平相當(dāng)?shù)囊曈X能力。機器視覺需要圖象信號,紋理和顏色建模,幾何處理和推理,以及物體建模。一個有能力的視覺系統(tǒng)應(yīng)該把所有這些處理都緊密地集成在一起。作為一門學(xué)科,計算機視覺開始于60年代初,但在計算機視覺的基本研究中的許多重要進展是在80年代取得的。計算機視覺與人類視覺密切相關(guān),對人類視覺有一個正確的認識將對計算機視覺的研究非常有益。為此我們將先介紹人類視覺。 人類正在進入信息時代,計算機將越來越廣泛地進入幾乎所有領(lǐng)域。一方面是更多未經(jīng)計算機專業(yè)訓(xùn)練的人也需要應(yīng)用計算機,而另一方面是計算機的功能越來越強,使用方法越來越復(fù)雜。這就使人在進行交談和通訊時的靈活性與目前在使用計算機時所要求的嚴格和死板之間產(chǎn)生了尖銳的矛盾。人可通過視覺和聽覺,語言與外界交換信息,并且可用不同的方式表示相同的含義,而目前的計算機卻要求嚴格按照各種程序語言來編寫程序,只有這樣計算機才能運行。為使更多的人能使用復(fù)雜的計算機,必須改變過去的那種讓人來適應(yīng)計算機,來死記硬背計算機的使用規(guī)則的情況。而是反過來讓計算機來適應(yīng)人的習(xí)慣和要求,以人所習(xí)慣的方式與人進行信息交換,也就是讓計算機具有視覺、聽覺和說話等能力。這時計算機必須具有邏輯推理和決策的能力。具有上述能力的計算機就是智能計算機。 智能計算機不但使計算機更便于為人們所使用,同時如果用這樣的計算機來控制各種自動化裝置特別是智能機器人,就可以使這些自動化系統(tǒng)和智能機器人具有適應(yīng)環(huán)境,和自主作出決策的能力。這就可以在各種場合取代人的繁重工作,或代替人到各種危險和惡劣環(huán)境中完成任務(wù)。1.1.3 簡單原理計算機視覺就是用各種成象系統(tǒng)代替視覺器官作為輸入敏感手段,由計算機來代替大腦完成處理和解釋。計算機視覺的最終研究目標(biāo)就是使計算機能象人那樣通過視覺觀察和理解世界,具有自主適應(yīng)環(huán)境的能力。要經(jīng)過長期的努力才能達到的目標(biāo)。因此,在實現(xiàn)最終目標(biāo)以前,人們努力的中期目標(biāo)是建立一種視覺系統(tǒng),這個系統(tǒng)能依據(jù)視覺敏感和反饋的某種程度的智能完成一定的任務(wù)。例如,計算機視覺的一個重要應(yīng)用領(lǐng)域就是自主車輛的視覺導(dǎo)航,目前還沒有條件實現(xiàn)象人那樣能識別和理解任何環(huán)境,完成自主導(dǎo)航的系統(tǒng)。因此,目前人們努力的研究目標(biāo)是實現(xiàn)在高速公路上具有道路跟蹤能力,可避免與前方車輛碰撞的視覺輔助駕駛系統(tǒng)。這里要指出的一點是在計算機視覺系統(tǒng)中計算機起代替人腦的作用,但并不意味著計算機必須按人類視覺的方法完成視覺信息的處理。計算機視覺可以而且應(yīng)該根據(jù)計算機系統(tǒng)的特點來進行視覺信息的處理。但是,人類視覺系統(tǒng)是迄今為止,人們所知道的功能最強大和完善的視覺系統(tǒng)。如在以下的章節(jié)中會看到的那樣,對人類視覺處理機制的研究將給計算機視覺的研究提供啟發(fā)和指導(dǎo)。因此,用計算機信息處理的方法研究人類視覺的機理,建立人類視覺的計算理論,也是一個非常重要和信人感興趣的研究領(lǐng)域。這方面的研究被稱為計算視覺(Computational Vision)。計算視覺可被認為是計算機視覺中的一個研究領(lǐng)域。2.1 簡單舉例-計算機視覺中的攝像機定標(biāo)方法2.1. 三維定標(biāo)法在人們的平常思維中 凡是物體的影像必定是三維的本文的理論研究也同樣基于這樣的想法 在討論單幅圖像的設(shè)計標(biāo)定之時 我們所追求的理論基礎(chǔ)就是需要攝像機的定標(biāo)物是人們所追求的那種三維的效果 在此基礎(chǔ)上再進行相關(guān)的理論研究 以達到相得益彰的效果 在此過程中 首先要準確定位定標(biāo)物上一些比較重要的點的三維坐標(biāo) 這樣才能夠為后來的工作提供方便 然后在與定標(biāo)物相對應(yīng)的成像上找到相應(yīng)的點的位置 這是至關(guān)重要的一步 這也決定了后面成像的具體設(shè)計方法 最后在那些比較重要的點的圖像上標(biāo)出其具體的三維坐標(biāo) 達到定標(biāo)物的實際成像效果圖 這樣就可以完全解決攝像機的成像問題了 這種定標(biāo)方法的基本原理就是充分分析定標(biāo)物的三維信息 同時與它的具體成像位置相關(guān)聯(lián) 在這兩者之間形成一種具體的相對應(yīng)關(guān)系 由此我們可以充分利用計算機的快速運算 實現(xiàn)攝像的功能 并適時進行程序功能改進 優(yōu)化定標(biāo)物參數(shù)的獲取方法 從而達到增加攝像機清晰度的目標(biāo)2.1.2 平面定標(biāo)法與上面的定標(biāo)方法相對立的一種方法就是多幅圖像的設(shè)計標(biāo)定 在這樣的時代背景下 人們的要求應(yīng)盡可能得到滿足 因而理論研究者會在這個方面下足功夫 弄懂這里面的個中玄機 利用多幅圖像對平面的定標(biāo)物來進行物體的標(biāo)定工作 以達到攝像機定標(biāo)的目的 這樣的平面定標(biāo)方法就是充分利用平面物體的運動特性 在它和攝像機之間找到一個平衡點 觀察兩者的相對運動 這樣的定標(biāo)方法也給拍攝運動中的物體帶來了生機 此方法在實施之余也會帶給人們不一樣的感受 讓人們充分體會到攝像的魅力 當(dāng)然這種考慮運動的平面定標(biāo)法會受到特征點的增多的影響 隨著點的不斷增加 定標(biāo)情況就會越來越好 定標(biāo)物的精度也會不斷提高 于是在定標(biāo)物相同的前提下 平面定標(biāo)法自然就可以從定標(biāo)物上獲得更多的數(shù)據(jù)信息 為準確對定標(biāo)物進行定位測量提供了更多的依據(jù) 因此 這種方法的效果要比前面的方法好很多 得到推廣的力度也會大大增加 所得到的經(jīng)濟效益也會增加設(shè)備的成本在原來的基礎(chǔ)上還有降低的趨勢 所以 理論研究者的研究領(lǐng)域就會逐漸向這一方面進行轉(zhuǎn)變2.1.3 兩步定標(biāo)法有了前面的研究成果作支撐 攝像機定標(biāo)方法的進一步研究就會顯得異常容易 人們的進一步要求也會得到滿足 可謂一舉兩得 理論研究者們在有了豐富的理論和實踐基礎(chǔ)之后 利用直接線性的定標(biāo)方法進行攝像機參數(shù)的進一步優(yōu)化提高 通過透視原理來修改以前的參數(shù) 然后將修正的參數(shù)進行初始值的確認 把它們作為現(xiàn)在研究階段的起點 在這樣的起點之上綜合考慮各種外界因素 利用最優(yōu)化的計算機算法進行攝像機成像程序的改進 把原來的程序進行升級處理 使得定標(biāo)物的精確度得到進一步的提高 這就是我們所提到的兩步定標(biāo)法 它的基本原理其實很簡單 只不過是充分利用了原有的理論 并進行了一定的創(chuàng)新而已 但就是這樣的創(chuàng)新步伐的邁出 給計算機視覺中的攝像機定標(biāo)方法帶來了新的生機 也給攝像機鏡頭的優(yōu)化帶來了很多指導(dǎo)方法 在圖像中心到圖像點的距離保持不變的前提下 參數(shù)的數(shù)量會顯著減少 這樣不僅節(jié)省了材料的用量 而且還進一步提高了攝像機的攝像清晰度 有效彌補了以前清晰度不高的缺點 這樣一來 攝像機的成像效果大大改進 于是才有了現(xiàn)代攝像機的高清效果 確實讓人們享受到了科技帶來的福音。2.1.4 總結(jié)綜上所述 計算機視覺中攝像機定標(biāo)方法在人們的不斷認識中得以應(yīng)用和推廣 在時代的不斷進步中逐漸向前發(fā)展 同時 攝像機標(biāo)定方法的應(yīng)用特點也大相徑庭 各有千秋 從而實現(xiàn)百家爭鳴的態(tài)勢 進一步推動計算機視覺中的攝像機研究工作的向前發(fā)展。3.1 會議期刊會議頂級ICCV:International Conference on Computer Vision,國際計算機視覺大會 CVPR:International Conference on Computer Vision and Pattern Recognition,國際計算機視覺與模式識別大會 ECCV:European Conference on Computer Vision,歐洲計算機視覺大會 較好ICIP:International Conference on Image Processing,國際圖像處理大會 BMVC:British Machine Vision Conference,英國機器視覺大會 ICPR:International Conference on Pattern Recognition,國際模式識別大會 ACCV:Asian Conference on Computer Vision,亞洲計算機視覺大會 期刊頂級PAMI:IEEE Transactions on Pattern Analysis and Machine Intelligence,IEEE 模式分析與機器智能雜志 IJCV:International Journal on Computer Vision,國際計算機視覺雜志 較好CVIU:Computer Vision and Image Understanding,計算機視覺與圖像理解 PR:Pattern Recognition,模式識別 PRL:Pattern Recognition Letters,模式識別快報參考文獻: 1 D. Vernon Machine vision-Automated visual inspection and robot vision :Englewood Clif

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論