版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、第14章場景解釋14.1 線條圖標記解釋14.2 體育比賽視頻排序14.3 計算機視覺系統(tǒng)模型14.4 計算機視覺理論框架14.1 線條圖標記解釋1.輪廓標記在線條圖中對輪廓進行標記時的一些名詞概念(1)刃邊(2)翼邊(3)折痕(4)痕跡(5)陰影14.1 線條圖標記解釋2.結構推理三面角點目標,處于常規(guī)位置14.1 線條圖標記解釋2.結構推理14.1 線條圖標記解釋3.回朔標記已知2-D線條圖中的一組邊,要給每條邊賦一個標記,以解釋3-D的情況回朔標記法將邊排成序列,以深度優(yōu)先的方式生成通路,依次對每條邊進行所有可能的標記,檢驗新標記與其他邊標記的一致性,依次賦給所有邊的標記都滿足一致性,則
2、得到一種標記結果 棱錐4個頂點分別用A,B,C,D表示14.1 線條圖標記解釋14.2 體育比賽視頻排序1.體育比賽視頻的特點一般均有較強的結構性總有一些高潮事件環(huán)境是特定的,比賽中有許多不定因素,事件發(fā)生的時間位置不能事先確定,所以比賽中無法控制視頻生成過程有關特殊事件的精彩鏡頭是一大看點使用先驗知識對精彩事件進行定義檢測14.2 體育比賽視頻排序2.比賽節(jié)目的結構(乒乓球比賽)比賽事件、發(fā)球事件、場間休息、觀眾和重放將節(jié)目中的鏡頭根據(jù)場景進行非監(jiān)督聚類14.2 體育比賽視頻排序3.目標檢測和跟蹤 基于客觀指標 運動員檢測 球桌檢測 球檢測 運動員跟蹤 乒乓球跟蹤14.2 體育比賽視頻排序3
3、.目標檢測和跟蹤 白線框為運動員外接盒跟蹤得到的乒乓球軌跡14.2 體育比賽視頻排序4.精彩度判定和排序 (1)基本層的排序球運動的平均速度連續(xù)兩次擊球間球運動的平均距離運動員連續(xù)兩次擊球間運動的平均距離14.2 體育比賽視頻排序4.精彩度判定和排序 (2)品質層的排序運動員移動的激烈程度球軌跡的品質擊球的變化14.3 計算機視覺系統(tǒng)模型14.3.1 多層次串行結構14.3.2 以知識庫為中心的輻射結構14.3.3 多模塊交叉配合結構14.3.1 多層次串行結構將圖像理解過程看作是一個信息加工過程,具有確定的輸入和輸出,因而將圖像理解系統(tǒng)組織成一系列分別處于不同層次的模塊并以串行方式結合起 來
4、,每個模塊(在其他模塊的協(xié)同配合下)按順序執(zhí)行一些特定的工作,從而逐步完成預定的視覺任務由底向上的處理,比較通用,但不一定總有 效。由頂向下的處理,在約束充分時效率會比較高,反之則不實用14.3.1 多層次串行結構14.3.2 以知識庫為中心的輻射結構可以看作是一種類比于人類視覺系統(tǒng)的結構。它的特點是以知識為中心,系統(tǒng)整體不分層,信號在各個模塊及知識庫中多次進行交換處理14.3.3 多模塊交叉配合結構將整個系統(tǒng)分成多個模塊,各有確定的輸入和輸出,且互相配合交叉,比較靈活一個圖,其中每個結點代表一個加工過程或加工任務,而結點間的連接則反映了信息的流動和過程的聯(lián)系本書的整體框架,即本書所采用的計算
5、機視覺系統(tǒng)框架是對上述多模塊交叉配合結構的系統(tǒng)框圖根據(jù)教學需求經(jīng)過調整而得到的14.3.3 多模塊交叉配合結構14.4 計算機視覺理論框架14.4.1 馬爾視覺計算理論14.4.2 對馬爾理論框架的改進14.4.3 新理論框架的研究14.4.1 馬爾視覺計算理論1.視覺是一個復雜的信息加工過程要解決兩個問題。一個是視覺信息的表達問 題,另一個是視覺信息的加工問題2.視覺信息加工的三個要素14.4.1 馬爾視覺計算理論2.視覺信息加工的三個要素一個任務要用計算機完成,它應該是可以被計算的。這就是可計算性問題,需要用計算理論來回答有了計算理論后,還必須要有算法實現(xiàn),為此需要給加工所操作的實體選擇一
6、種合適的表達有了表達和算法,在物理上如何實現(xiàn)算法也是必不可少的。特別是隨著對實時性要求的不斷提高,專用的硬件實現(xiàn)問題常常被提出來14.4.1 馬爾視覺計算理論2.視覺信息加工的三個要素上述三個要素之間有一定的邏輯因果聯(lián)系,但并無絕對的依賴關系箭頭正向表示帶有指導的含義,反過來則有作為基礎的含義14.4.1 馬爾視覺計算理論3.視覺信息的三級內部表達(1)基素表達一種2-D表達,它是圖像特征的集合(2)2.5-D表達完全是為了適應計算機的運算功能而提出來的(3)3-D表達以物體為中心(也包括了物體的不可見部分)的表達形式14.4.1 馬爾視覺計算理論3.視覺信息的三級內部表達如何由原始圖的像素表
7、達出發(fā),通過基素表達和2.5-D表達,最后得到3-D表達14.4.1 馬爾視覺計算理論4.視覺信息處理是按照功能模塊的形式組織起來的視覺信息系統(tǒng)應該包括許多模塊,每個模塊獲取某一特定的視覺線索,進行一定的加工5.計算理論形式化表示必須考慮約束條件約束條件一般是借助先驗知識獲得的,利用約束條件可改變病態(tài)問題14.4.2 對馬爾理論框架的改進馬爾的理論也有其不足之處:(1)框架中輸入是被動的,給什么圖像,系統(tǒng)就處理什么圖像(2)框架中加工目的不變,總是恢復場景中物體的位置和形狀等(3)框架缺乏或者說未足夠重視高層知識的指導作用(4)整個框架中信息加工過程基本自下而上,單向流動,沒有反饋14.4.2
8、 對馬爾理論框架的改進4個方面的改進:(1)主動視覺(2)有目的視覺(3)高層知識(4)反饋控制14.4.3 新理論框架的研究1.基于知識的理論框架(1)從圖像特征中提取那些相對于觀察方向在大范圍內保持不變的分組和結構(2)利用概率排隊的方法減小搜索空間(3)使3-D模型的投影直接與圖像特征相匹配14.4.3 新理論框架的研究2.主動視覺理論框架(1)選擇注意機制(2)注視控制14.4.3 新理論框架的研究3.計算機視覺的最終目標人類視覺系統(tǒng)是相當通用的計算機視覺系統(tǒng)。計算機視覺研究的一個重要目標就是要建立能完成各種視覺任務的通用系統(tǒng)計算機視覺是一個牽涉人類智能的問題。對于許多看起來非常簡單的人類智能是否可能在計算機上復現(xiàn),至今還沒有定論這是一個值得研究和有所作為的領域,有著光明的前景,讓我們一起努力吧!教程作者(
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 廣東外語外貿大學南國商學院《蒙臺梭利教育法》2023-2024學年第一學期期末試卷
- 廣東體育職業(yè)技術學院《特殊兒童早期干預》2023-2024學年第一學期期末試卷
- 廣東司法警官職業(yè)學院《通信系統(tǒng)制圖》2023-2024學年第一學期期末試卷
- 廣東食品藥品職業(yè)學院《教師領導力》2023-2024學年第一學期期末試卷
- 廣東女子職業(yè)技術學院《統(tǒng)計學原理實驗》2023-2024學年第一學期期末試卷
- 廣東農工商職業(yè)技術學院《環(huán)境工程項目管理與概預算》2023-2024學年第一學期期末試卷
- 廣東梅州職業(yè)技術學院《油畫速寫》2023-2024學年第一學期期末試卷
- 廣東女子職業(yè)技術學院《小學德育》2023-2024學年第一學期期末試卷
- 廣東理工職業(yè)學院《宏觀經(jīng)濟學原理(全英文)》2023-2024學年第一學期期末試卷
- 四年級數(shù)學(上)計算題專項練習及答案匯編
- 普外科醫(yī)療組長競聘演講
- 北京市朝陽區(qū)2022-2023學年三年級上學期英語期末試卷
- GB/T 9755-2024合成樹脂乳液墻面涂料
- 嗶哩嗶哩MATES人群資產經(jīng)營白皮書【嗶哩嗶哩】
- 【歷史】第一、二單元測試題2024~2025學年統(tǒng)編版七年級歷史上冊
- 婚姻家庭規(guī)劃
- 認識實習報告(10篇)
- 【MOOC】內科護理學-中山大學 中國大學慕課MOOC答案
- 2024年商業(yè)地產買賣合同樣本
- 2024年度軟件定制開發(fā)合同(ERP系統(tǒng))3篇
- 家族族譜模板
評論
0/150
提交評論