《機器視覺理論與實戰(zhàn)》 課件 第一章 緒論_第1頁
《機器視覺理論與實戰(zhàn)》 課件 第一章 緒論_第2頁
《機器視覺理論與實戰(zhàn)》 課件 第一章 緒論_第3頁
《機器視覺理論與實戰(zhàn)》 課件 第一章 緒論_第4頁
《機器視覺理論與實戰(zhàn)》 課件 第一章 緒論_第5頁
已閱讀5頁,還剩18頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第一章緒論

本章知識點:人工智能的概念人工智能技術(shù)優(yōu)勢人工智能發(fā)展階段人工智能研究領(lǐng)域機器視覺主要分類1.1人工智能技術(shù)簡介

人類不僅可以通過眼、耳、口、鼻等感覺器官感知世界,更重要的是可以對信息進行再加工,并通過雙手改造世界。

人類對世界的認知是可以通過學(xué)習積累和傳承的,即所謂的“經(jīng)驗”。正是在不斷的“學(xué)習-積累-改造”迭代過程中,人類社會才會不斷進步。由此,把人類所具有的感知信息、學(xué)習過程、經(jīng)驗積累、改造世界的能力,稱為“人類智能”?!爸恰敝傅氖撬季S方式,“能”指的是能力。思考題:舉例說明人類所具有的“智”、“能”?1、人工智能定義:1956年的達特茅斯會議上,人工智能定義首次提出為:人工智能是用計算機模擬人在思維活動中所需智能的工作過程。1987年Michael和Nils將人工智能定義為:人工智能是研究智能行為的科學(xué)。它的最終目的是建立關(guān)于自然智能實體行為的理論和指導(dǎo)創(chuàng)造具有智能行為的人工制品。人工智能有兩個分支,一個為科學(xué)人工智能,一個為工程人工智能。

百度百科將人工智能定義為:它是研究、開發(fā)用于模擬、延申和擴展人的智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的一門新的技術(shù)科學(xué)。思考題:人有哪些“智能”可以用計算機模擬?2、研究、應(yīng)用人工智能的原因:(1)縮短經(jīng)驗積累周期,擴展個體認知水平(2)將人從繁瑣的重復(fù)性勞動中解脫出來,提高工作效率(3)推動社會進步,帶動相關(guān)產(chǎn)業(yè)發(fā)展(4)構(gòu)建新的知識體系模式,推動技術(shù)發(fā)展進程思考題:你還能想出其他研究、應(yīng)用人工智能的原因嗎?1.2人工智能技術(shù)發(fā)展進程1.孕育期(1956年之前)

這一時期,主要是人類對自身思維方式的總結(jié),并探索用“機器”來實現(xiàn)某些人類思維。2.形成期(1956-1969)1969年,成立的國際人工智能聯(lián)合會議,標志著人工智能學(xué)科已經(jīng)取得了世界的認可。3.發(fā)展期(1970年-2010年)

學(xué)術(shù)界也相繼成立了多個人工智能學(xué)會、創(chuàng)辦了如ArtificialIntelligence、MachineIntelligence、IJCAI等多種期刊和論文集刊載人工智能的研究成果。Google、蘋果等公司從應(yīng)用角度,也在持續(xù)進行著人工智能產(chǎn)品的研發(fā)。4.融合期(2011年至今)

這一時期開始形成人工智能產(chǎn)業(yè)基礎(chǔ),人工智能企業(yè)數(shù)量大幅增長、國家出臺政策推動人工智能發(fā)展、人工智能與其他技術(shù)融合更加深入、人工智能技術(shù)獲得了更廣泛的應(yīng)用。1.3人工智能技術(shù)研究的各種學(xué)派1.符號主義

認為人類認知和思維的基本單元是符號,認知過程就是符號操作過程。代表人物紐厄爾、西蒙。

2.連接主義

認為人工智能源于仿生學(xué),通過對人腦模型的研究,實現(xiàn)人工智能。代表人物霍普菲爾德。3.行為主義

認為學(xué)習是刺激與反應(yīng)之間的聯(lián)結(jié),學(xué)習的過程,就是一個不斷試錯、強化訓(xùn)練、漸進優(yōu)化的過程。1.4人工智能研究領(lǐng)域1.機器學(xué)習

機器學(xué)習(MachineLearning)就是研究計算機怎樣模擬或?qū)崿F(xiàn)人類的學(xué)習行為,以獲取新的知識或技能,重新組織已有的知識結(jié)構(gòu)使之不斷改善自身的性能。

它是人工智能的核心技術(shù),是使計算機具有人類智能的根本途徑。思考題:你能舉出生活中“機器學(xué)習”的例子嗎?2.語音識別

語言是人類區(qū)別于其他動物的基本特征之一。人類在對話時,是通過聲帶振動發(fā)出不同聲音,從而形成對話內(nèi)容,這個功能在人工智能技術(shù)中稱為語音識別(SpeechRecognition)。語音識別是指一種通過計算機將語音生成文本的技術(shù)。思考題:你能舉出生活中“語音識別”的例子嗎?3.自然語言處理

人類語言是及其豐富的,在不同環(huán)境、不同場景下,相同的話語表達的意思可能大不相同,所以除了將語音譯成文字,還要根據(jù)語境分析、理解其中的含義,這個功能在人工智能技術(shù)中稱為自然語言處理(NaturalLanguageProcessing,NLP)。自然語言處理是研究對自然語言含義進行正確、合理、有效分析的理論、方法和實現(xiàn)技術(shù)。思考題:你能舉出生活中“自然語言處理”的例子嗎?4.機器視覺(計算機視覺)

機器視覺(ComputerVision,CV)是研究以計算機、攝像機構(gòu)為核心的系統(tǒng)來模仿人類視覺系統(tǒng)的技術(shù),讓計算機擁有類似人眼定位、提取、處理、分析、理解圖像的能力。由于視覺信息處理是人類智能的主要特征之一,所以機器視覺成為人工智能領(lǐng)域研究的重點和熱點;同時,因為視覺效果受物體特性、環(huán)境因素等影響,所以機器視覺也是人工智能研究的難點。思考題:你能舉出生活中“機器視覺”的例子嗎?5.機器人學(xué)

當機器的感官和思維方式具有人類特征之后,希望它在形體和行為特征方面也像人類一樣,由此產(chǎn)生了機器人學(xué),即創(chuàng)造外觀像人一樣的機器,能夠模仿人的動作,并且具有人類感知、識別、分析、處理、學(xué)習和反饋信息的能力。思考題:你了解的機器人發(fā)展到了什么程度?1.5機器視覺概述

1.5.1機器視覺主要分類1.圖像分類

在一張(靜態(tài))圖片中識別出其中的內(nèi)容,通常圖片內(nèi)容比較單一,主要目的是識別出內(nèi)容所屬的種類,例如圖1-1所示圖片。圖1-1圖像分類的例子2.目標檢測(與定位)

目標檢測不僅要辨別出圖片上內(nèi)容的類別,還要用邊框?qū)⒈鎰e的東西標記出來,確定所識別物體的位置。例如圖1-2中包含很多種水果,通過機器視覺,希望給出水果的名稱和出現(xiàn)的位置。圖1-2目標檢測的例子目標檢測至今仍然是計算機視覺領(lǐng)域較為活躍的一個研究方向,雖然已經(jīng)取得了大量成果,但離一些真實復(fù)雜場景的應(yīng)用還存在一定差距,目標檢測這一基本任務(wù)仍然是非常具有挑戰(zhàn)性的課題,存在很大的提升潛力和空間。圖1-3展示了一個工業(yè)工藝流程復(fù)雜應(yīng)用場景,此時目標檢測存在識別錯誤率較高的情況。圖1-3復(fù)雜工業(yè)場景目標檢測的例子3.語義分割

有些時候,不僅需要知道圖像中是什么內(nèi)容,還想知道更詳細的信息。例如對于圖1-2而言,我們需要知道其中包含的每種水果的數(shù)量,這比圖像分類和目標檢測結(jié)果要求更進了一步,實現(xiàn)這種功能的機器視覺技術(shù)稱為語義分割。即語義分割是指將圖像中的每個像素鏈接到其所屬的類(標簽)的過程,可以將語義分割視為像素級別的圖像分類。語義分割在公共場所中人流計數(shù)、自動駕駛中運行環(huán)境理解、醫(yī)學(xué)影像中診斷分析等領(lǐng)域都有廣闊的應(yīng)用前景和價值。4.目標跟蹤

目標跟蹤是指對圖像序列(在時間上連續(xù)的圖片,例如視頻)中的運動目標進行檢測、提取、識別和跟蹤,獲得運動目標的運動參數(shù),通過處理和分析,實現(xiàn)對運動目標的行為理解,以完成更高一級的檢測任務(wù)。如圖1-4所示的一段連續(xù)視頻截圖,通過目標跟蹤技術(shù),定位、跟蹤紅框中的車輛,以獲得需要的信息。圖1-4目標跟蹤的例子5.光學(xué)字符識別(OCR)

圖片中包含的內(nèi)容不僅僅是物體,還有諸如文字、數(shù)字、字符等信息,有時需要將這些信息識別出來,在機器視覺中稱為光學(xué)字符識別(opticalcharacterrecognition,OCR)。它是指通過電子設(shè)備(例如掃描儀或相機)拍攝介質(zhì)上的字符,然后利用字符識別方法將其翻譯成文字的過程。交通中的車牌識別、機場的身份證識別、銀行的銀行卡識別等都屬于OCR應(yīng)用場景。圖1-5利用OCR對工業(yè)數(shù)顯屏數(shù)據(jù)進行識別思考題:你能舉出生活中應(yīng)用OCR技術(shù)的例子嗎?1.5.2機器視覺研究難點1.光照條件

自然環(huán)境(晴天、陰天、白天、黑夜)、光照強度、光線色澤等因素對拍攝圖片的清晰度都會有影響,所以在機器視覺技術(shù)應(yīng)用中,一定要非常重視光照條件,并采取有效措施,盡量避免或減弱光照因素的影響。2.拍攝角度

拍攝角度不同,會使圖片中的內(nèi)容產(chǎn)生變形、扭曲,對于機器視覺技術(shù)應(yīng)用影響較大。所以在安裝攝像裝置時,盡量保證裝置與待拍場景垂直,以獲得最佳的拍攝角度;當待拍場景動態(tài)移動時,需要定制開發(fā)攝像跟蹤裝置,確保合適的拍攝角度,以得到清晰的圖片。3.物體特征

被拍攝物體的一些特征對圖片清晰度也有較大影響,這些特征主要包括物體形狀、物體顏色、物體反光性、是否運動、運動是否規(guī)則等,所以在安裝攝像裝置前,要充分了解物體特征,做出相應(yīng)的解決方案,確保拍攝到期望特征圖片。4.技術(shù)因素

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論