版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
AI遇見應(yīng)用
興趣引領(lǐng)未來項目三認知人工智能的應(yīng)用技術(shù)任務(wù)一視覺智能——機器如何識字、看人人工智能基礎(chǔ)與應(yīng)用
項目三認知人工智能的應(yīng)用技術(shù)目錄教學(xué)目標(biāo)教學(xué)要求內(nèi)容概覽相關(guān)知識3.1.1圖像識別技術(shù)的原理及應(yīng)用 3.1.2人臉識別技術(shù)及應(yīng)用 3.1.3OCR文字識別技術(shù)及應(yīng)用練習(xí)與思考 人工智能基礎(chǔ)與應(yīng)用
項目三認知人工智能的應(yīng)用技術(shù)任務(wù)一視覺智能——機器如何識字、看人1.掌握圖像識別、人臉識別、文字識別的含義2.理解圖像識別、人臉識別、文字識別的原理、技術(shù)流程、應(yīng)用及發(fā)展趨勢3.進行圖像識別、人臉識別、文字識別的實訓(xùn)【教學(xué)目標(biāo)】1.知識點圖像識別、視頻識別、人臉識別、行為識別、文字識別的概念和技術(shù)流程2.技能點掌握圖像識別、人臉識別、文字識別的實訓(xùn)操作3.重難點通過本項目的學(xué)習(xí),重點理解視覺智能包括哪些應(yīng)用技術(shù),過去的計算機視覺和現(xiàn)在的視覺智能有什么區(qū)別和聯(lián)系,思考在生活和行業(yè)方面有哪些具體應(yīng)用?從“看得見”到“看得清楚、看得明白”之間,需要我們怎么去訓(xùn)練機器?同時,結(jié)合每個任務(wù)后的實訓(xùn)項目進一步思考,嘗試拓展更多實訓(xùn)任務(wù)?!窘虒W(xué)要求】【內(nèi)容概覽】任務(wù)一視覺智能——機器如何識字、看人3.1.3OCR文字識別技術(shù)及應(yīng)用什么是OCR識別OCR識別的智能化OCR識別的應(yīng)用3.1.2人臉識別技術(shù)及應(yīng)用是圖像識別的一個應(yīng)用場景,也叫做人像識別、面部識別,即基于人的臉部特征信息進行身份識別3.1.1圖像識別技術(shù)及應(yīng)用什么是圖像識別?技術(shù)流程:人臉圖像采集及檢測、人臉圖像預(yù)處理、人臉圖像特征提取以及匹配與識別基于深度學(xué)習(xí)技術(shù),將圖片上的文字、符號智能識別出來并變?yōu)榭删庉嫷奈谋緝?yōu)點:識別效率和準(zhǔn)確率高、識別圖像質(zhì)量寬容度高通用文字識別、卡證文字識別、票據(jù)文字識別、場景文字識別、其他文字識別(圖片數(shù)字、印章檢測、表格文字、圖片二維碼等)識別流程:圖像輸入、圖像預(yù)處理、版面分析、字符切割、字符特征提取、字符識別、后處理校正圖像識別的技術(shù)流程圖像識別的應(yīng)用信息的獲取、預(yù)處理、特征抽取和選擇、分類器設(shè)計和分類決策應(yīng)用領(lǐng)域:公共安全、生物、工業(yè)、農(nóng)業(yè)、交通、醫(yī)療等延展介紹:視頻識別及視頻中的行為識別圖像處理:圖像采集、圖像增強、圖像復(fù)原、圖像編碼與壓縮、圖像分割圖像識別:統(tǒng)計法、模板匹配法和神經(jīng)網(wǎng)絡(luò)法等【相關(guān)知識】計算機視覺應(yīng)用場景圖像識別是人工智能行業(yè)應(yīng)用的一個重要方向,也是機器學(xué)習(xí)最熱門的領(lǐng)域之一。其目的是為了讓計算機代替人類去處理大量的物理信息,解決人類無法識別或者識別率特別低的信息。圖像識別的發(fā)展經(jīng)歷三個階段:文字識別、數(shù)字圖像處理與識別、物體識別。圖像識別通過分類并提取重要特征并排除多余的信息來識別圖像。圖像的內(nèi)容通常是用圖像特征進行描述,包括:顏色特征、紋理特征、形狀特征及局部特征點等。一、圖像識別技術(shù)的原理及應(yīng)用(一)什么是圖像識別?
圖像識別過程圖像識別過程分為圖像處理和圖像識別兩個部分。一、圖像識別技術(shù)的原理及應(yīng)用(一)什么是圖像識別?
圖像識別過程1.圖像處理分為模擬圖像處理和數(shù)字圖像處理。其目的是去除干擾、噪聲,將原始圖像進行特征提取,主要包括圖像采集、圖像增強、圖像復(fù)原、圖像編碼與壓縮和圖像分割。一、圖像識別技術(shù)的原理及應(yīng)用(一)什么是圖像識別?環(huán)節(jié)內(nèi)容圖像采集主要借助于攝像機、掃描儀、數(shù)碼相機等設(shè)備經(jīng)過采樣數(shù)字化得到的圖像,也包括一些動態(tài)圖像,并可以將其轉(zhuǎn)為數(shù)字圖像,與文字、圖形、聲音一起存儲。圖像提取是將一個圖像變換為適合計算機處理的形式的第一步。圖像增強為突出圖像中想抓取的部分,必須對圖像進行改善,以緩解圖像在成像、采集、傳輸?shù)冗^程中,質(zhì)量或多或少造成的退化。通過圖像增強,減少圖像中的干擾和噪聲,改變原來圖像的亮度、色彩分布、對比度等參數(shù),為后期的圖像分析和圖像理解奠定基礎(chǔ)。圖像復(fù)原為提取比較清晰的圖像,減少在獲取圖像時環(huán)境噪聲的影響、運動造成的圖像模糊、光線的強弱等原因使得圖像模糊,需要對圖像進行恢復(fù)。主要采用濾波方法,從降質(zhì)的圖像恢復(fù)原始圖。另一種特殊技術(shù)是圖像重建,該技術(shù)是從物體橫剖面的一組投影數(shù)據(jù)建立圖像。圖像編碼與壓縮為快速方便地在網(wǎng)絡(luò)環(huán)境下傳輸圖像或視頻,必須對圖像進行編碼和壓縮。如靜態(tài)圖像壓縮標(biāo)準(zhǔn)JPEG,針對圖像的分辨率、色彩等進行規(guī)范。由于視頻可被看作是一幅幅不同的但有緊密相關(guān)的靜態(tài)圖像的時間序列,因此動態(tài)視頻的單幀圖像壓縮可以應(yīng)用靜態(tài)圖像的壓縮標(biāo)準(zhǔn)。圖像編碼壓縮技術(shù)可以緩解數(shù)據(jù)量和存儲器容量問題、提高圖像傳輸速度、縮短處理時間。圖像分割技術(shù)圖像分割是把圖像分成一些互不重疊而又具有各自特征的子區(qū)域,每一區(qū)域是像素的一個連續(xù)集,這里的特性可以是圖像的顏色、形狀、灰度和紋理等。圖像分割對圖像中的目標(biāo)、背景進行標(biāo)記、定位,然后把目標(biāo)從背景中分離出來。目前,圖像分割的方法主要有基于區(qū)域特征的分割方法、基于相關(guān)匹配的分割方法和基于邊界特征的分割方法。在實際的圖像中需根據(jù)景物條件的不同選擇適合的圖像分割方法。圖像分割為進一步的圖像識別、分析和理解奠定了基礎(chǔ)。
圖像識別過程2.圖像識別將經(jīng)過處理的圖像進行特征提取和分類,這就是圖像識別。通常有幾種常用的識別方法:統(tǒng)計法、模板匹配法和神經(jīng)網(wǎng)絡(luò)法。統(tǒng)計法——該方法是對研究的圖像進行大量的統(tǒng)計分析,找出其中的規(guī)律并提取反映圖像本質(zhì)特點的特征來進行圖像識別。缺點:當(dāng)特征數(shù)量激增,給特征提取造成困難,分類也難以實現(xiàn)。模板匹配法——即把已知物體的模板與圖像中所有未知物體進行比較,如果某一未知物體與該模板匹配,則該物體被檢測出來,并被認為是與模板相同的物體。缺點:雖然簡單方便,但應(yīng)用有很大的限制,識別率過多地依賴于已知物體的模板,如果已知物體的模板產(chǎn)生變形,會導(dǎo)致錯誤的識別。一、圖像識別技術(shù)的原理及應(yīng)用(一)什么是圖像識別?
圖像識別過程2.圖像識別神經(jīng)網(wǎng)絡(luò)法——指用神經(jīng)網(wǎng)絡(luò)算法對圖像進行識別的方法。目前深度學(xué)習(xí)模型已應(yīng)用于一般圖像的識別和理解,不僅大大提升了圖像識別的準(zhǔn)確性,也避免了抽取人工特征時的時間消耗。什么是神經(jīng)網(wǎng)絡(luò)?神經(jīng)網(wǎng)絡(luò)側(cè)重于模擬和實現(xiàn)人的認知過程中的感知過程、形象思維、分布式記憶和自學(xué)習(xí)自組織過程。神經(jīng)網(wǎng)絡(luò)的特征:具有容錯性強、獨特的聯(lián)想記憶及自組織、自適應(yīng)和自學(xué)習(xí)能力,特別適合處理信息模糊或不精確問題。一、圖像識別技術(shù)的原理及應(yīng)用(一)什么是圖像識別?舉例:垃圾郵件的判斷圖像識別的技術(shù)流程分以下幾步:信息的獲取、預(yù)處理、特征抽取和選擇、分類器設(shè)計和分類決策。一、圖像識別技術(shù)的原理及應(yīng)用(二)圖像識別的技術(shù)流程信息獲取通過傳感器,將光或聲音等信息轉(zhuǎn)化為電信息。即獲取研究對象的基本信息并通過某種方法將其轉(zhuǎn)變?yōu)闄C器能夠認識的信息。預(yù)處理指圖像處理中的去噪、平滑、變換等的操作,從而加強圖像的重要特征。特征抽取和選擇特征抽?。豪媚撤N方法,研究各式各樣的圖像,獲取圖像所具有的本身特征特征選擇:從抽取的特征中,選擇對本次識別有用的特征分類器設(shè)計通過訓(xùn)練而得到一種識別規(guī)則,通過此識別規(guī)則可以得到一種特征分類,使圖像識別技術(shù)能夠得到高識別率。分類決策在特征空間中對被識別對象進行分類,從而更好地識別所研究的對象具體屬于哪一類。視頻監(jiān)控、人臉檢測和識別等都是圖像識別最廣泛的應(yīng)用。從場境上,公共安全、生物、工業(yè)、農(nóng)業(yè)、交通、醫(yī)療等均有廣泛應(yīng)用。存在的局限:圖像識別技術(shù)在應(yīng)用上還只是起著導(dǎo)盲犬性質(zhì)的指引作用,需要通過人工添加標(biāo)簽或注釋,幫助機器來理解圖片。未來的技術(shù)將朝著能夠具有人一樣的視覺、能夠理解圖像內(nèi)容的人工智能發(fā)展。一、圖像識別技術(shù)的原理及應(yīng)用(三)圖像識別的應(yīng)用視頻識別及視頻中的行為識別是圖像識別技術(shù)的重要應(yīng)用。視頻就是由圖像連續(xù)播放形成的(1秒鐘的視頻包含25幀圖像,每1幀都是1張圖像),視頻識別中一個重要內(nèi)容是視頻理解,主要包括:視頻結(jié)構(gòu)化分析:即是對視頻進行幀、超幀、鏡頭、場景、故事等分割,從而在多個層次上進行處理和表達。目標(biāo)檢測和跟蹤:如車輛跟蹤,多是應(yīng)用在交通安防領(lǐng)域。人物識別:識別出視頻中出現(xiàn)的人物。動作識別:識別出視頻中人物的動作。視頻中的行為識別是計算機視覺研究中的重要領(lǐng)域,將人的活動進行拆分并進行識別。一、圖像識別技術(shù)的原理及應(yīng)用(三)圖像識別的應(yīng)用
什么是人臉識別?人臉識別是圖像識別的一個應(yīng)用場景,通常也叫做人像識別、面部識別。人臉識別是基于人的臉部特征信息進行身份識別的一種生物識別技術(shù),用攝像機或攝像頭采集含有人臉的圖像或視頻流,并自動在圖像中檢測和跟蹤人臉,進而對檢測到的人臉進行臉部的一系列相關(guān)技術(shù)。人臉識別技術(shù)的主要流程人臉圖像采集及檢測人臉圖像預(yù)處理人臉圖像特征提取匹配與識別。二、人臉識別技術(shù)及應(yīng)用人臉識別技術(shù)的主要流程(1)人臉圖像采集及檢測人臉圖像采集:通過攝像鏡頭采集,比如靜態(tài)圖像、動態(tài)圖像、不同的位置、不同表情等方面都可以得到很好的采集。人臉檢測:主要用于人臉識別的預(yù)處理,即在圖像中準(zhǔn)確標(biāo)定出人臉的位置、大小和特征。其目的就是把其中有用的信息挑出來,并利用這些特征實現(xiàn)檢測。(2)人臉圖像預(yù)處理基于人臉檢測結(jié)果,對圖像進行處理并最終服務(wù)于特征提取的過程。包括人臉對準(zhǔn),人臉圖像的光線補償,灰度變換、直方圖均衡化、歸一化(取得尺寸一致,灰度取值范圍相同的標(biāo)準(zhǔn)化人臉圖像),中值濾波(圖片的平滑操作以消除噪聲)以及銳化等。二、人臉識別技術(shù)及應(yīng)用人臉識別技術(shù)的主要流程(3)人臉圖像特征提取也稱人臉表征,是對人臉進行特征建模的過程??墒褂玫奶卣魍ǔ7譃橐曈X特征、像素統(tǒng)計特征、人臉圖像變換系數(shù)特征、人臉圖像代數(shù)特征等。(4)匹配與識別提取的人臉特征值數(shù)據(jù)與數(shù)據(jù)庫中存貯的特征模板進行搜索匹配,通過設(shè)定一個閾值,將相似度與這一閾值進行比較,來對人臉的身份信息進行判斷。二、人臉識別技術(shù)及應(yīng)用人臉識別技術(shù)的應(yīng)用范圍企業(yè)、住宅安全和管理:如人臉識別門禁考勤系統(tǒng),人臉識別防盜門等電子護照及身份證公安、司法和刑偵自助服務(wù)信息安全:如計算機登錄、電子政務(wù)和電子商務(wù)等其他類似常見技術(shù)還有指紋識別、手掌幾何學(xué)識別、虹膜和視網(wǎng)膜識別等,也廣泛地應(yīng)用于身份認證等場境,比如簽證應(yīng)用、身份識別、打卡應(yīng)用等。二、人臉識別技術(shù)及應(yīng)用OCR,全稱OpticalCharacterRecognition,光學(xué)字符識別。利用該識別技術(shù),OCR文字識別可以代替人工錄入,將圖片上的文字、符號識別出來并變?yōu)榭删庉嫷奈谋尽H斯ぶ悄軙r代的OCR,又被稱為文字識別技術(shù),它是基于深度學(xué)習(xí)技術(shù),將紙張、圖片等載體上的文字內(nèi)容,智能識別成為可編輯的文本。三、OCR文字識別技術(shù)及應(yīng)用(一)什么是OCR識別?1.智能OCR的優(yōu)點為什么會出現(xiàn)智能OCR?——深度學(xué)習(xí)技術(shù)進入視覺識別領(lǐng)域,一種全新的基于深度學(xué)習(xí)的OCR流程被提出來。優(yōu)點:從單字識別進化到整行識別,文字識別準(zhǔn)確率大幅提升;極大提升對識別圖像質(zhì)量的寬容度,可以有效識別光照不均、圖像模糊、復(fù)雜背景等低質(zhì)量圖像;無需掃描儀或高拍儀、手機、平板等移動設(shè)備拍攝的照片,都可以用于識別。甚至,手寫字體的識別不再是“噩夢”。三、OCR文字識別技術(shù)及應(yīng)用(二)AI時代,OCR識別的蛻變
2.OCR技術(shù)的識別流程三、OCR文字識別技術(shù)及應(yīng)用(二)AI時代,OCR識別的蛻變序號步驟步驟內(nèi)容1圖像輸入采集所要識別的圖像,比如名片、身份證、護照、行駛證、駕駛證、公文、文檔等等2圖像預(yù)處理包含二值化、去噪、傾斜度矯正等3版面分析對將要識別的文檔分段、分行處理4字符切割定位出字符串的邊界,然后分別對字符串進行單個切割5字符特征提取提取字符特征,為識別提供依據(jù)6字符識別將當(dāng)前字符提取的特征向量與特征模板庫進行模板粗分類和模板細匹配,識別出字符7版面回復(fù)將識別結(jié)果按照原來的版面排班,輸出Word或pdf格式的文檔8后處理校正根據(jù)特定的語言上下文的關(guān)系,對識別結(jié)果進行較正OCR識別:包含通用文字識別、卡證文字識別、票據(jù)文字識別、場景文字識別、以及其他文字(圖片數(shù)字、印章檢測、表格文字、圖片二維碼等)識別等幾大類型場景的識別。三、OCR文字識別技術(shù)及應(yīng)用(三)OCR識別的應(yīng)用
OCR識別的應(yīng)用場境智能OCR技術(shù)的身影已逐漸覆蓋到智慧城市、智慧金融、智能交通、智慧醫(yī)療等越來越多的領(lǐng)域,如:網(wǎng)絡(luò)信息安全企業(yè)根據(jù)網(wǎng)絡(luò)爬蟲網(wǎng)絡(luò)圖片,對照片上的文字識別剖析,進而判斷其是不是帶有特殊顏色信息內(nèi)容;圖書館藏書的電子化,提高了效率和準(zhǔn)確度;物流行業(yè),通過手寫體文字識別技術(shù),自動識別出運單的收寄件人電話號碼和地址等字段,大幅提升運單信息錄入效率和物流資源的調(diào)度匹配能力;身份證的管理和識別、發(fā)票識別、出生證明識別、不動產(chǎn)登記識別等等。三、OCR文字識別技術(shù)及應(yīng)用(三)OCR識別的應(yīng)用【練習(xí)與思考】選擇題:1.以下哪些方法屬于圖像識別的方法?(多選題)A.模板匹配法B.神經(jīng)網(wǎng)絡(luò)法C.統(tǒng)計法D.知識圖譜2.以下哪個流程屬于圖像識別的正確流程?A.特征抽取選擇—分類決策—信息預(yù)處理B.信息預(yù)處理—分類決策—特征抽取選擇C.信息預(yù)處理—特征抽取選擇—分類決策D.分類決策—特征抽取選擇—信息預(yù)處理3.人臉識別包含以下哪些流程?(多選題)A.人臉圖像采集及檢測B.人臉圖像特征提取C.人臉圖像預(yù)處理D.人臉圖像匹配與識別【練習(xí)與思考】選擇題:4.以下哪些均屬于人物身份確認的常見技術(shù)?(多選題)A.指紋識別B.人臉識別C.手掌幾何學(xué)識別D.虹膜和視網(wǎng)膜識別5.人工智能OCR識別帶來哪些優(yōu)點?(多選題)A.識別效率提升B.識別的圖像質(zhì)量寬容度低C.識別的準(zhǔn)確率高D.手寫字體也很容易識別【練習(xí)與思考】選擇題:6.OCR識別可應(yīng)用于以下哪些場境?(多選題)A.文字識別B.票據(jù)識別C.圖片二維碼識別D.圖片數(shù)字判斷題:1.神經(jīng)網(wǎng)絡(luò)算法的提升對于人工智能技術(shù)的應(yīng)用有著重要推動作用。2.視頻識別是圖像識別技術(shù)的重要應(yīng)用之一。3.OCR識別不能用于印章檢測的識別?!揪毩?xí)與思考】討論題:1.談一談,列舉你身邊的圖像識別、人臉識別、文字識別應(yīng)用案例,試想還有哪些改進或創(chuàng)新之處。2.想一想,視覺智能相關(guān)技術(shù)在哪些方面已超越人類,進而影響到了傳統(tǒng)的就業(yè)崗位,又在哪些方面現(xiàn)階段甚至很長一段時間內(nèi)還不能代替人類的角色?【練習(xí)與思考】客觀題答案選擇題:1.ABC2.C3.ABCD4.ABCD5.ACD6.ABCD判斷題:1.對
2.對3.錯任務(wù)二聽覺智能——機器如何“聞聲識人”人工智能基礎(chǔ)與應(yīng)用
項目三認知人工智能的應(yīng)用技術(shù)目錄教學(xué)目標(biāo)教學(xué)要求內(nèi)容概覽相關(guān)知識3.2.1什么是語音識別技術(shù)? 3.2.2語音識別技術(shù)的應(yīng)用 3.2.3聲紋識別:讓語音識別更加隱秘練習(xí)與思考 人工智能基礎(chǔ)與應(yīng)用
項目三認知人工智能的應(yīng)用技術(shù)任務(wù)二聽覺智能——機器如何“聞聲識人”1.理解并掌握語音識別技術(shù)的含義及應(yīng)用領(lǐng)域2.了解聲紋識別與語音識別的區(qū)別與聯(lián)系3.進行語音識別的項目實訓(xùn)【教學(xué)目標(biāo)】1.知識點語音識別語音特征提取人機對話系統(tǒng)的角色演進聲紋識別2.技能點掌握語音識別為文本、文本識別為語音的雙向?qū)嵱?xùn)操作3.重難點本任務(wù)的重點是理解語音識別、聲紋識別技術(shù)的含義、應(yīng)用領(lǐng)域及相互間的區(qū)別和聯(lián)系,語音如何轉(zhuǎn)變成文本的技術(shù)和流程。難點是通過本任務(wù)的學(xué)習(xí),深度思考語音識別、語義理解、自然語言生成這樣一個人機對話系統(tǒng)的演進過程?!窘虒W(xué)要求】【內(nèi)容概覽】任務(wù)二聽覺智能——機器如何“聞聲識人”3.2.3聲紋識別打造“專屬語音管家”,是未來智能語音識別領(lǐng)域的重點方向不僅會捕捉語音內(nèi)容,還會根據(jù)音波特點、生理特征等參數(shù),自動識別說話人的身份3.2.2語音識別技術(shù)的應(yīng)用語音輸入3.2.1什么是語音識別技術(shù)?目標(biāo)就是讓機器通過識別和理解把語音信號轉(zhuǎn)變?yōu)橄鄳?yīng)的文本或命令語音控制語音識別技術(shù):特征提取技術(shù)、模式匹配準(zhǔn)則及模型訓(xùn)練技術(shù)語音識別任務(wù):孤立詞識別、連續(xù)語音識別、關(guān)鍵詞識別語音對話將語音識別成文字,提升用戶的效率,如微信語音轉(zhuǎn)換文字等通過語音控制設(shè)備,進行相關(guān)操作,如智能音箱、智能汽車系統(tǒng)等根據(jù)用戶的語音實現(xiàn)交流與對話,對語義理解要求較高。如訂票系統(tǒng)、銀行服務(wù)等語音識別流程:輸入——編碼——解碼——輸出【相關(guān)知識】
語音識別技術(shù)語音識別技術(shù)就是讓機器通過識別和理解過程把語音信號轉(zhuǎn)變?yōu)橄鄳?yīng)的文本或命令的技術(shù)。根據(jù)識別的對象不同,語音識別任務(wù)大體可分為3類,即孤立詞識別、連續(xù)語音識別和關(guān)鍵詞識別。一、什么是語音識別技術(shù)?
語音識別流程語音識別技術(shù)主要包括特征提取技術(shù)、模式匹配準(zhǔn)則及模型訓(xùn)練技術(shù)三方面。其識別流程為:信號處理:聲音信號是連續(xù)的模擬信號,為了保證音頻不失真影響識別,要進行降噪和過濾處理,保證讓計算機識別的是過濾后的語音信息;信號表征:對語音的內(nèi)容信息根據(jù)聲學(xué)特征進行提取,并盡量對數(shù)據(jù)進行壓縮,特征提取完成之后,就進入了特征識別、字符生成環(huán)節(jié);模式識別:從每一幀中找出當(dāng)前說的音素,由多個音素組成單詞,再由單詞組成文本句子。通過聲學(xué)模型識別音素、語言模型和詞匯模型識別單詞和句子。這樣,只要模型中涵蓋足夠的語料,即語音的大數(shù)據(jù)集,就能解決各種語音識別問題。整個流程下來,語音就能識別成文本了。一、什么是語音識別技術(shù)?
語音識別技術(shù)應(yīng)用領(lǐng)域概括起來,智能語音識別主要應(yīng)用于三個領(lǐng)域,這也是語音識別商業(yè)化發(fā)展的主要方向:1.語音輸入系統(tǒng)將語音識別成文字,提升用戶的效率,如微信語音轉(zhuǎn)換文字、訊飛輸入法等。2.語音控制系統(tǒng)通過語音控制設(shè)備,進行相關(guān)操作,徹底解放雙手,例如智能音箱、智能汽車系統(tǒng)等。3.語音對話系統(tǒng)語音對話系統(tǒng)更為復(fù)雜,它將會根據(jù)用戶的語音實現(xiàn)交流與對話,保證回答的內(nèi)容準(zhǔn)確,對語義理解要求較高。在家庭機器服務(wù)員、賓館服務(wù)、訂票系統(tǒng)、銀行服務(wù)等方面,都將會起到非常重要的作用。二、語音識別技術(shù)的應(yīng)用
語音識別技術(shù)應(yīng)用場景在日常的工作生活中,語音識別已廣泛應(yīng)用。如醫(yī)療智能語音錄入系統(tǒng)、智能車載、智能穿戴、智能家居等。二、語音識別技術(shù)的應(yīng)用
什么是聲紋識別如果說語音識別的目的是提升效率,那么聲紋識別的目的則是進行身份確認與審查。相比較語音識別,聲紋識別最大的特點在于:智能系統(tǒng)不僅會捕捉語音內(nèi)容,還會根據(jù)音波特點、說話人的生理特征等參數(shù),自動識別說話人的身份。因為每個人發(fā)出的聲紋圖譜會與其他人不同,聲紋識別正是通過比對說話人在相同音素上的發(fā)聲來判斷是否為同一個人,從而實現(xiàn)“聞聲識人”的功能。三、聲紋識別:讓語音識別更加隱秘
聲紋識別的流程三、聲紋識別:讓語音識別更加隱秘【練習(xí)與思考】選擇題:1.根據(jù)識別的對象不同,語音識別任務(wù)大體可分為幾類?(多選題)A.孤立詞識別B.關(guān)鍵詞識別C.圖像識別D.連續(xù)語音識別2.以下哪個流程為語音識別的正確流程?A.語音輸入—解碼—文字輸出—編碼(特征提?。〣.編碼(特征提?。獯a—文字輸出—語音輸入C.文字輸出—語音輸入—編碼(特征提取)—解碼D.語音輸入—編碼(特征提?。淖州敵觥獯a【練習(xí)與思考】選擇題:3.智能語音識別主要應(yīng)用于以下哪些領(lǐng)域?(多選題)A.醫(yī)療智能語音錄入系統(tǒng)B.智能車載C.智能穿戴D.智能家居判斷題:1.聲紋識別屬于智能語音識別系統(tǒng)之一。2.聲紋識別不僅會捕捉語音內(nèi)容,還能識別說話人的身份?!揪毩?xí)與思考】討論題:1.結(jié)合你身邊的語音識別技術(shù)應(yīng)用案例(如智能音箱、服務(wù)機器人),討論其工作原理和流程。2.想一想,目前的語音識別技術(shù)在哪些方面還有提升空間,未來有哪些應(yīng)用前景?【練習(xí)與思考】客觀題答案選擇題:1.ABD2.D3.ABCD判斷題:1.對
2.對
任務(wù)三認知智能——機器如何懂語義、會思考人工智能基礎(chǔ)與應(yīng)用
項目三認知人工智能的應(yīng)用技術(shù)目錄人工智能基礎(chǔ)與應(yīng)用
項目三認知人工智能的應(yīng)用技術(shù)任務(wù)三認知智能——機器如何懂語義、會思考教學(xué)目標(biāo)教學(xué)要求內(nèi)容概覽相關(guān)知識3.3.1
認知自然語言處理及應(yīng)用 3.3.2
走近知識圖譜3.3.3
數(shù)據(jù)智能推動人機協(xié)同3.3.4大語言模型從量變到質(zhì)變
練習(xí)與思考 【教學(xué)目標(biāo)】1.理解并掌握自然語言處理的含義及常見應(yīng)用2.初步學(xué)習(xí)知識圖譜的內(nèi)涵、體系及應(yīng)用3.了解數(shù)據(jù)智能的定義、發(fā)展目標(biāo)及數(shù)據(jù)中臺的意義4.了解大語言模型及其訓(xùn)練方式【教學(xué)要求】1.知識點自然語言處理的含義、應(yīng)用
知識圖譜的定義
知識圖譜的體系架構(gòu)及應(yīng)用數(shù)據(jù)智能的發(fā)展
數(shù)據(jù)中臺和業(yè)務(wù)中臺的價值大語言模型的內(nèi)涵及發(fā)展大語言模型的訓(xùn)練方式
多模態(tài)AI的創(chuàng)新應(yīng)用2.重難點本任務(wù)的重點是理解自然語言處理、知識圖譜、數(shù)據(jù)智能、大語言模型、多模態(tài)AI的定義及在工作生活中的應(yīng)用領(lǐng)域;難點是理解它們之間的促進關(guān)系、對人工智能技術(shù)水平發(fā)展的關(guān)鍵作用,進一步思考當(dāng)機器懂語義、會思考后,人和機器的關(guān)系可能會是什么樣的?!緝?nèi)容概覽】【相關(guān)知識】自然語言處理與知識圖譜
什么是自然語言處理?自然語言處理的目標(biāo)是彌補人類交流(自然語言)與計算機理解(機器語言)之間的差距,最終實現(xiàn)計算機在理解自然語言上像人類一樣智能,使計算機擁有能夠理解、處理、并使用人類語言的能力。一、認知自然語言處理及應(yīng)用
自然語言處理的常見應(yīng)用“機器翻譯”讓世界變成真正意義上的地球村,因其效率高、成本低滿足了全球各國多語言信息快速翻譯的需求。“情感分析”可以從大量數(shù)據(jù)中識別和吸收相關(guān)信息,而且能夠判斷出一段文字所表達觀點和態(tài)度的正負面性?!爸悄軉柎稹蹦軌蛑咐糜嬎銠C自動回答用戶所提出的問題。“個性化推薦”可以依據(jù)大數(shù)據(jù)和歷史行為記錄,學(xué)習(xí)用戶興趣愛好,實現(xiàn)對用戶意圖的精準(zhǔn)理解,實現(xiàn)精準(zhǔn)匹配?!拔谋痉诸悺蓖ㄟ^分析郵件中的文本內(nèi)容,能夠相對準(zhǔn)確地判斷郵件是否為垃圾郵件。一、認知自然語言處理及應(yīng)用
自然語言處理的常見應(yīng)用電子商務(wù)背后的自然語言處理應(yīng)用分析用戶詞句個性化推薦情感分析智能問答一、認知自然語言處理及應(yīng)用
自然語言處理的發(fā)展趨勢未來自然語言處理將朝著兩個互補式的方向發(fā)展:“大規(guī)模語言數(shù)據(jù)的分析處理能力”和“人-機交互方式”。1.大規(guī)模語言數(shù)據(jù)的分析處理能力:指的是建立在自然語言處理上對語言信息進行獲取、分析、推理和整合的能力。一、認知自然語言處理及應(yīng)用
自然語言處理的發(fā)展趨勢2.人-機交互方式:指的是將自然語言作為人與機器交互的自然接口和統(tǒng)一的交互方式。不同的機器,通常要使用不同的開發(fā)語言或方式,這嚴重影響了人們對機器的開發(fā)與使用。只有通過采用自然語言處理,才能讓機器具有理解人類語言的能力,從而實現(xiàn)建立在自然語言基礎(chǔ)上的人機交互。總結(jié):自然語言處理作為一門新興學(xué)科,其最終目標(biāo)是為了彌補人類交流(自然語言)與計算機理解(機器語言)之間的差距,最終實現(xiàn)計算機在理解自然語言上像人類一樣智能。一、認知自然語言處理及應(yīng)用
什么是知識圖譜?知識圖譜(KnowledgeGraph)是一門典型的多學(xué)科融合,通過將應(yīng)用數(shù)學(xué)、圖形學(xué)、信息科學(xué)等學(xué)科理論、方法與計量學(xué)、統(tǒng)計學(xué)等方法結(jié)合,并利用可視化的圖譜形象地展示出來。其核心目標(biāo)是把復(fù)雜的知識領(lǐng)域通過數(shù)據(jù)挖掘、信息處理、知識計量和圖形繪制顯示出來,揭示知識的動態(tài)發(fā)展規(guī)律。知識圖譜,本質(zhì)上,是一種揭示實體之間關(guān)系的語義網(wǎng)絡(luò)。二、走近知識圖譜
什么是知識圖譜?在信息的基礎(chǔ)上,建立實體之間的聯(lián)系,就能行成“知識”。知識圖譜是由一條條知識組成,每條知識表示為一個SPO三元組(Subject-Predicate-Object主謂賓,用來表示事物的一種方法和形式),而這個三元組集合可以抽象為一張圖。大量與之相關(guān)的實體信息會不斷關(guān)聯(lián)并結(jié)構(gòu)化地呈現(xiàn)出來,實現(xiàn)了數(shù)據(jù)圖譜化。二、走近知識圖譜
知識圖譜的體系架構(gòu)知識圖譜的體系架構(gòu)是指其構(gòu)建自身模式的結(jié)構(gòu)二、走近知識圖譜
知識圖譜的體系架構(gòu)共分為三個步驟:知識抽取:從一些公開的半結(jié)構(gòu)化、非結(jié)構(gòu)化的數(shù)據(jù)中,抽取出可用的知識單元。知識單元主要包括實體抽取、關(guān)系抽取以及屬性抽取3個知識要素。知識表示:把知識客體中的知識因子與知識關(guān)聯(lián)起來,便于人們識別和理解知識,分為主觀知識表示和客觀知識表示兩種。知識融合:是高層次的知識組織,使來自不同知識源的知識在同一框架規(guī)范下進行組織,實現(xiàn)數(shù)據(jù)、信息、經(jīng)驗以及人的思想的融合,形成高質(zhì)量的知識庫。二、走近知識圖譜
知識圖譜的應(yīng)用包括:智能搜索、社交網(wǎng)絡(luò),網(wǎng)上購物、新聞查詢等,知識圖譜已經(jīng)在我們的生活中、垂直行業(yè)應(yīng)用中發(fā)揮著日益重要的作用。二、走近知識圖譜
大數(shù)據(jù)的新篇章——數(shù)據(jù)智能數(shù)據(jù)智能的目標(biāo)是讓數(shù)據(jù)驅(qū)動決策,讓機器具備推理等認知能力。只有業(yè)務(wù)數(shù)據(jù)化進程的完成,才能真正進入到業(yè)務(wù)智能化,依靠數(shù)據(jù)去改變業(yè)務(wù)、指導(dǎo)決策。三、數(shù)據(jù)智能推動人機協(xié)同大數(shù)據(jù)行業(yè)發(fā)展階段
大數(shù)據(jù)的新篇章——數(shù)據(jù)智能讓機器具備推理能力,意味著自然語言處理、知識圖譜等認知技術(shù)需要不斷成熟。而數(shù)據(jù)驅(qū)動決策、數(shù)據(jù)驅(qū)動業(yè)務(wù)發(fā)展的新需求,標(biāo)志著智能數(shù)據(jù)時代的興起。三、數(shù)據(jù)智能推動人機協(xié)同不同階段大數(shù)據(jù)與業(yè)務(wù)的關(guān)系
數(shù)據(jù)智能的定義及數(shù)據(jù)中臺的價值數(shù)據(jù)智能核心分為兩個細分領(lǐng)域:中臺和應(yīng)用場景。其中,中臺包含技術(shù)中臺、數(shù)據(jù)中臺和業(yè)務(wù)中臺,應(yīng)用場景則按照不同行業(yè)進行劃分。數(shù)字化已不可抵擋,在企業(yè)數(shù)字化轉(zhuǎn)型進程中,傳統(tǒng)企業(yè)需要具備互聯(lián)網(wǎng)公司那樣快速迭代升級的能力,因此,數(shù)據(jù)驅(qū)動業(yè)務(wù)發(fā)展的中臺建設(shè)至關(guān)重要。數(shù)據(jù)中臺的價值是將數(shù)據(jù)資產(chǎn)化,實現(xiàn)不同體系數(shù)據(jù)的打通,為下一步數(shù)據(jù)應(yīng)用打好基礎(chǔ)。數(shù)據(jù)中臺涵蓋了從數(shù)據(jù)采集、數(shù)據(jù)處理、數(shù)據(jù)存儲、數(shù)據(jù)分析等環(huán)節(jié)的所有工具及平臺,包括基礎(chǔ)平臺、用戶行為分析、數(shù)據(jù)報表可視化、數(shù)據(jù)科學(xué)平臺、自然語言處理和知識圖譜等諸多技術(shù)體系。三、數(shù)據(jù)智能推動人機協(xié)同
數(shù)據(jù)智能的定義及數(shù)據(jù)中臺的價值基于數(shù)據(jù)中臺有三種應(yīng)用方式:數(shù)據(jù)集:主要是數(shù)據(jù)標(biāo)簽、用戶畫像等;數(shù)據(jù)模型:融合數(shù)據(jù)和算法,比如銷量預(yù)測、風(fēng)控建模等;數(shù)據(jù)應(yīng)用:將數(shù)據(jù)能力和軟件能力封裝,形成最終數(shù)據(jù)產(chǎn)品。而業(yè)務(wù)中臺則是指基于數(shù)據(jù)和技術(shù),結(jié)合行業(yè)應(yīng)用場景,從行業(yè)應(yīng)用切入,在大量服務(wù)垂直行業(yè)客戶,掌握大量場景需求后,逐步形成業(yè)務(wù)中臺能力??偨Y(jié):未來身處競爭激烈的智能數(shù)據(jù)時代,誰能更高效利用數(shù)據(jù),誰才能贏得最后的果實與勝利,傳統(tǒng)產(chǎn)業(yè)數(shù)字化已在風(fēng)口,已在路上。而認知智能的突破,一定不是由單個技術(shù)所完成,而是需要結(jié)合多種不同的技術(shù)持續(xù)完善和發(fā)展。三、數(shù)據(jù)智能推動人機協(xié)同數(shù)據(jù)標(biāo)簽與用戶畫像什么是大語言模型?大語言模型(LargeLanguageModel,LLM)是一種人工智能模型,通?;谏疃葘W(xué)習(xí)架構(gòu),旨在理解和生成人類語言。大語言模型在大量文本數(shù)據(jù)上進行訓(xùn)練,可執(zhí)行廣泛的任務(wù),包括文本總結(jié)、翻譯、情感分析等。其特點是規(guī)模龐大,包含數(shù)十億的參數(shù),能幫助機器學(xué)習(xí)文本數(shù)據(jù)中的復(fù)雜模式,有助于在各種自然語言處理任務(wù)上取得優(yōu)異的表現(xiàn)。ChatGPT的爆紅出圈吸引了更多人對于大語言模型的發(fā)展趨勢和現(xiàn)實應(yīng)用的關(guān)注。四、大語言模型從量變到質(zhì)變什么是大語言模型?常見的大語言模型有GPT-3(OpenAI):GPT-3(Generative
Pretrained
Transformer
3)是最著名的大語言模型之一,擁有1750億個參數(shù)。該模型在文本生成、翻譯和其他任務(wù)中表現(xiàn)出顯著的性能,在全球范圍內(nèi)引起了熱烈的反響,目前OpenAI已迭代到GPT-4版本。BERT(谷歌):BERT(Bidirectional
Encoder
Representations
from
Transformers)是另一個流行的大語言模型,對自然語言處理研究產(chǎn)生了重大影響。該模型使用雙向方法從一個詞的左右兩邊捕捉上下文,提升了各種任務(wù)的性能,如情感分析和命名實體識別。ERNIE3.0文心大模型(百度):百度推出的大語言模型ERNIE3.0首次在百億級和千億級預(yù)訓(xùn)練模型中引入大規(guī)模知識圖譜,提出了海量無監(jiān)督文本與大規(guī)模知識圖譜的平行預(yù)訓(xùn)練方法。四、大語言模型從量變到質(zhì)變什么是大語言模型?大語言模型的快速發(fā)展從人工智能的發(fā)展歷程來看,模型和算法是其不斷成長的核心驅(qū)動力。10年前語言模型是自然語言處理的某個細分方向,并不為大眾所熟知,而ChatGPT的廣泛應(yīng)用則讓更多人體會到大語言模型的快速發(fā)展。四、大語言模型從量變到質(zhì)變ChatGPT發(fā)展歷程什么是大語言模型?大語言模型的快速發(fā)展2018年第一代GPT并沒有引起廣泛關(guān)注。但到了2020年5月,GPT-3一經(jīng)推出,情況就發(fā)生了非常大的變化,GPT-3的參數(shù)值從GPT-2的170億躍升到1750億,參數(shù)數(shù)量級是GPT-2的10倍以上,性能也有大幅提升,從而引起全球廣泛關(guān)注。大語言模型經(jīng)過大量的學(xué)習(xí),實現(xiàn)了從量變到質(zhì)變的飛躍,即當(dāng)數(shù)據(jù)量超過某個臨界點時,模型實現(xiàn)顯著的性能提升,并出現(xiàn)了小模型中不存在的能力,如上下文學(xué)習(xí)能力等。因此,當(dāng)我們應(yīng)用GPT-3及GPT-4對話時,越來越被其強大的互動能力和解決問題的能力所震驚,越來越感覺不到在和一個機器對話。這就是大語言模型快速發(fā)展所帶來的質(zhì)變。四、大語言模型從量變到質(zhì)變走近ChatGPTChatGPT是一個由OpenAI開發(fā)的大語言模型,它使用的是自然語言處理和深度學(xué)習(xí)技術(shù),可以理解語言內(nèi)容和語境,能夠基于在預(yù)訓(xùn)練階段所見的模式和統(tǒng)計規(guī)律來生成回答,還能根據(jù)聊天的上下文進行互動,真正像人類一樣聊天交流,另外還能完成撰寫郵件、視頻腳本、文案、翻譯、代碼、論文等任務(wù)。GPT的全稱是Generative
Pre-trained
Transformer,從名稱可以看出,它是一種生成模型,擅長生成輸出;它是預(yù)訓(xùn)練的,這意味著它已經(jīng)從大量文本數(shù)據(jù)中學(xué)習(xí)到了知識,是Transformer的一種類型。因此,在了解GPT的原理之前,首先要認識Transformer。四、大語言模型從量變到質(zhì)變走近ChatGPTTransformer架構(gòu)Transformer架構(gòu)是GPT的基礎(chǔ)。它是一種神經(jīng)網(wǎng)絡(luò),類似于人腦中的神經(jīng)元。Transformer能夠通過注意力機制和自注意力機制更好地理解文本、語音或音樂等順序數(shù)據(jù)的上下文。注意力機制允許模型通過學(xué)習(xí)元素之間的相關(guān)性或相似性(通常由數(shù)字向量表示)來關(guān)注輸入和輸出中最相關(guān)的部分。如果它關(guān)注的是同一序列,則稱為自注意力。四、大語言模型從量變到質(zhì)變組件功能嵌入(Embedding)位置編碼(PositionalEncoding)將單詞和它們的位置轉(zhuǎn)換為數(shù)字向量編碼器(Encoder)從輸入序列提取特征并分析其含義和上下文。它為每個輸入標(biāo)記輸出一個隱藏狀態(tài)的矩陣,以傳遞給解碼器解碼器(Decoder)根據(jù)編碼器和先前的輸入標(biāo)記生成輸出序列線性層和Softmax層將數(shù)字向量轉(zhuǎn)換為輸出單詞的概率分布表3-4Transformer組成走近ChatGPT從Transformer到GPT、GPT-2、GPT-3、GPT-4作為一種生成模型,GPT使用了Transformer架構(gòu)中的解碼器部分,而解碼器負責(zé)預(yù)測序列中的下一個詞。GPT通過使用先前生成的結(jié)果作為輸入,反復(fù)執(zhí)行此過程以生成較長的文本,即自回歸。在訓(xùn)練第一個版本的GPT時,研究人員使用了數(shù)據(jù)庫的無監(jiān)督預(yù)訓(xùn)練,數(shù)據(jù)庫中包含超過7000本未經(jīng)出版的書籍。在預(yù)訓(xùn)練的基礎(chǔ)上,針對特定任務(wù)使用有監(jiān)督的微調(diào),會向人工智能展示請求和正確答案的示例,并要求人工智能從這些示例中學(xué)習(xí)。在GPT-2中,研究人員擴大了模型(15億個參數(shù))和給模型提供的語料庫的規(guī)模,在無監(jiān)督預(yù)訓(xùn)練中使用WebText,這是數(shù)百萬個網(wǎng)頁的集合。在GPT-3中,模型進一步擴展,規(guī)模達到1750億個參數(shù),并使用了來自網(wǎng)絡(luò)、書籍和維基百科的數(shù)百億個單詞構(gòu)成的龐大語料庫。四、大語言模型從量變到質(zhì)變大語言模型的訓(xùn)練方式訓(xùn)練大語言模型需要向其提供大量的文本數(shù)據(jù),模型利用這些數(shù)據(jù)來學(xué)習(xí)人類語言的結(jié)構(gòu)、語法和語義。該過程通常使用自我監(jiān)督學(xué)習(xí)的技術(shù)實現(xiàn)無監(jiān)督學(xué)習(xí)。訓(xùn)練過程包括兩個主要步驟:預(yù)訓(xùn)練(Pre-training)和微調(diào)(Fine-tuning):在預(yù)訓(xùn)練階段,模型從一個巨大的、多樣化的數(shù)據(jù)集中學(xué)習(xí),通常包含來自不同來源的數(shù)十億詞匯,如網(wǎng)站、書籍、文章等。這個階段允許模型學(xué)習(xí)一般的語言模式和表征。在微調(diào)階段,模型在與目標(biāo)任務(wù)或領(lǐng)域相關(guān)的更具體、更小的數(shù)據(jù)集上進一步訓(xùn)練。這有助于模型微調(diào)其理解,并適應(yīng)任務(wù)的特殊要求。四、大語言模型從量變到質(zhì)變大語言模型的訓(xùn)練方式通過訓(xùn)練,大語言模型涌現(xiàn)的能力如下:上下文學(xué)習(xí)。以GPT-3為例,其正式引入了上下文學(xué)習(xí)能力。假設(shè)語言模型已提供自然語言指令和多個任務(wù)描述,它可以通過完成輸入文本的詞序列來生成測試實例的預(yù)期輸出,而無需額外的訓(xùn)練或梯度更新。指令遵循。通過對自然語言描述(即指令)格式化的多任務(wù)數(shù)據(jù)集的混合進行微調(diào),大語言模型在微小的任務(wù)上表現(xiàn)良好,這些任務(wù)也以指令的形式所描述。循序漸進的推理。小語言模型通常很難解決涉及多個推理步驟的復(fù)雜任務(wù),而大語言模型可以通過思維鏈推理策略,利用涉及中間推理步驟的Prompt機制來解決此類任務(wù)并得出最終答案。四、大語言模型從量變到質(zhì)變認知多模態(tài)AI的創(chuàng)新應(yīng)用人類在信息獲取、環(huán)境感知、知識學(xué)習(xí)與表達等方面都是采用多模態(tài)的輸入、輸出方式。而傳統(tǒng)的深度學(xué)習(xí)算法則專注于從單一的數(shù)據(jù)源訓(xùn)練模型,多模態(tài)AI則將視覺、語言、聽覺等多種信息進行融合,其優(yōu)勢在于它能夠超越單模態(tài)數(shù)據(jù)的限制,并提供對復(fù)雜情況更全面的理解,為計算機提供更接近于人類感知的場景。四、大語言模型從量變到質(zhì)變認知多模態(tài)AI的創(chuàng)新應(yīng)用目前多模態(tài)AI的創(chuàng)新應(yīng)用主要體現(xiàn)在以下幾方面:文本生成圖片,文本生成視頻。跨模態(tài)的知識挖掘,如醫(yī)藥領(lǐng)域的應(yīng)用。跨多模態(tài)語義的知識檢索與數(shù)據(jù)提取。多模態(tài)廣告、網(wǎng)頁、小程序的自動生成。各類虛擬角色,如電商導(dǎo)購、虛擬講師等。人工智能表情或肢體語言,人工智能虛擬情感人。增強多模態(tài)感知和決策能力的機器人技術(shù)、自動駕駛技術(shù)。虛擬現(xiàn)實和混合現(xiàn)實中的自動內(nèi)容創(chuàng)建等。四、大語言模型從量變到質(zhì)變總結(jié)身處人工智能的新時代,我們不僅要擁抱變化,也要直視挑戰(zhàn)。大模型訓(xùn)練與優(yōu)化是人工智能走向通用人工智能的關(guān)鍵。相信在不久的未來,人工智能將在更多領(lǐng)域大放異彩。【練習(xí)與思考】選擇題:1.自然語言處理有哪此常見應(yīng)用?(多選題)A.情感分析B.智能問答C.個性化推薦D.機器翻譯2.自然語言處理未來將朝點哪些方向發(fā)展?(多選題)A.大規(guī)模語言數(shù)據(jù)的分析處理能力B.聲紋識別C.指紋識別D.人-機交互方式3.以下哪些語言屬于人工智能的編程語言?(多選題)A.PythonB.JavaC.C++D.LISP【練習(xí)與思考】選擇題:4.以下哪項屬于知識圖譜的正常步驟?A.知識融合—知識表示—知識抽取B.知識抽取—知識表示—知識融合C.知識表示—知識抽取—知識融合D.知識抽取—知識融合—知識表示5.以下哪些應(yīng)用屬于知識圖譜的行業(yè)應(yīng)用?(多選題)A.今日頭條B.淘寶C.GoogleD.百度【練習(xí)與思考】判斷題:1.“文本分類”用于打擊垃圾郵件上,屬于自然語言處理的應(yīng)用之一。2.自然語言處理的最終目標(biāo)是為了彌補人類交流與計算機理解(機器語言)之間的差距。3.知識圖譜的本質(zhì)不是為了揭示實體之間的關(guān)系。4.只有業(yè)務(wù)數(shù)據(jù)化進程的完成,才能真正進入到業(yè)務(wù)智能化,依靠數(shù)據(jù)去改變業(yè)務(wù)、指導(dǎo)決策?!揪毩?xí)與思考】討論題:1.分組討論,通過學(xué)習(xí)自然語言處理和知識圖譜的定義和應(yīng)用方向,結(jié)合自己的生活或所學(xué)的專業(yè),挑選一個場境或應(yīng)用案例深入分析其背后的原理。2.想一想:“有多少智能就有多少人工”,數(shù)據(jù)智能的決策、知識圖譜的構(gòu)建都需要人不斷對人工智能數(shù)據(jù)集進行訓(xùn)練,例如新聞網(wǎng)站、購物網(wǎng)站,未來人們?nèi)绾谓Y(jié)合自己的專業(yè)做好數(shù)據(jù)集的訓(xùn)練?【練習(xí)與思考】客觀題答案選擇題:1.ABCD2.AD3.ABCD
4.B5.ABCD判斷題:1.對
2.對3.錯4.對AI遇見應(yīng)用
興趣引領(lǐng)未來項目四探索人工智能的行業(yè)應(yīng)用任務(wù)一智能制造:走進“無人工廠”時代人工智能基礎(chǔ)與應(yīng)用
項目四探索人工智能的行業(yè)應(yīng)用目錄教學(xué)目標(biāo)教學(xué)要求內(nèi)容概覽相關(guān)知識4.1.1什么是“智能制造”?何謂智能制造的核心? 4.1.2什么是“燈塔工廠”? 4.1.3人工智能在制造業(yè)中的應(yīng)用 練習(xí)與思考 人工智能基礎(chǔ)與應(yīng)用
項目四探索人工智能的行業(yè)應(yīng)用任務(wù)一智能制造:走進“無人工廠”時代【教學(xué)目標(biāo)】1.掌握智能制造的內(nèi)涵、技術(shù)組成及應(yīng)用場景2.了解燈塔工廠的典型代表及成效3.了解智能制造基本的產(chǎn)業(yè)崗位要求和智能制造工程技術(shù)人員的定義4.掌握圖像分類算法模型創(chuàng)建、訓(xùn)練、校驗、發(fā)布的原理及流程5.掌握本任務(wù)實訓(xùn)項目所用到代碼積木的功能、使用方法、編程邏輯及語法1.知識點智能制造燈塔工廠機器視覺識別2.技能點智能硬件組裝與調(diào)試圖像分類算法模型訓(xùn)練代碼積木編程與運行3.重難點通過學(xué)習(xí)本任務(wù)知識點以及完成“智能機械手臂物體分揀”實訓(xùn)項目,切實地感受人工智能技術(shù)給制造行業(yè)帶來的技術(shù)革新,從而思考人工智能技術(shù)與自身所學(xué)專業(yè)的結(jié)合,為將來在專業(yè)領(lǐng)域應(yīng)用人工智能技術(shù)做鋪墊?!窘虒W(xué)要求】【內(nèi)容概覽】任務(wù)一智能制造:走進“無人工廠”時代4.1.3人工智能在制造業(yè)中的應(yīng)用智能制造背后的“神秘”崗位應(yīng)用案例:機器視覺識別用于智能檢測機器視覺識別在智能分揀中的應(yīng)用場景4.1.2什么是“燈塔工廠”?世界經(jīng)濟論壇于2018年推出,指率先打造出一批標(biāo)桿級的智能工廠,引領(lǐng)第四次工業(yè)革命發(fā)展潮流的智能工廠4.1.1什么是“智能制造”?智能制造的內(nèi)涵核心要素:材料、裝備、工藝、測量、維護、建模兩個判斷特征:(1)是否能夠?qū)W習(xí)人的經(jīng)驗,從而替代人來分析問題和形成決策;(2)能否從新的問題中積累經(jīng)驗,從而避免問題的再次發(fā)生目標(biāo):降本(降低成本)、減存(減少庫存)、提質(zhì)(提升質(zhì)量)、增效(增加效率)復(fù)合型技術(shù)技能人才:智能制造工程技術(shù)人員、工業(yè)互聯(lián)網(wǎng)工程技術(shù)人員、虛擬現(xiàn)實工程技術(shù)人員等產(chǎn)業(yè)發(fā)展趨勢:精益化、自動化、信息化、智能化工業(yè)機器視覺系統(tǒng)構(gòu)成:硬件設(shè)備和軟件算法視覺定位應(yīng)用、視覺檢測應(yīng)用、物體分揀應(yīng)用應(yīng)用流程:圖像獲取—圖像處理與分析—智能判斷決策與執(zhí)行智能車間的基本構(gòu)成流程:生產(chǎn)車間、傳感器、無線網(wǎng)絡(luò)、工業(yè)大數(shù)據(jù)、信息化應(yīng)用、自動化控制并逐步智能化關(guān)鍵技術(shù):人工智能技術(shù)、信息網(wǎng)絡(luò)技術(shù)、虛擬制造技術(shù)、人機一體化哪些方面體現(xiàn)智能化?-裝備、生產(chǎn)、管理、服務(wù)、產(chǎn)品智能化【相關(guān)知識】制造企業(yè)重點部署的人工智能應(yīng)用領(lǐng)域初步了解德國工業(yè)4.0、美國“工業(yè)互聯(lián)網(wǎng)”、日本精益制造、中國制造2025智能制造并不僅僅是一個技術(shù)體系,更重要的是對智能的理解、對制造系統(tǒng)核心要素的理解和重新定義。智能制造的核心要素:材料、裝備、工藝、測量、維護、建模一、什么是“智能制造”?何謂智能制造的核心?(一)智能制造的內(nèi)涵智能制造6大核心要素制造系統(tǒng)是否智能的兩個特征:(1)是否能夠?qū)W習(xí)人的經(jīng)驗,從而替代人來分析問題和形成決策。(2)能否從新的問題中積累經(jīng)驗,從而避免問題的再次發(fā)生。智能制造系統(tǒng)運行的邏輯是:發(fā)生問題→模型(或在人的幫助下)分析問題→模型調(diào)整5個要素→解決問題→模型積累經(jīng)驗,并分析問題的根源→模型調(diào)整5個要素→避免問題。一、什么是“智能制造”?何謂智能制造的核心?(一)智能制造的內(nèi)涵智能制造系統(tǒng)運行邏輯圖智能制造的系統(tǒng)流程一、什么是“智能制造”?何謂智能制造的核心?(二)智能制造的基本流程及技術(shù)組成在智能制造的整個系統(tǒng)和流程中,每個環(huán)節(jié)中都涉及了很多的細分技術(shù)及具體應(yīng)用。我們重點認識如下四項技術(shù):1.人工智能技術(shù)其應(yīng)用主要有三個方面:智能裝備,包括自動識別設(shè)備、人機交互系統(tǒng)、工業(yè)機器人以及數(shù)控機床等具體設(shè)備;智能工廠,包括智能設(shè)計、智能生產(chǎn)、智能管理以及集成優(yōu)化等具體內(nèi)容;智能服務(wù),包括大規(guī)模個性化定制、遠程運維以及預(yù)測性維護等具體服務(wù)模式。一、什么是“智能制造”?何謂智能制造的核心?(二)智能制造的基本流程及技術(shù)組成2.信息網(wǎng)絡(luò)技術(shù)信息網(wǎng)絡(luò)技術(shù)是制造過程中各個環(huán)節(jié)的智能集成,隨著5G時代的來臨,對開啟萬物互聯(lián)、人機深度交互提供了重要的技術(shù)支撐。3.虛擬制造技術(shù)可以在產(chǎn)品設(shè)計階段就模擬出該產(chǎn)品的整個生命周期,從而更有效、更經(jīng)濟、更靈活的組織生產(chǎn)。4.人機一體化一種混合智能。一方面突出人在制造系統(tǒng)中的核心地位,同時在智能機器的配合下,更好地發(fā)揮人的潛能,使得人機在不同的層次上各顯其能相輔相成。一、什么是“智能制造”?何謂智能制造的核心?(二)智能制造的基本流程及技術(shù)組成背景:2018年9月由麥肯錫與世界經(jīng)濟論壇聯(lián)合出版的報告中,評選出了目前世界上第一批先進的“燈塔工廠”名單,共9家,代表了全球先進的智能制造企業(yè)。其中5家位于歐洲,1家位于北美,3家位于中國。定義:“燈塔工廠”是指率先大規(guī)模地運用先進的技術(shù)與創(chuàng)新管理方式,打造出一批標(biāo)桿級的智能工廠,引領(lǐng)第四次工業(yè)革命發(fā)展潮流的智能工廠。目標(biāo):降本(降低成本)、減存(減少庫存)、提質(zhì)(提升質(zhì)量)、增效(增加效率)。二、什么是“燈塔工廠”?全球燈塔工廠網(wǎng)絡(luò)
工業(yè)富聯(lián)燈塔工廠——成效如何?富士康工業(yè)互聯(lián)網(wǎng):從過去的代工廠到如今首屈一指的工業(yè)4.0企業(yè),作為首批入選的“黑燈工廠”,在降本減存提質(zhì)增效方面取得很好成效。二、什么是“燈塔工廠”?工業(yè)富聯(lián)燈塔工廠——人工智能如何應(yīng)用?狀態(tài):工業(yè)富聯(lián)的深圳熄燈工廠已基本做到熄燈狀態(tài)下的無人自主作業(yè)云物大智新技術(shù)在熄燈工廠的典型應(yīng)用過程:通過物聯(lián)網(wǎng)獲取數(shù)據(jù);云計算為海量工業(yè)數(shù)據(jù)提供強大的承載能力;大數(shù)據(jù)對海量數(shù)據(jù)進行挖掘和分析,實現(xiàn)工業(yè)大數(shù)據(jù)到信息的轉(zhuǎn)換;人工智能對工業(yè)大數(shù)據(jù)進行學(xué)習(xí),并不斷修復(fù)改進;實現(xiàn)裝備、生產(chǎn)、管理智能化,最終實現(xiàn)產(chǎn)品和服務(wù)智能化。二、什么是“燈塔工廠”?人工智能在制造業(yè)的應(yīng)用目標(biāo)傳統(tǒng)制造業(yè)正朝著精益化、自動化、信息化、智能化方向邁進,亟需懂得行業(yè)新技術(shù)、新工藝、新規(guī)范和新流程的智能制造工程技術(shù)人員、網(wǎng)絡(luò)工程師、自動化工程師等各類各層次的復(fù)合型技術(shù)技能人才。三、人工智能在制造業(yè)中的應(yīng)用(一)智能制造背后的崗位變化智能制造亟需復(fù)合型技術(shù)技能人才
智能制造產(chǎn)業(yè)崗位要求三、人工智能在制造業(yè)中的應(yīng)用(一)智能制造背后的崗位變化
認識智能制造工程技術(shù)人員誕生背景:2020年3月,人社部向社會發(fā)布未來緊需的16個新職業(yè)之一。定義:指從事智能制造相關(guān)技術(shù)的研究、開發(fā),對智能制造裝備、生產(chǎn)線進行設(shè)計、安裝、調(diào)試、管控和應(yīng)用的工程技術(shù)人員。主要工作領(lǐng)域分為9項:(1)分析、研究、開發(fā)智能制造相關(guān)技術(shù);(2)研究、設(shè)計、開發(fā)智能制造裝備、生產(chǎn)線;(3)研究、開發(fā)、應(yīng)用智能制造虛擬仿真技術(shù);(4)設(shè)計、操作、應(yīng)用智能檢測系統(tǒng);(5)設(shè)計、開發(fā)、應(yīng)用智能生產(chǎn)管控系統(tǒng);(6)安裝、調(diào)試、部署智能制造裝備、生產(chǎn)線;(7)操作、應(yīng)用工業(yè)軟件進行數(shù)字化設(shè)計與制造;(8)操作、編程、應(yīng)用智能制造裝備、生產(chǎn)線進行智能加工;(9)提供智能制造相關(guān)技術(shù)咨詢和技術(shù)服務(wù)。三、人工智能在制造業(yè)中的應(yīng)用(一)智能制造背后的“神秘”崗位機器視覺識別在制造業(yè)的作用:主要用于完成定位、識別、檢測、測量等任務(wù),可以讓機器代替人眼做測量和判斷,讓機器替人去完成復(fù)雜、枯燥的工作。目前機器視覺在半導(dǎo)體及3C電子制造、汽車制造、包裝等行業(yè)已有廣泛應(yīng)用。機器視覺識別帶來的價值:提高生產(chǎn)的自動化程度,讓不適合人工作業(yè)的危險工作環(huán)境變成可能,讓大批量、持續(xù)生產(chǎn)變成現(xiàn)實,大大提高生產(chǎn)效率和產(chǎn)品精度。三、人工智能在制造業(yè)中的應(yīng)用(二)機器視覺識別在智能檢測中的應(yīng)用流程機器視覺分為工業(yè)視覺、計算機視覺兩類。工業(yè)機器視覺系統(tǒng)主要分為:硬件設(shè)備和軟件算法兩部分。硬件設(shè)備主要包括光源系統(tǒng)、鏡頭、攝像機、圖像采集卡和視覺處理器;軟件核心算法主要包括傳統(tǒng)的數(shù)字圖像處理算法和基于深度學(xué)習(xí)的圖像處理算法。三、人工智能在制造業(yè)中的應(yīng)用(二)機器視覺識別在智能檢測中的應(yīng)用流程機器視覺的應(yīng)用流程是如何實現(xiàn)的?(1)首先是將被攝取目標(biāo)轉(zhuǎn)換成圖像信號,傳送給專用的圖像處理系統(tǒng);(2)根據(jù)像素分布和亮度、顏色等信息,轉(zhuǎn)變成數(shù)字化信號;(3)圖像系統(tǒng)對這些信號進行各種運算來抽取目標(biāo)的特征,進而根據(jù)判別的結(jié)果來控制現(xiàn)場的設(shè)備動作。三、人工智能在制造業(yè)中的應(yīng)用(二)機器視覺識別在智能檢測中的應(yīng)用流程了解智能分揀的簡要工作流程,并充分思考機器視覺識別的應(yīng)用:1.視覺定位應(yīng)用要求機器視覺系統(tǒng)能夠快速準(zhǔn)確地找到被測零件并確認其位置,這也是視覺定位在機器視覺工業(yè)領(lǐng)域最基本的應(yīng)用。2.視覺檢測應(yīng)用利用機器代替人眼來作各種測量和判斷,被廣泛應(yīng)用于自動化生產(chǎn)線系統(tǒng),主要幫助企業(yè)實現(xiàn)零缺陷的質(zhì)量目標(biāo)。工作原理:實時動態(tài)地拍攝物體的圖像,對其進行檢測并轉(zhuǎn)化為數(shù)據(jù)供系統(tǒng)處理和分析,確保符合其設(shè)定的質(zhì)量標(biāo)準(zhǔn),不符合質(zhì)量標(biāo)準(zhǔn)的對象會被跟蹤和剔除。3.物體分揀應(yīng)用物體分揀應(yīng)用是在識別、檢測之后的一個環(huán)節(jié),通過機器視覺系統(tǒng)將圖像進行處理,根據(jù)輸出信號決定機械控制單元,實現(xiàn)分揀。在機器視覺工業(yè)應(yīng)用中常用于物料分揀、零件表面瑕疵自動分揀等。三、人工智能在制造業(yè)中的應(yīng)用(三)機器視覺識別在智能分揀中的應(yīng)用場景【練習(xí)與思考】任務(wù)描述基于前面對智能制造行業(yè)現(xiàn)狀需求以及人工智能技術(shù)在智能制造行業(yè)應(yīng)用場景的學(xué)習(xí)了解,依托人工智能實訓(xùn)平臺進行硬件組裝、硬件聯(lián)調(diào)、數(shù)據(jù)采集、模型訓(xùn)練、編程運行等一系列實訓(xùn)過程,可完成機械手臂智能分揀場景模擬,將色塊物料隨機放到傳送帶,傳送帶將色塊物料運輸?shù)诫妱愚D(zhuǎn)盤,攝像頭調(diào)用算法模型識別色塊物料顏色,機械手臂根據(jù)識別反饋,抓取不同顏色的色塊物料分類到相應(yīng)區(qū)域。任務(wù)目標(biāo)通過機械手臂智能分揀實訓(xùn)項目實踐主要到達以下目標(biāo):深入了解人工智能+機械手臂智能分揀應(yīng)用場景的設(shè)計與實現(xiàn);能夠針對顏色分類算法模型需求,完成數(shù)據(jù)標(biāo)注、模型訓(xùn)練等;清楚智能開發(fā)板、機械手臂、攝像頭、色塊物料等硬件的結(jié)構(gòu)與原理;能夠創(chuàng)建一個自己的人工智能實訓(xùn)項目,并完成軟硬件環(huán)境的聯(lián)調(diào);掌握基本的編程邏輯、語法,通過圖形化編程實現(xiàn)實訓(xùn)項目預(yù)設(shè)目標(biāo);能夠從智能制造行業(yè)實際場景中,應(yīng)用人工智能思維發(fā)現(xiàn)問題、解決問題。場景應(yīng)用實訓(xùn)任務(wù):機械手臂智能分揀【練習(xí)與思考】討論題:1.通過PLC自動機械手臂的任務(wù)實訓(xùn),我們切實感受到硬件自動化和機器視覺識別給生產(chǎn)帶來的智能。請深入思考機器視覺識別在各生產(chǎn)環(huán)節(jié)的具體應(yīng)用及呈現(xiàn)形式?為什么在這些環(huán)節(jié)引入,準(zhǔn)備解決什么問題?2.結(jié)合自已所學(xué)的專業(yè),查閱資料并分析未來可能出現(xiàn)的智能制造崗位群及新職業(yè)要求,與現(xiàn)在的能力要求有什么最大的差別,在哪些方面需要持續(xù)學(xué)習(xí)提升?任務(wù)二從歲月飛向未來——別了,快遞員!人工智能基礎(chǔ)與應(yīng)用
項目四探索人工智能的行業(yè)應(yīng)用目錄教學(xué)目標(biāo)教學(xué)要求內(nèi)容概覽相關(guān)知識4.2.1什么是“智慧物流”?究竟“智慧”在哪? 4.2.2人工智能在物流行業(yè)的典型應(yīng)用場景有哪些?4.2.3人工智能技術(shù)如何賦予AGV更多“智慧” 練習(xí)與思考 人工智能基礎(chǔ)與應(yīng)用
項目四探索人工智能的行業(yè)應(yīng)用任務(wù)二從歲月飛向未來——別了,快遞員!1.了解智慧物流的概念和應(yīng)用技術(shù)2.了解人工智能技術(shù)在無人倉儲、最后一公里的應(yīng)用場境3.掌握AGV(無人搬運小車)的構(gòu)成、原理及工作流程4.掌握無人派送實訓(xùn)項目算法模型創(chuàng)建、訓(xùn)練、校驗、發(fā)布的原理及流程5.掌握本任務(wù)實訓(xùn)所用到代碼積木的功能、使用方法、編程邏輯及語法【教學(xué)目標(biāo)】1.知識點智慧物流供應(yīng)鏈分揀機器人無人配送AGV小車2.技能點智能硬件組裝與調(diào)試算法模型創(chuàng)建與發(fā)布代碼積木編程與運行3.重難點通過學(xué)習(xí)本任務(wù)知識點,重點掌握人工智能如何實現(xiàn)智能化分揀服務(wù)及在物流配送中的應(yīng)用;通過無人派送實訓(xùn)項目,親身感受AGV小車的基本原理、路徑規(guī)劃及控制設(shè)置,主動探索身邊更多的智能物流應(yīng)用,并思考未來人工智能技術(shù)在物流領(lǐng)域還有哪些拓展?!窘虒W(xué)要求】【內(nèi)容概覽】任務(wù)二從歲月飛向未來——別了,快遞員!4.2.3AGV的應(yīng)用與工作流程圖像識別技術(shù)與AGV小車AGV小車的關(guān)鍵組成AGV小車的工作流程4.2.2人工智能在物流行業(yè)的典型應(yīng)用場景倉儲進入無人時代——智能分揀(分揀機器人、無人機、無人車、無人艙等)4.2.1什么是“智慧物流”?定義:指通過智能硬件、人工智能、物聯(lián)網(wǎng)、大數(shù)據(jù)等多種技術(shù)與手段,提升整個物流系統(tǒng)的智能化、自動化水平無人配送:配送機器人、無人機快遞等,解決最后一公里用攝像頭攝取圖片,進行圖形識別,確定最優(yōu)路徑,并引導(dǎo)小車行走的一種引導(dǎo)方法AGV小車管理監(jiān)控系統(tǒng)路線分析、最優(yōu)路徑規(guī)劃及確定、自動智能控制全過程應(yīng)用技術(shù):倉內(nèi)技術(shù)、最后一公里技術(shù)、智能數(shù)據(jù)底盤(大數(shù)據(jù)技術(shù)、人工智能技術(shù)、物聯(lián)網(wǎng)技術(shù))AGV小車路徑規(guī)劃:分為靜態(tài)路徑規(guī)劃和動態(tài)路徑規(guī)劃【相關(guān)知識】人工智能+物流技術(shù)體系智慧物流是指通過智能硬件、人工智能、物聯(lián)網(wǎng)、大數(shù)據(jù)等多種技術(shù)與手段,提高物流系統(tǒng)分析決策和智能執(zhí)行的能力,提升整個物流系統(tǒng)的智能化、自動化水平。智慧物流強調(diào)信息流與物質(zhì)流快速、高效、通暢地運轉(zhuǎn),從而實現(xiàn)降低社會成本,提高生產(chǎn)效率,整合社會資源的目的。一、什么是“智慧物流”?究竟“智慧”在哪?智能設(shè)備重組物流生產(chǎn)要素所謂“智慧物流”就是從支撐物流的3大基本要素(基礎(chǔ)設(shè)施、生產(chǎn)工具和勞動力)進行優(yōu)化、改善,甚至替代。所以支撐“智慧物流”的技術(shù)可分為:智慧物流應(yīng)用技術(shù)和智慧數(shù)據(jù)底盤技術(shù)。1.智慧物流應(yīng)用技術(shù)(1)倉內(nèi)技術(shù):主要有機器人與自動化分揀、可穿戴設(shè)備、無人駕駛叉車、貨物識別四類技術(shù)。(2)干線技術(shù):干線運輸主要是無人駕駛卡車技術(shù),無人駕駛卡車將改變干線物流現(xiàn)有格局。(3)最后一公里技術(shù):主要包括無人機技術(shù)與3D打印技術(shù)兩大類。(4)末端技術(shù):主要是智能快遞柜。一、什么是“智慧物流”?究竟“智慧”在哪?2.智慧數(shù)據(jù)底盤技術(shù)智慧物流的應(yīng)用技術(shù)在實際場境中得以廣泛應(yīng)用,離不開支撐其應(yīng)用的數(shù)據(jù)底盤技術(shù):物聯(lián)網(wǎng)、大數(shù)據(jù)及人工智能。物聯(lián)網(wǎng)與大數(shù)據(jù)互為依托,前者為后者提供部分分析數(shù)據(jù)來源,后者將前者數(shù)據(jù)進行業(yè)務(wù)化,而人工智能則是基于兩者更智能化的升級。一、什么是“智慧物流”?究竟“智慧”在哪?作為人工智能技術(shù)在智慧物流的應(yīng)用技術(shù)之一,倉內(nèi)技術(shù),它的應(yīng)用將為物流行業(yè)提供諸多巨變。到2021年,全球倉儲和物流機器人的市場規(guī)模預(yù)計將達到224億美元,將有十分之一的成熟經(jīng)濟體中的倉庫工人被人工智能機器人所取代。二、人工智能在物流行業(yè)的典型應(yīng)用場景(一)倉儲進入無人時代京東智能物流體系智能分揀工作流程什么是無人配送?目前主要是指配送機器人和無人機快遞。配送機器人根據(jù)目的地自動生成合理的配送路線,在行進過程中避讓車輛和障礙物,到達配送機器人??奎c后就會向用戶發(fā)送短信提醒通知收貨,用戶可以通過人臉識別直接開箱取貨。無人機快遞是通過無線遙控設(shè)備和自備的程序控制裝置操縱無人駕駛的低空飛行器運載包裹,自動送達目的地。二、人工智能在物流行業(yè)的典型應(yīng)用場景(二)人在家中坐,貨從天上來圖像識別AGV小車是模擬人通過眼睛來識別環(huán)境,通過大腦分析,并進行走行的方法。是建立在用攝像頭攝取照片圖形,通過計算機圖形識別軟件進行圖形分析和識別,找出小車體與已設(shè)置路徑的相對位置,從而引導(dǎo)小車走行的一種引導(dǎo)方法。倉儲業(yè)是AGV最早應(yīng)用的場所。AGV機器人在倉庫內(nèi)構(gòu)建了強大的機器人矩陣方陣,通過高效的任務(wù)編排、調(diào)度算法優(yōu)化、高精度二維碼定位導(dǎo)航技術(shù)和良好的人機交互體驗,調(diào)度多臺機器人同時工作,實現(xiàn)機器人之間,機器人和人之間的無縫對接。三、人工智能技術(shù)如何賦予AGV更多“智慧”(一)圖像識別技術(shù)與AGV小車1.AGV小車管理監(jiān)控系統(tǒng)這是一個復(fù)雜的軟、硬件系統(tǒng),硬件由服務(wù)器、管理監(jiān)控計算機、網(wǎng)絡(luò)通訊系統(tǒng)以及相關(guān)接口等組成,軟件由相關(guān)的數(shù)據(jù)庫管理系統(tǒng)、管理監(jiān)控調(diào)度軟件等組成。其主要功能是管理、監(jiān)控和調(diào)度AGV小車執(zhí)行搬運作業(yè)任務(wù)。通過接受控制中心的指令并執(zhí)行相應(yīng)的指令,同時將本身的狀態(tài)(如位置、速度等)及時反饋給控制中心。AGV控制器內(nèi)置腳本編程,可以讓AGV有更多擴展應(yīng)用,完成一些復(fù)雜或者特殊的應(yīng)用,如搭載機械臂,復(fù)雜任務(wù)邏輯處理等。三、人工智能技術(shù)如何賦予AGV更多“智慧”(二)AGV小車的關(guān)鍵組成2.AGV小車路徑規(guī)劃AGV小車路徑規(guī)劃在整個智能控制系統(tǒng)中具有重要作用,分為單臺AGV的控制和多臺AGV系統(tǒng)的控制。同時,還分為靜態(tài)和動態(tài)兩種環(huán)境的路徑規(guī)劃。靜態(tài)環(huán)境下的路徑規(guī)劃,又稱離線路徑規(guī)劃,是指AGV小車工作環(huán)境的全部信息已知。動態(tài)環(huán)境中的路徑規(guī)劃,是假定在環(huán)境信息未被完全掌握的情況下,機器人是通過怎么樣的路徑感知環(huán)境。三、人工智能技術(shù)如何賦予AGV更多“智慧”(二)AGV小車的關(guān)鍵組成AGV小車在靜態(tài)環(huán)境下運行1.路線分析。AGV小車接收到貨物搬運指令后,根據(jù)靜態(tài)還是動態(tài)環(huán)境進行路徑分析,確定AGV當(dāng)前坐標(biāo)及前進方向,中央控制器進行矢量計算、路線分析。2.最優(yōu)路徑規(guī)劃及確定。通過AGV的控制器進行路線分析后,從中選擇最佳的行駛路線。3.自動智能控制全過程。選擇好最佳路線后,自動智能控制AGV小車在路上的行駛、拐彎和轉(zhuǎn)向等,到達裝載貨物位置準(zhǔn)確停位、裝貨完成后。然后AGV小車啟動向目標(biāo)卸貨點“奔跑”,準(zhǔn)確到達位置后停住然后完成卸貨,并向控制計算機報告其位置和狀態(tài)。隨之AGV小車啟動跑向待命區(qū)域,直到接到新的指令后再作下一次任務(wù)。三、人工智能技術(shù)如何賦予AGV更多“智慧”(三)AGV小車的工作流程【練習(xí)與思考】任務(wù)描述基于前面對智慧物流行業(yè)現(xiàn)狀需求以及人工智能技術(shù)在智慧物流行業(yè)應(yīng)用場景的學(xué)習(xí)了解,依托人工智能實訓(xùn)平臺進行硬件組裝、硬件聯(lián)調(diào)、數(shù)據(jù)采集、模型訓(xùn)練、編程運行等一系列實訓(xùn)過程,可完成無人派送場景模擬,將需要派送的物品放置在AGV無人小車上,攝像頭調(diào)用路線檢測模型識別路線圖,小車根據(jù)識別反饋,沿著指定的路線行駛,在行駛途中設(shè)置紅綠燈障礙,攝像頭再次調(diào)用顏色分類模型識別紅綠燈狀態(tài),小車根據(jù)識別反饋,依據(jù)紅路燈交通規(guī)則行駛,最終小車將物品運送到指定地點。任務(wù)目標(biāo)通過無人派送實訓(xùn)項目實踐主要達到以下目標(biāo):深入了解人工智能+無人派送應(yīng)用場景的設(shè)計與實現(xiàn);能夠針對LED三色燈顏色分類算法模型需求,完成數(shù)據(jù)標(biāo)注、模型訓(xùn)練等;清楚智能開發(fā)板、AGV無人小車、攝像頭、LED三色燈等硬件的結(jié)構(gòu)與原理;能夠創(chuàng)建一個自己的人工智能實訓(xùn)項目,并完成軟硬件環(huán)境的聯(lián)調(diào);掌握基本的編程邏輯、語法,通過圖形化編程實現(xiàn)項目預(yù)設(shè)目標(biāo);能夠從智慧物流的其他具體場景中,應(yīng)用人工智能思維發(fā)現(xiàn)問題、解決問題。場景應(yīng)用實訓(xùn)任務(wù):無人派送【練習(xí)與思考】討論題:1.說一說,人工智能技術(shù)在智慧物流最后一公里方面有哪些突破和應(yīng)用,瓶頸在哪里?2.AGV小車中都應(yīng)用到了哪些人工智能技術(shù),分別解決了什么問題?3.AGV小車解決了物流中無人派送的難題,那么其他行業(yè)中是否對“無人派送”也有市場需求?具體的應(yīng)用有哪些?任務(wù)三AIGC+內(nèi)容生產(chǎn)——智媒時代已然來臨人工智能基礎(chǔ)與應(yīng)用
項目四探索人工智能的行業(yè)應(yīng)用目錄教學(xué)目標(biāo)教學(xué)要求內(nèi)容概覽相關(guān)知識4.3.1什么是AIGC 4.3.2AIGC在新媒體行業(yè)的典型應(yīng)用場景4.3.3多技術(shù)綜合培育下的AI應(yīng)用 練習(xí)與思考 人工智能基礎(chǔ)與應(yīng)用
項目四探索人工智能的行業(yè)應(yīng)用任務(wù)三AIGC+內(nèi)容生產(chǎn)——智媒時代已然來臨【教學(xué)目標(biāo)】1.了解AIGC的定義和技術(shù)場景劃分2.了解AIGC在新媒體行業(yè)的廣泛應(yīng)用及對優(yōu)化內(nèi)容生產(chǎn)的核心價值3.認知數(shù)字虛擬人生成、視頻生成、跨模態(tài)生成的基礎(chǔ)原理和流程4.掌握提示語工程技能,通過提示過程與人工智能高效交互1.知識點AIGC的技術(shù)應(yīng)用數(shù)字虛擬人生成視頻生成跨模態(tài)生成2.技能點掌握“數(shù)字營銷提示語工程訓(xùn)練”實訓(xùn)操作。3.重難點通過學(xué)習(xí)本任務(wù)知識點,重點了解ChatGTP爆火背后AIGC多模態(tài)技術(shù)的場景發(fā)展;了解AIGC通過多種應(yīng)用實現(xiàn)數(shù)字內(nèi)容新生產(chǎn)方式,如AI繪畫、數(shù)字虛擬人、AI生成視頻、ChatGTP等。實踐體驗通過提示語工程指導(dǎo)AIGC大模型在文本創(chuàng)作、圖形設(shè)計、視頻生成等方面的應(yīng)用,并思考未來人工智能技術(shù)在內(nèi)容創(chuàng)作、新媒體創(chuàng)新方面還有哪些拓展。【教學(xué)要求】【內(nèi)容概覽】任務(wù)三
AIGC+內(nèi)容生產(chǎn)——智媒時代已然來臨三、多技術(shù)綜合培育下的AI應(yīng)用數(shù)字虛擬人生成提示語工程跨模態(tài)生成二、AIGC在新媒體行業(yè)的典型應(yīng)用場景AIGC+媒體行業(yè)應(yīng)用一、什么是AIGC智能數(shù)字內(nèi)容孿生:圖像超分、語音轉(zhuǎn)字幕、文字轉(zhuǎn)語音等視頻生成智能數(shù)字內(nèi)容生成:文本生成(AI寫作)、圖像生成(AI繪畫)、音頻生成、視頻生成、多模態(tài)生成等
智能數(shù)字內(nèi)容編輯:視頻場景剪輯、虛擬試衣、人聲分離等AIGC+影視行業(yè)應(yīng)用【相關(guān)知識】內(nèi)容生成發(fā)展歷程PGC:Professionally-GeneratedContent內(nèi)容生產(chǎn)總量較低單人/多人專業(yè)體驗舉例:長視頻UGC:User-GeneratedContent內(nèi)容生產(chǎn)總量變多小規(guī)模多人互動舉例:小紅書、微博AIUGC:AI-assistedUserGeneratedContent內(nèi)容生產(chǎn)總量大大規(guī)模沉浸交互舉例:語音轉(zhuǎn)文字協(xié)助紀(jì)要生成、百家號TTV協(xié)助新聞圖文生成視頻AIGC:AI-GeneratedContent內(nèi)容生產(chǎn)總量巨大元宇宙式體驗舉例:ChatGPT、AI繪畫、AI生成視頻等內(nèi)容生產(chǎn)總量內(nèi)容消費體驗專家生成內(nèi)容用戶生成內(nèi)容AI輔助生成內(nèi)容AI生成內(nèi)容人工智能技術(shù)驅(qū)動下,數(shù)字內(nèi)容生產(chǎn)方式向更高效邁進AIGC(AI-GeneratedContent,生成式人工智能),即利用人工智能技術(shù)來快速生成內(nèi)容。2022年ChatGPT的爆紅出圈宣告了AIGC時代的到來,被認為是人工智能時代的新型內(nèi)容創(chuàng)作方式。AIGC能以優(yōu)于人類的制造能力和知識水平,承擔(dān)信息挖掘、素材調(diào)用、復(fù)刻編輯等基礎(chǔ)性機械勞動,從技術(shù)層面實現(xiàn)以低成本、高效率的方式滿足海量個性化需求。AIGC可以自動生成內(nèi)容,也可以輔助生成內(nèi)容。AIGC廣泛應(yīng)用在文本生成、圖像生成、音頻生成、視頻生成等方面,推動了大量深度學(xué)習(xí)模型的不斷完善。一、什么是AIGC一、什么是AIGCAIGC內(nèi)容生成種類一、什么是AIGC智能數(shù)字內(nèi)容孿生主要包括內(nèi)容的增強與轉(zhuǎn)譯。增強即對數(shù)字內(nèi)容修復(fù)、去噪、細節(jié)增強等。轉(zhuǎn)譯即對數(shù)字內(nèi)容轉(zhuǎn)換,如翻譯等。例如,一張低分辨率的圖片,通過智能增強技術(shù)中的圖像超分可對低分辨率進行放大,同時增強圖像的細節(jié)信息,生成高清圖。再比如,對于老照片中的像素缺失部分,可通過智能增強技術(shù)進行內(nèi)容復(fù)原。而智能轉(zhuǎn)譯技術(shù)則更關(guān)注不同模態(tài)之間的相互轉(zhuǎn)換。例如,我們錄制了一段音頻,可通過智能轉(zhuǎn)譯技術(shù)自動生成字幕;若輸入一段文字,則可以自動生成語音,實現(xiàn)模態(tài)間智能轉(zhuǎn)譯應(yīng)用。具體應(yīng)用:圖像超分、語音轉(zhuǎn)字幕、文字轉(zhuǎn)語音等。(一)智能數(shù)字內(nèi)容孿生智能數(shù)字內(nèi)容編輯指通過對內(nèi)容的理解以及屬性控制,進而實現(xiàn)對內(nèi)容的修改。例如,在計算機視覺領(lǐng)域,通過對視頻內(nèi)容的理解,實現(xiàn)不同場景視頻片段的剪輯。在語音信號處理領(lǐng)域,通過對音頻信號的分析,實現(xiàn)人聲與背景聲分離等。具體應(yīng)用:視頻場景剪輯、虛擬試衣、人聲分離等。一、什么是AIGC(二)智能數(shù)字內(nèi)容編輯智能數(shù)字內(nèi)容生成指通過從海量數(shù)據(jù)中學(xué)習(xí)抽象概念,并通過概念的組合生成全新的內(nèi)容。例如AI繪畫,從海量繪畫作品中學(xué)習(xí)不同筆法、內(nèi)容、藝術(shù)風(fēng)格,并基于學(xué)習(xí)內(nèi)容重新生成特定風(fēng)格的繪畫。采用此方式,人工智能在文本創(chuàng)作、音樂創(chuàng)作和詩詞創(chuàng)作中都有不錯的表現(xiàn)。再比如,在跨模態(tài)領(lǐng)域,通過輸入文本輸出特定風(fēng)格與屬性的圖像,不僅能夠描述圖像中主體的數(shù)量、形狀、顏色等屬性信息,還能夠描述主體的行為、動作以及主體之間的關(guān)系。具體應(yīng)用:文本生成(AI寫作)、圖像生成(AI繪畫)、音頻生成、視頻生成、多模態(tài)生成等。一、什么是AIGC(三)智能數(shù)字內(nèi)容生成1.文本生成根據(jù)使用場景,基于自然語言處理的文本內(nèi)容生成可分為非交互式文本生成與交互式文本生成。非交互式文本生成包括摘要/標(biāo)題生成、文本風(fēng)格遷移、文章生成、圖像生成文本等。交互式文本生成主要包括聊天機器人、文本交互游戲等。代表性模型:JasperAI、CopyAI、ChatGPT、Bard、AIDungeon等。2.圖像生成根據(jù)使用場景,可分為圖像編輯修改與圖像自主生成。圖像編輯修改可應(yīng)用于圖像超分、圖像修復(fù)、人臉替換、圖像去水印、圖像背景去除等。圖像自主生成則包括端到端的生成,如真實圖像生成卡通圖像、參照圖像生成繪畫圖像、真實圖像生成素描圖像、文本生成圖像等。代表性模型:EditGAN、Deepfake、DALL-E、MidJourney、StableDiffusion、文心一言等。一、什么是AI
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年度水庫漁業(yè)承包經(jīng)營權(quán)及漁產(chǎn)品品牌推廣合同3篇
- 2024年規(guī)范化采購協(xié)議與協(xié)議撰寫示例版
- 二零二五年度個人股票市場投資合同3篇
- 二零二五年度二手車交易金融服務(wù)合同模板7篇
- 二零二五年度XX房屋買賣合同裝修改造服務(wù)協(xié)議3篇
- 2024年船舶維修工程合同5篇
- 2025年度城市綜合體項目搬遷補償同意協(xié)議書3篇
- 虹吸雨水系統(tǒng)施工方案
- 防排水施工方案
- 2025年度標(biāo)的為商鋪的租賃合同范本8篇
- 三軸水泥攪拌樁施工質(zhì)量措施
- 幼兒園學(xué)前教育五以內(nèi)的數(shù)字比大小練習(xí)題
- 高速鐵路沉降觀測與評估
- 地脈動測試原理及應(yīng)用
- 溝槽式連接管道工程技術(shù)規(guī)程
- 原料罐區(qū)設(shè)備操作規(guī)程
- 廈門市2023-2024學(xué)年度初中語文初一上學(xué)期語文期末質(zhì)量檢測
- 項目施工員安全生產(chǎn)責(zé)任制考核記錄
- 中職英語教學(xué)總結(jié)
- 高中數(shù)學(xué)人教A版知識點與公式大全
- 2023年八省聯(lián)考普通高等學(xué)校招生全國統(tǒng)一考試語文試題含答案
評論
0/150
提交評論