版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
北京信息科技大學(xué)自動(dòng)化學(xué)院智能機(jī)器人原理與應(yīng)用“智能檢測(cè)技術(shù)與模式識(shí)別”研究所北京信息科技大學(xué)自動(dòng)化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》第十章智能機(jī)器人的前沿AI技術(shù)“人工智能”的概念第一次提出是在1956年的達(dá)特茅斯人工智能研究會(huì)議上。當(dāng)時(shí)的科學(xué)家主要討論了計(jì)算機(jī)科學(xué)領(lǐng)域尚未解決的問題,期待通過模擬人類大腦的運(yùn)行解決一些特定領(lǐng)域的具體問題。首次提出了把利用計(jì)算機(jī)進(jìn)行的復(fù)雜信息處理稱為“人工智能”(artificial
intelligence),簡(jiǎn)稱AI。簡(jiǎn)言之,人工智能是研究開發(fā)用于模擬、延伸和擴(kuò)展人的智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的技術(shù)科學(xué),其主要目標(biāo)是使人工智能機(jī)器能夠勝任那些需要人類智能才能完成的專業(yè)工作。北京信息科技大學(xué)自動(dòng)化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.1新一代人工智能技術(shù)
人工智能的發(fā)展一共經(jīng)歷了3次浪潮,如圖所示。北京信息科技大學(xué)自動(dòng)化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.1新一代人工智能技術(shù)
人工智能的發(fā)展一共經(jīng)歷了3次浪潮,如圖所示。AI的第1次浪潮。第1次浪潮與圖靈和他在1950年提出的“圖靈測(cè)試”緊密相關(guān)。1966年MIT的教授Weizenbaum發(fā)明了一個(gè)可以和人對(duì)話的小程序———Eliza,轟動(dòng)世界。AI的第2次浪潮。第2次浪潮出現(xiàn)在1980—1990年代,語音識(shí)別是最具代表性的幾項(xiàng)突破性進(jìn)展之一。AI的第3次浪潮。第3次浪潮始于2006年,很大程度上歸功于深度學(xué)習(xí)的實(shí)用化進(jìn)程。北京信息科技大學(xué)自動(dòng)化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.2機(jī)器人智能化在人工智能的加持下,智能化機(jī)器人應(yīng)運(yùn)而生。機(jī)器人的外延及邊界已被擴(kuò)大數(shù)倍,新物種的誕生及傳統(tǒng)設(shè)備的智能化將共同驅(qū)動(dòng)“機(jī)器人”產(chǎn)業(yè)以十倍及百倍速度增長(zhǎng)。人工智能技術(shù)帶給機(jī)器人質(zhì)的改變,主要在于以下兩個(gè)方面:10.2.1機(jī)器人是人工智能的實(shí)體化(1)智能化大幅提升。(2)智能化場(chǎng)景適用性提升。北京信息科技大學(xué)自動(dòng)化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.2機(jī)器人智能化智能化是逐步讓機(jī)器人具有自主智能,其發(fā)展路徑從學(xué)習(xí)單一任務(wù)開始,舉一反三,逐步達(dá)到與環(huán)境動(dòng)態(tài)交互的主動(dòng)學(xué)習(xí),最終實(shí)現(xiàn)自我進(jìn)化的高級(jí)智能。人工智能主要解決機(jī)器人智能化所需要的算法和技術(shù),具體包括以下3方面要素。10.2.2機(jī)器人智能化三要素1.感知要素機(jī)器人的感覺器官用來認(rèn)識(shí)周圍環(huán)境狀態(tài)以及和外界環(huán)境進(jìn)行交互,包括能感知視覺、接近、距離等的非接觸型傳感器和能感知力、壓覺、觸覺等的接觸型傳感器等。2.決策要素決策要素也稱為思考要素,根據(jù)傳感器收集的數(shù)據(jù)思考出采用什么樣的動(dòng)作。智能機(jī)器人的決策要素是3個(gè)要素中的關(guān)鍵,包括判斷、邏輯分析、理解等方面的智力活動(dòng)。3.控制要素控制要素也稱為運(yùn)動(dòng)要素,是對(duì)外界做出反應(yīng)性動(dòng)作.北京信息科技大學(xué)自動(dòng)化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.3機(jī)器學(xué)習(xí)機(jī)器人發(fā)展的趨勢(shì)是人工智能化,深度學(xué)習(xí)是智能機(jī)器人的前沿技術(shù),也是機(jī)器學(xué)習(xí)領(lǐng)域的新課題。深度學(xué)習(xí)可以簡(jiǎn)單理解為多層的神經(jīng)網(wǎng)絡(luò)模型,這里簡(jiǎn)約介紹幾種典型的神經(jīng)網(wǎng)絡(luò)架構(gòu)。10.3.1深度學(xué)習(xí)在感知機(jī)的基礎(chǔ)上,研究人員提出一種新的網(wǎng)絡(luò)結(jié)構(gòu)———CNN。CNN的本質(zhì)是一種采用監(jiān)督方式訓(xùn)練的面向兩維形狀不變性識(shí)別的特定多層感知機(jī),每層由多個(gè)二維平面組成,而每個(gè)平面由多個(gè)獨(dú)立神經(jīng)元組成,專門用來處理具有類似網(wǎng)格結(jié)構(gòu)的數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò)。如圖所示,CNN的結(jié)構(gòu)大致可以分為3層:卷積層、池化層和全連接層。1.卷積神經(jīng)網(wǎng)絡(luò)CNN北京信息科技大學(xué)自動(dòng)化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.3機(jī)器學(xué)習(xí)1)卷積層卷積層依賴于卷積計(jì)算,通過卷積運(yùn)算可以提取輸入圖像的特征,使得原始信號(hào)的某些特征增強(qiáng),并且在一定程度上降低噪聲。利用不同卷積算子對(duì)圖像進(jìn)行濾波,得到顯著的邊緣特征。10.3.1深度學(xué)習(xí)2)池化層池化層的原理是對(duì)圖像進(jìn)行下采樣,在減少數(shù)據(jù)處理量的同時(shí)保留有用信息。因此池化層的主要作用是在語義上把相似的特征合并起來,具有一定程度的位移、尺度、形變的魯棒性,可以消除輸入圖像的部分畸變與位移等的影響。3)全連接層全連接層采用softmax全連接,得到的激活值即卷積神經(jīng)網(wǎng)絡(luò)提取到的圖片特征。卷積后得到多組特征,池化后會(huì)對(duì)特征進(jìn)行聚合。卷積池化的多次疊加自動(dòng)提取圖片中的低級(jí)、中級(jí)、高級(jí)特征,實(shí)現(xiàn)對(duì)圖片的高精度分類。1.卷積神經(jīng)網(wǎng)絡(luò)CNN北京信息科技大學(xué)自動(dòng)化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.3機(jī)器學(xué)習(xí)10.3.1深度學(xué)習(xí)VGG是牛津大學(xué)科學(xué)工程系計(jì)算機(jī)視覺組(visualgeometrygroup)2014年提出的。在其發(fā)表的論文中,一共提及4種不同深度層數(shù)的卷積神經(jīng)網(wǎng)絡(luò),分別是VGG11、VGG13、VGG16和VGG19。這幾種網(wǎng)絡(luò)結(jié)構(gòu)除了網(wǎng)絡(luò)深度,本質(zhì)并沒有什么區(qū)別,增加網(wǎng)絡(luò)的深度能夠在一定程度上影響網(wǎng)絡(luò)的最終性能。在VGG網(wǎng)絡(luò)中,通過使用多個(gè)較小卷積核(3×3)的卷積層可以替代一個(gè)卷積核較大的卷積層,這也是VGG系列網(wǎng)絡(luò)的一大特色之一。使用小卷積核不僅可以減少參數(shù),還可以進(jìn)一步增加網(wǎng)絡(luò)的擬合能力。更深的層數(shù)和逐漸遞增的通道數(shù),也使得VGG網(wǎng)絡(luò)可以從數(shù)據(jù)中獲取更多的信息。2.卷積神經(jīng)網(wǎng)絡(luò)VGG北京信息科技大學(xué)自動(dòng)化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.3機(jī)器學(xué)習(xí)10.3.1深度學(xué)習(xí)3.殘差神經(jīng)網(wǎng)絡(luò)ResNetResNet中最重要的結(jié)構(gòu)就是殘差塊,是由多個(gè)卷積層相互連接形成的。形成的每一個(gè)殘差塊相互連接,每個(gè)殘差塊利用了恒等跳躍式連接的方式。如圖所示輸入直接來自給定的圖像數(shù)據(jù),然后用于訓(xùn)練每個(gè)殘差塊中的網(wǎng)絡(luò)結(jié)構(gòu),這也被稱為恒等映射。北京信息科技大學(xué)自動(dòng)化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.3機(jī)器學(xué)習(xí)10.3.1深度學(xué)習(xí)3.殘差神經(jīng)網(wǎng)絡(luò)ResNet傳統(tǒng)的卷積網(wǎng)絡(luò)或全連接網(wǎng)絡(luò)在信息傳遞時(shí)或多或少會(huì)存在信息丟失、損耗等問題,還有導(dǎo)致梯度消失或者梯度爆炸,導(dǎo)致很深的網(wǎng)絡(luò)無法訓(xùn)練。ResNet在一定程度上解決了這個(gè)問題,通過直接將輸入信息繞道傳到輸出保護(hù)信息的完整性,整個(gè)網(wǎng)絡(luò)只需要學(xué)習(xí)輸入、輸出差別的那一部分,簡(jiǎn)化學(xué)習(xí)目標(biāo)和難度??梢?ResNet的結(jié)構(gòu)可以極快地加速神經(jīng)網(wǎng)絡(luò)的訓(xùn)練,模型的準(zhǔn)確率也有較大的提升。北京信息科技大學(xué)自動(dòng)化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.3機(jī)器學(xué)習(xí)10.3.1深度學(xué)習(xí)4.YOLO算法YOLO算法是經(jīng)典的目標(biāo)檢測(cè)算法之一,隨著算法的改進(jìn),版本也從YOLOV1逐漸演變到了YOLOV7。最經(jīng)典的YOLOV1是典型的端到端目標(biāo)檢測(cè)算法,采用卷積神經(jīng)網(wǎng)絡(luò)提取特征,主干特征提取網(wǎng)絡(luò)的基礎(chǔ)是GooLeNet,與其他目標(biāo)檢測(cè)算法不同的是,它使用劃分網(wǎng)格的策略來對(duì)目標(biāo)進(jìn)行檢測(cè)。北京信息科技大學(xué)自動(dòng)化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.3機(jī)器學(xué)習(xí)10.3.1深度學(xué)習(xí)4.YOLO算法如圖10.5所示,YOLOV1的檢測(cè)流程如下北京信息科技大學(xué)自動(dòng)化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.3機(jī)器學(xué)習(xí)10.3.1深度學(xué)習(xí)4.YOLO算法(1)劃分網(wǎng)格。將原圖像劃分為7×7的網(wǎng)格。(2)生成預(yù)測(cè)框。每個(gè)網(wǎng)格生成2個(gè)邊界預(yù)測(cè)框和置信度信息,進(jìn)行物體的框定和分類,一共有98個(gè)邊界預(yù)測(cè)框。(3)置信度計(jì)算。計(jì)算每個(gè)預(yù)測(cè)框的置信度信息。(4)去除重復(fù)框。通過非極大值抑制得到最后的預(yù)測(cè)框。置信度包含預(yù)測(cè)框中含有目標(biāo)的可能性和預(yù)測(cè)框的準(zhǔn)確度。假設(shè)YOLOV1算法可以檢測(cè)出n種類別的目標(biāo),則該單元格中檢測(cè)出的目標(biāo)屬于n個(gè)分類的置信度概率可以表示為Pr(classi|object)。各個(gè)邊界框類別的置信度如下所示:1)YOLOV1算法流程式中,Pr(classi)*IoU是置信度,而IoU是預(yù)測(cè)框和實(shí)際框的交并比。北京信息科技大學(xué)自動(dòng)化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.3機(jī)器學(xué)習(xí)10.3.1深度學(xué)習(xí)4.YOLO算法(1)執(zhí)行速度快。由于YOLOV1算法的流程比較簡(jiǎn)單,執(zhí)行檢測(cè)任務(wù)時(shí),不需要提取輸入內(nèi)容的候選區(qū)域,因此與其他目標(biāo)檢測(cè)算法相比,執(zhí)行速度很快,基本能達(dá)到40到50fps。而在V1算法的基礎(chǔ)上進(jìn)行輕量化處理的FastYOLO算法,其檢測(cè)速度甚至能達(dá)到標(biāo)準(zhǔn)YOLOV1算法的3倍以上。(2)準(zhǔn)確率高。當(dāng)輸入的圖片中待檢測(cè)目標(biāo)與背景相近時(shí),不會(huì)將背景誤檢成目標(biāo),背景誤檢率比較低;除此之外,其他目標(biāo)檢測(cè)算法是基于滑動(dòng)窗口的,每個(gè)滑動(dòng)窗口的大小不一,無法在整體上對(duì)輸入圖片進(jìn)行檢測(cè),而YOLOV1支持輸入整張圖片,無須采用滑動(dòng)窗口的方式,所以極少會(huì)出現(xiàn)將背景誤檢為目標(biāo)的情況,因此檢測(cè)的準(zhǔn)確度較高。(3)泛化能力強(qiáng)。檢測(cè)比較抽象的圖片時(shí),例如國(guó)畫、油畫等畫作,能夠很好地學(xué)習(xí)目標(biāo)的概化特征,降低檢測(cè)的錯(cuò)誤率。因此,YOLO系列算法具有優(yōu)秀的檢測(cè)速度和通用性。2)YOLO算法的優(yōu)勢(shì)北京信息科技大學(xué)自動(dòng)化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.3機(jī)器學(xué)習(xí)10.3.2生成式對(duì)抗網(wǎng)絡(luò)GAN2014年,蘭·吉德費(fèi)羅等人首次提出生成式對(duì)抗網(wǎng)絡(luò)(generative
adversarial
nets,GAN),通過生成器和判別器互相競(jìng)爭(zhēng)對(duì)抗來生成數(shù)據(jù),引起學(xué)術(shù)界的關(guān)注。經(jīng)理論與工程驗(yàn)證,GAN網(wǎng)絡(luò)在圖像、文本、音頻等領(lǐng)域具有廣泛的適用性。GAN的基本結(jié)構(gòu)如圖所示,它由一個(gè)生成模型(generative
model,G)和一個(gè)判別模型(discriminative
model,D)構(gòu)成。生成模型可以看作一個(gè)樣本生成器,通過輸入一個(gè)隨機(jī)噪聲Z并且模仿真實(shí)數(shù)據(jù)樣本的分布,盡可能使生成的假樣本擁有與真實(shí)樣本一致的概率分布。判別模型用來判別輸入的樣本是否為真實(shí)樣本,輸出值為0或1,相當(dāng)于一個(gè)二分類過程。北京信息科技大學(xué)自動(dòng)化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.3機(jī)器學(xué)習(xí)10.3.2生成式對(duì)抗網(wǎng)絡(luò)GAN訓(xùn)練GAN網(wǎng)絡(luò)相當(dāng)于動(dòng)態(tài)博弈過程,通過交替訓(xùn)練GAN的生成模型與判別模型不斷地調(diào)整參數(shù),最終使判別器無法判別生成器的輸出結(jié)果是否為真,達(dá)到使生成器生成以假亂真數(shù)據(jù)樣本的目的。北京信息科技大學(xué)自動(dòng)化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.3機(jī)器學(xué)習(xí)10.3.3強(qiáng)化學(xué)習(xí)2016年,DeepMind公司主要基于強(qiáng)化學(xué)習(xí)算法研發(fā)的AlphaGo程序擊敗人類頂尖的職業(yè)圍棋選手這一消息震驚了全世界。強(qiáng)化學(xué)習(xí)方法起源于動(dòng)物心理學(xué)的相關(guān)原理,模仿人類和動(dòng)物學(xué)習(xí)的試錯(cuò)機(jī)制,是一種通過與環(huán)境交互,從學(xué)習(xí)狀態(tài)到行為的映射關(guān)系,以獲得最大累積期望回報(bào)的方法。狀態(tài)到行為的映射關(guān)系也即策略,表示在各個(gè)狀態(tài)下智能體采取的行為或行為概率。強(qiáng)化學(xué)習(xí)最大的特點(diǎn)是在與環(huán)境的交互中進(jìn)行學(xué)習(xí)。在與環(huán)境的互動(dòng)中,智能體根據(jù)它們獲得的獎(jiǎng)勵(lì)和懲罰不斷學(xué)習(xí),以更好地適應(yīng)環(huán)境。北京信息科技大學(xué)自動(dòng)化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.3機(jī)器學(xué)習(xí)10.3.3強(qiáng)化學(xué)習(xí)強(qiáng)化學(xué)習(xí)的核心思想是試錯(cuò)機(jī)制,即讓智能體在與環(huán)境的交互過程中不斷學(xué)習(xí)和反饋,以獲得最大的累計(jì)獎(jiǎng)勵(lì)。通??梢允褂民R爾可夫決策過程對(duì)RL問題建模,表示為一個(gè)五元組(S,P,A,R,γ),其中S代表一個(gè)有限的狀態(tài)集合,A代表一個(gè)動(dòng)作集合,P代表一個(gè)狀態(tài)轉(zhuǎn)移概率矩陣,R代表一個(gè)回報(bào)函數(shù),γ代表一個(gè)折扣因子,具體的學(xué)習(xí)過程如圖所示。北京信息科技大學(xué)自動(dòng)化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.3機(jī)器學(xué)習(xí)10.3.3強(qiáng)化學(xué)習(xí)為了獲得環(huán)境反饋給智能體的最大獎(jiǎng)勵(lì),智能體根據(jù)環(huán)境的即時(shí)狀態(tài)St選擇并執(zhí)行它認(rèn)為的最優(yōu)動(dòng)作At。環(huán)境接受動(dòng)作At后,以一定概率轉(zhuǎn)移到下一狀態(tài)St+1,并把一個(gè)獎(jiǎng)勵(lì)Rt反饋給智能體,智能體根據(jù)獎(jiǎng)勵(lì)Rt和當(dāng)前狀態(tài)St+1選擇下一個(gè)動(dòng)作。而t時(shí)刻的累計(jì)獎(jiǎng)勵(lì)R就是即時(shí)獎(jiǎng)勵(lì)Rt與后續(xù)所有可能采取的動(dòng)作和導(dǎo)致的環(huán)境狀態(tài)的價(jià)值之和。由于距離當(dāng)前狀態(tài)越遠(yuǎn),不確定性越高,需要乘以一個(gè)折扣因子γ來調(diào)整未來的每個(gè)即時(shí)獎(jiǎng)勵(lì)對(duì)于累計(jì)獎(jiǎng)勵(lì)的影響。累計(jì)獎(jiǎng)勵(lì)公式R表示如下:北京信息科技大學(xué)自動(dòng)化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.3機(jī)器學(xué)習(xí)10.3.3強(qiáng)化學(xué)習(xí)如果Agent的某個(gè)行為策略導(dǎo)致環(huán)境對(duì)Agent正的獎(jiǎng)賞(reward),則Agent以后采取這個(gè)行為策略的趨勢(shì)會(huì)加強(qiáng)。反之,若某個(gè)行為策略導(dǎo)致了負(fù)的獎(jiǎng)賞,那么Agent此后采取這個(gè)動(dòng)作的趨勢(shì)會(huì)減弱。人工智能的目標(biāo)是賦予機(jī)器像人一樣思考的能力。更進(jìn)一步,希望創(chuàng)造出像人類一樣具有自我意識(shí)和思考的人工智能。強(qiáng)化學(xué)習(xí)與監(jiān)督學(xué)習(xí)的不同之處在于,監(jiān)督學(xué)習(xí)涉及以執(zhí)行任務(wù)的正確動(dòng)作集的形式向代理提供反饋。相比之下,強(qiáng)化學(xué)習(xí)使用獎(jiǎng)勵(lì)和懲罰作為積極和消極行為的信號(hào),它可以從自己的經(jīng)驗(yàn)和行為中學(xué)習(xí),對(duì)機(jī)器人自己創(chuàng)建一個(gè)高效的自適應(yīng)控制系統(tǒng)至關(guān)重要。北京信息科技大學(xué)自動(dòng)化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.3機(jī)器學(xué)習(xí)10.3.4遷移學(xué)習(xí)遷移學(xué)習(xí)主要是運(yùn)用已有的知識(shí)對(duì)不同但相關(guān)領(lǐng)域的問題進(jìn)行求解,從根本上放寬了傳統(tǒng)機(jī)器學(xué)習(xí)的基本假設(shè)。它打破了傳統(tǒng)機(jī)器學(xué)習(xí)對(duì)測(cè)試數(shù)據(jù)與訓(xùn)練數(shù)據(jù)必須同分布的要求,是一種跨領(lǐng)域、跨任務(wù)的學(xué)習(xí)方法。遷移學(xué)習(xí)可以使訓(xùn)練過程中的時(shí)間成本和計(jì)算資源大大降低,獲得了廣泛的關(guān)注和應(yīng)用。遷移學(xué)習(xí)的基本思路是從一個(gè)或多個(gè)源領(lǐng)域(sourcedomain)任務(wù)中抽取知識(shí)和經(jīng)驗(yàn),然后應(yīng)用到一個(gè)目標(biāo)領(lǐng)域(targetdomain)中去。北京信息科技大學(xué)自動(dòng)化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.3機(jī)器學(xué)習(xí)10.3.4遷移學(xué)習(xí)假設(shè)一個(gè)有標(biāo)簽的數(shù)據(jù)集為其中,xi為數(shù)據(jù)集中的第i個(gè)樣本,yi為其標(biāo)簽。定義χ為描述樣本X的特征空間,P(X)為X的邊緣概率分布,X的特征空間表示為定義γ為描述標(biāo)簽Y的標(biāo)簽空間,f(X)=P(Y|X)為條件概率分布,Y的標(biāo)簽空間表示為在遷移學(xué)習(xí)中,定義域D被定義為由樣本的特征空間及其邊緣概率分布的集合,即D={χ,P(X)};任務(wù)T被定義為由標(biāo)簽的標(biāo)簽空間及目標(biāo)預(yù)測(cè)函數(shù)的集合,即T={γ,ft(·)}。對(duì)于給定源域Ds和對(duì)應(yīng)的任務(wù)Ts,給定目標(biāo)域Dt和對(duì)應(yīng)任務(wù)Tt,遷移學(xué)習(xí)旨在Ds≠Dt或Ts≠Tt的條件下,通過在源域Ds和源任務(wù)Ts獲得的知識(shí)來幫助模型解決在目標(biāo)域Dt上的目標(biāo)任務(wù)Tt的預(yù)測(cè)函數(shù)ft(·),使得ft(·)在目標(biāo)域Dt上擁有最小的預(yù)測(cè)誤差。北京信息科技大學(xué)自動(dòng)化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.3機(jī)器學(xué)習(xí)10.3.4遷移學(xué)習(xí)遷移學(xué)習(xí)的過程如圖所示。北京信息科技大學(xué)自動(dòng)化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.3機(jī)器學(xué)習(xí)10.3.4遷移學(xué)習(xí)根據(jù)領(lǐng)域、任務(wù)及數(shù)據(jù)監(jiān)督性的不同,遷移學(xué)習(xí)可以劃分為4個(gè)不同的類別?,F(xiàn)有的遷移學(xué)習(xí)研究大多都建立在源域和目標(biāo)域相似度較高的全局約束下。盡管整個(gè)源域數(shù)據(jù)不能直接被用到目標(biāo)域數(shù)據(jù)里,但還是可能在源域中找到一些可以重新被用到目標(biāo)域中的數(shù)據(jù)?;趯?shí)例的遷移學(xué)習(xí)方法根據(jù)一定的權(quán)重生成規(guī)則,對(duì)相同或相似的數(shù)據(jù)樣本調(diào)整權(quán)重,進(jìn)行重用,遷移學(xué)習(xí)后的預(yù)測(cè)效果更準(zhǔn)確。1.基于實(shí)例的遷移學(xué)習(xí)北京信息科技大學(xué)自動(dòng)化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.3機(jī)器學(xué)習(xí)10.3.4遷移學(xué)習(xí)根據(jù)領(lǐng)域、任務(wù)及數(shù)據(jù)監(jiān)督性的不同,遷移學(xué)習(xí)可以劃分為4個(gè)不同的類別?;谔卣鞯倪w移學(xué)習(xí)方法是指通過特征變換的方式進(jìn)行遷移,來減少源域和目標(biāo)域之間的差距。在機(jī)器學(xué)習(xí)的訓(xùn)練過程中,篩選出一些好的有代表性的特征,通過特征變換把源域和目標(biāo)域的特征變換到同樣的空間,使這個(gè)空間中源域和目標(biāo)域的數(shù)據(jù)具有相同的分布,然后利用傳統(tǒng)的機(jī)器學(xué)習(xí)進(jìn)行分類和預(yù)測(cè)研究。2.基于特征的遷移學(xué)習(xí)北京信息科技大學(xué)自動(dòng)化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.3機(jī)器學(xué)習(xí)10.3.4遷移學(xué)習(xí)根據(jù)領(lǐng)域、任務(wù)及數(shù)據(jù)監(jiān)督性的不同,遷移學(xué)習(xí)可以劃分為4個(gè)不同的類別。假設(shè)源域任務(wù)模型和目標(biāo)域任務(wù)模型之間可以共享一些參數(shù),或者共享模型超參數(shù)的先驗(yàn)分布,基于模型的遷移學(xué)習(xí)方法就是將源域任務(wù)模型可以共享的參數(shù)遷移到新的目標(biāo)域任務(wù)的模型上。在機(jī)器學(xué)習(xí)訓(xùn)練中,這種方法可以節(jié)省大量的時(shí)間成本和計(jì)算資源,使訓(xùn)練過程更高效、更快捷。3.基于模型的遷移學(xué)習(xí)北京信息科技大學(xué)自動(dòng)化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.3機(jī)器學(xué)習(xí)10.3.4遷移學(xué)習(xí)根據(jù)領(lǐng)域、任務(wù)及數(shù)據(jù)監(jiān)督性的不同,遷移學(xué)習(xí)可以劃分為4個(gè)不同的類別?;陉P(guān)系的遷移學(xué)習(xí)方法重點(diǎn)關(guān)注源域和目標(biāo)域樣本之間的關(guān)系,利用源域中的邏輯網(wǎng)絡(luò)將相似的關(guān)系進(jìn)行遷移,比如生物病毒傳播到計(jì)算機(jī)病毒傳播的遷移,師生關(guān)系到上司下屬關(guān)系的遷移。統(tǒng)計(jì)關(guān)系學(xué)習(xí)是基于關(guān)系的遷移學(xué)習(xí)方法的主要技術(shù)。4.基于關(guān)系的遷移學(xué)習(xí)北京信息科技大學(xué)自動(dòng)化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.4智能交互技術(shù)智能交互是人與機(jī)器之間使用某種對(duì)話語言,以一定的交互方式,為完成確定任務(wù)的人與機(jī)器之間的交換過程。整個(gè)交互系統(tǒng)中從接入用戶的輸入信息開始,包括語音、表情、手勢(shì)等多模態(tài)信息。我們?cè)趯?duì)話系統(tǒng)中對(duì)輸入的信息進(jìn)行理解,通過這個(gè)對(duì)話部分以后產(chǎn)生輸出,最后用文字、合成語音或行為展現(xiàn)出來。目前,新型的人機(jī)交互方式主要有語音交互、姿勢(shì)交互、觸摸交互、視線跟蹤與輸入交互、腦機(jī)交互、肌電交互、表情交互、虛擬現(xiàn)實(shí)和增強(qiáng)現(xiàn)實(shí)以及多通道交互等。北京信息科技大學(xué)自動(dòng)化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.4智能交互技術(shù)語音交互是讓機(jī)器能夠聽懂人說話,并根據(jù)人的話語執(zhí)行相應(yīng)的命令。語言是人類最重要的交流方式,如果機(jī)器能與人進(jìn)行語音交互,將使人們享受到更加輕松、自然的交互體驗(yàn)。語音交互的關(guān)鍵技術(shù)主要包括語音識(shí)別、語音合成和語義理解。語音識(shí)別對(duì)用戶的語言進(jìn)行特征分析,將其轉(zhuǎn)化為相應(yīng)的文本或計(jì)算機(jī)系統(tǒng)可識(shí)別的命令;語音合成將文本轉(zhuǎn)換成機(jī)器合成的語音;語義理解技術(shù)是,從語音識(shí)別輸出的文本中獲取語義信息從而理解用戶的意圖。10.4.1語音交互北京信息科技大學(xué)自動(dòng)化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.4智能交互技術(shù)姿勢(shì)交互是通過穿戴/移動(dòng)式傳感技術(shù)或計(jì)算機(jī)視覺技術(shù)對(duì)人體各個(gè)部位的狀態(tài)和動(dòng)作進(jìn)行檢測(cè)和識(shí)別。穿戴/移動(dòng)式傳感技術(shù)通過各種傳感設(shè)備主要感知以下3類信息:形狀變化、平移及旋轉(zhuǎn)運(yùn)動(dòng)、方位與距離。計(jì)算機(jī)視覺技術(shù)則是通過各種波長(zhǎng)的電磁波來感知軀體動(dòng)作。利用穿戴/移動(dòng)式傳感技術(shù)實(shí)現(xiàn)姿勢(shì)交互是一種主動(dòng)感知,其精度較高,但附屬感、侵入性較強(qiáng)。利用計(jì)算機(jī)視覺技術(shù)實(shí)現(xiàn)姿勢(shì)交互是一種被動(dòng)感知,不需要穿戴額外的設(shè)備,交互體驗(yàn)更加自然,但對(duì)動(dòng)作和姿勢(shì)的識(shí)別精度略遜一籌。10.4.2姿勢(shì)交互北京信息科技大學(xué)自動(dòng)化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.4智能交互技術(shù)姿勢(shì)交互方式利用人的姿勢(shì)行為主要分為以下幾類:10.4.2姿勢(shì)交互(1)手部與手臂姿勢(shì)交互。五指和手臂的運(yùn)動(dòng)最精細(xì)復(fù)雜。(2)頭部姿勢(shì)交互。頭部姿勢(shì)包括“空間姿勢(shì)”和“移動(dòng)姿勢(shì)”。(3)全身姿勢(shì)交互。北京信息科技大學(xué)自動(dòng)化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.4智能交互技術(shù)觸覺是人們感知物理世界的重要方式。人全身的皮膚上處處有能感知溫度、濕度、壓力、震動(dòng)、痛覺等多種感覺的觸覺感覺細(xì)胞,它們?cè)谥讣馍系姆植加葹槊芗?所以人們的手指觸覺非常敏感,在很多情況下幾乎可以替代視覺和聽覺。因此觸摸式交互界面在人機(jī)交互領(lǐng)域大有可為。觸摸界面是一種“能把數(shù)字信息結(jié)合于日常的實(shí)體物件與物理環(huán)境中,從而實(shí)現(xiàn)對(duì)真實(shí)物理世界的增強(qiáng)”的用戶界面。具體而言,就是用戶通過物理操控(如傾斜、擠壓、搖晃等)進(jìn)行輸入,系統(tǒng)感知到用戶輸入后,以改變某物件物理形態(tài)(如顯示、收縮、震動(dòng)等)的方式為用戶提供反饋。10.4.3觸摸交互不同種類觸摸屏性能對(duì)比。P228北京信息科技大學(xué)自動(dòng)化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.4智能交互技術(shù)人們觀察外部世界時(shí),眼睛總是與其他人體活動(dòng)自然協(xié)調(diào)地工作,并且眼動(dòng)所需的認(rèn)知負(fù)荷很低,人眼的注視包含著當(dāng)前的任務(wù)狀況以及人的內(nèi)部狀態(tài)等信息,因此眼注視是一種非常好的能使人機(jī)對(duì)話變得簡(jiǎn)便、自然的候選輸入通道。眼動(dòng)測(cè)量方法經(jīng)歷了早期的直接觀察法、主觀感知法,后來發(fā)展為瞳孔—角膜反射向量法、眼電圖法、虹膜—鞏膜邊緣法、角膜反射法、雙普金野象法、接觸鏡法等。10.4.4視線跟蹤與輸入北京信息科技大學(xué)自動(dòng)化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.4智能交互技術(shù)目前,根據(jù)用戶眼動(dòng)信息發(fā)揮的不同作用和特點(diǎn),眼動(dòng)交互技術(shù)可分為視線反饋技術(shù)、視線點(diǎn)擊技術(shù)和視線輸入技術(shù)。(1)基于自然眼動(dòng)信息的視線反饋技術(shù)。視線反饋技術(shù)指的是一種基于視線眼動(dòng)信息,通過反饋來促進(jìn)視覺操作績(jī)效的交互技術(shù)。(2)基于視線操作的視線點(diǎn)擊技術(shù)。用于點(diǎn)擊操作的眼控技術(shù)主要是通過收集顯示屏上用戶注視點(diǎn)的坐標(biāo),再結(jié)合其他用戶行為來代替?zhèn)鹘y(tǒng)鼠標(biāo)部分功能的交互技術(shù)。(3)利用視線行為進(jìn)行輸入的視線輸入技術(shù)。眼控技術(shù)的另一種重要用途是視線輸入技術(shù),它在用戶對(duì)特定輸入規(guī)則進(jìn)行學(xué)習(xí)的基礎(chǔ)上,結(jié)合計(jì)算機(jī)的識(shí)別和編碼,將視線移動(dòng)的軌跡序列或一定的停留時(shí)間編譯為輸入特定字符的指令,即利用視線動(dòng)作完成數(shù)字字母等字符的輸入任務(wù)。10.4.4視線跟蹤與輸入北京信息科技大學(xué)自動(dòng)化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.4智能交互技術(shù)腦機(jī)交互是人機(jī)交互的重要方向,依靠人的腦波信號(hào)直接識(shí)別翻譯成為機(jī)器的指令。顯然,這是一種直接的人機(jī)交互方式,將會(huì)對(duì)人機(jī)交互方式產(chǎn)生革命性的影響。10.4.5腦機(jī)交互腦機(jī)交互的實(shí)現(xiàn)有賴于腦功能的研究。腦功能的研究手段可分為以下幾類。(1)侵入式腦功能研究。就是把電極植入到腦內(nèi),形成皮質(zhì)腦電圖。(2)非侵入式腦功能研究。一種非侵入式MEG(腦磁信號(hào))設(shè)備,體量通常較大。另一種非侵入式設(shè)備是利用EEG(腦電)信號(hào),特點(diǎn)是設(shè)備非常小,非常便宜,可以做成便攜式裝置,實(shí)用性很好。北京信息科技大學(xué)自動(dòng)化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.4智能交互技術(shù)通過腦電識(shí)別,人們可以探索人腦,發(fā)現(xiàn)感知認(rèn)知機(jī)理,解釋邏輯推理過程,提供有效的人工智能研究手段和技術(shù)途徑。如圖所示,腦機(jī)接口技術(shù)使用在頭皮或皮層神經(jīng)元記錄的腦電活動(dòng),并把它轉(zhuǎn)化為對(duì)外界的控制信號(hào)。10.4.5腦機(jī)交互腦電信號(hào)直接反映人腦的活動(dòng)和認(rèn)知特性,可以做情緒、疾病的監(jiān)測(cè)和腦機(jī)交互。它的應(yīng)用領(lǐng)域和前景非常廣闊,比如在人工智能領(lǐng)域,它可以探索人腦活動(dòng)和認(rèn)知規(guī)律,在腦機(jī)交互上也可以幫助殘疾人來控制輪椅等設(shè)備。在情緒監(jiān)測(cè)上可以感知人的工作狀態(tài)、壓力和焦慮等。北京信息科技大學(xué)自動(dòng)化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.4智能交互技術(shù)另一方面,腦電信號(hào)分析研究目前仍存在不少問題。主要包括以下幾點(diǎn)10.4.5腦機(jī)交互(1)腦電信號(hào)的識(shí)別性能。腦電信號(hào)的信噪比非常低,因此識(shí)別準(zhǔn)確率和計(jì)算復(fù)雜度通常難以滿足實(shí)際應(yīng)用需求。在研究中需要發(fā)現(xiàn)新的視覺驅(qū)動(dòng)與腦電信號(hào)的相關(guān)性,即低信噪比腦電信號(hào)下的高準(zhǔn)確識(shí)別理論。(2)腦電信號(hào)的降噪方法。目前,針對(duì)腦電信號(hào)多通道、強(qiáng)噪聲特點(diǎn)的有效降噪方法和分類理論尚不完善。(3)腦電信號(hào)的多通道鑒別分析。針對(duì)腦電信號(hào)的多通道鑒別分析,現(xiàn)有分類模型和相關(guān)通道選擇問題的思路尚不十分有效,缺乏理論性支持。在研究中,需要尋找和探索更有效的基于思維的腦機(jī)交互范式,探索基于人視覺感知機(jī)理的計(jì)算模型。(4)腦機(jī)接口系統(tǒng)模式相對(duì)單一。研究中需要解決面向多種范式的思維腦控技術(shù)。北京信息科技大學(xué)自動(dòng)化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.4智能交互技術(shù)生肌電一體化是近年來快速發(fā)展的前沿科學(xué)技術(shù),它通過生物體運(yùn)動(dòng)執(zhí)行系統(tǒng),感知系統(tǒng),控制系統(tǒng)等與機(jī)電裝置(機(jī)構(gòu)、傳感器、控制器等)的功能集成,使生物體或機(jī)電裝備的功能得到延伸。生肌電一體化機(jī)器人與普通機(jī)器人相比,最大的特點(diǎn)就是將“固定在人體上的機(jī)器”發(fā)展為神經(jīng)系統(tǒng)直接控制的運(yùn)動(dòng)功能替代裝置,由人的神經(jīng)電生理信號(hào)來控制假肢的行動(dòng)。10.4.6肌電交互人體的任何一個(gè)動(dòng)作都是由多組肌群在神經(jīng)系統(tǒng)的支配下相互協(xié)調(diào)、共同完成的。肌肉組織運(yùn)動(dòng)時(shí)會(huì)產(chǎn)生微弱的(mV級(jí))電位變化,肌肉的活動(dòng)信息不但能反映關(guān)節(jié)的伸屈狀態(tài)和伸屈強(qiáng)度,還能反映動(dòng)作過程中肢體的形狀和位置等信息。可見,獲取肌電信號(hào)變化是感知人體動(dòng)作的重要方式,這可以由安裝在相應(yīng)肌群皮膚表面的表面肌電傳感器來完成。北京信息科技大學(xué)自動(dòng)化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.4智能交互技術(shù)目前,表情交互研究主要針對(duì)靜態(tài)圖像、圖像序列或視頻中的二維、三維或四維數(shù)據(jù)提出大量的表情識(shí)別算法。除對(duì)人臉的6種基本表情以及中性表情的分析識(shí)別外,還有一些關(guān)于疼痛、微表情等的識(shí)別,這大大促進(jìn)了表情識(shí)別在醫(yī)學(xué)、心理學(xué)及助老助殘上的應(yīng)用。10.4.7表情交互表情交互是指從給定的人臉靜態(tài)圖像或動(dòng)態(tài)視頻序列中分離出特定的表情狀態(tài),從而確定被識(shí)別對(duì)象的心理情緒,實(shí)現(xiàn)對(duì)表情的理解與識(shí)別,實(shí)現(xiàn)更優(yōu)的人機(jī)交互。這種技術(shù)的重要性在于,人類在日常交流中,人臉表情可傳遞高達(dá)55%的信息。計(jì)算機(jī)對(duì)人類表情的識(shí)別和分析能夠改善人際交流,尤其對(duì)殘障人士的信息表達(dá)與理解具有重要意義。表情交互通常需要對(duì)面部表情進(jìn)行追蹤、編碼、識(shí)別。其中,面部表情的識(shí)別是最關(guān)鍵的一步。北京信息科技大學(xué)自動(dòng)化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.4智能交互技術(shù)虛擬現(xiàn)實(shí)技術(shù)是20世紀(jì)末興起的一門嶄新的綜合性信息技術(shù),它融合了數(shù)字圖像處理、計(jì)算機(jī)圖形學(xué)、多媒體技術(shù)、傳感器技術(shù)等多個(gè)信息技術(shù)分支,大大推進(jìn)了計(jì)算機(jī)技術(shù)的發(fā)展。虛擬現(xiàn)實(shí)技術(shù)有3個(gè)特性,即沉浸感(immersion),交互性(interaction),思維構(gòu)想性(imagination)。10.4.8虛擬現(xiàn)實(shí)和增強(qiáng)現(xiàn)實(shí)虛擬現(xiàn)實(shí)技術(shù)是一種綜合應(yīng)用各種技術(shù)制造逼真的人工模擬環(huán)境,并有效模擬人在自然環(huán)境中的各種感知系統(tǒng)行為的高級(jí)人機(jī)交互技術(shù)。虛擬現(xiàn)實(shí)技術(shù)利用計(jì)算機(jī)生成三維視、聽、觸覺等感覺,使人通過適當(dāng)裝置,以虛擬的方式來體驗(yàn),并和所虛擬的世界進(jìn)行交互作用。北京信息科技大學(xué)自動(dòng)化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.4智能交互技術(shù)(1)桌面式虛擬現(xiàn)實(shí)系統(tǒng)(desktopVR)。桌面式虛擬現(xiàn)實(shí)系統(tǒng)用電腦屏幕呈現(xiàn)三維虛擬環(huán)境,通過鼠標(biāo)、手柄等進(jìn)行交互。使用者可能因受到現(xiàn)實(shí)環(huán)境的干擾而缺乏沉浸體驗(yàn),但由于成本相對(duì)較低,應(yīng)用廣泛。(2)完全沉浸式虛擬現(xiàn)實(shí)系統(tǒng)(fully-immersiveVR)。完全沉浸式虛擬現(xiàn)實(shí)系統(tǒng)需要佩戴沉浸式的輸出設(shè)備(如頭盔、具有力反饋的機(jī)械手臂等),以及頭部、身體的追蹤裝置,從而確保其身體運(yùn)動(dòng)和環(huán)境反饋之間的精確匹配??梢詫⑹褂谜叩囊曈X、聽覺與外界隔離,排除外界干擾,全身心投入虛擬世界中。(3)分布式虛擬現(xiàn)實(shí)系統(tǒng)(distributedVR)。分布式虛擬現(xiàn)實(shí)系統(tǒng)將分散的虛擬現(xiàn)實(shí)系統(tǒng)通過網(wǎng)絡(luò)聯(lián)結(jié)起來,采用協(xié)調(diào)一致的結(jié)構(gòu)、標(biāo)準(zhǔn)、協(xié)議和數(shù)據(jù)庫,形成一個(gè)在時(shí)間和空間上互相耦合的虛擬合成環(huán)境,參與者之間可以自由交互和協(xié)同工作。10.4.8虛擬現(xiàn)實(shí)和增強(qiáng)現(xiàn)實(shí)虛擬現(xiàn)實(shí)技術(shù)主要包括以下3種類型。北京信息科技大學(xué)自動(dòng)化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.4智能交互技術(shù)10.4.8虛擬現(xiàn)實(shí)和增強(qiáng)現(xiàn)實(shí)增強(qiáng)現(xiàn)實(shí)技術(shù)是一項(xiàng)高新科技技術(shù),通過立體顯示、傳感器、二維碼、3D建模等技術(shù)充分調(diào)動(dòng)用戶的參與意識(shí)與互動(dòng)思維,把現(xiàn)實(shí)世界與虛擬世界有機(jī)結(jié)合起來,營(yíng)造出似真似幻的曼妙時(shí)空。增強(qiáng)現(xiàn)實(shí)的技術(shù)主要包括顯示技術(shù)、識(shí)別技術(shù)、立體成像技術(shù)、傳感技術(shù)等。就顯示技術(shù)而言,則主要分為頭盔式和非頭盔式兩種。就頭盔式而言,依據(jù)影像呈現(xiàn)方式的不同,又可分為屏幕式與光學(xué)反射式。屏幕式頭盔顯示和光學(xué)反射式顯示技術(shù)的區(qū)別P232北京信息科技大學(xué)自動(dòng)化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.4智能交互技術(shù)10.4.8虛擬現(xiàn)實(shí)和增強(qiáng)現(xiàn)實(shí)與主流的屏幕顯示技術(shù)相比,另外一個(gè)進(jìn)展迅速的技術(shù)類型是全息影像(holography)。它是一種在真正意義上實(shí)現(xiàn)360°影像表達(dá)的技術(shù),即從任意角度觀看都會(huì)得到真實(shí)的立體效果。這種技術(shù)從最初的靜態(tài)影像呈現(xiàn),如身份證照片、防偽標(biāo)示等,進(jìn)化到如今的實(shí)時(shí)性、動(dòng)態(tài)性、體積感等多種特性。從技術(shù)實(shí)現(xiàn)的方式而言,既有大型投影群的參與,也能見到微型投影器的身影。此外,透明面板的發(fā)明也帶給人們極大的想象空間,即把屏幕的光學(xué)折射特性應(yīng)用到極致,透過屏幕可以看清后邊的真實(shí)世界,使裸眼3D產(chǎn)生的虛擬空間與真實(shí)世界更容易疊合,而不借助攝像頭進(jìn)行影像的捕捉。這既避免了光學(xué)反射式投影影像的對(duì)焦虛化,更避免了頭盔式屏幕顯示的影像質(zhì)量的畫質(zhì)損失,因而是一種極具前景的增強(qiáng)現(xiàn)實(shí)技術(shù)。北京信息科技大學(xué)自動(dòng)化學(xué)院課程《智能機(jī)器人原理與應(yīng)用》10.4智能交互技術(shù)10.4.9多通道交互從生物意義上說,人體在生活場(chǎng)景中的經(jīng)歷可以歸結(jié)為各種生理器官的相互協(xié)作,主要有耳朵、皮膚、眼睛、鼻子、舌頭等,與此對(duì)應(yīng)便產(chǎn)生了多通道。多通道人機(jī)交互是指利用兩種或多種通道的感知方式來進(jìn)行交互,包括聽覺、觸覺、視覺、嗅覺、味覺等;多通道交互技術(shù)綜合使用三維交互技術(shù)、語音識(shí)別與合成技術(shù)、自然語言理解技術(shù)、視線跟蹤技術(shù)、姿勢(shì)輸入技術(shù)、觸覺、力顯示等新的交互通道、設(shè)備和交互技術(shù),使用戶可通過多通道,以自然、并行、協(xié)作的方式進(jìn)行人機(jī)對(duì)話,融合來自不同通道的精確的和不精確的輸入,以捕捉用戶的交互意圖,提高人機(jī)交互的自然性和高效性,最終達(dá)到以人為中心的交互方式。“智能檢測(cè)技術(shù)與模式識(shí)別”研究所問答互動(dòng)環(huán)節(jié)北京信息科技大學(xué)自動(dòng)化學(xué)院智能機(jī)器人原理與應(yīng)用“智能檢測(cè)技術(shù)與模式識(shí)別”研究所11家庭智能空間服務(wù)機(jī)器人系統(tǒng)智能空間是一種新的人機(jī)交互協(xié)作的復(fù)雜系統(tǒng),它通過普適傳感器網(wǎng)絡(luò),把大量的多模態(tài)傳感器和帶有嵌入式處理器的計(jì)算、信息設(shè)備相互連接起來,從而將計(jì)算智能分布和嵌入到環(huán)境與日常工具中,以滿足各種特定需要[7]。與服務(wù)機(jī)器人研究的最終目的一致,智能空間研究也是為了提高人的生活質(zhì)量;從技術(shù)層面上看,將智能空間技術(shù)與服務(wù)機(jī)器人技術(shù)結(jié)合起來,可以實(shí)現(xiàn)兩者優(yōu)勢(shì)的互補(bǔ)[8]:一方面,服務(wù)機(jī)器人只需與智能空間建立通信即可隨時(shí)隨地感知整個(gè)家庭環(huán)境,擺脫了必須集各種傳感器于一身的束縛;另一方面,服務(wù)機(jī)器人的引入大大提高了智能空間感知與執(zhí)行的主動(dòng)性??梢?,智能空間服務(wù)機(jī)器人的研究,是服務(wù)機(jī)器人技術(shù)與智能空間技術(shù)的完美結(jié)合,是不同于兩者的各自獨(dú)立發(fā)展,卻可以同時(shí)進(jìn)行的另一條道路,其研究也必將豐富機(jī)器人和智能空間領(lǐng)域的相關(guān)理論。11.1家庭智能空間服務(wù)機(jī)器人系統(tǒng)介紹11.1.1家庭服務(wù)機(jī)器人1.家庭服務(wù)機(jī)器人研究尚不成熟當(dāng)前的家庭服務(wù)機(jī)器人研究和應(yīng)用遠(yuǎn)遠(yuǎn)沒有達(dá)到我們的期望,這其中一部分原因是當(dāng)前對(duì)服務(wù)機(jī)器人本身,包括智能、自主等方面的研究還不成熟:首先,機(jī)器人的智能程度較為低下,目前機(jī)器人的服務(wù)功能往往是通過使用者預(yù)先對(duì)機(jī)器人設(shè)置定時(shí)啟動(dòng),或通過遙控等設(shè)備發(fā)出指令為絕對(duì)前提,機(jī)器人缺乏主動(dòng)智能;其次,機(jī)器人感知和自主運(yùn)動(dòng)能力尚待提高,為機(jī)器人本體配備更多的感知設(shè)備,難以從根本上解決機(jī)器人全局范圍內(nèi)有效信息的感知問題,反而導(dǎo)致了成本和計(jì)算開銷的增加。因此,機(jī)器人進(jìn)入家庭作業(yè)仍受到很大的限制,其基本功能如定位、導(dǎo)航和物體識(shí)別等仍是最具有挑戰(zhàn)性的課題。11.1家庭智能空間服務(wù)機(jī)器人系統(tǒng)介紹11.1.1家庭服務(wù)機(jī)器人2.家庭服務(wù)任務(wù)的難度眾所周知,家庭服務(wù)機(jī)器人面對(duì)的是整個(gè)家庭環(huán)境及其中的各種目標(biāo),不同于工業(yè)現(xiàn)場(chǎng)固定和可編程的環(huán)境,其復(fù)雜性具體表現(xiàn)為以下幾個(gè)方面。(1)機(jī)器人工作環(huán)境為較為擁擠、混雜的家庭環(huán)境,且動(dòng)態(tài)性較高;(2)家庭目標(biāo)種類繁多特征各異,部分目標(biāo)具有較強(qiáng)的移動(dòng)性并在家庭環(huán)境進(jìn)出;(3)家庭環(huán)境和目標(biāo)相輔相承,融為一體,并無明確界限可分。由于上述因素的影響,造成了家庭環(huán)境及其中目標(biāo)的多而混雜、異質(zhì)性和動(dòng)態(tài)性,在此情況下,傳統(tǒng)的只適合在特定條件、特定場(chǎng)合下完成簡(jiǎn)單任務(wù)的工作模式和處理方法將不能滿足家庭服務(wù)機(jī)器人任務(wù)的需要。11.1家庭智能空間服務(wù)機(jī)器人系統(tǒng)介紹11.1.2智能空間1.智能空間的特點(diǎn)近年來,伴隨計(jì)算機(jī)、信息和網(wǎng)絡(luò)技術(shù)的飛速發(fā)展,出現(xiàn)了基于普適計(jì)算理論的智能空間技術(shù),它是一種新的復(fù)雜系統(tǒng),通過普適傳感器網(wǎng)絡(luò),把大量的多模態(tài)傳感器安裝在室內(nèi)的多個(gè)位置,并將其與帶有嵌入式處理器的計(jì)算設(shè)備進(jìn)行互連,從而將計(jì)算智能分布和嵌入到附有唯一識(shí)別標(biāo)簽的環(huán)境與日常目標(biāo)中,以實(shí)現(xiàn)對(duì)環(huán)境及其中目標(biāo)的隨時(shí)、隨地感知,滿足各種特定任務(wù)的需要。可見,智能空間既可以提供對(duì)其所在環(huán)境的精確觀測(cè)信息,同時(shí)又具備高效快速的信息處理能力。11.1家庭智能空間服務(wù)機(jī)器人系統(tǒng)介紹11.1.2智能空間2.智能空間的應(yīng)用前景智能空間技術(shù)旨在建立一個(gè)以人為中心的充滿計(jì)算和通信能力的空間,讓計(jì)算機(jī)參與到日?;顒?dòng)中,使用戶能像與其他人一樣與計(jì)算機(jī)系統(tǒng)發(fā)生交互,從而隨時(shí)隨地、透明地獲得人性化的服務(wù)。從普適計(jì)算的角度來看,智能空間是普適計(jì)算理論研究的理想實(shí)驗(yàn)平臺(tái),同時(shí)作為一種集成化系統(tǒng),智能空間也具有十分重要的應(yīng)用價(jià)值,在智能交通、應(yīng)急反應(yīng)、機(jī)器人等領(lǐng)域顯示出廣泛的應(yīng)用前景。11.1家庭智能空間服務(wù)機(jī)器人系統(tǒng)介紹11.1.3家庭智能空間服務(wù)機(jī)器人系統(tǒng)構(gòu)建背景1.家庭智能空間服務(wù)機(jī)器人系統(tǒng)的理念家庭智能空間服務(wù)機(jī)器人系統(tǒng)的建立主要是通過在室內(nèi)環(huán)境布撒各種信息檢測(cè)傳感器、用于數(shù)據(jù)處理和信息服務(wù)的計(jì)算主機(jī)、人-機(jī)交互的觸摸顯示器界面、網(wǎng)絡(luò)系統(tǒng)以及數(shù)據(jù)庫等軟硬件設(shè)施,從而將室內(nèi)家庭環(huán)境改造為遍布觀測(cè)和處理能力的信息空間,為服務(wù)機(jī)器人提供海量信息的環(huán)境信息,并通過無線傳輸方式與機(jī)器人交互,輔助機(jī)器人實(shí)現(xiàn)準(zhǔn)確導(dǎo)航、精確定位等工作,進(jìn)而完成抓取、運(yùn)送、整理家具和物品等各種家庭服務(wù)任務(wù)。11.1家庭智能空間服務(wù)機(jī)器人系統(tǒng)介紹11.1.3家庭智能空間服務(wù)機(jī)器人系統(tǒng)構(gòu)建背景2.家庭智能空間服務(wù)機(jī)器人系統(tǒng)的系統(tǒng)構(gòu)成圖11.1給出了一種以攝像機(jī)為節(jié)點(diǎn)構(gòu)建智能空間傳感器網(wǎng)絡(luò)的家庭智能空間服務(wù)機(jī)器人系統(tǒng)示意圖。本章的研究同樣是基于攝像機(jī)節(jié)點(diǎn)來構(gòu)建智能空間傳感器網(wǎng)絡(luò)。攝像機(jī)1攝像機(jī)N智能空間攝像機(jī)網(wǎng)絡(luò)智能空間主機(jī)ZigBeeZigBee操作目標(biāo)服務(wù)對(duì)象攝像頭圖11.1家庭智能空間服務(wù)機(jī)器人系統(tǒng)構(gòu)成11.2機(jī)器人同步定位、傳感器網(wǎng)絡(luò)標(biāo)定與環(huán)境建圖眾所周知,機(jī)器人定位、傳感器網(wǎng)絡(luò)標(biāo)定與環(huán)境建圖是物聯(lián)網(wǎng)機(jī)器人系統(tǒng)中三個(gè)相互耦合的基本問題,其有效解決是物聯(lián)網(wǎng)機(jī)器人系統(tǒng)提供高效智能服務(wù)的前提。本節(jié)提出了物聯(lián)網(wǎng)機(jī)器人系統(tǒng)同時(shí)機(jī)器人定位、傳感器網(wǎng)絡(luò)標(biāo)定與環(huán)境建圖的概念,通過分析三者之間的耦合關(guān)系,給出同時(shí)定位、標(biāo)定與建圖問題的聯(lián)合條件概率表示,基于貝葉斯公式和馬爾科夫特性將其分解為若干可解項(xiàng),并借鑒Rao-Blackwellized粒子濾波的思想分別求解。首先,聯(lián)合傳感器網(wǎng)絡(luò)對(duì)機(jī)器人的觀測(cè)、機(jī)器人對(duì)已定位環(huán)境特征的觀測(cè)以及機(jī)器人自身控制量設(shè)計(jì)了位姿粒子的采樣提議分布和權(quán)值更新公式;其次,聯(lián)合傳感器網(wǎng)絡(luò)對(duì)機(jī)器人運(yùn)動(dòng)軌跡及已定位環(huán)境特征的觀測(cè)設(shè)計(jì)了傳感器網(wǎng)絡(luò)標(biāo)定的遞推公式;然后,聯(lián)合傳感器網(wǎng)絡(luò)和機(jī)器人對(duì)(已定位或新發(fā)現(xiàn))環(huán)境特征的觀測(cè)設(shè)計(jì)環(huán)境建圖的遞推公式。給出了完整的同時(shí)定位、標(biāo)定與建圖算法,并通過仿真實(shí)驗(yàn)驗(yàn)證了該算法的有效性。11.2機(jī)器人同步定位、傳感器網(wǎng)絡(luò)標(biāo)定與環(huán)境建圖11.2.1問題簡(jiǎn)化作為人們?nèi)粘I詈凸ぷ鞯闹匾獔?chǎng)所,家庭或辦公室環(huán)境的布局結(jié)構(gòu)往往較為復(fù)雜,且其中目標(biāo)種類繁多、特征各異并具有不同程度的動(dòng)態(tài)特性。為方便分析,不妨將物聯(lián)網(wǎng)機(jī)器人系統(tǒng)進(jìn)行合理簡(jiǎn)化。首先建立機(jī)器人坐標(biāo)系:以標(biāo)識(shí)色塊的中心為坐標(biāo)系原點(diǎn),z軸方向垂直標(biāo)識(shí)色塊向上,x軸方向?yàn)闄C(jī)器人前進(jìn)方向,y軸方向由右手法則確定。假定機(jī)械手基座坐標(biāo)系、PTZ云臺(tái)坐標(biāo)系在機(jī)器人坐標(biāo)系下的位姿均已離線標(biāo)定。以初始建圖時(shí)刻的機(jī)器人坐標(biāo)系作為世界坐標(biāo)系,由于機(jī)器人運(yùn)行在平行于地面的二維平面,不妨假設(shè)任意時(shí)刻機(jī)器人在世界坐標(biāo)系z(mì)軸的投影始終為零。此外,環(huán)境目標(biāo)往往分布在三維空間中,故本文將整個(gè)環(huán)境描述為世界坐標(biāo)系下包含環(huán)境布局及其中目標(biāo)的三維特征地圖,并通過機(jī)器人和傳感器網(wǎng)絡(luò)的實(shí)時(shí)交互來聯(lián)合構(gòu)建并共同維護(hù)該地圖。11.2機(jī)器人同步定位、傳感器網(wǎng)絡(luò)標(biāo)定與環(huán)境建圖11.2.2模型求解從概率的觀點(diǎn)看,物聯(lián)網(wǎng)機(jī)器人系統(tǒng)同時(shí)定位、標(biāo)定與建圖問題可以用概率密度來表示,即在已知機(jī)器人控制輸入序列、機(jī)器人對(duì)N個(gè)環(huán)境目標(biāo)的觀測(cè)序列、傳感器網(wǎng)絡(luò)M個(gè)節(jié)點(diǎn)對(duì)機(jī)器人的觀測(cè)序列,以及傳感器網(wǎng)絡(luò)M個(gè)節(jié)點(diǎn)對(duì)N個(gè)環(huán)境特征的觀測(cè)序列的條件下,求解傳感器網(wǎng)絡(luò)M個(gè)節(jié)點(diǎn)的參數(shù)、機(jī)器人位姿、以及N個(gè)目標(biāo)所構(gòu)成地圖的聯(lián)合后驗(yàn)概率估計(jì)問題?;赗ao-Blackwellized粒子濾波的思想,機(jī)器人運(yùn)動(dòng)軌跡的遞歸估計(jì)由粒子濾波器完成,各粒子對(duì)應(yīng)傳感器網(wǎng)絡(luò)參數(shù)估計(jì)和特征地圖估計(jì)均由擴(kuò)展Kalman濾波器完成。11.2機(jī)器人同步定位、傳感器網(wǎng)絡(luò)標(biāo)定與環(huán)境建圖11.2.3算法描述通過前面的分解,并采用Rao-Blackwellized粒子濾波思想,在t時(shí)刻,物聯(lián)網(wǎng)機(jī)器人系統(tǒng)同時(shí)定位、標(biāo)定與建圖問題的求解算法如下:Step1.基于粒子濾波的機(jī)器人定位(1)機(jī)器人位姿估計(jì):采樣機(jī)器人位姿粒子;(2)位姿粒子權(quán)值計(jì)算:計(jì)算各位姿粒子的權(quán)值,歸一化;(3)計(jì)算有效粒子數(shù),進(jìn)行粒子重采樣;Step2.傳感器節(jié)點(diǎn)標(biāo)定環(huán)節(jié):基于EKF估計(jì)傳感器節(jié)點(diǎn)的位姿參數(shù)(1)預(yù)測(cè)更新;(2)根據(jù)傳感器節(jié)點(diǎn)對(duì)機(jī)器人觀測(cè)的觀測(cè)更新;(3)根據(jù)傳感器節(jié)點(diǎn)對(duì)已定位環(huán)境特征觀測(cè)的觀測(cè)更新;Step3.環(huán)境特征建圖環(huán)節(jié):基于EKF估計(jì)環(huán)境特征的位置:(1)預(yù)測(cè)更新:(2)根據(jù)機(jī)器人對(duì)環(huán)境特征觀測(cè)的觀測(cè)更新;(3)根據(jù)傳感器節(jié)點(diǎn)對(duì)環(huán)境特征觀測(cè)的觀測(cè)更新。11.2機(jī)器人同步定位、傳感器網(wǎng)絡(luò)標(biāo)定與環(huán)境建圖11.2.3算法復(fù)雜度分析同時(shí)定位、標(biāo)定與建圖問題的本質(zhì)是多傳感器信息融合意義下的狀態(tài)估計(jì)問題。本文方法采用序貫方式融合兩類觀測(cè)信息進(jìn)行狀態(tài)的觀測(cè)更新,針對(duì)每一類觀測(cè),當(dāng)同時(shí)存在多個(gè)該類觀測(cè)時(shí),仍然采用序貫方式加以融合,如對(duì)于步驟Step2.(2)的觀測(cè)更新,當(dāng)存在多個(gè)傳感器節(jié)點(diǎn)對(duì)機(jī)器人的觀測(cè)時(shí),采用序貫方式融合多傳感器節(jié)點(diǎn)的觀測(cè)信息,同樣策略應(yīng)用于步驟Step2.(3)、Step3.(2)和Step3.(3)中存在多個(gè)同類觀測(cè)的情形。假定物聯(lián)網(wǎng)機(jī)器人系統(tǒng)中包含一個(gè)移動(dòng)機(jī)器人和一個(gè)由M個(gè)節(jié)點(diǎn)構(gòu)成的傳感器網(wǎng)絡(luò),且環(huán)境中包含N個(gè)特征點(diǎn),本文算法中粒子個(gè)數(shù)選為K,在極端情形下,即各傳感器節(jié)點(diǎn)始終可以觀測(cè)到機(jī)器人和所有環(huán)境特征點(diǎn),且機(jī)器人在任意時(shí)刻也都可以觀測(cè)到所有環(huán)境特征點(diǎn)時(shí),本文算法所要融合的數(shù)據(jù)量最大,通過算法分析可知此情況下算法循環(huán)次數(shù)為K(M(N+1)+N(M+1)),或者說,本算法在最壞情況下的時(shí)間復(fù)雜度為O(KMN)。11.2機(jī)器人同步定位、傳感器網(wǎng)絡(luò)標(biāo)定與環(huán)境建圖11.2.4實(shí)驗(yàn)測(cè)試TimBailey提供了SLAM的matlab仿真程序和一個(gè)200m×200m的數(shù)據(jù)集,在此基礎(chǔ)上作如下改動(dòng):在地圖中隨機(jī)添加landmark和waypoint數(shù)據(jù),其位置如圖11.2所示;機(jī)器人初始位置在原點(diǎn)處、方向朝左;控制周期為0.025s;機(jī)器人能夠得到距離和方位的觀測(cè)信息,觀測(cè)范圍為其前方半徑為30m的半球區(qū)域,觀測(cè)采樣周期0.2s,觀測(cè)噪聲的協(xié)方差矩陣為diag{0.01.0.01},運(yùn)動(dòng)速率3m/s,運(yùn)動(dòng)噪聲的協(xié)方差diag{0.09,(3o)2},實(shí)驗(yàn)中所用到粒子濾波的采樣粒子數(shù)均取為100。圖11.2環(huán)境特征、傳感器節(jié)點(diǎn)和機(jī)器人運(yùn)行路徑示意圖11.2機(jī)器人同步定位、傳感器網(wǎng)絡(luò)標(biāo)定與環(huán)境建圖11.2.4實(shí)驗(yàn)結(jié)果分析第一組仿真實(shí)驗(yàn)進(jìn)行機(jī)器人定位精度對(duì)比,分別采用EKF-SLAM、FastSLAM2.0與本文的物聯(lián)網(wǎng)機(jī)器人系統(tǒng)U-SLAM(ubiquitousrobotsystemSLAM,U-SLAM)方法進(jìn)行對(duì)比,三類方法各運(yùn)行50次,得到的機(jī)器人位置誤差的數(shù)學(xué)期望和方差如圖11.3所示,角度誤差的數(shù)學(xué)期望和方差如圖11.4所示??梢钥闯觯瑐鹘y(tǒng)的SLAM方法中,EKF-SLAM算法僅利用機(jī)器人運(yùn)動(dòng)模型進(jìn)行位姿估計(jì)而沒有考慮對(duì)環(huán)境的觀測(cè)信息,得到的定位誤差較大;FastSLAM2.0算法由于充分考慮機(jī)器人觀測(cè)信息,定位精度較高,但由于傳感器隨機(jī)器人運(yùn)動(dòng),導(dǎo)致這兩種傳統(tǒng)SLAM方法都存在定位誤差隨運(yùn)動(dòng)時(shí)間明顯增大的缺陷。而對(duì)于本文U-SLAM,由于傳感器網(wǎng)絡(luò)各節(jié)點(diǎn)獨(dú)立于機(jī)器人,解除了觀測(cè)與機(jī)器人運(yùn)動(dòng)之間的數(shù)據(jù)耦合,在明顯提高機(jī)器人位姿估計(jì)精度的同時(shí),估計(jì)的穩(wěn)定性也有大幅改善。圖11.4機(jī)器人角度誤差對(duì)比圖11.3機(jī)器人位置誤差對(duì)比11.2機(jī)器人同步定位、傳感器網(wǎng)絡(luò)標(biāo)定與環(huán)境建圖11.2.4實(shí)驗(yàn)結(jié)果分析第二組仿真實(shí)驗(yàn)進(jìn)行傳感器網(wǎng)絡(luò)標(biāo)定精度對(duì)比,分別對(duì)僅依據(jù)運(yùn)動(dòng)方程的機(jī)器人位姿、依據(jù)FastSLAM2.0的機(jī)器人位姿,以及本文的物聯(lián)網(wǎng)機(jī)器人系統(tǒng)U-SLAM中聯(lián)合機(jī)器人位姿與環(huán)境特征這三類傳感器網(wǎng)絡(luò)標(biāo)定方法進(jìn)行對(duì)比,三類方法各運(yùn)行50次,得到的傳感器網(wǎng)絡(luò)標(biāo)定誤差的數(shù)學(xué)期望和方差如圖11.5所示??梢钥闯?,僅依據(jù)運(yùn)動(dòng)方程的方法,機(jī)器人位姿估計(jì)誤差隨運(yùn)動(dòng)距離增加迅速,得到的標(biāo)定結(jié)果誤差很大,難以滿足要求;依據(jù)FastSLAM2.0算法能夠有效減少機(jī)器人位姿估計(jì)誤差,從而提高了節(jié)點(diǎn)標(biāo)定的精度,但由于僅考慮了節(jié)點(diǎn)對(duì)機(jī)器人的觀測(cè),產(chǎn)生的標(biāo)定誤差仍然較高。而對(duì)于本文U-SLAM,傳感器網(wǎng)絡(luò)各節(jié)點(diǎn)標(biāo)定、機(jī)器人位姿估計(jì)相對(duì)獨(dú)立,解除了觀測(cè)與機(jī)器人運(yùn)動(dòng)之間的數(shù)據(jù)耦合,在明顯提高機(jī)器人位姿估計(jì)精度的同時(shí),傳感器節(jié)點(diǎn)標(biāo)定的精度和穩(wěn)定性也得到了大幅改善。圖11.5傳感器網(wǎng)絡(luò)標(biāo)定誤差對(duì)比11.2機(jī)器人同步定位、傳感器網(wǎng)絡(luò)標(biāo)定與環(huán)境建圖11.2.4實(shí)驗(yàn)結(jié)果分析第三組仿真實(shí)驗(yàn)進(jìn)行環(huán)境建圖精度對(duì)比,分別對(duì)僅依據(jù)運(yùn)動(dòng)方程的機(jī)器人位姿、FastSLAM2.0的機(jī)器人位姿,以及本文的物聯(lián)網(wǎng)機(jī)器人系統(tǒng)U-SLAM中聯(lián)合機(jī)器人位姿與環(huán)境特征這三類環(huán)境建圖方法進(jìn)行對(duì)比,三類方法各運(yùn)行50次,得到的傳感器網(wǎng)絡(luò)標(biāo)定誤差的數(shù)學(xué)期望和方差如圖11.6所示??梢钥闯?,僅依據(jù)運(yùn)動(dòng)方程的方法,機(jī)器人位姿估計(jì)誤差隨運(yùn)動(dòng)距離增加迅速,導(dǎo)致建圖誤差很大,難以滿足要求;依據(jù)FastSLAM2.0算法能夠有效減少機(jī)器人位姿估計(jì)誤差,從而提高了建圖的精度,但由于僅考慮了節(jié)點(diǎn)對(duì)機(jī)器人的觀測(cè),產(chǎn)生的標(biāo)定誤差仍然較高。而對(duì)于本文U-SLAM,機(jī)器人位姿估計(jì)、傳感器網(wǎng)絡(luò)各節(jié)點(diǎn)標(biāo)定和環(huán)境建圖相對(duì)獨(dú)立,環(huán)境建圖的精度和穩(wěn)定性得到了大幅提高。圖11.6環(huán)境特征建圖誤差對(duì)比11.2機(jī)器人同步定位、傳感器網(wǎng)絡(luò)標(biāo)定與環(huán)境建圖11.2.4實(shí)驗(yàn)結(jié)果分析第四組仿真實(shí)驗(yàn)進(jìn)行動(dòng)態(tài)環(huán)境下的機(jī)器人定位精度對(duì)比。在第30時(shí),將經(jīng)過機(jī)器人定位的目標(biāo)從處移動(dòng)到未建圖區(qū)域處,機(jī)器人在第36時(shí)刻重新發(fā)現(xiàn)該目標(biāo),假定機(jī)器人并未發(fā)現(xiàn)目標(biāo)的變動(dòng),利用傳統(tǒng)的SLAM算法進(jìn)行目標(biāo)數(shù)據(jù)關(guān)聯(lián)并根據(jù)先前獲取的信息自定位,得到的位置和角度誤差分別如圖11.7和圖11.8所示??梢钥闯觯捎肊KF-SLAM、UKF-SLAM和FastSLAM2.0算法得到錯(cuò)誤定位,其原因在于此三種算法在定位環(huán)節(jié)中融合了機(jī)器人的觀測(cè)信息,但機(jī)器人感知范圍有限而未察覺目標(biāo)變動(dòng),仍以先前獲取的位置和當(dāng)前觀測(cè)來推算當(dāng)前位姿,從而導(dǎo)致定位錯(cuò)誤。對(duì)于FastSLAM1.0算法,機(jī)器人定位只根據(jù)自身控制信息完成,未融合觀測(cè)信息從而避免受動(dòng)態(tài)環(huán)境的影響。而對(duì)于本文U-SLAM,通過傳感器網(wǎng)絡(luò)監(jiān)測(cè)動(dòng)態(tài)環(huán)境特征的變化,并將其告知移動(dòng)機(jī)器人,避免了動(dòng)態(tài)路標(biāo)對(duì)機(jī)器人定位的影響,并獲得了比FastSLAM1.0更高的定位精度。圖11.8機(jī)器人角度誤差對(duì)比圖11.7機(jī)器人位置誤差對(duì)比北京信息科技大學(xué)自動(dòng)化學(xué)院“智能檢測(cè)技術(shù)與模式識(shí)別”研究所問答互動(dòng)環(huán)節(jié)智能機(jī)器人原理與應(yīng)用“智能檢測(cè)技術(shù)與模式識(shí)別”研究所12家庭智能空間服務(wù)機(jī)器人環(huán)境功能區(qū)認(rèn)知室內(nèi)功能區(qū)是指根據(jù)房屋的使用功能和各共有建筑部位的服務(wù)范圍而劃分的區(qū)域.服務(wù)機(jī)器人室內(nèi)功能區(qū)認(rèn)知旨在建立一種人機(jī)共融式的功能區(qū)認(rèn)知框架,機(jī)器人通過視覺系統(tǒng)將室內(nèi)功能區(qū)場(chǎng)景圖像捕捉到大腦,經(jīng)由預(yù)先學(xué)習(xí)的認(rèn)知框架加以分析,得到該場(chǎng)景圖像的深層功能屬性,這一過程與人類場(chǎng)景認(rèn)知機(jī)理類似.本章提出了基于CLM(無碼本模型)的家庭服務(wù)機(jī)器人室內(nèi)功能區(qū)分類方法.首先,采用SURF(加速魯棒特征)提取算法獲得底層特征;其次,考慮到本文采用的室內(nèi)功能區(qū)數(shù)據(jù)集背景噪聲特點(diǎn),去除背景雜波的濾除過程,提高運(yùn)算效率;最后,采用改進(jìn)的SVM作為分類器,較現(xiàn)有CLM方法更加簡(jiǎn)潔高效,適用于較低配置的機(jī)器人.12.1功能區(qū)認(rèn)知的系統(tǒng)框架不同于詞袋模型通過學(xué)習(xí)碼本統(tǒng)計(jì)局部特征分布并對(duì)描述符進(jìn)行編碼的方法(如圖12.1所示),CLM模型直接用描述符表示圖像,無需預(yù)先訓(xùn)練碼本和隨后的編碼,具有規(guī)避詞袋模型上述限制的優(yōu)勢(shì)。此外,本章從底層特征與分類器兩方面進(jìn)行了優(yōu)化改進(jìn)。圖12.1詞袋模型與CLM模型構(gòu)建過程及對(duì)比基于CLM的家庭服務(wù)機(jī)器人室內(nèi)服務(wù)環(huán)境分類方法主要分為特征提取、離線構(gòu)建圖像表示模型和在線分類檢測(cè)3個(gè)階段。特征提取階段:以室內(nèi)環(huán)境的灰度圖像作為輸入,計(jì)算SURF特征描述子,獲得不同場(chǎng)景類別的特征描述。離線構(gòu)建圖像表示模型階段:考慮到構(gòu)建碼本的局限性,本文采用無碼本的CLM替代詞袋模型構(gòu)建室內(nèi)功能區(qū)的表示模型。首先,構(gòu)建單高斯模型的圖像表示;然后,使用一個(gè)有效的兩步度量方法匹配高斯模型,并引入2個(gè)重要參數(shù)改進(jìn)所使用的距離度量公式;最后,采用改進(jìn)的SVM學(xué)習(xí)方法,進(jìn)行室內(nèi)功能區(qū)的分類。在線檢測(cè)階段:將一組新的圖像作為測(cè)試集,通過與訓(xùn)練的圖像模型匹配,對(duì)測(cè)試集圖像進(jìn)行分類,通過分類精度判斷模型的有效性和實(shí)用性。12.1功能區(qū)認(rèn)知的系統(tǒng)框架12.2功能區(qū)圖像模型構(gòu)建12.2.1提取圖像特征描述符即使同類別的2張室內(nèi)功能區(qū)圖像之間也會(huì)存在拍攝角度、光照變化、尺度大小等方面的差異,從而影響分類判別的精度.SURF算法是一種圖像局部特征計(jì)算方法,基于物體上的一些局部外觀的興趣點(diǎn)而生成,對(duì)方向旋轉(zhuǎn)、亮度變化、尺度縮放具有不變性,對(duì)視角偏移、仿射變換、噪聲雜波也具有一定的穩(wěn)定性.SURF算法在保留了SIFT算法的優(yōu)良性能的基礎(chǔ)上,特征更為精簡(jiǎn),在降低算法復(fù)雜度的同時(shí)提高了計(jì)算效率.12.2功能區(qū)圖像模型構(gòu)建12.2.1提取圖像特征描述符基于SURF算法的功能區(qū)特征提取算法具體如下:輸入:室內(nèi)功能區(qū)的灰度圖像.輸出:室內(nèi)功能區(qū)的64維SURF特征矩陣.步驟1:對(duì)輸入圖像進(jìn)行高斯濾波,得到濾波后圖像,繼而分別求各個(gè)方向上的2階導(dǎo)數(shù).步驟2:構(gòu)造圖像的Hessian.步驟3:通過對(duì)每個(gè)像素的Hessian矩陣求行列式的值,得到每個(gè)像素點(diǎn)的近似表示,遍歷每個(gè)像素的Hessian矩陣,得到圖像的響應(yīng)圖像.步驟4:改變參數(shù)值,得到不同尺度下的高斯平滑圖像,形成高斯金字塔.步驟5:對(duì)某一像素點(diǎn),得到鄰域內(nèi)的極值,記為鄰域內(nèi)的特征點(diǎn).步驟6:選取主方向,然后把正方形框分為16個(gè)子區(qū)域,在每個(gè)子區(qū)域內(nèi)統(tǒng)計(jì)水平方向和垂直方向(相對(duì)主方向而言)的Haar小波特征,得到64維的圖像特征向量..12.2功能區(qū)圖像模型構(gòu)建12.2.2分類器的選擇本文通過采用對(duì)數(shù)-歐氏計(jì)算框架,得到了基于線性空間的高斯模型匹配度量公式,故可以采用線性分類器對(duì)數(shù)據(jù)進(jìn)行分類.常見的線性分類器有邏輯回歸、SVM、感知機(jī)、K均值法等.將SVM分類器用于本文中功能區(qū)分類具有如下優(yōu)勢(shì):(1)SVM以結(jié)構(gòu)化風(fēng)險(xiǎn)最小為優(yōu)化目標(biāo),相較于其他幾種分類器具有更強(qiáng)的泛化能力;(2)家庭服務(wù)機(jī)器人的應(yīng)用場(chǎng)景主要為室內(nèi),功能區(qū)樣本集種類有限,而SVM在少量的支持向量的基礎(chǔ)上確定的分類超平面,其受樣本數(shù)量的影響較小,具有很好的魯棒性;(3)本文采用CLM構(gòu)建的室內(nèi)功能區(qū)表示模型,相較于傳統(tǒng)基于碼本的表示方法維度較高,SVM提供了一種規(guī)避高維空間復(fù)雜性問題的思路,即直接用此空間的內(nèi)積函數(shù)(核函數(shù)),結(jié)合在線性可分情況下的求解方法,直接求解高維空間的決策問題.基于上述考慮,故本章采用SVM作為最終的分類器.12.2.3室內(nèi)功能區(qū)建模算法輸入:5種室內(nèi)功能區(qū)的灰度級(jí)圖像.輸出:室內(nèi)功能區(qū)表示模型.步驟1:在5種室內(nèi)功能區(qū)的灰度級(jí)圖像上計(jì)算SURF特征描述子;步驟2:運(yùn)用空間金字塔匹配方法,將功能區(qū)圖像分成一些規(guī)則的區(qū)域;步驟3:在每個(gè)區(qū)域上,運(yùn)用最大似然法,聯(lián)合平均向量和協(xié)方差矩陣,構(gòu)建一個(gè)單高斯模型,并引入
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年車用硅整流組合件項(xiàng)目可行性研究報(bào)告
- 2024年腫瘤熱療機(jī)項(xiàng)目可行性研究報(bào)告
- 2024至2030年中國(guó)坐式胸肌推舉訓(xùn)練器數(shù)據(jù)監(jiān)測(cè)研究報(bào)告
- 2024年仿古武術(shù)劍項(xiàng)目可行性研究報(bào)告
- 電氣設(shè)備傷害課程設(shè)計(jì)
- 中國(guó)顆粒鉀肥行業(yè)競(jìng)爭(zhēng)趨勢(shì)及管理策略建議研究報(bào)告(2024-2030版)
- 中國(guó)鑄鐵搪瓷鍋行業(yè)發(fā)展態(tài)勢(shì)與競(jìng)爭(zhēng)格局展望研究報(bào)告(2024-2030版)
- 中國(guó)酯基季銨鹽行業(yè)競(jìng)爭(zhēng)動(dòng)態(tài)及投資前景預(yù)測(cè)研究報(bào)告(2024-2030版)
- 中國(guó)邊緣計(jì)算機(jī)行業(yè)市場(chǎng)現(xiàn)狀分析及競(jìng)爭(zhēng)格局與投資發(fā)展研究報(bào)告(2024-2030版)
- 中國(guó)起糧機(jī)行業(yè)市場(chǎng)運(yùn)營(yíng)模式及未來發(fā)展動(dòng)向預(yù)測(cè)研究報(bào)告(2024-2030版)
- 液化氣站氣質(zhì)分析報(bào)告管理制度
- 砍伐工程方案35963
- 《大醫(yī)精誠(chéng)》說課(新)
- 牛羊屠宰管理辦法
- 《微觀經(jīng)濟(jì)學(xué)》課程思政教學(xué)案例(一等獎(jiǎng))
- DBJ50T-232-2016 建設(shè)工程監(jiān)理工作規(guī)程
- 國(guó)際人力資源管理課程教學(xué)大綱
- 深信服園區(qū)級(jí)雙活數(shù)據(jù)中心
- T-CSCS 016-2021 鋼結(jié)構(gòu)制造技術(shù)標(biāo)準(zhǔn)
- 回彈強(qiáng)度對(duì)應(yīng)表
- DB32T 3713-2020 高速公路建設(shè)工程施工班組管理規(guī)范
評(píng)論
0/150
提交評(píng)論