多智能體控制概述課件_第1頁(yè)
多智能體控制概述課件_第2頁(yè)
多智能體控制概述課件_第3頁(yè)
多智能體控制概述課件_第4頁(yè)
多智能體控制概述課件_第5頁(yè)
已閱讀5頁(yè),還剩45頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

多智能體控制概述2014.5.15.提綱什么是多智能體系統(tǒng)應(yīng)用研究意義研究方法分類基于圖的離散方法基于PDE的連續(xù)方法研究進(jìn)展-多智能體隊(duì)形控制多智能體系統(tǒng)生物界的群體自組織行為Ableto控制目標(biāo)deployoveragivenregion將多個(gè)自主體部署到指定區(qū)域assumespecifiedpattern形成指定的隊(duì)形,隊(duì)形控制rendezvousatacommonpoint所有智能體集合到一個(gè)點(diǎn)jointlyinitiatemotion/changedirectioninasynchronizedway協(xié)同的運(yùn)動(dòng)模式,同步運(yùn)動(dòng)方向Speciesachievesynchronizedbehaviorwithlimitedsensing/communicationbetweenindividualswithoutapparentlyfollowinggroupleader(Couzinetal,Nature05;Conradtetal,Nature03)多智能體系統(tǒng)的應(yīng)用Embeddedroboticsystemsandsensornetworksforhigh-stress,rapiddeployment|e.g.,disasterrecoverynetworks(在危險(xiǎn)的地方工作)Distributedenvironmentalmonitoring|e.g.,portablechemical(分布式環(huán)境下的監(jiān)視)andbiologicalsensorarraysdetectingtoxicpollutantsAutonomoussamplingforbiologicalapplications|e.g.,monitoringofspeciesinrisk,validationofclimateandoceanographicmodels自主采樣Scienceimaging|e.g.,multispacecraftdistributedinterferometersflyinginformationtoenableimagingatmicroarcsecondresolution科學(xué)成像2014年《科學(xué)》雜志十大科學(xué)進(jìn)展之一

Termites機(jī)器人的特點(diǎn)沒有中央控制(整體規(guī)劃)的情況下,依靠個(gè)體之間相互作用的簡(jiǎn)單規(guī)則,完成復(fù)雜的建造任務(wù)。機(jī)器人只擁有覺察到附近有塊磚或有一個(gè)機(jī)器人的能力,就能決定自己下一步的行動(dòng)。它們是在沒有詳細(xì)的規(guī)劃或中央通訊的情況完成這些工作的;而為這些機(jī)器人所設(shè)的程序只是若個(gè)簡(jiǎn)單的規(guī)則。由用戶定義的結(jié)構(gòu),來決定機(jī)器人需要遵循的規(guī)則.獨(dú)立且具有分散性控制的機(jī)器人有眾多的優(yōu)點(diǎn)。冗余性:個(gè)別的機(jī)器人可能會(huì)出毛病,但其余的機(jī)器人可繼續(xù)運(yùn)行。整個(gè)系統(tǒng)不會(huì)因?yàn)橛幸惶庩P(guān)鍵環(huán)節(jié)出現(xiàn)了故障而癱瘓。靈活性:這樣的系統(tǒng)也具可縮放性?!叭绻獜氖赂笠?guī)模的工作,人們只需要增加更多的機(jī)器人(甚至在工作進(jìn)行中)而無(wú)需對(duì)它們的編程進(jìn)行改動(dòng)?!睉?yīng)用例子例子roboticsubmarine尋找馬航失聯(lián)客機(jī)autonomousunderwatervehicle在海底尋找,多個(gè)水下機(jī)器人形成協(xié)同搜索,效率更好,每個(gè)搜索一片區(qū)域,相互之間傳遞消息。應(yīng)用于無(wú)人駕駛機(jī)群的編隊(duì)飛行,可移動(dòng)機(jī)器人的定位和位置部署,可移動(dòng)傳感網(wǎng)絡(luò)的布局,運(yùn)輸車輛的協(xié)調(diào),飛行器或者小衛(wèi)星群的空間布局等無(wú)人網(wǎng)絡(luò)系統(tǒng)的控制,在人類難以到達(dá)或者危險(xiǎn)的地方,完成環(huán)境探索、科學(xué)采樣、地圖繪制、監(jiān)測(cè)和偵查、搜索和營(yíng)救以及分布式傳感等協(xié)同任務(wù)。多智能體協(xié)同控制的研究可派生出各種分布式算法,解決不同領(lǐng)域的科學(xué)問題,例如異步網(wǎng)絡(luò)通訊、分布式協(xié)同決策、信息融合以及耦合振子系統(tǒng)等。Researchprogram:whatareweafter?Designofprovablycorrect,distributedcoordinationalgorithms分布式協(xié)同算法設(shè)計(jì)Mathematicaltoolstostudyconvergence,stability,androbustnessofcoordinationalgorithms對(duì)算法性能進(jìn)行分析Coordinationtasks執(zhí)行協(xié)同任務(wù)exploration,mapbuilding,searchandrescue,surveillance,odorlocalization,monitoring,distributedsensing勘探,繪制地圖,搜索營(yíng)救,偵查,氣味定位,監(jiān)視,分布式傳感。CooperativeroboticnetworksDistributedcoordinationalgorithmsLocalagentinteractionsgivingrisetoglobalbehaviorLimitedinformation,Veriablycorrect,rigorousassessmentofproperties要實(shí)現(xiàn)的目標(biāo):構(gòu)建機(jī)器人協(xié)同網(wǎng)絡(luò);采用分布式協(xié)同控制律;能夠通過有限的信息,局部的作用規(guī)則實(shí)現(xiàn)全局復(fù)雜的行為。Considerrendezvous/deployment/agreementscenarioConsensus=reachcommonvalueforsomevariable一致性算法Rendezvous=gettogetheratcertainlocationDeployment=deployoveragivenregion網(wǎng)絡(luò)拓?fù)渫ㄓ崍D:其中的一個(gè)實(shí)例圖24?12個(gè)agent映射到連續(xù)空間單位圓上的通訊拓?fù)鋱D用PDE建模因此agent的動(dòng)態(tài)特性就可以用PDE來描述一階積分的動(dòng)態(tài)關(guān)系可以用拋物PDE表示:,二階積分的動(dòng)態(tài)關(guān)系可以用雙曲的PDE表示:,(5)PDE的平衡點(diǎn)PDE的平衡點(diǎn)對(duì)應(yīng)系統(tǒng)的穩(wěn)定狀態(tài)我們令PDE的狀態(tài)量表示agent的位置,可以得到agent的穩(wěn)態(tài)位置方程通過變化參數(shù)和邊界輸入(也是領(lǐng)導(dǎo)者agent的位置),可以實(shí)現(xiàn)系統(tǒng)的不同穩(wěn)態(tài)解,對(duì)應(yīng)不同的部署流形。JieQi,RafaelVazquez*,MiroslavKrstic,Multi-agentDeploymentin3-DviaPDEControl,IEEETransactiononAutomaticControl.Acceptavailableonline:兩個(gè)二維復(fù)值方程確定的位置部署流形邊界條件如下,其中f(theta)是一個(gè)2pi為周期的周期函數(shù)圖3多智能體三維位置部署多智能體系統(tǒng)邊界控制器設(shè)計(jì)的基本思路這些流形由PDE的邊界輸入驅(qū)動(dòng),即改變領(lǐng)導(dǎo)者agent的位置可實(shí)現(xiàn)系統(tǒng)在不同部署隊(duì)形之間的轉(zhuǎn)換。在實(shí)際應(yīng)用中,大多數(shù)需要部署的流行對(duì)應(yīng)的平衡狀態(tài)不穩(wěn)定。我們將采用backstepping方法設(shè)計(jì)邊界反饋控制器使系統(tǒng)穩(wěn)定。圖2基于PDE的方法設(shè)計(jì)多智能體控制律實(shí)現(xiàn)位置部署與隊(duì)形控制PDE描述的多智能體模型邊界條件,也可看作邊界控制器控制器設(shè)計(jì)最后用傅立葉級(jí)數(shù)對(duì)全部子系統(tǒng)求和,得到整體系統(tǒng)的控制器如下:通過采用傅立葉級(jí)數(shù)展開,得到與theta獨(dú)立的子系統(tǒng),然后再對(duì)簡(jiǎn)單的子系統(tǒng)設(shè)計(jì)控制器,其backstepping的核函數(shù)如下:證明系統(tǒng)在L2,H1和H2空間穩(wěn)定對(duì)于二維的系統(tǒng),如果要確保系統(tǒng)狀態(tài)具有較好的函數(shù)性質(zhì),例如連續(xù)性,需要證明H2范數(shù)下穩(wěn)定。連續(xù)性使得在通訊拓?fù)渚W(wǎng)絡(luò)上相鄰的智能體在物理空間上也相鄰,這個(gè)特性對(duì)于系統(tǒng)的實(shí)際應(yīng)用非常重要,因?yàn)閍gent的通訊范圍是有限的,這樣agent就不會(huì)跑出與鄰居的通訊范圍之外,使系統(tǒng)失效。觀測(cè)器設(shè)計(jì)為了實(shí)現(xiàn)真正的分布式控制,即每個(gè)agent只需要局部鄰居的信息就能完成整體的控制目標(biāo),我們?cè)O(shè)計(jì)的觀測(cè)器,能夠估計(jì)所有agent的狀態(tài),也就是leaderagent能夠通過測(cè)量最近鄰居的狀態(tài),計(jì)算出所有agent的狀態(tài)。觀測(cè)的設(shè)計(jì)與控制器的設(shè)計(jì)是對(duì)偶的,我們得到了精確的封閉表達(dá)式證明帶觀測(cè)器的系統(tǒng)在L2,H1和H2空間穩(wěn)定

估計(jì)系統(tǒng)中也有一個(gè)核函數(shù)在角度0-2pi上積分將估計(jì)的狀態(tài)作為狀態(tài)反饋進(jìn)行邊界控制,可實(shí)現(xiàn)級(jí)聯(lián)系統(tǒng)的穩(wěn)定控制離散化獲得分布式控制律用有限差分方法離散化,離散化的誤差取決于agent的數(shù)目和離散方法。用三點(diǎn)中心法離散化,得到各個(gè)agent的分布式控制律中間的智能體離散化獲得分布式控制律得到一組常微分方程,描述每個(gè)agent的控制律(行為規(guī)則)。領(lǐng)導(dǎo)者智能體靠近極點(diǎn)的智能體仿真仿真仿真仿真KheperaIII機(jī)器人KheperaIII機(jī)器人小型機(jī)器人KheperaIII機(jī)器人上安裝的多傳感器陣

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論