RoboCup機(jī)器人足球世界杯_第1頁
RoboCup機(jī)器人足球世界杯_第2頁
RoboCup機(jī)器人足球世界杯_第3頁
RoboCup機(jī)器人足球世界杯_第4頁
RoboCup機(jī)器人足球世界杯_第5頁
已閱讀5頁,還剩4頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、RoboCup:機(jī)器人足球世界杯什么是RoboCup?一個(gè)為促進(jìn)足球機(jī)器人的發(fā)展而創(chuàng)立的國際性組織機(jī)器人足球世界杯(RoboCup)是一個(gè)國際性的研究和教育組織,它通過提供一個(gè)標(biāo)準(zhǔn)問題來促進(jìn)人工智能和智能機(jī)器人的研究。這個(gè)領(lǐng)域可以集成并檢驗(yàn)很大范圍內(nèi)的技術(shù),同時(shí)也可以作為面向教育的集成性項(xiàng)目。在國際性委員會(huì)的管理下舉行國際性的會(huì)議和比賽為了這個(gè)目的,RoboCup選擇了足球比賽作為基本的領(lǐng)域,并組織了RoboCup:機(jī)器人足球世界杯及學(xué)術(shù)會(huì)議。為了能讓一個(gè)機(jī)器人球隊(duì)真正能夠進(jìn)行足球比賽,必須集成各種各樣的技術(shù),包括自治智能體的設(shè)計(jì)準(zhǔn)則、多智能體合作、策略獲取、實(shí)時(shí)推理、機(jī)器人學(xué)以及傳感器信息融

2、合等。對一個(gè)由許多快速運(yùn)動(dòng)的機(jī)器人組成的球隊(duì)來說,RoboCup是一項(xiàng)在動(dòng)態(tài)環(huán)境下的任務(wù)。在RoboCup的軟件方面,RoboCup還提供了軟件平臺(tái)以便于研究。在將足球比賽作為標(biāo)準(zhǔn)問題的同時(shí),還會(huì)有其它各種各樣的努力,比賽只是RoboCup各項(xiàng)活動(dòng)的一部分.當(dāng)前RoboCup的活動(dòng)包括:學(xué)術(shù)會(huì)議機(jī)器人世界杯RoboCup挑戰(zhàn)計(jì)劃RoboCup教育計(jì)劃基礎(chǔ)組織的發(fā)展比賽的組成不過,機(jī)器人世界杯比賽還是我們各項(xiàng)活動(dòng)的中心,在那兒研究者們可以在一起評估研究進(jìn)展?,F(xiàn)在,RoboCup舉行以下比賽:模擬組比賽小型機(jī)器人比賽整隊(duì)小型機(jī)器人比賽,每隊(duì)包括11個(gè)機(jī)器人中型機(jī)器人比賽Sony有腿機(jī)器人比賽(由S

3、ony贊助)人形機(jī)器人比賽(從2002年開始,2002年前可能會(huì)有演示)遙控機(jī)器人比賽(即將公布)RoboCup評論員系統(tǒng)演示為什么要有RoboCup?推動(dòng)科學(xué)進(jìn)步我們的意圖是通過提供引人矚目但又非常困難的挑戰(zhàn),將RoboCup作為促進(jìn)人工智能和機(jī)器人學(xué)研究的工具。促進(jìn)研究的有效途徑是制定一個(gè)長期目標(biāo),而不拘泥與某一特定應(yīng)用。當(dāng)這個(gè)目標(biāo)完成時(shí),將產(chǎn)生巨大的社會(huì)影響,這就可以稱之為重大挑戰(zhàn)計(jì)劃。建造一個(gè)會(huì)踢足球的機(jī)器人本身并不能產(chǎn)生巨大的社會(huì)和經(jīng)濟(jì)影響,但是這種成功的確會(huì)被認(rèn)為是這個(gè)領(lǐng)域的重大成果。我們把這種計(jì)劃稱為劃時(shí)代的計(jì)劃。RoboCup既是一個(gè)標(biāo)準(zhǔn)問題,也是一個(gè)劃時(shí)代的計(jì)劃。夢想我們提出

4、的RoboCup的最終目標(biāo)是:至IJ21世紀(jì)中葉,一支完全自治的人形機(jī)器人足球隊(duì)?wèi)?yīng)該能在遵循國際足聯(lián)正式規(guī)則的比賽中,戰(zhàn)勝最近的人類世界杯冠軍隊(duì)。我們提出的這個(gè)目標(biāo)是人工智能與機(jī)器人學(xué)今后50年的重大挑戰(zhàn)。從現(xiàn)在的技術(shù)水平看來,這個(gè)目標(biāo)可能是過于雄心勃勃了。但是,我們相信,重要的是提出這樣的長期目標(biāo)并為之而奮斗。從萊特兄弟的第一架飛機(jī)到阿波羅計(jì)劃將人類送上月球并安全返回地球只花了50年。同樣,從數(shù)字計(jì)算機(jī)的發(fā)明到深藍(lán)擊敗人類國際象棋世界冠軍也只花了50年。我們已經(jīng)意識(shí)到,建立人形機(jī)器人足球隊(duì)需要大致相當(dāng)?shù)臅r(shí)間及很大范圍內(nèi)研究人員的極大努力,這個(gè)目標(biāo)是不能在短期內(nèi)完成的。劃時(shí)代的計(jì)劃目標(biāo)送一個(gè)宇

5、航員登陸月球并安全返回地球開發(fā)出能戰(zhàn)勝人類國際象棋世界冠軍的計(jì)算機(jī)MHHIM開發(fā)出能象人類那樣踢球的足球機(jī)器人系統(tǒng)工程,航空學(xué),各種電子學(xué)等搜索技術(shù),并行算法和并行計(jì)算機(jī)等實(shí)時(shí)系統(tǒng),分布式協(xié)作智能體等應(yīng)用遍布各處各種軟件系統(tǒng)、大規(guī)模并行計(jì)算機(jī)下一代人工智能,現(xiàn)實(shí)世界中的機(jī)器人和人工智能系統(tǒng)一個(gè)成功的劃時(shí)代計(jì)劃必須完成一個(gè)非常引人注目而且能引起廣泛關(guān)注的目標(biāo)。最成功的例子是阿波羅太空計(jì)劃。在阿波羅計(jì)劃中,美國制定了“送一個(gè)宇航員登陸月球并安全返回地球”的目標(biāo)。目標(biāo)的完成本身就是一個(gè)人類的歷史性事件。雖然送什么人登上月球帶來的直接經(jīng)濟(jì)收益很小(公正的講,阿波羅計(jì)劃是計(jì)劃獲得“國家聲望”,并展示對前

6、蘇聯(lián)的技術(shù)優(yōu)勢。即便如此,幾個(gè)宇航員在月球登陸也沒有帶來直接的軍事優(yōu)勢)。為達(dá)到這個(gè)目標(biāo)而發(fā)展的技術(shù)是如此重要,以至于成了美國工業(yè)強(qiáng)大的技術(shù)和人員基礎(chǔ)。劃時(shí)代計(jì)劃的重要問題是設(shè)定一個(gè)足夠高的目標(biāo),才能取得一系列為完成這個(gè)任務(wù)而必需的技術(shù)突破,同時(shí)這個(gè)目標(biāo)也要有廣泛的吸引力和興奮點(diǎn)。另外,這些完成目標(biāo)所需的技術(shù)必須是可以成為下一代工業(yè)基礎(chǔ)的技術(shù)。在阿波羅計(jì)劃中,實(shí)際的目標(biāo)遠(yuǎn)不止送個(gè)人上月球。(阿波羅計(jì)劃:“這是一個(gè)人的一小步,人類的一大步”。舉國上下的努力使宇航員NeilArmstrong在登上月球表面,實(shí)現(xiàn)這個(gè)與人類歷史一樣久遠(yuǎn)的夢想時(shí)能說出這句話。但是阿波羅計(jì)劃的目標(biāo)已經(jīng)超過了讓美國人登陸月

7、球并安全返回地球:創(chuàng)立了滿足太空中其它國家利益的技術(shù);為美國在太空留下英名;開始對月球的科學(xué)探索;提高人類在月球環(huán)境中的能力。)在RoboCup中,最終目標(biāo)是“開發(fā)一支能戰(zhàn)勝人類世界冠軍隊(duì)的機(jī)器人足球隊(duì)”。(更適當(dāng)?shù)哪繕?biāo)是“開發(fā)一支能象人一樣踢球的機(jī)器人足球隊(duì)”)不用說,最終目標(biāo)的實(shí)現(xiàn)需要幾十年的努力,如果不是幾個(gè)世紀(jì)的話。根據(jù)現(xiàn)在的技術(shù)水平,是不可能在短期內(nèi)完成這個(gè)目標(biāo)的。然而,這個(gè)目標(biāo)可以很容易的創(chuàng)立一系列方向?qū)︻^的子目標(biāo)。對任何雄心勃勃或過于雄心勃勃的計(jì)劃來說,這種途徑是較普遍的。在美國太空計(jì)劃中,完成載人軌道飛行的Mercury計(jì)劃和Gemini計(jì)劃就是阿波羅計(jì)劃的前導(dǎo)。RoboCup

8、第一個(gè)要完成的子目標(biāo)是“創(chuàng)建真實(shí)的和軟件的機(jī)器人足球隊(duì),在修改過的規(guī)則下很好的踢球”。即使完成這個(gè)目標(biāo)都會(huì)毫無疑問的產(chǎn)生能影響很大范圍工業(yè)的技術(shù)。人工智能和機(jī)器人學(xué)中新的標(biāo)準(zhǔn)問題RoboCup的另一方面是這樣一種觀點(diǎn):RoboCup是一個(gè)標(biāo)準(zhǔn)問題,可以用來評價(jià)各種不同的理論、算法和體系結(jié)構(gòu)。計(jì)算機(jī)國際象棋是一個(gè)典型的標(biāo)準(zhǔn)問題。各種搜索算法可以在這個(gè)領(lǐng)域中評價(jià)和發(fā)展。隨著最近深藍(lán)的成功,按照正式規(guī)則擊敗人類的頂尖高手GarryKasparov,計(jì)算機(jī)國際象棋的挑戰(zhàn)已經(jīng)到了殘局。計(jì)算機(jī)國際象棋作為一個(gè)標(biāo)準(zhǔn)問題的成功,主要原因之一是清楚的定義了進(jìn)展的評價(jià)。研究進(jìn)展可以用系統(tǒng)的棋力來評價(jià)。一個(gè)挑戰(zhàn)必須

9、能夠鼓勵(lì)一系列為下一代工業(yè)而發(fā)展的技術(shù)。我們認(rèn)為RoboCup可以做到這一點(diǎn)。以下是計(jì)算機(jī)國際象棋與RoboCup的領(lǐng)域特征的不同:環(huán)境狀態(tài).獲取信息傳感器信息控制.國際象棋靜態(tài)回合制完全符號(hào)式集中RoboCup動(dòng)態(tài)實(shí)時(shí)不完全非符號(hào)式分布人工智能和機(jī)器人學(xué)的教育RoboCup教育計(jì)劃著眼于使用RoboCup來建立各種教育計(jì)劃,例如可以開設(shè)以下課程:RoboCup中的人工智能(本科生或研究生課程),RoboCup中的機(jī)器人學(xué)導(dǎo)論(本科生課程),RoboCup中的人工智能程序設(shè)計(jì)(本科生課程),多智能體系統(tǒng)(研究生課程),及其它已經(jīng)開設(shè)的以RoboCup為基礎(chǔ)的課程:有:人工智能程序設(shè)計(jì),Arti

10、ficialIntelligenceProgramming(withRoboCup)bySilviaCoradeschiandJacekMalec,LinkoepingUniversity,Sweden自治系統(tǒng),AutonomousSystemsbyAndreasBirk;VrijeUniversiteitBrussel,Brussels,BelgiumRoboCup的歷史1997年5月,舊M的1997年7月4日,Sojournero與此同時(shí),“OnSeeingRobots”Dynamo機(jī)器人足球項(xiàng)在人工智能與機(jī)器人學(xué)的歷史上,1997年將作為一個(gè)轉(zhuǎn)折點(diǎn)被記住。在深藍(lán)擊敗了國際象棋世界冠軍,人

11、工智能界四十年的挑戰(zhàn)終于取得了成功。在NASA的“探路者”在火星登陸,在火星的表面釋放了第一個(gè)自治機(jī)器人系統(tǒng)RoboCup也朝開發(fā)能夠戰(zhàn)勝人類世界杯冠軍隊(duì)的機(jī)器人足球隊(duì)走出了第加拿大不列顛哥倫比亞大學(xué)的AlanMackworth教授在1992年發(fā)表了題為的文章,其中首次提出了機(jī)器人足球的思想。他的研究小組還發(fā)表了一系列目的論文。1992年10月,一些日本研究人員在東京組織了一個(gè)關(guān)于人工智能重大挑戰(zhàn)的研討會(huì),討論可能的重大挑戰(zhàn)性問題。這個(gè)研討會(huì)對采用足球比賽來促進(jìn)科技發(fā)展進(jìn)行了認(rèn)真的討論。他們進(jìn)行了一系列的調(diào)查,包括技術(shù)上的可行性,社會(huì)影響力評估以及財(cái)政上的可行性。另外,他們還草擬了規(guī)則和足球機(jī)

12、器人和模擬系統(tǒng)的開發(fā)原型。通過這些研究,他們認(rèn)為這個(gè)方案是可行的,也是大家都希望能開展的。1993年6月,包括淺田玲(MinoruAsada)、YasuoKuniyoshi和北野宏明(HiroakiKitano)在內(nèi)的一些研究者決定創(chuàng)辦一項(xiàng)機(jī)器人比賽,暫時(shí)命名為RoboCupJ聯(lián)賽(J聯(lián)賽是剛創(chuàng)辦的日本足球職業(yè)聯(lián)賽的名字)。然而在一個(gè)月之內(nèi),他們就接到了絕大部分是日本以外的研究者的反應(yīng),要求比賽擴(kuò)展成一個(gè)國際性的項(xiàng)目。于是,他們就將這個(gè)項(xiàng)目改名為機(jī)器人世界杯,簡稱為RoboCup。在這次討論的同時(shí),一些研究人員已經(jīng)將足球比賽作為他們的研究領(lǐng)域。例如,電子技術(shù)實(shí)驗(yàn)室(ETL,日本政府的一個(gè)研究中

13、心)的松原仁(ItsukiNoda)正在用足球進(jìn)行多智能體(multi-agent)的研究,并已經(jīng)開始開發(fā)一個(gè)專用的足球比賽模擬器。這個(gè)模擬器后來成了RoboCup的正式足球服務(wù)器。大坂大學(xué)的淺田玲(MinoruAsada)的實(shí)驗(yàn)室、卡內(nèi)基-梅隆大學(xué)的ManuelaVeloso教授和她的學(xué)生PeterStone也已經(jīng)開始研究足球機(jī)器人。沒有這些先行者的參與,RoboCup就不可能產(chǎn)生。1993年9月,RoboCup第一次發(fā)表公告,并草擬了明確的規(guī)則。于是,在很多會(huì)議和研討會(huì)上進(jìn)行了關(guān)于組織和技術(shù)問題的討論,包括AAAI-94(美國人工智能聯(lián)合會(huì)會(huì)議),JSAI(日本人工智能學(xué)會(huì))座談會(huì)以及其他

14、機(jī)器人界的會(huì)議。同時(shí),松原仁(Noda)在ETL的小組宣布了SoccerServerv0(LISP版本),為進(jìn)行多智能體系統(tǒng)研究而開發(fā)的第一個(gè)足球領(lǐng)域的開放系統(tǒng)模擬器,后來又通過Web發(fā)布了1.0版本的SoccerServer(C+版本)。這個(gè)模擬器的第一次公開演示是在IJCAI-95。1995年8月,在加拿大蒙特利爾召開的國際人工智能會(huì)議(IJCAI-95)上發(fā)表了公告,將在名古屋與IJCAI-97聯(lián)合舉辦首屆機(jī)器人世界杯足球賽及會(huì)議。同時(shí),為了發(fā)現(xiàn)與組織大型RoboCup比賽有關(guān)的潛在問題,決定先舉辦Pre-RoboCup-96。作出這個(gè)決定是為了留出兩年的準(zhǔn)備和開發(fā)時(shí)間,這樣研究小組就可

15、以開始開發(fā)機(jī)器人和模擬的球隊(duì),同時(shí)也能有時(shí)間籌集研究經(jīng)費(fèi)。1996年11月4日到8日,在大坂的國際智能機(jī)器人與系統(tǒng)會(huì)議(IROS-96)上舉行了Pre-RoboCup-96。有8支球隊(duì)參加了模擬組聯(lián)賽,并展示了參加中型聯(lián)賽的真正的機(jī)器人。雖然規(guī)模不大,但這是第一次將足球賽用于促進(jìn)研究與教育的比賽。1997年8月25日,與第15屆國際人工智能會(huì)議(IJCAI-97)聯(lián)合舉辦的RoboCup97在日本名古屋拉開帷幕,這是第一次正式的RoboCup比賽和會(huì)議,獲得了巨大的成功。來自美國、歐洲I、澳大利亞、日本等40多支球隊(duì)(機(jī)器人組和模擬組)參加,5000多名觀眾觀看了比賽。1998年7月4日至8日

16、,正當(dāng)世界杯比賽漸入佳境之時(shí)RoboCup-98在巴黎舉行,來自世界各地的80多支球隊(duì)參加了比賽,這也成為歷史上最大的移動(dòng)機(jī)器人活動(dòng)。另外,1998年還舉辦了一系列的其它活動(dòng),如新加坡的RoboCup-98環(huán)太平洋系列,加拿大維多利亞的RoboCup-98IROS系列,德國的VISION(歐洲最大的計(jì)算機(jī)視覺國際會(huì)議)RoboCup-98,RoboCup-98日本公開賽,AutonomousAgent98上的RoboCup模擬組演示,AAAI-98移動(dòng)機(jī)器人比賽和展示。RoboCup-99將于1999年7月30日至8月6日在瑞典斯德哥爾摩和第16屆國際人工智能會(huì)議(IJCAI-99)聯(lián)合舉辦,

17、以后還將舉辦RoboCup-2000(澳大利亞墨爾本)、RoboCup-2001(暫定美國西雅圖)、RoboCup-2002(日本)等比賽。機(jī)器人足球正以一種高技術(shù)對抗的形式贏得學(xué)術(shù)界的認(rèn)同。一些學(xué)術(shù)刊物如ArtificialIntelligenceJournal、AIMagazine>AppliedArtificialIntelligence>AdvancedRoboticsJournal、TheJournalonRoboticsandAutonomousSystem、TheInternationalJournalofIntelligentAutomationandSoftCom

18、puting等都出版了機(jī)器人足球?qū)]?。一些有影響的國際學(xué)術(shù)會(huì)議如IJCAI、IROS、Agent、ICMAS、AAAI研討會(huì)、JSAI研討會(huì)等也都安排了這方面的專題討論。一年一度的RoboCup也同時(shí)召開學(xué)術(shù)會(huì)議,推動(dòng)相關(guān)學(xué)科的進(jìn)展。可以預(yù)料,有朝一日機(jī)器人足球會(huì)因?yàn)樗膴蕵沸?、觀賞性,以及高技術(shù)挑戰(zhàn)性,不僅有助于科研與教學(xué)的進(jìn)展,也會(huì)形成相當(dāng)數(shù)量的需求與產(chǎn)業(yè),從而長盛不衰,不斷開創(chuàng)新的局面。RoboCup組織RoboCup聯(lián)盟瑞士RoboCup聯(lián)盟是一個(gè)在瑞士注冊的國際組織,分為科學(xué)委員會(huì)和國家委員會(huì)兩大部分。科學(xué)委員會(huì)包括模擬器開發(fā)小組和RoboCup挑戰(zhàn)委員會(huì),而國家委員會(huì)目前已經(jīng)包括了

19、35個(gè)國家。RoboCup挑戰(zhàn)計(jì)劃RoboCup提供了一些重大的長期挑戰(zhàn),將會(huì)需要幾十年的時(shí)間來完成。然而,由于最后目標(biāo)很明確,我們可以得到幾個(gè)子目標(biāo),這就是中短期的挑戰(zhàn)。RoboCup吸引了這么多研究者的主要原因就是它需要將很大范圍的技術(shù)集成到一個(gè)完整的智能體團(tuán)隊(duì)中,這就有別于一些基于專門任務(wù)的功能模塊。長期的研究問題實(shí)在太廣泛,難以編撰成一系列條目的列表。雖然如此,我們還是可以說,這些挑戰(zhàn)包括了從物理部件的開發(fā)(如高性能電池、馬達(dá))到高智能化的實(shí)時(shí)感知和控制軟件這些極其廣泛的技術(shù)問題。中期技術(shù)挑戰(zhàn)是今后十年的目標(biāo),可以說得更具體一些,也就可以編撰出一個(gè)部分列表。以下就是RoboCup中涉及

20、到的研究領(lǐng)域的部分列表,主要以中期時(shí)間段為目標(biāo):(1)通用的智能體體系結(jié)構(gòu);(2)綜合反應(yīng)式方法和建模/規(guī)劃式方法;(3)實(shí)時(shí)識(shí)別、規(guī)劃和推理;(4)在動(dòng)態(tài)環(huán)境中推理和行動(dòng);(5)傳感器數(shù)據(jù)融合;(6)通用的多智能體系統(tǒng);(7)復(fù)雜任務(wù)中的彳T為學(xué)習(xí);(8)策略獲??;(9)通用的認(rèn)知模型。除了這些技術(shù),提供一個(gè)帶有高質(zhì)量3D圖形能力的網(wǎng)絡(luò)足球服務(wù)器需要在模擬足球運(yùn)動(dòng)員的實(shí)時(shí)動(dòng)畫和基于網(wǎng)絡(luò)的交互式多用戶系統(tǒng)方面有一定的技術(shù)進(jìn)步。這些都是今后幾年基于網(wǎng)絡(luò)的服務(wù)中的關(guān)鍵技術(shù)。RoboCup的挑戰(zhàn)應(yīng)該理解為更大、更長期的挑戰(zhàn),而不是一個(gè)一次性的挑戰(zhàn)。因此,我們希望提供一系列的短期挑戰(zhàn),這將會(huì)很自然的引

21、導(dǎo)中長期挑戰(zhàn)的完成。RoboCup挑戰(zhàn)主要分為三類:(1)合成智能體挑戰(zhàn);(2)物理智能體挑戰(zhàn);(3)基礎(chǔ)組織挑戰(zhàn)。RoboCup合成智能體挑戰(zhàn)處理可以用軟件模擬器開發(fā)的技術(shù);RoboCup物理智能體挑戰(zhàn)的意圖是促進(jìn)使用實(shí)際機(jī)器人的研究,因此需要更長的時(shí)間來完成每一項(xiàng)挑戰(zhàn)。它們將和RoboCup合成智能體挑戰(zhàn)同時(shí)進(jìn)行研究,但需要更長的時(shí)間。提出基礎(chǔ)組織挑戰(zhàn)是為了方便研究而建立一個(gè)關(guān)于RoboCup、人工智能和機(jī)器人學(xué)的總的基礎(chǔ)組織。這些挑戰(zhàn)包括教育計(jì)劃、通用機(jī)器人平臺(tái)和部件標(biāo)準(zhǔn)、自動(dòng)評論員系統(tǒng)和進(jìn)行RoboCup比賽的智能體育場系統(tǒng)。RoboCup合成智能體挑戰(zhàn)對于RoboCup合成智能體挑戰(zhàn)

22、97,我們提供一個(gè)明確的目標(biāo),這不但對RoboCup是重要的,對總的人工智能的研究來說也很重要。這些挑戰(zhàn)將專門用于軟件智能體聯(lián)賽,而不是實(shí)際機(jī)器人聯(lián)賽。對于想設(shè)計(jì)一個(gè)參加RoboCup球隊(duì)的研究者來說,根本問題是設(shè)計(jì)一個(gè)多智能體系統(tǒng),能夠進(jìn)行實(shí)時(shí)的反應(yīng),表現(xiàn)出目標(biāo)制導(dǎo)的理性行為。目標(biāo)與環(huán)境動(dòng)態(tài)的變化并且是實(shí)時(shí)的。由于足球比賽的狀態(tài)空間極大,不可能用手工的方法來編碼所有可能的情形和智能體的行為,因此使智能體能學(xué)習(xí)如何有策略的進(jìn)行比賽變得極為重要。在這個(gè)方面的挑戰(zhàn)包括以下的研究問題:(1)在多智能體合作及對抗環(huán)境中的機(jī)器學(xué)習(xí),(2)多智能體體系結(jié)構(gòu),為了團(tuán)隊(duì)合作而進(jìn)行實(shí)時(shí)的多智能體規(guī)劃和規(guī)劃執(zhí)行,

23、和(3)對手建模。因此,我們提出以下三個(gè)挑戰(zhàn)作為RoboCup合成智能體挑戰(zhàn)97的中心任務(wù):學(xué)習(xí)挑戰(zhàn)、團(tuán)隊(duì)合作挑戰(zhàn)和對手建模挑戰(zhàn)。1. RoboCup學(xué)習(xí)挑戰(zhàn)RoboCup學(xué)習(xí)挑戰(zhàn)的目的是征求理解性學(xué)習(xí)模式,它能用于需要適應(yīng)環(huán)境的多智能體系統(tǒng)的學(xué)習(xí);并能用標(biāo)準(zhǔn)任務(wù)來評價(jià)所提供方法的優(yōu)點(diǎn)和缺點(diǎn)。學(xué)習(xí)是智能系統(tǒng)的重要方面,在RoboCup學(xué)習(xí)挑戰(zhàn)中,任務(wù)是為一組智能體創(chuàng)建一種學(xué)習(xí)和訓(xùn)練的方法。這個(gè)領(lǐng)域的學(xué)習(xí)機(jī)會(huì)可以分為以下幾類:(1)單個(gè)智能體的離線技術(shù)學(xué)習(xí)(2)智能體團(tuán)隊(duì)的離線合作學(xué)習(xí)(3)在線技術(shù)和合作學(xué)習(xí)(4)在線對抗學(xué)習(xí)這個(gè)領(lǐng)域離線和在線學(xué)習(xí)的區(qū)別特別重要,因?yàn)楸荣愔怀掷m(xù)大約20分鐘,所以

24、在線技術(shù),特別是學(xué)習(xí)某場特定比賽中的概念時(shí),必須很快的產(chǎn)生結(jié)果。例如,如果一個(gè)隊(duì)要學(xué)習(xí)針對某個(gè)對手變換它的行為,它必須能在比賽結(jié)束前提高自己的性能,然后再對付下一個(gè)對手。學(xué)習(xí)中的這種區(qū)別可以應(yīng)用到很多具有學(xué)習(xí)能力的多智能體系統(tǒng)中。2. RoboCup團(tuán)隊(duì)合作挑戰(zhàn)RoboCup團(tuán)隊(duì)合作挑戰(zhàn)提出了在動(dòng)態(tài)對抗環(huán)境中多智能體團(tuán)隊(duì)合作中的實(shí)時(shí)規(guī)劃、重規(guī)劃、執(zhí)行等問題。97-99階段這個(gè)挑戰(zhàn)中主要感興趣的問題是在團(tuán)隊(duì)背景下(特別是RoboCup的團(tuán)隊(duì)合作)進(jìn)行實(shí)時(shí)規(guī)劃和規(guī)劃執(zhí)行的體系結(jié)構(gòu)。另外,體系結(jié)卞在非RoboCup應(yīng)用中等通用性也是一個(gè)重要的因素。在類似足球這樣復(fù)雜、動(dòng)態(tài)的多智能體領(lǐng)域中需要極為靈活

25、的協(xié)調(diào)和通訊來克服其中的不確定性。例如,團(tuán)隊(duì)目標(biāo)的動(dòng)態(tài)變化,團(tuán)隊(duì)成員意外的不能完成應(yīng)盡的責(zé)任,或機(jī)會(huì)的意外發(fā)現(xiàn)。不幸的是,實(shí)現(xiàn)多智能體經(jīng)常依賴于預(yù)先規(guī)劃的、領(lǐng)域相關(guān)的協(xié)調(diào)方法,不可能提供這種靈活性。第一,很難預(yù)計(jì)并規(guī)劃所有的協(xié)調(diào)失敗,特別在上升到復(fù)雜情形時(shí),這樣的系統(tǒng)對象足球比賽這種動(dòng)態(tài)的任務(wù)就不夠健壯。第二,得到領(lǐng)域相關(guān)的系統(tǒng)后,可重用性就很差。更進(jìn)一步,動(dòng)態(tài)的規(guī)劃協(xié)調(diào)很難,特別是在具有這么多可能的行動(dòng)和這么大的狀態(tài)空間的領(lǐng)域。事實(shí)上,典型的規(guī)劃器需要極長的時(shí)間去找到一個(gè)簡單可用的規(guī)劃,而由于不可預(yù)料的對手行為造成的領(lǐng)域的動(dòng)態(tài)性使之變得更難。這些團(tuán)隊(duì)合作限制的根本原因是當(dāng)前的智能體體系結(jié)構(gòu),

26、象Soar、RAP、IRMA、BB1等體系結(jié)構(gòu)通過承諾和反應(yīng)式規(guī)劃等機(jī)制便利了單個(gè)智能體的靈活行為,然而,團(tuán)隊(duì)合作不僅僅是這種靈活的個(gè)體行為的簡單的合并,即使是協(xié)調(diào)的合并。事實(shí)上,在當(dāng)前的智能體體系結(jié)構(gòu)中,缺少了團(tuán)隊(duì)合作的理論,能把新的精神狀態(tài)作為團(tuán)隊(duì)合作的基礎(chǔ),如團(tuán)隊(duì)目標(biāo)、團(tuán)隊(duì)規(guī)劃、共有信念和聯(lián)合承諾等。特別是,團(tuán)隊(duì)目標(biāo)、團(tuán)隊(duì)規(guī)劃、共有信念沒有被顯式的表示,而團(tuán)隊(duì)承諾連概念都沒有。這樣,智能體們不能顯式的表示它們的團(tuán)隊(duì)目標(biāo)和規(guī)劃,也不能進(jìn)行推理,更不能在意外事件發(fā)生時(shí)進(jìn)行靈活的通訊或協(xié)調(diào)。例如,當(dāng)一個(gè)智能體個(gè)人意識(shí)到整個(gè)團(tuán)隊(duì)的當(dāng)前規(guī)劃不可行時(shí),它不能自己推理出它的協(xié)調(diào)責(zé)任。比如,為整個(gè)團(tuán)隊(duì)的

27、最高利益考慮,它應(yīng)該通知隊(duì)友。反而,智能體們必須依賴與領(lǐng)域相關(guān)的協(xié)調(diào)規(guī)劃,基于每個(gè)實(shí)例來進(jìn)行預(yù)防。團(tuán)隊(duì)合作挑戰(zhàn)中基本的體系結(jié)構(gòu)問題就將是建立這樣一種體系結(jié)構(gòu),它可以支持團(tuán)隊(duì)行為的規(guī)劃以及更重要的團(tuán)隊(duì)規(guī)劃的執(zhí)行。這種規(guī)劃和規(guī)劃執(zhí)行可以通過一個(gè)兩層的體系結(jié)構(gòu)來完成,但是整個(gè)系統(tǒng)必須能夠?qū)崟r(shí)運(yùn)作。在RoboCupSoccerServer中,傳感數(shù)據(jù)每隔300-500毫秒到達(dá),每100毫秒可以發(fā)送一條動(dòng)作命令。環(huán)境以毫秒量級(jí)改變,所以規(guī)劃、重規(guī)劃和規(guī)劃執(zhí)行必須是實(shí)時(shí)完成的。3. RoboCup對手建模挑戰(zhàn)智能體建模-為其它智能體的目標(biāo)、規(guī)劃、知識(shí)、能力或情感建模和推理-是多智能體交互的關(guān)鍵問題。Rob

28、oCup對手建模挑戰(zhàn)希望進(jìn)行這樣的研究,即為動(dòng)態(tài)多智能體領(lǐng)域內(nèi)的一個(gè)敵對的團(tuán)隊(duì)建模。RoboCup中的建模問題可以分為三個(gè)部分:(1)在線追蹤:通過觀察對手動(dòng)作對單個(gè)對手的目標(biāo)和意圖進(jìn)行實(shí)時(shí)、動(dòng)態(tài)的追蹤。隊(duì)員可以使用這種追蹤來預(yù)測對手的行為并作出適當(dāng)?shù)姆磻?yīng)。這種在線追蹤還可以用于防止受騙。這兒的挑戰(zhàn)是(i)盡管存在不明確性,仍要作出實(shí)時(shí)追蹤;(ii)處理世界模型的動(dòng)態(tài)性;(iii)追蹤整個(gè)團(tuán)隊(duì)而不是單個(gè)隊(duì)員-這需要對團(tuán)隊(duì)合作概念的理解。在線追蹤可以為在線規(guī)劃器或在線學(xué)習(xí)算法提供輸入數(shù)據(jù)。(2)在線策略識(shí)別:球隊(duì)的"教練"智能體可能從邊線觀察一場比賽,理解對方球隊(duì)采用的高層策

29、略。與在線追蹤相比,教練可以進(jìn)行更高層次的抽象分析,而不會(huì)有實(shí)時(shí)處理的壓力,他的分析可以更詳細(xì)。然后,教練智能體可以為他的隊(duì)員提供數(shù)據(jù)來改變隊(duì)形或使用某種策略。(3)離線審閱:"專家"智能體可以在比賽后觀察球隊(duì)的踢法,來識(shí)別對方球隊(duì)的優(yōu)點(diǎn)和弱點(diǎn),還可以提供專家評論。這些專家可以在人類足球比賽的數(shù)據(jù)庫中訓(xùn)練。RoboCup物理智能體挑戰(zhàn)人工智能的最終目標(biāo),可能也是機(jī)器人學(xué)的最終目標(biāo),就是創(chuàng)建一種智能系統(tǒng),能夠在與動(dòng)態(tài)變化的物理世界交互過程中突現(xiàn)出復(fù)雜行為,完成給定任務(wù)。傳統(tǒng)的人工智能研究主要是在尋求知識(shí)獲取和表示中用到的符號(hào)處理,以及用符號(hào)推理的方法,而很少考慮在現(xiàn)實(shí)的動(dòng)態(tài)世

30、界中的應(yīng)用。而在機(jī)器人學(xué)方面,更多的重點(diǎn)被放在設(shè)計(jì)、建造硬件系統(tǒng)及控制方法上。然而,最近包括自治智能體的設(shè)計(jì)準(zhǔn)則、多智能體合作、策略獲取、實(shí)時(shí)推理和規(guī)劃、智能機(jī)器人、傳感器數(shù)據(jù)融合及行為學(xué)習(xí)的話題在兩個(gè)領(lǐng)域都出現(xiàn)了,這些話題揭示了傳統(tǒng)方法很難處理的新的方向。為了處理這些問題,使智能體能在動(dòng)態(tài)環(huán)境中突現(xiàn)出復(fù)雜行為來完成目標(biāo),物理實(shí)體將是一個(gè)很重要的角色,而這一直是傳統(tǒng)人工智能沒有給予足夠關(guān)注的方面。RoboCup物理智能體挑戰(zhàn)提供了一個(gè)很好的測試環(huán)境,可以觀察在RoboCup的框架下實(shí)現(xiàn)智能行為時(shí)物理實(shí)體所扮演的重要角色?!熬哂形锢韺?shí)體”的準(zhǔn)確意思?xì)w納如下(1)傳感和行動(dòng)能力不能分割,必須緊密耦

31、合。(2)為了完成給定任務(wù),傳感器和效應(yīng)器空間必須在資源限制條件(存儲(chǔ)體、處理能力、控制器等)下進(jìn)行抽象。(3)抽象要依賴與智能體的內(nèi)部基礎(chǔ)和經(jīng)驗(yàn)(與環(huán)境的交互)。(4)抽象的結(jié)果是基于智能體對環(huán)境的主觀表示,并由行為的后果來評價(jià)這種表示。(5)在現(xiàn)實(shí)世界中,智能體之間和智能體與環(huán)境之間的交互都是異步的,并行的,也是任意復(fù)雜的。為模擬而采用一種自上而下的抽象層次如全局時(shí)鐘是不公正的。觀察到的其它智能體的信息,智能體之間交互的模式,甚至象滑動(dòng)這樣的物理現(xiàn)象,以及其它一些看起來不太重要的參數(shù)都可能發(fā)生并影響整個(gè)多智能體系統(tǒng)的行為。(6)物理交互的自然復(fù)雜性會(huì)自動(dòng)生成學(xué)習(xí)數(shù)據(jù)的可信的樣例分布,而不是

32、預(yù)先給定模擬的高斯分布,高斯分布并不一定總是能準(zhǔn)確概括系統(tǒng)的特征。RoboCup的研究要點(diǎn)包括適應(yīng)性行為,靈活、多模態(tài)的多智能體合作行為,在復(fù)雜、動(dòng)態(tài)和不確定的現(xiàn)實(shí)世界中最優(yōu)通訊策略。特別的,物理智能體方面主要關(guān)注與硬件軟件和通訊方式的集成。RoboCup物理智能體挑戰(zhàn)歸納如下:(1)感知能力:球員必須實(shí)時(shí)觀察他所不能完全預(yù)測或控制的物體的行為,以便于作出動(dòng)作進(jìn)行處理。這些物體包括球、對手及隊(duì)友,甚至將來的裁判。大范圍的感知能力,區(qū)分其它智能體的能力,在被擋住時(shí)對他們位置和運(yùn)動(dòng)的估計(jì)能力等都是必須具備的。這種感知能力是擴(kuò)展機(jī)器人應(yīng)用的基本技術(shù)。(2)行動(dòng)能力:球員必須具備快速的加速、減速、轉(zhuǎn)向

33、等運(yùn)動(dòng)能力,能進(jìn)行穩(wěn)定的移動(dòng),在踢球和阻截時(shí)有良好的技術(shù)和力量。其中的一些要求是互相矛盾的,如球員踢球的力量越大,技術(shù)就越差。如果我們采用龐大的機(jī)械裝置來滿足這兩點(diǎn),又會(huì)引起質(zhì)量和所需能量的增加,往往又會(huì)影響其它運(yùn)動(dòng)能力。還有,無線的要求和重量的限制嚴(yán)重的影響了機(jī)械裝置的設(shè)計(jì)。因此,不僅僅要考慮擁有良好技術(shù)的運(yùn)動(dòng)能力,而且要考慮整個(gè)系統(tǒng)需求的總體平衡。(3)形勢和行為:任務(wù)領(lǐng)域本身是簡單的,但是由于球、球門和球員之間的相對位置和相對運(yùn)動(dòng)及比賽進(jìn)程的動(dòng)態(tài)變化,會(huì)出現(xiàn)近乎無窮多的狀態(tài),最佳行為也會(huì)隨著形勢的改變而改變。因?yàn)槲覀兊哪繕?biāo)不是一支啞巴球隊(duì),我們還需要比簡單反應(yīng)式行為更復(fù)雜的能力,如對形勢

34、的理解,戰(zhàn)術(shù)的選擇和修改,隊(duì)友之間最少的通訊,從訓(xùn)練中培養(yǎng)的團(tuán)隊(duì)合作行為。這些物體與一些認(rèn)知問題有緊密聯(lián)系,如對時(shí)空世界的記憶的組織,將馬達(dá)動(dòng)作集合分類為物理實(shí)體的技術(shù)等。(4)實(shí)時(shí)處理:由于球和其它隊(duì)員的運(yùn)動(dòng)造成的形勢劇變,沒有時(shí)間來仔細(xì)分析當(dāng)前形勢并對規(guī)劃進(jìn)行深思熟慮。因此,如果旁邊沒有對方球員,為了等待更好的將會(huì),球員應(yīng)該立刻選擇帶球,或者跑到一個(gè)特定的地點(diǎn)以便于和隊(duì)友配合。RoboCup物理智能體挑戰(zhàn)97包括三個(gè)挑戰(zhàn):(1)在沒有障礙物、有靜止障礙物、有移動(dòng)障礙物的情況下分別將球移到指定地點(diǎn)(射門、傳球或帶千);(2)從對手或隊(duì)友處得到球(接球、撲球或截球);(3)在兩個(gè)隊(duì)員之間傳球。前兩個(gè)只考慮單個(gè)智能體的技術(shù)而第三個(gè)與簡單的合作行為有關(guān)。RoboCup基礎(chǔ)組織挑戰(zhàn)提出基礎(chǔ)組織挑戰(zhàn)是為了方便研究而建立一個(gè)關(guān)于RoboCup、人工智能和機(jī)器人學(xué)的總的基礎(chǔ)組織。這些挑戰(zhàn)包括教育計(jì)劃、通用機(jī)器人平臺(tái)和部件標(biāo)準(zhǔn)、自動(dòng)評論員系統(tǒng)和進(jìn)行RoboCup比賽的智能體育場系統(tǒng)。在教育方面,將在一些大學(xué)進(jìn)行以RoboCup為基礎(chǔ)的人工智能或機(jī)器人學(xué)教育,并準(zhǔn)備開展RoboCupJr.以促進(jìn)RoboCup在學(xué)生、家庭、娛樂方面的發(fā)展。在與RoboCup相關(guān)的自然語言處理方面,Robo

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論