RoboCup機(jī)器人足球世界杯

上傳人：d*** IP屬地：天津上傳時(shí)間：2022-05-13 格式：DOCX 頁數(shù)：9 大小：62.14KB 積分：15 舉報(bào) 版權(quán)申訴

已閱讀5頁，還剩4頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、RoboCup:機(jī)器人足球世界杯什么是RoboCup?一個(gè)為促進(jìn)足球機(jī)器人的發(fā)展而創(chuàng)立的國際性組織機(jī)器人足球世界杯（RoboCup）是一個(gè)國際性的研究和教育組織，它通過提供一個(gè)標(biāo)準(zhǔn)問題來促進(jìn)人工智能和智能機(jī)器人的研究。這個(gè)領(lǐng)域可以集成并檢驗(yàn)很大范圍內(nèi)的技術(shù)，同時(shí)也可以作為面向教育的集成性項(xiàng)目。在國際性委員會(huì)的管理下舉行國際性的會(huì)議和比賽為了這個(gè)目的，RoboCup選擇了足球比賽作為基本的領(lǐng)域，并組織了RoboCup：機(jī)器人足球世界杯及學(xué)術(shù)會(huì)議。為了能讓一個(gè)機(jī)器人球隊(duì)真正能夠進(jìn)行足球比賽，必須集成各種各樣的技術(shù)，包括自治智能體的設(shè)計(jì)準(zhǔn)則、多智能體合作、策略獲取、實(shí)時(shí)推理、機(jī)器人學(xué)以及傳感器信息融

2、合等。對一個(gè)由許多快速運(yùn)動(dòng)的機(jī)器人組成的球隊(duì)來說，RoboCup是一項(xiàng)在動(dòng)態(tài)環(huán)境下的任務(wù)。在RoboCup的軟件方面，RoboCup還提供了軟件平臺(tái)以便于研究。在將足球比賽作為標(biāo)準(zhǔn)問題的同時(shí)，還會(huì)有其它各種各樣的努力，比賽只是RoboCup各項(xiàng)活動(dòng)的一部分.當(dāng)前RoboCup的活動(dòng)包括：學(xué)術(shù)會(huì)議機(jī)器人世界杯RoboCup挑戰(zhàn)計(jì)劃RoboCup教育計(jì)劃基礎(chǔ)組織的發(fā)展比賽的組成不過，機(jī)器人世界杯比賽還是我們各項(xiàng)活動(dòng)的中心，在那兒研究者們可以在一起評估研究進(jìn)展?，F(xiàn)在，RoboCup舉行以下比賽：模擬組比賽小型機(jī)器人比賽整隊(duì)小型機(jī)器人比賽，每隊(duì)包括11個(gè)機(jī)器人中型機(jī)器人比賽Sony有腿機(jī)器人比賽（由S

3、ony贊助）人形機(jī)器人比賽（從2002年開始，2002年前可能會(huì)有演示）遙控機(jī)器人比賽（即將公布）RoboCup評論員系統(tǒng)演示為什么要有RoboCup?推動(dòng)科學(xué)進(jìn)步我們的意圖是通過提供引人矚目但又非常困難的挑戰(zhàn)，將RoboCup作為促進(jìn)人工智能和機(jī)器人學(xué)研究的工具。促進(jìn)研究的有效途徑是制定一個(gè)長期目標(biāo)，而不拘泥與某一特定應(yīng)用。當(dāng)這個(gè)目標(biāo)完成時(shí)，將產(chǎn)生巨大的社會(huì)影響，這就可以稱之為重大挑戰(zhàn)計(jì)劃。建造一個(gè)會(huì)踢足球的機(jī)器人本身并不能產(chǎn)生巨大的社會(huì)和經(jīng)濟(jì)影響，但是這種成功的確會(huì)被認(rèn)為是這個(gè)領(lǐng)域的重大成果。我們把這種計(jì)劃稱為劃時(shí)代的計(jì)劃。RoboCup既是一個(gè)標(biāo)準(zhǔn)問題，也是一個(gè)劃時(shí)代的計(jì)劃。夢想我們提出

4、的RoboCup的最終目標(biāo)是：至IJ21世紀(jì)中葉，一支完全自治的人形機(jī)器人足球隊(duì)?wèi)?yīng)該能在遵循國際足聯(lián)正式規(guī)則的比賽中，戰(zhàn)勝最近的人類世界杯冠軍隊(duì)。我們提出的這個(gè)目標(biāo)是人工智能與機(jī)器人學(xué)今后50年的重大挑戰(zhàn)。從現(xiàn)在的技術(shù)水平看來，這個(gè)目標(biāo)可能是過于雄心勃勃了。但是，我們相信，重要的是提出這樣的長期目標(biāo)并為之而奮斗。從萊特兄弟的第一架飛機(jī)到阿波羅計(jì)劃將人類送上月球并安全返回地球只花了50年。同樣，從數(shù)字計(jì)算機(jī)的發(fā)明到深藍(lán)擊敗人類國際象棋世界冠軍也只花了50年。我們已經(jīng)意識(shí)到，建立人形機(jī)器人足球隊(duì)需要大致相當(dāng)?shù)臅r(shí)間及很大范圍內(nèi)研究人員的極大努力，這個(gè)目標(biāo)是不能在短期內(nèi)完成的。劃時(shí)代的計(jì)劃目標(biāo)送一個(gè)宇

5、航員登陸月球并安全返回地球開發(fā)出能戰(zhàn)勝人類國際象棋世界冠軍的計(jì)算機(jī)MHHIM開發(fā)出能象人類那樣踢球的足球機(jī)器人系統(tǒng)工程，航空學(xué)，各種電子學(xué)等搜索技術(shù)，并行算法和并行計(jì)算機(jī)等實(shí)時(shí)系統(tǒng)，分布式協(xié)作智能體等應(yīng)用遍布各處各種軟件系統(tǒng)、大規(guī)模并行計(jì)算機(jī)下一代人工智能，現(xiàn)實(shí)世界中的機(jī)器人和人工智能系統(tǒng)一個(gè)成功的劃時(shí)代計(jì)劃必須完成一個(gè)非常引人注目而且能引起廣泛關(guān)注的目標(biāo)。最成功的例子是阿波羅太空計(jì)劃。在阿波羅計(jì)劃中，美國制定了“送一個(gè)宇航員登陸月球并安全返回地球”的目標(biāo)。目標(biāo)的完成本身就是一個(gè)人類的歷史性事件。雖然送什么人登上月球帶來的直接經(jīng)濟(jì)收益很小（公正的講，阿波羅計(jì)劃是計(jì)劃獲得“國家聲望”，并展示對前

6、蘇聯(lián)的技術(shù)優(yōu)勢。即便如此，幾個(gè)宇航員在月球登陸也沒有帶來直接的軍事優(yōu)勢）。為達(dá)到這個(gè)目標(biāo)而發(fā)展的技術(shù)是如此重要，以至于成了美國工業(yè)強(qiáng)大的技術(shù)和人員基礎(chǔ)。劃時(shí)代計(jì)劃的重要問題是設(shè)定一個(gè)足夠高的目標(biāo)，才能取得一系列為完成這個(gè)任務(wù)而必需的技術(shù)突破，同時(shí)這個(gè)目標(biāo)也要有廣泛的吸引力和興奮點(diǎn)。另外，這些完成目標(biāo)所需的技術(shù)必須是可以成為下一代工業(yè)基礎(chǔ)的技術(shù)。在阿波羅計(jì)劃中，實(shí)際的目標(biāo)遠(yuǎn)不止送個(gè)人上月球。（阿波羅計(jì)劃：“這是一個(gè)人的一小步，人類的一大步”。舉國上下的努力使宇航員NeilArmstrong在登上月球表面，實(shí)現(xiàn)這個(gè)與人類歷史一樣久遠(yuǎn)的夢想時(shí)能說出這句話。但是阿波羅計(jì)劃的目標(biāo)已經(jīng)超過了讓美國人登陸月

7、球并安全返回地球：創(chuàng)立了滿足太空中其它國家利益的技術(shù)；為美國在太空留下英名；開始對月球的科學(xué)探索；提高人類在月球環(huán)境中的能力。）在RoboCup中，最終目標(biāo)是“開發(fā)一支能戰(zhàn)勝人類世界冠軍隊(duì)的機(jī)器人足球隊(duì)”。（更適當(dāng)?shù)哪繕?biāo)是“開發(fā)一支能象人一樣踢球的機(jī)器人足球隊(duì)”）不用說，最終目標(biāo)的實(shí)現(xiàn)需要幾十年的努力，如果不是幾個(gè)世紀(jì)的話。根據(jù)現(xiàn)在的技術(shù)水平，是不可能在短期內(nèi)完成這個(gè)目標(biāo)的。然而，這個(gè)目標(biāo)可以很容易的創(chuàng)立一系列方向?qū)︻^的子目標(biāo)。對任何雄心勃勃或過于雄心勃勃的計(jì)劃來說，這種途徑是較普遍的。在美國太空計(jì)劃中，完成載人軌道飛行的Mercury計(jì)劃和Gemini計(jì)劃就是阿波羅計(jì)劃的前導(dǎo)。RoboCup

8、第一個(gè)要完成的子目標(biāo)是“創(chuàng)建真實(shí)的和軟件的機(jī)器人足球隊(duì)，在修改過的規(guī)則下很好的踢球”。即使完成這個(gè)目標(biāo)都會(huì)毫無疑問的產(chǎn)生能影響很大范圍工業(yè)的技術(shù)。人工智能和機(jī)器人學(xué)中新的標(biāo)準(zhǔn)問題RoboCup的另一方面是這樣一種觀點(diǎn)：RoboCup是一個(gè)標(biāo)準(zhǔn)問題，可以用來評價(jià)各種不同的理論、算法和體系結(jié)構(gòu)。計(jì)算機(jī)國際象棋是一個(gè)典型的標(biāo)準(zhǔn)問題。各種搜索算法可以在這個(gè)領(lǐng)域中評價(jià)和發(fā)展。隨著最近深藍(lán)的成功，按照正式規(guī)則擊敗人類的頂尖高手GarryKasparov,計(jì)算機(jī)國際象棋的挑戰(zhàn)已經(jīng)到了殘局。計(jì)算機(jī)國際象棋作為一個(gè)標(biāo)準(zhǔn)問題的成功，主要原因之一是清楚的定義了進(jìn)展的評價(jià)。研究進(jìn)展可以用系統(tǒng)的棋力來評價(jià)。一個(gè)挑戰(zhàn)必須

9、能夠鼓勵(lì)一系列為下一代工業(yè)而發(fā)展的技術(shù)。我們認(rèn)為RoboCup可以做到這一點(diǎn)。以下是計(jì)算機(jī)國際象棋與RoboCup的領(lǐng)域特征的不同：環(huán)境狀態(tài).獲取信息傳感器信息控制.國際象棋靜態(tài)回合制完全符號(hào)式集中RoboCup動(dòng)態(tài)實(shí)時(shí)不完全非符號(hào)式分布人工智能和機(jī)器人學(xué)的教育RoboCup教育計(jì)劃著眼于使用RoboCup來建立各種教育計(jì)劃，例如可以開設(shè)以下課程：RoboCup中的人工智能（本科生或研究生課程），RoboCup中的機(jī)器人學(xué)導(dǎo)論（本科生課程）,RoboCup中的人工智能程序設(shè)計(jì)（本科生課程）,多智能體系統(tǒng)（研究生課程）,及其它已經(jīng)開設(shè)的以RoboCup為基礎(chǔ)的課程：有：人工智能程序設(shè)計(jì)，Arti

10、ficialIntelligenceProgramming（withRoboCup）bySilviaCoradeschiandJacekMalec,LinkoepingUniversity,Sweden自治系統(tǒng)，AutonomousSystemsbyAndreasBirk;VrijeUniversiteitBrussel,Brussels,BelgiumRoboCup的歷史1997年5月，舊M的1997年7月4日，Sojournero與此同時(shí)，“OnSeeingRobots”Dynamo機(jī)器人足球項(xiàng)在人工智能與機(jī)器人學(xué)的歷史上，1997年將作為一個(gè)轉(zhuǎn)折點(diǎn)被記住。在深藍(lán)擊敗了國際象棋世界冠軍，人

11、工智能界四十年的挑戰(zhàn)終于取得了成功。在NASA的“探路者”在火星登陸，在火星的表面釋放了第一個(gè)自治機(jī)器人系統(tǒng)RoboCup也朝開發(fā)能夠戰(zhàn)勝人類世界杯冠軍隊(duì)的機(jī)器人足球隊(duì)走出了第加拿大不列顛哥倫比亞大學(xué)的AlanMackworth教授在1992年發(fā)表了題為的文章，其中首次提出了機(jī)器人足球的思想。他的研究小組還發(fā)表了一系列目的論文。1992年10月，一些日本研究人員在東京組織了一個(gè)關(guān)于人工智能重大挑戰(zhàn)的研討會(huì)，討論可能的重大挑戰(zhàn)性問題。這個(gè)研討會(huì)對采用足球比賽來促進(jìn)科技發(fā)展進(jìn)行了認(rèn)真的討論。他們進(jìn)行了一系列的調(diào)查，包括技術(shù)上的可行性，社會(huì)影響力評估以及財(cái)政上的可行性。另外，他們還草擬了規(guī)則和足球機(jī)

12、器人和模擬系統(tǒng)的開發(fā)原型。通過這些研究，他們認(rèn)為這個(gè)方案是可行的，也是大家都希望能開展的。1993年6月，包括淺田玲（MinoruAsada）、YasuoKuniyoshi和北野宏明（HiroakiKitano）在內(nèi)的一些研究者決定創(chuàng)辦一項(xiàng)機(jī)器人比賽，暫時(shí)命名為RoboCupJ聯(lián)賽（J聯(lián)賽是剛創(chuàng)辦的日本足球職業(yè)聯(lián)賽的名字）。然而在一個(gè)月之內(nèi)，他們就接到了絕大部分是日本以外的研究者的反應(yīng)，要求比賽擴(kuò)展成一個(gè)國際性的項(xiàng)目。于是，他們就將這個(gè)項(xiàng)目改名為機(jī)器人世界杯，簡稱為RoboCup。在這次討論的同時(shí)，一些研究人員已經(jīng)將足球比賽作為他們的研究領(lǐng)域。例如，電子技術(shù)實(shí)驗(yàn)室（ETL,日本政府的一個(gè)研究中

13、心）的松原仁（ItsukiNoda）正在用足球進(jìn)行多智能體（multi-agent）的研究，并已經(jīng)開始開發(fā)一個(gè)專用的足球比賽模擬器。這個(gè)模擬器后來成了RoboCup的正式足球服務(wù)器。大坂大學(xué)的淺田玲（MinoruAsada）的實(shí)驗(yàn)室、卡內(nèi)基-梅隆大學(xué)的ManuelaVeloso教授和她的學(xué)生PeterStone也已經(jīng)開始研究足球機(jī)器人。沒有這些先行者的參與，RoboCup就不可能產(chǎn)生。1993年9月，RoboCup第一次發(fā)表公告，并草擬了明確的規(guī)則。于是，在很多會(huì)議和研討會(huì)上進(jìn)行了關(guān)于組織和技術(shù)問題的討論，包括AAAI-94（美國人工智能聯(lián)合會(huì)會(huì)議），JSAI（日本人工智能學(xué)會(huì)）座談會(huì)以及其他

14、機(jī)器人界的會(huì)議。同時(shí)，松原仁（Noda）在ETL的小組宣布了SoccerServerv0（LISP版本），為進(jìn)行多智能體系統(tǒng)研究而開發(fā)的第一個(gè)足球領(lǐng)域的開放系統(tǒng)模擬器，后來又通過Web發(fā)布了1.0版本的SoccerServer（C+版本）。這個(gè)模擬器的第一次公開演示是在IJCAI-95。1995年8月，在加拿大蒙特利爾召開的國際人工智能會(huì)議（IJCAI-95）上發(fā)表了公告，將在名古屋與IJCAI-97聯(lián)合舉辦首屆機(jī)器人世界杯足球賽及會(huì)議。同時(shí)，為了發(fā)現(xiàn)與組織大型RoboCup比賽有關(guān)的潛在問題，決定先舉辦Pre-RoboCup-96。作出這個(gè)決定是為了留出兩年的準(zhǔn)備和開發(fā)時(shí)間，這樣研究小組就可

15、以開始開發(fā)機(jī)器人和模擬的球隊(duì)，同時(shí)也能有時(shí)間籌集研究經(jīng)費(fèi)。1996年11月4日到8日，在大坂的國際智能機(jī)器人與系統(tǒng)會(huì)議（IROS-96）上舉行了Pre-RoboCup-96。有8支球隊(duì)參加了模擬組聯(lián)賽，并展示了參加中型聯(lián)賽的真正的機(jī)器人。雖然規(guī)模不大，但這是第一次將足球賽用于促進(jìn)研究與教育的比賽。1997年8月25日，與第15屆國際人工智能會(huì)議（IJCAI-97）聯(lián)合舉辦的RoboCup97在日本名古屋拉開帷幕，這是第一次正式的RoboCup比賽和會(huì)議，獲得了巨大的成功。來自美國、歐洲I、澳大利亞、日本等40多支球隊(duì)（機(jī)器人組和模擬組）參加，5000多名觀眾觀看了比賽。1998年7月4日至8日

16、，正當(dāng)世界杯比賽漸入佳境之時(shí)RoboCup-98在巴黎舉行，來自世界各地的80多支球隊(duì)參加了比賽，這也成為歷史上最大的移動(dòng)機(jī)器人活動(dòng)。另外，1998年還舉辦了一系列的其它活動(dòng)，如新加坡的RoboCup-98環(huán)太平洋系列，加拿大維多利亞的RoboCup-98IROS系列，德國的VISION（歐洲最大的計(jì)算機(jī)視覺國際會(huì)議）RoboCup-98,RoboCup-98日本公開賽，AutonomousAgent98上的RoboCup模擬組演示，AAAI-98移動(dòng)機(jī)器人比賽和展示。RoboCup-99將于1999年7月30日至8月6日在瑞典斯德哥爾摩和第16屆國際人工智能會(huì)議（IJCAI-99）聯(lián)合舉辦，

17、以后還將舉辦RoboCup-2000（澳大利亞墨爾本）、RoboCup-2001（暫定美國西雅圖）、RoboCup-2002（日本）等比賽。機(jī)器人足球正以一種高技術(shù)對抗的形式贏得學(xué)術(shù)界的認(rèn)同。一些學(xué)術(shù)刊物如ArtificialIntelligenceJournal、AIMagazine>AppliedArtificialIntelligence>AdvancedRoboticsJournal、TheJournalonRoboticsandAutonomousSystem、TheInternationalJournalofIntelligentAutomationandSoftCom

18、puting等都出版了機(jī)器人足球?qū)］?。一些有影響的國際學(xué)術(shù)會(huì)議如IJCAI、IROS、Agent、ICMAS、AAAI研討會(huì)、JSAI研討會(huì)等也都安排了這方面的專題討論。一年一度的RoboCup也同時(shí)召開學(xué)術(shù)會(huì)議，推動(dòng)相關(guān)學(xué)科的進(jìn)展。可以預(yù)料，有朝一日機(jī)器人足球會(huì)因?yàn)樗膴蕵沸?、觀賞性，以及高技術(shù)挑戰(zhàn)性，不僅有助于科研與教學(xué)的進(jìn)展，也會(huì)形成相當(dāng)數(shù)量的需求與產(chǎn)業(yè)，從而長盛不衰，不斷開創(chuàng)新的局面。RoboCup組織RoboCup聯(lián)盟瑞士RoboCup聯(lián)盟是一個(gè)在瑞士注冊的國際組織，分為科學(xué)委員會(huì)和國家委員會(huì)兩大部分。科學(xué)委員會(huì)包括模擬器開發(fā)小組和RoboCup挑戰(zhàn)委員會(huì)，而國家委員會(huì)目前已經(jīng)包括了

19、35個(gè)國家。RoboCup挑戰(zhàn)計(jì)劃RoboCup提供了一些重大的長期挑戰(zhàn)，將會(huì)需要幾十年的時(shí)間來完成。然而，由于最后目標(biāo)很明確，我們可以得到幾個(gè)子目標(biāo)，這就是中短期的挑戰(zhàn)。RoboCup吸引了這么多研究者的主要原因就是它需要將很大范圍的技術(shù)集成到一個(gè)完整的智能體團(tuán)隊(duì)中，這就有別于一些基于專門任務(wù)的功能模塊。長期的研究問題實(shí)在太廣泛，難以編撰成一系列條目的列表。雖然如此，我們還是可以說，這些挑戰(zhàn)包括了從物理部件的開發(fā)（如高性能電池、馬達(dá)）到高智能化的實(shí)時(shí)感知和控制軟件這些極其廣泛的技術(shù)問題。中期技術(shù)挑戰(zhàn)是今后十年的目標(biāo)，可以說得更具體一些，也就可以編撰出一個(gè)部分列表。以下就是RoboCup中涉及

20、到的研究領(lǐng)域的部分列表，主要以中期時(shí)間段為目標(biāo)：（1）通用的智能體體系結(jié)構(gòu)；（2）綜合反應(yīng)式方法和建模/規(guī)劃式方法；（3）實(shí)時(shí)識(shí)別、規(guī)劃和推理；（4）在動(dòng)態(tài)環(huán)境中推理和行動(dòng)；（5）傳感器數(shù)據(jù)融合；（6）通用的多智能體系統(tǒng)；（7）復(fù)雜任務(wù)中的彳T為學(xué)習(xí)；（8）策略獲??；（9）通用的認(rèn)知模型。除了這些技術(shù)，提供一個(gè)帶有高質(zhì)量3D圖形能力的網(wǎng)絡(luò)足球服務(wù)器需要在模擬足球運(yùn)動(dòng)員的實(shí)時(shí)動(dòng)畫和基于網(wǎng)絡(luò)的交互式多用戶系統(tǒng)方面有一定的技術(shù)進(jìn)步。這些都是今后幾年基于網(wǎng)絡(luò)的服務(wù)中的關(guān)鍵技術(shù)。RoboCup的挑戰(zhàn)應(yīng)該理解為更大、更長期的挑戰(zhàn)，而不是一個(gè)一次性的挑戰(zhàn)。因此，我們希望提供一系列的短期挑戰(zhàn)，這將會(huì)很自然的引

21、導(dǎo)中長期挑戰(zhàn)的完成。RoboCup挑戰(zhàn)主要分為三類：（1）合成智能體挑戰(zhàn)；（2）物理智能體挑戰(zhàn)；（3）基礎(chǔ)組織挑戰(zhàn)。RoboCup合成智能體挑戰(zhàn)處理可以用軟件模擬器開發(fā)的技術(shù)；RoboCup物理智能體挑戰(zhàn)的意圖是促進(jìn)使用實(shí)際機(jī)器人的研究，因此需要更長的時(shí)間來完成每一項(xiàng)挑戰(zhàn)。它們將和RoboCup合成智能體挑戰(zhàn)同時(shí)進(jìn)行研究，但需要更長的時(shí)間。提出基礎(chǔ)組織挑戰(zhàn)是為了方便研究而建立一個(gè)關(guān)于RoboCup、人工智能和機(jī)器人學(xué)的總的基礎(chǔ)組織。這些挑戰(zhàn)包括教育計(jì)劃、通用機(jī)器人平臺(tái)和部件標(biāo)準(zhǔn)、自動(dòng)評論員系統(tǒng)和進(jìn)行RoboCup比賽的智能體育場系統(tǒng)。RoboCup合成智能體挑戰(zhàn)對于RoboCup合成智能體挑戰(zhàn)

22、97,我們提供一個(gè)明確的目標(biāo)，這不但對RoboCup是重要的，對總的人工智能的研究來說也很重要。這些挑戰(zhàn)將專門用于軟件智能體聯(lián)賽，而不是實(shí)際機(jī)器人聯(lián)賽。對于想設(shè)計(jì)一個(gè)參加RoboCup球隊(duì)的研究者來說，根本問題是設(shè)計(jì)一個(gè)多智能體系統(tǒng)，能夠進(jìn)行實(shí)時(shí)的反應(yīng)，表現(xiàn)出目標(biāo)制導(dǎo)的理性行為。目標(biāo)與環(huán)境動(dòng)態(tài)的變化并且是實(shí)時(shí)的。由于足球比賽的狀態(tài)空間極大，不可能用手工的方法來編碼所有可能的情形和智能體的行為，因此使智能體能學(xué)習(xí)如何有策略的進(jìn)行比賽變得極為重要。在這個(gè)方面的挑戰(zhàn)包括以下的研究問題：(1)在多智能體合作及對抗環(huán)境中的機(jī)器學(xué)習(xí)，(2)多智能體體系結(jié)構(gòu)，為了團(tuán)隊(duì)合作而進(jìn)行實(shí)時(shí)的多智能體規(guī)劃和規(guī)劃執(zhí)行，

23、和(3)對手建模。因此，我們提出以下三個(gè)挑戰(zhàn)作為RoboCup合成智能體挑戰(zhàn)97的中心任務(wù)：學(xué)習(xí)挑戰(zhàn)、團(tuán)隊(duì)合作挑戰(zhàn)和對手建模挑戰(zhàn)。1. RoboCup學(xué)習(xí)挑戰(zhàn)RoboCup學(xué)習(xí)挑戰(zhàn)的目的是征求理解性學(xué)習(xí)模式，它能用于需要適應(yīng)環(huán)境的多智能體系統(tǒng)的學(xué)習(xí)；并能用標(biāo)準(zhǔn)任務(wù)來評價(jià)所提供方法的優(yōu)點(diǎn)和缺點(diǎn)。學(xué)習(xí)是智能系統(tǒng)的重要方面，在RoboCup學(xué)習(xí)挑戰(zhàn)中，任務(wù)是為一組智能體創(chuàng)建一種學(xué)習(xí)和訓(xùn)練的方法。這個(gè)領(lǐng)域的學(xué)習(xí)機(jī)會(huì)可以分為以下幾類：(1)單個(gè)智能體的離線技術(shù)學(xué)習(xí)(2)智能體團(tuán)隊(duì)的離線合作學(xué)習(xí)(3)在線技術(shù)和合作學(xué)習(xí)(4)在線對抗學(xué)習(xí)這個(gè)領(lǐng)域離線和在線學(xué)習(xí)的區(qū)別特別重要，因?yàn)楸荣愔怀掷m(xù)大約20分鐘，所以

24、在線技術(shù)，特別是學(xué)習(xí)某場特定比賽中的概念時(shí)，必須很快的產(chǎn)生結(jié)果。例如，如果一個(gè)隊(duì)要學(xué)習(xí)針對某個(gè)對手變換它的行為，它必須能在比賽結(jié)束前提高自己的性能，然后再對付下一個(gè)對手。學(xué)習(xí)中的這種區(qū)別可以應(yīng)用到很多具有學(xué)習(xí)能力的多智能體系統(tǒng)中。2. RoboCup團(tuán)隊(duì)合作挑戰(zhàn)RoboCup團(tuán)隊(duì)合作挑戰(zhàn)提出了在動(dòng)態(tài)對抗環(huán)境中多智能體團(tuán)隊(duì)合作中的實(shí)時(shí)規(guī)劃、重規(guī)劃、執(zhí)行等問題。97-99階段這個(gè)挑戰(zhàn)中主要感興趣的問題是在團(tuán)隊(duì)背景下(特別是RoboCup的團(tuán)隊(duì)合作)進(jìn)行實(shí)時(shí)規(guī)劃和規(guī)劃執(zhí)行的體系結(jié)構(gòu)。另外，體系結(jié)卞在非RoboCup應(yīng)用中等通用性也是一個(gè)重要的因素。在類似足球這樣復(fù)雜、動(dòng)態(tài)的多智能體領(lǐng)域中需要極為靈活

25、的協(xié)調(diào)和通訊來克服其中的不確定性。例如，團(tuán)隊(duì)目標(biāo)的動(dòng)態(tài)變化，團(tuán)隊(duì)成員意外的不能完成應(yīng)盡的責(zé)任，或機(jī)會(huì)的意外發(fā)現(xiàn)。不幸的是，實(shí)現(xiàn)多智能體經(jīng)常依賴于預(yù)先規(guī)劃的、領(lǐng)域相關(guān)的協(xié)調(diào)方法，不可能提供這種靈活性。第一，很難預(yù)計(jì)并規(guī)劃所有的協(xié)調(diào)失敗，特別在上升到復(fù)雜情形時(shí)，這樣的系統(tǒng)對象足球比賽這種動(dòng)態(tài)的任務(wù)就不夠健壯。第二，得到領(lǐng)域相關(guān)的系統(tǒng)后，可重用性就很差。更進(jìn)一步，動(dòng)態(tài)的規(guī)劃協(xié)調(diào)很難，特別是在具有這么多可能的行動(dòng)和這么大的狀態(tài)空間的領(lǐng)域。事實(shí)上，典型的規(guī)劃器需要極長的時(shí)間去找到一個(gè)簡單可用的規(guī)劃，而由于不可預(yù)料的對手行為造成的領(lǐng)域的動(dòng)態(tài)性使之變得更難。這些團(tuán)隊(duì)合作限制的根本原因是當(dāng)前的智能體體系結(jié)構(gòu)，

26、象Soar、RAP、IRMA、BB1等體系結(jié)構(gòu)通過承諾和反應(yīng)式規(guī)劃等機(jī)制便利了單個(gè)智能體的靈活行為，然而，團(tuán)隊(duì)合作不僅僅是這種靈活的個(gè)體行為的簡單的合并，即使是協(xié)調(diào)的合并。事實(shí)上，在當(dāng)前的智能體體系結(jié)構(gòu)中，缺少了團(tuán)隊(duì)合作的理論，能把新的精神狀態(tài)作為團(tuán)隊(duì)合作的基礎(chǔ)，如團(tuán)隊(duì)目標(biāo)、團(tuán)隊(duì)規(guī)劃、共有信念和聯(lián)合承諾等。特別是，團(tuán)隊(duì)目標(biāo)、團(tuán)隊(duì)規(guī)劃、共有信念沒有被顯式的表示，而團(tuán)隊(duì)承諾連概念都沒有。這樣，智能體們不能顯式的表示它們的團(tuán)隊(duì)目標(biāo)和規(guī)劃，也不能進(jìn)行推理，更不能在意外事件發(fā)生時(shí)進(jìn)行靈活的通訊或協(xié)調(diào)。例如，當(dāng)一個(gè)智能體個(gè)人意識(shí)到整個(gè)團(tuán)隊(duì)的當(dāng)前規(guī)劃不可行時(shí)，它不能自己推理出它的協(xié)調(diào)責(zé)任。比如，為整個(gè)團(tuán)隊(duì)的

27、最高利益考慮，它應(yīng)該通知隊(duì)友。反而，智能體們必須依賴與領(lǐng)域相關(guān)的協(xié)調(diào)規(guī)劃，基于每個(gè)實(shí)例來進(jìn)行預(yù)防。團(tuán)隊(duì)合作挑戰(zhàn)中基本的體系結(jié)構(gòu)問題就將是建立這樣一種體系結(jié)構(gòu)，它可以支持團(tuán)隊(duì)行為的規(guī)劃以及更重要的團(tuán)隊(duì)規(guī)劃的執(zhí)行。這種規(guī)劃和規(guī)劃執(zhí)行可以通過一個(gè)兩層的體系結(jié)構(gòu)來完成，但是整個(gè)系統(tǒng)必須能夠?qū)崟r(shí)運(yùn)作。在RoboCupSoccerServer中，傳感數(shù)據(jù)每隔300-500毫秒到達(dá)，每100毫秒可以發(fā)送一條動(dòng)作命令。環(huán)境以毫秒量級(jí)改變，所以規(guī)劃、重規(guī)劃和規(guī)劃執(zhí)行必須是實(shí)時(shí)完成的。3. RoboCup對手建模挑戰(zhàn)智能體建模-為其它智能體的目標(biāo)、規(guī)劃、知識(shí)、能力或情感建模和推理-是多智能體交互的關(guān)鍵問題。Rob

28、oCup對手建模挑戰(zhàn)希望進(jìn)行這樣的研究，即為動(dòng)態(tài)多智能體領(lǐng)域內(nèi)的一個(gè)敵對的團(tuán)隊(duì)建模。RoboCup中的建模問題可以分為三個(gè)部分：(1)在線追蹤：通過觀察對手動(dòng)作對單個(gè)對手的目標(biāo)和意圖進(jìn)行實(shí)時(shí)、動(dòng)態(tài)的追蹤。隊(duì)員可以使用這種追蹤來預(yù)測對手的行為并作出適當(dāng)?shù)姆磻?yīng)。這種在線追蹤還可以用于防止受騙。這兒的挑戰(zhàn)是(i)盡管存在不明確性，仍要作出實(shí)時(shí)追蹤；(ii)處理世界模型的動(dòng)態(tài)性；(iii)追蹤整個(gè)團(tuán)隊(duì)而不是單個(gè)隊(duì)員-這需要對團(tuán)隊(duì)合作概念的理解。在線追蹤可以為在線規(guī)劃器或在線學(xué)習(xí)算法提供輸入數(shù)據(jù)。(2)在線策略識(shí)別：球隊(duì)的"教練"智能體可能從邊線觀察一場比賽，理解對方球隊(duì)采用的高層策

29、略。與在線追蹤相比，教練可以進(jìn)行更高層次的抽象分析，而不會(huì)有實(shí)時(shí)處理的壓力，他的分析可以更詳細(xì)。然后，教練智能體可以為他的隊(duì)員提供數(shù)據(jù)來改變隊(duì)形或使用某種策略。(3)離線審閱："專家"智能體可以在比賽后觀察球隊(duì)的踢法，來識(shí)別對方球隊(duì)的優(yōu)點(diǎn)和弱點(diǎn)，還可以提供專家評論。這些專家可以在人類足球比賽的數(shù)據(jù)庫中訓(xùn)練。RoboCup物理智能體挑戰(zhàn)人工智能的最終目標(biāo)，可能也是機(jī)器人學(xué)的最終目標(biāo)，就是創(chuàng)建一種智能系統(tǒng)，能夠在與動(dòng)態(tài)變化的物理世界交互過程中突現(xiàn)出復(fù)雜行為，完成給定任務(wù)。傳統(tǒng)的人工智能研究主要是在尋求知識(shí)獲取和表示中用到的符號(hào)處理，以及用符號(hào)推理的方法，而很少考慮在現(xiàn)實(shí)的動(dòng)態(tài)世

30、界中的應(yīng)用。而在機(jī)器人學(xué)方面，更多的重點(diǎn)被放在設(shè)計(jì)、建造硬件系統(tǒng)及控制方法上。然而，最近包括自治智能體的設(shè)計(jì)準(zhǔn)則、多智能體合作、策略獲取、實(shí)時(shí)推理和規(guī)劃、智能機(jī)器人、傳感器數(shù)據(jù)融合及行為學(xué)習(xí)的話題在兩個(gè)領(lǐng)域都出現(xiàn)了，這些話題揭示了傳統(tǒng)方法很難處理的新的方向。為了處理這些問題，使智能體能在動(dòng)態(tài)環(huán)境中突現(xiàn)出復(fù)雜行為來完成目標(biāo)，物理實(shí)體將是一個(gè)很重要的角色，而這一直是傳統(tǒng)人工智能沒有給予足夠關(guān)注的方面。RoboCup物理智能體挑戰(zhàn)提供了一個(gè)很好的測試環(huán)境，可以觀察在RoboCup的框架下實(shí)現(xiàn)智能行為時(shí)物理實(shí)體所扮演的重要角色?！熬哂形锢韺?shí)體”的準(zhǔn)確意思?xì)w納如下(1)傳感和行動(dòng)能力不能分割，必須緊密耦

31、合。(2)為了完成給定任務(wù)，傳感器和效應(yīng)器空間必須在資源限制條件(存儲(chǔ)體、處理能力、控制器等)下進(jìn)行抽象。(3)抽象要依賴與智能體的內(nèi)部基礎(chǔ)和經(jīng)驗(yàn)(與環(huán)境的交互)。(4)抽象的結(jié)果是基于智能體對環(huán)境的主觀表示，并由行為的后果來評價(jià)這種表示。(5)在現(xiàn)實(shí)世界中，智能體之間和智能體與環(huán)境之間的交互都是異步的，并行的，也是任意復(fù)雜的。為模擬而采用一種自上而下的抽象層次如全局時(shí)鐘是不公正的。觀察到的其它智能體的信息，智能體之間交互的模式，甚至象滑動(dòng)這樣的物理現(xiàn)象，以及其它一些看起來不太重要的參數(shù)都可能發(fā)生并影響整個(gè)多智能體系統(tǒng)的行為。(6)物理交互的自然復(fù)雜性會(huì)自動(dòng)生成學(xué)習(xí)數(shù)據(jù)的可信的樣例分布，而不是

32、預(yù)先給定模擬的高斯分布，高斯分布并不一定總是能準(zhǔn)確概括系統(tǒng)的特征。RoboCup的研究要點(diǎn)包括適應(yīng)性行為，靈活、多模態(tài)的多智能體合作行為，在復(fù)雜、動(dòng)態(tài)和不確定的現(xiàn)實(shí)世界中最優(yōu)通訊策略。特別的，物理智能體方面主要關(guān)注與硬件軟件和通訊方式的集成。RoboCup物理智能體挑戰(zhàn)歸納如下：(1)感知能力：球員必須實(shí)時(shí)觀察他所不能完全預(yù)測或控制的物體的行為，以便于作出動(dòng)作進(jìn)行處理。這些物體包括球、對手及隊(duì)友，甚至將來的裁判。大范圍的感知能力，區(qū)分其它智能體的能力，在被擋住時(shí)對他們位置和運(yùn)動(dòng)的估計(jì)能力等都是必須具備的。這種感知能力是擴(kuò)展機(jī)器人應(yīng)用的基本技術(shù)。(2)行動(dòng)能力：球員必須具備快速的加速、減速、轉(zhuǎn)向

33、等運(yùn)動(dòng)能力，能進(jìn)行穩(wěn)定的移動(dòng)，在踢球和阻截時(shí)有良好的技術(shù)和力量。其中的一些要求是互相矛盾的，如球員踢球的力量越大，技術(shù)就越差。如果我們采用龐大的機(jī)械裝置來滿足這兩點(diǎn)，又會(huì)引起質(zhì)量和所需能量的增加，往往又會(huì)影響其它運(yùn)動(dòng)能力。還有，無線的要求和重量的限制嚴(yán)重的影響了機(jī)械裝置的設(shè)計(jì)。因此，不僅僅要考慮擁有良好技術(shù)的運(yùn)動(dòng)能力，而且要考慮整個(gè)系統(tǒng)需求的總體平衡。(3)形勢和行為：任務(wù)領(lǐng)域本身是簡單的，但是由于球、球門和球員之間的相對位置和相對運(yùn)動(dòng)及比賽進(jìn)程的動(dòng)態(tài)變化，會(huì)出現(xiàn)近乎無窮多的狀態(tài)，最佳行為也會(huì)隨著形勢的改變而改變。因?yàn)槲覀兊哪繕?biāo)不是一支啞巴球隊(duì)，我們還需要比簡單反應(yīng)式行為更復(fù)雜的能力，如對形勢

34、的理解，戰(zhàn)術(shù)的選擇和修改，隊(duì)友之間最少的通訊，從訓(xùn)練中培養(yǎng)的團(tuán)隊(duì)合作行為。這些物體與一些認(rèn)知問題有緊密聯(lián)系，如對時(shí)空世界的記憶的組織，將馬達(dá)動(dòng)作集合分類為物理實(shí)體的技術(shù)等。(4)實(shí)時(shí)處理：由于球和其它隊(duì)員的運(yùn)動(dòng)造成的形勢劇變，沒有時(shí)間來仔細(xì)分析當(dāng)前形勢并對規(guī)劃進(jìn)行深思熟慮。因此，如果旁邊沒有對方球員，為了等待更好的將會(huì)，球員應(yīng)該立刻選擇帶球，或者跑到一個(gè)特定的地點(diǎn)以便于和隊(duì)友配合。RoboCup物理智能體挑戰(zhàn)97包括三個(gè)挑戰(zhàn)：(1)在沒有障礙物、有靜止障礙物、有移動(dòng)障礙物的情況下分別將球移到指定地點(diǎn)(射門、傳球或帶千)；(2)從對手或隊(duì)友處得到球(接球、撲球或截球)；(3)在兩個(gè)隊(duì)員之間傳球。前兩個(gè)只考慮單個(gè)智能體的技術(shù)而第三個(gè)與簡單的合作行為有關(guān)。RoboCup基礎(chǔ)組織挑戰(zhàn)提出基礎(chǔ)組織挑戰(zhàn)是為了方便研究而建立一個(gè)關(guān)于RoboCup、人工智能和機(jī)器人學(xué)的總的基礎(chǔ)組織。這些挑戰(zhàn)包括教育計(jì)劃、通用機(jī)器人平臺(tái)和部件標(biāo)準(zhǔn)、自動(dòng)評論員系統(tǒng)和進(jìn)行RoboCup比賽的智能體育場系統(tǒng)。在教育方面，將在一些大學(xué)進(jìn)行以RoboCup為基礎(chǔ)的人工智能或機(jī)器人學(xué)教育，并準(zhǔn)備開展RoboCupJr.以促進(jìn)RoboCup在學(xué)生、家庭、娛樂方面的發(fā)展。在與RoboCup相關(guān)的自然語言處理方面，Robo

人人文庫> 全部分類> 應(yīng)用文書 > 作業(yè)報(bào)告

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

RoboCup機(jī)器人足球世界杯

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔