AI09人工智能-多智能體_第1頁(yè)
AI09人工智能-多智能體_第2頁(yè)
AI09人工智能-多智能體_第3頁(yè)
AI09人工智能-多智能體_第4頁(yè)
AI09人工智能-多智能體_第5頁(yè)
已閱讀5頁(yè),還剩85頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

人工智能導(dǎo)論

Introduction

toArtificialIntelligence

第九章史忠植

中國(guó)科學(xué)院計(jì)算技術(shù)研究所/2023/10/20史忠植人工智能導(dǎo)論:多智能體系統(tǒng)1多智能體系統(tǒng)Multi-AgentSystem2023/10/20史忠植人工智能導(dǎo)論:多智能體系統(tǒng)2內(nèi)容提要9.1概述

9.2智能體結(jié)構(gòu) 9.3智能體通信語(yǔ)言ACL 9.4協(xié)調(diào)和協(xié)作 9.5移動(dòng)智能體 9.6 小結(jié) 2023/10/20史忠植人工智能導(dǎo)論:多智能體系統(tǒng)3概述分布式人工智能主要研究在邏輯上或物理上分散的智能系統(tǒng)如何并行的、相互協(xié)作地實(shí)現(xiàn)問(wèn)題求解。兩種解決問(wèn)題的方法:自頂向下:分布式問(wèn)題求解自底向上:基于智能體的方法2023/10/20史忠植人工智能導(dǎo)論:多智能體系統(tǒng)4分布智能系統(tǒng)的特色系統(tǒng)中的數(shù)據(jù)、知識(shí),以及控制不但在邏輯上,而且在物理上是分布的,既沒(méi)有全局控制,也沒(méi)有全局的數(shù)據(jù)存儲(chǔ)。各個(gè)求解機(jī)構(gòu)由計(jì)算機(jī)網(wǎng)絡(luò)互連,在問(wèn)題求解過(guò)程中,通信代價(jià)要比求解問(wèn)題的代價(jià)低得多。系統(tǒng)中諸機(jī)構(gòu)能夠相互協(xié)作,來(lái)求解單個(gè)機(jī)構(gòu)難以解決,甚至不能解決的任務(wù)。2023/10/20史忠植人工智能導(dǎo)論:多智能體系統(tǒng)5多智能體系統(tǒng)

20世紀(jì)90年代,多智能體系統(tǒng)(multi-agentsystems多智能體系統(tǒng))的研究成為分布式人工智能研究的熱點(diǎn)。多智能體系統(tǒng)主要研究自主的智能智能體之間智能行為的協(xié)調(diào),為了一個(gè)共同的全局目標(biāo),協(xié)作進(jìn)行問(wèn)題求解?;谥悄苤悄荏w的概念,人們提出了一種新的人工智能定義:“人工智能是計(jì)算機(jī)科學(xué)的一個(gè)分支,它的目標(biāo)是構(gòu)造能表現(xiàn)出一定智能行為的智能體”。所以,智能智能體的研究應(yīng)該是人工智能的核心問(wèn)題。斯坦福大學(xué)計(jì)算機(jī)科學(xué)系的Hayes-Roth在IJCAI'95的特邀報(bào)告中談到:“智能的計(jì)算機(jī)智能體既是人工智能最初的目標(biāo),也是人工智能最終的目標(biāo)?!?023/10/20史忠植人工智能導(dǎo)論:多智能體系統(tǒng)6多智能體系統(tǒng)

關(guān)于智能體的研究不僅受到了人工智能研究人員的關(guān)注,也吸引了數(shù)據(jù)通信、人機(jī)界面設(shè)計(jì)、機(jī)器人、并行工程等各領(lǐng)域的研究人員的興趣。有人認(rèn)為:“基于智能體的計(jì)算(Agent-BasedComputing,簡(jiǎn)稱ABC),將成為軟件開(kāi)發(fā)的下一個(gè)重要的突破?!?023/10/20史忠植人工智能導(dǎo)論:多智能體系統(tǒng)7

分布式問(wèn)題求解特點(diǎn):數(shù)據(jù)、知識(shí)、控制均分布在系統(tǒng)的各節(jié)點(diǎn)上,

既無(wú)全局控制,也無(wú)全局?jǐn)?shù)據(jù)和知識(shí)存儲(chǔ)。兩種協(xié)作方式:任務(wù)分擔(dān)結(jié)果共享2023/10/20史忠植人工智能導(dǎo)論:多智能體系統(tǒng)8任務(wù)分擔(dān)

Smith和Davis提出了任務(wù)分擔(dān)方式。在任務(wù)分擔(dān)系統(tǒng)中,結(jié)點(diǎn)之間通過(guò)分擔(dān)執(zhí)行整個(gè)任務(wù)的子任務(wù)而相互協(xié)作,系統(tǒng)中的控制以目標(biāo)為指導(dǎo),各結(jié)點(diǎn)的處理目標(biāo)是為了求解整個(gè)任務(wù)的一部分。任務(wù)分擔(dān)的問(wèn)題求解方式適合于求解具有層次結(jié)構(gòu)的任務(wù),如工廠聯(lián)合體生產(chǎn)規(guī)劃、數(shù)字邏輯電路設(shè)計(jì)、醫(yī)療診斷。2023/10/20史忠植人工智能導(dǎo)論:多智能體系統(tǒng)9結(jié)果共享

Lesser和Corkill提出了結(jié)果共享方式。在結(jié)果共享方式的系統(tǒng)中,各結(jié)點(diǎn)通過(guò)共享部分結(jié)果相互協(xié)作,系統(tǒng)中的控制以數(shù)據(jù)為指導(dǎo),各結(jié)點(diǎn)在任何時(shí)刻進(jìn)行的求解取決于當(dāng)時(shí)它本身?yè)碛谢驈钠渌Y(jié)點(diǎn)收到的數(shù)據(jù)和知識(shí)。結(jié)果共享的求解方式適合于求解與任務(wù)有關(guān)的各子任務(wù)的結(jié)果相互影響,并且部分結(jié)果需要綜合才能得出問(wèn)題解的領(lǐng)域。如分布式運(yùn)輸調(diào)度系統(tǒng)、分布式車(chē)輛監(jiān)控實(shí)驗(yàn)系統(tǒng)DVMT2023/10/20史忠植人工智能導(dǎo)論:多智能體系統(tǒng)10分布式問(wèn)題求解系統(tǒng)分類(lèi)根據(jù)組織結(jié)構(gòu),分布式問(wèn)題求解系統(tǒng)可以分為三類(lèi):層次結(jié)構(gòu)類(lèi)平行結(jié)構(gòu)類(lèi)混合結(jié)構(gòu)類(lèi)2023/10/20史忠植人工智能導(dǎo)論:多智能體系統(tǒng)11分布式問(wèn)題求解過(guò)程分布式問(wèn)題求解過(guò)程可以分為四步:任務(wù)分解任務(wù)分配子問(wèn)題求解結(jié)果綜合2023/10/20史忠植人工智能導(dǎo)論:多智能體系統(tǒng)12任務(wù)分解合同網(wǎng)絡(luò)動(dòng)態(tài)層次控制自然分解,固定分配部分全局規(guī)劃2023/10/20史忠植人工智能導(dǎo)論:多智能體系統(tǒng)13分布式問(wèn)題求解中協(xié)作的分類(lèi)

按節(jié)點(diǎn)間協(xié)作量的多少,協(xié)作分為三類(lèi):全協(xié)作系統(tǒng)無(wú)協(xié)作系統(tǒng)半?yún)f(xié)作系統(tǒng)常用的通信方式有:共享全局存儲(chǔ)器信息傳遞黑板模型2023/10/20史忠植人工智能導(dǎo)論:多智能體系統(tǒng)14

智能體多智能體(agent智能體,主體)系統(tǒng)主要研究在邏輯上或物理上分離的多個(gè)智能體協(xié)調(diào)其智能行為,即知識(shí)、目標(biāo)、意圖及規(guī)劃等,實(shí)現(xiàn)問(wèn)題求解。可以看作是一種由底向上設(shè)計(jì)的系統(tǒng)。Theagent

functionmapsfrompercepthistoriestoactions:[f:P*

A]2023/10/20史忠植人工智能導(dǎo)論:多智能體系統(tǒng)15智能體的定義在計(jì)算機(jī)和人工智能領(lǐng)域中,智能體可以看作是一個(gè)實(shí)體,它通過(guò)傳感器感知環(huán)境,通過(guò)效應(yīng)器作用于環(huán)境。Anagentisanythingthatcanbeviewedasperceivingitsenvironmentthroughsensorsandactinguponthatenvironmentthroughactuators2023/10/20史忠植人工智能導(dǎo)論:多智能體系統(tǒng)16智能體的特性智能體弱概念:自治性交互性協(xié)作性可通信性長(zhǎng)壽性2023/10/20史忠植人工智能導(dǎo)論:多智能體系統(tǒng)17智能體的特性智能體強(qiáng)概念:知識(shí)、信念、意圖、承諾等心智狀態(tài)其它屬性:移動(dòng)性推理能力規(guī)劃能力學(xué)習(xí)和適應(yīng)能力誠(chéng)實(shí)、善意、理性2023/10/20史忠植人工智能導(dǎo)論:多智能體系統(tǒng)18

智能體理論智能智能體的理論模型研究主要從邏輯、行為、心理、社會(huì)等角度出發(fā),對(duì)智能智能體的本質(zhì)進(jìn)行描述,為智能智能體系統(tǒng)創(chuàng)建奠定基礎(chǔ)。2023/10/20史忠植人工智能導(dǎo)論:多智能體系統(tǒng)19理性智能體(BDI智能體)Belief——信念,智能體對(duì)環(huán)境的基本看法。Desire——愿望,智能體想要實(shí)現(xiàn)的狀態(tài),即目標(biāo)。Intention——意圖,目標(biāo)的子集。2023/10/20史忠植人工智能導(dǎo)論:多智能體系統(tǒng)20

BDI智能體模型BDI智能體模型可以通過(guò)下列要素描述:一組關(guān)于世界的信念;智能體當(dāng)前打算達(dá)到的一組目標(biāo);一個(gè)規(guī)劃庫(kù),描述怎樣達(dá)到目標(biāo)和怎樣改變信念;一個(gè)意圖結(jié)構(gòu),描述智能體當(dāng)前怎樣達(dá)到它的目標(biāo)和改變信念。2023/10/20史忠植人工智能導(dǎo)論:多智能體系統(tǒng)21BDI解釋器BDI-Interpreterinitialize-state();do options:=option-generator(event-queue,B,G,I); selected-options:=deliberate(options,B,G,I); update-intentions(selected-options,I); execute(I); get-new-external-events(); drop-successful-attitudes(B,G,I); drop-impossible-attitudes(B,G,I);untilquit2023/10/20史忠植人工智能導(dǎo)論:多智能體系統(tǒng)22內(nèi)容提要9.1概述 9.2智能體結(jié)構(gòu) 9.3智能體通信語(yǔ)言ACL 9.4協(xié)調(diào)和協(xié)作 9.5移動(dòng)智能體 9.6 小結(jié) 2023/10/20史忠植人工智能導(dǎo)論:多智能體系統(tǒng)23智能體結(jié)構(gòu)智能體結(jié)構(gòu)需要解決的問(wèn)題包括:智能體由那些模塊組成,模塊之間如何交互信息,智能體感知到的信息如何影響它的行為和內(nèi)部狀態(tài),如何將這些模塊用軟件或硬件的方式組合起來(lái)形成一個(gè)有機(jī)的整體。2023/10/20史忠植人工智能導(dǎo)論:多智能體系統(tǒng)24智能體基本結(jié)構(gòu)環(huán)境智能體感知作用黑箱軟件智能體2023/10/20史忠植人工智能導(dǎo)論:多智能體系統(tǒng)25智能智能體的工作過(guò)程環(huán)境交互信息融合信息處理作用交互感知作用2023/10/20史忠植人工智能導(dǎo)論:多智能體系統(tǒng)26智能體骨架程序functionSkeleton-Agent(percept)returnactionstatic:memory/*智能體的世界記憶*/memory←Update-Memory(memory,percept)action←Choose-Best-Action(memory)memory←Update-Memory(memory,action)returnaction2023/10/20史忠植人工智能導(dǎo)論:多智能體系統(tǒng)27智能體的分類(lèi)

根據(jù)人類(lèi)思維的層次模型,可以將智能體分成四類(lèi):反應(yīng)智能體形象思維智能體抽象思維智能體復(fù)合式智能體形象思維智能體和抽象思維智能體也可以合稱為認(rèn)知智能體2023/10/20史忠植人工智能導(dǎo)論:多智能體系統(tǒng)28

反應(yīng)智能體環(huán)境當(dāng)前世界傳感器動(dòng)作效應(yīng)器條件-動(dòng)作規(guī)則智能體2023/10/20史忠植人工智能導(dǎo)論:多智能體系統(tǒng)29反應(yīng)智能體程序functionReactive-Agent(percept)returnsactionstatic:rules,/*一組條件-動(dòng)作規(guī)則*/state←Interpret-Input(percept)rule←Rule-Match(state,rules)action←Rule-Action[rule]returnaction2023/10/20史忠植人工智能導(dǎo)論:多智能體系統(tǒng)30認(rèn)知智能體環(huán)境信息融合傳感器動(dòng)作效應(yīng)器智能體規(guī)劃知識(shí)庫(kù)目標(biāo)內(nèi)部狀態(tài)2023/10/20史忠植人工智能導(dǎo)論:多智能體系統(tǒng)31認(rèn)知智能體程序functionCognitive-Agent(percept)returnsaction static:environment,/*描述當(dāng)前世界環(huán)境*/

kb,/*知識(shí)庫(kù)*/environment←Update-World-Model(environment,percept)state←Update-Mental-State(environment,state)action←Decision-Making(state,kb)environment←Update-World-Model(environment,action)returnaction2023/10/20史忠植人工智能導(dǎo)論:多智能體系統(tǒng)32BDI結(jié)構(gòu)知識(shí)信念規(guī)劃意圖目標(biāo)愿望2023/10/20史忠植人工智能導(dǎo)論:多智能體系統(tǒng)33復(fù)合式智能體決策生成規(guī)劃反射建模通信感知行動(dòng)其他智能智能體智能智能體外部世界預(yù)測(cè)協(xié)作與協(xié)商動(dòng)作請(qǐng)求或應(yīng)答信息一般情況緊急情況和簡(jiǎn)單情況2023/10/20史忠植人工智能導(dǎo)論:多智能體系統(tǒng)34規(guī)劃模塊世界的模型(包括其他智能體的模型)經(jīng)驗(yàn)庫(kù)目標(biāo)集合局部規(guī)劃器決策生成重新規(guī)劃規(guī)劃規(guī)劃目標(biāo)2023/10/20史忠植人工智能導(dǎo)論:多智能體系統(tǒng)35建模模塊世界的模型(包括其他智能體的模型)模型庫(kù)模型生成和維護(hù)預(yù)測(cè)規(guī)劃決策生成感知通信建模2023/10/20史忠植人工智能導(dǎo)論:多智能體系統(tǒng)36通信模塊詞法庫(kù)語(yǔ)法庫(kù)詞義庫(kù)物理通信語(yǔ)言生成語(yǔ)言理解通信2023/10/20史忠植人工智能導(dǎo)論:多智能體系統(tǒng)37智能體通信策略對(duì)話消息黑板協(xié)議通信協(xié)作協(xié)議2023/10/20史忠植人工智能導(dǎo)論:多智能體系統(tǒng)38智能體通信中的主要問(wèn)題語(yǔ)義:全部有關(guān)的智能體必須知道通信語(yǔ)言的語(yǔ)義,消息的語(yǔ)義內(nèi)容知識(shí)是分布式問(wèn)題求解的核心部分。言語(yǔ)行為:通信語(yǔ)言也是一種動(dòng)作,說(shuō)話是為了使世界的狀態(tài)發(fā)生改變。交互協(xié)議:智能體之間消息交換的典型模式通信語(yǔ)言:傳遞消息的標(biāo)準(zhǔn)語(yǔ)法。FoundationforIntelligentPhysicalAgents2023/10/20史忠植人工智能導(dǎo)論:多智能體系統(tǒng)39智能體間的消息傳遞消息發(fā)送/傳輸服務(wù)器轉(zhuǎn)換到傳輸格式從傳輸格式轉(zhuǎn)換消息M言語(yǔ)行為意圖I目標(biāo)GAgenti消息MAgenti2023/10/20史忠植人工智能導(dǎo)論:多智能體系統(tǒng)40內(nèi)容提要9.1概述 9.2智能體結(jié)構(gòu) 9.3智能體通信語(yǔ)言ACL

9.4協(xié)調(diào)和協(xié)作 9.5移動(dòng)智能體 9.6 小結(jié) 2023/10/20史忠植人工智能導(dǎo)論:多智能體系統(tǒng)41言語(yǔ)行為有關(guān)言語(yǔ)行為理論的研究主要集中在如何劃分不同類(lèi)型的言語(yǔ)行為。在智能體通信語(yǔ)言的研究中,言語(yǔ)行為理論主要用來(lái)考慮智能體之間可以交互的信息類(lèi)型。2023/10/20史忠植人工智能導(dǎo)論:多智能體系統(tǒng)42通信語(yǔ)言KQML:由美國(guó)ARPA的知識(shí)共享計(jì)劃中提出,規(guī)定了消息格式和消息傳送系統(tǒng),為多智能體系統(tǒng)通信和協(xié)商提供了一種通用框架。ACL:由FIPA制定的一種規(guī)范。與KQML非常相似2023/10/20史忠植人工智能導(dǎo)論:多智能體系統(tǒng)43KQML一個(gè)例子:(ask-all :sender A :receiver B :in-reply-to ido :reply-with idl :language Prolog :ontology foo :content “bar(X,Y)”)2023/10/20史忠植人工智能導(dǎo)論:多智能體系統(tǒng)44FIPAACL(inform :senderagent1 :receiverhpl-auction-server :content (price(bidgood02)150) :in-reply-toround-4 :reply-withbid04 :languages1 :ontologyhpl-auction)消息結(jié)構(gòu)開(kāi)始通信動(dòng)作類(lèi)型消息參數(shù)消息內(nèi)容表達(dá)式參數(shù)表達(dá)式2023/10/20史忠植人工智能導(dǎo)論:多智能體系統(tǒng)45FIPA通信動(dòng)作庫(kù)AcceptProposal 接受提議Agree 同意Cancel 取消CallforProposal 要求提議Confirm 確認(rèn)Disconfirm 確認(rèn)為否定Failure 失敗Inform 通知InformIf 通知是否InformRef 通知有關(guān)對(duì)象NotUnderstood 不理解2023/10/20史忠植人工智能導(dǎo)論:多智能體系統(tǒng)46Propagate 傳播Propose 提議Proxy 代理QueryIf 詢問(wèn)是否QueryRef 詢問(wèn)有關(guān)對(duì)象Refuse 拒絕(請(qǐng)求)RejectProposal 拒絕提議Request 請(qǐng)求RequestWhen 請(qǐng)求某個(gè)條件下執(zhí)行RequestWhenever 請(qǐng)求一旦某個(gè)條件成立就執(zhí)行Subscribe 預(yù)定詳細(xì)說(shuō)明:/repository/cas.htmlFIPA通信動(dòng)作庫(kù)2023/10/20史忠植人工智能導(dǎo)論:多智能體系統(tǒng)47XML可擴(kuò)展標(biāo)記語(yǔ)言

XML是用于標(biāo)記電子文件使其具有結(jié)構(gòu)性的標(biāo)記語(yǔ)言。XML文件本身只是將文件資料結(jié)構(gòu)化。

例如:下面的ACL消息

(inform :senderjklabrou :receivergrosof :content(CPUlibretto50pentium) :ontologylaptop :languagekif)2023/10/20史忠植人工智能導(dǎo)論:多智能體系統(tǒng)48<?xmlversion="pre-1.0"?><!DOCTYPEfipa_aclSYSTEM"fipa_acl.dtd"><message> <messagetype> inform </messagetype> <messageparameter> <senderlink="/?jklabrou"> jklabrou </sender> </messageparameter> <messageparameter> <receiverlink="/people/g/grosof/"> grosof </receiver> </messageparameter>轉(zhuǎn)換為XML格式2023/10/20史忠植人工智能導(dǎo)論:多智能體系統(tǒng)49 <messageparameter> <ontologylink="/?jklabrou/ontology/laptop.html"> laptop </ontology> </messageparameter> <messageparameter> <content> (CPUlibretto50pentium) </content> </messageparameter> <messageparameter> <languagelink="/kif.html"> kif </language> </messageparameter></message>轉(zhuǎn)換為XML格式2023/10/20史忠植人工智能導(dǎo)論:多智能體系統(tǒng)50內(nèi)容提要9.1概述 9.2智能體結(jié)構(gòu)

9.3智能體通信語(yǔ)言ACL 9.4協(xié)調(diào)和協(xié)作 9.5移動(dòng)智能體 9.6 小結(jié) 2023/10/20史忠植人工智能導(dǎo)論:多智能體系統(tǒng)51智能體的協(xié)調(diào)與協(xié)作

協(xié)調(diào)(coordination)與協(xié)作(cooperation)是多智能體研究的核心問(wèn)題之一。協(xié)調(diào)是指一組智能智能體完成一些集體活動(dòng)時(shí)相互作用的性質(zhì)。協(xié)作是非對(duì)抗的智能體之間保持行為協(xié)調(diào)的一個(gè)特例。2023/10/20史忠植人工智能導(dǎo)論:多智能體系統(tǒng)52協(xié)調(diào)

多智能體系統(tǒng)中的協(xié)調(diào)是指多個(gè)智能體為了以一致、和諧的方式工作而進(jìn)行交互的過(guò)程。進(jìn)行協(xié)調(diào)是希望避免智能體之間的死鎖或活鎖。死鎖指多個(gè)智能體無(wú)法進(jìn)行各自的下一步動(dòng)作;活鎖指多個(gè)智能體不斷工作卻無(wú)任何進(jìn)展。2023/10/20史忠植人工智能導(dǎo)論:多智能體系統(tǒng)53協(xié)作

目前針對(duì)智能體協(xié)作的研究大體上可分為兩類(lèi):將其它領(lǐng)域研究多實(shí)體行為的方法和技術(shù)用于智能體協(xié)作的研究。如對(duì)策論和力學(xué)研究。從智能體的目標(biāo)、意圖、規(guī)劃等心智態(tài)度出發(fā)來(lái)研究多智能體間的協(xié)作。2023/10/20史忠植人工智能導(dǎo)論:多智能體系統(tǒng)54協(xié)作協(xié)作的動(dòng)機(jī):某個(gè)智能體相信通過(guò)協(xié)作能帶來(lái)好處(如提高效率,完成以往單獨(dú)無(wú)法完成的任務(wù))多個(gè)智能體在交流的過(guò)程中,發(fā)現(xiàn)它們能夠通過(guò)協(xié)作來(lái)實(shí)現(xiàn)更大的目標(biāo)。2023/10/20史忠植人工智能導(dǎo)論:多智能體系統(tǒng)55協(xié)作過(guò)程產(chǎn)生需求、確定目標(biāo)協(xié)作規(guī)劃、求解協(xié)作結(jié)構(gòu)尋求協(xié)作伙伴選擇協(xié)作方案實(shí)現(xiàn)目標(biāo)評(píng)估結(jié)果2023/10/20史忠植人工智能導(dǎo)論:多智能體系統(tǒng)56協(xié)作模式從社會(huì)心理學(xué)的角度看,多智能體之間的協(xié)作情形大致可分為:

·協(xié)作型:同時(shí)將自己的利益放在第二位。

·自私型:同時(shí)將協(xié)作放在第二位。

·完全自私型:不考慮任何協(xié)作。

·完全協(xié)作型:不考慮自身利益。

·協(xié)作與自私相混合型。2023/10/20史忠植人工智能導(dǎo)論:多智能體系統(tǒng)57協(xié)作策略·計(jì)算生態(tài)學(xué)

·對(duì)策論

·規(guī)劃2023/10/20史忠植人工智能導(dǎo)論:多智能體系統(tǒng)58計(jì)算生態(tài)學(xué)

80年代末,在計(jì)算機(jī)中出現(xiàn)了一個(gè)嶄新的學(xué)科---計(jì)算生態(tài)學(xué)(theecologofcomputation)。計(jì)算生態(tài)學(xué)是研究關(guān)于開(kāi)放系統(tǒng)中訣定計(jì)算結(jié)點(diǎn)的行為與資源使用的交互過(guò)程的學(xué)科。它摒棄了封閉、靜止地處理問(wèn)題的傳統(tǒng)算法,將世界看作是開(kāi)放的、進(jìn)化的、并發(fā)的,通過(guò)多種協(xié)作處理問(wèn)題的"生態(tài)系統(tǒng)"(ecosystem)加以研究。它的進(jìn)展與開(kāi)放信息系統(tǒng)的研究息息相關(guān)。2023/10/20史忠植人工智能導(dǎo)論:多智能體系統(tǒng)59計(jì)算生態(tài)學(xué)

計(jì)算生態(tài)學(xué)將計(jì)算系統(tǒng)看作是一個(gè)生態(tài)系統(tǒng),它引進(jìn)了許多生物的機(jī)制,如變異(mutation)即物種的變化。這些變化導(dǎo)致生命基因的改變,從而形成物種的多樣性,增強(qiáng)了適應(yīng)環(huán)境的能力。這類(lèi)變異策略成為人工智能系統(tǒng)提高其自身能力的一種方法。Lenat與Brown成功地將變異機(jī)制引入他們的AM與Eurisko系統(tǒng)中,通過(guò)小型Lisp程序的語(yǔ)法變異發(fā)現(xiàn)數(shù)學(xué)概念。他們認(rèn)為未來(lái)成功的系統(tǒng)應(yīng)該是一系列進(jìn)化的、自組織的符號(hào)知識(shí)結(jié)構(gòu)的``社會(huì)"系統(tǒng)。2023/10/20史忠植人工智能導(dǎo)論:多智能體系統(tǒng)60生物生態(tài)模型

這是最著名的生態(tài)系統(tǒng),具有典型的進(jìn)化特征和層次性。這種特性反映在“食物鏈”中。對(duì)于復(fù)雜的生物生態(tài)系統(tǒng)而言,各物種組成了緊密相連的網(wǎng)絡(luò)-食物網(wǎng)。這個(gè)系統(tǒng)的主要角色是捕食者與被食者。生命依賴于生命,共同進(jìn)化,由小的生態(tài)環(huán)境組成大的生態(tài)系統(tǒng)。2023/10/20史忠植人工智能導(dǎo)論:多智能體系統(tǒng)61物種進(jìn)化模型

物種進(jìn)化的“復(fù)制者”是基因。從門(mén)德?tīng)柕闹参镞z傳研究到現(xiàn)代遺傳學(xué)的成果,都說(shuō)明了在物種進(jìn)化過(guò)程中,基因的組合與變異起著關(guān)鍵作用。在一個(gè)物種的某一群體中基因的集合稱為基因池。生物組織是基因的載體。如果環(huán)境變化,選擇的機(jī)制就會(huì)改變。這種變化必然引起基因池的變化。特定種群的基因變化稱為基因流。一個(gè)物種總是不斷地經(jīng)歷隔絕、基因流動(dòng)、變化的循環(huán)。開(kāi)始時(shí),一組地理上隔絕的群體自己孤立地發(fā)展,基因在內(nèi)部快速地流動(dòng)。隨著開(kāi)放,通過(guò)交流和競(jìng)爭(zhēng),優(yōu)勝劣汰。2023/10/20史忠植人工智能導(dǎo)論:多智能體系統(tǒng)62經(jīng)濟(jì)模型

經(jīng)濟(jì)系統(tǒng)在某種意義上類(lèi)似于生物生態(tài)系統(tǒng)。在商品市場(chǎng)和理想市場(chǎng)中,進(jìn)化決定于經(jīng)濟(jì)實(shí)體的決策。選擇機(jī)制是市場(chǎng)獎(jiǎng)勵(lì)機(jī)制。進(jìn)化是快速的,企業(yè)與消費(fèi)者之間、企業(yè)之間主要是一種互相依賴的合作關(guān)系。決策者為了追求長(zhǎng)遠(yuǎn)利益,可以采取各種有效的方法,甚至可以暫時(shí)做賠本買(mǎi)賣(mài)。2023/10/20史忠植人工智能導(dǎo)論:多智能體系統(tǒng)63協(xié)商模型Zlotkin的面向領(lǐng)域的協(xié)商理論Zlotkin的協(xié)商理論假設(shè):

各智能體追求本身效用最大。

知識(shí)完備。

無(wú)歷史信息。

目標(biāo)集固定。

協(xié)商在兩智能體之間同時(shí)進(jìn)行。

智能體操作集相同。

世界僅當(dāng)智能體操作之后發(fā)生變化。2023/10/20史忠植人工智能導(dǎo)論:多智能體系統(tǒng)64面向領(lǐng)域的協(xié)商理論在協(xié)商過(guò)程中,若存在一個(gè)雙方滿意的分配,可以得到一個(gè)聯(lián)合規(guī)劃,使協(xié)商終止的條件是:(1)達(dá)成協(xié)議:如果Utility(P(i,t))

Utility(P(i,t-1)),這一協(xié)商過(guò)程將在有限步內(nèi)結(jié)束。(2)沖突:如果Utility(P(i,t))=Utility(P(i,t-1)),則無(wú)法達(dá)成協(xié)議。2023/10/20史忠植人工智能導(dǎo)論:多智能體系統(tǒng)65最佳平衡傳統(tǒng)的協(xié)商是基于Nash平衡的,它的缺點(diǎn)是Nash平衡產(chǎn)生多個(gè)平衡點(diǎn),對(duì)結(jié)果約束較少。Kraus使用Rubinstein的“最佳”平衡(PerfectEquilibrium,簡(jiǎn)稱P.E.)理論,建立了一種基于P.E.的協(xié)商方法,需要在協(xié)商的任一階段都產(chǎn)生平衡,即在協(xié)商的任一階段,假設(shè)

智能體

A使用P.E.策略,則

智能體

B除了自己的

P.E.,策略外沒(méi)有更好的策略可遵循。故若有唯一的

P.E.,并假定智能體要使用該策略,則它在協(xié)商的每一階段都只用這一策略。可證明,存在唯一的P.E.,在第一階段后就可以終止協(xié)商。Kraus還將對(duì)時(shí)間的偏好引入這一理論中。結(jié)果表明,時(shí)間偏好可以提高協(xié)商效率,并僅對(duì)某一智能體有利。這一理論對(duì)于智能體的構(gòu)造和智能體之間的協(xié)作很有用處,如果為智能體提供唯一的P.E.策略,并通知其他智能體,則其他智能體的最佳選擇也是P.E.策略。該理論的缺陷是:缺乏動(dòng)態(tài)性特色,應(yīng)用面窄,因?yàn)楸M管存在唯一的P.E,但如何求出仍未得到解決。2023/10/20史忠植人工智能導(dǎo)論:多智能體系統(tǒng)66集中式協(xié)商方法

Ephrati使用了一種集中式的協(xié)商方法,用一個(gè)“masteragent”或組投票機(jī)制以達(dá)成協(xié)議。在這種方法中,一組智能體的協(xié)作與組規(guī)劃進(jìn)程相關(guān)。Ephrati使用一種動(dòng)態(tài)的、迭代的搜索過(guò)程,通過(guò)一組約束,使智能體遞增式地構(gòu)成一個(gè)最大“社會(huì)效用”規(guī)劃。在每一步,各智能體對(duì)于組規(guī)劃的下一個(gè)聯(lián)合行動(dòng)投票。使用這一技術(shù),智能體無(wú)需完整地展示其偏好,可選狀態(tài)集在投票之前產(chǎn)生。2023/10/20史忠植人工智能導(dǎo)論:多智能體系統(tǒng)67開(kāi)放環(huán)境多智能體協(xié)作方法

Osawa

(1)需求者(requestor)向公告板智能體發(fā)送需求建議RFP(2)空閑智能體向公告板智能體申請(qǐng)一個(gè)RFP(3)公告板將RFP發(fā)到提出申請(qǐng)的空閑智能體

(4)空閑智能體產(chǎn)生個(gè)體規(guī)劃

(5)空閑智能體將其規(guī)劃發(fā)給需求者

(6)需求者調(diào)查協(xié)作的可能

(7)需求者發(fā)送協(xié)作獎(jiǎng)勵(lì)

(8)申請(qǐng)者組成協(xié)作規(guī)劃2023/10/20史忠植人工智能導(dǎo)論:多智能體系統(tǒng)68開(kāi)放環(huán)境多智能體協(xié)作方法其效用值可用下式計(jì)算:

utility(a,g)=worth(a,g)-cost(plan(a,g))

效用的平均是協(xié)作的原則。盡管Osawa在一定程度上解決了開(kāi)放環(huán)境中智能體協(xié)作的問(wèn)題,但將各智能體效用簡(jiǎn)單相加再平均的方法仍然太弱,因?yàn)橹悄荏w效用僅是智能體本身對(duì)目標(biāo)偏好的一種排序關(guān)系,不同智能體效用一般不能用數(shù)值比較。2023/10/20史忠植人工智能導(dǎo)論:多智能體系統(tǒng)69交互協(xié)議智能體之間的會(huì)話常常形成典型模式,這種情況下某些消息序列是可知的,這些消息交換的典型模式稱為協(xié)議。智能體間交互的理想情況:智能體充分地理解消息的含意和意圖,然后根據(jù)自身的信念、目標(biāo)等心智狀態(tài),做出相應(yīng)的回答比較實(shí)際的實(shí)現(xiàn):預(yù)先規(guī)范這些協(xié)議,規(guī)定好消息的順序。2023/10/20史忠植人工智能導(dǎo)論:多智能體系統(tǒng)70FIPA英國(guó)拍賣(mài)協(xié)議交互協(xié)議2023/10/20史忠植人工智能導(dǎo)論:多智能體系統(tǒng)71規(guī)劃規(guī)劃是智能體對(duì)動(dòng)作進(jìn)行推理的一種主要形式,它很大程度上體現(xiàn)了智能體的智能性。同時(shí),規(guī)劃也是描述智能體行為的主要方式。規(guī)劃是為了建立一個(gè)控制算法,使智能智能體能夠?yàn)閷?shí)現(xiàn)目標(biāo),對(duì)動(dòng)作過(guò)程進(jìn)行綜合。2023/10/20史忠植人工智能導(dǎo)論:多智能體系統(tǒng)72經(jīng)典規(guī)劃問(wèn)題經(jīng)典的規(guī)劃理論認(rèn)為規(guī)劃要解決的問(wèn)題(即規(guī)劃的輸入)是:用某種形式語(yǔ)言描述的初始世界狀態(tài)用某種形式語(yǔ)言描述的智能體目標(biāo)用某種形式語(yǔ)言描述的智能體可能采用的動(dòng)作,通常也叫做領(lǐng)域知識(shí)輸出是:可以在某個(gè)滿足初始狀態(tài)描述的世界中執(zhí)行并達(dá)到智能體目標(biāo)的一個(gè)動(dòng)作序列2023/10/20史忠植人工智能導(dǎo)論:多智能體系統(tǒng)73內(nèi)容提要9.1概述 9.2智能體結(jié)構(gòu)

9.3智能體通信語(yǔ)言ACL 9.4協(xié)調(diào)和協(xié)作

9.5移動(dòng)智能體

9.6 小結(jié) 2023/10/20史忠植人工智能導(dǎo)論:多智能體系統(tǒng)74移動(dòng)智能體隨著Internet應(yīng)用的逐步深入,特別是信息搜索、分布式計(jì)算以及電子商務(wù)的蓬勃發(fā)展,人們?cè)絹?lái)越希望在整個(gè)Internet范圍內(nèi)獲得最佳的服務(wù),渴望將整個(gè)網(wǎng)絡(luò)虛擬成為一個(gè)整體,使軟件智能體能夠在整個(gè)網(wǎng)絡(luò)中自由移動(dòng),移動(dòng)智能體的概念隨即孕育而生。移動(dòng)智能體可以看成是軟件智能體技術(shù)與分布式計(jì)算技術(shù)相結(jié)合的產(chǎn)物,它與傳統(tǒng)網(wǎng)絡(luò)計(jì)算模式有著本質(zhì)上的區(qū)別。2023/10/20史忠植人工智能導(dǎo)論:多智能體系統(tǒng)75移動(dòng)智能體系統(tǒng)雖然目前不同移動(dòng)智能體系統(tǒng)的體系結(jié)構(gòu)各不相同,但幾乎所有的移動(dòng)智能體系統(tǒng)都包含移動(dòng)智能體(簡(jiǎn)稱MA)和移動(dòng)智能體服務(wù)設(shè)施(簡(jiǎn)稱MAE)兩個(gè)部分。MAE負(fù)責(zé)為MA建立安全、正確的運(yùn)行環(huán)境,為MA提供最基本的服務(wù)(包括創(chuàng)建、傳輸、執(zhí)行),實(shí)施針對(duì)具體MA的約束機(jī)制、容錯(cuò)策略、安全控制和通信機(jī)制等。MA的移動(dòng)性和問(wèn)題求解能力很大程度上取取于MAE所提供的服務(wù)2023/10/20史忠植人工智能導(dǎo)論:多智能體系統(tǒng)76移動(dòng)智能體系統(tǒng)移動(dòng)智能體服務(wù)設(shè)施MAE至少應(yīng)包括以下基本服務(wù):(1)事務(wù)服務(wù):實(shí)現(xiàn)移動(dòng)智能體的創(chuàng)建、移動(dòng)、持久化和執(zhí)行環(huán)境分配;(2)事件服務(wù):包含智能體傳輸協(xié)議和智能體通信協(xié)議,實(shí)現(xiàn)移動(dòng)智能體間的事件傳遞;(3)目錄服務(wù):提供移動(dòng)智能體的定位信息,形成路由選擇;(4)安全服務(wù):提供安全的執(zhí)行環(huán)境;(5)應(yīng)用服務(wù):提供面向特定任務(wù)的服務(wù)接口。2023/10/20史忠植人工智能導(dǎo)論:多智能體系統(tǒng)77移動(dòng)智能體系統(tǒng)Java-based:Odyssey.GeneralMagicInc.Concordia.Mitsubishi’sAglets.IBMVoyager.ObjectSpaceOthers:Tacoma:Univ.ofTromsoandCornellUniv.AgentTCL:DartmouthCollege2023/10/20史忠植人工智能導(dǎo)論:多智能體系統(tǒng)78移動(dòng)智能體系統(tǒng)—Voyager

Voyager的最大特點(diǎn)是以VoyagerORB作為核心,將Agent和分布式計(jì)算緊密結(jié)合在一起的。但Voyager只支持純Java的對(duì)象的通信,與CORBA和MASIF不兼容,它還支持異步或同步的通信,動(dòng)態(tài)消息機(jī)制和單向多點(diǎn)發(fā)送。在容錯(cuò)服務(wù)方面,Voyager支持任意時(shí)間的顯式地存儲(chǔ),其安全機(jī)制主要是通過(guò)VoyagerSecurity類(lèi)進(jìn)行編程設(shè)置。2023/10/20史忠植人工智能導(dǎo)論:多智能體系統(tǒng)79移動(dòng)智能體系統(tǒng)—

Aglet

Aglet是由IBM公司用純Java開(kāi)發(fā)的移動(dòng)Agent技術(shù),并提供著實(shí)用的平臺(tái)—AgletWorkbench,讓人們開(kāi)發(fā)或執(zhí)行移動(dòng)Agent系統(tǒng)。Aglet是一個(gè)較為成功和全面的系統(tǒng),主要表現(xiàn)在:它提供了一個(gè)簡(jiǎn)單而全面的移動(dòng)Agent編程模型;它為Agent間提供了動(dòng)態(tài)和有效的通信機(jī)制;它還提供了一套詳細(xì)且易用的安全機(jī)制。2023/10/20史忠植人工智能導(dǎo)論:多智能體系統(tǒng)80Aglet的系統(tǒng)框架

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論