分布式人工智能與Agent_第1頁
分布式人工智能與Agent_第2頁
分布式人工智能與Agent_第3頁
分布式人工智能與Agent_第4頁
分布式人工智能與Agent_第5頁
已閱讀5頁,還剩38頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

9.1分布式人工智能9.2Agent及其要素9.3真體的結(jié)構(gòu)9.4真體通信9.5移動真體和多真體系統(tǒng)9.6小結(jié)Ch.9DistributedArtificialIntelligenceandAgent

第九章分布式人工智能與Agent

9.1分布式人工智能

DistributedArtificialIntelligence

并行分布處理技術(shù)應(yīng)運而生

FeaturesofDistributedAI分布式人工智能的特點分布性

系統(tǒng)信息無論在邏輯上或者物理上都是分布的,系統(tǒng)能夠并行地求解問題,從而提高子系統(tǒng)的求解效率。連接性在問題求解過程中,各個子系統(tǒng)和求解機構(gòu)通過計算機網(wǎng)絡(luò)相互連接,降低了求解問題的代價。協(xié)作性各子系統(tǒng)協(xié)調(diào)工作,能夠求解單個機構(gòu)難以解決或者無法解決的困難問題,提高求解能力,擴大應(yīng)用領(lǐng)域。2FeaturesofDistributedAI開放性通過網(wǎng)絡(luò)互連和系統(tǒng)的分布,便于擴充系統(tǒng)規(guī)模,使系統(tǒng)具有比單個系統(tǒng)廣闊得多的開發(fā)性和靈活性。容錯性系統(tǒng)具有較多的冗余處理節(jié)點、通訊路徑和知識,能夠在系統(tǒng)出現(xiàn)故障時保持正常的根本工作狀況,以提高工作可靠性。獨立性系統(tǒng)把求解任務(wù)歸約為幾個相對獨立的子任務(wù),從而降低了各處理節(jié)點、子系統(tǒng)問題求解和軟件設(shè)計開發(fā)的復(fù)雜性。3TypesofDistributedAI分布式人工智能的分類分布式問題求解〔DPS〕研究如何在多個合作的和共享知識的模塊、節(jié)點或子系統(tǒng)之間劃分任務(wù),并求解問題。多真體系統(tǒng)〔MAS)研究如何在一群自主的agent間進行智能行為的協(xié)調(diào)。兩者的共同點在于研究如何對資源、知識、控制等進行劃分。兩者的不同點在于,DPS往往需要有全局的問題、概念模型和成功標準;而MAS那么包含多個局部的問題、概念模型和成功標準。49.2真體及其要素AgentandItsEssentialsFig9.1Agent與環(huán)境的交互作用

環(huán)境執(zhí)行器作用感知傳感器?59.2.1Agent的定義和譯法1.Agent的定義定義9.1社會中某個個體經(jīng)過協(xié)商后可求得問題的解,這個個體就是agent.定義9.2是一種通過傳感器知其環(huán)境,并通過執(zhí)行器作用于該環(huán)境的實體,因此,可以把真體定義為一種從感知序列實體動作的映射。定義9.3是一種具有智能的實體62.Agent的譯法建議把agent譯為“(艾)真體〞的理由:〔1〕Agent是一種通過傳感器感知其環(huán)境,并通過執(zhí)行器作用于該環(huán)境的實體。這個“實體〞也可叫做“真體〞。因此,可以把真體定義為一種從感知序列到實體動作的映射?!?〕譯為“主體〞可能是考慮到agent具有自主性。但交互性、協(xié)調(diào)性、社會性、適應(yīng)性和分布性等不可能在譯名上全部反映出來,因而是片面的?!?〕譯為“代理〞是受到社會科學和管理科學的影響。也不能表示出agent的原義。〔4〕音譯不失為一種可取方法?!?〕有一定的物理意義。79.2.2真體的要素和特性1.真體的要素真體必須利用知識修改其內(nèi)部狀態(tài)〔心理狀態(tài)〕,以適應(yīng)環(huán)境變化和協(xié)作求解的需要。真體的行動受其心理狀態(tài)驅(qū)動。人類心理狀態(tài)的要素有認知〔信念、知識、學習等〕、情感〔愿望、興趣、愛好等〕和意向〔意圖、目標、規(guī)劃和承諾等〕三種。著重研究信念〔belief〕、愿望〔desire〕和意圖〔intention〕的關(guān)系及其形式化描述,力圖建立真體的BDI〔信念、愿望和意圖〕模型,已成為真體理論模型研究的主要方向。81.真體的要素信念、愿望、意圖與行為的因果關(guān)系,如圖9.2所示。其中,信念描述真體對環(huán)境的認識,表示可能發(fā)生的狀態(tài)。愿望從信念直接得到,描述真體對可能發(fā)生情景的判斷。意圖來自愿望,制約真體,是目標的組成局部。Fig.9.2BDI關(guān)系圖

…信念愿望意圖行為92.真體的特性行為自主性能夠控制自身行為,其行為是主動的、自發(fā)的/有目標和意圖的,并能根據(jù)目標和環(huán)境要求對短期行為做出規(guī)劃。作用交互性能夠與環(huán)境交互作用,能夠感知其所處環(huán)境,并借助自己的行為結(jié)果,對環(huán)境做出適當反響。環(huán)境協(xié)調(diào)性真體存在于一定的環(huán)境中,感知環(huán)境的狀態(tài)、事件和特征,并通過其動作和行為影響環(huán)境,與環(huán)境保持協(xié)調(diào)。環(huán)境和真體互相依存,互相作用。面向目標性真體能夠表現(xiàn)出某種目標指導(dǎo)下的行為,為實現(xiàn)其內(nèi)在目標而采取主動行為。存在社會性真體存在于由多個真體構(gòu)成的社會環(huán)境中,與其它真體交換信息、交互作用和通訊。各真體通過社會承諾,進行社會推理,實現(xiàn)社會意向和目標。

102.真體的特性〔續(xù)〕工作協(xié)調(diào)性各真體合作和協(xié)調(diào)工作,求解單個真體無法處理的問題,提高處理問題的能力。運行持續(xù)性真體的程序在起動后,能夠在相當長的一段時間內(nèi)維持運行狀態(tài),不隨運算的停止而立即結(jié)束運行。系統(tǒng)適應(yīng)性真體不僅能夠感知環(huán)境,對環(huán)境做出反響,而且能夠把新建立的真體集成到系統(tǒng)中而無需對原有的多真體系統(tǒng)進行重新設(shè)計,因而具有很強的適應(yīng)性和可擴展性。結(jié)構(gòu)分布性在物理上或邏輯上分布和異構(gòu)的實體〔或真體〕,如主動數(shù)據(jù)庫、知識庫、控制器和執(zhí)行器等,在多真體系統(tǒng)中具有分布式結(jié)構(gòu),便于技術(shù)集成、資源共享、性能優(yōu)化和系統(tǒng)整合。功能智能性真體強調(diào)理性作用,可作為描述機器智能、動物智能和人類智能的統(tǒng)一模型。

119.3真體的結(jié)構(gòu)ArchitectureofAgent9.3.1ArchitectureFeaturesofAgent真體的結(jié)構(gòu)特點真體系統(tǒng)是個高度開放的智能系統(tǒng),其結(jié)構(gòu)將直接影響系統(tǒng)的智能和性能。例如,一個在未知環(huán)境中自主移動的機器人需要對它面對的各種復(fù)雜地形、地貌、通道狀況及環(huán)境信息做出實時感知和決策,控制執(zhí)行機構(gòu)完成各種運動操作,實現(xiàn)導(dǎo)航、跟蹤、越野等功能,并保證移動機器人處于最正確的運動狀態(tài)。這就要求構(gòu)成該移動機器人系統(tǒng)的各個真體有一個合理和先進的體系結(jié)構(gòu),保證各真體自主地完成局部問題求解任務(wù),顯示出較高的求解能力,并通過各真體間的協(xié)作完成全局任務(wù)。129.3.1ArchitectureFeaturesofAgent真體的結(jié)構(gòu)特點真體相當于一個獨立的功能模塊核心局部為決策生成器或問題求解器包含一個或多個進程,并接受總體調(diào)度在多計算機上并行運行

13人工智能的任務(wù)就是設(shè)計真體程序,實現(xiàn)從感知到動作的映射函數(shù)。這種真體程序需要在某種稱為結(jié)構(gòu)的計算設(shè)備上運行。一般上,體系結(jié)構(gòu)使得傳感器的感知對程序可用、運行程序并把該程序的作用選擇反響給執(zhí)行器??梢姡骟w、體系結(jié)構(gòu)和程序之間具有如下關(guān)系:=+真體體系結(jié)構(gòu)程序14真體結(jié)構(gòu)的分類反響式真體反響式〔reflex或reactive〕真體只簡單地對外部刺激產(chǎn)生響應(yīng),沒有任何內(nèi)部狀態(tài)。每個真體既是客戶,又是效勞器,根據(jù)程序提出請求或做出答復(fù)。圖9.3表示反響式真體的結(jié)構(gòu)示意圖,圖中,真體的條件-作用規(guī)那么使感知和動作連接起來。把這種連接稱為一條條件-作用規(guī)那么。15

反響式真體的軟件結(jié)構(gòu)Fig9.3反應(yīng)式真體結(jié)構(gòu)作用決策條件-作用規(guī)則

世界現(xiàn)狀執(zhí)行器傳感器環(huán)境真體16慎思式真體慎思式〔deliberative〕真體又稱為認知式〔cognitive〕真體,是個具有顯式符號模型的基于知識的系統(tǒng)。其環(huán)境模型一般是預(yù)先知道的,因而對動態(tài)環(huán)境存在一定的局限性,不適用于未知環(huán)境。慎思式真體的結(jié)構(gòu)如圖9.4所示。真體接收的外部環(huán)境信息,依據(jù)內(nèi)部狀態(tài)進行信息融合,以產(chǎn)生修改當前狀態(tài)的描述;然后,在知識庫支持下制訂規(guī)劃,再在目標指引下,形成動作序列,對環(huán)境發(fā)生作用。17慎思式真體結(jié)構(gòu)Fig9.4慎思式真體結(jié)構(gòu)環(huán)境執(zhí)行器傳感器信息融合目標知識庫狀態(tài)作用決策規(guī)劃18跟蹤式真體簡單的反響式真體只能在現(xiàn)有感知根底上做出正確的決策。隨時更新內(nèi)部狀態(tài)信息要求把兩種知識編入真體的程序,即關(guān)于世界如何獨立地開展真體的信息以及真體自身作用如何影響世界的信息。圖9.5給出一種具有內(nèi)部狀態(tài)的反響式真體的結(jié)構(gòu)圖,表示現(xiàn)有的感知信息如何與原有的內(nèi)部狀態(tài)相結(jié)合以產(chǎn)生現(xiàn)有狀態(tài)的更新描述。與解釋狀態(tài)的現(xiàn)有知識的新感知一樣,也采用了有關(guān)世界如何跟蹤其未知局部的信息,還必須知道真體對世界狀態(tài)有哪些作用。具有內(nèi)部狀態(tài)的反響式真體通過找到一條條件與現(xiàn)有環(huán)境匹配的規(guī)那么進行工作,然后執(zhí)行與規(guī)那么相關(guān)的作用。這種結(jié)構(gòu)叫做跟蹤世界真體或跟蹤式真體。19跟蹤式真體結(jié)構(gòu)Fig9.5具有內(nèi)部狀態(tài)的真體結(jié)構(gòu)執(zhí)行器傳感器環(huán)境世界現(xiàn)狀條件-作用規(guī)則作用決策真體影響世界信息世界發(fā)展真體信息原有內(nèi)部狀態(tài)真體20基于目標的真體僅僅了解現(xiàn)有狀態(tài)對決策來說往往是不夠的,真體還需要某種描述環(huán)境情況的目標信息。真體的程序能夠與可能的作用結(jié)果信息結(jié)合起來,以便選擇到達目標的行為。這類真體的決策根本上與前面所述的條件-作用規(guī)那么不同。反響式真體中有的信息沒有明確使用,而設(shè)計者已預(yù)先計算好各種正確作用。對于反響式真體,還必須重寫大量的條件-作用規(guī)那么?;谀繕说恼骟w在實現(xiàn)目標方面更靈活,只要指定新的目標,就能夠產(chǎn)生新的作用。圖9.6表示基于目標真體的結(jié)構(gòu)。21

基于目標的真體結(jié)構(gòu)Fig9.6一個具有顯式目標的真體環(huán)境目標行為決策真體執(zhí)行器傳感器世界現(xiàn)狀行為影響世界真體影響世界信息世界發(fā)展真體信息原有內(nèi)部狀態(tài)22基于效果的真體只有目標實際上還缺乏以產(chǎn)生高質(zhì)量的作用。如果一個世界狀態(tài)優(yōu)于另一世界狀態(tài),那么它對真體就有更好的效果〔utility〕。因此,效果是一種把狀態(tài)映射到實數(shù)的函數(shù),該函數(shù)描述了相關(guān)的滿意程度。一個完整標準的效果函數(shù)允許對兩類情況做出理性的決策第一,當真體只有一些目標可以實現(xiàn)時,效果函數(shù)指定適宜的交替。第二,當真體存在多個瞄準目標而不知哪個一定能夠?qū)崿F(xiàn)時,效果〔函數(shù)〕提供了一種根據(jù)目標的重要性來掂估成功可能性的方法。因此,一個具有顯式效果函數(shù)的真體能夠做出理性的決策;不過,必須比較由不同作用獲得的效果。圖9.7給出一個完整的基于效果的真體結(jié)構(gòu)。23Fig9.7基于效果的真體結(jié)構(gòu)傳感器執(zhí)行器環(huán)境真體影響世界信息世界發(fā)展真體信息原有內(nèi)部狀態(tài)真體行為影響世界世界現(xiàn)狀效果滿意程度行為決策

基于效果的真體結(jié)構(gòu)24復(fù)合式真體復(fù)合式真體即在一個真體內(nèi)組合多種相對獨立和并行執(zhí)行的智能形態(tài),其結(jié)構(gòu)包括感知、動作、反響、建模、規(guī)劃、通信和決策等模塊,如圖9.8所示。真體通過感知模塊來反映現(xiàn)實世界,并對環(huán)境信息做出一個抽象,再送到不同的處理模塊。假設(shè)感知到簡單或緊急情況,信息就被送入反射模塊,做出決定,并把動作命令送到行動模塊,產(chǎn)生相應(yīng)的動作25

復(fù)合式真體結(jié)構(gòu)真體建模規(guī)劃決策生成通信Fig9.8復(fù)合式真體的結(jié)構(gòu)環(huán)境其它Agent執(zhí)行器感知器反射一般情況緊急和簡單情況請求/答應(yīng)信息協(xié)作與協(xié)商動作反射真體建模規(guī)劃決策生成通信Fig9.8復(fù)合式真體的結(jié)構(gòu)環(huán)境其它Agent執(zhí)行器感知器反射一般情況緊急和簡單情況請求/答應(yīng)信息真體建模規(guī)劃決策生成通信Fig9.8復(fù)合式真體的結(jié)構(gòu)環(huán)境其它Agent執(zhí)行器感知器反射一般情況緊急和簡單情況請求/答應(yīng)信息協(xié)作與協(xié)商動作預(yù)測269.4真體的通信AgentCommunication9.4.1ProcessofAgentCommunication通信的過程語言的開展:邏輯推理與不確定推理語言基礎(chǔ):形式語言和自然語言通信的組成講話者:意向、生成、綜合受話者:感知、分析、消歧、總合279.4.2Types&FormsofAgentCommunication真體通信的類型和方式通信的類型使用TELL和ASK通信使用形式語言的通信行為感知真體A真體B通過界面TELL和ASK通信感知推理數(shù)據(jù)庫數(shù)據(jù)庫推理行為Fig9.10兩真體通過TELL和ASK通信28

Fig9.11兩真體通過語言通信知識庫推理推理知識庫真體A行為感知感知語言行為真體B語言299.4.3PlanningandRealizationofAgentCommunication交談的規(guī)劃與實現(xiàn)對話表示型:通信、宣言、致謝等指示型:詢問、命令、請求等交談的規(guī)劃交談的實現(xiàn)309.4.4LanguagesofAgentCommunication真體的通信語言知識詢問與操作語言〔KnowledgeQueryandManipulationLanguage,KQML〕KQML的三個層次:通信、消息和內(nèi)容。通信層——技術(shù)通信參數(shù)協(xié)議;消息層——規(guī)定言語行為的類型;內(nèi)容層——規(guī)定消息內(nèi)容。知識交換語言〔KnowledgeInterchangeFormat,KIF〕319.5MultiAgentSystems(MAS)

多真體系統(tǒng)9.5.1MobileAgent‘sDefinitionandStructures

移動真體的定義和系統(tǒng)構(gòu)成移動真體的定義定義1移動真體是一種能在異構(gòu)網(wǎng)絡(luò)環(huán)境中自主地從一臺主機遷移到另一臺主機,并可與其他真體或資源交互的軟件。定義2移動真體是一種具有移動特性的智能真體。定義3移動真體系統(tǒng)是由多個移動真體組成的系統(tǒng),各移動真體在系統(tǒng)中自主移動,協(xié)調(diào)工作以完成指定任務(wù)。

32移動真體系統(tǒng)的構(gòu)成真體移動真體,又稱用戶真體效勞真體,又稱系統(tǒng)真體或靜態(tài)真體移動真體環(huán)境〔MAE〕又稱MA效勞器、MA效勞裝置、MA主機、Location、Context等339.5.2FeaturesandKeyTechnologiesofMAS

多真體系統(tǒng)的特征和關(guān)鍵技術(shù)多真體系統(tǒng)定義多個真體組成一個松耦合又協(xié)作共事的系統(tǒng)。多真體系統(tǒng)的特征數(shù)據(jù)分布或分散計算過程異步、并發(fā)或并行每個真體具有不完全的信息和問題求解能力不存在全局控制34多真體系統(tǒng)的關(guān)鍵技術(shù)移動技術(shù)通信技術(shù)平安問題容錯機制編程語言359.5.3ModelsandStructuresofMAS多真體系統(tǒng)的模型和結(jié)構(gòu)MAS的根本模型BDI模型把BDI模型擴展至多真體研究時,提出了聯(lián)合意圖、社會承諾、合理行為等描述真體行為的形式化定義。協(xié)商模型主要用于資源競爭、任務(wù)分配和沖突消解等問題。協(xié)作規(guī)劃模型主要用于制訂其協(xié)調(diào)一致的問題求解規(guī)劃。自協(xié)調(diào)模型隨環(huán)境變化自適應(yīng)調(diào)整行為,是建立在開放和動態(tài)環(huán)境下的多真體模型。36多真體系統(tǒng)的體系結(jié)構(gòu)真體網(wǎng)絡(luò)在該體系結(jié)構(gòu)下,無論是遠距離或短距離的真體,其通信都是直接進行的。該類多真體系統(tǒng)的框架、通信和狀態(tài)知識都是固定的。真體聯(lián)盟在該結(jié)構(gòu)下,假設(shè)干近程真體通過助手真體進行交互,而遠程真體那么由各個局部真體群體的助手真體完成交互和消息發(fā)送。黑板結(jié)構(gòu)黑板結(jié)構(gòu)中的局部真體群共享數(shù)據(jù)存儲—黑板,即真體把信息放在可存取的黑板上,實現(xiàn)局部數(shù)據(jù)共享。379.5.4Cooperation,NegotiationandCoordinationofMAS多真體的協(xié)作、協(xié)商和協(xié)調(diào)多真體的協(xié)作方法決策網(wǎng)絡(luò)和遞歸建模Markov對策真體學習方法決策樹和對策樹多真體的協(xié)商技術(shù)協(xié)商協(xié)議協(xié)商策略協(xié)商處理38多真體的協(xié)調(diào)方法基于集中規(guī)劃的協(xié)調(diào)基于協(xié)商的協(xié)調(diào)基于對策論的協(xié)調(diào)基于社會規(guī)劃的協(xié)調(diào)399.5.5Learning&Planning

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論