




版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第二章智能體教材ArtificialIntelligence–Amodernapproach(2013)
S.RussellandP.Norvig
人工智能—一種現(xiàn)代方法(第二版)學(xué)校發(fā)的教材參考概率推理、機(jī)器學(xué)習(xí)部分理性的行動(dòng):MaximizeYour
ExpectedUtility使目標(biāo)期望值最大化!智能體Anagentisanythingthatcanbeviewedasperceivingitsenvironmentthroughsensorsandactinguponthatenvironmentthroughactuators。一個(gè)智能體是能通過(guò)傳感器來(lái)感知周?chē)h(huán)境并通過(guò)執(zhí)行器來(lái)行動(dòng)的任何東西。Agentsincludehumans,robots,softbots(軟件機(jī)器人),
thermostats(自動(dòng)調(diào)溫器),etc.
Humanagent人類(lèi)智能體:
eyes,ears,andotherorgansforsensors;
hands,legs,mouth,andotherbodypartsforactuators
Roboticagent機(jī)器人智能體:
camerasandinfraredrangefinders(紅外測(cè)距儀)forsensors;
variousmotors(馬達(dá))foractuators智能體和環(huán)境Theagentfunction(智能體函數(shù))
mapsfrompercepthistories(感知序列)
toactions(行動(dòng)):
[f:P*→A]
Theagentprogram(智能體程序)
runsonthephysicalarchitectureto
producef
agent=architecture(體系結(jié)構(gòu))+program(程序)
兩地點(diǎn)真空吸塵器世界Percepts:locationandcontents,e.g.,[A,Dirty]
Actions:Left,Right,Suck,NoOp
真空吸塵智能體Whatistherightfunction?
Canitbeimplemented(應(yīng)用)inasmallagentprogram?
理性智能體Anagentshouldstriveto“dotherightthing”,basedonwhatit
canperceiveandtheactionsitcanperform.Therightactionis
theonethatwillcausetheagenttobemostsuccessful對(duì)的行動(dòng)就是使智能體更加成功的行動(dòng)
Performancemeasure(性能度量):Anobjectivecriterion(客觀標(biāo)準(zhǔn))forsuccessofanagent'sbehavior
E.g.,performancemeasureofavacuum-cleaneragentcould
be:
灰塵清理量
耗電量
噪音產(chǎn)生量,etc.理性智能體RationalAgent:Foreachpossibleperceptsequence,a
rationalagentshouldselectanactionthatisexpected
tomaximizeitsperformancemeasure,giventhe
evidenceprovidedbytheperceptsequenceand
whateverbuilt-inknowledgetheagenthas.
理性智能體:對(duì)于每一個(gè)可能的感知序列,理性智
能體應(yīng)該基于已知的感知序列提供的信息,和智能
體已有的先驗(yàn)知識(shí),選擇能夠使它的性能度量最大
化的行為。
理性智能體理性與全知(all-knowingwithinfiniteknowledge)
是截然不同的Agentscanperformactionsinordertomodifyfuture
perceptssoastoobtainusefulinformation
(informationgathering,exploration)
智能體會(huì)為了獲取有用信息而采取行動(dòng)——信息收集
Anagentisautonomousifitsbehaviorisdetermined
byitsownexperience(withabilitytolearnand
adapt)
理性智能體應(yīng)該能夠自主地學(xué)習(xí),以彌補(bǔ)不全面或
不正確的先驗(yàn)知識(shí)。理性智能體Arationalagentchooseswhicheveractionmaximizestheexpectedvalueoftheperformancemeasuregiventheperceptsequencetodate
Rational≠omniscient(全知的)
—perceptsmaynotsupplyallrelevantinformation
Rational≠clairvoyant(洞察力)
—actionoutcomesmaynotbeasexpected
Hence,rational≠successfulRational?exploration探索,learning學(xué)習(xí),autonomy自主性Agent:自動(dòng)駕駛汽車(chē)Performancemeasure性能度量:safety,destination,profits,legality,comfort,…
Environment環(huán)境:streets/freeways,traffic,pedestrians,weather,…
Actuators執(zhí)行器:steering,accelerator,brake,horn,speaker/display,…
Sensors傳感器:video,accelerometers,gauges,enginesensors,keyboard,GPS,…任務(wù)環(huán)境PEAS
任務(wù)環(huán)境屬性完全可觀察(vs.部分可觀察):如果一直智能體的傳感器每個(gè)時(shí)間節(jié)點(diǎn)上都能讓它訪問(wèn)獲取環(huán)境的完整狀態(tài)
確定性的(vs.隨機(jī)的):如果環(huán)境的下一個(gè)狀態(tài)完全決定于當(dāng)前的狀態(tài)和智能體執(zhí)行的動(dòng)作.(如果環(huán)境是確定性的,除非有其它智能體活動(dòng)的影響,那么我們稱(chēng)該環(huán)境是策略的)
片段式的(vs.延續(xù)式的)
:智能體的經(jīng)驗(yàn)被分成了一個(gè)個(gè)原子片段(每個(gè)片段的組成包含了智能體所感知的信息以及進(jìn)而執(zhí)行的單個(gè)行動(dòng)),and行動(dòng)的選擇只取決于當(dāng)前片段自身.
如裝配線上檢測(cè)次品零件的機(jī)器人只需要把每次決策建立在當(dāng)前零件基礎(chǔ)上,
不用考慮以前的決策。任務(wù)環(huán)境屬性靜態(tài)的
(vs.動(dòng)態(tài)的):如果環(huán)境在智能體思考的時(shí)候不會(huì)變化.(如果環(huán)境本身不隨時(shí)間的流逝變化,但智能體的性能評(píng)價(jià)隨時(shí)間變化,那么我們稱(chēng)這個(gè)環(huán)境是半動(dòng)態(tài)的)
離散的(vs.連續(xù)的):包含有限個(gè)數(shù)的獨(dú)特狀態(tài).下棋、開(kāi)車(chē)
單智能體
(vs.多智能體):Anagentoperatingby
itselfinanenvironment.任務(wù)環(huán)境屬性任務(wù)環(huán)境屬性取決于任務(wù)環(huán)境是如何定義的
Therealworldis(ofcourse)部分可觀察的,隨機(jī)的,延續(xù)式的,動(dòng)態(tài)的,連續(xù)的,多智能體的~
智能體函數(shù)和程序Anagentiscompletelyspecifiedbytheagent
functionmappingperceptsequencestoactions
Oneagentfunction(orasmallequivalenceclass)isrational
目標(biāo):findawaytoimplementtherationalagent
functionconcisely
Table-lookupagent\input{algorithms/table-agent-algorithm}
缺陷:
空間大
創(chuàng)建表的時(shí)間太長(zhǎng)
沒(méi)有自主性
即使采用學(xué)習(xí)的方法,智能體在有限時(shí)間
內(nèi)無(wú)法學(xué)習(xí)所有表項(xiàng)
智能體類(lèi)型四種基本的智能體程序,按通用性遞增排序:
—simplereflexagents簡(jiǎn)單反射型智能體
—reflexagentswithstate基于模型的反射型智能體
—goal-basedagents基于目標(biāo)的智能體
—utility-basedagents基于效用的智能體
Allthesecanbeturnedintolearningagents學(xué)習(xí)智能體簡(jiǎn)單反射型智能體基于模型的反射型智能體基于目標(biāo)的智能體基于效用的智能體學(xué)習(xí)智能體SummaryAgentsinteractwithenvironmentsthroughactuatorsandsensorsTheagentfunctiondescribeswhattheagentdoesinallcircumstancesTheperformancemeasureevaluatestheenvironmentsequenceAperfectlyrationalagentmaximizesexpectedperformanceAgentprogramsimplement(some)agentfunctionsPEASdescriptionsdefinetaske
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025至2030年中國(guó)胎壓槍數(shù)據(jù)監(jiān)測(cè)研究報(bào)告
- 二零二五年度綠色環(huán)保技術(shù)資金入股合同
- 科技企業(yè)如何快速申請(qǐng)專(zhuān)利
- 2025年度中國(guó)星網(wǎng)校園招聘正式啟動(dòng)筆試參考題庫(kù)附帶答案詳解
- 二零二五年度銀行與方公司戰(zhàn)略合作框架協(xié)議
- 二零二五年度飯店員工勞動(dòng)合同管理與執(zhí)行細(xì)則
- 2025年度軟件開(kāi)發(fā)項(xiàng)目勞務(wù)費(fèi)合同示例
- 家政服務(wù)月嫂合同書(shū)(2025年度)嬰幼兒成長(zhǎng)關(guān)懷與育兒輔導(dǎo)協(xié)議
- 2025年度環(huán)保設(shè)備安裝與綠色家居產(chǎn)品推廣合同
- 2025年安慶某公司招聘外包工作人員3人筆試參考題庫(kù)附帶答案詳解
- 銅陵油庫(kù)重油罐區(qū)工藝設(shè)計(jì)
- 液壓傳動(dòng)全套ppt課件(完整版)
- 質(zhì)量手冊(cè)CCC認(rèn)證完整
- 內(nèi)部控制五要素圖解
- DB51∕T 2767-2021 安全生產(chǎn)風(fēng)險(xiǎn)分級(jí)管控體系通則
- 反興奮劑考試試題與解析
- 低壓電氣安全知識(shí)培訓(xùn)課件(35張PPT)
- 電子支氣管鏡檢查、清洗消毒保養(yǎng)及注意事項(xiàng)解讀
- 建筑工程材料取樣及收費(fèi)標(biāo)準(zhǔn)
- COMSOL培訓(xùn)PPT課件
- 麗聲北極星分級(jí)繪本第一級(jí)下 Can You Play with Me?課件
評(píng)論
0/150
提交評(píng)論