版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
人工智能演示文稿目前一頁(yè)\總數(shù)三十五頁(yè)\編于十一點(diǎn)內(nèi)容提要Agents和環(huán)境理性Agent環(huán)境的性質(zhì)Agent的類型與結(jié)構(gòu)目前二頁(yè)\總數(shù)三十五頁(yè)\編于十一點(diǎn)AgentAgent通過(guò)感知器感知環(huán)境并通過(guò)執(zhí)行器對(duì)所處的環(huán)境產(chǎn)生影響人類Agent眼睛,耳朵為感知器手,腳,聲道為執(zhí)行器機(jī)器人Agent攝像頭,紅外距測(cè)儀為感知器馬達(dá)為執(zhí)行器目前三頁(yè)\總數(shù)三十五頁(yè)\編于十一點(diǎn)Agent和環(huán)境Agent函數(shù)將任何感知?dú)v史數(shù)據(jù)映射為行為:Agent程序通過(guò)在物理系統(tǒng)上運(yùn)行來(lái)實(shí)現(xiàn)Agent函數(shù)Agent=體系結(jié)構(gòu)+程序目前四頁(yè)\總數(shù)三十五頁(yè)\編于十一點(diǎn)真空吸塵器世界感知器:地點(diǎn)和內(nèi)容(eg.[A,Dirty])行為:向左,向右,洗塵,無(wú)操作目前五頁(yè)\總數(shù)三十五頁(yè)\編于十一點(diǎn)真空吸塵器世界目前六頁(yè)\總數(shù)三十五頁(yè)\編于十一點(diǎn)理性Agent理性agent:對(duì)于每一可能的感知數(shù)據(jù)序列,一個(gè)理性的agent應(yīng)該采取一個(gè)行為以達(dá)到最大的性能。理性判斷的4個(gè)因素性能度量先驗(yàn)知識(shí)可以完成的行動(dòng)截至到此刻的感知序列目前七頁(yè)\總數(shù)三十五頁(yè)\編于十一點(diǎn)理性Agent一個(gè)Agent應(yīng)該根據(jù)它感知的信息和它能夠進(jìn)行的行為而做正確的事情正確的行為將使得Agent能夠取得最大的成功性能度量:一個(gè)客觀的標(biāo)準(zhǔn)來(lái)評(píng)價(jià)Agent的行為的成功性Eg.真空器agent的性能度量可以是它清洗區(qū)域的數(shù)量,花費(fèi)的時(shí)間,消耗的能量,產(chǎn)生的噪音等等Eg.真空洗塵器8個(gè)小時(shí)內(nèi)清理的灰塵總量來(lái)度量性能?以行為來(lái)度量性能不如以結(jié)果來(lái)度量性能目前八頁(yè)\總數(shù)三十五頁(yè)\編于十一點(diǎn)理性Agent全知:明確知道它的行動(dòng)產(chǎn)生的實(shí)際結(jié)果并且作出相應(yīng)的動(dòng)作理性不等同于全知(已知的知識(shí)都是有限的)理性不等于完美:理性是使期望的性能最大化完美是使實(shí)際的性能最大化目前九頁(yè)\總數(shù)三十五頁(yè)\編于十一點(diǎn)理性Agent理性agent能夠進(jìn)行信息收集。理性的agent應(yīng)該具有自主性,能夠進(jìn)行學(xué)習(xí)從環(huán)境的感知信息中根據(jù)歷史經(jīng)驗(yàn)來(lái)學(xué)習(xí)目前十頁(yè)\總數(shù)三十五頁(yè)\編于十一點(diǎn)任務(wù)環(huán)境任務(wù)環(huán)境:包括性能(Performance),環(huán)境(Environment),agent的執(zhí)行器(Actuators)和傳感器(Sensors),英文縮寫為PEAS對(duì)于每一個(gè)智能agent,必須說(shuō)明其PEAS參數(shù)Eg.自動(dòng)駕駛出租車性能度量環(huán)境執(zhí)行器傳感器目前十一頁(yè)\總數(shù)三十五頁(yè)\編于十一點(diǎn)任務(wù)環(huán)境Eg.自動(dòng)駕駛出租車性能度量:安全性,快速性,交通違規(guī),舒適度,利潤(rùn)環(huán)境:馬路,其他交通工具,行人,乘客執(zhí)行器:方向盤,加速油門,剎車,語(yǔ)音合成器傳感器:攝像頭,紅外或聲納,速度表,GPS,鍵盤,麥克風(fēng)目前十二頁(yè)\總數(shù)三十五頁(yè)\編于十一點(diǎn)任務(wù)環(huán)境Environment:Patient,hospital,staffActuators:Screendisplay(questions,tests,diagnoses,treatments,referrals)Sensors:Keyboard(entryofsymptoms,findings,patient'sanswers)Eg.醫(yī)療診斷系統(tǒng)性能度量:病人的健康性,病人花費(fèi)環(huán)境:病人,醫(yī)院,工作人員執(zhí)行器:顯示屏(詢問(wèn),測(cè)試,診斷,治療方案)傳感器:鍵盤(輸入癥狀,現(xiàn)場(chǎng)檢測(cè),病人的回答)目前十三頁(yè)\總數(shù)三十五頁(yè)\編于十一點(diǎn)任務(wù)環(huán)境Eg.挑揀零件機(jī)器人性能度量:正確挑揀的零件所占的百分比環(huán)境:零件傳送帶,容器執(zhí)行器:機(jī)器人手臂和手傳感器:攝像頭,關(guān)節(jié)感知器14目前十四頁(yè)\總數(shù)三十五頁(yè)\編于十一點(diǎn)任務(wù)環(huán)境Eg.交互式英語(yǔ)教學(xué)者性能度量:最大化學(xué)生成績(jī)環(huán)境:學(xué)生執(zhí)行器:顯示屏(練習(xí)題,建議,正確答案)傳感器:鍵盤15目前十五頁(yè)\總數(shù)三十五頁(yè)\編于十一點(diǎn)環(huán)境的性質(zhì)完全可觀察的vs.部分可觀察的一個(gè)agent的傳感器在每個(gè)時(shí)間點(diǎn)上都能獲取環(huán)境的完整狀態(tài)一個(gè)agent的傳感器在每個(gè)時(shí)間點(diǎn)上都能獲取環(huán)境的部分狀態(tài)真空洗塵器?自動(dòng)駕駛汽車?單agentvs.多agent單agent獨(dú)自運(yùn)行eg.字謎游戲多agent同時(shí)運(yùn)行eg.國(guó)際象棋國(guó)際象棋vs.駕駛出租車?16目前十六頁(yè)\總數(shù)三十五頁(yè)\編于十一點(diǎn)環(huán)境的性質(zhì)確定的vs.隨機(jī)的環(huán)境的下一個(gè)狀態(tài)完全取決于當(dāng)前狀態(tài)和agent執(zhí)行的動(dòng)作部分可觀察?出租車駕駛?真空吸塵器?片段式的vs.延續(xù)式的agent的經(jīng)歷被分成一個(gè)個(gè)原子片段,在每個(gè)片段中agent感知信息并完成單個(gè)行動(dòng),下一個(gè)片段不依賴于以前的片段檢查次品零件的機(jī)器人?國(guó)際象棋?目前十七頁(yè)\總數(shù)三十五頁(yè)\編于十一點(diǎn)環(huán)境的性質(zhì)靜態(tài)的vs.動(dòng)態(tài)的環(huán)境在agent計(jì)算的時(shí)候不會(huì)變化(vs.會(huì)變化)半動(dòng)態(tài)的:環(huán)境本身不變化但agent的性能評(píng)價(jià)隨時(shí)間變化出租車,國(guó)際象棋,填字游戲?離散的vs.連續(xù)的環(huán)境的狀態(tài),時(shí)間的處理方式以及agent的感知信息和行動(dòng)都有離散/連續(xù)之分國(guó)際象棋,出租車駕駛?18目前十八頁(yè)\總數(shù)三十五頁(yè)\編于十一點(diǎn)環(huán)境的性質(zhì)環(huán)境的性質(zhì)決定了agent的設(shè)計(jì)最難處理的情況:部分可觀察的,隨機(jī)的,連續(xù)的,動(dòng)態(tài)的,延續(xù)式的,多agent的目前十九頁(yè)\總數(shù)三十五頁(yè)\編于十一點(diǎn)Agent函數(shù)和程序一個(gè)agent用agent函數(shù)來(lái)表示agent函數(shù)將感知數(shù)據(jù)序列映射為行為Agent程序以傳感器得到的當(dāng)前感知信息為輸入以執(zhí)行器的行動(dòng)為輸出僅僅以當(dāng)前感知為輸入而不是以整個(gè)歷史感知為輸入目前二十頁(yè)\總數(shù)三十五頁(yè)\編于十一點(diǎn)Agent的表驅(qū)動(dòng)方法缺點(diǎn)表太大創(chuàng)建表時(shí)間長(zhǎng)非自主性,需人工填寫即使能夠?qū)W習(xí),也需要很長(zhǎng)的時(shí)間目前二十一頁(yè)\總數(shù)三十五頁(yè)\編于十一點(diǎn)Agent的類型四種基本的類型簡(jiǎn)單反射agent基于模型的反射agent基于目標(biāo)的agent基于效用的agent目前二十二頁(yè)\總數(shù)三十五頁(yè)\編于十一點(diǎn)真空吸塵器的Agent程序目前二十三頁(yè)\總數(shù)三十五頁(yè)\編于十一點(diǎn)簡(jiǎn)單反射的agent基于當(dāng)前的感知選擇行動(dòng),不關(guān)注感知?dú)v史目前二十四頁(yè)\總數(shù)三十五頁(yè)\編于十一點(diǎn)簡(jiǎn)單反射的agent環(huán)境是完全可觀察的還是部分可觀察的?Eg.真空吸塵器問(wèn)題,剎車問(wèn)題目前二十五頁(yè)\總數(shù)三十五頁(yè)\編于十一點(diǎn)基于模型的反射agentAgent根據(jù)感知?dú)v史維持內(nèi)部狀態(tài)Agent隨時(shí)更新內(nèi)部狀態(tài)信息目前二十六頁(yè)\總數(shù)三十五頁(yè)\編于十一點(diǎn)基于模型的反射agent目前二十七頁(yè)\總數(shù)三十五頁(yè)\編于十一點(diǎn)基于目標(biāo)的agent除了根據(jù)感知信息之外,還要根據(jù)目標(biāo)信息來(lái)選擇行動(dòng)效率比較低,需要推理搜索和規(guī)劃算法目前二十八頁(yè)\總數(shù)三十五頁(yè)\編于十一點(diǎn)基于目標(biāo)的agent目前二十九頁(yè)\總數(shù)三十五頁(yè)\編于十一點(diǎn)基于效用的agent當(dāng)達(dá)到目標(biāo)的行為有很多種的時(shí)候,需要考慮效率環(huán)境是部分可觀察的和隨機(jī)的,不確定下的決策過(guò)程可以通過(guò)基于效用的agent來(lái)實(shí)現(xiàn)。效用的作用多目標(biāo)相沖突時(shí)多目標(biāo)在不確定環(huán)境中一個(gè)目標(biāo)有多種行為可以達(dá)到時(shí)目前三十頁(yè)\總數(shù)三十五頁(yè)\編于十一點(diǎn)基于效用的agent目前三十一頁(yè)\總數(shù)三十五頁(yè)\編于十一點(diǎn)學(xué)習(xí)agent目前三十二頁(yè)\總數(shù)三十五頁(yè)\編于十一點(diǎn)學(xué)習(xí)agent4個(gè)組件性能元件:相當(dāng)于整個(gè)age
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度鋼材水泥市場(chǎng)調(diào)研與風(fēng)險(xiǎn)評(píng)估合同2篇
- 二零二五年度變壓器節(jié)能補(bǔ)貼申請(qǐng)與使用合同范本3篇
- 二零二五版加工承攬合同全文詳盡規(guī)定承攬物、報(bào)酬及質(zhì)量標(biāo)準(zhǔn)3篇
- 二零二五版合伙人業(yè)務(wù)拓展合同范本3篇
- 二零二五年度貨物包裝合同范本3篇
- 2025年度森林防火物資儲(chǔ)備與供應(yīng)標(biāo)準(zhǔn)植樹(shù)承包合同示范文本3篇
- 2024版權(quán)轉(zhuǎn)讓合同轉(zhuǎn)讓價(jià)格及支付方式
- 2024版環(huán)保設(shè)備生產(chǎn)與安裝合同
- 二零二五年房產(chǎn)分割公證合同書(shū)3篇
- 2024版環(huán)保型彩鋼板房安裝協(xié)議版B版
- 河南省鄭州外國(guó)語(yǔ)高中-【高二】【上期中】【把握現(xiàn)在 蓄力高三】家長(zhǎng)會(huì)【課件】
- 天津市武清區(qū)2024-2025學(xué)年八年級(jí)(上)期末物理試卷(含解析)
- 2025年中煤電力有限公司招聘筆試參考題庫(kù)含答案解析
- 企業(yè)內(nèi)部控制與財(cái)務(wù)風(fēng)險(xiǎn)防范
- 高端民用航空復(fù)材智能制造交付中心項(xiàng)目環(huán)評(píng)資料環(huán)境影響
- 建設(shè)項(xiàng)目施工現(xiàn)場(chǎng)春節(jié)放假期間的安全管理方案
- 胃潴留護(hù)理查房
- 植物細(xì)胞中氨基酸轉(zhuǎn)運(yùn)蛋白的一些已知或未知的功能
- 山東省高等學(xué)校精品課程
- 三菱張力控制器LE-40MTA-E說(shuō)明書(shū)
- 生活垃圾填埋場(chǎng)污染控制標(biāo)準(zhǔn)
評(píng)論
0/150
提交評(píng)論