2擴展式博弈與標(biāo)準(zhǔn)式博弈ppt課件_第1頁
2擴展式博弈與標(biāo)準(zhǔn)式博弈ppt課件_第2頁
2擴展式博弈與標(biāo)準(zhǔn)式博弈ppt課件_第3頁
2擴展式博弈與標(biāo)準(zhǔn)式博弈ppt課件_第4頁
2擴展式博弈與標(biāo)準(zhǔn)式博弈ppt課件_第5頁
已閱讀5頁,還剩24頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、2 擴展式博弈與標(biāo)準(zhǔn)式博弈2-0 如何描述博弈 要分析博弈問題,首先要找到便于進行博弈分析的表達(dá)方式 標(biāo)準(zhǔn)式和擴展式是描述博弈的兩種方式: 支付矩陣Payoff Matrix)(主要用于二人博弈) 博弈樹game tree)2-1 標(biāo)準(zhǔn)式博弈( normal form game ) 標(biāo)準(zhǔn)式博弈的描述工具是支付矩陣payoff matrix) 參與人多于兩個時,這種描述便產(chǎn)生困難見下圖)硬幣游戲(零和博弈的一個例子)PayoffMatrix乙乙正面朝上反面朝上甲甲正面朝上 1 -1 -1 1 反面朝上 -1 1 1 -1 支付矩陣的一個簡單例子每參與人存在有限個更多的戰(zhàn)略乙甲B1B2B3A1A2

2、A3考慮:若每人有無限個戰(zhàn)略如何描述? 例如:在“西班牙叛亂例子中,叛軍可以往任何一個方向出擊。 盡管此例中以這樣的戰(zhàn)略描述叛軍有點可笑,但如果將叛軍的處境想像為四面受敵而準(zhǔn)備突圍,這樣的戰(zhàn)略描述就是貼近現(xiàn)實的。同時行動博弈的基本思維方式 我認(rèn)為他認(rèn)為我認(rèn)為 諸葛亮:認(rèn)為曹操見到小路上的煙火會認(rèn)為是自己實行的“實則虛之的戰(zhàn)略,故在小路放火、小路伏兵 曹操:認(rèn)為小路煙火是諸葛亮“實則虛之的戰(zhàn)略,故走小路 卻不知道:諸葛亮知道自己知道“實則虛之的用兵之道2-2 擴展式博弈 擴展式博弈extensive form game): 描述工具是博弈樹A 10B90A 0B0A 90B10A 0B0ABB給

3、B90給B10接受回絕接受回絕Game tree: ultimatum bargaining game(分配100元錢)擴展式博弈中的戰(zhàn)略 戰(zhàn)略是行動計劃,具體到擴展式博弈中,這是由每個參與人在它的每個行動結(jié)點上對應(yīng)的行動方案的組合。 例如:在最后通牒博弈中,A只有一個行動結(jié)點,所以A的戰(zhàn)略為給B90;給B10;B有兩個行動結(jié)點,每個行動結(jié)點都是接受或拒絕,于是B的戰(zhàn)略為:(給(給90接受,給接受,給10接受),(給接受),(給90拒拒絕,給絕,給10接受),(給接受),(給90接受,給接受,給10拒絕),(給拒絕),(給90拒絕,給拒絕,給10拒拒絕)絕)博弈樹結(jié)構(gòu) 結(jié)點node):表明由誰

4、行動 分枝branch):表明參與人可選擇的行動 收益payoff):在最后的結(jié)點上,做為博弈的結(jié)果,每種博弈的路徑給參與人帶來的收益A 10B 90A 0B 0A 90B10A 0B0ABB給B90給B10接受回絕接受回絕博弈樹結(jié)構(gòu):分錢博弈結(jié)點分枝結(jié)點擴展式博弈的基本思維方式 向前展望,向后推理 向前展望:如果我給他留90,他會怎么做? 向后推理:如果他拒絕接受),我該給他留多少?2-3 兩種形式的轉(zhuǎn)換 描述擴展式博弈的博弈樹與描述標(biāo)準(zhǔn)式博弈的支付矩陣可以相互轉(zhuǎn)換。(1標(biāo)準(zhǔn)式博弈轉(zhuǎn)換為擴展式博弈甲 1乙 -1甲 -1乙 1甲 -1乙 1甲 1乙 -1甲乙乙正面朝上反面朝上正面朝上反面朝上正

5、面朝上反面朝上硬幣游戲零和博弈) 信息集:當(dāng)參與人輪到自己行動時所了解的信息 在同時行動的博弈中,即使用擴展式博弈來描述,甲、乙的行動也是不分先后的 在上例中,可將乙放在甲的位置上,則甲的兩個結(jié)點屬于同一信息集信息集的特點 如果兩個結(jié)點同屬一個信息集,意味著參與人在兩個或兩個以上結(jié)點處知道相同的信息,因而,參與人在這兩個或兩個以上結(jié)點必然有同樣的行動集。(2標(biāo)準(zhǔn)式博弈轉(zhuǎn)換為擴展式博弈ultimatum bargaining game(分配100元錢)PayoffMatrixA給B90給B10B接受 10 90 90 10拒絕 0 0 0 0 相機戰(zhàn)略 這種表達(dá)意味著A、B同時行動 正確的表達(dá)應(yīng)

6、該使用每個人的戰(zhàn)略而不是行動) 這里的戰(zhàn)略是相機戰(zhàn)略 相機戰(zhàn)略: 僅在不確定性事件發(fā)生時才會采取的戰(zhàn)略 只有對方實施了某種戰(zhàn)略時,相機戰(zhàn)略才會生效 計劃里“假如這一假設(shè)條件成為現(xiàn)實時,該相機戰(zhàn)略才會被執(zhí)行 如果將戰(zhàn)略視為相機戰(zhàn)略, 則所有的博弈都可以用標(biāo)準(zhǔn)式博弈(22博弈)的支付矩陣表示分錢博弈中A、B的相機戰(zhàn)略 A:無論B接受還是拒絕,給10; 無論B接受還是拒絕,給90 B: 若給10接受, 若給90接受; 戰(zhàn)略1 若給10接受, 若給90拒絕; 戰(zhàn)略2 若給10拒絕, 若給90接受; 戰(zhàn)略3 若給10拒絕, 若給90拒絕 戰(zhàn)略4擴展式博弈與標(biāo)準(zhǔn)式博弈在描述的相互轉(zhuǎn)換2)ultimatum

7、 bargaining game(分配100元錢)A無論B是否接受,給B90( 9-1分)無論B是否接受,給B10( 1-9分)B如果9-1分,接受;如果1-9分,接受 1090 90 10如果9-1分,接受;如果1-9分,拒絕 1090 0 0如果9-1分,拒絕;如果1-9分,接受 00 90 10如果9-1分,拒絕;如果1-9分,拒絕 0 0 0 0 2-4 聯(lián)盟博弈 吳、蜀之間存在利益沖突,并多次兵戎相見,但兩國為什么在赤壁之戰(zhàn)中能結(jié)為聯(lián)盟? 聯(lián)盟:相互協(xié)調(diào)行動的一組博弈參與人 聯(lián)盟價值:一個聯(lián)盟的產(chǎn)出收益)2-4 幾種著名的博弈例子n 囚徒困境n 警方逮捕甲、乙兩名嫌疑犯,但沒有足夠證

8、據(jù)指控二人入罪。于是警方分開囚禁嫌疑犯,分別和二人見面,并向雙方提供以下相同的選擇: n (1若一人認(rèn)罪并作證檢控對方相關(guān)術(shù)語稱“背叛對方),而對方保持沉默,此人將即時獲釋,沉默者將判監(jiān)10年。 n (2若二人都保持沉默相關(guān)術(shù)語稱互相“合作”),則二人同樣判監(jiān)1年。 n (3若二人都互相檢舉相關(guān)術(shù)語稱互相“背叛”),則二人同樣判監(jiān)8年。 n 性別戰(zhàn)n 懦夫博弈斗雞博弈)n 鷹鴿博弈n 智豬博弈n 假設(shè)豬圈里有一頭大豬、一頭小豬。豬圈的一頭有豬食槽,另一頭安裝著控制豬食供應(yīng)的按鈕,按一下按鈕會有10個單位的豬食進槽,但是誰按按鈕就會首先付出2個單位的成本,若大豬先到槽邊,大小豬吃到食物的收益比是9 1;同時到槽邊,收益比是7 3;小豬先到槽邊,收益比是6 4。那么,在兩頭豬都有智慧的前提下,最終結(jié)果是小豬選擇等待。 n 猜硬幣游戲/包袱剪子錘n 最后通牒博弈小結(jié) 博弈有兩種形式:標(biāo)準(zhǔn)式也稱戰(zhàn)略式和擴展式 標(biāo)準(zhǔn)式博弈描述的是同時行動靜態(tài)) 擴展式博弈描述的是序貫行動動態(tài)) 標(biāo)準(zhǔn)式和擴展式可以相互轉(zhuǎn)化 動態(tài)博弈中將行動描述為相機戰(zhàn)略,也可以用標(biāo)準(zhǔn)式表示 標(biāo)準(zhǔn)式博弈使用信息集也可以用擴展式來表達(dá) 聯(lián)盟博弈是合作博弈練習(xí)與思考1:田忌賽馬n故事情節(jié)n博弈描述n參與人n戰(zhàn)略用靜態(tài)博弈方法)n結(jié)果與收益田忌賽馬田忌上中下上下中中上下中下上下上中下中上齊王上中下

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論