版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、第五講第五講混合策略和混合策略納什均衡混合策略和混合策略納什均衡5.1 嚴(yán)格競爭博弈和混合策略的引進(jìn)嚴(yán)格競爭博弈和混合策略的引進(jìn)沒有納什均衡策略組合,無法用前述納什均衡概念分析的博弈問題:沒有納什均衡策略組合,無法用前述納什均衡概念分析的博弈問題:-1, 11, -11, -1-1, 1正 面反 面猜硬幣方猜硬幣方蓋蓋硬硬幣幣方方正 面反 面取勝關(guān)鍵:不能讓另一方猜到自己的策略不能讓另一方猜到自己的策略 盡可能猜出對方策略盡可能猜出對方策略各博弈方必須保證自身策略選擇的隨機(jī)性;各博弈方必須保證自身策略選擇的隨機(jī)性; 重視各個(gè)策略的概率分布重視各個(gè)策略的概率分布蓋硬幣方n避免自己的選擇帶有規(guī)律性
2、避免自己的選擇帶有規(guī)律性n如果你選擇出正面的概率為如果你選擇出正面的概率為p,則出反面的概率就,則出反面的概率就是是1-p,出正面多于出反面,意思味著,出正面多于出反面,意思味著p1/2,對方如果全猜正面,則他的期望利益為:對方如果全猜正面,則他的期望利益為:p*1+(1-P)*(-1)=2p-10n最可靠的方法是以相同的概率隨機(jī)出正面和反面最可靠的方法是以相同的概率隨機(jī)出正面和反面即取即取p=1/2n很顯然,雙方都以很顯然,雙方都以1/2的概率隨機(jī)選擇正面、反的概率隨機(jī)選擇正面、反面時(shí),雙方都面時(shí),雙方都無法無法根據(jù)對方的選擇方式,根據(jù)對方的選擇方式,調(diào)整調(diào)整自自己的策略或選擇方式己的策略或
3、選擇方式獲得利益獲得利益。n雙方可選策略隨機(jī)選擇概率達(dá)到了穩(wěn)定(雙方可選策略隨機(jī)選擇概率達(dá)到了穩(wěn)定(均衡均衡)混合策略:混合策略: 博弈方以博弈方以一定的概率一定的概率分布在可選策略中分布在可選策略中隨機(jī)選擇隨機(jī)選擇的的決策方式。決策方式。n在博弈 中,博弈方 的策略空間為 ,則博弈方 以概率分布 隨機(jī)在其 個(gè)可選策略中選擇的“策略”,稱為一個(gè)“混合策略”,其中 對 都成立,且 n純策略也可以看成混合策略,納什均衡策略組合中的策略純策略也可以看成混合策略,納什均衡策略組合中的策略選擇概率為選擇概率為1,其他策略的選擇概率為,其他策略的選擇概率為0。n在混合策略的意義上定義納什均衡:任何博弈方在
4、混合策略的意義上定義納什均衡:任何博弈方單獨(dú)改變單獨(dú)改變自己的策略自己的策略或者或者隨機(jī)選擇各個(gè)純策略的概率分布隨機(jī)選擇各個(gè)純策略的概率分布,都不能都不能給自己給自己增加增加任何利益。任何利益。 ,;,11nnuuSSGi,1ikiissSki),(1ikiippp10ijpkj, 111ikipp2, 35, 23, 11, 5CDAB博弈方2博弈方15213BABApppp1352DCDCpppp博弈方1的混合策略博弈方2的混合策略n 策略 得益n博弈方1 (0.8,0.2) 2.6n博弈方2 (0.8,0.2) 2.6不存在純策略均衡。不存在純策略均衡。決策時(shí)利用隨機(jī)性;決策時(shí)利用隨機(jī)性
5、;選擇每種策略的概率要恰好使對方無機(jī)可乘。選擇每種策略的概率要恰好使對方無機(jī)可乘。確定性選擇的策略稱確定性選擇的策略稱“純策略純策略”雙方都以雙方都以1/6的相同概率隨機(jī)選擇各自的六個(gè)純策略,構(gòu)的相同概率隨機(jī)選擇各自的六個(gè)純策略,構(gòu)成本博弈的唯一的成本博弈的唯一的混合策略納什均衡混合策略納什均衡。齊威王的期望得益齊威王的期望得益?田忌的期望得益田忌的期望得益?田忌賽馬3,-31,-11,-11,-1-1,11,-11,-13,-31,-11,-11,-1-1,11,-1-1,13,-31,-11,-11,-1-1,1 1,-11,-13,-31,-11,-11,-11,-11,-1-1,13,
6、-31,-11,-11,-1-1,11,-11,-13,-3上中下上中下上中下上中下上中下上中下上中下上中下上中下上中下上中下上中下田忌田忌 齊齊威威王王得益矩陣1994年經(jīng)濟(jì)學(xué)諾貝爾獎(jiǎng)得主之一的塞爾頓教授。不存在純策略納什均衡。守衛(wèi)睡策略的期望得益為:S(1-pt)+(-D)pt小偷和守衛(wèi)的博弈V,-D-P,00,S0,0睡不睡偷不偷守衛(wèi)守衛(wèi)小小偷偷加重對守衛(wèi)的處罰:短期效果是使守衛(wèi)更盡職但長期中并不是使守衛(wèi)更盡職,而是會(huì)降低盜竊發(fā)生的概率0- D- D守衛(wèi)得益(睡)SPt 小偷偷的概率1p*p*小偷和守衛(wèi)的博弈V,-D-P,00,S0,0睡不睡偷不偷守衛(wèi)守衛(wèi)小小偷偷加重對小偷的處罰:短期內(nèi)
7、能抑制盜竊發(fā)生率長期并不能降低盜竊發(fā)生率,但會(huì)使得守衛(wèi)更多的偷懶當(dāng)然,把守衛(wèi)可以更輕松掙錢看成增加社會(huì)福利或理解成少派守衛(wèi),那么加重對小偷的懲罰還是有意義的。0- P- P小偷得益(偷)VPg 守衛(wèi)睡的概率15.2 多重均衡博弈和混合策略n夫妻之爭的混合策略納什均衡2, 10, 00, 01, 3歌劇足 球歌劇足球丈丈 夫夫妻妻子子夫妻之爭夫妻之爭3)(0)(0)(1)(FpCpFpCpwwww1)(0)(0)(2)(FpCpFpCphhhh妻子的混合策略丈夫的混合策略 策略 期望得益博弈方1 (0.75,0.25) 0.67博弈方2 (1/3,2/3) 0.75結(jié)果明顯不如雙方交流協(xié)商:任何
8、一方至少得1在經(jīng)濟(jì)活動(dòng)中有許多與夫妻之爭相似的博弈問題。在經(jīng)濟(jì)活動(dòng)中有許多與夫妻之爭相似的博弈問題。電器往往有不同的原理或相關(guān)技術(shù)標(biāo)準(zhǔn)(制式),如果廠電器往往有不同的原理或相關(guān)技術(shù)標(biāo)準(zhǔn)(制式),如果廠商采用相同制式,對于推廣各自的產(chǎn)品很有幫助。設(shè)有兩商采用相同制式,對于推廣各自的產(chǎn)品很有幫助。設(shè)有兩個(gè)廠商同時(shí)計(jì)劃收進(jìn)生產(chǎn)線,有個(gè)廠商同時(shí)計(jì)劃收進(jìn)生產(chǎn)線,有A、B兩種不同制式。兩種不同制式。制式問題1, 30, 00, 02, 2ABAB廠商廠商2廠廠商商1制式問題制式問題 A B 得益廠商1: 0.4 0.6 0.664廠商2: 0.67 0.33 1.296兩個(gè)純策略均衡(兩個(gè)純策略均衡(A,
9、A)、()、(B,B),廠商),廠商1更喜歡后一個(gè),更喜歡后一個(gè),而廠商而廠商2更喜歡前一個(gè),如果更喜歡前一個(gè),如果不協(xié)商不協(xié)商,混合策略納什均衡,混合策略納什均衡結(jié)果結(jié)果是不理想是不理想的。在引進(jìn)技術(shù)、投資、開發(fā)產(chǎn)品等問題上,不同的。在引進(jìn)技術(shù)、投資、開發(fā)產(chǎn)品等問題上,不同廠商廠商各自為政的行為常常導(dǎo)致低效率各自為政的行為常常導(dǎo)致低效率。市場機(jī)會(huì)博弈-50,-50100,00,1000,0進(jìn)不 進(jìn)進(jìn)不進(jìn)廠商廠商2廠廠商商1市場機(jī)會(huì)市場機(jī)會(huì) 進(jìn) 不進(jìn) 得益廠商1: 2/3 1/3 0廠商2: 2/3 1/3 05.3 混合策略和嚴(yán)格下策反復(fù)消去法混合策略和嚴(yán)格下策反復(fù)消去法n在包括混合策略的情
10、況下,關(guān)于嚴(yán)格下策反復(fù)在包括混合策略的情況下,關(guān)于嚴(yán)格下策反復(fù)消去法的結(jié)論仍然成立。消去法的結(jié)論仍然成立。n任何博弈方都不會(huì)采用任何嚴(yán)格下策;嚴(yán)格下任何博弈方都不會(huì)采用任何嚴(yán)格下策;嚴(yán)格下策反復(fù)消去法不會(huì)消去任何納什均衡;如果經(jīng)策反復(fù)消去法不會(huì)消去任何納什均衡;如果經(jīng)過反復(fù)消去后留下的策略組合是唯一的,那么過反復(fù)消去后留下的策略組合是唯一的,那么一定是納什均衡。一定是納什均衡。n不論是純策略還是混合策略不論是純策略還是混合策略不管博弈方不管博弈方2采用哪種策略,包括所有可能的純策略和所采用哪種策略,包括所有可能的純策略和所有的混合策略,博弈方有的混合策略,博弈方1混合策略混合策略(1/2,1/
11、2,0)的期望利益的期望利益始終為始終為3/2,都大于采用,都大于采用D策略時(shí)能得到的確定性收益策略時(shí)能得到的確定性收益1 3, 10, 20, 23, 31, 31, 1LRUMD博弈方博弈方2博博弈弈方方123212111003eu23212111030eu博弈方2采用純策略L時(shí),博弈方1采用混合策略(1/2,1/2,0)的得益博弈方2采用純策略R時(shí),博弈方1采用混合策略(1/2,1/2,0)的得益即使博弈方2采用混合策略(q,1-q),博弈方1采用上述混合策略的利益還是:232121212113)1 (00)1 (3qqqquen消去D策略后的得益矩陣n此時(shí),L策是博弈方2的相對于R的嚴(yán)格下策,也可以將它從博弈方2的策略空間中消去。n納什均衡為(M,R)3
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年白糖供應(yīng)與采購合同
- 2025年度航空航天導(dǎo)航系統(tǒng)研發(fā)合同3篇
- 《2024版協(xié)議離婚申請書范本:專業(yè)指導(dǎo)與法律問題解答》3篇
- 2025年度體育場館場地設(shè)施設(shè)備租賃及管理服務(wù)合同3篇
- 2025版大理石地磚石材回收與資源循環(huán)利用合同3篇
- 2025年新能源鏟車租賃及維護(hù)服務(wù)合同3篇
- 2024年瓶裝水銷售合同范本
- 2025年寵物寄養(yǎng)服務(wù)與寵物醫(yī)療支持合同3篇
- 【培訓(xùn)課件】JIT精益生產(chǎn)實(shí)務(wù)
- 2024年鋁墻面板安裝分包合作協(xié)議
- 2025年中國誠通控股集團(tuán)限公司校園招聘高頻重點(diǎn)提升(共500題)附帶答案詳解
- 《Unit 5 What do we eat 》(說課稿)-2024-2025學(xué)年滬教版(2024)英語三年級(jí)上冊
- 2024年加油站的年度工作總結(jié)范文(2篇)
- (新版)廣電全媒體運(yùn)營師資格認(rèn)證考試復(fù)習(xí)題庫(含答案)
- ISO27001信息安全管理體系培訓(xùn)資料
- 紅色經(jīng)典影片與近現(xiàn)代中國發(fā)展學(xué)習(xí)通超星期末考試答案章節(jié)答案2024年
- 基金應(yīng)知應(yīng)會(huì)專項(xiàng)考試題庫(證券類190題)附有答案
- 健康體檢的八大意義
- 銷售顧問初級(jí)認(rèn)證筆試題
- 市場化人才選聘管理辦法
- 急性早幼粒細(xì)胞白血病及分化綜合征
評論
0/150
提交評論