




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、第五講第五講混合策略和混合策略納什均衡混合策略和混合策略納什均衡5.1 嚴(yán)格競爭博弈和混合策略的引進(jìn)嚴(yán)格競爭博弈和混合策略的引進(jìn)沒有納什均衡策略組合,無法用前述納什均衡概念分析的博弈問題:沒有納什均衡策略組合,無法用前述納什均衡概念分析的博弈問題:-1, 11, -11, -1-1, 1正 面反 面猜硬幣方猜硬幣方蓋蓋硬硬幣幣方方正 面反 面取勝關(guān)鍵:不能讓另一方猜到自己的策略不能讓另一方猜到自己的策略 盡可能猜出對(duì)方策略盡可能猜出對(duì)方策略各博弈方必須保證自身策略選擇的隨機(jī)性;各博弈方必須保證自身策略選擇的隨機(jī)性; 重視各個(gè)策略的概率分布重視各個(gè)策略的概率分布蓋硬幣方n避免自己的選擇帶有規(guī)律性
2、避免自己的選擇帶有規(guī)律性n如果你選擇出正面的概率為如果你選擇出正面的概率為p,則出反面的概率就,則出反面的概率就是是1-p,出正面多于出反面,意思味著,出正面多于出反面,意思味著p1/2,對(duì)方如果全猜正面,則他的期望利益為:對(duì)方如果全猜正面,則他的期望利益為:p*1+(1-P)*(-1)=2p-10n最可靠的方法是以相同的概率隨機(jī)出正面和反面最可靠的方法是以相同的概率隨機(jī)出正面和反面即取即取p=1/2n很顯然,雙方都以很顯然,雙方都以1/2的概率隨機(jī)選擇正面、反的概率隨機(jī)選擇正面、反面時(shí),雙方都面時(shí),雙方都無法無法根據(jù)對(duì)方的選擇方式,根據(jù)對(duì)方的選擇方式,調(diào)整調(diào)整自自己的策略或選擇方式己的策略或
3、選擇方式獲得利益獲得利益。n雙方可選策略隨機(jī)選擇概率達(dá)到了穩(wěn)定(雙方可選策略隨機(jī)選擇概率達(dá)到了穩(wěn)定(均衡均衡)混合策略:混合策略: 博弈方以博弈方以一定的概率一定的概率分布在可選策略中分布在可選策略中隨機(jī)選擇隨機(jī)選擇的的決策方式。決策方式。n在博弈 中,博弈方 的策略空間為 ,則博弈方 以概率分布 隨機(jī)在其 個(gè)可選策略中選擇的“策略”,稱為一個(gè)“混合策略”,其中 對(duì) 都成立,且 n純策略也可以看成混合策略,納什均衡策略組合中的策略純策略也可以看成混合策略,納什均衡策略組合中的策略選擇概率為選擇概率為1,其他策略的選擇概率為,其他策略的選擇概率為0。n在混合策略的意義上定義納什均衡:任何博弈方在
4、混合策略的意義上定義納什均衡:任何博弈方單獨(dú)改變單獨(dú)改變自己的策略自己的策略或者或者隨機(jī)選擇各個(gè)純策略的概率分布隨機(jī)選擇各個(gè)純策略的概率分布,都不能都不能給自己給自己增加增加任何利益。任何利益。 ,;,11nnuuSSGi,1ikiissSki),(1ikiippp10ijpkj, 111ikipp2, 35, 23, 11, 5CDAB博弈方2博弈方15213BABApppp1352DCDCpppp博弈方1的混合策略博弈方2的混合策略n 策略 得益n博弈方1 (0.8,0.2) 2.6n博弈方2 (0.8,0.2) 2.6不存在純策略均衡。不存在純策略均衡。決策時(shí)利用隨機(jī)性;決策時(shí)利用隨機(jī)性
5、;選擇每種策略的概率要恰好使對(duì)方無機(jī)可乘。選擇每種策略的概率要恰好使對(duì)方無機(jī)可乘。確定性選擇的策略稱確定性選擇的策略稱“純策略純策略”雙方都以雙方都以1/6的相同概率隨機(jī)選擇各自的六個(gè)純策略,構(gòu)的相同概率隨機(jī)選擇各自的六個(gè)純策略,構(gòu)成本博弈的唯一的成本博弈的唯一的混合策略納什均衡混合策略納什均衡。齊威王的期望得益齊威王的期望得益?田忌的期望得益田忌的期望得益?田忌賽馬3,-31,-11,-11,-1-1,11,-11,-13,-31,-11,-11,-1-1,11,-1-1,13,-31,-11,-11,-1-1,1 1,-11,-13,-31,-11,-11,-11,-11,-1-1,13,
6、-31,-11,-11,-1-1,11,-11,-13,-3上中下上中下上中下上中下上中下上中下上中下上中下上中下上中下上中下上中下田忌田忌 齊齊威威王王得益矩陣1994年經(jīng)濟(jì)學(xué)諾貝爾獎(jiǎng)得主之一的塞爾頓教授。不存在純策略納什均衡。守衛(wèi)睡策略的期望得益為:S(1-pt)+(-D)pt小偷和守衛(wèi)的博弈V,-D-P,00,S0,0睡不睡偷不偷守衛(wèi)守衛(wèi)小小偷偷加重對(duì)守衛(wèi)的處罰:短期效果是使守衛(wèi)更盡職但長期中并不是使守衛(wèi)更盡職,而是會(huì)降低盜竊發(fā)生的概率0- D- D守衛(wèi)得益(睡)SPt 小偷偷的概率1p*p*小偷和守衛(wèi)的博弈V,-D-P,00,S0,0睡不睡偷不偷守衛(wèi)守衛(wèi)小小偷偷加重對(duì)小偷的處罰:短期內(nèi)
7、能抑制盜竊發(fā)生率長期并不能降低盜竊發(fā)生率,但會(huì)使得守衛(wèi)更多的偷懶當(dāng)然,把守衛(wèi)可以更輕松掙錢看成增加社會(huì)福利或理解成少派守衛(wèi),那么加重對(duì)小偷的懲罰還是有意義的。0- P- P小偷得益(偷)VPg 守衛(wèi)睡的概率15.2 多重均衡博弈和混合策略n夫妻之爭的混合策略納什均衡2, 10, 00, 01, 3歌劇足 球歌劇足球丈丈 夫夫妻妻子子夫妻之爭夫妻之爭3)(0)(0)(1)(FpCpFpCpwwww1)(0)(0)(2)(FpCpFpCphhhh妻子的混合策略丈夫的混合策略 策略 期望得益博弈方1 (0.75,0.25) 0.67博弈方2 (1/3,2/3) 0.75結(jié)果明顯不如雙方交流協(xié)商:任何
8、一方至少得1在經(jīng)濟(jì)活動(dòng)中有許多與夫妻之爭相似的博弈問題。在經(jīng)濟(jì)活動(dòng)中有許多與夫妻之爭相似的博弈問題。電器往往有不同的原理或相關(guān)技術(shù)標(biāo)準(zhǔn)(制式),如果廠電器往往有不同的原理或相關(guān)技術(shù)標(biāo)準(zhǔn)(制式),如果廠商采用相同制式,對(duì)于推廣各自的產(chǎn)品很有幫助。設(shè)有兩商采用相同制式,對(duì)于推廣各自的產(chǎn)品很有幫助。設(shè)有兩個(gè)廠商同時(shí)計(jì)劃收進(jìn)生產(chǎn)線,有個(gè)廠商同時(shí)計(jì)劃收進(jìn)生產(chǎn)線,有A、B兩種不同制式。兩種不同制式。制式問題1, 30, 00, 02, 2ABAB廠商廠商2廠廠商商1制式問題制式問題 A B 得益廠商1: 0.4 0.6 0.664廠商2: 0.67 0.33 1.296兩個(gè)純策略均衡(兩個(gè)純策略均衡(A,
9、A)、()、(B,B),廠商),廠商1更喜歡后一個(gè),更喜歡后一個(gè),而廠商而廠商2更喜歡前一個(gè),如果更喜歡前一個(gè),如果不協(xié)商不協(xié)商,混合策略納什均衡,混合策略納什均衡結(jié)果結(jié)果是不理想是不理想的。在引進(jìn)技術(shù)、投資、開發(fā)產(chǎn)品等問題上,不同的。在引進(jìn)技術(shù)、投資、開發(fā)產(chǎn)品等問題上,不同廠商廠商各自為政的行為常常導(dǎo)致低效率各自為政的行為常常導(dǎo)致低效率。市場機(jī)會(huì)博弈-50,-50100,00,1000,0進(jìn)不 進(jìn)進(jìn)不進(jìn)廠商廠商2廠廠商商1市場機(jī)會(huì)市場機(jī)會(huì) 進(jìn) 不進(jìn) 得益廠商1: 2/3 1/3 0廠商2: 2/3 1/3 05.3 混合策略和嚴(yán)格下策反復(fù)消去法混合策略和嚴(yán)格下策反復(fù)消去法n在包括混合策略的情
10、況下,關(guān)于嚴(yán)格下策反復(fù)在包括混合策略的情況下,關(guān)于嚴(yán)格下策反復(fù)消去法的結(jié)論仍然成立。消去法的結(jié)論仍然成立。n任何博弈方都不會(huì)采用任何嚴(yán)格下策;嚴(yán)格下任何博弈方都不會(huì)采用任何嚴(yán)格下策;嚴(yán)格下策反復(fù)消去法不會(huì)消去任何納什均衡;如果經(jīng)策反復(fù)消去法不會(huì)消去任何納什均衡;如果經(jīng)過反復(fù)消去后留下的策略組合是唯一的,那么過反復(fù)消去后留下的策略組合是唯一的,那么一定是納什均衡。一定是納什均衡。n不論是純策略還是混合策略不論是純策略還是混合策略不管博弈方不管博弈方2采用哪種策略,包括所有可能的純策略和所采用哪種策略,包括所有可能的純策略和所有的混合策略,博弈方有的混合策略,博弈方1混合策略混合策略(1/2,1/
11、2,0)的期望利益的期望利益始終為始終為3/2,都大于采用,都大于采用D策略時(shí)能得到的確定性收益策略時(shí)能得到的確定性收益1 3, 10, 20, 23, 31, 31, 1LRUMD博弈方博弈方2博博弈弈方方123212111003eu23212111030eu博弈方2采用純策略L時(shí),博弈方1采用混合策略(1/2,1/2,0)的得益博弈方2采用純策略R時(shí),博弈方1采用混合策略(1/2,1/2,0)的得益即使博弈方2采用混合策略(q,1-q),博弈方1采用上述混合策略的利益還是:232121212113)1 (00)1 (3qqqquen消去D策略后的得益矩陣n此時(shí),L策是博弈方2的相對(duì)于R的嚴(yán)格下策,也可以將它從博弈方2的策略空間中消去。n納什均衡為(M,R)3
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- T/CMES 15001-2023自行式自上料攪拌機(jī)通用技術(shù)要求
- T/CHES 96-2023河口監(jiān)測浮標(biāo)技術(shù)條件
- T/CHES 91-2023連續(xù)磁性陰離子交換水處理技術(shù)規(guī)范
- T/CEMIA 005-2018光伏單晶硅生長用石英坩堝生產(chǎn)規(guī)范
- T/CECS 10336-2023地面防滑性能分級(jí)及試驗(yàn)方法
- T/CECS 10173-2022皮芯結(jié)構(gòu)熱壓交聯(lián)高分子胎基濕鋪防水卷材
- T/CECS 10065-2019綠色建材評(píng)價(jià)采光系統(tǒng)
- T/CECA-G 0282-2024鋼結(jié)構(gòu)工業(yè)建筑碳排放計(jì)算標(biāo)準(zhǔn)
- T/CCSAS 036-2023非均相分離單元操作機(jī)械化、自動(dòng)化設(shè)計(jì)方案指南
- T/CCOA 48-2023高直鏈淀粉玉米
- 年產(chǎn)10萬噸聚丙烯聚合工段工藝設(shè)計(jì)-本科畢業(yè)設(shè)計(jì)論文管理資料
- 小學(xué)生防跟蹤安全教育
- DB32/T 4880-2024民用建筑碳排放計(jì)算標(biāo)準(zhǔn)
- 浙江大學(xué)研究生導(dǎo)師培訓(xùn)心得體會(huì)
- 勞動(dòng)與社會(huì)保障專業(yè)大學(xué)生職業(yè)生涯發(fā)展
- DB11T 2335-2024 既有建筑外門窗改造及驗(yàn)收技術(shù)標(biāo)準(zhǔn)
- 外研版(三起)小學(xué)英語三年級(jí)下冊(cè)Unit 1 Animal friends Get ready start up 課件
- 數(shù)碼相機(jī)-SONY索尼-α200(DSLR-A200)(快速入門指南)說明書
- 2024年中國海鮮水餃?zhǔn)袌稣{(diào)查研究報(bào)告
- 模擬試卷(7)-【中職專用】2025年職教高考語文沖刺模擬卷(職教高考)解析版
- 【MOOC】成本會(huì)計(jì)學(xué)-西北農(nóng)林科技大學(xué) 中國大學(xué)慕課MOOC答案
評(píng)論
0/150
提交評(píng)論