![博弈論與信息經(jīng)濟(jì)學(xué)講義06-5_第1頁](http://file4.renrendoc.com/view/1a8894302adb2f96ab6ad3967cd916fe/1a8894302adb2f96ab6ad3967cd916fe1.gif)
![博弈論與信息經(jīng)濟(jì)學(xué)講義06-5_第2頁](http://file4.renrendoc.com/view/1a8894302adb2f96ab6ad3967cd916fe/1a8894302adb2f96ab6ad3967cd916fe2.gif)
![博弈論與信息經(jīng)濟(jì)學(xué)講義06-5_第3頁](http://file4.renrendoc.com/view/1a8894302adb2f96ab6ad3967cd916fe/1a8894302adb2f96ab6ad3967cd916fe3.gif)
![博弈論與信息經(jīng)濟(jì)學(xué)講義06-5_第4頁](http://file4.renrendoc.com/view/1a8894302adb2f96ab6ad3967cd916fe/1a8894302adb2f96ab6ad3967cd916fe4.gif)
![博弈論與信息經(jīng)濟(jì)學(xué)講義06-5_第5頁](http://file4.renrendoc.com/view/1a8894302adb2f96ab6ad3967cd916fe/1a8894302adb2f96ab6ad3967cd916fe5.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
會(huì)計(jì)學(xué)1博弈論與信息經(jīng)濟(jì)學(xué)講義06-5主要內(nèi)容簡(jiǎn)介第一章概述-人生處處皆博弈第一篇非合作博弈理論第二章完全信息靜態(tài)信息博弈-納什均衡第三章
完全信息動(dòng)態(tài)搏弈-子博弈精煉納什均衡第四章不完全信息靜態(tài)博弈-貝葉斯納什均衡第五章不完全信息動(dòng)態(tài)博弈-精練貝葉斯納什均衡第1頁/共71頁第二篇信息經(jīng)濟(jì)學(xué)
第六章委托-代理理論(I)第七章委托-代理理論(II)第八章逆向選擇與信號(hào)傳遞
主要內(nèi)容簡(jiǎn)介第2頁/共71頁第三章
完全信息動(dòng)態(tài)搏弈
-子博弈精煉納什均衡一博弈擴(kuò)展式表述二子博弈精練納什均衡三應(yīng)用舉例第3頁/共71頁博弈的戰(zhàn)略表述案例-房地產(chǎn)開發(fā)項(xiàng)目-假設(shè)有A、B兩家開發(fā)商市場(chǎng)需求:可能大,也可能小投入:1億假定市場(chǎng)上有兩棟樓出售:需求大時(shí),每棟售價(jià)1.4億,需求小時(shí),售價(jià)7千萬;如果市場(chǎng)上只有一棟樓需求大時(shí),可賣1.8億需求小時(shí),可賣1.1億第4頁/共71頁博弈戰(zhàn)略表述4000,40008000,00,80000,0不開發(fā)開發(fā)商A開發(fā)不開發(fā)開發(fā)-3000,-30001000,00,10000,0不開發(fā)開發(fā)商B開發(fā)商A開發(fā)不開發(fā)開發(fā)開發(fā)商B需求小的情況需求大的情況博弈的戰(zhàn)略式表述第5頁/共71頁一博弈擴(kuò)展式表述博弈的擴(kuò)展式表述包括三個(gè)要素:參與人集合每個(gè)參與人的戰(zhàn)略集合由戰(zhàn)略組合決定的每個(gè)參與人的支付進(jìn)入者進(jìn)入不進(jìn)入(0,300)在位者市場(chǎng)進(jìn)入阻撓博弈樹不可置信威脅合作(40,50)斗爭(zhēng)(-10,0)第6頁/共71頁A開發(fā)不開發(fā)NN大小1/21/2大小1/21/2BBBB開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)參與人(A,B,N)戰(zhàn)略支付參與人集合參與人行動(dòng)順序參與人的行動(dòng)空間參與人的信息集參與人的支付函數(shù)外生事件的概率分布房地產(chǎn)開發(fā)博弈結(jié),決策結(jié)結(jié),終點(diǎn)結(jié)枝結(jié),初始結(jié)
信息集第7頁/共71頁一博弈擴(kuò)展式表述博弈的基本構(gòu)造結(jié):包括決策結(jié)和終點(diǎn)結(jié)兩類;決策結(jié)是參與人行動(dòng)的始點(diǎn),終點(diǎn)結(jié)是決策人行動(dòng)的終點(diǎn).結(jié)滿足傳遞性和非對(duì)稱性x之前的所有結(jié)的集合,稱為x的前列集P(x),x之后的所有結(jié)的集合稱為x的后續(xù)集T(x)。枝:枝是從一個(gè)決策結(jié)到它的直接后續(xù)結(jié)的連線,每一個(gè)枝代表參與人的一個(gè)行動(dòng)選擇.信息集:每個(gè)信息集是決策結(jié)集合的一個(gè)子集,該子集包括所有滿足下列條件的決策結(jié):1每個(gè)決策結(jié)都是同一個(gè)參與人的決策結(jié);2該參與人知道博弈進(jìn)入該集合的某個(gè)決策結(jié),但不知道自己究竟處于哪一個(gè)決策結(jié).第8頁/共71頁A開發(fā)不開發(fā)NN大小1/21/2大小1/21/2BBBB開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)B在決策時(shí)不確切地知道自然的選擇;B的決策結(jié)由4個(gè)變?yōu)?個(gè)房地產(chǎn)開發(fā)博弈第9頁/共71頁A開發(fā)不開發(fā)NN大小1/21/2大小1/21/2BBBB開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)B知道自然的選擇;但不知道A的選擇(或A、B同時(shí)決策)
房地產(chǎn)開發(fā)博弈第10頁/共71頁一博弈擴(kuò)展式表述只包含一個(gè)決策結(jié)的信息集稱為單結(jié)信息集,如果博弈樹的所有信息都是單結(jié)的,該博弈稱為完美信息博弈。自然總是假定是單結(jié)的,因?yàn)樽匀辉趨⑴c人決策之后行動(dòng)等價(jià)于自然在參與人之前行動(dòng)但參與人不能觀測(cè)到自然的行動(dòng)。不同的博弈樹可以代表相同的博弈,但是有一個(gè)基本規(guī)則:一個(gè)參與人在決策之前知道的事情,必須出現(xiàn)在該參與人決策結(jié)之前。第11頁/共71頁二占優(yōu)戰(zhàn)略均衡
案例1-囚徒困境-8,-80,-10-10,0-1,-1囚徒A囚徒B坦白抵賴坦白抵賴第12頁/共71頁AB坦白抵賴BBAA坦白抵賴坦白抵賴(-8,-8)(0,-10)(-10,0)(-1,-1)坦白抵賴坦白抵賴坦白抵賴(-8,-8)(0,-10)(-10,0)(-1,-1)囚徒困境博弈的擴(kuò)展式表述囚徒困境博弈的擴(kuò)展式表述第13頁/共71頁智豬博弈的擴(kuò)展式表述?5,14,49,-10,0等待小豬大豬按等待按案例2-智豬博弈第14頁/共71頁第三章
完全信息動(dòng)態(tài)搏弈
-子博弈精煉納什均衡一博弈擴(kuò)展式表述二子博弈精練納什均衡擴(kuò)展式表述博弈的納什均衡子博弈精練納什均衡用逆向歸納法求子搏弈精練納什均衡承諾行動(dòng)與子搏弈精練納什均衡逆向歸納法與子搏弈精練納什均衡的存在問題三應(yīng)用舉例第15頁/共71頁博弈的劃分博弈的劃分:從參與人行動(dòng)的先后順序:靜態(tài)博弈和動(dòng)態(tài)博弈靜態(tài)博弈:參與人同時(shí)選擇行動(dòng)或非同時(shí)行動(dòng)但后行動(dòng)者并不知道前行動(dòng)者采取了什么具體行動(dòng);動(dòng)態(tài)博弈:參與人行動(dòng)有先后順序,且后行動(dòng)者能夠觀察先行動(dòng)者選擇的行動(dòng)。第16頁/共71頁博弈的劃分參與人對(duì)其他參與人(對(duì)手)的特征、戰(zhàn)略空間及支付函數(shù)的知識(shí):完全信息博弈和不完全信息博弈。完全信息:每一個(gè)參與人對(duì)所有其他參與人的(對(duì)手)的特征、戰(zhàn)略空間及支付函數(shù)有準(zhǔn)確的知識(shí),否則為不完全信息。第17頁/共71頁博弈的劃分:
行動(dòng)順序信息靜態(tài)動(dòng)態(tài)完全信息完全信息靜態(tài)博弈納什均衡納什(1950,1951)完全信息動(dòng)態(tài)博弈子博弈精練納什均衡澤爾騰(1965)不完全信息不完全信息靜態(tài)博弈貝葉斯納什均衡海薩尼(1967-1968)不完全信息動(dòng)態(tài)博弈精練貝葉斯納什均衡澤爾騰(1965)Kreps和Wilson(1982)Fudenberg和Tirole(1991)第18頁/共71頁完全信息靜態(tài)博弈的特點(diǎn)?占優(yōu)均衡DSE重復(fù)剔除占優(yōu)均衡IEDE純戰(zhàn)略納什均衡PNE混合戰(zhàn)略納什均衡MNE第19頁/共71頁完全信息動(dòng)態(tài)博弈-子博弈精練納什均衡
澤爾騰(1965)考慮下列問題:一個(gè)博弈可能有多個(gè)(甚至無窮多個(gè))納什均衡,究竟哪個(gè)更合理?納什均衡假定每一個(gè)參與人在選擇自己的最優(yōu)戰(zhàn)略時(shí)假定所有其他參與人的戰(zhàn)略是給定的,但是如果參與人的行動(dòng)有先有后,后行動(dòng)者的選擇空間依賴于前行動(dòng)者的選擇,前行動(dòng)者在選擇時(shí)不可能不考慮自己的行動(dòng)對(duì)后行動(dòng)者的影響。子博弈精練納什均衡的一個(gè)重要改進(jìn)是將“合理納什均衡”與“不合理納什均衡”分開。第20頁/共71頁一、博弈的基本概念及戰(zhàn)略表述4000,40008000,00,80000,0不開發(fā)開發(fā)商A開發(fā)不開發(fā)開發(fā)-3000,-30001000,00,10000,0不開發(fā)開發(fā)商B開發(fā)商A開發(fā)不開發(fā)開發(fā)開發(fā)商B需求小的情況需求大的情況博弈的戰(zhàn)略式表述第21頁/共71頁擴(kuò)展式A開發(fā)不開發(fā)BB開發(fā)不開發(fā)開發(fā)(-3,-3)(1,0)(0,1)(0,0)不開發(fā)xx’納什均衡與均衡結(jié)果:存在三個(gè)純戰(zhàn)略納什均衡:
(不開發(fā),(開發(fā),開發(fā))),(開發(fā),(不開發(fā),開發(fā)),(開發(fā),(不開發(fā),不開發(fā)))兩個(gè)均衡結(jié)果:(開發(fā),不開發(fā))(不開發(fā),開發(fā))注意:均衡不同于均衡結(jié)果到底哪一個(gè)均衡結(jié)果將最終出現(xiàn)?第22頁/共71頁完全信息動(dòng)態(tài)博弈-子博弈精練納什均衡
澤爾騰(1965)澤爾騰引入子博弈精練納什均衡的概念的目的是將那些不可置信威脅戰(zhàn)略的納什均衡從均衡中剔除,從而給出動(dòng)態(tài)博弈的一個(gè)合理的預(yù)測(cè)結(jié)果,簡(jiǎn)單說,子博弈精練納什均衡要求均衡戰(zhàn)略的行為規(guī)則在每一個(gè)信息集上是最優(yōu)的。第23頁/共71頁承諾行動(dòng)與子博弈精練納什均衡承諾行動(dòng)與子博弈精練納什均衡有些戰(zhàn)略之所以不是精練納什均衡,是因?yàn)樗瞬豢芍眯诺耐{戰(zhàn)略,如果參與人能在博弈之前采取某種行動(dòng)改變自己的行動(dòng)空間或支付函數(shù),原來不可置信威脅將變得可置信,博弈的精練納什均衡也會(huì)隨之改變.這些改變博弈結(jié)果而采取的措施稱為承諾行動(dòng).完全承諾:承諾可以使某項(xiàng)行動(dòng)完全沒有可能(破釜沉舟).不完全承諾:承諾只是增加了某個(gè)行動(dòng)的成本而不是使該活動(dòng)完全沒有可能.第24頁/共71頁承諾行動(dòng)與子博弈精練納什均衡A開發(fā)不開發(fā)BB開發(fā)不開發(fā)開發(fā)(1,0)(0,1)(0,0)(-3,-3)xx’房地產(chǎn)開發(fā)博弈
如果在A決策之前,B與某客戶簽定了一個(gè)合同,規(guī)定B若不在特定時(shí)期內(nèi)開發(fā)若干面積的寫字樓,則將支付違約金3.5,這個(gè)合同就是承諾行動(dòng).(1,-3.5)第25頁/共71頁完全信息動(dòng)態(tài)博弈-子博弈精練納什均衡
澤爾騰(1965)
曹操與袁紹的倉亭之戰(zhàn),曹操召集將領(lǐng)來獻(xiàn)破袁之策,程昱獻(xiàn)了十面埋伏之計(jì),他讓曹操退軍河上,誘袁前來追擊,到那時(shí)“我軍無退路,必將死戰(zhàn),可退袁矣”。曹操采納此計(jì),令許褚誘袁軍軍至河上,曹軍無退路,操大呼曰:“前無去路,諸軍何不死戰(zhàn)!”,眾軍奮力回頭反擊,袁軍大敗。第26頁/共71頁第三章
完全信息動(dòng)態(tài)搏弈
-子博弈精煉納什均衡一博弈擴(kuò)展式表述二子博弈精練納什均衡擴(kuò)展式表述博弈的納什均衡子博弈精練納什均衡用逆向歸納法求子搏弈精練納什均衡承諾行動(dòng)與子搏弈精練納什均衡逆向歸納法與子搏弈精練納什均衡的存在問題三應(yīng)用舉例第27頁/共71頁戰(zhàn)略的表述戰(zhàn)略:參與人在給定信息集的情況下選擇行動(dòng)的規(guī)則,它規(guī)定參與人在什么情況下選擇什么行動(dòng),是參與人的“相機(jī)行動(dòng)方案”。在靜態(tài)博弈中,戰(zhàn)略和行動(dòng)是相同的。作為一種行動(dòng)規(guī)則,戰(zhàn)略必須是完備的。第28頁/共71頁擴(kuò)展式表述博弈的納什均衡足球男足球芭蕾女女芭蕾足球芭蕾(1,2)(-1,-1)(0,0)(2,1)xx’男的策略:{足球,芭蕾}選擇足球;還是選擇芭蕾。女的策略:(足球,芭蕾),(芭蕾,足球)(芭蕾,芭蕾),(足球,足球)1、追隨策略:他選擇什么,我就選擇什么2、對(duì)抗策略:他選擇什么,我就偏不選什么3、芭蕾策略:不管他選什么,我都選芭蕾;4、足球策略:不管他選什么,我都選足球。策略即:如果他選擇什么,我就怎樣行動(dòng)的相機(jī)行動(dòng)方案。在擴(kuò)展式博弈里,參與人是相機(jī)行事,即“等待”博弈到達(dá)一個(gè)自己的信息集(包含一個(gè)或多個(gè)決策結(jié)后,再采取行動(dòng)方案。什么是動(dòng)態(tài)博弈?第29頁/共71頁擴(kuò)展式表述博弈的納什均衡若A先行動(dòng),B在知道A的行動(dòng)后行動(dòng),則A有一個(gè)信息集,兩個(gè)可選擇的行動(dòng),戰(zhàn)略空間為:(開發(fā),不開發(fā));B有兩個(gè)信息集,四個(gè)可選擇的行動(dòng),B有四個(gè)純戰(zhàn)略:開發(fā)策略:不論A開發(fā)不開發(fā),我開發(fā);追隨策略:A開發(fā)我開發(fā),A不開發(fā)我不開發(fā);對(duì)抗策略:A開發(fā)我不開發(fā),A不開發(fā)我開發(fā);不開發(fā)策略不論A開發(fā)不開發(fā)我不開發(fā),簡(jiǎn)寫為:(開發(fā),開發(fā)),(開發(fā),不開發(fā)),(不開發(fā),開發(fā)),(不開發(fā),不開發(fā)),括號(hào)內(nèi)的第一個(gè)元素對(duì)應(yīng)A選擇“開發(fā)”時(shí)B的選擇,第二個(gè)元素對(duì)應(yīng)A選擇“不開發(fā)”時(shí)B的選擇。A開發(fā)不開發(fā)BB開發(fā)不開發(fā)開發(fā)(-3,-3)(1,0)(0,1)(0,0)不開發(fā)xx’什么是參與人的戰(zhàn)略?第30頁/共71頁擴(kuò)展式-3,-3-3,-31,01,00,10,00,10,0{開發(fā),開發(fā)}{開發(fā),不開發(fā)}{不開發(fā),開發(fā)}{不開發(fā),不開發(fā)}開發(fā)不開發(fā)開發(fā)商B開發(fā)商A戰(zhàn)略式A開發(fā)不開發(fā)BB開發(fā)不開發(fā)開發(fā)(-3,-3)(1,0)(0,1)(0,0)不開發(fā)xx’{開發(fā),(開發(fā),不開發(fā))}納什均衡與均衡結(jié)果:存在三個(gè)純戰(zhàn)略納什均衡:
(不開發(fā),(開發(fā),開發(fā))),(開發(fā),(不開發(fā),開發(fā)),(開發(fā),(不開發(fā),不開發(fā)))兩個(gè)均衡結(jié)果:(開發(fā),不開發(fā))(不開發(fā),開發(fā))注意:均衡不同于均衡結(jié)果第31頁/共71頁擴(kuò)展式-3,-3-3,-31,01,00,10,00,10,0{開發(fā),開發(fā)}{開發(fā),不開發(fā)}{不開發(fā),開發(fā)}{不開發(fā),不開發(fā)}開發(fā)不開發(fā)開發(fā)商B開發(fā)商A戰(zhàn)略式A開發(fā)不開發(fā)BB開發(fā)不開發(fā)開發(fā)(-3,-3)(1,0)(0,1)(0,0)不開發(fā)xx’{開發(fā),(開發(fā),不開發(fā))}路徑在擴(kuò)展式博弈中,所有n個(gè)參與人的一個(gè)純戰(zhàn)略組合決定了博弈樹上的一個(gè)路徑。(開發(fā),{不開發(fā),開發(fā)})決定了博弈的路徑為A—開發(fā)—B—不開發(fā)--(1,0)(不開發(fā),{開發(fā),開發(fā)})決定了路徑:?第32頁/共71頁第三章
完全信息動(dòng)態(tài)搏弈
-子博弈精煉納什均衡一博弈擴(kuò)展式表述二子博弈精練納什均衡擴(kuò)展式表述博弈的納什均衡子博弈精練納什均衡用逆向歸納法求子搏弈精練納什均衡承諾行動(dòng)與子搏弈精練納什均衡逆向歸納法與子搏弈精練納什均衡的存在問題三應(yīng)用舉例第33頁/共71頁子博弈精煉納什均衡澤爾騰引入子博弈精練納什均衡的概念的目的是將那些不可置信威脅戰(zhàn)略的納什均衡從均衡中剔除,從而給出動(dòng)態(tài)博弈的一個(gè)合理的預(yù)測(cè)結(jié)果,簡(jiǎn)單說,子博弈精練納什均衡要求均衡戰(zhàn)略的行為規(guī)則在每一個(gè)信息集上是最優(yōu)的。第34頁/共71頁子博弈精煉納什均衡-不可置信威脅美國普林斯頓大學(xué)古爾教授在1997年的《經(jīng)濟(jì)學(xué)透視》里發(fā)表文章,提出一個(gè)例子說明威脅的可信性問題:兩兄弟老是為玩具吵架,哥哥老是要搶弟弟的玩具,不耐煩的父親宣布政策:好好去玩,不要吵我,不管你們誰向我告狀,我都把你們兩個(gè)關(guān)起來,關(guān)起來比沒有玩具更可怕。現(xiàn)在,哥哥又把弟弟的玩具搶去玩了,弟弟沒有辦法,只好說:快把玩具還我,不然我就要去告訴爸爸。各個(gè)想,你真要告訴爸爸,我是要倒霉的,可是你不告狀不過沒有玩具玩,而告了狀卻要被關(guān)禁閉,告狀會(huì)使你的境遇變得更壞,所以你不會(huì)告狀,因此哥哥對(duì)弟弟的警告置之不理。的確,如果弟弟是會(huì)算計(jì)自己利益的理性人,在這樣的環(huán)境下,還是不告狀的好??梢?,弟弟是理性人,他的告狀威脅是不可置信的。第35頁/共71頁擴(kuò)展式A開發(fā)不開發(fā)BB開發(fā)不開發(fā)開發(fā)(-3,-3)(1,0)(0,1)(0,0)不開發(fā)xx’納什均衡與均衡結(jié)果:存在三個(gè)純戰(zhàn)略納什均衡:
(不開發(fā),(開發(fā),開發(fā))),(開發(fā),(不開發(fā),開發(fā)),(開發(fā),(不開發(fā),不開發(fā)))兩個(gè)均衡結(jié)果:(開發(fā),不開發(fā))(不開發(fā),開發(fā))注意:均衡不同于均衡結(jié)果到底哪一個(gè)均衡結(jié)果將最終出現(xiàn)?第36頁/共71頁子博弈精練納什均衡A開發(fā)不開發(fā)BB開發(fā)不開發(fā)開發(fā)(-3,-3)(1,0)(0,1)(0,0)不開發(fā)(不開發(fā),(開發(fā),開發(fā))),(開發(fā),(不開發(fā),開發(fā)),(開發(fā),(不開發(fā),不開發(fā)))
如果A選擇開發(fā),B的最優(yōu)選擇是不開發(fā),如果A選擇不開發(fā),B的最優(yōu)選擇是開發(fā),A預(yù)測(cè)到自己的選擇對(duì)B的影響,因此開發(fā)是A的最優(yōu)選擇。子博弈精練納什均衡結(jié)果是:A選擇開發(fā),B選擇不開發(fā)。xx’
對(duì)于(不開發(fā),(開發(fā),開發(fā))),這個(gè)組合之所以構(gòu)成納什均衡,是因?yàn)锽威脅不論A開發(fā)還是不開發(fā),他都將選擇開發(fā),A相信了B的威脅,不開發(fā)是最優(yōu)選擇,但是A為什么要相信B的威脅呢?畢竟,如果A真開發(fā),B選擇開發(fā)得-3,不開發(fā)得0,所以B的最優(yōu)選擇是不開發(fā)。如果A知道B是理性的,A將選擇開發(fā),逼迫B選擇不開發(fā)。自己得1,B得0,即納什均衡(不開發(fā),(開發(fā),開發(fā)))是不可置信的。因?yàn)樗蕾囉贐的一個(gè)不可置信的威脅。同樣:(不開發(fā),不開發(fā))也是一個(gè)不可置信威脅,納什均衡(開發(fā),(不開發(fā),不開發(fā)))是不合理的。第37頁/共71頁子博弈精練納什均衡澤爾騰引入子博弈精練納什均衡的概念的目的是將那些不可置信威脅戰(zhàn)略的納什均衡從均衡中剔除,從而給出動(dòng)態(tài)博弈的一個(gè)合理的預(yù)測(cè)結(jié)果,簡(jiǎn)單說,子博弈精練納什均衡要求均衡戰(zhàn)略的行為規(guī)則在每一個(gè)信息集上是最優(yōu)的。什么是子博弈,什么是子博弈精練納什均衡?有沒有更好的方法找到子博弈精練納什均衡?第38頁/共71頁完全信息動(dòng)態(tài)博弈-子博弈精練納什均衡
澤爾騰(1965)子博弈:是原博弈的一部分,它本身也可以作為一個(gè)獨(dú)立的博弈進(jìn)行分析:(1)子博弈必須從一個(gè)單結(jié)信息點(diǎn)開始:只有決策者在原博弈中確切地知道博弈進(jìn)入一個(gè)特定的決策結(jié)時(shí),該決策結(jié)才能作為一個(gè)子博弈的初始結(jié)。如果信息集包含兩個(gè)以上的決策結(jié),則這兩個(gè)都不可以作為子博弈的初始結(jié)(見下頁)。(2)子博弈的信息集和支付向量都直接繼承自原博弈,即當(dāng)x’和x’’在原博弈中屬于同一信息集時(shí),他們?cè)谧硬┺闹胁艑儆谕恍畔⒓?。?xí)慣上,任何博弈的本身稱為自身的一個(gè)子博弈。第39頁/共71頁完全信息動(dòng)態(tài)博弈-子博弈精練納什均衡
澤爾騰(1965)不開發(fā)A開發(fā)不開發(fā)BB開發(fā)不開發(fā)開發(fā)(1,0)(0,1)(0,0)(-3,-3)xx’不開發(fā)開發(fā)不開發(fā)(1,0)(-3,-3)x開發(fā)(0,1)(0,0)x’子博弈I子博弈II房地產(chǎn)開發(fā)博弈A坦白抵賴BB坦白抵賴坦白(-8,-8)(0,-10)(-10,0)(-1,-1)找出房地產(chǎn)開發(fā)博弈的子博弈(不開發(fā),(開發(fā),開發(fā))),(開發(fā),(不開發(fā),開發(fā)),(開發(fā),(不開發(fā),不開發(fā)))第40頁/共71頁A開發(fā)不開發(fā)XX大小1/21/2大小1/21/2BBBB開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)
參與人X的信息集不能開始一個(gè)子博弈,否則的話,參與人B的信息將被切割。第41頁/共71頁完全信息動(dòng)態(tài)博弈-子博弈精練納什均衡
澤爾騰(1965)子博弈精練納什均衡:擴(kuò)展式博弈的戰(zhàn)略組合是一個(gè)子博弈精練納什均衡,如果:(1)它是原博弈的納什均衡;(2)它在每一個(gè)子博弈上給出納什均衡。第42頁/共71頁A開發(fā)不開發(fā)BB開發(fā)不開發(fā)開發(fā)(1,0)(0,1)(0,0)(-3,-3)xx’房地產(chǎn)開發(fā)博弈開發(fā)不開發(fā)(1,0)(-3,-3)x開發(fā)(0,1)(0,0)x’子博弈I子博弈II(不開發(fā),(開發(fā),開發(fā))),(開發(fā),(不開發(fā),開發(fā)),(開發(fā),(不開發(fā),不開發(fā)))在c上構(gòu)成均衡,在b上不構(gòu)成;在b和c上都構(gòu)成在c上構(gòu)成均衡,在b上不構(gòu)成完全信息動(dòng)態(tài)博弈-子博弈精練納什均衡
澤爾騰(1965)不開發(fā)
判斷下列均衡結(jié)果哪個(gè)構(gòu)成子博弈精練納什均衡?不開發(fā)bc第43頁/共71頁完全信息動(dòng)態(tài)博弈-子博弈精練納什均衡
澤爾騰(1965)如果一個(gè)博弈有幾個(gè)子博弈,一個(gè)特定的納什均衡決定了原博弈樹上唯一的一條路徑,這條路徑稱為“均衡路徑”,博弈樹上的其他路徑稱為“非均衡路徑”。納什均衡只要求均衡戰(zhàn)略在均衡路徑的決策結(jié)上是最優(yōu)的;而構(gòu)成子博弈精練納什均衡不僅要求在均衡路徑上策略是最優(yōu)的,而且在非均衡路徑上的決策結(jié)上也是最優(yōu)的。這是納什均衡與子博弈精練納什均衡的實(shí)質(zhì)區(qū)別。第44頁/共71頁完全信息動(dòng)態(tài)博弈-子博弈精練納什均衡
澤爾騰(1965)戰(zhàn)略是參與人行動(dòng)規(guī)則的完備描述,它要告訴參與人在每一種可預(yù)見的情況下(即每一個(gè)決策結(jié))上選擇什么行動(dòng),即使這種情況實(shí)際上沒有發(fā)生(甚至參與人并不預(yù)期它會(huì)發(fā)生)。因此,只有當(dāng)一個(gè)戰(zhàn)略規(guī)定的行動(dòng)規(guī)則在所有可能的情況下都是最優(yōu)的,它才是一個(gè)合理的可置信的戰(zhàn)略,子博弈精練納什均衡就是要剔除那些只在特定情況下是合理的而在其他情況下不合理的行動(dòng)規(guī)則。第45頁/共71頁第三章
完全信息動(dòng)態(tài)搏弈
-子博弈精煉納什均衡一博弈擴(kuò)展式表述二子博弈精練納什均衡擴(kuò)展式表述博弈的納什均衡子博弈精練納什均衡用逆向歸納法求子搏弈精練納什均衡承諾行動(dòng)與子搏弈精練納什均衡逆向歸納法與子搏弈精練納什均衡的存在問題三應(yīng)用舉例第46頁/共71頁用逆向歸納法求-子博弈精練納什均衡1UDL(3,1)(0,0)22,2R
給定博弈達(dá)到最后一個(gè)決策結(jié),該決策結(jié)上行動(dòng)的參與人有一個(gè)最優(yōu)選擇,這個(gè)最優(yōu)選擇即該決策結(jié)開始的子博弈的納什均衡倒數(shù)第二個(gè)決策結(jié),找倒數(shù)第二個(gè)的最優(yōu)選擇,這個(gè)最優(yōu)選擇與我們?cè)诘谝徊秸业降淖顑?yōu)選擇構(gòu)成一個(gè)納什均衡。
如此重復(fù)直到初始結(jié)。每一步都得到對(duì)應(yīng)于子博弈的一個(gè)納什均衡,并且根據(jù)定義,該納什均衡一定是該子博弈的子博弈的納什均衡,這個(gè)過程的最后一步得到整個(gè)博弈的納什均衡第47頁/共71頁完全信息動(dòng)態(tài)博弈-子博弈精練納什均衡
澤爾騰(1965)用逆向歸納法求子博弈精練納什均衡
對(duì)于有限完美信息博弈,逆向歸納法求解子博弈精練納什均衡是一個(gè)最簡(jiǎn)便的方法。A開發(fā)不開發(fā)BB開發(fā)不開發(fā)開發(fā)(1,0)(0,1)(0,0)(-3,-3)xx’房地產(chǎn)開發(fā)博弈第48頁/共71頁完全信息動(dòng)態(tài)博弈-子博弈精練納什均衡
澤爾騰(1965)1UDL(1,1)22,0RU’(3,0)(0,2)2D’
子博弈精練納什均衡((U,U’),L).U’和L分別是參與人1和參與人2在非均衡路徑上的選擇。逆向歸納法求解子博弈精練納什均衡的過程,實(shí)質(zhì)上是重復(fù)剔除劣戰(zhàn)略的過程:從最后一個(gè)決策結(jié)依次剔除每個(gè)子博弈的劣戰(zhàn)略,最后生存下來的戰(zhàn)略構(gòu)成精練納什均衡。第49頁/共71頁完全信息動(dòng)態(tài)博弈-子博弈精練納什均衡
澤爾騰(1965)用逆向歸納法求解的子博弈精練納什均衡也要求“所有的參與人是理性的”是共同知識(shí)。如果博弈由多個(gè)階段組成,則從逆向歸納法得到的均衡可能并不非常令人信服。第50頁/共71頁完全信息動(dòng)態(tài)博弈-子博弈精練納什均衡
澤爾騰(1965)進(jìn)入者進(jìn)入不進(jìn)入(0,300)在位者市場(chǎng)進(jìn)入阻撓博弈樹不可置信威脅支付函數(shù)行動(dòng)合作(40,50)斗爭(zhēng)(-10,0)第51頁/共71頁完全信息動(dòng)態(tài)博弈-子博弈精練納什均衡
澤爾騰(1965)練習(xí):---作業(yè)6參與人1(丈夫)和參與人2(妻子)必須獨(dú)立決定出門時(shí)是否帶傘。他們知道下雨和不下雨的可能性軍委50%,支付函數(shù)為:如果只有一人帶傘,下雨時(shí)帶傘者的效用為-2.5,不帶傘者的效用為-3不下雨時(shí)帶傘的效用為-1,不帶的效用為0;如兩人都不帶傘,下雨時(shí)每人的效用為-5,不下雨時(shí)每人的效用為1;給出下列四種情況下的擴(kuò)展式及戰(zhàn)略式表述:(1)兩人出門前都不知道是否會(huì)下雨;并且兩人同時(shí)決定是否帶傘(即每一方在決策時(shí)都不知道對(duì)方的決策);(2)兩人在出門前都不知道是否會(huì)下雨,但丈夫先決策,妻子觀察到丈夫是否帶傘后才決定自己是否帶傘;(3)丈夫出門前知道是否會(huì)下雨,但妻子不知道,但丈夫先決策,妻子后決策;(4),同(3),但妻子先決策,丈夫后決策.第52頁/共71頁第三章
完全信息動(dòng)態(tài)搏弈
-子博弈精煉納什均衡一博弈擴(kuò)展式表述二子博弈精練納什均衡擴(kuò)展式表述博弈的納什均衡子博弈精練納什均衡用逆向歸納法求子搏弈精練納什均衡承諾行動(dòng)與子搏弈精練納什均衡逆向歸納法與子搏弈精練納什均衡的存在問題三應(yīng)用舉例第53頁/共71頁承諾行動(dòng)與子博弈精練納什均衡承諾行動(dòng)與子博弈精練納什均衡有些戰(zhàn)略之所以不是精練納什均衡,是因?yàn)樗瞬豢芍眯诺耐{戰(zhàn)略,如果參與人能在博弈之前采取某種行動(dòng)改變自己的行動(dòng)空間或支付函數(shù),原來不可置信威脅將變得可置信,博弈的精練納什均衡也會(huì)隨之改變.這些改變博弈結(jié)果而采取的措施稱為承諾行動(dòng).完全承諾:承諾可以使某項(xiàng)行動(dòng)完全沒有可能(破釜沉舟).不完全承諾:承諾只是增加了某個(gè)行動(dòng)的成本而不是使該活動(dòng)完全沒有可能.第54頁/共71頁承諾行動(dòng)與子博弈精練納什均衡
曹操與袁紹的倉亭之戰(zhàn),曹操召集將領(lǐng)來獻(xiàn)破袁之策,程昱獻(xiàn)了十面埋伏之計(jì),他讓曹操退軍河上,誘袁前來追擊,到那時(shí)“我軍無退路,必將死戰(zhàn),可退袁矣”。曹操采納此計(jì),令許褚誘袁軍軍至河上,曹軍無退路,操大呼曰:“前無去路,諸軍何不死戰(zhàn)!”,眾軍奮力回頭反擊,袁軍大敗。第55頁/共71頁承諾行動(dòng)與子博弈精練納什均衡A開發(fā)不開發(fā)BB開發(fā)不開發(fā)開發(fā)(1,0)(0,1)(0,0)(-3,-3)xx’房地產(chǎn)開發(fā)博弈
如果在A決策之前,B與某客戶簽定了一個(gè)合同,規(guī)定B若不在特定時(shí)期內(nèi)開發(fā)若干面積的寫字樓,則將支付違約金3.5,這個(gè)合同就是承諾行動(dòng).(1,-3.5)第56頁/共71頁承諾行動(dòng)與子博弈精練納什均衡經(jīng)常有這樣的情況,非理性-通常是自動(dòng)的而不是策略性的-是一個(gè)優(yōu)勢(shì)。在電影《怪愛博士》中的末日機(jī)器就是一個(gè)例子。前蘇聯(lián)認(rèn)為不可能在一場(chǎng)理性的軍備競(jìng)賽中超過更富有的美國,所以,他制造了一顆炸彈,如果任何人引爆了這顆炸彈,它將自動(dòng)炸毀整個(gè)世界。著部電影描述了這樣一個(gè)細(xì)節(jié),你必須告訴對(duì)方你有這么一個(gè)末日機(jī)器。據(jù)說前美國總統(tǒng)尼克松曾告訴他的副手哈德蔓,他對(duì)這個(gè)策略更復(fù)雜的看法:我稱為瘋子理論,我要讓北越相信我已經(jīng)到了無論付出多少都要結(jié)束戰(zhàn)爭(zhēng)的地步,我們只要他聽到這樣的傳聞:“看在上帝的份上,尼克松已經(jīng)被共產(chǎn)黨搞瘋了,當(dāng)他生氣的時(shí)候,我們沒法制止他,他的手已經(jīng)按在核按紐上了?!焙久鲀商熘髸?huì)到巴黎求和的。第57頁/共71頁第三章
完全信息動(dòng)態(tài)搏弈
-子博弈精煉納什均衡一博弈擴(kuò)展式表述二擴(kuò)展式表述博弈的納什均衡三子博弈精練納什均衡子博弈精練納什均衡用逆向歸納法求子搏弈精練納什均衡承諾行動(dòng)與子搏弈精練納什均衡逆向歸納法與子搏弈精練納什均衡的存在問題四重復(fù)博弈和無名氏定理五應(yīng)用舉例第58頁/共71頁逆向歸納法與子搏弈精練納什均衡的存在問題1D(1,…,1)A2D(1/2,…,1/2)AiD(1/i,…,1/i)AnD(1/n,…,1/n)A……
逆向歸納法要求“所有參與人是理性的”是所有參與人的共同知識(shí)。因此,在有多個(gè)參與人或每個(gè)參與人有多次行動(dòng)機(jī)會(huì)的情況下,逆向歸納法的結(jié)果可能并非如此。多個(gè)參與人的情況(2,…,2)如果n很小,逆向歸納法的結(jié)果第59頁/共71頁逆向歸納法與子搏弈精練納什均衡的存在問題如果n很大,結(jié)果又如何呢?1D(1,…,1)A2D(1/2,…,1/2)AiD(1/i,…,1/i)AnD(1/n,…,1/n)A……多個(gè)參與人的情況(2,…,2)如果n很大
對(duì)于參與人1,獲得2單位支付前提是所有n-1個(gè)參與人都選A,否則就要考慮是否應(yīng)該選擇D以保證1的支付。如果給定一個(gè)參與人選擇A的概率是p<1,所有n-1個(gè)參與人選擇A的概率是pn-1,如果n很大,這個(gè)值就很??;另外,即使參與人1確信所有n-1個(gè)參與人都選A,他也可能懷疑是否第2個(gè)參與人相信所有n-2個(gè)參與人都選A。這個(gè)鏈越長,共同知識(shí)的要求就越難滿足。第60頁/共71頁逆向歸納法與子搏弈精練納什均衡的存在問題1D(1,0)A2D(0,2)A2D(N,0)A(0,N+1)逆向歸納法的結(jié)果:一開始,就結(jié)束!A1D(0,N-1)A1D(3,0)A2D(0,4)A每個(gè)參與人有多個(gè)行動(dòng)機(jī)會(huì)的蜈蚣博弈…
A、B進(jìn)行游戲決策,如果A在第一輪決策,得1,B得0,否則進(jìn)入第二輪,B決策得2,A得0……第61頁/共71頁逆向歸納法與子搏弈精練納什均衡的存在問題1D(1,1)A2D(0,3)A1D(98,98)A2D(98,101)A…另一種蜈蚣博弈(100,100)逆向歸納法的結(jié)果:一開始,就結(jié)束!2D(97,100)A1D(99,99)A
有兩個(gè)參與人A、B,若第一次A決策結(jié)束,A、B都得n,若B決策結(jié)束,A得n-1,B得n+2,下一輪從A、A都是n+1開始,共100次,每個(gè)參與人有100個(gè)決策結(jié)。1D(2,2)A2D(1,4)A
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024-2025學(xué)年四年級(jí)數(shù)學(xué)上冊(cè)第八單元垂線與平行線課時(shí)8認(rèn)識(shí)平行線教案蘇教版
- 高中文科班班主任學(xué)期工作計(jì)劃
- 行政人事個(gè)人上半年工作總結(jié)
- 我班主任工作總結(jié)
- 小學(xué)五年級(jí)第二學(xué)期班主任工作計(jì)劃
- 技術(shù)入股出資合作協(xié)議書范本
- 光伏電站并網(wǎng)發(fā)電項(xiàng)目EC總承包合同范本
- 前期物業(yè)服務(wù)合同范本
- 企業(yè)網(wǎng)站建設(shè)代理合同
- 中考數(shù)學(xué)復(fù)習(xí)第6課時(shí)《一次方程組及其應(yīng)用》聽評(píng)課記錄
- 中學(xué)生低碳生活調(diào)查報(bào)告
- 游泳池經(jīng)營合作方案
- 弱電項(xiàng)目經(jīng)理工作總結(jié)
- 擘畫未來技術(shù)藍(lán)圖
- 基于情報(bào)基本理論的公安情報(bào)
- 《“白山黑水”-東北三省》示范課課件(第1課時(shí))
- 員工節(jié)能環(huán)保培訓(xùn)課件
- 四年級(jí)下冊(cè)部編版語文教學(xué)參考教師用書
- 華為公司的內(nèi)部審計(jì)制度
- 月球基地建設(shè)與運(yùn)行管理模式
- 腫瘤醫(yī)院病歷書寫培訓(xùn)課件
評(píng)論
0/150
提交評(píng)論