完全信息動態(tài)博弈(課堂PPT)_第1頁
完全信息動態(tài)博弈(課堂PPT)_第2頁
完全信息動態(tài)博弈(課堂PPT)_第3頁
完全信息動態(tài)博弈(課堂PPT)_第4頁
完全信息動態(tài)博弈(課堂PPT)_第5頁
已閱讀5頁,還剩52頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、12.3 2.3 完全信息動態(tài)博弈完全信息動態(tài)博弈本節(jié)內(nèi)容:本節(jié)內(nèi)容:n一一 博弈擴展式表述博弈擴展式表述n二二 子博弈完美納什均衡子博弈完美納什均衡n三三 應(yīng)用舉例應(yīng)用舉例2博弈的戰(zhàn)略表述博弈的戰(zhàn)略表述案例- 房地產(chǎn)開發(fā)項目-假設(shè)有A、B兩家開發(fā)商市場需求:可能大,也可能小投入:1億v假定市場上有兩棟樓出售:假定市場上有兩棟樓出售:需求大時,需求大時,每棟售價每棟售價1.41.4億億,需求小時,需求小時,售價售價7 7千萬千萬;v如果市場上只有一棟樓如果市場上只有一棟樓需求大時,需求大時,可賣可賣1.81.8億億需求小時,需求小時,可賣可賣1.11.1億億3博弈戰(zhàn)略表述博弈戰(zhàn)略表述40004

2、000,4000400080008000,0 00 0,800080000 0,0 0不開發(fā)開發(fā)商A開發(fā)不開發(fā)開發(fā)-3000-3000,-3000-300010001000,0 00 0,100010000 0,0 0不開發(fā)開發(fā)商B開發(fā)商A開發(fā)不開發(fā)開發(fā)開發(fā)商B需求小的情況需求小的情況需求大的情況需求大的情況博弈的戰(zhàn)略式表述4博弈的擴展式表述o 擴展式表述所擴展式表述所“擴展擴展”的主要是參與人的戰(zhàn)略空間的主要是參與人的戰(zhàn)略空間o 戰(zhàn)略式表述簡單地給出參與人有些什么戰(zhàn)略可以選擇,戰(zhàn)略式表述簡單地給出參與人有些什么戰(zhàn)略可以選擇,而擴展式表述要給出而擴展式表述要給出每個戰(zhàn)略的每個戰(zhàn)略的動態(tài)動態(tài)描述

3、描述:誰在什么時:誰在什么時候行動,每次行動時有些什么具體行動方案可供選擇,候行動,每次行動時有些什么具體行動方案可供選擇,以及知道些什么以及知道些什么o 此時的戰(zhàn)略:如果你這樣,我將怎樣此時的戰(zhàn)略:如果你這樣,我將怎樣5博弈的擴展式表述要素:要素: 參與人集合參與人集合 參與人的行動順序參與人的行動順序 參與人的行動空間參與人的行動空間 參與人的信息集參與人的信息集 參與人的支付函數(shù)參與人的支付函數(shù) 外生事件外生事件( (即即“自然自然”的選擇的選擇) )的概率分布的概率分布6A開發(fā)不開發(fā)NN大小1/21/2大小1/2BBBB開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)(4,4)(8,0)(-3

4、,-3)(1,0)(0,8)(0,0)(0,1)(0,0)參與人(A,B,N)戰(zhàn)略支付參與人集合參與人行動順序參與人的行動空間參與人的信息集參與人的支付函數(shù)外生事件的概率分布房地產(chǎn)開發(fā)博弈結(jié),決策結(jié)結(jié),終點結(jié)枝結(jié),初始結(jié) 信息集結(jié)結(jié): : 包括決策結(jié)和終點結(jié)兩類包括決策結(jié)和終點結(jié)兩類; ;決策結(jié)決策結(jié)是參與人行動的始點是參與人行動的始點, ,終點結(jié)是決策人終點結(jié)是決策人行動的終點行動的終點. .結(jié)滿足傳遞性和非對稱性結(jié)滿足傳遞性和非對稱性x x之前的所有結(jié)的集合,稱為之前的所有結(jié)的集合,稱為x x的的前列前列集集P P(x x),),x x之后的所有結(jié)的集合稱為之后的所有結(jié)的集合稱為x x的的

5、后續(xù)集后續(xù)集T T(x x)。)。l枝枝: : 枝是從一個決策結(jié)到它的直接后枝是從一個決策結(jié)到它的直接后續(xù)結(jié)的連線續(xù)結(jié)的連線, ,每一個枝代表參與人的一每一個枝代表參與人的一個行動選擇個行動選擇. .l信息集信息集: : 每個信息集是決策結(jié)集合的每個信息集是決策結(jié)集合的一個子集一個子集, ,該子集包括所有滿足下列條該子集包括所有滿足下列條件的決策結(jié)件的決策結(jié): :1 1 每個決策結(jié)都是同一個參與人的決每個決策結(jié)都是同一個參與人的決策結(jié)策結(jié); ;2 2 該參與人知道博弈進入該集合的某該參與人知道博弈進入該集合的某個決策結(jié)個決策結(jié), ,但不知道自己究竟處于哪一但不知道自己究竟處于哪一個決策結(jié)個決策

6、結(jié). .7信息集:房地產(chǎn)博弈IIA 開發(fā) 不開發(fā) 大 小 大 小開發(fā) 不開發(fā) 開 不開 開 不開 開 不開 (4,4) (8,0) (-3,-3) (1,0) (0,8) (0,0) (0,1) (0,0) N1 N2 B1 B2 B3 B4 B在決策時不確切地知道自然的選擇; B的決策結(jié)由4個變?yōu)?個8信息集:房地產(chǎn)博弈IIIA 開發(fā) 不開發(fā) 大 小 大 小開發(fā) 不開發(fā) 開 不開 開 不開 開 不開 (4,4) (8,0) (-3,-3) (1,0) (0,8) (0,0) (0,1) (0,0) N1 N2 B1 B2 B3 B4 B知道自然的選擇;但不知道A的選擇(或A、B同時決策) 9

7、信息集:房地產(chǎn)博弈IVN 大 小 開 不開 開 不開開發(fā) 不開發(fā) 開 不開 開 不開 開 不開 (4,4) (8,0) (0,8) (0,0) (-3,-3) (1,0) (0,1) (0,0) B1 B2 A1 A2 A3 A410博弈擴展式表述o 只包含一個決策結(jié)的信息集稱為只包含一個決策結(jié)的信息集稱為單結(jié)信息集單結(jié)信息集,如果如果博弈樹的所有信息都是單結(jié)的,該博弈稱為完美信博弈樹的所有信息都是單結(jié)的,該博弈稱為完美信息博弈。息博弈。o 自然總是假定是單結(jié)的,自然總是假定是單結(jié)的,因為自然在參與人決策之因為自然在參與人決策之后行動等價于自然在參與人之前行動但參與人不能后行動等價于自然在參與

8、人之前行動但參與人不能觀測到自然的行動。觀測到自然的行動。o 不同的博弈樹可以代表相同的博弈,但是有一個基不同的博弈樹可以代表相同的博弈,但是有一個基本規(guī)則:本規(guī)則:一個參與人在決策之前知道的事情,必須一個參與人在決策之前知道的事情,必須出現(xiàn)在該參與人決策結(jié)之前。出現(xiàn)在該參與人決策結(jié)之前。11AB坦白抵賴BBAA坦白抵賴坦白抵賴(-8,-8)(0,-10)(-10,0) (-1,-1)坦白抵賴坦白抵賴坦白抵賴(-8,-8)(0,-10) (-10,0)(-1,-1)囚徒困境博弈的擴展式表述囚徒困境博弈的擴展式表述12智豬博弈的擴展式表述?5,14,49,-10,0等待小豬大豬按等待按案例2-智

9、豬博弈13動態(tài)博弈的戰(zhàn)略的表述動態(tài)博弈的戰(zhàn)略的表述戰(zhàn)略:參與人在給定信息集的情況下選擇行動的規(guī)則,它規(guī)定戰(zhàn)略:參與人在給定信息集的情況下選擇行動的規(guī)則,它規(guī)定參與人在什么情況下選擇什么行動,是參與人的參與人在什么情況下選擇什么行動,是參與人的“相機行動方相機行動方案案”。 個人選擇的戰(zhàn)略表示第)稱為一個戰(zhàn)略組合,(維向量戰(zhàn)略,個參與人每人選擇一個如果戰(zhàn)略集合個參與人所有可選擇的代表第個參與人的特定戰(zhàn)略表示第issssssnnisSisiniiii21在靜態(tài)博弈中,戰(zhàn)略和行動是相同的。在靜態(tài)博弈中,戰(zhàn)略和行動是相同的。作為一種行動規(guī)則,戰(zhàn)略必須是完備的。作為一種行動規(guī)則,戰(zhàn)略必須是完備的。14性

10、別戰(zhàn)博弈的擴展式表述男足球芭蕾女女芭蕾足球芭蕾(1,2)(-1,-1)(0,0)(2,1)xx女足球芭蕾男男芭蕾足球芭蕾(1,2)(-1,-1)(0,0)(2,1)xx15擴展式表述博弈的戰(zhàn)略擴展式表述博弈的戰(zhàn)略足球男足球芭蕾女女芭蕾足球芭蕾(1,2)(-1,-1)(0,0)(2,1)xx男的策略:足球,芭蕾選擇足球;還是選擇芭蕾。女的策略:(足球,芭蕾),(芭蕾,足球)(芭蕾,芭蕾),(足球,足球)1、追隨策略:他選擇什么,我就選擇什么2、對抗策略:他選擇什么,我就偏不選什么3、芭蕾策略:不管他選什么,我都選芭蕾;4、足球策略:不管他選什么,我都選足球。策略即:策略即:如果他選擇什么,我就怎

11、樣行動的相機行動方案。在擴展如果他選擇什么,我就怎樣行動的相機行動方案。在擴展式博弈里,參與人是相機行事,即式博弈里,參與人是相機行事,即“等待等待”博弈到達一個自己的博弈到達一個自己的信息集(包含一個或多個決策結(jié)信息集(包含一個或多個決策結(jié))后,再采取行動方案。后,再采取行動方案。16擴展式表述博弈的納什均衡擴展式表述博弈的納什均衡o若A先行動,B在知道A的行動后行動,則A有一個信息集,兩個可選擇的行動,戰(zhàn)略空間為:(:(開發(fā),不開發(fā))開發(fā),不開發(fā));oB有兩個信息集,四個可選擇的行動,B有四個純戰(zhàn)略:開發(fā)策略:不論開發(fā)策略:不論A A開發(fā)不開發(fā),我開發(fā);開發(fā)不開發(fā),我開發(fā);追隨策略:追隨策

12、略:A A開發(fā)我開發(fā),開發(fā)我開發(fā),A A不開發(fā)我不開發(fā);不開發(fā)我不開發(fā);對抗策略:對抗策略:A A開發(fā)我不開發(fā),開發(fā)我不開發(fā),A A不開發(fā)我開發(fā);不開發(fā)我開發(fā);不開發(fā)策略不論不開發(fā)策略不論A A開發(fā)不開發(fā)我不開發(fā),開發(fā)不開發(fā)我不開發(fā),o簡寫為:簡寫為:o(開發(fā),開發(fā)),(開發(fā),不開發(fā)),(開發(fā),開發(fā)),(開發(fā),不開發(fā)),(不開發(fā),開發(fā)),(不開發(fā),不開(不開發(fā),開發(fā)),(不開發(fā),不開發(fā)),發(fā)),括號內(nèi)的第一個元素對應(yīng)A選擇“開發(fā)”時B的選擇,第二個元素對應(yīng)A選擇“不開發(fā)”時B的選擇。A開發(fā)不開發(fā)BB開發(fā)不開發(fā)開發(fā)(-3,-3)(1,0)(0,1)(0,0)不開發(fā)xx什么是參與人什么是參與人的戰(zhàn)

13、略?的戰(zhàn)略?17擴展式擴展式-3, -3-3, -31, 01, 00, 10, 00, 10, 0開發(fā),開發(fā)開發(fā),不開發(fā)不開發(fā), 開發(fā)不開發(fā),不開發(fā)開發(fā)不開發(fā)開發(fā)商開發(fā)商B B開發(fā)商開發(fā)商A A戰(zhàn)略式戰(zhàn)略式A開發(fā)不開發(fā)BB開發(fā)不開發(fā)開發(fā)(-3,-3)(1,0)(0,1)(0,0)不開發(fā)xx路徑路徑在擴展式博弈中,所有在擴展式博弈中,所有n n個參與人個參與人的一個純戰(zhàn)略組合決定了博弈樹的一個純戰(zhàn)略組合決定了博弈樹上的一個路徑。上的一個路徑。(開發(fā),(開發(fā), 不開發(fā),開發(fā)不開發(fā),開發(fā) )決定)決定了博弈的路徑為了博弈的路徑為A A開發(fā)開發(fā)B B不不開發(fā)開發(fā)-(1 1,0 0)(不開發(fā),(不開發(fā)

14、, 開發(fā),開發(fā)開發(fā),開發(fā) )決定)決定了路徑:?了路徑:?18課堂練習(xí)課堂練習(xí): :o參與人參與人1 1(丈夫)和參與人(丈夫)和參與人2 2(妻子)必須獨立決定出門時是否(妻子)必須獨立決定出門時是否帶傘。他們知道下雨和不下雨的可能性均為帶傘。他們知道下雨和不下雨的可能性均為50%50%,支付函數(shù)為:,支付函數(shù)為:如果只有一人帶傘,下雨時帶傘者的效用為如果只有一人帶傘,下雨時帶傘者的效用為-2.5-2.5,不帶傘者的,不帶傘者的效用為效用為-3-3;不下雨時帶傘的效用為;不下雨時帶傘的效用為-1,-1,不帶的效用為不帶的效用為0 0;如兩人;如兩人都不帶傘都不帶傘, ,下雨時每人的效用為下雨

15、時每人的效用為-5,-5,不下雨時每人的效用為不下雨時每人的效用為1;1;給給出下列四種情況下的擴展式及戰(zhàn)略式表述出下列四種情況下的擴展式及戰(zhàn)略式表述: :(1)(1)兩人出門前都不知道是否會下雨兩人出門前都不知道是否會下雨; ;并且兩人同時決定是否帶并且兩人同時決定是否帶傘傘( (即每一方在決策時都不知道對方的決策即每一方在決策時都不知道對方的決策););(2)(2)兩人在出門前都不知道是否會下雨兩人在出門前都不知道是否會下雨, ,但丈夫先決策,妻子觀但丈夫先決策,妻子觀察到丈夫是否帶傘后才決定自己是否帶傘察到丈夫是否帶傘后才決定自己是否帶傘; ;(3)(3)丈夫出門前知道是否會下雨丈夫出門

16、前知道是否會下雨, ,但妻子不知道,但丈夫先決策,但妻子不知道,但丈夫先決策,妻子后決策妻子后決策; ;(4),(4),同同(3),(3),但妻子先決策,丈夫后決策但妻子先決策,丈夫后決策. .19完全信息動態(tài)博弈完全信息動態(tài)博弈- -子博弈完美納什均衡子博弈完美納什均衡澤爾騰(澤爾騰(19651965)o 考慮下列問題:考慮下列問題: 一個博弈可能有多個(甚至無窮多個)納什均衡,究竟一個博弈可能有多個(甚至無窮多個)納什均衡,究竟哪個更合理?哪個更合理? 納什均衡納什均衡假定每一個參與人在選擇自己的最優(yōu)戰(zhàn)略時假假定每一個參與人在選擇自己的最優(yōu)戰(zhàn)略時假定所有其他參與人的戰(zhàn)略是給定的定所有其他參

17、與人的戰(zhàn)略是給定的,但是如果參與人的,但是如果參與人的行動有先有后,后行動者的選擇空間依賴于前行動者的行動有先有后,后行動者的選擇空間依賴于前行動者的選擇,前行動者在選擇時不可能不考慮自己的行動對后選擇,前行動者在選擇時不可能不考慮自己的行動對后行動者的影響。行動者的影響。 子博弈完美納什均衡的一個重要改進是將子博弈完美納什均衡的一個重要改進是將“合理納什均合理納什均衡衡”與與“不合理納什均衡不合理納什均衡”分開。分開。20完全信息動態(tài)博弈-子博弈完美納什均衡(舉例)澤爾騰(1965)進入者進入不進入(0,300)在位者合作(40,50)斗爭(-10,0)市場進入阻撓博弈樹特點:剔除博弈中包含

18、的不可置信威脅。 承諾行動-破釜沉舟-背水一戰(zhàn)v給定進入者進入,剔除(進入,斗爭),(進入,默許)是唯一的子博弈完美納什均衡不可置信威脅支付函數(shù)行動21子博弈完美納什均衡子博弈完美納什均衡o 一個納什均衡稱為完美納什均衡,當(dāng)只當(dāng)參與人的戰(zhàn)略在每個子博弈中都構(gòu)成納什均衡,也就是說,組成完美納什均衡的戰(zhàn)略必須在每一個子博弈中都是最優(yōu)的。o 一個完美納什均衡首先必須是一個納什均衡,但納什均衡不一定是完美納什均衡。o 承諾行動-當(dāng)事人使自己的威脅戰(zhàn)略變得可置信的行動。22完全信息動態(tài)博弈完全信息動態(tài)博弈- -子博弈完美納什均衡子博弈完美納什均衡澤爾騰(澤爾騰(19651965)o 澤爾騰引入子博弈完美

19、納什均衡的概念的目的是將那些不可置信威脅戰(zhàn)略的納什均衡從均衡中剔除,從而給出動態(tài)博弈的一個合理的預(yù)測結(jié)果,簡單說,子博弈完美納什均衡要求均衡戰(zhàn)略的行為規(guī)則在每一個信息集上是最優(yōu)的。23子博弈完美納什均衡子博弈完美納什均衡- -不可置信威脅不可置信威脅o美國普林斯頓大學(xué)古爾教授在美國普林斯頓大學(xué)古爾教授在19971997年的年的經(jīng)濟學(xué)透視經(jīng)濟學(xué)透視里發(fā)表文里發(fā)表文章,提出一個例子說明威脅的可信性問題:章,提出一個例子說明威脅的可信性問題:o兩兄弟老是為玩具吵架,哥哥老是要搶弟弟的玩具,不耐煩的父親宣布兩兄弟老是為玩具吵架,哥哥老是要搶弟弟的玩具,不耐煩的父親宣布政策:好好去玩,不要吵我,不管你們

20、誰向我告狀,我都把你們兩個關(guān)政策:好好去玩,不要吵我,不管你們誰向我告狀,我都把你們兩個關(guān)起來,關(guān)起來比沒有玩具更可怕。現(xiàn)在,哥哥又把弟弟的玩具搶去玩了,起來,關(guān)起來比沒有玩具更可怕?,F(xiàn)在,哥哥又把弟弟的玩具搶去玩了,弟弟沒有辦法,只好說:快把玩具還我,不然我就要去告訴爸爸。哥哥弟弟沒有辦法,只好說:快把玩具還我,不然我就要去告訴爸爸。哥哥想,你真要告訴爸爸,我是要倒霉的,可是你不告狀不過沒有玩具玩,想,你真要告訴爸爸,我是要倒霉的,可是你不告狀不過沒有玩具玩,而告了狀卻要被關(guān)禁閉,告狀會使你的境遇變得更壞,所以你不會告狀,而告了狀卻要被關(guān)禁閉,告狀會使你的境遇變得更壞,所以你不會告狀,因此哥

21、哥對弟弟的警告置之不理因此哥哥對弟弟的警告置之不理。o的確,如果弟弟是會算計自己利益的理性人,在這樣的環(huán)境下,的確,如果弟弟是會算計自己利益的理性人,在這樣的環(huán)境下,還是不告狀的好??梢姡艿苁抢硇匀?,他的告狀威脅是不可置還是不告狀的好??梢姡艿苁抢硇匀?,他的告狀威脅是不可置信的。信的。24子博弈完美納什均衡子博弈完美納什均衡A開發(fā)不開發(fā)BB開發(fā)不開發(fā)開發(fā)(-3,-3)(1,0)(0,1)(0,0)不開發(fā)( (不開發(fā),(開發(fā),開發(fā)),(開發(fā),(不開發(fā),開發(fā)),(開發(fā)不開發(fā),(開發(fā),開發(fā)),(開發(fā),(不開發(fā),開發(fā)),(開發(fā), ,(不開發(fā),不開發(fā))(不開發(fā),不開發(fā)) 如果如果A A選擇開發(fā),選擇

22、開發(fā),B B的最優(yōu)選擇是不開發(fā),如果的最優(yōu)選擇是不開發(fā),如果A A選擇不開發(fā),選擇不開發(fā),B B的最優(yōu)選的最優(yōu)選擇是開發(fā),擇是開發(fā),A A預(yù)測到自己的選擇對預(yù)測到自己的選擇對B B的影響,因此開發(fā)是的影響,因此開發(fā)是A A的最優(yōu)選擇。子博的最優(yōu)選擇。子博弈完美納什均衡結(jié)果是:弈完美納什均衡結(jié)果是:A A選擇開發(fā),選擇開發(fā),B B選擇不開發(fā)。選擇不開發(fā)。xx 對于對于( (不開發(fā),(開發(fā),開發(fā)),不開發(fā),(開發(fā),開發(fā)),這個組合之所以構(gòu)成納什均衡,是因這個組合之所以構(gòu)成納什均衡,是因為為B B威脅不論威脅不論A A開發(fā)還是不開發(fā),他都開發(fā)還是不開發(fā),他都將選擇開發(fā),將選擇開發(fā),A A相信了相信了

23、B B的威脅,不開的威脅,不開發(fā)是最優(yōu)選擇,但是發(fā)是最優(yōu)選擇,但是A A為什么要相信為什么要相信B B的威脅呢?的威脅呢? 畢竟,如果畢竟,如果A A真開發(fā),真開發(fā),B B選擇開發(fā)選擇開發(fā)得得-3-3,不開發(fā)得,不開發(fā)得0 0,所以,所以B B的最優(yōu)選擇的最優(yōu)選擇是不開發(fā)。如果是不開發(fā)。如果A A知道知道B B是理性的,是理性的,A A將選擇開發(fā),逼迫將選擇開發(fā),逼迫B B選擇不開發(fā)。自選擇不開發(fā)。自己得己得1 1,B B得得0 0,即納什均衡,即納什均衡( (不開發(fā),不開發(fā),(開發(fā),開發(fā))是不可置信的。因(開發(fā),開發(fā))是不可置信的。因為它依賴于為它依賴于B B的一個不可置信的威脅。的一個不可

24、置信的威脅。 同樣:同樣: (不開發(fā),不開發(fā))也是一(不開發(fā),不開發(fā))也是一個不可置信威脅,納什均衡(開發(fā)個不可置信威脅,納什均衡(開發(fā), ,(不(不開發(fā),不開發(fā))是不合理的。開發(fā),不開發(fā))是不合理的。25子博弈完美納什均衡子博弈完美納什均衡o 澤爾騰引入子博弈完美納什均衡的概念的目的是將那些不可置信威脅戰(zhàn)略的納什均衡從均衡中剔除,從而給出動態(tài)博弈的一個合理的預(yù)測結(jié)果,簡單說,子博弈完美納什均衡要求均衡戰(zhàn)略的行為規(guī)則在每一個信息集上是最優(yōu)的。o 什么是子博弈,什么是子博弈完美納什均衡?o 有沒有更好的方法找到子博弈完美納什均衡?26l子博弈由一個決策結(jié)子博弈由一個決策結(jié)x和所有該決策結(jié)和所有該

25、決策結(jié)的后續(xù)結(jié)的后續(xù)結(jié)T(x)(包括終點結(jié)包括終點結(jié))組成,它滿足組成,它滿足下列條件:下列條件:l(1)x是一個單結(jié)信息集;是一個單結(jié)信息集;l(2)子博弈不改變原博弈的信息集和支子博弈不改變原博弈的信息集和支付向量付向量子博弈條件條件1 1說的是一個子博弈必需從一個單結(jié)信息集開說的是一個子博弈必需從一個單結(jié)信息集開始。即:始。即:(1)(1)當(dāng)且僅當(dāng)決策者在原博弈中確切地知當(dāng)且僅當(dāng)決策者在原博弈中確切地知道博弈進入一個特定的決策結(jié)時,該決策結(jié)才能道博弈進入一個特定的決策結(jié)時,該決策結(jié)才能作為一個子博弈的開始。作為一個子博弈的開始。(2)(2)如果一個信息集包含如果一個信息集包含兩個以上決策

26、結(jié),沒有任何一個決策結(jié)可以作為兩個以上決策結(jié),沒有任何一個決策結(jié)可以作為子博弈的初始結(jié)。子博弈的初始結(jié)。A 開發(fā) 不開發(fā) 大 小 大 小開發(fā) 不開發(fā) 開 不開 開 不開 開 不開 (4,4) (8,0) (-3,-3) (1,0) (0,8) (0,0) (0,1) (0,0) N1 N2 B1 B2 B3 B4A 開發(fā) 不開發(fā) 大 小 大 小開發(fā) 不開發(fā) 開 不開 開 不開 開 不開 (4,4) (8,0) (-3,-3) (1,0) (0,8) (0,0) (0,1) (0,0) N1 N2 B1 B2 B3 B4條件條件2 2說的是,子博弈的信息集和支付說的是,子博弈的信息集和支付向量都

27、直接繼承自原博弈,并不會發(fā)生向量都直接繼承自原博弈,并不會發(fā)生任何變化。任何變化。這意味著子博弈不能分割原博弈的信息這意味著子博弈不能分割原博弈的信息集。集。A 開發(fā) 不開發(fā) 大 小 大 小開發(fā) 不開發(fā) 開 不開 開 不開 開 不開 (4,4) (8,0) (-3,-3) (1,0) (0,8) (0,0) (0,1) (0,0) N1 N2 B1 B2 B3 B427完全信息動態(tài)博弈完全信息動態(tài)博弈-子博弈完美納什均衡子博弈完美納什均衡澤爾騰(澤爾騰(1965)不開發(fā)A開發(fā)不開發(fā)BB開發(fā)不開發(fā)開發(fā)(1,0)(0,1)(0,0)(-3,-3)xx不開發(fā)開發(fā)不開發(fā)(1,0)(-3,-3)x開發(fā)(

28、0,1)(0,0)x子博弈I子博弈II房地產(chǎn)開發(fā)博弈找出房地產(chǎn)開發(fā)博弈的子博弈找出房地產(chǎn)開發(fā)博弈的子博弈( (不開發(fā),(開發(fā),開發(fā)),(開發(fā),(不開發(fā),開發(fā)),(開發(fā)不開發(fā),(開發(fā),開發(fā)),(開發(fā),(不開發(fā),開發(fā)),(開發(fā), ,(不開發(fā),不開發(fā))(不開發(fā),不開發(fā))28完全信息動態(tài)博弈完全信息動態(tài)博弈-子博弈完美納什均衡子博弈完美納什均衡澤爾騰(澤爾騰(1965)o 子博弈完美納什均衡: 擴展式博弈的戰(zhàn)略組合是一個子博弈完美納什均衡,如果: (1)它是原博弈的納什均衡; (2)它在每一個子博弈上給出納什均衡。29A開發(fā)不開發(fā)BB開發(fā)不開發(fā)開發(fā)(1,0)(0,1)(0,0)(-3,-3)xx房地產(chǎn)

29、開發(fā)博弈開發(fā)不開發(fā)(1,0)(-3,-3)x開發(fā)(0,1)(0,0)x子博弈I子博弈II(不開發(fā),(開發(fā),開發(fā)),(開發(fā),(不開發(fā),開發(fā)),(開發(fā),(不開發(fā),不開發(fā))在c上構(gòu)成均衡,在b上不構(gòu)成; 在b和c上都構(gòu)成 在b上構(gòu)成均衡,在c上不構(gòu)成完全信息動態(tài)博弈完全信息動態(tài)博弈-子博弈完美納什均衡子博弈完美納什均衡澤爾騰(澤爾騰(1965)不開發(fā) 判斷下列均衡結(jié)果哪個構(gòu)成子博弈完美納什均衡?不開發(fā)bc30子博弈精煉納什均衡 可信性問題 子博弈和逆向歸納法 子博弈精煉納什均衡應(yīng)用舉例 有同時選擇的兩階段動態(tài)博弈31可信性:開金礦博弈 甲在開采一價值甲在開采一價值4 4萬元的金礦時缺萬元的金礦時缺1

30、 1萬元資金,而乙萬元資金,而乙正好有正好有1 1萬元資金可以投資。甲希望乙能將萬元資金可以投資。甲希望乙能將1 1萬元資金借萬元資金借給自己用于開礦,并許諾在采到金子后與乙對半分成,給自己用于開礦,并許諾在采到金子后與乙對半分成,乙是否該將錢借給甲呢?乙是否該將錢借給甲呢?32開金礦I無法律的博弈 乙 甲 借 不借 分 不分 (2,2) (0,4) (1,0)33開金礦II有法律保障的博弈 乙 甲 借 不借 分 不分 (2,2) 打 不打 (1,0) (0,4) (1,0)34逆向歸納法開 不開開 不開 開 不開(-3,-3) (1,0) (0,1) (0,0) A B B房地產(chǎn)開發(fā):需求小

31、房地產(chǎn)開發(fā):需求小逆向歸納法就是從動態(tài)博弈的最逆向歸納法就是從動態(tài)博弈的最后一個階段或最后一個子博弈開后一個階段或最后一個子博弈開始,逐步向前倒推以求解動態(tài)博始,逐步向前倒推以求解動態(tài)博弈的方法。弈的方法。35122左右ABCD(3,1) (5,6) (4,2)(2,7)h1h12h22122左右BD(5,6)(2,7)h1h12h2212左B(5,6)h1h1236o 用逆向歸納法求解的子博弈完美納什均衡也要求“所有的參與人是理性的”是共同知識。o 如果博弈由多個階段組成,則從逆向歸納法得到的均衡可能并不非常令人信服。37子博弈精煉納什均衡n 擴展式博弈的戰(zhàn)略組合s*=(s1*,si*,sn

32、*)是一個子博弈精煉納什均衡,如果:n (1)它是原博弈的納什均衡;n (2)它在每一個子博弈上給出納什均衡。n 一個戰(zhàn)略組合是一一個戰(zhàn)略組合是一個子博弈精煉納什均衡,當(dāng)只個子博弈精煉納什均衡,當(dāng)只當(dāng)當(dāng)它在每一個子博弈上都構(gòu)成一個納什均衡它在每一個子博弈上都構(gòu)成一個納什均衡38子博弈精煉納什均衡應(yīng)用舉例o 斯坦克爾伯格(Stackelberg)寡頭競爭模型o 勞資博弈o 討價還價博弈39Stackelberg寡頭競爭模型o 一個市場上只有兩個企業(yè),他們的行動都是選擇產(chǎn)量,但行動有先后順序。企業(yè)1(領(lǐng)頭企業(yè),Leader)首先選擇產(chǎn)量q10;企業(yè)2(尾隨企業(yè),F(xiàn)ollower)觀測到q1,然后選

33、擇自己的產(chǎn)量q2 0。o 設(shè)總產(chǎn)量Qq1+q2,兩個企業(yè)有相同的不變單位成本c 0,需求函數(shù)o P(Q)=a-Q=a-(q1+q2)。o 問題:兩個企業(yè)應(yīng)如何決策?40庫諾特模型與斯氏模型比較庫諾特模型均衡結(jié)果:庫諾特模型均衡結(jié)果:q q1 1* *=q=q2 2* *=1/3(a-c) q=1/3(a-c) q1 1* *+q+q2 2* *=2/3(a-c)=2/3(a-c) 1 1* *= = 2 2* *=1/9(a-c)=1/9(a-c)2 2斯氏模型均衡結(jié)果:斯氏模型均衡結(jié)果:q q1 1* *=1/2(a-c) q=1/2(a-c) q2 2* *=1/4(a-c) =1/4(a

34、-c) q q1 1* *+q+q2 2* *=3/4(a-c)=3/4(a-c) 1 1* *=1/8(a-c)=1/8(a-c)2 2 2 2* *=1/16(a-c)=1/16(a-c)2 2張教材張教材107頁頁張教材張教材43頁頁41勞資博弈勞資博弈 工會決定工資水平,但企業(yè)決定雇用多少人。工會決定工資水平,但企業(yè)決定雇用多少人。 工會不只追求高工資,還希望被雇人數(shù)多。不喜歡高工會不只追求高工資,還希望被雇人數(shù)多。不喜歡高工資高失業(yè),也不喜歡低工資低失業(yè)。工會方的效用工資高失業(yè),也不喜歡低工資低失業(yè)。工會方的效用是工資水平和雇用人數(shù)兩者的函數(shù)是工資水平和雇用人數(shù)兩者的函數(shù)u=u(w,

35、L)。工會的。工會的目標是最大化總效用目標是最大化總效用 假設(shè)收益是勞動雇用量的函數(shù)假設(shè)收益是勞動雇用量的函數(shù)R(L)(邊際效益遞減), ,再假設(shè)只有勞動成本,工廠的利潤函數(shù)為再假設(shè)只有勞動成本,工廠的利潤函數(shù)為(w,L)R(L)- wL42討價還價博弈(1)o 假設(shè)有甲乙兩人就如何分割假設(shè)有甲乙兩人就如何分割1 1萬元進行談判,并且萬元進行談判,并且已定下了如下規(guī)則:已定下了如下規(guī)則:o 首先,由甲提出一個分割比例,對此,乙可以接受首先,由甲提出一個分割比例,對此,乙可以接受也可以拒絕;如果乙拒絕,則乙自己應(yīng)提出另一個也可以拒絕;如果乙拒絕,則乙自己應(yīng)提出另一個方案,讓甲選擇接受與否。如此循

36、環(huán)。方案,讓甲選擇接受與否。如此循環(huán)。o 在循環(huán)中,只要有任何一方接受對方的方案博弈就在循環(huán)中,只要有任何一方接受對方的方案博弈就告結(jié)束,而如果方案被拒絕,則被拒絕的方案與以告結(jié)束,而如果方案被拒絕,則被拒絕的方案與以后的討價還價過程不再有關(guān)系。后的討價還價過程不再有關(guān)系。43討價還價博弈(2)o 每次一方提出一個方案和另一方選擇是否每次一方提出一個方案和另一方選擇是否接受為一個階段。再假設(shè)討價還價每多進接受為一個階段。再假設(shè)討價還價每多進行一個階段,由于談判費用和利息損失等,行一個階段,由于談判費用和利息損失等,雙方的得益都要打一次折扣,折扣率為雙方的得益都要打一次折扣,折扣率為 , 00

37、11,稱為消耗系數(shù)。,稱為消耗系數(shù)。o 如果限制討價還價最多只能進行三個階段,如果限制討價還價最多只能進行三個階段,到第三階段乙必須接受甲的方案,這就是到第三階段乙必須接受甲的方案,這就是一個三階段討價還價博弈。一個三階段討價還價博弈。44 接受接受 不接受,出不接受,出S 乙必須接受乙必須接受討價還價博弈(3)甲甲出出S1乙乙 接受接受 不接受,出不接受,出S2 甲甲 (S1, 10000-S1) S2, (10000-S2) 2S, 2(10000-S)第一第一階段階段第二第二階段階段第三第三階段階段45輪流出價的討價還價模型n 分蛋糕的動態(tài)博弈分蛋糕的動態(tài)博弈n 游戲規(guī)則:第一輪由第一個

38、參與人(小鵑)提出條件,游戲規(guī)則:第一輪由第一個參與人(小鵑)提出條件,第二個參與人小明可以接受,從而游戲結(jié)束,也可以不第二個參與人小明可以接受,從而游戲結(jié)束,也可以不接受,則游戲進入第二輪;小明提出條件,小鵑可以接接受,則游戲進入第二輪;小明提出條件,小鵑可以接受,從而結(jié)束游戲,也可以不接受,從而進入第三輪;受,從而結(jié)束游戲,也可以不接受,從而進入第三輪;蛋糕融化呈線性,游戲結(jié)束,蛋糕融化蛋糕融化呈線性,游戲結(jié)束,蛋糕融化n 第一種情況:假設(shè)博弈只有一步,小鵑提出分配方案,第一種情況:假設(shè)博弈只有一步,小鵑提出分配方案,如果小明同意,兩個人按照約定分蛋糕,如果小明不同如果小明同意,兩個人按照

39、約定分蛋糕,如果小明不同意,兩人什么也得不到。結(jié)果會怎樣?意,兩人什么也得不到。結(jié)果會怎樣?46輪流出價的討價還價模型n 第二種情況:桌上放了一個冰淇淋蛋糕,但兩輪談第二種情況:桌上放了一個冰淇淋蛋糕,但兩輪談判過后,蛋糕將完全融化。博弈結(jié)果如何?判過后,蛋糕將完全融化。博弈結(jié)果如何?n 第三種情況:桌上的冰淇淋蛋糕在三輪談判后將完第三種情況:桌上的冰淇淋蛋糕在三輪談判后將完全融化,結(jié)果又如何?全融化,結(jié)果又如何?n 第四種情況:桌上的冰淇淋蛋糕在四輪談判后將完第四種情況:桌上的冰淇淋蛋糕在四輪談判后將完全融化,或者在五輪談判、六輪全融化,或者在五輪談判、六輪,100輪談判輪談判后將完全融化,

40、結(jié)果又如何?后將完全融化,結(jié)果又如何? 博弈的結(jié)果是:假如“輪數(shù)”是偶數(shù),雙方各得一半,假若輪數(shù)是奇數(shù),則小鵑得到(n+1)/2n;小明得到(n-1)/(2n)47囚徒的救贖o 好萊圬大片肖申克的救贖是一部很好看的電影,主要內(nèi)容是一個被冤屈的囚犯如何憑著堅定的信念和聰明才智逃出牢房。我們的“囚犯”也可以通過好的策略合作,擺脫“困境”的詛咒。48囚徒的救贖囚徒的救贖-一報還一報一報還一報一報還一報能夠贏得競賽不是靠打擊對方,而是靠從對方引出使雙一報還一報能夠贏得競賽不是靠打擊對方,而是靠從對方引出使雙方都有好處的行為。方都有好處的行為。如果重復(fù)博弈多次,就有報復(fù)的機會,這種懲罰的規(guī)則是:人家對如

41、果重復(fù)博弈多次,就有報復(fù)的機會,這種懲罰的規(guī)則是:人家對你怎么做,你就對他怎么做,如果他上次背叛了你,你這次背叛他,你怎么做,你就對他怎么做,如果他上次背叛了你,你這次背叛他,如果上次他與你合作,你這次就選擇與他合作。如果上次他與你合作,你這次就選擇與他合作。艾克謝羅德認為,一報還一報體現(xiàn)了這個策略符合四個優(yōu)點:清晰、艾克謝羅德認為,一報還一報體現(xiàn)了這個策略符合四個優(yōu)點:清晰、善意、報復(fù)性和寬恕性。善意、報復(fù)性和寬恕性。這一法則不會引發(fā)作弊,所以是善意的;這一法則不會引發(fā)作弊,所以是善意的;它不會讓作弊者逍遙法外,所以是報復(fù)的;它不會讓作弊者逍遙法外,所以是報復(fù)的;它不會長時間懷恨在心,只要作

42、弊者改正,就愿意恢復(fù)合作,所以它不會長時間懷恨在心,只要作弊者改正,就愿意恢復(fù)合作,所以是寬恕的。是寬恕的。一報還一報從自己的不可欺負性得到好處,還放棄了占他人便宜的一報還一報從自己的不可欺負性得到好處,還放棄了占他人便宜的可能性可能性49囚徒的救贖o 重復(fù)囚徒困境的幾個建議:o 1、不要嫉妒o 2、不要首先背叛o 3、對合作和背叛都要給予回報o 4、不要耍小聰明50旅行者困境-做人不要太精明n 哈佛大學(xué)巴羅教授:哈佛大學(xué)巴羅教授:n 兩個旅行者從一個以生產(chǎn)細瓷花瓶聞名的地方旅行回來,兩個旅行者從一個以生產(chǎn)細瓷花瓶聞名的地方旅行回來,在提取行李的時候,發(fā)現(xiàn)花瓶被摔壞了,就向航空公司在提取行李的

43、時候,發(fā)現(xiàn)花瓶被摔壞了,就向航空公司索賠。航空公司知道花瓶的價格大概雜八、九十元,但索賠。航空公司知道花瓶的價格大概雜八、九十元,但不知道他們購買的確切價格。因此航空公司請兩位旅客不知道他們購買的確切價格。因此航空公司請兩位旅客在在100100元以內(nèi)寫出花瓶的價格,如果兩個人寫得一樣,元以內(nèi)寫出花瓶的價格,如果兩個人寫得一樣,就按照寫的數(shù)額賠償,如果不一樣,原則上按照低的價就按照寫的數(shù)額賠償,如果不一樣,原則上按照低的價格賠償,并認為該旅客講了真話,獎勵格賠償,并認為該旅客講了真話,獎勵2 2元,而講假話元,而講假話的罰款的罰款2 2元。元。n 這個博弈的最終結(jié)果將是什么?這個博弈的最終結(jié)果將

44、是什么?51旅行者困境o 一位富翁的狗在散步時跑丟了,于是他急匆匆到電視臺一位富翁的狗在散步時跑丟了,于是他急匆匆到電視臺發(fā)了一則啟示:有狗丟失,歸還者得酬金發(fā)了一則啟示:有狗丟失,歸還者得酬金1 1萬元,并附萬元,并附有狗的彩照。一個乞丐看到廣告后,第二天一大早就報有狗的彩照。一個乞丐看到廣告后,第二天一大早就報著狗準備去領(lǐng)酬金,當(dāng)他經(jīng)過一家大商店的墻體屏幕時,著狗準備去領(lǐng)酬金,當(dāng)他經(jīng)過一家大商店的墻體屏幕時,發(fā)現(xiàn)酬金漲到了發(fā)現(xiàn)酬金漲到了3 3萬元,乞丐又折回住處,把狗重新拴萬元,乞丐又折回住處,把狗重新拴在那里,在接下來的幾天里,乞丐從來沒有離開過這只在那里,在接下來的幾天里,乞丐從來沒有離開過這只大屏幕,當(dāng)酬金漲到使全市居民感到驚訝時,乞丐返回大屏幕,當(dāng)酬金漲到使全市居民感到驚訝時,乞丐返回他的住處,可是那只狗已經(jīng)死了他的住處,可是那只狗已經(jīng)死了-在這個世界上,金在這個世界上,金錢一旦被作為籌碼,就不會再買到任何東西。錢一旦被作為籌碼,就不會再買到任何東西。52重復(fù)博弈和無名氏定理 序貫博弈:不同階段的博弈結(jié)構(gòu)不同 重復(fù)博弈:同樣結(jié)構(gòu)的博弈重復(fù)多次,其中的每次博弈可稱“階段博弈” 影響重

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論