博弈論第四章-完全且完美信息動態(tài)博弈

上傳人：墨*** IP屬地：廣東上傳時間：2023-02-28 格式：PPT 頁數(shù)：107 大?。?.41MB 積分：15 舉報 版權(quán)申訴

已閱讀5頁，還剩102頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認領(lǐng)

文檔簡介

第四章完全且完美信息動態(tài)博弈本章討論動態(tài)博弈，所有博弈方都對博弈過程和得益完全了解的完全且完美信息動態(tài)博弈。這類博弈也是現(xiàn)實中常見的基本博弈類型。由于動態(tài)博弈中博弈方的選擇、行為有先后次序，因此在表示方法、利益關(guān)系、分析方法和均衡概念等方面，都與靜態(tài)博弈有很大區(qū)別。本章對動態(tài)博弈分析的概念和方法，特別是子博弈完美均衡和逆推歸納法作系統(tǒng)介紹，并介紹各種經(jīng)典的動態(tài)博弈模型。1精選PPT完全且完美信息動態(tài)博弈的主要特點（1）行動是順序發(fā)生的，（2）下一步行動選擇之前，所有以前的行動都可以被觀察到，（3）每個可能的行動組合下局中人的收益是共同知識。2精選PPT第三章完全且完美信息動態(tài)博弈一博弈擴展式表述二子博弈完美納什均衡三、用逆向歸納法求-子博弈完美納什均衡四、完全且完美信息的動態(tài)博弈的案例3精選PPT一博弈擴展式表述

（一）博弈的標準式（或戰(zhàn)略式、正則式或策略式）女足球芭蕾男足球2，10，0芭蕾0，01，24精選PPT博弈的標準式（戰(zhàn)略式）4000，40008000，00，80000，0不開發(fā)開發(fā)商A開發(fā)不開發(fā)開發(fā)-3000，-30001000，00，10000，0不開發(fā)開發(fā)商B開發(fā)商A開發(fā)不開發(fā)開發(fā)開發(fā)商B需求小的情況需求大的情況5精選PPT（二）博弈擴展式表述博弈的擴展式表述包括四個要素:參與人集合（Player）每個參與人的戰(zhàn)略集合（Strategy）博弈的順序（Order）由戰(zhàn)略組合決定的每個參與人的支付（Payoff）6精選PPT擴展式表示的一個例子7精選PPT

博弈樹始于局中人1的一個決策結(jié)點，這時1要從L和R中作出選擇，如果局中人1選擇L，其后就到達局中人2的一個決策結(jié)點，這時，局中人2要從L′和R′中作出選擇。類似地，如果局中人1選擇R，則將到達局中人2的另一個決策結(jié)點。這時局中人2從L′和R′中選擇行動。無論局中人2選擇了哪一個，都將到達終結(jié)點(即博弈結(jié)束)且兩局中人分別得到相應(yīng)終點節(jié)下面的收益。

8精選PPTA開發(fā)不開發(fā)NN大小1/21/2大小1/21/2BBBB開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)參與人(A,B,N)戰(zhàn)略支付參與人集合參與人行動順序參與人的行動空間參與人的信息集參與人的支付函數(shù)外生事件的概率分布房地產(chǎn)開發(fā)博弈結(jié),決策結(jié)結(jié),終點結(jié)枝結(jié),初始結(jié)信息集9精選PPT橫向擴展式舉例：進入者進入不進入（0，300）在位者市場進入阻撓博弈樹合作（40，50）斗爭（-10，0）10精選PPT擴展型

為了讓“樹”描繪博弈，其結(jié)點和枝需要滿足三條性質(zhì)：

1．單一的出發(fā)點。重要的是知道博弈從何處開始，所以必須有一個，也只能有一個出發(fā)點。

2．

無循環(huán)。重要的是在博弈運行中，我們不要陷入僵局；樹枝循原路折回并造成一個循環(huán)一定是不可接受的。3．

單方向前進。重要的是，對于博弈如何進行下去不能模棱兩可，因此，必定不存在二個或多個枝導(dǎo)向同一個結(jié)。11精選PPT為保證這三條性質(zhì)，在前結(jié)點上強加下述限制：

1．結(jié)點不能是自身的前結(jié)點。2．前結(jié)點的前結(jié)點也是前結(jié)點：如果結(jié)點是的前結(jié)點，依次結(jié)點是的前結(jié)點，那么也是的前結(jié)點。3．前結(jié)點可以排序：如果和都是的前結(jié)點，必定是或者是的前結(jié)點，或者反過來。4．必定存在一個共同的前結(jié)點：考慮任意兩個結(jié)，和，它們之間沒有一個是另一個的前結(jié)點。那么，必定存在一個結(jié)點，它是和雙方的前結(jié)點。12精選PPT動態(tài)博弈的戰(zhàn)略13精選PPT動態(tài)博弈的戰(zhàn)略的表述戰(zhàn)略：參與人在給定信息集的情況下選擇行動的規(guī)則，它規(guī)定參與人在什么情況下選擇什么行動，是參與人的“相機行動方案”。在靜態(tài)博弈中，戰(zhàn)略和行動是相同的。作為一種行動規(guī)則，戰(zhàn)略必須是完備的。14精選PPT足球男足球芭蕾女女芭蕾足球芭蕾(2,1)(0，0)（1，2)(0,0)xxBattleofSexesifBoymovesfirst15精選PPT足球男足球芭蕾女女芭蕾足球芭蕾(1,2)(-1，-1)（0，0)(2,1)xx男的策略：{足球，芭蕾}選擇足球；還是選擇芭蕾。女的策略：（足球，芭蕾），（芭蕾，足球）（芭蕾，芭蕾），（足球，足球）1、追隨策略：他選擇什么，我就選擇什么2、對抗策略：他選擇什么，我就偏不選什么3、芭蕾策略：不管他選什么，我都選芭蕾；4、足球策略：不管他選什么，我都選足球。策略即：如果他選擇什么，我就怎樣行動的相機行動方案。在擴展式博弈里，參與人是相機行事，即“等待”博弈到達一個自己的信息集（包含一個或多個決策結(jié)后，再采取行動方案。BattleofSexesifBoymovesfirst16精選PPT可以寫成標準式(戰(zhàn)略式)17精選PPT-3,-3-3,-31,01,00,10,00,10,0{足球,足球}{足球,芭蕾}{芭蕾,足球}{芭蕾,足球}足球芭蕾wifehusband標準式(戰(zhàn)略式)18精選PPTThestrategycombinations.19精選PPT(B,{B,B}),20精選PPT？？？21精選PPT在8個圖里找納什均衡22精選PPT(1,2)(-1,-1)(0,0)(2,1)(1,2)(-1,-1)(0,0)(2,1)(1,2)(-1,-1)(0,0)(2,1)(1,2)(-1,-1)(0,0)(2,1)(1,2)(-1,-1)(0,0)(2,1)(1,2)(-1,-1)(0,0)(2,1)(1,2)(-1,-1)(0,0)(2,1)(1,2)(-1,-1)(0,0)(2,1)Of8strategycombination,3areNash

23精選PPTThreeNashequilibriaofBattleofSexesare:

(B,{B,B}),(S,{S,S}),and(S,{B,S});Theircorrespondingoutcomesareall:

(Ballet,Ballet),(Soccer,Soccer),and(Soccer,Soccer).BBBSSSBBBSSSBBBSSS24精選PPT不同的納什均衡可以對應(yīng)相同的結(jié)果25精選PPT一個動態(tài)博弈可能有多個（甚至無窮多個）納什均衡，究竟哪個更合理？26精選PPT子博弈完美納什均衡-不可置信威脅美國普林斯頓大學(xué)古爾教授在1997年的《經(jīng)濟學(xué)透視》里發(fā)表文章，提出一個例子說明威脅的可信性問題：兩兄弟老是為玩具吵架，哥哥老是要搶弟弟的玩具。不耐煩的父親宣布政策：好好去玩，不要吵我，不管你們誰向我告狀，我都把你們兩個關(guān)起來，關(guān)起來比沒有玩具更可怕?，F(xiàn)在，哥哥又把弟弟的玩具搶去玩了，弟弟沒有辦法，只好說：快把玩具還我，不然我就要去告訴爸爸。哥哥想，你真要告訴爸爸，我是要倒霉的，可是你不告狀不過沒有玩具玩，而告了狀卻要被關(guān)禁閉，告狀會使你的境遇變得更壞，所以你不會告狀，因此哥哥對弟弟的警告置之不理。的確，如果弟弟是會算計自己利益的理性人，在這樣的環(huán)境下，還是不告狀的好。可見，弟弟是理性人，他的告狀威脅是不可置信的。27精選PPT完全信息動態(tài)博弈-子博弈完美納什均衡

澤爾騰（1965）考慮下列問題：一個博弈可能有多個（甚至無窮多個）納什均衡，究竟哪個更合理？納什均衡假定每一個參與人在選擇自己的最優(yōu)戰(zhàn)略時假定所有其他參與人的戰(zhàn)略是給定的，但是如果參與人的行動有先有后，后行動者的選擇空間依賴于前行動者的選擇，前行動者在選擇時不可能不考慮自己的行動對后行動者的影響。子博弈完美納什均衡的一個重要改進是將“合理納什均衡”與“不合理納什均衡”分開。28精選PPT二、子博弈精煉納什均衡（或子博弈完美納什均衡）一個納什均衡稱為精煉納什均衡，當只當參與人的戰(zhàn)略在每個子博弈中都構(gòu)成納什均衡，也就是說，組成完美納什均衡的戰(zhàn)略必須在每一個子博弈中都是最優(yōu)的。一個精煉納什均衡首先必須是一個納什均衡，但納什均衡不一定是精煉納什均衡。承諾行動-當事人使自己的威脅戰(zhàn)略變得可置信的行動。29精選PPT子博弈完美納什均衡澤爾騰引入子博弈完美納什均衡的概念的目的是將那些不可置信威脅戰(zhàn)略的納什均衡從均衡中剔除，從而給出動態(tài)博弈的一個合理的預(yù)測結(jié)果，簡單說，子博弈完美納什均衡要求均衡戰(zhàn)略的行為規(guī)則在每一個信息集上是最優(yōu)的。什么是子博弈，什么是子博弈完美納什均衡？有沒有更好的方法找到子博弈完美納什均衡？30精選PPT完全信息動態(tài)博弈-子博弈完美納什均衡

澤爾騰（1965）子博弈???31精選PPTThinkofabranchofatreeasa(smaller)tree.Ifabranchofatreerepresentingagamedoesnotdivideanyinformationsetofthegame,thenitisasubgameofthegame.

32精選PPT王P175什么是“支”？33精選PPT不開發(fā)A開發(fā)不開發(fā)BB開發(fā)不開發(fā)開發(fā)(1，0)（0，1)(0,0)(-3,-3)xx’房地產(chǎn)開發(fā)博弈找出房地產(chǎn)開發(fā)博弈的子博弈

34精選PPT開發(fā)不開發(fā)(1，0)(-3,-3)x開發(fā)（0，1)(0,0)x’子博弈I子博弈IIA開發(fā)不開發(fā)BB開發(fā)不開發(fā)開發(fā)(1，0)（0，1)(0,0)(-3,-3)xx’子博弈Ⅲ35精選PPT

動態(tài)博弈中的子博弈

虛線框出的部分正是博弈方2在博弈方1選擇進時所面臨的決策問題，它本身構(gòu)成博弈方2的一個單人博弈，我們稱它為原先來后到博弈的一個“子博弈”。36精選PPT37精選PPTGameandsubgames（子博弈未標完）38精選PPT子博弈定義

由一個動態(tài)博弈第一階段以外的某個階段開始的后續(xù)博弈階段構(gòu)成，它必須有初始信息集，具備進行博弈所需要的各種信息，能夠自成一個博弈的原博弈的一部分，稱為原動態(tài)博弈的一個“子博弈”。39精選PPT子博弈不好找?。。W(xué)完后面的信息集請看P17740精選PPT信息集為了擴展式表述也可用來表述靜態(tài)博弈，我們使用虛線圈。如：41精選PPT情愛博弈的擴展式表述男足球芭蕾女女芭蕾足球芭蕾(1,2)(-1，-1)（0，0)(2,1)xx’女足球芭蕾男男芭蕾足球芭蕾(1,2)(-1，-1)（0，0)(2,1)xx’42精選PPTA開發(fā)不開發(fā)NN大小1/21/2大小1/21/2BBBB開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)B在決策時不確切地知道自然的選擇;B的決策結(jié)由4個變?yōu)?個房地產(chǎn)開發(fā)博弈43精選PPTA開發(fā)不開發(fā)NN大小1/21/2大小1/21/2BBBB開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)B知道自然的選擇;但不知道A的選擇(或A、B同時決策)

房地產(chǎn)開發(fā)博弈44精選PPT45精選PPTBattleofSexesagainifBoymovesfirstBoyGirlBalletBalletBalletSoccerSoccerSoccer(1,2)(-1,-1)(0,0)(2,1)46精選PPTRepresentBattleofSexesasasimultaneous-movegamewithatreeInformationsetsBoyGirlBalletBalletBalletSoccerSoccerSoccer(1,2)(-1,-1)(0,0)(2,1)47精選PPT結(jié)(nodes)：枝(branches)：信息集(informationsets)：博弈樹的結(jié)構(gòu)包括決策結(jié)和終點結(jié)。決策結(jié)是參與人采取行動的時點；終點結(jié)是博弈行動路徑的終點。枝是從一個決策結(jié)到它的直接后續(xù)結(jié)的連線，每一個枝代表參與人的一個行動選擇。一個信息集是決策結(jié)集合的一個子集(信息集是由決策結(jié)構(gòu)成的集合)，該子集包括所有滿足下列條件的決策結(jié)：(1)每一個決策結(jié)都是同一個參與人的決策結(jié)(2)該參與人知道博弈進入該集合的某個決策結(jié)，但不知道自己究竟處于哪一個決策結(jié)。48精選PPT錯誤信息集示例見書166.49精選PPT1、一個信息集罩住的首先必須是同一個局中人的決策節(jié)點。2、一個信息集罩住的必須是同一個局中人在同一個時點的決策節(jié)點。3、50精選PPT3、Same-set-same-strategiesprinciple:Atanydecisionnodebelongingtoaspecificinformationset,theplayerhassamestrategies/actionstochoose.Thus,nogameslikethis:51精選PPT2.1博弈的擴展式表述如果博弈樹的所有信息集都是單結(jié)的，則稱為“完美信息博弈”，沒有任何兩個決策結(jié)是用虛線連起來的自然信息集總是假設(shè)為單結(jié)的博弈樹上是否出現(xiàn)連接不同決策結(jié)的虛線取決于如何劃決策結(jié)的順序有了信息集的概念，擴展式表述也可用來表述靜態(tài)博弈52精選PPT完全信息動態(tài)博弈-子博弈完美納什均衡

澤爾騰（1965）子博弈：是原博弈的一部分，它本身也可以作為一個獨立的博弈進行分析：（1）子博弈必須從一個單結(jié)信息點開始：只有決策者在原博弈中確切地知道博弈進入一個特定的決策結(jié)時，該決策結(jié)才能作為一個子博弈的初始結(jié)。如果信息集包含兩個以上的決策結(jié)，則這兩個都不可以作為子博弈的初始結(jié)（見下頁）。（2）子博弈的信息集和支付向量都直接繼承自原博弈，即當x’和x’’在原博弈中屬于同一信息集時，他們在子博弈中才屬于同一信息集。習慣上，任何博弈的本身稱為自身的一個子博弈。53精選PPT書上的定義175：1）S的博弈樹是T的博弈樹的一支（什么是支？見175）；2）博弈S不能分割博弈T的信息集，具體說，質(zhì)押博弈T的某個信息集的任何一個決策節(jié)點是博弈S的一個決策節(jié)點，那么T的這個信息集的每一個決策節(jié)點都必須是博弈S的決策節(jié)點。3）……54精選PPTP177圖表5——1455精選PPTA開發(fā)不開發(fā)XX大小1/21/2大小1/21/2BBBB開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)參與人X的信息集不能開始一個子博弈，否則的話，參與人B的信息將被切割。56精選PPT完全信息動態(tài)博弈-子博弈完美納什均衡

澤爾騰（1965）子博弈完美納什均衡：擴展式博弈的戰(zhàn)略組合是一個子博弈完美納什均衡，如果:（1）它是原博弈的納什均衡；（2）它在每一個子博弈上給出納什均衡。57精選PPTBBBSSSBBBSSSBBBSSS(1,2)(-1,-1)(0,0)(2,1)(1,2)(-1,-1)(0,0)(2,1)(1,2)(-1,-1)(0,0)(2,1)Restrictedtothecircledsubgames,theNashareunstable.Thusthereisonlyonesubgame-perfectequilibrium.58精選PPTA開發(fā)不開發(fā)BB開發(fā)不開發(fā)開發(fā)(1，0)（0，1)(0,0)(-3,-3)xx’房地產(chǎn)開發(fā)博弈開發(fā)不開發(fā)(1，0)(-3,-3)x開發(fā)（0，1)(0,0)x’子博弈I子博弈II(不開發(fā)，（開發(fā)，開發(fā)）），（開發(fā)，（不開發(fā)，開發(fā)），（開發(fā)，（不開發(fā)，不開發(fā)））在c上構(gòu)成均衡，在b上不構(gòu)成；在b和c上都構(gòu)成在c上構(gòu)成均衡，在b上不構(gòu)成完全信息動態(tài)博弈-子博弈完美納什均衡

澤爾騰（1965）不開發(fā)判斷下列均衡結(jié)果哪個構(gòu)成子博弈完美納什均衡？不開發(fā)bc59精選PPT完全信息動態(tài)博弈-子博弈完美納什均衡

澤爾騰（1965）如果一個博弈有幾個子博弈，一個特定的納什均衡決定了原博弈樹上唯一的一條路徑，這條路徑稱為“均衡路徑”，博弈樹上的其他路徑稱為“非均衡路徑”。納什均衡只要求均衡戰(zhàn)略在均衡路徑的決策結(jié)上是最優(yōu)的；而構(gòu)成子博弈完美納什均衡不僅要求在均衡路徑上策略是最優(yōu)的，而且在非均衡路徑上的決策結(jié)上也是最優(yōu)的。這是納什均衡與子博弈完美納什均衡的實質(zhì)區(qū)別。60精選PPTBBBSSSBBBSSSBBBSSS(1,2)(-1,-1)(0,0)(2,1)(1,2)(-1,-1)(0,0)(2,1)(1,2)(-1,-1)(0,0)(2,1)Restrictedtothecircledsubgames,theNashareunstable.Thusthereisonlyonesubgame-perfectequilibrium.61精選PPT完全信息動態(tài)博弈-子博弈完美納什均衡

澤爾騰（1965）戰(zhàn)略是參與人行動規(guī)則的完備描述，它要告訴參與人在每一種可預(yù)見的情況下（即每一個決策結(jié)）上選擇什么行動，即使這種情況實際上沒有發(fā)生（甚至參與人并不預(yù)期它會發(fā)生）。因此，只有當一個戰(zhàn)略規(guī)定的行動規(guī)則在所有可能的情況下都是最優(yōu)的，它才是一個合理的可置信的戰(zhàn)略，子博弈完美納什均衡就是要剔除那些只在特定情況下是合理的而在其他情況下不合理的行動規(guī)則。62精選PPT完全信息動態(tài)博弈-子博弈完美納什均衡

澤爾騰（1965）練習:參與人1（丈夫）和參與人2（妻子）必須獨立決定出門時是否帶傘。他們知道下雨和不下雨的可能性均為50%，支付函數(shù)為：如果只有一人帶傘，下雨時帶傘者的效用為-2.5，不帶傘者的效用為-3不下雨時帶傘的效用為-1,不帶的效用為0;如兩人都不帶傘,下雨時每人的效用為-5,不下雨時每人的效用為1;給出下列四種情況下的擴展式及戰(zhàn)略式表述:(1)兩人出門前都不知道是否會下雨;并且兩人同時決定是否帶傘(即每一方在決策時都不知道對方的決策);(2)兩人在出門前都不知道是否會下雨,但丈夫先決策，妻子觀察到丈夫是否帶傘后才決定自己是否帶傘;(3)丈夫出門前知道是否會下雨,但妻子不知道，但丈夫先決策，妻子后決策;(4),同(3),但妻子先決策，丈夫后決策.63精選PPT三、用逆向歸納法求-子博弈完美納什均衡64精選PPT微軟公司的入門考試題65精選PPT強盜分贓（向前展望，倒后推理）有5個強盜搶得100枚金幣，在如何分贓上爭論不休，于是他們決定：（1）抽簽決定個人的號碼（1，2，3，4，5）（2）由1號提出分配方案，然后5人表決，如果方案超過半數(shù)同意就通過，否則他被扔進大海喂鯊魚；（3）1號死后，2號提方案，4人表決，當且僅當超過半數(shù)同意時方案通過，否則2號被扔進大海；（4）依次類推，知道找到一個每個人都接受的方案（當然，如果只剩5號，他獨吞）結(jié)果會如何？66精選PPT強盜123450100100009801197012067精選PPT強盜123450100100009801197012097010268精選PPT三、用逆向歸納法求-子博弈完美納什均衡1UDL（3，1)(0,0)22，2R69精選PPT三、用逆向歸納法求-子博弈完美納什均衡1UDL（3，1)(0,0)22，2R

給定博弈達到最后一個決策結(jié)，該決策結(jié)上行動的參與人有一個最優(yōu)選擇，這個最優(yōu)選擇即該決策結(jié)開始的子博弈的納什均衡倒數(shù)第二個決策結(jié)，找倒數(shù)第二個的最優(yōu)選擇，這個最優(yōu)選擇與我們在第一步找到的最優(yōu)選擇構(gòu)成一個納什均衡。如此重復(fù)直到初始結(jié)。每一步都得到對應(yīng)于子博弈的一個納什均衡，并且根據(jù)定義，該納什均衡一定是該子博弈的子博弈納什均衡，這個過程的最后一步得到整個博弈的納什均衡70精選PPT完全信息動態(tài)博弈-子博弈完美納什均衡

澤爾騰（1965）1UDL（1，1)22，0RU’（3，0)(0,2)1D’子博弈完美納什均衡（（U，U’），L）.U’和L分別是參與人1和參與人2在非均衡路徑上的選擇。逆向歸納法求解子博弈完美納什均衡的過程，實質(zhì)上是重復(fù)剔除劣戰(zhàn)略的過程：從最后一個決策結(jié)依次剔除每個子博弈的劣戰(zhàn)略，最后生存下來的戰(zhàn)略構(gòu)成完美納什均衡。71精選PPT122左右ABCD（3,1）（5,6）（4,2）（2,7）h1h12h22122左右BD（5,6）（2,7）h1h12h2212左B（5,6）h1h1272精選PPT完全信息動態(tài)博弈-子博弈完美納什均衡

澤爾騰（1965）用逆向歸納法求解的子博弈完美納什均衡也要求“所有的參與人是理性的”是共同知識。如果博弈由多個階段組成，則從逆向歸納法得到的均衡可能并不非常令人信服。73精選PPT1D(1,…,1)A2D(1/2,…,1/2)AiD(1/i,…,1/i)AnD(1/n,…,1/n)A……逆向歸納法要求“所有參與人是理性的”是所有參與人的共同知識。因此，在有多個參與人或每個參與人有多次行動機會的情況下，逆向歸納法的結(jié)果可能并非如此。多個參與人的情況（2,…,2)如果n很小，逆向歸納法的結(jié)果逆向歸納法與子搏弈完美納什均衡的存在問題74精選PPT逆向歸納法與子搏弈完美納什均衡的存在問題如果n很大，結(jié)果又如何呢？1D(1,…,1)A2D(1/2,…,1/2)AiD(1/i,…,1/i)AnD(1/n,…,1/n)A……多個參與人的情況（2,…,2)如果n很大

對于參與人1，獲得2單位支付前提是所有n-1個參與人都選A，否則就要考慮是否應(yīng)該選擇D以保證1的支付。如果給定一個參與人選擇A的概率是p<1，所有n-1個參與人選擇A的概率是pn-1，如果n很大，這個值就很??；另外，即使參與人1確信所有n-1個參與人都選A，他也可能懷疑是否第2個參與人相信所有n-2個參與人都選A。這個鏈越長，共同知識的要求就越難滿足。75精選PPT逆向歸納法與子搏弈完美納什均衡的存在問題1D(1,1)A？2D(0,3)A1D(98,98)A2D(98,101)A…另一種蜈蚣博弈（100,100)2D(97,100)A1D(99,99)A有兩個參與人1、2，若第一次1決策結(jié)束，1、2都得n，若2決策結(jié)束，1得n-1，B得n+2，下一輪從1、1都是n+1開始，共100次，每個參與人有100個決策結(jié)。逆向歸納法的結(jié)果：一開始，就結(jié)束！1D(2,2)A2D(1,4)A但是，當你沒有預(yù)料的事情發(fā)生時，比如參與人選擇了A，你該如何選擇？你的選擇應(yīng)該依賴于你的參與人未來的行為。特別是，你如何修正你對參與人理性程度的評價。76精選PPT輪流出價的討價還價模型分蛋糕的動態(tài)博弈游戲規(guī)則：第一輪由第一個參與人（小鵑）提出條件，第二個參與人小明可以接受，從而游戲結(jié)束，也可以不接受，則游戲進入第二輪；小明提出條件，小鵑可以接受，從而結(jié)束游戲，也可以不接受，從而進入第三輪；蛋糕融化呈線性，游戲結(jié)束，蛋糕融化……問：假設(shè)博弈只有一步，小鵑提出分配方案，如果小明同意，兩個人按照約定分蛋糕，如果小明不同意，兩人什么也得不到。結(jié)果會怎樣？77精選PPT輪流出價的討價還價模型第一種情況：假設(shè)博弈只有一步，小鵑提出分配方案，如果小明同意，兩個人按照約定分蛋糕，如果小明不同意，兩人什么也得不到。結(jié)果會怎樣？博弈的結(jié)果是：假如“輪數(shù)”是偶數(shù)，雙方各得一半，假若輪數(shù)是奇數(shù)，則小鵑得到（n+1）/2n；小明得到（n-1）/（2n）78精選PPT四、完全且完美信息的動態(tài)博弈的案例

例1斯塔克爾貝格雙寡頭競爭模型例2勞資博弈例3序貫談判例4制造商與銷售商的博弈例5承包基數(shù)博弈79精選PPT練習：已知條件和斯塔克爾貝一樣，求按古諾模型博弈的結(jié)果。P(Q)=a-Q80精選PPT1斯塔克爾貝里雙頭壟斷模型

斯塔克爾貝里(1934)提出一個雙頭壟斷的動態(tài)模型，其中一個支配企業(yè)(領(lǐng)導(dǎo)者)首先行動，然后從屬企業(yè)(追隨者)行。比如在美國汽車產(chǎn)業(yè)發(fā)展史中的某些階段，通用汽車就扮演過這種領(lǐng)導(dǎo)者的角色(這一例子把模型直接擴展到允許不止一個追隨企業(yè)，如福特、克萊斯勒等等)。根據(jù)斯塔克爾貝里的假定，模型中的企業(yè)選擇其產(chǎn)量，這一點和古諾模型是一致的(只不過古諾模型中企業(yè)是同時行動的，不同于這里的序貫行動)。81精選PPT這里P(Q)=a-Q，是市場上的總產(chǎn)品Q=q1+q2時的市場出清價格，c是生產(chǎn)的邊際成本，為一常數(shù)(固定成本為0)。

為解出這一博弈的逆向歸納解，我們首先計算企業(yè)2對企業(yè)1任意產(chǎn)量的最優(yōu)反應(yīng)，R2(q1)應(yīng)滿足:

博弈的時間順序如下:(1)企業(yè)1選擇產(chǎn)量q1>0;(2)企業(yè)2觀測到然后選擇產(chǎn)量q2>0(3)企業(yè)1的收益由下面的利潤函數(shù)給出：P(Q)82精選PPT對上面的通過求極值可得：已知q1<a-c,在前面我們分析同時行動的古諾博弈中，得出的R2(q1)和上式完全一致，兩者的不同之處在于這里的R2(q1)是企業(yè)2對企業(yè)1已觀測到的產(chǎn)量的真實反應(yīng)，而在古諾的分析中，R2(q1)是企業(yè)2對假定的企業(yè)1的產(chǎn)量的最優(yōu)反應(yīng)，且企業(yè)1的產(chǎn)量選擇是和企業(yè)2同時作出的。83精選PPT

由于企業(yè)1也能夠像企業(yè)2一樣解出企業(yè)2的最優(yōu)反應(yīng)，企業(yè)1就可以預(yù)測到他如選擇q1，企業(yè)2將根據(jù)R2(q1)選擇產(chǎn)量。那么在博弈的第一階段，企業(yè)1的問題就可表示為：解得：84精選PPT這就是斯塔克爾貝里雙頭壟斷博弈的逆向歸納解。對斯塔科爾貝里雙頭壟斷博弈的逆向歸納解的評價：

回顧在古諾博弈的納什均衡中，每一企業(yè)的產(chǎn)量為(a一c)/3,也就是說，斯塔克爾貝里博弈中逆向歸納解的總產(chǎn)量3(a-c)/4，比古諾博弈中納什均衡的總產(chǎn)量2(a-c)/3要高，從而斯塔克爾貝里博弈相應(yīng)的市場出清價格就比較低。不過在斯塔克爾貝里博弈中，企業(yè)1完全可以選擇古諾均衡產(chǎn)量(a一c)/3，這時企業(yè)2的最優(yōu)反應(yīng)同樣是古諾均衡的產(chǎn)量，也就是說在斯塔克爾貝里博弈中，企業(yè)1完全可以使利潤水平達到古諾均衡的水平，而卻選擇了其他產(chǎn)量，85精選PPT那么企業(yè)1在斯塔克爾貝里博弈中的利潤一定高于其在古諾博弈中的利潤。但斯塔克爾貝里博弈中的市場出清價格降低了，從而總利潤水平也會下降，那么和古諾博弈的結(jié)果相比，在斯塔克爾貝里博弈中，企業(yè)1利潤的增加必定意味著企業(yè)2福利的惡化。

和古諾博弈相比，斯塔克爾貝里博弈中企業(yè)2利潤水平的降低，揭示了單人決策問題和多人決策間題的一個重要不同之處。在單人決策理論中，占有更多的信息決不會對決策制定者帶來不利，然而在博弈論中，了解更多的信息(或更為精確地說，是讓其他參加者知道一個人掌握更多的信息)卻可以讓一個參與者受損。86精選PPT斯塔科爾貝里博弈中信息進一步的探討

在斯塔克爾貝里博弈中，存在問題的信息是企業(yè)的產(chǎn)量:企業(yè)2知道q1,并且(重要的是)企業(yè)1知道企業(yè)2知道q1。為看清楚這一信息的影響，我們把上面序貫行動的博弈稍作修改，假設(shè)企業(yè)1先選擇q1，之后企業(yè)2選擇q2，但事前并沒有觀測到q1,如果企業(yè)2確信企業(yè)1選擇了它的斯塔克爾貝里產(chǎn)量(a-c)/2，則企業(yè)2的最優(yōu)反應(yīng)仍是R2(q1)=(a-c)/4。但是，如果企業(yè)1預(yù)測到企業(yè)2將持有這一推斷并選擇這一產(chǎn)量，企業(yè)1就會傾向于它對87精選PPT(a-c)/4的最優(yōu)反應(yīng)----即3(a-c)/8—而不愿去選擇斯塔克爾貝里產(chǎn)量(a-c)/2，那么企業(yè)2就不會相信企業(yè)1選擇了斯塔克爾貝里產(chǎn)量。從而這一修改過的序貫行動博弈的惟一納什均衡，對兩個企業(yè)都是選擇產(chǎn)量(a-c)/3.----這正是古諾博弈中的納什均衡，其中企業(yè)是同時行動的。88精選PPT2、里昂惕夫的工會模型

在里昂惕夫(1946)模型中，討論了一個企業(yè)和一個壟斷的工會組織(即作為企業(yè)勞動力惟一供給者的工會組織)的相互關(guān)系:工會對工資水平說一不二，但企業(yè)卻可以自主決定就業(yè)人數(shù)(在更符合現(xiàn)實情況的模型中，企業(yè)和工會間就工資水平討價還價，但企業(yè)仍自主決定就業(yè)，得到的定性結(jié)果與本模型相似)。工會的效用函數(shù)為U(W,L)，其中W為工會向企業(yè)開出的工資水平，L為就業(yè)人數(shù)。89精選PPT假定U(W,L)是W和L的增函數(shù)。企業(yè)的利潤函數(shù)為，其中R(L)為企業(yè)雇傭L名工人可以取得的收入(在最優(yōu)的生產(chǎn)和產(chǎn)品市場決策下)，假定R(L)是增函數(shù)，并且為凹函數(shù)。

假定博弈的時序為:(1)工會給出需要的工資水平W;(2)企業(yè)觀測到(并接受)W，隨后選擇雇傭人數(shù)L;(3)收益分別為U(W,L)和。即使沒有假定U(W,L)和R(L)的具體的表達式，從而無法明確解出該博弈的逆向歸納解，但我們?nèi)钥梢跃徒獾闹饕卣鬟M行討論。90精選PPT

首先，對工會在第一階段任意一個工資水平w，我們能夠分析在第二階段企業(yè)最優(yōu)反應(yīng)L*(W)的特征。給定w，企業(yè)選擇L*(W)滿足下式:

一階條件為：

為了滿足上述一階條件，假設(shè)R’(0)=∞;R’(∞)=0.91精選PPT

下面的圖把L*(w)表示為w的函數(shù)(但坐標軸經(jīng)過旋轉(zhuǎn)以便于和以后的數(shù)據(jù)相比較)，并表示出它和企業(yè)每條等利潤線交于其最高點。若令L保持不變，92精選PPTL保持不變，w降低時企業(yè)的利潤就會提高，于是較低的等利潤曲線代表了較高的利潤水平。93精選PPT這張圖描述了工會的無差異曲線，若令L不變，當w提高時工會的福利就會增加。于是較高的無差異曲線代表了工會較高的效用水平。94精選PPT下面我們分析工會在第一階段的問題，由于工會和企業(yè)同樣可以解出企業(yè)在第二階段的問題，工會就可預(yù)測到如果它要求的工資水平為w1，企業(yè)最優(yōu)反應(yīng)的就業(yè)人數(shù)將會是L*(w1)。那么，工會在第一階段的問題可以表示為:95精選PPT表現(xiàn)在圖中的無差異曲線上就是，工會希望選擇一個工資水平w，由此得到的結(jié)果(w，L*(w))處于可能達到的最高的無差異線上。這一最優(yōu)化間題的解為w*，這樣一個工資要求將使得工會通過(w*，L*(w*))的無差異曲線與L*(w)相切于該點，如圖所示。從而(w*，L*(w*))就是這一工資與就業(yè)博弈的逆向歸納解。96精選PPT

更進一步我們還可以看出，(w‘*,L*(w*))是低效率的，在上圖中，如果w和L處于圖中陰影部分以內(nèi)，企業(yè)和工會的效用水平都會提高。這種低效率對實踐中企業(yè)對雇傭工人數(shù)量保持的絕對控制權(quán)提出了質(zhì)疑。(允許工人和企業(yè)就工資相互討價還價，但企業(yè)仍對雇傭工人數(shù)量絕對控制，也會得到相似的低效率解)。97精選PPT埃斯皮諾薩和里(Espinosa&Rhee,1989)基于如下事實為這一質(zhì)疑提供了一個解釋:企業(yè)和工會之間經(jīng)常會進行定期或不定期的重復(fù)談判(在美國經(jīng)常是每三年一次)，在這樣的重復(fù)博弈中，可能會存在一個均衡，使得工會的選擇w和企業(yè)的選擇L都在圖所示的陰影部分以內(nèi)，即使在每一次性談判中，這樣的w和L都不是逆向歸納解。98精選PPT3、序貫談判（討價還價博弈）

分析

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負責。
6. 下載文件中如有侵權(quán)或不適當內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

博弈論第四章-完全且完美信息動態(tài)博弈

文檔簡介

溫馨提示

最新文檔

評論

博弈論第四章-完全且完美信息動態(tài)博弈

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔