版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、序貫決策博弈第一部分 同時博弈與序貫博弈 主要內(nèi)容本章主要引見:1、如何用正規(guī)型表示和展開型表示來表述 同一個博弈。2、博弈論中的兩個重要概念:信息集和不完美信息。3、調(diào)查包含同時決策行動和序貫決策行動的復(fù)合型博弈混合博弈的納什平衡。第一節(jié) 博弈的正規(guī)型表示與展開型表示第二節(jié) 同時決策與序貫決策的混合博弈 第三節(jié) 樹形博弈的子博弈 第四節(jié) 子博弈精煉納什平衡 第五節(jié) 完美博弈的庫恩定理第六節(jié) 動態(tài)博弈的運用 第一節(jié) 博弈的正規(guī)型表示與展開型表示一、如何將博弈的展開型方式轉(zhuǎn)化為正規(guī)型表示案例:“進(jìn)入妨礙博弈進(jìn)入者進(jìn)入不進(jìn)壟斷者容忍抵抗容忍抵抗1,5-2,20,100,4壟斷者abc“進(jìn)入妨礙的矩
2、陣表達(dá)1,5-2,2-2,21,50,100,40,100,4進(jìn)入者壟斷者進(jìn)入不進(jìn)入容忍,容忍抵抗,抵抗抵抗,容忍容忍,抵抗小 結(jié)1、普通我們將先行動者放在行局中人的位置,把后行動者放在列局中人的位置。2、每個局中人的戰(zhàn)略必需是一個完好的方案,必需思索本人在對方每一個行動下的行動。例如:容忍,容忍。在本例中,進(jìn)入者有兩個純戰(zhàn)略,而壟斷者有四個純戰(zhàn)略。3、每個局中人的決策輪數(shù)越多,那么他的純戰(zhàn)略選擇的數(shù)目越多。 思索:假設(shè)有三輪博弈,如何寫矩陣方式。4、矩陣方式表示的能夠的博弈結(jié)果比樹形表示的結(jié)果要多,這是由于有不止一個純戰(zhàn)略可以導(dǎo)致一樣的博弈結(jié)果。二、如何將正規(guī)型的博弈轉(zhuǎn)化為展開型比前面簡單,
3、尤其是序貫博弈,但假設(shè)是同時博弈,如何表示?信息集案例:情侶博弈2, 10, 00, 01, 2足球芭蕾足球芭蕾丈 夫妻子夫妻之爭信息集根據(jù)同時博弈的定義,每個局中人決策時不知道他人的戰(zhàn)略,即每個局中人在做本人的行動選擇時,并不知道本人處在哪個決策節(jié)點上。例如妻子在選芭蕾時,并不知道丈夫選的是芭蕾還是足球。局中人不能是他人對方“曾經(jīng)做出的行動或決策,就等于同時行動或決策。此時,我們用一個扁橢圓形的虛線的圈,把所論局中人的假設(shè)干決策節(jié)點罩起來,成為他的一個信息集。即局中人知道博弈曾經(jīng)進(jìn)展到他的這個信息集,但不知道博弈終究進(jìn)展到這個信息集中的哪個決策節(jié)點。信息集妻子雖然知道博弈曾經(jīng)進(jìn)展到她的信息集
4、,但不知道進(jìn)展到信息集中的那個決策點,即她不知道丈夫會選什么,因此是同時博弈。丈夫足球芭蕾妻子足球芭蕾足球芭蕾2,10,0-1,-11,2妻子注 意一個信息集罩住的必需是同一個局中人的決策點。必需是同一個局中人在同一個時點的決策節(jié)點。ABBA不制止制止-2,52,210,45,5不仿冒0,10仿冒不制止制止仿冒不仿冒這兩個虛線罩住的都不是信息集。注 意同時,即使是同一個人在同一時點進(jìn)展決策,也不一定構(gòu)成一個信息集,他還必需滿足:在每一個決策點他的行動選擇集合必需是一樣的。由于局中人在做行動選擇時并不知道本人位于哪個決策點,因此,他不能夠做出不同的行動選擇。ABB該虛線罩住的不是信息集。其必需滿
5、足:同集同注,即從各個決策點出發(fā)的戰(zhàn)略選擇數(shù)目一樣,稱號也一樣。單點集和非單點集我們把不被扁橢圓虛線罩住的每個決策節(jié)點也給以信息集的位置,稱為單點集。因此,每一個決策位置都是一個信息集,只需單點集和非單點集之分。ABB非單點集單點集完美信息博弈和不完美信息博弈當(dāng)博弈走到一個單點集的信息集時,面臨決策的局中人對于博弈迄今的歷史清清楚楚,他清楚了博弈詳細(xì)走到了他的這個決策節(jié)點而不是別的決策點。我們把這種歷史清楚的博弈稱為完美信息博弈。但是當(dāng)博弈走到一個非單點集的信息集時,面臨決策的局中人對于博弈迄今的歷史是不清楚的,他不清楚博弈詳細(xì)走到了他的這個信息集里面的那個決策點。我們把這種歷史不清楚的博弈稱
6、為不完美信息博弈。假設(shè)一個序貫博弈的每個信息集都是一個單點集,那么該序貫博弈就是完美信息博弈,否那么他就是不完美信息博弈。信息集舉例情愛博弈的擴(kuò)展式表述男足球芭蕾女女芭蕾足球芭蕾(1,2)(-1,-1)0,0)(2,1)xx女足球芭蕾男男芭蕾足球芭蕾(1,2)(-1,-1)0,0)(2,1)xxA開發(fā)不開發(fā)NN大小1/21/2大小1/21/2BBBB開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)房地產(chǎn)開發(fā)博弈A開發(fā)不開發(fā)NN大小1/21/2大小1/21/2BBBB開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)開發(fā)不開發(fā)(4,4)(8
7、,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0) B知道自然的選擇;但不知道A的選擇(或A、B同時決策) 房地產(chǎn)開發(fā)博弈第二節(jié) 同時決策與序貫決策的混合博弈完全不完美信息的兩階段博弈我們把包含同時決策行動和序貫決策行動的博弈稱為混合博弈。假設(shè)有兩家計算機(jī)公司:方正和聯(lián)想。彼此對新產(chǎn)品的研發(fā)和定價進(jìn)展博弈競爭。該博弈分為兩個階段:第一階段,兩個公司進(jìn)展研發(fā)投入競爭,每個公司都可以選擇“大投入和“小投入的研發(fā)預(yù)算,同時每個公司都不公開公布本人的預(yù)算;第二階段,當(dāng)產(chǎn)品開發(fā)出來并面世以后,廠商會觀摩對方研制出來的新產(chǎn)品對本人的新產(chǎn)品定價,每個廠商可以定高價也可以定低價,但定價之前
8、看不到對方的定價。聯(lián)想大投入小投入大投入小投入方正高價錢低價錢5,52,66,24,44,33,42,11,26,63,77,35,53,41,24,32,1高價錢高價錢高價錢高價錢高價錢高價錢高價錢低價錢低價錢低價錢低價錢低價錢低價錢低價錢聯(lián)想大投入小投入大投入小投入方正5,52,66,24,44,33,42,11,23,41,24,32,16,63,77,35,5聯(lián)想大投入小投入大投入小投入4,43,44,35,5方正該博弈的結(jié)果為:兩個公司都在第一個階段采取小投入帕累優(yōu)勢原那么,在第二個階段采取低價錢。但納什平衡有16個過程略,由于很多戰(zhàn)略導(dǎo)致同一個結(jié)果。該博弈的展開型表述見P173頁銀
9、行擠兌博弈案例案例情況: 兩個投資者每人存入銀行一筆存款D,銀行已將這些存款投入一個長期工程。假設(shè)在該工程到期前銀行被迫對投資者變現(xiàn),共可收回2r,這里DrD/2。不過,假設(shè)銀行允許投資工程到期,那么工程共可獲得2R,這里RD。有兩個時間,投資者可以從銀行提款:在銀行的投資工程到期之前或者在到期之后。為使分析簡化,假設(shè)不存在貼現(xiàn)。兩個投資者的提款日期可以有如下能夠:A、兩個都提早,都得到rB、一個提早提取另一個不動,那么第一人得D,另一人得2r-D.C、兩個在到期后提,各得RD、兩個都不提,等到投資工程終了,都得到RE、假設(shè)一個人在期滿后提取,另一人不動那么分別得:2R-D,D。如以下圖所示:
10、我們運用逆向歸納法分析問題從日期2開場先思索日期2的規(guī)范式博弈,由于明顯的RD,也就是說2R-DR。我們可以得到這個博弈的納什平衡R,R。由于不存在貼現(xiàn),我們可以直接帶入日期1的博弈矩陣表示式。由于rD(并且由此可得2r-D r),這一由兩階段博弈變形得到的單階段博弈存在兩個純戰(zhàn)略納什平衡:(1)兩個投資者都提款,最終收益情況為(r , r); 兩個投資者都不提款,最終收益為(R,R)。從而,最初的兩階段銀行擠提博弈就有2個子博弈精煉解。銀行擠兌(1)王那么柯“銀行擠兌的成因和預(yù)防兩客戶在同一銀行各存有100元,銀行將這200元投資于一個長期工程。假設(shè)在工程到期前銀行要抽回資金,那么只能收回1
11、40元;但假設(shè)到期后再收回投資,那么可收回本息280元。對客戶來說,抽回存款的日期也有兩種:一是在銀行投資工程到期之前,稱日期1;一是在到期之后,稱日期2。假定假設(shè)兩客戶在日期1要求抽回資金那么各得70元;假設(shè)只需一個客戶在日期1要抽回資金那么該客戶得100元,另一客戶只能得到剩余的40元。假設(shè)等到日期2兩客戶同時要收回資金,那么各得140元;假設(shè)到日期2還只需一方要求收回資金,那么要求收回資金一方得180元,另一方得100元;假設(shè)到日期2沒有客戶要求收回資金,那么銀行還是分給他們各140元。周瑜存不存存不存諸葛亮40,100100,4070,70周瑜抽回不抽回不諸葛亮40,100100,40
12、70,70銀行擠兌(3)日期1周瑜諸葛亮抽回不抽回抽回70,70100,40不抽回40,100140,140 前一種結(jié)果可以解釋為對銀行的一次擠提。假設(shè)投資者1置信投資者2將在日期1提款、那么投資者1的最優(yōu)反響也是去提款,即使他們等到日期2再去提款的話兩人的福利都會提高。這里的銀行擠提博弈在一個很重要的方面不同于第1章中討論的囚徒姿態(tài):雖然兩個博弈都存在一個對整個社會是低效率的納什平衡;但在囚徒姿態(tài)中這一平衡是獨一的(并且是參與者的嚴(yán)厲占優(yōu)戰(zhàn)略),而在這里還同時存在另一個有效率的平衡。從而,這一模型并不能預(yù)側(cè)何時會發(fā)生對銀行的擠提,但確實顯示出擠提會作為一個平衡結(jié)果而出現(xiàn)。經(jīng)典案例之 關(guān)稅競爭
13、在國際爭端中,關(guān)稅與貿(mào)易爭端最為猛烈。由于貿(mào)易能增進(jìn)雙方的福利,而關(guān)稅是妨礙貿(mào)易自在的最大妨礙。在早期,政府自在選擇關(guān)稅稅率時將如何決策?思索兩個完全一樣的國家i=1,2,思索兩個完全一樣的國家i=1,2,政府擔(dān)任確定關(guān)稅稅率(t1,t2);思索兩個完全一樣的國家i=1,2,一個政府擔(dān)任確定關(guān)稅稅率(t1,t2);企業(yè)1制造產(chǎn)品h1供應(yīng)本國,及出口e1;思索兩個完全一樣的國家i=1,2,一個政府擔(dān)任確定關(guān)稅稅率(t1,t2);企業(yè)1制造產(chǎn)品h1供應(yīng)本國,及出口e1;企業(yè)制造產(chǎn)品供應(yīng)本國(h1,h2)及出口(e1,e2);思索兩個完全一樣的國家i=1,2,政府擔(dān)任確定關(guān)稅稅率(t1,t2);企業(yè)
14、制造產(chǎn)品供應(yīng)本國(h1,h2)及出口(e1,e2);市場1:Q1=h1+e2思索兩個完全一樣的國家i=1,2,政府擔(dān)任確定關(guān)稅稅率(t1,t2);企業(yè)制造產(chǎn)品供應(yīng)本國(h1,h2)及出口(e1,e2);兩個市場:Qi=hi+ej思索兩個完全一樣的國家i=1,2,政府擔(dān)任確定關(guān)稅稅率(t1,t2);企業(yè)制造產(chǎn)品供應(yīng)本國(h1,h2)及出口(e1,e2);兩個市場:Qi=hi+ej, pi(Qi)=a-Qi思索兩個完全一樣的國家i=1,2,每個國家有一個政府擔(dān)任確定關(guān)稅稅率(t1,t2);一個企業(yè)制造產(chǎn)品供應(yīng)本國(h1,h2)及出口(e1,e2); 博弈的時間順序如下:(1)政府同時選擇關(guān)稅稅率t
15、1和t2;(2)企業(yè)察看到關(guān)稅稅率,并同時選擇其提供國內(nèi)消費和出口的產(chǎn)量(h1, e1)和(h2, e2); 企業(yè)的收益為其利潤i:i(ti, tj, hi,ei, hj, ej)=a-(hi+ej)hi + a-(hj+ei)ei-c(hi+ei)-tjei由于i (ti,tj,hi,ei,hj*,ej*)可表示為:企業(yè)I 在市場i的利潤 + 在市場j的利潤即i(ti, tj, hi,ei, hj, ej)=a-(hi+ej)hi + a-(hj+ei)ei-c(hi+ei)-tjei也即i(ti, tj, hi,ei, hj, ej)=a-(hi+ej)hi -chi + a-(hj+ei
16、)ei-cei-tjei企業(yè)i在市場的最優(yōu)化問題就可拆為一對問題,在每個市場分別求解 企業(yè)的收益為其利潤i:i(ti, tj, hi,ei, hj, ej)=a-(hi+ej)hi -chi + a-(hj+ei)ei-cei-tjei企業(yè)i在市場的最優(yōu)化問題就可拆為一對問題,在每個市場分別求解 hi*須滿足:max hia-(hi+ej*)-c,hi0企業(yè)的收益為其利潤i:i(ti, tj, hi,ei, hj, ej)=a-(hi+ej)hi -chi + a-(hj+ei)ei-cei-tjeiei*必需滿足:maxeia-(ei+hj*)-c-tjeiei0企業(yè)的收益為其利潤i:i(t
17、i, tj, hi,ei, hj, ej)=a-(hi+ej)hi + a-(hj+ei)ei-c(hi+ei)-tjeihi*須滿足:max hi a - (hi+ej*) - c,hi0ei*必需滿足:max ei a - (ei+hj*) c - tjeiei0企業(yè)的收益為其利潤i:i(ti, tj, hi,ei, hj, ej)=a-(hi+ej)hi + a-(hj+ei)ei-c(hi+ei)-tjeihi*須滿足:maxhia-(hi+ej*)-c,hi0且ei*必需滿足:maxeia-(ei+hj*)-c-tjeiei0企業(yè)的收益為其利潤i:i(ti, tj, hi,ei, h
18、j, ej)=a-(hi+ej)hi + a-(hj+ei)ei-c(hi+ei)-tjei解得hi*=(a-ej*-c)/2ei*=(a-hj*-c-tj)/2 同理,假設(shè)政府給定關(guān)稅稅率t1和t2,那么第二個企業(yè)j將選擇產(chǎn)量(hj*, ej*),即同理,假設(shè)政府給定關(guān)稅稅率t1和t2,那么第二個企業(yè)j將選擇產(chǎn)量(hj*, ej*),即hj*=(a-c+tj)/3 ej*=(a-c-2ti)/3假設(shè)政府給定關(guān)稅稅率t1和t2,那么企業(yè)i將選擇產(chǎn)量(hi*, ei*),即hj*=(a-c+tj)/3 ej*=(a-c-2ti)/3那么利潤為i(ti, tj, hi,ei, hj, ej)=a-
19、(hi+ej)hi + a-(hj+ei)ei-c(hi+ei)-tjei假設(shè)政府給定關(guān)稅稅率t1和t2,那么企業(yè)i將選擇產(chǎn)量(hi*, ei*),即hj*=(a-c+tj)/3 ej*=(a-c-2ti)/3那么利潤為i(ti, tj, hi,ei, hj, ej)=a-(hi+ej)hi + a-(hj+ei)ei-c(hi+ei)-tjei政府的收益回到第一階段政府的收益那么為其本國的總福利wi,它由消費者剩余、企業(yè)利潤及關(guān)稅構(gòu)成,即: wi(ti, tj, hi,ei, hj, ej)= (hi+ej)2/2 + i(ti, tj, hi,ei, hj, ej) + tiej回到第一階
20、段政府的收益那么為其本國的總福利wi,它由消費者剩余、企業(yè)利潤及關(guān)稅構(gòu)成,即: wi(ti, tj, hi,ei, hj, ej)= (hi+ej)2/2 + i(ti, tj, hi,ei, hj, ej) + tiej回到第一階段把第一階段的結(jié)果代入得回到第一階段求解一階條件回到第一階段求解一階條件回到第一階段求解一階條件得有該博弈的子博弈完美納什平衡: 以及對應(yīng)的納什平衡結(jié)果 在子博弈精煉解中,每個市場上的總量為 , 。 進(jìn)一步分析我們發(fā)現(xiàn),假設(shè)政府選擇0關(guān)稅稅率,那么每個市場上的總量為 , 。于是,政府就有動因簽署一個相互承諾0關(guān)稅稅率的協(xié)定,即自在貿(mào)易。第三節(jié) 樹形博弈的子博弈定義:
21、由一個動態(tài)博弈第一階段以外的某階段開場的后續(xù)博弈階段構(gòu)成的,有初始信息集和進(jìn)展博弈所需求的全部信息,可以自成一個博弈的原博弈的一部分,稱為原動態(tài)博弈的一個“子博弈。乙甲不借借不分分1,00,42,2乙-1,0留意1、子博弈不能從第一個階段開場,由于原來的博弈母博弈本身不能稱為子博弈,即子博弈集合是一個真子集合。2、子博弈不能分割原來博弈母博弈的信息集。ABCDEFGHID、E、F、G點以后都不能構(gòu)成子博弈.這個博弈有幾個子博弈?第四節(jié) 子博弈精煉納什平衡定義:假設(shè)一個完美信息的動態(tài)博弈中,各博弈方的戰(zhàn)略構(gòu)成的一個戰(zhàn)略組合滿足,在整個動態(tài)博弈及它的一切子博弈中都構(gòu)成納什平衡,那么這個戰(zhàn)略組合稱為
22、該動態(tài)博弈的一個“子博弈完美納什平衡。子博弈完美納什平衡可以排除平衡戰(zhàn)略中不可信的要挾(許愿)和承諾,因此是真正穩(wěn)定的。逆推歸納法(倒推法)是求完美信息動態(tài)博弈子博弈完美納什平衡的根本方法。留意子博弈精煉納什平衡本身也是納什平衡,但卻比納什平衡更強(qiáng)的平衡概念。子博弈精煉納什平衡可以排除不是結(jié)果的納什平衡。例如:情侶博弈中,足球,足球,足球和芭蕾,芭蕾,芭蕾戰(zhàn)略不是子博弈精煉納什平衡,因此不是最終的結(jié)果。圖見P179。假設(shè)一個戰(zhàn)略組合的某個戰(zhàn)略成分有偏離的鼓勵,我們可以說這個戰(zhàn)略組合缺乏部分穩(wěn)定性,不是子博弈精煉納什平衡。完美博弈的庫恩定理:完美信息的有限序貫博弈都有納什平衡。動態(tài)博弈分析中為什么要引進(jìn)子博弈完美納什平衡,它與納什平衡是什么關(guān)系?子博弈完美納什平衡是一種戰(zhàn)略組合,它們不僅在整個博弈中構(gòu)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024二手房屋買賣合同書,二手房買賣合同范本
- 2024校園零散維修年度服務(wù)合同
- 2024解除勞動合同的勞動爭議仲裁申請期限如何起算問題批復(fù)
- 2024上海市勞動合同常用條款解讀
- 完整美縫施工合同書范文三篇
- 2024裝飾外包合同范本常用版本
- 《召公諫歷王彌謗》課件
- 建筑裝飾建筑工程分包商管理案例考核試卷
- 腎部疾病的診斷與治療
- 化學(xué)礦物的利用與市場發(fā)展前景的研究考核試卷
- 外墻雙排鋼管腳手架搭設(shè)綜合單價分析表
- 《房屋查驗與室內(nèi)環(huán)境檢測技術(shù)》課程標(biāo)準(zhǔn)
- 中文分項樣本a10vm.a10ve
- 幼兒園游戲方案與案例-完整版PPT課件
- 生產(chǎn)安全事故風(fēng)險評估報告(參考模板)
- ASME培訓(xùn)教程ASME規(guī)范第VIII-1卷-壓力容器
- 過磅管理制度管理辦法
- 繩子的故事(課堂PPT)
- 華為交換機(jī)常用配置
- 社區(qū)居家養(yǎng)老服務(wù)需求論文
- 110米鋼桁梁頂推架設(shè)監(jiān)理實施細(xì)則
評論
0/150
提交評論