哈工大博弈論第7講_第1頁
哈工大博弈論第7講_第2頁
哈工大博弈論第7講_第3頁
哈工大博弈論第7講_第4頁
哈工大博弈論第7講_第5頁
已閱讀5頁,還剩88頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

經(jīng)典案例(2):討價還價博弈討價還價(bargaining)是市場中最常見、普通的事情。也是博弈論中典型的動態(tài)博弈問題。討價還價模型還可以推廣到談判問題。這里介紹的是討價還價最為經(jīng)典的模型。1經(jīng)典案例(2):討價還價博弈假設(shè)有兩個人分割一塊蛋糕,參與人1先出價(offer),參與人2可以選擇接受(accept)或拒絕(reject);如果參與人2接受,博弈結(jié)束,蛋糕按參與人1的方案分配。如果參與人2拒絕,參與人2出價,參與人1決定接受或拒絕;如果參與人1接受,博弈結(jié)束,蛋糕按參與人2的方案分配。如果參與人1拒絕,參與人1再出價…2經(jīng)典案例(2):討價還價博弈上述過程反復(fù)進行,直到一個參與人的出價被另一個參與人接受為止。這是一個無限期完美信息博弈,參與人1在1,3,5,…出價,參與人2在時期2,4,6,…出價。3經(jīng)典案例(2):討價還價博弈若用x表示參與人1的份額,(1-x)表示參與人2的份額,x1和(1-x1)分別是參與人1出價時參與人1和參與人2的份額,x2和1-x2分別是參與人2出價時參與人1和參與人2的份額。假定參與人1和參與人2的貼現(xiàn)因子分別為δ1和δ2,如果博弈在時期t結(jié)束,t是參與人i的出價階段,則參與人1支付的貼現(xiàn)值是π1=δ1t-1xi,參與人2支付的貼現(xiàn)值是π2=δ2t-1(1-xi)4經(jīng)典案例(2):討價還價博弈結(jié)合切蛋糕問題,貼現(xiàn)值既可以理解為資金的時間價值由于蛋糕由于未被分割出去所造成的自然縮減。雙方的耐心程度。5經(jīng)典案例(2):討價還價博弈問題分析由于該博弈是無限期博弈,因此,不能直接采用逆推歸納法。為分析上述問題,先考慮階段數(shù)有限的情形。6經(jīng)典案例(2):討價還價博弈有限階段討價還價問題假定博弈只進行兩個時期,在T=2,參與人2出價,如果他提出x2=0,參與人1會接受(假定參與人在接受和拒絕之間無差異時,我們假定他選擇接受)。因為博弈在T=2時,參與人1再沒有討價還價的機會。7經(jīng)典案例(2):討價還價博弈參與人2在T=2時得到的1單位等價于在t=1時的δ2單位,因此,如果參與人1在t=1時出價1-x1≥δ2,參與人2會接受;因為參與人1沒有必要給參與人2多于他會接受的最低份額,博弈均衡結(jié)果是參與人1得到x=x1=1-δ2,參與人2得到1-x=δ28

(a)T=1時參與人1出價情況(b)T=2時參與人2出價情況

圖2-18兩階段討價還價示意δ21-δ2經(jīng)典案例(2):討價還價博弈9經(jīng)典案例(2):討價還價博弈再假定T=3在最后階段,參與人1出價,他可以得到的最大份額是x1=1;因為參與人1在T=3時1單位等價于T=2時的δ1單位,因此,如果參與人2在T=2時出價x2=δ1,參與人1將會接受;因為參與人2在T=2的(1-δ1)單位等價于T=1時的δ2(1-δ1),因此,如果參與人1在T=1時出價1-x1=δ2(1-δ1),參與人2將會接受。因此,子博弈精煉均衡結(jié)果是x=1-δ2(1-δ1)10當T=4,5,…等有限整數(shù)值時,仿照前述方法,可以推導出任何給定的T的子博弈精煉納什均衡。如果δ1=δ2=0,不論T為多少,子博弈精煉均衡的結(jié)果是x=1;就是說,如果兩個參與人都是絕對無耐心的,第一個出價的人得到整個蛋糕;如果δ2=0,不論δ1為多少,子博弈精煉均衡結(jié)果仍然是x=1;如果δ1=0,δ2>0,子博弈精煉均衡結(jié)果是x=1-δ2經(jīng)典案例(2):討價還價博弈11經(jīng)典案例(2):討價還價博弈如果δ1=δ2=1,即雙方都有無限耐心,那么,如果T=1,3,5,…,均衡結(jié)果是x=1;如果T=2,4,6,…,均衡結(jié)果是x=0。這里的結(jié)果可以稱之為“后動優(yōu)勢”(last-moveradvantage)12經(jīng)典案例(2):討價還價博弈一般說來,如果0<δi<1,i=1,2,均衡結(jié)果不僅依賴于貼現(xiàn)因子的相對比率,而且還依賴于博弈時期T和誰在最后階段出價。然而,這種依存關(guān)系隨著T的變大而變小當T趨于無窮時,我們得到“先動優(yōu)勢”:如果δ1=δ2=δ,唯一的納什均衡結(jié)果為x=1/(1+δ)13無限階段討價還價問題羅賓斯坦恩(Rubinstein,1982):在無限期輪流出價博弈中,唯一的子博弈精煉納什均衡結(jié)果是經(jīng)典案例(2):討價還價博弈14無限階段討價還價問題羅賓斯坦恩(Rubinstein,1982):在無限期輪流出價博弈中,唯一的子博弈精煉納什均衡結(jié)果是如果δ1=δ2=δ,則經(jīng)典案例(2):討價還價博弈15經(jīng)典案例(2):討價還價博弈上述定理的證明由于T=∞,博弈沒有最后階段,不可能使用逆推歸納法。但根據(jù)Shaked,Sutton(1984),因為從參與人1出價的任何一個階段開始的子博弈等價于從T=1開始的整個博弈,因此可轉(zhuǎn)換為有限階段討價還價問題。見圖2-19。16從任一階段開始的子博弈(t為奇數(shù))…圖2-19無限階段討價還價問題t=1t=2t=k…t=3從t=1階段開始的整個博弈經(jīng)典案例(2):討價還價博弈17假定在時期t≥3時參與人1出價,參與人1能得到的最大份額是M;對參與人1而言,t期的M等價于t-1期的δ1M,參與人2知道在t-1時期的任何x2≥δ1M的出價將被參與人1接受,因此參與人出價x2=δ1M,自己獲得1-δ1M;對于參與人2而言,t-1期的1-δ1M等價于t-2期的δ2(1-δ1M),參與人知道在t-2期的任何x1<=1-δ2(1-δ1M)出價將被參與人2接受,因此參與人1出價x1=1-δ2(1-δ1M)t=1t=2t=k…t=3x=Mx=δ1Mx=1-δ2(1-δ1M)經(jīng)典案例(2):討價還價博弈18因此有x=1-δ2(1-δ1M)=M進而求得t=1t=2t=k…t=3x=Mx=δ1Mx=1-δ2(1-δ1M)經(jīng)典案例(2):討價還價博弈19與此類似,可求出參與人1能夠獲得的最小份額m,為經(jīng)典案例(2):討價還價博弈由于參與人1能得到的最大份額和最小份額相同,均衡結(jié)果是唯一的,為20多階段靜態(tài)博弈該類模型中至少在某個階段參與人同時選擇其決策。21多階段靜態(tài)博弈模型一例博弈中有四個參與人,分別用參與人1~4表示。第一階段是參與人1與2的決策選擇階段,他們同時在各自的策略集A1和A2中分別選擇a1和a2。第二階段是參與人3與4決策選擇階段,他們看到參與人1和2的決策a1和a2后,同時在各自的策略集A3,A4中分別選擇a3和a4。各參與人的支付函數(shù)是參與人的策略a1,a2,a3,a4的函數(shù),記為ui

=ui

(a1,a2,a3,a4)22多階段靜態(tài)博弈有同時選擇的動態(tài)博弈問題如國際競爭中最優(yōu)關(guān)稅博弈問題,兩個制定關(guān)稅的國家可看成標準模型中的參與人1與2;兩國各自的一個相互進行產(chǎn)量競爭的企業(yè)就是模型中的參與人3于4。上述標準模型的變形,如某個階段只有一個參與人;第二階段的參與人3于4與第一階段的參與人1與2相同等,也屬于同時選擇的動態(tài)博弈問題。23多階段靜態(tài)博弈這類模型實質(zhì)上就是完美信息動態(tài)博弈,因此仍然可以采用逆推歸納法進行分析。因為存在同時選擇,因此每個階段不再是單人優(yōu)化問題,而是一個靜態(tài)博弈。24

1988年杭州市許多儲蓄點被擠兌,原因是搶購風潮。

2000年6月河北省灤縣發(fā)生銀行擠兌,原因是灤縣縣政府行政干預(yù)金融業(yè)務(wù),引發(fā)儲戶心理發(fā)慌。當月28日,灤縣縣政府召開有縣土地局、質(zhì)量技術(shù)監(jiān)督局等5個單位參加的協(xié)調(diào)會,要求與會單位將存在建設(shè)銀行灤縣支行的公款轉(zhuǎn)存到其他銀行。此舉引起一些群眾對建行的信譽產(chǎn)生懷疑,造成部分儲戶恐慌,最終導致建設(shè)銀行灤縣支行的7個儲蓄網(wǎng)點中先后有6個網(wǎng)點被擠提存款。這事件隨在有關(guān)部門的努力下及時得到平息,但已嚴重干擾了金融秩序。25多階段靜態(tài)博弈簡例:擠兌博弈問題描述:銀行信貸對社會經(jīng)濟發(fā)展的作用無可估量,但它在帶來巨大利益的同時也蘊含著一定的風險。設(shè)一家銀行為了給一個企業(yè)貸放一筆20000元的貸款,以20%的年利率吸引客戶存款。若兩個客戶各有10000元資金,如果他們把資金作為1年期定期存款存入該銀行,那么銀行就可以向企業(yè)貸款。如果兩客戶都不愿存款或只有一個客戶存款,那么銀行就無法給上述企業(yè)貸款,這時候客戶的本金可以保全。26多階段靜態(tài)博弈簡例:擠兌博弈在兩個客戶都存款,從而銀行給上述企業(yè)提供貸款的情況下,如果銀行滿1年收回貸款,企業(yè)就能完成一筆生意,銀行可收回貸款本息,并可支付存款客戶的存款本息。如果在不到1年的時候,其中任何一個客戶單獨或同時要求提前取出存款,銀行就不得不提前收回貸款。假設(shè)銀行只能收回80%的本錢。若只有一個客戶要求提前取款,則銀行會償還其全部本金,余款則屬于另一客戶;若兩客戶同時要求提前取款,則平分回收的資金。27多階段靜態(tài)博弈簡例:擠兌博弈根據(jù)上述假設(shè),可以用圖2-20的兩個矩陣表示該問題。不存存款不存1,11,1存款1,1下一階段提前到期提前0.8,0.81,0.6到期0.6,11.2,1.2客戶2客戶1圖2-20銀行擠兌風險客戶2客戶1第一階段第二階段28多階段靜態(tài)博弈簡例:擠兌博弈用逆推歸納法來分析該博弈。在第二個階段的博弈。這是一個二人完全信息靜態(tài)博弈,可以得出該博弈有兩個純策略納什均衡(提前,提前)和(到期,到期)。對應(yīng)的支付情況分別為(0.8,0.8)和(1.2,1.2)。分別為風險占優(yōu)均衡和帕雷托占優(yōu)均衡。提前到期提前0.8,0.81,0.6到期0.6,11.2,1.2客戶2客戶1第二階段29多階段靜態(tài)博弈簡例:擠兌博弈其中,風險占優(yōu)均衡就是“擠兌”現(xiàn)象,而帕雷托占優(yōu)則是金融健康的經(jīng)濟現(xiàn)象。若采用風險占優(yōu)策略的客戶比例較大,超出了銀行承受能力,就可能會造成金融危機。提前到期提前0.8,0.81,0.6到期0.6,11.2,1.2客戶2客戶1第二階段30如果第二個階段博弈結(jié)果是比較理想的(到期,到期)納什均衡,那么這時候第一階段的博弈相當于圖2-21的支付矩陣(完全信息靜態(tài)博弈)。不存存款不存1,11,1存款1,1下一階段提前到期提前0.8,0.81,0.6到期0.6,11.2,1.2第一階段31如果第二個階段博弈結(jié)果是比較理想的(到期,到期)納什均衡,那么這時候第一階段的博弈相當于圖2-21的支付矩陣(完全信息靜態(tài)博弈)。不存存款不存1,11,1存款1,11.2,1.2多階段靜態(tài)博弈簡例:擠兌博弈圖2-21第一階段等價博弈(1)32此時也有兩個純戰(zhàn)略納什均衡,為(不存,不存),(存款,存款),且后一個均衡策略帕雷托優(yōu)于前一個,同時也是風險占優(yōu)均衡。因此,兩客戶都會選擇存款給銀行。這是銀行融資信用很好起的作用。不存存款不存1,11,1存款1,11.2,1.2多階段靜態(tài)博弈簡例:擠兌博弈圖2-21第一階段等價博弈(1)33如果第二個階段博弈結(jié)果是不甚理想的(提前,提前)納什均衡,那么這時候第一階段的博弈支付如圖2-22的矩陣。此時(不存,不存)是兩客戶的納什均衡,也是占優(yōu)均衡。因此,兩客戶都會選擇“不存”,這相當于客戶不再信任銀行的情況。但這時候不會引起銀行擠兌現(xiàn)象及金融危機。因為沒有人存錢給銀行。不存存款不存1,11,1存款1,10.8,0.8多階段靜態(tài)博弈簡例:擠兌博弈圖2-22第一階段等價博弈(2)34多階段靜態(tài)博弈簡例:擠兌博弈由該模型,可將由于擠兌導致的金融危機解釋為:在金融穩(wěn)定時期,社會閑散資金會選擇銀行;企業(yè)多數(shù)從銀行貸款進行發(fā)展,但若從事的項目風險較大,有些企業(yè)可能到期不能償還貸款;社會儲戶由于上述信息引起恐慌,引發(fā)擠兌現(xiàn)象;擠兌現(xiàn)象達到一定程度,引發(fā)一些銀行倒閉;金融危機由此產(chǎn)生。35多階段靜態(tài)博弈簡例:工作競賽博弈論在經(jīng)濟、機制理論上的應(yīng)用,是現(xiàn)代博弈論的一個重要應(yīng)用領(lǐng)域。傳統(tǒng)經(jīng)濟理論分析往往是“思辨似的”,“語言式的”分析方式,“一千個讀者就有一千個哈姆雷特”。因此,在看似合理的分析的同時,可能產(chǎn)生不同甚至相互矛盾的結(jié)論也就不足為奇了博弈論以定量化分析為主要特色,分析更具有嚴密性。36工作競賽問題描述有兩個工人,工人i(i=1或2)的產(chǎn)出,可用yi=ei+εi,其中ei

是努力程度,εi是隨機擾動項。多階段靜態(tài)博弈簡例:工作競賽37生產(chǎn)程序如下:第一,兩個工人同時選擇非負的努力水平ei≥0;第二,隨機擾動項ε1,ε2彼此獨立,并服從期望值為0、密度為f(ε)的概率分布;第三,工人的產(chǎn)出可以觀測,但各自選擇的努力水平無法觀測,從而工人的工資可以決定于個人的產(chǎn)出,但無法直接取決于其努力水平。多階段靜態(tài)博弈簡例:工作競賽38老板的激勵措施是,工作競賽的優(yōu)勝者(即產(chǎn)出水平較高的工人)獲得的工資為wH;失敗者的工資為wL.工人獲得工資水平w并付出努力程度e時的收益為u(w,e)=w–g(e),其中g(shù)(e)表示努力工作帶來的負效用,是遞增的凸函數(shù)(g’>0,g’’>0)。老板的收益為y1+y2-wH-wL多階段靜態(tài)博弈簡例:工作競賽39記老板為參與人1,他的行動a1是選擇工作競賽中的工資水平wH,wL;兩個工人是參與人3,4,他們觀測第一階段選定的工資水平,然后同時選擇行動a3,a4,也就是選擇努力的程度e1,e2參與者各自的收益如前面所給出。多階段靜態(tài)博弈簡例:工作競賽40分析假定老板已經(jīng)選定了工資水平wH,wL,如果一對努力水平組合(e1*,e2*)是第二階段兩工人博弈的納什均衡,則對于每一個i,ei*必須使工人的期望工資減去努力帶來的負效用后的凈收益最大,即多階段靜態(tài)博弈簡例:工作競賽41進一步化簡該式,得其中多階段靜態(tài)博弈簡例:工作競賽42進一步化簡該式,得多階段靜態(tài)博弈簡例:工作競賽上式的一階最優(yōu)條件為43該式的含義是,工人i選擇努力程度ei,從而使得額外努力的邊際負效用g’等于增加努力的邊際收益,后者又等于對優(yōu)勝者的獎勵工資(wH-wL),乘以因努力程度提高而使獲勝概率的增加。多階段靜態(tài)博弈簡例:工作競賽44根據(jù)貝葉斯法則多階段靜態(tài)博弈簡例:工作競賽45于是一階條件可化為多階段靜態(tài)博弈簡例:工作競賽46于是一階條件可化為多階段靜態(tài)博弈簡例:工作競賽在對稱均衡下,e1*=e2*=e*,得到新的式子47于是一階條件可化為多階段靜態(tài)博弈簡例:工作競賽在對稱均衡下,e1*=e2*=e*,得到新的式子48階段結(jié)論由于g(e)是凸函數(shù),優(yōu)勝獲得的獎勵越高,就會激發(fā)更大的努力;另一方面,在同樣的獎勵水平下,對產(chǎn)出的隨機擾動因素越大,越不值得努力工作,因為這時工作競賽的最終結(jié)果在很大程度上取決于運氣,而非努力程度。多階段靜態(tài)博弈簡例:工作競賽49按照逆向歸納法,假定工人們同意參加工作競賽,對于給定的wH

和wL的反應(yīng),就是前面描述的對稱納什均衡策略多階段靜態(tài)博弈簡例:工作競賽50假定工人可以尋求其他就業(yè)機會,得到的效用為Ua,如果老板要使工人有動力參加工作競賽,則他必須選擇滿足下式的工資水平多階段靜態(tài)博弈簡例:工作競賽51直觀上就可看出,老板給出的工資水平在滿足下式的基礎(chǔ)上,越低越好。因此,成立多階段靜態(tài)博弈簡例:工作競賽52直觀上就可看出,老板給出的工資水平在滿足下式的基礎(chǔ)上,越低越好。因此,成立多階段靜態(tài)博弈簡例:工作競賽53此時老板的利潤為多階段靜態(tài)博弈簡例:工作競賽該式的一階條件為54由式子多階段靜態(tài)博弈簡例:工作競賽該式的一階條件為55可以得出多階段靜態(tài)博弈簡例:工作競賽該式的一階條件為56可以得出多階段靜態(tài)博弈簡例:工作競賽與下式聯(lián)立,就可得出老板的最優(yōu)工資確定策略57前向歸納法前面已經(jīng)說明,完美信息動態(tài)博弈的經(jīng)典求解方法為逆序歸納法。還有一種分析方式,就是前向歸納法(forwardinduction)。前向歸納法由科爾博格和莫頓斯(1986)提出。這里不進行嚴格的數(shù)學描述,僅通過一個例題進行說明。58前向歸納法一例:燒錢博弈回顧博弈論的經(jīng)典問題,性別戰(zhàn)博弈PLAYER2LRT3,10,0B0,01,3圖2-23

性別戰(zhàn)博弈PLAYERl59前向歸納法一例:燒錢博弈該博弈有兩個純策略均衡(T,L),(B,R)以及一個混合策略均衡。PLAYER2LRT3,10,0B0,01,3圖2-23

性別戰(zhàn)博弈PLAYERl60前向歸納法一例:燒錢博弈現(xiàn)對博弈進行稍微修改,見圖2-24圖2-24

修改的性別戰(zhàn)

3,10,00,01,3TBLR1InOut2,261前向歸納法一例:燒錢博弈這時博弈的合理結(jié)果是什么?圖2-24

修改的性別戰(zhàn)

3,10,00,01,3TBLR1InOut2,262前向歸納法一例:燒錢博弈如果博弈到達第2階段…圖2-24

修改的性別戰(zhàn)

3,10,00,01,3TBLR1InOut2,263前向歸納法一例:燒錢博弈說明參與人1放棄了第一階段獲取2單位效用的機會…圖2-24

修改的性別戰(zhàn)

3,10,00,01,3TBLR1InOut2,264前向歸納法一例:燒錢博弈如果參與人是理性的,必然在第二階段追求更好(>2)的結(jié)局。圖2-24

修改的性別戰(zhàn)

3,10,00,01,3TBLR1InOut2,265前向歸納法一例:燒錢博弈因此,在第二階段,參與人1必然要選取策略T.圖2-24

修改的性別戰(zhàn)

3,10,00,01,3TBLR1InOut2,266前向歸納法一例:燒錢博弈預(yù)見到上述情況,參與人2將選擇策略L圖2-24

修改的性別戰(zhàn)

3,10,00,01,3TBLR1InOut2,267前向歸納法一例:燒錢博弈因此,按照前向歸納法邏輯,合理結(jié)局是…圖2-24

修改的性別戰(zhàn)

3,10,00,01,3TBLR1InOut2,268重復(fù)博弈和無名氏定理重復(fù)博弈(repeatedgame)的定義指同樣結(jié)構(gòu)的博弈重復(fù)多次,其中的每次博弈稱為“階段博弈(stagegame)”。如兩個多次犯罪的“囚徒問題”。由于動態(tài)博弈是相機行動,反映到重復(fù)博弈中,就是可以使自己在某個階段的博弈選擇依賴于其他參與人過去的行動歷史。69重復(fù)博弈和無名氏定理如囚徒困境的重復(fù)博弈的一個策略可以是:“如果這次你選擇了坦白,我下次將選擇坦白;如果你這次選擇了抵賴,我下次將選擇抵賴”。因此,參與人在重復(fù)博弈中的戰(zhàn)略空間遠遠大于和復(fù)雜于在每個階段博弈中的戰(zhàn)略空間。70重復(fù)博弈和無名氏定理影響重復(fù)博弈均衡結(jié)果的主要因素是博弈重復(fù)次數(shù)和信息的完備性(completeness)。重復(fù)次數(shù)對參與人可能會有的影響是:參與人為了獲得長遠利益而犧牲眼前利益的策略成為可能。關(guān)于完備性,簡單地說,但一個參與人的支付函數(shù)不為其他參與人所知時,該參與人可能有積極性建立一個“好”的聲譽(reputation)以換取長遠利益。在社會行為中,經(jīng)??梢钥吹奖举|(zhì)不好的人在相當長的時期內(nèi)干好事的原因。該部分內(nèi)容在不完全信息動態(tài)博弈中再作分析。71重復(fù)博弈和無名氏定理有限次重復(fù)博弈:連鎖店悖論考慮如圖2-25所示的市場進入博弈。如果進入者先行動,則可表示為完全信息動態(tài)博弈的博弈樹形式,見圖2-26。圖中A表示進入者,B表示在位者。圖2-25市場進入博弈默許斗爭進入40,50-10,0不進入0,3000,300在位者進入者72該博弈唯一的子博弈精煉納什均衡結(jié)果是進入者進入,在位者默許,分別得到40和50的支付。不進入進入斗爭默許(0,300)(0,300)圖2-26市場進入博弈ABB(40,50)(-10,0)默許斗爭重復(fù)博弈和無名氏定理73重復(fù)博弈和無名氏定理現(xiàn)在假定同樣的市場有20個(可以理解為在位者有20個連鎖店),進入者每次進入一個市場,博弈就變成了20次重復(fù)博弈。假定進入者先進入第1個市場,在位者應(yīng)該作如何反應(yīng)?按照一般的認識,在位者應(yīng)該堅決進行斗爭,即便是損失該市場,但可以阻止其他19個市場的進入者的進入。但按照子博弈精練納什均衡分析方法,卻與上述結(jié)論相左。74重復(fù)博弈和無名氏定理分析過程如下:設(shè)想前19個市場已被進入,進入者現(xiàn)在進入第20個市場。因為在最后階段,選擇斗爭已沒有任何威懾意義,在位者最優(yōu)選擇是默許,進入者將選擇進入?,F(xiàn)在考慮第19個市場。因為無論在位者選擇什么行動,第20個市場上的均衡結(jié)果不受影響(因為進入者知道第20各市場上在位者將選擇默許),在位者最優(yōu)選擇仍然是默許。75重復(fù)博弈和無名氏定理如此一直倒推回去,我們得到這個博弈的唯一子博弈精煉均衡是在位者在每一個市場上都選擇默許,進入者在每一個市場上選擇進入。這就是所謂的“連鎖店悖論”(chain-storeparadox,Selten,1978)76重復(fù)博弈和無名氏定理囚徒困境問題與市場進入博弈類似,只要博弈的重復(fù)次數(shù)是有限的,最后階段博弈的唯一納什均衡是兩個囚徒都選擇坦白,且“總是坦白”是唯一的子博弈精煉均衡。上述結(jié)果可以一般化為下述定理。定理:令G是階段博弈,G(T)是G重復(fù)T次的重復(fù)博弈(T<∞)。那么,如果G有唯一的納什均衡,重復(fù)博弈G(T)的唯一子博弈精煉納什均衡結(jié)果是階段博弈G的納什均衡重復(fù)T次(即每個階段博弈出現(xiàn)的都是一次性博弈的均衡結(jié)果)。77重復(fù)博弈和無名氏定理上述定理說明,只要博弈的重復(fù)次數(shù)是有限的,重復(fù)本身并不改變囚徒困境的均衡結(jié)果。上述定理中“唯一性”是一個重要條件。如果納什均衡不是唯一的,上述結(jié)論就不一定成立。當博弈有多個納什均衡時,參與人可以使用不同的納什均衡懲罰前面階段的不合作行為或獎勵第一階段的合作行為。78重復(fù)博弈和無名氏定理前述連鎖店悖論的一個解釋是引入信息的不完全性。在不完全信息動態(tài)博弈中,可以看到這一點。這里先給出一個解釋模型,即當博弈重復(fù)無窮多次而不是有限次時,存在著完全不同于一次博弈的子博弈精煉均衡。以囚徒問題為例,對此進行說明。79重復(fù)博弈和無名氏定理為便于討論,將囚徒問題復(fù)制于此,見圖2-27??梢宰C明,如果參與人有足夠的耐心,(抵賴,抵賴)是一個子博弈精煉納什均衡結(jié)果。圖2-27囚徒困境問題坦白抵賴坦白-8,-80,-10抵賴-10,0-1,-1囚徒2囚徒180考慮下列所謂的“冷酷戰(zhàn)略”(grimstrategies):開始時選擇抵賴;選擇抵賴直到有一方選擇了坦白,然后永遠選擇坦白。重復(fù)博弈和無名氏定理圖2-27囚徒困境問題坦白抵賴坦白-8,-80,-10抵賴-10,0-1,-1囚徒2囚徒181重復(fù)博弈和無名氏定理首先證明冷酷戰(zhàn)略是一個納什均衡回顧一下,所謂納什均衡,就是這樣的一個狀態(tài),對于任意一個參與人,給定其他參與人選擇納什均衡策略,該參與人都無法偏離納什均衡策略。因此,證明囚徒問題中冷酷戰(zhàn)略是一個納什均衡的方法是:給定其中任意一個參與人堅持“冷酷戰(zhàn)略”,另外一個參與人的最優(yōu)選擇也是堅持冷酷戰(zhàn)略。82重復(fù)博弈和無名氏定理設(shè)a為貼現(xiàn)因子(假定兩人貼現(xiàn)因子相同)。如果i在博弈的某個階段首先選擇了坦白,在該階段得到0單位的支付,優(yōu)于選擇抵賴得到的-1。但這個機會主義行為將觸發(fā)他的伙伴選擇“永遠坦白”的懲罰,因此i隨后每個階段的支付都是-8。因此,如果下列條件滿足,給定對手沒有選擇坦白,i將不會選擇坦白即83重復(fù)博弈和無名氏定理該式可以化簡為a≥1/8同樣道理,若對手首先選擇了坦白,不論a的值為多少,參與人i都有積極性堅持冷酷戰(zhàn)略。因此,冷酷戰(zhàn)略是一個納什均衡。84重復(fù)博弈和無名氏定理該戰(zhàn)略是否是子博弈精煉均衡?因為博弈重復(fù)無限次,從任何一個階段開始的子博弈與這個博弈的結(jié)構(gòu)完全相同。在冷酷戰(zhàn)略均衡下,子博弈可以分為兩類:在類型a,沒有任何參與人曾經(jīng)坦白;在類型b,至少有一個參與人曾經(jīng)坦白。85重復(fù)博弈和無名氏定理在類型a中,我們已經(jīng)證明,冷酷戰(zhàn)略在a類型子博弈

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論