第6.3講:RepeatedGames(III):以“囚徒困境博弈”為例_第1頁
第6.3講:RepeatedGames(III):以“囚徒困境博弈”為例_第2頁
第6.3講:RepeatedGames(III):以“囚徒困境博弈”為例_第3頁
第6.3講:RepeatedGames(III):以“囚徒困境博弈”為例_第4頁
第6.3講:RepeatedGames(III):以“囚徒困境博弈”為例_第5頁
已閱讀5頁,還剩40頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、Lecture 6: Repeated Games(III)以“囚徒困境博弈”為例1嚴(yán)格競爭博弈的重復(fù)博弈嚴(yán)格競爭博弈的重復(fù)博弈零和博弈或其他嚴(yán)格競爭博弈的零和博弈或其他嚴(yán)格競爭博弈的有限次有限次和和無限次無限次重復(fù)博弈,都不可能產(chǎn)生比一重復(fù)博弈,都不可能產(chǎn)生比一次性博弈更理想的結(jié)果,博弈方的唯一次性博弈更理想的結(jié)果,博弈方的唯一選擇是選擇是始終采用原博弈的混合策略納什始終采用原博弈的混合策略納什均衡策略均衡策略,因為重復(fù)博弈不會改變博弈,因為重復(fù)博弈不會改變博弈方之間的利益對立關(guān)系。方之間的利益對立關(guān)系。以以“猜硬幣博弈猜硬幣博弈”為例為例2存在唯一純策略納什均衡存在唯一純策略納什均衡博弈的

2、重復(fù)博弈博弈的重復(fù)博弈3在有唯一純策略納什均衡的博弈中,博在有唯一純策略納什均衡的博弈中,博弈方之間的利益關(guān)系不再是始終對立的,弈方之間的利益關(guān)系不再是始終對立的,而是有很大一致性甚至完全一致。而是有很大一致性甚至完全一致。4乙甲存在唯一純策略納什均衡博弈的重復(fù)博弈存在唯一純策略納什均衡博弈的重復(fù)博弈?以以“存在唯一純策略納什均衡博存在唯一純策略納什均衡博弈弈”為原博弈的重復(fù)博弈中,博弈為原博弈的重復(fù)博弈中,博弈方的行為和博弈結(jié)果會不會發(fā)生方的行為和博弈結(jié)果會不會發(fā)生本質(zhì)的變化呢?本質(zhì)的變化呢?5乙甲存在唯一純策略納什均衡博弈的重復(fù)博弈存在唯一純策略納什均衡博弈的重復(fù)博弈存在唯一純策略納什均衡

3、博弈的重復(fù)博弈存在唯一純策略納什均衡博弈的重復(fù)博弈有限次重復(fù)博弈有限次重復(fù)博弈無限次重復(fù)博弈無限次重復(fù)博弈6囚徒困境博弈囚徒困境博弈7坦白坦白抵賴抵賴坦白坦白(-5,-5)(0,-8)抵賴抵賴(-8,0)(-1,-1)甲乙策略組合(坦白,坦白)是策略組合(坦白,坦白)是“囚徒困境囚徒困境”博弈的唯一純策略納什均衡。博弈的唯一純策略納什均衡。“囚徒困境博弈囚徒困境博弈”的兩次重復(fù)博弈的兩次重復(fù)博弈“囚徒困境博弈囚徒困境博弈”的兩次重復(fù)博弈的兩次重復(fù)博弈利用利用“逆推歸納法逆推歸納法”進(jìn)行分析進(jìn)行分析8坦白坦白抵賴抵賴坦白坦白(-5,-5)(0,-8)抵賴抵賴(-8,0)(-1,-1)乙甲“囚徒困

4、境博弈囚徒困境博弈”的兩次重復(fù)博弈的兩次重復(fù)博弈首先,分析第二階段(即第二次重復(fù)時)兩博弈首先,分析第二階段(即第二次重復(fù)時)兩博弈方的選擇。方的選擇。第二階段仍然是兩囚徒之間的一個囚徒困境博弈,此時第二階段仍然是兩囚徒之間的一個囚徒困境博弈,此時前一階段的結(jié)果已成為既成事實,此后又不再有任何的前一階段的結(jié)果已成為既成事實,此后又不再有任何的后續(xù)階段,因此實現(xiàn)自身當(dāng)前的最大利益是兩博弈方在后續(xù)階段,因此實現(xiàn)自身當(dāng)前的最大利益是兩博弈方在該階段決策中的唯一原則。該階段決策中的唯一原則。因此不管前一次博弈的結(jié)果如何,第二階段的唯一結(jié)果因此不管前一次博弈的結(jié)果如何,第二階段的唯一結(jié)果就是原博弈唯一的

5、納什均衡(坦白,坦白),雙方得益就是原博弈唯一的納什均衡(坦白,坦白),雙方得益的現(xiàn)在值為(的現(xiàn)在值為(5 5 ,5 5 )。)。9坦白坦白抵賴抵賴坦白坦白(-5,-5)(0,-8)抵賴抵賴(-8,0)(-1,-1)乙甲“囚徒困境博弈囚徒困境博弈”的兩次重復(fù)博弈的兩次重復(fù)博弈然后,回到第一階段,即第一次博弈。然后,回到第一階段,即第一次博弈。理性的博弈方在第一階段就對后一階段(第二階段)理性的博弈方在第一階段就對后一階段(第二階段)的結(jié)局非常清楚。因此不管第一階段的博弈結(jié)果是的結(jié)局非常清楚。因此不管第一階段的博弈結(jié)果是什么,雙方在整個重復(fù)博弈中的最終得益,都將是什么,雙方在整個重復(fù)博弈中的最終

6、得益,都將是第一階段得益的基礎(chǔ)上各加第一階段得益的基礎(chǔ)上各加5 5 。因此從第一階段。因此從第一階段的選擇來看,這個重復(fù)博弈與如下得益矩陣表示的的選擇來看,這個重復(fù)博弈與如下得益矩陣表示的一次性博弈實際上是完全等價的。一次性博弈實際上是完全等價的。10坦白坦白抵賴抵賴坦白坦白(-55 ,-55 )(05 ,-85 )抵賴抵賴(-85 ,05 )(-15 ,-15 )乙甲“囚徒困境博弈囚徒困境博弈”的兩次重復(fù)博弈的兩次重復(fù)博弈11坦白坦白抵賴抵賴坦白坦白(-5-5 ,-5-5 )(0-5 ,-8-5 )抵賴抵賴(-8-5 ,0-5 )(-1-5 ,-1-5 )乙乙甲甲該等價博弈有唯一的純策略納什

7、均衡(坦白,坦該等價博弈有唯一的純策略納什均衡(坦白,坦白),雙方的得益則為(白),雙方的得益則為(-5-5-5-5 ,-5-5-5-5 )。)?!扒敉嚼Ь巢┺那敉嚼Ь巢┺摹钡膬纱沃貜?fù)博弈的兩次重復(fù)博弈“囚徒困境博弈囚徒困境博弈”的兩次重復(fù)博弈的兩次重復(fù)博弈存在唯一的子博弈完美納什均衡:存在唯一的子博弈完美納什均衡:(坦白,坦白),(坦白,坦白);(坦白,坦白),(坦白,坦白);博弈方的總得益組合為(博弈方的總得益組合為(-5-5-5-5 ,-5-5-5-5 )。)。12“囚徒困境博弈囚徒困境博弈”的兩次重復(fù)博弈的兩次重復(fù)博弈囚徒困境博弈的兩次重復(fù)博弈相囚徒困境博弈的兩次重復(fù)博弈相當(dāng)于一次性囚

8、徒困境博弈的簡單當(dāng)于一次性囚徒困境博弈的簡單重復(fù)。重復(fù)。13“囚徒困境博弈囚徒困境博弈”的有限次重復(fù)博弈的有限次重復(fù)博弈(推廣)(推廣)“囚徒困境博弈囚徒困境博弈”的的 T T 次重復(fù)次重復(fù)博弈博弈存在唯一的子博弈完美納什均衡,即每次存在唯一的子博弈完美納什均衡,即每次重復(fù)都采用原博弈唯一的純策略納什均衡。重復(fù)都采用原博弈唯一的純策略納什均衡。14小結(jié)論小結(jié)論利用劃線法求解利用劃線法求解NashNash均衡解,都是在均衡解,都是在給定其他博弈方所取策略的條件下,比給定其他博弈方所取策略的條件下,比較同一博弈方采用不同策略時的得益大較同一博弈方采用不同策略時的得益大小。因此,在每個博弈方的各種可

9、能得小。因此,在每個博弈方的各種可能得益上加一個常數(shù)(不同博弈方的得益所益上加一個常數(shù)(不同博弈方的得益所加常數(shù)可以不同)之后,博弈的加常數(shù)可以不同)之后,博弈的NashNash均衡仍為均衡仍為“新新”博弈的均衡結(jié)果。博弈的均衡結(jié)果。15存在唯一純策略納什均衡博弈的有限次重復(fù)博弈存在唯一純策略納什均衡博弈的有限次重復(fù)博弈 定理定理: 設(shè)原博弈設(shè)原博弈G G有唯一的純策略納有唯一的純策略納什均衡,則對任意正整數(shù)什均衡,則對任意正整數(shù)T T ,重復(fù)博弈,重復(fù)博弈G G( (T T) ) 有唯一的子博弈完美納什均衡,有唯一的子博弈完美納什均衡,即各博弈方每個階段都采用即各博弈方每個階段都采用G G

10、的納什的納什均衡策略。均衡策略。1617存在唯一純策略納什均衡博弈的有限次重復(fù)博弈(存在唯一純策略納什均衡博弈的有限次重復(fù)博弈(續(xù)續(xù)) 利用逆推歸納法證明利用逆推歸納法證明 首先,分析重復(fù)博弈首先,分析重復(fù)博弈G(T)G(T)的最后一個階段,即第的最后一個階段,即第T T次重復(fù)次重復(fù) 由于第由于第T T次重復(fù)就是原博弈次重復(fù)就是原博弈G G,并且在該階段之后不再重復(fù),因,并且在該階段之后不再重復(fù),因此不管以前此不管以前T T-1 -1階段的博弈結(jié)果如何,在該階段中各博弈方必然階段的博弈結(jié)果如何,在該階段中各博弈方必然采用采用G G的唯一的納什均衡。的唯一的納什均衡。18存在唯一純策略納什均衡博

11、弈的有限次重復(fù)博弈(存在唯一純策略納什均衡博弈的有限次重復(fù)博弈(續(xù)續(xù)) 然后,再推回到前一階段,即第然后,再推回到前一階段,即第T T-1-1次重復(fù)次重復(fù) 由于此時各博弈方都知道下一階段由于此時各博弈方都知道下一階段( (即第即第T T階段階段) )的博弈結(jié)果,因此的博弈結(jié)果,因此對每個博弈方來說,從該階段開始的子博弈(即最后兩個階段)中對每個博弈方來說,從該階段開始的子博弈(即最后兩個階段)中各種策略組合的得益就是本階段的得益加上下一階段的均衡得益的各種策略組合的得益就是本階段的得益加上下一階段的均衡得益的貼現(xiàn)值。因此,各博弈方在該階段仍將采用貼現(xiàn)值。因此,各博弈方在該階段仍將采用G G的唯

12、一的納什均衡。的唯一的納什均衡。19存在唯一純策略納什均衡博弈的有限次重復(fù)博弈(存在唯一純策略納什均衡博弈的有限次重復(fù)博弈(續(xù)續(xù)) 依此類推直至博弈的第一階段。依此類推直至博弈的第一階段。 最終,可得結(jié)論!最終,可得結(jié)論!20存在唯一純策略納什均衡博弈的有限次重復(fù)博弈(存在唯一純策略納什均衡博弈的有限次重復(fù)博弈(續(xù)續(xù)) 有唯一純策略納什均衡的有限次重復(fù)博弈不比一次性博弈的有唯一純策略納什均衡的有限次重復(fù)博弈不比一次性博弈的結(jié)果理想,因為唯一的子博弈完美納什均衡是各博弈方每次結(jié)果理想,因為唯一的子博弈完美納什均衡是各博弈方每次重復(fù)都采用原博弈的納什均衡。重復(fù)都采用原博弈的納什均衡。21存在唯一純

13、策略納什均衡博弈的無限次重復(fù)博弈存在唯一純策略納什均衡博弈的無限次重復(fù)博弈存在唯一純策略納什均衡博弈的存在唯一純策略納什均衡博弈的無限無限次次重復(fù)博弈重復(fù)博弈以囚徒困境式博弈的無限次重復(fù)為例以囚徒困境式博弈的無限次重復(fù)為例22囚徒困境式博弈的無限次重復(fù)博弈囚徒困境式博弈的無限次重復(fù)博弈囚徒困境式博弈的無限次重復(fù)囚徒困境式博弈的無限次重復(fù)下面的分析將表明,在囚徒困境式博弈的下面的分析將表明,在囚徒困境式博弈的無限次重復(fù)博弈中,對雙方有利的合作無限次重復(fù)博弈中,對雙方有利的合作(指雙方克制自己的行為,為對方的利益指雙方克制自己的行為,為對方的利益和共同的利益著想,并非真正的聯(lián)合、合和共同的利益著想

14、,并非真正的聯(lián)合、合作作)在子博弈完美納什均衡中有可能存在,)在子博弈完美納什均衡中有可能存在,博弈可能出現(xiàn)比較理想的結(jié)果。博弈可能出現(xiàn)比較理想的結(jié)果。以以削價競爭博弈削價競爭博弈的無限次重復(fù)為例。的無限次重復(fù)為例。23削價競爭博弈削價競爭博弈24博弈方博弈方2HL博弈方博弈方1H4,40,5L5,01,1H和和L分別表示高價(不削價)和低價(削價)策略分別表示高價(不削價)和低價(削價)策略 削價競爭博弈(削價競爭博弈(續(xù)續(xù))該博弈的一次性博弈有唯一的純策略納什該博弈的一次性博弈有唯一的純策略納什均衡(均衡(L L,L L),得益組合為(),得益組合為(1 1,1 1)。)。25博弈方博弈方

15、2HL博弈方博弈方1H4,40,5L5,01,1削價競爭博弈(削價競爭博弈(續(xù)續(xù))策略組合(策略組合(H,H)實現(xiàn)的得益組合()實現(xiàn)的得益組合(4,4)比(比(1,1)高得多。但因為()高得多。但因為(H,H)并不)并不是該博弈的納什均衡,因此在一次性博弈是該博弈的納什均衡,因此在一次性博弈中不會被采用,這是一個典型的中不會被采用,這是一個典型的囚徒困境囚徒困境式博弈式博弈。26博弈方博弈方2HL博弈方博弈方1H4,40,5L5,01,1削價競爭博弈(削價競爭博弈(續(xù)續(xù))該博弈的該博弈的有限次重復(fù)博弈有限次重復(fù)博弈不能實現(xiàn)潛不能實現(xiàn)潛在的合作利益,兩博弈方在每次重復(fù)在的合作利益,兩博弈方在每次

16、重復(fù)中都不會采用效率較高的(中都不會采用效率較高的(H H,H H)。)。27博弈方博弈方2HL博弈方博弈方1H4,40,5L5,01,1觸發(fā)策略觸發(fā)策略(Trigger StrategyTrigger Strategy)重復(fù)博弈中博弈方首先試探合作,一旦發(fā)現(xiàn)重復(fù)博弈中博弈方首先試探合作,一旦發(fā)現(xiàn)對方不合作則用不合作報復(fù)的策略,稱為對方不合作則用不合作報復(fù)的策略,稱為“觸發(fā)策略觸發(fā)策略”。觸發(fā)策略是重復(fù)博弈中實現(xiàn)合作和提高均衡觸發(fā)策略是重復(fù)博弈中實現(xiàn)合作和提高均衡效率的關(guān)鍵機制,是重復(fù)博弈分析中構(gòu)造子效率的關(guān)鍵機制,是重復(fù)博弈分析中構(gòu)造子博弈完美納什均衡的基本博弈完美納什均衡的基本“構(gòu)件構(gòu)件”

17、之一。之一。28 “冷酷策略冷酷策略”(grim strategy)又稱為)又稱為“觸發(fā)策觸發(fā)策略略”(trigger strategy),因為任何參與人的),因為任何參與人的一次性不合作將觸發(fā)永遠(yuǎn)的不合作。(張維一次性不合作將觸發(fā)永遠(yuǎn)的不合作。(張維迎,迎,2012,第,第126頁)頁) 在冷酷戰(zhàn)略下,參與人沒有改正錯誤的機會。在冷酷戰(zhàn)略下,參與人沒有改正錯誤的機會。所以這個戰(zhàn)略確實是很冷酷的,但冷酷的結(jié)所以這個戰(zhàn)略確實是很冷酷的,但冷酷的結(jié)果是雙方都沒有背叛對方的積極性,因而是果是雙方都沒有背叛對方的積極性,因而是友善的。(張維迎,友善的。(張維迎,2012,第,第127頁)頁)2930削

18、價競爭博弈的無限次重復(fù)削價競爭博弈的無限次重復(fù)削價競爭博弈的無限次重復(fù)削價競爭博弈的無限次重復(fù)假設(shè)兩博弈方都采用假設(shè)兩博弈方都采用觸發(fā)策略觸發(fā)策略:第一階段采用:第一階段采用H H,在第,在第 t t 階段,如果前階段,如果前 t t-1 -1 階段的結(jié)果都是階段的結(jié)果都是(H(H,H)H),則繼續(xù)采,則繼續(xù)采用用H H,否則采用,否則采用L L。雙方在無限次重復(fù)博弈中都是雙方在無限次重復(fù)博弈中都是先試圖合作,第一次無條件選先試圖合作,第一次無條件選H H,如果對方采用的也是合作,如果對方采用的也是合作態(tài)度,則堅持選態(tài)度,則堅持選H H;一旦發(fā)現(xiàn);一旦發(fā)現(xiàn)對方不合作(選擇對方不合作(選擇L L

19、),則用),則用以后永遠(yuǎn)選擇以后永遠(yuǎn)選擇L L報復(fù)。報復(fù)。博弈方博弈方2HL博弈方博弈方1H4,40,5L5,01,1削價競爭博弈的無限次重復(fù)(削價競爭博弈的無限次重復(fù)(續(xù)續(xù))證明:證明:當(dāng)貼現(xiàn)系數(shù)當(dāng)貼現(xiàn)系數(shù) 較大時,雙方采較大時,雙方采用上述觸發(fā)策略構(gòu)成無限次重復(fù)博用上述觸發(fā)策略構(gòu)成無限次重復(fù)博弈的一個子博弈完美納什均衡。弈的一個子博弈完美納什均衡。31博弈方博弈方2HL博弈方博弈方1H4,40,5L5,01,1觸發(fā)策略:觸發(fā)策略:第一階段采用第一階段采用H H,在第在第 t t 階段,如果前階段,如果前 t t-1 -1 階階段的結(jié)果都是段的結(jié)果都是(H(H,H)H),則繼,則繼續(xù)采用續(xù)采

20、用H H,否則采用,否則采用L L。削價競爭博弈的無限次重復(fù)(削價競爭博弈的無限次重復(fù)(續(xù)續(xù))證明:證明:首先,證明雙方采用上述觸發(fā)策略是一個首先,證明雙方采用上述觸發(fā)策略是一個納什均衡。納什均衡。然后,證明上述觸發(fā)策略組合構(gòu)成整個無然后,證明上述觸發(fā)策略組合構(gòu)成整個無限次重復(fù)博弈的子博弈完美納什均衡。限次重復(fù)博弈的子博弈完美納什均衡。 32觸發(fā)策略:觸發(fā)策略:第一階段采用第一階段采用H H,在第在第 t t 階段,如果前階段,如果前 t t-1 -1 階階段的結(jié)果都是段的結(jié)果都是(H(H,H)H),則繼,則繼續(xù)采用續(xù)采用H H,否則采用,否則采用L L。削價競爭博弈的無限次重復(fù)(削價競爭博弈

21、的無限次重復(fù)(續(xù)續(xù)) 證明雙方采用上述觸發(fā)策略是一個納什均衡。證明雙方采用上述觸發(fā)策略是一個納什均衡。 假設(shè)博弈方假設(shè)博弈方1 1已經(jīng)采用了觸發(fā)策略,證明在已經(jīng)采用了觸發(fā)策略,證明在 達(dá)到一達(dá)到一定水平時,采用同樣的觸發(fā)策略是博弈方定水平時,采用同樣的觸發(fā)策略是博弈方2 2的最佳反的最佳反應(yīng)策略。應(yīng)策略。 因為博弈方因為博弈方1 1與博弈方與博弈方2 2是對稱的,因此只要這個結(jié)是對稱的,因此只要這個結(jié)論成立,就可以確定上述觸發(fā)策略是兩博弈方相互論成立,就可以確定上述觸發(fā)策略是兩博弈方相互對對方策略的最佳反應(yīng),因此構(gòu)成納什均衡。對對方策略的最佳反應(yīng),因此構(gòu)成納什均衡。33觸發(fā)策略:觸發(fā)策略:第一

22、階段采用第一階段采用H H,在第,在第 t t 階段,如果前階段,如果前 t t-1 -1 階段的結(jié)果都階段的結(jié)果都是是(H(H,H)H),則繼續(xù)采用,則繼續(xù)采用H H,否則采,否則采用用L L。削價競爭博弈的無限次重復(fù)(削價競爭博弈的無限次重復(fù)(續(xù)續(xù)) 假定博弈方假定博弈方1 1已經(jīng)采用觸發(fā)策略,證明在已經(jīng)采用觸發(fā)策略,證明在達(dá)到一達(dá)到一定水平時,采用同樣的觸發(fā)策略是博弈方定水平時,采用同樣的觸發(fā)策略是博弈方2 2的最佳的最佳反應(yīng)策略。反應(yīng)策略。博弈方博弈方2 2對博弈方對博弈方1 1觸發(fā)策略的最佳反應(yīng)策略的后觸發(fā)策略的最佳反應(yīng)策略的后半部分與觸發(fā)策略的后半部分是一樣的。半部分與觸發(fā)策略的后

23、半部分是一樣的。由于在某個階段出現(xiàn)與(由于在某個階段出現(xiàn)與(H H,H H)不同的結(jié)果)不同的結(jié)果以后博弈方以后博弈方1 1將永遠(yuǎn)采用將永遠(yuǎn)采用L L,此時博弈方,此時博弈方2 2也只也只有一直選擇有一直選擇L L。34觸發(fā)策略:觸發(fā)策略:第一階段采用第一階段采用H H,在第,在第 t t 階段,如果前階段,如果前 t t-1 -1 階段的結(jié)果都階段的結(jié)果都是是(H(H,H)H),則繼續(xù)采用,則繼續(xù)采用H H,否則采,否則采用用L L。削價競爭博弈的無限次重復(fù)(削價競爭博弈的無限次重復(fù)(續(xù)續(xù))確定博弈方確定博弈方2 2在第一階段的最優(yōu)選擇。在第一階段的最優(yōu)選擇。如果博弈方如果博弈方2 2采用采

24、用L L,那么在第一階段能得到那么在第一階段能得到5 5,但以后引起博弈方但以后引起博弈方1 1一直采用一直采用L L的報復(fù),自己的報復(fù),自己也只能一直采用也只能一直采用L L,得益將永遠(yuǎn)為,得益將永遠(yuǎn)為1 1,總得益,總得益的貼現(xiàn)值為的貼現(xiàn)值為3525 11.51 觸發(fā)策略:觸發(fā)策略:第一階段采用第一階段采用H H,在第,在第 t t 階段,如果前階段,如果前 t t-1 -1 階段的結(jié)果都階段的結(jié)果都是是(H(H,H)H),則繼續(xù)采用,則繼續(xù)采用H H,否則采,否則采用用L L。削價競爭博弈的無限次重復(fù)(削價競爭博弈的無限次重復(fù)(續(xù)續(xù))如果博弈方如果博弈方2 2采用采用H H,則在第一階段

25、他將得則在第一階段他將得4 4,下一,下一階段又面臨同樣的選擇。若記階段又面臨同樣的選擇。若記V V為博弈方為博弈方2 2在該重復(fù)在該重復(fù)博弈中每階段采用最佳選擇的總得益現(xiàn)在值,那么博弈中每階段采用最佳選擇的總得益現(xiàn)在值,那么從第二階段開始的無限次重復(fù)博弈與從第一階段開從第二階段開始的無限次重復(fù)博弈與從第一階段開始的只差一階段,因而在無限次重復(fù)時可看作相同始的只差一階段,因而在無限次重復(fù)時可看作相同的,其總得益的現(xiàn)在值折算成第一階段的得益為的,其總得益的現(xiàn)在值折算成第一階段的得益為V V ,因此當(dāng)?shù)谝浑A段的最佳選擇是,因此當(dāng)?shù)谝浑A段的最佳選擇是H H時,整個時,整個無限次重復(fù)博弈總得益的現(xiàn)在值

26、為:無限次重復(fù)博弈總得益的現(xiàn)在值為:364VV觸發(fā)策略:觸發(fā)策略:第一階段采用第一階段采用H H,在第,在第 t t 階段,如果前階段,如果前 t t-1 -1 階段的結(jié)果都階段的結(jié)果都是是(H(H,H)H),則繼續(xù)采用,則繼續(xù)采用H H,否則采,否則采用用L L。削價競爭博弈的無限次重復(fù)(削價競爭博弈的無限次重復(fù)(續(xù)續(xù))37441VVV削價競爭博弈的無限次重復(fù)(削價競爭博弈的無限次重復(fù)(續(xù)續(xù))因此,當(dāng)因此,當(dāng)384511即即1/41/4時,博弈方時,博弈方2 2會采用會采用H H策略,否則會采用策略,否則會采用L L策略。即策略。即當(dāng)當(dāng)1/41/4時,時,博弈方博弈方2 2對博弈方對博弈方1

27、 1觸發(fā)策略的最佳反應(yīng)是第觸發(fā)策略的最佳反應(yīng)是第一階段采用一階段采用H H。 觸發(fā)策略:觸發(fā)策略:第一階段采用第一階段采用H H,在第,在第 t t 階段,如果前階段,如果前 t t-1 -1 階段的結(jié)果都階段的結(jié)果都是是(H(H,H)H),則繼續(xù)采用,則繼續(xù)采用H H,否則采,否則采用用L L。削價競爭博弈的無限次重復(fù)(削價競爭博弈的無限次重復(fù)(續(xù)續(xù))由于從第二階段開始的無限次重復(fù)博弈,由于從第二階段開始的無限次重復(fù)博弈,與從第一階段開始的無限次重復(fù)博弈是完與從第一階段開始的無限次重復(fù)博弈是完全相同的,因此博弈方第二階段的選擇必全相同的,因此博弈方第二階段的選擇必然也是然也是H H,第三階段

28、也同樣。,第三階段也同樣。39觸發(fā)策略:觸發(fā)策略:第一階段采用第一階段采用H H,在第,在第 t t 階段,如果前階段,如果前 t t-1 -1 階段的結(jié)果都階段的結(jié)果都是是(H(H,H)H),則繼續(xù)采用,則繼續(xù)采用H H,否則采,否則采用用L L。削價競爭博弈的無限次重復(fù)(削價競爭博弈的無限次重復(fù)(續(xù)續(xù))依此類推,只要博弈方依此類推,只要博弈方1 1采用前述觸發(fā)策略,采用前述觸發(fā)策略,那么博弈方那么博弈方2 2的最優(yōu)選擇始終是的最優(yōu)選擇始終是H H。當(dāng)然,。當(dāng)然,如果博弈方如果博弈方1 1偏離偏離H H,博弈方,博弈方2 2也必須用也必須用L L來來報復(fù)。報復(fù)。40削價競爭博弈的無限次重復(fù)(削價競爭博弈的無限次重復(fù)(續(xù)續(xù))因此,博弈方因此,博弈方2 2對博弈方對博弈方1 1觸發(fā)策略的完整觸發(fā)策略的完整反應(yīng)策略是同樣的觸發(fā)策略。反應(yīng)策略是同樣的觸發(fā)策略。這就證明了這就證明了雙方采用上述觸發(fā)策略是一個納什均衡雙方采用上述觸發(fā)策略是一個納什均衡。41削價競爭博弈的無限次重復(fù)(削價競爭博弈的無限次重復(fù)(續(xù)續(xù))證明上述觸發(fā)策略組合構(gòu)成整個無限證明上述觸發(fā)策略組合構(gòu)成整個無限次重復(fù)博弈的子博弈完美納什均衡。次重復(fù)博弈的子博弈完美納什均衡。因為重復(fù)博弈的子博

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論