第二節(jié)完全信息動態(tài)博弈(3)_第1頁
第二節(jié)完全信息動態(tài)博弈(3)_第2頁
第二節(jié)完全信息動態(tài)博弈(3)_第3頁
第二節(jié)完全信息動態(tài)博弈(3)_第4頁
第二節(jié)完全信息動態(tài)博弈(3)_第5頁
已閱讀5頁,還剩40頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、第三章 完全信息動態(tài)搏弈 -子博弈精煉納什均衡n一 博弈擴(kuò)展式表述n二 擴(kuò)展式表述博弈的納什均衡n三 子博弈精練納什均衡n四 重復(fù)博弈有限次重復(fù)博弈無限次重復(fù)博弈參與人不固定時的重復(fù)博弈n五 應(yīng)用舉例重復(fù)博弈n一次動態(tài)博弈也稱為“序貫博弈”。n重復(fù)博弈:指同樣結(jié)構(gòu)的博弈重復(fù)多次,其中的每次博弈稱為“階段博弈”。如囚徒困境。n重復(fù)博弈的特征:1、階段博弈之間沒有“物質(zhì)上”的聯(lián)系,即前一階段的博弈不改變后一階段的結(jié)構(gòu) ;2、所有參與人都觀測到博弈過去的歷史;3、參與人的總支付是所有階段博弈支付的貼現(xiàn)值之和或加權(quán)平均值。貼現(xiàn)因子:下一期的一單位支付在這一期的價值。注: (1)在每個階段,參與人可同時

2、行動(囚徒困境),也可不同時行動(房地產(chǎn)開發(fā))。(2)重復(fù)博弈可能是完美信息博弈,也可能是不完美信息博弈。重復(fù)博弈 因為其他參與人過去的歷史總是可以觀測到的,一個參與人可以使自己在某個階段博弈的選擇依賴于其他參與人過去的行動歷史,因此,參與人在重復(fù)博弈中的戰(zhàn)略空間遠(yuǎn)遠(yuǎn)大于和復(fù)雜于每一階段的戰(zhàn)略空間,這意味著,重復(fù)博弈可能帶來一些“額外”的均衡結(jié)果,而它可能在一次博弈分析中不存在。 影響重復(fù)博弈均衡結(jié)果的主要因素是博弈重復(fù)的次數(shù)和信息的完備性。 博弈重復(fù)的次數(shù)的重要性來源于參與人在短期利益和長遠(yuǎn)利益之間的權(quán)衡。 信息的完備性:當(dāng)一個參與人的支付函數(shù)不為其他參與人知道時,該參與人可能有積極性建立一

3、個“好”的聲譽(yù)以換取長遠(yuǎn)利益(第四章)。重復(fù)博弈和無名氏定理n有限次重復(fù)博弈連鎖店悖論進(jìn)入者進(jìn)入不進(jìn)入在位者默許斗爭默許(-10,0)(0,300)(0,300)(40,50)xx在位者斗爭 假定同樣的市場上有20個(可以理解為在位者有20個連鎖店),進(jìn)入者每次進(jìn)入一個市場,博弈就變成了20次重復(fù)博弈。 假定進(jìn)入者進(jìn)入第1個市場,在位者應(yīng)該如何反應(yīng)呢?重復(fù)博弈和無名氏定理n這個博弈的納什均衡是什么?n假定博弈共進(jìn)行10次,結(jié)果會如何?n為什么會出現(xiàn)這個結(jié)果?n倒推論證法 假定現(xiàn)在是第十次,結(jié)果和一次博弈一樣。第九次,即倒數(shù)第二次,局中人已經(jīng)很清楚,最后一次博弈對方肯定要實行低價,因此,現(xiàn)在如何

4、對他施行好心都不會在下一次得到好報,所以,理性人的“我”沒有理由實施高價使對方獲益。依次類推。3,36,11,65,5高價企業(yè)乙企業(yè)甲低價高價低價價格大戰(zhàn)中的囚徒困境價格大戰(zhàn)中的囚徒困境重復(fù)博弈和無名氏定理n定理:定理:令G是階段博弈,G(T)是G重復(fù)T(有限)次的重復(fù)博弈。那么,如果G有唯一的納什均衡,重復(fù)博弈G(T)的唯一子博弈精煉納什均衡結(jié)果是階段博弈G的納什均衡的重復(fù)T次(即每個階段博弈出現(xiàn)的都是一次性博弈的均衡結(jié)果)。n定理說明有限次的重復(fù)博弈不改變階段博弈的均衡結(jié)果。n注:(1)唯一的納什均衡可以是混合策略納什均衡;(2)階段博弈G是完全信息的不要求G一定是靜態(tài)的;(3)G是完全且

5、完美信息時結(jié)論仍然成立;(4)如果階段博弈納什均衡不唯一,定理結(jié)論不成立。重復(fù)博弈和無名氏定理1,1-1,1-1,11,-1f參與人1EFe參與人21, 15, 00, 00, 54, 40, 00, 00, 03, 3參與人Ae1e2e3參與人Bf1f2f3重復(fù)博弈和無名氏定理n當(dāng)階段博弈只重復(fù)有限次時,唯一的子博弈精煉納什均衡便是靜態(tài)博弈中的納什均衡(唯一)的重復(fù)。n因在最后一輪,除了靜態(tài)博弈納什均衡之外沒有別的可置信的威脅。在倒數(shù)第二輪為懲罰背離而進(jìn)行的威脅是毫無意義和不可置信的,均衡仍為靜態(tài)納什均衡;類推一直可上溯到第一輪。n上述結(jié)論對階段博弈納什均衡解唯一時是成立的,不唯一時,可根據(jù)

6、具體情況求解有限重復(fù)博弈的子博弈精煉納什均衡解。重復(fù)博弈和無名氏定理n納什均衡不唯一的情況0,03,46,04,30,00,00,60,05,5MUMLRD參與人B參與人1 一次博弈有三個納什均衡:(M, L),(U,M)和混合戰(zhàn)略均衡(3/7U, 4/7M),(3/7L, 4/7M);對應(yīng)支付向量分別為(4, 3),(3, 4),(12/7, 12/7)。 若貼現(xiàn)因子大于7/9,若博弈重復(fù)兩次則如下戰(zhàn)略組合是一個子博弈精煉納什均衡:第一階段選擇(D,R);如果第一階段結(jié)果是(D,R),二階段選擇(M,L);否則選擇混合戰(zhàn)略。第三章 完全信息動態(tài)搏弈 -子博弈精煉納什均衡n一 博弈擴(kuò)展式表述n

7、二 擴(kuò)展式表述博弈的納什均衡n三 子博弈精練納什均衡n四 重復(fù)博弈有限次重復(fù)博弈無限次重復(fù)博弈參與人不固定時的重復(fù)博弈n五 應(yīng)用舉例重復(fù)博弈與無名氏定理n無限次重復(fù)博弈n囚徒困境博弈重復(fù)無窮次,結(jié)果如何?n證明得出,如果參與人有足夠的耐心,(抵賴,抵賴)是一個子博弈精練納什均衡結(jié)果)。n冷酷戰(zhàn)略(1)開始選擇抵賴;(2)選擇抵賴一直到有一方選擇了坦白,然后永遠(yuǎn)選擇坦白。-8,-80,-10-10,0-1,-1囚徒A囚徒 B坦白抵賴坦白抵賴 令r為貼現(xiàn)因子,證明冷酷戰(zhàn)略是納什均衡。如果A在博弈的某個階段首先選擇了坦白,隨當(dāng)階段獲得0的支付,但會促發(fā)B“永遠(yuǎn)坦白”的懲罰。因此給定B不坦白,A不坦白

8、的條件是: 若B首先選擇坦白,A是否有積極性堅持冷酷戰(zhàn)略懲罰B的不合作?顯然會。 類似可證冷酷戰(zhàn)略也是B的最優(yōu)戰(zhàn)略。22*0( 8)( 8)1( 1)( 1)1/8rrrrr 即在條件下給定B堅持冷酷戰(zhàn)略,A不會偏離冷酷戰(zhàn)略(首先坦白)。貼現(xiàn)因子:下一期的一單位支付在這一期的價值。重復(fù)博弈與無名氏定理 再證冷酷戰(zhàn)略是子博弈精煉納什均衡,即冷酷戰(zhàn)略在每一個子博弈上都構(gòu)成納什均衡。在冷酷戰(zhàn)略納什均衡下,子博弈分為兩類:沒有任何人曾經(jīng)坦白(前面證明顯示是納什均衡);至少有一個曾經(jīng)坦白(參與人只是重復(fù)單階段博弈的納什均衡,自然也是整個子博弈的納什均衡)。 無限次重復(fù)博弈使其走出了囚徒困境,背后的原因是

9、: 如果博弈重復(fù)無窮次而且每個人有足夠的耐心,任何短期機(jī)會主義行為的所得都是微不足道的,參與人有積極性為自己建立一個樂于合作的聲譽(yù),同時也有積極性懲罰對方的機(jī)會主義的行為。重復(fù)博弈與無名氏定理n求下述階段博弈對應(yīng)無窮多次博弈的冷酷戰(zhàn)略均衡(開始選擇合作C;選擇合作一直到有一方選擇了不合作,然后永遠(yuǎn)選擇不合作D)是子博弈精煉納什均衡的貼現(xiàn)因子取值范圍。n參與人13,30,55,01,1CCDD參與人2重復(fù)博弈與無名氏定理n一個男孩被視為傻瓜,因為每當(dāng)別人拿一枚1角硬幣和5分硬幣讓他選的時候,他總是選5分的,有一個人覺得奇怪,就問他:“為什么你不拿1角錢的?”,男孩小聲回答:“假若我拿了1角錢的硬

10、幣,下次他們就不會拿錢讓我選了。”n求小男孩的貼現(xiàn)因子取值范圍。重復(fù)博弈與無名氏定理n無名氏定理(無名氏定理(Friedman 1971):):*1212*12( , )( ,)( ,)()1,( ,)nniinGnGGaGee eeavv vvVvev Vivv vv令 為一個 人階段博弈,為以 為階段博弈的無窮次重復(fù)博弈,是 的一個納什均衡(純或混合戰(zhàn)略),是 決定的支付向量,是一個任意支付向量, 是可行支付向量集合。那么,對于任何滿足的,存在一個貼現(xiàn)因子使得對于所有的是一個特定的子博弈精煉納什均衡結(jié)果。 即在無限重復(fù)博弈中,如果參與人有足夠耐心,那么,任何滿足個人理性的可行支付向量都可以

11、通過一個特定的子博弈精煉納什均衡得到。重復(fù)博弈與無名氏定理n 根據(jù)無名氏定理,只有當(dāng)貼現(xiàn)因子足夠接近于1時,帕累托最優(yōu)才會出現(xiàn)。n 該定理還告訴我們無限次重復(fù)博弈可能有無窮多個精煉納什均衡結(jié)果。因此精煉均衡仍不能幫助我們走出多重均衡的困境。n 在現(xiàn)實中,參與人可以使用特定的協(xié)調(diào)機(jī)制來達(dá)到一個“聚點均衡”(在庫諾特博弈中,生產(chǎn)壟斷參量可能是一個聚點均衡,具有相同成本函數(shù)的企業(yè)獲得相同的壟斷利潤)。第三章 完全信息動態(tài)搏弈 -子博弈精煉納什均衡n一 博弈擴(kuò)展式表述n二 擴(kuò)展式表述博弈的納什均衡n三 子博弈精練納什均衡n四 重復(fù)博弈有限次重復(fù)博弈無限次重復(fù)博弈參與人不固定時的重復(fù)博弈n五 應(yīng)用舉例參

12、與人不確定時的重復(fù)博弈n參與人不固定時的重復(fù)博弈1,1-1,20,00,0廠商消費(fèi)者購買不購買高質(zhì)量低質(zhì)量質(zhì)量博弈 假定只有一個廠商提供產(chǎn)品,每個消費(fèi)者只買一次,且每個階段只有一個消費(fèi)者。 為什么消費(fèi)者偏好于購買大商店的產(chǎn)品而不相信走街串巷的小商販?一次博弈的均衡結(jié)果 消費(fèi)者在購買時不知道自己買產(chǎn)品的質(zhì)量,但知道所有之前消費(fèi)者購買的產(chǎn)品質(zhì)量。參與人不確定時的重復(fù)博弈n參與人不固定時的重復(fù)博弈1,1-1,20,00,0廠商消費(fèi)者購買不購買高質(zhì)量低質(zhì)量質(zhì)量博弈 如果廠商的貼現(xiàn)因子r =1/2,則無限次重復(fù)博弈的納什均衡為: 廠商從生產(chǎn)高質(zhì)量的產(chǎn)品廠商從生產(chǎn)高質(zhì)量的產(chǎn)品開始,繼續(xù)生產(chǎn)高質(zhì)量的產(chǎn)品,開

13、始,繼續(xù)生產(chǎn)高質(zhì)量的產(chǎn)品,除非曾經(jīng)生產(chǎn)過低質(zhì)量產(chǎn)品,除非曾經(jīng)生產(chǎn)過低質(zhì)量產(chǎn)品,如果上一次生產(chǎn)了低質(zhì)量的產(chǎn)如果上一次生產(chǎn)了低質(zhì)量的產(chǎn)品,之后永遠(yuǎn)生產(chǎn)低質(zhì)量的產(chǎn)品,之后永遠(yuǎn)生產(chǎn)低質(zhì)量的產(chǎn)品。品。 第一個消費(fèi)者選擇購買,第一個消費(fèi)者選擇購買,只要廠商不曾生產(chǎn)過低質(zhì)量的只要廠商不曾生產(chǎn)過低質(zhì)量的產(chǎn)品,隨后消費(fèi)者繼續(xù)購買,產(chǎn)品,隨后消費(fèi)者繼續(xù)購買,如果廠商曾生產(chǎn)過低質(zhì)量的產(chǎn)如果廠商曾生產(chǎn)過低質(zhì)量的產(chǎn)品,之后消費(fèi)者不再購買。品,之后消費(fèi)者不再購買。重復(fù)博弈的均衡結(jié)果參與人不確定時的重復(fù)博弈n參與人不固定時的重復(fù)博弈1,1-1,20,00,0廠商廠商消費(fèi)者消費(fèi)者購買購買不購買不購買高質(zhì)量高質(zhì)量低質(zhì)量低質(zhì)量質(zhì)

14、量博弈質(zhì)量博弈 廠商:如果生產(chǎn)低質(zhì)量的產(chǎn)品,得到的短期利潤是2,但之后每階段利潤為0,如果總是生產(chǎn)高質(zhì)量的產(chǎn)品,每階段得到1單位利潤,貼現(xiàn)值為1/(1- ) =2,廠商將不會生產(chǎn)低質(zhì)量產(chǎn)品。害怕失掉消費(fèi)者。 消費(fèi)者: =1/2,其只關(guān)心1階段的支付,只有當(dāng)預(yù)期高質(zhì)量時,才會購買。消費(fèi)者預(yù)期不曾生產(chǎn)過低質(zhì)量產(chǎn)品的廠商將繼續(xù)生產(chǎn)高質(zhì)量產(chǎn)品,故選擇購買,反之亦然廠商生產(chǎn)過高質(zhì)量的產(chǎn)品.重復(fù)博弈的均衡結(jié)果 克萊因等認(rèn)為這個例子可以解釋為什么消費(fèi)者偏好去大商店購買東西而不信賴走街串巷的小商販。 西蒙等用類似博弈解釋雇傭關(guān)系,認(rèn)為,企業(yè)存在的原因之一正式創(chuàng)造一個“長期的參與人”,這樣一個參與人由于對未來利

15、益的考慮而更講信用。第三章 完全信息動態(tài)搏弈 -子博弈精煉納什均衡n一 博弈擴(kuò)展式表述n二 擴(kuò)展式表述博弈的納什均衡n三 子博弈精練納什均衡n四 重復(fù)博弈n五 應(yīng)用舉例斯坦克爾伯的寡頭競爭模型輪流出價的討價還價模型囚徒的救贖旅行者困境第三章 完全信息動態(tài)搏弈 -子博弈精煉納什均衡n斯坦克爾伯的寡頭競爭模型企業(yè)1企業(yè)2v參與人:企業(yè)參與人:企業(yè)1 1、企業(yè)、企業(yè)2 2;v行動順序:企業(yè)行動順序:企業(yè)1 1先選擇產(chǎn)量先選擇產(chǎn)量q q1 1,企業(yè),企業(yè)2 2觀測到觀測到q q1 1,然后選,然后選 擇自己的產(chǎn)量擇自己的產(chǎn)量q q2 2。v支付:支付: 利潤,利潤是兩個企業(yè)產(chǎn)量的函數(shù)利潤,利潤是兩個企

16、業(yè)產(chǎn)量的函數(shù)n斯坦克爾伯的寡頭競爭模型nqi :第i個企業(yè)的產(chǎn)量nC:代表單位不變成本n假定逆需求函數(shù)為:n第i個企業(yè)的利潤函數(shù)為:企業(yè)1企業(yè)22 , 1),)(),(21icQPqqqii)()(21qqaQP斯坦克爾伯的寡頭競爭模型n用逆向歸納法求解,首先考慮給定q1的情況下,企業(yè)2的最優(yōu)選擇。企業(yè)2的問題是:)(),(212212cqqaqqqMax最優(yōu)化一階條件意味著:)(21)(1122cqaqSq因為企業(yè)1預(yù)測到企業(yè)2將根據(jù)S2(q1)來選擇q2,企業(yè)1在第1階段的問題是:)()(,(111211cqSqaqqSqMax)(21*1caq)(41*2caq壟斷情況下庫諾特寡頭競爭模

17、型斯坦克爾伯寡頭競爭模型產(chǎn)量A:A:B:B:總產(chǎn)量利潤A:A:B:B:總利潤)(21ca)(31ca)(31ca2)(91ca2)(91ca)(21ca)(41ca2)(81ca2)(161ca2)(41ca)(21ca2)(41ca)(32ca)(43ca2)(92ca2)(163ca斯坦克爾伯的寡頭競爭模型均衡結(jié)果比較斯坦克爾伯的寡頭競爭模型n從上述計算可以看出:n斯坦克爾伯的均衡總產(chǎn)量大于庫諾特均衡總產(chǎn)量,企業(yè)1的斯坦克爾伯的均衡產(chǎn)量大于庫諾特均衡產(chǎn)量,企業(yè)2的斯坦克爾伯的均衡產(chǎn)量小于庫諾特均衡產(chǎn)量。同樣,企業(yè)1在斯坦克爾伯博弈中的利潤大于在庫諾特博弈中的利潤,企業(yè)2的利潤卻有所下降,這

18、就是所謂的“先動優(yōu)勢”。若企業(yè)的戰(zhàn)略選擇是價格,則博弈具有“后動優(yōu)勢”。n 擁有信息優(yōu)勢可能使參與人處于劣勢。企業(yè)1先行動的承諾價值 :企業(yè)1之所以獲得斯坦克爾伯利潤而不是庫諾特利潤,是因為它的產(chǎn)品一旦生產(chǎn)出來就變成了一種積淀成本,無法改變,從而使企業(yè)2不得不承認(rèn)它的威脅是可置信的。而假如企業(yè)1只是宣布了它將生產(chǎn) ,企業(yè)2是不會相信它的威脅的。因為如果企業(yè)2選擇斯坦伯格參量(a-c)/4,企業(yè)的最優(yōu)產(chǎn)量是3(a-c)/8,n最終唯一的納什均衡是雙方都選擇庫諾特產(chǎn)量。)(21ca宏觀經(jīng)濟(jì)政策的動態(tài)一致性貨幣政策模型n政府政策的動態(tài)一致性:一個政策不僅在制定階段應(yīng)該是最優(yōu)的(從政府角度),而且在制

19、定之后的執(zhí)行階段也是最優(yōu)的,假設(shè)沒有任何新的信息出現(xiàn)。n動態(tài)不一致是因政府沒積極性真正實施這項政策;自然國民也就不信這一政策。n貨幣政策模型(Kydland and Prescott 1977)n(1)參與人:政府和私人部門;(2)博弈過程:私人部門選擇預(yù)期的通貨膨脹率,政府在給定預(yù)期通貨膨脹率下選擇實際通貨膨脹率。n政府面臨的問題是給定私人部門通貨膨脹率預(yù)期下選擇貨幣政策:n最優(yōu)化上述最優(yōu)化問題得政府短期最優(yōu)通貨膨脹率(政府的反應(yīng)函數(shù)):n若私人部門有理性預(yù)期即預(yù)期的通脹率等于政府的最優(yōu)通脹率,則均衡通脹率:貨幣政策模型22( , )() ,0,1. .(),0eMaxMycykycksty

20、y *21()(1) )1eckyk 可理解為市場扭曲程度。*1(1)eckyn政府面臨的問題是給定私人部門通貨膨脹率預(yù)期下選擇貨幣政策:n最優(yōu)化上述最優(yōu)化問題得政府短期最優(yōu)通貨膨脹率(政府的反應(yīng)函數(shù)):n若私人部門有理性預(yù)期即預(yù)期的通脹率等于政府的最優(yōu)通脹率,則均衡通脹率:貨幣政策模型22( , )() ,0,1. .(),0eMaxMycykyckstyy *21()(1) )1eckyk 可理解為市場扭曲程度。*1(1)ecky貨幣政策模型n由均衡通貨膨脹率(S)可得政府短期效用水平:n而零通脹率(P)對應(yīng)政府效用:n零通脹率不是一個子博弈精煉納什均衡,因在私人部門輕信政府零通脹率情況下

21、,政府的最優(yōu)通脹率及效用水平分別是:2212(1)(1),0,0,1SMkycck *212212(0) ()(1)(1() (1) )efckyMcky 22(1)PMky 第三章 完全信息動態(tài)搏弈 -子博弈精煉納什均衡n一 博弈擴(kuò)展式表述n二 擴(kuò)展式表述博弈的納什均衡n三 子博弈精練納什均衡n四 重復(fù)博弈n五 應(yīng)用舉例斯坦克爾伯的寡頭競爭模型輪流出價的討價還價模型囚徒的救贖旅行者困境輪流出價的討價還價模型(1)n分蛋糕的動態(tài)博弈(如果參與人在接受和拒絕之間無差異時假定接受。)n游戲規(guī)則:第一輪由第一個參與人小鵑提出條件,第二個參與人小明可以接受,從而游戲結(jié)束,也可以不接受,則游戲進(jìn)入第二輪

22、;小明提出條件,小鵑可以接受,從而結(jié)束游戲,也可以不接受,從而進(jìn)入第三輪;蛋糕融化呈線性,游戲結(jié)束,蛋糕融化n第一種情況:假設(shè)博弈只有一步,小鵑提出分配方案,如果小明同意,兩個人按照約定分蛋糕,如果小明不同意,兩人什么也得不到。結(jié)果會怎樣?輪流出價的討價還價模型(1)n第二種情況:桌上放了一個冰淇淋蛋糕,但兩輪談判過后,蛋糕將完全融化。博弈結(jié)果如何?n第三種情況:桌上的冰淇淋蛋糕在三輪談判后將完全融化,結(jié)果又如何?n第四種情況:桌上的冰淇淋蛋糕在四輪談判后將完全融化,或者在五輪談判、六輪,100輪談判后將完全融化,結(jié)果又如何?n參與人1、2輪流出價分割一塊蛋糕,兩人獲得的份額和折現(xiàn)率分別為n如

23、果參與人在接受和拒絕之間無差異時假定接受。輪流出價的討價還價模型1212,;,.x x 1122111211.1(1)2.1.(1)12ttiixxxxtxxior參與人參與人2參與人 出價(參與人2出價)n若博弈次數(shù)T有限,則有下述子博弈精煉納什均衡:n子博弈精煉納什均衡與貼現(xiàn)因子之間關(guān)系:輪流出價的討價還價模型12122212112121211112121121212:1,1;0,11.3:1(1),1(1);,11;1 ,10.4:1(1(1(1),1(1(1(1);TxxxxTxxxxxxTxx 1212212120,1;0,0,1;0,=0,1;1,1,3,5:1;2,4,6:0.(

24、)xxxTxTx 后動優(yōu)勢n 一般來說,如果 均衡結(jié)果不僅依賴于貼現(xiàn)因子的相對比率,而且依賴于博弈時間長度T和誰在最后階段出價。然而這種依存關(guān)系隨T的變大而變??;當(dāng)T趨于無窮大時,我們得到“先動優(yōu)勢”:即如果 唯一的均衡是 n定理(Rubinstein 1982):在無限期輪流出價博弈中,唯一的子博弈精煉納什均衡結(jié)果是:輪流出價的討價還價模型01,1,2ii121 (1).x*221211()11xifx 第三章 完全信息動態(tài)搏弈 -子博弈精煉納什均衡n一 博弈擴(kuò)展式表述n二 擴(kuò)展式表述博弈的納什均衡n三 子博弈精練納什均衡n四 重復(fù)博弈n五 應(yīng)用舉例斯坦克爾伯的寡頭競爭模型輪流出價的討價還價

25、模型囚徒的救贖旅行者困境囚徒的救贖n好萊圬大片肖申克的救贖是一部很好看的電影,主要內(nèi)容是一個被冤屈的囚犯如何憑著堅定的信念和聰明才智逃出牢房。我們的“囚犯”也可以通過好的策略合作,擺脫“困境”的詛咒。囚徒的救贖-一報還一報一報還一報能夠贏得競賽不是靠打擊對方,而是靠從對方引出使雙方都有好處的行為。如果重復(fù)博弈多次,就有報復(fù)的機(jī)會,這種懲罰的規(guī)則是:人家對你怎么做,你就對他怎么做,如果他上次背叛了你,你這次背叛他,如果上次他與你合作,你這次就選擇與他合作。艾克謝羅德認(rèn)為,一報還一報體現(xiàn)了這個策略符合四個優(yōu)點:清晰、善意、報復(fù)性和寬恕性。這一法則不會引發(fā)作弊,所以是善意的;它不會讓作弊者逍遙法外,所以是報復(fù)的;它不會長時間懷恨在心,只要作弊者改正,就愿意恢復(fù)合作,所以是寬恕的。一報還一報從自己

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論