博弈論課件 第四章_第1頁
博弈論課件 第四章_第2頁
博弈論課件 第四章_第3頁
博弈論課件 第四章_第4頁
博弈論課件 第四章_第5頁
已閱讀5頁,還剩55頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、第四講第四講 重復博弈重復博弈 何為何為“重復博弈重復博弈”?l重復博弈是指基本博弈重復進行構成的博弈過程。重復博弈中每個階段中的博弈方、可選策略、規(guī)則和得益都是相同的-是特殊的動態(tài)博弈;形式上是基本博弈的重復進行,但博弈方的行為和博弈結果不一定是基本博弈的簡單重復,因為博弈方對于博弈會重復進行的意識,會使他們對利益的判斷發(fā)送變化,從而使他們在重復博弈過程不同階段的行為選擇受到影響??尚哦龋鹤硬┺耐昝佬匀允桥袛嗑馐欠穹€(wěn)定可靠的重要判斷依據(jù)4.1 引引 論論4.1.1 為何研究為何研究“重復博弈重復博弈”(game):):4.1.2 基本概念基本概念:l分類:有限次重復博弈,無限次重復博弈分類

2、:有限次重復博弈,無限次重復博弈有限次重復博弈:給定一個基本博弈g(可以靜態(tài),也可以動態(tài)),重復進行了t次g,并且在每次重復g之前,各博弈方都能觀察到以前博弈的結果,這樣的博弈過程稱為“g的t次重復博弈”,記為g(t)。而g稱為g(t)的“原博弈”。g(t)中的每次重復稱為g(t)的一個“階段”。無限次重復博弈:理論上,重復博弈可以無限制進行下去,不一定經(jīng)過一定次數(shù)重復以后就必須結束。如果一個基本博弈g一直重復下去,這樣的重復博弈就是“無限次重復博弈”,記為g()。無限次重復博弈的基本博弈也稱為“原博弈”。無限次重復博弈是有無限個階段的動態(tài)博弈。l 重復博弈的次數(shù)雖然有限,但重復的次數(shù)或博弈結

3、束的時間不確定,這種重復博弈中博弈方的行為選擇與確定結束時間的有限次重復博弈很不同,與無限次重復博弈很相似,甚至可以通過某種方式與無限次重復博弈統(tǒng)一起來。這種重復博弈可以稱為“隨機結束的重復博弈”。策略、子博弈和均衡路徑策略、子博弈和均衡路徑l策略:博弈方的一個策略就是在每個階段(即每次重復),針對每種情況(以前階段的結果)如何行動的計劃。l子博弈:重復博弈的子博弈就是從某個階段(不包括第一階段)開始,包括此后所有階段的重復博弈部分。子博弈:重復博弈?原博弈?(最后一個階段)l路徑:子博弈完美納什均衡,以逆推歸納法(逆向歸納法)為核心的子博弈完美納什均衡分析及相關結論,可以推廣到重復博弈中。重

4、復博弈的路徑是由每個階段博弈方的行動組合串聯(lián)而成的。因為對應前一階段的每種結果,下一階段都有原博弈全部策略組合數(shù)那么多種可能的結果。原博弈有m種策略組合,那么重復兩次就有m2條博弈路徑,重復次就有mt條博弈路徑。2111231.tttttt 重復博弈的得益重復博弈的得益l任何博弈博弈方策略選擇依據(jù)都是得益的大小。l計算重復博弈的“總得益”。l計算各階段的“平均得益”。l時間有先后,引入貼現(xiàn)系數(shù)2111231.ttttt 無限次重復博弈: 隨機停止和貼現(xiàn)率隨機停止和貼現(xiàn)率l典型的隨機結束重復博弈可以理解為在進行一個重復博弈時,每次都通過抽簽來決定是否停止重復,如果抽到停止重復的概率為,則抽到重復

5、下去的概率為。l設某博弈方在此博弈中的階段得益為,利率為,因為在每一次博弈以后能繼續(xù)下一次重復的可能性是,因此第二階段的期望得益為,進一步,第三階段的期望得益為,l故該博弈方在重復博弈中期望得益的現(xiàn)值為:l其中最后一個等式是通過令得到的。l把這個與前面純粹考慮時間價值的貼現(xiàn)率統(tǒng)一起來,我們就把已知概率的隨機停止重復博弈與無限次重復博弈統(tǒng)一起來了。隨機停止重復博弈問題可以當作無限次重復博弈來進行分析。4.2 有限次重復博弈有限次重復博弈l有限次重復博弈:給定一個基本博弈g(可以靜態(tài),也可以動態(tài)),重復進行了t次g,并且在每次重復g之前,各博弈方都能觀察到以前博弈的結果,這樣的博弈過程稱為“g的t

6、次重復博弈”,記為g(t)。而g稱為g(t)的“原博弈”。g(t)中的每次重復稱為g(t)的一個“階段”。策略、子博弈和均衡路徑策略、子博弈和均衡路徑l策略:博弈方的一個策略就是在每個階段(即每次重復),針對每種情況(以前階段的結果)如何行動的計劃。l子博弈:重復博弈的子博弈就是從某個階段(不包括第一階段)開始,包括此后所有階段的重復博弈部分。子博弈:重復博弈?原博弈?(最后一個階段)l路徑:子博弈完美納什均衡,以逆推歸納法(逆向歸納法)為核心的子博弈完美納什均衡分析及相關結論,可以推廣到重復博弈中。重復博弈的路徑是由每個階段博弈方的行動組合串聯(lián)而成的。因為對應前一階段的每種結果,下一階段都有

7、原博弈全部策略組合數(shù)那么多種可能的結果。原博弈有m種策略組合,那么重復兩次就有m2條博弈路徑,重復次就有mt條博弈路徑。4.2.1 兩人零和博弈的有限次重復博弈兩人零和博弈的有限次重復博弈l重復零和博弈不會創(chuàng)造出新的利益。l合作的可能性根本不存在。即使雙方都知道還要重復進行許多次基本博弈,也不會改變它們在當前階段博弈中的行動方式,不可能變得(哪怕是暫時的)合作和顧及對方的利益。l所有以零和博弈為原博弈的有限次重復博弈,博弈方的正確策略都是重復一次性博弈中的納什均衡策略。l推廣:非零和或多個博弈方,博弈方的利益嚴格對立,沒有純策略納什均衡的其他嚴格競爭博弈中。在以這些博弈作為原博弈構成的有限次重

8、復博弈中,惟一的子博弈完美納什均衡就是所有博弈方都始終采用原博弈的混合策略納什均衡策略。有限次重復猜硬幣博弈有限次重復猜硬幣博弈l各博弈方的正確策略就是在每次重復中都采用一次性博弈中的納什均衡策略。4.2.2 惟一純策略納什均衡博弈的有限惟一純策略納什均衡博弈的有限次重復博弈次重復博弈l在有惟一純策略納什均衡的博弈中,博弈方之間的利益關系不再是始終對立的,而是有很大一致性甚至完全一致。l在以這樣的博弈為原博弈的有限次重復博弈中,博弈方的行動和博弈結果會不會發(fā)生質的變化?l如果原博弈惟一的純策略納什均衡本身就是帕累托意義上的最佳策略組合,那么因為符合所有博弈方的利益,因此,有限次重復顯然不會改變

9、博弈方的行動方式。l分析:原博弈惟一的納什均衡沒有達到帕累托效率,因此存在通過合作進一步提高效率的潛在可能性的囚徒困境式的博弈,在有限次重復博弈中能不能實現(xiàn)合作和提高效率呢?-5,-50,-8-8,0-1,-1坦 白不坦白 坦 白不坦白囚徒2囚徒1 圖4.1 囚徒的困境博弈有限次重復博弈的囚徒困境有限次重復博弈的囚徒困境 重復博弈等價于圖4.2 兩次 -10, -10-5, -13-13, -5-6, -6坦 白不 坦 白 坦 白不 坦 白囚 徒 2囚徒1圖 4.2 逆 推 歸 納 法 和 等 價 博 弈一般結論:在有限次重復博弈中,如果原博弈存在唯一的純策略納什均衡策略組合,一般結論:在有限

10、次重復博弈中,如果原博弈存在唯一的純策略納什均衡策略組合,則有限次重復博弈的唯一的均衡解即各博弈方在每階段中都采用原博弈的納什均衡;則有限次重復博弈的唯一的均衡解即各博弈方在每階段中都采用原博弈的納什均衡; (2 2)由于在這樣的雙方策略下,均衡路徑中的每個階段都不存在任何不可信的)由于在這樣的雙方策略下,均衡路徑中的每個階段都不存在任何不可信的威脅或許諾,因此這種均衡是子博弈完美納什均衡。威脅或許諾,因此這種均衡是子博弈完美納什均衡。(3 3)在一個博弈中的每個博弈方的所有得益上各自加上相同的數(shù)值不會改變博弈)在一個博弈中的每個博弈方的所有得益上各自加上相同的數(shù)值不會改變博弈原來的均衡原來的

11、均衡定理定理 設原博弈g有惟一的純策略納什均衡,則對任意正整數(shù)t,重復博弈g(t)有惟一的子博弈完美納什均衡,即各博弈方每個階段都采用g的納什均衡策略。各博弈方在g(t)中的總得益為在g中得益的t倍,平均得益等于原博弈g中的得益。gtg( )g tg一般結論一般結論: (1 1)在有限次重復博弈中,如果原博弈存在唯一的純策略納什在有限次重復博弈中,如果原博弈存在唯一的純策略納什均衡策略組合,則有限次重復博弈的唯一的均衡解即各博弈方在均衡策略組合,則有限次重復博弈的唯一的均衡解即各博弈方在每階段中都采用原博弈的納什均衡;每階段中都采用原博弈的納什均衡; (2 2)由于在這樣的雙方策略下,均衡路徑

12、中的每個階段都不存)由于在這樣的雙方策略下,均衡路徑中的每個階段都不存在任何不可信的威脅或許諾,因此這種均衡是子博弈完美納什均在任何不可信的威脅或許諾,因此這種均衡是子博弈完美納什均衡。衡。 (3 3)在一個博弈中的每個博弈方的所有得益上各自加上相同的)在一個博弈中的每個博弈方的所有得益上各自加上相同的數(shù)值不會改變博弈原來的均衡數(shù)值不會改變博弈原來的均衡定理定理 : 設原博弈g有惟一的純策略納什均衡,則對任意正整數(shù)t,重復博弈g(t)有惟一的子博弈完美納什均衡,即各博弈方每個階段都采用g的納什均衡策略。各博弈方在g(t)中的總得益為在g中得益的t倍,平均得益等于原博弈g中的得益。石油輸出國組織

13、的困境石油輸出國組織的困境l(1)某些成員國的石油資源已趨枯竭;l(2)不少非石油輸出國組織成員國加入石油市場;l(3)石油輸出國組織成員之間地位的不平衡;l(4)有些國家由于政治、經(jīng)濟、軍事等方面的原因造成資金、財政緊張;100,10020, ,20 ,高價低價高價低價寡頭2寡頭1圖4.3 削價競爭博弈1507070150有限次重復削價競爭模型有限次重復削價競爭模型 重復囚徒困境悖論和連鎖店悖論重復囚徒困境悖論和連鎖店悖論l(1 1)與直覺的差異)與直覺的差異l(2 2)連鎖店悖論()連鎖店悖論(seltenselten,19781978)澤爾騰澤爾騰l一個在一個在n個市場都開設有連鎖店的企

14、業(yè),對于各個市個市場都開設有連鎖店的企業(yè),對于各個市場的競爭者是否應該加以打擊排斥?場的競爭者是否應該加以打擊排斥?l由于由于n個市場的競爭者一般不會同時進入競爭,如果個市場的競爭者一般不會同時進入競爭,如果忽略各個市場環(huán)境、競爭者不同等方面的微小差異,忽略各個市場環(huán)境、競爭者不同等方面的微小差異,這個問題對上述連鎖企業(yè)來說相當于一個這個問題對上述連鎖企業(yè)來說相當于一個n次重復的次重復的重復博弈。重復博弈。ll較多階段的動態(tài)博弈較多階段的動態(tài)博弈例:若例:若10次重復下先來后到博弈,次重復下先來后到博弈,spne?97l 打進 不進 (0,10) 打擊 和平 (-2,3)(5,5)ba結論結論

15、 : 10個重復博弈的spne就是重復原博弈g的子博弈納什均衡。這就有有名的“連鎖店悖論??偨Y:總結:l第一類是由零和博弈構成的,不存在純策略ne;第二類是唯一的純策略納什么均衡的靜態(tài)博弈構成的。l共性:重復博弈本質上只不過是原博弈的簡單重復,重復博弈每個階段采取的策略就是原博弈中所采取的策略,在零和博弈的情況下是同樣的混合策略ne,在后一種情況下則是純策略ne;l重復博弈并不能給博弈方帶來比一次博弈更好的結果,每階段的平均得益與一次性博弈的得益相同。例:例:如果如果t次重復齊威王田忌賽馬,雙方在該重次重復齊威王田忌賽馬,雙方在該重復博弈中的策略是什么?博弈結果如何?復博弈中的策略是什么?博弈

16、結果如何?l特點:此博弈是混合博弈ne的嚴格競爭零和博弈,對一方有利的策略組合總是對另一方不利,沒有一個策略組合雙方同時愿意接受。例例2:重復博弈與一次性博弈效率不同?:重復博弈與一次性博弈效率不同?4.2.3 有兩個有兩個納什均衡博弈的有限次重納什均衡博弈的有限次重復博弈復博弈l重復博弈有可能有多個子博弈完美納會均衡重復博弈有可能有多個子博弈完美納會均衡路徑重復次數(shù)越多,這種路徑也越多,并且路徑重復次數(shù)越多,這種路徑也越多,并且會出現(xiàn)在原博弈中并非均衡的策略組合在重會出現(xiàn)在原博弈中并非均衡的策略組合在重復博弈中卻構成其子博弈完美納什均衡的一復博弈中卻構成其子博弈完美納什均衡的一個部分的情況。

17、個部分的情況。3,31,44,10,0abab廠商2產(chǎn)商1圖4.8 兩市場博弈兩個廠商兩個廠商1 1和和2 2,同時面臨兩個市場機會,同時面臨兩個市場機會a a和和b b。假設每個。假設每個廠商都只有能力選擇一個市場發(fā)展,即他們的可選策略廠商都只有能力選擇一個市場發(fā)展,即他們的可選策略都是都是a a或或b b。a a:市場較大,但開發(fā)程度還很低:市場較大,但開發(fā)程度還很低b b:市場較小,但已不需花大力氣去開發(fā)市場:市場較小,但已不需花大力氣去開發(fā)市場輪換策略:雙方輪流去兩個不同市場的策略。例:兩市場博弈的重復博弈例:兩市場博弈的重復博弈3,31,44,10,0abab廠商2產(chǎn)商1圖4.8 兩

18、市場博弈(1,4)(1.5,3)(3,3)(2.5,2.5)(2,2)(3,1.5)(4,1)廠商2得益廠商1得益圖4.9 兩市場博弈及重復博弈各均衡的平均得益例:兩市場博弈的重復博弈例:兩市場博弈的重復博弈輪換策略:雙方輪流去兩個不同市場的策略。3,31,44,10,0abab廠商2產(chǎn)商1圖4.8 兩市場博弈 廠商廠商1 1:第一階段選:第一階段選a a;如果第一階段結果是(;如果第一階段結果是(a,aa,a),),則第二階段選則第二階段選a a;如果第一階段結果是(;如果第一階段結果是(a a,b b),則第二),則第二階段選階段選b b;第三階段無條件選;第三階段無條件選b b。 廠商廠

19、商2 2:第一階段選第一階段選a a;則第二階段無條件選;則第二階段無條件選b b;如果第;如果第一階段結果是(一階段結果是(a,aa,a),則第三階段選),則第三階段選a a ;如果第一階段;如果第一階段結果是(結果是(b,ab,a),則第三階段選),則第三階段選b b;輪換策略:雙方輪流去兩個不同市場的策略。例:兩市場博弈的重復博弈(進行三次)例:兩市場博弈的重復博弈(進行三次)三階段路徑三階段路徑: :( (a,a)到()到(a,b)再到再到(b,a)是是spne路徑路徑平均得益平均得益=(3+1+4)/3=2.67例例3:分析兩次重復制式問題時雙方:分析兩次重復制式問題時雙方的均衡策略

20、的均衡策略l彩電有不同的制式,采用相同的制式,則廠商之間由于零部件的通用性,相關設備可相互匹配等大家都能獲得一定的好處。l設有兩廠商都決定引進彩電生產(chǎn)線,可選擇的有a,b兩種制式,則兩廠商面臨一個決定制式的博弈。l 廠商b a b a廠商a b結論:純策略ne多于一個,無法肯定在一次博弈中兩博弈方究竟會作何選擇,哪個結果會出現(xiàn)。1,3 0,00,0 2,24.2.3 多個純策略納什均衡博弈的有限多個純策略納什均衡博弈的有限次重復博弈次重復博弈觸發(fā)策略觸發(fā)策略trigger strategy:首先試探合作,首先試探合作,一旦發(fā)覺對方不合作,則也用不合作相報一旦發(fā)覺對方不合作,則也用不合作相報復的

21、策略。復的策略。冷酷策略冷酷策略grim strategy 例:例:博弈博弈g如下圖:如下圖: 1,15,00,00,54,40,00,00,03,3 博弈博弈2 l m r 博博 l弈弈 m1 r 最重要的是:兩次重復的路徑中包括的最重要的是:兩次重復的路徑中包括的spne中中 可在第一階段采用非原可在第一階段采用非原博弈的均衡策略博弈的均衡策略 例:例:博弈博弈g如下圖:如下圖: 博弈方博弈方1:第一階段選:第一階段選m;如第一階段結果為(;如第一階段結果為(m,m),), 則第一階段選則第一階段選r;如第一階段結果為任何其他;如第一階段結果為任何其他 策略組合,則選策略組合,則選l. 博

22、弈方博弈方2:同博弈方:同博弈方1: 結論結論:路徑為第一階段(:路徑為第一階段(m,m),), 第二階段第二階段(r,r),是一個,是一個spne路徑路徑 2,26,11,11,67,71,11,11,14,4 博弈博弈2 l m r 博博 l弈弈 m1 r 最重要的是:觸發(fā)策略所帶的威脅的可信性。最重要的是:觸發(fā)策略所帶的威脅的可信性。兩兩博弈方都采用觸發(fā)策略:第一階段選結果為(博弈方都采用觸發(fā)策略:第一階段選結果為(m,m),), 則第二階段必為(則第二階段必為(r,r);而第一階段結果為任何其他);而第一階段結果為任何其他8種結種結 果時,第二階段必為(果時,第二階段必為(l,l) 4

23、,48,33,33,87,73,33,33,36,6 博弈博弈2 l m r 博博 l弈弈 m1 r 最重要的是:觸發(fā)策略所帶的威脅的可信性。最重要的是:觸發(fā)策略所帶的威脅的可信性。兩兩博弈方:不管第一階段結果如何,第二階段總為(博弈方:不管第一階段結果如何,第二階段總為(r,r),), 得益(得益(3,3)所采用的觸發(fā)策略的威脅的可信性是勉強的。所采用的觸發(fā)策略的威脅的可信性是勉強的。5,50,60,26,03,30,22,02,01,1mlhhml廠商2產(chǎn)商1圖4.4 三價博弈三價博弈的重復博弈三價博弈的重復博弈8,81,71,37,14,41,33,13,12,2mlhhml廠商2產(chǎn)商1

24、圖4.5 兩次重復三價博弈的等價博弈觸發(fā)策略觸發(fā)策略trigger strategytrigger strategy:首先試探合作,一首先試探合作,一旦發(fā)覺對方不合作,則也用不合作相報復的策略。旦發(fā)覺對方不合作,則也用不合作相報復的策略。冷酷策略冷酷策略grim strategygrim strategy8,83,93,59,36,61,35,35,34,4mlhhml廠商2產(chǎn)商1圖4.6 重復三價博弈的等價博弈:不可信報復觸發(fā)策略的進一步討論觸發(fā)策略的進一步討論不計前嫌擔心報復5,50,60,20,00,06,03,30,20,00,02,02,01,10,00,00,00,00,04,1/

25、20,00,00,00,00,01/2,4 hmlpqhm l pq博弈方2博弈方2圖4.7 重復博弈時觸發(fā)策略可信性較強的博弈iwiwiw4.2.4 4.2.4 有限次重復博弈的無名氏定理(有限次重復博弈的無名氏定理(folk folk theoremtheorem)民間定理,民歌定理首先,記 為博弈方在一次性博弈中最差的均衡得益(支付),用 表示各博弈方的構成的得益數(shù)組。其次,不管其他博弈方的行為如何,一博弈方在某個博弈中只要自己采取某種特定的策略,最低限度保證能獲得的得益稱為“個體理性得益”(individual rationality payoff)或“保留得益”(reservatio

26、n payoff)。第三,博弈中所有純策略組合得益的加權平均(權數(shù)非負且總和為1)數(shù)組稱為“可實現(xiàn)得益”(feasible payoff)。iwiwiw有限次重復博弈的無名氏定理有限次重復博弈的無名氏定理l設原博弈的一次性博弈有均衡得益數(shù)組優(yōu)于,設原博弈的一次性博弈有均衡得益數(shù)組優(yōu)于,那么在該博弈的多次重復中,所有不小于個人那么在該博弈的多次重復中,所有不小于個人理性得益的可實現(xiàn)得益,都至少有一個子博弈理性得益的可實現(xiàn)得益,都至少有一個子博弈完美納什均衡的極限的平均得益來實現(xiàn)它們。完美納什均衡的極限的平均得益來實現(xiàn)它們。廠商2得益廠商1得益(1,4)(3,3)(4,1)0w=(1,1)圖4.1

27、0 兩市場博弈有限次重復的民間定理無名氏定理的關鍵意義:l保證這些得益有一定次數(shù)重復博弈的子博弈完美納保證這些得益有一定次數(shù)重復博弈的子博弈完美納什均衡的平均得益可以實現(xiàn)或逼近它們。什均衡的平均得益可以實現(xiàn)或逼近它們。l有助于在重復博弈中更好地把握機會,設計和運用有助于在重復博弈中更好地把握機會,設計和運用高效率的策略,建立相互的默契和信任,從而爭取高效率的策略,建立相互的默契和信任,從而爭取實現(xiàn)更好的博弈結果。實現(xiàn)更好的博弈結果。ll重復博弈往往也很難確定博弈結果究竟是哪一個子重復博弈往往也很難確定博弈結果究竟是哪一個子博弈完美納什均衡。現(xiàn)實博弈的結果很大程度上取博弈完美納什均衡?,F(xiàn)實博弈的

28、結果很大程度上取決于博弈方對重復博弈結構和性質的了解,以及博決于博弈方對重復博弈結構和性質的了解,以及博弈方的分析能力和相互信任等因素,特別是博弈方弈方的分析能力和相互信任等因素,特別是博弈方是否具有設計和實行輪換策略、觸發(fā)策略的能力和是否具有設計和實行輪換策略、觸發(fā)策略的能力和默契。默契。l冷酷策略grim strategy:以囚徒困境博弈為例。l(1) 一開始選擇抵賴l(2) 一直選擇抵賴,除非某些參與人選擇了坦白;如果某些參與人已經(jīng)選擇了坦白,那么就永遠選擇坦白ll針鋒相對策略tit-for-tatl(1) 開始時選擇否認。l此后,在第n期選擇其他參與人在第n-1期選擇的行動。 4.3

29、無限次重復博弈無限次重復博弈有限與無限的比較有限與無限的比較l異:l有限次:(1)存在最后一次博弈正是破壞重復博弈中博弈方利益和行為的相互制約關系,使重復博弈無法實現(xiàn)更高效率均衡的關鍵。l(2)不一定考慮貼現(xiàn)問題l無限次:(1)(2)對博弈方選擇和博弈均衡的分析必須以平均得益或總得益的現(xiàn)值為依據(jù)。l l同:試圖“合作”,懲罰“不合作”都是實現(xiàn)理想均衡的關鍵,是構造高效率均衡策略的核心構件。l 4.3.1 兩人零和博弈的無限次重復博弈兩人零和博弈的無限次重復博弈l沒有最后一個階段,逆推法。l先討論無限次重復博弈的第階段。顯然,該階段博弈方面臨的仍然是一個無限次重復博弈兩人零和博弈,博弈方的利益關

30、系不會因為第t-1階段或前t-1階段的結果而有任何改變,仍然是嚴格對立的,因此在第t-1階段不會合作。同理,第t-2、t-3也都不會合作。從重復博弈的第一個階段開始就不可能合作。l l推廣到更多博弈方、非零和的其他嚴格競爭博弈的無限次重復博弈。4.3.2 惟一純策略納什均衡博弈的無限惟一純策略納什均衡博弈的無限次重復博弈次重復博弈l原博弈有惟一純策略納什均衡的無限次重復博弈l帕累托意義上最佳策略組合l存在前在合作利益的囚徒困境式博弈 4,40,55,01,1hlhl博弈方2博弈方1圖4.11 兩寡頭削價競爭博弈囚徒困境式的無限次重復囚徒困境式的無限次重復 在囚徒困境式博弈的無限次重復博弈中,對

31、雙方有利的合作在子博弈完美納什均衡中有可能存在,博弈可能會出現(xiàn)較理想的結果。1( ,., )nee1(,.,)nxxiixei( , )g1(,.,)nxx無限次重復博弈無名氏定理:設g是一個完全信息的靜態(tài)博弈。用 記g的納什均衡的得益,用 表示g的任意可實現(xiàn)得益。如果 對任意博弈方都成立,而 足夠接近1,那么無限次重復博弈 中一定存在一個子博弈完美的納什均衡,各博弈方的平均得益就是 。弗里德曼(1971)這個定理稱為無名氏定理是因為有限次重復博弈無名氏定理的關系。廠商2得益(0,5)(4,4)(5,0)w=(1,1)廠商1得益圖4.12 兩寡頭削價競爭無限次重復博弈的民間定理0例:例:l寡頭

32、的古諾產(chǎn)量博弈中,如果市場需求p=130-q,邊際成本c=30且沒有固定成本,帖現(xiàn)因子=0.9。如果該市場有長期穩(wěn)定性,問兩個廠商能否維持壟斷產(chǎn)量?例:例:l如果上一題廠商1的邊際成本改為10,廠商2的邊際成本仍然是30.假設該市場仍然是長期穩(wěn)定的,而且兩個廠商之間已經(jīng)達成廠商1生產(chǎn)3/4,廠商2生產(chǎn)1/4的壟斷產(chǎn)量分配協(xié)議,問這種協(xié)議是否能夠長期維持?例:兩人合作開發(fā)一項產(chǎn)品,能否成例:兩人合作開發(fā)一項產(chǎn)品,能否成功與兩個人的工作態(tài)度有關。功與兩個人的工作態(tài)度有關。l得益矩陣如下: l b 努力 偷懶a 努力 9/4,9/4 3/2,5/2 偷懶 5/2,3/2 2,2問題:該博弈無限次重復

33、博弈的均衡?案例案例3:價格大戰(zhàn)和雙贏對局:價格大戰(zhàn)和雙贏對局l兩個企業(yè)壟斷或幾乎壟斷了某種商品的市場,他們兩個企業(yè)壟斷或幾乎壟斷了某種商品的市場,他們都想打垮對手,爭取更大的利潤??煽诳蓸饭竞投枷氪蚩鍖κ郑瑺幦「蟮睦麧???煽诳蓸饭竞桶偈驴蓸饭?,幾乎壟斷了美國碳酸飲料的市場,百事可樂公司,幾乎壟斷了美國碳酸飲料的市場,他們之間的爭斗,就是這個樣子。爭斗的目的,最他們之間的爭斗,就是這個樣子。爭斗的目的,最后是增加自己的利潤后是增加自己的利潤-要緊的因素是市場份額。要緊的因素是市場份額。l假定兩個企業(yè)都采取比較低的價格,可以各得利潤假定兩個企業(yè)都采取比較低的價格,可以各得利潤3030億美

34、元;都采取比較高的價格,各得億美元;都采取比較高的價格,各得5050億美元;億美元;而如果一家采取較高的價格而另一家采取較低的價而如果一家采取較高的價格而另一家采取較低的價格,那么價格高的企業(yè)利潤變格,那么價格高的企業(yè)利潤變1010億美元,價格低的億美元,價格低的企業(yè)因多銷利潤將上升到企業(yè)因多銷利潤將上升到6060億美元。億美元。l 百事可樂 低價 高價 低價可口可樂 高價問:為什么兩個企業(yè)那么蠢要進行價格大戰(zhàn)呢?價格博弈中,只要以對方為敵手,那么不管對方的決策怎樣,自己總是采取低價策略會占便宜。這就促使雙方都采取低價策略。為何不合作?-“雙贏對局”。3,3 6,1 1,6 5,5案例案例4:

35、為什么多數(shù)情形是非合作博:為什么多數(shù)情形是非合作博弈?弈?l博弈論主要研究非合作博弈,主要有兩方面原因:博弈論主要研究非合作博弈,主要有兩方面原因:l從經(jīng)濟的角度來看,如果幾個大企業(yè)聯(lián)手或勾結起從經(jīng)濟的角度來看,如果幾個大企業(yè)聯(lián)手或勾結起來形成對行業(yè)的壟斷,謀求最大利潤,那么他們結來形成對行業(yè)的壟斷,謀求最大利潤,那么他們結成的聯(lián)盟,稱為成的聯(lián)盟,稱為“卡特爾卡特爾”??ㄌ貭栆驗橛勺灾鞯摹?ㄌ貭栆驗橛勺灾鞯钠髽I(yè)組成,所以很不穩(wěn)定。以產(chǎn)量競爭來說,組成企業(yè)組成,所以很不穩(wěn)定。以產(chǎn)量競爭來說,組成卡特爾,就要討價還價,達成限制產(chǎn)量的協(xié)定,總卡特爾,就要討價還價,達成限制產(chǎn)量的協(xié)定,總產(chǎn)量因為協(xié)定的

36、限制降低了,價格也就上去了,可產(chǎn)量因為協(xié)定的限制降低了,價格也就上去了,可能比結成卡特爾以前高很多。這時候,誰要是偷偷能比結成卡特爾以前高很多。這時候,誰要是偷偷地擴大產(chǎn)量,他可能占到很大的便宜。卡特爾聯(lián)盟地擴大產(chǎn)量,他可能占到很大的便宜??ㄌ貭柭?lián)盟和組成聯(lián)盟的成員之間和組成聯(lián)盟的成員之間l的關系,不是上下級的關系,不時誰服從誰的關系。的關系,不是上下級的關系,不時誰服從誰的關系。卡特爾的成員,都是獨立的經(jīng)濟主體人,只不過為了卡特爾的成員,都是獨立的經(jīng)濟主體人,只不過為了利益關系走到一起來了。偷偷違反協(xié)議增加產(chǎn)量或提利益關系走到一起來了。偷偷違反協(xié)議增加產(chǎn)量或提供優(yōu)惠會撈到很大的便宜,這就促使一些成員違反協(xié)供優(yōu)惠會撈到很大的便宜,這就促使一些成員違反協(xié)議。所以說,卡特爾行為本身就提供了瓦解卡特爾的議。所以說,卡特爾行為本身就提供了瓦解卡特爾的激勵。在人類經(jīng)濟活動中,除了石油輸出國組織激勵。在人類經(jīng)濟活動中,除了石油輸出國組織opecopec以外,卡特爾成功的例子實在很少。以外,卡特爾成功的例子實在很少。l從政府管制的角度來看,卡特爾在許多情況下是非法從政府管制的角度來看,卡特爾在許多情況下是非法行為。行為。19801980年代電風扇大戰(zhàn)的時候,我國電風扇企業(yè)年代

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論