




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、1.6 重復(fù)博弈一、有限重復(fù)博弈 定義: 對于完全信息博弈 ,其中 I(1,2,n)為參與者集合, 為所有參與者的策略空間, 為所有參與者的收益函數(shù),如果G在時(shí)間上()不斷重復(fù),并且在下一次博弈G開始前,所有以前博弈的歷史都被觀察到,那么它構(gòu)成的動(dòng)態(tài)博弈就稱之為重復(fù)博弈,G就為重復(fù)博弈中的階段博弈。如果G重復(fù)進(jìn)行T次,那么G(T)就表示重復(fù)進(jìn)行T次的有限重復(fù)博弈。如果G重復(fù)進(jìn)行 次,那么G( )就表示無限重復(fù)博弈。 1二、序貫博弈與重復(fù)博弈 1、序貫博弈:參與人在前一個(gè)階段的行動(dòng)選擇決定隨后的子博弈結(jié)構(gòu),從后一個(gè)決策節(jié)開始的博弈不同于從前一個(gè)決策節(jié)開始的博弈。 2、重復(fù)博弈:簡單地說,就是同樣
2、結(jié)構(gòu)的博弈重復(fù)多次,其中的每次博弈稱為“階段博弈”。階段博弈可以是靜態(tài)博弈,也可以是動(dòng)態(tài)博弈; 3、重復(fù)博弈的三項(xiàng)特征:(1)階段博弈之間沒有“物質(zhì)上”的聯(lián)系;序貫博弈涉及到物質(zhì)上的聯(lián)系。(2)所有參與人觀測到博弈過去的歷史;(3)參與人的總支付是所有階段博弈支付的貼現(xiàn)值之和或加權(quán)平均值。24、參與人在某一階段的博弈選擇依賴于其他參與人過去的行動(dòng)歷史,所以,參與人在重復(fù)博弈中的戰(zhàn)略空間遠(yuǎn)遠(yuǎn)大于和復(fù)雜于在每一個(gè)階段博弈中的戰(zhàn)略空間。這一點(diǎn)意味著,重復(fù)博弈可能帶來一些“額外的”均衡結(jié)果,這些均衡結(jié)果在一次性博弈中是從來不會(huì)出現(xiàn)的。5、影響重復(fù)博弈均衡結(jié)果的主要因素是博弈的重復(fù)次數(shù)。重復(fù)次數(shù)的重要性
3、來源于參與人在短期利益和長遠(yuǎn)利益之間的權(quán)衡。 32.51 有限次重復(fù)博弈:連鎖店悖論例1:見下圖市場進(jìn)入博弈,假定同樣的市場有20個(gè),其均衡會(huì)與單個(gè)市場不同嗎? 均衡1:進(jìn)入者總是選擇進(jìn)入,在位者選擇默許; 均衡2:在位者選擇斗爭,進(jìn)入者總是選擇不進(jìn)入。40,50-10,00,3000,300 在位者 默許 斗爭進(jìn)入者 進(jìn)入不進(jìn)入圖1 市場進(jìn)入博弈4定理1、如果階段博弈G有惟一的納什均衡,則對任意有限的T,重復(fù)博弈G(T)有惟一的子博弈完美納什均衡,即G的納什均衡結(jié)果在每一個(gè)階段重復(fù)進(jìn)行。 注意:此定律的一個(gè)重要條件是:單階段博弈存在“唯一”的納什均衡。例2:重復(fù)博弈舉例 1、參與人:商人1,
4、 商人2; 2、行動(dòng)空間:都是誠信、欺騙; 3、博弈次數(shù):兩次; 4、支付函數(shù): 見圖2所示。4,40,55,01,1 商人1 誠信 欺騙商人2誠信欺騙圖2 信用困境(1)5 逆推到第一階段,將第二階段的納什均衡收益代入,則如圖3所示。 有限重復(fù)博弈納什 均衡是(欺騙,欺騙) 此題解釋了現(xiàn)實(shí)中 存在的一類現(xiàn)象 普遍的欺詐行為;沒有解釋另一類現(xiàn)象廣泛的合作。 為了在理論上容納合作解,博弈論主要從三個(gè)方面來加以發(fā)展: 一是引入多重均衡; 二是引入無限重復(fù)博弈; 三是引入信息不完全。 5,51,66,12,2 商人1 誠信 欺騙商人2誠信欺騙圖3 信用困境(2)62.52 無限重復(fù)博弈 1、合作解要
5、在有限重復(fù)博弈申出現(xiàn)要求階段博弈G必須存在多重納什均衡,但在無限重復(fù)博弈中這一條件并不是必需的:即使階段博弈G只存在惟一納什均衡,無限重復(fù)博弈中也可以存在子博弈完美納什均衡解,其中沒有任何一個(gè)階段結(jié)果是G的納什均衡。顯然這和定理1 相對立,根本的原因就在于博弈可以進(jìn)行無限期。如果博弈是無限的,那么長遠(yuǎn)利益就要好于短期利益。 2、解開連鎖店難題的辦法之一是引入信息的不完全性,或者博弈重復(fù)無限次,或者重復(fù)未知的次數(shù)。7(一)數(shù)學(xué)分析假設(shè)利率r,則貼現(xiàn)率為:1/(1+r),貼現(xiàn)因子 ,一般的有1/(1+r)= ; 有了貼現(xiàn)因子,我們就能比較無限博弈中的不同收益值。 收益值計(jì)算法如下:如果未來的收益系
6、列為: 其收益流現(xiàn)值為:如果每一期的收益都是R,則貼現(xiàn)值為:8例4:仍考察信用困境博弈1、單階段博弈是:(欺騙,欺騙)2、無限重復(fù)博弈中子博弈精練納什均衡有可能為:每一階段都是合作:(誠信,誠信);3、此博弈的可能完美均衡: 觸發(fā)策略,又叫冷酷戰(zhàn)略;4,40,55,01,1 商人1 誠信 欺騙商人2誠信欺騙圖6 信用困境(1)9(二)證明冷酷戰(zhàn)略戰(zhàn)略表述:在第一階段選擇誠信,且如果所有前面t一1階段的結(jié)果都是(誠信,誠信),則在第t階段,選擇誠信,否則選擇欺騙,并永久欺騙下去。 1、先證明此戰(zhàn)略是納什均衡:即如果給定參與者j的策略為觸發(fā)策略,那么參與者i的最優(yōu)反應(yīng)也是觸發(fā)策略,即觸發(fā)策略是彼此
7、策略的最優(yōu)反應(yīng)。假設(shè) 與1足夠接近的條件下,我們用計(jì)算來證明;10 參與者j在某階段選擇欺騙將會(huì)使當(dāng)期得到5的收益,但卻會(huì)觸發(fā)參與者i的永遠(yuǎn)不合作策略,于是未來每一階段的收益都將成為1。 收益現(xiàn)值為: 如果采取合作,設(shè)V為j在無限博弈中的最優(yōu)反映的收益現(xiàn)值,則有: a、 故: b、 當(dāng)且僅當(dāng)下式成立,選擇誠信才是最優(yōu)的。4,40,55,01,1 商人1 誠信 欺騙商人2誠信欺騙圖6 信用困境(1)(1)(2)112、再證明此戰(zhàn)略是子博弈精練納什均衡 無限重復(fù)博弈的每一子博弈都等同于原博弈,而觸發(fā)策略是無限重復(fù)信用博弈的納什均衡,因而它同樣是任意一個(gè)子博弈的納什均衡,根據(jù)完美均衡的定義可知觸發(fā)策
8、略是一個(gè)子博弈精練納什均衡。在無限重復(fù)信用困境的觸發(fā)策略納什均衡中,當(dāng)博弈進(jìn)行到t階段時(shí),存在兩個(gè)可能的歷史過程:(1)所有以前階段的結(jié)果都是(誠信,誠信)的子博弈;(2)至少有一個(gè)前面階段的結(jié)果不是(誠信,誠信)的子博弈。如果參與者在整個(gè)博弈中采取觸發(fā)策略,則:(1)參與者在第一類子博弈中的最優(yōu)策略同樣是觸發(fā)策略,我們已證明它是整個(gè)博弈的一個(gè)納什均衡;(2)參與者在第二類子博弈中的最優(yōu)策略是永遠(yuǎn)單純重復(fù)階段博弈的均衡(欺騙,躍騙),它本身就是階段博弈G的納什均衡。這就證明了無限重復(fù)信用困境中的冷酷戰(zhàn)略納什均衡是子博弈精練的。 12(三)以牙還牙戰(zhàn)略也是此博弈的子博弈精練納什均衡,可類似以上進(jìn)
9、行證明。 1、先后悔比后后悔好; (1)0階段欺騙,1階段后悔的收益現(xiàn)值 (3) (2)0階段欺騙,t階段后悔的收益現(xiàn)值 (4)132、后悔要比永遠(yuǎn)欺騙好; (3)式大于(1)式:當(dāng)貼現(xiàn)因子為 1/4時(shí),參與者j選擇后悔,以求得重新合作要優(yōu)于永遠(yuǎn)欺騙。 3、證明永遠(yuǎn)誠信比欺騙之后再后悔要優(yōu) ,等于證明(2)式大于(3)式;4、結(jié)論:當(dāng)貼現(xiàn)因子 接近1(1/4),以牙還牙策略組合是重復(fù)無限信用博弈的納什均衡。 14(四)無名氏定理 當(dāng)貼現(xiàn)因子充分接近1,無限重復(fù)信用博弈存在合作解,那么是否所有的無服重復(fù)博弈G( )都存在合作解?這就引出了無名氏定理。無名氏定理:令G為一個(gè)n人階段博弈, 為以G為
10、階段博弈的無限次重復(fù)博弈, 是G的一個(gè)納什均衡(純戰(zhàn)略或混合戰(zhàn)略), 是 決定的支付向量, 是一個(gè)任意可行的支付向量,V是可行支付向量集合。那么,對于任何滿足 的 ,存在一個(gè)貼現(xiàn)因子 使得對于所有的 , 是一個(gè)特定的子博弈精練納什均衡結(jié)果。 子博弈精練納什均衡的多重性是無限次重復(fù)博弈的普遍問題。15(五)對無名氏定理的三點(diǎn)說明:1、懲罰點(diǎn)(納什威脅點(diǎn)):在上述定理中,階段博弈的納什均衡 可能是混合戰(zhàn)略均衡也可能是純戰(zhàn)略均衡;由 決定的支付向量 是達(dá)到任何精練均衡的結(jié)果v的懲罰點(diǎn)。2、可行支付: 稱為一個(gè)可行支付向量,如果它是階段博弈G的純戰(zhàn)略支付的凸組合;所有可行支付向量構(gòu)成可行支付集合V。
11、凸組合:假設(shè) 為參與者選擇純策略組合下所有可能收益組合的集合(r為向量),向量 中的任意一個(gè)元素 ,且 那么, 就稱之為凸組合。 16 例如“信用困境”的所有純戰(zhàn)略收益的凸組合如圖7的陰影部分 其納什威脅點(diǎn)是e=(1,1)。無名氏定理告訴我們,如果 足夠接近于1,由過點(diǎn)(1,1)的兩條垂直線圍成的可行集合上的任意點(diǎn)都可以是一個(gè)子博弈精練納什均衡的結(jié)果。3、平均支付:假設(shè)貼現(xiàn)因子為 ,無窮收益系列為: ,其貼現(xiàn)值之和為: ; 另假設(shè)有無窮收益系列: ,其貼現(xiàn)值之和為: ;要求 成為無窮序列 的平均支付,要求: 因此有:即:平均支付是貼現(xiàn)值之和的標(biāo)準(zhǔn)化(標(biāo)準(zhǔn)化因子是 )可行收益集合(1,1)(5,
12、0)(4,4)(0,5)企業(yè)1收益企業(yè)2收益o17例:無限重復(fù)庫諾特雙頭壟斷下的共謀1、在納什均衡下,庫諾特均衡產(chǎn)量: 庫諾特均衡利潤:2、在壟斷情況下:壟斷產(chǎn)量: 壟斷利潤:3、無窮次重復(fù)博弈,考慮冷酷戰(zhàn)略: 首先選擇生產(chǎn) ,繼續(xù)選擇生產(chǎn) ; 直到有一個(gè)企業(yè)選擇生產(chǎn): ,然后生產(chǎn): (1)給定企業(yè) j 堅(jiān)持冷酷戰(zhàn)略,證明其為納什均衡: 企業(yè) i 堅(jiān)持合作,每期利潤為: 如果企業(yè) i 選擇短期最優(yōu)產(chǎn)量: 當(dāng)期利潤為: 但隨后的利潤流量為:18如果下列條件滿足,企業(yè) i 會(huì)選擇合作均衡: 解得:(2)證明其為子博弈精練納什均衡; (略)(3)討論 a、此博弈也有多個(gè)精練納什均衡,“總選擇庫諾特均
13、衡產(chǎn)量”就是一個(gè)精練納什均衡;若產(chǎn)量選擇: 都是冷酷戰(zhàn)略精練均衡的一個(gè)特定結(jié)果。 b、其可行支付集與子博弈 精練均衡可達(dá)到的支付集 如圖7所示19c、保留支付(最小最大支付): 是當(dāng)其他參與人試圖給參與人 i 最大懲罰時(shí)參與人 i 能保證自己得到的最大支付;d、個(gè)人理性支付:指大于保留支付的支付;202.53 參與人不固定時(shí)的重復(fù)博弈 消費(fèi)者市場交易就是一個(gè)典型的例子。廠商是長期的固定參與人,重復(fù)提供產(chǎn)品;而消費(fèi)者是不固定的,假設(shè)一次博弈只有一個(gè)廠商,一個(gè)消費(fèi)者,且只買一件產(chǎn)品,支付矩陣如圖8。 (1)在一次性博弈中,均衡結(jié)果為(不購買,低質(zhì)量) (2)在重復(fù)博弈中均衡結(jié)果為(購買,高質(zhì)量);條件是 (3)此例說明消費(fèi)者偏好大商場買東西而不信賴走街竄巷的小商販的原因
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 禮品定制合同范本
- 初中教師聘用合同樣本
- 分配利潤合同樣本
- 個(gè)人委托制作合同樣本
- 2025年-安徽省安全員《C證》考試題庫及答案
- 制作門窗合同范例
- 出讓地轉(zhuǎn)讓合同樣本
- 分期購機(jī)合同標(biāo)準(zhǔn)文本
- 出口加工合同標(biāo)準(zhǔn)文本
- 2025年江蘇省安全員-C證考試(專職安全員)題庫附答案
- T-CSHB 0017-2024 生成式人工智能模型訓(xùn)練合規(guī)技術(shù)規(guī)范
- 2025屆重慶市雙福育才中學(xué)中考化學(xué)最后沖刺卷含解析
- 光伏項(xiàng)目承包商的實(shí)施策略與計(jì)劃
- 管理學(xué)組織設(shè)計(jì)案例分析
- 消除艾滋病、梅毒和乙肝母嬰傳播項(xiàng)目工作制度及流程(模板)
- 2025年河南機(jī)電職業(yè)學(xué)院單招職業(yè)傾向性測試題庫有完整答案
- 2025年度汽車行業(yè)電子商務(wù)平臺(tái)合作開發(fā)合同
- 攝影拍攝合同畢業(yè)季拍攝合同
- 《個(gè)人所得稅申報(bào)贍養(yǎng)老人專項(xiàng)附加扣除指定分?jǐn)倕f(xié)議模板》
- 國家一級博物館運(yùn)行報(bào)告2024
- 血液病早期發(fā)現(xiàn)-你不可忽視的健康防線
評論
0/150
提交評論