




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、第五章 同時博弈與序貫博弈 主要內容本章主要介紹:1、如何用正規(guī)型表示和展開型表示來表述 同一個博弈。2、博弈論中的兩個重要概念:信息集和不完美信息。3、考察包含同時決策行動和序貫決策行動的復合型博弈(混合博弈)的納什均衡。4、動態(tài)博弈的運用。 第一節(jié) 博弈的正規(guī)型表示與展開型表示第二節(jié) 同時決策與序貫決策的混合博弈 第三節(jié) 樹形博弈的子博弈 第四節(jié) 子博弈精煉納什均衡 第五節(jié) 完美博弈的庫恩定理第六節(jié) 動態(tài)博弈的運用 第一節(jié) 博弈的正規(guī)型表示與展開型表示一、如何將博弈的展開型形式轉化為正規(guī)型表示案例:“進入障礙”博弈進入者進入不進壟斷者容忍抵抗容忍抵抗(1,5)(-2,2)(0,10)(0,
2、4)壟斷者abc“進入障礙”的矩陣表達進入者壟斷者進入不進入容忍,容忍抵抗,抵抗抵抗,容忍容忍,抵抗1,5-2,2-2,21,50,100,40,100,4小 結1、一般我們將先行動者放在行局中人的位置,把后行動者放在列局中人的位置。2、每個局中人的策略必須是一個完整的計劃,必須考慮自己在對方每一個行動下的行動。例如:容忍,容忍。在本例中,進入者有兩個純策略,而壟斷者有四個純策略。3、每個局中人的決策輪數越多,則他的純策略選擇的數目越多。 思考:如果有三輪博弈,如何寫矩陣形式。4、矩陣形式表示的可能的博弈結果比樹形表示的結果要多,這是因為有不止一個純策略可以導致相同的博弈結果。三輪序貫博弈如何
3、用矩陣表述先行動者有2種純策略;后行動者有4種純策略;第三行動者有16種純策略這是共有2416=128個博弈結果不過實際只有八種不同的支付情況。創(chuàng)立一個家庭博弈由原來的情侶博弈變成家庭博弈了!增加一個孩子,他最后作決策。我給這個博弈起了個好聽的名字:家庭博弈!爸爸有2種純策略;媽媽有4種純策略;小孩有16種純策略;這是個2416=128個博弈結果實際只有八種不同的支付情況。還可以用矩陣的形式表示。二、如何將正規(guī)型的博弈轉化為展開型比前面簡單,尤其是序貫博弈,但如果是同時博弈,如何表示?信息集案例:情侶博弈2, 10, 00, 01, 2足球芭蕾足球芭蕾丈 夫妻子夫妻之爭信息集根據同時博弈的定義
4、,每個局中人決策時不知道別人的策略,即每個局中人在做自己的行動選擇時,并不知道自己處在哪個決策節(jié)點上。例如妻子在選芭蕾時,并不知道丈夫選的是芭蕾還是足球。局中人不能是別人對方“已經”做出的行動或決策,就等于同時行動或決策。此時,我們用一個扁橢圓形的虛線的圈,把所論局中人的若干決策節(jié)點罩起來,成為他的一個信息集。即局中人知道博弈已經進行到他的這個信息集,但不知道博弈究竟進行到這個信息集中的哪個決策節(jié)點。信息集妻子雖然知道博弈已經進行到她的信息集,但不知道進行到信息集中的那個決策點,即她不知道丈夫會選什么,因此是同時博弈。丈夫足球芭蕾妻子足球芭蕾足球芭蕾(2,1)(0,0)(-1,-1)(1,2)
5、妻子注 意一個信息集罩住的必須是同一個局中人的決策點。必須是同一個局中人在同一個時點的決策節(jié)點。ABBA不制止制止(-2,5)(2,2)(10,4)(5,5)不仿冒(0,10)仿冒不制止制止仿冒不仿冒這兩個虛線罩住的都不是信息集。注 意同時,即使是同一個人在同一時點進行決策,也不一定構成一個信息集,他還必須滿足:在每一個決策點他的行動選擇集合必須是相同的。因為局中人在做行動選擇時并不知道自己位于哪個決策點,因此,他不可能做出不同的行動選擇。ABB該虛線罩住的不是信息集。其必須滿足:同集同注,即從各個決策點出發(fā)的策略選擇數目相同,名稱也相同。單點集和非單點集我們把不被扁橢圓虛線罩住的每個決策節(jié)點
6、也給以信息集的地位,稱為單點集。因此,每一個決策位置都是一個信息集,只有單點集和非單點集之分。ABB非單點集單點集完美信息博弈和不完美信息博弈當博弈走到一個單點集的信息集時,面臨決策的局中人對于博弈迄今的歷史清清楚楚,他清楚了博弈具體走到了他的這個決策節(jié)點而不是別的決策點。我們把這種歷史清楚的博弈稱為完美信息博弈。但是當博弈走到一個非單點集的信息集時,面臨決策的局中人對于博弈迄今的歷史是不清楚的,他不清楚博弈具體走到了他的這個信息集里面的那個決策點。我們把這種歷史不清楚的博弈稱為不完美信息博弈。如果一個序貫博弈的每個信息集都是一個單點集,那么該序貫博弈就是完美信息博弈,否則他就是不完美信息博弈
7、。第二節(jié) 同時決策與序貫決策的混合博弈我們把包含同時決策行動和序貫決策行動的博弈稱為混合博弈。假設有兩家計算機公司:方正和聯想。彼此對新產品的研發(fā)和定價進行博弈競爭。該博弈分為兩個階段:第一階段,兩個公司進行研發(fā)投入競爭,每個公司都可以選擇“大投入”和“小投入”的研發(fā)預算,同時每個公司都不公開公布自己的預算;第二階段,當產品開發(fā)出來并面世以后,廠商會觀摩對方研制出來的新產品對自己的新產品定價,每個廠商可以定高價也可以定低價,但定價之前看不到對方的定價。聯想大投入小投入大投入小投入方正高價格低價格5,52,66,24,44,33,42,11,26,63,77,35,53,41,24,32,1高價
8、格高價格高價格高價格高價格高價格高價格低價格低價格低價格低價格低價格低價格低價格聯想大投入小投入大投入小投入方正5,52,66,24,44,33,42,11,23,41,24,32,16,63,77,35,5聯想大投入小投入大投入小投入4,43,44,35,5方正該博弈的結果為:兩個公司都在第一個階段采取小投入(帕累優(yōu)勢原則),在第二個階段采取低價格。但納什均衡有16個(過程略),因為很多策略導致同一個結果。該博弈的展開型表述見P173頁注意:1、非單點信息集代表什么?2、為什么兩個決策點會用虛線聯系起來?1、非單點信息集代表聯想做決策時并不知道方正選的是什么行動,因此意味著方正與聯想在進行同
9、時博弈。2、虛線表示者這兩個決策點其實是一個決策點。混合博弈的標準模型博弈中有四個博弈方,分別稱為博弈方1、博弈方2、博弈方3和博弈方4第一階段是博弈方1和博弈方2的選擇階段,他們同時在各自的可選策略(行為)集合 和 中分別選擇 和 第二階段是博弈方3和博弈方4的選擇階段,他們在看到博弈方1和博弈方2的選擇 和 以后,同時在各自的可選策略(行為)集合 和 中分別選擇 和各博弈方的得益都取決于所有博弈方的策略 即博弈方i的得益是各個博弈方所選擇策略的多元函數案例:間接融資和擠兌風險1, 11, 11, 1不 存存 款客戶2不存存款客戶1第一階段0.8,0.80.6,11,0.61.2,1.2提
10、前到 期客戶2提前到期客戶1第二階段(到期,到期) (存款,存款)(提前,提前) (不存,不存)第二階段建立信貸保證、保險制度,對存款進行保護、保險的原因。非法集資問題 現代更容易引發(fā)金融、社會風險的主要是不正規(guī)的非法金融活動,如地下錢莊和非法集資等。因為非法金融活動常常通過惡意欺騙的手段吸引人們參加,用借新債還舊債的方法,而不是經營利潤償還到期資金,信用差、管理差而且缺乏保險措施,引起金融風險并引發(fā)社會問題的可能性要大得多。第三節(jié) 樹形博弈的子博弈定義:由一個動態(tài)博弈第一階段以外的某階段開始的后續(xù)博弈階段構成的,有初始信息集和進行博弈所需要的全部信息,能夠自成一個博弈的原博弈的一部分,稱為原
11、動態(tài)博弈的一個“子博弈”。乙甲不借借不分分(1,0)(0,4)(2,2)乙(-1,0)注意1、子博弈不能從第一個階段開始,因為原來的博弈(母博弈)本身不能稱為子博弈,即子博弈集合是一個真子集合。2、子博弈不能分割原來博弈(母博弈)的信息集。ABCDEFGHID、E、F、G點以后都不能構成子博弈.這個博弈有幾個子博弈?第四節(jié) 子博弈精煉納什均衡定義:如果一個完美信息的動態(tài)博弈中,各博弈方的策略構成的一個策略組合滿足,在整個動態(tài)博弈及它的所有子博弈中都構成納什均衡,那么這個策略組合稱為該動態(tài)博弈的一個“子博弈完美納什均衡”。子博弈完美納什均衡能夠排除均衡策略中不可信的威脅(允諾)和承諾,因此是真正
12、穩(wěn)定的。逆推歸納法(倒推法)是求完美信息動態(tài)博弈子博弈完美納什均衡的基本方法。注意子博弈精煉納什均衡本身也是納什均衡,但卻比納什均衡更強的均衡概念。子博弈精煉納什均衡能夠排除不是結果的納什均衡。例如:情侶博弈中,(足球,足球,足球)和(芭蕾,芭蕾,芭蕾)策略不是子博弈精煉納什均衡,因此不是最終的結果。圖見P179。如果一個策略組合的某個策略成分有偏離的激勵,我們可以說這個策略組合缺乏局部穩(wěn)定性,不是子博弈精煉納什均衡。完美博弈的庫恩定理:完美信息的有限序貫博弈都有納什均衡。動態(tài)博弈分析中為什么要引進子博弈完美納什均衡,它與納什均衡是什么關系?子博弈完美納什均衡是一種策略組合,它們不僅在整個博弈
13、中構成納什均衡,而且在所有的子博弈中也構成納什均衡。在動態(tài)博弈分析中,引進子博弈完美納什均衡的原因在于可以消除不可信的威脅(允諾)和承諾,使得求的納什均衡更具有穩(wěn)定性。子博弈完美納什均衡一定是納什均衡,但納什均衡不一定是子博弈完美納什均衡。不可信的威脅和承諾這個博弈有幾個納什均衡?1.用虛線排除確定法得到博弈的納什均衡 甲乙共有四種策略組合,其中第1和第4種策略組合是納什均衡(給,不實施,實施)(給,不實施,不實施)(不給,不實施,實施)(不給,不實施,不實施)2.用比較優(yōu)勢劃線法,得到博弈的納什均衡(給,不實施,實施)(不給,不實施,不實施)3.用倒推法找到子博弈完美納什均衡:(不給,不實施
14、,不實施),而(給,不實施,實施)這個策略組合里乙在甲不給情況下實施是個不可信的威脅,所以這個納什均衡不是子博弈完美納什均衡,它的穩(wěn)定性比子博弈完美納什均衡要差一些.第五節(jié) 幾個經典動態(tài)博弈模型一、寡占的斯塔克爾博格模型二、勞資博弈補充:三、討價還價博弈四、委托-代理博弈一、寡占的斯塔克爾博格模型先后選擇產量的產量競爭博弈把古諾模型改為廠商1先選擇,廠商2后選擇,而非同時選擇即可。用倒推法,因此從分析廠商2的產量選擇開始,再分析上一階段的廠商1的產量選擇。1、先分析廠商2假設P(Q1+Q2)=a- (Q1+Q2), MC2=MC1=c,沒有固定成本, 廠商2的利潤函數為:2=a- (Q1+Q2
15、)Q2-cQ2 利潤最大化的一階條件為:a-Q1-2Q2-c=0 即:Q2=(a-c-Q1)/22、再分析廠商1由于完全信息,廠商1的利潤函數為: 1=a-(Q1+Q2)Q1-cQ1將Q2=(a-c-Q1)/2代入上式得:利潤最大化的一階條件為:a/2-bQ1=0。Q1=(a-c)/2, Q2=(a-c)/4。結論1、該博弈領導者決定的產量(a-c)/2要大于追隨者的產量(a-c)/4 。領導者的所得的利潤也要大于追隨者的利潤,即“誰先動誰占優(yōu)”。2、斯塔克爾博格模型的產量(a-c)/2 + (a-c)/4 =3(a-c)/4要大于古諾模型的產量2(a-c)/3。因此,市場有一個領導者比各廠商
16、勢均力敵時更好。課外作業(yè):試比較古諾模型與斯塔克爾博格模型的結果有什么不同? 斯塔克爾博格模型中兩個寡頭先后選擇的產量之和要大于古諾模型中兩個寡頭同時選擇的產量之和,而斯塔克爾博格模型中兩個寡頭利潤之和則小于古諾模型的兩個寡頭利潤之和。因此,市場有一個領導者比各廠商勢均力敵時對消費者而言更好,因為斯塔克爾博格模型與古諾模型相比產量大了,價格低了。斯塔克爾博格模型中博弈領導者決定的產量要大于追隨者的產量,領導者的所得的利潤也要大于追隨者的利潤,即斯塔克爾博格模型具有先動優(yōu)勢“誰先動誰占優(yōu)。 二、勞資博弈里昂惕夫提出的,分別代表勞資雙方的工會和廠商之間的博弈模型。這個博弈模型假設工資完全由工會決定
17、,而廠商則根據工會要求的工資高低決定雇傭工人的數量。工會代表的勞方效用應該是工資率和雇傭數兩者的函數,即U=U (W,L)。假設廠商只關心利潤,也就是廠商的效用可以直接用利潤來表示, = (W,L)=R(L)-WL,而利潤是工資率和雇傭數兩者的函數.假設博弈過程是這樣的:先由工會決定工資率,再由廠商根據提出的工資率決定雇傭多少勞動。我們用倒推法分析這個博弈。第一步先分析第二階段廠商的選擇,也就是廠商對工會選擇的工資率W的反應函數L(W)。設工會提出的工資率為W,那么廠商實現自己最大利益的雇傭數L,就是最大值問題。對求導, R(L)-W=0,解出L,就是在給定工會選擇工資率W時廠商的最優(yōu)雇傭數量
18、。R(L)-W=0的經濟意義就是廠商增加雇傭的邊際收益,也就是雇傭的最后一單位勞動所能增加的收益等于雇傭一單位勞動的邊際成本。第二步,回到第一階段工會的選擇。由于工會了解廠商的決策方法,因此它完全清楚對應自己選擇的每種工資率W,廠商將會選擇雇傭數一定是由上述方式決定的L*(W)。因此,工會需要解決的決策問題變成W*,使它滿足是最大值問題如果有對應工會效用函數的具體形成,就可以解出這個最大值,求出符合工會最大利益的工資率W*。二、勞資博弈先由工會決定工資率,再由廠商決定雇用多少勞動力RL0W L廠商的反應函數R(L)斜率為WLW0工會的無差異曲線R(L)-W=0三、討價還價博弈 討價還價是市場經
19、濟中最常見普通的事情。討價還價在博弈論中是典型的動態(tài)博弈問題,也是博弈論最早研究的一種博弈問題。 局中人1、2對1萬元進行分配,由局中人1先提出一個分配比例,使自己得S1,如果局中人2同意就成交,若局中人2不同意,他可以拒絕,他可以重新提出分配比例使局中人1得S2;若局中人1同意則成交,不同意,他也可以重新提出分配比例,使自己得S,這時局中人2必須同意。由于討價還價是要付出成本的,假設每次討價還價有折損成本 試問這三回合的博弈中局中人1先開什么價,局中人2會同意?112不接受,出S接受不接受,出S2接受出S1本博弈中的關鍵有兩點,第三回合局中人1的方案有強制力,即進行到該回合乙必須接受;第二是
20、該博弈每多進行一回合總得益就會下降一個比例,因此,讓談判拖得越長對雙方越不利。用逆推歸納法分析。先分析第三回合第二回合第一回合。三回合討價還價博弈結果的討論無限回合討價還價練習題:兄弟吃冰激棱,哥先提,弟若同意則按哥的方案進行分配;若拒絕,則由弟提出分配方案,哥若接受則按弟提出分配方案,若不接受,第三輪由哥提出分配方案,不過冰激棱會全部融化。假設每回合冰檄棱會融一半。請問哥哥第一回合可以提出怎么樣的分配方案?該博弈的子博弈完美納什均衡是:哥哥開始提出按(1/2,1/2)的分配方案,弟弟接受。本博弈中的關鍵有兩點,第三回合雪糕融掉,倒推到第二回合的方案有強制力,即弟弟無論提出怎么的分配方案,哥哥
21、都要接受;第二是該博弈每多進行一回合總得益就會下降一個比例,因此,讓談判拖得越長對雙方越不利。用倒推法進行分析。先分析第三回合第二回合第一回合。四、委托人代理人理論1、委托人代理人關系經濟活動和社會活動中有很多委托人代理人關系,有明顯的,也有隱蔽的。工廠和工人、店主和店員、客戶和律師、市民和政府、基金購買者和基金管理人等都是。委托人代理人關系的關鍵特征:不能直接控制,監(jiān)督不完全,信息不完全,利益的相關性委托人代理人涉及問題:激勵機制設計、機制設計理論,委托合同設計問題等2、(成果)無不確定性的委托人代理人模型R(S)-w(S), w(S)-SR(E)-w(E), w(E)-ER(0),0122
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 勞動合同勞務合同范例
- 公司合并協議合同范本
- 全職合同范本
- 醫(yī)院物業(yè)招聘合同范本
- 加盟快遞押金合同范本
- 單位電線更換維修合同范本
- 聲學顧問合同范本
- 單位車棚工程合同范本
- cpvc管購買合同范本
- ul認證合同范本
- 高中主題班會 悟哪吒精神做英雄少年-下學期開學第一課主題班會課件-高中主題班會課件
- 2025電力物資檢儲配一體化建設技術導則
- 新學期 開學第一課 主題班會課件
- 民法典合同編講座
- 2024年青島港灣職業(yè)技術學院高職單招語文歷年參考題庫含答案解析
- 廣西壯族自治區(qū)公路發(fā)展中心2025年面向社會公開招聘657名工作人員高頻重點提升(共500題)附帶答案詳解
- 大學轉專業(yè)高等數學試卷
- DBJ51-T 198-2022 四川省既有民用建筑結構安全隱患排查技術標準
- 公司廠區(qū)保潔培訓
- 江蘇省招標中心有限公司招聘筆試沖刺題2025
- 2024年防盜門銷售合同范本
評論
0/150
提交評論