經(jīng)濟(jì)博弈論02完全信息靜態(tài)博弈(Park).ppt_第1頁
經(jīng)濟(jì)博弈論02完全信息靜態(tài)博弈(Park).ppt_第2頁
經(jīng)濟(jì)博弈論02完全信息靜態(tài)博弈(Park).ppt_第3頁
經(jīng)濟(jì)博弈論02完全信息靜態(tài)博弈(Park).ppt_第4頁
經(jīng)濟(jì)博弈論02完全信息靜態(tài)博弈(Park).ppt_第5頁
已閱讀5頁,還剩29頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

2019/7/14,1,第二章 完全信息靜態(tài)博弈,分析思路 納什均衡 混合策略和混合策略納什均衡 * 納什均衡的存在性 * 納什均衡的選擇和存在性,2019/7/14,2,楔子,本章介紹完全信息靜態(tài)博弈。完全信息靜態(tài)博弈即各博弈方同時決策,且所有博弈方對各方得益都了解的博弈。囚徒的困境、齊威王田忌賽馬、猜硬幣、石頭剪子布、古諾產(chǎn)量決策都屬于這種博弈。完全信息靜態(tài)博弈屬于非合作博弈最基本的類型。 本章介紹完全信息靜態(tài)博弈的一般分析方法、納什均衡概念、各種經(jīng)典模型及其應(yīng)用等。,2019/7/14,3,2.1 基本分析思路和方法,一、上策均衡 上策(dominate str.):不管其它博弈方選擇什么策略,一博弈方的某個策略給他帶來的得益始終高于其它的策略,至少不低于其他策略的策略 ui (Si*, S-i ) ui (Si, S-i) 上策均衡:一個博弈的某個策略組合中的所有策略都是各個博弈方的上策,則稱為上策均衡。 * 上策均衡必然是該博弈比較穩(wěn)定的結(jié)果 上策均衡不是普遍存在的,2019/7/14,4,2.1 Cont.,-5, -5,0, -8,-8, 0,-1, -1,坦白,不坦白,坦白,不坦白,Payoff,妻(囚徒 2 ),夫 (囚徒1 ),2019/7/14,5,2.1 Cont.,二、下策均衡 嚴(yán)格下策(dominate str.):不管其它博弈方的策略如何變化,給一個博弈方帶來的收益總是比另一種策略給他帶來的收益小的策略, ui (Si , S-i) , ui (Si*, S-i ) ,分別稱為弱下策、嚴(yán)格下策 嚴(yán)格下策反復(fù)消去,1, 0,1, 3,0, 4,0, 2,L,M,U,D,Payoff,Player 2,Player 1,0, 1,2, 0,R,2019/7/14,6,2.1 Cont.,尋找均衡的技術(shù)技巧 劃線法,2019/7/14,7,2.1 Cont.,尋找均衡的技術(shù)技巧 箭頭法,1, 0,1, 3,0, 1,0, 4,0, 2,2, 0,2019/7/14,8,2.2 納什均衡,一、納什均衡的定義 博弈方:1,n ;表示有n個博弈方 策略空間:S1, .,Si,Sn,博弈方 i 的第 j 個策略 Sij Si 博弈方 i 的得益: ui 博弈:G=S1, .Sn; u1, .un 納什均衡:在博弈 G=S1, .Sn; u1, .un中,如果由各個博弈方的各一個策略組成的某個策略組合 S1*, .Sn*中,任一博弈方 i 的策略 Si*, 都是對其余博弈方策略的組合 S1*, . Si-1*, Si+1*, Sn*的最佳對策,也即對任意 ui(S1*, . Si-1*, Si*, Si+1*, . Sn*) ui(S1, . Si-1*, Sij, Si+1*, Sn*) 都成立,則稱 S1*, .Sn*為G的一個納什均衡,2019/7/14,9,Cont.,二、納什均衡的一致預(yù)測性質(zhì) 一致預(yù)測:如果所有博弈方都預(yù)測一個特定博弈結(jié)果會出現(xiàn),所有博弈方都不會利用該預(yù)測或者這種預(yù)測能力選擇與預(yù)測結(jié)果不一致的策略,即沒有哪個博弈方有偏離這個預(yù)測結(jié)果的愿望,因此預(yù)測結(jié)果會成為博弈的最終結(jié)果 只有納什均衡才具有一致預(yù)測的性質(zhì) 一致預(yù)測性是納什均衡的本質(zhì)屬性 一致預(yù)測并不意味著一定能準(zhǔn)確預(yù)測,因?yàn)橛卸嘀鼐?,預(yù)測不一致的可能,2019/7/14,10,Cont,三、納什均衡與嚴(yán)格下策反復(fù)消去法 上策均衡肯定是納什均衡,但納什均衡不一定是上策均衡 命題1:在n個博弈方的博弈 G=S1, .Sn; u1, .un中,如果嚴(yán)格下策反復(fù)消去法排除了除 S1*, .Sn*之外的所有策略組合,那么 S1*, .Sn*一定是該博弈的唯一的納什均衡 命題2:在n個博弈方的博弈中 G=S1, .Sn; u1, .un中,如果 S1*, .Sn*是G的一個納什均衡,那么嚴(yán)格下策反復(fù)消去法一定不會將它消去 上述兩個命題保證在進(jìn)行納什均衡分析之前先通過嚴(yán)格下策反復(fù)消去法簡化博弈是可行的,2019/7/14,11,Cont,證明:納什均衡與嚴(yán)格下策反復(fù)消去法(反證法) 命題1:如果 消去所有后余下的Si*, S-i*不是納什均衡 不是納什均衡,一定存在那么Si, S-i*, 使得Si*, S-i*Si, S-i Si*, S-i* inSi*, S-i, Si, S-i* in Si, S-i 所以, Si*, S-i* Si, S-i* 命題2: 如果納什均衡Si*, S-i* 被嚴(yán)格下策反復(fù)消去; 那么必然存在一個Si, 使得Si, S-i Si*, S-i 進(jìn)而, Si, S-i* Si*, S-i* 與納什均衡的定義,矛盾,2019/7/14,12,2.3 無限策略分析和反應(yīng)函數(shù),古諾的寡頭模型 Player:廠商1,2 Strategy:q1, q2 Payoff: P=8-(q1+q2), c1=c2=2; u1=6q1-q1q2-q12, u2=6q2-q1q2-q22, How to find the equilibrium?,(3,0),(6,0),(0,3),(0,6),古諾模型的反應(yīng)函數(shù)圖示,R1(q2),R2(q1),q1,q2,2019/7/14,13,Cont。,伯特蘭德寡頭模型模型 Player:廠商1,2 Strategy:0 ,p1max, 0 ,p2max Payoff: q1(p1, p2)=28- p1-0.5p2 , q2(p1, p2)=28- p2-0.5p1 , c1=c2=2; u1=(p1-2)(28- p1-0.5p2); u2=(p2-2)(28- p2-0.5p1); Howe to find the equilibrium?,maxu1=max(p1-2)(28- p1-0.5p2); maxu2=max(p2-2)(28- p2-0.5p1);,p1 p2,p1*=0.5(30- 0.5p2*); p2*=0.5(30- 0.5p1*); p1*=p2*=20,2019/7/14,14,Cont。,公共草地養(yǎng)羊問題 Player:3個農(nóng)戶 Strategy:0 ,q1,max, ,0 ,qn,max,Q=q1 +q2 +q3 Payoff:ui=qi100- (q1+q2+q3); -qic; Howe to find the equilibrium?,maxu1=maxq1100- (q1+q2+q3); q1c; maxu2=maxq2100- (q1+q2+q3); q2c; maxu3=maxq3100- (q1+q2+q3); q3c;,q1 q2 q3,q1*=q2*= q3*= 24, u1*=u2*= u3*= 576,如果總體來看, maxQ100- Q Qc; Q*=48,u=2304 公共資源的悲??!,2019/7/14,15,Cont.,反應(yīng)函數(shù)的問題和局限性 有此博弈中,博弈方的策略是有限且非連續(xù)時,其得益函數(shù)不是連續(xù)可導(dǎo)函數(shù),無法求得反應(yīng)函數(shù),從而不能通過解方程組的方法求得納什均衡。 即使得益函數(shù)可以求導(dǎo),也可能各博弈方的得益函數(shù)比較復(fù)雜,因此各自的反應(yīng)函數(shù)也比較復(fù)雜,并不總能保證各博弈方的反應(yīng)函數(shù)有交點(diǎn),特別不能保證有唯一的交點(diǎn)。,2019/7/14,16,2.4 混合策略和混合策略納什均衡,一、猜硬幣博弈,(1)不存在前面定義的納什均衡策略組合 (2)關(guān)鍵是不能讓對方猜到自己策略 這類博弈很多,引出混合策略納什均衡概念,-1, 1,1, -1,1, -1,-1, 1,正面,反面,正面,反面,猜硬幣方,蓋硬幣方,2019/7/14,17,Cont.,二、混合策略、混合策略博弈和混合策略納什均衡 混合策略:在博弈 G=S1, .Sn; u1, .un 中,博弈方 i 的策略空間 Si1, .Sik ,則博弈方 i 以概率分布pi1, .pik隨機(jī)在其k個可選策略中選擇的“策略”,稱為一個“混合策略”,其中0 pij 1 , 對 1 j k,都成立, pi1+ .pik=1 混合策略擴(kuò)展博弈:博弈方在混合策略的策略空間(概率分布空間)的選擇看作一個博弈,就是原博弈的“混合策略擴(kuò)展博弈)。 混合策略納什均衡:包含混合策略的策略組合,構(gòu)成納什均衡。,2019/7/14,18,Cont.,三、一個例子 該博弈無純策略納什均衡,可用混合策略納什均衡分析,I 的混合策略(p):3p+1(1-p)=2p+5(1-p) II的混合策略(q):2q+5(1-q)=3q+1(1-q) u1 = p2q+5(1-q)+(1-p)3q+1(1-q)=2.6 u2 = q3p+1(1-p)+(1-q)2p+5(1-p)=2.6,2, 3,5, 2,3, 1,1, 5,C (q),D (1-q),A (p),B (1-p),Payoff,Player 2,Player 1,2019/7/14,19,Cont.,博弈方2選C的收益(p混) 3p+1(1-p)=1+2p 博弈方2選D的收益(p混) 2p+5(1-p)=5-3p 博弈方1選A的收益(q混) 2q+5 (1-q) =5-3q 博弈方1選B的收益(q混): 3q+1(1-q)=1+2q,0,p=1,u2(C),u2(D),0,p=1,q=1,0.8,0.8,0,q=1,u1(B),u1(A),0.8,2019/7/14,20,五、小偷和守衛(wèi)的博弈,加重對首位的處罰:短期中的效果是使守衛(wèi)真正盡職 在長期中并不能使守衛(wèi)更盡職,但會降低盜竊發(fā)生的概略,0,- D,- D,守衛(wèi) 得益(睡),S,p=1,小偷p混合下,守衛(wèi)的得益 睡時:-Dp+S(1-p) 不睡時:0*p + 0*(1-p),守衛(wèi)睡覺時的得益,p*,守衛(wèi)不睡覺時的得益,2019/7/14,21,Cont.,0,- P,守衛(wèi) 得益(睡),V,q=1,守衛(wèi)q混合下,小偷的得益 偷:Vq -P(1-q)= -P +(V+P)q 不偷:0*q + 0*(1-q) =0,偷時的得益,q*,不偷的得益,加重對小偷的處罰:短期內(nèi)能抑制盜竊發(fā)生率 長期并不能降低盜竊發(fā)生率,但會是的守衛(wèi)更多的偷懶,2019/7/14,22,Cont.,多重均衡博弈和混合策略 夫妻之爭的混合策略納什均衡,妻子的p混合策略使: 1p+0(1-p)=0p+3(1-p) 丈夫的q混合策略使: 2q+0(1-q)=0q+1(1-q),夫妻之爭博弈的混合策略納什均衡 策略 得益 博弈方1 ( 3/4,1/4 ) 0.67 博弈方2 ( 1/3, 2/3 ) 0.75,2019/7/14,23,Cont.,夫妻之爭 丈夫選時裝的得益(p混):p-0(1-p)=p 丈夫選足球的得益(p混) :0p +3(1-p)=3-3p 妻子選時裝的得益(q混) :2q+0(1-q) =2q 妻子選足球的得益(q混): 0q+1(1-q)=1-q,0,p=1,u2(球),u2(時),0,p=1,q=1,3/4,3/4,0,q=1,u1(時),u1(球),1/3,R2,R1,1/3,3,1,2019/7/14,24,Cont.,制式問題,1, 3,0, 0,0, 0,2, 2,A(q),B(1-q),A(p),B(1-p),廠商1,廠商2,payoff,廠商A的p混合策略使: 3p+0(1-p)=0p+2(1-p) 廠商B的q混合策略使: 1q+0(1-q)=0q+2(1-q),制式問題的混合策略納什均衡 策略 得益 廠商1 (0.4, 0.6) 0.67 廠商2 (0.67,0.33) 0.75,2019/7/14,25,Cont.,三、混合策略和嚴(yán)格下策反復(fù)消去法 包括混合策略時,嚴(yán)格下策反復(fù)消去法依然成立 (左)博弈不存在純策略嚴(yán)格下策,如果I使用p混合策略,如(.5,.5,0),2019/7/14,26,重新思考“夫妻之爭”,夫妻約會:但電話斷了!能遇見么 妻子根據(jù)對“丈夫”的判斷,q, 考慮決定: u1時裝=2q + 0(1-q)= 2q u1足球=0q + 1(1-q)= 1-q 如果判斷q大, 2q 1-q ,or, q 1/3 妻子最好直接去時裝! 問題: 混合策略的得益小:雙方預(yù)期得益0.67,0.75 均小于兩個納什均衡 遇不到的概率:1/3*1/4+2/3*3/4=7/12,2019/7/14,27,2.5 納什均衡的存在性(略),2019/7/14,28,2.6 納什均衡的選擇和分析方法擴(kuò)展(選),2.6.1 多重納什均衡博弈的分析 2.6.2 共謀和防共謀均衡 核心是均衡的精煉問題!,2019/7/14,29,Cont.,多重納什均衡博弈的分析 一、帕累托上策均衡(鷹鴿博弈) 這個博弈中有兩個純策略納什均衡,(戰(zhàn)爭,戰(zhàn)爭) 和(和平,和平),顯然后者帕累托優(yōu)于前者,所 以,(和平,和平)是本博弈的一個帕累托上策均衡。,-5, -5,-10, 8,8, -10,10, 10,戰(zhàn)爭,和平,國家2,戰(zhàn)爭,和平,國家1,戰(zhàn)爭與和平,2019/7/14,30,Cont.,二、風(fēng)險(xiǎn)上策均衡 考慮、顧忌博弈方、其他博弈方可能發(fā)生錯誤等時,帕累托上策均衡并不一定是最優(yōu)選擇,需要考慮:風(fēng)險(xiǎn)上策均衡。下面就是兩個例子。,9, 9,8, 0,0, 8,7, 7,L,R,博弈方2,U,D,博 弈 方 1,風(fēng)險(xiǎn)上策均衡(D,R),5, 5,3, 0,0, 3,3, 3,鹿,兔子,獵人2,鹿,兔子,獵 人 1,獵鹿博弈 風(fēng)險(xiǎn)上策均衡(兔子,兔子),4.5,7.5,4.5,7.5,2.5,3,2.5,3,2019/7/14,31,Cont.,三、聚點(diǎn)均衡 利

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論