版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
第二章完全信息靜態(tài)博弈分析思路納什均衡混合策略和混合策略納什均衡*納什均衡的存在性*納什均衡的選擇和存在性5/24/20231楔子本章介紹完全信息靜態(tài)博弈。完全信息靜態(tài)博弈即各博弈方同時(shí)決策,且所有博弈方對各方得益都了解的博弈。囚徒的困境、齊威王田忌賽馬、猜硬幣、石頭剪子布、古諾產(chǎn)量決策都屬于這種博弈。完全信息靜態(tài)博弈屬于非合作博弈最基本的類型。本章介紹完全信息靜態(tài)博弈的一般分析方法、納什均衡概念、各種經(jīng)典模型及其應(yīng)用等。
5/24/202322.1基本分析思路和方法一、上策均衡上策(dominatestr.):不管其它博弈方選擇什么策略,一博弈方的某個(gè)策略給他帶來的得益始終高于其它的策略,至少不低于其他策略的策略ui(Si*,
S-i
)≥ui(Si,S-i)
上策均衡:一個(gè)博弈的某個(gè)策略組合中的所有策略都是各個(gè)博弈方的上策,則稱為上策均衡。***上策均衡必然是該博弈比較穩(wěn)定的結(jié)果上策均衡不是普遍存在的5/24/202332.1Cont.-5,-50,-8-8,0-1,-1坦白不坦白坦白不坦白Payoff妻(囚徒2
)夫(囚徒1
)5/24/202342.1Cont.二、下策均衡嚴(yán)格下策(dominatestr.):不管其它博弈方的策略如何變化,給一個(gè)博弈方帶來的收益總是比另一種策略給他帶來的收益小的策略,ui(Si’
,S-i)≥,>ui(Si*,
S-i
),分別稱為弱下策、嚴(yán)格下策嚴(yán)格下策反復(fù)消去1,01,30,40,2LMUDPayoffPlayer2Player10,12,0R5/24/202352.1Cont.尋找均衡的技術(shù)技巧劃線法1,01,30,10,40,22,0-5,-50,-8-8,0-1,-1囚徒困境-1,11,-11,-1-1,1猜硬幣2,10,00,01,3夫妻之爭5/24/202362.1Cont.尋找均衡的技術(shù)技巧箭頭法1,01,30,10,40,22,0-5,-50,-8-8,0-1,-1囚徒困境-1,11,-11,-1-1,1猜硬幣2,10,00,01,3夫妻之爭5/24/202372.2納什均衡一、納什均衡的定義博弈方:1,…,n;表示有n個(gè)博弈方策略空間:S1,...,Si,…Sn,博弈方i的第j個(gè)策略Sij∈Si博弈方i的得益:ui博弈:G={S1,...Sn;u1,...un}
納什均衡:在博弈G={S1,...Sn;u1,...un}中,如果由各個(gè)博弈方的各一個(gè)策略組成的某個(gè)策略組合{S1*,...Sn*}中,任一博弈方i的策略Si*,都是對其余博弈方策略的組合{S1*,...Si-1*,Si+1*,…
Sn*}的最佳對策,也即對任意
ui(S1*,...Si-1*,Si*,
Si+1*,...Sn*)
≥ui(S1,...Si-1*,Sij,
Si+1*,…
Sn*)都成立,則稱{S1*,...Sn*}為G的一個(gè)納什均衡5/24/20238Cont.二、納什均衡的一致預(yù)測性質(zhì)一致預(yù)測:如果所有博弈方都預(yù)測一個(gè)特定博弈結(jié)果會出現(xiàn),所有博弈方都不會利用該預(yù)測或者這種預(yù)測能力選擇與預(yù)測結(jié)果不一致的策略,即沒有哪個(gè)博弈方有偏離這個(gè)預(yù)測結(jié)果的愿望,因此預(yù)測結(jié)果會成為博弈的最終結(jié)果只有納什均衡才具有一致預(yù)測的性質(zhì)一致預(yù)測性是納什均衡的本質(zhì)屬性一致預(yù)測并不意味著一定能準(zhǔn)確預(yù)測,因?yàn)橛卸嘀鼐?,預(yù)測不一致的可能5/24/20239Cont三、納什均衡與嚴(yán)格下策反復(fù)消去法上策均衡肯定是納什均衡,但納什均衡不一定是上策均衡命題1:在n個(gè)博弈方的博弈G={S1,...Sn;u1,...un}中,如果嚴(yán)格下策反復(fù)消去法排除了除{S1*,...Sn*}之外的所有策略組合,那么{S1*,...Sn*}一定是該博弈的唯一的納什均衡命題2:在n個(gè)博弈方的博弈中G={S1,...Sn;u1,...un}中,如果{S1*,...Sn*}是G的一個(gè)納什均衡,那么嚴(yán)格下策反復(fù)消去法一定不會將它消去上述兩個(gè)命題保證在進(jìn)行納什均衡分析之前先通過嚴(yán)格下策反復(fù)消去法簡化博弈是可行的5/24/202310Cont證明:納什均衡與嚴(yán)格下策反復(fù)消去法(反證法)命題1:如果消去所有后余下的{Si*,S-i*}不是納什均衡不是納什均衡,一定存在那么{Si’,S-i*},
使得{Si*,S-i*}<{Si’,S-i*}。然而,反復(fù)消去法消去了{(lán)Si’,S-i},說明{Si*,S-i}>{Si’,S-i}{Si*,S-i*}in{Si*,S-i},{Si’,S-i*}
in{Si’,S-i}所以,{Si*,S-i*}>{Si’,S-i*}
命題2:如果納什均衡{Si*,S-i*}被嚴(yán)格下策反復(fù)消去;那么必然存在一個(gè)Si‘,使得{Si’,S-i}>{Si*,S-i}進(jìn)而,
{Si‘,S-i*}>{Si*,S-i*}與納什均衡的定義,矛盾5/24/2023112.3無限策略分析和反應(yīng)函數(shù)古諾的寡頭模型Player:廠商1,2Strategy:q1,q2Payoff:P=8-(q1+q2),c1=c2=2;u1=6q1-q1q2-q12,u2=6q2-q1q2-q22,Howtofindtheequilibrium?(3,0)(6,0)(0,3)(0,6)古諾模型的反應(yīng)函數(shù)圖示R1(q2)R2(q1)q1q25/24/202312Cont。伯特蘭德寡頭模型模型Player:廠商1,2Strategy:[0,p1max],[0,p2max]Payoff:q1(p1,p2)=28-p1-0.5p2,q2(p1,p2)=28-p2-0.5p1,c1=c2=2;u1=(p1-2)(28-p1-0.5p2);u2=(p2-2)(28-p2-0.5p1);Howetofindtheequilibrium?maxu1=max(p1-2)(28-p1-0.5p2);maxu2=max(p2-2)(28-p2-0.5p1);p1p2p1*=0.5(30-0.5p2*);p2*=0.5(30-0.5p1*);p1*=p2*=205/24/202313Cont。公共草地養(yǎng)羊問題Player:3個(gè)農(nóng)戶Strategy:[0,q1,max],…,[0,qn,max],Q=q1+q2+q3Payoff:ui=qi[100-(q1+q2+q3);]-qic;Howetofindtheequilibrium?maxu1=maxq1[100-(q1+q2+q3);]–q1c;maxu2=maxq2[100-(q1+q2+q3);]–q2c;maxu3=maxq3[100-(q1+q2+q3);]–q3c;q1q2q3q1*=q2*=q3*=24,u1*=u2*=u3*=576如果總體來看,maxQ[100-Q
]–Qc;Q*=48,u=2304公共資源的悲劇?。?!5/24/202314Cont.反應(yīng)函數(shù)的問題和局限性有此博弈中,博弈方的策略是有限且非連續(xù)時(shí),其得益函數(shù)不是連續(xù)可導(dǎo)函數(shù),無法求得反應(yīng)函數(shù),從而不能通過解方程組的方法求得納什均衡。即使得益函數(shù)可以求導(dǎo),也可能各博弈方的得益函數(shù)比較復(fù)雜,因此各自的反應(yīng)函數(shù)也比較復(fù)雜,并不總能保證各博弈方的反應(yīng)函數(shù)有交點(diǎn),特別不能保證有唯一的交點(diǎn)。5/24/2023152.那4混合狗策略太和混乏合策化略納哀什均處衡一、伏猜硬潤幣博循弈(1)不綁存在稍前面王定義秋的納宜什均倚衡策躺略組泰合(2)關(guān)假鍵是至不能王讓對調(diào)方猜奪到自荒己策援略這類吹博弈襲很多朋,引姐出混富合策勒略納北什均耽衡概膨念-1,11,-11,-1-1,1正面反面正面反面猜硬燙幣方蓋硬陽幣方5/卵18俗/2熔02暴316Co虛nt沫.二、混合澤策略德、混舍合策續(xù)略博觀弈和氏混合捕策略柱納什帖均衡混合統(tǒng)策略:在買博弈G={S1,石..減.Sn;u1,奸..編.un}中,煮博弈逆方i的策蒙略空摔間{Si1,校..勤.Sik},則屬博弈敬方i以概毛率分召布{pi1,致..朵.pik}隨機(jī)雨在其k個(gè)可拖選策管略中辦選擇較的“甜策略間”,含稱為副一個(gè)斷“混旗合策付略”增,其劃中0<pij<1勝,對1<j<k翅,都成支立,pi1+西..茫.pik=1混合京策略航擴(kuò)展睬博弈:博墓弈方搬在混窯合策厘略的近策略格空間路(概業(yè)率分輪布空烤間)瘡的選賺擇看央作一淋個(gè)博狂弈,郵就是糊原博帥弈的具“混電合策棵略擴(kuò)詠展博忠弈)虧。混合維策略圍納什厚均衡:包攻含混糖合策寧略的己策略攜組合碧,構(gòu)芒成納省什均洲衡。5/爬18武/2方02蔽317Co仗nt針.三、一個(gè)灑例子該博石弈無鈴純策深略納和什均形衡,磁可用白混合脅策略至納什蒙均衡瀉分析I的混康合策股略(p):3p+1鵝(1綠-p)=匪2p+5包(1鞭-p)II的混印合策撿略(q):2q+5層(1帥-q)=雹3q+1彼(1峰-q)u1=鞋p[昌2q拿+5杠(1圓-q抖)]票+(攤1-穴p)奪[3掏q+櫻1(下1-晚q)闊]=窗2.城6u2=身q[確3p走+1證(1莫-p讀)]凝+(括1-切q)贈[2蛋p+攜5(壓1-粱p)摩]=都2.孩62,35,23,11,5C網(wǎng)(q)D槽(1鉗-q)A(p)B(1雞-p)Pa仔yo須ffPl膏ay怕er恢2Pl纏ay陷er殿1p=0.8,q=0.8u
1=2.6,u
2=2.65/占18奴/2雕02暫318Co腦nt敬.博弈號方2選C的收狗益(p混)3p桑+1瞧(1雜-p晨)=蠅1+粒2p博弈貼方2選D的收犬益(p混)2p線+5劉(1永-p剃)=妨5-流3p博弈澆方1選A的收糾益(q混)2q師+5燃(辯1-逢q)派=沉5-聚3q博弈肝方1選B的收灑益(q混):3q縮慧+1話(1糕-q泰)=圖1+鉆2q2,35,23,11,5C(q)D(1-q)A(p)B(1-p)PayoffPlayer2Player10p=造1u2(C)u2(D)0p=的1q=壩10.幟80.厘80q=殊1u1(B)u1(A)0.謠85/汪18暢/2痛02鴉319五、萬小偷綠和守哈衛(wèi)的肯博弈加重右對首暮位的嫁處罰宣:短茂期中銅的效廁果是蜻使守致衛(wèi)真忌正盡煩職在長軌期中鈴并不渾能使快守衛(wèi)吹更盡丸職,隆但會娛降低勾盜竊邁發(fā)生姑的概規(guī)略0-化D-診D’守衛(wèi)得益((睡)Sp=1小偷p混合煎下,掠守衛(wèi)膊的得編益睡時(shí)敬:-Dp+S(1剝-p)不睡醬時(shí):0*p+狠0*澤(1荷-p)守衛(wèi)直睡覺暴時(shí)的禁得益p*守衛(wèi)溝不睡放覺時(shí)選的得際益V,-D-P,00,S0,0睡不睡偷不偷守衛(wèi)小偷5/腦18移/2巨02遞320Co典nt寄.0-P守衛(wèi)得益((睡)Vq=1守衛(wèi)q混合臂下,妖小偷睜的得戶益偷:Vq-P(1冊-q)=攤-P+(V+P)q不偷師:0*q+陳0*猶(1命-q)項(xiàng)=0偷時(shí)胖的得坑益q*不偷遲的得袍益V,-D-P,00,S0,0睡不睡偷不偷守衛(wèi)小偷加重注對小蛾偷的斗處罰戀:短煙期內(nèi)循能抑改制盜統(tǒng)竊發(fā)意生率長期遷并不使能降革低盜盼竊發(fā)燈生率靠,但鑒會是搏的守臂衛(wèi)更英多的鋪偷懶5/虛18卡/2避02吊321Co柜nt堆.多重影均衡責(zé)博弈產(chǎn)和混俯合策平略夫妻暴之爭線的混加合策每略納恩什均材衡2,10,00,01,3時(shí)裝足球時(shí)裝足球丈夫妻子夫妻之爭妻子備的p混合個(gè)策略讓使:1p+0賤(1暮-p)=鮮0p+3電(1猶-p)丈夫始的q混合闖策略介使:2q+0元(1借-q)=貍0q+1某(1信-q)夫妻晴之爭泄博弈框的混羅合策哭略納冷什均鬧衡策略只得益博弈檢方1(3/罪4,相1/喜4)0.靜67博弈喊方2(1/設(shè)3,嘗2猴/3)0.呆755/絲式18聲/2是02情322Co責(zé)nt來.夫妻狡之爭丈夫郊選時(shí)裝的得鋤益(p混):p-0崖(1挪-p)=p丈夫他選足球的得局益(p混):0p+3楊(1帥-p)=該3-炊3p妻子討選時(shí)裝的得除益(q混):2q+0愛(1翁-q)李=2q妻子茅選足球的得慰益(q混):0q+1捧(1掌-q)=折1-qPayoff2,10,00,01,3時(shí)裝(q)足球(1-q)時(shí)裝(p)足球(1-p)丈夫妻0p=1u2(球)u2(時(shí))0p=鞏1q=舟13/漏43/遍40q=毫1u1(時(shí))u1(球)1/切3R2R11/馬3315/逮18畫/2各02訪323Co闊nt石.制式孕問題1,30,00,02,2A(q)B(1-q)A(p)B(1-p)廠商1廠商2pa宴yo哪ff廠商A的p混合喇策略鐵使:3p+0嘉(1校-p)=緒0p+2寨(1丈-p)廠商B的q混合劃策略眠使:1q+0懸(1圾-q)=質(zhì)0q+2蛾(1換-q)制式勵(lì)問題峰的混聰合策感略納猾什均敞衡策略兆得益廠商1(0.葬4,0.漲6)0.缸67廠商2(0.皇67,0.脊33)0.磚755/揭18悄/2塑02趕324Co普nt訴.三、景混合還策略跨和嚴(yán)塵格下爸策反夫復(fù)消散去法包括跨混合牢策略醫(yī)時(shí),慈嚴(yán)格妨下策道反復(fù)異消去燈法依蠟然成告立(左米)博文弈不蛛存在可純策遺略嚴(yán)于格下緩策3,10,20,23,31,31,1LRUMD博弈方2博弈方11.5,1.51.5,2.5mix如果I使用p混合茂策略哈,如個(gè)(.5,.5,0)5/羞18白/2喪02繩325重新隸思考評“夫理妻之批爭”夫妻莊約會是:但侍電話算斷了覽!能飽遇見器么妻子擊根據(jù)叔對“雪丈夫嫂”的回判斷萬,q,考慮酷決定如:u1[時(shí)裝]=久2q+艙0(1-維q)=尖2qu1[足球]=呼0q+旬1(1-飯q)=車1蓋-q如果那判斷q大,2q>籮1-q,or住,q>精1/況3妻子塵最好動(dòng)直接松去時(shí)炒裝!問題灰:混合渠策略胃的得辦益小脆:雙導(dǎo)方預(yù)煮期得訊益0.起67,0.途75均小竊于兩浴個(gè)納兩什均住衡遇不內(nèi)到的際概率堡:1/另3*炊1/鄰4+延2/客3*役3/墨4=防7/興12Payoff2,10,00,01,3時(shí)裝(q)足球(1-q)時(shí)裝(p)足球(1-p)丈夫妻5/媽18缺/2征02理3262.故5納什睬均衡蛋的存配在性智(略凱)5/星18疼/2畢02驅(qū)3272.約6納什刑均衡膀的選檢擇和癢分析茶方法駛擴(kuò)展(選)2.燃6.廚1多重引納什預(yù)均衡墾博弈秧的分斤析2.星6.栗2共謀窯和防而共謀瞇均衡核心雷是均江衡的按精煉子問題載!!5/場18流/2畝02口328Co移nt退.多重凝納什銹均衡膝博弈址的分態(tài)析一、晝帕累抽托上拆策均找衡(鷹鴿柳博弈紀(jì))這個(gè)爬博弈塞中有裝兩個(gè)棵純策部略納線什均暴衡,打(戰(zhàn)胸爭,楚戰(zhàn)爭悟)和(碌和平文,和役平)流,顯增然后劉者帕漸累托毅優(yōu)于巾前者辱,所以,旨(和杠平,庸和平概)是稀本博確弈的扁一個(gè)瓶帕累美托上宮策均垂衡。-5,-5-1撒0,88,-1毒010,10戰(zhàn)爭和平國家2戰(zhàn)爭和平國家1戰(zhàn)爭湯與和仰平5/牽18顯/2醒02脈329Co督nt膊.二、旋風(fēng)險(xiǎn)膛上策詳均衡考慮需、顧弟忌博劣弈方全、其鴨他博塌弈方險(xiǎn)可能稀發(fā)生死錯(cuò)誤聽等時(shí)離,帕歸累托熱上策似均衡教并不堅(jiān)一定秤是最輛優(yōu)選閘擇,匠需要盛考慮合:風(fēng)籮險(xiǎn)上卻策均廉衡。殘下面纖就是劣兩個(gè)蛾例子跨。9,98,00,87,7LR博弈轉(zhuǎn)方2UD博弈方1風(fēng)險(xiǎn)酸上策皮均衡翁(D,R)5,53,00,33,3鹿兔子獵人2鹿兔子獵人1獵鹿博弈風(fēng)險(xiǎn)哲上策物均衡瓶(兔越子,息兔子舅)4.告57.荒54.挑57.捏52.攏532.鮮535/磁18倚/2鬧02括330Co響nt鋪.三、擠聚點(diǎn)漠均衡利用捷博弈念設(shè)定犯以外傍的信隱息和歉依據(jù)板選擇笨的均校衡文化嗽、習(xí)憑慣或庸者其什他各須種特險(xiǎn)征都挺可能沒是聚棗點(diǎn)均多衡的耍依據(jù)城市乖博弈殲(城亭市分怖組相賣同)緞、時(shí)湯間博該弈(瘡報(bào)出聯(lián)相同雕的時(shí)分間)侄是聚言點(diǎn)均上衡的聞典型蹤蝶例子5/刺18喇/2慚02莊331四、勒相關(guān)洞均衡冠(略環(huán))5,14,40,01,5LR博弈方2UD博弈方1相關(guān)均衡例子三個(gè)納什動(dòng)均衡:(U,L)、峰(D,R)和混陸合策田略均譽(yù)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 關(guān)于節(jié)約糧食主題國旗下講話稿范文(13篇)
- 新型風(fēng)電軸承材料研究-洞察分析
- 填料對混凝土耐久性的影響-洞察分析
- 土壤水勢時(shí)空演變-洞察分析
- 虛擬仿真技術(shù)在職業(yè)教育中的應(yīng)用-洞察分析
- 心理健康與生活質(zhì)量-第1篇-洞察分析
- 物聯(lián)網(wǎng)數(shù)據(jù)質(zhì)量評估與治理-洞察分析
- 碳捕集與氣候變化應(yīng)對-洞察分析
- 水資源跨區(qū)域調(diào)配與協(xié)同管理-洞察分析
- 醫(yī)院醫(yī)生調(diào)換科室申請書(8篇)
- 高中詞匯3500亂序版
- NY 5051-2001無公害食品淡水養(yǎng)殖用水水質(zhì)
- GB/T 24176-2009金屬材料疲勞試驗(yàn)數(shù)據(jù)統(tǒng)計(jì)方案與分析方法
- 2023年初一學(xué)生綜合素質(zhì)自我陳述報(bào)告3篇(范文)
- 四年級數(shù)學(xué)期末考試質(zhì)量分析
- 多發(fā)性骨髓瘤的療效評估
- 題型二次函數(shù)壓軸題課件
- 中建二局“大商務(wù)”管理實(shí)施方案20200713(終稿)
- 燃?xì)獍踩^續(xù)教育考試題及答案
- 班前安全教育手冊(適用于全公司房屋建筑工程、市政基礎(chǔ)設(shè)施工程、公路工程施工的作業(yè)人員)
評論
0/150
提交評論