版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第二章完全信息的靜態(tài)博弈第一節(jié)博弈模型的分析方法
一、上策均衡(1)上策:在一個(gè)博弈中,不論其他博弈方選擇什么策略,某一博弈方的最優(yōu)策略是唯一的,稱這種策略為該博弈方的一個(gè)上策。(2)上策均衡:如果在一個(gè)博弈中的某個(gè)策略組合中的所有策略都是各個(gè)博弈方的各自的上策,稱這個(gè)策略組合為該博弈的一個(gè)“上策均衡”。上策均衡的分析(1)囚徒B坦白不坦白例1:囚徒困境囚徒A坦白不坦白-5,-50,-8-8,0-1,-1上策均衡的分析(2)大豬踩不踩例2:智豬博弈小豬踩不踩1.5,3.5-0.5,65,0.50,0結(jié)論:由于不是所有的博弈都存在著這種上策均衡,因此,上策均衡的分析方法存在一定的局限性。二、嚴(yán)格下策反復(fù)消去法
(1)如果在一個(gè)博弈中,不管其它博弈方的策略如何變化,一個(gè)博弈方的某種策略給他帶來(lái)的得益,總是比另一種策略給他帶來(lái)的得益要小,那么稱前一種策略為相對(duì)于后一種策略的一個(gè)“嚴(yán)格下策”。(2)經(jīng)“反復(fù)消去”博弈方的嚴(yán)格下策以后,每個(gè)博弈方可選策略都縮小為一個(gè)策略。因此,每個(gè)博弈方都選擇各自剩下的一個(gè)策略所組成的策略組合,是這個(gè)博弈的均衡解。嚴(yán)格下策反復(fù)消去法的分析(1)囚徒B坦白不坦白例1:囚徒困境囚徒A坦白不坦白-5,-50,-8-8,0-1,-1嚴(yán)格下策反復(fù)消去法的分析(2)大豬踩不踩例2:智豬博弈小豬踩不踩1.5,3.5-0.5,65,0.50,0嚴(yán)格下策反復(fù)消去法的分析(3)博弈方2左中右例2:下圖中的得益矩陣表示兩博弈方的一個(gè)靜態(tài)博弈,試使用嚴(yán)格下策反復(fù)消去法進(jìn)行分析。博弈方1上下1,01,30,10,40,22,0嚴(yán)格下策反復(fù)消去法的總結(jié)(1)先找出某一個(gè)博弈方的嚴(yán)格下策(假定存在),然后把這個(gè)嚴(yán)格下策去掉,繼續(xù)這個(gè)過(guò)程,一直到只剩下一個(gè)唯一的策略組合為止。這個(gè)唯一剩下的策略組合就是這個(gè)博弈的均衡解。如果剩下的策略組合不唯一,那么就不能用嚴(yán)格下策反復(fù)消去法去解。(2)嚴(yán)格下策反復(fù)消去法也不能解決所有的博弈分析問(wèn)題。嚴(yán)格下策反復(fù)消去法的思考問(wèn)題:(1)“嚴(yán)格下策”和“上策”之間有沒(méi)有對(duì)應(yīng)關(guān)系,什么情況下有對(duì)應(yīng)關(guān)系?(2)使用嚴(yán)格下策反復(fù)消去法所得到的均衡結(jié)果,是否與消去的嚴(yán)格下策的次序有關(guān)。嚴(yán)格下策反復(fù)消去法的練習(xí)博弈方2ULR例2:下圖中的得益矩陣表示兩博弈方的一個(gè)靜態(tài)博弈,試使用嚴(yán)格下策反復(fù)消去法進(jìn)行分析。博弈方1UD1,01,20,10,30,12,0三、劃線法
其中心思想是根據(jù)博弈方策略之間的相對(duì)優(yōu)劣關(guān)系,導(dǎo)出博弈分析的“劃線法”。例:下圖中的得益矩陣表示兩博弈方的一個(gè)靜態(tài)博弈,試使用劃線法進(jìn)行分析。博弈方2左中右上下博弈方11,01,30,10,40,22,0劃線法的練習(xí)(1)囚徒B坦白不坦白例2:囚徒困境囚徒A坦白不坦白-5,-50,-8-8,0-1,-1劃線法的聯(lián)系(2)博弈方2LCR例3:下圖中的得益矩陣表示兩博弈方的一個(gè)靜態(tài)博弈,試使用劃線法進(jìn)行分析;另可否用嚴(yán)格反復(fù)消去法分析。博弈方1UMD0,44,05,34,00,45,33,53,56,6三種分析方法的總結(jié)在一個(gè)博弈中,對(duì)于一個(gè)穩(wěn)定性的策略組合,不管是否唯一,都有一個(gè)共同的特性,就是每一個(gè)博弈方的策略都是針對(duì)其他博弈方策略的最佳對(duì)策,各博弈方都不愿意改變策略的策略組合。第二節(jié)納什均衡一、納什均衡在博弈G=(S1,S2,…,Sn;u1,u2,…,un)中,如果某個(gè)策略組合(s1*,s2*,…,sn*)中的任一博弈方i的策略si*,都是對(duì)其余博弈方策略的最佳對(duì)策,也即:Vi,有下面式子成立:ui(s1*,s2*,…,si*,…,sn*)≥ui(s1*,s2*,…,si,…,sn*)其中,Vsi∈Si。納什均衡的練習(xí)(1)囚徒B坦白不坦白例1:囚徒困境囚徒A坦白不坦白-5,-50,-8-8,0-1,-1納什均衡的練習(xí)(2)大豬踩不踩例2:智豬博弈小豬踩不踩1.5,3.5-0.5,65,0.50,0納什均衡的練習(xí)(3)猜硬幣者正反例2:猜硬幣的博弈蓋硬幣者正反-1,11,-11,-1-1,1二、有關(guān)納什均衡的幾個(gè)結(jié)論
(1)納什均衡的一致預(yù)測(cè)性:如果所有的博弈方都預(yù)測(cè)某一個(gè)特定的納什均衡所組成的策略組合會(huì)出現(xiàn),那么,所有的博弈方都不會(huì)選擇與預(yù)測(cè)結(jié)果不一致的策略。(2)每一個(gè)上策均衡都是納什均衡,但反過(guò)來(lái)納什均衡不一定是上策均衡。二、有關(guān)納什均衡的幾個(gè)結(jié)論
(3)在一個(gè)博弈中,如果使用嚴(yán)格下策反復(fù)消去法消去了除某一策略組合以外的所有策略組合,那么該策略組合一定是該博弈的唯一的納什均衡。(4)通過(guò)劃線法所求出的最佳策略組合一定是納什均衡。有關(guān)納什均衡的例子(1)丈夫時(shí)裝足球例1:夫妻之爭(zhēng)妻子時(shí)裝足球2,10,00,01,2有關(guān)納什均衡的例子(2)B進(jìn)退例2:斗雞博弈A進(jìn)退-1,-12,11,20,0三、有關(guān)納什均衡的應(yīng)用舉例
(1)古諾(Cournot,1838)的寡頭模型設(shè)一市場(chǎng)有廠商1和廠商2生產(chǎn)同樣的產(chǎn)品(產(chǎn)品是同質(zhì)的)。如果廠商1的產(chǎn)量為q1,廠商2的產(chǎn)量為q2,則市場(chǎng)上的總產(chǎn)量為Q=q1+q2。設(shè)上述總產(chǎn)量全部售出的價(jià)格為P=P(Q)=8-Q。再設(shè)兩廠商的生產(chǎn)都無(wú)固定成本,且每增加一單位產(chǎn)量的邊際成本相等,c1=c2=2,最后強(qiáng)調(diào)的是兩廠商同時(shí)決定他們各自的產(chǎn)量,也就是他們?cè)跊Q策時(shí)都不知道對(duì)方的產(chǎn)量。試確定上述博弈模型達(dá)到納什均衡時(shí)兩個(gè)廠商的各自的產(chǎn)量。反應(yīng)函數(shù)的概念
稱R1(q2):q1=R1(q2)=1/2(6-q2)為廠商1對(duì)廠商2產(chǎn)量的“反應(yīng)函數(shù)”,它意味著對(duì)廠商2的每一個(gè)產(chǎn)量q2,有廠商1的最佳對(duì)策的q1,q1是廠商2產(chǎn)量的一個(gè)連續(xù)函數(shù)。同理,稱R2(q1):q2=R2(q1)=1/2(6-q1)為廠商2對(duì)廠商1產(chǎn)量的“反應(yīng)函數(shù)”。它意味著對(duì)廠商1的每一個(gè)產(chǎn)量q1,有廠商2的最佳對(duì)策的q2。古諾模型的深入分析廠商2不突破(1.5)突破(2)例:高低產(chǎn)量決策廠商1不突破突破4.5,4.53.75,55,3.754,4(2)伯特蘭德寡頭模型
已知:當(dāng)廠商1和廠商2的價(jià)格分別為P1和P2時(shí),他們各自的需求函數(shù)為:q1=a1–b1P1+d1P2
q2=a2–b2P2+d2P1假設(shè)兩廠商無(wú)固定成本,其邊際生產(chǎn)成本分別為c1和c2。試用反應(yīng)函數(shù)的方法來(lái)確定納什均衡時(shí)的價(jià)格。(3)公共資源問(wèn)題
設(shè)某個(gè)村莊有三個(gè)農(nóng)戶,該村有一片大家都可以自由放牧羊群的公共草地。由于這片草地的面積有限,因此只能讓不超過(guò)某一數(shù)量的羊吃飽,如果在這片草地上的放牧的羊只的數(shù)量超過(guò)這個(gè)數(shù)量,則每只羊都無(wú)法吃飽,從而每只羊的產(chǎn)出(毛,皮和肉的總價(jià)值)就會(huì)減少,甚至有些羊就會(huì)餓死。假設(shè)這些農(nóng)戶在夏天才到公共草地放羊,而每年的春天就要決定養(yǎng)羊的數(shù)量。(3)公共資源問(wèn)題
再假設(shè)所有的農(nóng)戶都清楚這片公共草地上最多能養(yǎng)多少只羊,以及羊只總數(shù)不同水平下每只羊的不同產(chǎn)出。在這個(gè)博弈中,博弈方是3個(gè)農(nóng)戶,他們各自的策略空間就是他們的養(yǎng)羊數(shù)目qi(i=1,2,3)的取值范圍,此時(shí)在公共草地上放牧羊只的總數(shù)Q=q1+q2+q3,根據(jù)上面的介紹,每只羊的產(chǎn)出V應(yīng)是羊只的總數(shù)Q的減函數(shù)V=V(q1+q2+q3)=100-(q1+q2+q3)。假設(shè)購(gòu)買和照料每只羊的成本對(duì)每個(gè)農(nóng)戶都是相同的不變常數(shù)c=4。試用反應(yīng)函數(shù)的方法來(lái)確定納什均衡時(shí)的三個(gè)農(nóng)戶的養(yǎng)羊數(shù)量。第三節(jié)混合策略和混合策略的納什均衡
一、混合策略
在一個(gè)博弈中,博弈方在每一個(gè)給定的信息情況下只選擇一種特定的策略,稱之為純策略。在一個(gè)博弈中,博弈方以一定的概率分布在可選的策略中隨機(jī)選擇策略的決策方式,稱之為混合策略?;旌喜呗栽跀?shù)學(xué)上的一般定義定義:在博弈G=(S1,S2,…,Sn;u1,u2,…,un)中,設(shè)博弈方i的策略空間為Si=(si1,si2,…,sik),則博弈方i以概率分布pi=(pi1,pi2,…,pik)隨機(jī)在其k個(gè)可選策略中選擇的“策略”,稱為一個(gè)“混合策略”,其中,0≤pij≤1(j=1,2,…,k),且pi1+pi2+…+pik=1。
二、混合策略的納什均衡純策略空間上的納什均衡的定義:如果一個(gè)策略組合滿足各博弈方的策略相互是對(duì)其他博弈方策略的最佳對(duì)策時(shí),就是一個(gè)納什均衡當(dāng)策略擴(kuò)展到混合策略時(shí),上述納什均衡的概念仍成立。此時(shí),策略含義既可能是純策略,也可能是混合策略混合策略納什均衡的推導(dǎo)猜硬幣者正反例:猜硬幣的博弈蓋硬幣者正反-1,11,-11,-1-1,1博弈方選擇策略的原則(1)自己的策略選擇不能預(yù)先被另一方知道或猜測(cè)到;(2)在博弈的多次重復(fù)中,博弈方一定要避免自己的選擇帶有規(guī)律性;(3)每一個(gè)博弈方選擇每種策略的概率一定要使對(duì)方無(wú)機(jī)可乘;使博弈中各博弈方選擇不同策略的平均得益(期望得益)相等;混合策略的納什均衡例子(1)博弈方2CD例1:博弈方1AB2,35,23,11,5例2:齊威王與田忌賽馬
田忌上上中中下下中下上下上中下中下上中上上中下齊上下中威中上下王中下上下上中下中上3,-3
1,-1
1,-1
1,-1
-1,1
1,-1
1,-1
3,-3
1,-1
1,-1
1,-1
-1,1
1,-1
-1,1
3,-31,-1
1,-1
1,-1
-1,1
1,-1
1,-1
3,-31,-1
1,-1
1,-1
1,-1
1,-1
-1,1
3,-31,-1
1,-11,-1-1,1
1,-11,-13,-3例3:小偷和守衛(wèi)的博弈
一小偷欲偷竊有一守衛(wèi)者看守的倉(cāng)庫(kù),如果小偷偷竊時(shí)守衛(wèi)在睡覺(jué),則小偷就能得手,偷得價(jià)值為V的贓物;如果小偷偷竊時(shí)守衛(wèi)沒(méi)有睡覺(jué),則小偷就被抓住,小偷產(chǎn)生負(fù)的效用-P。守衛(wèi)睡覺(jué)而未遭偷竊有S的正效用,因睡覺(jué)被竊,守衛(wèi)要有負(fù)的效用-D。而如果小偷不偷,則他既無(wú)所得也所失;而守衛(wèi)不睡,他也沒(méi)有得失。試確定上述博弈是否有純策略的納什均衡,是否唯一,否則求出其混合策略的納什均衡,并分析所得到的結(jié)果。分析:守衛(wèi)睡不睡(1)博弈的矩陣形式小偷偷不偷V,-D-P,00,S0,0(2)小偷與守衛(wèi)的混合策略的博弈,揭示了一種“激勵(lì)的悖論”。例4:夫妻之爭(zhēng)丈夫時(shí)裝足球妻子時(shí)裝足球2,10,00,01,2例5:市場(chǎng)機(jī)會(huì)博弈
博弈問(wèn)題:兩廠商同時(shí)發(fā)現(xiàn)一個(gè)市場(chǎng)機(jī)會(huì),但這個(gè)市場(chǎng)的容量并不大,如果只有一個(gè)廠商進(jìn)入該市場(chǎng),能掙到100個(gè)單位的利潤(rùn),但如果兩廠商同時(shí)進(jìn)入該市場(chǎng),則他們不僅掙不到錢而且要虧損50個(gè)單位。如果在這兩個(gè)廠商之間沒(méi)有溝通和協(xié)商解決的有效辦法,試確定上述博弈是否有純策略的納什均衡,是否唯一,否則求出其混合策略的納什均衡,并分析所得到的結(jié)果。分析:廠商2進(jìn)不進(jìn)博弈的矩陣形式廠商1進(jìn)不進(jìn)-50,-50100,00,1000,0例6:市民責(zé)任博弈李四旁觀報(bào)警張三旁觀報(bào)警0,010,77,107,7第四節(jié)多重納什均衡分析
一、納什定理(NASH1950)
在一個(gè)有n個(gè)博弈方的博弈G=(S1,S2,…,Sn;u1,u2,…,un)中,如果n是有限的,且Si都是有限集(i=1,2,…,n),則該博弈至少存在一個(gè)納什均衡,但可能包含混合策略。一、帕累托上策均衡在一個(gè)多重納什均衡的博弈中,如果這些納什均衡有明顯的優(yōu)劣關(guān)系,并且所有的博弈方都偏好其中的某一個(gè)納什均衡,也就是說(shuō),這個(gè)納什均衡給所有博弈方帶來(lái)的得益,大于其他納什均衡給所有博弈方帶來(lái)的得益,稱該納什均衡為帕累托上策均衡。帕累托上策均衡舉例國(guó)家2戰(zhàn)爭(zhēng)和平國(guó)家1戰(zhàn)爭(zhēng)和平-5,-58,-10-10,810,10“戰(zhàn)爭(zhēng)與和平”從國(guó)家和人民總體的長(zhǎng)遠(yuǎn)利益出發(fā)進(jìn)行客觀分析,戰(zhàn)爭(zhēng)通常對(duì)任何一方都是有害無(wú)益的。選擇戰(zhàn)爭(zhēng)比選擇和平有利的唯一情況是對(duì)方已經(jīng)選擇了戰(zhàn)爭(zhēng),因?yàn)檫@時(shí)候不奮起反擊就會(huì)任人宰割。二、“廉價(jià)磋商”在一個(gè)多重納什均衡博弈中,博弈方為保證某一個(gè)納什均衡出現(xiàn),可以在博弈開(kāi)始之前進(jìn)行不花成本或低成本的“廉價(jià)磋商”,這樣的磋商即使不能達(dá)成協(xié)議,但可以使某一個(gè)納什均衡實(shí)際上出現(xiàn)。廉價(jià)磋商舉例博弈方BLR博弈方AUD9,90,00,01,1三、風(fēng)險(xiǎn)上策均衡在多重納什均衡的博弈中,各個(gè)博弈方從風(fēng)險(xiǎn)的角度上,通常比較傾向于接受預(yù)測(cè)風(fēng)險(xiǎn)較小的策略組合博弈方BLR博弈方AUD9,90,88,07,7風(fēng)險(xiǎn)上策均衡舉例獵鹿博弈:兩個(gè)人同時(shí)發(fā)現(xiàn)1頭鹿和兩只兔子,如果兩人合力抓鹿,則可以把這頭價(jià)值10個(gè)單位的鹿抓住,當(dāng)然兔子是抓不到了;如果兩人都去抓兔子,則各可以抓到一只價(jià)值3單位的兔子,鹿就會(huì)跑掉;但如果一個(gè)人選擇抓兔子而另一個(gè)人選擇抓鹿,那么選擇抓兔子的能抓到一只兔子,選擇抓鹿的人什么也抓不到。由于兩人的決策
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年03月招商銀行長(zhǎng)沙分行2024春季校園招考筆試歷年參考題庫(kù)附帶答案詳解
- 2025年度智能辦公設(shè)施租賃合同范本3篇
- 2025版新型路沿石產(chǎn)品定制及銷售合同3篇
- 2025年度二零二五版農(nóng)產(chǎn)品冷鏈物流服務(wù)合同范本3篇
- 2024年貨物供應(yīng)與配送協(xié)議
- 2025版數(shù)字經(jīng)濟(jì)股權(quán)投資及數(shù)據(jù)安全保護(hù)合同協(xié)議范本
- 2025年度P2P出借業(yè)務(wù)法律咨詢與風(fēng)險(xiǎn)防范協(xié)議2篇
- 2025年智能停車場(chǎng)管理系統(tǒng)設(shè)備維護(hù)及運(yùn)營(yíng)服務(wù)合同
- 臺(tái)州浙江臺(tái)州市黃巖區(qū)慈善總會(huì)招聘編外聘用人員筆試歷年典型考點(diǎn)(頻考版試卷)附帶答案詳解
- 2025年智能家居系統(tǒng)研發(fā)項(xiàng)目融資合同范本2篇
- 2022年7月國(guó)家開(kāi)放大學(xué)本科《中國(guó)法律史》期末紙質(zhì)考試試題及答案
- 2024-2025學(xué)年七年級(jí)數(shù)學(xué)上冊(cè)第一學(xué)期 期末模擬測(cè)試卷(湘教版)
- 2024年部門年終工作總結(jié)參考(四篇)
- 企業(yè)反恐專項(xiàng)經(jīng)費(fèi)保障制度
- 二年級(jí)數(shù)學(xué)上冊(cè)口算天天練
- 《概率論與數(shù)理統(tǒng)計(jì)基礎(chǔ)》全套教學(xué)課件
- 肯耐珂薩題庫(kù)
- 德詢歐陽(yáng)開(kāi)貴 -組織的發(fā)展與挑戰(zhàn)
- 肥豬銷售合同模板
- 冷凝集素綜合征治療與護(hù)理研究進(jìn)展
- CJT313-2009 生活垃圾采樣和分析方法
評(píng)論
0/150
提交評(píng)論