博弈論課件4兩人博弈_第1頁
博弈論課件4兩人博弈_第2頁
博弈論課件4兩人博弈_第3頁
博弈論課件4兩人博弈_第4頁
博弈論課件4兩人博弈_第5頁
已閱讀5頁,還剩40頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第二章 完全信息靜態(tài)博弈§2.1 兩人博弈一、兩人博弈的基本模型二、兩人零和博弈三、兩人博弈的占優(yōu)策略均衡

.2023/7/271中南財(cái)經(jīng)政法大學(xué)信息學(xué)院占優(yōu)策略均衡的實(shí)質(zhì)是—追求最佳!

不是所有博弈都有占優(yōu)策略,哪怕這個(gè)博弈只有一個(gè)參與者。實(shí)際上,優(yōu)勢與其說是一種規(guī)律,不如說是一種例外。雖然出現(xiàn)一個(gè)占優(yōu)策略可以大大簡化行動(dòng)的規(guī)則,但這些規(guī)則卻并不適用于大多數(shù)現(xiàn)實(shí)生活中的博弈。這時(shí)候我們必須用到其他原理。當(dāng)博弈問題不存在占優(yōu)策略均衡,即博弈雙方都沒有占優(yōu)策略,但有可能有一博弈方有占優(yōu)策略,假如你有一個(gè)占優(yōu)策略,你可以選擇采用,并且知道你的對手若是有一個(gè)優(yōu)勢策略他也會(huì)采納;分析的線條也就非常明朗了。.2023/7/272中南財(cái)經(jīng)政法大學(xué)信息學(xué)院占優(yōu)策略的情形分析情形一:占優(yōu)均衡存在——雙方都有一個(gè)占優(yōu)策略。.2023/7/273中南財(cái)經(jīng)政法大學(xué)信息學(xué)院情形二:某博弈方有一個(gè)優(yōu)勢策略,其他博弈方則沒有

只有一方擁有優(yōu)勢策略的博弈其實(shí)也非常簡單。擁有優(yōu)勢策略的一方將采用其優(yōu)勢策略,另一方則針對這個(gè)策略采用自己的最佳策略。

.2023/7/274中南財(cái)經(jīng)政法大學(xué)信息學(xué)院經(jīng)典案例二——智豬博弈

假設(shè)豬圈有一頭大豬,一頭小豬。豬圈的一頭有豬食槽,另一頭安裝著一控制豬食的按鈕,按一下按鈕,10個(gè)單位的豬食進(jìn)槽,但先按按鈕需要付出2個(gè)單位的成本。若大豬先到,大豬可吃到9個(gè)單位的食物,小豬只能吃到一個(gè)單位;若小豬先到,小豬可吃到4個(gè)單位,大豬也吃到6個(gè)單位;若兩豬同時(shí)到,大豬吃到7個(gè)單位,小豬吃到3個(gè)單位,在這種情況下,你認(rèn)為對小豬來說最佳選擇是什么?.2023/7/275中南財(cái)經(jīng)政法大學(xué)信息學(xué)院主動(dòng)去按按鈕;等大豬去按,如果大豬不去在去按;去按按鈕,然后快速跑向豬食;耐心等待,決不去按按鈕。分析:智豬博弈的盈利矩陣為.2023/7/276中南財(cái)經(jīng)政法大學(xué)信息學(xué)院

5,14,49,-10,0等待小豬大豬按等待按等待是小豬的嚴(yán)格占優(yōu)策略大豬有無嚴(yán)格占優(yōu)策略?4大于10大于-1答案是:小豬將舒舒服服地等在食槽邊,而大豬則為一點(diǎn)殘羹不知疲倦地奔忙于踏板和食槽之間。.2023/7/277中南財(cái)經(jīng)政法大學(xué)信息學(xué)院例1股市博弈在股票市場上,大戶是大豬,他們要進(jìn)行技術(shù)分析,收集信息、預(yù)測股價(jià)走勢,但大量散戶就是小豬。他們不會(huì)花成本去進(jìn)行技術(shù)分析,而是跟著大戶的投資策略進(jìn)行股票買賣,即所謂“散戶跟大戶”的現(xiàn)象。

智豬博弈:對諸多經(jīng)濟(jì)現(xiàn)象的解釋.2023/7/278中南財(cái)經(jīng)政法大學(xué)信息學(xué)院例2為何股份公司中的大股東才有投票權(quán)?

在股份公司中,大股東是大豬,他們要收集信息監(jiān)督經(jīng)理,因而擁有決定經(jīng)理任免的投票權(quán),而小股東是小豬,不會(huì)直接花精力去監(jiān)督經(jīng)理,因而沒有投票權(quán)。.2023/7/279中南財(cái)經(jīng)政法大學(xué)信息學(xué)院

例3為什么中小企業(yè)不會(huì)花錢去開發(fā)新產(chǎn)品?

在技術(shù)創(chuàng)新市場上,大企業(yè)是大豬,它們投入大量資金進(jìn)行技術(shù)創(chuàng)新,開發(fā)新產(chǎn)品,而中小企業(yè)是小豬,不會(huì)進(jìn)行大規(guī)模技術(shù)創(chuàng)新,而是等待大企業(yè)的新產(chǎn)品形成新的市場后生產(chǎn)模仿大企業(yè)的新產(chǎn)品的產(chǎn)品去銷售。.2023/7/2710中南財(cái)經(jīng)政法大學(xué)信息學(xué)院

例4為什么只有大企業(yè)才會(huì)花巨額打廣告?

大企業(yè)是大豬,中小企業(yè)是小豬。大企業(yè)投入大量資金為產(chǎn)品打廣告,中小企業(yè)等大企業(yè)的廣告為產(chǎn)品打開銷路形成市場后才生產(chǎn)類似產(chǎn)品進(jìn)行銷售。

.2023/7/2711中南財(cái)經(jīng)政法大學(xué)信息學(xué)院結(jié)果-大豬行動(dòng)

“搭便車”現(xiàn)象;公共物品,窮人和富人修路博弈;大股東對管理者的監(jiān)督;天塌下來有高個(gè)子頂著。.2023/7/2712中南財(cái)經(jīng)政法大學(xué)信息學(xué)院對策:解決這一現(xiàn)象的關(guān)鍵是加強(qiáng)決策的透明度和民主參與能力,讓每一個(gè)員工都有合適的途徑表達(dá)自己的觀點(diǎn)。同時(shí)要培養(yǎng)員工的團(tuán)隊(duì)意識(shí),盡量減少非正式組織對組織的影響力。以上僅僅是職場中幾個(gè)極為常見的博弈小例子。看一看,想一想,我們在生活中是不是經(jīng)常充當(dāng)了一些“大豬”或“小豬”的角色呢。.2023/7/2713中南財(cái)經(jīng)政法大學(xué)信息學(xué)院

假如你有一個(gè)劣勢策略,你應(yīng)該避免采用,并且知道你的對手若是有一個(gè)劣勢策略他也會(huì)規(guī)避。在你沒有優(yōu)勢策略的情況下,你要做的就是:

不能追求最佳,就要避免最差即剔除所有劣勢策略,不予考慮。如此一步一步做下去。.2023/7/2714中南財(cái)經(jīng)政法大學(xué)信息學(xué)院四、重復(fù)剔除的占優(yōu)均衡(嚴(yán)劣策略剔除法)“重復(fù)剔除嚴(yán)格劣策略”(iteratedeliminationofstrictlydominatedstrategy)的思路:首先找出某博弈方的劣策略(dominatedstrategy),把這個(gè)劣策略剔除后,剩下的是一個(gè)不包含已剔除劣策略的新的博弈;然后在剔除這個(gè)新的博弈中的劣策略;繼續(xù)這個(gè)過程,直到?jīng)]有劣策略存在。如果剩下的策略組合是唯一的,這個(gè)唯一的策略組合就是“重復(fù)剔除占優(yōu)均衡”(iterateddominanceequilibrium)。如果這樣的解存在,我們說該博弈是“重復(fù)剔除占優(yōu)可解的”(iterateddominancesolvable)..2023/7/2715中南財(cái)經(jīng)政法大學(xué)信息學(xué)院重復(fù)剔除嚴(yán)格劣策略:思路:首先找到某個(gè)博弈方的劣策略(假定存在),把這個(gè)劣策略從策略空間剔除掉,重新構(gòu)造一個(gè)不包含已剔除策略的新的博弈,然后再剔除這個(gè)新的博弈中的某個(gè)博弈方的劣策略,一直重復(fù)這個(gè)過程,直到只剩下唯一的策略組合為止。這個(gè)唯一剩下的策略組合就是這個(gè)博弈的均衡解,稱為“重復(fù)剔除的占優(yōu)均衡”。.2023/7/2716中南財(cái)經(jīng)政法大學(xué)信息學(xué)院嚴(yán)劣策略剔除法(重復(fù)剔除的占優(yōu)均衡)這種剔除法只是一個(gè)過程,它是決策雙方通過對各種純策略的優(yōu)劣,逐次保留嚴(yán)優(yōu)策略,剔除嚴(yán)劣策略,在博弈G中博弈方的嚴(yán)劣策當(dāng)然是博弈方實(shí)際上不愿選擇的策略,因此可以從博弈方的策略集中去掉,最終得到一個(gè)雙方都認(rèn)可的博弈策略組合或策略空間。

例1、G={S1,S2,C}中

C為.2023/7/2717中南財(cái)經(jīng)政法大學(xué)信息學(xué)院分析:博弈方甲各項(xiàng)純策略α1,α2,

α3之盈利向量(4,5,6)(2,8,3)(3,9,2)

顯然α1,α2,

α3之間不存在嚴(yán)優(yōu)關(guān)系。(連弱優(yōu)關(guān)系都不存在)

博弈方乙的各項(xiàng)純策略β1,β2,

β3之盈利向量 顯然β3嚴(yán)優(yōu)于β2,因而剔除β2。.2023/7/2718中南財(cái)經(jīng)政法大學(xué)信息學(xué)院一次嚴(yán)劣策略剔除后,原博弈問題為博弈方甲的α1

,α2,α3之盈利向量分別為

(4,6)(2,3)(3,2), 顯然α1

嚴(yán)優(yōu)于α2,α3, 因而對博弈方甲可剔除α2,α3。 博弈方乙的新策略β1

,β3之盈利向量分別為

(3,1,0)’與(2,6,8)’

顯然,β1

與β3無嚴(yán)優(yōu)關(guān)系。.2023/7/2719中南財(cái)經(jīng)政法大學(xué)信息學(xué)院

二次嚴(yán)劣策略剔除后,得新博弈問題二次保持嚴(yán)優(yōu)策略后,局中人甲只保留了純策略α1,這時(shí)局中人乙也應(yīng)選擇純策略β1

。例2、用嚴(yán)劣策略剔除法分析下面博弈

G={S1,S2,C}.2023/7/2720中南財(cái)經(jīng)政法大學(xué)信息學(xué)院解:用嚴(yán)劣策略剔除法分析的,局中人甲、乙的策略組合為(α1

,β1

)。例3、囚徒困境

C為分析: 甲的嚴(yán)優(yōu)策略為“坦白” 乙的嚴(yán)優(yōu)策略為“坦白”.2023/7/2721中南財(cái)經(jīng)政法大學(xué)信息學(xué)院

經(jīng)典案例一——囚徒困境-8,-80,-15-15,0-1,-1囚徒A囚徒B坦白抵賴坦白抵賴-8大于-150大于-1-8大于-150大于-1抵賴是A的嚴(yán)格劣戰(zhàn)略抵賴是B的嚴(yán)格劣戰(zhàn)略則該博弈有嚴(yán)劣策略剔除法的策略組合為(坦白,坦白).2023/7/2722中南財(cái)經(jīng)政法大學(xué)信息學(xué)院1,01,20,30,1M列先生行先生UDL0,12,0R行:沒有占優(yōu)戰(zhàn)略列:M嚴(yán)格優(yōu)于R剔除R行:u優(yōu)于D列:無占優(yōu)戰(zhàn)略剔除DM優(yōu)于L(U,M)是重復(fù)剔除的占優(yōu)均衡例4:.2023/7/2723中南財(cái)經(jīng)政法大學(xué)信息學(xué)院一般定義:若博弈G中每個(gè)博弈方都反復(fù)去掉嚴(yán)劣策略后剩下唯一策略組合s*=(s1*,s2*,…,sn*),則稱s*=(s1*,s2*,…,sn*)為G的嚴(yán)劣策略的剔除法求得的均衡。求解嚴(yán)劣策略的剔除法的方法成為嚴(yán)劣策略反復(fù)消去法(結(jié)果為——重復(fù)剔除的占優(yōu)均衡)。注意一:嚴(yán)劣策略反復(fù)消去法中每次消去的必須是嚴(yán)格劣的策略,否則會(huì)出現(xiàn)一些意想不到的結(jié)果。.2023/7/2724中南財(cái)經(jīng)政法大學(xué)信息學(xué)院例5:博弈G如下圖:1,81,62,80,80,80,91,50,80,6博弈方ⅡLMR.2023/7/2725中南財(cái)經(jīng)政法大學(xué)信息學(xué)院

解:方法1)博弈方Ⅱ的策略“L”和“M”都是策略“R”的下策(是嚴(yán)格下策),消去策略“L”和“M”后為:0,90,81,8

R

博弈方Ⅰ的策略“S”和“D”都是策略“U”的嚴(yán)格下策,消去策略“S”和“D”后剩下唯一策略組合(U,R)。2,81,61,80,80,60,80,81,50,9.2023/7/2726中南財(cái)經(jīng)政法大學(xué)信息學(xué)院

方法2)博弈方Ⅰ的策略“S”和“D”都是策略“U”的下策(是嚴(yán)格下策),消去策略“S”和“D”后為:1,81,62,8LMRU

博弈方Ⅱ的策略“M”和“R”都是策略“L”的下策(但不是嚴(yán)格下策),消去策略“M”和“R”后剩下策略組合(U,L)。同時(shí),策略“L”和“M”都是策略“R”的下策,消去策略“L”和“M”后剩下策略組合(U,R)。

由上例可以看出:如果不是按反復(fù)消去嚴(yán)格下策,最后將得到不同的策略組合。.2023/7/2727中南財(cái)經(jīng)政法大學(xué)信息學(xué)院重復(fù)剔除的占優(yōu)均衡的理解策略組合稱為重復(fù)剔除的占優(yōu)均衡,如果它是重復(fù)剔除劣策略后剩下的唯一策略組合。如果這種唯一策略組合是存在的,我們就說該博弈是重復(fù)剔除占優(yōu)可解。

注意二:如果重復(fù)剔除后的策略組合不唯一,該博弈就不是重復(fù)剔除占優(yōu)可解的。.2023/7/2728中南財(cái)經(jīng)政法大學(xué)信息學(xué)院注意三:1、重復(fù)剔除的占優(yōu)均衡結(jié)果與劣策略的剔除順序是否有關(guān)取決于剔除的是否是嚴(yán)格劣策略。2、重復(fù)剔除的占優(yōu)均衡要求每個(gè)博弈方是理性的,而且要求“理性”是博弈方的共同知識(shí)。即:所有博弈方知道所有博弈方是理性的,所有博弈方知道所有博弈方知道所有參與方是理性的。.2023/7/2729中南財(cái)經(jīng)政法大學(xué)信息學(xué)院2,121,101,120,120,100,110,120,100,13C2R1R2C1C3R3剔除順序:R3、C3、C2、R2,得策略組合(R1,C1)

故一般使用(嚴(yán)格)劣策略剔除,可以看到,(R1,C3)(R1,C1)雖都是剔除占優(yōu)均衡,但在這里是不可解的。剔除順序:C2、R2、C1、R3,得策略組合(R1,C3)例如:.2023/7/2730中南財(cái)經(jīng)政法大學(xué)信息學(xué)院3、盡管許多博弈中重復(fù)剔除的占優(yōu)均衡是一個(gè)合理的預(yù)測,但并不總是如此,尤其是大概得益某些極端值的時(shí)候。8,10-1000,97,66,5博弈方B博弈方AUDLRU是A的最優(yōu)選擇,但是,只要有1/1000的概率B選R,A就會(huì)選D.2023/7/2731中南財(cái)經(jīng)政法大學(xué)信息學(xué)院應(yīng)用案例1——如何以弱敵強(qiáng)

在戰(zhàn)爭史上,以弱勝強(qiáng)的例子是很多的。在商業(yè)競爭中,以弱敵強(qiáng)也是經(jīng)常會(huì)遇到的情形。在二戰(zhàn)中的諾曼底登陸戰(zhàn)的謀略策劃中,盟軍就面臨以弱敵強(qiáng)的問題。盟軍有兩個(gè)可以選擇的登陸目標(biāo)地,一是加萊,二是諾曼底。德國守軍在人數(shù)上超過了盟軍,并且就軍事進(jìn)攻而言,在人數(shù)相同的情況下,攻方與守方相比會(huì)處于不利的情形。.2023/7/2732中南財(cái)經(jīng)政法大學(xué)信息學(xué)院

下面,將這種情形模型化。有一支軍隊(duì)準(zhǔn)備進(jìn)攻一座城市,它有軍力兩個(gè)師。守城軍隊(duì)有三個(gè)師。通往城市有甲、乙兩條道路或方向。兩軍相遇時(shí),人數(shù)居多的一方取勝,當(dāng)兩方人數(shù)相等時(shí),守方獲勝。假定軍隊(duì)只能整師調(diào)動(dòng)。

.2023/7/2733中南財(cái)經(jīng)政法大學(xué)信息學(xué)院

攻方戰(zhàn)略:

a=兩個(gè)師集中沿甲方向進(jìn)攻

b=兵分兩路,一個(gè)師沿甲方向進(jìn)攻,另一個(gè)師沿乙方向進(jìn)攻

c=兩個(gè)師集中沿乙方向進(jìn)攻.2023/7/2734中南財(cái)經(jīng)政法大學(xué)信息學(xué)院

守方戰(zhàn)略:

A=三個(gè)師集中守甲方向

B=兩個(gè)師守甲方向,一個(gè)師守乙方向

C=一個(gè)師守甲方向,兩個(gè)師守乙方向

D=三個(gè)師集中守乙方向.2023/7/2735中南財(cái)經(jīng)政法大學(xué)信息學(xué)院用“+”、“-”,分別表示勝和敗,見下表

守方

ABCDa

進(jìn)攻方bc

表1以弱敵強(qiáng)博弈-,+-,++,-+,-+,--,+-,++,-+,-+,--,+-,+.2023/7/2736中南財(cái)經(jīng)政法大學(xué)信息學(xué)院

用“重復(fù)剔除劣策略”分析:進(jìn)攻方無劣策略,但守方有劣策略,A劣于B,D劣于C,故守方不會(huì)采用策略B和C,剔除后的博弈變?yōu)椋?/p>

守方

BCa

進(jìn)攻方bc

表2守方剔除劣策略后的博弈

-,++,--,+-,++,--,+.2023/7/2737中南財(cái)經(jīng)政法大學(xué)信息學(xué)院

攻方知道守方不會(huì)選A和D,他由此知道博弈變成上圖所示。此時(shí),攻方就有一個(gè)劣策略b,他剔除b后得到新的博弈,見下表:守方

進(jìn)攻方

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論