第二章策略型博弈_第1頁
第二章策略型博弈_第2頁
第二章策略型博弈_第3頁
第二章策略型博弈_第4頁
第二章策略型博弈_第5頁
已閱讀5頁,還剩69頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

博弈論與信息經(jīng)濟(jì)學(xué)

GameTheoryandInformationEconomics第二部分非協(xié)作博弈實(shí)際第二章戰(zhàn)略型博弈第三章擴(kuò)展型博弈第四章貝葉斯博弈第五章動(dòng)態(tài)貝葉斯博弈

主要內(nèi)容第一節(jié)戰(zhàn)略型博弈的表示第二節(jié)反復(fù)剔除嚴(yán)厲劣戰(zhàn)略平衡第三節(jié)納什平衡第四節(jié)混合戰(zhàn)略納什平衡第五節(jié)納什平衡的存在性第二章戰(zhàn)略型博弈——同時(shí)行動(dòng),如何決策

戰(zhàn)略型(規(guī)范型〕表述——適宜表示靜態(tài)博弈擴(kuò)展型表述——適宜表示動(dòng)態(tài)博弈

博弈有兩種表述方法一、戰(zhàn)略型博弈的含義完全信息靜態(tài)博弈又稱為戰(zhàn)略型博弈。完全信息是指局中人對本人與其他局中人的一切與博弈有關(guān)的事前信息〔戰(zhàn)略空間、支付函數(shù)等〕有充分的了解(局中人的支付函數(shù)是共同知識)。靜態(tài)博弈是指在博弈中,局中人同時(shí)采取行動(dòng),或者局中人的行動(dòng)有先有后,但后行動(dòng)者不能知道先行動(dòng)者的行動(dòng)選擇。第一節(jié)戰(zhàn)略型博弈的表示二、戰(zhàn)略型博弈的三個(gè)要素:1、局中人〔Players):1,2,…,n;2、戰(zhàn)略〔Strategies):;3、支付函數(shù)〔Payofffunctions)表示為:第一節(jié)戰(zhàn)略型博弈的表示1、有限博弈:(1)博弈中局中人人數(shù)有限;(2)每個(gè)局中人只需有限個(gè)戰(zhàn)略。2、零和博弈:博弈中局中人所獲支付之和為零,即一方所得為另一方所失。三、兩種特殊博弈類型1、局中人:甲,乙2、策略:{坦率,不坦率}3、支付函數(shù)——支付矩陣〔雙人有限博弈〕每個(gè)位置上第一個(gè)數(shù)字表示局中人1在對應(yīng)的戰(zhàn)略組合中得到的支付,第二個(gè)數(shù)字表示局中人2的相應(yīng)所獲支付。例2.1囚徒姿態(tài)及其戰(zhàn)略型表示

(Tucker,1950)

乙甲坦白不坦白坦白-6,-6-1,-8不坦白-8,-1-2,-2囚徒姿態(tài)的支付矩陣

乙甲石頭剪刀布石頭0,01,-1-1,1剪刀-1,10,01,-1布1,-1-1,10,1例2.2石頭、剪刀、布的支付矩陣

田忌齊王上中下上下中中上下中下上下上中下中上上中下3,-31,-11,-11,-1-1,11,-1上下中1,-13,-31,-11,-11,-1-1,1中上下1,-1-1,13,-31,-11,-11,-1中下上-1,11,-11,-13,-31,-11,-1下上中1,-11,-11,-1-1,13,-31,-1下中上1,-11,-1-1,11,-11,-13,-3例2.3田忌賽馬的支付矩陣

局中人:男,女策略:男:看足球,看芭蕾女:看足球,看芭蕾支付矩陣:見下一頁

例2.4性別大戰(zhàn)〔battleofthesexes)

女男足球芭蕾足球3,21,1芭蕾-1,-12,3性別大戰(zhàn)的支付矩陣一、根本思想:假設(shè)一個(gè)局中人在任何情況下從某種戰(zhàn)略中得到的支付均小于從另一種戰(zhàn)略中得到的支付,那么顯然對他而言,前一種戰(zhàn)略劣于后一種戰(zhàn)略。從個(gè)人利益出發(fā),被剔除的戰(zhàn)略不會(huì)被局中人采用。從而可以利用剔除嚴(yán)厲劣戰(zhàn)略的概念來簡化博弈局勢,能夠會(huì)得到博弈的解。第二節(jié)反復(fù)剔除嚴(yán)厲劣戰(zhàn)略平衡,假設(shè)存在,對于一切的都有且其中至少有一個(gè)為嚴(yán)厲不等式,那么稱是第i個(gè)局中人的一個(gè)嚴(yán)厲劣戰(zhàn)略。二、嚴(yán)厲劣戰(zhàn)略的定義1、根據(jù)理性的局中人不會(huì)選擇嚴(yán)厲劣戰(zhàn)略這一原那么,可以經(jīng)過反復(fù)剔除嚴(yán)厲劣戰(zhàn)略的方法對博弈進(jìn)展求解。2、其方法是:對每個(gè)局中人尋覓嚴(yán)厲劣戰(zhàn)略,由于它不會(huì)被局中人選擇實(shí)施,所以找到一種后就可以將其從博弈局勢中剔除,從而得到一種新的縮減后的博弈局勢,對這種新局勢反復(fù)上述過程,直到無法找到新的嚴(yán)厲劣戰(zhàn)略為止。三、反復(fù)剔除嚴(yán)厲劣戰(zhàn)略對局中人甲而言,無論局中人乙采取何種戰(zhàn)略,采用“不坦率〞戰(zhàn)略得到的支付都小于采用“坦率〞戰(zhàn)略。局中人甲的“不坦率〞戰(zhàn)略嚴(yán)厲劣于“坦率〞戰(zhàn)略.“不坦率〞戰(zhàn)略都是一種嚴(yán)厲劣戰(zhàn)略,從而可以剔除。博弈中局中人各自從本身利益出發(fā)的理性選擇〔博弈平衡解〕就是〔坦率,坦率〕。四、囚徒姿態(tài)的解

乙甲坦白不坦白坦白-6,-6-1,-8不坦白-8,-1-2,-2例2.1囚徒姿態(tài)的支付矩陣

甲:“不坦率〞相對于“坦率〞是嚴(yán)厲劣戰(zhàn)略

乙甲坦白不坦白坦白-6,-6-1,-8乙:“不坦率〞相對于“坦率〞是嚴(yán)厲劣戰(zhàn)略

乙甲坦白坦白-6,-6·例2.5利用反復(fù)剔除嚴(yán)厲劣戰(zhàn)略求解

乙甲左中右上1,01,20,1下0,30,12,0·乙:“右〞相對于“中〞是嚴(yán)厲劣戰(zhàn)略

乙甲左中右上1,01,20,1下0,30,12,0·甲:“下〞相對于“上〞是嚴(yán)厲劣戰(zhàn)略

乙甲左中上1,01,2下0,30,1·乙:“左〞相對于“中〞是嚴(yán)厲劣戰(zhàn)略

乙甲左中上1,01,2·反復(fù)剔除嚴(yán)厲劣戰(zhàn)略平衡是(上,中)

乙甲中上1,21、每一步剔除需求局中人間相互了解的更進(jìn)一步假定,假設(shè)我們把這一過程運(yùn)用到恣意多步,需求假定“局中人是理性的〞是共同知識。2、這一方法對博弈結(jié)果的預(yù)測經(jīng)常是不準(zhǔn)確的.五、反復(fù)剔除嚴(yán)厲劣戰(zhàn)略有兩個(gè)缺陷

乙甲石頭剪刀布石頭0,01,-1-1,1剪刀-1,10,01,-1布1,-1-1,10,0例2.2石頭、剪刀、布的支付矩陣

利用反復(fù)剔除嚴(yán)厲劣戰(zhàn)略無法求解例2.6利用反復(fù)剔除嚴(yán)厲劣戰(zhàn)略無法求解

乙甲左中右上0,44,05,3中4,00,45,3下3,53,56,6大多數(shù)的博弈局勢中運(yùn)用剔除嚴(yán)厲劣戰(zhàn)略的方法可以對博弈局勢進(jìn)展簡化,但能夠得不到博弈的平衡解。需求引入非協(xié)作博弈實(shí)際中的中心概念——納什平衡(NashEquilibrium)。六、留意一、納什平衡的思想“雙贏〞或“多贏〞第三節(jié)納什平衡它是關(guān)于博弈結(jié)局的一致性預(yù)測假設(shè)一切局中人預(yù)測一個(gè)特定的納什平衡會(huì)出現(xiàn),那么這種平衡就會(huì)出現(xiàn)。只需納什平衡才干使每個(gè)局中人均認(rèn)可這種結(jié)局,而且他們均知道其他局中人也認(rèn)可這種結(jié)局。二、納什平衡的意義1、博弈的納什平衡是這樣一種最優(yōu)戰(zhàn)略組合,是一種他好、我好大家都好的理性結(jié)局,其中每一個(gè)局中人均不能也不想一方面改動(dòng)本人的戰(zhàn)略而添加收益,每個(gè)局中人選擇的戰(zhàn)略是對其他局中人所選戰(zhàn)略的最正確反響。

三、納什平衡的定義2、數(shù)學(xué)定義:在戰(zhàn)略型博弈中,假設(shè)對于每個(gè)局中人i,存在,都有

或那么稱戰(zhàn)略組合是此博弈G的一個(gè)納什平衡。三、納什平衡的定義1、雙人有限博弈:雙劃線法首先對局中人2的每一個(gè)戰(zhàn)略,局中人1尋覓支付最大的戰(zhàn)略,在其對應(yīng)支付下劃線;然后對局中人1進(jìn)展相應(yīng)的步驟;最后,凡是兩個(gè)局中人支付下均被劃線的結(jié)局就是納什平衡。四、納什平衡的求法用雙劃線法可以求出納什平衡:〔坦率,坦率〕,〔-6,-6〕意義:提示個(gè)人理性與集體理性之間的矛盾。例2.1囚徒姿態(tài)的納什平衡

乙甲坦白不坦白坦白-6,-6-1,-8不坦白-8,-1-2,-2

乙甲坦白不坦白坦白-6,-6-1,-8不坦白-8,-1-2,-2

乙甲坦白不坦白坦白-6,-6-1,-8不坦白-8,-1-2,-2局中人:大豬,小豬策略:大豬:按,等待小豬:按,等待支付矩陣:見下一頁納什平衡:〔按,等待〕例2.7智豬博弈〔boxedpigs)

小豬大豬按等待按5,14,4等待9,-10,0例2.7智豬博弈的支付矩陣

小豬大豬按等待按5,14,4等待9,-10,0

小豬大豬按等待按5,14,4等待9,-10,0

女男足球芭蕾足球3,21,1芭蕾-1,-12,3例2.4性別大戰(zhàn)博弈的支付矩陣

女男足球芭蕾足球3,21,1芭蕾-1,-12,3

女男足球芭蕾足球3,21,1芭蕾-1,-12,3局中人:甲,乙策略:甲:放左手,放右手乙:猜左手,猜右手支付矩陣:見下一頁沒有納什平衡例2.8猜左右手游戲

乙甲猜左手猜右手放左手-1,11,-1放右手1,-1-1,1

乙甲猜左手猜右手放左手-1,11,-1放右手1,-1-1,1

乙甲猜左手猜右手放左手-1,11,-1放右手1,-1-1,12、延續(xù)性博弈納什平衡的求法首先求出每個(gè)局中人對其他局中人戰(zhàn)略組合的反響函數(shù)——即在其他局中人戰(zhàn)略組合給定時(shí)極大化本人的支付,得到的最正確反響戰(zhàn)略表現(xiàn)為其他局中人戰(zhàn)略組合的函數(shù);然后將這些反響函數(shù)聯(lián)立求解即得到博弈的納什平衡解。四、納什平衡的求法局中人:廠商1,廠商2策略:廠商1:選擇產(chǎn)量廠商2:選擇產(chǎn)量假設(shè):價(jià)錢支付函數(shù)(利潤函數(shù)):

例2.9兩寡頭產(chǎn)量競爭Cournot〔1838〕模型

Cournot模型求解反響函數(shù):

納什平衡:Cournot模型求解假設(shè)兩寡頭可以串謀,共同確定產(chǎn)量Q使總利潤最大化,利潤函數(shù)為:(Q)=Q(a-Q-c)總利潤最大的產(chǎn)量為:——稱為契約曲線總利潤為:比較及含義:

兩寡頭產(chǎn)量串謀模型Q1

廠商2的反響曲線納什平衡契約曲線廠商1的反響曲線OQ2圖1反響曲線、納什平衡與契約曲線局中人:廠商1,廠商2策略:廠商1選擇價(jià)錢;廠商2選擇價(jià)錢假設(shè):兩寡頭固定本錢都為0,邊沿本錢為常數(shù)c,消費(fèi)者對廠商1和2消費(fèi)產(chǎn)品的需求量分別為:;例2.10兩寡頭價(jià)錢競爭Bertrand〔1883〕模型支付〔利潤〕函數(shù):最優(yōu)化的一階條件是:

Bertrand〔1883〕模型及求解反響函數(shù):

納什平衡價(jià)錢:

Bertrand〔1883〕模型及求解在n個(gè)局中人的戰(zhàn)略型博弈中,1、假設(shè)反復(fù)剔除嚴(yán)厲劣戰(zhàn)略剔除掉除戰(zhàn)略組合s以外的一切戰(zhàn)略,那么這一戰(zhàn)略組合s為該博弈的獨(dú)一的納什平衡。2、假設(shè)戰(zhàn)略組合s是一個(gè)納什平衡,那么它就不會(huì)被反復(fù)剔除嚴(yán)厲劣戰(zhàn)略所剔除。納什平衡是比反復(fù)剔除嚴(yán)厲劣戰(zhàn)略更強(qiáng)的解概念。五、納什平衡與反復(fù)剔除嚴(yán)厲劣戰(zhàn)略平衡一、舉例闡明混合戰(zhàn)略納什平衡例2.8猜左右手游戲第四節(jié)混合戰(zhàn)略納什平衡

乙甲(q)猜左手(1-q)猜右手(p)放左手-1,

11,

-1(1-p)放右手1,

-1-1,

1在甲選,乙選這種戰(zhàn)略時(shí),他們的期望成效分別為:混合戰(zhàn)略與期望成效甲和乙的目的是:最優(yōu)化的一階條件是:

混合戰(zhàn)略納什平衡

混合戰(zhàn)略納什平衡為:

混合戰(zhàn)略納什平衡1、混合戰(zhàn)略〔mixedStrategy)局中人i的一個(gè)混合戰(zhàn)略是在其純戰(zhàn)略空間上的一個(gè)概率分布,其中是i選擇戰(zhàn)略的概率。局中人i的混合戰(zhàn)略空間是他的一切混合戰(zhàn)略構(gòu)成的集合。純戰(zhàn)略可以了解為混合戰(zhàn)略的特例。如等價(jià)于

二、混合戰(zhàn)略納什平衡在混合戰(zhàn)略組合下,局中人i的期望成效函數(shù)為:

其中2、期望成效函數(shù)在戰(zhàn)略型博弈中,假設(shè)對于每個(gè)局中人i,存在,都有

或那么稱是博弈G的一個(gè)混合戰(zhàn)略納什平衡。3、混合戰(zhàn)略納什平衡奇數(shù)定理(Wilson1971):幾乎一切的有限博弈都有奇數(shù)個(gè)納什平衡。4、奇數(shù)定理例2.11社會(huì)保證博弈局中人:政府和下崗工人策略:政府:救援,不救援下崗工人:找任務(wù),不找任務(wù)支付矩陣為:

三、運(yùn)用舉例

工人政府找工作不找救濟(jì)3,2-1,3不救濟(jì)-1,10

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論