博弈論9p mixed nash equilibrium existence theorem如果沒有純策略最佳應(yīng)對(duì)組合_第1頁
博弈論9p mixed nash equilibrium existence theorem如果沒有純策略最佳應(yīng)對(duì)組合_第2頁
博弈論9p mixed nash equilibrium existence theorem如果沒有純策略最佳應(yīng)對(duì)組合_第3頁
博弈論9p mixed nash equilibrium existence theorem如果沒有純策略最佳應(yīng)對(duì)組合_第4頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

MixedStrategyandNash

參與人參與人參與人參與人11

-11,---1,

參與人

5《論語·9參與人布0,1,0,參與人0,0,1,布1,0,0, )或( ,正

–無論參與人1選擇哪個(gè)純策略,參與人2

策略均衡不存在1.1.C節(jié)所定義的均衡。

G={S1,····,Sn;u1,····,Sii 動(dòng);例如,在猜硬幣的博弈中,Si包含兩個(gè)純策略:正面與背面。參與人i的一個(gè)混合策略是在其策略空間Si中的(一些或

在進(jìn)行觀察或試驗(yàn)前,我們不能一個(gè)具體的會(huì)出現(xiàn)。我們可以判斷哪些有可能出現(xiàn),并且能預(yù)測每一個(gè)出現(xiàn)的可能性大 樣本空間:Ω={ωω,…,試驗(yàn)中可能出現(xiàn)的所有基本結(jié)果ωi由基本結(jié)果組成,是樣本空間的子集。如果在試驗(yàn) 中的一個(gè)結(jié)果出現(xiàn)了,就 A發(fā)生概率分布就是將總概率P(Ω)=1分解到所有可能的樣本點(diǎn)

參與人參與人q參與人參與人q-1---1舉例S2包含兩個(gè)純策略即正面和,因此參與人2

參與人2的一個(gè)混合策略為概率分布q,r,1-q-rq表示選左的概率,r表示選中的概率,1q–r表示選右的概率。和前面一樣,0<q<1,并且還應(yīng)滿足0<r<1和0<q+r<1?;旌喜呗?式對(duì)于混合策略,樣本空間對(duì)應(yīng)行動(dòng)集合。被某一混合策略賦予非零概率的純策略構(gòu)成該混合策略的支撐集。

1q),其中q為正面朝上的概率,1q率,并且0<q<

混合策略(01)策略類似地混合策略(1,0)是正

參與人左參與人左中右上1,1,0,參與人下0,0,2,圖略(10.0) 一般地,假定參與人i有K個(gè)純策略:Si={si1,…,siK}參與人i的一個(gè)混合策略是一個(gè)概率分布(pi1,…,piK),其中piK表示對(duì)所有k=1,…,K,參與人i選擇策略sik的概率,由于pik是一個(gè)概率,對(duì)所有k=1,…,K,有0≤pik≤1且pi1++piK=1。我們用pi表示Sisi表示Si內(nèi)任意定義對(duì)策略式博弈 ,假設(shè)Si={si1,…,siK}。那么,參與人i的一個(gè)混合策略為概率分布pi=(pi1,…,piK),其中對(duì)所有k=1,…,K,0≤pik≤1,且pi1++piK=1

參與人參與人q-1,參與人參與人q-1,1,-1,--1,例如假設(shè)參與人1相信參與人2會(huì)以q的概率選正面,以1-q的概率選背面;也就是說,1相信2的混合策略是(q,1-q)。稱這種對(duì)局中人行為的看法或推測為信念 何推斷(q,1-q),1的最優(yōu)反應(yīng)是要么是T(當(dāng)q1/2),要么是M(當(dāng)q1/2),但不會(huì)是B,雖然T或M并不嚴(yán)格優(yōu)于B概率選M,則1的期望支付是3/2

參與人L參與人LR1-T3,0,參與人M0,3,B2,2,參與人LR1-T3,參與人LR1-T3,0,參與人M0,3,B1,1,

si的策略”時(shí),混合策略所起的

Figure1.3

參與人qr-1,1,-參與人qr-1,1,-1,--1,支付是(1-2r);給定行關(guān)于列的信念(q1-(1-2r)×q+(2r-1)×(1-記號(hào):對(duì)[0,1]上任意的q,計(jì)算r的最優(yōu)值,用r*(q)表示。那么,當(dāng)(q,1q)時(shí),參與人1的最優(yōu)反應(yīng)記為r*,1r*)。

1q1qr-1,1,-1,--1,行的反應(yīng)策略:(r,1-r求解r*(q當(dāng)列的混合策略為(q,1-q)時(shí),行選擇(r,1-r)(1-2r)×q+(2r-1)×(1-q)=(2r–1)(1-r*(q)=argmax4(r-1/2)(1/2-

是(q,1-q)與(r,1-r)

1qr-1,1,-1-1,--1,1qr-1;r1;r?1qr-1;r1;r?(1-1--1;(1-r)?(1--1?(1-r)?(1-r*(q)=argmax4(r-1/2)(1/2-

這里,因?yàn)榇嬖谝粋€(gè)q,使得r*(q)有不止一個(gè)值,我們稱r*(q)對(duì)參與人1的策略(r,1-r),參與人2的最優(yōu)反應(yīng)是(q*(r),1-q*(r)),q*(r)=argmax4(q-1/2)(1/2-列的策略:(q,1-q)行的策略:(r,1-r rr*(q)=argmax4(r-1/2)(1/2-1當(dāng)q=1/2時(shí),行的期望支付4(r-1/2)(1/2-q)與r無關(guān),即“行的所有混合策略1-r都是無差異的”?;蛘哒f,當(dāng)q=1/2時(shí),對(duì)于0到1之間的任何,1-r)都是(q,1-q)的最優(yōu)反應(yīng)。 –如果參與人i的策略是(1/2,1/2),則參與人j的最優(yōu)反應(yīng)是(1/2,1/2)圖1

混合策 均衡:兩人博定義.在兩個(gè)參與人策略式博弈G={S1,S2;u1u2}中,混合策略(p*,p*)是均衡的充要條件為:每一參與人的混

–(Opera,Opera)和(Fight,Fight)都

r,1-r)=(2/3,1/3)和(q,1-q)=(1/3,2/3)是一個(gè)納qr2,0,0,1,參 ––(O,F(xiàn))與(F,O)發(fā)生2/9=2222%JohnNash,“Equilibriumpointsingames,”oftheNationalAcademyofSciences,36(1950),48-在一個(gè)n人策略式博弈中,如果參與人的數(shù)量以及

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論