石頭,剪刀,布三人博弈

上傳人：0*** IP屬地：湖北上傳時(shí)間：2023-02-03 格式：PPTX 頁(yè)數(shù)：25 大小：907.05KB 積分：28 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩20頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶(hù)提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

（一）“石頭，剪刀，布”游戲

（Rock,Scissor,Paper）思考：

雙方應(yīng)該怎么選擇才是最優(yōu)的？

是否存在絕對(duì)致勝的方法？

我們總是在選擇自己的戰(zhàn)略前試圖猜中對(duì)手的行動(dòng)選擇；同時(shí)，我們又會(huì)力圖避免自己的選擇被對(duì)方猜中，還要根據(jù)自己對(duì)對(duì)方行動(dòng)的事前預(yù)測(cè)來(lái)做出最優(yōu)的行動(dòng)選擇，即這樣的游戲行動(dòng)選擇帶有隨機(jī)性。（二）著名的“囚徒困境”

（Prisoners’Dilemma）

假設(shè)有兩個(gè)小偷聯(lián)合犯事，私入民宅被警察抓住。警方將兩人分別置于不同的兩個(gè)房間內(nèi)進(jìn)行單獨(dú)審訊，對(duì)每一個(gè)犯罪嫌疑人，警方給出的政策是：如果兩人都認(rèn)罪，則各被判刑8年。如果一人認(rèn)罪，另一人不認(rèn)，則認(rèn)罪者立即釋放，不認(rèn)罪者加重判刑至10年。如果兩人都不認(rèn)罪，則警方因證據(jù)不足不能判兩人有罪，但可以因私入民宅的罪名將兩人各判入獄一年。并且，每個(gè)小偷都被告知，他的同伙也面對(duì)著同樣的政策。想想:

他們會(huì)如何選擇，最終的決策結(jié)果會(huì)是什么？分析：

這個(gè)模型有如下要素：1.兩個(gè)小偷必須在不知道對(duì)方的選擇的情況下獨(dú)立進(jìn)行自己的決策2.雙方都會(huì)為自己的利益考慮，即使自己的盈利最大化將雙方的具體選擇和相應(yīng)的結(jié)果描述如下：-8-80-10-100-1-12認(rèn)罪不認(rèn)罪認(rèn)罪1不認(rèn)罪對(duì)1來(lái)說(shuō)無(wú)論2選擇什么，他選擇‘認(rèn)罪’總是最優(yōu)的，根據(jù)對(duì)稱(chēng)性，對(duì)于2，‘認(rèn)罪’也是最優(yōu)的，所以模型的最終選擇結(jié)果是（認(rèn)罪，認(rèn)罪）但是，實(shí)際上，顯然（不認(rèn)罪，不認(rèn)罪）是對(duì)雙方最好的結(jié)果。所以，在個(gè)人理性與集體理性之間存在不一致性。我們假定兩個(gè)小偷都只在乎各自的刑期，且盈利等于刑期的相反數(shù)博弈與決策：

博弈是建立在相互猜測(cè)對(duì)方的決策過(guò)程基礎(chǔ)上的決策，即是“互動(dòng)性”的決策。

博弈論是建立在理性人的假設(shè)基礎(chǔ)之上（理性人一般是指主體所追求的唯一目標(biāo)是自身經(jīng)濟(jì)利益的最大化），

博弈論考慮游戲中的個(gè)體的預(yù)測(cè)行為和實(shí)際行為，并研究它們的優(yōu)化策略，被廣泛應(yīng)用到經(jīng)濟(jì)活動(dòng)和其他社會(huì)科學(xué)領(lǐng)域當(dāng)中。上述兩個(gè)例子，其實(shí)都可以被描述為一局博弈，而且都是二人博弈（只有兩個(gè)參與者），其中隱含了時(shí)間的動(dòng)態(tài)性質(zhì)，被稱(chēng)為靜態(tài)戰(zhàn)略式博弈。下面我們給出博弈模型的戰(zhàn)略式數(shù)學(xué)描述GameTheory

局中人（Players）：可以是個(gè)人也可以是團(tuán)體、組織等，在博弈論中假定局中人是理性人。行動(dòng)空間（Actionspace）：每個(gè)局中人都有一行動(dòng)集，而每個(gè)人在自己的行動(dòng)集當(dāng)中的選擇所構(gòu)成的一組策略，被稱(chēng)為行動(dòng)空間，即上述

A。盈利函數(shù)（效用函數(shù)Payofffunction）：指局中人從博弈中獲得的效用水平，大多是數(shù)值型的，來(lái)表示自己在一局博弈當(dāng)中的盈利。顯然，它是A的函數(shù)，并且滿(mǎn)足線性變換。（

Rock,Scissor,Paper）

001-1-11-11001-11-1-11002石頭剪刀布

石頭剪刀布（Rock,Scissor,Paper）

顯然，從支付矩陣上看，不存在一個(gè)對(duì)雙方都是最優(yōu)的決策，但是無(wú)論雙方的選擇是什么，各自的效用函數(shù)之和總是為零。這樣的博弈稱(chēng)為二人零和博弈那么我們?cè)趺催x擇才能使自己的盈利最大呢?既然，局中人的行動(dòng)具有隨機(jī)性,我們對(duì)每一行動(dòng)選擇賦予概率，組成該博弈的混合戰(zhàn)略。

局中人1希望最大化自己的期望效用，而局中人2希望最小化1的效用（等價(jià)于最大化自己的期望效用，因?yàn)槭橇愫筒┺模?，根?jù)二人零和博弈理論，1和2的決策問(wèn)題變?yōu)椋?/p>

在博弈理論中，納什均衡是一個(gè)非常重要的概念，它表達(dá)了博弈的基本原理，我們簡(jiǎn)單地給出它的定義：

對(duì)二人博弈，用計(jì)算機(jī)求解納什均衡常用的Lemke-Howson算法主要運(yùn)用下述定理：LINGO程序如下：model:sets:k/1..3/:p;n/1..3/:q;pay(k,n):Ma,Mb;endsetsdata:Ma=01-1

-101

1-10;Mb=0-1110-1-110;enddatava=@sum(pay(i,j):Ma(i,j)*p(i)*q(j));vb=@sum(pay(i,j):Mb(i,j)*p(i)*q(j));@for(k(i):@sum(n(j):Ma(i,j)*q(j))<=va);@for(n(j):@sum(k(i):Mb(i,j)*p(i))<=vb);@sum(k:p)=1;@sum(n:q)=1;@free(va);@free(vb);End運(yùn)行結(jié)果：VariableValue

VA0.000000

VB0.000000

P(1)0.3333333

P(2)0.3333333

P(3)0.3333333

Q(1)0.3333333

Q(2)0.3333333

Q(3)0.3333333

1.我們可以這么理解該游戲的混合戰(zhàn)略，當(dāng)每個(gè)人以同等的概率隨機(jī)的選擇時(shí)，他們認(rèn)為這三個(gè)行動(dòng)一樣好，即沒(méi)有對(duì)哪個(gè)的偏好，此時(shí)對(duì)于對(duì)方的選擇，你選擇哪一個(gè)行動(dòng)所獲得的期望效用是相同的，所以你選擇哪個(gè)是無(wú)差別的。2.對(duì)于該游戲，我們選取的效用函數(shù)構(gòu)成了零和博弈（Zero-SumGame），但是如果局中人的效用之和不為零，我們不能根據(jù)最小最大定理簡(jiǎn)單地去分析和計(jì)算，但是我們可以根據(jù)納什均衡的定義去求解。我現(xiàn)在要求是三個(gè)人玩呢？（”Rock,Scissor,Paper”forthreepeople）拆分成三個(gè)二維矩陣：對(duì)于某一局中人1有23石頭剪刀布石頭0,0,01,1,-1-1,-1,1剪刀1,-1,11,-1,-10,0,0布-1,1,-10,0,0-1,1,1石頭：23石頭剪刀布石頭-1,1,1-1,1,-10,0,0剪刀-1,-1,10,0,01,1,-1布0,0,01,-1,11,-1,-1剪刀：23石頭剪刀布石頭1,-1,-10,0,01,-1,1剪刀0,0,0-1,1,1-1,1,-1布1,1,-1-1,-1,10,0,0布：

進(jìn)一步分析：局中人的選擇和盈利是對(duì)稱(chēng)的，所以我們考慮的局中人1怎么選讓自己的盈利最大，對(duì)于2和3

人人文庫(kù)> 全部分類(lèi)> 教育資料 > 輔導(dǎo)培訓(xùn)

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

石頭,剪刀,布三人博弈

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

石頭,剪刀,布三人博弈

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔