石頭,剪刀,布三人博弈_第1頁(yè)
石頭,剪刀,布三人博弈_第2頁(yè)
石頭,剪刀,布三人博弈_第3頁(yè)
石頭,剪刀,布三人博弈_第4頁(yè)
石頭,剪刀,布三人博弈_第5頁(yè)
已閱讀5頁(yè),還剩20頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

(一)“石頭,剪刀,布”游戲

(Rock,Scissor,Paper)思考:

雙方應(yīng)該怎么選擇才是最優(yōu)的?

是否存在絕對(duì)致勝的方法?

我們總是在選擇自己的戰(zhàn)略前試圖猜中對(duì)手的行動(dòng)選擇;同時(shí),我們又會(huì)力圖避免自己的選擇被對(duì)方猜中,還要根據(jù)自己對(duì)對(duì)方行動(dòng)的事前預(yù)測(cè)來(lái)做出最優(yōu)的行動(dòng)選擇,即這樣的游戲行動(dòng)選擇帶有隨機(jī)性。(二)著名的“囚徒困境”

(Prisoners’Dilemma)

假設(shè)有兩個(gè)小偷聯(lián)合犯事,私入民宅被警察抓住。警方將兩人分別置于不同的兩個(gè)房間內(nèi)進(jìn)行單獨(dú)審訊,對(duì)每一個(gè)犯罪嫌疑人,警方給出的政策是:如果兩人都認(rèn)罪,則各被判刑8年。如果一人認(rèn)罪,另一人不認(rèn),則認(rèn)罪者立即釋放,不認(rèn)罪者加重判刑至10年。如果兩人都不認(rèn)罪,則警方因證據(jù)不足不能判兩人有罪,但可以因私入民宅的罪名將兩人各判入獄一年。并且,每個(gè)小偷都被告知,他的同伙也面對(duì)著同樣的政策。想想:

他們會(huì)如何選擇,最終的決策結(jié)果會(huì)是什么?分析:

這個(gè)模型有如下要素:1.兩個(gè)小偷必須在不知道對(duì)方的選擇的情況下獨(dú)立進(jìn)行自己的決策2.雙方都會(huì)為自己的利益考慮,即使自己的盈利最大化將雙方的具體選擇和相應(yīng)的結(jié)果描述如下:-8-80-10-100-1-12認(rèn)罪不認(rèn)罪認(rèn)罪1不認(rèn)罪對(duì)1來(lái)說(shuō)無(wú)論2選擇什么,他選擇‘認(rèn)罪’總是最優(yōu)的,根據(jù)對(duì)稱(chēng)性,對(duì)于2,‘認(rèn)罪’也是最優(yōu)的,所以模型的最終選擇結(jié)果是(認(rèn)罪,認(rèn)罪)但是,實(shí)際上,顯然(不認(rèn)罪,不認(rèn)罪)是對(duì)雙方最好的結(jié)果。所以,在個(gè)人理性與集體理性之間存在不一致性。我們假定兩個(gè)小偷都只在乎各自的刑期,且盈利等于刑期的相反數(shù)博弈與決策:

博弈是建立在相互猜測(cè)對(duì)方的決策過(guò)程基礎(chǔ)上的決策,即是“互動(dòng)性”的決策。

博弈論是建立在理性人的假設(shè)基礎(chǔ)之上(理性人一般是指主體所追求的唯一目標(biāo)是自身經(jīng)濟(jì)利益的最大化),

博弈論考慮游戲中的個(gè)體的預(yù)測(cè)行為和實(shí)際行為,并研究它們的優(yōu)化策略,被廣泛應(yīng)用到經(jīng)濟(jì)活動(dòng)和其他社會(huì)科學(xué)領(lǐng)域當(dāng)中。上述兩個(gè)例子,其實(shí)都可以被描述為一局博弈,而且都是二人博弈(只有兩個(gè)參與者),其中隱含了時(shí)間的動(dòng)態(tài)性質(zhì),被稱(chēng)為靜態(tài)戰(zhàn)略式博弈。下面我們給出博弈模型的戰(zhàn)略式數(shù)學(xué)描述GameTheory

局中人(Players):可以是個(gè)人也可以是團(tuán)體、組織等,在博弈論中假定局中人是理性人。行動(dòng)空間(Actionspace):每個(gè)局中人都有一行動(dòng)集,而每個(gè)人在自己的行動(dòng)集當(dāng)中的選擇所構(gòu)成的一組策略,被稱(chēng)為行動(dòng)空間,即上述

A。盈利函數(shù)(效用函數(shù)Payofffunction):指局中人從博弈中獲得的效用水平,大多是數(shù)值型的,來(lái)表示自己在一局博弈當(dāng)中的盈利。顯然,它是A的函數(shù),并且滿(mǎn)足線性變換。(

Rock,Scissor,Paper)

001-1-11-11001-11-1-11002石頭剪刀布

石頭剪刀布(Rock,Scissor,Paper)

顯然,從支付矩陣上看,不存在一個(gè)對(duì)雙方都是最優(yōu)的決策,但是無(wú)論雙方的選擇是什么,各自的效用函數(shù)之和總是為零。這樣的博弈稱(chēng)為二人零和博弈那么我們?cè)趺催x擇才能使自己的盈利最大呢?既然,局中人的行動(dòng)具有隨機(jī)性,我們對(duì)每一行動(dòng)選擇賦予概率,組成該博弈的混合戰(zhàn)略。

局中人1希望最大化自己的期望效用,而局中人2希望最小化1的效用(等價(jià)于最大化自己的期望效用,因?yàn)槭橇愫筒┺模?,根?jù)二人零和博弈理論,1和2的決策問(wèn)題變?yōu)椋?/p>

在博弈理論中,納什均衡是一個(gè)非常重要的概念,它表達(dá)了博弈的基本原理,我們簡(jiǎn)單地給出它的定義:

對(duì)二人博弈,用計(jì)算機(jī)求解納什均衡常用的Lemke-Howson算法主要運(yùn)用下述定理:LINGO程序如下:model:sets:k/1..3/:p;n/1..3/:q;pay(k,n):Ma,Mb;endsetsdata:Ma=01-1

-101

1-10;Mb=0-1110-1-110;enddatava=@sum(pay(i,j):Ma(i,j)*p(i)*q(j));vb=@sum(pay(i,j):Mb(i,j)*p(i)*q(j));@for(k(i):@sum(n(j):Ma(i,j)*q(j))<=va);@for(n(j):@sum(k(i):Mb(i,j)*p(i))<=vb);@sum(k:p)=1;@sum(n:q)=1;@free(va);@free(vb);End運(yùn)行結(jié)果:VariableValue

VA0.000000

VB0.000000

P(1)0.3333333

P(2)0.3333333

P(3)0.3333333

Q(1)0.3333333

Q(2)0.3333333

Q(3)0.3333333

1.我們可以這么理解該游戲的混合戰(zhàn)略,當(dāng)每個(gè)人以同等的概率隨機(jī)的選擇時(shí),他們認(rèn)為這三個(gè)行動(dòng)一樣好,即沒(méi)有對(duì)哪個(gè)的偏好,此時(shí)對(duì)于對(duì)方的選擇,你選擇哪一個(gè)行動(dòng)所獲得的期望效用是相同的,所以你選擇哪個(gè)是無(wú)差別的。2.對(duì)于該游戲,我們選取的效用函數(shù)構(gòu)成了零和博弈(Zero-SumGame),但是如果局中人的效用之和不為零,我們不能根據(jù)最小最大定理簡(jiǎn)單地去分析和計(jì)算,但是我們可以根據(jù)納什均衡的定義去求解。我現(xiàn)在要求是三個(gè)人玩呢?(”Rock,Scissor,Paper”forthreepeople)拆分成三個(gè)二維矩陣:對(duì)于某一局中人1有23石頭剪刀布石頭0,0,01,1,-1-1,-1,1剪刀1,-1,11,-1,-10,0,0布-1,1,-10,0,0-1,1,1石頭:23石頭剪刀布石頭-1,1,1-1,1,-10,0,0剪刀-1,-1,10,0,01,1,-1布0,0,01,-1,11,-1,-1剪刀:23石頭剪刀布石頭1,-1,-10,0,01,-1,1剪刀0,0,0-1,1,1-1,1,-1布1,1,-1-1,-1,10,0,0布:

進(jìn)一步分析:局中人的選擇和盈利是對(duì)稱(chēng)的,所以我們考慮的局中人1怎么選讓自己的盈利最大,對(duì)于2和3

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論