版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
(一)“石頭,剪刀,布”游戲
(Rock,Scissor,Paper)思考:
雙方應(yīng)該怎么選擇才是最優(yōu)的?
是否存在絕對(duì)致勝的方法?
我們總是在選擇自己的戰(zhàn)略前試圖猜中對(duì)手的行動(dòng)選擇;同時(shí),我們又會(huì)力圖避免自己的選擇被對(duì)方猜中,還要根據(jù)自己對(duì)對(duì)方行動(dòng)的事前預(yù)測(cè)來(lái)做出最優(yōu)的行動(dòng)選擇,即這樣的游戲行動(dòng)選擇帶有隨機(jī)性。(二)著名的“囚徒困境”
(Prisoners’Dilemma)
假設(shè)有兩個(gè)小偷聯(lián)合犯事,私入民宅被警察抓住。警方將兩人分別置于不同的兩個(gè)房間內(nèi)進(jìn)行單獨(dú)審訊,對(duì)每一個(gè)犯罪嫌疑人,警方給出的政策是:如果兩人都認(rèn)罪,則各被判刑8年。如果一人認(rèn)罪,另一人不認(rèn),則認(rèn)罪者立即釋放,不認(rèn)罪者加重判刑至10年。如果兩人都不認(rèn)罪,則警方因證據(jù)不足不能判兩人有罪,但可以因私入民宅的罪名將兩人各判入獄一年。并且,每個(gè)小偷都被告知,他的同伙也面對(duì)著同樣的政策。想想:
他們會(huì)如何選擇,最終的決策結(jié)果會(huì)是什么?分析:
這個(gè)模型有如下要素:1.兩個(gè)小偷必須在不知道對(duì)方的選擇的情況下獨(dú)立進(jìn)行自己的決策2.雙方都會(huì)為自己的利益考慮,即使自己的盈利最大化將雙方的具體選擇和相應(yīng)的結(jié)果描述如下:-8-80-10-100-1-12認(rèn)罪不認(rèn)罪認(rèn)罪1不認(rèn)罪對(duì)1來(lái)說(shuō)無(wú)論2選擇什么,他選擇‘認(rèn)罪’總是最優(yōu)的,根據(jù)對(duì)稱(chēng)性,對(duì)于2,‘認(rèn)罪’也是最優(yōu)的,所以模型的最終選擇結(jié)果是(認(rèn)罪,認(rèn)罪)但是,實(shí)際上,顯然(不認(rèn)罪,不認(rèn)罪)是對(duì)雙方最好的結(jié)果。所以,在個(gè)人理性與集體理性之間存在不一致性。我們假定兩個(gè)小偷都只在乎各自的刑期,且盈利等于刑期的相反數(shù)博弈與決策:
博弈是建立在相互猜測(cè)對(duì)方的決策過(guò)程基礎(chǔ)上的決策,即是“互動(dòng)性”的決策。
博弈論是建立在理性人的假設(shè)基礎(chǔ)之上(理性人一般是指主體所追求的唯一目標(biāo)是自身經(jīng)濟(jì)利益的最大化),
博弈論考慮游戲中的個(gè)體的預(yù)測(cè)行為和實(shí)際行為,并研究它們的優(yōu)化策略,被廣泛應(yīng)用到經(jīng)濟(jì)活動(dòng)和其他社會(huì)科學(xué)領(lǐng)域當(dāng)中。上述兩個(gè)例子,其實(shí)都可以被描述為一局博弈,而且都是二人博弈(只有兩個(gè)參與者),其中隱含了時(shí)間的動(dòng)態(tài)性質(zhì),被稱(chēng)為靜態(tài)戰(zhàn)略式博弈。下面我們給出博弈模型的戰(zhàn)略式數(shù)學(xué)描述GameTheory
局中人(Players):可以是個(gè)人也可以是團(tuán)體、組織等,在博弈論中假定局中人是理性人。行動(dòng)空間(Actionspace):每個(gè)局中人都有一行動(dòng)集,而每個(gè)人在自己的行動(dòng)集當(dāng)中的選擇所構(gòu)成的一組策略,被稱(chēng)為行動(dòng)空間,即上述
A。盈利函數(shù)(效用函數(shù)Payofffunction):指局中人從博弈中獲得的效用水平,大多是數(shù)值型的,來(lái)表示自己在一局博弈當(dāng)中的盈利。顯然,它是A的函數(shù),并且滿(mǎn)足線性變換。(
Rock,Scissor,Paper)
001-1-11-11001-11-1-11002石頭剪刀布
石頭剪刀布(Rock,Scissor,Paper)
顯然,從支付矩陣上看,不存在一個(gè)對(duì)雙方都是最優(yōu)的決策,但是無(wú)論雙方的選擇是什么,各自的效用函數(shù)之和總是為零。這樣的博弈稱(chēng)為二人零和博弈那么我們?cè)趺催x擇才能使自己的盈利最大呢?既然,局中人的行動(dòng)具有隨機(jī)性,我們對(duì)每一行動(dòng)選擇賦予概率,組成該博弈的混合戰(zhàn)略。
局中人1希望最大化自己的期望效用,而局中人2希望最小化1的效用(等價(jià)于最大化自己的期望效用,因?yàn)槭橇愫筒┺模?,根?jù)二人零和博弈理論,1和2的決策問(wèn)題變?yōu)椋?/p>
在博弈理論中,納什均衡是一個(gè)非常重要的概念,它表達(dá)了博弈的基本原理,我們簡(jiǎn)單地給出它的定義:
對(duì)二人博弈,用計(jì)算機(jī)求解納什均衡常用的Lemke-Howson算法主要運(yùn)用下述定理:LINGO程序如下:model:sets:k/1..3/:p;n/1..3/:q;pay(k,n):Ma,Mb;endsetsdata:Ma=01-1
-101
1-10;Mb=0-1110-1-110;enddatava=@sum(pay(i,j):Ma(i,j)*p(i)*q(j));vb=@sum(pay(i,j):Mb(i,j)*p(i)*q(j));@for(k(i):@sum(n(j):Ma(i,j)*q(j))<=va);@for(n(j):@sum(k(i):Mb(i,j)*p(i))<=vb);@sum(k:p)=1;@sum(n:q)=1;@free(va);@free(vb);End運(yùn)行結(jié)果:VariableValue
VA0.000000
VB0.000000
P(1)0.3333333
P(2)0.3333333
P(3)0.3333333
Q(1)0.3333333
Q(2)0.3333333
Q(3)0.3333333
1.我們可以這么理解該游戲的混合戰(zhàn)略,當(dāng)每個(gè)人以同等的概率隨機(jī)的選擇時(shí),他們認(rèn)為這三個(gè)行動(dòng)一樣好,即沒(méi)有對(duì)哪個(gè)的偏好,此時(shí)對(duì)于對(duì)方的選擇,你選擇哪一個(gè)行動(dòng)所獲得的期望效用是相同的,所以你選擇哪個(gè)是無(wú)差別的。2.對(duì)于該游戲,我們選取的效用函數(shù)構(gòu)成了零和博弈(Zero-SumGame),但是如果局中人的效用之和不為零,我們不能根據(jù)最小最大定理簡(jiǎn)單地去分析和計(jì)算,但是我們可以根據(jù)納什均衡的定義去求解。我現(xiàn)在要求是三個(gè)人玩呢?(”Rock,Scissor,Paper”forthreepeople)拆分成三個(gè)二維矩陣:對(duì)于某一局中人1有23石頭剪刀布石頭0,0,01,1,-1-1,-1,1剪刀1,-1,11,-1,-10,0,0布-1,1,-10,0,0-1,1,1石頭:23石頭剪刀布石頭-1,1,1-1,1,-10,0,0剪刀-1,-1,10,0,01,1,-1布0,0,01,-1,11,-1,-1剪刀:23石頭剪刀布石頭1,-1,-10,0,01,-1,1剪刀0,0,0-1,1,1-1,1,-1布1,1,-1-1,-1,10,0,0布:
進(jìn)一步分析:局中人的選擇和盈利是對(duì)稱(chēng)的,所以我們考慮的局中人1怎么選讓自己的盈利最大,對(duì)于2和3
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 未成年人思想道德教育的工作計(jì)劃
- 工作總結(jié)及計(jì)劃范文
- 2025教師校本研修工作計(jì)劃范文
- 暑期校本培訓(xùn)計(jì)劃
- 2025應(yīng)急預(yù)案演練計(jì)劃
- 下半年教科研工作計(jì)劃
- 監(jiān)理年度工作計(jì)劃集錦
- 《正弦電壓電流》課件
- 土地承包合同糾紛辯論詞
- 航空運(yùn)輸合同的法律關(guān)系
- 支氣管動(dòng)脈造影護(hù)理
- 2024年度建筑工程有限公司股權(quán)轉(zhuǎn)讓合同3篇
- 校園春季安全
- 2024-2025學(xué)年度上學(xué)期九年級(jí)十二月聯(lián)考英語(yǔ)試卷
- 2024-2025學(xué)年六上科學(xué)期末綜合檢測(cè)卷(含答案)
- 2024年債權(quán)投資協(xié)議6篇
- 【MOOC】工程力學(xué)-浙江大學(xué) 中國(guó)大學(xué)慕課MOOC答案
- 2024-2025學(xué)年北師大版八年級(jí)數(shù)學(xué)上冊(cè)期末綜合測(cè)試卷(含答案)
- 2024廣州租房合同范本
- 菏澤學(xué)院中外教育史(高起專(zhuān))復(fù)習(xí)題
- 分?jǐn)?shù)的初步認(rèn)識(shí)(單元測(cè)試)-2024-2025學(xué)年三年級(jí)上冊(cè)數(shù)學(xué)期末復(fù)習(xí) 人教版
評(píng)論
0/150
提交評(píng)論