博弈論幾個(gè)經(jīng)典模型_第1頁(yè)
博弈論幾個(gè)經(jīng)典模型_第2頁(yè)
博弈論幾個(gè)經(jīng)典模型_第3頁(yè)
博弈論幾個(gè)經(jīng)典模型_第4頁(yè)
博弈論幾個(gè)經(jīng)典模型_第5頁(yè)
已閱讀5頁(yè),還剩26頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、關(guān)于博弈論的幾個(gè)經(jīng)典模型第一張,PPT共三十一頁(yè),創(chuàng)作于2022年6月引 言 博弈論又被稱為對(duì)策論(Game Theory),及研究互動(dòng)決策的理論。 互動(dòng)決策:即各行動(dòng)方(即局內(nèi)人player)的決策是相互影響的,每個(gè)人在決策的時(shí)候必須將他人的決策納入自己的決策考慮之中,當(dāng)然也需要把別人對(duì)于自己的考慮也要納入考慮之中在如此迭代考慮情形進(jìn)行決策,選擇最有利于自己的戰(zhàn)略(strategy)。 第二張,PPT共三十一頁(yè),創(chuàng)作于2022年6月 博弈:game,即是人們遵循一定規(guī)則下的活 動(dòng),參與人的目的是“贏”。進(jìn)行g(shù)ame的人是很認(rèn)真的,不同于漢語(yǔ)中游戲的概念。 博弈論/對(duì)策論:game theor

2、y 奧林匹克運(yùn)動(dòng)會(huì):Olympic Games。 引 言第三張,PPT共三十一頁(yè),創(chuàng)作于2022年6月博弈論研究的對(duì)象:是理性人或參與者如何選擇策略或如何作出行動(dòng)的決定。理性不一定道德?;拘g(shù)語(yǔ)第四張,PPT共三十一頁(yè),創(chuàng)作于2022年6月 豬圈里有兩只豬,一只比較大,一只比較小。豬圈狹長(zhǎng),豬食槽在一頭,豬食按鈕在另一頭,按一下會(huì)有10個(gè)單位的豬食落進(jìn)槽里。由于按鈕和食槽距離較遠(yuǎn),按按鈕的體力耗費(fèi)相當(dāng)于2個(gè)單位的食物。若大豬先到槽邊,大小豬吃到食物的收益比是9:1;同時(shí)到槽邊,收益比是7:3;小豬先到槽邊,收益比是6:4。 模型一、智豬博弈/完全信息靜態(tài)博弈 小豬大豬按不按(等待)按(5,1)

3、(4,4)不按(等待)(9,-1)(0,0)第五張,PPT共三十一頁(yè),創(chuàng)作于2022年6月選擇等待是小豬的占優(yōu)策略。大豬的最佳選擇取決于小豬的行動(dòng),如果小豬去按,大豬最好選擇等待;如果小豬不去按,則最佳選擇是大豬親自去按。也就是說(shuō),在智豬博弈中,大豬沒(méi)有占優(yōu)策略,而小豬有占優(yōu)策略,它的最佳選擇就是耐心等待大豬去按鈕,才能獲得最佳結(jié)果?!靶∝i躺著大豬跑”的現(xiàn)象是由于故事中的游戲規(guī)則所導(dǎo)致的。規(guī)則的核心指標(biāo)是:每次落下的事物數(shù)量和踏板與投食口之間的距離。 模型一、智豬博弈/完全信息靜態(tài)博弈第六張,PPT共三十一頁(yè),創(chuàng)作于2022年6月如果改變一下核心指標(biāo),豬圈里還會(huì)出現(xiàn)同樣的“小豬躺著大豬跑”的景

4、象嗎?試試看。改變方案一:減量方案。改變方案二:增量方案。改變方案三:減量加移位方案。投食僅原來(lái)的一半分量,但同時(shí)將投食口移到踏板附近。結(jié)果呢,小豬和大豬都在拼命地?fù)屩忍ぐ?。等待者不得?而多勞者多得。每次的收獲剛好消費(fèi)完。 對(duì)于游戲設(shè)計(jì)者,這是一個(gè)最好的方案。成本不高,但收獲最大。 模型一、智豬博弈/完全信息靜態(tài)博弈第七張,PPT共三十一頁(yè),創(chuàng)作于2022年6月 有兩個(gè)小偷A(chǔ)和B聯(lián)合犯事、私入民宅被警察抓住。警方將兩人分別置于不同的兩個(gè)房間內(nèi)進(jìn)行審訊,對(duì)每一個(gè)犯罪嫌疑人,警方給出的政策是:如果一個(gè)犯罪嫌疑人坦白了罪行,交出了贓物,于是證據(jù)確鑿,兩人都被判有罪。如果另一個(gè)犯罪嫌疑人也作了坦白

5、,則兩人各被判刑8年;如果另一個(gè)犯罪嫌人沒(méi)有坦白而是抵賴,則以妨礙公務(wù)罪(因已有證據(jù)表明其有罪)再加刑2年,而坦白者有功被減刑8年,立即釋放。如果兩人都抵賴,則警方因證據(jù)不足不能判兩人的偷竊罪,但可以私入民宅的罪名將兩人各判入獄1年。 模型二、囚徒困境/非合作博弈第八張,PPT共三十一頁(yè),創(chuàng)作于2022年6月 不難看出,“坦白”是任一犯罪嫌疑人的占優(yōu)戰(zhàn)略,而(坦白,坦白)是一個(gè)占優(yōu)戰(zhàn)略均衡。模型二、囚徒困境/非合作博弈 乙 甲坦白抵賴坦白(-8,-8)(0,-10)抵賴(-10,0)(-1,-1)第九張,PPT共三十一頁(yè),創(chuàng)作于2022年6月該博弈刻劃了兩大難題:沖突情形下,參與人的目標(biāo)是什么

6、?是采用(作為個(gè)人)他自己的最好策略,還是采用(作為集體的一員)他們共同的最好策略?前者導(dǎo)致均衡策略(坦白,坦白),支付為(-8,-8);后者的最好策略是(抵賴,抵賴),支付為(-1,-1)。這里反映了個(gè)體理性行為與集體理性行為之間的矛盾、沖突。此博弈只進(jìn)行一次還是重復(fù)進(jìn)行?如果博弈只進(jìn)行一次,參與人似乎只有坦白才是最好的策略,因?yàn)闆](méi)有理由相信對(duì)手會(huì)對(duì)你有信心,他總認(rèn)為你自己會(huì)坦白;因此,雙方都采取坦白策略。然而,若博弈進(jìn)行多次,則結(jié)論將會(huì)發(fā)生變化。模型二、囚徒困境/非合作博弈第十張,PPT共三十一頁(yè),創(chuàng)作于2022年6月什么是海薩尼轉(zhuǎn)換? 海薩尼提出了一種處理不完全信息博弈的方法,即引入一個(gè)

7、虛擬的局中人“自然”。自然首先行動(dòng),它決定每個(gè)局中人的特征。每個(gè)局中人知道自己的特征,但不知道別的局中人特征。這種方法將不完全信息靜態(tài)博弈變成一個(gè)兩階段動(dòng)態(tài)博弈,第一個(gè)階段是自然N的行動(dòng)選擇,第二階段是除N外的局中人的靜態(tài)博弈。這種轉(zhuǎn)換被稱為“海薩尼轉(zhuǎn)換”,這個(gè)轉(zhuǎn)換把“不完全信息”轉(zhuǎn)變成為完全但不完美信息,從而可以用分析完全信息博弈的方法進(jìn)行分析。模型三、獨(dú)立私人價(jià)值下的一級(jí)密封拍賣/不完全信息靜態(tài)博弈第十一張,PPT共三十一頁(yè),創(chuàng)作于2022年6月海薩尼轉(zhuǎn)換的具體方法一個(gè)虛擬的參與人“自然”,自然首先決定參與人的類型,賦予各參與人的類型向量 ,其中 ; 自然告知參與者自己的類型,卻不告訴其他

8、參與者的類型; 參與者同時(shí)選擇行動(dòng),每一參與者 從可行集 中選擇行動(dòng)方案 ; 各方得到收益 。 借助于第一步和第二步中虛構(gòu)的參與者“自然”的行動(dòng),我們可以把一個(gè)不完全信息的博弈表述為一個(gè)不完美信息的博弈。模型三、獨(dú)立私人價(jià)值下的一級(jí)密封拍賣/不完全信息靜態(tài)博弈第十二張,PPT共三十一頁(yè),創(chuàng)作于2022年6月海薩尼轉(zhuǎn)換分析 海薩尼轉(zhuǎn)換是處理不完全信息博弈的標(biāo)準(zhǔn)方法。一般地,“自然”在博弈開(kāi)始的時(shí)候選擇參與人的類型,參與人的某個(gè)類型包括表征類型的各個(gè)特征如策略空間、信息集、得益函數(shù)等,這些又稱為該類型參與人所擁有的個(gè)人信息。 不完全信息意味著博弈各方中至少有一個(gè)參與人有多個(gè)類型。 模型三、獨(dú)立私人

9、價(jià)值下的一級(jí)密封拍賣/不完全信息靜態(tài)博弈第十三張,PPT共三十一頁(yè),創(chuàng)作于2022年6月 通過(guò)海薩尼轉(zhuǎn)換,博弈開(kāi)始時(shí),所有參與人有關(guān)“自然”的行動(dòng)有一致的信念,即都知道所有參與人類型的概率分布函數(shù),此即“海薩尼公理”。 模型三、獨(dú)立私人價(jià)值下的一級(jí)密封拍賣/不完全信息靜態(tài)博弈第十四張,PPT共三十一頁(yè),創(chuàng)作于2022年6月 某一市場(chǎng)原來(lái)被A企業(yè)所壟斷?,F(xiàn)在B企業(yè)考慮是否進(jìn)入。B企業(yè)知道,A企業(yè)是否允許它進(jìn)入,取決于A企業(yè)阻撓B企業(yè)進(jìn)入所花費(fèi)的成本。如果阻撓的成本低,那么,正如下表后兩列所表示的,A企業(yè)的占優(yōu)戰(zhàn)略是阻撓,博弈有重復(fù)剔除的占優(yōu)戰(zhàn)略均衡A阻撓,B不進(jìn)入。如果阻撓的成本高,那么,正如下

10、表前兩列所表示的,A企業(yè)的占優(yōu)戰(zhàn)略是默許B進(jìn)入,博弈有重復(fù)剔除的占優(yōu)戰(zhàn)略均衡A默許,B進(jìn)入。B企業(yè)所不知道的,是A企業(yè)的阻撓成本是高是低。這里,某一參與人本人知道、其他參與人則不知道的信息稱為私人信息。某一參與人所擁有的全部私人信息稱為他的類型。在本例中,阻撓成本就是 A的私人信息。高阻撓成本和低阻撓成本則是兩種不同的類型。 模型三、獨(dú)立私人價(jià)值下的一級(jí)密封拍賣/不完全信息靜態(tài)博弈第十五張,PPT共三十一頁(yè),創(chuàng)作于2022年6月海薩尼轉(zhuǎn)換后的市場(chǎng)進(jìn)入博弈: 模型三、獨(dú)立私人價(jià)值下的一級(jí)密封拍賣/不完全信息靜態(tài)博弈 A B高成本低成本默許阻撓默許阻撓進(jìn)入(40,50)(-10,0)(30,100

11、)(-10,140)不進(jìn)入(0,300)(0,300)(0,400)(0,400) 顯然,在這里,B所遇到的,是不確定性條件下的選擇問(wèn)題。因?yàn)锽不僅不知道A的類型 (是高還是低),而且不知道不同類型的分布概率。 第十六張,PPT共三十一頁(yè),創(chuàng)作于2022年6月 按照海薩尼的方法,所有參與人的真實(shí)類型都是給定的。其他參與人雖然不清楚某一參與人的真實(shí)類型,但知道這些可能出現(xiàn)的類型的分布概率,而且這種概率是公共知識(shí)。用本例來(lái)說(shuō),公共知識(shí)不僅意味著B(niǎo)企業(yè)知道A企業(yè)高阻撓成本與低阻撓成本的分布概率,而且意味著A也清楚B知道這一概率。模型三、獨(dú)立私人價(jià)值下的一級(jí)密封拍賣/不完全信息靜態(tài)博弈第十七張,PPT

12、共三十一頁(yè),創(chuàng)作于2022年6月模型三、獨(dú)立私人價(jià)值下的一級(jí)密封拍賣/不完全信息靜態(tài)博弈N低成本高成本ABB(50,40)(300,0)(0,-10)(300,0)(100,30)(400,0)(140,-10)(400,0)ABB默許默許阻撓阻撓進(jìn)入不進(jìn)入進(jìn)入進(jìn)入進(jìn)入不進(jìn)入不進(jìn)入不進(jìn)入*貝葉斯納什均衡 第十八張,PPT共三十一頁(yè),創(chuàng)作于2022年6月斗雞博弈(Chicken Game)其實(shí)是一種誤譯。Chicken在美國(guó)口語(yǔ)中是“懦夫”之意,Chicken Game本應(yīng)譯成懦夫博弈。兩只公雞狹路相逢。結(jié)果有四種可能:兩只公雞對(duì)峙,誰(shuí)也不讓誰(shuí)?;蛘邇烧呦喽?。結(jié)局都一樣兩敗俱傷,這是誰(shuí)也不愿意的

13、。另兩種可能是一退一進(jìn)。但退者有損失、丟面子。雙方都不愿退,也知道對(duì)方不愿退。在這樣的博弈中,要想取勝,就要在氣勢(shì)上壓倒對(duì)方,至少要顯示出破釜沉舟、背水一戰(zhàn)的決心來(lái),以迫使對(duì)方退卻。但到最后的關(guān)鍵時(shí)刻,必有一方要退下來(lái)。模型四、斗雞博弈 (chicken game)第十九張,PPT共三十一頁(yè),創(chuàng)作于2022年6月甲/乙前進(jìn)后退前進(jìn)(-2,-2)(1,-1)后退(-1,1)(-1,-1)上表中的數(shù)字的意思是:兩者如果均選擇“前進(jìn)”,結(jié)果是兩敗俱傷,兩者均獲得-2的支付;如果一方“前進(jìn)”,另外一方“后退”,前進(jìn)者獲得1的支付,贏得了面子,而后退者獲得-1的支付,輸?shù)袅嗣孀?,但沒(méi)有兩者均“前進(jìn)”受到

14、的損失大;兩者均“后退”,兩者均輸?shù)袅嗣孀?,獲得-1的支付。當(dāng)然表中的數(shù)字只是相對(duì)的值。模型四、斗雞博弈 (chicken game)第二十張,PPT共三十一頁(yè),創(chuàng)作于2022年6月斗雞博弈強(qiáng)調(diào)的是,如何在博弈中采用妥協(xié)的方式取得利益。如果雙方都換位思考,它們可以就補(bǔ)償進(jìn)行談判,最后造成以補(bǔ)償換退讓的協(xié)議,問(wèn)題就解決了。模型四、斗雞博弈 (chicken game)第二十一張,PPT共三十一頁(yè),創(chuàng)作于2022年6月光天化日之下的違法行為為什么總能成功? 人類有許多關(guān)于猴子的故事,比如朝三暮四,殺雞給猴看。其實(shí)猴子是沒(méi)有思維的,它們有一定的群體意識(shí),但沒(méi)有社會(huì)意識(shí),人們關(guān)于它們的故事其實(shí)是說(shuō)人自

15、己的。我們這里也講一個(gè)猴子的故事。 在現(xiàn)實(shí)社會(huì)中,竊賊在公共場(chǎng)所比如公共汽車上偷東西時(shí),車上的乘客看到了,但不敢吭聲。沒(méi)有被偷的人想,反正被偷的待宰猴群的結(jié)局人不是我,我反抗了,我得不到任何好處,反而遭到傷害;而不反抗雖不得益,但也不受損,我何必要反抗呢?這就是光天化日之下的偷竊行為為什么總能成功的原因。模型五、信號(hào)博弈/不完全信息動(dòng)態(tài)博弈第二十二張,PPT共三十一頁(yè),創(chuàng)作于2022年6月 竊賊在偷東西時(shí)發(fā)出這樣的信號(hào):如果誰(shuí)反抗,將毆打誰(shuí)。乘客想,竊賊的威脅是可信的:因?yàn)槿绻麄€(gè)別乘客反抗,而竊賊不毆打該乘客的話,就會(huì)有更多的乘客抓竊賊,竊賊將有可能被抓,因此竊賊必然歐打反抗的乘客。 乘客的策

16、略及可能的支付為:反抗,有可能被毆打甚至受傷;不反抗,無(wú)所得也無(wú)所失。 模型五、信號(hào)博弈/不完全信息動(dòng)態(tài)博弈第二十三張,PPT共三十一頁(yè),創(chuàng)作于2022年6月乘客反抗不反抗偷東西竊賊竊賊毆打不毆打乘客:受傷竊賊:可能被抓, 可能逃脫乘客:無(wú)所得, 無(wú)所失竊賊:被抓竊賊毆打不毆打乘客:受傷竊賊:得到贓物乘客:無(wú)所得, 無(wú)所失竊賊:得到贓物第二十四張,PPT共三十一頁(yè),創(chuàng)作于2022年6月 對(duì)于乘客來(lái)說(shuō),竊賊的威脅是可信的,因而乘客的最優(yōu)策略是“不反抗”;而對(duì)于竊賊來(lái)說(shuō),乘客“不反抗”下的“不毆打”策略為最憂。 這一博弈的結(jié)果是,竊賊偷東西時(shí)“乘客不反抗,竊賊不敢打”,這是一“子精煉納什均衡”。

17、這樣一種群體不反抗的結(jié)果將使社會(huì)風(fēng)氣惡化,偷竊之風(fēng)盛行。對(duì)個(gè)體來(lái)說(shuō),雖然這一次被偷的不是你,但下次你被偷的幾率增加了。這使得我們都如同待宰的猴子,我們不知道什么時(shí)候輪到我們自己。這樣,我們每個(gè)人的處境比以前更差。模型五、信號(hào)博弈/不完全信息動(dòng)態(tài)博弈第二十五張,PPT共三十一頁(yè),創(chuàng)作于2022年6月如何從這種困境中擺脫出來(lái)?我們看到,使乘客采取“反抗”策略,而非“不反抗”策略在于加大采取“反抗”策略的獲益,而減少不反抗的獲益。當(dāng)“反抗”策略下的獲益大于“不反抗”策略下的獲益時(shí),乘客就會(huì)采取“反抗”的策略。 加大道德宣傳,培養(yǎng)人的道德感可以解決這個(gè)囚徒困境。模型五、信號(hào)博弈/不完全信息動(dòng)態(tài)博弈第二

18、十六張,PPT共三十一頁(yè),創(chuàng)作于2022年6月乘客反抗不反抗偷東西竊賊竊賊毆打不毆打乘客:受傷,但沒(méi)有 道德滿足感竊賊:可能被抓, 可能逃脫乘客:沒(méi)有受傷 并有道德 滿足感竊賊:被抓竊賊毆打不毆打乘客:受傷,并有 道德恥辱感竊賊:得到贓物乘客:道德恥 辱感竊賊:得到贓物上述博弈過(guò)程為:第二十七張,PPT共三十一頁(yè),創(chuàng)作于2022年6月 這樣,當(dāng)小偷偷東西時(shí),盡管乘客認(rèn)為竊賊的威脅是可信的,但是如果乘客是道德感強(qiáng)的人,那么博弈結(jié)果是“乘客反抗,小偷毆打”,從而小偷有可能被抓住,這也是一“子精煉納什均衡”。 博弈論對(duì)不合作的博弈結(jié)果的預(yù)測(cè)是令人悲哀的。但是,從這個(gè)例子我們看到,道德就是由群體實(shí)施的對(duì)所謂“非道德”的行為進(jìn)行非強(qiáng)制性的懲罰機(jī)制,而法律及實(shí)施法律的國(guó)家的形成與改進(jìn)就是建立一個(gè)對(duì)所謂“違法行為”實(shí)施的中心懲罰機(jī)制。 *精煉貝葉斯納什均衡;混同均衡;分離均衡模型五、信號(hào)博弈/不完全信息動(dòng)態(tài)博弈第二十八張,PPT共

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論