第10章-博弈論初步_第1頁
第10章-博弈論初步_第2頁
第10章-博弈論初步_第3頁
第10章-博弈論初步_第4頁
第10章-博弈論初步_第5頁
已閱讀5頁,還剩46頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1第十章博弈論初步2(一)博弈論簡介博弈論(GameTheory)又稱對(duì)策論或游戲論,是一門研究在互動(dòng)關(guān)系的游戲中,參與者選擇策略的科學(xué)。博弈論是研究在策略性環(huán)境中如何進(jìn)行策略性決策和采取策略性行動(dòng)的科學(xué)。。一、

博弈論和策略行為博弈論引例——“囚徒困境”

警察抓住了兩個(gè)合伙犯罪的罪犯,但卻缺乏足夠的證據(jù)指證他們的罪行。如果其中至少一人供認(rèn)犯罪,就能確認(rèn)罪名成立。為了得到所需的口供,警察將這兩名罪犯分別關(guān)押并給他們同樣的選擇機(jī)會(huì):如果他們兩人都拒不認(rèn)罪,則因缺乏證據(jù),他們會(huì)被以較輕的妨礙公務(wù)罪各判2年徒刑;如果他們兩人中有一人坦白認(rèn)罪,則坦白者從輕處理,立即釋放,而另一人則將重判10年徒刑;如果兩人同時(shí)認(rèn)罪,則他們將各判4年徒刑。囚徒2

坦白不坦白坦白-4,-40,-10囚徒1

不坦白-10,0-2,-24案例:田忌賽馬

《史記》:有一天,齊王要田忌與他賽馬,規(guī)定每個(gè)人從自己的上、中、下三等馬中各選出一匹參加比賽;并約定,各方每有一匹馬獲勝可獲黃金千兩,每有一匹馬落敗就要輸?shù)酎S金千兩。

當(dāng)時(shí),齊王每一等次的馬都比田忌的馬跑得快,如果田忌用自己的上等馬與齊王的上等馬比,用自己的中等馬與齊王的中等馬比,用自己的下等馬與齊王的下等馬比,則田忌要輸三次,因而要輸黃金(銅)三千兩。但是比賽結(jié)果出人意料,田忌不但沒有輸,反而贏了一千兩黃金。這是怎么回事呢?5

原來:在賽馬之前,田忌的謀士孫臏給他出主意,讓田忌用自己的下等馬與齊王的上等馬比,用自己的上等馬與齊王的中等馬比,用自己的中等馬與齊王的下等馬比。田忌的下等馬當(dāng)然會(huì)輸,但是上等馬和中等馬都贏了。因而田忌不僅沒有輸?shù)酎S金三千兩,還贏了黃金(銅)一千兩。

在有雙方參加的競賽或競爭中,策略很重要。如果策略適當(dāng),就可能在注定要失敗的情況下取得勝利。

研究這種競賽策略的數(shù)學(xué)分支,叫作博弈論,也叫對(duì)策論;它是運(yùn)籌學(xué)的一部分。

6案例:小乞丐的故事

有一個(gè)小乞丐,對(duì)于路人的施舍,他只接受1美元,而不要10美元。許多人都想見識(shí)一下這個(gè)小傻瓜,拿10美元和1美元給小乞丐,小乞丐總是選擇1美元。好奇的實(shí)驗(yàn)者絡(luò)繹不絕,小乞丐則財(cái)源滾滾。

有人問小乞丐:為什么這么傻,只要1美元,不要10美元?

小乞丐回答說:如果我選擇了10美元,還會(huì)有這么多人來做實(shí)驗(yàn)嗎?最后,讓我們做一個(gè)游戲,來測試一下你的博弈思維能力。要過年了,公司要發(fā)年終獎(jiǎng),作為老板,你論功行賞。你給每位員工一個(gè)信封,并告訴他們:每個(gè)信封里面都有一張撲克牌,如果里面裝著1,就可以去領(lǐng)1000元獎(jiǎng)金,是2則可以領(lǐng)2000元,依此類推,是K就可以領(lǐng)13000元,“小王”可以領(lǐng)15000元,“大王”則是20000元7同時(shí),你還告訴他們:拆開信封后,里面的撲克牌只能自己看,不能告訴別人。如果對(duì)自己的撲克牌(年終獎(jiǎng)數(shù)額)不滿意,大家可以相互自由交換,但交換前還是不能讓對(duì)方知道自己的撲克牌是什么。問題是:會(huì)有多少人能成功與別人交換撲克牌,改變自己的年終獎(jiǎng)數(shù)額?8答案是:一個(gè)都不會(huì)成功。讓我們同樣用“向前展望,倒后推理”的辦法來分析一下這個(gè)博弈:對(duì)于拿到“大王”的人來說(估計(jì)你會(huì)把這張牌給功勞最大的副總經(jīng)理),他有交換和不交換兩種選擇,但他知道沒什么牌比“大王”更大,和誰交換都不合算,因此,不交換是“大王”的占優(yōu)策略。拿到“小王”的人知道,除了“大王”,他和誰交換都不合算,而“大王”又不可能和其他人交換,因此,“小王”的占優(yōu)策略也是不交換。9對(duì)于拿到K的人來說,除了“大王”和“小王”,和其他任何人交換都不合算,而可想而知,“大王”和“小王”肯定不會(huì)出來交換,因此,“K”的占優(yōu)策略也是不交換?!来祟愅?,連拿到2的人也明白,即使拿3的人也肯定不會(huì)出來交換,因此,“2”的占優(yōu)策略也是不交換。最后,敢出來與別人交換年終獎(jiǎng)的肯定是那些拿“1”的人。既然大家的年終獎(jiǎng)都是最少的1000元,還交換它干什么?這種原理,博弈論稱之為“逆向選擇”。10從游戲到博弈博弈就是策略對(duì)抗,或策略有關(guān)鍵作用的游戲博弈Game,博弈論GameTheory,Game即游戲、競技游戲和經(jīng)濟(jì)等決策,具有競爭較量的共同特征:規(guī)則、結(jié)果、策略選擇,策略和利益相互依存,策略的關(guān)鍵作用游戲——下棋、猜大小、石頭剪刀布經(jīng)濟(jì)——寡頭產(chǎn)量決策、市場阻入、投標(biāo)拍賣(新娘拍賣)、股票市場政治——兩黨政治、多黨政治、政黨聯(lián)盟軍事——美國和伊拉克、印巴危機(jī)、以色列和巴勒斯坦、臺(tái)海兩岸(反分裂)娛樂——選美其他——婚姻市場12博弈論的發(fā)展改變了傳統(tǒng)經(jīng)濟(jì)學(xué)的結(jié)構(gòu):1)傳統(tǒng)經(jīng)濟(jì)學(xué)著重研究市場機(jī)制或價(jià)格制度,分析完全競爭市場中的最優(yōu)決策,不考慮決策者之間的相互影響。但是,現(xiàn)實(shí)經(jīng)濟(jì)運(yùn)行中市場是不完全競爭的,行為主體之間的決策是相互影響的2)完全競爭市場是以完全信息為條件的,而現(xiàn)實(shí)經(jīng)濟(jì)運(yùn)行中也難以保證信息完全。在信息不對(duì)稱條件下,考慮行為主體相互影響的非價(jià)格制度可以用博弈論分析。博弈論與最優(yōu)化理論是不同的決策理論。最優(yōu)化理論——單人決策理論;博弈論——多人決策理論。13(二)博弈的基本要素

一個(gè)所謂博弈(Game/游戲)至少需要三個(gè)要素:(1)參與者。就是在博弈中進(jìn)行決策的個(gè)體;博弈分析假定參與者都是理性的。(2)參與人的策略,指的是一項(xiàng)規(guī)則,根據(jù)該規(guī)則,參與人在博弈的每一時(shí)點(diǎn)上選擇如何行動(dòng);(3)支付(或結(jié)果):有可評(píng)價(jià)優(yōu)劣的博弈結(jié)果(效用)。博弈論用數(shù)字表示這類結(jié)果,并稱之為支付(Payoff).02二月2023制作者:張昌廷(河北經(jīng)貿(mào)大學(xué))14博弈的簡單分類根據(jù)參與人的數(shù)量,可以分為二人博弈和多人博弈;根據(jù)參與人的支付情況,可分為零和博弈和非零和博弈;根據(jù)參與人擁有的策略的數(shù)量多少,可分為有限博弈和無限博弈;根據(jù)參與人在實(shí)施策略上是否有時(shí)間的先后,可分為同時(shí)博弈和序貫博弈。博弈樹:序貫博弈例:拋幣游戲。甲乙兩小孩拋硬幣,甲先拋,乙后拋。若硬幣同面,甲贏乙一個(gè)硬幣,如硬幣異面,甲輸乙一個(gè)硬幣。甲正反乙乙正正反反(1,-1)(1,-1)(-1,1)(-1,1)圖10—7競爭者—壟斷者博弈02二月2023制作者:張昌廷(河北經(jīng)貿(mào)大學(xué))1617

支付矩陣(PayoffMatrix,又稱收益矩陣等)描述一個(gè)博弈結(jié)構(gòu)。下面的支付矩陣中,兩個(gè)參與者甲和乙各自可以選擇兩種策略;數(shù)字表示雙方在不同策略選擇組合下得到的支付,較大數(shù)字代表較大利益。

寡頭間的價(jià)格競爭

乙廠商策略合作不合作甲廠商策略合作5,61,5不合作7,12,3甲廠商的條件策略和條件策略組合02二月2023制作者:張昌廷(河北經(jīng)貿(mào)大學(xué))181.博弈均衡的概念

當(dāng)兩個(gè)廠商的條件策略組合恰好相同,從而,兩個(gè)廠商都不再有單獨(dú)改變策略的傾向時(shí),整個(gè)博弈就達(dá)到了均衡,即博弈均衡。博弈均衡是博弈各方最終選取的策略組合,是博弈的最終結(jié)果,是博弈的解。納什均衡02二月2023制作者:張昌廷(河北經(jīng)貿(mào)大學(xué))192.對(duì)納什均衡的理解一是“單獨(dú)改變策略”是指任何一個(gè)參與人在所有其他人都不改變策略的情況下改變自己的策略。其他人也同時(shí)改變策略的情況不在考慮之列。二是“不會(huì)得到好處”是指任何一個(gè)參與人在單獨(dú)改變策略之后自己的支付不會(huì)增加,這包括兩種情況:或者支付減少,或者支付不變。02二月2023制作者:張昌廷(河北經(jīng)貿(mào)大學(xué))201.基本方法先用下劃線法分別表示甲廠商和乙廠商的條件策略,最后確定博弈的均衡(就是找到在兩個(gè)數(shù)字之下都劃線的單元格即可,與這些單元格相對(duì)應(yīng)的策略組合就是所要求的均衡策略組合)。五、尋找納什均衡的方法——條件策略下劃線法02二月2023制作者:張昌廷(河北經(jīng)貿(mào)大學(xué))212.條件策略下劃線方法的五步法第一,把整個(gè)的支付矩陣分解為甲廠商的支付矩陣和乙廠商的支付矩陣五、尋找納什均衡的方法——條件策略下劃線法02二月2023制作者:張昌廷(河北經(jīng)貿(mào)大學(xué))22第十章

博弈論初步

第二節(jié)

同時(shí)博弈:純策略均衡2.條件策略下劃線方法的五步法第二,在甲廠商的支付矩陣中,找出每一列的最大者(每列的最大者可能不只一個(gè)),并在其下劃線五、尋找納什均衡的方法——條件策略下劃線法02二月2023制作者:張昌廷(河北經(jīng)貿(mào)大學(xué))23第十章

博弈論初步

第二節(jié)

同時(shí)博弈:純策略均衡2.條件策略下劃線方法的五步法第三,在乙廠商的支付矩陣中,找出每一行的最大者(每行的最大者也可能不只一個(gè)),并在其下劃線五、尋找納什均衡的方法——條件策略下劃線法02二月2023制作者:張昌廷(河北經(jīng)貿(mào)大學(xué))24第十章

博弈論初步

第二節(jié)

同時(shí)博弈:純策略均衡2.條件策略下劃線方法的五步法第四,將已經(jīng)劃好線的甲廠商的支付矩陣和乙廠商的支付矩陣再合并起來,得到整個(gè)的有下劃線的支付矩陣五、尋找納什均衡的方法——條件策略下劃線法02二月2023制作者:張昌廷(河北經(jīng)貿(mào)大學(xué))25第十章

博弈論初步

第二節(jié)

同時(shí)博弈:純策略均衡2.條件策略下劃線方法的五步法第五,在帶有下劃線的整個(gè)的支付矩陣中,找到兩個(gè)數(shù)字之下均劃有線的支付組合,則由該支付組合代表的策略組合就是均衡的策略組合五、尋找納什均衡的方法——條件策略下劃線法02二月2023制作者:張昌廷(河北經(jīng)貿(mào)大學(xué))263.總結(jié)在一個(gè)單元格中,如果兩個(gè)數(shù)字之下均劃有線,則兩個(gè)參與人都沒有單獨(dú)改變策略的動(dòng)機(jī),因?yàn)檫@兩個(gè)數(shù)字分別是列最大值和行最大值;如果兩個(gè)數(shù)字之下均沒有線,則兩個(gè)參與人都有單獨(dú)改變策略的動(dòng)機(jī),因?yàn)檫@兩個(gè)數(shù)字分別不是列最大值和行最大值;如果兩個(gè)數(shù)字中一個(gè)下面有線一個(gè)下面沒線,則有線的數(shù)字所代表的參與人沒有單獨(dú)改變策略的動(dòng)機(jī),沒線的數(shù)字所代表的參與人有單獨(dú)改變策略的動(dòng)機(jī)。五、尋找納什均衡的方法——條件策略下劃線法27納什均衡的特點(diǎn)(1)納什均衡的存在性:在同時(shí)博弈中,(純策略)納什均衡可能存在,也可能不存在案例1:沒有納什均衡的同時(shí)博弈B廠商策略左右A廠商策略上4,69,1下7,32,828(2)納什均衡的唯一性:如果納什均衡存在,那么,均衡可能是一個(gè),也可能是多個(gè)案例1:智豬博弈小豬策略:等待智豬博弈豬圈里有兩頭豬,一頭大豬,一頭小豬,采用自動(dòng)喂養(yǎng),豬圈一頭有一個(gè)豬食槽,按鈕在另一頭,控制豬食,按一下會(huì)有10個(gè)豬食進(jìn)槽,但按的成本為2,若大豬先到,可吃9個(gè)食,小豬吃1個(gè);若同時(shí)到,大7小3;若小豬先到,大6小4。納什均衡:大豬按,小豬等待,小豬搭便車智豬博弈的其他含義。

“小豬躺著大豬跑”的現(xiàn)象是由于故事中的游戲規(guī)則所導(dǎo)致的。規(guī)則的核心指標(biāo)是:每次落下的事物數(shù)量和踏板與投食口之間的距離。

如果改變一下核心指標(biāo),豬圈里還會(huì)出現(xiàn)同樣的“小豬躺著大豬跑”的景象嗎?試試看。30改變方案:減量方案;增量方案。減量加移位方案。投食僅原來的一半分量,但同時(shí)將投食口移到踏板附近。結(jié)果呢,小豬和大豬都在拼命地?fù)屩忍ぐ?。等待者不得食,而多勞者多得。每次的收獲剛好消費(fèi)完。

3132(3)納什均衡的最優(yōu)性:如果納什均衡存在,那么,可能是最優(yōu)的,也可能不是寡頭價(jià)格聯(lián)盟的不穩(wěn)定性:每個(gè)成員都有強(qiáng)烈的降價(jià)獲利沖動(dòng)33

寡頭廠商之間降價(jià)競爭導(dǎo)致兩敗俱傷;

寡頭廠商共謀比競爭更為有利,因而具有共謀(Collude)的動(dòng)機(jī)。市場上的共謀現(xiàn)象十分普遍。當(dāng)寡頭廠商共謀時(shí),它們像一個(gè)壟斷廠商一樣行動(dòng):通過減產(chǎn)和提價(jià)來增加利潤,并對(duì)利潤加以瓜分,共同享有高價(jià)格帶來的高利潤。

共謀具有不穩(wěn)定性:個(gè)別廠商不守規(guī)則可以得到巨大利益,利益驅(qū)動(dòng)使寡頭遵守規(guī)則很困難。34

囚徒困境反映了一個(gè)深刻的問題,從個(gè)體角度出發(fā)所選擇的占優(yōu)策略,從整體來看,卻是最差的結(jié)局,即個(gè)人理性和集體理性的沖突根據(jù)“看不見的手”原理,在市場機(jī)制的作用,理性的個(gè)體在追求自己利益的過程中,會(huì)同時(shí)增進(jìn)整體利益,即個(gè)人理性與集體理性是一致的。西方經(jīng)濟(jì)學(xué)家引入“重復(fù)博弈”的概念,以走出“囚徒困境”例:看芭蕾舞還是球賽?周末,壯壯喜歡去看球賽,而他的女朋友麗麗喜歡看芭蕾舞,具體支付如下圖,哪個(gè)是最優(yōu)策略?36芭蕾足球男1,2-1,-10,02,1芭蕾足球女芭蕾足球女二、序貫博弈:情侶博弈(1)男方先選博弈均衡:足球37芭蕾足球女2,1-1,-10,012芭蕾足球男芭蕾足球男情侶博弈(2)女方先選博弈均衡:芭蕾38支付矩陣分析:情侶博弈女足球芭蕾教材第314頁女足球芭蕾男足球2,10,0芭蕾-1,-11,2策略:先下手為強(qiáng)納稅檢查假定稅務(wù)機(jī)關(guān)的檢查成本10,納稅人應(yīng)稅額為20,如果查到逃稅,罰款為兩倍。結(jié)果不確定:納稅機(jī)關(guān)和納稅人均沒有上策還取決于納稅機(jī)關(guān)的檢查概率,比如稅收機(jī)關(guān)的檢查概率是20%,納稅人會(huì)選擇逃稅(-60*20%>-20),稅收機(jī)關(guān)會(huì)檢查;如果概率是50%,納稅人會(huì)選擇納稅(-60*50%<-20),稅收機(jī)關(guān)選擇不檢查。40一、混合策略:當(dāng)純策略被賦予概率向量時(shí),就轉(zhuǎn)化為混合策略。

例如:上策、下策分別被賦予0.6、0.4的概率,即博弈參與者以60%的概率選擇上策,以40%的概率選擇下策。教材第299頁B廠商策略q1=0.3q2=0.7左右A廠商策略p1=0.6上4,69,1p2=0.4下7,32,8§7-3同時(shí)博弈:混合策略均衡41二、混合策略組合如果:A、B廠商的混合策略分別是(0.6,0.4)和(0.3,0.7),那么:它們的組合可以記做(0.6,0.4),(0.3,0.7)即:混合策略組合B廠商策略q1=0.3q2=0.7左右A廠商策略p1=0.6上4,69,1p2=0.4下7,32,842

在混合策略博弈中,對(duì)于每一個(gè)混合策略組合,也存在一個(gè)支付組合,其中,每一項(xiàng)也都是相應(yīng)參與人在該混合策略組合條件下所得到的支付。由于每個(gè)參與人都是以一定的概率來選擇其純策略,故相應(yīng)的支付也就成了“期望支付”,即支付的期望值。

三、期望支付43四種策略組合發(fā)生的概率分別是:

B廠商策略q1

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論