博弈論基礎作業(yè)及答案_第1頁
博弈論基礎作業(yè)及答案_第2頁
博弈論基礎作業(yè)及答案_第3頁
博弈論基礎作業(yè)及答案_第4頁
博弈論基礎作業(yè)及答案_第5頁
已閱讀5頁,還剩6頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

1、.博弈論基礎作業(yè)一、名詞解釋納什均衡 占優(yōu)戰(zhàn)略均衡 純戰(zhàn)略 混合戰(zhàn)略 子博弈精煉納什均衡 貝葉斯納什均衡 精煉貝葉斯納什均衡 共同知識見ppt二、問答題1.舉出囚徒困境和智豬博弈的現(xiàn)實例子并進行分析。囚徒困境的例子:軍備競賽;中小學生減負;幾個大企業(yè)之間的爭相殺價等等;以中小學生減負為例:在當前的高考制度下,給定其他學校對學生進行減負,一個學校最好不減負,因為這樣做,可以帶來比其他學校更高的升學率。給定其他學校不減負,這個學校的最佳應對也是不減負。否則自己的升學率就比其他學校低。因此,不論其他學校如何選擇,這個學校的最佳選擇都是不減負。每個學校都這樣想,所以每個學校的最佳選擇都是不減負,因此學

2、生的負擔越來越重。請用同樣的方法分析其他例子。智豬博弈的例子:大企業(yè)開發(fā)新產(chǎn)品;小企業(yè)模仿;股市中,大戶搜集分析信息,散戶跟隨大戶的操作策略以股市為例:給定散戶搜集資料進行分析,大戶的最佳選擇是跟隨。而給定散戶跟隨,大戶的最佳選擇是自己搜集資料進行分析。但是不論大戶是選擇分析還是跟隨,散戶的最佳選擇都是跟隨。因此如果大戶和散戶是聰明的,并且大戶知道散戶也是聰明的,那么大戶就會預見到散戶會跟隨,而給定散戶跟隨,大戶只有自己分析。請用同樣的方法分析其他例子。2.請用博弈論來說明“破釜沉舟”和“窮寇勿追”的道理。破釜沉舟是一個承諾行動。目的是要斷絕自己的退路,讓自己無路可退,讓自己決一死戰(zhàn)變得可以置

3、信。也就是說與敵人對決時,只有決一死戰(zhàn),這樣才可以取得勝利。否則,如果不破釜沉舟,那么遇到困難時,就很有可能退卻,也就無法取得勝利。窮寇勿追就是要給對方一個退路,由于有退路,對方就不會殊死抵抗。否則,對方退無可退,只有堅決抵抗一條路,因而必然決一死戰(zhàn)。自己也會付出更大的代價。精品.3.當求職者向企業(yè)聲明自己能力強時,企業(yè)未必相信。但如果求職者拿出自己的各種獲獎證書時,卻能在一定程度上傳遞自己能力強的信息。這是為什么?由于口頭聲明幾乎沒有成本,因此即便是能力差的求職者也會向企業(yè)聲明自己能力強。當然能力強的人也會聲明自己的能力強。也就是說不同類型的求職者為了贏得職位會做出同樣的聲明。這樣口頭聲明就

4、不能有效的傳遞信息,因此企業(yè)不會輕易相信。而求職者拿出獲獎證書就成了一個信號博弈。由于獲得證書是要付出代價的,但代價卻引人而異。能力強的個人可以相對輕易獲得證書,而能力弱的個人卻很難獲得證書,以至于能力弱的人認為化巨大的代價獲得證書,從而獲得企業(yè)的職位是不劃算的,因此干脆就不要獲獎證書。因此獲獎證書就成為個人能力的信號。4.五個海盜搶得100顆鉆石,他們?yōu)榉众E發(fā)生了爭議,最后達成協(xié)議,由抓鬮確定出分贓順序,然后按照民主程序進行分贓。首先由1號海盜提出分贓方案,五人共同舉手表決。若贊成的占一半以上(不包括一半的情況),就按1號提出的方案分贓,否則1號將被扔到海里喂鯊魚。接著由2號提出方案, 四人

5、共同舉手表決。若贊成的占一半以上(不包括一半的情況),就按2號提出的方案分贓,否則2號將被扔到海里喂鯊魚,依此類推。如果你是1號海盜,你該提什么樣的方案?說明理由。精品. 假設(1)五個強盜都很聰明,而且大家知道大家很聰明,大家知道大家知道大家很聰明,如此等等。(2)每個海盜都很貪婪,希望獲得盡可能多的鉆石,但是又不想為了鉆石丟掉性命。(3)給定一個方案,只有該方案大于他的備選方案所獲的鉆石時,海盜才選擇贊成。第一個海盜的提議應該是:五個海盜分別獲得的鉆石數(shù)目為97,0,1,0,2,或者97,0,1,2,0。具體理由自己思考,方法是倒推法。三、計算題1.試計算表1中的戰(zhàn)略式博弈的重復剔除劣戰(zhàn)略

6、均衡。表1 一個戰(zhàn)略式表述博弈blmrau1,23,12,4m5,67,12,6d3,12,07,8對b而言,戰(zhàn)略m嚴格劣于r;(因為14, 16,08),因此剔除b的戰(zhàn)略m;構(gòu)成新的博弈如下blrau1,22,4m5,62,6d3,17,8精品.在新的博弈中,對于a而言,戰(zhàn)略u嚴格劣于d(因為13,27),因此剔除a的戰(zhàn)略u,構(gòu)成新的博弈如下:blram5,62,6d3,17,8對于新的博弈中,已經(jīng)沒有嚴格的劣戰(zhàn)略,因此沒有嚴格的劣戰(zhàn)略可以剔除。所以該博弈不是重復剔除嚴格劣戰(zhàn)略可解的。但是存在弱劣戰(zhàn)略。對于b而言,戰(zhàn)略l弱劣于r(因為6=6,18),因此剔除b的弱劣戰(zhàn)略l,構(gòu)成新的博弈如下:

7、bram2,6d7,8在新的博弈中,對于a而言,戰(zhàn)略m嚴格劣于d(因為27),因此剔除a的戰(zhàn)略m,構(gòu)成新的博弈如下:brad7,8因此,重復剔除(弱)劣戰(zhàn)略均衡為(d,r)(ps: 如果同學們用劃線的方法求納什均衡,就可以發(fā)現(xiàn)純戰(zhàn)略nash均衡有兩個:(m,l)和(d,r)但采用剔除弱劣戰(zhàn)略的方法,把其中一個納什均衡剔除掉了)2. 試給出下述戰(zhàn)略式表述博弈的所有納什均衡。2精品.lr 1u2,23,3d4,41,2給定1選擇u,2的最佳選擇是r(因為22),在相應位置劃線給定2選擇l,1的最佳選擇是d(理由自己寫),在相應位置劃線給定2選擇r,1的最佳選擇是u(理由自己寫),在相應位置劃線找兩

8、個數(shù)字下都劃線的,顯然有兩個純戰(zhàn)略納什均衡:和據(jù)wilson的奇數(shù)定理,可能有一個混合戰(zhàn)略均衡。設1選的概率為,那么選d的概率為設2選的概率為,那么選r的概率為,如果存在混合戰(zhàn)略,那么2選戰(zhàn)略l和r的期望收益應該應該相等,因此應有 自己求解 (2分)同樣,1選戰(zhàn)略u和d的期望收益應該應該相等 得混合均衡:?3.市場里有兩個企業(yè)1和2。每個企業(yè)的成本都為0。市場的逆需求函數(shù)為p=16-q。其中p是市場價格,q為市場總產(chǎn)量。(1)求古諾(cournot)均衡產(chǎn)量和利潤。(2)求斯坦克爾伯格(stackelberg)均衡產(chǎn)量和利潤。(1)設兩個企業(yè)的產(chǎn)量分別為,有,因此利潤函數(shù)分別為:利潤最大化的一

9、階條件分別為:精品.因此企業(yè)1和企業(yè)2的反應函數(shù)分別為: 聯(lián)立,得到。自己求解(2)設企業(yè)1先行,企業(yè)2跟進。兩個企業(yè)的產(chǎn)量分別為,因此利潤函數(shù)分別為:由逆向歸納法,在第二階段,企業(yè)2在已知企業(yè)1的產(chǎn)量的情況下,最優(yōu)化自己的產(chǎn)量,從而得到企業(yè)2的反應函數(shù):因此企業(yè)2的反應函數(shù)為: 在第一階段,企業(yè)1考慮到企業(yè)2的反應,從而自己的利潤函數(shù)為: (2分)要使企業(yè)1的利潤最大,應滿足一階條件:得到。 所以。 (ps: 古諾模型是完全信息靜態(tài)博弈,求的是納什均衡;斯坦伯格模型是完全信息動態(tài)博弈,求的是子博弈精煉納什均衡) 4.(1)試給出圖1中的完全信息動態(tài)博弈的子博弈精煉均衡和均衡結(jié)果。(2)倘若2

10、告訴1:2的戰(zhàn)略是精品.,問此時1的最優(yōu)戰(zhàn)略是什么?(3)在(2)中,1和2的戰(zhàn)略組合構(gòu)成一個納什均衡嗎?均衡結(jié)果是什么?(4)(3)中的納什均衡不是子博弈精煉的,原因是什么? 12 a b 2 2 c d e j (1,2) (2,1) 1 (6,3) f g (3,2) l i (4,6) (0,2)答: (1) 1 a b 2 2 c d e j (1,2) (2,1) 1 (6,3)2 (2分) f g (3,2) l i (4,6) (0,2)由逆向歸納法,子博弈精煉均衡為,均衡結(jié)果為(4,6)。(2)若2的戰(zhàn)略為,則1的最優(yōu)戰(zhàn)略為。(3)給定2的戰(zhàn)略為,1的最優(yōu)戰(zhàn)略為;反之,給定1

11、的戰(zhàn)略,戰(zhàn)略是2的一個最優(yōu)戰(zhàn)略。所以它們構(gòu)成一個納什均衡,均衡結(jié)果為(6,3)。精品.(4)因為2的戰(zhàn)略中含有不可置信的威脅,使1在和之間不敢選。當博弈進行到2在與之間進行選擇的時候,2必會選,給定如此,1選而不是,此時2會選,這就是子博弈精煉均衡。5、試解出下述不完美信息動態(tài)博弈的精煉貝葉斯均衡。 1 r (1,2) l 2 l r l r (2,4) (0,1) (3,1) (7,2)當“2”看見“1”未選r時,設他認為“1”選l的概率為p, “1”選的概率為1p,則“2”選的期望支付為:“2”選的期望支付為當,即時,“2”選,而給定“2”選,“1”選l收益為2,選的收益為3,選r的收益為1,因此“1”會選。而給定“1”選,“2”認為(注意:p是“1”選l的概率),與矛盾。故不會有均衡;當,即時,“2”選,給定“2”選

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論