博弈論基本作業(yè)任務(wù)及答案解析_第1頁
博弈論基本作業(yè)任務(wù)及答案解析_第2頁
博弈論基本作業(yè)任務(wù)及答案解析_第3頁
博弈論基本作業(yè)任務(wù)及答案解析_第4頁
博弈論基本作業(yè)任務(wù)及答案解析_第5頁
已閱讀5頁,還剩5頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、博弈論基礎(chǔ)作業(yè)、名詞解釋納什均衡占優(yōu)戰(zhàn)略均衡純戰(zhàn)略混合戰(zhàn)略子博弈精煉納什均衡貝葉斯納什均衡精煉貝葉斯納什均衡 共同知識見PPT、問答題1. 舉出囚徒困境和智豬博弈的現(xiàn)實例子并進行分析。囚徒困境的例子:軍備競賽;中小學(xué)生減負;幾個大企業(yè)之間的爭相殺價等 等;以中小學(xué)生減負為例:在當(dāng)前的高考制度下,給定其他學(xué)校對學(xué)生進行減負, 一個學(xué)校最好不減負,因為這樣做,可以帶來比其他學(xué)校更高的升學(xué)率。 給定其 他學(xué)校不減負,這個學(xué)校的最佳應(yīng)對也是不減負。 否則自己的升學(xué)率就比其他學(xué) 校低。因此,不論其他學(xué)校如何選擇,這個學(xué)校的最佳選擇都是不減負。每個學(xué) 校都這樣想,所以每個學(xué)校的最佳選擇都是不減負,因此學(xué)生

2、的負擔(dān)越來越重。請用同樣的方法分析其他例子。智豬博弈的例子:大企業(yè)開發(fā)新產(chǎn)品;小企業(yè)模仿;股市中,大戶搜集分析 信息,散戶跟隨大戶的操作策略以股市為例:給定散戶搜集資料進行分析,大戶的最佳選擇是跟隨。而給定 散戶跟隨,大戶的最佳選擇是自己搜集資料進行分析。 但是不論大戶是選擇分析 還是跟隨,散戶的最佳選擇都是跟隨。因此如果大戶和散戶是聰明的,并且大戶 知道散戶也是聰明的,那么大戶就會預(yù)見到散戶會跟隨, 而給定散戶跟隨,大戶 只有自己分析。請用同樣的方法分析其他例子。2. 請用博弈論來說明“破釜沉舟”和“窮寇勿追”的道理。破釜沉舟是一個承諾行動。目的是要斷絕自己的退路,讓自己無路可退,讓 自己決

3、一死戰(zhàn)變得可以置信。也就是說與敵人對決時,只有決一死戰(zhàn),這樣才可 以取得勝利。否則,如果不破釜沉舟,那么遇到困難時,就很有可能退卻,也就 無法取得勝利。窮寇勿追就是要給對方一個退路, 由于有退路,對方就不會殊死 抵抗。否則,對方退無可退,只有堅決抵抗一條路,因而必然決一死戰(zhàn)。自己也 會付出更大的代價。3. 當(dāng)求職者向企業(yè)聲明自己能力強時,企業(yè)未必相信。但如果求職者拿出自己的各種獲獎證書時,卻能在一定程度上傳遞自己能力強的信息。 這是為什么?由于口頭聲明幾乎沒有成本,因此即便是能力差的求職者也會向企業(yè)聲明自 己能力強。當(dāng)然能力強的人也會聲明自己的能力強。 也就是說不同類型的求職者因此企為了贏得職

4、位會做出同樣的聲明。 這樣口頭聲明就不能有效的傳遞信息, 業(yè)不會輕易相信。而求職者拿出獲獎證書就成了一個信號博弈。 由于獲得證書是 要付出代價的,但代價卻引人而異。能力強的個人可以相對輕易獲得證書, 而能 力弱的個人卻很難獲得證書,以至于能力弱的人認為化巨大的代價獲得證書, 從 而獲得企業(yè)的職位是不劃算的,因此干脆就不要獲獎證書。因此獲獎證書就成為 個人能力的信號。4. 五個海盜搶得100顆鉆石,他們?yōu)榉众E發(fā)生了爭議,最后達成協(xié)議,由抓鬮確定出分贓順序,然后按照民主程序進行分贓。首先由1號海盜提出分贓方案,五人共同舉手表決。若贊成的占一半以上(不包括一半的情況),就按1號提出的方案分贓,否則1

5、號將被扔到海里喂鯊魚。接著由2號提出方案,四人共同舉手表決。若贊成的占一半以上(不包括一半的情況),就按2號提出的方案分贓,否則2號將被扔到海里喂鯊魚,依此類推。如果你是1號海盜,你該提什么樣的方案?說明理由。假設(shè)(1)五個強盜都很聰明,而且大家知道大家很聰明,大家知道大家知道大家很聰明,如此等等。(2)每個海盜都很貪婪,希望獲得盡可能多的鉆石,但是又不想為了鉆石丟掉性命。(3)給定一個方案,只有該方案大于他的備選方案所獲的鉆石時, 海盜才選擇贊成。第一個海盜的提議應(yīng)該是:五個海盜分別獲得的鉆石數(shù)目為 97 , 0,1 ,0, 2,或者 97,0,1,2,0。具體理由自己思考,方法是倒推法。三

6、、計算題1. 試計算表1中的戰(zhàn)略式博弈的重復(fù)剔除劣戰(zhàn)略均衡。1 一個戰(zhàn)略式表述博弈1,23,12,45,67,12,63,12,07,8LMRDUAM對B而言,戰(zhàn)略M嚴格劣于R;(因為14, 16,08 ),因此剔除B的戰(zhàn)略M ;構(gòu)成新的博弈如下1,22,45,62,63,17,8LRUMD在新的博弈中,對于A而言,戰(zhàn)略U嚴格劣于D(因為13,27),因此剔除A的戰(zhàn)略U,構(gòu)成新的博弈如下:5,62,63,17,8LRMD對于新的博弈中,已經(jīng)沒有嚴格的劣戰(zhàn)略,因此沒有嚴格的劣戰(zhàn)略可以剔除。所以該博弈不是重復(fù)剔除 嚴格劣戰(zhàn)略可解的。但是存在弱劣戰(zhàn)略。對于 B而言,戰(zhàn)略L弱劣于R (因為6=6,18

7、 ),因 此剔除B的弱劣戰(zhàn)略L,構(gòu)成新的博弈如下:2,67,8在新的博弈中,對于A而言,戰(zhàn)略M嚴格劣于D (因為22),在相應(yīng)位置劃線給定2選擇L,1的最佳選擇是D (理由自己寫),在相應(yīng)位置劃線給定2選擇R,1的最佳選擇是U (理由自己寫),在相應(yīng)位置劃線2,23,34,41,2LRUDR(因為23),在相應(yīng)位置劃線找兩個數(shù)字下都劃線的,顯然有兩個純戰(zhàn)略納什均衡:(U, R)和(D,L)據(jù)Wilson的奇數(shù)定理,可能有一個混合戰(zhàn)略均衡。設(shè)1選U的概率為,那么選D的概率為1設(shè)2選L的概率為,那么選R的概率為1如果存在混合戰(zhàn)略,那么2選戰(zhàn)略L和R的期望收益應(yīng)該應(yīng)該相等,因此應(yīng)有 Ul 24(1)

8、 Ur 32(1)?自己求解(2 分)同樣,1選戰(zhàn)略U和D的期望收益應(yīng)該應(yīng)該相等Uu 23(1) Ud 41(1)得混合均衡:?3. 市場里有兩個企業(yè)1和2。每個企業(yè)的成本都為0。市場的逆需求函數(shù)為P=16-Q。其中P是市場價格,Q為市場總產(chǎn)量。(1)求古諾(Cournot)均衡產(chǎn)量和利潤。(2)求斯坦克爾伯格(Stackelberg )均衡產(chǎn)量和利潤。(1)設(shè)兩個企業(yè)的產(chǎn)量分別為qi,q2,有Q q1 q2,因此利潤函數(shù)分別為:1(16 q1 q2)q1 蝕22(16 q1 q2)q216q2 q2利潤最大化的一階條件分別為:16 q12q1 q2 016 q22q2 q1 0因此企業(yè)1和企

9、業(yè)2的反應(yīng)函數(shù)分別為:q1 q2 16 q1聯(lián)立,得到q1 q2?。自己求解(2)設(shè)企業(yè)1先行,企業(yè)2跟進。兩個企業(yè)的產(chǎn)量分別為 q1,q2,因此利潤函數(shù)分別為:21(16 q1 q2)q1 蝕 q12 (16 q1 q2 )q2 16q22q2由逆向歸納法,在第二階段,企業(yè)在已知企業(yè)1的產(chǎn)量的情況下,最優(yōu)化自己的產(chǎn)量,從而得到企業(yè)2的反應(yīng)函數(shù):216 2q2 q10q2因此企業(yè)2的反應(yīng)函數(shù)為:q216在第一階段,企業(yè) 1考慮到企業(yè)2的反應(yīng),從而自己的利潤函數(shù)為:1 (16 q1 q2)q1 16q116qi216 q1q1 q1( )(2 分)2要使企業(yè)1的利潤最大,應(yīng)滿足一階條件:1q1得

10、到q1?。所以q2?。(PS:古諾模型是完全信息靜態(tài)博弈,求的是納什均衡;斯坦伯格模型是完全信息動態(tài)博弈,求的是子博弈精煉納什均衡)4. ( 1 )試給出圖1中的完全信息動態(tài)博弈的子博弈精煉均衡和均衡結(jié)果。(2)倘若2告訴1: 2的戰(zhàn)略是(c, i, j),冋此時1的最優(yōu)戰(zhàn)略是什么?( 3 )在(2)中,1和2的戰(zhàn)略組合構(gòu)成一個納什均衡嗎?均衡結(jié)果是什么? ( 4) (3)中的納什均衡不是子博弈精煉的,原因是什么?(1,2)(2,1)(6,3)(3,2)(4,6)(0,2)(2)若2的戰(zhàn)略為(c,i, j),則1的最優(yōu)戰(zhàn)略為(b, f)。答:(1)(3)給定2的戰(zhàn)略為(c,i, j) , 1的

11、最優(yōu)戰(zhàn)略為(b, f);反之,給定1的戰(zhàn) 略(b, f),戰(zhàn)略(c,i, j)是2的一個最優(yōu)戰(zhàn)略。所以它們構(gòu)成一個納什均衡,均衡 結(jié)果為(6,3)。(4)因為2的戰(zhàn)略(c,i, j)中含有不可置信的威脅i,使1在f和g之間不 敢選g。當(dāng)博弈進行到2在I與i之間進行選擇的時候,2必會選I,給定如此,1選g而不是f,此時2會選e,這就是子博弈精煉均衡。5、試解出下述不完美信息動態(tài)博弈的精煉貝葉斯均衡。(1,2)(2,4)(0,1)(3,1)(7,2)當(dāng)“2”看見j”未選R時,設(shè)他認為 j ”選L的概率為P,“1 ”選L的概率為1 P,則“2 ”選I的期望支付為:4P 1 (1 P) 1 3P“2”選r的期望支付為1 P 2(1 P) 2 P當(dāng)1 3P 2 P,即P 1時,“ 2 ”選I,而給定“ 2 ”選I , “1 ”選L收 4選L,“2 ”認為P 0丄4益為2,選L的收益為3,選R的收益為1,因此“1 ”會選L。而給定“ 1 ”(注意:P是“1 ”選L的概率),與 P丄矛盾。4故P 1不會有均衡;4丄時,“2”選r,給定“2”選r , “ 1 ”

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論