




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、第 8 章博弈論1考慮下面的博弈:圖 8-1博弈矩陣a找到純策略均衡(如果存在)b在均衡中各個參與人只會在前兩個行動之間隨機(jī)選擇,找到此時的混合策略衡。均c計算問題 a、b 中得到的均衡中各個參與人的期望。d畫出這個博弈的擴(kuò)展式。解:a對于參與人 1 來說:1 選擇 A,則參與人 2 會選擇 E;1 選擇 B,則參與人 2 選擇 D;1 選擇C,參與人 2 會選擇 F。同樣地,對于參與人 2 來說:2 選擇 D,參與人 1 選擇A;2 選擇E,1 選擇 B;2 選擇 F,1 選擇C。因此,此博弈的純策略均衡為:(C,F)。b此時博弈矩陣為圖 8-2 博弈矩陣設(shè)參與人選擇 A 的概率為r ,參與
2、人 2 選擇D 的概率為 s ,那么參與人 1 的期望表示為:可E1 = 7rs + 5r(1 - s) + 5(1 - r= 2r(2s - 1) - 2s + 7若 s > 0.5 ,隨著r 的增加參與人 1 的期望增加;若 s < 0.5 ,隨著r 的增加參與人 1 的期望減?。蝗?s = 0.5 , r 不影響參與人 1 的期望。同理,參與人 2 的期望為E2 = 6rs + 8r(1 - s) + 8(1 - r )= (- 4r + 2)s + 2r + 6若 r > 0.5 ,隨著 s 的增加參與人 1 的期望減?。?若 r < 0.5 ,隨著 s 的增加
3、參與人 1 的期望增加;若 r = 0.5 , s 不影響參與人 1 的期望。綜上所述,該博弈的混合策略選擇 D,E 的概率也各占 1/2。均衡為參與人 1 選擇A,B 的概率各占 1/2,參與人 2均衡點(diǎn)為(C,F),此時 E1a = E2a = 4 。c在a 中,參與人的純策略在 b 中,= 4rs- 2s + 7 = 4E1b4rs + 2r + 2s + 6 =E2bd參與人 1 先做出選擇的博弈擴(kuò)展式為:圖 8-3戰(zhàn)2在圖 8-4 的般解,假設(shè)該博弈的之,混合策略均衡會與的數(shù)值相關(guān)。為了得到一個一矩陣是:圖 8-4戰(zhàn)博弈矩陣其中, K ³ 1 。說明該博弈的混合策略均衡如何
4、依賴于 K 的值。解:假設(shè)參與人 1 以概率 r 去看芭蕾,2 以概率 s 去看芭蕾,則 A 的期望效用為:E (UA ) = 1- s + r éB 的期望效用為:E (UB ) = K (1- r ) + s éë(K +1)r - K ùû因而可得混合策略均衡為:s = 1 / ( K +1) , r = K / (3“膽小鬼”博弈描述的是,在一條單行道上,兩個血?dú)夥絼偟哪贻p人面對面地駕車沖向?qū)Ψ?。第一個轉(zhuǎn)向的人會被打上膽小鬼的烙印,而沒有轉(zhuǎn)向的人則會受到其他年輕人的尊重。當(dāng)然,如果雙方都不轉(zhuǎn)向,兩個人都會因?yàn)樽曹嚩仃嚾缦聢D所示。膽小鬼
5、博弈的圖 8-5 膽小鬼博弈矩陣a畫出博弈的擴(kuò)展式。b找出博弈的純策略均衡?c計算混合策略均衡,作為的一部分,畫出混合策略的最優(yōu)反應(yīng)函數(shù)圖形。d假定博弈是序貫進(jìn)行的,其中年輕人 1 首先行動,他扔掉了汽車的方向盤以此來承諾他選擇轉(zhuǎn)向。此時年輕人 2 應(yīng)該選擇怎樣的策略?寫出這個序貫博弈的標(biāo)準(zhǔn)式和擴(kuò)展式。e利用序貫博弈的標(biāo)準(zhǔn)式求出均衡。f求出這個序貫博弈的嚴(yán)格子博弈。運(yùn)用逆向歸納法求解子博弈完美均衡,并且解釋為什么另一個均衡是不合理的。解:a分別用 A,B 代表兩個年輕人。博弈的擴(kuò)展形式可表示為:圖 8-6 博弈樹b該博弈存在兩個均衡:(轉(zhuǎn)向,不轉(zhuǎn)向)、(不轉(zhuǎn)向,轉(zhuǎn)向)。c設(shè)年輕人 1 轉(zhuǎn)向的概
6、率為r ,年輕人 2 轉(zhuǎn)向的概率為c ,那么年輕人 1 的期望為:E1 = 2rs + r(1 - s) + 3(1 - r)s = (- 2s + 1)r + 3s若 s > 0.5 ,隨著r 的增加參與人 1 的期望減少; 若 s < 0.5 ,隨著r 的增加參與人 1 的期望增加;若 s = 0.5 , r 不影響參與人 1 的期望。同理,參與人 2 的期望為:E2 = (- 2r + 1)s + 3r若 r > 0.5 ,隨著 s 的增加參與人 2 的期望減小; 若 r < 0.5 ,隨著 s 的增加參與人 2 的期望增加;若 r = 0.5 , s 不影響參與
7、人 2 的期望。綜上所述,該博弈的混合策略均衡為年輕人 1 選轉(zhuǎn)向、不轉(zhuǎn)向的概率各占 1/2,年輕人 2 選擇轉(zhuǎn)向、不轉(zhuǎn)向的概率也各占 1/2?;旌喜呗缘淖顑?yōu)反應(yīng)圖像:圖 8-7 混合博弈d該序貫博弈的標(biāo)準(zhǔn)式和擴(kuò)展式可表示為:圖 8-8序貫博弈圖 8-9博弈樹e該序貫博弈中有三個均衡:年輕人 1 轉(zhuǎn)向,年輕人 2 總是不轉(zhuǎn);年輕人 1 不轉(zhuǎn),年輕人 2 總是轉(zhuǎn)向;年輕人 1 不轉(zhuǎn),年輕人 2 總是與年輕人 1 做法相反。f這個序貫博弈的嚴(yán)格子博弈均衡是年輕人的策略總是與年輕人 1 的策略相反。e 中年輕人 1 選擇不轉(zhuǎn)向,年輕人 2 總是選擇轉(zhuǎn)向是不合理的,因?yàn)槟贻p人 2 在覺察到年輕人 1有
8、可能轉(zhuǎn)向時他會選擇不轉(zhuǎn)向。同理,年輕人 1 轉(zhuǎn)向,年輕人 2 總是選擇不轉(zhuǎn)向也是不合理的,因?yàn)槿绻煊X到年輕人 1 可能不轉(zhuǎn)向,他會選擇轉(zhuǎn)向。4兩個鄰居, i = 1,2 ,同時選擇花費(fèi)多少時間li 來修剪草坪。每小時的平均為:+ l j10 - li2同時,機(jī)會成本為每小時 4 元。房主i 的平均隨鄰居 j 1 除草時間的增加而增加,這是由于鄰居環(huán)境的美化能夠增加的價值。a計算均衡。b畫出最優(yōu)反應(yīng)函數(shù),并且在圖中標(biāo)注出均衡。c用圖形說明,如果鄰居的平均函數(shù)的截距由 10 變?yōu)橐粋€比 10 小的數(shù)值,均衡如何變化。解:a p (l ) = æölç10 - l+
9、÷ × l - 4l 2ji iiiièø利潤最大化的一階條件為:l j+ l jp ¢(l ) = 10 - 2li + 2 - 4 = 6 - 2l= 0 ,即得房主的反應(yīng)函數(shù):iii212 = 4li - l j同理可得鄰居的反應(yīng)函數(shù):12 = 4l j - li均衡解li * = l j * = 4 。,交點(diǎn)即表示聯(lián)立兩式子求得b最優(yōu)反應(yīng)函數(shù)均衡點(diǎn)。圖 8-10 最優(yōu)反應(yīng)函數(shù)圖函數(shù)的截距由 10 變?yōu)橐粋€比 10 小的數(shù)值 a ,利用 a 中的方法,c如果鄰居的平均同樣可以得到此時房主和鄰居的最優(yōu)反應(yīng)函數(shù):ì2(a - 4)
10、= 4li - l jí( - 4) = 4l - l2 aji()()a - 4 3a - 4 3æ 2ö2(4,4)均衡點(diǎn)為ç,÷,這一點(diǎn)較點(diǎn)更加靠左下,意味著房主及其鄰èø居修剪草坪的時間變短了。5鏡頭闡述了獲獎美麗心靈用戲劇的手法講述了的一生,其中有一個在學(xué)術(shù)上的貢獻(xiàn):他和他的男在酒吧中閑聊的過程時,想到了均衡的概念。他們注意到酒吧中有幾個女生,其中一個女性是金發(fā)的,其他的都是深褐色頭發(fā),他們都認(rèn)為金發(fā)的女生要比深褐色頭發(fā)的女生更有。把這一場景視為幾個男學(xué)生之間的博弈。假設(shè) n 個男生同時接近這些女生。如果男生i 單
11、獨(dú)接近金發(fā)女生,那么地和金發(fā)女生,得到 a 的他就能。如果接近金發(fā)女生的男生人數(shù)多于 1 個,那么由于競爭,這些男生都得不到金發(fā)女生的青睞,他們只能得到 0 的。然而,如果男生i 接近深褐色頭發(fā)的女生,他們一定能夠與深褐色頭發(fā)女生,獲得b > 0 的,因?yàn)樯詈稚^發(fā)的女生數(shù)量比男學(xué)生的數(shù)量多。也就是說,i 一定能夠與深褐色頭發(fā)的女生。同時因?yàn)榻鸢l(fā)女生更迷人,所以 a > b 。a證明這個博弈不存在一個對稱的純策略均衡。b求解出對稱的混合策略均衡,即令 p 為一個男生選擇接近金發(fā)女生的概率,求解p 。c證明下面結(jié)論:酒吧中男生越多, b 里的均衡中,至少有一個男生的概率越低。金發(fā)女生
12、解:a如果所有男生都選擇與金發(fā)女生,則會有男生背離這個而選擇與深褐色頭發(fā)女生,因?yàn)楫?dāng)接近金發(fā)女生的男生人數(shù)多于 1 時,即為 0;而與深褐色頭發(fā)女生能獲得正的利而選擇與金發(fā)女生。如果所有男生都選擇與深褐色頭發(fā)女生,也會有男生背離這個,因?yàn)榻鸢l(fā)女生獲得的大于和深褐色頭發(fā)女生的。因此這個博弈不存在一個對稱的純策略均衡。一定能得到b ,而與金發(fā)女生b與深褐色頭發(fā)女生a(1- p)n-1 。對稱的混合策略能得到的期望為相等,即b = a(1- p)n-1均衡是使兩者可解出:。1p* = 1 - æ b ön -1ç a ÷èø11-æ
13、; b ö1n金發(fā)女生的概率為:1 - (1 - p*)n = 1 -ç a ÷c至少有一個男生èø,é 1 ù¶ê1 - æ b ö1- 1 úç a ÷n úêèø 1 -1 n æ b öëû1n= -1-< 0注意到 n > 1時,ç÷,隨著 n 的增加,顯然這個概¶nn - 1è a ø率是下降的。6下面的
14、博弈是 徒困境的一個版本,其中與圖 8-11 中的博弈有些許變化。圖 8-11徒困境a說明這個博弈的略。均衡與普通的 徒困境博弈相似,同時兩個參與人都有占優(yōu)策b假設(shè)這個階段博弈重復(fù)無限次。計算出貼現(xiàn)因子在什么范圍內(nèi),兩個嫌疑人能夠在各個階段都采取合作策略()。描述其中使用的觸發(fā)策略。解:a對于嫌疑人 1 來說,如果他選擇告發(fā),那么嫌疑人 2 會選擇告發(fā);如果他選擇沉默,2 會選擇告發(fā)。因此,不難看出告發(fā)對嫌疑人 2 來說是占優(yōu)策略選擇。同樣地,對于嫌疑人 2 來說,如果他選擇告發(fā),嫌疑人 1 也會選擇告發(fā);如果他選擇沉默,1 會選擇告發(fā)。因此不難看出告發(fā)對嫌疑人 1 來說是占優(yōu)策略選擇。綜上所
15、述,雙方的告發(fā)都是占優(yōu)的。均衡是(告發(fā),告發(fā)),不論對于嫌疑人 1 還是嫌疑人 2 來說,b當(dāng)博弈重復(fù)無限次時,均衡為(沉默,沉默)。假設(shè)從某一局博弈開始,嫌疑人 1 選擇告發(fā),嫌疑人 2 選擇沉默,那么從下一局博弈開始,嫌疑人 2 為嫌疑人 1 的告為,選擇一直告發(fā),則此時博弈的均衡變?yōu)椋ǜ姘l(fā),告發(fā))。嫌疑人 1 選擇告發(fā)時,其為:¥10å tE = u +u dt =1= 1 + 3d + 0 + 0 + . = 1 + 3dt嫌疑人 1 選擇沉默時,其為:¥+ åu d t = 1 + d + d 2 + . = 1 E = u1 - d20tt
16、=1當(dāng) E2 > E1 時,兩個嫌疑人會一直采用合作(沉默)策略,此時有> 1 + 3d , d > 211 - d37回到練習(xí)題 8.5 中兩個鄰居之間的博弈。參與人i 修剪草坪的每小時平均還是10 - l + l j 、參與人 2 的機(jī)會成本保持 4 不變;而參與人 1 的機(jī)會成本會以相同的概率變?yōu)閕23 或 5,參與人 1 的成本是他的私人信息。a求解-均衡。b用最優(yōu)反應(yīng)函數(shù)圖形表示-均衡。c哪種類型的參與人 1 傾向于參與人 2 傳遞真實(shí)的信號?哪種類型的參與人 1 傾向于的私人信息?隱藏解:a當(dāng)參與人 1 的機(jī)會成本為 3 時,p (l ) = æ10 -
17、 löl+× l - 3lç2 ÷21 1111èø利潤最大化的一階條件:+ l2+ l2p ¢(l ) = 10 - 2l- 3 = 7 - 2l= 01 11122可解出參與人 1 的反應(yīng)函數(shù):l= 3.5 + l2L14同樣地分析可得,當(dāng)參與人 1 的機(jī)會成本為 5 時,參與人 1 的反應(yīng)函數(shù)為:l= 2.5 + l2H 14參與人 2 的利潤函數(shù):p (l ) = æ10 - l +l - 4lElöç1÷ 22 222è2ø由此解出參與人 2 的反應(yīng)函數(shù)為
18、l = 3 +,其中 El = 1 l+ 1 lEl121L1H 1422ìlL1 = 4.5ï聯(lián)立相關(guān)方程可得到均衡解ílH 1 = 3.5ïl= 4î 2.圖 8-12均衡b如圖 8-12 所示,BRHC (l2 )表示參與人 1 機(jī)會成本為 5 時的最優(yōu)反應(yīng)函數(shù),BRLC (l2 )表示參與人 1 機(jī)會成本為 3 時的最優(yōu)反應(yīng)函數(shù), BRLC (l1 )表示參與人 2 的最優(yōu)反應(yīng)函數(shù),HC 點(diǎn)表示參與人 1 機(jī)會成本為 5 時的最優(yōu)均衡點(diǎn),LC 點(diǎn)表示機(jī)會成本為 3 時的最優(yōu)納什均衡點(diǎn)。c當(dāng)參與人 1 機(jī)會成本為 3 時,在a 中均衡下的
19、為:p= æ10 - 4.5 + 4 ö ´ 4.5 - 3 ´ç2 ÷1Lèø然而在全信息下均衡求得為(l ,l ) = æ 68 , 62 ö ,帶入利潤函數(shù)可得:ç 15 15 ÷1 2èøæ 0 - 68 + 31 ö ´ 68p ¢ç1515 ÷151Lèø參與人 2 傳遞真實(shí)的信號。因此,參與人 1 傾向均衡下的為p1H = 12.25 ,全信類似的,當(dāng)參與人 1
20、機(jī)會成本為 5 時,æ 52 58 ö息下的均衡為ç÷ ,帶入利潤函數(shù)后可得:,è 15 15 øæ 0 - 52 + 29 ö ´ 52p ¢ç1515 ÷151Lèø的私人信息。因此參與人 1 傾向于隱藏8在德克薩斯中,參與人 2 首先從標(biāo)準(zhǔn)牌堆中抽出一張紙牌,并且將紙牌背對自己,讓參與人 1 看到紙牌的大小,而不看。參與人 1 首先行動,決定是保留還是蓋牌。如果參與人 1 蓋牌,他必須向參與人 2 支付 50;如果參與人 1 選擇保留,則參與人 2開
21、始動。參與人 2 可以選擇蓋牌和開牌。如果參與人 2 蓋牌,她必須向參與人 1 支付 50 美元;而如果參與人 2 選擇開牌,則雙方查看紙牌的大小。如果是小牌(2-8),參與人 2 就輸 100與人 2。給參與人 1。而如果是大牌(9,10,J,Q,K,A),參與人 1 就輸 100給參a畫出博弈的擴(kuò)展式。b求解雜合均衡。c計算各參與人的期望。解:a博弈的擴(kuò)展式如圖 8-13。其中 Pr(H )和 Pr(L)分別表示在觀察到參與人 1 行動前,參與人 2 對牌大小的信念。圖 8-13 混合策略均衡b在一個混合均衡中,至少有一個參與者的選擇策略是混合策略。如果參與者 1 看到是小牌,他的純策略均
22、衡是選擇保留;那么當(dāng)他看到的是大牌時,他的選擇策略一定是隨機(jī)的。這是因?yàn)槿绻麉⑴c者 1 的純策略選擇是要么保留要么蓋牌,參與人 2 的最有反應(yīng)同樣也是一個純策略,此時的均衡不可能是混合均衡。設(shè)參與人 1 看到大牌后選擇保留的概率是a ,則看到大牌后蓋牌的概率是1 - a ;同樣設(shè) 2 看到大牌后保留的概率為 b 。b 應(yīng)保證參與人 2 在保留和蓋牌之間的選擇是無差異的,即參與人 2 看到大牌后選擇保留的應(yīng)當(dāng)與看到大牌后選擇蓋牌的相等,即:- 50 = (-100)b + 50(1 - b ) ,b = 2 / 3 。要保證參與人 2 的策略選擇是隨機(jī)的,則由其在保留和蓋牌之間的選擇是無差異的,
23、因= 100P(H | 保留)+ (-100)1 - P(H | 保留) = -50 。其中 此有參與人 2 的保留 P(H | 保留) 是一種后驗(yàn)概率, 即參與人 1 在大牌情況下保留的概率。P(H | 保留) = 1/ 4 。根據(jù)后驗(yàn)概率 P(H | 保留)滿足法則,有P(保留| H )P(H )P(H | 保留) =P 保留| H )P(H ) + P(保留| L)P(L)(6 a= 13= 6a= 16 a +76a + 741313a* = 7 /18總而言之,在混合均衡中,參與人 1 看到小牌總會選擇保留,看到大牌后選擇保留的概率是 7/18,選擇蓋牌的概率是 11/18。參與人
24、2 在保留和蓋牌之間的選擇是隨機(jī)的,其概率分別是 2/3 和 1/3。參與人 2 的后驗(yàn)信念是如果參與人 1 選擇蓋牌,則參與人 1 的牌面是大牌;若參與人 1 選擇保留,則參與人 1 有 1/4 的概率是大牌,3/4 的概率是小牌。c看到小牌的期望= 100´ 2 + 50´ 1 = 83.3 ,看到大牌的期望= -50(因?yàn)?3在均衡狀態(tài)下參與人在看到大牌后保留和蓋牌的期望效用一樣,都是- 50)。在給定看到76大牌和小牌的先驗(yàn)概率,參與人 1 的期望= 83.3 ´- 50´= 21.8 ,參與人 2 的期1313望= -50(因?yàn)樵诰鉅顟B(tài)下參與
25、人 2 在保留和蓋牌之間的效用一樣。)由此,此博弈對參與人 1 有利。9之前討論過的最后通牒博弈。首先行動的參與人提出一個分配 1的方案。令 r 為另一個參與人得到的份額(即先行動的參與人保留1 - r ),其中0 £ r £ 1/ 2 。然后第二個參與人行動,選擇接受或者拒絕這個提案。如果回應(yīng)人接受提案,兩個參與人會按照提案獲得相應(yīng)的;如果回應(yīng)人拒絕,兩個參與人就什么都得不到。如果回應(yīng)人接受或者拒絕一個提案的a. 假設(shè)參與人只在意金錢弈完美均衡。b. 比較最后通牒博弈和是無差異的,回應(yīng)人就會選擇接受。請證明在前文中提到的結(jié)果是最后通牒博弈的博者博弈的結(jié)果(在之前內(nèi)容中也提
26、到過),即提案人在決策時并考慮回應(yīng)人的行動(實(shí)際上這個博弈并不是策略博弈)。c現(xiàn)在假定參與人會同時考慮公平和金錢。的效用函數(shù)為;Fehr 和 Schmidt 的文獻(xiàn),假定參與人U (1 - a | x1 - x2 |其中, x1 為參與人 1 的, x2 為參與人 2 的(對于參與人 2,對稱的效用函數(shù)同樣成立)。函數(shù)中的第一項(xiàng)反映了參與人對金錢的渴望,第二項(xiàng)反映了對公平的考慮, 即兩個參與人的不能相差太多。參數(shù) a 衡量了參與人對公平的偏好。假設(shè) a < 1/ 2 。1. 求解在最后通牒博弈中回應(yīng)人的均衡策略。2. 在考慮到回應(yīng)人的行動后,求解提案人的均衡策略 r * 。提示: r *
27、 會是一個角點(diǎn)解, 并且與a 的取值有關(guān)。3在公平偏好下,比較最后通牒博弈和結(jié)果匹配的結(jié)果,特別是最后通牒博弈比 弈是否存在最公平的分配方式?者博弈結(jié)果的區(qū)別。并且找到與前文中實(shí)驗(yàn)者博弈分配方式更公平的結(jié)果。最后通牒博解:a參與人 1 的為p1 = 1 - r ,參與人 2 的為p 2 = max r,0,當(dāng)r = e (其中e 為任意小的)時,參與人 2 選擇接受提案,此時,參與人 1的選擇為:max p1 = 1 - r ,因此參與人 1 選擇r = e ,所以存在唯一的子博弈完美均衡,即 r = e 。r ³0者博弈中,博弈的均衡提案為r = 0 ,此時與最后通牒博弈相比,參與
28、人 2b在的境況變差而參與人 1 的境況變好。c1回應(yīng)人的選擇問題為:max U2 = r2 - a | r2 - (1 - r1 ) |r2 ³0s.t. r2 £ r1r2 = r1 。2提案人的選擇問題為:max U2 = 1 - r1 - a | 1 - r2 - r1 |r2 ³ 0s.t. r2 = r1當(dāng) a < 1/ 2 時, r1 = r2 = 0 ; a ³ 1/ 2 時, r1 = r2 = 1/ 2 ,又因?yàn)榧僭O(shè)了 a < 1/ 2 ,所以 r* = 0 。3在公平偏好下,參與人 1 不僅僅考慮能獲得的金錢,同時要考慮
29、參與人 2 所獲得的金錢對的效用的影響,因此參與人 1 會適當(dāng)?shù)目紤]提案的公平。而在最后通牒博弈和者博弈中,參與人 1 的效用只與所能獲得的金錢有關(guān),而同參與人 2 所能獲得的金錢無關(guān),因此參與人 1 只會考慮錢。所能獲得的金錢,而考慮參與人 2 所能獲得的金由前文實(shí)驗(yàn)的結(jié)果可知最后傾向于 50 對 50,因此可知參與人是公平偏好的,并且a ³ 1/ 2 ,當(dāng)r1 = r2 = 1/ 2 ,U1 = U2 = 1/ 2 ,此時分配最公平。10在論家庭中,獎得主提出了著名的壞孩子定理。壞孩子定理是由一個序貫博弈得出,博弈是在一個潛在的壞孩子(參與人 1)和孩子的家長(參與¢收
30、入 Y (r)Y (r) > 0 和父母收入人 2)中進(jìn)行。孩子首先行動,選擇能夠影響他11¢Y (r)Y (r) > 0 的行動 r 。然后,父母行動,決定留給孩子的遺產(chǎn) 。孩子在乎L的效22用U1 (Y1 + L),不過父母則是最大化U2 (Y2 - L)+ aU1 其中a > 0 反映父母的利他程度。請證明,在子博弈完美均衡中,孩子會選擇合適的 r ,使得Y1 + Y2 取得最大值,即使他沒有利他傾向。提示:運(yùn)用逆向歸納法,首先求解父母的最優(yōu)化問題,由一階條件可以得到均 衡的 L * ;盡管不能得出 L * 的精確值,但是 L * 的微分關(guān)于r 的函數(shù)可以運(yùn)用
31、隱函數(shù)法則得出(在孩子的第一階段最優(yōu)化問題中求解)。解:第二階段中,父母關(guān)于 L 的效用最大化問題為:max U2 (Y2 (r)- L)+ aU1(Y1(r) + L)對 L 求導(dǎo)可得:- U2¢ (Y2 (r)- L)+ aU1¢(Y1(r) + L) = 0U2¢ Y2¢(r ) - aU1¢¢1Y1¢ (r )dL*整理可得=- U ¢ + aU ¢dr21在第一階段,孩子的效用最大化問題為:max U ()Y (r ) -L (r )*1 1一階條件為:¢dL*() +U1 Y1 rd
32、r= æU1¢öéY ¢(r)()(-)(U) ¢ + aU ¢¢ + U Y ¢¢¢rùúûç÷êë- aU Y ¢¢r¢U + aU¢¢¢¢1212 211-è21 øæU1U2¢¢¢öé¢Y ()()ùû¢= ç&
33、#247;+ Y rrè - U2¢¢+ aU1¢¢øë12¢由上述等式可得Y (r)+Y (r) = 0 ,所以,在子博弈完美均衡中,孩子們會選擇合適的¢12r ,使得Y1 + Y2 取得最大值,即使他沒有利他傾向。11假設(shè) 徒困境階段博弈重復(fù)進(jìn)行無限多次。a參與人能否利用以牙還牙策略得到合作的結(jié)果,即在出現(xiàn)背離時只轉(zhuǎn)向階段博弈納什均衡一個回合,在這個回合后就回到合作策略?兩個回合的懲罰夠不夠?b假設(shè)參與人會使用下面的策略,即在出現(xiàn)背離時,會轉(zhuǎn)向階段博弈均衡 10 個回合,然后才回到合作策略。計算能夠?qū)?/p>
34、現(xiàn)合作并且最大化雙方總?cè)≈?。的臨界貼現(xiàn)因子的解:a沿著均衡路徑,每個參與人在每個時期都選擇,則每個人各個時期可21 - d獲得 2 的,其總的貼現(xiàn)值為。如果在出現(xiàn)背離時采取以牙還牙的策略,則在21- d一個回合后回到合作策略的貼現(xiàn)值為3 + d + d 2 ×。因?yàn)樵诒畴x的第一階段,為 3,第二階段為不合作的懲罰,為 2。為 1,第三階段回到合作的策略上,為 2,以后各期均要使參與者在一個回合后回到合作,則要223 + d + d 2 ×>1 - d1 - d化簡有d 2 > -1 ,0 £ d < 1 。如果采取兩個回合的懲罰,則在兩個回合后回到合作策略的貼現(xiàn)值為:21 - d3 + d + d 2 + d 3 ×要使參與者在兩個回合后回到合作,則要223 + d + d 2 + d 3 ×>1- d1- d0 £ d < 0.62 。b如果采取 10
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 六一學(xué)校漢服活動方案
- 六一彩粉活動方案
- 醫(yī)學(xué)常識考試試題及答案
- 六一活動拉棋活動方案
- 六一活動野營活動方案
- 六一游園活動策劃方案
- 六一玩樂活動策劃方案
- 六一舞會活動方案
- 六一節(jié)小班活動方案
- 六一黑板抽獎活動方案
- 《敬畏生命向陽而生》的主題班會
- 中華護(hù)理學(xué)會精神科??谱o(hù)士理論考試試題
- 新能源電動汽車操作安全
- 中職生職業(yè)生涯規(guī)劃課件PPT
- 《和諧與夢想》作業(yè)設(shè)計
- 企業(yè)清產(chǎn)核資報表
- 金融風(fēng)險管理習(xí)題匯總第1-13章金融風(fēng)險概述思考題-經(jīng)濟(jì)資本與風(fēng)險調(diào)整績效
- 北京英文介紹課件
- 2021年NICaS-(無創(chuàng)血流動力學(xué)監(jiān)測系統(tǒng))課件
- 消防維保協(xié)議書
- 膀胱功能訓(xùn)練技術(shù)(康復(fù)護(hù)理課件)
評論
0/150
提交評論