博弈論及其應用-課節(jié)_第1頁
博弈論及其應用-課節(jié)_第2頁
博弈論及其應用-課節(jié)_第3頁
博弈論及其應用-課節(jié)_第4頁
博弈論及其應用-課節(jié)_第5頁
已閱讀5頁,還剩18頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

教案5教案5――第二章完全信息靜態(tài)博弈 #教案4教學題目:(第一章完全信息靜態(tài)博弈,§2—§3)學時數(shù)2教學目的和要求:理解Nash均衡的表達。掌握Nash均衡的應用。教學基本內(nèi)容:基本方法:理解Nash均衡的表達。掌握Nash均衡的應用。教學重點與難點:重點在于Nash均衡的應用;難點在于例2.6的討論。教學過程:課前復習理解博弈均衡的概念。講授新課:§2.2Nash均衡我們再以囚徒困境為例討論如下:囚徒B坦白囚徒B抗拒囚徒A坦白-6,-60,-10囚徒A抗拒-10,0-1,-1顯然,不論囚徒A選擇坦白還是抗拒,囚徒B的最優(yōu)策略都是坦白;不論囚徒B選擇坦白還是抗拒,囚徒A的最優(yōu)策略都是坦白;由收益函數(shù):UA(抗拒,坦白)=」10;UA(坦白,坦白)=-6;

UA(抗拒,抗拒)=—1;UA(坦白,抗拒)=0。UB(抗拒,坦白)=0;UB(坦白,坦白)=-6;

UB(抗拒,抗拒)=—;UB(坦白,抗拒)=—10。UA(坦白,。)>UA(抗拒O);Ub(O,坦白)>Ub(O,抗拒);這時,“坦白”策略就成為囚徒A,B的嚴格優(yōu)策略,如果一個博弈中的所有局中人都存在嚴格優(yōu)策略,那么由這些嚴格優(yōu)策略組成的局勢,就是該博弈的惟一均衡解。在囚;困境中的囚徒A,B的嚴格優(yōu)策略“坦白”組成的局勢(坦白,坦白)就是該博弈的惟-均衡解記S斗=(仆2,…,s^,s加…,Sn),則局勢s^Ss?,…,S斗S,S如…,Sn)=(s,sJES=3宀咒S。定義2—2(嚴格優(yōu)策略)在n人博弈G=N,S,U沖,除局中人i夕卜,其余n—1個局中人的所有可能的局勢s_j=(q,s2,…,第,s十,…,sn),局中人i存在著一個自己的策略s*,使得對一切的SiES(Si式s),有**Ui(Si,S_J=Ui(si,s2,…,匚,s,sm…,sj>Ui(q,…,Si「’,Sn)=Ui(Si,St),則稱S*?Si是局中人i的嚴格優(yōu)策略。囚徒A,B在囚徒困境中都有自己儼格優(yōu)策略“坦白”組成的局勢(坦白,坦白)為該博弈的惟一均衡解。這種現(xiàn)象是一般規(guī)律嗎?命題2—1在n人博弈G=〈N,S,U〉中,如果每一個局中人都有自己的嚴格優(yōu)策略s*(i=1,…,n),那么,n個局中人每人的嚴格優(yōu)策略組成的局勢s*=(s*,…,s*,…,s;)是博弈G=〈N,S,U)的惟一均衡解并稱S*=(s*,…,S*,…,s;)為嚴格優(yōu)策略均衡局勢或嚴格優(yōu)策略均衡解。證明:由以上的討論,n個局中人的嚴格優(yōu)策略組成的局勢*=(『??■,s*,…,s;)是博弈G=(N,S,U〉的一個均衡解。如果博弈G=〈N,S,U〉有兩個均衡解s*,s**,則至少有一個局中人j有兩個嚴*************格優(yōu)策略Sj, Sj ,設S=(s,…,Sj,…,sn), s= (s,,…,Sj ,…,sj.因為s*是局中人j的嚴格優(yōu)策略所以***(1) Uj(S)>Uj(S);又因為Sj也是局中人j的嚴格優(yōu)策略所以***⑵ Uj(sp"Uj(s).結(jié)合(1)(2)兩式有:****Uj(S)>Uj(S)=Uj(S), 、,******此為矛盾因此,Sj=Sj.從而S=S,即解是唯一的口定義2—4(優(yōu)策略)在n人博弈G=〈N,S,U〉中,除局中人i外,其余n—1個局中人的所有可能的局

勢s」=(q,s2,…,s」s扣…,sn),局中人i存在著一個自己的策略s*,使得對一切的s€S,有Ui(s*,s_J=Ui(3,s2,…,s*,s和…,sn)>Ui(s「…,Si,…,Sn)=Ui(s,S」),并且局中人i至少存在著一個自己的策略s"eS,使得Ui(s*,s」)=Ui(s, ,Si“s*,s1, , sn) Ui(Si, ,Si, , Sn)二Ui(s, s」),則稱s?Si是局中人i的優(yōu)策略。顯然,嚴格優(yōu)策略一定是優(yōu)策略但在許多情況下,不要說嚴格優(yōu)策略,就是優(yōu)策略都未必存在!我們以例2-1(獵鹿博弈)為例討論如下獵人B-獵鹿獵人B-獵兔獵人A-獵鹿何河0,1獵人A-獵兔1,0I1, □由收益函數(shù):UAUA(獵鹿,獵鹿)=10;UA(獵鹿,獵兔)=0;UB(獵鹿,獵鹿)=10;UB(獵鹿,獵兔)=0;UA(獵兔,獵鹿)=1;UA(獵兔,獵兔)=1UB(獵兔,獵鹿)=1;UB(獵兔,獵兔)=1但是,UA(獵鹿,o)>uA(獵兔,。)不成立,因為UA(獵鹿,獵鹿)=10>UA(獵兔,獵鹿)=1;UA(獵鹿,獵兔)=0<UA(獵兔,獵兔)=1;因此,獵人A沒有優(yōu)策略,更沒有嚴格優(yōu)策略。對獵人B的討論也同樣沒有優(yōu)策略

但卻存在兩個Nash均衡解。博弈解的第一組值為(10,10)(雙值),對應博弈的解為(獵鹿,獵鹿);博弈解的第二組值為(1, 1)(雙值),對應博弈的解為(獵兔獵兔),它們都是Nash均衡,即此博弈有2個解,或兩個均衡點。問題是:這兩個解應當如何去看?如果將博弈改為獵人乙-獵鹿獵人乙-獵兔獵人甲-獵鹿10,100,1獵人甲-獵兔1,00,0請同學們發(fā)表意見。毛澤東的思考Ua(獵鹿,Ua(獵鹿,獵鹿)=10;Ua(獵兔,獵鹿)=0;Ua(獵鹿,獵兔)=1;Ua(獵兔,獵兔)=0Ub(獵鹿,獵鹿)=10;Ub(獵兔,獵鹿)=1;Ub(獵鹿,獵兔)=0;Ub(獵兔,獵兔)=0<Ua(獵鹿,?)>Ua(獵兔,?)成立,顯然,因為UA(獵鹿,獵鹿)=10>UA(獵兔,獵鹿)=1;UA(獵鹿,獵兔)=1>UA(獵兔,獵兔)=0;因此,獵人A有嚴格劣策略’獵兔”同理,獵人B也有嚴格劣策略“昔兔”我們在上述基本式中剔除嚴格劣策略,我們就只剩下一個均衡解:

獵人B孑昔鹿獵人A-獵鹿10,10我們?yōu)槭裁匆钯Y本主義的尾巴?智豬博弈產(chǎn)生了,我的經(jīng)歷:獵鹿博弈=智豬博弈=囚徒困境例2-2斗雞博弈首先,依據(jù)情景描述寫出博弈的基本式再列出博弈雙方的收益矩陣雙矩陣)飛車黨黨徒B讓飛車黨黨徒B撞飛車黨黨徒A讓—10—10—10+10飛車黨黨徒A撞+10—10——OO ——OO最后,用相對優(yōu)勢策略的劃線法求解飛車黨黨徒B讓飛車黨黨徒B撞飛車黨黨徒A讓—10—10飛車黨黨徒A撞+0—10——OO ——OO博弈解的第一組值為(一10,+10)(雙值),對應博弈的解為(讓,撞);博弈解的第二組值為(+10,—10)(雙值),對應博弈的解為(撞讓),它們都是Nash均衡,即此博弈有2個解,或兩個均衡點。例2-3雙寡頭壟斷博弈(Cournot模型(1838年))首先,依據(jù)情景描述寫出博弈的基本式;再列出博弈雙方的收益矩陣雙矩陣)企業(yè)乙-定咼價企業(yè)乙-定低價企業(yè)甲-定咼價1000,1000500, 1500企業(yè)甲-定低價1500, 500700, 700最后,用相對優(yōu)勢策略的劃線法求解企業(yè)乙-定咼價企業(yè)乙-定低價企業(yè)甲-定咼價1000,1000500, 1500企業(yè)甲-定低價〔1500, 500匝,殛博弈的值為(700,700)(雙值),對應博弈的解為(低價,低價);它是Nash均衡。思考它與哪一個博弈是一致的?例2—4(雙人抬物)

博弈G「博弈G「N,S,U的基本式為局中人的集合N={1,2};策略空間S1S,=收益函數(shù):Ui(出力,出力)=v-c?0,U1(出力,不出力)=v-2c::0,U1(不出力,出力)=v0,U1(不出力,不出力)=0。容易看出局中人1的偏好序為:(不出力,出力)「(出力,出力)容易看出局中人2的偏好序為:(出力,不出力)—(出力,出力)顯然,兩局中人均有{出力,不出力}X{出力,不出力;U2(出力,出力)=v-c?0,U2(出力,不出力)=v-2s0,

U2(出力,不出力)=v0,U2(不出力,不出力)=0。(不出力,不出力)—(出力,不出力);(不出力,不出力)-(不出力,出力);U1(不出力>U1(出力,O),U2(不出力U2(出力,。);即,選擇“不出力”是兩局中人的嚴格優(yōu)策略,因此,惟一的Nash均衡為(不出力,不出力)博弈的值為(0,0)。我們還可以用劃線法解決:局中人2出力局中人2不出力局中人1出力v—C,v—Cv-2c,v局中人1不出力v,v-2c0,0討論:例2—5(雙人抬物)和哪一個博弈一致?關于道德風險;如何從技術上改變這種情況?例2-6(雙虎爭獵物)博弈G「N,S,U的基本式為局中人的集合N二{A,B};策略空間S=SASB={堅持,放棄堅持,放棄;收益函數(shù):Ua(堅持,堅持)=UB(堅持,堅持0,Ua(堅持,放棄)=UB(放棄,堅持)=f0,Ua(放棄,堅持)=Ub(堅持,放棄)=0,Ua(放棄,放棄)=ue}(放棄,,放棄)=0。容易看出兩老虎沒有嚴格優(yōu)策略,我們還是用劃線法解決:老虎B堅持老虎B放棄老虎A堅持—C,一cf,0老虎A放棄0,f0,0因此,Nash均衡為(堅持,放棄)和(放棄,堅持),博弈的值分別為(f,0)和(0,f)。討論:例2-10和哪一個博弈一致?現(xiàn)實中有何意義?例2—7(情侶分歧)博弈G=N,S,U的基本式為局中人的集合N={甲(男),乙(女)};策略空間S二S乙二{古典音樂,流行音樂古典音樂,流行音樂}收益函數(shù)用矩陣表示為:乙-古典音樂乙-流行音樂甲一古典音樂a,b0,0甲一流行音樂0,0b,a,用劃線法解決:乙-古典音樂乙-流行音樂甲一古典音樂a,b0,0甲一流行音樂0,0因此,Nash均衡為(古典音樂,古典音樂)和(流行音樂,流行音樂)博弈的值分別為(a,b)和小,a),(O^b^a)。討論:例2—7和哪一個博弈一致?協(xié)調(diào)型博弈在現(xiàn)實中有何意義?(總收益高)例2—8(公共產(chǎn)品的提供一一集資建橋博弈G“N,S,U的基本式為局中人的集合N二{1,2,…,n};策略空間S2 Sn-{出資,不出資}乂……x{出資,不出資;收益函數(shù)根據(jù)參加出資的人數(shù)有不同的情況:1)出資人數(shù)k二n(人人出資才能建橋)5=u2「二un(出資,……,出資)T-t0,出資居民i的收益Uj(至少有一個人不出資)=t舟0,不出資居民j的收益Uj(至少有一個人不出資)=0。我們簡化問題為兩個局中人的情況:局中人j出資局中人j不出資局中人i出資V-1,V-1-t,o局中人i不出資o, -t0,0因此,Nash均衡為(出資,……,出資)和(不出資,……,不出資)2)出資人數(shù)kn如果恰有k個居民出資而n-k個居民不出資。有2種情況,討論如下:如果已經(jīng)有k-1個居民出資而n-k個居民不出資,局中人將選擇出資:k-1個局中人出資,n-k個局中人不出資局中人i出資v-1>0局中人i不出資0如果已經(jīng)有k個居民出資而n-k-1個居民不出資k個局中人出資,n-kT個局中人不出資局中人i出資v-1a0局中人i不出資vNash均衡出現(xiàn)了:(k個居民出資,n-k個居民不出資);根據(jù)組合的知識,這樣的均衡共有Ck種。如果已經(jīng)有0咗mk-1個居民出資,那么局中人的選擇是不出資,因為0蘭m*k-1個局中人出資局中人i出資-t局中人i不出資0由于每一個局中人面對m(0乞m”:kT)個局中人出資時,必選擇不出資,因此,Nash均衡為(不出資,……,不出資。對m(m-k)個居民出資,局中人的選擇是不出資,因為m(m-k)個局中人出資

局中人i出資v-1局中人i不出資vNash均衡出現(xiàn)了:(k個居民出資,n-k個居民不出資);綜上所述,這樣的均衡共有2+C;種。討論:1.通過例2-7,談談集資建設和公共產(chǎn)品如何攤派和收取集資款?例2-8(經(jīng)濟學著名例子:公共地悲劇n個牧民共同擁有一片草地,每年,他們在這片草地上放牧養(yǎng)羊。設牧民i放牧的羊為qj(i=0,1/,n,…)只,則全體牧民養(yǎng)羊G=q q? qn照看一只羊的平均成本為c,當草地上有G只羊時,牧民養(yǎng)每只羊的價值為v(G)(v(G)0)。假設使草地上草的生長和羊群達到平衡的羊的只數(shù)為imax,如果羊的數(shù)量超過了Gmax,必將使草地的生態(tài)受到損害,從而使整個羊群不能吃飽,使羊的值v(G)下降(此地將自變量3看作連續(xù)變量),這就可以用數(shù)學語言來表達為(1)dV(1)dV0,dG4<odG2公共地悲劇博弈W二N,S,U的基本式為局中人的集合N二{1,2, ,n};策略空間S2 Sn=[0,x……x[0,,);收益函數(shù):Uj(q,…,q「…,qn)=v(G)qj-cq1蘭i蘭n.博弈問題:每一個牧民如何確定自己羊群的數(shù)量(i=1/,n),以獲得自己的最大收益(僅僅考慮個人利益的最大化?根據(jù)微積分的知識,這需要去求n元函數(shù)Uj(q[,…,q,…,qn)的極值,而方法是先求n個變量的偏導數(shù):-Ui dvdG dv芥呵①^拓亦一^心^詰一。(T「n).再令v(G)qidV=c(i「, ,n),dG當v(G)為已知函數(shù)時,由以上n個方程,可以解出n個數(shù)q;,…,q;,則得到Nash均衡局勢(q;,…,qn)=q。記我們以n二3,v(G)二kG=k(q1q2q3)為例,有3個方程構(gòu)成的方程組:2q^q^q3=c/kq「2q2q3=c/kg+q2+2q3二c/k解出qi二q2=q3C4k為簡單起見,我們進一步假設這1個牧民的基本情況相同,因此,我們不妨設q;=q*(仁i乞n),則n個收益函數(shù)成為Uj(q,…4,…,qn)二v(nq口一cq1G蘭n,于是據(jù)(2)式,v(G*)q*v(G*)=c仁i乞n,1*]**v(G) -Gv(G)=c.n那么,為什么稱作公共地悲劇呢?這n個牧民的總收益函數(shù)是⑶ U=nUj=nqv(G)-ncq=Gv(G)-cG.這n個牧民在Nash均衡q*下的總收益是(4) U=nUinqiv(G)-ncqi二Gv(G)-cG如果這塊草地是由政府管理的,專家認定最佳的放牧量是*=Gmax,即F*是使得收益最優(yōu)的值,即(5)收益最優(yōu)的值,即(5)F*二maxU,或?qū)σ磺械目偸找鍶冬F(xiàn)根據(jù)極值的必要條件應當有9^4=0(邊際收益=邊際成本)從(3)式推得dGdU

dG二dU

dG二v(G)Gv(G)-c,代入執(zhí)廠0有:v(F*)F*v(F*)二c.H(G)二v(G)Gv(G),我們首先有H(G)二2v(G)Gv(G):0.所以函數(shù)H(G)是遞減的,其次H(G*)-H(F*)二v(G*)G*v(G*)-[v(F*)F*v(F*)]二v(G*)G*v(G*)-c1* * * * I * *二v(G)Gv(G)-[v(G)Gv(G)]nn-1Gv(G) 0.n我們得到H(G*)::H(F*),即**GF.牧民在均衡處的羊多于專家設定的羊的最佳數(shù)量,又由于1*是使得收益函數(shù)取得最大值的點,有:U*g*蘭U*F* ?公共地悲劇指出:如果每個牧民僅僅考慮個人利益的最大化那么,在Nash均衡(q;,…,q;)二q*處羊群的數(shù)量G*大,但不如羊群為F*的收益,而且,草地將退化,所以生產(chǎn)應當是有組織的公共資源應當科學地開發(fā)怎么組織學問很深!公共地悲劇(P.87)公共衛(wèi)生一一國家資源一一 例2-9(密封式二級價格拍賣密封式二級價格拍賣——規(guī)則介紹分析局中人的集合:N二{1,2, ,n};策略集A=(0,g)(i=1,2,…,n),策略空間:A=A4…A;局勢:{sA|^(b1,b2/,bn)}是一個無限集。收益函數(shù):Uj(s)=?-sbi=1,2,…,n。表示為局中人12oooiooon標的物價值ViV2oooVioooVn競拍報價bb2ooobooobn收益VifoooV-bj°oooVn-S為討論方便,除第個局中人的報價b外,把其余的n-1個局中人報價的最大值記作眄刈口}=bj°我們討論如下:fb=Vi£bj°徑b“]bj05=v二Ui=v-bb>0.biVibjo:brtbjo口<? =5r-S>0bibjoVi:.TOC\o"1-5"\h\z\o"CurrentDocument"v「bj bj =Ui二w-% 0 :\o

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論