版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、1博弈論博弈論( (對策論對策論) )擴(kuò)展擴(kuò)展 完全信息靜態(tài)博弈完全信息靜態(tài)博弈 2參考書1.謝識予,經(jīng)濟(jì)博弈論, 復(fù)旦大學(xué)出版社2.施錫荃,博弈論3.張維迎,博弈論與信息經(jīng)濟(jì)學(xué),上海人民出版社4.吉本斯,博弈論基礎(chǔ),中國社會科學(xué)出版社3引言:引言:19941994年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)授予了三位博弈論專家年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)授予了三位博弈論專家和和。19961996年諾獎(jiǎng)授予兩位博弈論與信息經(jīng)濟(jì)學(xué)研究專家莫里年諾獎(jiǎng)授予兩位博弈論與信息經(jīng)濟(jì)學(xué)研究專家莫里斯、維克瑞;斯、維克瑞;20012001年諾獎(jiǎng)授予阿克洛夫、斯彭斯、斯蒂格利茨,表彰年諾獎(jiǎng)授予阿克洛夫、斯彭斯、斯蒂格利茨,表彰他們在檸檬市場、信號傳遞
2、和信號甄別等非對稱信息他們在檸檬市場、信號傳遞和信號甄別等非對稱信息理論研究中的開創(chuàng)性貢獻(xiàn)。理論研究中的開創(chuàng)性貢獻(xiàn)。20052005年諾獎(jiǎng)授予年諾獎(jiǎng)授予有以色列和美國雙重國籍的羅伯特有以色列和美國雙重國籍的羅伯特奧奧曼和美國人托馬斯曼和美國人托馬斯謝林,以表彰他們在博弈論領(lǐng)域謝林,以表彰他們在博弈論領(lǐng)域作出的貢獻(xiàn)。作出的貢獻(xiàn)。20122012年諾獎(jiǎng)授予美國經(jīng)濟(jì)學(xué)家埃爾文年諾獎(jiǎng)授予美國經(jīng)濟(jì)學(xué)家埃爾文. .羅斯羅斯(Alvin Roth)(Alvin Roth)與羅伊德與羅伊德. .沙普利沙普利(Lloyd(Lloyd Shapley)(Shapley)(穩(wěn)定配置和市場穩(wěn)定配置和市場設(shè)計(jì)實(shí)踐理論設(shè)
3、計(jì)實(shí)踐理論 ) )4博弈的分類博弈的分類 根據(jù)參與人的多少,可將博弈分為兩人博弈或多人博弈; 根據(jù)參與人是否合作,可將博弈分為合作博弈或非合作博弈; 根據(jù)博弈結(jié)果的不同,又可分為零和博弈、常和博弈與變和博弈。 51、從行動(dòng)的先后次序來分,博弈可以分為靜態(tài)博弈和動(dòng)態(tài)博弈。 靜態(tài)博弈指在博弈中,參與人同時(shí)選擇行動(dòng),或雖非同時(shí)但后行動(dòng)者并不知道前行動(dòng)者采取了什么具體行動(dòng); 動(dòng)態(tài)博弈指的是參與人的行動(dòng)有先后順序,且后行動(dòng)者能夠觀察到先行動(dòng)者所選擇的行動(dòng)的博弈。 6 2、從參與人對其他參與人的各種特征信息的獲得差異來分,博弈可分為完全信息博弈和不完全信息博弈。 完全信息指的是每一個(gè)參與人對所有其他參與人
4、的特征,如策略集合及得益函數(shù)都有準(zhǔn)確完備的知識;否則就是不完全信息。 將上述兩個(gè)角度的劃分結(jié)合起來,我們就得到四種不同類型的博弈,這就是:完全信息靜態(tài)博弈,完全信息動(dòng)態(tài)博弈,不完全信息靜態(tài)博弈和不完全信息動(dòng)態(tài)博弈。7行動(dòng)次序信息靜態(tài)動(dòng)態(tài)完全信息納什均衡子博弈精練納什均衡不完全信息貝葉斯均衡精煉貝葉斯均衡 博弈的分類和均衡博弈的分類和均衡8完全信息靜態(tài)博弈完全信息靜態(tài)博弈 (一)完全信息靜態(tài)博弈定義 所謂完全信息靜態(tài)博弈指的是各博弈方同時(shí)決策,或者決策行動(dòng)雖有先后,但后行動(dòng)者不知道先行動(dòng)者的具體行動(dòng)是什么,且各博弈方對博弈中各種策略組合情況下所有參與人相應(yīng)的得益都完全了解的博弈。 9納什均衡納什
5、均衡 1、占優(yōu)策略均衡。一般來說,由于每個(gè)參與人的得益是博弈中所有參與人的策略的函數(shù),因此每個(gè)參與人的最優(yōu)策略選擇依賴于所有其他參與人的策略選擇。但在一些特殊的博弈中,一個(gè)參與人的最優(yōu)策略可能可以不依賴于其他參與人的策略選擇,就是說,不論其他參與人選擇什么策略,他的最優(yōu)策略是 唯一的,這樣的最優(yōu)策略被稱為“占優(yōu)策略”。 如果一個(gè)博弈中,某個(gè)參與人有占優(yōu)策略,那么該參與人的其他可選擇策略就被稱為“劣策略”。 10 在一個(gè)博弈里在一個(gè)博弈里, ,如果所有參與人都有占優(yōu)策略存在,如果所有參與人都有占優(yōu)策略存在,那么占優(yōu)策略均衡是可以預(yù)測到的唯一的均衡,那么占優(yōu)策略均衡是可以預(yù)測到的唯一的均衡,因?yàn)闆]
6、有一個(gè)理性的參與人會選擇劣策略。所以在囚徒因?yàn)闆]有一個(gè)理性的參與人會選擇劣策略。所以在囚徒困 境 博 弈 里 ,困 境 博 弈 里 , 坦 白 , 坦 白坦 白 , 坦 白 是 占 優(yōu) 策 略 均 衡 。是 占 優(yōu) 策 略 均 衡 。 囚徒困境反映了一個(gè)深刻的問題囚徒困境反映了一個(gè)深刻的問題, ,即個(gè)人理性與即個(gè)人理性與團(tuán)體理性的沖突。這給我們一個(gè)啟示團(tuán)體理性的沖突。這給我們一個(gè)啟示, ,我們學(xué)習(xí)博弈論,我們學(xué)習(xí)博弈論,也許更應(yīng)該研究的是怎樣設(shè)計(jì)一種制度也許更應(yīng)該研究的是怎樣設(shè)計(jì)一種制度, ,在滿足個(gè)人理在滿足個(gè)人理性 的 同 時(shí)性 的 同 時(shí) , , 去 爭 取 達(dá) 到去 爭 取 達(dá) 到 “
7、 集 體 理 性集 體 理 性 ” 。11 2 2、嚴(yán)格劣策略的重復(fù)剔除、嚴(yán)格劣策略的重復(fù)剔除 重復(fù)剔除嚴(yán)格劣策略”的思路如下:首先找出某個(gè)參與人的嚴(yán)格劣策略(假定其存在),把這個(gè)劣策略剔除掉,重新構(gòu)造一個(gè)不包含已剔除策略的新的博弈;重復(fù)這個(gè)過程,一直到只剩下一個(gè)唯一的策略組合為止。這個(gè)唯一剩下的策略組合就是這個(gè)博弈的均衡解,稱為”重復(fù)剔除的占優(yōu)均衡”。注意,上述表述中強(qiáng)調(diào)了“唯一”這個(gè)詞。也就是說,如果重復(fù)剔除后剩下的策略組合不唯一,那么該博弈就不是可通過重復(fù)剔除劣策略求解的。 12 3 3納什均衡納什均衡 納什均衡是完全信息靜態(tài)博弈解的一般概念,構(gòu)成納什均衡的策略一定是重復(fù)剔除嚴(yán)格劣策略過
8、程中不能被剔除的策略,即沒有任何一個(gè)策略嚴(yán)格優(yōu)于納什均衡策略。當(dāng)然,逆定理是不存在的。更為重要的是,許多不存在占優(yōu)策略均衡或重復(fù)剔除的占優(yōu)策略均衡的博弈,也存在納什均衡。 下面,我們給出納什均衡的正式定義。13 納什均衡的正式定義納什均衡的正式定義 納什均衡:有n個(gè)參與人的戰(zhàn)略式表述博弈GS1,Sn;u1, ,un,戰(zhàn)略組合S*(S1*,Sn*)是一個(gè)納什均衡,如果對于每一個(gè)i,Si*是給定其他參與人Si*(S1*,,S-1*,Si+1*,Sn*)的情況下第i個(gè)參與人的最優(yōu)戰(zhàn)略,即:ui(si*,s-i*)ui(si,s-i*)對任意SiSi,和任意的 I都成立。14 指一組給定對手行為前提下
9、對各指一組給定對手行為前提下對各博弈方存在的最佳選擇;在納什博弈方存在的最佳選擇;在納什均衡狀態(tài)下,只要其它參與者不均衡狀態(tài)下,只要其它參與者不變換策略選擇,任何單個(gè)參與者變換策略選擇,任何單個(gè)參與者不可能單方面通過變換策略來提不可能單方面通過變換策略來提高他的所獲支付。高他的所獲支付。15古諾的寡頭模型寡頭產(chǎn)量競爭以兩廠商產(chǎn)量競爭為例QQPPqqQ8)(21121111112)(8 )(qqqqqcQPqu212116qqqq221 cc221222222)(8 )(qqqqqcQPqu222126qqqq16古諾模型的反應(yīng)函數(shù))6()()6()()6max(max1211222212112
10、121111qqRqqqRqqqqquq1q(3,0)(6,0)(0,3)(0,6)2q)(21qR)(12qR古諾模型的反應(yīng)函數(shù)圖示理性局限和古諾調(diào)整17伯特蘭德(Bortrand)寡頭模型價(jià)格競爭寡頭的博弈模型價(jià)格競爭寡頭的博弈模型異質(zhì)產(chǎn)品異質(zhì)產(chǎn)品122222122211112111),(),(PdPbaPPqqPdPbaPPqq11111112111)(),(qcPqcqPPPuu22222222122)(),(qcPqcqPPPuu)(2111111PdPbacP)(1222222PdPbacP)(21)(21*122222*2*211111*1PdcbabPPdcbabP18公共資源
11、問題公共草地養(yǎng)羊問題QQVVqqQn100)(1以三農(nóng)戶為例 n=3,c=4cqQVquiii)(19323211212148),(qqqqRq313122212148),(qqqqRq212133212148),(qqqqR3*2*1*3*2*1uQuuuqqqQQQQQu)96(4)100(1728576323047224348uQ合作:總體利益最大化合作:總體利益最大化競爭:個(gè)體利益最大化競爭:個(gè)體利益最大化20納什均衡的多重性納什均衡的多重性 在兩人的有限策略博弈中,我們還可以簡單地用劃線法來找出納什均衡在位者進(jìn)入者默許打擊進(jìn)入40,50-10,0不進(jìn)入0,3
12、000,300 從這個(gè)例子中我們知道一個(gè)博弈可能有多個(gè)納什均衡,而具體哪個(gè)均衡會實(shí)現(xiàn),納什均衡本身不能給出回答,任何有限博弈都存在至少一個(gè)納什均衡,若是無限博弈則不一定。 21多重均衡博弈和混合策略夫妻之爭2, 10, 00, 01, 2時(shí) 裝足 球時(shí)裝足球丈丈 夫夫妻妻子子夫妻之爭夫妻之爭rq111/32/3(r,1-r):妻子的混合策略概率分布(q,1-q):丈夫的混合策略概率分布)(2rRq )(1rRr 兩個(gè)純均衡策略,一個(gè)混合策略22猜硬幣博弈-1, 11, -11, -1-1, 1正 面反 面猜硬幣方猜硬幣方正面反面猜硬幣博弈猜硬幣博弈蓋蓋硬硬幣幣方方rq111/21/2(r,1-
13、r):蓋硬幣方選擇正反面的混合策略概率分布(q,1-q):猜硬幣方選擇正反面的混合策略概率分布)(2rRq )(1qRr 23納什均衡的存在性納什定理納什定理:在一個(gè)由n個(gè)博弈方的博弈 中,如果n是有限的,且 都是有限集(對 ),則該博弈至少存在一個(gè)納什均衡,但可能包含混合策略。納什均衡的普遍存在性正是納什均衡成為非合作博弈分析核心概念的根本原因之一。兩人兩策略時(shí),均衡為1個(gè)(純或混合)或3個(gè)(2純,1混合),;,11nnuuSSGiSni, 124多重納什均衡博弈的分析兩個(gè)以上均衡,確認(rèn)最優(yōu)均衡的問題,原則:n帕累托上策均衡n風(fēng)險(xiǎn)上策均衡n聚點(diǎn)均衡n相關(guān)均衡25一、帕累托上策均衡(鷹鴿博弈)
14、這個(gè)博弈中有兩個(gè)純策略納什均衡,(戰(zhàn)爭,戰(zhàn)爭)和(和平,和平),顯然后者帕累托優(yōu)于前者,所以,(和平,和平)是本博弈的一個(gè)帕累托上策均衡。-5, -5-10, 88, -1010, 10戰(zhàn)爭和平國家國家2戰(zhàn)爭和平國國家家1戰(zhàn)爭與和平戰(zhàn)爭與和平26二、風(fēng)險(xiǎn)上策均衡 考慮、顧忌博弈方、其他博弈方可能發(fā)生錯(cuò)誤等時(shí),帕累托上策均衡并不一定是最優(yōu)選擇,需要考慮:風(fēng)險(xiǎn)上策均衡。下面就是兩個(gè)例子。9, 98, 00, 87, 7LR博弈方博弈方2UD博博弈弈方方1風(fēng)險(xiǎn)上策均衡(風(fēng)險(xiǎn)上策均衡(D,R)5, 53, 00, 33, 3鹿兔子獵人獵人2鹿兔子獵獵人人1獵鹿博弈風(fēng)險(xiǎn)上策均衡(兔子,兔子)風(fēng)險(xiǎn)上策均衡
15、(兔子,兔子)27三、聚點(diǎn)均衡n利用博弈設(shè)定以外的信息和依據(jù)選擇的均衡n文化、習(xí)慣或者其他各種特征都可能是聚點(diǎn)均衡的依據(jù)n城市博弈(城市分組相同)、時(shí)間博弈(報(bào)出相同的時(shí)間)是聚點(diǎn)均衡的典型例子28四、相關(guān)均衡5, 14, 40, 01, 5LR博弈方博弈方2UD博博弈弈方方1相關(guān)均衡例子相關(guān)均衡例子三個(gè)納什均衡三個(gè)納什均衡:(U,L)、(D,R)和混合策略均衡(1/2,1/2),(1/2,1/2)結(jié)果都不理想,不如(D,L)。可利用聚點(diǎn)均衡(天氣,拋硬天氣,拋硬幣)幣),但仍不理想。相關(guān)裝置:1、各1/3概率A、B、C2、博弈方1看到是否A,博弈方2看到是否C3、博弈方1見A采用U,否則D;博弈方2見C采用R,否則L。29一、多人博弈中的共謀問題本博弈的純策略納什均衡:(U,L,A)、(D,R,B) 前者帕累托優(yōu)于后者。博弈的結(jié)果會是什么呢?(U,L,A)有共謀 (Coalition)問題:博弈方1和2同時(shí)偏離。而 (D,R,B)0,0,10-5,-5,0-5,-5,01,1,-5LRUD博弈方博弈方2博博弈弈方方1博弈方博弈方3A-2,-2,0-5,-
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 接口微型電子秤課程設(shè)計(jì)
- 企業(yè)擔(dān)保借款協(xié)議
- 交通事故處理協(xié)議書標(biāo)準(zhǔn)格式
- 電子商務(wù)平臺數(shù)據(jù)管理與分析
- 個(gè)人商業(yè)股權(quán)抵押合同范例
- 倉儲內(nèi)墻施工合同
- 代理銷售合同樣本
- 井隊(duì)員工健康與福利
- 二手車保養(yǎng)合同書
- 倉儲物流勞務(wù)分包協(xié)議
- 熱導(dǎo)率的測量課件
- 山東省煙臺市2022~2023學(xué)年八年級上學(xué)期期中階段性測試數(shù)學(xué)【含答案】
- 懸臂澆筑連續(xù)梁施工作業(yè)指導(dǎo)書
- Unit 3 Just a brother 閱讀理解課件-高中英語外研版必修第一冊
- 酸奶的制作課件1
- 建筑材料進(jìn)場驗(yàn)收制度頁
- 班主任經(jīng)驗(yàn)交流-課件(共18張)
- 7的乘法口訣(省一等獎(jiǎng))課件
- 1.《鄭人買履》課件PPT
- 謝公與人圍棋文言文閱讀答案
- 肝臟特殊部位腫瘤消融治療的策略課件
評論
0/150
提交評論