博弈論之策略型博弈與Nash均衡_第1頁
博弈論之策略型博弈與Nash均衡_第2頁
博弈論之策略型博弈與Nash均衡_第3頁
博弈論之策略型博弈與Nash均衡_第4頁
博弈論之策略型博弈與Nash均衡_第5頁
已閱讀5頁,還剩30頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

博弈論

TheGameTheory上海財(cái)經(jīng)大學(xué)金融學(xué)院韓其恒參考書籍施錫銓(2002),博弈論。上海財(cái)經(jīng)大學(xué)出版社。張維迎(1996),博弈論與信息經(jīng)濟(jì)學(xué)。上海人民出版社,上海三聯(lián)書店,[美]朱?弗登博格,[法]讓?梯若爾(2003),博弈論。中國人民大學(xué)出版社陳學(xué)彬(1999),宏觀金融博弈分析。上海財(cái)經(jīng)大學(xué)出版社。經(jīng)濟(jì)學(xué)家梯若爾(JeanTirole):“正如理性預(yù)期使宏觀經(jīng)濟(jì)學(xué)發(fā)生革命一樣,博弈論廣泛而深遠(yuǎn)的改變了經(jīng)濟(jì)學(xué)家的思維方式?!比绻闆r確實(shí)如此,對(duì)今天的經(jīng)濟(jì)學(xué)家來說,不懂得博弈論顯然是不行了。值得人們尊敬的人在非合作博弈的均衡分析理論方面做出了開創(chuàng)性的貢獻(xiàn),對(duì)博弈論和經(jīng)濟(jì)學(xué)產(chǎn)生了重大影響。約翰·納什,1928年生于美國

1994年Nobel經(jīng)濟(jì)學(xué)獎(jiǎng)得主在非合作博弈的均衡分析理論方面做出了開創(chuàng)性的貢獻(xiàn),對(duì)博弈論和經(jīng)濟(jì)學(xué)產(chǎn)生了重大影響。約翰·海薩尼,1920年生于美國1994年Nobel經(jīng)濟(jì)學(xué)獎(jiǎng)得主在非合作博弈的均衡分析理論方面做出了開創(chuàng)性的貢獻(xiàn),對(duì)博弈論和經(jīng)濟(jì)學(xué)產(chǎn)生了重大影響。萊因哈德·澤爾騰,1930年生于德國1994年Nobel經(jīng)濟(jì)學(xué)獎(jiǎng)得主背景馮·諾依曼(VonNeumann),摩根斯坦恩(Morgenstern)(1944),博弈論和經(jīng)濟(jì)行為(TheTheoryofGamesandEconomicBehavior)。標(biāo)志著博弈理論的初步形成Nash(1950,1951)兩篇關(guān)于非合作博弈的重要文章,在非常一般的意義下。定義了非合作博弈及其均衡解,并證明了均衡解的存在。基本上奠定了現(xiàn)代非合作博弈論的基石。

第一章導(dǎo)論

1.什么是博弈論定義:關(guān)于包含相互依存情況中理性行為的研究。目的:決策,合理的預(yù)測(cè)思想:有限性,東方性妻子

BF

B丈夫F1,20,00,02,1性別戰(zhàn)(battleofsexes)腐敗問題的博弈分析政府監(jiān)督不監(jiān)督

受賄官員

不受賄R-F,F(xiàn)-C-SR,-S0,-C0,0貿(mào)易自由化的博弈分析乙國自由化保護(hù)

自由化甲國

保護(hù)10,10-10,2020,-10-5,-5大戶與散戶的博弈模型散戶分析并進(jìn)入跟隨大戶進(jìn)入

分析并進(jìn)入大戶

跟隨散戶進(jìn)入0.7p-c,0.3p-c0.7p-c,0.3p0.7p,0.3p-c0,0國有股減持投資者支持不支持

減持國有股東

不減持5,-6-8,-2-3,-1-5,0機(jī)構(gòu)投資者之間的博弈分析機(jī)構(gòu)乙合作不合作

合作機(jī)構(gòu)甲

不合作0.5,0.5雙方獲利均為溢價(jià)的一半0,1乙獲全部溢價(jià)1,0甲獲全部溢價(jià)0,0雙方獲利均為零貨幣政策目標(biāo)的博弈分析企業(yè)增加投資不增加投資

增加貨幣供給中央銀行

不增加貨幣供給0,2通貨膨脹率10%經(jīng)濟(jì)增長率5%2,1通貨膨脹率0%經(jīng)濟(jì)增長率10%-1,0通貨膨脹率10%經(jīng)濟(jì)增長率0%1,3通貨膨脹率0%經(jīng)濟(jì)增長率5%上市公司虛假信息披露行為的博弈分析發(fā)現(xiàn)(θ)F-C+E,-F-D-C,0未發(fā)現(xiàn)(1-θ)-C,E-D0,E-D0,0證券監(jiān)管機(jī)構(gòu)上市公司造假不造假檢查不檢查E:造假行為對(duì)上市公司的額外收益;F:監(jiān)管機(jī)構(gòu)發(fā)現(xiàn)公司造假后的懲罰;C:監(jiān)管機(jī)構(gòu)的檢查成本;D:上市公司造假的成本;θ:監(jiān)管機(jī)構(gòu)成功查實(shí)公司造假行為之概率。2.博弈要素局中人策略 純策略空間Si={Si1,Si2,…,Siki}盈利(支付)函數(shù)(payofffunction):Ui(s)3.博弈的分類從信息的角度:完全信息、不完全信息從局中人行動(dòng)的先后次序:靜態(tài)博弈、動(dòng)態(tài)博弈完全信息靜態(tài)博弈 完全信息動(dòng)態(tài)博弈 不完全信息靜態(tài)博弈 不完全信息動(dòng)態(tài)博弈第一部分完全信息靜態(tài)博弈第二章策略型博弈與Nash均衡1.博弈的正則型兩人零和游戲(猜謎游戲)局中人212

局中人11,-1-1,1-1,11,-112定義:n人博弈正則型(或策略型)表示指定了n個(gè)局中人的純策略空間,以及對(duì)應(yīng)每個(gè)策略組合的盈利函數(shù)U1,U2,…,Un,可將該博弈表示為:G={S1,S2,…,Sn;U1,U2,…,Un}2.混合策略猜謎游戲無純策略解設(shè)甲的策略為(p,1-p) 乙的策略為(q,1-q)對(duì)于甲來說,如果乙伸一個(gè)指頭,期望盈利為:p+(-1)(1-p)=2p-1≥0p≥0.5 如果乙伸兩個(gè)指頭,期望盈利為:-p+(1-p)=-2p+1≥0p≤0.5因此理想的混合策略是:(0.5,0.5)1,-1-1,1-1,11,-1定義:局中人i(i=1,2,…,n)中的一個(gè)混合策略是該局中人的純策略空間Si=(si1,si2,…,siki)上的一個(gè)概率分布,可用σi來表示。所有n個(gè)局中人各自的混合策略σ1,σ2,…,

σn是獨(dú)立的。n個(gè)混合策略構(gòu)成的σ={

σ1,σ2,…,

σn}是一個(gè)策略組合(策略剖面,profile)。σi(sij)表示第i個(gè)局中人混合策略σi在純策略sij上的概率,因此局中人i在混合策略σ上的期望盈利為:算例局中人2

LMRU局中人1MD4,35,16,22,18,43,63,09,62,8局中人1的混合策略:σ1=(σ1(U),σ1(M),σ1(D)=(1/3,1/3,1/3)局中人2的混合策略:σ2=(σ2(U),σ2(M),σ2(D)=(0,1/2,1/2)策略組合:σ=(σ1,σ2)4,35,16,22,18,43,63,09,62,8局中人1策略組合σ的期望盈利為:U1(σ)=4*1/3*0+5*1/3*1/2+6*1/3*1/2+2*1/3*0+8*1/3*1/2+3*1/3*1/2+3*1/2*0+9*1/3*1/2+2*1/3*1/2

=11/2局中人1的混合策略:σ1=(σ1(U),σ1(M),σ1(D)=(1/3,1/3,1/3)局中人2的混合策略:σ2=(σ2(U),σ2(M),σ2(D)=(0,1/2,1/2)策略組合:σ=(σ1,σ2)4,35,16,22,18,43,63,09,62,8局中人2策略組合σ的期望盈利為:U2(σ)=3*1/3*0+1*1/3*1/2+2*1/3*1/2+1*1/3*0+4*1/3*1/2+6*1/3*1/2+0*1/2*0+6*1/3*1/2+8*1/3*1/2

=9/23.累次嚴(yán)優(yōu)(iterateddominance)隱含著Nash均衡的思想局中人2

LMRU局中人1MD4,35,16,22,18,43,63,09,62,8

局中人2

LMR4562833923121460684,35,16,22,18,43,63,09,62,8局中人1

局中人2

LRU局中人1MD

局中人2

LR局中人1U4,36,22,13,63,02,84,36,2312146068合理,符合邏輯的過程,得到累次嚴(yán)優(yōu)的解為:局中人2

L局中人1U累次嚴(yán)優(yōu)的局限性4,3嚴(yán)劣純策略定義:對(duì)局中人i的某個(gè)純策略si,如果存在混合策略σi*,使得s-iS-iUi(σi*,s-i)≥Ui(si,s-i)

且在S-i中至少存在一個(gè)純策略組合s-i*S-i,使上式中的不等號(hào)嚴(yán)格成立Ui(σi*,s-I*)>Ui(si,s-I*)

則稱純策略si為局中人i的弱劣純策略。 如果對(duì)一切s-iS-I,上式中的不等式嚴(yán)格的成立Ui(σi*,s-i)>Ui(si,s-i)s-iS-i

則稱si為局中人i的嚴(yán)劣純策略。4.累次嚴(yán)優(yōu)的應(yīng)用囚徒困境

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論