已閱讀5頁,還剩10頁未讀, 繼續(xù)免費(fèi)閱讀
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
第七講 完全信息靜態(tài)博弈即使是在不久以前,好事者仍將經(jīng)濟(jì)計(jì)量學(xué)與博弈論比作日本和阿根廷。在20世紀(jì)40年代晚期,這兩門學(xué)科都有遠(yuǎn)大前程,而這兩個(gè)國家也都充滿了希望,準(zhǔn)備高歌猛進(jìn),對世界產(chǎn)生深遠(yuǎn)的影響。日本和阿根廷經(jīng)濟(jì)隨后發(fā)生了什么已是眾所周知。而對這兩門學(xué)科來說,經(jīng)濟(jì)計(jì)量學(xué)成了經(jīng)濟(jì)學(xué)中必不可少的一部分,博弈論則萎縮成一門子學(xué)科。他只對博弈論專家來說樂趣無窮,卻為整個(gè)經(jīng)濟(jì)學(xué)界所遺忘。這些博弈論專家一般都是數(shù)學(xué)家。他們更關(guān)注定義與證明,而非將這一方法運(yùn)用于經(jīng)濟(jì)問題。他們?yōu)樽约旱睦碚撃茉诒姸鄬W(xué)科中運(yùn)用而倍感自豪,但沒有一門學(xué)科將博弈論作為自身不可分割的一部分。 但是到了70年代,再將博弈論比作阿根廷就不恰當(dāng)了。正但阿根廷迎回其前獨(dú)裁者胡安.庇隆之時(shí),經(jīng)濟(jì)學(xué)家發(fā)現(xiàn)博弈論與復(fù)雜的經(jīng)濟(jì)問題結(jié)合起來可能會(huì)得到的結(jié)果。理論與應(yīng)用方面的創(chuàng)新對于分析非對稱信息和動(dòng)態(tài)行為尤為有用。在80年代,博弈論迅速成為主流經(jīng)濟(jì)學(xué)的重要組成部分。事實(shí)上,他幾乎吞沒了整個(gè)微觀經(jīng)濟(jì)學(xué),即如同經(jīng)濟(jì)計(jì)量學(xué)吞沒了經(jīng)驗(yàn)經(jīng)濟(jì)學(xué)一樣。 博弈論與現(xiàn)代經(jīng)濟(jì)學(xué)傳統(tǒng)經(jīng)濟(jì)學(xué):新古典范式或阿羅德布魯體系:研究資源的有效配置。在市場完全的假設(shè)下,認(rèn)為市場(價(jià)格)能使資源得到最合理的配置,因而,又稱為價(jià)格理論?,F(xiàn)代經(jīng)濟(jì)學(xué);1980年代以后的經(jīng)濟(jì)學(xué):研究人的理性行為。在現(xiàn)代經(jīng)濟(jì)學(xué)看來,人的行為至少有兩個(gè)特點(diǎn):信息不完全或不對稱;人的行為相互影響。而傳統(tǒng)經(jīng)濟(jì)學(xué)將人的決策行為概括為約束條件下的最大化。假設(shè)不存在信息行為,而其他人的行為的影響被總結(jié)在環(huán)境參數(shù)。而現(xiàn)代經(jīng)濟(jì)學(xué)進(jìn)一步對人與人的相互影響建模。而目前人們找到的研究人與人之間的相互影響的行為(策略行為)的合適工具就是博弈論。博弈論(game theory)是研究決策主體的行為發(fā)生直接相互作用時(shí)的決策以及這種決策的均衡問題的一個(gè)分析工具。第一節(jié)博弈論的基本概念例:房地產(chǎn)開發(fā)博弈兩個(gè)房地產(chǎn)商A,B準(zhǔn)備在某地段開發(fā)一棟房產(chǎn),投入資金為1億元。如果市場上有兩棟樓出售,需求大時(shí),每棟樓售價(jià)1.4億元,需求小時(shí)每棟樓售價(jià)為0.7億元;如果市場上只有一棟樓出售,需求大時(shí),每棟樓售價(jià)1.8億元,需求小時(shí)每棟樓售價(jià)為1.1億元。假定雙方同時(shí)決策,每一方?jīng)Q策時(shí)不知道對方的決策。如果市場需求已知,如何決策?三、4.2過程,知道所有參與人的占優(yōu)策略組合就是一個(gè)占優(yōu)策略組合a、市場需求大時(shí)?b、市場需求小時(shí)?如果市場需求不知,如何決策?博弈論的基本概念:1、參與人player:指的是一個(gè)博弈中的決策主體,其目的是通過選擇行動(dòng)策略以最大化自己的支付(效用)水平“自然”是虛擬參與人(pseudo-player),他在博弈的特定時(shí)點(diǎn)上以特定的概率選擇隨機(jī)行動(dòng)。例如,自然隨機(jī)選擇市場需求的大小。2、行動(dòng):參與人i的行動(dòng)以ai表示,是他所能做的某一選擇。參與人i的行動(dòng)集(action set)Aiai,是其可以采取的全部行動(dòng)的集合。例如:AA=開發(fā),不開發(fā),AB=開發(fā),不開發(fā)一個(gè)行動(dòng)組合(action profile)是一個(gè)由博弈中的n個(gè)參與人每人選擇一個(gè)行動(dòng)而組成的有序集,a=ai),(i=1,.,n).例:a=(開發(fā),開發(fā))表示A選擇開發(fā),B也選擇開發(fā)。行動(dòng)的順序3、信息:是參與人有關(guān)博弈的知識,如自然的選擇,其他參與人的特征和行動(dòng)等知識。4、參與人的策略(strategy)si參與人在給定信息集下的行動(dòng)規(guī)則,他規(guī)定參與人在每一時(shí)點(diǎn)選擇何種行動(dòng)。si表示參與人i的一個(gè)特定策略。參與人的策略集(strategy set;strategy space)或策略空間Si=si是其可行策略的集合。策略組合(strategy profile)s(s1,s2,.,sn)是由博弈的n個(gè)參與人每人選擇一個(gè)策略的集合例:博弈條件為參與人B在不知道市場需求的情況下先行動(dòng),A在得知B的行動(dòng)后再選擇自己的行動(dòng)。自然 大 小B B開發(fā) 不開發(fā)A 開發(fā) 不開發(fā) 開發(fā) 不開發(fā)B的策略為:SB=開發(fā),不開發(fā),即B的策略是如果市場需求大就開發(fā),否則不開發(fā)。A的策略是:Sa=(開發(fā),開發(fā)),(開發(fā),不開發(fā)),(不開發(fā),開發(fā)),(不開發(fā),不開發(fā))(x,y)x對應(yīng)b開發(fā)時(shí)的a的行動(dòng),y對應(yīng)b不開發(fā)時(shí)a的行動(dòng).策略不同于行動(dòng)。請分析上例中A的行動(dòng)?策略必須是完備的。比如,上例中如果市場需求大,那么A可以肯定B會(huì)開發(fā),但也必須在策略集中給出B不開發(fā)的情況。這是因一個(gè)人的策略會(huì)影響另一個(gè)人的行動(dòng)。比如:紅軍對付白軍的策略是:人不犯我,我不犯人;人若犯我,我必犯人。這個(gè)策略使白軍不敢犯我。但是策略必須包括人若犯我的情況。否則,就不能保證敵人不犯我。5、支付/收益payoff:是指在一個(gè)特定的策略組合下參與人得到的確定效用水平(收益),或指參與人得到的期望效用水平(收益)。u=(u1,u2,.ui,.un)為n個(gè)參與人的支付組合payoff profile。參與人i的支付是所有參與人的策略的函數(shù):ui=ui(s1,.si,.sn)6、一個(gè)博弈(分析)的結(jié)果outcome是博弈分析者所感興趣的所有東西,如均衡策略組合,均衡行動(dòng)組合,均衡支付組合等等,取決于博弈分析者的到底需要什么。7、均衡是所有參與人的最優(yōu)策略的組合:s*=(s1*,.si*,.,sn*)其中si*表示第i個(gè)參與人在均衡條件下的最優(yōu)策略:ui(si*,s-i)ui(si,s-i)對任意的sisi*.例:如果兩開發(fā)商同時(shí)行動(dòng),如果需求大,則均衡是(開發(fā),開發(fā));如果需求小,則存在兩個(gè)均衡(開發(fā),不開發(fā)),(不開發(fā),開發(fā))第二節(jié) 策略博弈與占優(yōu)博弈完全信息:根據(jù)博弈的各方參與人是否了解自己和其他參與人在每種結(jié)果(策略組合)下的收益情況,可以將博弈分為完全信息和不完全信息。如果各個(gè)博弈參與人都完全了解所有博弈參與人在各種情況下的支付,這種博弈就是完全信息博弈。否則就是不完全信息博弈。例:囚徒困境,每個(gè)囚徒對于自己每種策略(抵賴,坦白)的支付都是清楚的。在房地產(chǎn)博弈中,如果參與人對市場需求不了解,那么他們并不能確定他們進(jìn)入或不進(jìn)入策略的支付,因而是不完全信息。靜態(tài)博弈:各個(gè)參與人同時(shí)決策(不一定是時(shí)間上同時(shí)決策,只要求每一個(gè)參與人在決策之前不知道其他參與人的決策,例如也許對每個(gè)囚徒的審訊有前有后,但只要后審訊的囚徒不知道前面囚徒的決策就可以認(rèn)為它們是同時(shí)決策的。)一、博弈的策略式表述一般用策略式(strategic form representation)表述法描述靜態(tài)博弈,而用擴(kuò)展式表述(extensive form representation)描述動(dòng)態(tài)博弈。策略式表述一般要給出博弈的參與人,每個(gè)參與人的策略集和支付函數(shù)。一個(gè)博弈如果1、參與人的個(gè)數(shù)是有限的;2、每個(gè)參與人的策略也是有限的,則是有限博弈,兩人(有時(shí)三人博弈可以用策略式表述)。例:囚徒困境二、占優(yōu)策略均衡分析囚徒困境中的(坦白,坦白)策略組合。如果,不管其他參與人的策略是什么,某個(gè)參與人的某個(gè)策略都嚴(yán)格優(yōu)于其它策略,并且其他參與人也同樣有一個(gè)策略嚴(yán)格由于其它策略并不受其他參與人的影響,那么,所有參與人的占優(yōu)策略組合就是一個(gè)占優(yōu)策略均衡。參與人在任何情況下都會(huì)選擇這個(gè)占優(yōu)策略組合,這樣的占優(yōu)策略組合就稱為占優(yōu)策略均衡(dominant strategy equilibrium)。如果一個(gè)博弈中,每一個(gè)參與人都存在占優(yōu)策略,那么均衡一定是占優(yōu)策略均衡。重復(fù)刪除的占優(yōu)均衡例:智豬博弈“重復(fù)剔除劣策略”解題思路:1、找出參與人的劣策略,把這個(gè)劣策略剔除掉;2、在剩下的博弈中重復(fù)第一步:剔除劣策略;3、繼續(xù)這個(gè)過程,直到只剩下唯一的策略組合為止,這個(gè)(均衡)策略組合就是重復(fù)剔除的占優(yōu)策略。2.1.4劃線法例:囚徒困境解題思路:針對對方的每一個(gè)策略找出其最優(yōu)的策略,并在其對應(yīng)的支付下劃線;對另一個(gè)參與人也是如此。兩個(gè)支付下面都劃了線的策略組合就是均衡策略。練習(xí):1、智豬博弈2、猜硬幣博弈3、性別戰(zhàn)第三節(jié) 納什均衡前面用劃線法求出的具有穩(wěn)定性的均衡策略組合,不管是否唯一,都有一個(gè)共同的特點(diǎn),就是每一個(gè)博弈參與人的策略都是其他參與人的策略的最佳對策。具有這種性質(zhì)的均衡策略組合被稱為納什均衡。定義:在博弈G=S1,.,Sn;u1,.,un中,如果策略組合中,任意參與人的策略都是針對其余參與人的策略組合的最佳策略,即:則稱為博弈G的一個(gè)納什均衡(Nash Equilibrim)。在納什均衡中由于每一個(gè)參與人都選擇的是針對其他參與人的策略的最佳策略,因而每一個(gè)參與人都沒有激勵(lì)改變其初始決策(策略),因而納什均衡是穩(wěn)定的。性別戰(zhàn)(多重納什均衡),猜硬幣博弈(不存在納什均衡)。每一個(gè)占優(yōu)策略均衡、重復(fù)剔除的占優(yōu)均衡都是納什均衡,第四節(jié) 混合策略與混合策略納什均衡一、混合策略混合策略博弈和混合策略納什均衡分析猜硬幣博弈。蓋硬幣一方必須:1、保證自己的策略選擇不能被猜硬幣一方預(yù)先知道;2、如果博弈多次進(jìn)行,那么蓋硬幣一方的策略必須是無規(guī)律的。3、正面和反面的概率必須是0.5。對于猜硬幣方也是如此。猜硬幣游戲中,兩個(gè)參與人的最佳策略都是以0.5的概率選擇正面,0.5的概率選擇反面。這種參與人以一定的概率分布在可選策略中隨機(jī)選擇的決策方式稱為“混合博弈”(mixed strategies),相應(yīng)的前面分析中參與人只選擇特定的策略的博弈稱為“純策略”例:猜硬幣博弈,雙方都以0.5的概率選擇正面和反面時(shí)的期望效用函數(shù):猜硬幣方1:u1(0.5,0.5)=0.5*1*0.5+(-1*0.5)+0.5*(-1*0.5+1*0.5給定對方的混合策略,參與人的最優(yōu)混合策略是使其期望效用函數(shù)最大化的混合策略。所有參與人的最優(yōu)混合策略的組合即混合策略納什均衡。定義混合策略納什均衡:在n個(gè)參與人的博弈G=S1,.Sn;u1,.un中,混合策略組合構(gòu)成一個(gè)納什均衡,如果對于所有的i1,2.,n下式成立:也就是說,如果一個(gè)策略組合使任何一個(gè)參與人的策略都是相對于其他參與人的策略的最佳策略,這個(gè)策略就構(gòu)成一個(gè)納什均衡,不管這個(gè)策略是混合策略還是純策略。解混合策略納什均衡的方法:1、最大化支付法:即最大化各個(gè)參與人的效用函數(shù)。2、支付相等法:根據(jù)前面分析的猜硬幣博弈中參與人的策略的思路,每個(gè)參與人的混合策略都使其余參與人的任何純策略的期望支付相等,因此,解混合策略納什均衡可以令參與人的各個(gè)純策略支付相等,構(gòu)成方程組求解。二、社會(huì)福利博弈解法1、最大化期望效用函數(shù)法:假定政府的混合策略是,流浪漢的混合策略是:。政府的期望效用函數(shù)為:求導(dǎo)得最優(yōu)化一階條件:同理,最大化流浪漢效用函數(shù)得政府救濟(jì)的概率是: 解法二:期望支付相等法假設(shè)流浪漢的混合策略為(r,1-r),政府選擇純策略救濟(jì)的期望支付是:選擇純策略不救濟(jì)的期望支付是:4r-1=-r r*=0.2同理可得政府救濟(jì)的概率為:政府的行動(dòng)是: 流浪漢的行動(dòng):畫圖即得反應(yīng)對應(yīng): r 1 0.2 NE 0 0.5 1 三、多重均衡博弈與混合策略一、性別戰(zhàn)期望支付相等法:妻子的混合策略
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 虛擬現(xiàn)實(shí)與時(shí)尚產(chǎn)業(yè)融合發(fā)展-洞察分析
- 采購合同的類別特點(diǎn)3篇
- 采購合同中的國際非政府組織合作3篇
- 采購合同編碼的拓展研究3篇
- 2024年02月江蘇2024屆杭州銀行南京分行春季校園招考筆試歷年參考題庫附帶答案詳解
- 采購合同樣本的阿爾巴尼亞語3篇
- 采購合同風(fēng)險(xiǎn)防范與案例分析解析分享3篇
- 一年級數(shù)學(xué)(上)計(jì)算題專項(xiàng)練習(xí)匯編
- 采購合同評審總結(jié)3篇
- 三年級數(shù)學(xué)計(jì)算題專項(xiàng)練習(xí)及答案
- 具有明顯首過消除的藥物
- 幼兒園采購索證索票制度
- 邁達(dá)斯橋梁建模
- 新產(chǎn)品試制流程管理辦法
- 幼兒園中班個(gè)人工作計(jì)劃幼兒園中班個(gè)人工作計(jì)劃范例2021.doc
- 常見繁體字的簡化表 香港人簡體字教學(xué)
- 《教育經(jīng)濟(jì)學(xué)》試題及答案
- 塑料模具肥皂盒設(shè)計(jì)說明書
- 穿越河流工程定向鉆專項(xiàng)施工方案
- 社會(huì)主義新農(nóng)村建設(shè)建筑廢料利用探究
- 火炬介紹 音速火炬等
評論
0/150
提交評論