微觀經(jīng)濟(jì)學(xué) 第9章課件

上傳人：星*** IP屬地：貴州上傳時(shí)間：2022-12-03 格式：PPTX 頁數(shù)：72 大?。?79.23KB 積分：25 舉報(bào) 版權(quán)申訴

已閱讀5頁，還剩67頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第八章博弈論

要解決的問題：人們之間決策的相互作用、相互影響。第八章博弈論要解決的問題：人們之間決策的相互1

博弈論又稱為對(duì)策論或游戲論，是研究決策主體的行為發(fā)生直接相互作用時(shí)的決策以及這種決策的均衡問題。嚴(yán)格地說，博弈論并不是經(jīng)濟(jì)學(xué)的一個(gè)分支。它是一種方法，應(yīng)用范圍并不局限于經(jīng)濟(jì)學(xué)。在政治學(xué)、軍事學(xué)、外交學(xué)甚至犯罪學(xué)等多個(gè)領(lǐng)域都涉及到博弈論知識(shí)。實(shí)際上，它屬于數(shù)學(xué)知識(shí)。近20年來，博弈論在經(jīng)濟(jì)學(xué)中得到了廣泛的應(yīng)用，它對(duì)寡頭理論、信息經(jīng)濟(jì)學(xué)等方面的發(fā)展做出了重要貢獻(xiàn)。博弈論又稱為對(duì)策論或游戲論，是研究決策主體的行為21994年度的諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)授予三位從事對(duì)策論研究的經(jīng)濟(jì)學(xué)家：納什、澤爾騰、海薩尼。2005年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)授予有以色列和美國(guó)雙重國(guó)籍的羅伯特·奧曼和美國(guó)人托馬斯·謝林，以表彰他們通過博弈理論的分析增強(qiáng)世人對(duì)合作與沖突的理解。

博弈在經(jīng)濟(jì)學(xué)中應(yīng)用最廣、最成功，其根本原因是經(jīng)濟(jì)學(xué)和博弈論的研究模式是一樣的，都強(qiáng)調(diào)個(gè)人理性，即追求給定條件下效用最大化。1994年度的諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)授予三位從事對(duì)策論研3在一個(gè)博弈中，基本要素包括參與人或游戲者、行動(dòng)、信息、戰(zhàn)略、收益或支付、結(jié)果、均衡等。第一節(jié)博弈論基本概念一、博弈的基本要素在一個(gè)博弈中，基本要素包括參與人或游戲者、行動(dòng)、信4參與人(players)：指的是在博弈中選擇行動(dòng)以最大化自己效用的決策主體（可能是個(gè)人，也可能是團(tuán)體）。

行動(dòng)(actions)：指的是參與人的決策變量。

戰(zhàn)略(strategies)：參與人選擇行動(dòng)的規(guī)則，它告訴參與人在什么時(shí)候選擇什么行動(dòng)。

信息(Information)：指的是參與人在博弈中的知識(shí)，特別是有關(guān)其它參與人的特征和行動(dòng)的知識(shí)。

參與人(players)：指的是在博弈中選擇行動(dòng)以最大化自己5在每一個(gè)博弈中，都至少有兩個(gè)參與者，每一個(gè)參與者都有一組可選擇的策略。作為博弈的結(jié)局，每個(gè)參與者都得到各自的報(bào)酬。每一個(gè)參與者的報(bào)酬都是所有參與者各自所選擇的策略的共同作用的結(jié)果，或者說是所有參與者所采用的策略的函數(shù)——報(bào)酬函數(shù)或支付函數(shù)?？梢杂靡粋€(gè)支付矩陣來描述和分析一個(gè)博弈。在每一個(gè)博弈中，都至少有兩個(gè)參與者，每一個(gè)參與者都有一組可選6假定兩個(gè)嫌疑犯作案后被警察抓住,分別被關(guān)在不同的屋子里審訊。警察告訴他們:如果都坦白,兩人要被各判刑7年；如果都抵賴,兩人可以各判1年；如果一人坦白而另一人抵賴,則坦白的放出去,抵賴的要被判刑9年。囚徒困境假定兩個(gè)嫌疑犯作案后被警察抓住,分別被關(guān)在不同的屋子7-1-1-900-9-7-7囚犯A坦白不坦白囚犯B坦白不坦白戰(zhàn)略式表述囚犯A坦白不坦白囚犯B坦白不坦白戰(zhàn)略式表述8二、博弈的分類可以從不同的角度對(duì)博弈進(jìn)行分類1、雙人博弈和n人博弈根據(jù)局中人的數(shù)量，博弈可以劃分為雙人博弈和n人博弈2、合作博弈與非合作博弈二、博弈的分類可以從不同的角度對(duì)博弈進(jìn)行分類93、根據(jù)行動(dòng)的先后順序：靜態(tài)博弈：是指參與人同時(shí)行動(dòng)或不同時(shí)行動(dòng)，但后行動(dòng)者并不知道先行動(dòng)者采取了什么具體行動(dòng)。

—田忌賽馬、猜硬幣、古諾模型動(dòng)態(tài)博弈：是指參與人行動(dòng)有先后順序，且后行動(dòng)者能觀察到先行動(dòng)者所選擇的行動(dòng)。

—弈棋、市場(chǎng)進(jìn)入、斯塔克爾伯格模型3、根據(jù)行動(dòng)的先后順序：104、根據(jù)參與人掌握的信息完全信息博弈：每一個(gè)參與人對(duì)所有其他參與人（對(duì)手）的特征、戰(zhàn)略空間及支付函數(shù)有準(zhǔn)確的知識(shí)。不完全信息博弈：至少部分參與人不完全了解其他參與人的特征、戰(zhàn)略空間及支付函數(shù)的情況，也稱為“不對(duì)稱信息博弈”4、根據(jù)參與人掌握的信息完全信息博弈：每一個(gè)參與人對(duì)所有其他11

行動(dòng)順序

信息靜態(tài)動(dòng)態(tài)完全信息完全信息靜態(tài)博弈納什均衡納什完全信息動(dòng)態(tài)博弈子博弈精煉納什均衡澤爾騰不完全信息不完全信息靜態(tài)博弈貝葉斯納什均衡海薩尼不完全信息動(dòng)態(tài)博弈精煉貝葉斯納什均衡澤爾騰、克瑞普斯、威爾遜、泰勒爾行動(dòng)順序靜態(tài)動(dòng)態(tài)完全完全信息靜態(tài)博弈完全信息動(dòng)態(tài)博12第二節(jié)完全信息靜態(tài)博弈

占優(yōu)戰(zhàn)略均衡是指參與人的最優(yōu)戰(zhàn)略不依賴于其他參與人的戰(zhàn)略選擇。不論其他參與人選擇什么戰(zhàn)略，他的最優(yōu)戰(zhàn)略是唯一的，這個(gè)最優(yōu)戰(zhàn)略被稱為占優(yōu)戰(zhàn)略。在一個(gè)博弈中，如果所有參與人都有占優(yōu)戰(zhàn)略，那么所有參與人的占優(yōu)戰(zhàn)略組合便是該博弈的唯一均衡，叫占優(yōu)戰(zhàn)略均衡。一、占優(yōu)戰(zhàn)略均衡第二節(jié)完全信息靜態(tài)博弈占優(yōu)戰(zhàn)略均衡是指參與人的13-1-1-900-9-7-7囚犯A坦白不坦白囚犯B坦白不坦白囚徒困境（）囚犯A坦白不坦白囚犯B坦白不坦白囚徒困境（141701608018020050150100廠商A1020廠商B1020練習(xí)：價(jià)格競(jìng)爭(zhēng)策略（）廠商A1020廠商B1020練習(xí)：價(jià)格競(jìng)爭(zhēng)策略（15二、重復(fù)剔除的占優(yōu)均衡首先找出某一參與人的嚴(yán)格劣戰(zhàn)略，將它剔除掉，重新構(gòu)造一個(gè)不包括已剔除戰(zhàn)略的新的博弈，然后繼續(xù)剔除這個(gè)新的博弈中某一參與人的嚴(yán)格劣戰(zhàn)略，直到剩下唯一的參與人戰(zhàn)略組合為止。這個(gè)唯一剩下的參與人的戰(zhàn)略組合，就是博弈的均衡解，稱為“重復(fù)剔除的占優(yōu)戰(zhàn)略均衡”。二、重復(fù)剔除的占優(yōu)均衡首先找出某一參與人的嚴(yán)格劣16有一頭大豬和一頭小豬住在同一個(gè)豬圈里，豬圈的一側(cè)放者豬食槽，另一側(cè)安裝著一個(gè)控制食物供應(yīng)的按鈕。按一次按鈕，有8個(gè)單位的食物進(jìn)槽，但需承擔(dān)2個(gè)單位的成本。偌大豬小豬同時(shí)到達(dá)豬食槽，大豬吃到5個(gè)單位的食物，小豬吃到3個(gè)單位的食物；若大豬先到，大豬吃7個(gè)單位的食物，小豬只能吃到1個(gè)單位；若小豬先到，小豬吃到4個(gè)單位食物，大豬也吃到4個(gè)單位食物。例子：智豬博弈有一頭大豬和一頭小豬住在同一個(gè)豬圈里，豬例子：智豬博弈17007-12431大豬按等待小豬按等待小豬的理性選擇是“等待”，那么大豬就會(huì)正確的預(yù)測(cè)到小豬的選擇而將“等待”剔除，（按，等待）是該博弈的唯一均衡。大豬的收益外部化，小豬不勞而獲，免費(fèi)搭了大豬的便車。大豬按等待小豬按等待小豬的理性選擇是“等待”，那么大豬就會(huì)正183，67，15，1

8，26，06，2游戲者B

V游戲者AXYZ練習(xí)：尋找占優(yōu)戰(zhàn)略均衡？（）3，67，15，119三、納什均衡納什均衡是指這樣一種均衡狀態(tài)，在這一均衡狀態(tài)中，每一個(gè)參與人選擇的戰(zhàn)略必須是針對(duì)其他參與人選擇戰(zhàn)略的最優(yōu)反映，沒有人愿意獨(dú)立放棄他所選擇的戰(zhàn)略。納什均衡要求任何一個(gè)參與者在其他參與者的策略選擇給定的條件下，其選擇的策略是最優(yōu)的。在一個(gè)納什均衡里，任何一個(gè)參與者都不會(huì)改變自己的策略，如果其他參與者不改變策略。三、納什均衡納什均衡是指這樣一種均衡狀態(tài)，在這一均衡狀態(tài)中，20占優(yōu)策略均衡是比納什均衡更強(qiáng)的一個(gè)博弈均衡概念。占優(yōu)策略均衡要求任何一個(gè)參與者對(duì)于其他參與者任何策略選擇來說，其最優(yōu)策略都是唯一的。而納什均衡只要求任何一個(gè)參與者在其他參與者的策略選擇給定的條件下，其選擇的策略是最優(yōu)的。所以，占優(yōu)策略均衡一定是納什均衡，而納什均衡不一定就是占優(yōu)策略均衡。占優(yōu)策略均衡是比納什均衡更強(qiáng)的一個(gè)博弈均衡概念。21-1-1-900-9-7-7囚犯A坦白不坦白囚犯B坦白不坦白囚徒困境囚犯A坦白不坦白囚犯B坦白不坦白囚徒困境220，66，07，56，0

0，67，55，75，58，8游戲者B

VW游戲者AXYZ練習(xí)：尋找納什均衡？0，66，07，523囚徒困境的啟示個(gè)體理性與集體理性的矛盾?？梢越忉尩膯栴}：寡頭廠商關(guān)于價(jià)格、產(chǎn)量的博弈公共資源的供給問題軍備競(jìng)賽一種制度安排或一種體制選擇，要發(fā)生效力，它必須是納什均衡。否則，這種制度安排是不能成立的。囚徒困境的啟示個(gè)體理性與集體理性的矛盾。24例子：性別戰(zhàn)12000021男看足球看電影女看足球看電影例子：性別戰(zhàn)男看足球看電影女看足球看電影25納什均衡常常不是唯一的，在這種條件下，納什均衡的存在性并不意味著均衡結(jié)果會(huì)出現(xiàn)，即使結(jié)果是一個(gè)納什均衡，但也是我們無法準(zhǔn)確預(yù)測(cè)的；經(jīng)濟(jì)學(xué)家的建議是：可以增加更多的限制條件，如增加參與人的其他信息，使得納什均衡的數(shù)目減少，從而做出預(yù)測(cè)。納什均衡常常不是唯一的，在這種條件下，納什均衡的存在性并不意26納什均衡納什均衡是博弈的結(jié)局，在該均衡中每個(gè)局中人均不能因單方面改變自己的策略選擇而獲益。納什均衡是一個(gè)僵局：給定別人不動(dòng)的情況下，沒有人有興趣動(dòng)。納什均衡可以理解為一種具有自我強(qiáng)制力的協(xié)議，即這種協(xié)議沒有外加力量保證實(shí)施卻使每個(gè)參與者都自愿遵守，原因就在背叛協(xié)議無利可圖。納什均衡納什均衡是博弈的結(jié)局，在該均衡中每個(gè)局中人均不能因單27四、混合戰(zhàn)略納什均衡混合戰(zhàn)略指的是參與人以一定的概率鉆則某種戰(zhàn)略，導(dǎo)致其他人不能準(zhǔn)確的猜出它實(shí)際的選擇。甲乙兩個(gè)人玩同時(shí)擲硬幣游戲。兩人約定，如果兩枚硬幣正面或反面同時(shí)朝上，則甲付給乙1塊錢；如果出現(xiàn)一正一帆，則乙付給甲1塊錢。四、混合戰(zhàn)略納什均衡混合戰(zhàn)略指的是參與人以一定的28-111-11-1-11甲正面反面乙正面反面例子：猜硬幣甲正面反面乙正面反面例子：猜硬幣29如果每一個(gè)參與人完全清楚對(duì)手將會(huì)采取什么樣的戰(zhàn)略，則不會(huì)出現(xiàn)均衡。在實(shí)際博弈中，每個(gè)參與人都試圖猜中對(duì)方的戰(zhàn)略，然后自己采用相應(yīng)的戰(zhàn)略，因此雙方都以隨機(jī)的方法去出示硬幣是最安全的，也是最優(yōu)的。這樣一來，參與人的戰(zhàn)略選擇變成不確定的，是遵從某一概率分布的隨機(jī)選擇。假設(shè)參與人甲選擇正面的概率為p，選擇背面的概率為1-p;參與人乙選擇正面的概率為q，選擇背面的概率為1-q。參與人甲的收益是：如果每一個(gè)參與人完全清楚對(duì)手將會(huì)采取什么樣的戰(zhàn)略，則不會(huì)出現(xiàn)30這表明當(dāng)甲乙兩個(gè)人分別以50%的概率選擇正面和背面的次數(shù)時(shí)，對(duì)策達(dá)到了納什均衡。這表明當(dāng)甲乙兩個(gè)人分別以50%的概率選擇正面和背31第三節(jié)完全信息動(dòng)態(tài)博弈在上面的分析中，所有的對(duì)局者僅對(duì)抗一次，不會(huì)重復(fù)進(jìn)行。這是一種靜態(tài)博弈。但是在現(xiàn)實(shí)中，同樣結(jié)構(gòu)的博弈可能要重復(fù)許多次。在對(duì)局可以多次重復(fù)的情況下，每個(gè)對(duì)局者在選擇策略的時(shí)候，不僅需要考慮當(dāng)前的對(duì)局，可能還要考慮當(dāng)前選擇的策略對(duì)于以后的對(duì)局將產(chǎn)生什么影響。一、重復(fù)博弈第三節(jié)完全信息動(dòng)態(tài)博弈在上面的分析中，所有的對(duì)32如果博弈重復(fù)多次，每個(gè)參與人都有機(jī)會(huì)樹立合作的信譽(yù)，并鼓勵(lì)對(duì)方也樹立起合作的信譽(yù)以換取雙贏的機(jī)會(huì)。1451451803018030100100廠商A1020廠商B1020如果博弈重復(fù)多次，每個(gè)參與人都有機(jī)會(huì)樹立合作的信33二、序列博弈在實(shí)踐中，還存在著另一種情況，參與者的行動(dòng)有先后順序，而且后行動(dòng)的參與者在自己行動(dòng)之前可以觀測(cè)到先行動(dòng)者的行動(dòng)，并選擇相應(yīng)的戰(zhàn)略。這種博弈稱為序列博弈，是動(dòng)態(tài)博弈的一種形式。二、序列博弈在實(shí)踐中，還存在著另一種情況，參與者340001001000-50-50廠商A進(jìn)入不進(jìn)入廠商B進(jìn)入不進(jìn)入廠商A進(jìn)入不進(jìn)入廠商B進(jìn)入不進(jìn)入35ABB不進(jìn)入進(jìn)入不進(jìn)入不進(jìn)入進(jìn)入進(jìn)入（-50，-50）（100，0）（0，100）（0，0）ABB不進(jìn)入進(jìn)入不進(jìn)入不進(jìn)入進(jìn)入進(jìn)入（-50，-50）（1036第八章博弈論

要解決的問題：人們之間決策的相互作用、相互影響。第八章博弈論要解決的問題：人們之間決策的相互37

博弈論又稱為對(duì)策論或游戲論，是研究決策主體的行為發(fā)生直接相互作用時(shí)的決策以及這種決策的均衡問題。嚴(yán)格地說，博弈論并不是經(jīng)濟(jì)學(xué)的一個(gè)分支。它是一種方法，應(yīng)用范圍并不局限于經(jīng)濟(jì)學(xué)。在政治學(xué)、軍事學(xué)、外交學(xué)甚至犯罪學(xué)等多個(gè)領(lǐng)域都涉及到博弈論知識(shí)。實(shí)際上，它屬于數(shù)學(xué)知識(shí)。近20年來，博弈論在經(jīng)濟(jì)學(xué)中得到了廣泛的應(yīng)用，它對(duì)寡頭理論、信息經(jīng)濟(jì)學(xué)等方面的發(fā)展做出了重要貢獻(xiàn)。博弈論又稱為對(duì)策論或游戲論，是研究決策主體的行為381994年度的諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)授予三位從事對(duì)策論研究的經(jīng)濟(jì)學(xué)家：納什、澤爾騰、海薩尼。2005年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)授予有以色列和美國(guó)雙重國(guó)籍的羅伯特·奧曼和美國(guó)人托馬斯·謝林，以表彰他們通過博弈理論的分析增強(qiáng)世人對(duì)合作與沖突的理解。

博弈在經(jīng)濟(jì)學(xué)中應(yīng)用最廣、最成功，其根本原因是經(jīng)濟(jì)學(xué)和博弈論的研究模式是一樣的，都強(qiáng)調(diào)個(gè)人理性，即追求給定條件下效用最大化。1994年度的諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)授予三位從事對(duì)策論研39在一個(gè)博弈中，基本要素包括參與人或游戲者、行動(dòng)、信息、戰(zhàn)略、收益或支付、結(jié)果、均衡等。第一節(jié)博弈論基本概念一、博弈的基本要素在一個(gè)博弈中，基本要素包括參與人或游戲者、行動(dòng)、信40參與人(players)：指的是在博弈中選擇行動(dòng)以最大化自己效用的決策主體（可能是個(gè)人，也可能是團(tuán)體）。

行動(dòng)(actions)：指的是參與人的決策變量。

戰(zhàn)略(strategies)：參與人選擇行動(dòng)的規(guī)則，它告訴參與人在什么時(shí)候選擇什么行動(dòng)。

信息(Information)：指的是參與人在博弈中的知識(shí)，特別是有關(guān)其它參與人的特征和行動(dòng)的知識(shí)。

參與人(players)：指的是在博弈中選擇行動(dòng)以最大化自己41在每一個(gè)博弈中，都至少有兩個(gè)參與者，每一個(gè)參與者都有一組可選擇的策略。作為博弈的結(jié)局，每個(gè)參與者都得到各自的報(bào)酬。每一個(gè)參與者的報(bào)酬都是所有參與者各自所選擇的策略的共同作用的結(jié)果，或者說是所有參與者所采用的策略的函數(shù)——報(bào)酬函數(shù)或支付函數(shù)?？梢杂靡粋€(gè)支付矩陣來描述和分析一個(gè)博弈。在每一個(gè)博弈中，都至少有兩個(gè)參與者，每一個(gè)參與者都有一組可選42假定兩個(gè)嫌疑犯作案后被警察抓住,分別被關(guān)在不同的屋子里審訊。警察告訴他們:如果都坦白,兩人要被各判刑7年；如果都抵賴,兩人可以各判1年；如果一人坦白而另一人抵賴,則坦白的放出去,抵賴的要被判刑9年。囚徒困境假定兩個(gè)嫌疑犯作案后被警察抓住,分別被關(guān)在不同的屋子43-1-1-900-9-7-7囚犯A坦白不坦白囚犯B坦白不坦白戰(zhàn)略式表述囚犯A坦白不坦白囚犯B坦白不坦白戰(zhàn)略式表述44二、博弈的分類可以從不同的角度對(duì)博弈進(jìn)行分類1、雙人博弈和n人博弈根據(jù)局中人的數(shù)量，博弈可以劃分為雙人博弈和n人博弈2、合作博弈與非合作博弈二、博弈的分類可以從不同的角度對(duì)博弈進(jìn)行分類453、根據(jù)行動(dòng)的先后順序：靜態(tài)博弈：是指參與人同時(shí)行動(dòng)或不同時(shí)行動(dòng)，但后行動(dòng)者并不知道先行動(dòng)者采取了什么具體行動(dòng)。

—田忌賽馬、猜硬幣、古諾模型動(dòng)態(tài)博弈：是指參與人行動(dòng)有先后順序，且后行動(dòng)者能觀察到先行動(dòng)者所選擇的行動(dòng)。

—弈棋、市場(chǎng)進(jìn)入、斯塔克爾伯格模型3、根據(jù)行動(dòng)的先后順序：464、根據(jù)參與人掌握的信息完全信息博弈：每一個(gè)參與人對(duì)所有其他參與人（對(duì)手）的特征、戰(zhàn)略空間及支付函數(shù)有準(zhǔn)確的知識(shí)。不完全信息博弈：至少部分參與人不完全了解其他參與人的特征、戰(zhàn)略空間及支付函數(shù)的情況，也稱為“不對(duì)稱信息博弈”4、根據(jù)參與人掌握的信息完全信息博弈：每一個(gè)參與人對(duì)所有其他47

行動(dòng)順序

占優(yōu)戰(zhàn)略均衡是指參與人的最優(yōu)戰(zhàn)略不依賴于其他參與人的戰(zhàn)略選擇。不論其他參與人選擇什么戰(zhàn)略，他的最優(yōu)戰(zhàn)略是唯一的，這個(gè)最優(yōu)戰(zhàn)略被稱為占優(yōu)戰(zhàn)略。在一個(gè)博弈中，如果所有參與人都有占優(yōu)戰(zhàn)略，那么所有參與人的占優(yōu)戰(zhàn)略組合便是該博弈的唯一均衡，叫占優(yōu)戰(zhàn)略均衡。一、占優(yōu)戰(zhàn)略均衡第二節(jié)完全信息靜態(tài)博弈占優(yōu)戰(zhàn)略均衡是指參與人的49-1-1-900-9-7-7囚犯A坦白不坦白囚犯B坦白不坦白囚徒困境（）囚犯A坦白不坦白囚犯B坦白不坦白囚徒困境（501701608018020050150100廠商A1020廠商B1020練習(xí)：價(jià)格競(jìng)爭(zhēng)策略（）廠商A1020廠商B1020練習(xí)：價(jià)格競(jìng)爭(zhēng)策略（51二、重復(fù)剔除的占優(yōu)均衡首先找出某一參與人的嚴(yán)格劣戰(zhàn)略，將它剔除掉，重新構(gòu)造一個(gè)不包括已剔除戰(zhàn)略的新的博弈，然后繼續(xù)剔除這個(gè)新的博弈中某一參與人的嚴(yán)格劣戰(zhàn)略，直到剩下唯一的參與人戰(zhàn)略組合為止。這個(gè)唯一剩下的參與人的戰(zhàn)略組合，就是博弈的均衡解，稱為“重復(fù)剔除的占優(yōu)戰(zhàn)略均衡”。二、重復(fù)剔除的占優(yōu)均衡首先找出某一參與人的嚴(yán)格劣52有一頭大豬和一頭小豬住在同一個(gè)豬圈里，豬圈的一側(cè)放者豬食槽，另一側(cè)安裝著一個(gè)控制食物供應(yīng)的按鈕。按一次按鈕，有8個(gè)單位的食物進(jìn)槽，但需承擔(dān)2個(gè)單位的成本。偌大豬小豬同時(shí)到達(dá)豬食槽，大豬吃到5個(gè)單位的食物，小豬吃到3個(gè)單位的食物；若大豬先到，大豬吃7個(gè)單位的食物，小豬只能吃到1個(gè)單位；若小豬先到，小豬吃到4個(gè)單位食物，大豬也吃到4個(gè)單位食物。例子：智豬博弈有一頭大豬和一頭小豬住在同一個(gè)豬圈里，豬例子：智豬博弈53007-12431大豬按等待小豬按等待小豬的理性選擇是“等待”，那么大豬就會(huì)正確的預(yù)測(cè)到小豬的選擇而將“等待”剔除，（按，等待）是該博弈的唯一均衡。大豬的收益外部化，小豬不勞而獲，免費(fèi)搭了大豬的便車。大豬按等待小豬按等待小豬的理性選擇是“等待”，那么大豬就會(huì)正543，67，15，1

8，26，06，2游戲者B

V游戲者AXYZ練習(xí)：尋找占優(yōu)戰(zhàn)略均衡？（）3，67，15，155三、納什均衡納什均衡是指這樣一種均衡狀態(tài)，在這一均衡狀態(tài)中，每一個(gè)參與人選擇的戰(zhàn)略必須是針對(duì)其他參與人選擇戰(zhàn)略的最優(yōu)反映，沒有人愿意獨(dú)立放棄他所選擇的戰(zhàn)略。納什均衡要求任何一個(gè)參與者在其他參與者的策略選擇給定的條件下，其選擇的策略是最優(yōu)的。在一個(gè)納什均衡里，任何一個(gè)參與者都不會(huì)改變自己的策略，如果其他參與者不改變策略。三、納什均衡納什均衡是指這樣一種均衡狀態(tài)，在這一均衡狀態(tài)中，56占優(yōu)策略均衡是比納什均衡更強(qiáng)的一個(gè)博弈均衡概念。占優(yōu)策略均衡要求任何一個(gè)參與者對(duì)于其他參與者任何策略選擇來說，其最優(yōu)策略都是唯一的。而納什均衡只要求任何一個(gè)參與者在其他參與者的策略選擇給定的條件下，其選擇的策略是最優(yōu)的。所以，占優(yōu)策略均衡一定是納什均衡，而納什均衡不一定就是占優(yōu)策略均衡。占優(yōu)策略均衡是比納什均衡更強(qiáng)的一個(gè)博弈均衡概念。57-1-1-900-9-7-7囚犯A坦白不坦白囚犯B坦白不坦白囚徒困境囚犯A坦白不坦白囚犯B坦白不坦白囚徒困境580，66，07，56，0

0，67，55，75，58，8游戲者B

VW游戲者AXYZ練習(xí)：尋找納什均衡？0，66，07，559囚徒困境的啟示個(gè)體理性與集體理性的矛盾?？梢越忉尩膯栴}：寡頭廠商關(guān)于價(jià)格、產(chǎn)量的博弈公共資源的供給問題軍備競(jìng)賽一種制度安排或一種體制選擇，要發(fā)生效力，它必須是納什均衡。否則，這種制度安排是不能成立的。囚徒困境的啟示個(gè)體理性與集體理性的矛盾。60例子：性別戰(zhàn)12000021男看足球看電影女看足球看電影例子：性別戰(zhàn)男看足球看電影女看足球看電影61納什均衡常常不是唯一的，在這種條件下，納什均衡的存在性并不意味著均衡結(jié)果會(huì)出現(xiàn)，即使結(jié)果是一個(gè)納什均衡，但也是我們無法準(zhǔn)確預(yù)測(cè)的；經(jīng)濟(jì)學(xué)家的建議是：可以增加更多的限制條件，如增加參與人的其他信息，使得納什均衡的數(shù)目減少，從而做出預(yù)測(cè)。納什均衡常常不是唯一的，在這種條件下，納什均衡的存在性并不意62納什均衡納什均衡是博弈的結(jié)局，在該均衡中每個(gè)局中人均不能因單方面改變自己的策略選擇而獲益。納什均衡是一個(gè)僵局：給定別人不動(dòng)的情況下，沒有人有興趣動(dòng)。納什均衡可以理解為一種具有自我強(qiáng)制力的協(xié)議，即這種協(xié)議沒有外加力量保證實(shí)施卻使每個(gè)參與者都自愿遵守，原因就在背叛協(xié)議無利可圖。納什均衡納什均衡是博弈的結(jié)局，在該均衡中每個(gè)局中人均不能因單63四、混合戰(zhàn)略納什均衡混合戰(zhàn)略指的是參與人以一定的概率鉆則某種戰(zhàn)略，導(dǎo)致其他人不能準(zhǔn)確的猜出它實(shí)際的選擇。甲乙兩個(gè)人玩同時(shí)擲硬幣游戲。兩人約定，如果兩枚硬幣正面或反面同時(shí)朝上，則甲付給乙1塊錢；如果出現(xiàn)一正一帆，則乙

人人文庫> 全部分類> 教育資料 > 輔導(dǎo)培訓(xùn)

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

微觀經(jīng)濟(jì)學(xué) 第9章課件

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

微觀經(jīng)濟(jì)學(xué) 第9章課件

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔