微觀經(jīng)濟(jì)學(xué) 第9章課件_第1頁
微觀經(jīng)濟(jì)學(xué) 第9章課件_第2頁
微觀經(jīng)濟(jì)學(xué) 第9章課件_第3頁
微觀經(jīng)濟(jì)學(xué) 第9章課件_第4頁
微觀經(jīng)濟(jì)學(xué) 第9章課件_第5頁
已閱讀5頁,還剩67頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第八章博弈論

要解決的問題:人們之間決策的相互作用、相互影響。第八章博弈論要解決的問題:人們之間決策的相互1

博弈論又稱為對(duì)策論或游戲論,是研究決策主體的行為發(fā)生直接相互作用時(shí)的決策以及這種決策的均衡問題。嚴(yán)格地說,博弈論并不是經(jīng)濟(jì)學(xué)的一個(gè)分支。它是一種方法,應(yīng)用范圍并不局限于經(jīng)濟(jì)學(xué)。在政治學(xué)、軍事學(xué)、外交學(xué)甚至犯罪學(xué)等多個(gè)領(lǐng)域都涉及到博弈論知識(shí)。實(shí)際上,它屬于數(shù)學(xué)知識(shí)。近20年來,博弈論在經(jīng)濟(jì)學(xué)中得到了廣泛的應(yīng)用,它對(duì)寡頭理論、信息經(jīng)濟(jì)學(xué)等方面的發(fā)展做出了重要貢獻(xiàn)。博弈論又稱為對(duì)策論或游戲論,是研究決策主體的行為21994年度的諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)授予三位從事對(duì)策論研究的經(jīng)濟(jì)學(xué)家:納什、澤爾騰、海薩尼。2005年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)授予有以色列和美國(guó)雙重國(guó)籍的羅伯特·奧曼和美國(guó)人托馬斯·謝林,以表彰他們通過博弈理論的分析增強(qiáng)世人對(duì)合作與沖突的理解。

博弈在經(jīng)濟(jì)學(xué)中應(yīng)用最廣、最成功,其根本原因是經(jīng)濟(jì)學(xué)和博弈論的研究模式是一樣的,都強(qiáng)調(diào)個(gè)人理性,即追求給定條件下效用最大化。1994年度的諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)授予三位從事對(duì)策論研3在一個(gè)博弈中,基本要素包括參與人或游戲者、行動(dòng)、信息、戰(zhàn)略、收益或支付、結(jié)果、均衡等。第一節(jié)博弈論基本概念一、博弈的基本要素在一個(gè)博弈中,基本要素包括參與人或游戲者、行動(dòng)、信4參與人(players):指的是在博弈中選擇行動(dòng)以最大化自己效用的決策主體(可能是個(gè)人,也可能是團(tuán)體)。

行動(dòng)(actions):指的是參與人的決策變量。

戰(zhàn)略(strategies):參與人選擇行動(dòng)的規(guī)則,它告訴參與人在什么時(shí)候選擇什么行動(dòng)。

信息(Information):指的是參與人在博弈中的知識(shí),特別是有關(guān)其它參與人的特征和行動(dòng)的知識(shí)。

參與人(players):指的是在博弈中選擇行動(dòng)以最大化自己5在每一個(gè)博弈中,都至少有兩個(gè)參與者,每一個(gè)參與者都有一組可選擇的策略。作為博弈的結(jié)局,每個(gè)參與者都得到各自的報(bào)酬。每一個(gè)參與者的報(bào)酬都是所有參與者各自所選擇的策略的共同作用的結(jié)果,或者說是所有參與者所采用的策略的函數(shù)——報(bào)酬函數(shù)或支付函數(shù)??梢杂靡粋€(gè)支付矩陣來描述和分析一個(gè)博弈。在每一個(gè)博弈中,都至少有兩個(gè)參與者,每一個(gè)參與者都有一組可選6假定兩個(gè)嫌疑犯作案后被警察抓住,分別被關(guān)在不同的屋子里審訊。警察告訴他們:如果都坦白,兩人要被各判刑7年;如果都抵賴,兩人可以各判1年;如果一人坦白而另一人抵賴,則坦白的放出去,抵賴的要被判刑9年。囚徒困境假定兩個(gè)嫌疑犯作案后被警察抓住,分別被關(guān)在不同的屋子7-1-1-900-9-7-7囚犯A坦白不坦白囚犯B坦白不坦白戰(zhàn)略式表述囚犯A坦白不坦白囚犯B坦白不坦白戰(zhàn)略式表述8二、博弈的分類可以從不同的角度對(duì)博弈進(jìn)行分類1、雙人博弈和n人博弈根據(jù)局中人的數(shù)量,博弈可以劃分為雙人博弈和n人博弈2、合作博弈與非合作博弈二、博弈的分類可以從不同的角度對(duì)博弈進(jìn)行分類93、根據(jù)行動(dòng)的先后順序:靜態(tài)博弈:是指參與人同時(shí)行動(dòng)或不同時(shí)行動(dòng),但后行動(dòng)者并不知道先行動(dòng)者采取了什么具體行動(dòng)。

—田忌賽馬、猜硬幣、古諾模型動(dòng)態(tài)博弈:是指參與人行動(dòng)有先后順序,且后行動(dòng)者能觀察到先行動(dòng)者所選擇的行動(dòng)。

—弈棋、市場(chǎng)進(jìn)入、斯塔克爾伯格模型3、根據(jù)行動(dòng)的先后順序:104、根據(jù)參與人掌握的信息完全信息博弈:每一個(gè)參與人對(duì)所有其他參與人(對(duì)手)的特征、戰(zhàn)略空間及支付函數(shù)有準(zhǔn)確的知識(shí)。不完全信息博弈:至少部分參與人不完全了解其他參與人的特征、戰(zhàn)略空間及支付函數(shù)的情況,也稱為“不對(duì)稱信息博弈”4、根據(jù)參與人掌握的信息完全信息博弈:每一個(gè)參與人對(duì)所有其他11

行動(dòng)順序

信息靜態(tài)動(dòng)態(tài)完全信息完全信息靜態(tài)博弈納什均衡納什完全信息動(dòng)態(tài)博弈子博弈精煉納什均衡澤爾騰不完全信息不完全信息靜態(tài)博弈貝葉斯納什均衡海薩尼不完全信息動(dòng)態(tài)博弈精煉貝葉斯納什均衡澤爾騰、克瑞普斯、威爾遜、泰勒爾行動(dòng)順序靜態(tài)動(dòng)態(tài)完全完全信息靜態(tài)博弈完全信息動(dòng)態(tài)博12第二節(jié)完全信息靜態(tài)博弈

占優(yōu)戰(zhàn)略均衡是指參與人的最優(yōu)戰(zhàn)略不依賴于其他參與人的戰(zhàn)略選擇。不論其他參與人選擇什么戰(zhàn)略,他的最優(yōu)戰(zhàn)略是唯一的,這個(gè)最優(yōu)戰(zhàn)略被稱為占優(yōu)戰(zhàn)略。在一個(gè)博弈中,如果所有參與人都有占優(yōu)戰(zhàn)略,那么所有參與人的占優(yōu)戰(zhàn)略組合便是該博弈的唯一均衡,叫占優(yōu)戰(zhàn)略均衡。一、占優(yōu)戰(zhàn)略均衡第二節(jié)完全信息靜態(tài)博弈占優(yōu)戰(zhàn)略均衡是指參與人的13-1-1-900-9-7-7囚犯A坦白不坦白囚犯B坦白不坦白囚徒困境()囚犯A坦白不坦白囚犯B坦白不坦白囚徒困境(141701608018020050150100廠商A1020廠商B1020練習(xí):價(jià)格競(jìng)爭(zhēng)策略()廠商A1020廠商B1020練習(xí):價(jià)格競(jìng)爭(zhēng)策略(15二、重復(fù)剔除的占優(yōu)均衡首先找出某一參與人的嚴(yán)格劣戰(zhàn)略,將它剔除掉,重新構(gòu)造一個(gè)不包括已剔除戰(zhàn)略的新的博弈,然后繼續(xù)剔除這個(gè)新的博弈中某一參與人的嚴(yán)格劣戰(zhàn)略,直到剩下唯一的參與人戰(zhàn)略組合為止。這個(gè)唯一剩下的參與人的戰(zhàn)略組合,就是博弈的均衡解,稱為“重復(fù)剔除的占優(yōu)戰(zhàn)略均衡”。二、重復(fù)剔除的占優(yōu)均衡首先找出某一參與人的嚴(yán)格劣16有一頭大豬和一頭小豬住在同一個(gè)豬圈里,豬圈的一側(cè)放者豬食槽,另一側(cè)安裝著一個(gè)控制食物供應(yīng)的按鈕。按一次按鈕,有8個(gè)單位的食物進(jìn)槽,但需承擔(dān)2個(gè)單位的成本。偌大豬小豬同時(shí)到達(dá)豬食槽,大豬吃到5個(gè)單位的食物,小豬吃到3個(gè)單位的食物;若大豬先到,大豬吃7個(gè)單位的食物,小豬只能吃到1個(gè)單位;若小豬先到,小豬吃到4個(gè)單位食物,大豬也吃到4個(gè)單位食物。例子:智豬博弈有一頭大豬和一頭小豬住在同一個(gè)豬圈里,豬例子:智豬博弈17007-12431大豬按等待小豬按等待小豬的理性選擇是“等待”,那么大豬就會(huì)正確的預(yù)測(cè)到小豬的選擇而將“等待”剔除,(按,等待)是該博弈的唯一均衡。大豬的收益外部化,小豬不勞而獲,免費(fèi)搭了大豬的便車。大豬按等待小豬按等待小豬的理性選擇是“等待”,那么大豬就會(huì)正183,67,15,1

8,26,06,2游戲者B

U

V游戲者AXYZ練習(xí):尋找占優(yōu)戰(zhàn)略均衡?()3,67,15,119三、納什均衡納什均衡是指這樣一種均衡狀態(tài),在這一均衡狀態(tài)中,每一個(gè)參與人選擇的戰(zhàn)略必須是針對(duì)其他參與人選擇戰(zhàn)略的最優(yōu)反映,沒有人愿意獨(dú)立放棄他所選擇的戰(zhàn)略。納什均衡要求任何一個(gè)參與者在其他參與者的策略選擇給定的條件下,其選擇的策略是最優(yōu)的。在一個(gè)納什均衡里,任何一個(gè)參與者都不會(huì)改變自己的策略,如果其他參與者不改變策略。三、納什均衡納什均衡是指這樣一種均衡狀態(tài),在這一均衡狀態(tài)中,20占優(yōu)策略均衡是比納什均衡更強(qiáng)的一個(gè)博弈均衡概念。占優(yōu)策略均衡要求任何一個(gè)參與者對(duì)于其他參與者任何策略選擇來說,其最優(yōu)策略都是唯一的。而納什均衡只要求任何一個(gè)參與者在其他參與者的策略選擇給定的條件下,其選擇的策略是最優(yōu)的。所以,占優(yōu)策略均衡一定是納什均衡,而納什均衡不一定就是占優(yōu)策略均衡。占優(yōu)策略均衡是比納什均衡更強(qiáng)的一個(gè)博弈均衡概念。21-1-1-900-9-7-7囚犯A坦白不坦白囚犯B坦白不坦白囚徒困境囚犯A坦白不坦白囚犯B坦白不坦白囚徒困境220,66,07,56,0

0,67,55,75,58,8游戲者B

U

VW游戲者AXYZ練習(xí):尋找納什均衡?0,66,07,523囚徒困境的啟示個(gè)體理性與集體理性的矛盾??梢越忉尩膯栴}:寡頭廠商關(guān)于價(jià)格、產(chǎn)量的博弈公共資源的供給問題軍備競(jìng)賽一種制度安排或一種體制選擇,要發(fā)生效力,它必須是納什均衡。否則,這種制度安排是不能成立的。囚徒困境的啟示個(gè)體理性與集體理性的矛盾。24例子:性別戰(zhàn)12000021男看足球看電影女看足球看電影例子:性別戰(zhàn)男看足球看電影女看足球看電影25納什均衡常常不是唯一的,在這種條件下,納什均衡的存在性并不意味著均衡結(jié)果會(huì)出現(xiàn),即使結(jié)果是一個(gè)納什均衡,但也是我們無法準(zhǔn)確預(yù)測(cè)的;經(jīng)濟(jì)學(xué)家的建議是:可以增加更多的限制條件,如增加參與人的其他信息,使得納什均衡的數(shù)目減少,從而做出預(yù)測(cè)。納什均衡常常不是唯一的,在這種條件下,納什均衡的存在性并不意26納什均衡納什均衡是博弈的結(jié)局,在該均衡中每個(gè)局中人均不能因單方面改變自己的策略選擇而獲益。納什均衡是一個(gè)僵局:給定別人不動(dòng)的情況下,沒有人有興趣動(dòng)。納什均衡可以理解為一種具有自我強(qiáng)制力的協(xié)議,即這種協(xié)議沒有外加力量保證實(shí)施卻使每個(gè)參與者都自愿遵守,原因就在背叛協(xié)議無利可圖。納什均衡納什均衡是博弈的結(jié)局,在該均衡中每個(gè)局中人均不能因單27四、混合戰(zhàn)略納什均衡混合戰(zhàn)略指的是參與人以一定的概率鉆則某種戰(zhàn)略,導(dǎo)致其他人不能準(zhǔn)確的猜出它實(shí)際的選擇。甲乙兩個(gè)人玩同時(shí)擲硬幣游戲。兩人約定,如果兩枚硬幣正面或反面同時(shí)朝上,則甲付給乙1塊錢;如果出現(xiàn)一正一帆,則乙付給甲1塊錢。四、混合戰(zhàn)略納什均衡混合戰(zhàn)略指的是參與人以一定的28-111-11-1-11甲正面反面乙正面反面例子:猜硬幣甲正面反面乙正面反面例子:猜硬幣29如果每一個(gè)參與人完全清楚對(duì)手將會(huì)采取什么樣的戰(zhàn)略,則不會(huì)出現(xiàn)均衡。在實(shí)際博弈中,每個(gè)參與人都試圖猜中對(duì)方的戰(zhàn)略,然后自己采用相應(yīng)的戰(zhàn)略,因此雙方都以隨機(jī)的方法去出示硬幣是最安全的,也是最優(yōu)的。這樣一來,參與人的戰(zhàn)略選擇變成不確定的,是遵從某一概率分布的隨機(jī)選擇。假設(shè)參與人甲選擇正面的概率為p,選擇背面的概率為1-p;參與人乙選擇正面的概率為q,選擇背面的概率為1-q。參與人甲的收益是:如果每一個(gè)參與人完全清楚對(duì)手將會(huì)采取什么樣的戰(zhàn)略,則不會(huì)出現(xiàn)30這表明當(dāng)甲乙兩個(gè)人分別以50%的概率選擇正面和背面的次數(shù)時(shí),對(duì)策達(dá)到了納什均衡。這表明當(dāng)甲乙兩個(gè)人分別以50%的概率選擇正面和背31第三節(jié)完全信息動(dòng)態(tài)博弈在上面的分析中,所有的對(duì)局者僅對(duì)抗一次,不會(huì)重復(fù)進(jìn)行。這是一種靜態(tài)博弈。但是在現(xiàn)實(shí)中,同樣結(jié)構(gòu)的博弈可能要重復(fù)許多次。在對(duì)局可以多次重復(fù)的情況下,每個(gè)對(duì)局者在選擇策略的時(shí)候,不僅需要考慮當(dāng)前的對(duì)局,可能還要考慮當(dāng)前選擇的策略對(duì)于以后的對(duì)局將產(chǎn)生什么影響。一、重復(fù)博弈第三節(jié)完全信息動(dòng)態(tài)博弈在上面的分析中,所有的對(duì)32如果博弈重復(fù)多次,每個(gè)參與人都有機(jī)會(huì)樹立合作的信譽(yù),并鼓勵(lì)對(duì)方也樹立起合作的信譽(yù)以換取雙贏的機(jī)會(huì)。1451451803018030100100廠商A1020廠商B1020如果博弈重復(fù)多次,每個(gè)參與人都有機(jī)會(huì)樹立合作的信33二、序列博弈在實(shí)踐中,還存在著另一種情況,參與者的行動(dòng)有先后順序,而且后行動(dòng)的參與者在自己行動(dòng)之前可以觀測(cè)到先行動(dòng)者的行動(dòng),并選擇相應(yīng)的戰(zhàn)略。這種博弈稱為序列博弈,是動(dòng)態(tài)博弈的一種形式。二、序列博弈在實(shí)踐中,還存在著另一種情況,參與者340001001000-50-50廠商A進(jìn)入不進(jìn)入廠商B進(jìn)入不進(jìn)入廠商A進(jìn)入不進(jìn)入廠商B進(jìn)入不進(jìn)入35ABB不進(jìn)入進(jìn)入不進(jìn)入不進(jìn)入進(jìn)入進(jìn)入(-50,-50)(100,0)(0,100)(0,0)ABB不進(jìn)入進(jìn)入不進(jìn)入不進(jìn)入進(jìn)入進(jìn)入(-50,-50)(1036第八章博弈論

要解決的問題:人們之間決策的相互作用、相互影響。第八章博弈論要解決的問題:人們之間決策的相互37

博弈論又稱為對(duì)策論或游戲論,是研究決策主體的行為發(fā)生直接相互作用時(shí)的決策以及這種決策的均衡問題。嚴(yán)格地說,博弈論并不是經(jīng)濟(jì)學(xué)的一個(gè)分支。它是一種方法,應(yīng)用范圍并不局限于經(jīng)濟(jì)學(xué)。在政治學(xué)、軍事學(xué)、外交學(xué)甚至犯罪學(xué)等多個(gè)領(lǐng)域都涉及到博弈論知識(shí)。實(shí)際上,它屬于數(shù)學(xué)知識(shí)。近20年來,博弈論在經(jīng)濟(jì)學(xué)中得到了廣泛的應(yīng)用,它對(duì)寡頭理論、信息經(jīng)濟(jì)學(xué)等方面的發(fā)展做出了重要貢獻(xiàn)。博弈論又稱為對(duì)策論或游戲論,是研究決策主體的行為381994年度的諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)授予三位從事對(duì)策論研究的經(jīng)濟(jì)學(xué)家:納什、澤爾騰、海薩尼。2005年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)授予有以色列和美國(guó)雙重國(guó)籍的羅伯特·奧曼和美國(guó)人托馬斯·謝林,以表彰他們通過博弈理論的分析增強(qiáng)世人對(duì)合作與沖突的理解。

博弈在經(jīng)濟(jì)學(xué)中應(yīng)用最廣、最成功,其根本原因是經(jīng)濟(jì)學(xué)和博弈論的研究模式是一樣的,都強(qiáng)調(diào)個(gè)人理性,即追求給定條件下效用最大化。1994年度的諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)授予三位從事對(duì)策論研39在一個(gè)博弈中,基本要素包括參與人或游戲者、行動(dòng)、信息、戰(zhàn)略、收益或支付、結(jié)果、均衡等。第一節(jié)博弈論基本概念一、博弈的基本要素在一個(gè)博弈中,基本要素包括參與人或游戲者、行動(dòng)、信40參與人(players):指的是在博弈中選擇行動(dòng)以最大化自己效用的決策主體(可能是個(gè)人,也可能是團(tuán)體)。

行動(dòng)(actions):指的是參與人的決策變量。

戰(zhàn)略(strategies):參與人選擇行動(dòng)的規(guī)則,它告訴參與人在什么時(shí)候選擇什么行動(dòng)。

信息(Information):指的是參與人在博弈中的知識(shí),特別是有關(guān)其它參與人的特征和行動(dòng)的知識(shí)。

參與人(players):指的是在博弈中選擇行動(dòng)以最大化自己41在每一個(gè)博弈中,都至少有兩個(gè)參與者,每一個(gè)參與者都有一組可選擇的策略。作為博弈的結(jié)局,每個(gè)參與者都得到各自的報(bào)酬。每一個(gè)參與者的報(bào)酬都是所有參與者各自所選擇的策略的共同作用的結(jié)果,或者說是所有參與者所采用的策略的函數(shù)——報(bào)酬函數(shù)或支付函數(shù)??梢杂靡粋€(gè)支付矩陣來描述和分析一個(gè)博弈。在每一個(gè)博弈中,都至少有兩個(gè)參與者,每一個(gè)參與者都有一組可選42假定兩個(gè)嫌疑犯作案后被警察抓住,分別被關(guān)在不同的屋子里審訊。警察告訴他們:如果都坦白,兩人要被各判刑7年;如果都抵賴,兩人可以各判1年;如果一人坦白而另一人抵賴,則坦白的放出去,抵賴的要被判刑9年。囚徒困境假定兩個(gè)嫌疑犯作案后被警察抓住,分別被關(guān)在不同的屋子43-1-1-900-9-7-7囚犯A坦白不坦白囚犯B坦白不坦白戰(zhàn)略式表述囚犯A坦白不坦白囚犯B坦白不坦白戰(zhàn)略式表述44二、博弈的分類可以從不同的角度對(duì)博弈進(jìn)行分類1、雙人博弈和n人博弈根據(jù)局中人的數(shù)量,博弈可以劃分為雙人博弈和n人博弈2、合作博弈與非合作博弈二、博弈的分類可以從不同的角度對(duì)博弈進(jìn)行分類453、根據(jù)行動(dòng)的先后順序:靜態(tài)博弈:是指參與人同時(shí)行動(dòng)或不同時(shí)行動(dòng),但后行動(dòng)者并不知道先行動(dòng)者采取了什么具體行動(dòng)。

—田忌賽馬、猜硬幣、古諾模型動(dòng)態(tài)博弈:是指參與人行動(dòng)有先后順序,且后行動(dòng)者能觀察到先行動(dòng)者所選擇的行動(dòng)。

—弈棋、市場(chǎng)進(jìn)入、斯塔克爾伯格模型3、根據(jù)行動(dòng)的先后順序:464、根據(jù)參與人掌握的信息完全信息博弈:每一個(gè)參與人對(duì)所有其他參與人(對(duì)手)的特征、戰(zhàn)略空間及支付函數(shù)有準(zhǔn)確的知識(shí)。不完全信息博弈:至少部分參與人不完全了解其他參與人的特征、戰(zhàn)略空間及支付函數(shù)的情況,也稱為“不對(duì)稱信息博弈”4、根據(jù)參與人掌握的信息完全信息博弈:每一個(gè)參與人對(duì)所有其他47

行動(dòng)順序

信息靜態(tài)動(dòng)態(tài)完全信息完全信息靜態(tài)博弈納什均衡納什完全信息動(dòng)態(tài)博弈子博弈精煉納什均衡澤爾騰不完全信息不完全信息靜態(tài)博弈貝葉斯納什均衡海薩尼不完全信息動(dòng)態(tài)博弈精煉貝葉斯納什均衡澤爾騰、克瑞普斯、威爾遜、泰勒爾行動(dòng)順序靜態(tài)動(dòng)態(tài)完全完全信息靜態(tài)博弈完全信息動(dòng)態(tài)博48第二節(jié)完全信息靜態(tài)博弈

占優(yōu)戰(zhàn)略均衡是指參與人的最優(yōu)戰(zhàn)略不依賴于其他參與人的戰(zhàn)略選擇。不論其他參與人選擇什么戰(zhàn)略,他的最優(yōu)戰(zhàn)略是唯一的,這個(gè)最優(yōu)戰(zhàn)略被稱為占優(yōu)戰(zhàn)略。在一個(gè)博弈中,如果所有參與人都有占優(yōu)戰(zhàn)略,那么所有參與人的占優(yōu)戰(zhàn)略組合便是該博弈的唯一均衡,叫占優(yōu)戰(zhàn)略均衡。一、占優(yōu)戰(zhàn)略均衡第二節(jié)完全信息靜態(tài)博弈占優(yōu)戰(zhàn)略均衡是指參與人的49-1-1-900-9-7-7囚犯A坦白不坦白囚犯B坦白不坦白囚徒困境()囚犯A坦白不坦白囚犯B坦白不坦白囚徒困境(501701608018020050150100廠商A1020廠商B1020練習(xí):價(jià)格競(jìng)爭(zhēng)策略()廠商A1020廠商B1020練習(xí):價(jià)格競(jìng)爭(zhēng)策略(51二、重復(fù)剔除的占優(yōu)均衡首先找出某一參與人的嚴(yán)格劣戰(zhàn)略,將它剔除掉,重新構(gòu)造一個(gè)不包括已剔除戰(zhàn)略的新的博弈,然后繼續(xù)剔除這個(gè)新的博弈中某一參與人的嚴(yán)格劣戰(zhàn)略,直到剩下唯一的參與人戰(zhàn)略組合為止。這個(gè)唯一剩下的參與人的戰(zhàn)略組合,就是博弈的均衡解,稱為“重復(fù)剔除的占優(yōu)戰(zhàn)略均衡”。二、重復(fù)剔除的占優(yōu)均衡首先找出某一參與人的嚴(yán)格劣52有一頭大豬和一頭小豬住在同一個(gè)豬圈里,豬圈的一側(cè)放者豬食槽,另一側(cè)安裝著一個(gè)控制食物供應(yīng)的按鈕。按一次按鈕,有8個(gè)單位的食物進(jìn)槽,但需承擔(dān)2個(gè)單位的成本。偌大豬小豬同時(shí)到達(dá)豬食槽,大豬吃到5個(gè)單位的食物,小豬吃到3個(gè)單位的食物;若大豬先到,大豬吃7個(gè)單位的食物,小豬只能吃到1個(gè)單位;若小豬先到,小豬吃到4個(gè)單位食物,大豬也吃到4個(gè)單位食物。例子:智豬博弈有一頭大豬和一頭小豬住在同一個(gè)豬圈里,豬例子:智豬博弈53007-12431大豬按等待小豬按等待小豬的理性選擇是“等待”,那么大豬就會(huì)正確的預(yù)測(cè)到小豬的選擇而將“等待”剔除,(按,等待)是該博弈的唯一均衡。大豬的收益外部化,小豬不勞而獲,免費(fèi)搭了大豬的便車。大豬按等待小豬按等待小豬的理性選擇是“等待”,那么大豬就會(huì)正543,67,15,1

8,26,06,2游戲者B

U

V游戲者AXYZ練習(xí):尋找占優(yōu)戰(zhàn)略均衡?()3,67,15,155三、納什均衡納什均衡是指這樣一種均衡狀態(tài),在這一均衡狀態(tài)中,每一個(gè)參與人選擇的戰(zhàn)略必須是針對(duì)其他參與人選擇戰(zhàn)略的最優(yōu)反映,沒有人愿意獨(dú)立放棄他所選擇的戰(zhàn)略。納什均衡要求任何一個(gè)參與者在其他參與者的策略選擇給定的條件下,其選擇的策略是最優(yōu)的。在一個(gè)納什均衡里,任何一個(gè)參與者都不會(huì)改變自己的策略,如果其他參與者不改變策略。三、納什均衡納什均衡是指這樣一種均衡狀態(tài),在這一均衡狀態(tài)中,56占優(yōu)策略均衡是比納什均衡更強(qiáng)的一個(gè)博弈均衡概念。占優(yōu)策略均衡要求任何一個(gè)參與者對(duì)于其他參與者任何策略選擇來說,其最優(yōu)策略都是唯一的。而納什均衡只要求任何一個(gè)參與者在其他參與者的策略選擇給定的條件下,其選擇的策略是最優(yōu)的。所以,占優(yōu)策略均衡一定是納什均衡,而納什均衡不一定就是占優(yōu)策略均衡。占優(yōu)策略均衡是比納什均衡更強(qiáng)的一個(gè)博弈均衡概念。57-1-1-900-9-7-7囚犯A坦白不坦白囚犯B坦白不坦白囚徒困境囚犯A坦白不坦白囚犯B坦白不坦白囚徒困境580,66,07,56,0

0,67,55,75,58,8游戲者B

U

VW游戲者AXYZ練習(xí):尋找納什均衡?0,66,07,559囚徒困境的啟示個(gè)體理性與集體理性的矛盾??梢越忉尩膯栴}:寡頭廠商關(guān)于價(jià)格、產(chǎn)量的博弈公共資源的供給問題軍備競(jìng)賽一種制度安排或一種體制選擇,要發(fā)生效力,它必須是納什均衡。否則,這種制度安排是不能成立的。囚徒困境的啟示個(gè)體理性與集體理性的矛盾。60例子:性別戰(zhàn)12000021男看足球看電影女看足球看電影例子:性別戰(zhàn)男看足球看電影女看足球看電影61納什均衡常常不是唯一的,在這種條件下,納什均衡的存在性并不意味著均衡結(jié)果會(huì)出現(xiàn),即使結(jié)果是一個(gè)納什均衡,但也是我們無法準(zhǔn)確預(yù)測(cè)的;經(jīng)濟(jì)學(xué)家的建議是:可以增加更多的限制條件,如增加參與人的其他信息,使得納什均衡的數(shù)目減少,從而做出預(yù)測(cè)。納什均衡常常不是唯一的,在這種條件下,納什均衡的存在性并不意62納什均衡納什均衡是博弈的結(jié)局,在該均衡中每個(gè)局中人均不能因單方面改變自己的策略選擇而獲益。納什均衡是一個(gè)僵局:給定別人不動(dòng)的情況下,沒有人有興趣動(dòng)。納什均衡可以理解為一種具有自我強(qiáng)制力的協(xié)議,即這種協(xié)議沒有外加力量保證實(shí)施卻使每個(gè)參與者都自愿遵守,原因就在背叛協(xié)議無利可圖。納什均衡納什均衡是博弈的結(jié)局,在該均衡中每個(gè)局中人均不能因單63四、混合戰(zhàn)略納什均衡混合戰(zhàn)略指的是參與人以一定的概率鉆則某種戰(zhàn)略,導(dǎo)致其他人不能準(zhǔn)確的猜出它實(shí)際的選擇。甲乙兩個(gè)人玩同時(shí)擲硬幣游戲。兩人約定,如果兩枚硬幣正面或反面同時(shí)朝上,則甲付給乙1塊錢;如果出現(xiàn)一正一帆,則乙

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論