版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、 問(wèn)題的提出問(wèn)題的提出 博弈論基礎(chǔ)博弈論基礎(chǔ) 納什均衡納什均衡 囚徒困境囚徒困境 序貫博弈序貫博弈 重復(fù)博弈重復(fù)博弈 博弈的種類(lèi)總結(jié)博弈的種類(lèi)總結(jié) 問(wèn)題的提出問(wèn)題的提出 1994年,諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)授給了美國(guó)人約年,諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)授給了美國(guó)人約 翰翰哈桑尼(哈桑尼(John C. Harsanyi)、美國(guó)人約)、美國(guó)人約 翰翰納什(納什(John F. Nash Jr.)和德國(guó)人萊因)和德國(guó)人萊因 哈德哈德澤爾騰(澤爾騰(Reinhard Selten),以表彰),以表彰 他們?cè)诜呛献鞑┺牡木夥治隼碚摲矫嫠麄冊(cè)诜呛献鞑┺牡木夥治隼碚摲矫嫠?做出的開(kāi)創(chuàng)性貢獻(xiàn)。做出的開(kāi)創(chuàng)性貢獻(xiàn)。 1996年,
2、諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)授給了英國(guó)人年,諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)授給了英國(guó)人 詹姆斯詹姆斯莫里斯(莫里斯(James A. Mirrlees)和美)和美 國(guó)人威廉國(guó)人威廉維克瑞(維克瑞(William Vickrey),以),以 表彰他們?cè)谛畔⒔?jīng)濟(jì)學(xué)、激勵(lì)理論、博弈表彰他們?cè)谛畔⒔?jīng)濟(jì)學(xué)、激勵(lì)理論、博弈 論等方面都做出的重大貢獻(xiàn)。論等方面都做出的重大貢獻(xiàn)。 2001年,諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)授給了美國(guó)人邁克年,諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)授給了美國(guó)人邁克 爾爾斯彭斯(斯彭斯(A. Michael Spence)、美國(guó)人約)、美國(guó)人約 瑟夫瑟夫斯蒂格利茨(斯蒂格利茨(Joseph E. Stiglitz)和美)和美 國(guó)人喬治國(guó)人喬治阿克爾
3、洛夫(阿克爾洛夫(George A. Akerlof),), 以表彰他們對(duì)信息不對(duì)稱(chēng)市場(chǎng)所作的精彩分以表彰他們對(duì)信息不對(duì)稱(chēng)市場(chǎng)所作的精彩分 析。析。 古語(yǔ)有云,世事如棋。生活中每個(gè)人如同棋古語(yǔ)有云,世事如棋。生活中每個(gè)人如同棋 手,其每一個(gè)行為如同在一張看不見(jiàn)的棋盤(pán)手,其每一個(gè)行為如同在一張看不見(jiàn)的棋盤(pán) 上布一個(gè)子,精明慎重的棋手們相互揣摩、上布一個(gè)子,精明慎重的棋手們相互揣摩、 相互牽制,人人爭(zhēng)贏,下出諸多精彩紛呈、相互牽制,人人爭(zhēng)贏,下出諸多精彩紛呈、 變化多端的棋局。博弈論是研究棋手們變化多端的棋局。博弈論是研究棋手們 “ “出出 棋棋” ” 著數(shù)中理性化、邏輯化的部分,并將其著數(shù)中理性
4、化、邏輯化的部分,并將其 系統(tǒng)化為一門(mén)科學(xué)。換句話(huà)說(shuō),就是研究個(gè)系統(tǒng)化為一門(mén)科學(xué)。換句話(huà)說(shuō),就是研究個(gè) 體如何在錯(cuò)綜復(fù)雜的相互影響中得出最合理體如何在錯(cuò)綜復(fù)雜的相互影響中得出最合理 的策略。事實(shí)上,博弈論正是衍生于古老的的策略。事實(shí)上,博弈論正是衍生于古老的 游戲或曰博弈如象棋、撲克等。游戲或曰博弈如象棋、撲克等。 數(shù)學(xué)家們將具體的問(wèn)題抽象化,通過(guò)建立自數(shù)學(xué)家們將具體的問(wèn)題抽象化,通過(guò)建立自 完備的邏輯框架、體系研究其規(guī)律及變化。完備的邏輯框架、體系研究其規(guī)律及變化。 這可不是件容易的事情,以最簡(jiǎn)單的二人對(duì)這可不是件容易的事情,以最簡(jiǎn)單的二人對(duì) 弈為例,稍想一下便知此中大有玄妙:若假弈為例,稍
5、想一下便知此中大有玄妙:若假 設(shè)雙方都精確地記得自己和對(duì)手的每一步棋設(shè)雙方都精確地記得自己和對(duì)手的每一步棋 且都是最且都是最“理性理性” ” 的棋手,甲出子的時(shí)候,的棋手,甲出子的時(shí)候, 為了贏棋,得仔細(xì)考慮乙的想法,而乙出子為了贏棋,得仔細(xì)考慮乙的想法,而乙出子 時(shí)也得考慮甲的想法,所以甲還得想到乙在時(shí)也得考慮甲的想法,所以甲還得想到乙在 想他的想法,乙當(dāng)然也知道甲想到了他在想想他的想法,乙當(dāng)然也知道甲想到了他在想 甲的想法甲的想法 博弈論是分析企業(yè)和個(gè)人行為的一個(gè)重博弈論是分析企業(yè)和個(gè)人行為的一個(gè)重 要工具,在分析企業(yè)與企業(yè)或個(gè)人與個(gè)要工具,在分析企業(yè)與企業(yè)或個(gè)人與個(gè) 人之間的互動(dòng)的時(shí)候尤
6、為重要。人之間的互動(dòng)的時(shí)候尤為重要。 博弈論(博弈論(game theory)研究企業(yè)或個(gè)人研究企業(yè)或個(gè)人 (agent)的策略行為()的策略行為(strategic behavior),這些策略行為取決于其他企),這些策略行為取決于其他企 業(yè)或個(gè)人的行動(dòng)(業(yè)或個(gè)人的行動(dòng)(action)互相依存又互)互相依存又互 相影響。相影響。 非合作博弈(非合作博弈(non-cooperative game):在在 非合作博弈中,不存在通過(guò)談判協(xié)商非合作博弈中,不存在通過(guò)談判協(xié)商 (negotiation)或有約束力的合約)或有約束力的合約 (binding contract)的方式限制博弈人的)的方式限
7、制博弈人的 行為。我們這里討論的一般為非合作博弈。行為。我們這里討論的一般為非合作博弈。 合作博弈(合作博弈( cooperative game ):在合作:在合作 博弈中,博弈人通過(guò)談判一個(gè)有約束力的博弈中,博弈人通過(guò)談判一個(gè)有約束力的 合約來(lái)實(shí)現(xiàn)其聯(lián)合策略。合約來(lái)實(shí)現(xiàn)其聯(lián)合策略。 博弈論可以幫助我們分析存在兩個(gè)或數(shù)個(gè)博弈論可以幫助我們分析存在兩個(gè)或數(shù)個(gè) 行為主體時(shí)的最佳策略。如分析在存在寡行為主體時(shí)的最佳策略。如分析在存在寡 頭壟斷時(shí)一個(gè)企業(yè)的行為,以及不同企業(yè)頭壟斷時(shí)一個(gè)企業(yè)的行為,以及不同企業(yè) 行為之間的相互影響。行為之間的相互影響。 博弈論應(yīng)用的例子包括對(duì)寡頭壟斷行為的博弈論應(yīng)用的例
8、子包括對(duì)寡頭壟斷行為的 分析,對(duì)外部性的分析,對(duì)軍事策略的分分析,對(duì)外部性的分析,對(duì)軍事策略的分 析,等等。析,等等。 q一個(gè)完整的博弈包括以下要素:一個(gè)完整的博弈包括以下要素: 博弈人(博弈人(players):兩個(gè)以上。兩個(gè)以上。 規(guī)則:誰(shuí)在什么時(shí)候行動(dòng)?如何行動(dòng)?每個(gè)規(guī)則:誰(shuí)在什么時(shí)候行動(dòng)?如何行動(dòng)?每個(gè) 博弈人有至少兩個(gè)以上可供選擇的博弈人有至少兩個(gè)以上可供選擇的策略策略 (strategies)。 結(jié)果:每個(gè)可能的策略都有一個(gè)相應(yīng)的結(jié)果:每個(gè)可能的策略都有一個(gè)相應(yīng)的報(bào)酬報(bào)酬 (payoffs)。一個(gè)假設(shè)是博弈人偏好于報(bào)酬。一個(gè)假設(shè)是博弈人偏好于報(bào)酬 高的結(jié)果。高的結(jié)果。 q作為博弈論
9、的介紹,我們主要討論作為博弈論的介紹,我們主要討論兩人兩人 博弈(博弈(two-player game)模型,即每個(gè)模型,即每個(gè) 博弈只有兩個(gè)博弈人。博弈只有兩個(gè)博弈人。 q同時(shí),我們也假設(shè)每個(gè)博弈人只有兩個(gè)同時(shí),我們也假設(shè)每個(gè)博弈人只有兩個(gè) 可供選擇的策略??晒┻x擇的策略。 q兩人博弈的一個(gè)例子:兩人博弈的一個(gè)例子: u我們將兩個(gè)博弈人叫做我們將兩個(gè)博弈人叫做A和和B。 uA有兩個(gè)(策略)選擇:上(有兩個(gè)(策略)選擇:上(up)或下)或下 (down)。)。 uB有兩個(gè)選擇:左(有兩個(gè)選擇:左(left)或右()或右(right)。)。 u說(shuō)明:(說(shuō)明:(1)A和和B的策略選擇可以相同也可的
10、策略選擇可以相同也可 以不同;(以不同;(2)每個(gè)策略選擇可以被看作是)每個(gè)策略選擇可以被看作是 一個(gè)投資決定或者利益分配計(jì)劃。一個(gè)投資決定或者利益分配計(jì)劃。 q兩人博弈的一個(gè)例子(續(xù)):兩人博弈的一個(gè)例子(續(xù)): u兩個(gè)博弈人,每個(gè)博弈人各有兩個(gè)選擇,結(jié)兩個(gè)博弈人,每個(gè)博弈人各有兩個(gè)選擇,結(jié) 果有四個(gè)不同的策略選擇組合:上左,上右,果有四個(gè)不同的策略選擇組合:上左,上右, 下左,下右。下左,下右。 u每個(gè)策略組合中,每個(gè)博弈人的報(bào)酬已知,每個(gè)策略組合中,每個(gè)博弈人的報(bào)酬已知, 見(jiàn)下頁(yè)見(jiàn)下頁(yè)收益矩陣(收益矩陣(payoff matrix)或一般形)或一般形 式(式(normal form)。
11、收益矩陣(收益矩陣(Payoff MatrixPayoff Matrix,又稱(chēng)報(bào)酬矩,又稱(chēng)報(bào)酬矩 陣,支付矩陣等)描述一個(gè)博弈結(jié)構(gòu)。下陣,支付矩陣等)描述一個(gè)博弈結(jié)構(gòu)。下 面支付矩陣中,面支付矩陣中,兩個(gè)參與者兩個(gè)參與者A A和和B B各自可以各自可以 選擇兩種策略,分別用選擇兩種策略,分別用“左右左右”和和“上下上下” 來(lái)標(biāo)識(shí);數(shù)字表示雙方在不同策略選擇組來(lái)標(biāo)識(shí);數(shù)字表示雙方在不同策略選擇組 合下得到的支付,較大數(shù)字代表較大利益。合下得到的支付,較大數(shù)字代表較大利益。 Player B Player A 通常的表達(dá)方式是,第一個(gè)博弈人的報(bào)酬在通常的表達(dá)方式是,第一個(gè)博弈人的報(bào)酬在 前,第二個(gè)
12、博弈人的報(bào)酬在后。前,第二個(gè)博弈人的報(bào)酬在后。 LR U D (3,9) (0,0) (1,8) (2,1) 報(bào)酬矩陣也可以用展開(kāi)式(extensive form)或樹(shù) 形圖(tree diagram)來(lái)表示。 UD LLRR (3,9)(1,8) (0,0)(2,1) A BB 信息集(信息集(information set) 決策結(jié)(決策結(jié)(decision node) l信息集(信息集(information set)表明了哪一個(gè)博弈人表明了哪一個(gè)博弈人 應(yīng)該作決定,并且每個(gè)博弈人作決定所掌握的應(yīng)該作決定,并且每個(gè)博弈人作決定所掌握的 信息。信息。 l充分信息(充分信息(perfect
13、information):一個(gè)信息集:一個(gè)信息集 里只有一個(gè)決策結(jié)。里只有一個(gè)決策結(jié)。 l不充分信息(不充分信息(imperfect information):一個(gè)信:一個(gè)信 息集有多個(gè)決策結(jié)。博弈人不能區(qū)分其作決策息集有多個(gè)決策結(jié)。博弈人不能區(qū)分其作決策 時(shí)位于哪個(gè)決策結(jié)。時(shí)位于哪個(gè)決策結(jié)。 q報(bào)酬矩陣與展開(kāi)形式之間的關(guān)系:報(bào)酬矩陣與展開(kāi)形式之間的關(guān)系: u一個(gè)展開(kāi)形式肯定有唯一相對(duì)應(yīng)的一個(gè)展開(kāi)形式肯定有唯一相對(duì)應(yīng)的 報(bào)酬矩陣;報(bào)酬矩陣; u但一個(gè)報(bào)酬矩陣可能反映多個(gè)展開(kāi)但一個(gè)報(bào)酬矩陣可能反映多個(gè)展開(kāi) 形式。如下面兩個(gè)不同的展開(kāi)形式形式。如下面兩個(gè)不同的展開(kāi)形式 有相同的報(bào)酬矩陣。有相同的報(bào)
14、酬矩陣。 UD LLRR (3,9)(1,8) (2,1)(2,1) A BB 展開(kāi)形式一展開(kāi)形式一 UD LR (3,9)(1,8) (2,1) A B 展開(kāi)形式二展開(kāi)形式二 o博弈均衡博弈均衡指博弈中的所有參與者都指博弈中的所有參與者都 不想改變自己的策略的一種狀態(tài)。不想改變自己的策略的一種狀態(tài)。 前面我們討論了一個(gè)博弈的表達(dá)形式。前面我們討論了一個(gè)博弈的表達(dá)形式。 現(xiàn)在我們來(lái)解這個(gè)兩人博弈,即每個(gè)現(xiàn)在我們來(lái)解這個(gè)兩人博弈,即每個(gè) 博弈人的最佳策略是什么?博弈人的最佳策略是什么? l在回答前面這個(gè)問(wèn)題之前,我們?cè)倏匆粋€(gè)例在回答前面這個(gè)問(wèn)題之前,我們?cè)倏匆粋€(gè)例 子,這就是著名的囚犯困境(子,
15、這就是著名的囚犯困境(the prisoners dilemma)。)。 l這個(gè)例子是這樣的,兩個(gè)嫌疑犯同時(shí)被捕,這個(gè)例子是這樣的,兩個(gè)嫌疑犯同時(shí)被捕, 并被隔離審問(wèn)。這兩個(gè)囚犯都有兩個(gè)選擇:并被隔離審問(wèn)。這兩個(gè)囚犯都有兩個(gè)選擇: 坦白(坦白(confess)還是不坦白)還是不坦白(deny)他們的罪他們的罪 行。問(wèn)題是:在互相不知道對(duì)方的選擇的情行。問(wèn)題是:在互相不知道對(duì)方的選擇的情 況下,應(yīng)該坦白還是不坦白呢?況下,應(yīng)該坦白還是不坦白呢? q對(duì)這兩個(gè)囚犯的懲罰(或者負(fù)的報(bào)酬)對(duì)這兩個(gè)囚犯的懲罰(或者負(fù)的報(bào)酬) 是:是: 如果兩個(gè)人都坦白,兩個(gè)人的罪行一如果兩個(gè)人都坦白,兩個(gè)人的罪行一 樣重
16、;樣重; 如果一個(gè)坦白,一個(gè)不坦白,前者處如果一個(gè)坦白,一個(gè)不坦白,前者處 罰較輕,后者處罰較重;罰較輕,后者處罰較重; 如果兩個(gè)人都不坦白,則因?yàn)闆](méi)有證如果兩個(gè)人都不坦白,則因?yàn)闆](méi)有證 據(jù),兩個(gè)人的處罰較都坦白時(shí)輕。據(jù),兩個(gè)人的處罰較都坦白時(shí)輕。 這兩個(gè)囚犯會(huì)作什么樣的選擇呢?這兩個(gè)囚犯會(huì)作什么樣的選擇呢? 乙乙 甲甲 (-5,-5)(-30,-1) (-1,-30)(-10,-10) Deny Confess DenyConfess 如果甲不坦白,乙的最佳選擇是坦白。如果甲不坦白,乙的最佳選擇是坦白。 乙乙 甲甲 (-5,-5)(-30,-1) (-1,-30)(-10,-10) D C
17、DC 乙乙 甲甲 (-5,-5)(-30,-1) (-1,-30)(-10,-10) D C DC 如果甲不坦白,乙的最佳選擇是坦白。如果甲不坦白,乙的最佳選擇是坦白。 如果甲坦白,乙的最佳選擇還是坦白。如果甲坦白,乙的最佳選擇還是坦白。 乙乙 甲甲 (-5,-5)(-30,-1) (-1,-30)(-10,-10) D C DC 所以不管甲怎么做,乙的最佳選擇都是坦白。所以不管甲怎么做,乙的最佳選擇都是坦白。 對(duì)乙來(lái)講,坦白是一個(gè)對(duì)乙來(lái)講,坦白是一個(gè)主導(dǎo)性的策略主導(dǎo)性的策略 (dominant strategy)。 乙乙 甲甲 (-5,-5)(-30,-1) (-1,-30)(-10,-10
18、) D C DC 反過(guò)來(lái)也成立,即不管乙怎么做,反過(guò)來(lái)也成立,即不管乙怎么做, 對(duì)甲來(lái)講,坦白也是一對(duì)甲來(lái)講,坦白也是一個(gè)主導(dǎo)性的策略個(gè)主導(dǎo)性的策略。 乙乙 甲甲 (-5,-5)(-30,-1) (-1,-30)(-10,-10) D C DC 所以,對(duì)囚犯所以,對(duì)囚犯A,B來(lái)說(shuō),無(wú)論對(duì)方如何選擇,來(lái)說(shuō),無(wú)論對(duì)方如何選擇, “坦白坦白”都是各自最優(yōu)選擇。所以都是各自最優(yōu)選擇。所以“坦白,坦白坦白,坦白 ”就是此博弈的就是此博弈的占優(yōu)策略均衡占優(yōu)策略均衡 不管其它參與者如何選擇,每個(gè)局中人自有不管其它參與者如何選擇,每個(gè)局中人自有 的那個(gè)最優(yōu)選擇稱(chēng)作的那個(gè)最優(yōu)選擇稱(chēng)作嚴(yán)格占優(yōu)策略嚴(yán)格占優(yōu)策略,由
19、此實(shí),由此實(shí) 現(xiàn)的均衡是現(xiàn)的均衡是嚴(yán)格占優(yōu)策略嚴(yán)格占優(yōu)策略均衡均衡。 嚴(yán)格占優(yōu)策略均衡的應(yīng)用:逐步剔除嚴(yán)格劣嚴(yán)格占優(yōu)策略均衡的應(yīng)用:逐步剔除嚴(yán)格劣 策略均衡策略均衡見(jiàn)課本見(jiàn)課本P111P111:智豬博弈,寡頭:智豬博弈,寡頭 博弈,廣告博弈等博弈,廣告博弈等 1,2 1,02,1 0,1 左左 上上 右右 下下 廠商廠商B B 廠商廠商A A 可口可樂(lè)的決策可口可樂(lè)的決策 做做 廣廣 告告 不做廣告不做廣告 百百 事事 可可 樂(lè)樂(lè) 的的 決決 策策 做廣告做廣告 不不 做做 廣廣 告告 每家每家30億美元的利潤(rùn)億美元的利潤(rùn) 可口可樂(lè)得到可口可樂(lè)得到20億美元利潤(rùn)億美元利潤(rùn) 百事可樂(lè)得到百事可樂(lè)
20、得到50億美元利潤(rùn)億美元利潤(rùn) 可口可樂(lè)得到可口可樂(lè)得到50億美億美 元利潤(rùn)元利潤(rùn) 百事可樂(lè)得到百事可樂(lè)得到20億美億美 元利潤(rùn)元利潤(rùn) 每家都得到每家都得到40億美元利潤(rùn)億美元利潤(rùn) 做廣告 在這個(gè)博弈中,只有一個(gè)唯一的在這個(gè)博弈中,只有一個(gè)唯一的納什納什 均衡均衡, 即(即(C,C)。但由于()。但由于(D,D)的回)的回 報(bào)較高,這個(gè)納什均衡是報(bào)較高,這個(gè)納什均衡是無(wú)效率的無(wú)效率的 (inefficient) 例子:例子: A A,B B在做廣告上存在策略關(guān)系。在做廣告上存在策略關(guān)系。A A沒(méi)有支配策略,最佳決沒(méi)有支配策略,最佳決 策取決于策取決于B B的選擇:的選擇:B B做廣告時(shí),做廣告時(shí)
21、,A A應(yīng)做廣告,得到應(yīng)做廣告,得到1010而不而不 是是6 6的支付;但的支付;但B B不做廣告時(shí),不做廣告時(shí),A A也不應(yīng)做廣告,得到也不應(yīng)做廣告,得到2020而而 不是不是1515支付。如同時(shí)決策,支付。如同時(shí)決策,A A應(yīng)如何決策?應(yīng)如何決策? A A可以把自己放在可以把自己放在B B的位置,從的位置,從B B角度看什么是最好選擇,角度看什么是最好選擇, 并在此基礎(chǔ)上考慮自己選擇。并在此基礎(chǔ)上考慮自己選擇。B B有占優(yōu)策略:選擇做廣告有占優(yōu)策略:選擇做廣告 時(shí)利益較大時(shí)利益較大,A A判斷判斷B B會(huì)選擇做廣告。會(huì)選擇做廣告。B B做廣告時(shí),做廣告時(shí),A A應(yīng)當(dāng)選應(yīng)當(dāng)選 擇做廣告。均衡
22、結(jié)局是雙方都做廣告。擇做廣告。均衡結(jié)局是雙方都做廣告。 10,5 20,2 6,8 15,0 做廣告做廣告不做廣告不做廣告 廠商廠商B B 廠商廠商A A 做廣告做廣告 不做廣告不做廣告 指一組給定對(duì)手行為前提下對(duì)各博弈方存指一組給定對(duì)手行為前提下對(duì)各博弈方存 在的最佳選擇,這時(shí)只要其它參與者不變?cè)诘淖罴堰x擇,這時(shí)只要其它參與者不變 換策略選擇,任何單個(gè)參與者不可能單方換策略選擇,任何單個(gè)參與者不可能單方 面通過(guò)變換策略來(lái)提高支付。面通過(guò)變換策略來(lái)提高支付。 廣告策略事例中,給定廠商廣告策略事例中,給定廠商B做廣告,做廣告,A的的 最好選擇是做廣告;當(dāng)最好選擇是做廣告;當(dāng)A做廣告時(shí),做廣告時(shí),
23、B的選的選 擇仍是它能做的最好的。滿(mǎn)足了納什均衡擇仍是它能做的最好的。滿(mǎn)足了納什均衡 條件。條件。 在納什均衡下,在納什均衡下,“我所做的是給定你的選擇我所我所做的是給定你的選擇我所 能做的最好的能做的最好的”,占優(yōu)策略均衡下,占優(yōu)策略均衡下, “ “我所做我所做 的是不論你的選擇我所能做的更好的的是不論你的選擇我所能做的更好的”。 占優(yōu)策略均衡必然是納什均衡,納什均衡未必是占優(yōu)策略均衡必然是納什均衡,納什均衡未必是 支配均衡。支配均衡。 納什均衡的應(yīng)用:情侶博弈,斗雞博弈,古諾模型納什均衡的應(yīng)用:情侶博弈,斗雞博弈,古諾模型 Read by yourself 一個(gè)博弈可能有幾個(gè)納什均衡,也可
24、能沒(méi)有納什均衡。左表兩個(gè)納什一個(gè)博弈可能有幾個(gè)納什均衡,也可能沒(méi)有納什均衡。左表兩個(gè)納什 均衡:其中均衡:其中“上,左上,左”是納什均衡(是納什均衡(A A選上,則選上,則B B選左;且選左;且B B選左時(shí)選左時(shí)A A仍仍 應(yīng)選上);應(yīng)選上);“下,右下,右”也是納什均衡(也是納什均衡(A A選下,則選下,則B B選右;且選右;且B B選右時(shí)選右時(shí)A A 仍應(yīng)選下)。沒(méi)有更多信息則無(wú)法判斷均衡位置。右表沒(méi)有納什均衡。仍應(yīng)選下)。沒(méi)有更多信息則無(wú)法判斷均衡位置。右表沒(méi)有納什均衡。 如如A A選選“上上”,B B則選則選“左左”;當(dāng);當(dāng)B B選選“左左”時(shí),時(shí),A A卻應(yīng)當(dāng)選卻應(yīng)當(dāng)選“下下”。反。
25、反 之,之,A A選選“下下”時(shí),時(shí),B B應(yīng)選應(yīng)選“右右”;然而當(dāng);然而當(dāng)B B選右時(shí),選右時(shí),A A又應(yīng)選又應(yīng)選“上上”。 2,1 1,2 0,0 0,0 左左 上上 右右 下下 局中人局中人B B 局中人局中人A A 0,0 -1,3 1,0 0,-1 左左 上上 右右 下下 局中人局中人B B 局中人局中人A A (左) (右) 在前面兩個(gè)例子中,兩個(gè)博弈人同時(shí)決在前面兩個(gè)例子中,兩個(gè)博弈人同時(shí)決 定他們的策略,這樣的博弈叫定他們的策略,這樣的博弈叫靜態(tài)博弈靜態(tài)博弈 或者或者同時(shí)博弈(同時(shí)博弈(simultaneous play game)。 我們知道同時(shí)博弈時(shí),每個(gè)博弈的信息我們知道
26、同時(shí)博弈時(shí),每個(gè)博弈的信息 是充分的,或不對(duì)稱(chēng)的是充分的,或不對(duì)稱(chēng)的 q在有些博弈中,一個(gè)博弈人先于另一個(gè)博弈在有些博弈中,一個(gè)博弈人先于另一個(gè)博弈 人決定其策略,這樣的博弈叫人決定其策略,這樣的博弈叫序貫博弈序貫博弈或或動(dòng)動(dòng) 態(tài)博弈(態(tài)博弈(sequential play game)。 q在序貫博弈中,先決定策略的那個(gè)博弈人叫在序貫博弈中,先決定策略的那個(gè)博弈人叫 領(lǐng)頭者(領(lǐng)頭者(leader),后決定策略的叫跟從者),后決定策略的叫跟從者 (follower)。)。 q在同時(shí)博弈時(shí),一個(gè)博弈有多個(gè)納什在同時(shí)博弈時(shí),一個(gè)博弈有多個(gè)納什 均衡,很難說(shuō)哪個(gè)均衡更有可能發(fā)生。均衡,很難說(shuō)哪個(gè)均衡更
27、有可能發(fā)生。 q如果這樣的博弈是一個(gè)序貫博弈,我如果這樣的博弈是一個(gè)序貫博弈,我 們可以決定哪個(gè)均衡更有可能發(fā)生。們可以決定哪個(gè)均衡更有可能發(fā)生。 q這里我們討論一個(gè)序貫博弈時(shí)的一個(gè)這里我們討論一個(gè)序貫博弈時(shí)的一個(gè) 均衡例子。均衡例子。 序貫博弈(序貫博弈(Sequential Game)Sequential Game)中,各博弈方先后中,各博弈方先后 依次行動(dòng)。下面支付矩陣中,如果雙方同時(shí)行動(dòng),依次行動(dòng)。下面支付矩陣中,如果雙方同時(shí)行動(dòng), 有兩個(gè)納什均衡點(diǎn)(有兩個(gè)納什均衡點(diǎn)(“甜,咸甜,咸”與與“咸,甜咸,甜”)。)。 序貫博弈假定:序貫博弈假定:A A先作決策,先作決策,B B隨后選擇。隨
28、后選擇。A A決策時(shí)決策時(shí) 需要考慮競(jìng)爭(zhēng)者反應(yīng):它知道不論自己推出那種需要考慮競(jìng)爭(zhēng)者反應(yīng):它知道不論自己推出那種 餅干,餅干,B B出于自身利益會(huì)推出另一種。因而出于自身利益會(huì)推出另一種。因而A A推出推出 甜餅干,甜餅干,B B在給定在給定A A決策時(shí)選擇咸餅干;給定決策時(shí)選擇咸餅干;給定B B的選的選 擇擇A A的選擇仍然最佳。結(jié)果兩個(gè)納什均衡點(diǎn)收斂為的選擇仍然最佳。結(jié)果兩個(gè)納什均衡點(diǎn)收斂為 一個(gè)(下,左),一個(gè)(下,左),A A獲得先行者優(yōu)勢(shì)(獲得先行者優(yōu)勢(shì)(First First Movers AdvantageMovers Advantage)。)。 -5,-5 -5,-5 20,1
29、0 10,20 咸餅干咸餅干 咸餅干咸餅干 甜餅干甜餅干 甜餅干甜餅干 廠商廠商B B 廠商廠商A A Player B Player A (U,L) and (D,R) are both Nash equilibria when this game is played simultaneously and we have no way of deciding which equilibrium is more likely to occur. LR U D (3,9) (0,0) (1,8) (2,1) Suppose instead that the game is played sequ
30、entially, with A leading and B following. We can rewrite the game in its extensive Form. Player B Player A LR U D (3,9) (0,0) (1,8) (2,1) UD LLRR (3,9)(1,8) (0,0)(2,1) A BB A plays first. B plays second. A plays first. B plays second. A UD LLRR (3,9)(1,8) (0,0)(2,1) BB (U,L) is a Nash equilibrium. A
31、 plays first. B plays second. UD LLRR (3,9)(1,8) (0,0)(2,1) A BB (U,L) is a Nash equilibrium. (D,R) is a Nash equilibrium. Which is more likely to occur? A plays first. B plays second. UD LLRR (3,9)(1,8) (0,0)(2,1) A BB If A plays U then B plays L; A gets 3. A plays first. B plays second. UD LLRR (3
32、,9)(1,8) (0,0)(2,1) A BB If A plays U then B plays L; A gets 3. If A plays D then B plays R; A gets 2. A plays first. B plays second. UD LLRR (3,9)(1,8) (0,0)(2,1) A BB If A plays U then B plays L; A gets 3. If A plays D then B plays R; A gets 2. So (U,L) is the likely Nash equilibrium. q這種由結(jié)果反推博弈人的
33、最佳策略的方法這種由結(jié)果反推博弈人的最佳策略的方法 叫逆向歸納(叫逆向歸納(backword induction)法。)法。 q這種方法在博弈論中的應(yīng)用非常普遍。這種方法在博弈論中的應(yīng)用非常普遍。 q見(jiàn)課本見(jiàn)課本P119例子:市場(chǎng)進(jìn)入阻撓例子:市場(chǎng)進(jìn)入阻撓 q閱讀子博弈完美納什均衡(澤爾騰)閱讀子博弈完美納什均衡(澤爾騰) “囚徒困境囚徒困境”的一次性博弈,陷入個(gè)體的一次性博弈,陷入個(gè)體 理性導(dǎo)致集體非理性結(jié)果。如是可重復(fù)理性導(dǎo)致集體非理性結(jié)果。如是可重復(fù) 博弈(博弈(Repeated Game)Repeated Game),選擇坦白的機(jī),選擇坦白的機(jī) 會(huì)成本太高,可能成為不利選擇。會(huì)成本太高
34、,可能成為不利選擇。”沉沉 默默+ +沉默沉默“可能成為雙方最佳選擇,成為可能成為雙方最佳選擇,成為 納什均衡點(diǎn)。博弈條件改變導(dǎo)致均衡狀納什均衡點(diǎn)。博弈條件改變導(dǎo)致均衡狀 態(tài)變化。態(tài)變化。 o重復(fù)博弈重復(fù)博弈是動(dòng)態(tài)博弈的一種特殊情況,是動(dòng)態(tài)博弈的一種特殊情況, 在重復(fù)博弈中,同一個(gè)博弈被重復(fù)多次。在重復(fù)博弈中,同一個(gè)博弈被重復(fù)多次。 q例:國(guó)內(nèi)飛機(jī)機(jī)票降價(jià)規(guī)定可行嗎? q按照國(guó)家發(fā)展和改革委員會(huì)最近公布的按照國(guó)家發(fā)展和改革委員會(huì)最近公布的 新運(yùn)價(jià)方案,機(jī)票價(jià)格最大下浮幅度是新運(yùn)價(jià)方案,機(jī)票價(jià)格最大下浮幅度是 40%。 q南航、東航、國(guó)航、上航等幾大企業(yè),南航、東航、國(guó)航、上航等幾大企業(yè), 在新
35、票價(jià)方案公布之前曾有一次盟約:在新票價(jià)方案公布之前曾有一次盟約: 上海始發(fā)航班散客票價(jià)最低不得低于上海始發(fā)航班散客票價(jià)最低不得低于8.5 折。折。 q為方便討論,我們假設(shè)只有兩家航空公司:為方便討論,我們假設(shè)只有兩家航空公司: 南航和東航。這兩家公司的盟約是:上海南航和東航。這兩家公司的盟約是:上海 始發(fā)航班散客票價(jià)最低不得低于始發(fā)航班散客票價(jià)最低不得低于8.5折。折。 q這兩家公司都有兩個(gè)可能的策略:遵守盟這兩家公司都有兩個(gè)可能的策略:遵守盟 約(即誠(chéng)實(shí))或不遵守盟約(即欺騙)。約(即誠(chéng)實(shí))或不遵守盟約(即欺騙)。 假設(shè)的報(bào)酬矩陣見(jiàn)下頁(yè)。假設(shè)的報(bào)酬矩陣見(jiàn)下頁(yè)。 我們知道,盡管(我們知道,盡管
36、(H,H)的報(bào)酬都較高,)的報(bào)酬都較高, 這個(gè)博弈的唯一納什均衡是(這個(gè)博弈的唯一納什均衡是(C,C)。)。 H-honest C-Cheat 南航南航 東航東航 HC H C (5,5) (8,-2) (-2,8) (2,2) q單一博弈(單一博弈(one-shot game):兩個(gè)博:兩個(gè)博 弈人之間只博弈一次。前面的例子是弈人之間只博弈一次。前面的例子是 一個(gè)典型的單一博弈的結(jié)果。在單一一個(gè)典型的單一博弈的結(jié)果。在單一 博弈中,合作是很難建立的。博弈中,合作是很難建立的。 q重復(fù)博弈(重復(fù)博弈(repeated game):同樣的:同樣的 博弈人、同樣的博弈重復(fù)進(jìn)行多次。博弈人、同樣的博
37、弈重復(fù)進(jìn)行多次。 在重復(fù)博弈中,合作是可能的。在重復(fù)博弈中,合作是可能的。 q重復(fù)博弈可以促進(jìn)合作(或誠(chéng)實(shí))主要重復(fù)博弈可以促進(jìn)合作(或誠(chéng)實(shí))主要 是因?yàn)槭且驗(yàn)椋含F(xiàn)在的合作是為了以后的合作,:現(xiàn)在的合作是為了以后的合作, 或者說(shuō),對(duì)現(xiàn)在的不合作或欺騙的懲罰或者說(shuō),對(duì)現(xiàn)在的不合作或欺騙的懲罰 是以后的不合作。當(dāng)合作的報(bào)酬大于不是以后的不合作。當(dāng)合作的報(bào)酬大于不 合作的報(bào)酬時(shí),合作是一個(gè)較佳的策略。合作的報(bào)酬時(shí),合作是一個(gè)較佳的策略。 q在重復(fù)博弈中,重復(fù)博弈的次數(shù)可以是在重復(fù)博弈中,重復(fù)博弈的次數(shù)可以是 有限的數(shù)次,也可以是無(wú)數(shù)次。在這兩有限的數(shù)次,也可以是無(wú)數(shù)次。在這兩 種情況下,結(jié)果是不同的
38、。種情況下,結(jié)果是不同的。 q 如果重復(fù)博弈的次數(shù)是有限的數(shù)次,比如如果重復(fù)博弈的次數(shù)是有限的數(shù)次,比如 說(shuō)說(shuō)5次,情況會(huì)怎么樣呢?次,情況會(huì)怎么樣呢? q 我們先看最后一次博弈,因?yàn)椴┺碾p方都我們先看最后一次博弈,因?yàn)椴┺碾p方都 知道這是最后一次,結(jié)果跟單一博弈時(shí)一知道這是最后一次,結(jié)果跟單一博弈時(shí)一 樣,即(樣,即(C,C)。)。 q 第四次博弈時(shí),雙方知道以后不會(huì)有合作,第四次博弈時(shí),雙方知道以后不會(huì)有合作, 所以最佳策略也是(所以最佳策略也是(C,C)。)。 q 如此反推,在第一次時(shí)也不會(huì)有合作。如此反推,在第一次時(shí)也不會(huì)有合作。 只有在重復(fù)博弈次數(shù)無(wú)限的時(shí)候,合作只有在重復(fù)博弈次數(shù)無(wú)
39、限的時(shí)候,合作 才有可能。才有可能。 如果你的對(duì)手現(xiàn)在選擇如果你的對(duì)手現(xiàn)在選擇C(欺騙),在(欺騙),在 以后的博弈你永遠(yuǎn)會(huì)選以后的博弈你永遠(yuǎn)會(huì)選C。 只要博弈雙方都在意以后的報(bào)酬,那么只要博弈雙方都在意以后的報(bào)酬,那么 彼此都有積極性在當(dāng)前博弈中選彼此都有積極性在當(dāng)前博弈中選H。 q重復(fù)博弈的機(jī)制,即所謂的重復(fù)博弈的機(jī)制,即所謂的“針?shù)h相對(duì)針?shù)h相對(duì)”策策 略(略(tit-for-tat strategy),是:),是: 在第一次博弈中,博弈人一選在第一次博弈中,博弈人一選H; 在以后的每次博弈中,只要在前一次博弈中在以后的每次博弈中,只要在前一次博弈中 博弈人二也是選博弈人二也是選H,博弈人
40、一繼續(xù)選,博弈人一繼續(xù)選H; 一旦在前一次博弈中博弈人二選了一旦在前一次博弈中博弈人二選了C,博弈,博弈 人一在當(dāng)前博弈中肯定選人一在當(dāng)前博弈中肯定選C。 反之亦然。反之亦然。 q名譽(yù)(名譽(yù)(reputation)的價(jià)值:如果你有誠(chéng)實(shí)的的價(jià)值:如果你有誠(chéng)實(shí)的 名譽(yù),你現(xiàn)在的合作伙伴很可能也會(huì)選擇誠(chéng)名譽(yù),你現(xiàn)在的合作伙伴很可能也會(huì)選擇誠(chéng) 實(shí),你就會(huì)享受合作的成果。推而廣之,你實(shí),你就會(huì)享受合作的成果。推而廣之,你 的新的合作伙伴也有較大的可能性會(huì)選擇誠(chéng)的新的合作伙伴也有較大的可能性會(huì)選擇誠(chéng) 實(shí)。實(shí)。 q“It helps with your customers, suppliers, and e
41、mployees. Your reputation is everything, and should be protected at any cost.” David Glass, CEO, Wal-Mart. 動(dòng)態(tài)博弈動(dòng)態(tài)博弈 / / 靜態(tài)博弈靜態(tài)博弈 單人博弈單人博弈/ /兩人博弈兩人博弈/ /多人博弈多人博弈 零和博弈零和博弈/ /常和博弈常和博弈/ /變和博弈變和博弈 有限策略博弈有限策略博弈/ /無(wú)限策略博弈無(wú)限策略博弈 完全信息博弈完全信息博弈/ /不完全信息博弈不完全信息博弈 非合作博弈非合作博弈 / / 合作博弈合作博弈 靜態(tài)博弈:決策選擇同步進(jìn)行靜態(tài)博弈:決策選擇同步進(jìn)行
42、動(dòng)態(tài)博弈:決策選擇有先后次序動(dòng)態(tài)博弈:決策選擇有先后次序 只有一個(gè)博弈方,一個(gè)博弈方面只有一個(gè)博弈方,一個(gè)博弈方面 對(duì)一定局面如何決策的問(wèn)題。個(gè)體最優(yōu)化問(wèn)題對(duì)一定局面如何決策的問(wèn)題。個(gè)體最優(yōu)化問(wèn)題 25萬(wàn)元萬(wàn)元-20萬(wàn)元 10萬(wàn)元10萬(wàn)元 受損事件發(fā)生受損事件發(fā)生25% 受損事件不發(fā)生受損事件不發(fā)生75% 自然自然 存入銀行存入銀行 投資證卷投資證卷 張三張三 投資證卷的期望收益投資證卷的期望收益: 25 75%( 20) 25%13.75 10 兩人博弈:兩人博弈:兩個(gè)各自獨(dú)立決策,相互具有策兩個(gè)各自獨(dú)立決策,相互具有策 略依存關(guān)系的博弈方之間的博弈。最常見(jiàn),略依存關(guān)系的博弈方之間的博弈。最
43、常見(jiàn), 最普通。最普通。 特點(diǎn):特點(diǎn): 兩個(gè)博弈方利益可對(duì)抗,可不對(duì)抗兩個(gè)博弈方利益可對(duì)抗,可不對(duì)抗 掌握信息多不一定得益多掌握信息多不一定得益多 個(gè)人追求利益最大化往往不能使社會(huì)利益最大化個(gè)人追求利益最大化往往不能使社會(huì)利益最大化 多人博弈:多人博弈:三個(gè)或三個(gè)以上的博弈方參加。三個(gè)或三個(gè)以上的博弈方參加。 特點(diǎn):特點(diǎn): 與兩人博弈類(lèi)似與兩人博弈類(lèi)似 可能存在破壞者可能存在破壞者 零和博弈:各博弈方得益之和總為零。零和博弈:各博弈方得益之和總為零。 “你死我活你死我活” Eg:剪刀石頭布,打官司,競(jìng)選,競(jìng)標(biāo)剪刀石頭布,打官司,競(jìng)選,競(jìng)標(biāo) 常和博弈:各博弈方得益之和為非零常數(shù)。常和博弈:各博弈
44、方得益之和為非零常數(shù)。 “你多我少你多我少” Eg:多人分食某物,某單位確定分配方案。多人分食某物,某單位確定分配方案。 變和博弈:博弈方的得益總和可大可小,可變和博弈:博弈方的得益總和可大可小,可 以變化。以變化。 博弈方的得益之和大小取決于博弈方采取的博弈方的得益之和大小取決于博弈方采取的 策略組合。如囚徒困境。策略組合。如囚徒困境。 有限策略博弈:有限策略博弈:可供博弈方選擇的策略數(shù)量可供博弈方選擇的策略數(shù)量 有限。有限。 無(wú)限策略博弈:無(wú)限策略博弈:可供博弈方選擇的策略數(shù)量可供博弈方選擇的策略數(shù)量 無(wú)限。無(wú)限。 完全信息博弈:完全信息博弈:各博弈方都完全了解所有博各博弈方都完全了解所有
45、博 弈方各種情況下得益。弈方各種情況下得益。 囚徒困境囚徒困境 不完全信息博弈:不完全信息博弈:至少存在部分博弈方不完至少存在部分博弈方不完 全了解其他博弈方的得益。全了解其他博弈方的得益。 競(jìng)標(biāo),打牌競(jìng)標(biāo),打牌 合作博弈:合作博弈:各博弈方能達(dá)成某種有約束力的各博弈方能達(dá)成某種有約束力的 協(xié)議,以使他們選擇共同的或聯(lián)合的策略,協(xié)議,以使他們選擇共同的或聯(lián)合的策略, 從而實(shí)現(xiàn)利益最大化。從而實(shí)現(xiàn)利益最大化。 非合作博弈:非合作博弈:各博弈方不存在任何有約束力各博弈方不存在任何有約束力 的協(xié)議,不能的協(xié)議,不能“串通,勾結(jié),共謀串通,勾結(jié),共謀”,只追,只追 求個(gè)人利益最大化。求個(gè)人利益最大化。
46、 豬圈里有兩頭豬,一頭大豬,一頭小豬。豬圈里有兩頭豬,一頭大豬,一頭小豬。 豬圈的一邊有個(gè)踏板,每踩一下踏板,在遠(yuǎn)豬圈的一邊有個(gè)踏板,每踩一下踏板,在遠(yuǎn) 離踏板的豬圈的另一邊的投食口就會(huì)落下少離踏板的豬圈的另一邊的投食口就會(huì)落下少 量的食物。如果有一只豬去踩踏板,另一只量的食物。如果有一只豬去踩踏板,另一只 豬就有機(jī)會(huì)搶先吃到另一邊落下的食物。當(dāng)豬就有機(jī)會(huì)搶先吃到另一邊落下的食物。當(dāng) 小豬踩動(dòng)踏板時(shí),大豬會(huì)在小豬跑到食槽之小豬踩動(dòng)踏板時(shí),大豬會(huì)在小豬跑到食槽之 前剛好吃光所有的食物;若是大豬踩動(dòng)了踏前剛好吃光所有的食物;若是大豬踩動(dòng)了踏 板,則還有機(jī)會(huì)在小豬吃完落下的食物之前板,則還有機(jī)會(huì)在小
47、豬吃完落下的食物之前 跑到食槽,爭(zhēng)吃到另一半殘羹。跑到食槽,爭(zhēng)吃到另一半殘羹。 小豬將選擇小豬將選擇“搭便車(chē)搭便車(chē)”策略,也就是舒舒服策略,也就是舒舒服 服地等在食槽邊;而大豬則為一點(diǎn)殘羹不知服地等在食槽邊;而大豬則為一點(diǎn)殘羹不知 疲倦地奔忙于踏板和食槽之間。疲倦地奔忙于踏板和食槽之間。 原因何在?因?yàn)?,小豬踩踏板將一無(wú)所獲,原因何在?因?yàn)?,小豬踩踏板將一無(wú)所獲, 不踩踏板反而能吃上食物。對(duì)小豬而言,無(wú)不踩踏板反而能吃上食物。對(duì)小豬而言,無(wú) 論大豬是否踩動(dòng)踏板,不踩踏板總是好的選論大豬是否踩動(dòng)踏板,不踩踏板總是好的選 擇。反觀大豬,已明知小豬是不會(huì)去踩動(dòng)踏擇。反觀大豬,已明知小豬是不會(huì)去踩動(dòng)踏
48、 板的,自己親自去踩踏板總比不踩強(qiáng)吧,所板的,自己親自去踩踏板總比不踩強(qiáng)吧,所 以只好親力親為了。以只好親力親為了。 “小豬躺著大豬跑小豬躺著大豬跑”的現(xiàn)象是由于故事中的的現(xiàn)象是由于故事中的 游戲規(guī)則所導(dǎo)致的。規(guī)則的核心指標(biāo)是:每游戲規(guī)則所導(dǎo)致的。規(guī)則的核心指標(biāo)是:每 次落下的事物數(shù)量和踏板與投食口之間的距次落下的事物數(shù)量和踏板與投食口之間的距 離。離。 如果改變一下核心指標(biāo),豬圈里還會(huì)出如果改變一下核心指標(biāo),豬圈里還會(huì)出 現(xiàn)同樣的現(xiàn)同樣的“小豬躺著大豬跑小豬躺著大豬跑”的景象嗎?試的景象嗎?試 試看。試看。 改變方案一:減量方案。投食僅原來(lái)的一半改變方案一:減量方案。投食僅原來(lái)的一半 分量。
49、分量。 改變方案二:增量方案。投食為原來(lái)的一倍改變方案二:增量方案。投食為原來(lái)的一倍 分量。分量。 改變方案三:減量加移位方案。投食僅原來(lái)改變方案三:減量加移位方案。投食僅原來(lái) 的一半分量,但同時(shí)將投食口移到踏板附近。的一半分量,但同時(shí)將投食口移到踏板附近。 法國(guó)經(jīng)濟(jì)學(xué)家古諾(法國(guó)經(jīng)濟(jì)學(xué)家古諾(Augustin CournotAugustin Cournot)1919 世紀(jì)提出一個(gè)簡(jiǎn)單雙寡頭模型。假定兩個(gè)廠世紀(jì)提出一個(gè)簡(jiǎn)單雙寡頭模型。假定兩個(gè)廠 商生產(chǎn)同樣產(chǎn)品并都知道市場(chǎng)需求,各廠商商生產(chǎn)同樣產(chǎn)品并都知道市場(chǎng)需求,各廠商 必須決定生產(chǎn)多少,并且它們同時(shí)作出決策。必須決定生產(chǎn)多少,并且它們同時(shí)作
50、出決策。 作產(chǎn)量決策時(shí),各廠商必須考慮它的競(jìng)爭(zhēng)者,作產(chǎn)量決策時(shí),各廠商必須考慮它的競(jìng)爭(zhēng)者, 因?yàn)閷?duì)手也在考慮產(chǎn)量決策,并且它能夠得因?yàn)閷?duì)手也在考慮產(chǎn)量決策,并且它能夠得 到的產(chǎn)量取決于兩個(gè)廠商的總產(chǎn)量。到的產(chǎn)量取決于兩個(gè)廠商的總產(chǎn)量。 古諾模型實(shí)質(zhì)是各廠商將它的競(jìng)爭(zhēng)者產(chǎn)量看古諾模型實(shí)質(zhì)是各廠商將它的競(jìng)爭(zhēng)者產(chǎn)量看 作固定的,然后決定自己生產(chǎn)多少。作固定的,然后決定自己生產(chǎn)多少。 如果如果A A認(rèn)為認(rèn)為B B不生產(chǎn),不生產(chǎn),A A需求線(xiàn)需求線(xiàn) 就是市場(chǎng)需求線(xiàn):就是市場(chǎng)需求線(xiàn):D DA A( (0 0)和 和 MRMRA A( (0 0),),假定邊際成本為常 假定邊際成本為常 數(shù)(數(shù)(MCMCA
51、A),利潤(rùn)最大化產(chǎn)出),利潤(rùn)最大化產(chǎn)出 為為5050。如。如A A認(rèn)為認(rèn)為B B產(chǎn)出為產(chǎn)出為5050, 則則A A需求線(xiàn)左移動(dòng)需求線(xiàn)左移動(dòng)5050個(gè)單位,個(gè)單位, 為為D DA A( (5050)和 和MRMRA A( (5050),),均衡產(chǎn) 均衡產(chǎn) 量量2525。如。如A A認(rèn)為認(rèn)為B B產(chǎn)出量為產(chǎn)出量為7575, 它最佳產(chǎn)出它最佳產(chǎn)出12.512.5;B B產(chǎn)出產(chǎn)出100100 或更多時(shí),或更多時(shí),A A產(chǎn)出量應(yīng)為零。產(chǎn)出量應(yīng)為零。 B B產(chǎn)量越大,產(chǎn)量越大,A A均衡產(chǎn)量越小,均衡產(chǎn)量越小, A A利潤(rùn)最大化產(chǎn)量是它預(yù)期的利潤(rùn)最大化產(chǎn)量是它預(yù)期的 B B產(chǎn)量減函數(shù)。產(chǎn)量減函數(shù)。B B均
52、衡產(chǎn)量也均衡產(chǎn)量也 是它預(yù)期的是它預(yù)期的A A產(chǎn)量的減函數(shù)。產(chǎn)量的減函數(shù)。 DA(0) MRA(0) DA(50) DA(75) MRA(50) MRA(75) Q 5025 12.5 P MCA 廠商廠商A A產(chǎn)量的決定函數(shù)產(chǎn)量的決定函數(shù) 稱(chēng)為廠商稱(chēng)為廠商A A的反應(yīng)曲線(xiàn)的反應(yīng)曲線(xiàn) 并表示為并表示為Q QA A* *(Q QB B);); 廠商廠商B B產(chǎn)量決定函數(shù)稱(chēng)產(chǎn)量決定函數(shù)稱(chēng) 為廠商為廠商B B的反應(yīng)曲線(xiàn)并的反應(yīng)曲線(xiàn)并 表示為表示為Q QB B* *(Q QA A)。圖)。圖 中中Q QA A* *(Q QB B)依據(jù)前面)依據(jù)前面4 4 個(gè)產(chǎn)量組合點(diǎn)作出,個(gè)產(chǎn)量組合點(diǎn)作出,B B 反
53、應(yīng)曲線(xiàn)任意給出。反應(yīng)曲線(xiàn)任意給出。 兩個(gè)曲線(xiàn)交點(diǎn)給出了兩個(gè)曲線(xiàn)交點(diǎn)給出了 均衡產(chǎn)量,稱(chēng)為古諾均衡產(chǎn)量,稱(chēng)為古諾 均衡。具有納什均衡均衡。具有納什均衡 性質(zhì)。性質(zhì)。 QB QA 10075 5025 25 50 75 100 古諾均衡點(diǎn)古諾均衡點(diǎn) 廠商廠商B的反應(yīng)曲線(xiàn)的反應(yīng)曲線(xiàn)Q QB B* *(Q QA A) 廠商廠商A的反應(yīng)曲線(xiàn)的反應(yīng)曲線(xiàn)Q QA A* *(Q QB B) 12.5 求解一個(gè)簡(jiǎn)單古諾模型,討論它與競(jìng)爭(zhēng)均衡和串求解一個(gè)簡(jiǎn)單古諾模型,討論它與競(jìng)爭(zhēng)均衡和串 謀均衡區(qū)別。謀均衡區(qū)別。 假定雙寡頭面臨市場(chǎng)需求曲線(xiàn):假定雙寡頭面臨市場(chǎng)需求曲線(xiàn): P = 60 - Q P = 60 - Q
54、 ;(;(Q = QQ = Q1 1 + Q + Q2 2);); 設(shè)設(shè) MCMC1 1 = AC = AC1 1 = MC = MC2 2 = AC = AC2 2 = 6 = 6。 先求廠商先求廠商1 1反應(yīng)曲線(xiàn):反應(yīng)曲線(xiàn): TRTR1 1 = PQ = PQ1 1 = =(60 - Q60 - Q)Q Q1 1 = (60-Q = (60-Q1 1 - Q - Q2 2)Q)Q1 1 = 60Q = 60Q1 1 - Q - Q1 12 2- Q- Q2 2Q Q1 1 MRMR1 1 = dTR = dTR1 1/dQ/dQ1 1 = 60 - 2Q = 60 - 2Q1 1 - Q - Q2 2 由由MRMR1 1 = MC = MC1 1 = 6 = 6 解得廠商解得廠商1 1反應(yīng)函數(shù)為:反應(yīng)函數(shù)為: Q Q1 1 = 27 - Q = 27 - Q2 2/2 /2 (1 1) 類(lèi)似方法求類(lèi)似方法求TRTR2 2和和MRMR2 2,得廠商,得廠商2 2反應(yīng)函數(shù)為:反應(yīng)函數(shù)為: Q Q2 2 = 27 - Q = 27 - Q1 1/2 /2 (2 2) 古諾均衡解是(古諾均衡解是(1 1)和()和(2 2)的方程組解:)的方程組解
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 甲苯精餾塔課程設(shè)計(jì)結(jié)論
- 網(wǎng)絡(luò)營(yíng)銷(xiāo)微信課程設(shè)計(jì)
- 醫(yī)院設(shè)備管理制度
- 波浪能發(fā)電裝置課程設(shè)計(jì)
- 舞蹈機(jī)構(gòu)古典舞課程設(shè)計(jì)
- 用天正暖通進(jìn)行課程設(shè)計(jì)
- 會(huì)計(jì)師工作總結(jié)細(xì)心核算確保賬目準(zhǔn)確無(wú)誤
- 數(shù)字時(shí)代品牌營(yíng)銷(xiāo)的新趨勢(shì)計(jì)劃
- 日常教學(xué)反思與總結(jié)計(jì)劃
- 裝修合同簡(jiǎn)易版
- 通力電梯KCE電氣系統(tǒng)學(xué)習(xí)指南
- 風(fēng)電場(chǎng)崗位任職資格考試題庫(kù)大全-下(填空題2-2)
- 九年級(jí)數(shù)學(xué)特長(zhǎng)生選拔考試試題
- 幼兒園交通安全宣傳課件PPT
- 門(mén)窗施工組織設(shè)計(jì)與方案
- 健身健美(課堂PPT)
- (完整版)財(cái)務(wù)管理學(xué)課后習(xí)題答案-人大版
- 錨索試驗(yàn)總結(jié)(共11頁(yè))
- 移動(dòng)腳手架安全交底
- 人教版“課標(biāo)”教材《統(tǒng)計(jì)與概率》教學(xué)內(nèi)容、具體目標(biāo)和要求
- 矩形鋼板水箱的設(shè)計(jì)與計(jì)算
評(píng)論
0/150
提交評(píng)論