版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、 1.界定博弈論的一些基本概念;2.界定優(yōu)勢策略和納什均衡3.理解囚犯困境的含義及其應(yīng)用;4.推導(dǎo)重復(fù)性博弈的納什均衡;5.推導(dǎo)序列博弈的納什均衡; 本章要點(diǎn)本章要點(diǎn)學(xué)完本章,你將能夠?qū)W完本章,你將能夠 11 博弈論基礎(chǔ)博弈論基礎(chǔ)2011-13 王秋石2/100 6.理解為什么存在著先動優(yōu)勢;7.理解進(jìn)入威懾的可信性問題8.推導(dǎo)混合策略的納什均衡 本章要點(diǎn)本章要點(diǎn)學(xué)完本章,你將能夠?qū)W完本章,你將能夠 11 博弈論基礎(chǔ)博弈論基礎(chǔ)2011-13 王秋石3/100博弈就是一種比賽博弈就是一種比賽2011-13 王秋石比賽可以比快,也可以比慢。比賽可以比快,也可以比慢。4/100博弈論的基本概念博弈論
2、的基本概念n 博弈論博弈論(game theory):又稱對策論,:又稱對策論,是用于分析是用于分析策略性行為的一種工具。策略性行為的一種工具。n 博弈的分析步驟博弈的分析步驟第一步是尋找到某種有用的方式來第一步是尋找到某種有用的方式來描述描述這場博弈這場博弈;第二步是尋找某種方式來第二步是尋找某種方式來預(yù)測預(yù)測結(jié)果。結(jié)果。n 博弈的要素博弈的要素(1)(1)選手;選手;(2)(2)規(guī)則;規(guī)則;(3)(3)策略;策略;(4)(4)收益;收益;(5)(5)結(jié)果。結(jié)果。2011-13 王秋石5/100“剪子、石頭、布剪子、石頭、布”的博弈的博弈n 該游戲有該游戲有兩個(gè)選手兩個(gè)選手(players)
3、(players),即參與此博弈的行,即參與此博弈的行為者;為者;n 每個(gè)選手有每個(gè)選手有三種策略三種策略(strategies)(strategies)可供選擇:可供選擇:1 1出出剪子;剪子;2 2出石頭;出石頭;3 3出布。通俗點(diǎn)說,策略就是出出布。通俗點(diǎn)說,策略就是出招兒。招兒。n 該游戲有個(gè)該游戲有個(gè)規(guī)則規(guī)則: :如果兩人出了相同的策略如果兩人出了相同的策略( (如石如石頭對石頭等三種可能性頭對石頭等三種可能性) ),雙方為打平;如果兩人,雙方為打平;如果兩人出手不一出手不一( (如石頭對剪子等六種可能性如石頭對剪子等六種可能性) ),則可決,則可決定出勝負(fù),石頭贏剪子、剪子贏布、布
4、贏石頭定出勝負(fù),石頭贏剪子、剪子贏布、布贏石頭( (即即石頭砸剪子、剪子剪布、布包石頭石頭砸剪子、剪子剪布、布包石頭) )。2011-13 王秋石6/100“剪子、石頭、布剪子、石頭、布”的博弈的博弈n 在游戲之前,雙方達(dá)成獎懲協(xié)議在游戲之前,雙方達(dá)成獎懲協(xié)議: :如贏家賺如贏家賺1 1元,元,輸家輸輸家輸1 1元;或者贏家不喝酒,而輸家罰酒一杯等元;或者贏家不喝酒,而輸家罰酒一杯等等。等。n 假如是輸贏假如是輸贏1 1元的協(xié)議,表元的協(xié)議,表(11.1)(11.1)就是這個(gè)游戲的就是這個(gè)游戲的收益表收益表(Payoff table)(Payoff table),把選手的收益狀況用表把選手的收
5、益狀況用表的形式描述,的形式描述,有時(shí)亦稱有時(shí)亦稱收益矩陣收益矩陣(Payoff matrix)(Payoff matrix)。2011-13 王秋石7/100收益表收益表n 如果如果A A出石頭,出石頭,B B也出石頭,各自收益均為也出石頭,各自收益均為0 0;2011-13 王秋石8/100收益表收益表n 如果如果A A出石頭,出石頭,B B出剪子,出剪子,A A的收益為的收益為1 1,B B的收益為的收益為(-1)(-1);2011-13 王秋石9/100收益表收益表n 如果如果A A出石頭,出石頭,B B出布,出布,A A的收益為的收益為(-1)(-1),而,而B B的收的收益為益為1
6、 1。2011-13 王秋石余此類推余此類推10/100博弈論的基本概念博弈論的基本概念n 一般來說,在每個(gè)小方框內(nèi),第一個(gè)數(shù)據(jù)為排在一般來說,在每個(gè)小方框內(nèi),第一個(gè)數(shù)據(jù)為排在左邊的選手左邊的選手A A的收益,第二個(gè)數(shù)據(jù)為排在上方的選的收益,第二個(gè)數(shù)據(jù)為排在上方的選手手B B的收益,中間用逗號隔開,即的收益,中間用逗號隔開,即(A(A,B)=(0B)=(0,0)0)等等。等等。n 上表是一種常見的用表格描述一場博弈的方法上表是一種常見的用表格描述一場博弈的方法,簡簡稱稱常規(guī)式博弈常規(guī)式博弈(normal form)。n 同時(shí)博弈同時(shí)博弈:要求選手同時(shí)出招的博弈。:要求選手同時(shí)出招的博弈。n 序
7、列博弈序列博弈: 選手可以分先后時(shí)間出招的博弈。選手可以分先后時(shí)間出招的博弈。2011-13 王秋石11/100優(yōu)勢策略優(yōu)勢策略n 假定假定A、B 兩人在玩一個(gè)十分簡單的博弈兩人在玩一個(gè)十分簡單的博弈,A 在紙上在紙上可以寫可以寫“上上”或或“下下”,B 在另外一張紙上可以寫在另外一張紙上可以寫“左左”或或“右右”,其收益矩陣如下表所示。其收益矩陣如下表所示。2011-13 王秋石每個(gè)選手都是自我利益極大化者。每個(gè)選手都是自我利益極大化者。12/100優(yōu)勢策略優(yōu)勢策略n 如果如果B B選左,選左,A A選上的收益為選上的收益為1 1,而選下的收益為,而選下的收益為2 2,那么,那么,A A選下
8、;選下;2011-13 王秋石 如果如果B B選右,選右,A A在收益在收益0 0與與1 1之間選擇,之間選擇,A A選擇下。選擇下。13/100優(yōu)勢策略優(yōu)勢策略n 優(yōu)勢策略優(yōu)勢策略: :無論對方選擇什么策略,該選手總是選無論對方選擇什么策略,該選手總是選擇某種固定的策略,又稱占優(yōu)策略。擇某種固定的策略,又稱占優(yōu)策略。n 在本例中,無論在本例中,無論B B出什么招,出什么招,A A總是選下。因此,總是選下。因此,選下是選下是A A的優(yōu)勢策略。的優(yōu)勢策略。n 所謂優(yōu)勢策略,就是無論你出什么招,我就出這所謂優(yōu)勢策略,就是無論你出什么招,我就出這一招。一招。n 選手選手B B也有優(yōu)勢策略嗎?也有優(yōu)勢
9、策略嗎?2011-13 王秋石14/100優(yōu)勢策略優(yōu)勢策略n 給定給定A A選上,選上,B B選左的收益為選左的收益為1 1,而選右的收益為,而選右的收益為2 2,那么,那么,B B選左;選左;2011-13 王秋石 如果如果A A選下,選下,B B在收益在收益0 0與與1 1之間選擇,之間選擇, B B選左。選左。15/100優(yōu)勢策略優(yōu)勢策略n 無論選手無論選手A A如何選擇,如何選擇,B B將始終選擇左。將始終選擇左。n B B選擇左是優(yōu)勢選擇左是優(yōu)勢策略策略。n 在某個(gè)博弈中在某個(gè)博弈中,如果每個(gè)選手都有一種優(yōu)勢策略如果每個(gè)選手都有一種優(yōu)勢策略,那那么么,兩個(gè)選手的優(yōu)勢策略組合就是這一博
10、弈的兩個(gè)選手的優(yōu)勢策略組合就是這一博弈的均衡均衡。n 所謂博弈的所謂博弈的均衡均衡就是會發(fā)生的一種結(jié)局。就是會發(fā)生的一種結(jié)局。2011-13 王秋石16/100優(yōu)勢策略優(yōu)勢策略n 在上例中,在上例中,(A(A,B)=(B)=(下,左下,左)=(2)=(2,1)1)就是該博弈就是該博弈優(yōu)勢策略的均衡結(jié)果優(yōu)勢策略的均衡結(jié)果。2011-13 王秋石17/100優(yōu)勢策略優(yōu)勢策略n 大學(xué)成功秘訣大學(xué)成功秘訣: n 不管你如何,我始終把努不管你如何,我始終把努力學(xué)習(xí)作為我的優(yōu)勢策略力學(xué)習(xí)作為我的優(yōu)勢策略。2011-13 王秋石18/100納什均衡納什均衡n 并非所有的博弈都存在優(yōu)勢策略均衡。并非所有的博弈
11、都存在優(yōu)勢策略均衡。2011-13 王秋石在以下改進(jìn)的博弈中,如果在以下改進(jìn)的博弈中,如果B B選左,選左,A A就選上;如果就選上;如果B B選右,選右,A A就選下;因此,就選下;因此,A A沒有優(yōu)勢策略。沒有優(yōu)勢策略。?19/100納什均衡納什均衡n 同理可以分析,同理可以分析,B B也沒有優(yōu)勢策略。也沒有優(yōu)勢策略。2011-13 王秋石?那么該博弈是否存在著均衡呢?那么該博弈是否存在著均衡呢?20/100納什均衡納什均衡n 優(yōu)勢策略均衡的要求也許太高了點(diǎn)。優(yōu)勢策略均衡的要求也許太高了點(diǎn)。n 它要求無論它要求無論B 出什么招出什么招,A 有一個(gè)優(yōu)勢策略有一個(gè)優(yōu)勢策略;而且還而且還要求無論
12、要求無論A 出什么招出什么招,B 也有一個(gè)優(yōu)勢策略。這兩也有一個(gè)優(yōu)勢策略。這兩個(gè)優(yōu)勢策略的組合才構(gòu)成一個(gè)優(yōu)勢策略均衡。個(gè)優(yōu)勢策略的組合才構(gòu)成一個(gè)優(yōu)勢策略均衡。n 如果給定如果給定B 的選擇的選擇,A 的選擇是最佳的的選擇是最佳的;同時(shí)給定同時(shí)給定A 的選擇的選擇,B 的選擇也是最佳的的選擇也是最佳的,那么,那么,A 和和B 的這組的這組最佳選擇的組合就是最佳選擇的組合就是納什均衡納什均衡。2011-13 王秋石21/100約翰約翰 納什納什n 這是以這是以1994年諾貝爾經(jīng)濟(jì)年諾貝爾經(jīng)濟(jì)學(xué)獎得主、美國經(jīng)濟(jì)學(xué)家學(xué)獎得主、美國經(jīng)濟(jì)學(xué)家約翰約翰納什的名字命名的。納什的名字命名的。n 瑞典皇家科學(xué)院的
13、公報(bào)稱瑞典皇家科學(xué)院的公報(bào)稱:“納什由于引入了合作博納什由于引入了合作博弈與非合作博弈的區(qū)分弈與非合作博弈的區(qū)分,并并為非合作博弈創(chuàng)立了一種為非合作博弈創(chuàng)立了一種均衡概念。這種均衡概念均衡概念。這種均衡概念現(xiàn)在被命名為現(xiàn)在被命名為 納什均衡納什均衡”2011-13 王秋石22/100約翰約翰納什納什納什均衡納什均衡n 如果如果B 選左選左,A 的最佳選擇為上的最佳選擇為上;2011-13 王秋石如果如果B 選右選右,A 的最佳選擇為下的最佳選擇為下;如果如果A 選上選上,B 的最佳選擇為左的最佳選擇為左;如果如果A 選下選下,B的最佳的最佳選擇為右。選擇為右。兩箭頭所指就是兩箭頭所指就是納什均
14、衡。納什均衡。23/100納什均衡納什均衡n 給定給定B 選左選左,A 的最佳選擇為上;給定的最佳選擇為上;給定A選擇上,選擇上,B的最佳選擇為左的最佳選擇為左 ;所以;所以,(上,左上,左)為為納什均衡納什均衡。2011-13 王秋石同理同理,(下,右下,右)為另一組納什均衡。為另一組納什均衡。24/100優(yōu)勢均衡與納什均衡的聯(lián)系與區(qū)別優(yōu)勢均衡與納什均衡的聯(lián)系與區(qū)別n 優(yōu)勢策略優(yōu)勢策略:無論你做什么,我做我最好的;無論:無論你做什么,我做我最好的;無論我做什么,你做你最好的。我做什么,你做你最好的。n 納什均衡納什均衡:給定你的策略,我做我最好的;給定:給定你的策略,我做我最好的;給定我的策
15、略,你做你最好的。我的策略,你做你最好的。n 由此可見,優(yōu)勢策略均衡便是納什均衡的一種特由此可見,優(yōu)勢策略均衡便是納什均衡的一種特例。通俗地講,如果是優(yōu)勢策略均衡,就一定是例。通俗地講,如果是優(yōu)勢策略均衡,就一定是納什均衡;反之,則不然。納什均衡;反之,則不然。2011-13 王秋石25/100囚犯困境囚犯困境n 有兩個(gè)嫌疑犯有兩個(gè)嫌疑犯A A和和B B因合伙偷竊自行車被警方捉拿因合伙偷竊自行車被警方捉拿歸案,且證據(jù)確鑿,可判他們每人各歸案,且證據(jù)確鑿,可判他們每人各2 2年的徒刑。年的徒刑。n 如果他倆都承認(rèn)犯有搶劫銀行罪,當(dāng)局就以兩罪如果他倆都承認(rèn)犯有搶劫銀行罪,當(dāng)局就以兩罪并罰,各判并罰
16、,各判1010年監(jiān)禁;如果兩嫌疑犯都否認(rèn)犯有年監(jiān)禁;如果兩嫌疑犯都否認(rèn)犯有搶劫銀行罪,當(dāng)局則以偷自行車罪各判搶劫銀行罪,當(dāng)局則以偷自行車罪各判2 2年刑;如年刑;如果一方承認(rèn)犯有搶劫銀行罪并提供有效證據(jù),而果一方承認(rèn)犯有搶劫銀行罪并提供有效證據(jù),而另一方拒絕承認(rèn)的話,當(dāng)局以另一方拒絕承認(rèn)的話,當(dāng)局以“坦白從寬,抗拒坦白從寬,抗拒從嚴(yán)從嚴(yán)”的原則,對承認(rèn)犯罪者不再追究偷竊自行的原則,對承認(rèn)犯罪者不再追究偷竊自行車罪而釋放,而對否認(rèn)者三罪并罰(偷自行車、車罪而釋放,而對否認(rèn)者三罪并罰(偷自行車、搶劫銀行和不誠實(shí)罪搶劫銀行和不誠實(shí)罪) )投監(jiān)投監(jiān)2020年。年。2011-13 王秋石26/100囚犯
17、困境囚犯困境n 在這個(gè)游戲中,有兩個(gè)選手:囚犯在這個(gè)游戲中,有兩個(gè)選手:囚犯A和和B,每個(gè)選,每個(gè)選手均有兩種策略。手均有兩種策略。承認(rèn)或否認(rèn)犯有搶劫銀行罪,有可能出現(xiàn)四種結(jié)果,其承認(rèn)或否認(rèn)犯有搶劫銀行罪,有可能出現(xiàn)四種結(jié)果,其收益矩陣如表收益矩陣如表11.411.4所示。表中第一列,如果所示。表中第一列,如果A A和和B B同時(shí)承同時(shí)承認(rèn)犯罪各坐牢認(rèn)犯罪各坐牢1010年;如果年;如果A A否認(rèn)犯罪,而否認(rèn)犯罪,而B B承認(rèn)犯罪,承認(rèn)犯罪,A A坐牢坐牢2020年,而年,而B B卻可自由,表的第二列依此類推。卻可自由,表的第二列依此類推。2011-13 王秋石27/100囚犯困境囚犯困境n 對
18、策論的一個(gè)中心問題對策論的一個(gè)中心問題如果我相信我的對手是如果我相信我的對手是理性的,我如何給定他理性的,我如何給定他的行為做出我的一個(gè)最的行為做出我的一個(gè)最優(yōu)決策,即給定對手行優(yōu)決策,即給定對手行為,我如何做出最佳選為,我如何做出最佳選擇。擇。n 這個(gè)對策存在著均衡嗎?這個(gè)對策存在著均衡嗎?2011-13 王秋石28/100囚犯困境囚犯困境n 給定對方承認(rèn),你也承認(rèn);給定對方否認(rèn),你承認(rèn)。給定對方承認(rèn),你也承認(rèn);給定對方否認(rèn),你承認(rèn)。(承認(rèn),承認(rèn))(承認(rèn),承認(rèn))= =(-10-10,-10-10)就是是優(yōu)勢策略均衡)就是是優(yōu)勢策略均衡;于是;于是( (承認(rèn),承認(rèn)承認(rèn),承認(rèn)) )也是也是囚犯困
19、境的納什均衡囚犯困境的納什均衡。2011-13 王秋石29/100囚犯困境囚犯困境n 為什么把它稱為為什么把它稱為“囚犯困境囚犯困境” 呢?呢?n ( (承認(rèn),承認(rèn)承認(rèn),承認(rèn))=(-10)=(-10,-10)-10)是納什均衡。是納什均衡。n 如果他們都否認(rèn)犯罪,每人只需坐牢如果他們都否認(rèn)犯罪,每人只需坐牢2 2年,而不是年,而不是1010年。年。n ( (否認(rèn),否認(rèn))是一種帕累托效率,而否認(rèn),否認(rèn))是一種帕累托效率,而( (承認(rèn),承承認(rèn),承認(rèn)認(rèn)) )一種帕累托非效率。一種帕累托非效率。n 囚犯困境的囚犯困境的“困惑困惑”就在于為什么納什均衡并非就在于為什么納什均衡并非是帕累托最優(yōu),而帕累托效
20、率又不是納什均衡的是帕累托最優(yōu),而帕累托效率又不是納什均衡的結(jié)果呢?結(jié)果呢?2011-13 王秋石30/100囚犯困境及其應(yīng)用囚犯困境及其應(yīng)用n 囚犯困境隱含著囚犯困境隱含著,合謀也許是一個(gè)更為有效的結(jié),合謀也許是一個(gè)更為有效的結(jié)果。果。n 囚犯困境是在向看不見手的挑戰(zhàn)囚犯困境是在向看不見手的挑戰(zhàn)。亞當(dāng)。亞當(dāng). .斯密的看斯密的看不見的手理論認(rèn)為,市場經(jīng)濟(jì)中的每個(gè)人都在追不見的手理論認(rèn)為,市場經(jīng)濟(jì)中的每個(gè)人都在追求自我利益,但在追求自我利益的過程中同時(shí)也求自我利益,但在追求自我利益的過程中同時(shí)也實(shí)現(xiàn)了社會的公共利益。實(shí)現(xiàn)了社會的公共利益。n 囚犯困境卻揭示社會中的每個(gè)人都在追求自我利囚犯困境卻
21、揭示社會中的每個(gè)人都在追求自我利益,然而,人類社會的公共利益卻不可能實(shí)現(xiàn)。益,然而,人類社會的公共利益卻不可能實(shí)現(xiàn)。2011-13 王秋石31/100囚犯困境一種表現(xiàn)囚犯困境一種表現(xiàn)2011-13 王秋石32/100你急我急大家急急成一團(tuán)你急我急大家急急成一團(tuán)(請對下聯(lián))(請對下聯(lián))廣告困境廣告困境n 做廣告導(dǎo)致需求增加,將激勵企業(yè)大量做廣告。做廣告導(dǎo)致需求增加,將激勵企業(yè)大量做廣告。其一,廣告之后,原本沒使用過本產(chǎn)品的人了解了產(chǎn)其一,廣告之后,原本沒使用過本產(chǎn)品的人了解了產(chǎn)品,其中一部分可能購買之;品,其中一部分可能購買之;其二,一些在使用其它同類品牌的人可能轉(zhuǎn)換過來消其二,一些在使用其它同
22、類品牌的人可能轉(zhuǎn)換過來消費(fèi)本產(chǎn)品。費(fèi)本產(chǎn)品。n 現(xiàn)假定有兩家寡頭面臨著兩個(gè)選擇:(大量)做現(xiàn)假定有兩家寡頭面臨著兩個(gè)選擇:(大量)做廣告和不(大量)做廣告。廣告和不(大量)做廣告。n 在現(xiàn)實(shí)經(jīng)濟(jì)中,他們要選擇做多少廣告的問題。在現(xiàn)實(shí)經(jīng)濟(jì)中,他們要選擇做多少廣告的問題。為了簡化起見,也不失一般性,就假定只有這兩為了簡化起見,也不失一般性,就假定只有這兩種選擇種選擇。2011-13 王秋石33/100可口可樂與百事可樂之爭可口可樂與百事可樂之爭2011-13 王秋石34/100可口可樂與百事可樂之爭可口可樂與百事可樂之爭2011-13 王秋石35/100廣告困境之一廣告困境之一n 無論無論A A如
23、何,如何,B B始終要做廣告,做廣告是始終要做廣告,做廣告是B B的優(yōu)勢策的優(yōu)勢策略;同理,做廣告也是略;同理,做廣告也是A A的優(yōu)勢策略。的優(yōu)勢策略。2011-13 王秋石因此,因此,( (做廣告,做廣告做廣告,做廣告)=(300)=(300,300)300)便成為此博弈便成為此博弈的優(yōu)勢策略均衡,同時(shí)也是納什均衡。的優(yōu)勢策略均衡,同時(shí)也是納什均衡。36/100廣告困境之二廣告困境之二n 企業(yè)企業(yè)B 的優(yōu)勢策略是做廣告的優(yōu)勢策略是做廣告,而企業(yè)而企業(yè)A 卻沒有優(yōu)勢卻沒有優(yōu)勢策略。如果策略。如果B做廣告做廣告,A 最好跟著做廣告最好跟著做廣告;但如果但如果B 不做廣告不做廣告,A 最好的策略也
24、是不做廣告。最好的策略也是不做廣告。2011-13 王秋石37/100廣告困境廣告困境n 因此,因此,( (做廣告,做廣告做廣告,做廣告)=(200)=(200,300)300)依然是納什均依然是納什均衡。衡。2011-13 王秋石但是,但是,( (不做廣告,不做廣告不做廣告,不做廣告)=(500)=(500,600)600)卻是一種帕卻是一種帕累托最優(yōu),但對這種非合作性博弈就偏偏實(shí)現(xiàn)不了。累托最優(yōu),但對這種非合作性博弈就偏偏實(shí)現(xiàn)不了。38/100禁播香煙廣告的法案禁播香煙廣告的法案n 1971 年年1 月月1 日日,美國眾議院通過了禁止在電視上美國眾議院通過了禁止在電視上播出香煙廣告的法案播
25、出香煙廣告的法案.n 但法案的制定者當(dāng)初并不知道它有利于解決香煙但法案的制定者當(dāng)初并不知道它有利于解決香煙廣告困境問題。廣告困境問題。n 它使得美國煙草制造商們花在香煙上的廣告費(fèi)從它使得美國煙草制造商們花在香煙上的廣告費(fèi)從此法案實(shí)施前一年的此法案實(shí)施前一年的3 億美元下降到了實(shí)施后一億美元下降到了實(shí)施后一年的年的6 000 多萬美元多萬美元,這其中大部分都轉(zhuǎn)化為煙草這其中大部分都轉(zhuǎn)化為煙草行業(yè)的利潤了。行業(yè)的利潤了。2011-13 王秋石39/100研發(fā)博弈研發(fā)博弈n 研發(fā)是指企業(yè)研究新技術(shù)、開發(fā)新產(chǎn)品的活動。研發(fā)是指企業(yè)研究新技術(shù)、開發(fā)新產(chǎn)品的活動。n 現(xiàn)假定有兩個(gè)實(shí)力相當(dāng)?shù)墓杨^在兩大策略中
26、選擇研發(fā)現(xiàn)假定有兩個(gè)實(shí)力相當(dāng)?shù)墓杨^在兩大策略中選擇研發(fā)和不研發(fā),其假定的收益矩陣如表和不研發(fā),其假定的收益矩陣如表11.711.7所示。所示。2011-13 王秋石40/100研發(fā)博弈研發(fā)博弈n 寡頭寡頭A 和寡頭和寡頭B 都存在著一種優(yōu)勢策略都存在著一種優(yōu)勢策略研發(fā)研發(fā),所以所以,(研發(fā)研發(fā),研發(fā)研發(fā))成為本博弈中的納什均衡。其實(shí)成為本博弈中的納什均衡。其實(shí),雙方達(dá)到合謀都不研發(fā)或者少研發(fā)是一種帕累托雙方達(dá)到合謀都不研發(fā)或者少研發(fā)是一種帕累托改進(jìn)。改進(jìn)。2011-13 王秋石41/100產(chǎn)量困境產(chǎn)量困境:古諾解古諾解n 我們在第我們在第1010章介紹古諾模型時(shí)假設(shè),有兩家寡頭生產(chǎn)同質(zhì)章介紹古
27、諾模型時(shí)假設(shè),有兩家寡頭生產(chǎn)同質(zhì)的礦泉水,每家寡頭的邊際成本為零,其共同的市場需求的礦泉水,每家寡頭的邊際成本為零,其共同的市場需求曲線為曲線為: : p p=120-=120-q q企業(yè)企業(yè)A A和企業(yè)和企業(yè)B B的數(shù)量反應(yīng)函數(shù)分別為的數(shù)量反應(yīng)函數(shù)分別為: :2011-13 王秋石求解古諾解為:求解古諾解為:42/100產(chǎn)量困境產(chǎn)量困境:古諾解古諾解n 如果兩家組成卡特爾,像一個(gè)壟斷者那樣生產(chǎn),如果兩家組成卡特爾,像一個(gè)壟斷者那樣生產(chǎn),那么那么,MR=MC=0,MR=MC=0,平分市場后有:平分市場后有:2011-13 王秋石如果如果A 生產(chǎn)生產(chǎn)30,但但B 違約生產(chǎn)違約生產(chǎn)40,這樣這樣,
28、p =50,A =1 500, B =2 000,因此因此,B 有違約的激勵。有違約的激勵。同理同理,如果如果B 生產(chǎn)生產(chǎn)30,但但A 違約生產(chǎn)違約生產(chǎn)40,這樣這樣p = 50, A = 2 000, B =1 500,因此因此,A 有違約的激勵。有違約的激勵。43/100產(chǎn)量困境產(chǎn)量困境:古諾解古諾解n 把上述情況用利潤矩陣描述成下表。把上述情況用利潤矩陣描述成下表。2011-13 王秋石44/100產(chǎn)量困境產(chǎn)量困境:古諾解古諾解n 給定給定B合作,合作,A違約,給定違約,給定B違約,違約,A違約;違約;2011-13 王秋石給定給定A合作,合作,B違約,給定違約,給定A違約,違約,B違約
29、;違約;45/100產(chǎn)量困境產(chǎn)量困境:古諾解古諾解n (違約,違約)(違約,違約)=(1600,1600)成為納什均衡。)成為納什均衡。2011-13 王秋石合謀性壟斷產(chǎn)量合謀性壟斷產(chǎn)量(各為各為30)使得雙方利潤都更高使得雙方利潤都更高(1800,1800),但它不是一種納什均衡。),但它不是一種納什均衡。46/100囚犯困境及其應(yīng)用囚犯困境及其應(yīng)用n 以上幾個(gè)例子都有一個(gè)共同特征以上幾個(gè)例子都有一個(gè)共同特征: :合作性博弈的解合作性博弈的解優(yōu)越于非合作性博弈,但合作又不是納什均衡優(yōu)越于非合作性博弈,但合作又不是納什均衡。n 在現(xiàn)實(shí)生活中畢竟有一些在現(xiàn)實(shí)生活中畢竟有一些( (短暫短暫) )合
30、作成功的案例合作成功的案例。核武器不擴(kuò)散條件核武器不擴(kuò)散條件、有核國家不首先使有核國家不首先使用核武器條約用核武器條約,甚至,甚至兩國導(dǎo)彈互不對準(zhǔn)條約兩國導(dǎo)彈互不對準(zhǔn)條約。n 在現(xiàn)實(shí)生活中,有些囚犯就是不承認(rèn)犯罪,原因在現(xiàn)實(shí)生活中,有些囚犯就是不承認(rèn)犯罪,原因是這些博弈不是玩一次,而是在重復(fù)性地玩。是這些博弈不是玩一次,而是在重復(fù)性地玩。2011-13 王秋石47/100重復(fù)性博弈重復(fù)性博弈n 在現(xiàn)實(shí)生活中在現(xiàn)實(shí)生活中,寡頭間關(guān)于彼此產(chǎn)量和價(jià)格的決策寡頭間關(guān)于彼此產(chǎn)量和價(jià)格的決策遠(yuǎn)不止一次遠(yuǎn)不止一次,他們根據(jù)對手的行為在不斷地調(diào)整自他們根據(jù)對手的行為在不斷地調(diào)整自己的產(chǎn)量和價(jià)格。己的產(chǎn)量和價(jià)格
31、。n 這種不斷調(diào)整其策略并改變收益的博弈被稱為這種不斷調(diào)整其策略并改變收益的博弈被稱為重重復(fù)性博弈復(fù)性博弈。n 當(dāng)囚犯困境的雙方只能進(jìn)行一次性博弈時(shí),很難當(dāng)囚犯困境的雙方只能進(jìn)行一次性博弈時(shí),很難進(jìn)行有效的懲罰;而在重復(fù)性博弈時(shí),有效的懲進(jìn)行有效的懲罰;而在重復(fù)性博弈時(shí),有效的懲罰對方或者威脅對方就成為可能了。罰對方或者威脅對方就成為可能了。n 重復(fù)性博弈重復(fù)性博弈擺脫囚犯困境。擺脫囚犯困境。2011-13 王秋石48/100重復(fù)性博弈重復(fù)性博弈n 20 世紀(jì)世紀(jì)60 年代進(jìn)行的實(shí)驗(yàn)性研究尋找到了一種簡年代進(jìn)行的實(shí)驗(yàn)性研究尋找到了一種簡單的辦法單的辦法以牙還牙以牙還牙(tit-for-tat)
32、策略策略能夠有能夠有效地讓意欲違約者保持克制。效地讓意欲違約者保持克制。n 以牙還牙策略以牙還牙策略是指在重復(fù)性博弈過程中某一選手是指在重復(fù)性博弈過程中某一選手對對方在前一期的合作同樣也采取合作的態(tài)度,對對方在前一期的合作同樣也采取合作的態(tài)度,對對方不合作則采取報(bào)復(fù)性的策略。對對方不合作則采取報(bào)復(fù)性的策略。n 在囚犯困境的重復(fù)性博弈中,大家都清楚地知道在囚犯困境的重復(fù)性博弈中,大家都清楚地知道,合作的巨大收益提供了合作的正面激勵,對方,合作的巨大收益提供了合作的正面激勵,對方的有效威脅和潛在傷害則提供了合作的負(fù)面激勵的有效威脅和潛在傷害則提供了合作的負(fù)面激勵。2011-13 王秋石49/100
33、重復(fù)性博弈重復(fù)性博弈:價(jià)格:價(jià)格n 在固定價(jià)格的一次性博弈中,哪怕有約在先,雙在固定價(jià)格的一次性博弈中,哪怕有約在先,雙方都保持壟斷價(jià)格同時(shí)分享市場需求,最后的均方都保持壟斷價(jià)格同時(shí)分享市場需求,最后的均衡為各自采用競爭性價(jià)格獲得零經(jīng)濟(jì)利潤。衡為各自采用競爭性價(jià)格獲得零經(jīng)濟(jì)利潤。n 但在重復(fù)性博弈中,情況有所不同。雙方知道,但在重復(fù)性博弈中,情況有所不同。雙方知道,如果我降價(jià),對方一定會降價(jià),可能降得還更慘如果我降價(jià),對方一定會降價(jià),可能降得還更慘,對方要置我于死地而后快;如果我采取合作態(tài),對方要置我于死地而后快;如果我采取合作態(tài)度,對方很可能也會合作。度,對方很可能也會合作。n 為什么我不首
34、先采取合作態(tài)度為什么我不首先采取合作態(tài)度把價(jià)格定在壟把價(jià)格定在壟斷價(jià)格呢?斷價(jià)格呢?2011-13 王秋石50/100重復(fù)性博弈重復(fù)性博弈:日常生活:日常生活n 在公交車上,我們很少為素不相識的乘客買車票在公交車上,我們很少為素不相識的乘客買車票,因?yàn)檫@大凡是一次性博弈。,因?yàn)檫@大凡是一次性博弈。n 而我們很可能為朋友買車票,我們與朋友的交往而我們很可能為朋友買車票,我們與朋友的交往是重復(fù)性博弈。如果他是個(gè)吝嗇鬼,你可以選擇是重復(fù)性博弈。如果他是個(gè)吝嗇鬼,你可以選擇不與他同車等。不與他同車等。n 在重復(fù)性博弈中,每個(gè)人都比較關(guān)心自己的聲譽(yù)在重復(fù)性博弈中,每個(gè)人都比較關(guān)心自己的聲譽(yù),正是這種聲譽(yù)
35、機(jī)制使得人們大量采取,正是這種聲譽(yù)機(jī)制使得人們大量采取合作性策合作性策略略。2011-13 王秋石51/100重復(fù)性博弈重復(fù)性博弈:軍事合作:軍事合作n 牙還牙策略在軍事上也有所表現(xiàn)。牙還牙策略在軍事上也有所表現(xiàn)。n 有核國家首先不使用核武器的協(xié)議有核國家首先不使用核武器的協(xié)議到目前為到目前為止遵守得很好的原因就是這個(gè)以牙還牙策略。止遵守得很好的原因就是這個(gè)以牙還牙策略。n 但是,但是,兩國導(dǎo)彈互不對準(zhǔn)協(xié)議兩國導(dǎo)彈互不對準(zhǔn)協(xié)議遵循得就會差遵循得就會差一些,兩國關(guān)系一旦惡化,很有可能都在暗地里一些,兩國關(guān)系一旦惡化,很有可能都在暗地里違約違約。2011-13 王秋石52/100重復(fù)性博弈重復(fù)性博
36、弈:戰(zhàn)地醫(yī)院戰(zhàn)地醫(yī)院n 以牙還牙策略可以使戰(zhàn)地以牙還牙策略可以使戰(zhàn)地醫(yī)院享受愛情的浪漫。醫(yī)院享受愛情的浪漫。n 如果你專門轟炸對方的戰(zhàn)如果你專門轟炸對方的戰(zhàn)地醫(yī)院,你自己的醫(yī)院也地醫(yī)院,你自己的醫(yī)院也就處于危險(xiǎn)之中。就處于危險(xiǎn)之中。n 如果你打我的戰(zhàn)地醫(yī)院,如果你打我的戰(zhàn)地醫(yī)院,我絕對要以牙還牙,報(bào)仇我絕對要以牙還牙,報(bào)仇雪恨。雪恨。n 以上這些對人類行為的觀以上這些對人類行為的觀察能夠幫助我們更好地認(rèn)察能夠幫助我們更好地認(rèn)識人類的行為方式。識人類的行為方式。2011-13 王秋石53/100重復(fù)性博弈重復(fù)性博弈n 以牙還牙策略能否成功實(shí)施取決于博弈的次數(shù)。以牙還牙策略能否成功實(shí)施取決于博弈的
37、次數(shù)。我們將重復(fù)性博弈按次數(shù)分類為有限次重復(fù)性博我們將重復(fù)性博弈按次數(shù)分類為有限次重復(fù)性博弈和無限次重復(fù)性博弈。弈和無限次重復(fù)性博弈。n 有限次重復(fù)性博弈有限次重復(fù)性博弈就是未來博弈的次數(shù)已經(jīng)確定就是未來博弈的次數(shù)已經(jīng)確定的博弈,也被稱為固定次數(shù)的重復(fù)性博弈。的博弈,也被稱為固定次數(shù)的重復(fù)性博弈。n 無限次重復(fù)性博弈無限次重復(fù)性博弈就是可以無限次數(shù)地、重復(fù)性就是可以無限次數(shù)地、重復(fù)性地玩的一種博弈。地玩的一種博弈。2011-13 王秋石54/100有限次重復(fù)性博弈有限次重復(fù)性博弈n 假定我們知道假定我們知道囚犯困境囚犯困境博弈只博弈只玩十次玩十次,現(xiàn)在就是,現(xiàn)在就是最后一次,結(jié)果會如何呢?最后
38、玩的那次博弈就最后一次,結(jié)果會如何呢?最后玩的那次博弈就像只玩一次的博弈。因此,兩者的結(jié)果應(yīng)該是相像只玩一次的博弈。因此,兩者的結(jié)果應(yīng)該是相同的。同的。n 第九輪第九輪會如何呢?我們已知在第十輪雙方都會承會如何呢?我們已知在第十輪雙方都會承認(rèn)犯罪,為什么在第九輪就要合作呢?認(rèn)犯罪,為什么在第九輪就要合作呢?n 同理,同理,第八輪第八輪、第七輪、第七輪都會出現(xiàn)只玩一次博都會出現(xiàn)只玩一次博弈的納什均衡。弈的納什均衡。n 只要這一博弈重復(fù)的次數(shù)已知,每一輪的結(jié)果都只要這一博弈重復(fù)的次數(shù)已知,每一輪的結(jié)果都是原納什均衡的結(jié)果。是原納什均衡的結(jié)果。2011-13 王秋石55/100無限次無限次重復(fù)性博弈
39、重復(fù)性博弈n 以牙還牙策略只有在無限以牙還牙策略只有在無限次重復(fù)性博弈中才能有效次重復(fù)性博弈中才能有效。n 歐佩克(歐佩克(OPECOPEC)是一個(gè)合)是一個(gè)合作比較成功的卡特爾組織作比較成功的卡特爾組織,其原因之一就是無限次,其原因之一就是無限次重復(fù)性博弈所隱含的各種重復(fù)性博弈所隱含的各種懲罰機(jī)制。懲罰機(jī)制。n 無限次重復(fù)性博弈所形成無限次重復(fù)性博弈所形成的合作均衡解并不是穩(wěn)定的合作均衡解并不是穩(wěn)定的,它較為容易被打破。的,它較為容易被打破。2011-13 王秋石56/100序列博弈序列博弈n 到目前為止所討論的博弈都是兩個(gè)選手要同時(shí)選到目前為止所討論的博弈都是兩個(gè)選手要同時(shí)選擇策略。例如,
40、在古諾模型中,兩家企業(yè)同時(shí)決擇策略。例如,在古諾模型中,兩家企業(yè)同時(shí)決定產(chǎn)量。定產(chǎn)量。n 在序列博弈中,選手們按先后順序進(jìn)行選擇。因在序列博弈中,選手們按先后順序進(jìn)行選擇。因此,此,序列博弈序列博弈就是就是選手依次出招的博弈。選手依次出招的博弈。n 斯坦伯格模型就是序列博弈的一個(gè)例子,一企業(yè)斯坦伯格模型就是序列博弈的一個(gè)例子,一企業(yè)是領(lǐng)導(dǎo)者,率先決定其產(chǎn)量,另一企業(yè)是跟隨者是領(lǐng)導(dǎo)者,率先決定其產(chǎn)量,另一企業(yè)是跟隨者,相應(yīng)決定其產(chǎn)量。,相應(yīng)決定其產(chǎn)量。2011-13 王秋石57/100序列博弈序列博弈n 經(jīng)過分析經(jīng)過分析,我們知道該博弈有兩個(gè)納什均衡我們知道該博弈有兩個(gè)納什均衡:(上上,左左)和
41、和(下下,右右)。但是。但是,我們將說明其中的一個(gè)均衡不大我們將說明其中的一個(gè)均衡不大合理。合理。2011-13 王秋石58/100擴(kuò)展型博弈擴(kuò)展型博弈n 圖圖11. 1 是表是表11. 9 中的博弈的中的博弈的擴(kuò)展型博弈,擴(kuò)展型博弈,它有些它有些像樹狀像樹狀,故被稱為故被稱為博弈樹博弈樹。n 因此因此,用博弈樹表示的博弈被稱為用博弈樹表示的博弈被稱為擴(kuò)展型擴(kuò)展型,用表格所用表格所表示的博弈被稱為表示的博弈被稱為常規(guī)型常規(guī)型。2011-13 王秋石59/100擴(kuò)展型博弈擴(kuò)展型博弈2011-13 王秋石如何求解擴(kuò)展型博弈的納什均衡呢?如何求解擴(kuò)展型博弈的納什均衡呢? 假定假定A A已經(jīng)選擇了上,
42、已經(jīng)選擇了上,B B一定會選擇左,收益一定會選擇左,收益為(為(1 1,9 9);); 但如果但如果A A選擇下,選擇下,B B只好選擇右,收益為(只好選擇右,收益為(2 2,1 1)。)。60/100擴(kuò)展型博弈擴(kuò)展型博弈2011-13 王秋石A A是先動者,在信息完備時(shí),當(dāng)他看到博弈樹端點(diǎn)是先動者,在信息完備時(shí),當(dāng)他看到博弈樹端點(diǎn)的收益情況后,他一定會選擇下。的收益情況后,他一定會選擇下。這樣(上,左)就不再是一個(gè)合理的均衡了。這樣(上,左)就不再是一個(gè)合理的均衡了。從擴(kuò)展型博弈看,(下,右)是唯一的納什均從擴(kuò)展型博弈看,(下,右)是唯一的納什均衡。衡。61/100“先動優(yōu)勢先動優(yōu)勢”n A
43、 A好開心,他享受到了好開心,他享受到了“先動優(yōu)勢先動優(yōu)勢”。一步為先,。一步為先,步步為先。步步為先。n 再看看選手再看看選手B B,他有些可,他有些可憐,他本可享受憐,他本可享受9 9,最后,最后只好收益為只好收益為1 1。他要看人。他要看人家的臉色行事。家的臉色行事。2011-13 王秋石62/100“先動優(yōu)勢先動優(yōu)勢”n 當(dāng)然,他可以向當(dāng)然,他可以向A A發(fā)出威脅:如果發(fā)出威脅:如果A A選下,他報(bào)復(fù)選下,他報(bào)復(fù)性地選左,兩人都同歸于盡,各自收益為零。性地選左,兩人都同歸于盡,各自收益為零。n 如果如果A A相信相信B B會實(shí)施威脅,會實(shí)施威脅,A A只好選擇上,這樣,只好選擇上,這樣
44、,A A的收益至少為的收益至少為1 1,而不是零。,而不是零。n 但這個(gè)但這個(gè)威脅可信嗎威脅可信嗎?在一次性博弈中,一旦?在一次性博弈中,一旦A A選擇選擇了下,了下,B B就沒辦法了,只有在就沒辦法了,只有在0 0和和1 1的收益中進(jìn)行理的收益中進(jìn)行理性選擇,只好有氣無力地選擇右啰。性選擇,只好有氣無力地選擇右啰。2011-13 王秋石63/100“先動優(yōu)勢先動優(yōu)勢”n 現(xiàn)在我們這樣思考現(xiàn)在我們這樣思考: :在此博弈中,如果由于種種原在此博弈中,如果由于種種原因,因,B B為先動者,均衡點(diǎn)又何在呢?它是否證明了為先動者,均衡點(diǎn)又何在呢?它是否證明了所謂所謂“先動優(yōu)勢先動優(yōu)勢”?n 如果上例中
45、的如果上例中的B B先動,他會選擇左,然后先動,他會選擇左,然后A A沒辦法沒辦法,只好選擇上。先動者得到了,只好選擇上。先動者得到了9 9的收益,后動時(shí)他的收益,后動時(shí)他只得到只得到1 1。n 這就說明了的確存在著所謂的這就說明了的確存在著所謂的“先動優(yōu)勢先動優(yōu)勢”,即,即在序列博弈中,首先采取策略的選手通常得利更在序列博弈中,首先采取策略的選手通常得利更大。大。2011-13 王秋石64/100先動優(yōu)勢:斯塔克伯格解先動優(yōu)勢:斯塔克伯格解n 用前一章學(xué)過的斯塔克伯格模型進(jìn)一步解釋先動用前一章學(xué)過的斯塔克伯格模型進(jìn)一步解釋先動優(yōu)勢。優(yōu)勢。n 需求曲線依然為需求曲線依然為 p p=120-=1
46、20-q q,n 假定企業(yè)假定企業(yè)A A為領(lǐng)導(dǎo)者,企業(yè)為領(lǐng)導(dǎo)者,企業(yè)B B為跟隨者,斯塔克伯為跟隨者,斯塔克伯格解為:格解為:q q* *A A=60=60,q q* *B B=30=30,p p=30=30, A =1800=1800, B=900=900。n 現(xiàn)在以表現(xiàn)在以表11.811.8為基礎(chǔ),再加上斯塔克伯格解,我為基礎(chǔ),再加上斯塔克伯格解,我們得到下表:們得到下表:2011-13 王秋石65/100先動優(yōu)勢:斯塔克伯格解先動優(yōu)勢:斯塔克伯格解2011-13 王秋石此博弈是否存在此博弈是否存在納什均衡納什均衡呢?呢?如果如果A選選30,B選選40;如果;如果A選選40,B也選也選40
47、;如果;如果A選選60,B選選30。如果如果B選選30,A選選40;如果;如果B選選40,A也選也選40;如果;如果B選選60,A選選30。這樣,兩個(gè)天真的跟隨者的這樣,兩個(gè)天真的跟隨者的產(chǎn)量(40,40)才是)才是納什均衡。66/100先動優(yōu)勢:斯塔克伯格解先動優(yōu)勢:斯塔克伯格解n 現(xiàn)假定現(xiàn)假定A 為領(lǐng)導(dǎo)者為領(lǐng)導(dǎo)者,B 為跟隨者為跟隨者,把表把表11. 10 改為擴(kuò)改為擴(kuò)展型的博弈樹。展型的博弈樹。2011-13 王秋石這三對策略都是子博弈的均衡。這三對策略都是子博弈的均衡。67/100先動優(yōu)勢:斯塔克伯格解先動優(yōu)勢:斯塔克伯格解n 哪一個(gè)會成為整個(gè)博弈的均衡呢哪一個(gè)會成為整個(gè)博弈的均衡呢?
48、 既然我先動既然我先動,我我選選60啦,我的利潤最大。啦,我的利潤最大。2011-13 王秋石斯塔克爾伯格的解為斯塔克爾伯格的解為(A,B)= (60,30)=(1800,900)。)。68/100幾個(gè)寡頭模型解的比較幾個(gè)寡頭模型解的比較n 給定需求函數(shù)給定需求函數(shù)p p=120-=120-q q,MCMC=0=0,1.1. E E點(diǎn)(點(diǎn)(4040,4040)為)為古諾古諾解解2.2. S SA A(6060,3030)為)為A A先動的先動的斯斯塔克伯格解塔克伯格解,S SB B(3030,6060)為)為B B先動的斯塔克伯格先動的斯塔克伯格解;解;3.3. C C點(diǎn)(點(diǎn)(6060,606
49、0)為)為競爭性競爭性均衡均衡;4.4. M M點(diǎn)(點(diǎn)(3030,3030)為合謀性)為合謀性均衡。均衡。2011-13 王秋石69/100進(jìn)入威懾進(jìn)入威懾n 在一些寡頭行業(yè),乃至壟斷行業(yè)中,總是存在著在一些寡頭行業(yè),乃至壟斷行業(yè)中,總是存在著企業(yè)進(jìn)入的可能性。一般來說,誰都希望自己是企業(yè)進(jìn)入的可能性。一般來說,誰都希望自己是個(gè)壟斷者。個(gè)壟斷者。n 因此,現(xiàn)有壟斷者總是會采取一些措施威懾新企因此,現(xiàn)有壟斷者總是會采取一些措施威懾新企業(yè)的進(jìn)入。有些威脅是可信的,但也有些威脅是業(yè)的進(jìn)入。有些威脅是可信的,但也有些威脅是不可信的。不可信的。n 潛在進(jìn)入者潛在進(jìn)入者(定義為定義為A)為先動者為先動者,
50、它有兩種選擇它有兩種選擇:進(jìn)進(jìn)入或放棄?,F(xiàn)有壟斷者入或放棄?,F(xiàn)有壟斷者(定義為定義為B)為后動者為后動者,它有兩它有兩種策略種策略:一是降低價(jià)格實(shí)施反擊一是降低價(jià)格實(shí)施反擊,二是不反擊。二是不反擊。2011-13 王秋石70/100進(jìn)入威懾進(jìn)入威懾2011-13 王秋石如果如果A A不進(jìn)入,不進(jìn)入,B B也不反擊,這是事件的起點(diǎn),也不反擊,這是事件的起點(diǎn),A A和和B B的利潤分別為的利潤分別為0 0和和8 8,這是最后一行。,這是最后一行。71/100進(jìn)入威懾進(jìn)入威懾2011-13 王秋石如果如果A A不進(jìn)入,不進(jìn)入,B B還要反擊,這是一組沒有實(shí)際意還要反擊,這是一組沒有實(shí)際意義的策略組合
51、,利潤也假定同前,這是倒數(shù)第二行。義的策略組合,利潤也假定同前,這是倒數(shù)第二行。72/100進(jìn)入威懾進(jìn)入威懾2011-13 王秋石如果如果A A選擇進(jìn)入,選擇進(jìn)入,B B發(fā)出威脅信號,要以降價(jià)為發(fā)出威脅信號,要以降價(jià)為手段反擊,手段反擊,(A,BA,B)=(=(-1-1,4).,4).73/100進(jìn)入威懾進(jìn)入威懾2011-13 王秋石如果如果A A選擇進(jìn)入,選擇進(jìn)入,B B不反擊的收益為不反擊的收益為6 6,大于反擊,大于反擊時(shí)的時(shí)的4 4,它的威脅是不可信的。,它的威脅是不可信的。因此,因此,A A決定進(jìn)入。最后,均衡解為決定進(jìn)入。最后,均衡解為(A(A,B)=(B)=(進(jìn)進(jìn)入,不反擊入,不
52、反擊) )。74/100不可信威脅不可信威脅n 在現(xiàn)實(shí)生活中,不可信威脅還是比較多見的。比在現(xiàn)實(shí)生活中,不可信威脅還是比較多見的。比如如“老師,你不讓我及格我無臉見朋友我就跳樓老師,你不讓我及格我無臉見朋友我就跳樓”,“你不嫁給我,我就跟你同歸于盡你不嫁給我,我就跟你同歸于盡”,“如如果你硬要嫁給那臭小子,你就不是我的女兒,我果你硬要嫁給那臭小子,你就不是我的女兒,我也不是你爹也不是你爹”,“如果你要侵略我的盟國,我就如果你要侵略我的盟國,我就對你實(shí)施核打擊對你實(shí)施核打擊”等等。等等。n 這里所講的這里所講的“不可信不可信”是在正常狀態(tài)對收益和成是在正常狀態(tài)對收益和成本比較所做出的一種理性判斷
53、。但的確存在著一本比較所做出的一種理性判斷。但的確存在著一些非理性的人。這種人的威脅往往是成功的,可些非理性的人。這種人的威脅往往是成功的,可信的,這被稱為信的,這被稱為“非理性的理性非理性的理性”。2011-13 王秋石75/100愛的心語愛的心語2011-13 王秋石如果你不買那件衣服如果你不買那件衣服給我,我就不給你燒給我,我就不給你燒飯。飯。76/100可信的可信的威脅威脅n 在本例中,現(xiàn)有壟斷者如何實(shí)現(xiàn)可信的承諾呢?在本例中,現(xiàn)有壟斷者如何實(shí)現(xiàn)可信的承諾呢?n 其中一種辦法就是在潛在進(jìn)入者尚未考慮進(jìn)入之其中一種辦法就是在潛在進(jìn)入者尚未考慮進(jìn)入之前前,就做好了擴(kuò)大生產(chǎn)能力的物資準(zhǔn)備,一
54、旦有就做好了擴(kuò)大生產(chǎn)能力的物資準(zhǔn)備,一旦有潛在進(jìn)入者進(jìn)入,它就可以以更低的平均成本生潛在進(jìn)入者進(jìn)入,它就可以以更低的平均成本生產(chǎn)更多的產(chǎn)量,為打價(jià)格戰(zhàn)做好了充分的準(zhǔn)備。產(chǎn)更多的產(chǎn)量,為打價(jià)格戰(zhàn)做好了充分的準(zhǔn)備。此時(shí),利潤分配狀況此時(shí),利潤分配狀況會會發(fā)生發(fā)生實(shí)質(zhì)實(shí)質(zhì)變化變化。n 到時(shí)就別怪我不客氣。到時(shí)就別怪我不客氣。2011-13 王秋石77/100可信的可信的威脅威脅2011-13 王秋石78/100可信的可信的威脅威脅n 這種威脅可信嗎?如果這種威脅可信嗎?如果A A選擇進(jìn)入,選擇進(jìn)入,B B一定會選擇一定會選擇反擊。因?yàn)榉磽舻氖找鏋榉磽?。因?yàn)榉磽舻氖找鏋? 3,大于不反擊的收益,大于不
55、反擊的收益2 2。n 一旦一旦B B反擊,反擊,A A的利潤為(的利潤為(-2-2)。如果)。如果A A選擇不進(jìn)入選擇不進(jìn)入,利潤為零。那就不進(jìn)入吧!,利潤為零。那就不進(jìn)入吧!n 最后最后,A ,A 選擇放棄進(jìn)入選擇放棄進(jìn)入,B ,B 威懾成功威懾成功。n 生命的機(jī)會成本為零的人的威脅大多可行嗎?生命的機(jī)會成本為零的人的威脅大多可行嗎?2011-13 王秋石79/100純粹策略純粹策略n 在上述博弈中在上述博弈中,我們所考察的所有策略都是有特定我們所考察的所有策略都是有特定的策略或行動的的策略或行動的,例如例如,進(jìn)入或不進(jìn)入進(jìn)入或不進(jìn)入,承認(rèn)或否認(rèn)承認(rèn)或否認(rèn),定價(jià)為定價(jià)為3 元或?yàn)樵驗(yàn)? 元
56、等。元等。n 這種選手采用特定策略的策略就是這種選手采用特定策略的策略就是純粹策略純粹策略。n 讓我們看一個(gè)讓我們看一個(gè) “手心手背博弈手心手背博弈”。2011-13 王秋石80/100手心手背博弈手心手背博弈n 給定給定A A出手心,出手心,B B的最佳策略是手背;給定的最佳策略是手背;給定A A出手背出手背,B B的最佳策略是手心。的最佳策略是手心。2011-13 王秋石 給定給定B B出手心,出手心,A A的最佳策略是手心;給定的最佳策略是手心;給定B B出手出手背,背,A A的最佳策略是手背。的最佳策略是手背。 這里不存在任何一組策略使得兩人都同時(shí)滿足,這里不存在任何一組策略使得兩人都
57、同時(shí)滿足,因此,因此,沒有沒有納什均衡納什均衡。(不存在兩個(gè)同時(shí)所指的。(不存在兩個(gè)同時(shí)所指的箭頭)箭頭)81/100混合策略混合策略n 在純粹策略中,選手要么選手心,要么選手背;在純粹策略中,選手要么選手心,要么選手背;而在混合策略中,選手可以而在混合策略中,選手可以50%50%的概率出手心,的概率出手心,50%50%的概率出手背;或者其他什么概率。的概率出手背;或者其他什么概率。n 這種基于一組選擇的概率對其結(jié)果進(jìn)行隨機(jī)選擇這種基于一組選擇的概率對其結(jié)果進(jìn)行隨機(jī)選擇的策略就是的策略就是混合策略混合策略。n 盡管從純粹策略而言,盡管從純粹策略而言,手心手背手心手背博弈不存在著納博弈不存在著納
58、什均衡;但從混合策略上講,它是存在著納什均什均衡;但從混合策略上講,它是存在著納什均衡的衡的。2011-13 王秋石82/100混合策略混合策略n 如何求解混合策略的納什均衡呢?如何求解混合策略的納什均衡呢?n 納什均衡的實(shí)質(zhì)納什均衡的實(shí)質(zhì)是:它必然是一個(gè)選手對另外一個(gè)選是:它必然是一個(gè)選手對另外一個(gè)選手最佳策略的一種最佳反應(yīng)。如果是你的最佳策略,手最佳策略的一種最佳反應(yīng)。如果是你的最佳策略,但不是我的,這不是納什均衡;如果是我的最佳策略但不是我的,這不是納什均衡;如果是我的最佳策略,但不是你的,這也不是納什均衡。只有兩個(gè)同時(shí)為,但不是你的,這也不是納什均衡。只有兩個(gè)同時(shí)為最佳策略才為納什均衡
59、。最佳策略才為納什均衡。n 在選手在選手A A看來,如果他選手心的概率幾乎為看來,如果他選手心的概率幾乎為1 1,選手,選手B B幾乎選手背,但幾乎選手背,但A A對此的最佳反應(yīng)都是選手背,沒有對此的最佳反應(yīng)都是選手背,沒有均衡。同理,如果均衡。同理,如果A A選手心的概率幾乎為選手心的概率幾乎為0 0(即更可能(即更可能選手背),選手背),B B的最佳選擇是手心,但的最佳選擇是手心,但A A對此的最佳反應(yīng)對此的最佳反應(yīng)又是手心,也沒有均衡。又是手心,也沒有均衡。2011-13 王秋石83/100混合策略混合策略n 要使得這一博弈存在均衡的關(guān)鍵是要使得這一博弈存在均衡的關(guān)鍵是A A要選擇出手心
60、的一個(gè)要選擇出手心的一個(gè)概率概率p p(那么,出手背的概率便為(那么,出手背的概率便為1-p1-p),使得對手),使得對手B B不會不會選擇一個(gè)確定性策略,而是對幾種選擇無差異。選擇一個(gè)確定性策略,而是對幾種選擇無差異。n 這樣,如果這樣,如果A A以以p p的概率選手心,(的概率選手心,(1-p1-p)的概率選手背,)的概率選手背,那么,那么,B B選手心的預(yù)期收益(或效用)等于:選手心的預(yù)期收益(或效用)等于:2011-13 王秋石 同理,同理,B B選手背的預(yù)期效用等于:選手背的預(yù)期效用等于:84/100混合策略混合策略n 欲使欲使B B對選手心和手背的預(yù)期效用無差異,就必須對選手心和手
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年度年福建省高校教師資格證之高等教育心理學(xué)題庫附答案(典型題)
- 2024年度山西省高校教師資格證之高等教育法規(guī)能力檢測試卷A卷附答案
- 2024年度年福建省高校教師資格證之高等教育學(xué)考前自測題及答案
- 四年級數(shù)學(xué)(四則混合運(yùn)算帶括號)計(jì)算題專項(xiàng)練習(xí)與答案
- 北京版英語小學(xué)五年級上學(xué)期期末試題與參考答案(2024年)
- 2024年股東專項(xiàng)資金墊付協(xié)議樣本
- 2024年市場代銷業(yè)務(wù)協(xié)議參考樣本
- 2024煤礦作業(yè)綜合運(yùn)營承包協(xié)議
- 2024年規(guī)范化藥品招標(biāo)協(xié)議范例
- 2024裝修項(xiàng)目訂金協(xié)議范書
- 各省中國鐵路限公司2024招聘(目前38183人)高頻難、易錯點(diǎn)500題模擬試題附帶答案詳解
- 杭州本級公共租賃住房資格續(xù)審申請表Ⅴ
- 建筑垃圾外運(yùn)施工方案
- 上海市青浦區(qū)上海五浦匯實(shí)驗(yàn)學(xué)校 2024-2025學(xué)年上學(xué)期六年級數(shù)學(xué)期中試卷(無答案)
- 大學(xué)實(shí)訓(xùn)室虛擬仿真平臺網(wǎng)絡(luò)VR實(shí)訓(xùn)室方案(建筑學(xué)科)
- 體育賽事組織與執(zhí)行手冊
- 2024年擴(kuò)大“司機(jī)之家”覆蓋范圍工作策劃方案
- 2024二十屆三中全會知識競賽題庫及答案
- 消化系統(tǒng)常見疾病課件(完美版)
- 醫(yī)院檢驗(yàn)外包服務(wù)項(xiàng)目招標(biāo)文件
- 檔案整理及數(shù)字化服務(wù)方案
評論
0/150
提交評論