




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
Lecture13博弈論與經(jīng)濟(jì)行為1Lecture13博弈論與經(jīng)濟(jì)行為1Introduction到目前為止,我們對經(jīng)濟(jì)活動的考察沒有考慮人們之間的相互影響。其實(shí),一個人的行為總是受到他人行為的影響。人們在追逐自己利益時,難免要與他人發(fā)生利益沖突或矛盾。如何克服和解決人們之間的利益沖突?如何才能實(shí)現(xiàn)一種既能讓每個人都實(shí)現(xiàn)自己的利益,又能讓每個人都不妨礙和傷害他人利益的互利互惠的和諧局面?博弈論(gametheory)為解決這些問題提供了有力工具。博弈論以人的理性為基本假定,強(qiáng)調(diào)策略性——一種普遍的行為現(xiàn)象。這種現(xiàn)象的廣闊背景是市場中的競爭與合作。20世紀(jì)80年代以來,博弈論在經(jīng)濟(jì)學(xué)中得到了廣泛應(yīng)用,在揭示經(jīng)濟(jì)行為的相互影響和制約方面取得了重大進(jìn)展。大部分經(jīng)濟(jì)活動都可以用博弈論加以解釋,甚至連市場調(diào)節(jié)與宏觀調(diào)控這樣的重大問題,都可看成博弈現(xiàn)象來研究。2Introduction到目前為止,我們對經(jīng)濟(jì)活動的考察沒有(一)兩個充滿理性與智慧的博弈故事Introduction豬圈里有一大一小兩頭豬,豬圈一邊裝有踏板,踩一下,遠(yuǎn)離踏板的食槽端就會落下食物。若一豬去踩踏板,另一豬就會等在槽邊搶先吃到食物。若小豬去踩,大豬會在小豬跑到食槽前吃光食物;若大豬去踩,大豬還有機(jī)會在小豬吃完之前搶吃到食物的一半。這兩頭豬會采取什么策略呢?答案:小豬舒服地等在槽邊,大豬要為爭取殘羹奔忙于踏板和食槽之間。原因:對小豬而言,去踩,吃不到食物;不去踩,反而能吃到一半食物,當(dāng)然不去踩了。反觀大豬,明知小豬不為,那么自己為之總還是要比不為強(qiáng)。1.智豬博弈的故事3(一)兩個充滿理性與智慧的博弈故事Introduction智豬故事揭示了大、小企業(yè)的關(guān)系。當(dāng)企業(yè)定位于“大豬”時,應(yīng)選擇“主動獲得”之優(yōu)勢策略;當(dāng)定位于“小豬”時,應(yīng)選擇“等待獲得”,這也是優(yōu)勢策略。比如,研究開發(fā)、為新產(chǎn)品做廣告,這對大企業(yè)值得,對小企業(yè)是得不償失的。完全市場中,作為一個理性企業(yè),最可能的情況是小企業(yè)把精力花在模仿上,或等待大企業(yè)打開市場后出售廉價產(chǎn)品。而大企業(yè)應(yīng)當(dāng)以主動的態(tài)度來開拓市場。智豬故事還給競爭中的弱者以等待為最佳策略的啟發(fā)。博弈中,每一方都想方設(shè)法攻擊對方、保護(hù)自己,最終取得勝利;同時,對方也是一個與你一樣的理性人,他會這么做嗎?這就需要更高明的智慧。任何理性企業(yè)都必然會像智豬那樣,總是選擇優(yōu)勢策略。Introduction(三)兩個充滿理性與智慧的博弈故事1.智豬博弈的故事(啟示)4智豬故事揭示了大、小企業(yè)的關(guān)系。當(dāng)企業(yè)定位于“大豬”時,應(yīng)選Introduction(三)兩個充滿理性與智慧的博弈故事2.魚與魚竿的故事從前有兩個饑餓的人從一位智者那里得到了一根魚竿和一簍鮮魚。得到那簍鮮魚的人在原地把魚煮熟吃完,解決了饑餓問題,可很快又感到肚內(nèi)空空,最終餓死在空魚簍旁邊。另外一個得到魚竿的人提著魚竿朝向遙遠(yuǎn)的大海走去,當(dāng)他終于來到海邊的時候,也用盡了最后一點(diǎn)力氣而死去。不久之后,同樣是兩個饑餓的人,也從智者那里得到了一根魚竿和一簍鮮魚。不同的是:他們一起去尋找大海。每到饑餓的時候,就從魚簍中拿出一條魚吃。當(dāng)他們最終來到海邊的時候,這兩個人就拿著那根魚竿開始了捕魚為生的日子!5Introduction(三)兩個充滿理性與智慧的博弈故事(二)
博弈論的研究對象博弈是一種普遍現(xiàn)象,人們總會有意、無意地運(yùn)用博弈的思想。比如企業(yè)在決策時,總是會考慮競爭對手的反應(yīng);個人與政府之間“上有政策,下有對策”;金融監(jiān)管與創(chuàng)新猶如“貓鼠博弈”;博弈還作為消遣游戲,讓人們獲得快樂。博弈的特征表現(xiàn)為兩個或兩個以上具有利益沖突的當(dāng)事人處于一種不相容狀態(tài)中,一方的行動取決于對方的行動,每個當(dāng)事人的收益都取決于所有當(dāng)事人的行動。當(dāng)所有當(dāng)事人都拿定主意作出決策時,博弈的局勢便確定下來。博弈論的目的是要研究人們之間這種不相容的行為,推廣標(biāo)準(zhǔn)的一人決策理論。博弈論關(guān)注的問題:在每個當(dāng)事人的收益都依賴于其他當(dāng)事人的選擇的情況下,追求個人收益最大化的當(dāng)事人應(yīng)該如何采取行動?Introduction6(二)博弈論的研究對象博弈是一種普遍現(xiàn)象,人們總會有意、無(三)
博弈的標(biāo)準(zhǔn)形式與分類基本要素:局中人(players)、策略(strategies)、收益(payoffs)局中人以策略定勝負(fù),以收益最大化為目標(biāo)。標(biāo)準(zhǔn)形式(normalform):G=(Xi,
fi)n,其中
Xi為局中人
i
的策略集合,fi:
S
R
為局中人
i
的收益函數(shù)(i=
1,2,,n)。S=X1X2Xn
叫做博弈G的局勢集合。局勢:策略
n
元組
(x1,
x2,,
xn)(
xiXi,i=
1,2,,n)。博弈的分類:一般按照博弈的基本要素進(jìn)行分類。按人數(shù)分:二人博弈、多人博弈按策略分:有限(策略)博弈、無限(策略)博弈按收益分:常和(零和)博弈、變和博弈按性質(zhì)分:非合作博弈、合作博弈按次序分:同時移動博弈、先后移動博弈(序貫博弈)交叉分類:以上分類方式的結(jié)合,比如二人零和有限博弈。Introduction7(三)博弈的標(biāo)準(zhǔn)形式與分類基本要素:局中人(players矩陣博弈我們先以矩陣博弈為重點(diǎn),建立博弈論的基本分析框架。矩陣博弈:二人零和有限博弈,這是最簡單的博弈形式。特點(diǎn):甲與乙利益沖突,一方的收益就是對方的損失。甲的策略集
X
={x1,
x2,,
xm}; 乙的策略集Y
={y1,
y2,,
yn}S=X
Y={(xi,
yj):i
=1,2,,m
;j
=1,2,,n}甲的收益函數(shù)f:S
R;乙的收益函數(shù)g
:S
R零和:f
(xi,
yj)
+
g
(xi,
yj)
=
0(i=1,2,,m
;j
=
1,2,,n)標(biāo)準(zhǔn)形式:G=(X,f;Y,
g)=(X,Y,f)矩陣博弈的矩陣表示:甲的收益矩陣
f即可表示矩陣博弈。8矩陣博弈我們先以矩陣博弈為重點(diǎn),建立博弈論的基本分析框(一)
古諾均衡局中人的目標(biāo):選擇合適的策略以使自己的收益(對方的損失)達(dá)到最大,也即讓對方的收益(自己的損失)達(dá)到最小。假定:甲和乙彼此了解對方的收益矩陣,雙方都清楚自己的收益就是對方的損失。博弈過程:每個人都根據(jù)對方的行動來確定自己的行動,每個人都不斷地在對方選定了策略的情況下來調(diào)整自己的策略以使自己的收益達(dá)到最大。博弈結(jié)局:當(dāng)策略調(diào)整達(dá)到這樣的局勢(xh,yk)使得
xh是甲在乙選定yk的情況下的收益最大策略,同時yk是乙甲在選定xh的情況下的收益最大策略的時候,雙方策略調(diào)整宣告結(jié)束,博弈得以確定。此時的局勢(xh,yk)就是古諾均衡(最優(yōu)解),即矩陣博弈9(一)古諾均衡局中人的目標(biāo):選擇合適的策略以使自己的收益(1.最大最小原理依據(jù)定義,矩陣博弈
f
的古諾均衡正對應(yīng)于矩陣
f
的鞍點(diǎn)。鞍點(diǎn)定理(最大最小原理)
是矩陣的鞍點(diǎn)(即局勢(xh,
yk)是矩陣博弈
f的古諾均衡)當(dāng)且僅當(dāng)下述等式成立:矩陣博弈古諾均衡的求解步驟從矩陣各行的最小元中找出最大元,稱為最大最小元;從矩陣各列的最大元中找出最小元,稱為最小最大元;如果最大最小元與最小最大元一致,那么該元素就是鞍點(diǎn),代表矩陣博弈的古諾均衡。
(一)
古諾均衡矩陣博弈x1y1x2x4x3y3y4y5YXz鞍點(diǎn)古諾均衡y2101.最大最小原理依據(jù)定義,矩陣博弈f的古諾均衡正對應(yīng)于2.兩個博弈事例
乙甲作廣告不作廣告作廣告3030不作廣告2020例1.廣告競爭:存在古諾均衡單位:萬元(一)
古諾均衡矩陣博弈例2.便士匹配:沒有古諾均衡甲、乙獨(dú)立決定出示硬幣正或反面。若兩人出示相同,甲贏乙1元;若出示相反,乙贏甲1元。甲的收益表如下:乙甲出示正面出示反面出示正面11出示反面11112.兩個博弈事例3.穩(wěn)妥策略與不穩(wěn)定性只有當(dāng)收益矩陣的最大最小元與最小最大元一致時,矩陣博弈才有古諾均衡(最優(yōu)解)。最大最小元和最小最大元總存在,但二者未必一致,從而矩陣博弈可能沒有最優(yōu)解。例如,便士匹配博弈沒有最優(yōu)解。矩陣博弈可能沒有最優(yōu)解的真正原因是什么?穩(wěn)妥策略甲的穩(wěn)妥策略:甲的收益矩陣的最大最小元;乙的穩(wěn)妥策略:甲的收益矩陣的最小最大元。問題的答案:原因在于穩(wěn)妥策略可能不穩(wěn)定。不穩(wěn)定的穩(wěn)妥策略不能使博弈中的策略調(diào)整過程結(jié)束。即使甲和乙都選擇穩(wěn)妥策略,但若穩(wěn)妥策略不穩(wěn)定,那么博弈就無法達(dá)到古諾均衡。矩陣博弈(一)
古諾均衡123.穩(wěn)妥策略與不穩(wěn)定性只有當(dāng)收益矩陣的最大最小元與最小最大(二)
混合策略
為了消除古諾均衡未必存在的困惑,人們提出使用混合策略,即一種連當(dāng)事人自己都不知道會采取什么行動的策略,對手就更不得而知了,從而使得局中人的行動變得相當(dāng)詭異。考慮二人有限博弈G=(X,f;Y,g):X={x1,x2,…,xm}:甲的純策略集合;Y={y1,y2,…,yn}:乙的純策略集合;S=X
Y:博弈G的純局勢集合?;旌喜呗?mixedstrategies):以一定的概率采取一種策略。甲的混合策略集合:乙的混合策略集合:G的混合局勢集合:甲的預(yù)期收益:乙的預(yù)期收益:混合擴(kuò)充:博弈叫做
G
的混合擴(kuò)充。矩陣博弈13(二)混合策略為了消除古諾均衡未必存在的1.矩陣博弈的混合擴(kuò)充定理博弈
G=(X,f;Y,g)
為常和博弈當(dāng)且僅當(dāng)G
的混合擴(kuò)充
為常和博弈。當(dāng)G
是常和博弈時,G
與
具有相同的收入常和。因此,矩陣博弈的混合擴(kuò)充仍為二人零和博弈。矩陣博弈
G
的混合均衡:是指
G
的混合擴(kuò)充
的古諾均衡。即,G的混合局勢(p*,q*)叫做
G
的混合均衡(混合最優(yōu)解)是指(p*,q*)滿足如下條件:定理(混合均衡的存在性)任何矩陣博弈都有混合均衡。矩陣博弈
f
的混合均衡正對應(yīng)于函數(shù)
Ef
的鞍點(diǎn)。鞍點(diǎn)定理(最小最大原理)(
p*,
q*)是矩陣博弈G
的混合均衡(即函數(shù)
Ef的鞍點(diǎn))
當(dāng)且僅當(dāng)下述等式成立:(二)
混合策略
矩陣博弈141.矩陣博弈的混合擴(kuò)充定理博弈G=(X,f;2.事例:求解便士匹配博弈的混合均衡便士匹配博弈中,甲的收益矩陣為尋找混合均衡,就是去找出使得(二)
混合策略
矩陣博弈152.事例:求解便士匹配博弈的混合均衡便士匹配博弈中,甲的收3.混合均衡集的特點(diǎn)博弈值:混合均衡的存在性及鞍點(diǎn)定理,保證了V(G)是良好定義的,并且當(dāng)(p*,q*)是混合均衡時,V(G)
=Ef(p*,q*)。博弈值在解釋均衡及求解混合均衡方面相當(dāng)有用。還可通過V(G)
證明矩陣博弈的混合均衡集的下述特點(diǎn)。令定理
對于甲和乙的矩陣博弈G=(X,Y,f)來說,T=
T1T2且混合均衡集
T是空間的非空有界閉凸子集,從而甲的混合最優(yōu)策略集T1是的非空有界閉凸子集,乙的混合最優(yōu)策略集T2
是
的非空有界閉凸子集。
(二)
混合策略
矩陣博弈163.混合均衡集的特點(diǎn)博弈值:定理對于甲和乙的矩陣博弈二人博弈矩陣博弈僅僅是一類簡單又典型的二人常和博弈,經(jīng)濟(jì)學(xué)中遇到的博弈往往都是變和博弈。矩陣博弈理論之所以重要,是因為它為研究變和博弈提供了很好的分析思路和框架?,F(xiàn)在,我們來在矩陣博弈理論的基礎(chǔ)上建立一般的二人博弈理論。
二人博弈:
古諾均衡二人有限博弈:策略集合X和Y為有限集合。二人無限博弈:策略集合X和Y為無限(任意)集合。二人博弈的重復(fù):博弈不只進(jìn)行一次,而是要進(jìn)行多次。17二人博弈矩陣博弈僅僅是一類簡單又典型的二人常和博弈,經(jīng)濟(jì)學(xué)中(一)
二人有限博弈二人博弈古諾均衡應(yīng)對
yj的上策
xi(
j):當(dāng)乙采取yj
時,甲采取xi(
j)是最好的,即fi(
j)j是f的第j列的最大元:。應(yīng)對
xi的上策yj(i):當(dāng)甲采取xi
時,甲采取yj(i)是最好的,即gi
j(i)是g的第i行的最大元:。甲的上上策
xi*:不論乙采取什么策略,xi*都是甲的上策,即f的第i*行最大:。乙的上上策
yj*:不論甲采取什么策略,yj*都是乙的上策,即g的第j*列最大:
。占優(yōu)解(xi*,yj*):xi*是甲的上上策,yj*是乙的上上策。18(一)二人有限博弈二人博弈古諾均衡181.求解方法二人博弈(一)
二人有限博弈最大最小原理只適用于矩陣博弈,一般的二人有限博弈的求解只能采取通用方法。把局中人甲和乙的收益矩陣寫在同一張表中。圈出甲的收益矩陣各列的最大元。圈出乙的收益矩陣各行的最大元。收益表中同時出現(xiàn)兩個圈的位置即為古諾均衡。如果沒有一個位置出現(xiàn)兩個圈,就說明該博弈的古諾均衡不存在。如果在甲的收益矩陣的某一行上全部帶圈,則就出現(xiàn)了甲的上上策;同樣,若在乙的收益矩陣的某一列上全部帶圈,則就出現(xiàn)了乙的上上策。如果既找到了甲的上上策,又找到了乙的上上策,那么也就找到了博弈的占優(yōu)解。否則,博弈沒有占優(yōu)解。191.求解方法二人博弈(一)二人有限博弈最大最小原理只適用2.求解事例二人博弈(一)
二人有限博弈囚徒難題乙甲合作背叛合作3304背叛4011古諾均衡上上策上上策智豬博弈小豬大豬去踩踏板不去踩去踩踏板7355不去踩10000上上策均衡次優(yōu)均衡—剔除乙甲y1y2y3y4x1121582623141811x21820151611191517x315101849221714x41712131814171920找出下列博弈的古諾均衡古諾均衡(x2,y1)(x4,y4)無上上策202.求解事例二人博弈(一)二人有限博弈囚徒難題乙合作背叛,預(yù)期收益都為2/3。3.混合策略二人博弈(一)
二人有限博弈G=(X,f;Y,
g)的混合擴(kuò)充:G的混合均衡(
p*,
q*):角谷不動點(diǎn)定理
設(shè)
T
是有限維歐氏空間的非空有界閉凸子集,F(xiàn):
T
T
是集值映射。若
F
上半連續(xù)且對任何xT,F(xiàn)(x)都是非空閉凸集,那么F
必有不動點(diǎn),即(xT
)(xF(x))。定理(混合均衡存在性)
任何二人有限博弈都有混合均衡。卡夫茹達(dá)話劇足球話劇2100足球0012例.性別之戰(zhàn):性別差異導(dǎo)致收益差異21
假設(shè)G1X
是拓?fù)湎蛄靠臻gV1的非空緊凸子集;乙的策略集合Y是
拓?fù)湎蛄靠臻gV2的非空緊凸子集;故局勢集合
S
是拓?fù)湎蛄靠臻gV1V2的非空緊凸子集。假設(shè)G2甲的收益函數(shù)
f
(x,y)連續(xù)且關(guān)于策略變元
x
弱擬凹;乙的收益函數(shù)g(x,y)連續(xù)且關(guān)于策略變元
y
弱擬凹。(二)
二人無限博弈G
=
(X,f;
Y,
g):X
和Y
為無限集合,S
=
X
Y
。二人有限博弈的混合擴(kuò)充是二人無限博弈,二人無限博弈的混合擴(kuò)充依然是二人無限博弈。因此,二人無限博弈是二人博弈的一般情形,無需再討論其混合擴(kuò)充。古諾均衡(x*,
y*):XYzf
(x*,
y*)古諾均衡g
(x*,
y*)二人博弈x*y*22假設(shè)G1X是拓?fù)湎蛄靠臻gV1的非空緊凸子集;乙的策略1.均衡的存在性與反應(yīng)函數(shù)范格不動點(diǎn)定理設(shè)T是拓?fù)湎蛄靠臻g的非空緊凸子集,集值映射
F
:
T
T
上半連續(xù)且對任何
xT,F(xiàn)(x)
都是非空閉凸集。則
F
有不動點(diǎn),即(tT)(tF(t))。定理(古諾均衡的存在性)任何滿足假設(shè)G1和G2的二人無限博弈都有古諾均衡。反應(yīng)函數(shù)甲對乙的反應(yīng):當(dāng)乙采取策略
y時,甲的應(yīng)對上策
x=(y)為:f
(x,
y)
=max
{
f
(x,y):xX
}。(y):甲的反應(yīng)函數(shù)。乙對甲的反應(yīng):當(dāng)甲采取策略
x時,乙的應(yīng)對上策
y=(x)為:g(x,
y)
=max
{g(x,y
):y
Y
}。(x):乙的反應(yīng)函數(shù)。古諾均衡(x*,
y*):(二)
二人無限博弈二人博弈231.均衡的存在性與反應(yīng)函數(shù)范格不動點(diǎn)定理設(shè)T是拓?fù)湎蛄?.用反應(yīng)函數(shù)求解古諾均衡比如,(二)
二人無限博弈二人博弈一般情形:找出反應(yīng)曲線的交點(diǎn),如右圖所示。特殊情況:X
和
Y
都是實(shí)數(shù)區(qū)間,收益函數(shù)f:XR
和g:Y
R可微。于是,反應(yīng)函數(shù)由下述方程確定:YXx1x2x3x4x5x6x7x8y1y2y3y4y5古諾均衡甲的反應(yīng)曲線乙的反應(yīng)曲線242.用反應(yīng)函數(shù)求解古諾均衡比如,(二)二人無限博弈二人博(三)
重復(fù)博弈雖然人們對二人博弈的最優(yōu)解作了深入研究,但讓局中人找到最優(yōu)解卻不是一件容易的事情,需要反復(fù)實(shí)踐和鍛煉,就好像棋手下棋一樣,需要反復(fù)不斷地下,才能越來越接近最優(yōu)解??梢姡┺氖切枰貜?fù)進(jìn)行。但到目前為止,所研究的博弈都是一次性博弈。因此,有必要研究博弈的重復(fù)。事實(shí)上,當(dāng)博弈重復(fù)進(jìn)行時,其最優(yōu)結(jié)局可能會與一次性博弈的均衡有所差異。下面以囚徒難題博弈為例,來說明重復(fù)博弈的最優(yōu)解。我們將分兩種情況討論:博弈重復(fù)進(jìn)行有限次博弈重復(fù)進(jìn)行無限次二人博弈25(三)重復(fù)博弈雖然人們對二人博弈的最優(yōu)解作了深入研究,但讓1.有限次重復(fù)博弈每個局中人都知道博弈將重復(fù)一個固定的次數(shù)。最后一次博弈中局中人的推理:這是最后一次行動,每個人都認(rèn)為此時是在進(jìn)行一次性博弈,因而古諾均衡的標(biāo)準(zhǔn)邏輯得以應(yīng)用,結(jié)果局中人雙方選擇“背叛”。倒數(shù)第二次博弈:這里似乎每個人都重視合作,可以向?qū)Ψ桨l(fā)出“善意”的合作信號,以便在下次博弈中繼續(xù)合作。但理性的局中人清楚,最后一次博弈中對方必然背叛。因此他在倒數(shù)第二次博弈中選擇合作就沒有優(yōu)勢,故要選擇背叛。倒數(shù)第三次博弈:局中人的推理與倒數(shù)第二次一樣,結(jié)果在倒數(shù)第三次博弈中,局中人依然選擇背叛。結(jié)局:逆向歸納(backward
induction)可知,每次博弈中雙方都要“背叛”,有限次重復(fù)博弈的最優(yōu)解依然是古諾均衡。古諾均衡是局中人雙方的短期利益所在。(三)
重復(fù)博弈二人博弈261.有限次重復(fù)博弈每個局中人都知道博弈將重復(fù)一個固定的次數(shù)2.無限次重復(fù)博弈(三)
重復(fù)博弈二人博弈每個局中人都知道,博弈要無限重復(fù)進(jìn)行下去。每個局中人的策略都是一個函數(shù)序列,表明每個人在每個階段的策略選擇都是此階段之前的博弈歷史的函數(shù)。這樣,局中人的收益是各階段收益的貼現(xiàn)值之和(向時刻0貼現(xiàn)):。R:局中人永不背叛的收益;RT:局中人第T次背叛的收益。
只要貼現(xiàn)率r<2,就有RT<R,即選擇背叛無利可圖,還是合作為好。貼現(xiàn)率小于2是平常的,說明通常情況下,只要博弈能夠無限次重復(fù)下去,則可實(shí)現(xiàn)“(合作,合作)”。雙方選擇合作是局中人雙方的長期利益所在。
272.無限次重復(fù)博弈(三)重復(fù)博弈二人博弈每個局中人都知道多人非合作博弈二人一次性博弈是典型的非合作博弈,局中人之間沒有串通和勾結(jié),各個局中人都是獨(dú)立決策和獨(dú)立行動。20世紀(jì)50年代,美國數(shù)學(xué)家納什成功地將這種博弈模式推廣到多人情形,接連發(fā)表了多篇研究論文,為現(xiàn)代博弈論的形成和發(fā)展奠定了堅實(shí)基礎(chǔ)。納什對多人非合作博弈作出了明確界定,提出了多人非合作博弈的“納什均衡”概念,并應(yīng)用角谷不動點(diǎn)定理證明了納什均衡的存在性。由于納什均衡是對矩陣博弈的古諾均衡概念的推廣,因此人們也常常把納什均衡稱作古諾-納什均衡。納什均衡存在性定理的重要意義:該定理的結(jié)論可以直接向經(jīng)濟(jì)系統(tǒng)推廣,并且這種推廣是阿羅和德布羅重建瓦爾拉一般均衡理論大廈的關(guān)鍵所在。28多人非合作博弈二人一次性博弈是典型的非合作博弈,局中人之間沒G
的混合擴(kuò)充:(一)非合作的多人有限博弈定理(納什定理)
任何非合作
n
人有限博弈都有混合最優(yōu)解。多人非合作博弈博弈
G
=
(Xi,fi)iI:納什均衡:29G的混合擴(kuò)充:(一)非合作的多人有限博弈定理(納什定理)(二)非合作的多人連續(xù)博弈
連續(xù)博弈:策略集合為拓?fù)淇臻g,收益函數(shù)為連續(xù)函數(shù)。x*S是納什均衡
x*
(x*)(即x*為的不動點(diǎn))。假設(shè)G1每個局中人
i
的策略集合
Xi都是某個拓?fù)湎蛄靠臻gVi的非空緊凸子集,從而局勢集合S是拓?fù)湎蛄靠臻gV1Vn的非空緊凸子集。假設(shè)G2連續(xù)且關(guān)于策略變元
xi弱擬凹。定理(均衡存在性)
任何滿足假設(shè)G1和G2的n人非合作博弈都有納什均衡。多人非合作博弈(i
的上策集)30(二)非合作的多人連續(xù)博弈連續(xù)博弈:策略集合為拓?fù)淇臻g,(三)
帶約束條件的納什均衡
假設(shè)G3在帶約束的博弈G
=
(Xi,
fi,
Bi)iI中,每個局中人
i
的約束集映Bi:SXi都是連續(xù)的集值映射,同時對任何xS,Bi(x)都是Xi的非空閉凸子集,并且Bi(x)與局中人i在局勢x中的策略無關(guān)。定理(帶約束條件的納什均衡存在性)
任何滿足假設(shè)G1、G2和G3的
n
人非合作博弈都有納什均衡。納什均衡:多人非合作博弈帶約束的博弈:31(三)帶約束條件的納什均衡假設(shè)G3在帶約束的博弈G=合作博弈當(dāng)博弈從二人發(fā)展到多人參與的時候,局中人就不再像二人博弈那樣只是獨(dú)立行動,而是可以開展合作。一些局中人聯(lián)合起來對抗另外一些局中人。他們出于某種動機(jī)或需要而結(jié)成聯(lián)盟,互通情報信息,采取一致行動,以便取得對自己有利的結(jié)果。這種相互配合、彼此協(xié)作、結(jié)成聯(lián)盟的現(xiàn)象就是合作博弈的原型。在合作博弈中,局中人自己的策略選擇已經(jīng)不再是什么重要事情,關(guān)鍵是聯(lián)盟如何選擇策略,如何采取一致行動,聯(lián)盟的收入如何向其成員進(jìn)行分配。收入分配問題至關(guān)重要,它決定著局中人能否形成聯(lián)盟,盟外人又是否愿意加入到聯(lián)盟中來。現(xiàn)在,我們來討論這些問題,建立多人合作博弈的理論。我們將以有限博弈為對象展開討論,至于無限博弈的情形,這里的理論和方法都可以自然地推廣過去。
32合作博弈當(dāng)博弈從二人發(fā)展到多人參與的時候,局中人就不再像二人(一)
聯(lián)盟對抗博弈
G=(Xi,
ui)iI
,局中人集合
I
=
{1,2,,n}。合作表現(xiàn)為局中人結(jié)盟,即形成聯(lián)盟。聯(lián)盟是I
的子集。定義
博弈
G
中的一個聯(lián)盟是指局中人集合
I
的一個子集。對于這個定義,以下三點(diǎn)值得注意:如果
A
是聯(lián)盟,那么
B
=
I
–
A
也是聯(lián)盟——
A
的余聯(lián)盟。任何聯(lián)盟
A
都把局中人分成兩個聯(lián)盟:聯(lián)盟
A
和余聯(lián)盟
B。
I
和空集
都是聯(lián)盟且互為余聯(lián)盟??占?/p>
稱為空聯(lián)盟。只含一個局中人的集合也是聯(lián)盟,叫做單人聯(lián)盟。通過聯(lián)盟,合作博弈轉(zhuǎn)化為非合作博弈。若
A
是聯(lián)盟,那么G
轉(zhuǎn)化為
A
與余聯(lián)盟
B
的非合作博弈GA=
(XA,
uA;XB,
uB):局中人A
和
B,策略集合分別為
XA=
iAXi和
XB=
iBXi,局勢集合為
X=
iIXi=
XA
XB,局勢
x
=
(x1,,
xn)
=
(xA,
xB),A
和
B
的收益函數(shù)分別為
uA(x)
=
iA
ui(x)和
uB(x)
=
iB
ui(x)。合作博弈33(一)聯(lián)盟對抗博弈G=(Xi,ui)iI,局中(二)
特征函數(shù)通過聯(lián)盟
A,G
轉(zhuǎn)化為二人非合作博弈
GA
=
(XA,
uA;XB,
uB),由此可引出G
的特征函數(shù)V:V(A)是
uA在鞍點(diǎn)處的值,等于零和博弈(XA,
uA;XB,
uA)的局中人
A在古諾均衡中的收益(馮·諾伊曼據(jù)此提出了特征函數(shù))。特征函數(shù)V(A)具有以下基本性質(zhì):對于空聯(lián)盟來說,V()
=
0
(這是因為
u
=
0)。若A,
BP(I
)
且
AB
=,則V(AB
)
V(A)
+
V(B)。若G為零和,則V(I
)
=
0
且(AP
(I
))(V(I
–
A)
=
V(A))??杉有裕喝绻?/p>
V(AB
)
=
V(A)+V(B)
對一切不相交的聯(lián)盟
A
和B成立,則稱特征函數(shù)V
是可加的(即具有可加性)。當(dāng)V可加時,V(A)
=
iAV({i})對一切聯(lián)盟
A
成立。這表明結(jié)盟與不結(jié)盟無差別,從而合作沒有意義。這種特征函數(shù)可加的博弈,稱為非本質(zhì)博弈。人們感興趣的是本質(zhì)博弈。合作博弈34(二)特征函數(shù)通過聯(lián)盟A,G轉(zhuǎn)化為二人非合作博弈GA(三)
收入分配特征函數(shù)表示聯(lián)盟總收入。這筆收入在聯(lián)盟內(nèi)部又如何分配?為了研究收入分配問題,首先給出收入分配的定義。定義
博弈
G
=
(Xi,
ui)n
的收入分配(簡稱分配)是一個n維向量(r1,
r2,,
rn)
使得
V(I
)
=
iI
ri且
ri
vi=V({i})
(i
=1,2,,n)。V(I
)
=
iI
ri:全體局中人組成聯(lián)盟,每人從中得到收入。vi=V({i}):局中人不與他人結(jié)盟而單干的收入;ri
vi:局中人加盟的收入不低于單干的收入,聯(lián)盟的吸引力就在于參加聯(lián)盟能夠得到更多的收入。v
=
(v1,
v2,,
vn):單干收入向量。V(I
)
iI
vi
(特征函數(shù)性質(zhì))。收入分配具有下述一些性質(zhì):(r1,
r2,,
rn)
是分配存在
(a1,
a2,,
an)
0
使得
ri=
vi
+
ai(i
=1,2,,n)
且iI
ai=V(I
)
iI
vi。n
人非本質(zhì)博弈的分配只有單干收入向量v
=
(v1,
v2,,
vn)。
本質(zhì)博弈的分配有無限多個。合作博弈35(三)收入分配特征函數(shù)表示聯(lián)盟總收入。這筆收入在聯(lián)盟內(nèi)部又(四)
核心最優(yōu)解AP(I)
是收入分配
t
=
(t1,
t2,,
tn)
的反對者聯(lián)盟,是指存在另一種分配r
=
(r1,
r2,,
rn)
使得
(V(A)
iA
ri)
&
(iA)(ri
>
ti)。核心最優(yōu)解:是指不存在反對者聯(lián)盟的收入分配。只有這種收入分配,才能被所有局中人接受。G
的核心(core)
C(G):是指由所有核心最優(yōu)解組成的集合
。占優(yōu)分配:對于收入分配
r
和
t,
r
A
t
(在聯(lián)盟
A
中
r
比
t
占優(yōu))是指V(A
)
iA
ri
且
ri
>
ti對一切
iA
成立;rt
(
r
比
t
占優(yōu))是指存在聯(lián)盟
A
使得r
A
t。占優(yōu)關(guān)系
A
具有傳遞性,但占優(yōu)關(guān)系
不具有傳遞性。若
r
A
t
且
A
,則
A
I且A
不是單人聯(lián)盟。對任何收入分配
r=(r1,
r2,,
rn),rC(G)
當(dāng)且僅當(dāng)
iA
ri
V(A)對一切非空聯(lián)盟A
成立。當(dāng)
G
為零和本質(zhì)博弈時,C(G)=
。合作博弈36(四)核心最優(yōu)解AP(I)是收入分配t=(t1序貫博弈迄今為止,我們討論的博弈都具有簡單的動態(tài)結(jié)構(gòu),即它們是一次性博弈,或者是一次性博弈的重復(fù)序列,而且還具有簡單的信息結(jié)構(gòu),即每個局中人都知道其他局中人的收益情況及可以采用的各種策略。換句話說,各個局中人都是同時移動的。然而實(shí)際中,許多利益較量博弈并不具備這種結(jié)構(gòu),局中人的決策和行動具有先后次序,即每個局中人都是在看到其他對手的行動后才開始行動的。這種局中人在行動上具有先后次序的博弈,就是所謂的序貫博弈(sequentialgame)。對序貫博弈進(jìn)行研究,將會產(chǎn)生一些新的概念和方法。37序貫博弈迄今為止,我們討論的博弈都具有簡單的動態(tài)結(jié)構(gòu),即它們(一)
博弈的擴(kuò)展形式:博弈樹省略號序貫博弈38(一)博弈的擴(kuò)展形式:博弈樹省略號序貫博弈38(二)
子博弈與逆向歸納求解法
541769653496253981369458甲乙丙序貫均衡
乙丙丙丙序貫博弈39(二)子博弈與逆向歸納求解法57642934甲乙丙序貫均完全均衡是序貫博弈的這樣一種結(jié)局:局中人在所有到達(dá)的子博弈中都處于納什均衡狀態(tài)。完全均衡
=
序貫均衡
+
納什均衡(三)
信息集與完全均衡
非納什均衡之解甲乙乙正正正反反反101015812685納什均衡序貫均衡乙的信息集序貫博弈40完全均衡是序貫博弈的這樣一種結(jié)局:局中人在所有到達(dá)的子博弈中子博弈完全均衡(subgameperfectequilibrium)是指這樣的序貫均衡,其在任何子博弈中都處于納什均衡狀態(tài)。(四)
子博弈完全均衡甲乙乙正左左反右右13230021完全均衡子博弈均衡子博弈完全均衡序貫博弈41子博弈完全均衡(subgameperfectequili第13次作業(yè)(共3道題)
如果把落下的食物量減半或加倍,那么智豬博弈的結(jié)局又會如何?門衛(wèi)和小偷的故事:門衛(wèi)偷懶,小偷偷盜,小偷得到收益V,門衛(wèi)受到處罰而得收益D(負(fù)收益)。門衛(wèi)提高警惕,小偷偷盜,小偷被逮住受到處罰而得收益P(負(fù)收益),門衛(wèi)收益為零。門衛(wèi)偷懶,小偷沒有偷盜,小偷收益為零,而門衛(wèi)得到了放松和休息的收益R。門衛(wèi)提高警惕,小偷沒有偷盜,雙方收益都為零。該博弈是否存在納什均衡?如果存在,求出納什均衡;如果不存在,求出混合納什均衡。(第3題見下一頁)(12月20日前,通過e-mail交給助教閆勇)42第13次作業(yè)(共3道題)如果把落下的食物量減半或加倍,那么第13次作業(yè)(共3道題)
某行業(yè)被企業(yè)A和B壟斷,這兩家企業(yè)都在努力制造產(chǎn)品差別以增強(qiáng)各自的競爭力。已知企業(yè)A和B的產(chǎn)品需求函數(shù)分別為:
和,其中Q1和P1分別表示A的產(chǎn)品的需求量和價格,Q2和P2分別表示B的產(chǎn)品的需求量和價格。A和B的固定成本都為20,邊際成本都為0,并且他們都能各自獨(dú)立制定自己產(chǎn)品的價格。求納什均衡中,企業(yè)A和B各自的價格和利潤。如果A和B勾結(jié)串通,勾結(jié)利潤對半分,那么他們的價格和利潤為多少?從短期來看,A和B會勾結(jié)串通嗎?從長期來看,情況又會如何?
(12月20日前,通過e-mail交給助教閆勇)43第13次作業(yè)(共3道題)某行業(yè)被企業(yè)A和B壟斷,這兩家企業(yè)Lecture13博弈論與經(jīng)濟(jì)行為44Lecture13博弈論與經(jīng)濟(jì)行為1Introduction到目前為止,我們對經(jīng)濟(jì)活動的考察沒有考慮人們之間的相互影響。其實(shí),一個人的行為總是受到他人行為的影響。人們在追逐自己利益時,難免要與他人發(fā)生利益沖突或矛盾。如何克服和解決人們之間的利益沖突?如何才能實(shí)現(xiàn)一種既能讓每個人都實(shí)現(xiàn)自己的利益,又能讓每個人都不妨礙和傷害他人利益的互利互惠的和諧局面?博弈論(gametheory)為解決這些問題提供了有力工具。博弈論以人的理性為基本假定,強(qiáng)調(diào)策略性——一種普遍的行為現(xiàn)象。這種現(xiàn)象的廣闊背景是市場中的競爭與合作。20世紀(jì)80年代以來,博弈論在經(jīng)濟(jì)學(xué)中得到了廣泛應(yīng)用,在揭示經(jīng)濟(jì)行為的相互影響和制約方面取得了重大進(jìn)展。大部分經(jīng)濟(jì)活動都可以用博弈論加以解釋,甚至連市場調(diào)節(jié)與宏觀調(diào)控這樣的重大問題,都可看成博弈現(xiàn)象來研究。45Introduction到目前為止,我們對經(jīng)濟(jì)活動的考察沒有(一)兩個充滿理性與智慧的博弈故事Introduction豬圈里有一大一小兩頭豬,豬圈一邊裝有踏板,踩一下,遠(yuǎn)離踏板的食槽端就會落下食物。若一豬去踩踏板,另一豬就會等在槽邊搶先吃到食物。若小豬去踩,大豬會在小豬跑到食槽前吃光食物;若大豬去踩,大豬還有機(jī)會在小豬吃完之前搶吃到食物的一半。這兩頭豬會采取什么策略呢?答案:小豬舒服地等在槽邊,大豬要為爭取殘羹奔忙于踏板和食槽之間。原因:對小豬而言,去踩,吃不到食物;不去踩,反而能吃到一半食物,當(dāng)然不去踩了。反觀大豬,明知小豬不為,那么自己為之總還是要比不為強(qiáng)。1.智豬博弈的故事46(一)兩個充滿理性與智慧的博弈故事Introduction智豬故事揭示了大、小企業(yè)的關(guān)系。當(dāng)企業(yè)定位于“大豬”時,應(yīng)選擇“主動獲得”之優(yōu)勢策略;當(dāng)定位于“小豬”時,應(yīng)選擇“等待獲得”,這也是優(yōu)勢策略。比如,研究開發(fā)、為新產(chǎn)品做廣告,這對大企業(yè)值得,對小企業(yè)是得不償失的。完全市場中,作為一個理性企業(yè),最可能的情況是小企業(yè)把精力花在模仿上,或等待大企業(yè)打開市場后出售廉價產(chǎn)品。而大企業(yè)應(yīng)當(dāng)以主動的態(tài)度來開拓市場。智豬故事還給競爭中的弱者以等待為最佳策略的啟發(fā)。博弈中,每一方都想方設(shè)法攻擊對方、保護(hù)自己,最終取得勝利;同時,對方也是一個與你一樣的理性人,他會這么做嗎?這就需要更高明的智慧。任何理性企業(yè)都必然會像智豬那樣,總是選擇優(yōu)勢策略。Introduction(三)兩個充滿理性與智慧的博弈故事1.智豬博弈的故事(啟示)47智豬故事揭示了大、小企業(yè)的關(guān)系。當(dāng)企業(yè)定位于“大豬”時,應(yīng)選Introduction(三)兩個充滿理性與智慧的博弈故事2.魚與魚竿的故事從前有兩個饑餓的人從一位智者那里得到了一根魚竿和一簍鮮魚。得到那簍鮮魚的人在原地把魚煮熟吃完,解決了饑餓問題,可很快又感到肚內(nèi)空空,最終餓死在空魚簍旁邊。另外一個得到魚竿的人提著魚竿朝向遙遠(yuǎn)的大海走去,當(dāng)他終于來到海邊的時候,也用盡了最后一點(diǎn)力氣而死去。不久之后,同樣是兩個饑餓的人,也從智者那里得到了一根魚竿和一簍鮮魚。不同的是:他們一起去尋找大海。每到饑餓的時候,就從魚簍中拿出一條魚吃。當(dāng)他們最終來到海邊的時候,這兩個人就拿著那根魚竿開始了捕魚為生的日子!48Introduction(三)兩個充滿理性與智慧的博弈故事(二)
博弈論的研究對象博弈是一種普遍現(xiàn)象,人們總會有意、無意地運(yùn)用博弈的思想。比如企業(yè)在決策時,總是會考慮競爭對手的反應(yīng);個人與政府之間“上有政策,下有對策”;金融監(jiān)管與創(chuàng)新猶如“貓鼠博弈”;博弈還作為消遣游戲,讓人們獲得快樂。博弈的特征表現(xiàn)為兩個或兩個以上具有利益沖突的當(dāng)事人處于一種不相容狀態(tài)中,一方的行動取決于對方的行動,每個當(dāng)事人的收益都取決于所有當(dāng)事人的行動。當(dāng)所有當(dāng)事人都拿定主意作出決策時,博弈的局勢便確定下來。博弈論的目的是要研究人們之間這種不相容的行為,推廣標(biāo)準(zhǔn)的一人決策理論。博弈論關(guān)注的問題:在每個當(dāng)事人的收益都依賴于其他當(dāng)事人的選擇的情況下,追求個人收益最大化的當(dāng)事人應(yīng)該如何采取行動?Introduction49(二)博弈論的研究對象博弈是一種普遍現(xiàn)象,人們總會有意、無(三)
博弈的標(biāo)準(zhǔn)形式與分類基本要素:局中人(players)、策略(strategies)、收益(payoffs)局中人以策略定勝負(fù),以收益最大化為目標(biāo)。標(biāo)準(zhǔn)形式(normalform):G=(Xi,
fi)n,其中
Xi為局中人
i
的策略集合,fi:
S
R
為局中人
i
的收益函數(shù)(i=
1,2,,n)。S=X1X2Xn
叫做博弈G的局勢集合。局勢:策略
n
元組
(x1,
x2,,
xn)(
xiXi,i=
1,2,,n)。博弈的分類:一般按照博弈的基本要素進(jìn)行分類。按人數(shù)分:二人博弈、多人博弈按策略分:有限(策略)博弈、無限(策略)博弈按收益分:常和(零和)博弈、變和博弈按性質(zhì)分:非合作博弈、合作博弈按次序分:同時移動博弈、先后移動博弈(序貫博弈)交叉分類:以上分類方式的結(jié)合,比如二人零和有限博弈。Introduction50(三)博弈的標(biāo)準(zhǔn)形式與分類基本要素:局中人(players矩陣博弈我們先以矩陣博弈為重點(diǎn),建立博弈論的基本分析框架。矩陣博弈:二人零和有限博弈,這是最簡單的博弈形式。特點(diǎn):甲與乙利益沖突,一方的收益就是對方的損失。甲的策略集
X
={x1,
x2,,
xm}; 乙的策略集Y
={y1,
y2,,
yn}S=X
Y={(xi,
yj):i
=1,2,,m
;j
=1,2,,n}甲的收益函數(shù)f:S
R;乙的收益函數(shù)g
:S
R零和:f
(xi,
yj)
+
g
(xi,
yj)
=
0(i=1,2,,m
;j
=
1,2,,n)標(biāo)準(zhǔn)形式:G=(X,f;Y,
g)=(X,Y,f)矩陣博弈的矩陣表示:甲的收益矩陣
f即可表示矩陣博弈。51矩陣博弈我們先以矩陣博弈為重點(diǎn),建立博弈論的基本分析框(一)
古諾均衡局中人的目標(biāo):選擇合適的策略以使自己的收益(對方的損失)達(dá)到最大,也即讓對方的收益(自己的損失)達(dá)到最小。假定:甲和乙彼此了解對方的收益矩陣,雙方都清楚自己的收益就是對方的損失。博弈過程:每個人都根據(jù)對方的行動來確定自己的行動,每個人都不斷地在對方選定了策略的情況下來調(diào)整自己的策略以使自己的收益達(dá)到最大。博弈結(jié)局:當(dāng)策略調(diào)整達(dá)到這樣的局勢(xh,yk)使得
xh是甲在乙選定yk的情況下的收益最大策略,同時yk是乙甲在選定xh的情況下的收益最大策略的時候,雙方策略調(diào)整宣告結(jié)束,博弈得以確定。此時的局勢(xh,yk)就是古諾均衡(最優(yōu)解),即矩陣博弈52(一)古諾均衡局中人的目標(biāo):選擇合適的策略以使自己的收益(1.最大最小原理依據(jù)定義,矩陣博弈
f
的古諾均衡正對應(yīng)于矩陣
f
的鞍點(diǎn)。鞍點(diǎn)定理(最大最小原理)
是矩陣的鞍點(diǎn)(即局勢(xh,
yk)是矩陣博弈
f的古諾均衡)當(dāng)且僅當(dāng)下述等式成立:矩陣博弈古諾均衡的求解步驟從矩陣各行的最小元中找出最大元,稱為最大最小元;從矩陣各列的最大元中找出最小元,稱為最小最大元;如果最大最小元與最小最大元一致,那么該元素就是鞍點(diǎn),代表矩陣博弈的古諾均衡。
(一)
古諾均衡矩陣博弈x1y1x2x4x3y3y4y5YXz鞍點(diǎn)古諾均衡y2531.最大最小原理依據(jù)定義,矩陣博弈f的古諾均衡正對應(yīng)于2.兩個博弈事例
乙甲作廣告不作廣告作廣告3030不作廣告2020例1.廣告競爭:存在古諾均衡單位:萬元(一)
古諾均衡矩陣博弈例2.便士匹配:沒有古諾均衡甲、乙獨(dú)立決定出示硬幣正或反面。若兩人出示相同,甲贏乙1元;若出示相反,乙贏甲1元。甲的收益表如下:乙甲出示正面出示反面出示正面11出示反面11542.兩個博弈事例3.穩(wěn)妥策略與不穩(wěn)定性只有當(dāng)收益矩陣的最大最小元與最小最大元一致時,矩陣博弈才有古諾均衡(最優(yōu)解)。最大最小元和最小最大元總存在,但二者未必一致,從而矩陣博弈可能沒有最優(yōu)解。例如,便士匹配博弈沒有最優(yōu)解。矩陣博弈可能沒有最優(yōu)解的真正原因是什么?穩(wěn)妥策略甲的穩(wěn)妥策略:甲的收益矩陣的最大最小元;乙的穩(wěn)妥策略:甲的收益矩陣的最小最大元。問題的答案:原因在于穩(wěn)妥策略可能不穩(wěn)定。不穩(wěn)定的穩(wěn)妥策略不能使博弈中的策略調(diào)整過程結(jié)束。即使甲和乙都選擇穩(wěn)妥策略,但若穩(wěn)妥策略不穩(wěn)定,那么博弈就無法達(dá)到古諾均衡。矩陣博弈(一)
古諾均衡553.穩(wěn)妥策略與不穩(wěn)定性只有當(dāng)收益矩陣的最大最小元與最小最大(二)
混合策略
為了消除古諾均衡未必存在的困惑,人們提出使用混合策略,即一種連當(dāng)事人自己都不知道會采取什么行動的策略,對手就更不得而知了,從而使得局中人的行動變得相當(dāng)詭異??紤]二人有限博弈G=(X,f;Y,g):X={x1,x2,…,xm}:甲的純策略集合;Y={y1,y2,…,yn}:乙的純策略集合;S=X
Y:博弈G的純局勢集合。混合策略(mixedstrategies):以一定的概率采取一種策略。甲的混合策略集合:乙的混合策略集合:G的混合局勢集合:甲的預(yù)期收益:乙的預(yù)期收益:混合擴(kuò)充:博弈叫做
G
的混合擴(kuò)充。矩陣博弈56(二)混合策略為了消除古諾均衡未必存在的1.矩陣博弈的混合擴(kuò)充定理博弈
G=(X,f;Y,g)
為常和博弈當(dāng)且僅當(dāng)G
的混合擴(kuò)充
為常和博弈。當(dāng)G
是常和博弈時,G
與
具有相同的收入常和。因此,矩陣博弈的混合擴(kuò)充仍為二人零和博弈。矩陣博弈
G
的混合均衡:是指
G
的混合擴(kuò)充
的古諾均衡。即,G的混合局勢(p*,q*)叫做
G
的混合均衡(混合最優(yōu)解)是指(p*,q*)滿足如下條件:定理(混合均衡的存在性)任何矩陣博弈都有混合均衡。矩陣博弈
f
的混合均衡正對應(yīng)于函數(shù)
Ef
的鞍點(diǎn)。鞍點(diǎn)定理(最小最大原理)(
p*,
q*)是矩陣博弈G
的混合均衡(即函數(shù)
Ef的鞍點(diǎn))
當(dāng)且僅當(dāng)下述等式成立:(二)
混合策略
矩陣博弈571.矩陣博弈的混合擴(kuò)充定理博弈G=(X,f;2.事例:求解便士匹配博弈的混合均衡便士匹配博弈中,甲的收益矩陣為尋找混合均衡,就是去找出使得(二)
混合策略
矩陣博弈582.事例:求解便士匹配博弈的混合均衡便士匹配博弈中,甲的收3.混合均衡集的特點(diǎn)博弈值:混合均衡的存在性及鞍點(diǎn)定理,保證了V(G)是良好定義的,并且當(dāng)(p*,q*)是混合均衡時,V(G)
=Ef(p*,q*)。博弈值在解釋均衡及求解混合均衡方面相當(dāng)有用。還可通過V(G)
證明矩陣博弈的混合均衡集的下述特點(diǎn)。令定理
對于甲和乙的矩陣博弈G=(X,Y,f)來說,T=
T1T2且混合均衡集
T是空間的非空有界閉凸子集,從而甲的混合最優(yōu)策略集T1是的非空有界閉凸子集,乙的混合最優(yōu)策略集T2
是
的非空有界閉凸子集。
(二)
混合策略
矩陣博弈593.混合均衡集的特點(diǎn)博弈值:定理對于甲和乙的矩陣博弈二人博弈矩陣博弈僅僅是一類簡單又典型的二人常和博弈,經(jīng)濟(jì)學(xué)中遇到的博弈往往都是變和博弈。矩陣博弈理論之所以重要,是因為它為研究變和博弈提供了很好的分析思路和框架?,F(xiàn)在,我們來在矩陣博弈理論的基礎(chǔ)上建立一般的二人博弈理論。
二人博弈:
古諾均衡二人有限博弈:策略集合X和Y為有限集合。二人無限博弈:策略集合X和Y為無限(任意)集合。二人博弈的重復(fù):博弈不只進(jìn)行一次,而是要進(jìn)行多次。60二人博弈矩陣博弈僅僅是一類簡單又典型的二人常和博弈,經(jīng)濟(jì)學(xué)中(一)
二人有限博弈二人博弈古諾均衡應(yīng)對
yj的上策
xi(
j):當(dāng)乙采取yj
時,甲采取xi(
j)是最好的,即fi(
j)j是f的第j列的最大元:。應(yīng)對
xi的上策yj(i):當(dāng)甲采取xi
時,甲采取yj(i)是最好的,即gi
j(i)是g的第i行的最大元:。甲的上上策
xi*:不論乙采取什么策略,xi*都是甲的上策,即f的第i*行最大:。乙的上上策
yj*:不論甲采取什么策略,yj*都是乙的上策,即g的第j*列最大:
。占優(yōu)解(xi*,yj*):xi*是甲的上上策,yj*是乙的上上策。61(一)二人有限博弈二人博弈古諾均衡181.求解方法二人博弈(一)
二人有限博弈最大最小原理只適用于矩陣博弈,一般的二人有限博弈的求解只能采取通用方法。把局中人甲和乙的收益矩陣寫在同一張表中。圈出甲的收益矩陣各列的最大元。圈出乙的收益矩陣各行的最大元。收益表中同時出現(xiàn)兩個圈的位置即為古諾均衡。如果沒有一個位置出現(xiàn)兩個圈,就說明該博弈的古諾均衡不存在。如果在甲的收益矩陣的某一行上全部帶圈,則就出現(xiàn)了甲的上上策;同樣,若在乙的收益矩陣的某一列上全部帶圈,則就出現(xiàn)了乙的上上策。如果既找到了甲的上上策,又找到了乙的上上策,那么也就找到了博弈的占優(yōu)解。否則,博弈沒有占優(yōu)解。621.求解方法二人博弈(一)二人有限博弈最大最小原理只適用2.求解事例二人博弈(一)
二人有限博弈囚徒難題乙甲合作背叛合作3304背叛4011古諾均衡上上策上上策智豬博弈小豬大豬去踩踏板不去踩去踩踏板7355不去踩10000上上策均衡次優(yōu)均衡—剔除乙甲y1y2y3y4x1121582623141811x21820151611191517x315101849221714x41712131814171920找出下列博弈的古諾均衡古諾均衡(x2,y1)(x4,y4)無上上策632.求解事例二人博弈(一)二人有限博弈囚徒難題乙合作背叛,預(yù)期收益都為2/3。3.混合策略二人博弈(一)
二人有限博弈G=(X,f;Y,
g)的混合擴(kuò)充:G的混合均衡(
p*,
q*):角谷不動點(diǎn)定理
設(shè)
T
是有限維歐氏空間的非空有界閉凸子集,F(xiàn):
T
T
是集值映射。若
F
上半連續(xù)且對任何xT,F(xiàn)(x)都是非空閉凸集,那么F
必有不動點(diǎn),即(xT
)(xF(x))。定理(混合均衡存在性)
任何二人有限博弈都有混合均衡??ǚ蛉氵_(dá)話劇足球話劇2100足球0012例.性別之戰(zhàn):性別差異導(dǎo)致收益差異64
假設(shè)G1X
是拓?fù)湎蛄靠臻gV1的非空緊凸子集;乙的策略集合Y是
拓?fù)湎蛄靠臻gV2的非空緊凸子集;故局勢集合
S
是拓?fù)湎蛄靠臻gV1V2的非空緊凸子集。假設(shè)G2甲的收益函數(shù)
f
(x,y)連續(xù)且關(guān)于策略變元
x
弱擬凹;乙的收益函數(shù)g(x,y)連續(xù)且關(guān)于策略變元
y
弱擬凹。(二)
二人無限博弈G
=
(X,f;
Y,
g):X
和Y
為無限集合,S
=
X
Y
。二人有限博弈的混合擴(kuò)充是二人無限博弈,二人無限博弈的混合擴(kuò)充依然是二人無限博弈。因此,二人無限博弈是二人博弈的一般情形,無需再討論其混合擴(kuò)充。古諾均衡(x*,
y*):XYzf
(x*,
y*)古諾均衡g
(x*,
y*)二人博弈x*y*65假設(shè)G1X是拓?fù)湎蛄靠臻gV1的非空緊凸子集;乙的策略1.均衡的存在性與反應(yīng)函數(shù)范格不動點(diǎn)定理設(shè)T是拓?fù)湎蛄靠臻g的非空緊凸子集,集值映射
F
:
T
T
上半連續(xù)且對任何
xT,F(xiàn)(x)
都是非空閉凸集。則
F
有不動點(diǎn),即(tT)(tF(t))。定理(古諾均衡的存在性)任何滿足假設(shè)G1和G2的二人無限博弈都有古諾均衡。反應(yīng)函數(shù)甲對乙的反應(yīng):當(dāng)乙采取策略
y時,甲的應(yīng)對上策
x=(y)為:f
(x,
y)
=max
{
f
(x,y):xX
}。(y):甲的反應(yīng)函數(shù)。乙對甲的反應(yīng):當(dāng)甲采取策略
x時,乙的應(yīng)對上策
y=(x)為:g(x,
y)
=max
{g(x,y
):y
Y
}。(x):乙的反應(yīng)函數(shù)。古諾均衡(x*,
y*):(二)
二人無限博弈二人博弈661.均衡的存在性與反應(yīng)函數(shù)范格不動點(diǎn)定理設(shè)T是拓?fù)湎蛄?.用反應(yīng)函數(shù)求解古諾均衡比如,(二)
二人無限博弈二人博弈一般情形:找出反應(yīng)曲線的交點(diǎn),如右圖所示。特殊情況:X
和
Y
都是實(shí)數(shù)區(qū)間,收益函數(shù)f:XR
和g:Y
R可微。于是,反應(yīng)函數(shù)由下述方程確定:YXx1x2x3x4x5x6x7x8y1y2y3y4y5古諾均衡甲的反應(yīng)曲線乙的反應(yīng)曲線672.用反應(yīng)函數(shù)求解古諾均衡比如,(二)二人無限博弈二人博(三)
重復(fù)博弈雖然人們對二人博弈的最優(yōu)解作了深入研究,但讓局中人找到最優(yōu)解卻不是一件容易的事情,需要反復(fù)實(shí)踐和鍛煉,就好像棋手下棋一樣,需要反復(fù)不斷地下,才能越來越接近最優(yōu)解??梢?,博弈是需要重復(fù)進(jìn)行。但到目前為止,所研究的博弈都是一次性博弈。因此,有必要研究博弈的重復(fù)。事實(shí)上,當(dāng)博弈重復(fù)進(jìn)行時,其最優(yōu)結(jié)局可能會與一次性博弈的均衡有所差異。下面以囚徒難題博弈為例,來說明重復(fù)博弈的最優(yōu)解。我們將分兩種情況討論:博弈重復(fù)進(jìn)行有限次博弈重復(fù)進(jìn)行無限次二人博弈68(三)重復(fù)博弈雖然人們對二人博弈的最優(yōu)解作了深入研究,但讓1.有限次重復(fù)博弈每個局中人都知道博弈將重復(fù)一個固定的次數(shù)。最后一次博弈中局中人的推理:這是最后一次行動,每個人都認(rèn)為此時是在進(jìn)行一次性博弈,因而古諾均衡的標(biāo)準(zhǔn)邏輯得以應(yīng)用,結(jié)果局中人雙方選擇“背叛”。倒數(shù)第二次博弈:這里似乎每個人都重視合作,可以向?qū)Ψ桨l(fā)出“善意”的合作信號,以便在下次博弈中繼續(xù)合作。但理性的局中人清楚,最后一次博弈中對方必然背叛。因此他在倒數(shù)第二次博弈中選擇合作就沒有優(yōu)勢,故要選擇背叛。倒數(shù)第三次博弈:局中人的推理與倒數(shù)第二次一樣,結(jié)果在倒數(shù)第三次博弈中,局中人依然選擇背叛。結(jié)局:逆向歸納(backward
induction)可知,每次博弈中雙方都要“背叛”,有限次重復(fù)博弈的最優(yōu)解依然是古諾均衡。古諾均衡是局中人雙方的短期利益所在。(三)
重復(fù)博弈二人博弈691.有限次重復(fù)博弈每個局中人都知道博弈將重復(fù)一個固定的次數(shù)2.無限次重復(fù)博弈(三)
重復(fù)博弈二人博弈每個局中人都知道,博弈要無限重復(fù)進(jìn)行下去。每個局中人的策略都是一個函數(shù)序列,表明每個人在每個階段的策略選擇都是此階段之前的博弈歷史的函數(shù)。這樣,局中人的收益是各階段收益的貼現(xiàn)值之和(向時刻0貼現(xiàn)):。R:局中人永不背叛的收益;RT:局中人第T次背叛的收益。
只要貼現(xiàn)率r<2,就有RT<R,即選擇背叛無利可圖,還是合作為好。貼現(xiàn)率小于2是平常的,說明通常情況下,只要博弈能夠無限次重復(fù)下去,則可實(shí)現(xiàn)“(合作,合作)”。雙方選擇合作是局中人雙方的長期利益所在。
702.無限次重復(fù)博弈(三)重復(fù)博弈二人博弈每個局中人都知道多人非合作博弈二人一次性博弈是典型的非合作博弈,局中人之間沒有串通和勾結(jié),各個局中人都是獨(dú)立決策和獨(dú)立行動。20世紀(jì)50年代,美國數(shù)學(xué)家納什成功地將這種博弈模式推廣到多人情形,接連發(fā)表了多篇研究論文,為現(xiàn)代博弈論的形成和發(fā)展奠定了堅實(shí)基礎(chǔ)。納什對多人非合作博弈作出了明確界定,提出了多人非合作博弈的“納什均衡”概念,并應(yīng)用角谷不動點(diǎn)定理證明了納什均衡的存在性。由于納什均衡是對矩陣博弈的古諾均衡概念的推廣,因此人們也常常把納什均衡稱作古諾-納什均衡。納什均衡存在性定理的重要意義:該定理的結(jié)論可以直接向經(jīng)濟(jì)系統(tǒng)推廣,并且這種推廣是阿羅和德布羅重建瓦爾拉一般均衡理論大廈的關(guān)鍵所在。71多人非合作博弈二人一次性博弈是典型的非合作博弈,局中人之間沒G
的混合擴(kuò)充:(一)非合作的多人有限博弈定理(納什定理)
任何非合作
n
人有限博弈都有混合最優(yōu)解。多人非合作博弈博弈
G
=
(Xi,fi)iI:納什均衡:72G的混合擴(kuò)充:(一)非合作的多人有限博弈定理(納什定理)(二)非合作的多人連續(xù)博弈
連續(xù)博弈:策略集合為拓?fù)淇臻g,收益函數(shù)為連續(xù)函數(shù)。x*S是納什均衡
x*
(x*)(即x*為的不動點(diǎn))。假設(shè)G1每個局中人
i
的策略集合
Xi都是某個拓?fù)湎蛄靠臻gVi的非空緊凸子集,從而局勢集合S是拓
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 真石漆的施工方案
- 管道陰極保護(hù)施工方案
- 二零二五年度梁上打孔作業(yè)風(fēng)險控制免責(zé)合同
- 二零二五年度金融服務(wù)合同價款調(diào)整與信用風(fēng)險防范
- 二零二五年度武漢房屋租賃合同糾紛處理辦法
- 二零二五年度足療店連鎖經(jīng)營授權(quán)管理合同
- 二零二五年度能源消耗監(jiān)控系統(tǒng)維保及節(jié)能服務(wù)合同
- 二零二五年度羊群代放牧與綠色食品生產(chǎn)協(xié)議
- 二零二五年度二零二五年度承重墻拆除工程安全生產(chǎn)責(zé)任承諾書
- 普通高等學(xué)校就業(yè)協(xié)議書(2025年度)-金融服務(wù)業(yè)人才輸送協(xié)議
- 自來水廠安全施工組織設(shè)計
- 川教版2024-2025學(xué)年六年級下冊信息技術(shù)全冊教案
- 《無人機(jī)測繪技術(shù)》項目1任務(wù)3無人機(jī)測繪基礎(chǔ)知識
- 招標(biāo)代理機(jī)構(gòu)遴選投標(biāo)方案(技術(shù)標(biāo))
- 彩鋼瓦雨棚施工技術(shù)標(biāo)準(zhǔn)方案
- 2024年新疆(兵團(tuán))公務(wù)員考試《行測》真題及答案解析
- KTV商務(wù)禮儀培訓(xùn)
- 三級安全教育試題(公司級、部門級、班組級)
- 2024年《論教育》全文課件
- 罐區(qū)安全培訓(xùn)教程
- 計算機(jī)網(wǎng)絡(luò)與信息安全(2024年版)課件 李全龍 第1-4章計算機(jī)網(wǎng)絡(luò)與信息安全概述-網(wǎng)絡(luò)層服務(wù)與協(xié)議
評論
0/150
提交評論