哈工大博弈論第4講_第1頁
哈工大博弈論第4講_第2頁
哈工大博弈論第4講_第3頁
哈工大博弈論第4講_第4頁
哈工大博弈論第4講_第5頁
已閱讀5頁,還剩64頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

上次內(nèi)容回顧BestResponse點球博弈合作博弈納什均衡(一致預測性、selfenforcing)納什定理劃線法箭頭法1納什均衡是一種策略組合,當所有參與人都公開自己的策略后,每個人都滿意自己的選擇;如果偏離納什均衡,沒有人會得到更好的收益。2投資博弈參與人:全體同學策略:不投資、投資10元收益:不投資,收益為0元;

如果90%以上,各投資人收益為15元;如果低于90%,各投資人收益為-10元。

此博弈的NE是什么?3NE(1)都投資(2)都不投資4位置模型(社會學)參與人:說廣東話的,100000人

說上海話的,100000人策略:選A鎮(zhèn)和B鎮(zhèn),各容納10萬人收益:如下頁圖。56同時選擇,如果超出限額,隨機分配(如,15萬人選A,則選A的人有2/3機會滿足愿望。)。給定初始位置,類型帶狀分布,博弈幾次結(jié)束后,呈隔離狀態(tài)。7NE隔離狀態(tài)完全混合全部選一個,然后隨機分配89按競爭程度劃分的市場類型:

A完全競爭市場

B寡頭競爭市場

C獨家壟斷市場卡特爾古諾模型(CournotModelofDuopoly)10市場類型不同,廠商的行為特征不同。A與C型,廠商的決策都是個體優(yōu)化決策。B型,寡頭壟斷競爭的本質(zhì)是博弈。他們的行為既影響自身,又影響對方。盡管兩寡頭由于壟斷能給他們帶來一些共同的利益,但是他們的根本利益并不是完全一致的。11古諾模型這里考慮連續(xù)形式的古諾模型兩個企業(yè),分別表示為企業(yè)1、企業(yè)2每個企業(yè)的策略是選擇產(chǎn)量(用qi表示)收益是利潤(用πi表示),是兩個企業(yè)產(chǎn)量的函數(shù),生產(chǎn)成本與產(chǎn)量有關(guān),用Ci(qi)表示,市場出清價格為P=P(q1+q2)第i個企業(yè)的利潤函數(shù)為:πi=qiP(q1+q2)–Ci(qi),i=1,212(q1*,q2*)是均衡產(chǎn)量意味著:q1*∈argmaxπ1(q1,q2*)q2*∈argmaxπ2(q1*,q2)根據(jù)上面兩個式子可以得出反應函數(shù)(reactionfunction):q1*=R1(q2)q2*=R2(q1)兩個反應函數(shù)的交叉點就是納什均衡(q1*,q2*),見圖古諾模型13q2q1古諾模型的納什均衡NE古諾模型R2R114古諾模型實際驗證假定每個企業(yè)具有相同的不變單位成本,即C1(q1)=q1c,C2(q2)=q2c,價格出清函數(shù)取線性形式:

P=a-(q1+q2)。根據(jù)q1*∈argmaxπ1(q1,q2*)=q1P(q1+q2*)–C1(q1)q2*∈argmaxπ2(q1*,q2)=q2P(q1*+q2)–C2(q2)通過求一階導數(shù),得15于是可得到反應函數(shù)為:古諾模型16從而求出古諾模型17古諾模型進而可以得出每個企業(yè)的納什均衡產(chǎn)量下的利潤,為可以同壟斷企業(yè)的最優(yōu)決策類比18古諾模型壟斷條件下的最優(yōu)產(chǎn)量,可同過計算Q*∈argmaxπ=Q*(a-Q*-c)求出最優(yōu)的產(chǎn)量值壟斷條件下的最優(yōu)利潤為最優(yōu)納什均衡總產(chǎn)量最優(yōu)納什均衡利潤總和19古諾模型古諾模型的啟示寡頭競爭的總產(chǎn)量大于壟斷競爭產(chǎn)量的原因在于每個企業(yè)在選擇自己的最優(yōu)產(chǎn)量時,只考慮對本企業(yè)利潤的影響,而忽視對另一個企業(yè)的外部負效應。這是一個典型的囚徒困境從另一個層面我們也了解到為什么國外有反壟斷法,為什么有微軟分拆事件。20豪太林(Hotelling)價格競爭模型古諾模型中,產(chǎn)品是同質(zhì)的(homogenous);豪泰林模型中,引入了產(chǎn)品的差異性;產(chǎn)品的差異性可以有很多體現(xiàn)形式:如品牌、外觀、功能、空間差別(如房地產(chǎn))豪泰林模型中,產(chǎn)品的差異通過空間差別來體現(xiàn)豪泰林模型的主要假設(shè)是產(chǎn)品的差異完全是由空間位置的不同而造成的21豪太林(Hotelling)價格競爭模型模型描述假定有一個長度為1的線性城市,消費者均勻地分布在[0,1]區(qū)間上。假定有兩個商店,分別位于城市的兩端,商店1在x=0處,商店2在x=1處,出售完全相同的產(chǎn)品每個商店提供單位產(chǎn)品的成本為c,消費者購買商品的旅行成本與離商店的距離成正比,單位距離的成本為t假定消費者有單位需求:要么消費1單位,要么消費0個單位(如住房消費)。消費者從消費中得到的消費者剩余為s。22納什均衡分析假定兩個商店同時選擇自己的銷售價格。假定消費者剩余s相對于購買總成本(價格加旅行費用)足夠大從而所有消費者都購買一個單位的產(chǎn)品令pi為商店i的價格,Di(p1,p2)為需求函數(shù),i=1,2豪太林(Hotelling)價格競爭模型23豪太林(Hotelling)價格競爭模型如果住在x的消費者在兩個商店之間是無差異的,那么,所有住在x左邊的將都在商店1購買,而住在x右邊的將在商店2購買,需求比例分別是D1=x,D2=1-x。這里的x滿足:p1+tx=p2+t(1-x)解上面兩個式子,可得出需求函數(shù)為24豪太林(Hotelling)價格競爭模型利潤函數(shù)分別為25豪太林(Hotelling)價格競爭模型通過一階導數(shù)法,可以求出兩個企業(yè)的最優(yōu)價格,為均衡價格下,每個企業(yè)的最優(yōu)利潤為26可以進一步設(shè)想,若兩個商店為了爭奪顧客源,可以自由選擇商店位置,那么可以計算,納什均衡位置在[0,1]區(qū)間的中點0.5處,即最終兩個商店匯聚一點;這在一定程度上可以說明,為什么商店通常都聚集在一處的原因。此時可以算出均衡價格和利潤分別是豪太林(Hotelling)價格競爭模型27前面介紹的納什均衡分析方法…對于相當多一類博弈問題無能為力。石頭剪子布博弈,不存在已經(jīng)定義的各種均衡混合策略的提出2829混合策略的提出利用生活經(jīng)驗不難知道,分別以1/3的概率出招是最佳決策這就引出了用概率來確定采用何種策略的方法,這就是混合策略(mixedstrategies)概念的由來在此之前所說的策略,實質(zhì)上是以概率1選取某個確定的策略或行動,我們稱之為純策略(purestrategies)AmixedstrategyPi

isarandomizationoveri'spurestrategies.3031混合策略的提出混合策略的定義:在博弈G={N,Si,ui,i∈N}中,假設(shè)參與人i的純策略構(gòu)成的策略集合為Si={si1,…,sik},若參與人i以概率分布pi=(pi1,…,pik)在其k個可選策略中隨機選擇“策略”,稱這樣的選擇方式為混合策略。這里,0≤pij≤1,對于j=1,…,k都成立,且有,pi1+…+pik=1純策略可看成特殊的混合策略上述定義是在有限博弈前提下進行的32混合策略意義下的相關(guān)表述混合策略意義下策略組合的表述{x1∈X1,…,xn∈Xn},其中Xi,i=1,…,n表示參與人i所有純策略生成的概率空間,xi為參與人i的一個具體混合策略猜硬幣博弈的一個混合策略就可記為{(1/2,1/2),(1/2,1/2)}33混合策略若允許每個參與人選擇混合策略,則博弈結(jié)果就是一個關(guān)于純策略組合得來一個風險結(jié)果為研究參與人行為,需要知道各參與人對這些風險結(jié)果的偏好關(guān)系博弈論假定每個參與人的偏好關(guān)系,可用期望收益函數(shù)表示。34VNM效用函數(shù)

VNM效用函數(shù)理論是20世紀50年代,馮·諾依曼和摩根斯坦(VonNeumannandMorgenstern)在公理化假設(shè)的基礎(chǔ)上,運用邏輯和數(shù)學工具,建立了不確定條件下對理性人(rationalactor)選擇進行分析的框架。35VNM效用函數(shù)如果某個隨機變量X以概率Pi取值xi,i=1,2,…,n,而某人在確定地得到xi時的效用為u(xi),那么,該隨機變量給他的效用便是:

U(X)=P1u(x1)+P2u(x2)+...+Pnu(xn)

表示關(guān)于隨機變量X的期望效用。因此U(X)稱為期望效用函數(shù),又叫做馮·諾依曼—摩根斯坦效用函數(shù)(VNM函數(shù))。36混合策略于是可以定義基于混合策略意義下的博弈策略式表述定義基于(v-N-M效用的)策略式博弈由參與人集合每個參與人有一個(純)策略集合對于每一個參與人來說,由所有參與人純策略組合構(gòu)成的風險結(jié)果空間,存在一個v-N-M效用TheexpectedpayoffofthemixedstrategyPi

isaweightedaverageoftheexpectedpayoffsofeachofthepurestrategiesinthemix.

3738混合策略意義下的納什均衡定義,對于博弈G={N,Si,ui,i∈N},基于v-N-M效用的混合策略組合α*是一個納什均衡,若對于每一個i,以及i的任意一個混合策略αi,α*對應的期望支付至少和(αi,α*-i)的期望支付一樣大39混合策略意義下的納什均衡換句話說,稱混合策略組合α*是一個納什均衡,如果沒有一個參與人通過偏離策略α*i

實現(xiàn)支付的增加MixedStrategyNEAmixedstrategy(P1*,P2*,…PN*),isamixedstrategyNashEquilibriumif,foreachPlayeri--thatplayer'smixedstrategyPi*isabestresponseforPlayeritothestrategieseveryoneelseispickingP

-i*4041一個定理對于N-人靜態(tài)博弈問題,設(shè)混合策略納什均衡對應的策略組合為(Xi,

X–i)。對于任意的i,若最優(yōu)混合策略為Xi={x1,…,xl,0…0}(不失一般性,假設(shè)前l(fā)個分量嚴格大于0),記分量xk(k=1,…,l)對應的純策略sk,則對于參與人i而言,sk與其他參與人的最優(yōu)混合策略組合X–i形成的局勢的收益值,等于納什均衡混合策略組合(Xi,

X–i)的收益值。即ui(sk,X–i)=ui(Xi,X–i)成立,k=1,…,l42定理證明由于(Xi,

X–i)是納什均衡,因此下式成立ui(sk,X–i)≤ui(Xi,X–i),k=1,…,l在上式中,不失一般性,假設(shè){ui

(s1,X–i),…,ui

(sl,X–i)}中,數(shù)值最小的為ui

(s1,X–i),43一個定理假設(shè)ui(s1,X–i)<ui

(sl,X–i)根據(jù)ui(Xi,X–i)=x1ui

(s1,X–i)+x2ui

(s2,X–i)+…xlui

(sl,X–i)可以構(gòu)造一個混合策略Xi’=(0,x2,…,xl-1,(x1+xl)),滿足ui(Xi’,X–i)>ui(Xi,X–i)這與(Xi’,X–i)是納什均衡的前提矛盾因此,ui(s1,X–i)=ui

(sl,X–i)44一個定理因此,ui(s1,X–i)=ui

(sl,X–i)又ui(sk,X–i)≤ui(Xi,X–i),k=1,…,l

((Xi,X–i)是納什均衡)ui

(s1,X–i)=min{ui

(sk,X–i),k=1,…,l}由本張投影的三個表達式,立即得出ui(Xi,X–i)=ui(sk,X–i),k=1,…,l該定理一言以蔽之…45一個算例簡單博弈,先用劃線法確定參與人1、2針對對手各純策略下的最優(yōu)純策略反應。顯然沒有純策略意義下的納什均衡。參與人2參與人1CDA2,35,2B3,11,5是否存在混合策略意義下的納什均衡?46一個算例設(shè)參與人1分別以pA、pB概率選擇純策略A和B根據(jù)前面介紹的關(guān)于混合策略納什均衡定理參與人1以混合策略(pA、pB)與參與人2的純策略C,D進行博弈時,相應支付值相等(為什么?)參與人2參與人1CDA2,35,2B3,11,5圖1-12二人博弈47一個算例于是有參與人2參與人1CDA2,35,2B3,11,5圖1-12二人博弈又根據(jù)可以求出48一個算例同理可求出參與人2的最優(yōu)混合策略參與人2參與人1CDA2,35,2B3,11,5圖1-12二人博弈在這樣的混合策略組合下,參與人1相應的期望支付值為49

一對夫妻要決定去看時裝表演還是看足球賽。有關(guān)純策略及相應支付情況如圖1-13所示。圖1-13性別戰(zhàn)博弈BattleofSexes

丈夫妻子時裝足球時裝2,10,0足球0,01,350BattleofSexes純策略均衡可通過劃線法計算得出,為(時裝,時裝),(足球,足球),支付值分別為(2,1),(1,3)該博弈還有一個混合策略均衡

丈夫妻子時裝足球時裝2,10,0足球0,01,3圖1-13性別戰(zhàn)51BattleofSexes設(shè)pw(C)和pw(F)分別是妻子選擇時裝表演和足球的概率,ph(C)和ph(F)是丈夫選擇時裝表演和足球賽的概率。經(jīng)計算,可得

丈夫妻子時裝足球時裝2,10,0足球0,01,352BattleofSexes當采用上面混合策略時,可以算出丈夫和妻子的收益期望,分別為

丈夫妻子時裝足球時裝2,10,0足球0,01,3圖1-13性別戰(zhàn)可以看出,該結(jié)果明顯不如夫妻雙方能交流協(xié)商…53性別戰(zhàn)變體1:制式問題電器和電子設(shè)備往往有不同的原理或相關(guān)技術(shù)標準,通常稱為制式圖1-4就是一個2廠商的制式博弈模型該模型存在兩個純策略均衡,以及一個混合策略均衡

廠商2廠商1制式1制式2制式11,30,0制式20,02,2圖1-14制式問題54性別戰(zhàn)變體1:制式問題純策略均衡為(制式1,制式1)、(制式2、制式2)混合策略均衡為{(0.4,0.6),(0.67,0.33)}相應支付值分別為0.664和1.296

廠商2廠商1制式1制式2制式11,30,0制式20,02,2圖1-14制式問題55性別戰(zhàn)變體2:市場機會博弈兩個廠商同時發(fā)現(xiàn)一個市場機會,但這個市場容量并不大。如果只有一個廠商進入該市場,能賺到100個單位的利潤,但如果兩個廠商同時進入該市場,則他們不僅賺不到錢,而且要各虧損50單位。如果這兩個廠商事先沒有溝通和協(xié)商。

廠商2廠商1進入觀望進入-50,-50100,0觀望0,1000,056性別戰(zhàn)變體2:市場機會博弈本博弈有(進入,不進入)、(不進入,進入)兩個純策略均衡,其中前一個均衡對廠商1有利,第二個均衡對廠商2有利此外,還有一個混合策略均衡,為{(2/3,1/3),(2/3,1/3)}期望支付均為0。

廠商2廠商1進入觀望進入-50,-50100,0觀望0,1000,0圖1-15市場機會57性別戰(zhàn)變體2:市場機會博弈可以把混合策略{(2/3,1/3),(2/3,1/3)解釋為:約有2/3比例的廠商選擇進入,1/3比例的廠商選擇不進入

廠商2廠商1進入觀望進入-50,-50100,0觀望0,1000,0圖1-15市場機會582×2雙矩陣博弈的圖解法雙矩陣的含義…以BattleofSexes為例,介紹2×2雙矩陣博弈模型的圖解法為便于說明,將BattleofSexes模型再次復制與此59一對夫妻要決定去看時裝表演還是看足球賽。有關(guān)純策略及相應支付情況如圖1-16所示設(shè)妻子的混合策略為(r,1-r),丈夫的策略為(q,1-q)。這里的r,q分別表示妻子或丈夫觀看時裝表演的概率為便于分析,將混合策略列于右上角

丈夫妻子時裝足球時裝2,10,0足球0,01,3圖1-16性別戰(zhàn){(r,1-r),(q,1-q)}2×2雙矩陣博弈的圖解法60若丈夫以q的概率選擇去看時裝表演(以1-q的概率去看足球),則妻子選擇時裝和觀看足球的期望收益分別為

丈夫妻子時裝足球時裝2,10,0足球0,01,3圖1-16性別戰(zhàn){(r,1-r),(q,1-q)}2×2雙矩陣博弈的圖解法61比較π1與π2可知當q<1/3時,妻子選擇看時裝的支付為2q,小于看足球的支付,因此,應選擇看足球;當q=1/3時,選擇看時裝和足球支付情況沒有差異;當q>1/3時,則選擇看時裝表演

丈夫妻子時裝足球時裝2,10,0足球0,01,3圖1-16性別戰(zhàn){(r,1-r

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論