版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1.界定博弈論的一些基本概念;2.界定優(yōu)勢策略和納什均衡3.理解囚犯困境的含義及其應用;4.推導重復性博弈的納什均衡;5.推導序列博弈的納什均衡;本章要點2學完本章,你將能夠
11博弈論基礎?2011WangQiushi2/100
6.理解為什么存在著先動優(yōu)勢;7.理解進入威懾的可信性問題8.推導混合策略的納什均衡本章要點3學完本章,你將能夠
11博弈論基礎?2011WangQiushi3/100博弈就是一種比賽?2011WangQiushi比賽可以比快,也可以比慢4/100博弈論的基本概念博弈論(gametheory):又稱對策論,是用于分析策略性行為的一種工具。博弈的分析步驟第一步是尋找到某種有用的方式來描述這場博弈;第二步是尋找某種方式來預測結(jié)果。博弈的要素(1)選手;(2)規(guī)則;(3)策略;(4)收益;(5)結(jié)果。?2011WangQiushi5/100“剪子、石頭、布”的博弈該游戲有兩個選手(players),即參與此博弈的行為者;每個選手有三種策略(strategies)可供選擇:1出剪子;2出石頭;3出布。通俗點說,策略就是出招兒。該游戲有個規(guī)則:如果兩人出了相同的策略(如石頭對石頭等三種可能性),雙方為打平;如果兩人出手不一(如石頭對剪子等六種可能性),則可決定出勝負,石頭贏剪子、剪子贏布、布贏石頭(即石頭砸剪子、剪子剪布、布包石頭)。?2011WangQiushi6/100“剪子、石頭、布”的博弈在游戲之前,雙方達成獎懲協(xié)議:如贏家賺1元,輸家輸1元;或者贏家不喝酒,而輸家罰酒一杯等等。假如是輸贏1元的協(xié)議,表(11.1)就是這個游戲的收益表(Payofftable),把選手的收益狀況用表的形式描述,有時亦稱收益矩陣(Payoffmatrix)。?2011WangQiushi7/100收益表如果A出石頭,B也出石頭,各自收益均為0;?2011WangQiushi8/100收益表如果A出石頭,B出剪子,A的收益為1,B的收益為(-1);?2011WangQiushi9/100收益表如果A出石頭,B出布,A的收益為(-1),而B的收益為1。?2011WangQiushi余此類推10/100博弈論的基本概念一般來說,在每個小方框內(nèi),第一個數(shù)據(jù)為排在左邊的選手A的收益,第二個數(shù)據(jù)為排在上方的選手B的收益,中間用逗號隔開,即(A,B)=(0,0)等等。上表是一種常見的用表格描述一場博弈的方法,簡稱常規(guī)式博弈(normalform)。同時博弈:要求選手同時出招的博弈。序列博弈:選手可以分先后時間出招的博弈。?2011WangQiushi11/100優(yōu)勢策略假定A、B兩人在玩一個十分簡單的博弈,A在紙上可以寫“上”或“下”,B在另外一張紙上可以寫“左”或“右”,其收益矩陣如下表所示。?2011WangQiushi每個選手都是自我利益極大化者。12/100優(yōu)勢策略如果B選左,A選上的收益為1,而選下的收益為2,那么,A選下;?2011WangQiushi如果B選右,A在收益0與1之間選擇,A選擇下。13/100優(yōu)勢策略優(yōu)勢策略:無論對方選擇什么策略,該選手總是選擇某種固定的策略,又稱占優(yōu)策略。在本例中,無論B出什么招,A總是選下。因此,選下是A的優(yōu)勢策略。所謂優(yōu)勢策略,就是無論你出什么招,我就出這一招。選手B也有優(yōu)勢策略嗎??2011WangQiushi14/100優(yōu)勢策略給定A選上,B選左的收益為1,而選右的收益為2,那么,B選左;?2011WangQiushi如果A選下,B在收益0與1之間選擇,
B選左。15/100優(yōu)勢策略無論選手A如何選擇,B將始終選擇左。B選擇左是優(yōu)勢策略。在某個博弈中,如果每個選手都有一種優(yōu)勢策略,那么,兩個選手的優(yōu)勢策略組合就是這一博弈的均衡。所謂博弈的均衡就是會發(fā)生的一種結(jié)局。?2011WangQiushi16/100優(yōu)勢策略在上例中,(A,B)=(下,左)=(2,1)就是該博弈優(yōu)勢策略的均衡結(jié)果。?2011WangQiushi17/100優(yōu)勢策略大學成功秘訣:不管你如何,我始終把努力學習作為我的優(yōu)勢策略。?2011WangQiushi18/100納什均衡并非所有的博弈都存在優(yōu)勢策略均衡。?2011WangQiushi在以下改進的博弈中,如果B選左,A就選上;如果B選右,A就選下;因此,A沒有優(yōu)勢策略。?19/100納什均衡同理可以分析,B也沒有優(yōu)勢策略。?2011WangQiushi?那么該博弈是否存在著均衡呢?20/100納什均衡優(yōu)勢策略均衡的要求也許太高了點。它要求無論B出什么招,A有一個優(yōu)勢策略;而且還要求無論A出什么招,B也有一個優(yōu)勢策略。這兩個優(yōu)勢策略的組合才構(gòu)成一個優(yōu)勢策略均衡。如果給定B的選擇,A的選擇是最佳的;同時給定A的選擇,B的選擇也是最佳的,那么,A和B的這組最佳選擇的組合就是納什均衡。?2011WangQiushi21/100約翰納什這是以1994年諾貝爾經(jīng)濟學獎得主、美國經(jīng)濟學家約翰·納什的名字命名的。瑞典皇家科學院的公報稱:“納什由于引入了合作博弈與非合作博弈的區(qū)分,并為非合作博弈創(chuàng)立了一種均衡概念。這種均衡概念現(xiàn)在被命名為‘納什均衡’”?2011WangQiushi22/100約翰·納什納什均衡如果B選左,A的最佳選擇為上;?2011WangQiushi如果B選右,A的最佳選擇為下;如果A選上,B的最佳選擇為左;如果A選下,B的最佳選擇為右。兩箭頭所指就是納什均衡。23/100納什均衡給定B選左,A的最佳選擇為上;給定A選擇上,B的最佳選擇為左
;所以,(上,左)為納什均衡。?2011WangQiushi同理,(下,右)為另一組納什均衡。24/100優(yōu)勢均衡與納什均衡的聯(lián)系與區(qū)別優(yōu)勢策略:無論你做什么,我做我最好的;無論我做什么,你做你最好的。納什均衡:給定你的策略,我做我最好的;給定我的策略,你做你最好的。由此可見,優(yōu)勢策略均衡便是納什均衡的一種特例。通俗地講,如果是優(yōu)勢策略均衡,就一定是納什均衡;反之,則不然。?2011WangQiushi25/100囚犯困境有兩個嫌疑犯A和B因合伙偷竊自行車被警方捉拿歸案,且證據(jù)確鑿,可判他們每人各2年的徒刑。如果他倆都承認犯有搶劫銀行罪,當局就以兩罪并罰,各判10年監(jiān)禁;如果兩嫌疑犯都否認犯有搶劫銀行罪,當局則以偷自行車罪各判2年刑;如果一方承認犯有搶劫銀行罪并提供有效證據(jù),而另一方拒絕承認的話,當局以“坦白從寬,抗拒從嚴”的原則,對承認犯罪者不再追究偷竊自行車罪而釋放,而對否認者三罪并罰(偷自行車、搶劫銀行和不誠實罪)投監(jiān)20年。?2011WangQiushi26/100囚犯困境在這個游戲中,有兩個選手:囚犯A和B,每個選手均有兩種策略。承認或否認犯有搶劫銀行罪,有可能出現(xiàn)四種結(jié)果,其收益矩陣如表11.4所示。表中第一列,如果A和B同時承認犯罪各坐牢10年;如果A否認犯罪,而B承認犯罪,A坐牢20年,而B卻可自由,表的第二列依此類推。?2011WangQiushi27/100囚犯困境對策論的一個中心問題如果我相信我的對手是理性的,我如何給定他的行為做出我的一個最優(yōu)決策,即給定對手行為,我如何做出最佳選擇。這個對策存在著均衡嗎??2011WangQiushi28/100囚犯困境給定對方承認,你也承認;給定對方否認,你承認。(承認,承認)=(-10,-10)就是是優(yōu)勢策略均衡;于是(承認,承認)也是囚犯困境的納什均衡。?2011WangQiushi29/100囚犯困境為什么把它稱為“囚犯困境”
呢?(承認,承認)=(-10,-10)是納什均衡。如果他們都否認犯罪,每人只需坐牢2年,而不是10年。(否認,否認)是一種帕累托效率,而(承認,承認)一種帕累托非效率。囚犯困境的“困惑”就在于為什么納什均衡并非是帕累托最優(yōu),而帕累托效率又不是納什均衡的結(jié)果呢??2011WangQiushi30/100囚犯困境及其應用囚犯困境隱含著,合謀也許是一個更為有效的結(jié)果。囚犯困境是在向看不見手的挑戰(zhàn)。亞當.斯密的看不見的手理論認為,市場經(jīng)濟中的每個人都在追求自我利益,但在追求自我利益的過程中同時也實現(xiàn)了社會的公共利益。囚犯困境卻揭示社會中的每個人都在追求自我利益,然而,人類社會的公共利益卻不可能實現(xiàn)。?2011WangQiushi31/100囚犯困境一種表現(xiàn)?2011WangQiushi32/100你急我急大家急急成一團(請對下聯(lián))廣告困境做廣告導致需求增加,將激勵企業(yè)大量做廣告。其一,廣告之后,原本沒使用過本產(chǎn)品的人了解了產(chǎn)品,其中一部分可能購買之;其二,一些在使用其它同類品牌的人可能轉(zhuǎn)換過來消費本產(chǎn)品?,F(xiàn)假定有兩家寡頭面臨著兩個選擇:(大量)做廣告和不(大量)做廣告。在現(xiàn)實經(jīng)濟中,他們要選擇做多少廣告的問題。為了簡化起見,也不失一般性,就假定只有這兩種選擇。?2011WangQiushi33/100可口可樂與百事可樂之爭?2011WangQiushi34/100可口可樂與百事可樂之爭?2011WangQiushi35/100廣告困境之一無論A如何,B始終要做廣告,做廣告是B的優(yōu)勢策略;同理,做廣告也是A的優(yōu)勢策略。?2011WangQiushi■因此,(做廣告,做廣告)=(300,300)便成為此博弈的優(yōu)勢策略均衡,同時也是納什均衡。36/100廣告困境之二企業(yè)B的優(yōu)勢策略是做廣告,而企業(yè)A卻沒有優(yōu)勢策略。如果B做廣告,A最好跟著做廣告;但如果B不做廣告,A最好的策略也是不做廣告。?2011WangQiushi37/100廣告困境因此,(做廣告,做廣告)=(200,300)依然是納什均衡。?2011WangQiushi■但是,(不做廣告,不做廣告)=(500,600)卻是一種帕累托最優(yōu),但對這種非合作性博弈就偏偏實現(xiàn)不了。38/100禁播香煙廣告的法案1971年1月1日,美國眾議院通過了禁止在電視上播出香煙廣告的法案.但法案的制定者當初并不知道它有利于解決香煙廣告困境問題。它使得美國煙草制造商們花在香煙上的廣告費從此法案實施前一年的3億美元下降到了實施后一年的6000多萬美元,這其中大部分都轉(zhuǎn)化為煙草行業(yè)的利潤了。?2011WangQiushi39/100研發(fā)博弈研發(fā)是指企業(yè)研究新技術、開發(fā)新產(chǎn)品的活動?,F(xiàn)假定有兩個實力相當?shù)墓杨^在兩大策略中選擇研發(fā)和不研發(fā),其假定的收益矩陣如表11.7所示。?2011WangQiushi40/100研發(fā)博弈寡頭A和寡頭B都存在著一種優(yōu)勢策略——研發(fā),所以,(研發(fā),研發(fā))成為本博弈中的納什均衡。其實,雙方達到合謀都不研發(fā)或者少研發(fā)是一種帕累托改進。?2011WangQiushi41/100
產(chǎn)量困境:古諾解
我們在第10章介紹古諾模型時假設,有兩家寡頭生產(chǎn)同質(zhì)的礦泉水,每家寡頭的邊際成本為零,其共同的市場需求曲線為:
p=120-q■企業(yè)A和企業(yè)B的數(shù)量反應函數(shù)分別為:?2011WangQiushi■求解古諾解為:42/100
產(chǎn)量困境:古諾解
如果兩家組成卡特爾,像一個壟斷者那樣生產(chǎn),那么,MR=MC=0,平分市場后有:?2011WangQiushi■如果A生產(chǎn)30,但B違約生產(chǎn)40,這樣,p=50,πA=1500,πB
=2000,因此,B有違約的激勵?!鐾?如果B生產(chǎn)30,但A違約生產(chǎn)40,這樣p=50,πA=2000,πB=1500,因此,A有違約的激勵。43/100
產(chǎn)量困境:古諾解
把上述情況用利潤矩陣描述成下表。?2011WangQiushi44/100
產(chǎn)量困境:古諾解
給定B合作,A違約,給定B違約,A違約;?2011WangQiushi給定A合作,B違約,給定A違約,B違約;45/100
產(chǎn)量困境:古諾解
(違約,違約)=(1600,1600)成為納什均衡。?2011WangQiushi■合謀性壟斷產(chǎn)量(各為30)使得雙方利潤都更高(1800,1800),但它不是一種納什均衡。46/100囚犯困境及其應用以上幾個例子都有一個共同特征:合作性博弈的解優(yōu)越于非合作性博弈,但合作又不是納什均衡。在現(xiàn)實生活中畢竟有一些(短暫)合作成功的案例?!逗宋淦鞑粩U散條件》、《有核國家不首先使用核武器條約》,甚至《兩國導彈互不對準條約》。在現(xiàn)實生活中,有些囚犯就是不承認犯罪,原因是這些博弈不是玩一次,而是在重復性地玩。?2011WangQiushi47/100重復性博弈在現(xiàn)實生活中,寡頭間關于彼此產(chǎn)量和價格的決策遠不止一次,他們根據(jù)對手的行為在不斷地調(diào)整自己的產(chǎn)量和價格。這種不斷調(diào)整其策略并改變收益的博弈被稱為重復性博弈。當囚犯困境的雙方只能進行一次性博弈時,很難進行有效的懲罰;而在重復性博弈時,有效的懲罰對方或者威脅對方就成為可能了。重復性博弈——擺脫囚犯困境。?2011WangQiushi48/100重復性博弈20世紀60年代進行的實驗性研究尋找到了一種簡單的辦法——以牙還牙(tit-for-tat)策略——能夠有效地讓意欲違約者保持克制。以牙還牙策略是指在重復性博弈過程中某一選手對對方在前一期的合作同樣也采取合作的態(tài)度,對對方不合作則采取報復性的策略。在囚犯困境的重復性博弈中,大家都清楚地知道,合作的巨大收益提供了合作的正面激勵,對方的有效威脅和潛在傷害則提供了合作的負面激勵。?2011WangQiushi49/100重復性博弈:價格在固定價格的一次性博弈中,哪怕有約在先,雙方都保持壟斷價格同時分享市場需求,最后的均衡為各自采用競爭性價格獲得零經(jīng)濟利潤。但在重復性博弈中,情況有所不同。雙方知道,如果我降價,對方一定會降價,可能降得還更慘,對方要置我于死地而后快;如果我采取合作態(tài)度,對方很可能也會合作。為什么我不首先采取合作態(tài)度——把價格定在壟斷價格呢??2011WangQiushi50/100重復性博弈:日常生活在公交車上,我們很少為素不相識的乘客買車票,因為這大凡是一次性博弈。而我們很可能為朋友買車票,我們與朋友的交往是重復性博弈。如果他是個吝嗇鬼,你可以選擇不與他同車等。在重復性博弈中,每個人都比較關心自己的聲譽,正是這種聲譽機制使得人們大量采取合作性策略。?2011WangQiushi51/100重復性博弈:軍事合作牙還牙策略在軍事上也有所表現(xiàn)?!队泻藝沂紫炔皇褂煤宋淦鞯膮f(xié)議》到目前為止遵守得很好的原因就是這個以牙還牙策略。但是,《兩國導彈互不對準協(xié)議》遵循得就會差一些,兩國關系一旦惡化,很有可能都在暗地里違約。?2011WangQiushi52/100重復性博弈:戰(zhàn)地醫(yī)院以牙還牙策略可以使戰(zhàn)地醫(yī)院享受愛情的浪漫。如果你專門轟炸對方的戰(zhàn)地醫(yī)院,你自己的醫(yī)院也就處于危險之中。如果你打我的戰(zhàn)地醫(yī)院,我絕對要以牙還牙,報仇雪恨。以上這些對人類行為的觀察能夠幫助我們更好地認識人類的行為方式。?2011WangQiushi53/100重復性博弈以牙還牙策略能否成功實施取決于博弈的次數(shù)。我們將重復性博弈按次數(shù)分類為有限次重復性博弈和無限次重復性博弈。有限次重復性博弈就是未來博弈的次數(shù)已經(jīng)確定的博弈,也被稱為固定次數(shù)的重復性博弈。無限次重復性博弈就是可以無限次數(shù)地、重復性地玩的一種博弈。?2011WangQiushi54/100有限次重復性博弈假定我們知道囚犯困境博弈只玩十次,現(xiàn)在就是最后一次,結(jié)果會如何呢?最后玩的那次博弈就像只玩一次的博弈。因此,兩者的結(jié)果應該是相同的。第九輪會如何呢?我們已知在第十輪雙方都會承認犯罪,為什么在第九輪就要合作呢?同理,第八輪、第七輪……都會出現(xiàn)只玩一次博弈的納什均衡。只要這一博弈重復的次數(shù)已知,每一輪的結(jié)果都是原納什均衡的結(jié)果。?2011WangQiushi55/100無限次重復性博弈以牙還牙策略只有在無限次重復性博弈中才能有效。歐佩克(OPEC)是一個合作比較成功的卡特爾組織,其原因之一就是無限次重復性博弈所隱含的各種懲罰機制。無限次重復性博弈所形成的合作均衡解并不是穩(wěn)定的,它較為容易被打破。?2011WangQiushi56/100序列博弈到目前為止所討論的博弈都是兩個選手要同時選擇策略。例如,在古諾模型中,兩家企業(yè)同時決定產(chǎn)量。在序列博弈中,選手們按先后順序進行選擇。因此,序列博弈就是選手依次出招的博弈。斯坦伯格模型就是序列博弈的一個例子,一企業(yè)是領導者,率先決定其產(chǎn)量,另一企業(yè)是跟隨者,相應決定其產(chǎn)量。?2011WangQiushi57/100序列博弈經(jīng)過分析,我們知道該博弈有兩個納什均衡:(上,左)和(下,右)。但是,我們將說明其中的一個均衡不大合理。?2011WangQiushi58/100擴展型博弈圖11.1是表11.9中的博弈的擴展型博弈,它有些像樹狀,故被稱為博弈樹。因此,用博弈樹表示的博弈被稱為擴展型,用表格所表示的博弈被稱為常規(guī)型。?2011WangQiushi59/100擴展型博弈?2011WangQiushi■如何求解擴展型博弈的納什均衡呢?■假定A已經(jīng)選擇了上,B一定會選擇左,收益為(1,9);■但如果A選擇下,B只好選擇右,收益為(2,1)。60/100擴展型博弈?2011WangQiushiA是先動者,在信息完備時,當他看到博弈樹端點的收益情況后,他一定會選擇下。這樣(上,左)就不再是一個合理的均衡了。從擴展型博弈看,(下,右)是唯一的納什均衡。61/100“先動優(yōu)勢”A好開心,他享受到了“先動優(yōu)勢”。一步為先,步步為先。再看看選手B,他有些可憐,他本可享受9,最后只好收益為1。他要看人家的臉色行事。?2011WangQiushi62/100“先動優(yōu)勢”當然,他可以向A發(fā)出威脅:如果A選下,他報復性地選左,兩人都同歸于盡,各自收益為零。如果A相信B會實施威脅,A只好選擇上,這樣,A的收益至少為1,而不是零。但這個威脅可信嗎?在一次性博弈中,一旦A選擇了下,B就沒辦法了,只有在0和1的收益中進行理性選擇,只好有氣無力地選擇右啰。?2011WangQiushi63/100“先動優(yōu)勢”現(xiàn)在我們這樣思考:在此博弈中,如果由于種種原因,B為先動者,均衡點又何在呢?它是否證明了所謂“先動優(yōu)勢”?如果上例中的B先動,他會選擇左,然后A沒辦法,只好選擇上。先動者得到了9的收益,后動時他只得到1。這就說明了的確存在著所謂的“先動優(yōu)勢”,即在序列博弈中,首先采取策略的選手通常得利更大。?2011WangQiushi64/100先動優(yōu)勢:斯塔克伯格解用前一章學過的斯塔克伯格模型進一步解釋先動優(yōu)勢。需求曲線依然為
p=120-q,假定企業(yè)A為領導者,企業(yè)B為跟隨者,斯塔克伯格解為:q*A=60,q*B=30,p=30,πA=1800,πB=900。現(xiàn)在以表11.8為基礎,再加上斯塔克伯格解,我們得到下表:?2011WangQiushi65/100先動優(yōu)勢:斯塔克伯格解?2011WangQiushi此博弈是否存在納什均衡呢?如果A選30,B選40;如果A選40,B也選40;如果A選60,B選30。如果B選30,A選40;如果B選40,A也選40;如果B選60,A選30。這樣,兩個天真的跟隨者的產(chǎn)量(40,40)才是納什均衡。66/100先動優(yōu)勢:斯塔克伯格解現(xiàn)假定A為領導者,B為跟隨者,把表11.10改為擴展型的博弈樹。?2011WangQiushi■這三對策略都是子博弈的均衡。67/100先動優(yōu)勢:斯塔克伯格解哪一個會成為整個博弈的均衡呢?既然我先動,我選60啦,我的利潤最大。?2011WangQiushi■斯塔克爾伯格的解為(A,B)=(60,30)=(1800,900)。68/100幾個寡頭模型解的比較給定需求函數(shù)p=120-q,MC=0,E點(40,40)為古諾解SA(60,30)為A先動的斯塔克伯格解,SB(30,60)為B先動的斯塔克伯格解;C點(60,60)為競爭性均衡;M點(30,30)為合謀性均衡。?2011WangQiushi69/100
進入威懾
在一些寡頭行業(yè),乃至壟斷行業(yè)中,總是存在著企業(yè)進入的可能性。一般來說,誰都希望自己是個壟斷者。因此,現(xiàn)有壟斷者總是會采取一些措施威懾新企業(yè)的進入。有些威脅是可信的,但也有些威脅是不可信的。潛在進入者(定義為A)為先動者,它有兩種選擇:進入或放棄。現(xiàn)有壟斷者(定義為B)為后動者,它有兩種策略:一是降低價格實施反擊,二是不反擊。?2011WangQiushi70/100進入威懾?2011WangQiushi■如果A不進入,B也不反擊,這是事件的起點,A和B的利潤分別為0和8,這是最后一行。71/100進入威懾?2011WangQiushi■如果A不進入,B還要反擊,這是一組沒有實際意義的策略組合,利潤也假定同前,這是倒數(shù)第二行。72/100進入威懾?2011WangQiushi■如果A選擇進入,B發(fā)出威脅信號,要以降價為手段反擊,(A,B)=(-1,4).73/100進入威懾?2011WangQiushi■如果A選擇進入,B不反擊的收益為6,大于反擊時的4,它的威脅是不可信的。■因此,A決定進入。最后,均衡解為(A,B)=(進入,不反擊)。74/100不可信威脅在現(xiàn)實生活中,不可信威脅還是比較多見的。比如“老師,你不讓我及格我無臉見朋友我就跳樓”,“你不嫁給我,我就跟你同歸于盡”,“如果你硬要嫁給那臭小子,你就不是我的女兒,我也不是你爹”,“如果你要侵略我的盟國,我就對你實施核打擊”等等。這里所講的“不可信”是在正常狀態(tài)對收益和成本比較所做出的一種理性判斷。但的確存在著一些非理性的人。這種人的威脅往往是成功的,可信的,這被稱為“非理性的理性”。?2011WangQiushi75/100愛的心語?2011WangQiushi如果你不買那件衣服給我,我就不給你燒飯。76/100可信的威脅在本例中,現(xiàn)有壟斷者如何實現(xiàn)可信的承諾呢?其中一種辦法就是在潛在進入者尚未考慮進入之前,就做好了擴大生產(chǎn)能力的物資準備,一旦有潛在進入者進入,它就可以以更低的平均成本生產(chǎn)更多的產(chǎn)量,為打價格戰(zhàn)做好了充分的準備。此時,利潤分配狀況會發(fā)生實質(zhì)變化。到時就別怪我不客氣。?2011WangQiushi77/100可信的威脅?2011WangQiushi78/100可信的威脅這種威脅可信嗎?如果A選擇進入,B一定會選擇反擊。因為反擊的收益為3,大于不反擊的收益2。一旦B反擊,A的利潤為(-2)。如果A選擇不進入,利潤為零。那就不進入吧!最后,A選擇放棄進入,B威懾成功。生命的機會成本為零的人的威脅大多可行嗎??2011WangQiushi79/100純粹策略在上述博弈中,我們所考察的所有策略都是有特定的策略或行動的,例如,進入或不進入,承認或否認,定價為3元或為5元等。這種選手采用特定策略的策略就是純粹策略。讓我們看一個“手心手背博弈”。?2011WangQiushi80/100手心手背博弈給定A出手心,B的最佳策略是手背;給定A出手背,B的最佳策略是手心。?2011WangQiushi■給定B出手心,A的最佳策略是手心;給定B出手背,A的最佳策略是手背?!鲞@里不存在任何一組策略使得兩人都同時滿足,因此,沒有納什均衡。(不存在兩個同時所指的箭頭)81/100混合策略在純粹策略中,選手要么選手心,要么選手背;而在混合策略中,選手可以50%的概率出手心,50%的概率出手背;或者其他什么概率。這種基于一組選擇的概率對其結(jié)果進行隨機選擇的策略就是混合策略。盡管從純粹策略而言,手心手背博弈不存在著納什均衡;但從混合策略上講,它是存在著納什均衡的。?2011WangQiushi82/100混合策略如何求解混合策略的納什均衡呢?納什均衡的實質(zhì)是:它必然是一個選手對另外一個選手最佳策略的一種最佳反應。如果是你的最佳策略,但不是我的,這不是納什均衡;如果是我的最佳策略,但不是你的,這也不是納什均衡。只有兩個同時為最佳策略才為納什均衡。在選手A看來,如果他選手心的概率幾乎為1,選手B幾乎選手背,但A對此的最佳反應都是選手背,沒有均衡。同理,如果A選手心的概率幾乎為0(即更可能選手背),B的最佳選擇是手心,但A對此的最佳反應又是手心,也沒有均衡。?2011WangQiushi83/100混合策略要使得這一博弈存在均衡的關鍵是A要選擇出手心的一個概率p(那么,出手背的概率便為1-p),使得對手B不會選擇一個確定性策略,而是對幾種選擇無差異。這樣,如果A以p的概率選手心,(1-p)的概率選手背,那么,B選手心的預期收益(或效用)等于:?2011WangQiushi■同理,B選手背的預期效用等于:84/100混合策略欲使B對選手心和手背的預期效用無差異,就必須使得以上兩式相等,1-2p=2p-1,
p=1/2■即A以1/2的概率各出手心與手背,B在選擇手心手背之間無差異。
如果p>1/2,B從選擇手背中得到更大的效用;
如果p<1/2,B從選擇手心中得到更大的效用。?2011WangQiushi85/100混合策略同理,選手B要選擇出手心的概率q(出手背的概率為1-q),使得A在兩種選擇中無差異。這樣,A選手心的預期效用UE(手心)要恰好等于選手背的預期效用UE(手背),即:?2011WangQiushi86/100混合策略即B以1/2的概率各出手心與手背,A在選擇手心和手背之間無差異。如果q>1/2,A從選擇手心中得到更大效用;如果q<1/2,A從選手背中得到更大效用。這樣,(這一策略組合p=1/2,q=1/2)便是混合策略的納什均衡。?2011WangQiushi87/100混合策略一般地說,一個2人和2種策略的博弈的收益矩陣以及相應概率(p,q)可以寫成表11.12。?2011WangQiushi88/100混合策略混合策略的納什均衡必須滿足以下兩個條件:第一,A選擇S1A的概率為p時,使得B選擇S1B和S2B無差異:?2011WangQiushi第二,B選擇S1B的概率為q時,使得A選擇S1A和S2A無差異:89/100混合策略求解出p*和q*便是混合策略的納什均衡。我們?yōu)槭裁匆紤]求解混合策略的納什均衡呢?原因之一就是有些博弈的純粹策略沒有納什均衡,然而,一旦允許玩混合策略,每一個博弈至少有一個納什均衡。因此,混合策略對沒有純粹策略納什均衡的博弈提供了一種解。這個解是否合理取決于具體的博弈。在上述博弈中,手心手背各隨機地出,其概率為1/2,你的效用就實現(xiàn)了極大化。?2011WangQiushi90/100
性別沖突博弈
性別沖突博弈是既有純粹策略納什均衡,又有混合策略納什均衡的一個例子。丈夫和妻子很想在某一個周六晚上呆在一起,但對娛樂的偏好不盡相同。妻子喜歡聽音樂會,丈夫偏愛看足球賽,同時這對新婚夫婦都認為在一起的效用比單獨行動的效用更大。?2011WangQiushi91/100
性別沖突博弈
給定妻子看足球賽,丈夫的最佳選擇也是看足球賽,此時他最幸福,效用最大;給定妻子聽音樂會,丈夫的最佳選擇也是聽音樂會,因為他討厭一人孤獨地看足球賽。?2011WangQiushi給定丈夫看足球賽,妻子的最佳選擇也是看足球賽(因為她討厭一人孤獨地聽音樂會);給定丈
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 廣東科技學院《素描2》2023-2024學年第一學期期末試卷
- 廣東江門幼兒師范高等??茖W?!峨娮由虅张c電子支付》2023-2024學年第一學期期末試卷
- 廣東行政職業(yè)學院《土力學與地基基礎(B)》2023-2024學年第一學期期末試卷
- 廣東工貿(mào)職業(yè)技術學院《三維技術基礎》2023-2024學年第一學期期末試卷
- 廣東工程職業(yè)技術學院《多元統(tǒng)計分析(SPSS)》2023-2024學年第一學期期末試卷
- 廣東財貿(mào)職業(yè)學院《播音主持創(chuàng)作實踐》2023-2024學年第一學期期末試卷
- 《模具開發(fā)》課件
- 基本藥物制度政策培訓課件
- 油庫反恐課件培訓
- 贛西科技職業(yè)學院《教師語言與書寫技能》2023-2024學年第一學期期末試卷
- 西南交大畢業(yè)設計-地鐵車站主體結(jié)構(gòu)設計
- 紀委案件工作總結(jié)
- 江蘇省南通市崇川區(qū)2023-2024學年三年級上學期期末語文試卷
- 醫(yī)療研究小組成員及其角色劃分
- 陰道助產(chǎn)完整課件
- 宜家品牌分析報告
- 新媒體個人賬號分析報告
- crtd植入術護理查房
- 掃雪鏟冰安全教育培訓
- 人教版三年級下冊必讀書目《中國古代寓言故事》
- 涉密內(nèi)網(wǎng)分級保護設計方案
評論
0/150
提交評論