![不完全信息博弈和貝葉斯均衡_第1頁](http://file2.renrendoc.com/fileroot_temp3/2021-3/26/d78b431f-af14-420f-bcc1-91cb64c9f1eb/d78b431f-af14-420f-bcc1-91cb64c9f1eb1.gif)
![不完全信息博弈和貝葉斯均衡_第2頁](http://file2.renrendoc.com/fileroot_temp3/2021-3/26/d78b431f-af14-420f-bcc1-91cb64c9f1eb/d78b431f-af14-420f-bcc1-91cb64c9f1eb2.gif)
![不完全信息博弈和貝葉斯均衡_第3頁](http://file2.renrendoc.com/fileroot_temp3/2021-3/26/d78b431f-af14-420f-bcc1-91cb64c9f1eb/d78b431f-af14-420f-bcc1-91cb64c9f1eb3.gif)
![不完全信息博弈和貝葉斯均衡_第4頁](http://file2.renrendoc.com/fileroot_temp3/2021-3/26/d78b431f-af14-420f-bcc1-91cb64c9f1eb/d78b431f-af14-420f-bcc1-91cb64c9f1eb4.gif)
![不完全信息博弈和貝葉斯均衡_第5頁](http://file2.renrendoc.com/fileroot_temp3/2021-3/26/d78b431f-af14-420f-bcc1-91cb64c9f1eb/d78b431f-af14-420f-bcc1-91cb64c9f1eb5.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、第三章:,不完全信息靜態(tài)博弈,主要內(nèi)容:,一、不完全信息博弈和貝葉斯納什均衡,二、貝葉斯均衡的應用,三、貝葉斯博弈與混合戰(zhàn)略均衡,四、機制設計理論與顯示原理,第一節(jié),不完全信息博弈,和貝葉斯均衡,一、貝葉斯博弈,二、海薩尼轉(zhuǎn)換,三、貝葉斯博弈的戰(zhàn)略式描述,四、貝葉斯納什均衡,一、貝葉斯博弈,?,完全信息(,complete information,):每個參與人,對其他參與人的,支付函數(shù)有準確的了解,;否則,,為不完全信息(,incomplete information,)。,?,完美信息(,perfect information,):在博弈過程的,任何時點每個參與人都能,觀察并記憶之前各局中
2、,人所選擇的行動,,否則為不完美信息(,imperfect,information,)。,?,前面兩章我們討論了完全信息博弈問題,,但在現(xiàn)實生活中我們遇到更多的可能是不,完全信息博弈問題。,?,例如:,?,在企業(yè)的新產(chǎn)品開發(fā)過程中,,企業(yè)對市場的需,求可能并不清楚,;,?,在連鎖店博弈中,,潛在的進入者可能并不知道,連鎖店在市場上的盈利情況,,等等。,?,像這種博弈,開始時就存在事前不確定性的,博弈問題,是不完全信息博弈問題。,40,,,50,-10,,,0,30,,,80,-10,,,100,0,,,300,0,,,300,0,,,400,0,,,400,高成本情況,低成本情況,默許,斗爭,
3、默許,斗爭,進入,不進入,進入者,在位者,市場進入博弈:不完全信息,?,在位者的成本有兩種類型,而進入者并不,知道在位者的成本類型。,?,顯然,在這種情形下,進入者有關(guān)在位者,的成本信息是不完全的。,?,當在位者具有不同的成本時,所表現(xiàn)出來,的博弈情形是不同的,對應的均衡也是不,一樣的。,?,高成本情形:,(進入,默許)(不進入,斗爭),?,低成本情形:,(不進入,斗爭),斗雞博弈,?,兩個所謂的勇士舉著長槍,準備從獨木,橋的兩端沖上橋中央進行決斗。每位勇,士都有兩種選擇:沖上去,(,用,U,表示,),,或,退下來,(,用,D,表示,),。若兩人都沖上去,則,兩敗俱傷;若一方上去而另一方退下來
4、,,沖上去者取得勝利,(,至少心理上是這樣,的,),,退下來的丟了面子;若兩人都退下,來,兩人都丟面子。,?,存在兩個純戰(zhàn)略,Nash,均衡,(,U,,,D,),和,(,D,,,U,),,,也就是一個人沖上去,另一個就必須退下來。,?,當一個理性的參與人預測到對方將會沖上去時,,明智的選擇就是退下來;而當預測到對方將會選,擇退卻時,就應該大膽地沖上去。,-4,-4,2,-2,-2,2,0,0,U,D,2,1,U,D,?,現(xiàn)在考慮這樣的情形:假設參與人可能有,這樣的兩種性格特征,(,類型,),“,強硬”,(,用,s,表示,),或“軟弱”,(,用,w,表示,),。,?,所謂“強硬”的參與人是指那些
5、喜歡爭強,好勝、不達目的誓不罷休的決斗者;而,“軟弱”的參與人是指那些膽小怕事、遇,事希望息事寧人的決斗者。,?,可以想象,當具有不同性格特征的決斗者,相遇時,表現(xiàn)出來的博弈情形將會不同。,斗雞博弈:不完全信息,當參與人都為強硬者時,?,博弈存在兩個純戰(zhàn)略,Nash,均衡,(,U,,,D,),和,(,D,U,),。,-4, -4,2, -2,-2, 2,0, 0,U,D,2,1,U,D,當參與人,1,為強硬者參與人,2,為軟弱者時,?,博弈存在唯一的,Nash,均衡,(,U,D,),。,-4, -4,2, 0,-2, 0,0, 1,U,D,2,1,U,D,當參與人,1,為軟弱者參與人,2,為強
6、硬者時,?,博弈存在唯一的,Nash,均衡,(,D,U,),。,-4, -4,0, -2,0, 2,1, 0,U,D,2,1,U,D,當參與人都為軟弱者時,?,博弈存在唯一的,Nash,均衡,(,D,D,),。,-4, -4,0, 0,0, 0,1, 1,U,D,2,1,U,D,-4, -4,2, -2,-2, 2,0, 0,U,D,2,1,U,D,-4, -4,2, 0,-2, 0,0, 1,U,D,2,1,U,D,-4, -4,0, -2,0, 2,1, 0,U,D,2,1,U,D,-4, -4,0, 0,0, 0,1, 1,U,D,2,1,U,D,(1),參與人都為強硬者,(2),參與人
7、,1,為強硬者,參與人,2,為軟弱者,(3),參與人,1,為軟弱者,參與人,2,為強硬者,(4),參與人都為軟弱者,強硬,軟弱,U D U D,1,2,1,,,1,0,,,0,1,,,0,0,,,2,0,,,0,-4,,,-4,0,,,-2,-4,,,-4,0,,,1,-2,,,0,0,,,0,-2,,,2,2,,,0,-4,,,-4,2,,,-2,-4,,,-4,U,D,U,D,強硬,軟弱,斗雞博弈:不完全信息,?,在“斗雞博弈”中,雖然在博弈開始之前,每位決斗者都知道自己的性格特征,但對,對手的性格特征往往不甚了解。,?,在這種情況下即使所有的決斗者都看到了,上面的四個戰(zhàn)略式博弈,,但對決
8、斗者來講,,仍存在著所謂的事前不確定性,即博弈開,始之前就不知道的信息,。,?,具體而言,這意味著當博弈真正開始的時,候,對,到底體現(xiàn)為哪一種博弈形勢,并不清,楚。,?,對于“強硬”的參與人,1,來講,雖然他看,到了上面的戰(zhàn)略式博弈,但他不知道對手,是“強硬”的還是“軟弱”的,所以博弈,開始之前他無法確定博弈是根據(jù),(1),還是,(2),進行。這意味著“強硬”的參與人,1,面臨,著事前無法確定的信息。,?,同樣,“軟弱”的參與人,1,也會面臨類似,的問題。此時,“斗雞博弈”就是一個不,完全信息博弈問題。,?,從這一例子來看,博弈的參與人均存在,兩,種不同的類型,,即強硬和軟弱;,?,由于參與人
9、,1,不知道對手究竟是“強硬”,的還是“軟弱”的,因此,此時參與人,1,就好像在與兩個決斗者進行決斗,一個是,“強硬”的,另一個是“軟弱”的;,?,當一個參與人并不知道在與誰博弈時,博,弈的規(guī)則是無法定義的,,如何處理不完全,信息導致的這一問題?,?,為了解決該問題,海薩尼提出了,Harsanyi,轉(zhuǎn)換,。,?,海薩尼指出,引入虛擬參與人,自然,,由自然先決定參與人的不同類型,將不完,全信息博弈轉(zhuǎn)換為不完美信息博弈。,二、海薩尼(,Harsanyi,)轉(zhuǎn)換,?,為了解釋,Harsanyi,轉(zhuǎn)換的具體含義,我們,對“斗雞博弈”進行簡化。,?,假設,參與人,1,是“強硬”的決斗者,,參與,人,2,
10、可能是“強硬”的也可能是“軟弱”,的,參與人,1,不知道參與人,2,的類型,但參,與人,2,知道自己的類型,而且這一假設為,所有的參與人所知道。,Harsanyi,轉(zhuǎn)換,?,對于簡化的“斗雞博弈”,,Harsanyi,轉(zhuǎn)換,是這樣處理的:在原博弈中引入一個,“虛擬”的參與人,“,自然”,(nature,,,用,N,表示,),,構(gòu)造一個參與人為兩個決斗,者和“自然”的三人博弈。,Harsanyi,轉(zhuǎn)換,-4,-4,2,-2,-2,2,U,D,0,0,-4,-4,2,0,-2,0,0,1,N,(,),p,強,硬,(1,),p,?,軟,弱,2,2,0,x,1,x,2,x,D,D,D,D,D,U,U,
11、U,U,U,1,“,自然”首先行動決定參與人,2,的性格特征,(,即選擇,參與人,2,是“強硬”的還是“軟弱”的,),,“自然”,的選擇參與人,1,不知道,但參與人,2,知道。,參與人,2,的特征,在“自然”選擇后,參與人,1,和,2,再進行“斗雞博,弈”。,-4,-4,2,-2,-2,2,U,D,0,0,-4,-4,2,0,-2,0,0,1,N,(,),p,強,硬,(1,),p,?,軟,弱,2,2,0,x,1,x,2,x,D,D,D,D,D,U,U,U,U,U,1,-4,-4,2,-2,-2,2,U,D,0,0,-4,-4,2,0,-2,0,0,1,N,(,),p,強,硬,(1,),p,?,
12、軟,弱,2,2,0,x,1,x,2,x,D,D,D,D,D,U,U,U,U,U,1,在新構(gòu)造的三人博弈中,“自然”的支付不必,考慮。參與人,1,和,2,的支付由“斗雞博弈”決定。,-4,-4,2,-2,-2,2,U,D,0,0,-4,-4,2,0,-2,0,0,1,N,(,),p,強,硬,(1,),p,?,軟,弱,2,2,0,x,1,x,2,x,D,D,D,D,D,U,U,U,U,U,1,如果“自然”選擇參與人,2,的性格特征是“強硬”的,則意味,著參與人,1,與“強硬”的參與人,2,進行決斗,博弈進入決策結(jié),x,1,,其支付由,(1),決定;,-4,-4,2,-2,-2,2,U,D,0,0,
13、-4,-4,2,0,-2,0,0,1,N,(,),p,強,硬,(1,),p,?,軟,弱,2,2,0,x,1,x,2,x,D,D,D,D,D,U,U,U,U,U,1,如果“自然”選擇參與人,2,的性格特征是“軟弱”的,,則意味著參與人,1,與“軟弱”的參與人,2,進行決斗,,博弈進入決策結(jié),x,2,,其支付由,(2),決定。,?,海薩尼通過引入“虛擬”參與人,將博,弈的起始點由,x,1,或,x,2,提前至,x,0,,從而,將原,博弈中參與人的事前不確定性轉(zhuǎn)變?yōu)椴?弈開始后的不確定性,。,?,這種通過引入“虛擬”參與人來處理不,完全信息博弈問題的方法稱為,Harsanyi,轉(zhuǎn)換,。,?,在,Har
14、sanyi,轉(zhuǎn)換中規(guī)定:參與人關(guān)于“自,然”選擇的推斷為共同知識。,?,也就是說,兩個決斗者不僅同時一起看,到了“自然”隨機選擇參與人,2,的性格特,征,而且同時一起看到了“自然”以一,定的概率分布隨機選擇參與人,2,的性格特,征。,在應用,Harsanyi,轉(zhuǎn)換時,需要注意以下問題:,1) “,自然”的選擇。在一般的不完全信息,博弈問題中,,Harsanyi,轉(zhuǎn)換規(guī)定“自然”,選擇的是參與人的,類型,(type),。除了根據(jù),參與人的支付來劃分參與人的類型以外,,還可以根據(jù)參與人的行動空間,甚至根,據(jù)參與人掌握信息的多少,(,或程度,),來劃分,參與人的類型。,?,用,t,i,表示參與人,i
15、,的一個特定的類型,,T,i,表,示參與人,i,所有類型的集合,(,亦稱類型空間,,type space),,即,,,t,=(,t,1,t,n,),表示所有,參與人的類型組合,,t,-i,=(,t,1,t,i,-1,t,n,),表,示除參與人,i,之外其他參與人的類型組合。,所以,,t,=(,t,i,t,-i,),。,i,i,t,T,?,?,用,表示參與人,i,在知道自己類型為,t,i,的情況下,關(guān)于其他參與人類型的推斷,(,即條件概率,),,則,(,),i,i,i,p,t,t,?,(,(,),(,),),(,),(,),i,i,i,i,i,i,i,i,i,i,i,i,t,T,t,t,t,t,
16、p,t,t,t,t,t,p,p,p,p,?,?,?,?,?,?,?,?,?,?,2),參與人關(guān)于“自然”選擇的推斷:,?,用,p,(,t,1,t,n,),表示定義在參與人類型組合上,的一個聯(lián)合分布概率函數(shù)。,?,假設,p,ss,=0.2,,,p,sw,=0.3,,,p,ws,=0.25,,,p,ww,=0.25,。,?,其中,,p,ss,:決斗者,1,和決斗者,2,同時強硬的概率;,p,sw,:決斗者,1,強硬、決斗者,2,軟弱的概率;,p,ws,:決斗者,1,軟弱、決斗者,2,強硬的概率;,p,ww,:決斗者,1,軟弱、決斗者,2,軟弱的概率;,?,雖然決斗者,1,不知道決斗者,2,的類型,
17、但由于決斗,者,1,知道自己的類型,因此他可以根據(jù)貝葉斯公式,推知決斗者,2,的類型分布。,例如,?,根據(jù)貝葉斯規(guī)則,“強硬”的決斗者,1,可以推,知:,決斗者,2,是“強硬”的概率為,決斗者,2,是“軟弱”的概率為,?,“軟弱”的決斗者,1,可以推知:,決斗者,2,是“強硬”的概率為,決斗者,2,是“軟弱”的概率為,1,(,0.2,),0.4,0.2,0.3,p,s,s,?,?,?,1,(,0.3,),0.6,0.2,0.3,p,w,s,?,?,?,1,(,0.25,),0.5,0.25,0.25,p,s,w,?,?,?,1,(,0.25,),0.5,0.25,0.25,p,w,w,?,?,
18、?,?,不完全信息博弈:完全信息博弈在不完,全信息上的拓展,我們又將其稱為貝葉,斯博弈;,?,貝葉斯博弈:靜態(tài)貝葉斯博弈和動態(tài)貝,葉斯博弈;,三、貝葉斯博弈的戰(zhàn)略式描述,貝葉斯博弈的定義,?,貝葉斯博弈包含以下五個要素:,(1),參與人集合,;,(2),參與人的類型集合,T,1,T,2,;,(3),參與人關(guān)于其他參與人類型的推斷,;,(4),參與人類型相依的行動集,A,(,t,1,),A,(,t,n,),;,(5),參與人類型相依的支付函數(shù),。,1,2,.,n,?,?,1,1,1,(,),p,t,t,?,(,),n,n,n,p,t,t,?,1,1,2,2,1,1,(,(,),(,),(,);,
19、),n,n,a,t,a,t,a,t,t,u,K,1,1,2,2,(,(,),(,),(,);,),n,n,n,n,a,t,a,t,a,t,t,u,K,貝葉斯博弈中的戰(zhàn)略,?,在貝葉斯博弈,中,參與人,i,的一個戰(zhàn)略是從參與人的類,型集,T,i,到其行動集的一個函數(shù),s,i,(,t,i,),;,?,它包含了當自然賦予,i,的類型為,t,i,時,,i,將,從可行的行動集,A,i,(,t,i,),中選擇的行動。,;,(,);,(,);,(,(,);,(,(,(,);,),i,i,i,i,i,i,G,T,p,A,t,u,a,t,t,?,?,?,用,表示給定其他參與人的戰(zhàn),略,,類型為,t,i,的,參與
20、人,i,選擇行動,a,i,時的期望效用,則,其中,對,,,為給定,t,-i,時由,s,-i,所確定的其他參與人的行動組合,(,;,),i,i,i,i,v,a,s,t,?,1,1,1,(,(,),(,),(,),(,),i,i,i,n,s,s,s,s,s,?,?,?,?,?,?,?,?,K,K,(,;,),(,),(,(,);,),i,i,i,i,i,i,i,i,i,i,i,i,i,i,t,T,v,a,s,t,p,t,t,u,a,a,t,t,?,?,?,?,?,?,?,?,?,i,i,t,T,?,?,?,?,(,),i,i,a,t,?,?,1,1,1,1,1,1,(,),(,(,),(,),(,
21、),(,),i,i,i,i,i,i,n,n,a,t,a,t,a,t,a,t,a,t,?,?,?,?,?,?,?,K,K,貝葉斯博弈的時間順序如下:,(1),“,自然”選擇參與人的類型組合,t,=(,t,1,t,n,),,,其中,參與人,i,觀測到“自然”關(guān)于自己類型,t,i,的選擇;雖然參與人,i,觀測不到“自然”關(guān)于,其他參與人類型,t,-i,的選擇,但參與人,i,具有關(guān),于其他參與人類型的推斷,;,(2),參與人同時選擇行動,每個參與人,i,從行動集,A,i,(,t,i,),中選擇行動,a,i,(,t,i,),;,(3),參與人,i,得到,。,(,),i,i,i,p,t,t,?,1,1,2
22、,2,(,(,),(,),(,);,),n,n,i,i,a,t,a,t,a,t,t,u,L,“,斗雞博弈”的貝葉斯模型,?,參與人為決斗者,1,和,2,;,?,用,s,表示決斗者是“強硬”的,,w,表示決斗,者是“軟弱”的,所以,T,1,=,T,2,=,s,w,。,?,用,p,xy,表示“自然”選擇類型組合,(,x,y,),的概,率,并假設,p,xy,為共同知識,則決斗者,1,關(guān),于其對手類型的推斷為,p,1,(,y,|,x,),。,?,決斗者,1,關(guān)于類型相依的行動空間,A,1,(,x,)=,U,D,,決斗者,2,關(guān)于類型相依的行動空間,A,2,(,y,),=,U,D,。,?,每位決斗者,i
23、,的支付由前面的圖決定。,?,在貝葉斯博弈中,對于一個理性的參與,人,i,,當他只知道自己的類型,t,i,而不知道其,他參與人的類型時,給定其他參與人的,戰(zhàn)略,s,-i,,他將選擇使自己期望效用,(,支付,),最大化的行動,,其中,(,),i,i,a,t,?,(,),(,),arg,max,(,;,),i,i,i,i,i,i,i,i,i,a,A,t,a,t,v,a,s,t,?,?,?,?,四、貝葉斯納什均衡,純戰(zhàn)略貝葉斯,Nash,均衡,?,貝葉斯博弈,的純戰(zhàn)略貝葉斯,Nash,均衡是一個類型相依的行,動組合,,其中每個參與人,在給定自己的類型,t,i,和其他參與人的類型相依,行動,的情況下最
24、大化自己的期望效用。,?,也就是,行動組合,是一個,純戰(zhàn)略貝葉斯,Nash,均衡,如果對,,,;,(,);,(,);,(,(,);,(,(,(,);,),i,i,i,i,i,i,G,T,p,A,t,u,a,t,t,?,?,1,1,2,2,(,(,),(,),(,),n,n,a,t,a,t,a,t,?,?,?,L,(,),i,i,a,t,?,?,?,1,1,2,2,(,(,),(,),(,),n,n,a,t,a,t,a,t,?,?,?,L,i,?,?,(,),(,),arg,max,(,),(,(,);,),i,i,i,i,i,i,i,i,i,i,i,i,i,i,i,a,A,t,t,T,a,t,
25、p,t,t,u,a,a,t,t,?,?,?,?,?,?,?,?,?,?,?,貝葉斯博弈納什均衡的存在性,?,定理,一個有限的貝葉斯博弈一定存在貝,葉斯,Nash,均衡。,類型,?,1,類型,?,2,左,右,左,右,3,,,1,2,,,0,3,,,0,2,,,1,0,,,1,4,,,0,0,,,0,4,,,1,上,下,甲,乙,靜態(tài)貝葉斯博弈均衡舉例:,表中甲、乙同時行動,甲只有一種類型,但乙有,兩種類型:,?,2,=,?,1,,,?,2,;甲不了解對方是哪一種,類型,但他相信對方為,?,1,,,?,2,的概率各為,1/2,。求,解均衡,。,?,乙:如果為,?,1,,有占優(yōu)戰(zhàn)略為“左”;如,果為,
26、?,2,,有占優(yōu)戰(zhàn)略為“右”,?,甲:由于甲相信對方為兩種類型的可能性,各為,1/2,,故甲考慮選“上”和“下”分別,給他帶來的期望收益;,?,結(jié)果選“上”,期望支付為,5/2,,選“下”,,期望支付為,2,,因而甲的最佳選擇是“上”。,?,納什均衡為,s,1,*=,上;,s,2,*(,?,1,)=,左,,s,2,*(,?,2,)=,右。,貝葉斯,Nash,均衡的求解:,?,先以簡化的“斗雞博弈”為例。,強硬,軟弱,U D U D,1,2,0,,,1,-2,,,0,0,,,0,-2,,,2,2,,,0,-4,,,-4,2,,,-2,-4,,,-4,U,D,強硬,?,用,p,表示決斗者,1,關(guān)于
27、決斗者,2,的類型的推斷,,即,決斗者,1,認為決斗者,2,為強硬的概率為,p,。,?,(,x,(,y,z,),:,x,表示當決斗者,2,選擇該方格所對應的,戰(zhàn)略時,決斗者,1,選擇該方格所對應的戰(zhàn)略規(guī),定的行動所得到的期望支付;,y,和,z,分別表示當,決斗者,1,選擇該方格所對應的戰(zhàn)略時,“強硬”,決斗者,2,和“軟弱”決斗者,2,選擇該方格所對應,的戰(zhàn)略規(guī)定的行動所得到的期望支付。,?,給定決斗者,1,選擇戰(zhàn)略,U,,“軟弱”決斗者,2,選擇,行動,D,的期望支付為,0,,選擇行動,U,的期望支付為,-4,,行動,D,優(yōu)于行動,U,;給定決斗者,1,選擇戰(zhàn)略,D,,,“軟弱”決斗者,2,
28、選擇行動,D,的期望支付為,1,,選,擇行動,U,的期望支付為,0,,所以,行動,D,優(yōu)于行動,U,。這意味著戰(zhàn)略,U,為軟弱決斗者,2,的劣戰(zhàn)略。,-4,-4,2,-2,-2,2,0,0,U,2,1,U,D,-,4,-4,2,0,-2,0,0,1,D,D,U,-4,-4,2,-2,-,2,2,0,0,U,2,1,U,D,2,,,0,D,D,0,,,1,?,下面根據(jù),p,的大小,求解博弈的純戰(zhàn)略貝葉斯,Nash,均衡。,?,1),假設,,無論決斗者,2,選擇戰(zhàn)略,(,U,D,),還是,(,D,D,),,,決斗者,1,的最優(yōu)行動都是,U,。給定決斗者,1,的選擇,U,,“強,硬”決斗者,2,的最
29、優(yōu)行動為,D,。所以,博弈存在惟一的純戰(zhàn),略貝葉斯,Nash,均衡,決斗者,1,選擇行動,U,,“強硬”決斗,者,2,選擇行動,D,,“軟弱”決斗者,2,選擇行動,D,。,1/,2,p,?,情形,1,:給定決斗者,1,認為決斗者,2,為強硬的概率為,p,?,2),假設,,博弈存在如下兩個純戰(zhàn),略貝葉斯,Nash,均衡:,(1),決斗者,1,選擇行動,U,,“強硬”決斗者,2,選擇行動,D,,“軟弱”決斗者,2,選擇行動,D,;,(2),決斗者,1,選擇行動,D,,“強硬”決斗者,2,選擇行動,U,,“軟弱”決斗者,2,選擇行動,D,。,1/,2,p,?,求解另一種情形下“斗雞博弈”的,貝葉斯,
30、Nash,均衡,強硬,軟弱,U D U D,1,,,1,0,,,0,1,,,0,0,,,2,0,,,0,-4,,,-4,0,,,-2,-4,,,-4,0,,,1,-2,,,0,0,,,0,-2,,,2,2,,,0,-4,,,-4,2,,,-2,-4,,,-4,U,D,U,D,強硬,軟弱,求解另一種情形下“斗雞博弈”的,貝葉斯,Nash,均衡,?,假設,?,“強硬”決斗者,1,關(guān)于決斗者,2,的類型推,斷,;,?,“軟弱”決斗者,1,關(guān)于決斗者,2,的類型推,斷,;,?,“強硬”決斗者,2,關(guān)于決斗者,1,的類型推,斷,;,?,“軟弱”決斗者,2,關(guān)于決斗者,1,的類型推,斷,;,0.2,0.3
31、,0.2,0.3,ss,sw,ws,ww,p,p,p,p,?,?,?,?,1,1,(,(,),0.4,),0.6,p,s,s,p,w,s,?,?,2,2,(,(,),0.5,),0.5,p,s,s,p,w,s,?,?,2,2,(,(,),0.5,),0.5,p,s,w,p,w,w,?,?,1,1,(,(,),0.4,),0.6,p,s,w,p,w,w,?,?,強硬,軟弱,U D U D,1,,,1,0,,,0,1,,,0,0,,,2,0,,,0,-4,,,-4,0,,,-2,-4,,,-4,0,,,1,-2,,,0,0,,,0,-2,,,2,2,,,0,-4,,,-4,2,,,-2,-4,,,-4,U,D,U,D,強硬,軟弱,強硬,軟弱,U D U D,1,,,1,0,,,0,1,,,0,0,,,2,0,,,1,-2,,,0,0,,,0,-2,,,2,2,,,0,-4,,,-4,2,,,-2,-4,,,-4,U,D,D,強硬,軟弱,強硬,軟弱,U D U D,1,,,1,0,,,0,1,,,0,0,,,2,0,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年代保管檔案協(xié)議(2篇)
- 2025年企業(yè)單位雇傭合同模板(2篇)
- 2025年買賣合作廉潔協(xié)議經(jīng)典版(2篇)
- 2025年交通事故自行協(xié)商協(xié)議(三篇)
- 2025年個人汽車貸款擔保合同簡單版(2篇)
- 地鐵項目居間合同協(xié)議書
- 八年級大考數(shù)學試卷
- 幼兒園全包裝修合同條款
- 沙石運輸誠信體系建設合同
- 樂器運輸協(xié)調(diào)協(xié)議
- 動火作業(yè)安全管理要求及控制措施
- 詩豪劉禹錫一生部編教材PPT
- 資源循環(huán)科學和工程專業(yè)建設探討
- 中國營養(yǎng)師培訓教材1
- 2023年河南省鄭州市一模道德與法治試題(含答案)
- 《民航服務溝通技巧》教案第13課內(nèi)部溝通基礎知識
- 2023年湖南高速鐵路職業(yè)技術(shù)學院高職單招(語文)試題庫含答案解析
- FZ/T 54024-2019錦綸6預取向絲
- 2022年云南省中考數(shù)學試卷及答案
- 30453自考機電一體化技術(shù)及應用小抄
- 水利生產(chǎn)安全事故典型案例分析
評論
0/150
提交評論