講義不完全信息靜態(tài)博弈_第1頁(yè)
講義不完全信息靜態(tài)博弈_第2頁(yè)
講義不完全信息靜態(tài)博弈_第3頁(yè)
講義不完全信息靜態(tài)博弈_第4頁(yè)
講義不完全信息靜態(tài)博弈_第5頁(yè)
已閱讀5頁(yè),還剩44頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第5講:不完全信息靜態(tài)博弈主講人:張成科博士廣東工業(yè)大學(xué)經(jīng)濟(jì)與貿(mào)易學(xué)院zhangck@管理博弈論

(Management

GameTheory)一不完全信息靜態(tài)博弈和貝葉斯納什均衡不完全信息博弈海薩尼轉(zhuǎn)換不完全信息靜態(tài)博弈的戰(zhàn)略式表述和貝葉斯納什均衡二貝葉斯納什均衡應(yīng)用舉例三貝葉斯納什均衡與混合戰(zhàn)略均衡四機(jī)制設(shè)計(jì)理論與顯示原理第四章不完全信息靜態(tài)博弈

------貝葉斯納什均衡不完全信息博弈我們不可能料事如神,也無(wú)法掌握所有變因,更無(wú)力預(yù)測(cè)未來(lái),不確定性不可避免。這里主要探討如何在不確定性的情況下做出理性、一致的決策,換句話說(shuō),首先必須承認(rèn)自己雖然沒(méi)有辦法做到無(wú)所不知,但也不至于一無(wú)所知,而應(yīng)該或盡可能有效運(yùn)用自己所知的一切為自己謀利。不完全信息博弈“空城計(jì)”街亭失守,司馬懿引大軍蜂擁而來(lái),當(dāng)時(shí)孔明身邊只有一班文官,軍士一半已經(jīng)運(yùn)糧草去了,只有2500軍士在城中。眾官聽(tīng)得這個(gè)消息,盡皆失色??酌鞯浅峭?,果然塵土沖天,魏兵分兩路殺來(lái)??酌髁畋妼㈧浩毂M皆藏匿,打開(kāi)城門(mén),每一門(mén)用20軍士,扮作百姓,灑掃街道。而孔明羽扇綸巾,引二小童攜琴一張,于城上敵樓前憑欄而望,焚香操琴。不完全信息博弈司馬懿自馬上遠(yuǎn)遠(yuǎn)望之,見(jiàn)諸葛亮神態(tài)自若,頓時(shí)心生疑忌,猶豫再三,難下決斷。又接到遠(yuǎn)山中可能有埋伏的情報(bào),于是叫后軍做前軍,前軍做后軍,急速退去。司馬懿之子司馬昭問(wèn):“莫非諸葛亮無(wú)軍,故做此態(tài),父何故便退兵?”司馬懿說(shuō):“亮平生謹(jǐn)慎,不曾弄險(xiǎn),今大開(kāi)城門(mén),必有埋伏,我兵若進(jìn),必中計(jì)也?!笨酌饕?jiàn)魏軍退去,撫掌而笑,眾官無(wú)不駭然。諸葛亮說(shuō),司馬懿“料吾生平謹(jǐn)慎,必不弄險(xiǎn),疑有伏兵,所以退去。吾非行險(xiǎn),蓋因不得已而用之,棄城而去,必為之所擒。”不完全信息博弈-信息的重要性被擒,?不被擒,?被擒,?不被擒,?司馬懿諸葛亮棄城守城進(jìn)攻撤退司馬懿:兵多將廣,但不知道自己和對(duì)方在不同行動(dòng)策略下的支付;諸葛亮:處于劣勢(shì),但知道博弈的結(jié)構(gòu),比對(duì)方掌握更多的信息。計(jì)策:使用各種手段迷惑司馬懿,為的是不讓對(duì)方知道其策略的結(jié)果(支付)。迫使其認(rèn)為,撤退比進(jìn)攻好,降低其進(jìn)攻的預(yù)期收益。如用概率論的術(shù)語(yǔ)來(lái)說(shuō),諸葛亮的做法是加大司馬懿對(duì)進(jìn)攻失敗的主觀概率,使司馬懿認(rèn)為進(jìn)攻的期望收益小于撤退的期望收益。

司馬懿關(guān)于自己策略的支付的信息是不完全的。不完全信息博弈

在信息不充分的情況下,博弈參與者不是使自己的支付或效用最大,而是使自己的期望效用或支付最大。如讓你在50%的概率獲得100元與10%的概率獲得200元兩者之間選擇的話,前者的期望所得是50元,后者是20元,故選前者。不完全信息博弈在生活中我們也會(huì)碰到這樣的問(wèn)題,比如一個(gè)乞丐向你乞討,你愿意幫助別人,但不知道他是真的乞丐還是騙子,該如何決定呢?如果你喜歡與人為善,你可能愿意冒一點(diǎn)上當(dāng)?shù)奈kU(xiǎn),這不等于你愚蠢,而是你認(rèn)為,幫助一個(gè)困境中的人比回絕一個(gè)騙子更重要。不完全信息博弈完全信息與不完全信息:每一個(gè)參與人對(duì)所有其他參與人的(對(duì)手)的特征、戰(zhàn)略空間及支付函數(shù)有準(zhǔn)確的知識(shí),否則為不完全信息。類(lèi)似上述情況稱為不完全信息博弈,即在不完全信息博弈中,至少有一個(gè)參與人不知道其他參與人的支付函數(shù)。第四章不完全信息靜態(tài)博弈

-貝葉斯納什均衡一不完全信息靜態(tài)博弈和貝葉斯納什均衡不完全信息博弈海薩尼轉(zhuǎn)換不完全信息靜態(tài)博弈的戰(zhàn)略式表述和貝葉斯納什均衡二貝葉斯納什均衡應(yīng)用舉例三貝葉斯納什均衡與混合戰(zhàn)略均衡海薩尼轉(zhuǎn)換-3,-3-3,-31,01,00,10,00,10,0默許斗爭(zhēng)默許斗爭(zhēng)進(jìn)入不進(jìn)入在位者市場(chǎng)進(jìn)入博弈:不完全信息進(jìn)入者高成本情況低成本情況

進(jìn)入者似乎在與兩個(gè)在位者博弈,一個(gè)是高成本的在位者,一個(gè)是低成本的在位者;如果在位者有T種不同的成本函數(shù)進(jìn)入者就相當(dāng)于與T個(gè)不同的在位者博弈。

1976年以前,博弈論專(zhuān)家認(rèn)為這樣的不完全信息是沒(méi)法分析的。海薩尼轉(zhuǎn)換海薩尼在1967-1968年提出了一個(gè)處理不完全信息的方法-引入一個(gè)虛擬的參與人“自然”,自然首先行動(dòng),選擇決定參與人的特征(如成本函數(shù)),參與人知道自己的特征,其他參與人不知道。這樣不完全信息博弈就轉(zhuǎn)換為完全但不完美信息博弈,可以利用標(biāo)準(zhǔn)的分析技術(shù)進(jìn)行分析,這就是“海薩尼轉(zhuǎn)換”。N高低[P][1-P]不進(jìn)入進(jìn)入不進(jìn)入進(jìn)入BB合作斗爭(zhēng)合作斗爭(zhēng)(0,300)(40,50)(-10,0)(30,80)(-10,100)進(jìn)入者在位者在位者(0,400)海薩尼轉(zhuǎn)換類(lèi)型:一個(gè)參與人擁有的所有的個(gè)人信息(即所有不是共同知識(shí)的信息)稱為他的類(lèi)型。根據(jù)這個(gè)定義,甚至允許參與人不知道其他參與人是否知道自己的類(lèi)型。例如:市場(chǎng)進(jìn)入博弈:在位者不知道進(jìn)入者是否知道自己是高成本還是低成本,只知道進(jìn)入者有p’的概率知道自己的成本函數(shù),(1-p’)的概率不知道自己的成本函數(shù)。這種情況下,進(jìn)入者也有兩種類(lèi)型:知道(在位者的成本)或不知道(在位者的成本)。例如:在談判中,甲方知道自己是強(qiáng)硬派或妥協(xié)派,乙方知道自己是否知道甲方是強(qiáng)硬派或妥協(xié)派,但甲方不知道乙方是否知道自己是強(qiáng)硬派還是妥協(xié)派,則甲方有兩種類(lèi)型:強(qiáng)硬派或妥協(xié)派,乙方有兩種類(lèi)型:知道或不知道。不完全信息意味著,至少有一個(gè)參與人有多個(gè)類(lèi)型。真正的“信息不對(duì)稱”一個(gè)古董商發(fā)現(xiàn)一個(gè)人用珍貴的茶碟做貓食碗,于是假裝對(duì)這只貓很感興趣,要叢主人手里買(mǎi)下,主人不賣(mài),為此古董商出了大價(jià)錢(qián)。成交之后,古董商裝做不在意地說(shuō):這個(gè)碟子它已經(jīng)用慣了,就一塊送給我吧。貓主人不干了:你知道用這個(gè)碟子,我已經(jīng)賣(mài)了多少只貓了?關(guān)于完全信息與不完全信息的關(guān)系如果參與人i的類(lèi)型只包含一個(gè)元素,即每個(gè)參與人只有一種類(lèi)型,則該博弈退化為完全信息靜態(tài)博弈,即完全信息靜態(tài)博弈是不完全信息靜態(tài)博弈的特例。Bayes法則:在日常生活中,當(dāng)面臨不確定時(shí),在任何一個(gè)時(shí)點(diǎn)上,我們對(duì)某件事情發(fā)生的可能性有一個(gè)判斷(先驗(yàn)概率),然后,會(huì)根據(jù)新的信息來(lái)修正這個(gè)判斷(后驗(yàn)概率),Bayes法則就是這樣的方法。設(shè)參與人的類(lèi)型是獨(dú)立分布的,參與人i有K個(gè)可能的類(lèi)型;有H個(gè)可能的行動(dòng),θk和ak分別表示特定的類(lèi)型和行動(dòng),則P(θk)≥0,∑P(θk)=1,i選擇ak的概率為:P{aK}=P(a1|θ1)P(θ1)+···+P(aK|θK)P(θK)=Bayes公式:Bayes法則要求P(aK)>0,否則后驗(yàn)概率無(wú)意義。如果P(aK)=0,我們?cè)试SP(θK|aK)在區(qū)間[0,1]區(qū)間取任何值,只要所取的值與均衡策略相容。在動(dòng)態(tài)博弈中,P(aK)=0對(duì)應(yīng)的則為非均衡路徑上的信息集。海薩尼轉(zhuǎn)換設(shè)θi表示參與人i的一個(gè)特定的類(lèi)型,根據(jù)海薩尼公理:假定參與人類(lèi)型的分布函數(shù)P(θ1,…,θn)是所有參與人的共同知識(shí),所有參與人知道P(θ1,…,θn),所有參與人知道所有參與人知道P(θ1,…,θn),如此等等。這意味著在進(jìn)入市場(chǎng)的博弈中,如果進(jìn)入者有一種類(lèi)型,在位者有兩種類(lèi)型,那么p是共同知識(shí),即進(jìn)入者知道在位者是高成本的概率是p,進(jìn)入者知道在位者知道進(jìn)入者知道在位者是高成本的概率是p,如此等等,即在博弈開(kāi)始時(shí),所有參與人有關(guān)自然行動(dòng)的信念(belief)是相同的。第四章不完全信息靜態(tài)博弈

-貝葉斯納什均衡一不完全信息靜態(tài)博弈和貝葉斯納什均衡不完全信息博弈海薩尼轉(zhuǎn)換不完全信息靜態(tài)博弈的戰(zhàn)略式表述和貝葉斯納什均衡二貝葉斯納什均衡應(yīng)用舉例三貝葉斯納什均衡與混合戰(zhàn)略均衡四機(jī)制設(shè)計(jì)理論與顯示原理不完全信息靜態(tài)博弈

-貝葉斯納什均衡在不完全信息靜態(tài)博弈中,所有參與人同時(shí)行動(dòng),其戰(zhàn)略空間等于行動(dòng)空間,但是參與人i的行動(dòng)空間可能依賴于其類(lèi)型,也就是行動(dòng)空間是類(lèi)型依存的。類(lèi)似的,其支付函數(shù)也是類(lèi)型依存的。如企業(yè)能選擇什么產(chǎn)量依賴于它的成本函數(shù),一個(gè)人能干什么依賴于它的能力等。貝葉斯納什均衡是完全信息靜態(tài)博弈納什均衡概念在不完全信息靜態(tài)博弈上的擴(kuò)展,不完全信息靜態(tài)博弈又叫做靜態(tài)貝葉斯博弈。不完全信息靜態(tài)博弈

-貝葉斯納什均衡靜態(tài)貝葉斯博弈的時(shí)間順序?yàn)椋?、自然選擇類(lèi)型向量,參與人i能觀測(cè)到自己的類(lèi)型,但參與人j只知道除i之外所有參與人類(lèi)型,但不知道參與人i的類(lèi)型。2、n個(gè)參與人同時(shí)行動(dòng);3、參與人i得到類(lèi)型依存支付函數(shù)。給定參與人i只知道自己的類(lèi)型而不知道其他參與人的類(lèi)型,參與人i將選擇使自己的效應(yīng)最大化的期望效用。貝葉斯納什均衡:n人不完全信息靜態(tài)博弈的純戰(zhàn)略均衡是一個(gè)類(lèi)型依存戰(zhàn)略組合,其中每個(gè)參與人i在給定自己的類(lèi)型θi和其他參與人類(lèi)型依存戰(zhàn)略的情況下,最大化自己的期望效用。靜態(tài)貝葉斯博弈定義n人靜態(tài)貝葉斯博弈的戰(zhàn)略式表述包括:參與人的類(lèi)型空間Θ1,…,Θn,條件概率p1,…,pn,類(lèi)型依存戰(zhàn)略空間A1(θ1),…,An(θn)和類(lèi)型依存支付函數(shù)u1(a1,…,an;θ1),…,un(a1,…,an;θn)。參與人i知道自己的類(lèi)型θi∈Θi,條件概率pi=pi(θ-i︱θi)描述給定自己屬于θi的情況下,參與人i有關(guān)其他參與人類(lèi)型θ-i∈Θ-i的不確定性??梢杂肎={A1,…,An;θ1,…,θn;p1,…,pn;u1,…,un}代表這個(gè)博弈。靜態(tài)貝葉斯博弈的時(shí)間順序?yàn)椋?、自然選擇類(lèi)型向量θ=(θ1,…,θn),參與人i觀測(cè)到θi,但參與人j(≠i)只知道pj(θ-j︱θj),觀測(cè)不到θi;2、n個(gè)參與人同時(shí)選擇行動(dòng)a=(a1,…,an),其中ai(θi)∈Ai(θi);3、參與人i得到類(lèi)型依存支付函數(shù)ui(a1,…,an;θi)。

靜態(tài)貝葉斯博弈定義給定參與人i只知道自己的類(lèi)型θi而不知道其他參與人的類(lèi)型θ-i

,參與人i將選擇行動(dòng)ai(θi)最大化自己的期望效用。參與人i的期望效用函數(shù)定義為

vi=∑pi(θ-i︱θi)ui(ai(θi),a-i(θ-i);θi,θ-i)戰(zhàn)略:在n人靜態(tài)貝葉斯博弈G={A1,…,An;θ1,…,θn;p1,…,pn;u1,…,un}中,參與人i的戰(zhàn)略是一個(gè)類(lèi)型依存函數(shù)ai(θi),其中對(duì)Θi中的每一個(gè)類(lèi)型θi,ai(θi)包含了自然賦予i的可能類(lèi)型為ai(θi)時(shí),i將從自己的戰(zhàn)略空間Ai(θi)中中選擇戰(zhàn)略ai(θi)。靜態(tài)貝葉斯博弈定義貝葉斯納什均衡:n人不完全信息靜態(tài)博弈G={A1,…,An;θ1,…,θn;p1,…,pn;u1,…,un}的純戰(zhàn)略均衡是一個(gè)類(lèi)型依存戰(zhàn)略組合{ai*(θi)}ni=1

,其中每個(gè)參與人i在給定自己的類(lèi)型θi和其他參與人類(lèi)型依存戰(zhàn)略a-i*(θ-i)的情況下,最大化自己的期望效用函數(shù)vi

。與純戰(zhàn)略納什均衡不同的是,在貝葉斯均衡中參與人i只知道具有類(lèi)型θj的參與人j將選擇aj(θj)但并不知道θj。因此,即使純戰(zhàn)略選擇也必須取支付函數(shù)的期望值。

二貝葉斯納什均衡應(yīng)用舉例三貝葉斯納什均衡與混合戰(zhàn)略均衡第四章不完全信息靜態(tài)博弈(續(xù))N高低[P][1-P]不進(jìn)入進(jìn)入不進(jìn)入進(jìn)入BB合作斗爭(zhēng)合作斗爭(zhēng)(0,300)(40,50)(-10,0)(30,80)(-10,100)進(jìn)入者在位者在位者(0,400)市場(chǎng)進(jìn)入博弈在市場(chǎng)進(jìn)入的例子里,均衡戰(zhàn)略是:高成本的在位者選擇默許,低成本的在位者選擇斗爭(zhēng)。只有當(dāng)高成本的概率p=1/5時(shí),進(jìn)入者才選擇進(jìn)入,否則不進(jìn)入。不完全信息靜態(tài)博弈

-貝葉斯納什均衡假定參與人i的類(lèi)型依存活動(dòng)空間和參與人i的效用函數(shù)是共同知識(shí),其他參與人不知道參與人i的類(lèi)型,但知道其戰(zhàn)略空間和支付函數(shù)是如何依賴于他的類(lèi)型的。給定參與人i只知道自己的類(lèi)型而不知道其他參與人的類(lèi)型,參與人i將選擇使自己的效應(yīng)最大化的期望效用。貝葉斯納什均衡:n人不完全信息靜態(tài)博弈的純戰(zhàn)略均衡是一個(gè)類(lèi)型依存戰(zhàn)略組合,其中每個(gè)參與人i在給定自己的類(lèi)型θi和其他參與人類(lèi)型依存戰(zhàn)略的情況下,最大化自己的期望效用。在市場(chǎng)進(jìn)入的例子里,高成本的在位者選擇默許,低成本的在位者選擇斗爭(zhēng),只有當(dāng)如果p>=1/5時(shí),進(jìn)入者才選擇進(jìn)入。不完全信息庫(kù)諾特模型企業(yè)1企業(yè)2參與人:企業(yè)1、企業(yè)2;行動(dòng)順序:同時(shí)行動(dòng)不完全信息:企業(yè)1單位成本c1是共同知識(shí),企業(yè)2的成本可能是c2l或c2h,企業(yè)1只知道c2=c2l的可能性是1/2,這是共同知識(shí)。不完全信息庫(kù)諾特模型qi

:第i個(gè)企業(yè)的產(chǎn)量Ci:代表第i個(gè)企業(yè)的成本假定逆需求函數(shù)為:第i個(gè)企業(yè)的利潤(rùn)函數(shù)為:企業(yè)1企業(yè)2假定a=2,c1=1,c2l=3/4,c2h=5/4。給定企業(yè)2知道企業(yè)1的成本,企業(yè)2將選擇q2最大化利潤(rùn)函數(shù):t=a-c=a-3/4=5/4或t=a-5/4=3/4依賴于企業(yè)2的實(shí)際成本。從最優(yōu)化一階條件可得企業(yè)2的反應(yīng)函數(shù)為:企業(yè)1企業(yè)2不完全信息庫(kù)諾特模型不完全信息庫(kù)諾特模型也就是說(shuō),企業(yè)2的最優(yōu)產(chǎn)量不僅依賴于企業(yè)的產(chǎn)量,而且依賴于自己的成本,令q2l為t=5/4時(shí)企業(yè)2的最優(yōu)產(chǎn)量,q2h為t=3/4時(shí)企業(yè)2的最優(yōu)產(chǎn)量。那么,

q2l=1/2*(5/4-q1);q2h=1/2*(3/4-q1)

企業(yè)1不知道企業(yè)2的真實(shí)成本從而不知道企業(yè)2的最優(yōu)反應(yīng)究竟是q2l還是q2h,因此企業(yè)1將選擇q1最大化下列利潤(rùn)函數(shù):不完全信息庫(kù)諾特模型最優(yōu)化一階條件得企業(yè)1的反應(yīng)函數(shù)為:是企業(yè)1關(guān)于企業(yè)2產(chǎn)量的期望值均衡意味著兩個(gè)反應(yīng)函數(shù)同時(shí)成立,解兩個(gè)反應(yīng)函數(shù)得貝葉斯均衡為:

拍賣(mài)理論簡(jiǎn)介拍賣(mài)或招標(biāo)有兩個(gè)基本功能,一是揭示信息,二是減少代理成本。拍賣(mài)是博弈論重要的分支。著名拍賣(mài)理論專(zhuān)家維克利(Vickrey),由于在拍賣(mài)及在拍賣(mài)基礎(chǔ)上衍生的機(jī)制設(shè)計(jì)理論的一些原創(chuàng)新工作,獲得了1996年的諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)。一級(jí)密封價(jià)格拍賣(mài)(招標(biāo))當(dāng)一件物品對(duì)買(mǎi)者的價(jià)值買(mǎi)者比賣(mài)者更清楚時(shí),賣(mài)者一般不愿意首先提出價(jià)格,而常常采用拍賣(mài)的方式以獲得可能的最高價(jià)格。這種情況在古董和名畫(huà)的交易中特別普遍。一級(jí)密封價(jià)格拍賣(mài)是許多拍賣(mài)方式中的一種。在這種拍賣(mài)中,投標(biāo)人同時(shí)將自己的出價(jià)寫(xiě)下來(lái)裝入一個(gè)信封,密封后交給拍賣(mài)人,拍賣(mài)人打開(kāi)信封,出價(jià)最高者是贏者,按他的出價(jià)支付價(jià)格,拿走被拍賣(mài)的物品。這里,每個(gè)投標(biāo)人的戰(zhàn)略是根據(jù)自己對(duì)該物品的評(píng)價(jià)和對(duì)其他投標(biāo)人評(píng)價(jià)的判斷來(lái)選擇自己的出價(jià),贏者的支付是他對(duì)物品的評(píng)價(jià)減去他的出價(jià),其他投標(biāo)人的支付為零。首先考慮兩個(gè)投標(biāo)人的情況,i=1,2。令bi≥0是投標(biāo)人i的出價(jià),vi為拍賣(mài)物品對(duì)投標(biāo)人i的價(jià)值。假定vi只有i知道(因而vi是投標(biāo)人i的類(lèi)型),但兩個(gè)投標(biāo)人都知道vi獨(dú)立地取自定義在區(qū)間[0,1]上的均勻分布函數(shù)。投標(biāo)人i的支付如下:這里,我們假定如果兩個(gè)投標(biāo)人出價(jià)相同,拍賣(mài)品在兩人之間隨機(jī)的分配。一級(jí)密封價(jià)格拍賣(mài)(招標(biāo))假定投標(biāo)人i的出價(jià)bi(vi)是其價(jià)值vi的嚴(yán)格遞增可微函數(shù)。顯然,bi>1≥vi不可能是最優(yōu)的,因?yàn)闆](méi)有人愿意付出比物品價(jià)值本身更高的價(jià)格。由于博弈的對(duì)稱性,我們可只需考慮對(duì)稱的均衡出價(jià)戰(zhàn)略:b=b*(v)。給定v

和b,投標(biāo)人i的期望支付為:這里Prob(·)代表bj<b的概率,其中bj是投標(biāo)人j的出價(jià)戰(zhàn)略。因?yàn)槌鰞r(jià)戰(zhàn)略是嚴(yán)格遞增的,Prob(bj<b

)=Prob(

bj≤b

)。期望支付的第一項(xiàng)(v-b)是給定贏的情況下投標(biāo)人i的凈所得,第二項(xiàng)Prob(·)是贏的概率。一級(jí)密封價(jià)格拍賣(mài)(招標(biāo))根據(jù)對(duì)稱性,bj=b*(vj),所以這里,φ(b)是b*的逆函數(shù)(即當(dāng)投標(biāo)人選擇b時(shí)他的價(jià)值是φ(b))。因此,投標(biāo)人i面臨的問(wèn)題是:最優(yōu)化的一階條件是:一級(jí)密封價(jià)格拍賣(mài)(招標(biāo))如果b*(·)是投標(biāo)人i的最優(yōu)策略,φ(b)=v。因此,上述微分方程可以寫(xiě)成:解得:就是說(shuō),這個(gè)博弈的貝葉斯均衡是。每個(gè)投標(biāo)人的出價(jià)是其實(shí)際價(jià)值的一半:。在均衡情況下,被拍賣(mài)品歸評(píng)價(jià)最高的投標(biāo)人所有,這從資源配置的角度講是有效率的,但賣(mài)者只得到買(mǎi)者價(jià)值的一半。一級(jí)密封價(jià)格拍賣(mài)(招標(biāo))可以證明,投標(biāo)人出價(jià)與實(shí)際價(jià)值之間的差距隨投標(biāo)人數(shù)的增加而遞減。假定有n個(gè)投標(biāo)人,每個(gè)投標(biāo)人的價(jià)值vi具有獨(dú)立的、相同的定義在[0,1]區(qū)間上的均勻分布,如果評(píng)價(jià)為v的投標(biāo)人i出價(jià)b,他的期望支付函數(shù)為:最優(yōu)化的一階條件為:

或一級(jí)密封價(jià)格拍賣(mài)(招標(biāo))一級(jí)密封價(jià)格拍賣(mài)(招標(biāo))因?yàn)樵诰馇闆r下φ(b)=v,一階條件可以寫(xiě)成:

解上述微分方程得:顯然,b*(v)隨著n的增加而增加。特別地,當(dāng)n→∞時(shí),b*→

v

。就是說(shuō),投標(biāo)人越多,賣(mài)方能得到的價(jià)格就越高;當(dāng)投標(biāo)人趨于無(wú)窮時(shí),賣(mài)方幾乎可以得到買(mǎi)方價(jià)值的全部。所以,讓更多的投標(biāo)人加入競(jìng)標(biāo)是賣(mài)方的利益所在。在公共管理中,政府的采購(gòu)和公共工程招投標(biāo)中通常規(guī)定要進(jìn)行公開(kāi)招標(biāo),并在參加競(jìng)標(biāo)的公司數(shù)目上有下限規(guī)定,其緣故正是如此,因?yàn)楦嗟母?jìng)爭(zhēng)者參加投標(biāo)會(huì)壓低工程報(bào)價(jià),從而使政府開(kāi)支得到一定程度的節(jié)省。二貝葉斯納什均衡應(yīng)用舉例三貝葉斯納什均衡與混合戰(zhàn)略均衡第四章不完全信息靜態(tài)博弈(續(xù))4.3

貝葉斯博弈與混合戰(zhàn)略均衡例抓錢(qián)(grabthedolla)博弈:

每個(gè)參與人有兩個(gè)可能的行動(dòng):投資(“抓”)或不投資,在完全相信博弈中兩人的得益如下:

抓不抓抓-1,-11,0

不抓0,10,0該博弈有唯一的混合策略Nash均衡σ1=σ2=(1/2,1/2)。現(xiàn)在我們稍微擾動(dòng)一下得益矩陣,即對(duì)部分得益賦予一個(gè)小的“隨機(jī)干擾”:

投資不投資

投資-1,-11+θ1,0

不投資0,1+θ20,0

其中θi在[-ε,ε]上均勻地分布。12這是一個(gè)不完全信息的Bayes博弈,如果把“抓錢(qián)”看作投資,不論公司屬于什么類(lèi)型,它們依然各有兩個(gè)策略:投資或不投資。信念密度為:如果當(dāng)θ1超過(guò)某臨界值x時(shí),公司1投資,否則就不投資;同樣,如果θ2超過(guò)某臨界值y時(shí),公司2投資,否則就不投資。X、y∈[-ε,ε]。公司1投資時(shí)的期望利潤(rùn)為:時(shí)公司1投資。類(lèi)似地,只有當(dāng)時(shí)公司2投資。將上面兩式聯(lián)立,解得:x=y=0。于是我們得到對(duì)稱的純策略Bayes均衡解為:公司i當(dāng)θi≥0時(shí)投資,當(dāng)θi<0時(shí)不投資。從以上分析可知,每家公司均以1/2的概率投資,1/2的概率不投資。當(dāng)ε→0時(shí),不完全信息靜態(tài)博弈趨于完全信息靜態(tài)博弈,而完全信息靜態(tài)博弈的混合策略Nash均衡{(1/2,1/2),(1/2,1/2)}可以看作這一系列Bayes博弈均衡的極限。例2性別戰(zhàn)博弈該博弈有兩個(gè)純策策Nash均衡和一個(gè)混合策略Nash均衡,分別為:(戲,戲)、(足球,足球)和{(2/3,1/3),(1/3,2/3)}。戲足球戲2,10,0足球0,01,2女男Ⅰ例2性別戰(zhàn)博弈明顯地,t1應(yīng)有一個(gè)臨界值c1,超過(guò)c1女方就會(huì)選擇“戲”,同樣t2也有一個(gè)臨界值c2,超過(guò)c2時(shí)男方就會(huì)選擇“足球”。對(duì)該博弈稍作擾動(dòng),變?yōu)橄率霾┺模簍1為女方的私人信息,t2為男方的私人信息。設(shè)類(lèi)型t1、t2為來(lái)自[0,x]上均勻分布的獨(dú)立隨機(jī)變量。在該博弈中,行動(dòng)空間A1=A2={戲,足球},類(lèi)型空間T1=T2=[0,x],信念密度為p1(t1)=p2(t2)=1/x戲足球戲2+t1,10,0足球0.01,2+t2男女Ⅱ現(xiàn)在來(lái)尋求Bayes博弈的純策略均衡,在這個(gè)均衡中,女以(x-c1)/x的概率看戲;男以(x-c2)/x的概率看足球。對(duì)給定的x,要求出c1、c2的確定值,使上述策略構(gòu)成純策略Baye

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論