第二講完全信息

上傳人：2*** IP屬地：湖北上傳時(shí)間：2023-02-05 格式：PPT 頁(yè)數(shù)：43 大?。?6KB 積分：30 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩38頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶(hù)提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第二講完全信息靜態(tài)博弈1博弈的標(biāo)準(zhǔn)式或策略式2占優(yōu)策略均衡3重復(fù)剔除劣策略4納什均衡1博弈的標(biāo)準(zhǔn)式或策略式

博弈的要素包括博弈方、策略空間、博弈的次序、博弈方的支付、博弈方的信息掌握程度和理性基礎(chǔ)。其中博弈的次序、信息和理性基礎(chǔ)是構(gòu)成博弈前提，而要表示一個(gè)博弈，只要表出各博弈方及其策略空間和得益就可以了。即：(1)博弈參與者集合：A=｛1，2，…，n｝(2)策略空間：Si，i=1，2，…，n.(3)支付函數(shù)：ui(s1,s2,…，sn)定義1：如果一個(gè)博弈有n個(gè)博弈方，其策略空間分別為S1，S2，…，Sn,支付函數(shù)分別為：u1，u2，…，un，則此博弈的標(biāo)準(zhǔn)式表示為：G=｛S1，S2，…，Sn,；u1，u2，…，un｝標(biāo)準(zhǔn)式主要用來(lái)表示靜態(tài)博弈。這種博弈中，參與者是同時(shí)選擇策略的，但只要每一參與者在行動(dòng)時(shí)不知道其他參與者的選擇就可以了。2占優(yōu)策略均衡參與者選擇策略的過(guò)程。選擇方法無(wú)非兩種：選優(yōu)和去劣。一般說(shuō)來(lái)，每個(gè)參與者的收益都是所有參與者所選戰(zhàn)略的函數(shù)，因此，每個(gè)參與者選擇最優(yōu)策略時(shí)必須考慮其他參與者的選擇。但有些特殊的博弈中，某些參與者可能不需要考慮其他參與者的選擇，因?yàn)闊o(wú)論其他參與者如何選擇，他有唯一的最優(yōu)策略，稱(chēng)為占優(yōu)策略。對(duì)于任一向量s=s(s1,…,sn),將向量(s1,…,si-1，si+1,…，sn)記作s-i，即s中與參與人i無(wú)關(guān)的部分。參與人i之外所有其他參與人的策略組合參與人i對(duì)于其他參與人所選擇的策略s-i的最佳應(yīng)對(duì)是使其獲得最大支付的策略si即ui(si*,s-i)≥ui(si′,s-i)對(duì)于任何si′≠si*如果沒(méi)有其他策略是同樣好的，那么這一最佳應(yīng)對(duì)就是強(qiáng)最佳應(yīng)對(duì)。

第一個(gè)重要的均衡概念就是優(yōu)勢(shì)策略均衡（dominantstrategyequilibrium）。如果無(wú)論其他參與人選擇什么策略，策略si*都是參與人i的強(qiáng)最佳應(yīng)對(duì)，那么si*就稱(chēng)為優(yōu)勢(shì)策略。這意味著無(wú)論別人選擇什么策略，si*都使參與人i的支付最大化。從數(shù)學(xué)上講ui(si*,s-i)≥ui(si′,s-i)對(duì)于任何si′≠si*對(duì)于參與人i而言較差的策略稱(chēng)為劣式策略（dominantedstrategy）。優(yōu)勢(shì)策略均衡是由每個(gè)參與人優(yōu)勢(shì)策略所組成的策略組合(s1*，s2*，…，sn*)。優(yōu)勢(shì)策略只要求每個(gè)參與者是理性的，而不要求每個(gè)參與者知道其他參與者是理性的（即不要求“理性”是共同知識(shí)）囚徒困境舉例囚徒困境列抵賴(lài)坦白抵賴(lài)（-1，-1）（-10，0）列坦白（0，-10）（-8，-8）每一個(gè)參與人都有一個(gè)優(yōu)勢(shì)策略。以行先生為例，他并不知道列先生選擇的是什么行動(dòng)。但不管列先生選擇什么，行先生的優(yōu)勢(shì)策略都是坦白。由于支付矩陣是對(duì)稱(chēng)的，列先生也是如此。所以?xún)?yōu)勢(shì)策略均衡為（坦白，坦白），均衡支付為（-8，-8）囚徒困境看起來(lái)既荒謬又不現(xiàn)實(shí)（雖然這是對(duì)付犯罪的標(biāo)準(zhǔn)工具之一）。如果你實(shí)在不能理解，應(yīng)該意識(shí)到，模型的主要用處通常是導(dǎo)出荒謬的結(jié)果，引致困惑。困惑是你的模型與你設(shè)想的有所不同的標(biāo)志（你遺漏了對(duì)于所期望但卻未得到的結(jié)果來(lái)說(shuō)必不可少的東西）。此時(shí)要么是你的最初想法有問(wèn)題，要么是你的模型有錯(cuò)誤發(fā)現(xiàn)此類(lèi)錯(cuò)誤是建模過(guò)程中的收獲。這種收獲雖然痛苦，但卻是真實(shí)的有益的。拒絕接受出乎意料的結(jié)論就是拒絕邏輯。3重復(fù)剔除劣策略——“俾斯麥海戰(zhàn)”日本海軍上將木村要將日本陸軍運(yùn)往新幾內(nèi)亞，有兩條航線：較短的北線和較長(zhǎng)的南線。美國(guó)海軍上將肯尼則必須決定將其飛機(jī)派往南線還是北線進(jìn)行搜索轟炸。俾斯麥海戰(zhàn)木村北南北（2，-2）（2，-2）肯尼南（1，-1）（3，-3）兩個(gè)參與人都沒(méi)有優(yōu)勢(shì)策略。但使用弱優(yōu)勢(shì)的概念，可以找到一個(gè)較為合理的均衡。對(duì)參與人i的策略si′來(lái)說(shuō)，如果存在有可能比si′好而絕不會(huì)比si′差的另一策略si‘’，即在某些策略組合下si‘’可帶來(lái)更高支付而絕不會(huì)產(chǎn)生更低的支付，那么我們說(shuō)si′弱劣于si‘’。從數(shù)學(xué)上講，若存在這樣的si‘’，對(duì)于任何s-iui(si‘’,s-i)≥ui(si′,s-i)，對(duì)于某一s-i，則說(shuō)si′弱劣于si‘’。弱優(yōu)勢(shì)策略均衡（weakdomimantstrategyequilibrium）定義為在剔除了每個(gè)參與人的全部弱劣勢(shì)策略后得到的一個(gè)策略組合。但是肯尼沒(méi)有任一策略是弱劣的。于是要求定義一個(gè)重復(fù)剔除優(yōu)勢(shì)均衡。我們首先從某一個(gè)參與人的策略集里剔除一個(gè)弱劣策略，再重新考察各個(gè)參與人剩下的策略中哪些是弱劣的并剔除其中之一，繼續(xù)這一過(guò)程直到每一個(gè)參與人都僅剩下一個(gè)策略。這樣得到的策略組合就稱(chēng)為這重復(fù)剔除優(yōu)勢(shì)均衡（iterateddominanceequilibrium）將這一均衡概念應(yīng)用于俾斯麥海戰(zhàn)，則意味著肯尼斷定木村會(huì)選擇策略北，因?yàn)樗侨鮾?yōu)勢(shì)的。木村北北（2，-2）肯尼南（1，-1）去掉了一列的情況下，肯尼就有一個(gè)強(qiáng)優(yōu)勢(shì)策略：選擇北。（北，北）就是一個(gè)重復(fù)剔除優(yōu)勢(shì)均衡，這也是1943年真實(shí)發(fā)生的情況。優(yōu)勢(shì)策略均衡和重復(fù)剔除策略均衡對(duì)參與者的理性要求是不同的。前者只要每個(gè)參與者自己是理性的就可以了，而后者要求理性是參與者的共同知識(shí)，即，參與者不僅自己是理性的，還需要其他參與者也是理性的，并且還假定所有參與者都知道其他參與者是理性的。重復(fù)剔除策略均衡是建立在理性參與者不會(huì)選擇嚴(yán)格劣策略這一合情推理之上的，但這一方法和嚴(yán)格占優(yōu)策略均衡一樣，有時(shí)候找不到嚴(yán)格劣策略。所以，這兩種解法雖然簡(jiǎn)單，但有時(shí)不奏效。4納什均衡對(duì)于大多數(shù)的博弈而言，重復(fù)剔除優(yōu)勢(shì)均衡也是不存在的，于是引入納什均衡（NashEquilibrium）。在一個(gè)策略組合si*，在其他參與人都不會(huì)改變已有策略的條件下，如果沒(méi)有參與人有激勵(lì)去改變自身的策略，則稱(chēng)策略組合si*為納什均衡，數(shù)學(xué)表達(dá)為，ui(si*,s-i*)≥ui(si′,s-i*)對(duì)于任何si′≠si*智豬博弈（boxedpigs）小豬按鍵等待按鍵（5，1）→（4，4）大豬↓↑等待（9，-1）→（0，0）策略組合為（按鍵，等待）是一個(gè)納什均衡。理解納什均衡就是構(gòu)造一個(gè)策略組合，然后看看每個(gè)參與人的策略是否是對(duì)其他參與人策略的最好應(yīng)對(duì)。如果大豬選擇了按鍵，那么小豬會(huì)選擇等待。反過(guò)來(lái)，如果小豬選擇了等待，那么大豬選擇按鍵，這就是印證了（按鍵，等待）確實(shí)是一個(gè)納什均衡。乙左中右上甲中下0，44，05，34，03，50，43，56，65，3性別大戰(zhàn)妻子韓劇球賽韓劇2，10，0丈夫球賽0，01，2不存在重復(fù)剔除優(yōu)勢(shì)均衡?？辞蛸惡涂错n劇都是納什均衡，但分別是針對(duì)不同均衡而言。若這對(duì)戀人事先不通氣，則可能出現(xiàn)誤會(huì)。性別戰(zhàn)中，任一納什均衡都是帕累托有效的，其他任一策略都不可能在不降低其他參與人支付的條件下提高另一參與人的支付，即不存在帕累托改進(jìn)。但囚徒困境博弈中納什均衡并不是帕累托最優(yōu)的。斗雞博弈妻子進(jìn)退進(jìn)-3，-32，0丈夫退0，20，0市場(chǎng)進(jìn)入阻撓在位者默許斗爭(zhēng)進(jìn)入40，50-10，0進(jìn)入者不進(jìn)入0，3000，300恩愛(ài)夫妻博弈妻子活著死了活著2，2-6，0丈夫死了0，-60，0仇恨夫妻博弈妻子活著死了活著0，06，0丈夫死了0，60，0同優(yōu)勢(shì)策略均衡一樣,納什均衡也有強(qiáng)弱之分,要定義一個(gè)強(qiáng)納什均衡,只要不等式成立嚴(yán)格成立。也就是說(shuō)，沒(méi)有參與人會(huì)對(duì)是選擇均衡策略還是選擇其他策略持兩可的態(tài)度。每一個(gè)優(yōu)勢(shì)策略均衡都是納什均衡，但并非每一個(gè)納什均衡都是優(yōu)勢(shì)策略均衡。如果某一策略是優(yōu)勢(shì)的，那么它對(duì)于其他參與人選擇的任何策略都是最佳應(yīng)對(duì)從數(shù)學(xué)上講（ui(si*,s-i)≥ui(si′,s-i)對(duì)于任何si′≠si*），這自然也包括其他參與人的均衡策略。如果某一策略是納什均衡的組成部分，那么它只需要對(duì)其他參與人的均衡策略而言是最佳應(yīng)對(duì)即可。（ui(si*,s-i*)≥ui(si′,s-i*)對(duì)于任何si′≠si*）為了說(shuō)明納什均衡的這一特點(diǎn)，構(gòu)造囚徒困境的變形。變形的囚徒困境列抵賴(lài)坦白抵賴(lài)（0，0）（-10，0）列坦白（0，-10）（-8，-8）變形的囚徒困境沒(méi)有強(qiáng)優(yōu)勢(shì)策略均衡，它僅有一個(gè)弱優(yōu)勢(shì)策略均衡，坦白仍是一個(gè)弱優(yōu)勢(shì)策略。（坦白，坦白）是一個(gè)重復(fù)剔除均衡策略，也是一個(gè)強(qiáng)納什均衡。但是還存在另一個(gè)納什均衡：（抵賴(lài)，抵賴(lài)）。這是一個(gè)弱納什均衡。雖然這一均衡是弱的而另一均衡是強(qiáng)的，但（抵賴(lài)，抵賴(lài)）仍然有其自身的優(yōu)勢(shì)：它的結(jié)果具有帕累托優(yōu)勢(shì)，因?yàn)椋?，0）中二者的支付均大于（-8，-8）。納什均衡的應(yīng)用古諾（Cournot)的雙寡頭壟斷模型設(shè)q1,q2分別表示企業(yè)1，2生產(chǎn)的同樣產(chǎn)品的產(chǎn)量，市場(chǎng)中該產(chǎn)品的總供給Q=q1+q2,令P(Q)=a-Q表示市場(chǎng)出清價(jià)格（當(dāng)Q＞a時(shí)P（Q）=0），設(shè)企業(yè)i生產(chǎn)qi總成本為cqi,即不考慮固定成本，邊際成本為常數(shù)c，并且兩個(gè)企業(yè)同時(shí)進(jìn)行產(chǎn)量決策。首先把問(wèn)題轉(zhuǎn)化為標(biāo)準(zhǔn)式博弈。博弈參與者：企業(yè)1、2；博弈參與者的策略空間：設(shè)產(chǎn)量是連續(xù)變化的，則S1=S2=[0,+∞）。（其實(shí)不會(huì)產(chǎn)生qi＞a的情況）把各自的收益表示成自己和對(duì)方所選策略的函數(shù)：U1(q1,q2)=q1[P(q1+q2)-c]=q1[a-(q1+q2)-c]U2(q1,q2)=q2[P(q1+q2)-c]=q2[a-(q1+q2)-c]設(shè)（q1*,q2*)是納什均衡，則由（NE)得：u1（q1*,q2*)≥u1（q1,q2*)u2（q1*,q2*)≥u2（q1*

,q2)對(duì)所有qi∈Si=[0，+∞）都成立。分別求導(dǎo)得出如果（q1*,q2*)是納什均衡則必須解得這一均衡在直觀上很好理解。每一企業(yè)都想成為壟斷者，它會(huì)選擇qi使ui(qi,0)最大化假設(shè)a=8,c=2.惟一一組解為q1*=q2*=2，策略組合（2，2）是惟一納什均衡。市場(chǎng)總產(chǎn)量為4，市場(chǎng)價(jià)格為4，雙方支付（利潤(rùn)）均為2×（8－4）－2×2=4，利潤(rùn)總和為8。如果從兩廠商總利潤(rùn)最大化角度來(lái)看，U=Q(8－Q)－2Q=6Q－Q×Q，最大產(chǎn)量為3，最大總利潤(rùn)為9。古諾模型的簡(jiǎn)單模型：兩寡頭間的囚徒困境博弈。寡頭2不突破突破不突破4.5，4.53.75，5寡頭1突破5，3.754，4團(tuán)隊(duì)中的道德風(fēng)險(xiǎn)模型假設(shè)一個(gè)團(tuán)隊(duì)中有兩個(gè)工人，每個(gè)人可以工作（si=1）或偷懶（si=0），團(tuán)隊(duì)總產(chǎn)出是4（s1+s2)，并在兩個(gè)工人中平均分配。每個(gè)人工作要承擔(dān)私人成本3，偷懶時(shí)私人成本為0。工人2

人人文庫(kù)> 全部分類(lèi)> 教育資料 > 備課教案

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

第二講完全信息

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

第二講 完全信息

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔

第二講完全信息