《不完全信息博弈綜述》3400字

上傳人：E*** IP屬地：湖北上傳時(shí)間：2024-12-30 格式：DOCX 頁(yè)數(shù)：7 大?。?6.85KB 積分：10.8 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩2頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

不完全信息博弈綜述目錄TOC\o"1-2"\h\u9274不完全信息博弈綜述 124451不完全信息靜態(tài)博弈 192471.1貝葉斯納什均衡 133831.2貝葉斯納什均衡的例子及應(yīng)用 277343.4不完全信息動(dòng)態(tài)博弈 31不完全信息靜態(tài)博弈在上文介紹的納什均衡、子博弈精煉納什均衡中都有一個(gè)共同的假設(shè)：完全信息，也就是參加博弈的每一個(gè)人都清楚地知道博弈的規(guī)則、博弈的結(jié)構(gòu)、博弈的函數(shù)等。換句話說(shuō)，也就是參與者對(duì)博弈的信息沒有未知。但實(shí)際上博弈論中很多問(wèn)題都是不完全信息的。在1967年之前是不完全信息的問(wèn)題是沒有辦法解決的，數(shù)學(xué)家或者是經(jīng)濟(jì)學(xué)家都是束手無(wú)策的，直到海薩尼提出新的理論。1.1貝葉斯納什均衡海薩尼（JohnCharlesHarsanyi，1920年5月29日-2000年8月9日）是出生于\o"匈牙利"匈牙利布達(dá)佩斯，后定居于\o"美國(guó)"美國(guó)。他是一位著名\o"經(jīng)濟(jì)學(xué)家"經(jīng)濟(jì)學(xué)家，曾獲得1994年\o"諾貝爾獎(jiǎng)獲得者"諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)。曾就讀于法國(guó)里昂大學(xué)，后來(lái)在故鄉(xiāng)的布達(dá)佩斯大學(xué)取得本科、博士學(xué)位。因其在博弈論以及博弈論在經(jīng)濟(jì)學(xué)的應(yīng)用而聞名于世，尤其是他在分析不完全信息靜態(tài)博弈時(shí)，引入相關(guān)的貝葉斯理論，進(jìn)行了高度創(chuàng)新。同時(shí)他在對(duì)博弈論在其他領(lǐng)域的交叉應(yīng)用也做出了極大的貢獻(xiàn)，例如推動(dòng)博弈論在政治、哲學(xué)的應(yīng)用。他于1967年在管理科學(xué)（Management

Science）發(fā)表的論文《Gameswithincompleteinformationplayedby“Bayesian”players，I-III.》使得關(guān)于不完全信息的問(wèn)題變得可以得到處理。他將概率論引入博弈論，同時(shí)在分析不完全信息靜態(tài)博弈時(shí)引入一個(gè)了假設(shè)的參與人：自然。同時(shí)對(duì)自然有一個(gè)附加條件：所有的博弈結(jié)果對(duì)自然都是沒有本質(zhì)區(qū)別的。然后自然首先行動(dòng)，選擇每一個(gè)參與者的類型。然后對(duì)于任意一個(gè)參與者而言，自己的類型已知，其他參與者的類型未知，但知道各種可被選擇的類型的分布函數(shù)。即分布函數(shù)是共同知識(shí)。上述的轉(zhuǎn)化被命名為海薩尼轉(zhuǎn)化，這個(gè)轉(zhuǎn)化將不完全信息靜態(tài)博弈轉(zhuǎn)化為完全但不完美靜態(tài)信息博弈。這里的不完美主要可以解釋為：參與者知道了選擇的分布函數(shù)，但對(duì)于自然的選擇卻一無(wú)所知。1.2貝葉斯納什均衡的例子及應(yīng)用關(guān)于貝葉斯均衡的例子，為了突出不完全信息靜態(tài)博弈和完全信息靜態(tài)博弈的區(qū)別，本文選擇介紹不完全信息下的古諾模型。假設(shè)中除了企業(yè)生產(chǎn)成本發(fā)生變化，其余假設(shè)不變。對(duì)于生產(chǎn)成本的假設(shè)更換為：企業(yè)1的成產(chǎn)成本為，并且是企業(yè)1、企業(yè)2的共同知識(shí)。對(duì)于企業(yè)2的成本，可能有兩種情況或，企業(yè)2知道自己的成本，但企業(yè)1只知道分布，即表2：成本概率表2注：企業(yè)1、2同時(shí)做決策。可以將企業(yè)1、2的利潤(rùn)函數(shù)分布表示為：分別關(guān)于各自產(chǎn)量求導(dǎo)，尋找導(dǎo)數(shù)的零點(diǎn)得：則：對(duì)于企業(yè)2：則對(duì)于企業(yè)2的產(chǎn)量，企業(yè)1認(rèn)為的最優(yōu)情況：為了方便對(duì)比不妨賦值,則有：3.4不完全信息動(dòng)態(tài)博弈在上文中，我們總共介紹了完全信息靜態(tài)博弈、完全信息動(dòng)態(tài)博弈、不完全信息靜態(tài)博弈。但實(shí)際上在生活中面對(duì)的情況是不完全信息，同時(shí)行動(dòng)又有先后順序的，或者在后先動(dòng)者也是可以觀察先行動(dòng)者，來(lái)推斷他的喜好。這也是本文想介紹的最后一個(gè)博弈論模型：不完全信息動(dòng)態(tài)博弈。對(duì)于這個(gè)問(wèn)題許多博弈論學(xué)家提出解決方法，本文主要對(duì)精煉貝葉斯均衡進(jìn)行介紹。3.4.1顫抖手均衡顫抖手均衡是由澤爾騰提出的，前文已經(jīng)對(duì)澤爾騰做過(guò)介紹，這里就不進(jìn)行介紹。他是在1975年于著名的論文《AReexaminationofthePerfectnessConceptforEquilibriumPointsinExtensiveGames》提出"顫抖手均衡"(tremblinghandequilibrium)的概念，給出了如何處理動(dòng)態(tài)博弈中有限理性的方法。顫抖手均衡主要的思想是：對(duì)于一個(gè)保持穩(wěn)定的納什均衡是可能會(huì)遭受某些極其微小的擾動(dòng)，這些微小的擾動(dòng)可能來(lái)自于人決策行動(dòng)時(shí)出現(xiàn)的錯(cuò)誤。如果出現(xiàn)這種錯(cuò)誤的概率趨近0，而且這個(gè)過(guò)程中的均衡序列收斂，那么均衡序列的極限就是顫抖手均衡。換句話就是在納什均衡的下，博弈中有一個(gè)人手抖了一下，選擇的是次優(yōu)的策略，如果該納什均衡是顫抖手均衡，則博弈參與者會(huì)回到該均衡，而不是偏向另一個(gè)納什均衡。下面我們簡(jiǎn)要介紹一個(gè)關(guān)于顫抖手均衡的例子：假設(shè)博弈者1、2的支付矩陣如表3：表3易得該博弈具有兩個(gè)納什均衡：（U,L）、（D,R）。當(dāng)博弈處于（U,L）時(shí)，如果博弈者2手抖犯錯(cuò)，將策略換為D，則其收益變?yōu)?。對(duì)于博弈者1來(lái)說(shuō)，收益變?yōu)?，這是他是沒有更換策略的積極性的，若更換為R，收益沒有發(fā)生變化，還可能會(huì)遭遇博弈者2更換策略，收益變?yōu)?。但是對(duì)于博弈者2而言，更換策略的動(dòng)機(jī)是易見的，只要更換策略為U，收益就會(huì)增加。然后博弈又回到了最初的狀態(tài)（U,L），這就是顫抖手均衡。但是如果博弈處于（D,R）,博弈者1手抖犯錯(cuò)，將策略換為L(zhǎng)，對(duì)于自身收益造成影響，但是博弈者2的收益變?yōu)?，博弈者只有調(diào)整策略為U，才可增加收益。均衡變成（U,L）,無(wú)法回到（D,R），則（D,R）不是一個(gè)納什均衡。3.4.2序貫均衡克雷普斯（David

M.Kreps，1950-）是美國(guó)斯坦福大學(xué)的著名教授，他是一位經(jīng)濟(jì)學(xué)家。他出生于美國(guó)紐約，曾就讀于達(dá)特茅斯學(xué)院、斯坦福大學(xué)等高校。在1989年榮獲John

Bates

Clark

Medal，也在2018年被授予John

J.Carty

Award。他以對(duì)動(dòng)態(tài)選擇模型和非合作博弈論的研究而聞名。威爾遜（Robert

B.Wilson，1937年-），出生于內(nèi)布拉斯加州，博士就讀于哈佛大學(xué)，后一直執(zhí)教于斯坦福大學(xué)。在1994年獲選為美國(guó)國(guó)家科學(xué)院成員，后在2020年獲得諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)。威爾遜以其對(duì)管理科學(xué)和商業(yè)經(jīng)濟(jì)學(xué)的貢獻(xiàn)而聞名。他與斯坦福商學(xué)院的其他數(shù)理經(jīng)濟(jì)學(xué)家一起，使用非合作博弈理論幫助重新構(gòu)造了產(chǎn)業(yè)組織經(jīng)濟(jì)學(xué)和組織理論。他對(duì)非線性定價(jià)的研究影響了大公司的政策，尤其是在能源工業(yè)。序貫均衡提出于克瑞普斯和威爾遜共同發(fā)表的論文《SequentialEquilibrium》中，在這篇論文中，他們定義了序貫均衡，序貫均衡是一個(gè)行為策略—信念的組合。這要求：首先，策略必須是“序貫理性”，換句話說(shuō)，可以理解為在后續(xù)出現(xiàn)的任意一個(gè)貝葉斯博弈當(dāng)作構(gòu)成一個(gè)貝葉斯納什均衡。其次，信念的一致性，一列完全混合策略生成的信念的極限是這個(gè)信念。下面我們簡(jiǎn)要介紹一個(gè)關(guān)于序貫均衡的例子：圖3圖3是博弈者1、2的博弈過(guò)程樹形圖。博弈者1先做出選擇，選擇有A、B、C，博弈者2再做出選擇，選擇有D、E，虛線表示博弈者2做出選擇時(shí)，不知道博弈者1做出了何種選擇，也是博弈者1的選擇不是共同知識(shí)。很容易可得到，博弈者1的最優(yōu)策略是選擇A，得到2的收益，博弈直接結(jié)束。但博弈的過(guò)程中出現(xiàn)錯(cuò)誤，博弈者1未選擇A，然后博弈者2就需要開始考慮選擇何種策略。博弈者2知道博弈者1在B、C之間做出了選擇，但不知道何種選擇。如果博弈者1選擇B，博弈者2的最優(yōu)策略為E；如果博弈者1選擇C，博弈者2的最優(yōu)策略為D。如何做出選擇就要依靠博弈者2認(rèn)為博弈者1做出對(duì)應(yīng)選擇的概率為多少。如上圖，假設(shè)博弈者1選擇B的概率為，則選擇C的概率為可計(jì)算得到，博弈者2做出選擇對(duì)應(yīng)收益的數(shù)學(xué)期望如下：根據(jù)收益的期望得到，當(dāng)，博弈者2應(yīng)選擇E;,應(yīng)選擇D。等于時(shí)都可以。3.4.3精煉貝葉斯納什均衡精煉貝葉斯納什均衡（prefect

Bayesian

equilibrium）的主要成果是由弗登伯格和泰勒爾提出的。讓·弗登伯格（Drew

Fudenberg

,1957年—）出生于美國(guó)紐約，是美國(guó)哈佛大學(xué)經(jīng)濟(jì)系的著名教授。1981年，他取得了麻省理工學(xué)院的經(jīng)濟(jì)學(xué)博士學(xué)位。之后，他在博弈論和動(dòng)態(tài)經(jīng)濟(jì)學(xué)方面做出了巨大貢獻(xiàn)。曾經(jīng)在加州大學(xué)伯克利分校、麻省理工學(xué)院、斯坦福大學(xué)和法國(guó)圖盧茲大學(xué)任教。他的廣泛研究涵蓋了博弈論的許多方面，包括均衡理論，博弈學(xué)習(xí)，進(jìn)化博弈論以及在其他領(lǐng)域的許多應(yīng)用。富登堡還是最早將博弈論分析應(yīng)用到產(chǎn)業(yè)組織，討價(jià)還價(jià)理論和契約理論中的人之一。讓·泰勒爾（Jean

Tirole，1953年—）是法國(guó)圖盧茲大學(xué)的著名產(chǎn)業(yè)經(jīng)濟(jì)學(xué)教授，同時(shí)他也是巴黎大學(xué)、麻省理工學(xué)院的兼職教授，并且曾經(jīng)在哈佛大學(xué)、斯坦福大學(xué)擔(dān)任客座教授。他專注于產(chǎn)業(yè)組織、博弈論、銀行、金融等各種領(lǐng)域。2014年，他因?qū)κ袌?chǎng)力量和監(jiān)管的分析而被授予諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)。1978年，在獲得巴黎第九大學(xué)應(yīng)用數(shù)學(xué)博士學(xué)位后，對(duì)經(jīng)濟(jì)學(xué)興趣油生，他來(lái)到著名的美國(guó)麻省理工學(xué)院繼續(xù)深造，并于1981年獲得經(jīng)濟(jì)學(xué)博士學(xué)位。精煉貝葉斯均衡出現(xiàn)在弗登伯格和泰勒爾于1991年年共同撰寫的《gametheory》中。在本書中詳細(xì)介紹了精煉貝葉斯均衡，精煉貝葉斯均衡的關(guān)鍵點(diǎn)是博弈的參與者可通過(guò)觀察其他參與者的行為來(lái)改變自己關(guān)于后面的參與者類型的主觀概率，并由此決定自己的策略。這個(gè)修正的過(guò)程就被稱之為貝葉斯規(guī)則。從數(shù)學(xué)觀點(diǎn)來(lái)說(shuō)，精煉貝葉斯均衡就是一個(gè)關(guān)于映射的不動(dòng)點(diǎn)。具體的理解可以理解為每一個(gè)博弈的參與者都預(yù)先假設(shè)其他博弈參與者是均衡策略。換句話說(shuō)就是：它

人人文庫(kù)> 全部分類> 行業(yè)資料 > 工業(yè)設(shè)計(jì)

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

《不完全信息博弈綜述》3400字

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

《不完全信息博弈綜述》3400字

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔