博弈論教材課件匯總完整版ppt全套課件最全教學(xué)教程整本書(shū)電子教案全書(shū)教案合集最新課件匯編_第1頁(yè)
博弈論教材課件匯總完整版ppt全套課件最全教學(xué)教程整本書(shū)電子教案全書(shū)教案合集最新課件匯編_第2頁(yè)
博弈論教材課件匯總完整版ppt全套課件最全教學(xué)教程整本書(shū)電子教案全書(shū)教案合集最新課件匯編_第3頁(yè)
博弈論教材課件匯總完整版ppt全套課件最全教學(xué)教程整本書(shū)電子教案全書(shū)教案合集最新課件匯編_第4頁(yè)
博弈論教材課件匯總完整版ppt全套課件最全教學(xué)教程整本書(shū)電子教案全書(shū)教案合集最新課件匯編_第5頁(yè)
已閱讀5頁(yè),還剩33頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、博 弈 論序 言在序言中,我們主要是對(duì)整個(gè)教材做一個(gè)總體上的介紹,并且提出有關(guān)的注意事項(xiàng)。一、該教材的組織安排和結(jié)構(gòu)。二、該教材所具有的特點(diǎn)。三、學(xué)習(xí)博弈論所需要的幾個(gè)條件。下面我們就分別加以介紹。第一章 導(dǎo)論第二章 靜態(tài)博弈第三章 納什均衡解第四章 動(dòng)態(tài)博弈第五章 重復(fù)博弈第六章 貝葉斯博弈第七章 非完全信息動(dòng)態(tài)博弈第八章 若干擴(kuò)展博弈論的組織安排和結(jié)構(gòu)教材的特點(diǎn)在保證理論教全面的情況下,強(qiáng)調(diào)運(yùn)用。邊學(xué)邊做,習(xí)題都被放在文章的正文中,成為正文的一個(gè)有機(jī)組成部分,通過(guò)做題來(lái)理解理論要比單純的學(xué)習(xí)要有有效的多,而且也與課程追求運(yùn)用的目的相吻合。對(duì)數(shù)學(xué)的要求都很基礎(chǔ),相信即使對(duì)數(shù)學(xué)了解不多的讀者也

2、能很好的理解本書(shū)內(nèi)容。深入淺出也是本書(shū)的一大特點(diǎn)。給讀者的幾點(diǎn)建議盡管在書(shū)中盡量不用數(shù)學(xué)和盡量用簡(jiǎn)單的數(shù)學(xué),但仍要求讀者對(duì)求導(dǎo)數(shù)較為熟悉,同時(shí)具備基本的概率論知識(shí)。學(xué)習(xí)是一個(gè)痛并快樂(lè)的事,有時(shí)可能面對(duì)一個(gè)問(wèn)題百思不得其解,但一旦破解將會(huì)豁然開(kāi)朗,喜悅之情悠然而生,該書(shū)的目的就是希望每位讀者都能夠體會(huì)到這種樂(lè)趣,但最終還是取決于讀者自身。好記性不如爛筆頭,多寫(xiě)多記,甚至進(jìn)一步查閱文獻(xiàn)都是學(xué)好博弈論的有效方法,也是深造的最有效途徑。第一章 導(dǎo)言第一節(jié) 什么是博弈論第二節(jié) 博弈論的經(jīng)濟(jì)學(xué)淵源第三節(jié) 博弈論革命第四節(jié) 博弈論要點(diǎn) 第一節(jié) 什么是博弈論我們首先看幾個(gè)例子。例1.1 石頭、剪刀、布豬 八

3、戒 石 頭 剪 刀 布孫悟空石頭未定,未定休息,找水找水,休息剪刀找水,休息未定,未定休息,找水布休息,找水找水,休息未定,未定例1.2 諾曼底登陸德 軍加來(lái)設(shè)防諾曼底設(shè)防盟 軍加來(lái)登陸失敗,成功成功,失敗諾曼底登陸成功,失敗失敗,成功例1.3 鴿派和鷹派美 國(guó)鴿派政策鷹派政策蘇聯(lián)鴿派政策0,01,+1鷹派政策+1,1 , 從上面的三個(gè)例子中,我們可以概括出一個(gè)博弈所具有的共同特征:利益相沖突的參與者、參與者總是根據(jù)對(duì)手可能采取的策略來(lái)采取相應(yīng)的行動(dòng)-相互依存的策略和行動(dòng)、參與者總是追求自身利益最大化。根據(jù)這些共同特征我們就能給出一個(gè)博弈的定義,只要符合這個(gè)定義,就可以將其納入到博弈論的研究范

4、疇之中。定義1.1 博弈是指利益存在沖突的決策主體(個(gè)人,企業(yè),集團(tuán),政黨,國(guó)家等等)在相互對(duì)抗(或合作)中,對(duì)抗雙方(或多方)相互依存的一系列策略和行動(dòng)的過(guò)程集合。 在定義1.1中,我們最需要注意的就是策略的相互依存性。對(duì)于策略的相互依存性,傳統(tǒng)的經(jīng)濟(jì)學(xué)不是不想研究,而是缺乏有效的工具。從這個(gè)意義上而言,博弈論正是為了解決這一問(wèn)題而產(chǎn)生的。也是從這個(gè)意義上講,我們有了博弈論的定義。定義1.2 博弈論是專(zhuān)門(mén)研究博弈如何出現(xiàn)均衡的規(guī)律的學(xué)科。 正是由于博弈論將博弈如何出現(xiàn)均衡列為核心,因而博弈論對(duì)于各門(mén)社會(huì)科學(xué)而言,就具有了方法論意義,成為各門(mén)學(xué)科的有力分析工具。第二節(jié) 博弈論的經(jīng)濟(jì)學(xué)淵源 博弈

5、論與經(jīng)濟(jì)學(xué)存在著不解之緣,主要是由于下面幾個(gè)方面:(1)博弈論的核心問(wèn)題是經(jīng)濟(jì)學(xué)最早提出并加以系統(tǒng)研究的。(2)博弈論理論發(fā)展主要是經(jīng)濟(jì)學(xué)的需要推動(dòng)的,也主要是由經(jīng)濟(jì)學(xué)家加以發(fā)展。(3)博弈論中的主要問(wèn)題基本上都涉及到經(jīng)濟(jì)利益沖突問(wèn)題。一、模型 所謂模型通俗地說(shuō)就是一個(gè)對(duì)某種現(xiàn)象進(jìn)行說(shuō)明與解釋、甚或推演的邏輯體系。模型的形式多種多樣,并不一定必須是數(shù)學(xué)建立起來(lái)的才能稱(chēng)為模型。一個(gè)模型通常有三個(gè)最基本的部分組成: 理論假設(shè) 邏輯推理 理論假說(shuō)評(píng)判一個(gè)模型是好是壞關(guān)鍵取決于實(shí)踐檢驗(yàn),但由于模型總是簡(jiǎn)化的,因而檢驗(yàn)并不像我們想象的那么簡(jiǎn)單。實(shí)際上,當(dāng)我們觀察到一個(gè)現(xiàn)象,將其抽象為一個(gè)模型的過(guò)程實(shí)際上

6、就是一個(gè)簡(jiǎn)化的過(guò)程,簡(jiǎn)化不同可能得出完全矛盾的結(jié)論,真理與謬誤相差只不過(guò)是毫厘之間,所謂既科學(xué)也是藝術(shù)就是這個(gè)道理。二、博弈論的經(jīng)濟(jì)學(xué)淵源 經(jīng)濟(jì)學(xué)的一些思想為博弈論提供了基礎(chǔ),其中最重要的就是所謂的“理性人”。 描述理性人的工具就是所謂的理性偏好。為了方便,我們又用效用函數(shù)(在博弈論中稱(chēng)為收益函數(shù))來(lái)表示偏好。 構(gòu)成博弈論基礎(chǔ)的一個(gè)重要的經(jīng)濟(jì)定理就是所謂的理性選擇原理:如果決策主體的偏好是理性的,那么(有限)選擇集中就一定存在最優(yōu)選擇,這個(gè)選擇可能是唯一的,也可能是多個(gè)。需要注意的幾個(gè)問(wèn)題:(1)表達(dá)同一個(gè)偏好的收益函數(shù)不唯一,但在單調(diào)變換下卻是唯一的。(2)理性并不等同于自私自利。(3)理性

7、選擇理論是有局限性的。三、博弈論革命 所謂革命是指博弈論對(duì)經(jīng)濟(jì)學(xué)(其他社會(huì)科學(xué))研究產(chǎn)生了深遠(yuǎn)的影響。傳統(tǒng)經(jīng)濟(jì)學(xué)失靈的五個(gè)領(lǐng)域正好體現(xiàn)著博弈論的價(jià)值和意義:(1)非完全競(jìng)爭(zhēng);(2)外在性;(3)公共產(chǎn)品;(4)逆向選擇;(5)道德風(fēng)險(xiǎn)。在其他社會(huì)科學(xué)中,博弈論同樣可以用來(lái)解釋各種現(xiàn)象,比如政黨,利益集團(tuán),甚或人類(lèi)的基本制度。比如奧爾森集體行動(dòng)的邏輯,羅爾斯正義論。在自然科學(xué)中,博弈論被運(yùn)用在人工智能,物種演化等方面。所以稱(chēng)博弈論革命并不為過(guò)。第四節(jié) 博弈論要點(diǎn)一、博弈的四個(gè)要素:(1)參與者,博弈中的決策主體。(2)博弈規(guī)則,對(duì)博弈如何進(jìn)行做出的規(guī)定。(3)結(jié)果,博弈最后出現(xiàn)的情形。(4)收益

8、,就是參與者對(duì)結(jié)果的偏好。二、博弈的基本式 如何將博弈表示成一種便于研究和分析的形式顯然是很重要的。如果用參與者、策略和收益函數(shù)來(lái)(科學(xué))描述一個(gè)博弈,就稱(chēng)為博弈表達(dá)的基本式。三、博弈的擴(kuò)展式 博弈的擴(kuò)展式就是非常詳細(xì)地描繪出一個(gè)博弈的參與者、策略、行動(dòng)順序以及行動(dòng)時(shí)擁有的信息、可能的結(jié)果和收益等細(xì)節(jié)就稱(chēng)為博弈的擴(kuò)展式。四、信息和順序 完全信息和非完全信息,完全和非完全判斷的標(biāo)準(zhǔn)就是如果有些信息只有一部分參與者知道,并不是所有的信息都是公共信息,那么博弈就是非完全信息博弈。 靜態(tài)博弈和動(dòng)態(tài)博弈,靜態(tài)和動(dòng)態(tài)的區(qū)別并不在于時(shí)間上是否同時(shí),而是在信息上的一種同時(shí)行動(dòng)。公共知識(shí)與一般信息的區(qū)別。第二章

9、 完全信息靜態(tài)博弈本章要點(diǎn)什么是博弈的基本式。如何將一個(gè)博弈用基本式加以概括。什么是納什均衡。純策略和混合策略納什均衡的證明。一、博弈的基本式首先我們需要明確什么是完全信息和靜態(tài)博弈,完全信息是指每個(gè)參與者的收益函數(shù)都是公共信息,而靜態(tài)博弈則指每個(gè)參與者都同時(shí)行動(dòng),隨后博弈結(jié)束。理解同時(shí)行動(dòng)的關(guān)鍵在于每一個(gè)參與者在行動(dòng)時(shí)并不了解其他參與者的行動(dòng)。完全信息靜態(tài)博弈是最簡(jiǎn)單的博弈。通常描述它只需要一些基本的要素就可以了。定義2.1 博弈表達(dá)的基本式(或策略式)由博弈的參與者N,策略空間S和收益函數(shù)u三個(gè)要素組成,即G = N, S, u。這里需要注意的是,完全信息靜態(tài)博弈在多數(shù)情況下,策略就等同于

10、行動(dòng),所以G= A,u。但嚴(yán)格來(lái)講,策略并不是行動(dòng)。我們可以通過(guò)一個(gè)例子來(lái)加以說(shuō)明。例1 進(jìn)攻與防守雙方爭(zhēng)奪一個(gè)據(jù)點(diǎn),有兩條進(jìn)攻路線X和Y,攻方有兩個(gè)軍,而防守方也有兩個(gè)軍,只有當(dāng)守方的兵力不少于攻方時(shí),才能擊退進(jìn)攻,否則據(jù)點(diǎn)將會(huì)失守。首先可知守方的防守方案(即策略)為(0,2),(1,1),(2,0),即在X線路和Y線路駐扎軍隊(duì)數(shù),同樣可以到的攻方的進(jìn)攻方案(0,2),(1,1)和(2,0)。容易看出,行動(dòng)并非策略,策略是行動(dòng)方案。守 方(0,2)(1,1)(2,0)攻 方(0,2)失敗,成功成功,失敗成功,失敗(1,1)成功,失敗失敗,成功成功,失敗(2,0)成功,失敗成功,失敗失敗,成功

11、二、納什均衡 有些策略式博弈性態(tài)非常好,不需要所謂的均衡概念就能找到博弈的均衡解,例如利用博弈參與者的理性這一假設(shè)就可以找出甚至是唯一的均衡。這里介紹幾個(gè)重要的概念:嚴(yán)格優(yōu)策略,嚴(yán)格劣策略,優(yōu)策略,劣策略,其基本的方法就是重復(fù)剔除嚴(yán)格劣策略,這種思路又被稱(chēng)為博弈的可理性化。 但是,對(duì)于更一般的博弈,利用可理性化導(dǎo)致的結(jié)果可能是所有博弈組合都無(wú)法剔除,從而導(dǎo)致所有組合都可能是均衡這樣的狀態(tài)。嚴(yán)格優(yōu)策略通俗地說(shuō)就是在任何情況下,該策略帶給參與者的收益都要嚴(yán)格大于其它任意策略。理解嚴(yán)格優(yōu)策略的關(guān)鍵在于兩個(gè)任意:給定對(duì)手任意的策略和自己任意的策略。如果嚴(yán)格優(yōu)策略存在,那么它必然是唯一的。這體現(xiàn)在命題2

12、.1中。相應(yīng)地,我們可以定義嚴(yán)格劣策略。嚴(yán)格劣策略是指存在某個(gè)策略無(wú)論在任何情況下,該策略帶個(gè)參與者的收益都要嚴(yán)格大于另一個(gè)策略。由此,可以看出嚴(yán)格優(yōu)策略和嚴(yán)格劣策略的差異。嚴(yán)格優(yōu)策略是全局性的,而嚴(yán)格劣策略只是相對(duì)于另一個(gè)策略而言。因而嚴(yán)格劣策略的要求要比嚴(yán)格優(yōu)策略要松,運(yùn)用重復(fù)剔出嚴(yán)格劣策略(如果存在的話)通常都能夠確定博弈的均衡。如果放寬要求,可以相應(yīng)地定義優(yōu)策略和劣策略。優(yōu)策略的缺點(diǎn)是均衡不唯一,而劣策略卻有可能將均衡剔出,因而重復(fù)剔出只能運(yùn)用到嚴(yán)格劣策略。通常,并不是所有博弈都存在劣策略,那么在這種情況下,博弈還存在均衡嗎?納什均衡:納什均衡通俗地說(shuō)就是一個(gè)策略組合,其具有這樣一個(gè)特

13、性,即沒(méi)有任何一個(gè)參與者有動(dòng)機(jī)單方面改變策略單邊背離。納什均衡與嚴(yán)格優(yōu)策略、嚴(yán)格劣策略的關(guān)系,體現(xiàn)在命題2.2和命題2.3上。納什均衡同樣存在不合理的地方,例如當(dāng)參與者的人數(shù)2時(shí),一個(gè)納什均衡(策略組合)雖然不存在單邊背離,但有可能存在多邊背離。所謂多邊背離就是2人或2人以上的參與者同時(shí)背離納什均衡。為了克服這個(gè)缺點(diǎn),理論界進(jìn)行了一系列的努力,但都未能動(dòng)搖納什均衡的地位。我們現(xiàn)在就舉例說(shuō)明。例 雙邊背離與納什均衡1,1,2_ ,0, _0, _, _2, 2,1_, _, 1. 2 2 左 右 左 右上下1 3 高 低為了加深理解,我們來(lái)看一些經(jīng)典例子。見(jiàn)書(shū)43頁(yè)50頁(yè)。通過(guò)這些例子,要求:1

14、、掌握如果概括博弈的方法基本式,2、如何找納什均衡。三、最優(yōu)反應(yīng)函數(shù)最優(yōu)反應(yīng)函數(shù)是更為一般的尋找納什均衡的通用方法。最優(yōu)反應(yīng)函數(shù)通俗講就是描述了當(dāng)給定對(duì)手的某個(gè)策略時(shí),我最優(yōu)的策略是什么?數(shù)學(xué)一點(diǎn)的話講,就是一個(gè)函數(shù)(對(duì)應(yīng)),其自變量為其它對(duì)手的策略,而應(yīng)變量則為自己的策略。最優(yōu)反應(yīng)函數(shù)不僅適用于離散策略,而且特別適用于連續(xù)策略。如果找到了所有參與者的最優(yōu)反應(yīng)函數(shù),如果我們把所有參與者的最優(yōu)反應(yīng)函數(shù)看作是一個(gè)大的“函數(shù)”,那么它的不動(dòng)點(diǎn),就是納什均衡。對(duì)稱(chēng)博弈和對(duì)稱(chēng)均衡能夠大大節(jié)省工作量,這也是博弈論中所舉例子通常為對(duì)稱(chēng)博弈的原因。對(duì)稱(chēng)博弈通俗說(shuō)就是代表參與者身份的下標(biāo),在分析中可以省略掉而沒(méi)有關(guān)系。四、混合策略博弈論里面最根本的問(wèn)題是什么?就是均衡的存在性。如果均衡不存在,所有的工作都成了無(wú)用功,之所以引入混合策略,意義就在這里,因?yàn)槿绻麅H僅限制在純策略的范圍內(nèi)討論博弈的話,均衡有可能是不存在的?;旌喜呗酝ㄋ椎卣f(shuō)就是隨機(jī)選擇純策略。在混合策略條件下,偏好實(shí)質(zhì)上變成了v-N-M偏好,除了滿足非對(duì)稱(chēng)性和負(fù)傳遞性外,還需滿足替代公理和阿基米德公理。伯努利收益函數(shù)滿足線性變換。我們知道,一個(gè)嚴(yán)格劣策略肯定是一個(gè)從來(lái)都不會(huì)選擇的策略,在混合策略下,從來(lái)都不選擇的策略同樣是嚴(yán)格劣策略。但限制在純策略下,這個(gè)逆命題卻不成立。一個(gè)純策略組合如果它是一個(gè)納什均衡,那么在任何情況下,它仍是一

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論