![第12章 博弈論_第1頁](http://file3.renrendoc.com/fileroot_temp3/2022-5/27/5e0703be-11cc-441d-b504-b84d8b52afd5/5e0703be-11cc-441d-b504-b84d8b52afd51.gif)
![第12章 博弈論_第2頁](http://file3.renrendoc.com/fileroot_temp3/2022-5/27/5e0703be-11cc-441d-b504-b84d8b52afd5/5e0703be-11cc-441d-b504-b84d8b52afd52.gif)
![第12章 博弈論_第3頁](http://file3.renrendoc.com/fileroot_temp3/2022-5/27/5e0703be-11cc-441d-b504-b84d8b52afd5/5e0703be-11cc-441d-b504-b84d8b52afd53.gif)
![第12章 博弈論_第4頁](http://file3.renrendoc.com/fileroot_temp3/2022-5/27/5e0703be-11cc-441d-b504-b84d8b52afd5/5e0703be-11cc-441d-b504-b84d8b52afd54.gif)
![第12章 博弈論_第5頁](http://file3.renrendoc.com/fileroot_temp3/2022-5/27/5e0703be-11cc-441d-b504-b84d8b52afd5/5e0703be-11cc-441d-b504-b84d8b52afd55.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、第第12章章 博弈論博弈論(Game Theory)對策論又稱博弈論對策論又稱博弈論:主要研究策略形勢主要研究策略形勢自由競爭的企業(yè)自由競爭的企業(yè): :企業(yè)是價格的接受者企業(yè)是價格的接受者, ,不用關(guān)心對手的情況不用關(guān)心對手的情況. .壟斷企業(yè)壟斷企業(yè): :沒有競爭對手沒有競爭對手, ,不是價格的接受者不是價格的接受者, ,但面對需求曲線但面對需求曲線. .介于兩者之間的就是策略形勢介于兩者之間的就是策略形勢, ,即不完全競爭的情況即不完全競爭的情況: :如汽車產(chǎn)業(yè)如汽車產(chǎn)業(yè)少數(shù)幾家公司的決策會互相影響少數(shù)幾家公司的決策會互相影響. .策略形勢書面定義策略形勢書面定義: :行為影響結(jié)果行為影響
2、結(jié)果, ,然而結(jié)果不僅取決于你的行為然而結(jié)果不僅取決于你的行為, ,還取決于其它人的行為還取決于其它人的行為. .適用領(lǐng)域適用領(lǐng)域: :經(jīng)濟學、政治學、法學、生物學等經(jīng)濟學、政治學、法學、生物學等簡單的成績博弈:簡單的成績博弈:請仔細閱讀以下條款:請仔細閱讀以下條款: 在不被你同桌看到的情況下,在方框中填字母在不被你同桌看到的情況下,在方框中填字母或或,把這看成,把這看成是成績的賭注。我會隨機把你們分成兩兩一組,你們不知道會跟誰是成績的賭注。我會隨機把你們分成兩兩一組,你們不知道會跟誰分到一組。按如下方法給出你們的成績:分到一組。按如下方法給出你們的成績:如果你選如果你選 而你的對手選而你的對
3、手選,那么你得,那么你得A,你對手得,你對手得C;如果你們都選如果你們都選 ,那么你們都得,那么你們都得B - ;如果你選如果你選,而你對手選,而你對手選,你得,你得C,你對手得,你對手得A;如果你們都選如果你們都選,你們都得,你們都得B+。 定義:如果你選定義:如果你選得到的結(jié)果嚴格優(yōu)于得到的結(jié)果嚴格優(yōu)于,那么,那么相對于相對于 是是個嚴格優(yōu)勢策略。個嚴格優(yōu)勢策略。結(jié)論結(jié)論1.不要選擇嚴格劣勢策略。不要選擇嚴格劣勢策略。原因:如果我選擇優(yōu)勢策略,在每次博弈都得到更好的收益。原因:如果我選擇優(yōu)勢策略,在每次博弈都得到更好的收益。結(jié)論結(jié)論2.理性人的理性選擇造成次優(yōu)的結(jié)果。理性人的理性選擇造成次
4、優(yōu)的結(jié)果。 囚徒困境囚徒困境壞形勢下最好的策略是減少損失。壞形勢下最好的策略是減少損失。合作型博弈合作型博弈有劣勢策略嗎?有劣勢策略嗎?改變了收益,我們改變了目的,即改變了博弈,改變了結(jié)改變了收益,我們改變了目的,即改變了博弈,改變了結(jié)果,因此收益很重要。果,因此收益很重要。結(jié)論結(jié)論3. 汝欲得之,必先知之汝欲得之,必先知之是優(yōu)勢策略,是優(yōu)勢策略,是劣勢策略是劣勢策略學會換位思考,去分析他們的收益如何,再根據(jù)對手的策略學會換位思考,去分析他們的收益如何,再根據(jù)對手的策略選擇。選擇。12.1 博弈論的基本概念博弈論的基本概念-1-1-1a3(下下)1-1-1a2(中中)11-1a1(上上)b3(
5、下下)b2(中中)b1(上上) S2(齊齊王王)S1(田忌田忌) 例例1田忌賽馬田忌賽馬:1. 局中人局中人(players):參與競爭的各方參與競爭的各方,每方必須有每方必須有獨立的決策能力和承擔風險的能力。獨立的決策能力和承擔風險的能力。局中人局中人A的策略的策略局中人局中人B的策略的策略.3. 收益向量:一局博弈后的各局中人的輸贏得失收益向量:一局博弈后的各局中人的輸贏得失2. 策略策略:局中人為了應對其他局中人的行局中人為了應對其他局中人的行動而采取的方案和手段。動而采取的方案和手段。4. 二人零和對策二人零和對策三個條件三個條件:(1)有兩個局中人有兩個局中人(2)每個局中人的的策略
6、都是有限的每個局中人的的策略都是有限的(3)每一策略組合下每一策略組合下,各局中人贏得之和始終為零各局中人贏得之和始終為零.例例2 甲乙二人玩剪刀甲乙二人玩剪刀石頭石頭布游戲,輸方付給布游戲,輸方付給 贏方贏方1元人民幣。元人民幣。11232123,SS 剪刀 石頭 布剪刀 石頭 布01 11011 10A剪刀石頭 布剪刀石頭布贏得矩陣:贏得矩陣:G=S1,S2,A11232123,SS ()ijmnAa局中人局中人策略集策略集贏得矩陣贏得矩陣 1994年諾貝爾經(jīng)濟學獎授予了三位博弈論專家和。 1996年諾獎授予兩位博弈論與信息經(jīng)濟學研究專家莫里斯、維克瑞; 2001年諾獎授予阿克洛夫、斯彭斯
7、、斯蒂格利茨,表彰他們在檸檬市場、信號傳遞和信號甄別等非對稱信息理論研究中的開創(chuàng)性貢獻。 2005年諾獎授予有以色列和美國雙重國籍的羅伯特奧曼和美國人托馬斯謝林,以表彰他們在博弈論領(lǐng)域作出的貢獻。( (三三) )博弈的分類博弈的分類 根據(jù)參與人的多少,可將博弈分為兩人博弈或多人博弈; 根據(jù)參與人是否合作,可將博弈分為合作博弈或非合作博弈; 根據(jù)博弈結(jié)果的不同,又可分為零和博弈、常和博弈與變和博弈。 1、從行動的先后次序來分,博弈可以分為靜態(tài)博弈和動態(tài)博弈。n靜態(tài)博弈指在博弈中,參與人同時選擇行動,或雖非同時但后行動者并不知道前行動者采取了什么具體行動;n動態(tài)博弈指的是參與人的行動有先后順序,且
8、后行動者能夠觀察到先行動者所選擇的行動的博弈。 2、從參與人對其他參與人的各種特征信息的獲得差異來分,博弈可分為完全信息博弈和不完全信息博弈。 完全信息指的是每一個參與人對所有其他參與人的特征,如策略集合及得益函數(shù)都有準確完備的知識;否則就是不完全信息。 將上述兩個角度的劃分結(jié)合起來,我們就得到四種不同類型的博弈,這就是:完全信息靜態(tài)博弈,完全信息動態(tài)博弈,不完全信息靜態(tài)博弈和不完全信息動態(tài)博弈。行動次序信息靜態(tài)動態(tài)完全信息納什均衡子博弈精練納什均衡不完全信息貝葉斯均衡精煉貝葉斯均衡 博弈的分類和均衡均衡是所有參與人的最優(yōu)策略或行動的組合;均衡結(jié)果是指博弈結(jié)束后博弈分析者感興趣的一些要素的集合
9、,如在各參與人的均衡策略作用下,各參與人最終的行動或效用集合第二節(jié)第二節(jié) 完全信息靜態(tài)博弈完全信息靜態(tài)博弈 所謂完全信息靜態(tài)博弈即各博弈方同時決策,且所有博弈方對博弈中的各種情況下的得益都完全了解的博弈問題. 靜態(tài):指博弈方同時采取行動,或雖不同時但后行動者對前者采取的策略并不了解。 納什均衡 無限策略博弈的解和反應函數(shù) 混合策略 納什均衡的存在性博弈模型的表達形式博弈模型的表達形式 基本式基本式 擴展式擴展式例例1 囚徒悖論囚徒悖論例例22.1 2.1 納什均衡納什均衡定義定義 在博弈 中,如果策略組合 中任一博弈方i的策略 都是對其余博弈方的策略組合 的最佳對策,也即 對任意 都成立,則稱
10、 為G的一個納什均納什均衡衡。11,.,;,.,nnGSS uu*1(,.)nss*is*111( ,., ,., )iiinsss ss*111111( ,., ,., )( ,., ,., )iiijiniiijinu ss s ssu ss s ssijisS*1(,.)nss2.1.12.1.1博弈的解和納什均衡博弈的解和納什均衡劃線法:先找出自己針對其他博弈方每種策略或策略組合(對多方劃線法:先找出自己針對其他博弈方每種策略或策略組合(對多方博弈)的最佳對策,即自己的可選策略中與其他博弈方的策略或策博弈)的最佳對策,即自己的可選策略中與其他博弈方的策略或策略組合配合,給自己帶來最大得
11、益的策略(這種相對最佳對策總是略組合配合,給自己帶來最大得益的策略(這種相對最佳對策總是存在的,不過不一定唯一),然后在此基礎(chǔ)上,通過對其他博弈方存在的,不過不一定唯一),然后在此基礎(chǔ)上,通過對其他博弈方策略選擇的判斷,包括其他博弈方對自己策略判斷的分析等,預測策略選擇的判斷,包括其他博弈方對自己策略判斷的分析等,預測博弈的可能結(jié)果和確定自己的最有策略。博弈的可能結(jié)果和確定自己的最有策略。箭頭法:對博弈中的每個策略組合進行分析,考察在每個策略組合箭頭法:對博弈中的每個策略組合進行分析,考察在每個策略組合處各個博弈方能否通過單獨改變自己的策略而增加得益。如能,則處各個博弈方能否通過單獨改變自己的
12、策略而增加得益。如能,則從所分析的策略組合對應的得益數(shù)組引出一個箭頭,到改變策略后從所分析的策略組合對應的得益數(shù)組引出一個箭頭,到改變策略后策略組合對應的得益數(shù)組。最后綜合對每個策略組合的分析情況,策略組合對應的得益數(shù)組。最后綜合對每個策略組合的分析情況,形成對策略結(jié)果的判斷。形成對策略結(jié)果的判斷。2.1.12.1.1博弈的解和納什均衡博弈的解和納什均衡 劃線法 囚徒2 不坦白 坦白 囚 不坦白 徒 1 坦白 箭頭法 囚徒2 不坦白 坦白 囚 不坦白 徒 1 坦白 1 1,1 1 8 8,0 0 0 0,8 8 3 3,3 31 1,1 1 8 8,0 0 0 0,8 83 3,3 3練習練習
13、2.1.22.1.2嚴格下策反復消去法與納什均衡納什均衡納什均衡 總結(jié)總結(jié)納什均衡點是一種局部均衡點,可以有很多個,也可以不存在。來源于策略組合的策略可能有n!個(離散),也可能無窮多個(連續(xù)),那么求解將會十分煩瑣。得益 對于任一策略組合(s1,sn),其總得益為各博弈方得益之和 那么對于具有多個納什均衡點的博弈,則對應的應有最優(yōu)納什均衡的概念,而對應于最優(yōu)納什均衡的點為全局最優(yōu)點。此處最優(yōu)的含義為穩(wěn)定性而不是得益之和最大。11( ,.,)( ,.,)ninu ssu ss線性規(guī)劃求混合策略的納什均衡線性規(guī)劃求混合策略的納什均衡(1,., )ijia xvjn111111nnmmmnyyax
14、aAxaa 1jjmjja ya y甲贏得(, )ijijija x yE X Yv1 iiinia xa x乙損失(, )ijijija x yE X Yv當甲使用混合策略對付乙的純策略時當甲使用混合策略對付乙的純策略時,不不論乙采取何種純策略論乙采取何種純策略,甲的收入都不小于甲的收入都不小于雙方都采取混合策略的期望值雙方都采取混合策略的期望值v,即即:1212:max.1minmin:,1min.miimvxxxvvxxvxxxv 目標函數(shù)是期望收入最大,即或?qū)懗? 令則目標函數(shù)變?yōu)?或?qū)懟驅(qū)懗沙?11 112211212222112212.10(1,.,)mmmmmmnmmmia xa
15、 xa xva xa xaxva xaxaxvxxxxim11 1212112122221122:.1.1. . .10(1,.,)mmmnmmnmnia xa xa xa xa xaxsta xaxaxxim約束條件變?yōu)?.矩陣對策線性規(guī)劃模型矩陣對策線性規(guī)劃模型線性規(guī)劃求混合策略的納什均衡線性規(guī)劃求混合策略的納什均衡(1,., )ijja yvim同理同理,當乙使用組合策略對付甲的純當乙使用組合策略對付甲的純策略時策略時,不論甲采取何種純策略不論甲采取何種純策略,乙的乙的損失都不大于雙方都采取組合策略損失都不大于雙方都采取組合策略的期望值的期望值v,即即:1212:min.1maxmax:
16、,1max.njjnvyyyvvyyvyyyv 目標函數(shù)是期望損失最小,即或?qū)懗? 令則目標函數(shù)變?yōu)?或?qū)懟驅(qū)懗沙?11 1122121 122221 12212.10(1,.,)nnnnmmmnnnia xa xa xva xa xa xva xaxaxvxxxxim11 1122121 122221 122:.1.1. .10 (1,., )nnnnmmmnnja ya ya ya ya ya ysta ya ya yyjn 約束條件變?yōu)榭梢娋种腥思着c乙的線性規(guī)劃可見局中人甲與乙的線性規(guī)劃模型為一對對偶問題模型為一對對偶問題.例例利用線性規(guī)劃方法利用線性規(guī)劃方法求解贏得矩陣的最求解贏得矩陣
17、的最優(yōu)策略優(yōu)策略7292909011A解解該問題可以化為兩個線性規(guī)劃問題該問題可以化為兩個線性規(guī)劃問題:1231231231313:1min7291291. .91110Axxxvxxxxxstxxx局中人1231231231313:1max7291291. .91110Byyyvyyyyystyyy局中人2.4 2.4 幾個應用例子幾個應用例子 古諾的寡頭模型 反應函數(shù) 伯特蘭德的寡頭模型 公共資源問題2.4.12.4.1古諾的寡頭模型古諾的寡頭模型 博弈方1 1利潤: 博弈方2 2利潤: 在本博弈中, 的納什均衡的充分必要條件是 和 的最大值問題: 社會收益最大化: 假設(shè)總產(chǎn)量為Q Q,總
18、收益為U UQPQP(Q Q)CQCQ Q Q(8-Q8-Q)2Q2Q6Q6QQ Q2 2 其最大值為Q Q* *=3,=3, ;該結(jié)果與納什均衡有較大的差異,這就是納什均衡是源于各廠商追求自身利益最大化的結(jié)果。2111 1112111 21( )8 ()26uqP QCqqqqqqqqq2222221222122( )8()26uq P QC qqqqqqq qq*12(,)qq*1q*2q12*21121*22122max(6)max(6)qqqq qqqq qq*12122, u =u =4qq12u =u =4.52.4.2 2.4.2 反應函數(shù)反應函數(shù) 反應函數(shù)反應函數(shù)每個博弈方針對
19、其他博弈方所有策略的最佳反應構(gòu)成的函數(shù)。而各個博弈方反應函數(shù)的交點交點(如果有的話)就是納什均衡。2.4.2 2.4.2 反應函數(shù)古諾模型反應函數(shù)古諾模型 在古諾模型中廠商1和廠商2的反應函數(shù)分別為1122221111()(6), ()(6)22qR qqqR qqq2q1(0,6)(0,3)R1(q2)R2(q1)(2,2)E0(3,0)(6,0) 從左圖可以看出,當一方的選擇為0時,另一方的最佳反應為3,這正是我們前面所說過的實現(xiàn)總體最大利益的產(chǎn)量,因為一家產(chǎn)量為零,意味著另一家壟斷市場。當一方的產(chǎn)量達到6時,另一方則被迫選擇0,因為實際上堅持生產(chǎn)已無利可圖。2.4.3 2.4.3 伯特蘭德的寡頭模型伯特蘭德的寡頭模型 在該模型中廠商選擇價格而不是產(chǎn)量 廠商1的價格與需求函數(shù): P1, 廠商2的價格與需求函數(shù): P2, 其中,d1,d20為兩廠商產(chǎn)品的替代系數(shù)。假設(shè)兩廠商無固定成本,邊際成本分別為c1和c2。收益:納什均衡:221222221 ( ,)qq P Pab Pd P11121 11 11111 11 222122 22 22222 22 1( ,)()()( ,)()()uu P PPqcqPcabPd Puu P PPqc qPcab Pd P*12122 211 11 2121 212*21211 122 2
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 北師大版道德與法治七年級上冊8.2《友善待人》聽課評課記錄
- 四年級上冊口算和筆算題
- 實驗小學二年級上學期口算練習題
- 標準預防及其措施
- 2024年七年級道德與法治下冊第十六課我與集體共成長復習提綱新人教版
- 八上18《中國石拱橋》公開課一等獎創(chuàng)新教學設(shè)計
- 上海興偉學院《光電類導論》2023-2024學年第二學期期末試卷
- 江西2025年江西景德鎮(zhèn)學院引進高層次人才66人筆試歷年參考題庫附帶答案詳解
- 巢湖學院《寶石資源及礦床》2023-2024學年第二學期期末試卷
- 未來智能駕駛與人工智能的融合趨勢
- 快餐品牌全案推廣方案
- 華為員工股權(quán)激勵方案
- 衛(wèi)生院安全生產(chǎn)知識培訓課件
- 口腔醫(yī)院感染預防與控制1
- 發(fā)生輸液反應時的應急預案及處理方法課件
- 中國旅游地理(高職)全套教學課件
- 門脈高壓性消化道出血的介入治療課件
- 民航保密培訓課件
- 兒童尿道黏膜脫垂介紹演示培訓課件
- 詩詞寫作入門
- 學校教育中的STEM教育模式培訓課件
評論
0/150
提交評論