第十章-博弈論初步

上傳人：1*** IP屬地：湖北上傳時間：2024-10-30 格式：PPT 頁數(shù)：17 大?。?70.50KB 積分：3.6 舉報 版權(quán)申訴

已閱讀5頁，還剩12頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認領(lǐng)

文檔簡介

1第十章博弈論初步博弈論和策略行為同時博弈：純策略均衡同時博弈：混合策略均衡序貫博弈2博弈論和策略行為博弈論(對策論)：

研究在策略性環(huán)境中如何進行策略性決策、采取策略性行動的科學(xué)研究前提：策略性環(huán)境——每個人的決策和行動都會影響到其他人的這樣一種作用關(guān)系研究內(nèi)容：策略性對策和策略性行動策略性對策——當(dāng)事人根據(jù)其他有關(guān)者的可能反應(yīng)來作出決策策略性行動——當(dāng)事人考慮其他有關(guān)者的可能反應(yīng)而采取行動博弈論的三個基本要素參與人（局中人）——博弈中的決策個體，至少應(yīng)有二人參與人的策略——參與人選擇什么情況下采取什么行動的規(guī)則，通常至少應(yīng)有兩種策略可供選擇參與人的支付——博弈的所有參與人可采用的每種策略的組合決定的博弈完成時每個參與人能夠獲得或可期望獲得的效用。博弈的基本類型二人博弈與多人博弈零和博弈與非零和博弈有限博弈與無限博弈同時博弈與序貫博弈3第二節(jié)同時博弈：純策略均衡同時博弈與序貫博弈條件策略與條件策略組合納什均衡雙方同時博弈的一般理論（略）4同時博弈與序貫博弈同時博弈與序貫博弈同時博弈——參與人的決策沒有先后差異的博弈，就是說，沒有人是在知道別人的決策之后才作決策的序貫博弈——參與人的決策有先后順序的博弈，后決策的人可以根據(jù)別人已作的決策作出對應(yīng)的決策。支付矩陣：表明兩個參與人同時決策的策略組合和各自支付的矩陣例題：甲、乙兩家寡頭在是否遵守卡特爾協(xié)議方面（卡特爾：獨立廠商共同建立的合作控制市場的價格同盟），都可選擇合作或不合作的策略。如果雙方合作，則甲、乙分別得到的支付是5，6；雙方都不合作，則分別得到2，3；如果甲合作而乙不合作，則甲得1，乙得5；如果甲不合作而乙合作，則甲得7，乙得1。寡頭甲寡頭乙合作不合作合作不合作5，61，57，12，3

支付矩陣的結(jié)構(gòu)

最左方、最上方分別表示兩個參與人左起第二列、上起第二行分別列出各自的可能策略它們右下方的各單元格分別表示雙方的各種策略組合上述各單元格內(nèi)數(shù)字表示各策略組合下各參與人得到的支付，其中前一數(shù)字對應(yīng)左方，后一數(shù)字對應(yīng)上方也可把該矩陣拆成兩個“子矩陣”，如藍、紅色分別所示5條件策略與條件策略組合

條件策略：參與人在假定其他參與人選擇某一策略的條件下篩選出來的對自己而言最優(yōu)的策略，稱為“條件優(yōu)勢策略”或“相對優(yōu)勢策略”，簡稱“條件策略”。對例題中的甲而言，假定乙合作，那么甲合作只能得到5，不合作卻能得到7，因此不合作是乙合作條件下甲的條件策略；假定乙不合作，那么甲的條件策略也是不合作，該策略的支付為2，比合作策略的支付多1。對乙而言，如果假定甲合作，那么乙合作的支付為6，比不合作的支付多1，因此合作是甲合作條件下乙的條件策略；假定甲不合作，那么乙的條件策略是也不合作，乙若合作支付只有1，不合作則可得到3。

條件策略組合：參與人以其他參與人選擇某一策略為條件的條件策略與作為它的條件的對方策略之間的組合，稱為“條件優(yōu)勢策略組合”或“相對優(yōu)勢策略組合”，簡稱“條件策略組合”。

甲有兩個條件策略組合：不合作，合作；不合作，不合作

乙的兩個條件策略組合則是：合作，合作；不合作，不合作乙合否甲合5，61，5否7，12，36納什均衡納什均衡概念：所有參與人之間的這樣一種策略組合，他們中任何人都不會單獨改變策略，因為單獨改變策略對自己沒有好處。參與人之間的博弈由此得到最終結(jié)果。在支付矩陣中尋找納什均衡：條件策略下劃線法分別在兩個參與人各條件策略的己方支付值下劃一橫線，再找出雙方支付值下都有橫線的單元格，它就表示納什均衡實現(xiàn)時的支付情況，它對應(yīng)的策略組合就是所尋找的均衡策略組合。劃線法可采用以下五個步驟：把支付矩陣分解為兩個參與人各自的子支付矩陣為左方參與人找出子支付矩陣中各列的最大值并劃線為上方參與人找出子支付矩陣中各行的最大值并劃線把劃線后的兩個子矩陣合并為共同的支付矩陣由共同支付矩陣中兩個數(shù)字下都劃線的單元格，可找到均衡策略組合關(guān)于納什均衡“存在性、唯一性、最優(yōu)性”的說明同時博弈中，納什均衡可能存在，也可能不存在如果納什均衡存在，它可能是唯一的，也可能不是。如果納什均衡存在，它可能是最優(yōu)的，也可能不是。乙合否甲合5，61，5否7，12，34，69，17，32，85，61，44，12，3最優(yōu)，但非均衡的組合納什均衡組合，但非最優(yōu)7第三節(jié)同時博弈：混合策略均衡不存在純策略均衡時的混合策略均衡存在純策略均衡時的混合策略均衡混合策略博弈的一般理論（略）8不存在純策略均衡時的混合策略均衡1純策略與混合策略純策略：右表中策略組合的納什均衡不存在，但每個參與人在給定對方策略的條件下選擇的策略都是確定的，換句話說，他在己方的策略選擇中都處于非此即彼的狀態(tài)。前面分析的其他支付矩陣中如果存在納什均衡，那么在均衡的策略組合中雙方各自的策略也是確定的、魚與熊掌不可兼得的。這種在給定對方策略條件下只能選一種確定策略的組合叫“純策略組合”。

混合策略：“剪刀、石頭、帕子”游戲（劃拳也類似）每次仍屬同時博弈，如果對方前幾次總是出石頭，這一次己方的條件策略似乎該以帕子戰(zhàn)勝石頭。但對方并沒患手指蜷攣癥、只會出石頭。他估計對手很可能出帕子，他就可能不再出石頭而變?yōu)槌黾舻?。己方估計他可能改變策略，己方就不一定出帕子，而可能學(xué)對方出石頭，對方不變則戰(zhàn)平，對方變剪刀則己方勝。雙方都不能確定對方下次的策略，只能估計對方選擇每種策略的概率；己方下次的策略也不是確定的，而有多種可能，各種策略的選擇按一定概率分布。這種選擇不同策略間分布概率的做法叫“混合策略”.“純策略”可看作各策略被選中的概率非1即0，作為“混合策略”的一種特例。在支付矩陣中反映混合策略，可在左方第1、2列和上方第1、2行之間分別插入一列、行，用數(shù)字分別注明各策略被選擇的概率(p1，p2)、(q1，q2)等。(p1，p2)、(q1，q2)等在這里被稱為“概率向量”。4，69，17，32，8q1q2CDp1A4，69，1p2B7，32，8乙甲9不存在純策略均衡時的混合策略均衡2

混合策略組合：采取混合策略的各參與人的混合策略的組合，稱為“混合策略組合”，可用各參與人混合策略概率向量的組合表示。例如，甲與乙的混合策略概率向量分別為（p1，p2）、（q1，q2），那么他們的混合策略組合就可表示為概率向量組合（（p1，p2），（q1，q2））。期望支付：在混合策略博弈中，每個混合策略組合有各自的支付組合，但每個參與人得到的支付是他的各種純策略應(yīng)獲的支付的加權(quán)平均數(shù)，稱為期望支付。加權(quán)用的權(quán)數(shù)，為與各單元格對應(yīng)的雙方每個策略組合中各種純策略被采用的概率之積，也就是該策略組合被采用的概率。假定下表中參與人甲、乙的混合策略概率向量分別為（0.6,0.4）與（0.3,0.7），他們將有混合策略組合（（0.6,0.4）,（0.3,0.7））

[參考右下角調(diào)整后的支付矩陣]乙q1q2CD甲p1A4，69，1p2B7，32，8.6.4.3.7

那么，甲的期望支付為：E甲=p1·q1·4+p1·q2·9

+p2·q1·7+p2·q2·2(式甲)=0.6×0.3×4+0.6×0.7×9+0.4×0.3×7+0.4×0.7×2=5.90。E乙=p1·q1·6+p1·q2·1

+p2·q1·3+p2·q2·8=3.20(式乙)

由于p1，p2和q1，q2的取值有無限多的可能，混合策略組合及其支付也就有無限多的可能。10不存在純策略均衡時的混合策略均衡3條件混合策略：參與人在假定其他參與人按某一概率選擇某一策略的條件下設(shè)計的對自己而言具有相對優(yōu)勢的（即期望支付最大的）混合策略，稱為“條件混合策略”。假定（p1，p2）、（q1，q2）的取值從0到1有無限多可能，把p2=1-p1和q2=1-q1代入甲與乙各自的期望支付表達式，經(jīng)整理可得：

E甲=p1（7－10q1）+5q1+2（式1）；E乙=5q1（2p1－1）－7p1+8（式2）每個參與人需要確定，在另一參與人為其混合策略選擇某個概率值時，己方混合策略的概率向量應(yīng)怎樣取值，才能使自己的期望支付最大。對式1的討論：當(dāng)7－10q1＞0時，E甲隨p1同向變動，為使E甲最大，p1應(yīng)取其可達的最大值1；當(dāng)7－10q1＜0時，E甲隨p1反向變動，為使E甲最大，p1應(yīng)取其可達的最小值0；當(dāng)7－10q1=0時，E甲與p1無關(guān)，p1可在0與1之間（含0和1）任意取值而E甲不變。于是，參與人甲的條件混合策略可表達為：

1q1＜0.7[0,1]q1=0.7

q1＞0.7用同樣方法討論式2，可得到乙的條件混合策略:乙q1q2CD甲p1A4，69，1p2B7，32，8

0p1＜0.5

[0,1]p1=0.5

p1＞0.5P1=q1=11不存在純策略均衡時的混合策略均衡40p1＜0.5[0,1]p1=0.5

p1＞0.5p1=q1=1q1＜0.7[0,1]q1=0.7

q1＞0.7

混合策略的納什均衡：當(dāng)博弈雙方中任何一方選擇某種混合策略時，另一方選擇的混合策略都能使另一方的期望支付達到最大的博弈均衡狀態(tài)。因此任何一方都不會偏離自己選擇的混合策略，因為偏離不能給自己帶來任何好處。混合策略納什均衡圖根據(jù)前面分析出的甲乙兩位參與人各自的條件混合策略（見本頁下方），可以在以甲、乙各自的概率p1、q1為兩軸的平面坐標(biāo)系中繪出甲、乙各自的混合策略曲線。甲的混合策略曲線（以藍色表示）和乙的混合策略曲線（以紅色表示）相交于e點，e點的混合策略組合就實現(xiàn)混合策略博弈的納什均衡。e點的坐標(biāo)是p1=0.5，q1=0.7，則納什均衡時p2=0.5，q2=0.3。本題中混合策略的納什均衡還可表示為：((p1,p2)，(q1,q2))=((0.5,0.5)，(0.7,0.3))。本題中，只有唯一的這個納什均衡點。q1p1O10.70.51e12存在純策略均衡時的混合策略均衡

在混合策略博弈中求納什均衡解的方法，也適用于純策略納什均衡的分析。以本章開始時分析過的兩個寡頭是否遵守卡特爾協(xié)議與對方合作的純策略博弈為例，假定甲與乙選擇合作策略的概率分別為p1與q1，選擇不合作的概率分別為p2（=1－p1）與q2（=1－q1

），形成下面的支付矩陣。把p2=1－p1與q2=1－q1代入甲與乙各自的期望支付表達式，經(jīng)整理可得：

E甲=－p1（1+q1）+5q1+2（式1）；E乙=q1（3p1－2）+2p1+3（式2）由式1可知E甲隨p1而反向變動，為了使E甲最大化，p1應(yīng)盡可能小，因此甲的條件混合策略是p1=00≤q1≤1。這實際上是個純策略。由式2得到乙的條件混合策略：0p1＜2/3[0,1]p1=2/31p1＞2/3

納什均衡點就在原點，與純策略博弈的均衡相同，雙方都選擇不合作的策略。

乙q1q2合否甲p1合5，61，5p2否7，12，3q1p11o2/31q1=因此，純策略博弈是混合策略博弈的特例純策略博弈均衡是混合策略博弈均衡的特例13序貫博弈和博弈樹

序貫博弈的參與人決策有先后之分，后決策者可以根據(jù)先決策者的策略作出決策。例如，某市場原來被壟斷者獨家控制，有潛在的競爭者可能進入該市場。競爭者先決策：是否進入；壟斷者后決策：是否抵抗。左下方的支付矩陣表示他們的各個策略組合及其支付組合。也可用博弈樹進一步表示參與者的決策順序。博弈樹有一個起點（先決策者的決策點，注明何人決策）、不止一個中間點（后決策者的決策點，注明何人決策）與若干終點（策略組合的結(jié)果點，注明支付組合），按時間和邏輯順序排列，并以字母或數(shù)字排序。起點與中間點之間、中間點與終點之間，以線段連接（策略線，注明發(fā)出該線段的決策者的策略）。壟斷者容忍抵抗競爭進1，4-2，2者不進0，50，3競爭者壟斷者壟斷者進不進容忍容忍抵抗抵抗（1，4）（-2，2）（0，5）（0，3）abcdefg競爭者—壟斷者模型的博弈樹

右下方圖中的決策順序表示為由左向右，象左面生根而向右發(fā)出枝條的“樹”，故稱“博弈樹”。它也可由下向上“生長”，或向左、向下“生長”。有的終點的支付狀況會引起下一輪博弈，它就成為新起點（實際是新的“中間決策點”），長出新的博弈樹“枝條”。14序貫博弈的納什均衡

在有的序貫博弈中可能實現(xiàn)納什均衡。以左下方的支付矩陣為例，就有唯一的納什均衡策略組合：進入，容忍。每個參與人都不愿意單獨改變自己的策略，因為變更至少無益于己。設(shè)想競爭者改選均衡組合所在列的其他組合，或壟斷者改選均衡組合所在行的其他組合，都將看到變卦者的損失。雙方的其他策略組合都不是納什均衡。至少有一個參與者如果單獨改變策略就能增加己方的支付。序貫博弈也許有不止一個納什均衡的策略組合。以左下方支付矩陣表示的情侶博弈模型為例，戀愛中的男女如何度周末？可以在看足球賽與欣賞芭蕾舞這兩個策略中選擇。男方先決策，他可能約情侶看球賽；女方后決策，如果愿意看球賽，策略組合就是（足球，足球）；如果不愿，自己去看芭蕾，策略組合就成為（足球，芭蕾）。男方也可能投女方所好，建議一起看芭蕾，女方樂意，就有策略組合（芭蕾，芭蕾）；理論上還有（芭蕾，足球）策略組合的可能。每個策略組合給戀愛中雙方帶來不同感受，形成矩陣中的不同支付組合。倆人同度周末，看什么都行，誰拆臺誰自己都會受損，就有兩種納什均衡，也叫多重納什均衡。壟斷者容忍抵抗競爭進1，4-2，2者不進0，50，3女方足球芭蕾男足球2，10，0方芭蕾-1，-11，215納什均衡的精煉：逆向歸納法1在多重納什均衡中，有的納什均衡未必合理。例如情侶博弈中男方先決策卻出現(xiàn)“芭蕾，芭蕾”策略組合的納什均衡，就可能使人質(zhì)疑男方?jīng)Q策的理性問題。可以采用逆向歸納法對納什均衡實行精煉處理，排除不合理的納什均衡。做法是，從博弈最后階段的每個決策點出發(fā)，確定決策者選擇的策略，剔除他放棄的策略，使博弈模型得到簡化；再對上一階段的策略作類似處理，直到博弈模型最簡，這個最簡博弈就是原模型的解。以情侶博弈為例，最后階段決策以女方為決策者。她在兩個決策點各可從兩種策略中選一種。根據(jù)她可獲的支付情況之間的比較，可從每個決策點刪除一種對她相對不利的策略，于是情侶模型被初步簡化。在上一階段，簡化后可能的策略組合只剩（足球，足球）與（芭蕾，芭蕾），女方總是作出與男方一致的選擇。男方就可選擇對自己更有利的足球。于是模型得到最終的簡化，其他選擇和

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

第十章-博弈論初步

文檔簡介

溫馨提示

最新文檔

評論

第十章-博弈論初步

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔