博弈論的基本要素_第1頁
博弈論的基本要素_第2頁
博弈論的基本要素_第3頁
博弈論的基本要素_第4頁
博弈論的基本要素_第5頁
已閱讀5頁,還剩61頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、上一講內(nèi)容回顧上一講內(nèi)容回顧 q博弈論用處(解釋、預(yù)測(cè)和提出建議)博弈論用處(解釋、預(yù)測(cè)和提出建議) q猜數(shù)游戲猜數(shù)游戲-博弈關(guān)注的(博弈關(guān)注的(interdependence) q博弈論發(fā)展簡(jiǎn)史博弈論發(fā)展簡(jiǎn)史 q囚徒困境囚徒困境 q智豬博弈智豬博弈 q商業(yè)中心區(qū)(商業(yè)中心區(qū)(CBD)的形成)的形成 q動(dòng)態(tài)博弈與承諾行動(dòng)動(dòng)態(tài)博弈與承諾行動(dòng) q信息不對(duì)稱(二手車市場(chǎng))信息不對(duì)稱(二手車市場(chǎng)) q混合策略混合策略 q機(jī)制設(shè)計(jì)(定價(jià)策略、制度設(shè)計(jì)等)機(jī)制設(shè)計(jì)(定價(jià)策略、制度設(shè)計(jì)等) 12021/3/11 2 通俗理解博弈論通俗理解博弈論 q博弈論是有關(guān)取舍策略取舍策略的科學(xué),它的方 程式告訴你在與人

2、接觸中怎樣得到最大 的好處。 q博弈論剛開始運(yùn)用到經(jīng)濟(jì)領(lǐng)域,現(xiàn)在幾 乎在哪個(gè)科學(xué)領(lǐng)域都能看到它的身影, 尤其是那些涉及到人性與人的行為的科 學(xué)。 3 4 上述問題都有如下共同點(diǎn) q都有若干決策者,我們稱之為參與人參與人(players) vN-人博弈問題的決策者集合,習(xí)慣上也用 N表示 v針對(duì)具體問題,參與人可以是 個(gè)人 一個(gè)政府 公司的整個(gè)董事會(huì) 博弈的基本要素博弈的基本要素 5 6 7 對(duì)參與人的理解對(duì)參與人的理解 q 博弈中的決策者。每個(gè)參與人的目標(biāo)是選擇一個(gè)期望最 大化的策略, q 要求博弈的決策主體具有行為選擇能力,并且對(duì)博弈結(jié) 果負(fù)責(zé)的能力,否則不是參與人。眾所周知的田忌賽馬 博弈

3、,參與人是田忌和齊威王,孫臏僅僅是一個(gè)策略分 析者。孫臏并不是決策者,因而不是參與人. q 虛擬參與人,又稱為自然(nature)。自然在博弈的一 些特定點(diǎn)按照給定的概率隨機(jī)選擇行動(dòng)。 q 虛擬參與人與正常的參與人之間在概念上的差異是:參 與人有預(yù)先設(shè)定的效用函數(shù),而虛擬的參與人對(duì)于給定 的結(jié)局,不存在任何效用感受。 8 博弈論對(duì)參與人做兩個(gè)基本假設(shè)博弈論對(duì)參與人做兩個(gè)基本假設(shè) 1 理性的(理性的(rational)? 1如果一個(gè)決策者在追逐其目標(biāo)時(shí)能如果一個(gè)決策者在追逐其目標(biāo)時(shí)能 前后一致地做決策,就稱他為前后一致地做決策,就稱他為rational。 Roger BMyerson (P2)

4、2廣義而言指的是一種行為方式,他廣義而言指的是一種行為方式,他 同在給定條件或約束下最有效地實(shí)現(xiàn)預(yù)期目同在給定條件或約束下最有效地實(shí)現(xiàn)預(yù)期目 標(biāo)相關(guān)。具體地講,理性含義如下:標(biāo)相關(guān)。具體地講,理性含義如下: 9 (1)存在一組可供選擇的備選或替代方)存在一組可供選擇的備選或替代方案;案; (2)每一種方案均對(duì)應(yīng)著某種特定的預(yù)期)每一種方案均對(duì)應(yīng)著某種特定的預(yù)期 凈收益或滿足程度或目標(biāo)實(shí)現(xiàn)程度;凈收益或滿足程度或目標(biāo)實(shí)現(xiàn)程度; (3)人們總是選擇那個(gè)能夠帶來最大預(yù)期)人們總是選擇那個(gè)能夠帶來最大預(yù)期 凈收益的方案。凈收益的方案。 (西蒙,(西蒙,1964) 博弈論對(duì)參與人做兩個(gè)基本假設(shè)博弈論對(duì)參

5、與人做兩個(gè)基本假設(shè) 10 2 智能的(智能的(intelligent)? 當(dāng)我們像博弈論專家那樣分析一個(gè)博弈當(dāng)我們像博弈論專家那樣分析一個(gè)博弈 時(shí),如果參與人知道我們對(duì)此博弈所知道時(shí),如果參與人知道我們對(duì)此博弈所知道 的一切,并能做出我們對(duì)此博弈所能做出的一切,并能做出我們對(duì)此博弈所能做出 的一切推斷,我們就說此博弈的參與人是的一切推斷,我們就說此博弈的參與人是 智能的。智能的。Roger BMyerson (P3) 博弈論對(duì)參與人做兩個(gè)基本假設(shè)博弈論對(duì)參與人做兩個(gè)基本假設(shè) 11 q參與人都存在若干策略(strategies)或行 動(dòng)(actions) v參與人i的策略用si表示,參與人i的所

6、有策 略構(gòu)成的集合稱為策略集策略集,記為Si , si Si v注意行動(dòng)與策略的區(qū)別 博弈的基本要素博弈的基本要素 12 13 14 q支付(收益、效用)(payoff) v各參與人對(duì)所有參與人不同策略組合 (strategy profile),構(gòu)成了博弈的一個(gè)局勢(shì)一個(gè)局勢(shì)。 記為 s v參與人 i (iN)對(duì)局勢(shì)s 有一個(gè)主觀的偏好, 可用一個(gè)函數(shù)表示這種偏好,這個(gè)偏好函 數(shù)稱為參與人 i 的支付支付 博弈的基本要素博弈的基本要素 15 16 q參與人、各參與人的策略集、各參與人 的支付函數(shù),是博弈最重要的基本要素。 博弈的基本要素博弈的基本要素 17 1:博弈的基本特征是一個(gè)參與人博弈的基

7、本特征是一個(gè)參與人 的支付不僅取決于自己的策略選擇,而且取的支付不僅取決于自己的策略選擇,而且取 決于所有其他參與人的策略選擇;是策略組決于所有其他參與人的策略選擇;是策略組 合的函數(shù)。合的函數(shù)。 2:效用是參與人真正關(guān)心的東西,參:效用是參與人真正關(guān)心的東西,參 與人在博弈中的目標(biāo)就是選擇自己的策略以與人在博弈中的目標(biāo)就是選擇自己的策略以 最大化自己的效用函數(shù)。最大化自己的效用函數(shù)。 18 19 20 21 22 An item of information in a game is common knowledge if all of the players know it and all

8、 of the players know that all other players know it and all other players know that all other players know that all other players know it, and so on. This is much more than simply saying that something is known by all, but also implies that the fact that it is known is also known by all, etc. 23 Con

9、sider a simple example of two allied armies situated on opposite hilltops waiting to attack their foe. Neither commander will attack unless he is sure that the other will attack at exactly the same time. The first commander sends a messenger to the other hilltop with the message I plan to attack in

10、the morning. The messengers journey is perilous and he may die on the way to delivering the message. 24 If he gets to the other hilltop and informs the other commander - can we be certain that both will attack in the morning? Note that both commanders now know the message, but the first cannot be su

11、re that the second got the message. Thus, common knowledge implies not only that both know some piece of information, but can also be absolutely confident that the rest know it, and that the rest know that we know it, and so on. 25 共同知識(shí)趣題共同知識(shí)趣題 有一群人圍坐在一起,假定只有4個(gè)人,每人頭上帶著戴 著一頂帽子,顏色為黑色和白色,每個(gè)人看不到自己 頭上帽子的

12、顏色,但能看到別人帽子的顏色. 為了分析 的方便,我們假定這四個(gè)人均戴的是黑色帽子。這時(shí) 候,一個(gè)局外人來到他們集體當(dāng)中,對(duì)他們說:“你 們其中至少一個(gè)頭戴的是黑色帽子?!碑?dāng)他說完這句 話后,他問:“你們知道你們頭上的帽子顏色嗎?”4 個(gè)人都說不知道。這個(gè)局外人第二次問道:“你們知 道你們頭上帽子的顏色嗎?”4個(gè)人又都說不知道。局 外人第三次問:“你們知道你們頭上帽子的顏色 嗎?”4個(gè)人又說不知道。局外人第四次問道:“你們 知道你們頭上帽子的顏色嗎?”這時(shí)4個(gè)人均說知道了。 你能知道這是為什么嗎? 26 博弈概念的理解博弈概念的理解 qOPEC成員國(guó)選擇其年產(chǎn)量;成員國(guó)選擇其年產(chǎn)量; q兩家制

13、造商,一家做螺釘,一一家做螺帽,兩家制造商,一家做螺釘,一一家做螺帽, 決定是采用美制標(biāo)準(zhǔn)還是公制標(biāo)準(zhǔn);決定是采用美制標(biāo)準(zhǔn)還是公制標(biāo)準(zhǔn); q公司董事會(huì)為其總經(jīng)理設(shè)立一項(xiàng)期股安排;公司董事會(huì)為其總經(jīng)理設(shè)立一項(xiàng)期股安排; q一家電力公司在估計(jì)了未來一家電力公司在估計(jì)了未來10年對(duì)電力的需年對(duì)電力的需 求后,決定是否購(gòu)置一套新的發(fā)電機(jī)組;求后,決定是否購(gòu)置一套新的發(fā)電機(jī)組; q明天出去玩,決定是否帶傘;明天出去玩,決定是否帶傘; q諸葛亮和司馬懿進(jìn)行的空城計(jì);諸葛亮和司馬懿進(jìn)行的空城計(jì); 27 Definition of a Game qMust consider the strategic env

14、ironment Who are the PLAYERS? (Decision makers) What STRATEGIES are available? (Feasible actions) What are the PAYOFFS? (Objectives) qRules of the game What is the time-frame for decisions? What is the nature of the conflict? What is the nature of interaction? What information is available? 28 29 30

15、 31 32 課程主要內(nèi)容課程主要內(nèi)容 q完全信息靜態(tài)博弈 q完全信息動(dòng)態(tài)博弈 q不完全信息靜態(tài)博弈 q機(jī)制設(shè)計(jì) q合作博弈 33 完全信息靜態(tài)博弈概念完全信息靜態(tài)博弈概念 q概念:各參與人對(duì)彼此的策略集、支付 函數(shù)有準(zhǔn)確了解 q博弈行為同時(shí)進(jìn)行 q一些實(shí)例 v石頭、剪子、布游戲 v彼此了解的兩個(gè)廠商的價(jià)格戰(zhàn) 34 完全信息靜態(tài)博弈概念完全信息靜態(tài)博弈概念 q有些實(shí)際博弈 v雖然決策不是在絕對(duì)時(shí)間意義上的“同 時(shí)”, v但決策的時(shí)間先后差別跟博弈結(jié)果沒有關(guān) 系,也可看成是“同時(shí)進(jìn)行的博弈”。 v如不同競(jìng)標(biāo)單位作出的工程投標(biāo)決策 35 博弈的策略式表述博弈的策略式表述 q常用G表示一個(gè)博弈 q博

16、弈模型的兩種表示形式 v策略式表述 (Strategic form), v擴(kuò)展式表述(Extensive form) q本章主要介紹博弈的策略式表述 36 博弈的策略式表述博弈的策略式表述 q參與人集合 vN人博弈的參與人集合,往往也記為N。參 與人則記為i, i N v參與人i的策略集,記為Si ,其中的一個(gè)特定 策略,可記為si.有si Si. 37 v對(duì)于給定的參與人i, i=1,2,N, 卡氏積 S1S2 Si-1 Si+1 Sn v表示除了參與人i外所有參與人所有策略的 可能組合,通 常記為S-i; v于是所有參與人不同策略組合構(gòu)成的策略 空間可表示為 vS=(Si , S-i) 博

17、弈的策略式表述博弈的策略式表述 38 vSi中的元素 si 表示參與人i的一個(gè)具體策略 v一旦確定了所有參與人的策略,便形成了 一個(gè)博弈局勢(shì),表示為s=(s1, s2, sN), sS。 博弈的策略式表述博弈的策略式表述 39 q參與人i的效用函數(shù) v參與人 i的支付函數(shù),是從博弈局勢(shì)集 S=S1S2 SN 到實(shí)數(shù)集R的一個(gè)映射,記為 ui(s1, s2, s N),表示參與人i對(duì)局勢(shì)s = (s1, s2, sn)的偏好。 q一個(gè)博弈可以表示為 G = S1, ,SN; u1, ,uN, i N q這就是博弈的策略式表述 博弈的策略式表述博弈的策略式表述 40 博弈的策略式表述博弈的策略式表

18、述 例 寫出囚徒問題的策略式表述 v參與人集合N=囚徒1,囚徒2 v參與人的策略集S1=S2= 坦白,不坦白 v各參與人的支付,可用圖1-1表示。 坦 白不坦白 坦 白(-8, -8)(0, -10) 不坦白(-10, 0)(-1, -1) 圖圖1-1 1-1 囚徒問題的支付矩陣囚徒問題的支付矩陣 囚徒1 囚徒2 41 博弈的策略式表述博弈的策略式表述 v實(shí)質(zhì)上,圖1-1已經(jīng)完全表述了囚徒困境的策略式 表述信息 v稱圖1-1為二人有限博弈的雙矩陣雙矩陣 (bimatrix)表述 坦 白不坦白 坦 白(-8, -8)(0, -10) 不坦白(-10, 0)(-1, -1) 圖圖1-1 1-1 囚

19、徒問題的支付矩陣囚徒問題的支付矩陣 囚徒1 囚徒2 42 占優(yōu)均衡占優(yōu)均衡 q英文術(shù)語:Dominant-strategy Equilibrium q定義:在博弈中如果不管其他參與人選 擇什么策略,一個(gè)參與人的某個(gè)策略給 他帶來的支付值始終高于其他策略,或 至少不劣于其他策略,則稱該策略為該 參與人的嚴(yán)格占優(yōu)策略或占優(yōu)策略。 43 占優(yōu)策略占優(yōu)策略 q對(duì)于所有的s-i, si*稱為參與人i的嚴(yán)格占 優(yōu)戰(zhàn)略,如果滿足: qui(si*,s-i)ui(si,s-i) s-i, si si* 44 占優(yōu)均衡占優(yōu)均衡 q占優(yōu)均衡定義 v一個(gè)博弈的某個(gè)策略組合中,如果對(duì)應(yīng)的 所有策略都是各參與人的占優(yōu)策

20、略,則稱 該策略組合為該博弈的一個(gè)占優(yōu)均衡。 45 占優(yōu)均衡占優(yōu)均衡 q 占優(yōu)戰(zhàn)略均衡:每個(gè)參與人的占優(yōu)戰(zhàn)略組合(如果存 在的話)被稱為占優(yōu)戰(zhàn)略均衡。 坦 白不坦白 坦 白(-8, -8)(0, -10) 不坦白(-10, 0)(-1, -1) 圖圖1-2 囚徒問題的支付矩陣囚徒問題的支付矩陣 囚徒1 囚徒2 46 占優(yōu)均衡占優(yōu)均衡 q以囚徒1為例,無論囚徒2采取什么策 略 坦 白不坦白 坦 白(-8, -8)(0, -10) 不坦白(-10, 0)(-1, -1) 圖圖1-2 囚徒問題的支付矩陣囚徒問題的支付矩陣 囚徒1 囚徒2 47 占優(yōu)均衡占優(yōu)均衡 q坦白總是占優(yōu)策略 圖圖1-2 囚徒問

21、題的支付矩陣囚徒問題的支付矩陣 囚徒1 囚徒2 坦 白不坦白 坦 白(-8, -8)(0, -10) 不坦白(-10, 0)(-1, -1) 48 占優(yōu)均衡占優(yōu)均衡 q由于矩陣的對(duì)稱性,對(duì)囚徒2來說亦可得出類 似結(jié)論 坦 白不坦白 坦 白(-8, -8)(0, -10) 不坦白(-10, 0)(-1, -1) 圖圖1-2 囚徒問題的支付矩陣囚徒問題的支付矩陣 囚徒1 囚徒2 49 占優(yōu)均衡占優(yōu)均衡 q 因此,該博弈的策略組合(坦白、坦白)是占優(yōu)均衡。 圖圖1-2 囚徒問題的支付矩陣囚徒問題的支付矩陣 囚徒1 囚徒2 坦 白不坦白 坦 白(-8, -8)(0, -10) 不坦白(-10, 0)(

22、-1, -1) 50 占優(yōu)均衡占優(yōu)均衡 q但該占優(yōu)均衡的收益,卻劣于另外一個(gè)策略 組合(不坦白,不坦白)。 坦 白不坦白 坦 白(-8, -8)(0, -10) 不坦白(-10, 0)(-1, -1) 圖圖1-2 囚徒問題的支付矩陣囚徒問題的支付矩陣 囚徒1 囚徒2 51 q成績(jī)博弈,分析占優(yōu)策略和占優(yōu)均衡 52 重復(fù)剔除嚴(yán)劣策略均衡重復(fù)剔除嚴(yán)劣策略均衡 q前面介紹了第一均衡概念占優(yōu)均衡 q(顯然)并非所有博弈都存在占優(yōu)均衡, 如石頭、剪子、布游戲 q對(duì)占優(yōu)均衡概念稍加擴(kuò)展,就得到重復(fù) 剔除嚴(yán)劣策略均衡概念 53 選舉實(shí)例選舉實(shí)例 q中間選民定理 54 重復(fù)剔除嚴(yán)劣策略均衡重復(fù)剔除嚴(yán)劣策略均衡

23、 q“嚴(yán)劣”和“弱劣”的含義: v 設(shè) si和si是參與人i可選擇的兩個(gè)策略, 若對(duì)其他參與人的任意策略組合s-i, 均成立 ui(si, s-i) ui(si, s-i), 則說策略si嚴(yán)劣于策略si 。 v上面式子中,若將“”改為“”,則說策 略si弱劣于策略si 。 55 重復(fù)剔除嚴(yán)劣策略均衡重復(fù)剔除嚴(yán)劣策略均衡 q重復(fù)剔除嚴(yán)劣策略均衡的定義 v重復(fù)剔除嚴(yán)格策略就是各參與人在其各自 策略集中,不斷剔除嚴(yán)劣策略 v如果最終各參與人僅剩下一個(gè)策略,則該 策略組合就被稱為重復(fù)剔除嚴(yán)劣策略均衡。 56 重復(fù)剔除嚴(yán)劣策略均衡重復(fù)剔除嚴(yán)劣策略均衡 q實(shí)例 一個(gè)虛擬的博弈,見圖1-4。 v該博弈不存在

24、占優(yōu)均衡。 參參 與與 人人 1 參參 與與 人人 2 上上 下下 左左 中中 右右 1, 01, 30, 1 0, 40, 22, 0 圖圖 1-4 57 重復(fù)剔除嚴(yán)劣策略均衡重復(fù)剔除嚴(yán)劣策略均衡 v可用重復(fù)剔除嚴(yán)劣策略的方法,得到重復(fù) 剔除嚴(yán)劣策略均衡解 參參 與與 人人 1 參參 與與 人人 2 上上 下下 左左 中中 右右 1, 01, 30, 1 0, 40, 22, 0 圖圖 1-4 58 重復(fù)剔除嚴(yán)劣策略均衡重復(fù)剔除嚴(yán)劣策略均衡 v先從參與人2開始 v顯然,策略“中”要嚴(yán)格優(yōu)于策略“右”,因此, 參與人2應(yīng)該剔除嚴(yán)劣策略“右”,博弈簡(jiǎn)化為圖 1-5 參參 與與 人人 1 參參 與與 人人 2 上上 下下 左左 中中 右右 1, 01, 30, 1 0, 40, 22, 0 圖圖 1-4 59 重復(fù)剔除嚴(yán)劣策略均衡重復(fù)剔除嚴(yán)劣策略均衡 v先從參與人2開始 v顯然,策略“中”要嚴(yán)格優(yōu)于策略“右”,因此, 參與人2應(yīng)該剔除嚴(yán)劣策略“

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論