![第12章博弈論_第1頁](http://file2.renrendoc.com/fileroot_temp3/2021-11/5/72cbad2f-e535-40c4-a910-fa8a2f0c8b5b/72cbad2f-e535-40c4-a910-fa8a2f0c8b5b1.gif)
![第12章博弈論_第2頁](http://file2.renrendoc.com/fileroot_temp3/2021-11/5/72cbad2f-e535-40c4-a910-fa8a2f0c8b5b/72cbad2f-e535-40c4-a910-fa8a2f0c8b5b2.gif)
![第12章博弈論_第3頁](http://file2.renrendoc.com/fileroot_temp3/2021-11/5/72cbad2f-e535-40c4-a910-fa8a2f0c8b5b/72cbad2f-e535-40c4-a910-fa8a2f0c8b5b3.gif)
![第12章博弈論_第4頁](http://file2.renrendoc.com/fileroot_temp3/2021-11/5/72cbad2f-e535-40c4-a910-fa8a2f0c8b5b/72cbad2f-e535-40c4-a910-fa8a2f0c8b5b4.gif)
![第12章博弈論_第5頁](http://file2.renrendoc.com/fileroot_temp3/2021-11/5/72cbad2f-e535-40c4-a910-fa8a2f0c8b5b/72cbad2f-e535-40c4-a910-fa8a2f0c8b5b5.gif)
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、 第第1212章章 博弈論博弈論 Game Theory 幾個(gè)博弈的例子:1.高考填報(bào)志愿2.外交談判3.企業(yè)合作與競爭4.金融危機(jī)5.就業(yè) “要想在現(xiàn)代社會做一個(gè)有文化的人,你必須對博弈論有一個(gè)大致了解” 保羅薩繆爾森一.什么是“博弈” “博弈論”譯自英文“Game Theory”?!癎ame”的基本意義是游戲,因此“Game Theory”直譯應(yīng)該是“游戲理論”。 博弈即一些個(gè)人、隊(duì)組或其他組織,面對一定的環(huán)境條件,在一定的規(guī)則下,同時(shí)或先后,一次或多次,從各自允許選擇的行為或策略中進(jìn)行選擇并加以實(shí)施,各自取得相應(yīng)結(jié)果的過程。 博弈論(Game Theory,又名對策論)是一門以數(shù)學(xué)為基礎(chǔ)
2、的、研究對抗沖突中最優(yōu)解決問題的學(xué)科,更確切地說是運(yùn)籌學(xué)的一個(gè)分支,開山鼻祖是數(shù)學(xué)家、計(jì)算機(jī)的發(fā)明者馮諾意曼(Von neumann)。他是一位出生于匈牙利的天才的數(shù)學(xué)家。他不僅創(chuàng)立了經(jīng)濟(jì)博弈論,而且發(fā)明了計(jì)算機(jī)。 博弈論是人們深刻理解諸如經(jīng)濟(jì)行為和社會問題的基礎(chǔ)。現(xiàn)在人們所說的博弈論,一般指非合作博弈論。非合作博弈強(qiáng)調(diào)的是個(gè)人理性、個(gè)人最優(yōu)決策, 其結(jié)果可能是有效率的,也可能是無效率的。它的特征是:人們行為相互作用時(shí),行為人不能達(dá)成一個(gè)有約束力的協(xié)議。或者說,行為人之間的合約對于簽約人沒有實(shí)質(zhì)性約束力。然而,在各種生活行為中,人與人之間除了競爭關(guān)系,還存在合作關(guān)系,常常是兩種關(guān)系并存,合理的
3、合作能夠給雙方帶來共同利益。這是合作型博弈論研究的范疇。 博弈論的應(yīng)用非常廣泛, 利用博弈論可以證明現(xiàn)實(shí)生活中許多有趣的問題。如:多勞者不多得,公共資源的過度使用,非合作者在一段時(shí)間內(nèi)選擇合作。雖然這些結(jié)論都是建立在一個(gè)很強(qiáng)的假設(shè),即參與人是理性的,有最大化自己效用的趨勢。但是其結(jié)論有深刻的哲學(xué)內(nèi)涵。目前經(jīng)濟(jì)學(xué)中的委托代理制、激勵(lì)理論都可以用博弈論來分析?,F(xiàn)代的企業(yè)間競爭有很多情況都是在合作的背景下進(jìn)行的。 博弈論目前在生物學(xué),經(jīng)濟(jì)學(xué),國際關(guān)系,計(jì)算機(jī)科學(xué), 政治學(xué),軍事戰(zhàn)略和其他很多學(xué)科都有廣泛的應(yīng)用。 此外,博弈論也應(yīng)用于數(shù)學(xué)的其他分支,如概率,統(tǒng)計(jì)和線性規(guī)劃等。 二.博弈的標(biāo)準(zhǔn)式表達(dá) 博
4、弈的標(biāo)準(zhǔn)式表達(dá)包括以下八個(gè)方面:1. 博弈的參與者(Players) 2. 各博弈方各自可選擇的全部策略(Strategies)或行為(Actions)的集合 3. 進(jìn)行博弈的次序(Orders) 4. 博弈方的得益(Payoffs)5.博弈行為(action) 6.博弈信息(information) 7.結(jié)果(outcome)8.均衡(equilibrium) 三三. 經(jīng)典的博弈模型經(jīng)典的博弈模型1 1、“囚徒的困境囚徒的困境” ” ( (Prisoners Dilemma) 關(guān)于博弈論,流傳最廣的是一個(gè)叫做關(guān)于博弈論,流傳最廣的是一個(gè)叫做“囚徒困境囚徒困境”的故事??梢哉f凡是講博弈論,都會
5、說到這個(gè)經(jīng)典的的故事??梢哉f凡是講博弈論,都會說到這個(gè)經(jīng)典的博弈模型。博弈模型。 (1950年,數(shù)學(xué)家塔克任斯坦福大學(xué)客座教授,在給一些心理學(xué)家作講演時(shí),講到兩個(gè)囚犯的故事。) 假設(shè)有兩個(gè)小偷A(chǔ)和B聯(lián)合犯事、私入民宅被警察抓住。警方將兩人分別置于不同的兩個(gè)房間內(nèi)進(jìn)行審訊,對每一個(gè)犯罪嫌疑人,警方給出的政策是:如果一個(gè)犯罪嫌疑人坦白了罪行,交出了贓物,于是證據(jù)確鑿,兩人都被判有罪。如果另一個(gè)犯罪嫌疑人也作了坦白,則兩人各被判刑8年;如果另一個(gè)犯罪嫌人沒有坦白而是抵賴,則以妨礙公務(wù)罪(因已有證據(jù)表明其有罪)再加刑2年,而坦白者有功被減刑8年,立即釋放。如果兩人都抵賴,則警方因證據(jù)不足不能判兩人的偷
6、竊罪,但可以私入民宅的罪名將兩人各判入獄1年。 博弈的支付矩陣博弈矩陣 B坦白 B抵賴A坦白-8,-8 0,-10A抵賴-10,0-1,-1囚徒1:坦白囚徒2:坦白 這兩個(gè)人都會有這樣一個(gè)盤算過程:假如他坦白,我抵賴,得坐10年監(jiān)獄,坦白最多才8年;他要是抵賴,我就可以被釋放,而他會坐10年牢。綜合以上幾種情況考慮,不管他坦白與否,對我而言都是坦白了劃算。兩個(gè)人都會動這樣的腦筋,最終,兩個(gè)人都選擇了坦白,結(jié)果都被判8年刑期。 這樣兩人都選擇坦白的策略以及因此被判8年的結(jié)局被稱為“納什均衡”,也叫非合作均衡。 囚徒困境的啟示囚徒困境的啟示 “囚徒的兩難選擇”有著廣泛而深刻的意義。個(gè)人理性與集體理
7、性的沖突,各人追求利己行為而導(dǎo)致的最終結(jié)局是一個(gè)“納什均衡”,也是對所有人都不利的結(jié)局。他們兩人都是在坦白與抵賴策略上首先想到自己,這樣他們必然要服長的刑期。只有當(dāng)他們都首先替對方著想時(shí),或者相互合謀(串供)時(shí),才可以得到最短時(shí)間的監(jiān)禁的結(jié)果。 “納什均衡”對亞當(dāng)斯密的“看不見的手”的原理提出挑戰(zhàn)。按照斯密的理論,在市場經(jīng)濟(jì)中,每一個(gè)人都從利己的目的出發(fā),而最終全社會達(dá)到利他的效果。國富論中有這樣一句名言:“通過追求(個(gè)人的)自身利益,他常常會比其實(shí)際上想做的那樣更有效地促進(jìn)社會利益。從“納什均衡”我們引出了“看不見的手”的原理的一個(gè)悖論:從利己目的出發(fā),結(jié)果損人不利己,既不利己也不利他。兩個(gè)
8、囚徒的命運(yùn)就是如此。 可以說,“納什均衡”提出的悖論實(shí)際上動搖了西方經(jīng)濟(jì)學(xué)的基石。從“納什均衡”中我們還可以悟出一條真理:合作是有利的“利己策略”。但它必須符合以下黃金律:按照你愿意別人對你的方式來對別人,但只有他們也按同樣方式行事才行。也就是中國人說的“己所不欲勿施于人”。但前提是人所不欲勿施于我。2 . 猜硬幣游戲猜硬幣游戲-1, 11, -11, -1-1, 1正 面反 面猜猜 方方蓋蓋方方正 面反 面3. “田忌賽馬田忌賽馬” “田忌賽馬”是我國古代一個(gè)非常有名的故事,講的是發(fā)生在齊威王與大將田忌之間的賽馬的故事。田忌在謀士孫臏的幫助下,運(yùn)用謀略幫助田忌以弱勝強(qiáng)戰(zhàn)勝了齊威王。這個(gè)故事講
9、的其實(shí)是一個(gè)很典型的博弈問題。3,-31,-11,-11,-1-1,11,-11,-13,-31,-11,-11,-1-1,11,-1-1,13,-31,-11,-11,-1-1,11,-1,1,-13,-31,-11,-11,-11,-11,-1-1,13,-31,-11,-11,-1-1,11,-11,-13,-3上中下上下中中上下中下上下上中下中上上中下上下中中上下中下上下上中下中上田田 忌忌齊齊威威王王得益矩陣得益矩陣 在這個(gè)博弈中齊威王和田忌應(yīng)該怎樣選擇自己的策略,才能最終獲得滿意的結(jié)果呢? 首先,作為博弈方的齊威王和田忌不能讓對方知道或猜中自己的策略,從而導(dǎo)致自己輸?shù)舯荣悺_@也意味
10、著任何一方的策略選擇不能一成不變,或者不能有規(guī)律性地變動,即必須以隨機(jī)的方式選擇策略,否則一旦對方捕捉到這種規(guī)律性的變動,就可以針對性地采取應(yīng)對措施。 其次,無論對齊威王還是田忌,可選擇的六種策略之間沒有優(yōu)劣之分。從圖可以看出,對齊威王來說,每一種策略都可能有六種不同的結(jié)果,究竟最終得到哪種結(jié)果,主要看對方策略與自己策略的對應(yīng)狀況,而不是自己的策略本身。同樣的,對田忌來講六種策略本身也無好壞之分。因此,兩博弈方在決策時(shí)對自已的可選策略并無偏好,應(yīng)以相同的概率選用。 第三節(jié)第三節(jié) 博弈結(jié)構(gòu)和博弈的分類博弈結(jié)構(gòu)和博弈的分類一、博弈的分類一、博弈的分類(Types) 1.如果按照博弈者的先后順序,博
11、弈持續(xù)的時(shí)間和重復(fù)的次數(shù)進(jìn)行分類,博弈可以劃分為靜態(tài)博弈(Static game)和動態(tài)博弈(Dynamic Game)。 靜態(tài)博弈是指這樣一種博弈,在這種博弈中,博弈者同時(shí)采取行動,同時(shí)進(jìn)行策略決定,博弈者所獲得的支付依賴于他們所采取的不同的策略組合情況。因此,我們也靜態(tài)博弈稱為“同時(shí)行動的博弈”(Simultaneous-Move Games)?;蛘弑M管博弈者的行動有先后順序,但后行動的人不知道先采取行動的人采取的是什么行動。如“囚徒困境”就是如此。再比如工程招標(biāo),不同的投標(biāo)者投標(biāo)的時(shí)間也許不同,但只要互相不知道對方的報(bào)價(jià),則是同時(shí)行動。 動態(tài)博弈是指在博弈中,博弈者的行動有先后順序(Se
12、quential-Move),且后行動者能夠觀察到先行動者所選擇的行動或策略,因此, 動態(tài)博弈又叫做序貫博弈。 2.如果按照博弈者對其他博弈者所掌握的信息的完全與完備程度進(jìn)行分類,博弈可以劃分為完全信息博弈(Game with Complete Information)與不完全信息的博弈(Game with Incomplete Information),以及完美信息的博弈(Game with Perfect Information)與不完美信息的博弈(Game with Imperfect Information),確定的博弈(Game of Certainty)與不確定的博弈(Game o
13、f Uncertainty),對稱信息的博弈(Game of Symmetric Information)與非對稱信息的博弈(Game of Asymmetric Information)等。 行動次序信息靜態(tài)動態(tài)完全信息納什均衡子博弈精練納什均衡不完全信息貝葉斯均衡精煉貝葉斯均衡 博弈的分類和均衡博弈的分類和均衡 信息是博弈論中重要的內(nèi)容。 完全博弈是指在博弈過程中,每一位博弈者對其他博弈者的特征、策略空間及收益函數(shù)有準(zhǔn)確的信息。嚴(yán)格地講,完全信息博弈是指博弈者的策略空間及策略組合下的支付,是博弈中所有博弈者的“公共知識”(Commom Knowledge)的博弈。 完美信息是指博弈者完全清
14、楚到他決策時(shí)為止時(shí), 所有其他博弈者的所有決策信息,或者說,了解博弈已進(jìn)行過程的所有信息。 3.如果博弈者對其他博弈者的特征、策略空間及收益函數(shù)信息了解的不夠準(zhǔn)確、或者不是對所有博弈者的特征、策略空間及收益函數(shù)都有準(zhǔn)確的信息,在這種情況下進(jìn)行的博弈就是不完全信息博弈。對于不完全信息博弈,博弈者所做的是努力使自己的期望支付或期望效用最大化。 在不完全信息的博弈中,首先行動的是自然(Nature),自然決定了博弈者以多大的可能性采取某種行動,由自然決定的每個(gè)博弈者以多大的可能性采取某種行動的情況只有每個(gè)博弈者個(gè)人知道,其他博弈者都不知道。確定的博弈是指不存在由自然作出行動的博弈,否則就是不確定的博
15、弈。 4.如果按照博弈者之間是否存在合作進(jìn)行分類,博弈可以劃分為合作博弈(Cooperative Game)和非合作博弈(Non-Cooperative Game)。合作博弈是指博弈者之間有著一個(gè)對各方具有約束力的協(xié)議,博弈者在協(xié)議范圍內(nèi)進(jìn)行的博弈。人們分工與交換的經(jīng)濟(jì)活動就是合作性的博弈。如果博弈者無法通過談判達(dá)成一個(gè)有約束的契約來限制博弈者的行為,那么這個(gè)博弈為非合作博弈。典型的合作博弈是寡頭企業(yè)之間的串謀(Collusion)。 串謀是指企業(yè)之間通過公開或暗地里簽訂協(xié)議,對各自的價(jià)格或產(chǎn)量進(jìn)行限制,以達(dá)到獲取更多壟斷利潤的行為。后面將會繼續(xù)討論的囚徒困境和將要討論的公共資源悲劇都是非合作
16、性的博弈。 根據(jù)博弈者支付的情況,有以下分類: 5.零和博弈(Zero-Sum Game)和非零和博弈(Non-Zero-Sum Game)。如果一個(gè)博弈在所有對局情況下全體參與人的得益之和總為0,這個(gè)博弈就叫做零和博弈; 如果一個(gè)博弈在所有對局情況下全體參與人的得益之和不為0,這個(gè)博弈就叫做非零和博弈。 6.常和博弈(Constant-Sum Game)和變和博弈(Variable-Sum Game)。如果一個(gè)博弈在所有對局情況下全體參與人的得益之和總為一個(gè)常數(shù),這個(gè)博弈就叫做常和博弈; 如果一個(gè)博弈在所有對局情況下全體參與人的得益之和不總是一個(gè)常數(shù),這個(gè)博弈就叫做變和博弈。二、博弈中的博弈
17、方二、博弈中的博弈方1.單人博弈 單人博弈即只有一個(gè)博弈方的博弈。嚴(yán)格地講,單人博弈已經(jīng)退化為一般的最優(yōu)化問題,因此不屬于博弈論研究的目標(biāo)對象。不過討論單人博弈還是有價(jià)值的,因?yàn)榘▎稳瞬┺目梢允共┺睦碚摰慕Y(jié)構(gòu)更加完整,如同集合里面的完整,它使集合理論的結(jié)構(gòu)更完整。 一個(gè)單人博弈例子的例子 有一個(gè)商人需要將一批商品從武漢向上海運(yùn)輸,從武漢到上海運(yùn)輸有水、陸兩條路線,走陸路運(yùn)輸成本為10000元,走水路的運(yùn)輸成本為6000元。走陸路比較安全,走水路則有一定的風(fēng)險(xiǎn),如果遇到惡劣天氣將會造成這批貨物總價(jià)值10%的損失。假設(shè)已知該批貨物的總價(jià)值為100000元,運(yùn)輸期間出現(xiàn)暴風(fēng)雨天氣的概率為20%,問
18、該商人該選擇哪條運(yùn)輸路線?0 武漢武漢 1 武漢武漢海海壞天氣(壞天氣(20%)好天氣(好天氣(80%)上海(-0.6)(-1.0)(-1.6)(-1.0)上海 在本博弈中,供應(yīng)商走水路時(shí),得益為-0.6的概率為80%(好天氣),得益為-1.6的概率為20%(壞天氣),因此走水路的期望得益為(-0.6)80%(-1.6)20%=-0.8;走陸路時(shí),得益是確定的-1。因?yàn)?0.8-1,即走水路的期望費(fèi)用0.8小于走陸路的費(fèi)用1,所以供應(yīng)商還是應(yīng)該選擇走水路。若多次碰到同樣的決策選擇并每次都作這樣的選擇,則平均每次的運(yùn)輸成本應(yīng)接近0.8。 2.雙人博弈 雙人博弈就是兩個(gè)各自獨(dú)立決策,但策略和利益具有相互依存關(guān)系的博弈方的決策問題。雙人博弈是博弈問題中最常見,也是研究得最多的博弈類型。 3.多人博弈 有三個(gè)或三個(gè)以上博弈方參加的博弈稱為“多人博弈”。 多人博弈中的“破壞者” 三、博弈中的策略三、博弈中的
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年玻璃工藝家具項(xiàng)目可行性研究報(bào)告
- 2025年臥式破碎機(jī)項(xiàng)目可行性研究報(bào)告
- 2025年美甲師工作服項(xiàng)目可行性研究報(bào)告
- 2025年汽車保護(hù)架項(xiàng)目可行性研究報(bào)告
- 2025年掌上電腦保護(hù)套項(xiàng)目可行性研究報(bào)告
- 2025年開循環(huán)制冷平臺項(xiàng)目可行性研究報(bào)告
- 2025年丁腈聚氯乙烯防波軟管項(xiàng)目可行性研究報(bào)告
- 科技改變生活家庭理財(cái)新模式探索
- 校園安全文化建設(shè)的核心環(huán)節(jié)-加強(qiáng)校車停車位管理
- 城市公共衛(wèi)生系統(tǒng)的構(gòu)建與優(yōu)化-深度研究
- 四川省自貢市2024-2025學(xué)年上學(xué)期八年級英語期末試題(含答案無聽力音頻及原文)
- 2025-2030年中國汽車防滑鏈行業(yè)競爭格局展望及投資策略分析報(bào)告新版
- 2025年上海用人單位勞動合同(4篇)
- 新疆烏魯木齊地區(qū)2025年高三年級第一次質(zhì)量監(jiān)測生物學(xué)試卷(含答案)
- 衛(wèi)生服務(wù)個(gè)人基本信息表
- 高中英語北師大版必修第一冊全冊單詞表(按單元編排)
- 苗圃建設(shè)項(xiàng)目施工組織設(shè)計(jì)范本
- 廣東省湛江市廉江市2023-2024學(xué)年八年級上學(xué)期期末考試數(shù)學(xué)試卷(含答案)
- 通用電子嘉賓禮薄
- 技能大賽題庫(空分)
- 污水處理廠設(shè)備的操作規(guī)程(完整版)
評論
0/150
提交評論