版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、第一節(jié)第一節(jié) 博弈論的基本概念與分類博弈論的基本概念與分類 第二節(jié)第二節(jié) 完全信息博弈完全信息博弈第三節(jié)第三節(jié) 不完全信息博弈不完全信息博弈( (自學)自學)第九章第九章 博弈論博弈論- -無處不在的游戲“要想在現(xiàn)代社會做一個有文化的人,你要想在現(xiàn)代社會做一個有文化的人,你必須對博弈論有一個大致了解必須對博弈論有一個大致了解”。 保羅保羅薩繆爾薩繆爾森森 一、博弈論的基本概念一、博弈論的基本概念 1 1 、 定 義 :定 義 : 博 弈 論 (博 弈 論 ( g a m e g a m e theorytheory),又稱對策論,),又稱對策論,是研究相是研究相互依賴、相互影響的決策主體的理互
2、依賴、相互影響的決策主體的理性決策行為以及這些決策的均衡結(jié)性決策行為以及這些決策的均衡結(jié)果的理論。果的理論。第一節(jié)第一節(jié) 博弈論的博弈論的基本概念與分類基本概念與分類通俗地講,通俗地講,博弈論是一種博弈論是一種“游戲理游戲理論論”。其準確的定義是:其準確的定義是:一些個人、一些個人、團隊或其他組織,面對一定的環(huán)境團隊或其他組織,面對一定的環(huán)境條件,在一定的規(guī)則約束下,依靠條件,在一定的規(guī)則約束下,依靠所掌握的信息,同時或先后,一次所掌握的信息,同時或先后,一次或多次,從各自允許選擇的行為或或多次,從各自允許選擇的行為或策略進行選擇并加以實施,并從中策略進行選擇并加以實施,并從中各自取得相應結(jié)果
3、或收益的過程。各自取得相應結(jié)果或收益的過程。續(xù)上頁續(xù)上頁2 2、博弈論的演進博弈論的演進(1 1)早期博弈論的萌芽)早期博弈論的萌芽(田忌賽馬)(田忌賽馬) (2 2)合作型博弈(馮)合作型博弈(馮諾依曼與摩根諾依曼與摩根斯特恩于斯特恩于19441944年合著年合著博弈論和經(jīng)濟行博弈論和經(jīng)濟行為為););(3 3)非合作博弈(納什均衡);)非合作博弈(納什均衡);(4 4)2020世紀世紀5050年代以后,澤爾騰、海年代以后,澤爾騰、海薩尼等人對博弈論作了進一步的完善,薩尼等人對博弈論作了進一步的完善,使之更為實用。使之更為實用。附:納什其人附:納什其人3、博弈論模型簡介博弈論模型簡介博弈論模
4、型可以用五博弈論模型可以用五個方面來描述個方面來描述 GP,A,S,I,U P(player): 為局中人,博弈的參與者,為局中人,博弈的參與者,也稱為也稱為“博弈方博弈方”,局中人以最終實現(xiàn)自身,局中人以最終實現(xiàn)自身利益最大化為目標。利益最大化為目標。 A(action) :為各局中人的所有可能的策略或為各局中人的所有可能的策略或行動的集合。行動的集合。根據(jù)該集合是有限還是無限,根據(jù)該集合是有限還是無限,可分為有限博弈和無限博弈??煞譃橛邢薏┺暮蜔o限博弈。S(strategies) :博弈的進程,也是博弈進行的:博弈的進程,也是博弈進行的次序。次序。靜態(tài)博弈與動態(tài)博弈。靜態(tài)博弈與動態(tài)博弈。
5、I(information) :博弈信息,如果博弈各方:博弈信息,如果博弈各方對各種局勢下所有局中人的得益狀況完全對各種局勢下所有局中人的得益狀況完全清楚,稱之為清楚,稱之為完全信息博弈完全信息博弈。反之為。反之為不完不完全信息博弈。全信息博弈。 U:為局中人獲得利益,也是博弈各方追為局中人獲得利益,也是博弈各方追求的最終目標。根據(jù)各方得益的不同情況,求的最終目標。根據(jù)各方得益的不同情況,分為分為零和博弈和變和博弈零和博弈和變和博弈。二、博弈的分類二、博弈的分類1 1、按照、按照參與人之間是否合作參與人之間是否合作進行分類,博弈進行分類,博弈可分為可分為合作博弈和非合作博弈。合作博弈和非合作博
6、弈。合作博弈合作博弈是指參與人之間有著一個對各方具是指參與人之間有著一個對各方具有約束力的協(xié)議,參與人在協(xié)議范圍內(nèi)進行有約束力的協(xié)議,參與人在協(xié)議范圍內(nèi)進行的博弈。反之,就是非合作博弈。的博弈。反之,就是非合作博弈。前者前者主要強調(diào)的是團體理性;主要強調(diào)的是團體理性;而后者而后者主要研主要研究人們在利益相互影響的局勢中如何選擇策究人們在利益相互影響的局勢中如何選擇策略使得自己的收益最大,即策略選擇問題,略使得自己的收益最大,即策略選擇問題,強調(diào)的是個人理性。強調(diào)的是個人理性。2 2、在非合作博弈中,按照、在非合作博弈中,按照參與人的先后順參與人的先后順序序進行分類,又可分為進行分類,又可分為靜
7、態(tài)博弈和動態(tài)博靜態(tài)博弈和動態(tài)博弈。弈。靜態(tài)博弈靜態(tài)博弈是指,博弈中參與人同時選擇行是指,博弈中參與人同時選擇行動;或者雖非同時行動,但行動在后者并動;或者雖非同時行動,但行動在后者并不知道行動在先者采取了什么具體行動。不知道行動在先者采取了什么具體行動。動態(tài)博弈動態(tài)博弈是指參與人的行動有先后順序,是指參與人的行動有先后順序,而且行動在后者可以觀察到行動在先者的而且行動在后者可以觀察到行動在先者的選擇,并據(jù)此作出相應的選擇。選擇,并據(jù)此作出相應的選擇。3 3、按照按照參與人對其他參與人的了解程度參與人對其他參與人的了解程度進進行分類,博弈可分為行分類,博弈可分為完全信息博弈和不完完全信息博弈和不
8、完全信息博弈全信息博弈。n完全信息博弈完全信息博弈是指:是指:在每個參與人對所有在每個參與人對所有其他參與人的特征、戰(zhàn)略和支付函數(shù)都有其他參與人的特征、戰(zhàn)略和支付函數(shù)都有精確了解的情況下,所進行的博弈。精確了解的情況下,所進行的博弈。n如果了解得不夠精確,或者不是對所有的如果了解得不夠精確,或者不是對所有的參與人都有精確的了解,在這種情況下進參與人都有精確的了解,在這種情況下進行的博弈就是行的博弈就是不完全博弈不完全博弈。 第一節(jié)第一節(jié) 博弈論的博弈論的基本概念與分類基本概念與分類博弈的分類及對應的均衡概念博弈的分類及對應的均衡概念 第一節(jié)第一節(jié) 博弈論的博弈論的基本概念與分類基本概念與分類行
9、動順序行動順序完全信息完全信息動動 態(tài)態(tài)靜靜 態(tài)態(tài)不完全信息不完全信息完全信息靜態(tài)博弈完全信息靜態(tài)博弈信信 息息不完全信息靜態(tài)博弈不完全信息靜態(tài)博弈完全信息動態(tài)博弈完全信息動態(tài)博弈不完全信息動態(tài)博弈不完全信息動態(tài)博弈納什均衡納什均衡貝葉斯納什均衡貝葉斯納什均衡精煉貝葉斯納什均衡精煉貝葉斯納什均衡子博弈精煉納什均衡子博弈精煉納什均衡一、完全信息靜態(tài)博弈一、完全信息靜態(tài)博弈二、二、完全信息動態(tài)博弈完全信息動態(tài)博弈第二節(jié)第二節(jié) 完全信息完全信息博弈博弈一、完全信息靜態(tài)博弈:一、完全信息靜態(tài)博弈:納什博弈論的原理與應用納什博弈論的原理與應用 、占優(yōu)策略均衡、占優(yōu)策略均衡無論其他參與人如無論其他參與人如
10、何選擇自己的策略,該參與人的最優(yōu)策略何選擇自己的策略,該參與人的最優(yōu)策略選擇是惟一的。選擇是惟一的。(1 1)經(jīng)典案例經(jīng)典案例: :囚徒困境囚徒困境 “ “囚犯困境囚犯困境”講的是兩個同案犯罪嫌疑犯講的是兩個同案犯罪嫌疑犯(囚徒)被警方拘捕后,為防其相互間串(囚徒)被警方拘捕后,為防其相互間串供,而分別拘捕、隔離審問時,兩疑犯所供,而分別拘捕、隔離審問時,兩疑犯所面臨的認罪策略選擇的問題。面臨的認罪策略選擇的問題。 囚徒B坦白 抵賴囚徒A坦白抵賴8,81,1010, 1 2 ,2n在博弈中,如果所有的參與人都有占優(yōu)戰(zhàn)略存在博弈中,如果所有的參與人都有占優(yōu)戰(zhàn)略存在,因而博弈將在所有參與人的占優(yōu)戰(zhàn)
11、略的基礎在,因而博弈將在所有參與人的占優(yōu)戰(zhàn)略的基礎上達到均衡。這種均衡稱為上達到均衡。這種均衡稱為占優(yōu)戰(zhàn)略均衡占優(yōu)戰(zhàn)略均衡。在上。在上表中的表中的“A A坦白坦白,B,B也坦白也坦白”就是占優(yōu)戰(zhàn)略均衡就是占優(yōu)戰(zhàn)略均衡(2 2)條件:)條件:占優(yōu)策略雖然要求每個參與人是理占優(yōu)策略雖然要求每個參與人是理性的,但并不要求每個參與人知道其他參與人也性的,但并不要求每個參與人知道其他參與人也是理性的。是理性的。(3 3) “ “囚犯困境囚犯困境”的意義:的意義:首先首先對亞當對亞當斯密的斯密的“看不見的手看不見的手”的原理的原理提出挑戰(zhàn)。提出挑戰(zhàn)。個人理性與集體理性的沖突。個人理性與集體理性的沖突。按照
12、斯密的理論,在市場經(jīng)濟中,每一個人都從按照斯密的理論,在市場經(jīng)濟中,每一個人都從利己的目的出發(fā),而最終全社會達到利他的效果。利己的目的出發(fā),而最終全社會達到利他的效果。從從“納什均衡納什均衡”引出一個悖論:從利己目的出發(fā),引出一個悖論:從利己目的出發(fā),結(jié)果損人不利己。兩個囚徒的命運就是如此。從結(jié)果損人不利己。兩個囚徒的命運就是如此。從這個意義上說,這個意義上說,“納什均衡納什均衡”提出的悖論實際上提出的悖論實際上動搖了西方經(jīng)濟學的基石動搖了西方經(jīng)濟學的基石 。 其次其次可悟出一條真理:合作是有利的可悟出一條真理:合作是有利的“利己利己策略策略”。 (4 4)應用:)應用:奧爾森奧爾森的的集體行
13、動的邏輯集體行動的邏輯多人囚犯兩難博弈多人囚犯兩難博弈 (n-person (n-person prisoners dilemma games)prisoners dilemma games),成為,成為非合作博弈論的一個重要分支。非合作博弈論的一個重要分支。 重復剔除的占優(yōu)策略均衡重復剔除的占優(yōu)策略均衡(1 1)智豬博弈)智豬博弈 按按鈕對于吃食量的影響按按鈕對于吃食量的影響第二節(jié)第二節(jié) 完全信息完全信息博弈博弈按按鈕的豬按按鈕的豬 吃到的豬食數(shù)量大豬大豬 小豬小豬 大豬大豬4單位4單位 小豬7單位1單位兩豬同時5單位3單位智豬博弈智豬博弈第二節(jié)第二節(jié) 完全信息完全信息博弈博弈小豬按按鈕等待
14、大豬按按鈕 3, 1 2,4等待 7,1 0,0重復剔除的占優(yōu)策略均衡重復剔除的占優(yōu)策略均衡首先找出某參與人的嚴首先找出某參與人的嚴格劣策略,將它剔除,重新構(gòu)造一個不包括已剔除策略的格劣策略,將它剔除,重新構(gòu)造一個不包括已剔除策略的新博弈;然后,繼續(xù)剔除這個新的博弈中某一參與人的嚴新博弈;然后,繼續(xù)剔除這個新的博弈中某一參與人的嚴格劣策略;重復進行這一過程,直到剩下惟一的參與人策格劣策略;重復進行這一過程,直到剩下惟一的參與人策略組合為止。剩下的這個惟一的參與人組合,就是這個博略組合為止。剩下的這個惟一的參與人組合,就是這個博弈的均衡解弈的均衡解。嚴格劣策略:嚴格劣策略:是指在博弈中,不論其他
15、參與人采取什么策是指在博弈中,不論其他參與人采取什么策略,某一參與人可能采取的策略中,對自己嚴格不利的策略,某一參與人可能采取的策略中,對自己嚴格不利的策略。略。(2 2)應用)應用: :集體行動出現(xiàn)的條件之一集體行動出現(xiàn)的條件之一是集體成員是集體成員的不對稱。的不對稱。 第二節(jié)第二節(jié) 完全信息完全信息博弈博弈3 3納什均衡納什均衡在這一均衡中,每個參與人都確信,在這一均衡中,每個參與人都確信,在給定其他參與人戰(zhàn)略決定的情況下,在給定其他參與人戰(zhàn)略決定的情況下,他選擇了最優(yōu)戰(zhàn)略以回應對手的戰(zhàn)略。他選擇了最優(yōu)戰(zhàn)略以回應對手的戰(zhàn)略。納什均衡是完全信息靜態(tài)博弈解的一般納什均衡是完全信息靜態(tài)博弈解的一
16、般情況。情況。第二節(jié)第二節(jié) 完全信息完全信息博弈博弈性性 別別 戰(zhàn)戰(zhàn)第二節(jié)第二節(jié) 完全信息完全信息博弈博弈女方看足球逛商場男方看足球3,10,0逛商場0,01,3第二節(jié)第二節(jié) 完全信息完全信息博弈博弈一、完全信息動態(tài)博弈:一、完全信息動態(tài)博弈:、子博弈精練納什均衡子博弈精練納什均衡n 房地產(chǎn)開發(fā)博弈(靜態(tài))房地產(chǎn)開發(fā)博弈(靜態(tài)) B 開發(fā) 不開發(fā) A開發(fā)不開發(fā)3,3 1,0 0, 1 0,0第二節(jié)第二節(jié) 完全信息完全信息博弈博弈在行動開始前的在行動開始前的A A看來,如果不計得失,看來,如果不計得失,B B有有四種戰(zhàn)略可選擇。四種戰(zhàn)略可選擇。 第一第一,無論,無論A A是否開發(fā),是否開發(fā),B
17、B都要開發(fā)。都要開發(fā)。 第二第二,如果,如果A A開發(fā),開發(fā),B B也開發(fā);如果也開發(fā);如果A A不不開發(fā),開發(fā),B B也不開發(fā)。也不開發(fā)。 第三第三,如果,如果A A開發(fā),開發(fā),B B就不開發(fā);如果就不開發(fā);如果A A不開發(fā)不開發(fā) ,B B就開發(fā)。就開發(fā)。 第四第四,無論,無論A A是否開發(fā),是否開發(fā),B B必定開發(fā)。必定開發(fā)。第二節(jié)第二節(jié) 完全信息完全信息博弈博弈先行動者先行動者A A對對B B預測結(jié)果的收益矩陣預測結(jié)果的收益矩陣 B開發(fā),開發(fā) 開發(fā),不開發(fā) 不開發(fā),開發(fā) 不開發(fā),不開發(fā) A開 發(fā)不開發(fā)3,3 3, 3 1, 0 1,0 0, 1 0, 0 0, 1 0,0第二節(jié)第二節(jié) 完
18、全信息完全信息博弈博弈 只有當某一戰(zhàn)略組合在每一個子博弈上都只有當某一戰(zhàn)略組合在每一個子博弈上都構(gòu)成一個納什均衡,這一戰(zhàn)略組合才是構(gòu)成一個納什均衡,這一戰(zhàn)略組合才是子子博弈精練納什均衡。博弈精練納什均衡。第二節(jié)第二節(jié) 完全信息完全信息博弈博弈2 2、重復博弈、重復博弈(1 1)定義:是指同樣結(jié)構(gòu)的博弈重復許多次,)定義:是指同樣結(jié)構(gòu)的博弈重復許多次,其中每次博弈稱為階段博弈。其中每次博弈稱為階段博弈。(2 2)影響重復博弈均衡結(jié)果的主要因素:博弈)影響重復博弈均衡結(jié)果的主要因素:博弈重復的次數(shù)和信息的完備性。重復的次數(shù)和信息的完備性。(3 3)博弈重復次數(shù)為無限次與)博弈重復次數(shù)為無限次與冷酷策略冷酷策略 博弈重復次數(shù)為有限次時每個博弈重復次數(shù)為有限次時每個階段博弈的均階段博弈的均衡解都是一次性博弈的納什均衡解衡解都是一次性博弈的納什均衡解。第二節(jié)第二節(jié) 完全信息完全信息博弈博弈3 3、 動態(tài)博弈戰(zhàn)略行動動態(tài)博弈戰(zhàn)略行動n在動態(tài)博弈中,參與人為
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 《消化系統(tǒng)護理課件》課件
- 【2021高考復習參考】高三數(shù)學(理)配套黃金練習:10-7
- 【先學后教新思路】2020高考物理一輪復習-教案8-電路-閉合電路歐姆定律
- 一年級反義詞100個
- 湖北省恩施州高中教育聯(lián)盟2024年秋季學期高一年級期末考試物理試題(含答案)
- 【高效提能】2021高考歷史(人教版)一輪作業(yè):第七單元-資本主義世界市場的形成和發(fā)展
- 【名師一號】2021年岳麓歷史必修3-雙基限時練21
- 五年級數(shù)學(小數(shù)乘除法)計算題專項練習及答案匯編
- 四年級數(shù)學(三位數(shù)乘兩位數(shù))計算題專項練習及答案
- 二年級數(shù)學計算題專項練習集錦
- (法律資料)城管執(zhí)法操作實務
- 廣東省珠海市2022-2023六年級上學期數(shù)學期末試卷(含答案)
- 山東省青島市第二中學2023-2024學年化學高二第一學期期末綜合測試試題含解析
- 網(wǎng)上商城 售后服務范本
- 軍隊文職專用簡歷(2023年)
- 人教版四年級話說溫州(表格式)
- 《安的種子》幼兒故事
- 真題解析1-2021年上??鐚W科案例分析(茭白案例)
- 豎井工程地質(zhì)勘察報告
- 2024屆安徽省物理八年級第一學期期末復習檢測試題含解析
- 實用衛(wèi)生統(tǒng)計學題庫(附參考答案)
評論
0/150
提交評論