




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、參考書目參考書目1. 美美阿維納什阿維納什K 迪克西特迪克西特.策略思維策略思維.中國人民大中國人民大學(xué)出版社,學(xué)出版社,20022. 王則柯王則柯. 新編新編博弈論平話博弈論平話. 中信出版社,中信出版社,20033. 謝識(shí)予謝識(shí)予.經(jīng)濟(jì)博弈論經(jīng)濟(jì)博弈論(第二版第二版) .復(fù)旦大學(xué)復(fù)旦大學(xué) 出版社,出版社,20024. 美美埃里克埃里克拉斯繆森拉斯繆森.博弈與信息:博弈論概論博弈與信息:博弈論概論.北京大學(xué)出版社,北京大學(xué)出版社,20035.張維迎張維迎.博弈論與信息經(jīng)濟(jì)學(xué)博弈論與信息經(jīng)濟(jì)學(xué).上海三聯(lián)書店,上海三聯(lián)書店,2004第二章第二章 博弈論基本知識(shí)博弈論基本知識(shí)2.1 2.1 什么是
2、博弈論什么是博弈論2.2 2.2 博弈的結(jié)構(gòu)和分類博弈的結(jié)構(gòu)和分類2.3 2.3 博弈的表達(dá)方式博弈的表達(dá)方式2.42.4 幾類經(jīng)典的博弈模型幾類經(jīng)典的博弈模型2.1.1 從游戲到博弈從游戲到博弈2.1.2 一個(gè)非技術(shù)性的定義一個(gè)非技術(shù)性的定義2.1.3 博弈論模型簡(jiǎn)介博弈論模型簡(jiǎn)介第一節(jié)第一節(jié) 什么是博弈論什么是博弈論2.1.1 2.1.1 從游戲到博弈從游戲到博弈 “博弈論博弈論”譯自英文譯自英文“Game Theory”,直譯就是,直譯就是“游戲理論游戲理論”。 游戲的共有特征游戲的共有特征 1. 一定的規(guī)則一定的規(guī)則 2. 有一個(gè)結(jié)果(且可以折算有一個(gè)結(jié)果(且可以折算成數(shù)字)成數(shù)字)
3、3.策略的相互依存性策略的相互依存性 4.策略至關(guān)重要策略至關(guān)重要博弈論博弈論- -無處不在的游戲 “要想在現(xiàn)代社會(huì)做一要想在現(xiàn)代社會(huì)做一個(gè)有文化的人,你必須對(duì)個(gè)有文化的人,你必須對(duì)博弈論有一個(gè)大致了解博弈論有一個(gè)大致了解”。 保羅保羅薩繆爾森薩繆爾森 年光似鳥翩翩過,世事年光似鳥翩翩過,世事如棋局局新。如棋局局新。 ( (宋宋) )僧志文僧志文 博弈論(博弈論(game theorygame theory):):又稱對(duì)策論,是研究相互依又稱對(duì)策論,是研究相互依賴、相互影響的決策主體的賴、相互影響的決策主體的理性決策行為理性決策行為以及這些決策以及這些決策的均衡結(jié)果的理論。的均衡結(jié)果的理論。2
4、.1.2 2.1.2 博弈論的博弈論的基本概念基本概念Governing Dynamics博弈論的基本假設(shè)博弈論的基本假設(shè) 人是理性人(人是理性人(rationalrational,也,也說自私人)說自私人): :行動(dòng)者具有行動(dòng)者具有推理推理能力能力,在具體策略選擇時(shí)的,在具體策略選擇時(shí)的目的是使決策者自己的目的是使決策者自己的目標(biāo)目標(biāo)效用最大化效用最大化。2.1.2 2.1.2 博弈論的博弈論的基本概念基本概念通俗地講,博弈論是一種通俗地講,博弈論是一種“游戲理游戲理論論”。其較對(duì)博弈為準(zhǔn)確的理解是:其較對(duì)博弈為準(zhǔn)確的理解是:一些個(gè)人、團(tuán)隊(duì)或其他組織,面對(duì)一些個(gè)人、團(tuán)隊(duì)或其他組織,面對(duì)一定的
5、環(huán)境條件,在一定的規(guī)則約一定的環(huán)境條件,在一定的規(guī)則約束下,依靠所掌握的信息,同時(shí)或束下,依靠所掌握的信息,同時(shí)或先后,一次或多次,從各自允許選先后,一次或多次,從各自允許選擇的行為或策略進(jìn)行選擇并加以實(shí)擇的行為或策略進(jìn)行選擇并加以實(shí)施,并從中各自取得相應(yīng)結(jié)果或收施,并從中各自取得相應(yīng)結(jié)果或收益的過程。益的過程。博弈論模型可以用七個(gè)方面來描述博弈論模型可以用七個(gè)方面來描述 GP,A,S,I,U,O,E 2.1.32.1.3博弈論的模型簡(jiǎn)介博弈論的模型簡(jiǎn)介P(players) P(players):): 為局中人,博弈的為局中人,博弈的參與者,也稱為參與者,也稱為“博弈方博弈方”,局中,局中人以
6、最終實(shí)現(xiàn)自身利益最大化為目人以最終實(shí)現(xiàn)自身利益最大化為目標(biāo)。標(biāo)。個(gè)人個(gè)人團(tuán)體團(tuán)體雙方雙方多方多方虛擬參與人:虛擬參與人:NatureA(action) A(action) :為各局中人的所有可能的:為各局中人的所有可能的策略或行動(dòng)的集合。策略或行動(dòng)的集合。 行動(dòng)的順序(行動(dòng)的順序(The order of play) 根據(jù)該集合是有限還是無限進(jìn)行分類:根據(jù)該集合是有限還是無限進(jìn)行分類:先動(dòng)優(yōu)勢(shì)先動(dòng)優(yōu)勢(shì)后動(dòng)優(yōu)勢(shì)后動(dòng)優(yōu)勢(shì)S(strategies) S(strategies) :博弈的進(jìn)程,也是:博弈的進(jìn)程,也是博弈進(jìn)行的次序。它規(guī)定什么人在博弈進(jìn)行的次序。它規(guī)定什么人在什么時(shí)候選擇什么行動(dòng)。因此,
7、戰(zhàn)什么時(shí)候選擇什么行動(dòng)。因此,戰(zhàn)略是參與人的略是參與人的 “相機(jī)行動(dòng)方案相機(jī)行動(dòng)方案” (contingent action plan) 分類:根據(jù)后行動(dòng)的人是否能夠看分類:根據(jù)后行動(dòng)的人是否能夠看到先行動(dòng)人的具體行動(dòng)到先行動(dòng)人的具體行動(dòng)靜態(tài)博弈靜態(tài)博弈動(dòng)態(tài)博弈動(dòng)態(tài)博弈行動(dòng)與策略的區(qū)別?行動(dòng)與策略的區(qū)別? 行動(dòng)是指參與者可能有的具體行動(dòng)行動(dòng)是指參與者可能有的具體行動(dòng) 戰(zhàn)略是行動(dòng)的規(guī)則而不是行動(dòng)本身戰(zhàn)略是行動(dòng)的規(guī)則而不是行動(dòng)本身毛澤東:毛澤東:人不犯我我不犯人人不犯我我不犯人人若犯我我必犯人人若犯我我必犯人敵進(jìn)我退敵進(jìn)我退敵退我追敵退我追敵駐我擾敵駐我擾敵疲我打敵疲我打 I(informatio
8、n) I(information) :博弈信息。:博弈信息。指的是指的是參與人在博弈中的知識(shí),特別是有關(guān)參與人在博弈中的知識(shí),特別是有關(guān)其他參與人(對(duì)手)的特征和行為的其他參與人(對(duì)手)的特征和行為的知識(shí)知識(shí) 分類:根據(jù)博弈各方對(duì)各種局勢(shì)下所分類:根據(jù)博弈各方對(duì)各種局勢(shì)下所有局中人的信息掌握情況分:有局中人的信息掌握情況分:完全信息博弈完全信息博弈不完全信息不完全信息博弈博弈U( utility ) U( utility ):也稱為支付():也稱為支付(pay off).為局中人獲得利益,或者是為局中人獲得利益,或者是指參與人的期望效用水平。也是博指參與人的期望效用水平。也是博弈各方追求的最終
9、目標(biāo)。弈各方追求的最終目標(biāo)。 分類:根據(jù)各方得益的不同情況分類:根據(jù)各方得益的不同情況零和零和博弈博弈變和變和博弈博弈田忌賽馬囚徒困境 Ua(t,t)=-8Ua(t,n)=0 Ua(n,n)=-1 Ua(n,t)=-10 Ub(t,t)=-8Ub(t,n)=-10 Ub(n,n)=-1 Ub(n,t)=0 坦白坦白t t不坦白不坦白n n坦白坦白t t-8-8,-8-80,-100,-10不坦不坦白白n n-10, 0-10, 0-1-1,-1-1嫌疑人嫌疑人a嫌疑人bU(t,t)=0.5*(-8)+ 0.5*(-8)=-8U(t,n)=0.5*0+ 0.5*(-10)=-5U(n,t)=0.
10、5*(-10)+ 0.5*0=-5 U(n,n)=0.5*(-1)+ 0.5*(-1)=-1 結(jié)果(結(jié)果(outcome) 是指博弈分析者是指博弈分析者感興趣的要素的感興趣的要素的集合。是均衡行集合。是均衡行動(dòng)的組合。動(dòng)的組合。 坦白坦白t t不坦白不坦白n n坦白坦白t t-8-8,-8-80,-100,-10不坦不坦白白n n-10, 0-10, 0-1-1,-1-1嫌疑人嫌疑人A嫌疑人BE(equilibrium) 均衡均衡(equilibrium):是所有參與人的最:是所有參與人的最優(yōu)戰(zhàn)略的組合。優(yōu)戰(zhàn)略的組合。 所謂博弈均衡,它是一種所謂博弈均衡,它是一種穩(wěn)定的穩(wěn)定的博弈結(jié)博弈結(jié)果。果
11、。 納什均衡納什均衡(Nash Equilibrium):一策):一策略組合中,所有的參與者面臨這樣的一略組合中,所有的參與者面臨這樣的一種情況:當(dāng)其他人不改變策略時(shí),他此種情況:當(dāng)其他人不改變策略時(shí),他此時(shí)的策略是最好的。時(shí)的策略是最好的。 謝識(shí)予:謝識(shí)予:給定你的給定你的 策略,我的策略是最策略,我的策略是最好的的策略,給定我的好的的策略,給定我的 策略,你的策略策略,你的策略也是最好的的策略也是最好的的策略 兩個(gè)小偷甲和乙聯(lián)手作案,私入民宅兩個(gè)小偷甲和乙聯(lián)手作案,私入民宅被警方逮住但未獲證據(jù)。警方將兩人被警方逮住但未獲證據(jù)。警方將兩人分別置于兩間房間分開審訊,政策是分別置于兩間房間分開審
12、訊,政策是若一人招供但另一人未招,則招者立若一人招供但另一人未招,則招者立即被釋放,未招者判入獄即被釋放,未招者判入獄10年;若二年;若二人都招則兩人各判刑人都招則兩人各判刑8年年;若兩人都不若兩人都不招則未獲證據(jù)但因私入民宅各拘留招則未獲證據(jù)但因私入民宅各拘留1年。年。囚徒困境囚徒困境 坦白坦白不坦白不坦白坦白坦白不坦白不坦白嫌疑人A嫌疑人B一個(gè)納什均衡點(diǎn)!情侶博弈情侶博弈 足球足球演唱會(huì)演唱會(huì)足球足球演唱會(huì)演唱會(huì)王菲李亞鵬兩個(gè)納什均衡點(diǎn)!博弈論模型可以用五個(gè)方面來描述博弈論模型可以用五個(gè)方面來描述 GP,A,S,I,U,O,E描述博弈的最少要素:描述博弈的最少要素:參與人,戰(zhàn)略,支付參與人
13、,戰(zhàn)略,支付。 行動(dòng)行動(dòng)和和信息信息是其積木是其積木參與人、行動(dòng)、結(jié)果參與人、行動(dòng)、結(jié)果統(tǒng)稱為統(tǒng)稱為“博弈規(guī)則博弈規(guī)則” 博弈分析的目的:是使用博弈規(guī)則預(yù)測(cè)博弈分析的目的:是使用博弈規(guī)則預(yù)測(cè)均衡均衡2.1.3 2.1.3 博弈論的模型簡(jiǎn)介博弈論的模型簡(jiǎn)介博弈論模型可以用七個(gè)方面來描述博弈論模型可以用七個(gè)方面來描述 GP,A,S,I,U,O,E2.2.1 博弈方博弈方2.2.2 博弈的行動(dòng)過程博弈的行動(dòng)過程2.2.3 策略策略2.2.4 支付(效用、得益)支付(效用、得益)2.2.5 博弈的信息結(jié)構(gòu)博弈的信息結(jié)構(gòu)2.2.6 博弈方的能力和理性博弈方的能力和理性2.2.7 博弈的分類和理論結(jié)構(gòu)博弈
14、的分類和理論結(jié)構(gòu)第二節(jié)第二節(jié) 博弈論的結(jié)構(gòu)與分類博弈論的結(jié)構(gòu)與分類2.2.1 2.2.1 博弈中的博弈方博弈中的博弈方博弈方(博弈方(player/ players) 博弈中獨(dú)立決策、獨(dú)立承擔(dān)博弈結(jié)博弈中獨(dú)立決策、獨(dú)立承擔(dān)博弈結(jié)果的個(gè)人或組織稱為博弈方。果的個(gè)人或組織稱為博弈方。 1.單人博弈單人博弈 2.雙人博弈雙人博弈 3.多人博弈多人博弈1.單人博弈單人博弈設(shè)有一商人要從設(shè)有一商人要從A地運(yùn)輸一批貨物,地運(yùn)輸一批貨物,從從A地到地到B地有水、陸兩條路線,地有水、陸兩條路線,走陸路運(yùn)輸成本走陸路運(yùn)輸成本10 000元,而走水元,而走水路運(yùn)輸成本只要路運(yùn)輸成本只要7000元。但非常元。但非常
15、危險(xiǎn),出現(xiàn)壞天氣的概率為危險(xiǎn),出現(xiàn)壞天氣的概率為0.25,此時(shí)會(huì)損失此時(shí)會(huì)損失10%的貨物。貨物總價(jià)的貨物。貨物總價(jià)值值90 000元。元。此人怎樣決策?此人怎樣決策? 好天氣好天氣(75%)(75%)壞天氣壞天氣(25%)(25%)水路水路陸路陸路自然商人囚徒困境囚徒困境 坦白坦白不坦白不坦白坦白坦白不坦白不坦白嫌疑人A嫌疑人B2.雙人博弈雙人博弈情侶博弈情侶博弈 足球足球演唱會(huì)演唱會(huì)足球足球演唱會(huì)演唱會(huì)王菲李亞鵬選修課另一版本選修課另一版本 博弈論博弈論舞蹈舞蹈博弈論博弈論舞蹈舞蹈王菲李亞鵬石頭石頭剪子剪子布布石頭石頭剪子剪子布布石頭石頭0,01,1-1,1剪子剪子-1,10,01,-1布
16、布1,-1-1,10,0博弈方博弈方2 2博博弈弈方方1 1雙人博弈小結(jié)雙人博弈小結(jié)注意二點(diǎn):注意二點(diǎn):1. 博弈方之間并非總是對(duì)抗的。博弈方之間并非總是對(duì)抗的。2. 個(gè)人理性決策常不能實(shí)現(xiàn)自己的個(gè)人理性決策常不能實(shí)現(xiàn)自己的 最大利益。最大利益。3、多人博弈、多人博弈三個(gè)或三個(gè)以上的博弈方參加的博弈。三個(gè)或三個(gè)以上的博弈方參加的博弈。競(jìng)爭(zhēng)者競(jìng)爭(zhēng)者破壞者破壞者競(jìng)爭(zhēng)者競(jìng)爭(zhēng)者北京申辦北京申辦2000年奧運(yùn)會(huì)失利年奧運(yùn)會(huì)失利第一輪第一輪第二輪第二輪第三輪第三輪第四輪第四輪北京北京32374043悉尼悉尼28303745曼徹斯特曼徹斯特111111柏林柏林910伊斯坦布伊斯坦布爾爾82.2.2 策略策略
17、有限博弈(有限博弈(finite games) :如:如果博弈中每個(gè)博弈方的策略是有果博弈中每個(gè)博弈方的策略是有限的,稱為有限博弈。限的,稱為有限博弈。2.無限博弈(無限博弈(infinite games) :如:如果博弈中至少有某些博弈方的策果博弈中至少有某些博弈方的策略是無限多個(gè)的,稱為無限博弈。略是無限多個(gè)的,稱為無限博弈。 (函數(shù)表示函數(shù)表示)2.2.3 2.2.3 博弈的行動(dòng)過程博弈的行動(dòng)過程 1. 靜態(tài)博弈(靜態(tài)博弈(static games):所有博弈方同時(shí)所有博弈方同時(shí)選擇策略的博弈。選擇策略的博弈。 2 . 動(dòng)態(tài)博弈(動(dòng)態(tài)博弈(dynamic games):):各博弈方的各博
18、弈方的選擇和行動(dòng)有先后次序,而且后選擇的、后行動(dòng)選擇和行動(dòng)有先后次序,而且后選擇的、后行動(dòng)的博弈方,在自己選擇行動(dòng)方案之前,可以看到的博弈方,在自己選擇行動(dòng)方案之前,可以看到其他博弈方的選擇和行動(dòng)。也稱為多階段博弈其他博弈方的選擇和行動(dòng)。也稱為多階段博弈(multistage games) 3. 重復(fù)博弈(重復(fù)博弈(repeated games):):同一個(gè)博弈同一個(gè)博弈反復(fù)進(jìn)行多構(gòu)成的博弈。反復(fù)進(jìn)行多構(gòu)成的博弈。2.2.4 2.2.4 博弈的支付博弈的支付(效用,得益)(效用,得益)效用的計(jì)算方法:將每一個(gè)博弈方在效用的計(jì)算方法:將每一個(gè)博弈方在同一策同一策略結(jié)果中略結(jié)果中的得益相加,算出所
19、有博弈方的的得益相加,算出所有博弈方的得益總和。得益總和。Ua(1,2)= Ua1+Ua2Ub(1,2)= Ub1+Ub2 1. 零和博弈零和博弈: Ua(1,2)= Ub(1,2) =0 2 . 常和博弈常和博弈: Ua(1,2)= Ub(1,2) = m 3. 變和博弈變和博弈: Ua(1,2) Ub(1,2) 兩個(gè)人通過猜硬幣的正反賭輸贏,其兩個(gè)人通過猜硬幣的正反賭輸贏,其中一人用手蓋住一枚硬幣,有另一方中一人用手蓋住一枚硬幣,有另一方在是正面還是反面朝上。若猜對(duì),則在是正面還是反面朝上。若猜對(duì),則猜著贏猜著贏1元,蓋著輸元,蓋著輸1元;若猜錯(cuò),則元;若猜錯(cuò),則猜著輸猜著輸1元,蓋著贏元
20、,蓋著贏1元。元。 假設(shè)贏著收益為假設(shè)贏著收益為1,輸者收益為,輸者收益為-1。猜硬幣游戲猜硬幣游戲猜硬幣游戲猜硬幣游戲 正面正面z z反面反面f f正面正面z z-1,1-1,11,-11,-1反面反面f f1 1,-1-1-1,1-1,1猜硬幣方-2 U1z(z,z)=-1U1z(z,f)=1 U1f(f,z)=1 U1f(f,f)=-1 U2z(z,z)=-1U2z(f,z)=1 U2f(z,f)=1 U2f(f,f)=-1Uz= U1z+ U2z=-1+1-1+1=0Uf= U1f+ U2f=1-1+1-1=0蓋硬幣方-1石頭石頭剪子剪子布布石頭石頭剪子剪子布布石頭石頭0,01,1-1
21、,1剪子剪子-1,10,01,-1布布1,-1-1,10,0博弈方博弈方2 2博博弈弈方方1 1周末約會(huì)周末約會(huì) 足球足球g g演唱會(huì)演唱會(huì)d d足球足球g g2,12,10,00,0演唱會(huì)演唱會(huì)d d-1-1,-1-11,21,2王菲b李亞鵬a Uag(g,g)=2Uag(g,d)=0 Uad(d,g)=-1 Uad(d,d)=1 Ubg(g,g)=1Ubg(d,g)=-1 Ubd(g,d)=0 Ubd(d,d)=2UU= Uag+ Ubg=2+0+1-1=2Ud= Uad+ Ubd=-1+1+0+2=2Un= Uan+ Ubn=-1-10-10-1=-22 Uat(t,t)=-8Uat(t
22、,n)=0 Uan(n,t)=-10 Uan(n,n)=-1 Ubt(t,t)=-8Ubt(n,t)=0 Ubn(t,n)=-10 Ubn(n,n)=-1 坦白坦白t t不坦白不坦白n n坦白坦白t t-8-8,-8-80,-100,-10不坦不坦白白n n-10, 0-10, 0-1-1,-1-1嫌疑人嫌疑人b嫌疑人aUt= Uat+ Ubt=-8+0-8+0=-16囚徒困境囚徒困境獎(jiǎng)金分配獎(jiǎng)金分配 績(jī)效高績(jī)效高g g 績(jī)效低績(jī)效低d d績(jī)效高績(jī)效高g g績(jī)效低績(jī)效低d d王菲b李亞鵬a Uag(g,g)=5Uag(g,d)=7 Uad(d,g)=3 Uad(d,d)=5 Ubg(g,g)=
23、5Ubg(d,g)=7 Ubd(g,d)=3 Ubd(d,d)=5Ug= Uag+ Ubg=5+7+5+7=24Ud= Uad+ Ubd=3+5+3+5=16Ud= Uad+ Ubd=30+80+30+80=220 Uag(g,g)=50Uag(g,d)=10 Uad(d,g)=80 Uad(d,d)=30 Ubg(g,g)=50Ubg(d,g)=10 Ubd(g,d)=80 Ubd(d,d)=30 高價(jià)高價(jià)g g低價(jià)低價(jià)d d高價(jià)高價(jià)g g5050,505010,8010,80低價(jià)低價(jià)d d80, 1080, 103030,3030聯(lián)通聯(lián)通b移動(dòng)aUg= Uag+ Ubg=50+10+50+
24、10=120寡頭定價(jià)寡頭定價(jià)2.2.5 2.2.5 博弈的信息結(jié)構(gòu)博弈的信息結(jié)構(gòu)1.關(guān)于得益的信息關(guān)于得益的信息 完全信息和不完全信息完全信息和不完全信息(1) 完全信息(完全信息(complete information)是是指在博弈過程中,每一位博弈方對(duì)其他博弈指在博弈過程中,每一位博弈方對(duì)其他博弈方的特征、策略空間及收益函數(shù)有準(zhǔn)確的信方的特征、策略空間及收益函數(shù)有準(zhǔn)確的信息。息。(2)不完全信息()不完全信息(incomplete information): 如果博弈方對(duì)其他博弈方的特征、策略空間如果博弈方對(duì)其他博弈方的特征、策略空間及收益函數(shù)信息了解的不夠準(zhǔn)確、或者不是及收益函數(shù)信息了
25、解的不夠準(zhǔn)確、或者不是對(duì)所有博弈方的特征、策略空間及收益函數(shù)對(duì)所有博弈方的特征、策略空間及收益函數(shù)都有準(zhǔn)確的準(zhǔn)確信息,在這種情況下進(jìn)行的都有準(zhǔn)確的準(zhǔn)確信息,在這種情況下進(jìn)行的博弈就是不完全信息博弈。也成博弈就是不完全信息博弈。也成不對(duì)稱信息不對(duì)稱信息或者或者信息不對(duì)稱信息不對(duì)稱(asymmetric information)2.2.關(guān)于博弈過程的信息關(guān)于博弈過程的信息 完美信息和不完美信息完美信息和不完美信息完美信息(完美信息(perfect informationperfect information): :對(duì)對(duì)已經(jīng)發(fā)生的的事情有清楚的了解,稱具已經(jīng)發(fā)生的的事情有清楚的了解,稱具有完美信息。
26、否則,稱為有完美信息。否則,稱為不完美信息不完美信息(imperfect informationimperfect information)2.2.6 博弈方的理性與能力博弈方的理性與能力 完全理性與完全理性與有限理性有限理性 個(gè)體理性與個(gè)體理性與集體理性集體理性 戰(zhàn)爭(zhēng)戰(zhàn)爭(zhēng)和平和平戰(zhàn)爭(zhēng)戰(zhàn)爭(zhēng)-50-50,- -5050100, 0100, 0和平和平0, 1000, 1005050,5050A國國B國國戰(zhàn)爭(zhēng)與和平戰(zhàn)爭(zhēng)與和平2.2.7 博弈的類型1 根據(jù)參與者能否形成約束性的協(xié)議,以便集體行動(dòng) (1)合作博弈(cooperative game )研究人們達(dá)成合作時(shí)如何分配合作得到的收益,即收益分配
27、問題。 (2)非合作博弈( non-cooperative /uncooperative game )研究人們?cè)诶嫦嗷ビ绊懙木謩?shì)中如何選決策使自己的收益最大,即策略選擇問題。 行動(dòng)次行動(dòng)次序序信息信息靜態(tài)靜態(tài)動(dòng)態(tài)動(dòng)態(tài)完全信完全信息息完全信息靜態(tài)博弈完全信息靜態(tài)博弈納什均衡(納什均衡()完全信息動(dòng)態(tài)博弈完全信息動(dòng)態(tài)博弈子博弈精練納什均衡子博弈精練納什均衡()不完全不完全信息信息不完全信息靜態(tài)博弈不完全信息靜態(tài)博弈貝葉斯均衡(貝葉斯均衡(不完全信息動(dòng)態(tài)博弈不完全信息動(dòng)態(tài)博弈精煉貝葉斯均衡精煉貝葉斯均衡 2.2.7 博弈的分類博弈的分類 22囚徒困境囚徒困境(prisoners dilemma )
28、 乙的對(duì)策乙的對(duì)策甲甲的的對(duì)對(duì)策策合作合作(沉默)(沉默)背叛背叛(認(rèn)罪)(認(rèn)罪)合作合作(沉默)(沉默)(-1,-1)(-10,0)背叛背叛(交代)(交代)(0,-10)(-8,-8)完全信息靜態(tài)博弈完全信息靜態(tài)博弈空城計(jì)空城計(jì) 進(jìn)攻進(jìn)攻后退后退堅(jiān)持堅(jiān)持被擒被擒, ,大勝大勝0,0,1010逃脫逃脫, ,無勝無勝5 5,0,0逃跑逃跑被擒被擒, ,大勝大勝0,100,10逃脫逃脫, ,無勝無勝5,05,0諸葛亮諸葛亮司馬懿司馬懿不完全信息靜態(tài)博弈不完全信息靜態(tài)博弈 走大路走大路走小路走小路守大路守大路被擒被擒10,10,0 0逃脫逃脫0 0,10,10守小道守小道逃脫逃脫0,100,10被擒
29、被擒10,010,0諸葛亮(關(guān)羽)諸葛亮(關(guān)羽)曹操曹操不完全信息靜態(tài)博弈不完全信息靜態(tài)博弈曹操敗走華容道曹操敗走華容道相親相親王實(shí)甫王實(shí)甫張生和崔鶯鶯張生和崔鶯鶯 紅娘紅娘王實(shí)甫王實(shí)甫. .西廂記西廂記不完全信息靜態(tài)博弈不完全信息靜態(tài)博弈完全信息動(dòng)態(tài)博弈完全信息動(dòng)態(tài)博弈黔之驢黔之驢黔驢技窮黔驢技窮 柳宗元柳宗元(唐)(唐)不完全信息不完全信息動(dòng)態(tài)博弈動(dòng)態(tài)博弈斗雞博弈斗雞博弈斗雞博弈斗雞博弈(Chicken Game)其實(shí)是一種誤譯。其實(shí)是一種誤譯。Chicken在美國口語中是在美國口語中是“懦夫懦夫”之意,之意,Chicken Game本應(yīng)譯成本應(yīng)譯成懦夫博弈懦夫博弈。不過這個(gè)錯(cuò)誤并不。不過
30、這個(gè)錯(cuò)誤并不算太嚴(yán)重,非要把算太嚴(yán)重,非要把chicken game叫作斗雞博弈,也不是不可以。叫作斗雞博弈,也不是不可以。試想有兩人狹路相逢,每人有兩個(gè)行動(dòng)選擇:一是退下來,一是進(jìn)試想有兩人狹路相逢,每人有兩個(gè)行動(dòng)選擇:一是退下來,一是進(jìn)攻。如果一方退下來,而對(duì)方?jīng)]有退下來,對(duì)方獲得勝利,這人就很丟攻。如果一方退下來,而對(duì)方?jīng)]有退下來,對(duì)方獲得勝利,這人就很丟面子;如果對(duì)方也退下來,雙方則打個(gè)平手;如果自己沒退下來,而對(duì)面子;如果對(duì)方也退下來,雙方則打個(gè)平手;如果自己沒退下來,而對(duì)方退下來,自己則勝利,對(duì)方則失?。蝗绻麅扇硕记斑M(jìn),那么則兩敗俱方退下來,自己則勝利,對(duì)方則失??;如果兩人都前進(jìn),
31、那么則兩敗俱傷。因此,對(duì)每個(gè)人來說,最好的結(jié)果是,對(duì)方退下來,而自己不退。傷。因此,對(duì)每個(gè)人來說,最好的結(jié)果是,對(duì)方退下來,而自己不退。贏利矩陣贏利矩陣(payoff matrix)如下:甲如下:甲/乙乙 前進(jìn)前進(jìn) 后退后退前進(jìn)前進(jìn) (-2,-2) (1,-1)后退后退 (-1,1) (-1,-1)上表中的數(shù)字的意思是:兩者如果均選擇上表中的數(shù)字的意思是:兩者如果均選擇“前進(jìn)前進(jìn)”,結(jié)果是兩敗俱,結(jié)果是兩敗俱傷,兩者均獲得傷,兩者均獲得-2的支付;如果一方的支付;如果一方“前進(jìn)前進(jìn)”,另外一方,另外一方“后退后退”,前,前進(jìn)者獲得進(jìn)者獲得1的支付,贏得了面子,而后退者獲得的支付,贏得了面子,而
32、后退者獲得-1的支付,輸?shù)袅嗣孀樱闹Ц?,輸?shù)袅嗣孀?,但沒有兩者均但沒有兩者均“前進(jìn)前進(jìn)”受到的損失大;兩者均受到的損失大;兩者均“后退后退”,兩者均輸?shù)袅?,兩者均輸?shù)袅嗣孀?,獲得面子,獲得-1的支付。當(dāng)然表中的數(shù)字只是相對(duì)的值。的支付。當(dāng)然表中的數(shù)字只是相對(duì)的值。這個(gè)博弈有兩個(gè)純策略這個(gè)博弈有兩個(gè)純策略納什均衡納什均衡:一方前進(jìn),另一方后退;或一方:一方前進(jìn),另一方后退;或一方后退,另一方前進(jìn)。但關(guān)鍵是誰進(jìn)誰退?當(dāng)然,該博弈也存在一個(gè)混合后退,另一方前進(jìn)。但關(guān)鍵是誰進(jìn)誰退?當(dāng)然,該博弈也存在一個(gè)混合策略均衡,即大家隨機(jī)的選擇前進(jìn)或后退。不過相對(duì)而言,我們更關(guān)注策略均衡,即大家隨機(jī)的選擇前進(jìn)或
33、后退。不過相對(duì)而言,我們更關(guān)注于純策略均衡。一博弈,如果有惟一的納什均衡點(diǎn),那么這個(gè)博弈是可于純策略均衡。一博弈,如果有惟一的納什均衡點(diǎn),那么這個(gè)博弈是可預(yù)測(cè)的,即這個(gè)納什均衡點(diǎn)就是事先知道的惟一的博弈結(jié)果。但是如果預(yù)測(cè)的,即這個(gè)納什均衡點(diǎn)就是事先知道的惟一的博弈結(jié)果。但是如果一博弈有多個(gè)納什均衡,則要預(yù)測(cè)結(jié)果就必須附加另外的有關(guān)博弈的細(xì)一博弈有多個(gè)納什均衡,則要預(yù)測(cè)結(jié)果就必須附加另外的有關(guān)博弈的細(xì)節(jié)信息。比如,這里誰進(jìn)誰退,可能就需要附加額外的細(xì)節(jié)信息才能做節(jié)信息。比如,這里誰進(jìn)誰退,可能就需要附加額外的細(xì)節(jié)信息才能做出判斷。出判斷。 斗雞博弈斗雞博弈 斗雞博弈斗雞博弈(Chicken Ga
34、me) 試想有兩人試想有兩人(雞雞)狹路相逢,每人有兩個(gè)行狹路相逢,每人有兩個(gè)行動(dòng)選擇:一是退下來,一是進(jìn)攻。如果一方退動(dòng)選擇:一是退下來,一是進(jìn)攻。如果一方退下來,而對(duì)方?jīng)]有退下來,對(duì)方獲得勝利,這下來,而對(duì)方?jīng)]有退下來,對(duì)方獲得勝利,這人就很丟面子;如果對(duì)方也退下來,雙方則打人就很丟面子;如果對(duì)方也退下來,雙方則打個(gè)平手;如果自己沒退下來,而對(duì)方退下來,個(gè)平手;如果自己沒退下來,而對(duì)方退下來,自己則勝利,對(duì)方則失?。蝗绻麅扇硕记斑M(jìn),自己則勝利,對(duì)方則失??;如果兩人都前進(jìn),那么則兩敗俱傷。假設(shè)兩敗俱傷為那么則兩敗俱傷。假設(shè)兩敗俱傷為-2,贏的一,贏的一方為方為1,輸?shù)囊环綖椋數(shù)囊环綖?1。
35、請(qǐng)用戰(zhàn)略式和擴(kuò)展式。請(qǐng)用戰(zhàn)略式和擴(kuò)展式寫出他們的表達(dá)方式。并說明納什均衡點(diǎn)。寫出他們的表達(dá)方式。并說明納什均衡點(diǎn)。斗雞博弈斗雞博弈 進(jìn)進(jìn)退退進(jìn)進(jìn)-2, -2-2, -21, -11, -1退退-1, 1-1, 1-1, -1-1, -1Chicken AChicken B完全信息動(dòng)態(tài)博弈完全信息動(dòng)態(tài)博弈行動(dòng)次序行動(dòng)次序信息信息靜態(tài)靜態(tài)動(dòng)態(tài)動(dòng)態(tài)完全信完全信息息完全信息靜態(tài)博弈完全信息靜態(tài)博弈納什均衡納什均衡()囚徒困境,周末約會(huì)囚徒困境,周末約會(huì)完全信息動(dòng)態(tài)博弈完全信息動(dòng)態(tài)博弈子博弈精練納什均衡子博弈精練納什均衡()田忌賽馬,破釜沉舟,田忌賽馬,破釜沉舟,昭君出塞昭君出塞不完全不完全信息信息不完
36、全信息靜態(tài)博弈不完全信息靜態(tài)博弈貝葉斯均衡貝葉斯均衡(不完全信息動(dòng)態(tài)博弈不完全信息動(dòng)態(tài)博弈精煉貝葉斯均衡精煉貝葉斯均衡 2.2.7 博弈的分類和均衡博弈的分類和均衡2.3.1 戰(zhàn)略式表達(dá)戰(zhàn)略式表達(dá)2.3.2 擴(kuò)展式表達(dá)擴(kuò)展式表達(dá)第三節(jié)第三節(jié) 博弈的表達(dá)方式博弈的表達(dá)方式2.3.1 戰(zhàn)略式表達(dá)戰(zhàn)略式表達(dá) 戰(zhàn)略式表達(dá)(戰(zhàn)略式表達(dá)(strategic representation),又稱標(biāo)準(zhǔn)式表達(dá)又稱標(biāo)準(zhǔn)式表達(dá)(normal from representation)。更適。更適合靜態(tài)博弈。用合靜態(tài)博弈。用支付矩陣支付矩陣表示。表示。 三個(gè)要素:三個(gè)要素: 1.博弈的參與人集合博弈的參與人集合 2.每
37、個(gè)參與人的戰(zhàn)略空間每個(gè)參與人的戰(zhàn)略空間 3.每個(gè)參與人的支付函數(shù)(由戰(zhàn)略組合每個(gè)參與人的支付函數(shù)(由戰(zhàn)略組合決定)決定)囚徒困境囚徒困境 坦白坦白不坦白不坦白坦白坦白不坦白不坦白嫌疑人A嫌疑人B案例:智豬博弈案例:智豬博弈(pigs game) 豬圈中有一頭大豬和一頭小豬,在豬圈的一豬圈中有一頭大豬和一頭小豬,在豬圈的一端設(shè)有一個(gè)按鈕,每按一下,位于豬圈另一端端設(shè)有一個(gè)按鈕,每按一下,位于豬圈另一端的食槽中就會(huì)有的食槽中就會(huì)有10單位的豬食進(jìn)槽,但每按一單位的豬食進(jìn)槽,但每按一下按鈕會(huì)耗去相當(dāng)于下按鈕會(huì)耗去相當(dāng)于2單位豬食的成本。如果大單位豬食的成本。如果大豬先到食槽,則大豬吃到豬先到食槽,則
38、大豬吃到9單位食物,小豬僅能單位食物,小豬僅能吃到吃到1單位食物;如果兩豬同時(shí)到食槽,則大豬單位食物;如果兩豬同時(shí)到食槽,則大豬吃吃7單位,小豬吃單位,小豬吃3單位食物;如果小豬先到,單位食物;如果小豬先到,大豬吃大豬吃6單位而小豬吃單位而小豬吃4單位食物。請(qǐng)用戰(zhàn)略式單位食物。請(qǐng)用戰(zhàn)略式和擴(kuò)展式寫出他們的表達(dá)方式。并說明納什均和擴(kuò)展式寫出他們的表達(dá)方式。并說明納什均衡點(diǎn)衡點(diǎn)智豬博弈智豬博弈 局中人:大豬,小豬局中人:大豬,小豬 策策 略:大豬:按,等待略:大豬:按,等待 小豬:按,等待小豬:按,等待 支付矩陣:支付矩陣:智豬博弈智豬博弈 按按等待等待按按等待等待小豬大豬完全信息靜態(tài)博弈完全信息
39、靜態(tài)博弈案例:田忌賽馬案例:田忌賽馬上中下上中下上下中上下中中上下中上下中下上中下上下上中下上中下中上下中上上中下上中下3,-31,-11,-11,-1- 1,1 1,-1上下中上下中1,-13,-31,-11,-11,-1- 1,1中上下中上下1,-1- 1,1 3,-31,-11,-11,-1中下上中下上- 1,1 1,-11,-13,-31,-11,-1下上中下上中1,-11,-11,-1- 1,1 3,-31,-1下上中下上中1,-11,-1- 1,1 1,-11,-13,-3田忌田忌齊威王齊威王2.3.2 擴(kuò)展式表達(dá)擴(kuò)展式表達(dá) 擴(kuò)展式表達(dá)(擴(kuò)展式表達(dá)(extensive form r
40、epresentation )。更適合動(dòng)態(tài)博弈。用)。更適合動(dòng)態(tài)博弈。用博博弈樹弈樹來表示來表示 六個(gè)要素:六個(gè)要素: 1.博弈的參與人集合博弈的參與人集合 2. 參與人的行動(dòng)順序參與人的行動(dòng)順序 3. 參與人的戰(zhàn)略行動(dòng)空間參與人的戰(zhàn)略行動(dòng)空間 4. 參與人的信息集參與人的信息集 5.參與人的支付函數(shù)參與人的支付函數(shù) 6.外生事件(即自然選擇)的概率分布)外生事件(即自然選擇)的概率分布)博弈樹的基本建筑材料博弈樹的基本建筑材料1 1.結(jié)(結(jié)(nodes): 2.枝枝(branches): 3.信息集信息集(information sets)博弈樹的基本建筑材料博弈樹的基本建筑材料1 1.結(jié)(
41、結(jié)(nodes): 初始結(jié)(初始結(jié)(begining nodes ) 決策結(jié)(決策結(jié)(decision nodes ) 終點(diǎn)結(jié)(終點(diǎn)結(jié)(terminal nodes ) 博弈從空心圓開始,空心圓表示開始決策,博弈從空心圓開始,空心圓表示開始決策,A選擇后,博弈進(jìn)入標(biāo)有選擇后,博弈進(jìn)入標(biāo)有B的實(shí)心圓。的實(shí)心圓。 初始結(jié)用初始結(jié)用 其他決策結(jié)用其他決策結(jié)用博弈樹的基本建筑材料博弈樹的基本建筑材料2 2.枝枝(branches):是從一個(gè)決策結(jié)到:是從一個(gè)決策結(jié)到它的直接后續(xù)結(jié)的連線,某一個(gè)枝代它的直接后續(xù)結(jié)的連線,某一個(gè)枝代表參與人的一個(gè)行動(dòng)選擇。表參與人的一個(gè)行動(dòng)選擇。博弈樹的基本建筑材料博弈樹
42、的基本建筑材料2 3.信息集信息集(information sets):某個(gè)參與人某個(gè)參與人都知道些什么。信息集是用來標(biāo)注某個(gè)人都知道些什么。信息集是用來標(biāo)注某個(gè)人知道些什么信息的,不同的標(biāo)注表示這個(gè)知道些什么信息的,不同的標(biāo)注表示這個(gè)人知道不同的信息。人知道不同的信息。博弈樹上的所有決策結(jié)分割成不同的信息集。每博弈樹上的所有決策結(jié)分割成不同的信息集。每一個(gè)信息集是決策結(jié)集合的一個(gè)子集,該子集一個(gè)信息集是決策結(jié)集合的一個(gè)子集,該子集包括所有滿足下列條件的決策結(jié)。包括所有滿足下列條件的決策結(jié)。 (1)每一個(gè)決策結(jié)都是同一個(gè)參與人的決)每一個(gè)決策結(jié)都是同一個(gè)參與人的決策結(jié)策結(jié) (2)該參與人知道博
43、弈進(jìn)入該集合的某個(gè)該參與人知道博弈進(jìn)入該集合的某個(gè)決策結(jié),但不知道自己究竟處于哪一個(gè)決決策結(jié),但不知道自己究竟處于哪一個(gè)決策結(jié)策結(jié)2.3.2 擴(kuò)展式表達(dá)擴(kuò)展式表達(dá)坦白坦白坦白不坦白不坦白(-8,-8)(0,-10)不坦白坦白坦白囚徒困境囚徒困境不坦白不坦白(-10,0)(-1,-1)ABB案例案例 案例一:姑娘案例一:姑娘(girl)愛上小伙子,父親愛上小伙子,父親(father)不同意。威脅說,如果分手,)不同意。威脅說,如果分手,我們還是好父女,兩人和好;如果嫁給小我們還是好父女,兩人和好;如果嫁給小伙子,那就一刀兩斷?;镒樱蔷鸵坏秲蓴?。 局中人:姑娘局中人:姑娘(girl) ,父親(,
44、父親(father) 策策 略:略: girl:分手,不分手:分手,不分手 father :和好,不和好:和好,不和好 支付矩陣:支付矩陣:2.3.2 擴(kuò)展式表達(dá)擴(kuò)展式表達(dá)girl不分手不分手和好和好不和好不和好father(2,1)(1,0)father分手分手和好和好父女威脅父女威脅不和好不和好(1,1)(0,0) 和好和好不和好不和好分手分手1, 11, 10,00,0不分不分手手2, 12, 11, 01, 0girlfather 有兩家房地產(chǎn)公司,決定是否開發(fā)房地產(chǎn)。有兩家房地產(chǎn)公司,決定是否開發(fā)房地產(chǎn)。 需求大,開發(fā)需求大,開發(fā)者者利潤利潤8千萬,千萬,不開發(fā)者不開發(fā)者利潤利潤0。
45、 需求大,需求大,兩者都開發(fā)兩者都開發(fā)利潤各為利潤各為4千萬。千萬。 需求小,開發(fā)需求小,開發(fā)者者利潤利潤1千萬,千萬,不開發(fā)者不開發(fā)者利潤利潤0。 需求小,需求小,兩者都開發(fā)兩者都開發(fā)利潤各為利潤各為-3千萬千萬 兩者都兩者都不開發(fā)利潤各為不開發(fā)利潤各為0。博弈樹:房地產(chǎn)開發(fā)博弈I博弈樹:房地產(chǎn)開發(fā)博弈IA 開發(fā) 不開發(fā) 大 小 大 小開發(fā) 不開發(fā) 開 不開 開 不開 開 不開 (4,4) (8,0) (-3,-3) (1,0) (0,8) (0,0) (0,1) (0,0) N1 N2 B1 B2 B3 B4博弈樹:不允許的情形博弈樹:不允許的情形博弈樹的基本建筑材料博弈樹的基本建筑材料2
46、 3.信息集信息集(information sets):某個(gè)參與人某個(gè)參與人都知道些什么。信息集是用來標(biāo)注某個(gè)人都知道些什么。信息集是用來標(biāo)注某個(gè)人知道些什么信息的,不同的標(biāo)注表示這個(gè)知道些什么信息的,不同的標(biāo)注表示這個(gè)人知道不同的信息。人知道不同的信息。博弈樹上的所有決策結(jié)分割成不同的信息集。每博弈樹上的所有決策結(jié)分割成不同的信息集。每一個(gè)信息集是決策結(jié)集合的一個(gè)子集,該子集一個(gè)信息集是決策結(jié)集合的一個(gè)子集,該子集包括所有滿足下列條件的決策結(jié)。包括所有滿足下列條件的決策結(jié)。 (1)每一個(gè)決策結(jié)都是同一個(gè)參與人的決)每一個(gè)決策結(jié)都是同一個(gè)參與人的決策結(jié)策結(jié) (2)該參與人知道博弈進(jìn)入該集合的某
47、個(gè)該參與人知道博弈進(jìn)入該集合的某個(gè)決策結(jié),但不知道自己究竟處于哪一個(gè)決決策結(jié),但不知道自己究竟處于哪一個(gè)決策結(jié)策結(jié)博弈樹:房地產(chǎn)開發(fā)博弈IA 開發(fā) 不開發(fā) 大 小 大 小開發(fā) 不開發(fā) 開 不開 開 不開 開 不開 (4,4) (8,0) (-3,-3) (1,0) (0,8) (0,0) (0,1) (0,0) N1 N2 B1 B2 B3 B4另一種描述:房地產(chǎn)開發(fā)博弈IN 大(1/2) 小(1/2) 開發(fā) 不開發(fā) 開發(fā) 不開發(fā)開發(fā) 不開發(fā) 開 不開 開 不開 開 不開 (4,4) (8,0) (-3,-3) (1,0) (0,8) (0,0) (0,1) (0,0) A A B1 B2 B
48、3 B4信息集:房地產(chǎn)博弈信息集:房地產(chǎn)博弈IIA 開發(fā) 不開發(fā) 大 小 大 小開發(fā) 不開發(fā) 開 不開 開 不開 開 不開 (4,4) (8,0) (-3,-3) (1,0) (0,8) (0,0) (0,1) (0,0) N1 N2 B1 B2 B3 B4信息集:房地產(chǎn)博弈信息集:房地產(chǎn)博弈IIIA 開發(fā) 不開發(fā) 大 小 大 小開發(fā) 不開發(fā) 開 不開 開 不開 開 不開 (4,4) (8,0) (-3,-3) (1,0) (0,8) (0,0) (0,1) (0,0) N1 N2 B1 B2 B3 B4第二種描述:房地產(chǎn)開發(fā)博弈IIIN 大(1/2) 小(1/2) 開發(fā) 不開發(fā) 開發(fā) 不開發(fā)
49、開發(fā) 不開發(fā) 開 不開 開 不開 開 不開 (4,4) (8,0) (-3,-3) (1,0) (0,8) (0,0) (0,1) (0,0) A A B1 B2 B3 B4第三種描述:房地產(chǎn)博弈房地產(chǎn)博弈IVN 大 小 開 不開 開 不開開發(fā) 不開發(fā) 開 不開 開 不開 開 不開 (4,4) (8,0) (0,8) (0,0) (-3,-3) (1,0) (0,1) (0,0) B1 B2 A1 A2 A3 A4囚徒困境囚徒困境 A 坦白坦白 抵賴抵賴 坦白坦白 抵賴抵賴 B B坦白坦白 抵賴抵賴(-8,-8) (0,-10) (-10,0) (-1,-1) B 坦白坦白 抵賴抵賴 坦白坦白
50、 抵賴抵賴 坦白坦白 抵賴抵賴 (-8,-8) (0,-10) (-10,0) (-1,-1)A A囚徒困境囚徒困境 A 坦白坦白 抵賴抵賴 坦白坦白 抵賴抵賴 B B坦白坦白 抵賴抵賴(-8,-8) (0,-10) (-10,0) (-1,-1) B 坦白坦白 抵賴抵賴 坦白坦白 抵賴抵賴 坦白坦白 抵賴抵賴 (-8,-8) (0,-10) (-10,0) (-1,-1)A A2.4.1 靜態(tài)博弈靜態(tài)博弈2.4.2 動(dòng)態(tài)博弈動(dòng)態(tài)博弈第四節(jié)第四節(jié) 如何尋找博弈的均衡點(diǎn)如何尋找博弈的均衡點(diǎn)納什均衡納什均衡納什均衡的定義納什均衡的定義 對(duì)于一個(gè)給定的策略組合,如果各博弈方都對(duì)于一個(gè)給定的策略組合,
51、如果各博弈方都沒有單獨(dú)改變策略組合的意愿,則稱該策略組沒有單獨(dú)改變策略組合的意愿,則稱該策略組合為納什均衡合為納什均衡.納什均衡的一致預(yù)測(cè)性質(zhì)納什均衡的一致預(yù)測(cè)性質(zhì) 各博弈方都能預(yù)測(cè)到,并且能預(yù)測(cè)到其他博各博弈方都能預(yù)測(cè)到,并且能預(yù)測(cè)到其他博弈方能預(yù)測(cè)到,能預(yù)測(cè)到其他博弈方也能預(yù)測(cè)弈方能預(yù)測(cè)到,能預(yù)測(cè)到其他博弈方也能預(yù)測(cè)到自己能預(yù)測(cè)到到自己能預(yù)測(cè)到.完全信息靜態(tài)博弈納什均衡完全信息靜態(tài)博弈納什均衡 各博弈方同時(shí)決策,且所有博弈方各博弈方同時(shí)決策,且所有博弈方對(duì)博弈中的各種情況下的得益都完全了對(duì)博弈中的各種情況下的得益都完全了解的博弈問題。解的博弈問題。 1.1.基本分析思路和方法基本分析思路和
52、方法 2.2.納什均衡納什均衡 3.3.無限策略博弈分析無限策略博弈分析1.1.基本分析思路和方法基本分析思路和方法1 優(yōu)勢(shì)策略均衡優(yōu)勢(shì)策略均衡2 箭頭法箭頭法3 畫線法畫線法4 嚴(yán)格劣勢(shì)反復(fù)消去法嚴(yán)格劣勢(shì)反復(fù)消去法1 優(yōu)勢(shì)策略均衡優(yōu)勢(shì)策略均衡 不管其他博弈方選擇什么策略,一博不管其他博弈方選擇什么策略,一博弈方的某個(gè)策略給他帶來的得益始終高于弈方的某個(gè)策略給他帶來的得益始終高于其他策略,就稱此策略為其他策略,就稱此策略為“優(yōu)勢(shì)優(yōu)勢(shì)” 一策略組合中的策略都是博弈方的優(yōu)一策略組合中的策略都是博弈方的優(yōu)勢(shì)策略,則稱該策略為勢(shì)策略,則稱該策略為“優(yōu)勢(shì)策略均衡優(yōu)勢(shì)策略均衡” 如如“囚徒困境囚徒困境”2
53、 箭頭法箭頭法 思路是:判斷各博弈方能否通過單獨(dú)改思路是:判斷各博弈方能否通過單獨(dú)改變自己的策略而改善自己的得益,如能,則變自己的策略而改善自己的得益,如能,則引一箭頭。對(duì)可能的策略組合都考察過后,引一箭頭。對(duì)可能的策略組合都考察過后,根據(jù)箭頭反映的情況來判斷博弈的結(jié)果。根據(jù)箭頭反映的情況來判斷博弈的結(jié)果。犯人A犯人B坦白坦白不坦白不坦白坦白坦白-10,-100,25不坦白不坦白25,01,1 按按等待等待按按5,15,14,44,4等待等待9,-19,-10,00,0小豬大豬 足球足球演唱會(huì)演唱會(huì)足球足球2 2,1 10 0,0 0演唱會(huì)演唱會(huì)1 1,1 11 1,2 2王菲李亞鵬 某策略組合只有指向的箭頭,沒有某策略組合只有指向的箭
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 服裝店裝修發(fā)包合同
- 2025年度養(yǎng)豬場(chǎng)生物安全防控體系建設(shè)合同
- 2025年度勞動(dòng)合同到期解除協(xié)議書及離職員工離職證明及離職手續(xù)辦理指南
- 2025年度建筑勞務(wù)施工節(jié)能減排合作協(xié)議
- 2025年度分紅股收益分配與權(quán)益變更協(xié)議
- 2025年度數(shù)據(jù)保密審計(jì)與保密合同
- 2025年度公司免責(zé)的旅游服務(wù)合作協(xié)議
- 2025年度創(chuàng)業(yè)公司股權(quán)激勵(lì)及轉(zhuǎn)讓協(xié)議
- 2025年網(wǎng)絡(luò)游戲行業(yè)發(fā)展現(xiàn)狀分析:網(wǎng)絡(luò)游戲國內(nèi)用戶規(guī)模不斷擴(kuò)大
- 崗位晉升申請(qǐng)書
- 2024年成人高等教育學(xué)士學(xué)位英語水平考試大綱
- 職業(yè)技術(shù)學(xué)院《酒店財(cái)務(wù)管理》課程標(biāo)準(zhǔn)
- 【蘇教版信息科技】三年級(jí)下冊(cè)8.1《認(rèn)識(shí)自主可控》教案
- MIL-STD-202-211-2020美國美軍標(biāo)準(zhǔn)
- 《假性動(dòng)脈瘤》課件
- JBT 14682-2024 多關(guān)節(jié)機(jī)器人用伺服電動(dòng)機(jī)技術(shù)規(guī)范(正式版)
- 診所校驗(yàn)現(xiàn)場(chǎng)審核表
- DL-T 572-2021電力變壓器運(yùn)行規(guī)程-PDF解密
- 教科版四下科學(xué)《植物的生長變化》單元解讀(新教材解讀)
- 2024年高考生物考前信息必刷卷02(全國卷新教材)(含答案與解析)
- JB-T 14509-2023 反滲透海水淡化設(shè)備技術(shù)規(guī)范
評(píng)論
0/150
提交評(píng)論