![博弈論高級(jí)管理學(xué)講義_第1頁(yè)](http://file4.renrendoc.com/view/ed0eedea8f710d0d25aa15dfc6cb2395/ed0eedea8f710d0d25aa15dfc6cb23951.gif)
![博弈論高級(jí)管理學(xué)講義_第2頁(yè)](http://file4.renrendoc.com/view/ed0eedea8f710d0d25aa15dfc6cb2395/ed0eedea8f710d0d25aa15dfc6cb23952.gif)
![博弈論高級(jí)管理學(xué)講義_第3頁(yè)](http://file4.renrendoc.com/view/ed0eedea8f710d0d25aa15dfc6cb2395/ed0eedea8f710d0d25aa15dfc6cb23953.gif)
![博弈論高級(jí)管理學(xué)講義_第4頁(yè)](http://file4.renrendoc.com/view/ed0eedea8f710d0d25aa15dfc6cb2395/ed0eedea8f710d0d25aa15dfc6cb23954.gif)
![博弈論高級(jí)管理學(xué)講義_第5頁(yè)](http://file4.renrendoc.com/view/ed0eedea8f710d0d25aa15dfc6cb2395/ed0eedea8f710d0d25aa15dfc6cb23955.gif)
版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
《高級(jí)管理學(xué)》
第八講博弈論初步12/28/20221SchoolofEconomics&Management,TongjiUniversity1囚徒困境和納什均衡
囚徒困境(prisoners’dilemma)博弈論的著名的例子,納什均衡是博弈論的重要概念。囚徒困境說(shuō)的是,兩個(gè)嫌疑犯作案后被捕,起訴機(jī)構(gòu)沒有足夠的證據(jù)證明他們搶劫了銀行。所以,若犯人們不坦白,起訴者只能就非法持有武器罪起訴,判犯人有期徒刑2年。起訴者于是向犯人采取攻心戰(zhàn),說(shuō)可以“坦白從寬、抗拒從嚴(yán)”。如果一人坦白,則坦白者從寬處理,判徒刑1年,抗拒者從嚴(yán)處理,判徒刑12年。如果兩人都坦白,每人依法判徒刑10年。兩個(gè)囚徒是坦白還是不坦白呢?12/28/20222SchoolofEconomics&Management,TongjiUniversity1.1囚徒困境12/28/20223SchoolofEconomics&Management,TongjiUniversity1.2博弈均衡博弈論假設(shè)博弈的參加者都是理性的,即在對(duì)手戰(zhàn)略給定的條件下,每個(gè)參加者都會(huì)選擇適當(dāng)?shù)膽?zhàn)略來(lái)實(shí)現(xiàn)自己報(bào)酬的最大化(或損失最小化)。問題是博弈的一方不能控制另一方的決策。當(dāng)參加者甲以最優(yōu)戰(zhàn)略對(duì)付乙的某個(gè)戰(zhàn)略時(shí),乙會(huì)發(fā)現(xiàn)原先的戰(zhàn)略不是對(duì)付甲的實(shí)際戰(zhàn)略的最佳戰(zhàn)略,因而會(huì)改變其戰(zhàn)略。要是乙改變了戰(zhàn)略,參加者甲也要進(jìn)行相應(yīng)的改變。這樣的改變行為會(huì)否停止?這里借用經(jīng)濟(jì)學(xué)常用的均衡概念,我們把博弈的穩(wěn)定結(jié)果稱為均衡,博弈的均衡也稱為博弈的解。均衡是指所有的參加者都不想改變戰(zhàn)略的狀態(tài)。
12/28/20224SchoolofEconomics&Management,TongjiUniversity1.3占優(yōu)均衡在一些特殊的博弈中,一個(gè)參加者的最優(yōu)戰(zhàn)略可能并不依賴于其他參加者的戰(zhàn)略選擇,也就是說(shuō),不論其他參加者選擇什么戰(zhàn)略,他的最優(yōu)戰(zhàn)略是唯一的,這樣的最優(yōu)戰(zhàn)略被稱為“占優(yōu)戰(zhàn)略”(dominantstrategy)。在上述的囚徒困境博弈中,每個(gè)囚徒可選擇的戰(zhàn)略有兩種:坦白與不坦白。顯然,不論另外一個(gè)囚犯選擇什么戰(zhàn)略,每個(gè)囚犯的最優(yōu)戰(zhàn)略都是“坦白”。例如,如果乙選擇坦白,囚犯甲選擇坦白時(shí)的報(bào)酬為-10,選擇不坦白的報(bào)酬為-12,因而坦白比不坦白好;如果乙選擇不坦白,甲坦白的報(bào)酬為-1,不坦白的報(bào)酬為-2,所以坦白還是比不坦白好。也就是說(shuō),“坦白”是囚犯甲的占優(yōu)戰(zhàn)略。由于對(duì)稱性,“坦白”也是囚犯乙的占優(yōu)戰(zhàn)略。于是,(坦白,坦白)或(-10,-10)是囚徒困境博弈的占優(yōu)均衡。
12/28/20225SchoolofEconomics&Management,TongjiUniversity個(gè)人理性與集體理性甲乙兩人都尋求最好的結(jié)果,而得到的卻是較糟的結(jié)果。這個(gè)例子說(shuō)明,在多人決策的環(huán)境里,個(gè)人理性與集體理性經(jīng)常是矛盾的,這種集體利益和個(gè)人利益的之間的沖突被稱為“囚徒困境”。
12/28/20226SchoolofEconomics&Management,TongjiUniversity1.4納什均衡納什均衡是這樣一種穩(wěn)定狀態(tài),博弈的任何一方參加者都不會(huì)改變其戰(zhàn)略,如果其他參加者都不改變戰(zhàn)略的話。
依定義,任何占優(yōu)戰(zhàn)略均衡必定是納什均衡,但納什均衡卻不一定是占優(yōu)戰(zhàn)略均衡,占優(yōu)戰(zhàn)略均衡是比較強(qiáng)的均衡概念。囚徒困境中的(坦白,坦白)就是納什均衡。經(jīng)濟(jì)生活中的眾多集體利益和個(gè)人利益的之間的沖突帶來(lái)的非帕累托有效狀態(tài)都是納什均衡。12/28/20227SchoolofEconomics&Management,TongjiUniversity納什均衡(嚴(yán)格的定義)12/28/20228SchoolofEconomics&Management,TongjiUniversity完全信息靜態(tài)博弈的幾個(gè)著名博弈智豬博弈(boxedpigs)豬圈里有兩頭豬,一頭大豬,一頭小豬,豬圈的一頭有個(gè)豬食槽,另一頭安裝一個(gè)按鈕,控制著豬食的供應(yīng)。按一下按鈕會(huì)有10單位的豬食進(jìn)槽,但誰(shuí)按按鈕誰(shuí)就要付2個(gè)單位的成本。若大豬先到,大豬吃到9個(gè)單位,小豬只能吃1個(gè)單位;若同時(shí)到,大豬吃7個(gè)單位,小豬吃3個(gè)單位;若小豬先到,大豬吃6個(gè)單位,小豬吃4個(gè)單位。12/28/20229SchoolofEconomics&Management,TongjiUniversity標(biāo)準(zhǔn)型支付矩陣12/28/202210SchoolofEconomics&Management,TongjiUniversity性別戰(zhàn)戰(zhàn)(battleofthesexes)12/21/202211SchoolofEconomics&Management,TongjiUniversity市場(chǎng)進(jìn)進(jìn)入阻阻撓博博弈12/21/202212SchoolofEconomics&Management,TongjiUniversity2動(dòng)態(tài)態(tài)博弈弈靜態(tài)博博弈,,即博博弈各各方同同時(shí)行行動(dòng),,但是是經(jīng)濟(jì)濟(jì)生活活中許許多情情形是是動(dòng)態(tài)態(tài)博弈弈,也也就是是指博博弈參參加者者的行行動(dòng)有有先后后順序序,又又叫序序貫博博弈。。12/21/202213SchoolofEconomics&Management,TongjiUniversity2.1完完全信息息動(dòng)態(tài)博博弈的分分類博弈總的的可以分分為完全全信息的的博弈((即博弈弈參加者者的收益益函數(shù)是是共同知知識(shí)的博博弈)和和不完全全信息博博弈(博博弈中的的一些參參加者不不知道其其它參加加者的收收益函數(shù)數(shù))。完全信息息動(dòng)態(tài)博博弈又分為完完全且完完美信息息(completeandperfectinformation)的動(dòng)態(tài)態(tài)博弈和和完全但但不完美美信息博博弈兩類類。前者者是指在在博弈進(jìn)進(jìn)行的每每一步當(dāng)當(dāng)中,要要選擇行行動(dòng)的參參加者都都知道這這一步之之前博弈弈進(jìn)行的的整個(gè)過(guò)過(guò)程;后后者是指指在博弈弈的某些些階段,,要選擇擇行動(dòng)的的參加者者并不知知道在這這一步之之前博弈弈進(jìn)行的的整個(gè)過(guò)過(guò)程12/21/202214SchoolofEconomics&Management,TongjiUniversity2.2子博弈完完美納什什均衡((SPNE)一個(gè)子博博弈是全全部博弈弈的一部部分,當(dāng)當(dāng)全部博博弈進(jìn)行行到任何何一個(gè)階階段,到到此為止止的進(jìn)行行過(guò)程已已經(jīng)稱為為博弈參參加各方方的共同同知識(shí),,而其后后尚未開開始進(jìn)行行的部分分就是一一個(gè)子博博弈。如如果博弈弈參加者者的戰(zhàn)略略在每一一子博弈弈中都構(gòu)構(gòu)成納什什均衡,,我們稱稱此納什什均衡是是子博弈弈完美納納什均衡衡(subgameperfectNashequilibrium)(Selten,1965)。。所有動(dòng)態(tài)博弈弈的中心問題題是可信任性性,所以不可可置信的威脅脅被研究較多多,子博弈完完美納什均衡衡(SPNE)是不含不可可置信的威脅脅的。子博弈弈完美納什均均衡可以用逆逆向歸納法((backwards-induction)找出12/21/202215SchoolofEconomics&Management,TongjiUniversity幾種著名的動(dòng)動(dòng)態(tài)博弈Stackelbeg模模型Hotelling模型型(地點(diǎn)模型型)12/21/202216SchoolofEconomics&Management,TongjiUniversity3重復(fù)博弈:特特殊的動(dòng)態(tài)博博弈同一博弈重復(fù)復(fù)多次,稱為為重復(fù)博弈((repeatedgame),,其中的的每一次博弈弈稱為“階段段博弈”(stagegame),事實(shí)上它它是動(dòng)態(tài)博弈弈的一種特殊殊情況。它的的均衡狀況可可能與一次性性博弈不同,,被研究最多多的重復(fù)博弈弈還是囚徒困困境博弈。12/21/202217SchoolofEconomics&Management,TongjiUniversity例子子:古古諾諾產(chǎn)產(chǎn)量量博博弈弈12/21/202218SchoolofEconomics&Management,TongjiUniversity作為為囚囚徒徒困困境境的的一一個(gè)個(gè)例例子子,,其其占占優(yōu)優(yōu)戰(zhàn)戰(zhàn)略略均均衡衡的的結(jié)結(jié)局局雙雙方方都都增增加加產(chǎn)產(chǎn)量量,,它它們們的的報(bào)報(bào)酬酬各各為為900。如如果果它它們們能能合合作作,,共共同同壓壓縮縮產(chǎn)產(chǎn)量量,,則則可可以以實(shí)實(shí)現(xiàn)現(xiàn)各各自自1000的報(bào)報(bào)酬酬。。它它們們都都想想合合作作,,但但是是又又怕怕被被欺欺騙騙,,于于是是就就此此陷陷入入““囚囚徒徒困困境境””。。關(guān)關(guān)鍵鍵是是在在一一次次性性博博弈弈中中,,被被欺欺騙騙之之后后就就無(wú)無(wú)法法報(bào)報(bào)復(fù)復(fù)了了,,當(dāng)當(dāng)然然也也無(wú)無(wú)法法建建立立公公司司的的聲聲譽(yù)譽(yù)。。重重復(fù)復(fù)博博弈弈下下的的情情形形就就會(huì)會(huì)發(fā)發(fā)生生變變化化。。因因?yàn)闉椴┎┺霓牡牡钠淦渌鼌⒓蛹诱哒哌^(guò)過(guò)去去行行動(dòng)動(dòng)的的歷歷史史是是可可以以觀觀測(cè)測(cè)得得到到的的,,一一個(gè)個(gè)參參加加者者可可以以使使自自己己在在某某個(gè)個(gè)階階段段博博弈弈的的戰(zhàn)戰(zhàn)略略選選擇擇依依賴賴于于其其它它參參加加者者過(guò)過(guò)去去的的行行動(dòng)動(dòng)歷歷史史。。這這樣樣企企業(yè)業(yè)就就可可以以報(bào)報(bào)復(fù)復(fù)和和建建立立合合作作的的聲聲譽(yù)譽(yù),,合合作作發(fā)發(fā)生生的的原原因因在在于于公公司司的的長(zhǎng)長(zhǎng)遠(yuǎn)遠(yuǎn)利利益益。。12/21/202219SchoolofEconomics&Management,TongjiUniversity在重重復(fù)復(fù)博博弈弈里里,,參參加加者者每每個(gè)個(gè)階階段段都都得得到到一一定定的的報(bào)報(bào)酬酬,,長(zhǎng)長(zhǎng)期期博博弈弈就就要要把把所所有有的的各各期期報(bào)報(bào)酬酬加加總總起起來(lái)來(lái)進(jìn)進(jìn)行行比比較較。。這這里里引引進(jìn)進(jìn)一一個(gè)個(gè)指指標(biāo)標(biāo)::時(shí)時(shí)間間折折扣扣率率δ,,數(shù)數(shù)值值等等于于明明年年的的一一元元前前相相當(dāng)當(dāng)于于今今年年的的金金額額,,δδ也也稱稱為為貼貼現(xiàn)現(xiàn)因因子子。。例例如如,,明明年年的的利利潤(rùn)潤(rùn)為為,,折折算算到到現(xiàn)現(xiàn)在在就就是是δδ。。熟熟悉悉財(cái)財(cái)務(wù)務(wù)的的同同學(xué)學(xué)都都知知道道這這是是貨貨幣幣的的時(shí)時(shí)間間價(jià)價(jià)值值,,但但是是δδ不不是是貼貼現(xiàn)現(xiàn)率率r,,而而是是1-r,,這這里里不不多多解解釋釋。。還還有有一一點(diǎn)點(diǎn)不不一一樣樣,,貼貼現(xiàn)現(xiàn)率率r更更多多的的是是由由社社會(huì)會(huì)決決定定的的,,而而時(shí)間間折折扣扣率率δ更更多多的的是是博博弈弈參參加加者者的的主主觀觀判判斷斷。。假定定企企業(yè)業(yè)甲甲和和企企業(yè)業(yè)乙乙從從頭頭到到尾尾均均合合作作,,那那么么兩兩家家企企業(yè)業(yè)的的總總報(bào)報(bào)酬酬為為如果果一一開開始始就就不不合合作作,,那那么么每每個(gè)個(gè)公公司司的的總總報(bào)報(bào)酬酬為為12/21/202220SchoolofEconomics&Management,TongjiUniversity9、靜夜四無(wú)無(wú)鄰,荒居居舊業(yè)貧。。。12月-2212月-22Wednesday,December21,202210、雨中黃葉葉樹,燈下下白頭人。。。18:18:3318:18:3318:1812/21/20226:18:33PM11、以我獨(dú)獨(dú)沈久,,愧君相相見頻。。。12月-2218:18:3318:18Dec-2221-Dec-2212、故人人江海海別,,幾度度隔山山川。。。18:18:3318:18:3318:18Wednesday,December21,202213、乍見翻疑疑夢(mèng),相悲悲各問年。。。12月-2212月-2218:18:3418:18:34December21,202214、他鄉(xiāng)生白白發(fā),舊國(guó)國(guó)見青山。。。21十二二月20226:18:34下下午18:18:3412月-2215、比不不了得得就不不比,,得不不到的的就不不要。。。。。十二月月226:18下下午午12月月-2218:18December21,202216、行動(dòng)出出成果,,工作出出財(cái)富。。。2022/12/2118:18:3418:18:3421December202217、做前,,能夠環(huán)環(huán)視四周周;做時(shí)時(shí),你只只能或者者最好沿沿著以腳腳為起點(diǎn)點(diǎn)的射線線向前。。。6:18:34下午午6:18下午午18:18:3412月-229、沒沒有有失失敗敗,,只只有有暫暫時(shí)時(shí)停停止止成成功功?。 ?。12月月-2212月月-22Wednesday,December21,202210、很多多事情情努力力了未未必有有結(jié)果果,但但是不不努力力卻什什么改改變也也沒有有。。。18:18:3418:18:3418:1812/21/20226:18:34PM11、成功功就是是日復(fù)復(fù)一日日那一一點(diǎn)點(diǎn)點(diǎn)小小小努力力的積積累。。。12月月-2218:18:3418:18Dec-2221-Dec-2212、世間成成事,不不求其絕絕對(duì)圓滿滿,留一一份不足足,可得得無(wú)限完完美。。。18:18:3418:18:3418:18Wednesday,December21,202213、不知香積積寺,數(shù)里里入云峰。。。12月-2212月-2218:18:3418:18:34December21,202214、意志堅(jiān)強(qiáng)強(qiáng)的人能把把世界放在在手中像泥泥塊一樣任任意揉捏。。21十二二月20226:18:34下下午18:18:3412月-2215、楚塞塞三湘湘接,,荊門門九派派通。。。。。十二月月226:18下下午午12月月-2218:18December21,202216、少年年十五五二十十時(shí),,步行行奪得得胡馬馬騎。。。2022/12/2118:18:3418:18:3421December202217、空山新雨后后,天氣晚來(lái)來(lái)秋。。6:18:34下午6:18下下午18:18:341
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 二零二五年度碎石場(chǎng)環(huán)保設(shè)備購(gòu)置合同2篇
- 2024年中國(guó)球磨機(jī)配件市場(chǎng)調(diào)查研究報(bào)告
- 2025年度展臺(tái)搭建與展覽策劃一體化服務(wù)合同3篇
- 公益崗位用工協(xié)議(2025年度)執(zhí)行責(zé)任書3篇
- 二零二五年度農(nóng)副產(chǎn)品品牌推廣與廣告投放合同3篇
- 2024年沁陽(yáng)市人民醫(yī)院高層次衛(wèi)技人才招聘筆試歷年參考題庫(kù)頻考點(diǎn)附帶答案
- 2025年度消防控制系統(tǒng)設(shè)計(jì)與安裝合同2篇
- 2024年噴涂塑鋼鋼襯項(xiàng)目可行性研究報(bào)告
- 《基于單目視覺移動(dòng)機(jī)器人的避障研究》
- 2024年單相感應(yīng)馬達(dá)項(xiàng)目可行性研究報(bào)告
- AI在藥物研發(fā)中的應(yīng)用
- 建立信息共享和預(yù)警機(jī)制
- 美容外外科管理制度
- 苯-甲苯分離精餾塔化工原理課程設(shè)計(jì)
- 國(guó)企人力資源崗位筆試題目多篇
- 病毒 課件 初中生物人教版八年級(jí)上冊(cè)(2023~2024學(xué)年)
- JGT129-2017 建筑門窗五金件 滑輪
- 三年級(jí)科學(xué)上冊(cè)水和空氣復(fù)習(xí)課教案
- 全國(guó)普通高校本科專業(yè)目錄(2023版)
- 助產(chǎn)學(xué)導(dǎo)論學(xué)習(xí)通章節(jié)答案期末考試題庫(kù)2023年
- 寧波大學(xué)“一頁(yè)開卷”考試專用紙
評(píng)論
0/150
提交評(píng)論