博弈論初步 高級(jí)管理學(xué)講義_第1頁(yè)
博弈論初步 高級(jí)管理學(xué)講義_第2頁(yè)
博弈論初步 高級(jí)管理學(xué)講義_第3頁(yè)
博弈論初步 高級(jí)管理學(xué)講義_第4頁(yè)
博弈論初步 高級(jí)管理學(xué)講義_第5頁(yè)
已閱讀5頁(yè),還剩16頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

《高級(jí)管理學(xué)》

第九講博弈論初步12/28/20221SchoolofEconomics&Management,TongjiUniversity1囚徒困境和納什均衡

囚徒困境(prisoners’dilemma)博弈論的著名的例子,納什均衡是博弈論的重要概念。囚徒困境說的是,兩個(gè)嫌疑犯作案后被捕,起訴機(jī)構(gòu)沒有足夠的證據(jù)證明他們搶劫了銀行。所以,若犯人們不坦白,起訴者只能就非法持有武器罪起訴,判犯人有期徒刑2年。起訴者于是向犯人采取攻心戰(zhàn),說可以“坦白從寬、抗拒從嚴(yán)”。如果一人坦白,則坦白者從寬處理,判徒刑1年,抗拒者從嚴(yán)處理,判徒刑12年。如果兩人都坦白,每人依法判徒刑10年。兩個(gè)囚徒是坦白還是不坦白呢?12/28/20222SchoolofEconomics&Management,TongjiUniversity1.1囚徒困境12/28/20223SchoolofEconomics&Management,TongjiUniversity1.2博弈均衡博弈論假設(shè)博弈的參加者都是理性的,即在對(duì)手戰(zhàn)略給定的條件下,每個(gè)參加者都會(huì)選擇適當(dāng)?shù)膽?zhàn)略來實(shí)現(xiàn)自己報(bào)酬的最大化(或損失最小化)。問題是博弈的一方不能控制另一方的決策。當(dāng)參加者甲以最優(yōu)戰(zhàn)略對(duì)付乙的某個(gè)戰(zhàn)略時(shí),乙會(huì)發(fā)現(xiàn)原先的戰(zhàn)略不是對(duì)付甲的實(shí)際戰(zhàn)略的最佳戰(zhàn)略,因而會(huì)改變其戰(zhàn)略。要是乙改變了戰(zhàn)略,參加者甲也要進(jìn)行相應(yīng)的改變。這樣的改變行為會(huì)否停止?這里借用經(jīng)濟(jì)學(xué)常用的均衡概念,我們把博弈的穩(wěn)定結(jié)果稱為均衡,博弈的均衡也稱為博弈的解。均衡是指所有的參加者都不想改變戰(zhàn)略的狀態(tài)。

12/28/20224SchoolofEconomics&Management,TongjiUniversity1.3占優(yōu)均衡在一些特殊的博弈中,一個(gè)參加者的最優(yōu)戰(zhàn)略可能并不依賴于其他參加者的戰(zhàn)略選擇,也就是說,不論其他參加者選擇什么戰(zhàn)略,他的最優(yōu)戰(zhàn)略是唯一的,這樣的最優(yōu)戰(zhàn)略被稱為“占優(yōu)戰(zhàn)略”(dominantstrategy)。在上述的囚徒困境博弈中,每個(gè)囚徒可選擇的戰(zhàn)略有兩種:坦白與不坦白。顯然,不論另外一個(gè)囚犯選擇什么戰(zhàn)略,每個(gè)囚犯的最優(yōu)戰(zhàn)略都是“坦白”。例如,如果乙選擇坦白,囚犯甲選擇坦白時(shí)的報(bào)酬為-10,選擇不坦白的報(bào)酬為-12,因而坦白比不坦白好;如果乙選擇不坦白,甲坦白的報(bào)酬為-1,不坦白的報(bào)酬為-2,所以坦白還是比不坦白好。也就是說,“坦白”是囚犯甲的占優(yōu)戰(zhàn)略。由于對(duì)稱性,“坦白”也是囚犯乙的占優(yōu)戰(zhàn)略。于是,(坦白,坦白)或(-10,-10)是囚徒困境博弈的占優(yōu)均衡。

12/28/20225SchoolofEconomics&Management,TongjiUniversity個(gè)人理性與集體理性甲乙兩人都尋求最好的結(jié)果,而得到的卻是較糟的結(jié)果。這個(gè)例子說明,在多人決策的環(huán)境里,個(gè)人理性與集體理性經(jīng)常是矛盾的,這種集體利益和個(gè)人利益的之間的沖突被稱為“囚徒困境”。

12/28/20226SchoolofEconomics&Management,TongjiUniversity1.4納什均衡納什均衡是這樣一種穩(wěn)定狀態(tài),博弈的任何一方參加者都不會(huì)改變其戰(zhàn)略,如果其他參加者都不改變戰(zhàn)略的話。

依定義,任何占優(yōu)戰(zhàn)略均衡必定是納什均衡,但納什均衡卻不一定是占優(yōu)戰(zhàn)略均衡,占優(yōu)戰(zhàn)略均衡是比較強(qiáng)的均衡概念。囚徒困境中的(坦白,坦白)就是納什均衡。經(jīng)濟(jì)生活中的眾多集體利益和個(gè)人利益的之間的沖突帶來的非帕累托有效狀態(tài)都是納什均衡。12/28/20227SchoolofEconomics&Management,TongjiUniversity納什均衡(嚴(yán)格的定義)12/28/20228SchoolofEconomics&Management,TongjiUniversity完全信息靜態(tài)博弈的幾個(gè)著名博弈智豬博弈(boxedpigs)豬圈里有兩頭豬,一頭大豬,一頭小豬,豬圈的一頭有個(gè)豬食槽,另一頭安裝一個(gè)按鈕,控制著豬食的供應(yīng)。按一下按鈕會(huì)有10單位的豬食進(jìn)槽,但誰按按鈕誰就要付2個(gè)單位的成本。若大豬先到,大豬吃到9個(gè)單位,小豬只能吃1個(gè)單位;若同時(shí)到,大豬吃7個(gè)單位,小豬吃3個(gè)單位;若小豬先到,大豬吃6個(gè)單位,小豬吃4個(gè)單位。12/28/20229SchoolofEconomics&Management,TongjiUniversity標(biāo)準(zhǔn)型支付矩陣12/28/202210SchoolofEconomics&Management,TongjiUniversity性別戰(zhàn)((battleofthesexes)12/21/202211SchoolofEconomics&Management,TongjiUniversity市場(chǎng)進(jìn)入入阻撓博博弈12/21/202212SchoolofEconomics&Management,TongjiUniversity2動(dòng)態(tài)博博弈靜態(tài)博弈弈,即博博弈各方方同時(shí)行行動(dòng),但但是經(jīng)濟(jì)濟(jì)生活中中許多情情形是動(dòng)動(dòng)態(tài)博弈弈,也就就是指博博弈參加加者的行行動(dòng)有先先后順序序,又叫叫序貫博博弈。12/21/202213SchoolofEconomics&Management,TongjiUniversity2.1完完全信息息動(dòng)態(tài)博博弈的分分類博弈總的的可以分分為完全全信息的的博弈((即博弈弈參加者者的收益益函數(shù)是是共同知知識(shí)的博博弈)和和不完全全信息博博弈(博博弈中的的一些參參加者不不知道其其它參加加者的收收益函數(shù)數(shù))。完全信息息動(dòng)態(tài)博博弈又分為完完全且完完美信息息(completeandperfectinformation)的動(dòng)態(tài)態(tài)博弈和和完全但但不完美美信息博博弈兩類類。前者者是指在在博弈進(jìn)進(jìn)行的每每一步當(dāng)當(dāng)中,要要選擇行行動(dòng)的參參加者都都知道這這一步之之前博弈弈進(jìn)行的的整個(gè)過過程;后后者是指指在博弈弈的某些些階段,,要選擇擇行動(dòng)的的參加者者并不知知道在這這一步之之前博弈弈進(jìn)行的的整個(gè)過過程12/21/202214SchoolofEconomics&Management,TongjiUniversity2.2子博弈完美納納什均衡(SPNE)一個(gè)子博弈是是全部博弈的的一部分,當(dāng)當(dāng)全部博弈進(jìn)進(jìn)行到任何一一個(gè)階段,到到此為止的進(jìn)進(jìn)行過程已經(jīng)經(jīng)稱為博弈參參加各方的共共同知識(shí),而而其后尚未開開始進(jìn)行的部部分就是一個(gè)個(gè)子博弈。如如果博弈參加加者的戰(zhàn)略在在每一子博弈弈中都構(gòu)成納納什均衡,我我們稱此納什什均衡是子博博弈完美納什什均衡(subgameperfectNashequilibrium)(Selten,1965)。。所有動(dòng)態(tài)博弈弈的中心問題題是可信任性性,所以不可可置信的威脅脅被研究較多多,子博弈完完美納什均衡衡(SPNE)是不含不可可置信的威脅脅的。子博弈弈完美納什均均衡可以用逆逆向歸納法((backwards-induction)找出12/21/202215SchoolofEconomics&Management,TongjiUniversity幾種著名的動(dòng)動(dòng)態(tài)博弈Stackelbeg模模型Hotelling模型型(地點(diǎn)模型型)12/21/202216SchoolofEconomics&Management,TongjiUniversity3重復(fù)博弈:特特殊的動(dòng)態(tài)博博弈同一博弈重復(fù)復(fù)多次,稱為為重復(fù)博弈((repeatedgame),,其中的的每一次博弈弈稱為“階段段博弈”(stagegame),事實(shí)上它它是動(dòng)態(tài)博弈弈的一種特殊殊情況。它的的均衡狀況可可能與一次性性博弈不同,,被研究最多多的重復(fù)博弈弈還是囚徒困困境博弈。12/21/202217SchoolofEconomics&Management,TongjiUniversity例子:古諾產(chǎn)產(chǎn)量博弈12/21/202218SchoolofEconomics&Management,TongjiUniversity作為囚徒困境境的一個(gè)例子子,其占優(yōu)戰(zhàn)戰(zhàn)略均衡的結(jié)結(jié)局雙方都增增加產(chǎn)量,它它們的報(bào)酬各各為900。如果它們能能合作,共同同壓縮產(chǎn)量,,則可以實(shí)現(xiàn)現(xiàn)各自1000的報(bào)酬。它們們都想合作,,但是又怕被被欺騙,于是是就此陷入““囚徒困境””。關(guān)鍵是在在一次性博弈弈中,被欺騙騙之后就無法法報(bào)復(fù)了,當(dāng)當(dāng)然也無法建建立公司的聲聲譽(yù)。重復(fù)博博弈下的情形形就會(huì)發(fā)生變變化。因?yàn)椴┎┺牡钠渌鼌⒓诱哌^去行行動(dòng)的歷史是是可以觀測(cè)得得到的,一個(gè)個(gè)參加者可以以使自己在某某個(gè)階段博弈弈的戰(zhàn)略選擇擇依賴于其它它參加者過去去的行動(dòng)歷史史。這樣企業(yè)業(yè)就可以報(bào)復(fù)復(fù)和建立合作作的聲譽(yù),合合作發(fā)生的原原因在于公司司的長(zhǎng)遠(yuǎn)利益益。12/21/202219SchoolofEconomics&Management,TongjiUniversity在重復(fù)博弈里里,參加者每每個(gè)階段都得得到一定的報(bào)報(bào)酬,長(zhǎng)期博博弈就要把所所有的各期報(bào)報(bào)酬加總起來來進(jìn)行比較。。這里引進(jìn)一一個(gè)指標(biāo):時(shí)時(shí)間折扣率δ,數(shù)值等于于明年的一元元前相當(dāng)于今今年的金額,,δ也稱為貼貼現(xiàn)因子。例例如,明年的的利潤(rùn)為,折折算到現(xiàn)在就就是δ。熟悉悉財(cái)務(wù)的同學(xué)學(xué)都知道這是是貨幣的時(shí)間間價(jià)值,但是是δ不是貼現(xiàn)現(xiàn)率r,而是是1-r,這這里不多解釋釋。還有一點(diǎn)點(diǎn)不一樣,貼貼現(xiàn)率r更多多的是由社會(huì)會(huì)決定的,而而時(shí)間折扣率δ更多的是博博弈參加者的的主觀判斷。。假定企業(yè)甲和和企業(yè)乙從頭頭到尾均合作作,那么兩家家企業(yè)的總報(bào)報(bào)酬為如果一開始就就不合作,那那么每個(gè)公司司的總報(bào)酬為為12/21/202220SchoolofEconomics&Management,TongjiUniversity9、靜夜四無無鄰,荒居居舊業(yè)貧。。。12月-2212月-22Wednesday,December21,202210、雨中黃葉葉樹,燈下下白頭人。。。18:16:5818:16:5818:1612/21/20226:16:58PM11、以我我獨(dú)沈沈久,,愧君君相見見頻。。。12月月-2218:16:5818:16Dec-2221-Dec-2212、故人人江海海別,,幾度度隔山山川。。。18:16:5818:16:5818:16Wednesday,December21,202213、乍見見翻疑疑夢(mèng),,相悲悲各問問年。。。12月月-2212月月-2218:16:5818:16:58December21,202214、他鄉(xiāng)生生白發(fā),,舊國(guó)見見青山。。。21十十二月20226:16:58下午午18:16:5812月-2215、比不了了得就不不比,得得不到的的就不要要。。。。十二月226:16下午午12月-2218:16December21,202216、行動(dòng)出成果果,工作出財(cái)財(cái)富。。2022/12/2118:16:5818:16:5821December202217、做前前,能能夠環(huán)環(huán)視四四周;;做時(shí)時(shí),你你只能能或者者最好好沿著著以腳腳為起起點(diǎn)的的射線線向前前。。。6:16:58下下午6:16下下午午18:16:5812月月-229、沒有有失敗敗,只只有暫暫時(shí)停停止成成功??!。12月月-2212月月-22Wednesday,December21,202210、很多事事情努力力了未必必有結(jié)果果,但是是不努力力卻什么么改變也也沒有。。。18:16:5818:16:5818:1612/21/20226:16:58PM11、成功就就是日復(fù)復(fù)一日那那一點(diǎn)點(diǎn)點(diǎn)小小努努力的積積累。。。12月-2218:16:5818:16Dec-2221-Dec-2212、世間成成事,不不求其絕絕對(duì)圓滿滿,留一一份不足足,可得得無限完完美。。。18:16:5818:16:5818:16Wednesday,December21,202213、不不知知香香積積寺寺,,數(shù)數(shù)里里入入云云峰峰。。。。12月月-2212月月-2218:16:5818:16:58December21,202214、意意志志堅(jiān)堅(jiān)強(qiáng)強(qiáng)的的人人能能把把世世界界放放在在手手中中像像泥泥塊塊一一樣樣任任意意揉揉捏捏。。21十十二二月月20226:16:58下下午午18:16:5812月月-2215、楚塞塞三湘湘接,,荊門門九派派通。。。。。十二月月226:16下下午午12月月-2218:16December21,202216、少年年十五五二十十時(shí),,步行行奪得得胡馬馬騎。。。2022/12/2118:16:5818:16:5821December202217、空山新雨后后,天氣晚來來秋。。6:16:58下午6:16下下午18:16:5812月-229、楊柳散和風(fēng)風(fēng),青山澹吾吾慮。。12月-2212月-22Wednesday,December21,202210、閱讀一切好好書如同和過過去最杰出的的人談話。18:16:5818:16:5818:1612/21/20226:16:58PM11、越是是沒有有本領(lǐng)領(lǐng)的就就越加加自命命不凡凡。12月月-2218:16:5818:16Dec-2221-Dec-2212、越是是無能能的人人,越越喜歡歡挑剔剔別人人的錯(cuò)錯(cuò)兒。。18:16:5818:16:5818:16Wednesday,December21,202213、知人者智

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論