下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
生活中納什均衡例子生活中納什均衡例子
首先我們先簡潔看一下納什均衡的經(jīng)濟(jì)學(xué)含義:所謂納什均衡,指的是參加人的這樣一種策略組合,在該策略組合上,任何參加人單獨(dú)轉(zhuǎn)變策略都不會得到好處。換句話說,假如在一個策略組合上,當(dāng)全部其他人都不轉(zhuǎn)變策略時,沒有人會轉(zhuǎn)變自己的策略,則該策略組合就是一個納什均衡。大家可以現(xiàn)有一個簡潔的印象,結(jié)合下面的案例再回來看這個定義。
案例一、智豬博弈
豬圈里有兩頭豬,一頭大豬,一頭小豬。豬圈的一邊有個踏板,每踩一下踏板,在遠(yuǎn)離踏板的豬圈的另一邊的投食口就會落下少量的食物。假如有一只豬去踩踏板,另一只豬就有機(jī)會搶先吃到另一邊落下的食物。當(dāng)小豬踩動踏板時,大豬會在小豬跑到食槽之前剛好吃光全部的食物;若是大豬踩動了踏板,則還有機(jī)會在小豬吃完落下的食物之前跑到食槽,爭吃到另一半殘羹。
那么,兩只豬各會實(shí)行什么策略?答案是:小豬將選擇"搭便車'策略,也就是舒舒適服地等在食槽邊;而大豬則為一點(diǎn)殘羹不知疲乏地奔忙于踏板和食槽之間。
緣由何在?由于,小豬踩踏板將一無所獲,不踩踏板反而能吃上食物。對小豬而言,無論大豬是否踩動踏板,不踩踏板總是好的選擇。反觀大豬,已明知小豬是不會去踩動踏板的,自己親自去踩踏板總比不踩強(qiáng)吧,所以只好親力親為了。
案例二、囚徒逆境
(1950年,數(shù)學(xué)家塔克任斯坦福高??妥淌?,在給一些心理學(xué)家作講演時,講到兩個囚犯的故事。)
假設(shè)有兩個小偷A(chǔ)和B聯(lián)合犯事、私入民宅被警察抓住。警方將兩人分別置于不同的兩個房間內(nèi)進(jìn)行審訊,對每一個犯罪嫌疑人,警方給出的政策是:假如一個犯罪嫌疑人坦白了罪行,交出了贓物,于是證據(jù)確鑿,兩人都被判有罪。
假如另一個犯罪嫌疑人也作了坦白,則兩人各被判刑8年;假如另一個犯罪嫌人沒有坦白而是抵賴,則以阻礙公務(wù)罪(因已有證據(jù)表明其有罪)再加刑2年,而坦白者有功被減刑8年,馬上釋放。假如兩人都抵賴,則警方因證據(jù)不足不能判兩人的偷竊罪,但可以私入民宅的罪名將兩人各判入獄1年。
囚徒逆境博弈A╲B坦白抵賴
坦白-8,-80,-10
抵賴-10,0-1,-1
關(guān)于案例,明顯最好的策略是雙方都抵賴,結(jié)果是大家都只被判1年。但是由于兩人處于隔離的狀況,首先應(yīng)當(dāng)是從心理學(xué)的角度來看,當(dāng)事雙方都會懷疑對方會出賣自己以求自保、其次才是亞當(dāng)斯密的理論,假設(shè)每個人都是"理性的經(jīng)濟(jì)人',都會從利己的目的動身進(jìn)行選擇。
這兩個人都會有這樣一個盤算過程:假如他坦白,假如我抵賴,得坐10年監(jiān)獄,假如我坦白最多才8年;假如他要是抵賴,假如我也抵賴,我就會被判一年,假如我坦白就可以被釋放,而他會坐10年牢。綜合以上幾種狀況考慮,不管他坦白與否,對我而言都是坦白了劃算。兩個人都會動這樣的腦筋,最終,兩個人都選擇了坦白,結(jié)果都被判8年刑期。
基于經(jīng)濟(jì)學(xué)中Rationalagent的前提假設(shè),兩個囚犯符合自己利益的選擇是坦白招供,原本對雙方都有利的策略不招供從而均被判處一年就不會消失。這樣兩人都選擇坦白的策略以及因此被判8年的結(jié)局,納什均衡'首先對亞當(dāng)斯密的"看不見的手'的原理提出挑戰(zhàn):根據(jù)斯密的理論,在市場經(jīng)濟(jì)中,每一個人都從利己的目的動身,而最終全社會達(dá)到利他的效果。但是我們可以從"納什均衡'中引出"看不見的手'原理的一個悖論:從利己目的動身,結(jié)果損人不利己,既不利己也不利他。
案例三、一般范式博弈
GOO公司和SAM公司是某手機(jī)產(chǎn)品生態(tài)的兩大重量級參加者,雙方在產(chǎn)業(yè)鏈的不同位置上各司其職且關(guān)系曖昧,有時也往往因商業(yè)利益和產(chǎn)品影響力的爭奪而各懷異心。二者的收益也隨著博弈的變化而不斷更替。
上圖表格模擬了兩家公司的博弈現(xiàn)狀,雙方各有兩個可選策略"合作'與"背叛',格中的四組數(shù)據(jù)表示四個博弈結(jié)局的分?jǐn)?shù)(收益),每組數(shù)據(jù)的第一個數(shù)字表示GOO公司的收益,后一個數(shù)字表示SAM公司的收益。
博弈是同時進(jìn)行的,一方參加者必需站在對方的角度上來思索我方的策略選擇,以追求收益最大化。這在博弈論里稱作Puttingyourselvesintootherpeoplesshoes。
現(xiàn)在我們以GOO公司為第一人稱視角來思索應(yīng)對SAM公司的博弈策略。假如SAM公司選擇合作,那么我方也選擇合作帶來的收益是3,而我方選擇背叛帶來的收益是5,基于理性的收益最大化考慮,我方應(yīng)當(dāng)選擇背叛,這叫嚴(yán)格優(yōu)勢策略;假如SAM公司選擇背叛,那么我方選擇合作帶來的收益是-3,而選擇背叛帶來的收益為-1,為使損失降到最低,我方應(yīng)當(dāng)選擇背叛。最終,GOO公司的分析結(jié)果是,無論SAM公司選擇合作還是背叛策略,我方都必需選擇背叛策略才能獲得最大化的收益。
同理,當(dāng)SAM公司也以嚴(yán)格優(yōu)勢策略來應(yīng)對GOO公司的策略選擇時,我們重復(fù)上述分析過程,就能得出結(jié)論:無論GOO公司選擇合作還是背叛策略,SAM公司都必需選擇背叛策略才能獲得最大化收益。
最終我們發(fā)覺,本次博弈的雙方都實(shí)行了背叛策略,各自的收益都為-1,這是一個比較糟糕的結(jié)局,盡管對任何一方來說都不是最糟糕的那種。這種局面就是聞名的"囚徒逆境'。
但是,博弈的次數(shù)往往不止一次,就像COO與SAM公司雙方的商業(yè)往來或許會有許多機(jī)會。當(dāng)二者經(jīng)受了多次背叛策略的博弈之后,發(fā)覺公式上還有一個(3,3)收益的雙贏局面,這比(-1,-1)的收益結(jié)果明顯要好許多,因此二者在之后的博弈過程中必定會嘗試互建相信,從而驅(qū)使雙方都選擇合作策略。
這里有一個抱負(fù)化假設(shè),那就是假設(shè)雙方都知道博弈次數(shù)是無限的話,也就是說雙方的商業(yè)往來是無止盡的,那么二者的策略都將持續(xù)選擇合作,最終的博弈收益將定格在(3,3),這就是一個納什均衡。既然博弈次數(shù)是無限的,那么任何一方都沒有理由選擇背叛策略去冒險追求5點(diǎn)短暫收益,而招致對方在下一輪博弈中的報(bào)復(fù)(這種報(bào)復(fù)在博弈論里稱作"以牙還牙'策略)。
還有另一種假設(shè)狀況是,假使雙方都知道博弈次數(shù)是有限的,或許下一次博弈就是最終一次,那么為了避開對方在最終一輪博弈中選擇背叛策略而使我方遭受-3的收益損失,于是雙方都重新實(shí)行了背叛的策略選擇,最終的博弈結(jié)果又回到了(-1,-1),這就形成了其次個納什均衡。
由此可見,隨著次數(shù)(博弈性質(zhì))的變化,納什均衡點(diǎn)也并非唯一,這在下一個例子中有著更明顯的表現(xiàn)。
案例四、餓獅博弈
題設(shè)為A、B、C、D、E、F六只獅子(強(qiáng)弱從左到右依次排序)和一只綿羊。假設(shè)獅子A吃掉綿羊后就會打盹午睡,這時比A稍弱的獅子B就會趁機(jī)吃掉獅子A,接著B也會午睡,然后獅子C就會吃掉獅子B,以此類推。那么問題來了,獅子A敢不敢吃綿羊?
為簡化說明,我們先給出此題的解法。該題須采納逆向分析法,也就是從最弱的獅子F開頭分析,依次前推。假設(shè)獅子E睡著了,獅子F敢不敢吃掉獅子E?答案是確定的,由于在獅子F的后面已沒有其它獅子,所以獅子F可以放心地吃掉午睡中的獅子E。
連續(xù)前推,既然獅子E睡著會被獅子F吃掉,那么獅子E必定不敢吃在他前面睡著的獅子D。
再往前推,既然獅子E不敢吃掉獅子D,那么D則可以放心去吃午睡中的獅子C。依次前推,得出C不吃,B吃,A不吃。所以答案是獅子A不敢吃掉綿羊。
細(xì)心的人或許會發(fā)覺,假如增加或削減獅子的總數(shù),博弈的結(jié)果會完全不同。我們用下圖來驗(yàn)證:
我們在獅子F的后面增加了一只獅子G,總數(shù)變成7只。用逆向分析法根據(jù)上題步驟再推一次,很簡單得出結(jié)論:獅子G吃,獅子F不吃,E吃,D不吃,C吃,B不吃,A吃。這次的答案變成了獅子A敢吃掉綿羊。
對比兩次博弈我們發(fā)覺,獅子A敢不敢吃綿羊取決于獅子總數(shù)的奇偶性,總數(shù)為奇數(shù)時,A敢吃掉綿羊;總數(shù)為偶數(shù)時,A則不敢吃。因此,總數(shù)為奇數(shù)和總數(shù)為偶數(shù)的獅群博弈結(jié)果形成了兩個穩(wěn)定的納什均衡點(diǎn)。
案例五、硬幣正反
你正在圖書館枯坐,一位生疏美女主動過來和你搭訕,并要求和你一起玩?zhèn)€數(shù)學(xué)嬉戲。美女提議:"讓我們各自亮出硬幣的一面,或正或反。假如我們都是正面,那么我給你3元,假如我們都是反面,我給你1元,剩下的狀況你給我2元就可以了。'那么該不該和這位姑娘玩這個嬉戲呢?這基本是廢話,當(dāng)然該。問題是,這個嬉戲公正嗎?
每一種嬉戲依具其規(guī)章的不同會存在兩種納什均衡,一種是純策略納什均衡,也就是說玩家都能夠?qū)嵭泄潭ǖ牟呗?比如始終出正面或者始終出反面),使得每人都賺得最多或虧得最少;或者是混合策略納什均衡,而在這個嬉戲中,便應(yīng)當(dāng)采納混合策略納什均衡。
你\美女美女出正面美女出反面
你出正面+3,-3-2,+2
你出反面-2,+2+1,-1
假設(shè)我們出正面的概率是x,反面的概率是1-x,美女出正面的概率是y,反面的概率是1-y。為了使利益最大化,應(yīng)當(dāng)在對手出正面或反面的時候我們的收益都相等,由此列出方程就是
3x+(-2)*(1-x)=(-2)*x+1*(1-x)解方程得x=3/8。
同樣,美女的收益,列方程
-3y+2(1-y)=2y+(-1)*(1-y)
解得y也等于3/8,而美女每次的期望收益則是2(1-y)-3y=1/8元。這告知我們,在雙方都實(shí)行最優(yōu)策略的狀況下,平均每次美女贏1/8元。
其實(shí)只要美女實(shí)行了(3/8,5/8
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年海南省建筑安全員考試題庫
- 2025年海南建筑安全員知識題庫及答案
- 中國傳統(tǒng)文化主題:對聯(lián)
- 長度與時間的測量課件
- 《電路中的能量轉(zhuǎn)化》課件
- 石油加工原油組成教學(xué)課件
- 病理生理學(xué)課件凝血和抗凝血平衡紊亂
- 一年級語文下冊《語文園地六》課件
- 《心血管急癥》課件
- 固定收益點(diǎn)評報(bào)告:把握跨年后的信用配置窗口
- 犀角多肽與免疫細(xì)胞相互作用的機(jī)制研究
- 中國食物成分表2018年(標(biāo)準(zhǔn)版)第6版
- 植樹問題專項(xiàng)講義(五大類型+方法+練習(xí)+答案)六年級數(shù)學(xué)小升初總復(fù)習(xí)
- 二年級上冊數(shù)學(xué)豎式計(jì)算300道帶答案
- 組織學(xué)與胚胎學(xué)課程教學(xué)大綱
- 玻璃硝酸鉀加硬工藝
- 珠海金灣區(qū)2023-2024學(xué)年七年級上學(xué)期期末數(shù)學(xué)達(dá)標(biāo)卷(含答案)
- 廣西壯族自治區(qū)欽州市浦北縣2023-2024學(xué)年七年級上學(xué)期期末歷史試題
- 《輸電線路防雷保護(hù)》課件
- 《中國八大菜系》課件
- 高級會計(jì)師 案例分析第五章 企業(yè)成本管理
評論
0/150
提交評論