經(jīng)濟(jì)博弈論第二講a_第1頁(yè)
經(jīng)濟(jì)博弈論第二講a_第2頁(yè)
經(jīng)濟(jì)博弈論第二講a_第3頁(yè)
經(jīng)濟(jì)博弈論第二講a_第4頁(yè)
經(jīng)濟(jì)博弈論第二講a_第5頁(yè)
已閱讀5頁(yè),還剩73頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第二講完全信息靜態(tài)博弈

所謂完全信息靜態(tài)博弈即各博弈方同時(shí)決策,且所有博弈方對(duì)博弈中的各種情況下的得益都完全了解的博弈問(wèn)題納什均衡無(wú)限策略博弈的解和反應(yīng)函數(shù)混合策略納什均衡的存在性2.1納什均衡博弈的解和納什均衡嚴(yán)格下策反復(fù)消去法與納什均衡2.1.1博弈的解和納什均衡定義在博弈中,如果策略組合中任一博弈方i的策略都是對(duì)其余博弈方的策略組合的最佳對(duì)策,也即對(duì)任意都成立,則稱(chēng)為G的一個(gè)納什均衡。

斯特恩巴赫是費(fèi)城的一個(gè)家庭保健醫(yī)生,她很奇怪為什么輝瑞公司(Pfizer)的五位不同推銷(xiāo)員重復(fù)上門(mén)到她的診所推銷(xiāo)同樣的止痛藥—Betra及Celebrex。她在貯藏室里一個(gè)像冰箱大的柜子里已裝滿了Bextra和Celebrex,她說(shuō),“眾多的推銷(xiāo)員重復(fù)同樣的產(chǎn)品,沒(méi)有任何新意,實(shí)在是離奇?!遍L(zhǎng)達(dá)十年的招聘狂潮使制藥業(yè)的推銷(xiāo)員人數(shù)增加到90000,為原來(lái)人數(shù)的三倍。制藥業(yè)人士篤信:只要推銷(xiāo)員與醫(yī)生推銷(xiāo)一種藥越頻繁,醫(yī)生越有可能多開(kāi)此藥。據(jù)統(tǒng)計(jì),2010年制藥業(yè)在推銷(xiāo)員工上花費(fèi)為120多億美元,在藥物廣告上花費(fèi)為27.6億美元。根據(jù)聯(lián)邦政府的報(bào)告,美國(guó)國(guó)內(nèi)在處方藥上的支出激增14%,達(dá)到1,610億美元。專(zhuān)欄—制藥公司的銷(xiāo)售大戰(zhàn)(摘自華爾街日?qǐng)?bào))Betra輝瑞推銷(xiāo)員止痛藥醫(yī)生2010年美國(guó)制藥業(yè)推銷(xiāo)員工與藥物廣告花費(fèi)(單位:億美元)專(zhuān)欄—制藥公司的銷(xiāo)售大戰(zhàn)(摘自華爾街日?qǐng)?bào))(續(xù))

盡管如此,沒(méi)有任何一家制藥商愿意第一個(gè)單方面裁軍。葛蘭素史克公司(GlaxoSmithKline)的推銷(xiāo)員隊(duì)伍是如此壯大:它只需要七天就可以聯(lián)系到美國(guó)80%以上的醫(yī)生?!斑@有必要嗎?”葛蘭素史克的CEO加涅爾說(shuō):“應(yīng)該說(shuō)是沒(méi)有必要,但是如果我的競(jìng)爭(zhēng)對(duì)手能而我做不到,我們就處于劣勢(shì)。這的確是以最壞可能的方式進(jìn)行的軍備競(jìng)賽。”

“擁有眾多的推銷(xiāo)員不是競(jìng)爭(zhēng)優(yōu)勢(shì)的源泉”,默克公司的主席和CEO吉爾馬丁補(bǔ)充說(shuō)。他說(shuō)制藥商通過(guò)發(fā)現(xiàn)新藥來(lái)獲得優(yōu)勢(shì)。然而,默克公司2001年起在美國(guó)已增加了1500名推銷(xiāo)員,使得總數(shù)達(dá)到約7000人。既然誰(shuí)都知道擁有眾多的推銷(xiāo)員并不是競(jìng)爭(zhēng)優(yōu)勢(shì)的源泉,那為什么各家制藥公司的推銷(xiāo)員仍然在不斷膨脹呢?

——引自周林,《商業(yè)戰(zhàn)略決策:博弈論的應(yīng)用》同步,一次博弈--標(biāo)準(zhǔn)式博弈 構(gòu)成標(biāo)準(zhǔn)式博弈的要素有:參與者:參加博弈并做出決策的個(gè)體策略:參與者可能采取的行動(dòng)得益:參與者采取不同策略帶來(lái)的利益或損失參與者2參與者1策略ABCa3,22,35,4b2,11,23,3c1,61,44,5標(biāo)準(zhǔn)式博弈:均衡分析假設(shè)參與者1認(rèn)為參與者2選擇“A”參與者2參與者1策略ABCa3,22,35,4b2,11,23,3c1,61,44,5標(biāo)準(zhǔn)式博弈:均衡分析則參與者1應(yīng)該選擇“a”參與者1對(duì)“A”的最優(yōu)反應(yīng)是“a”.參與者2參與者1策略ABCa3,22,35,4b2,11,23,3c1,61,44,5標(biāo)準(zhǔn)式博弈:均衡分析假設(shè)參與者1認(rèn)為參與者2選擇“B”.參與者2參與者1策略ABCa3,22,35,4b2,11,23,3c1,61,44,5標(biāo)準(zhǔn)式博弈:均衡分析則參與者1應(yīng)該選擇“a”.參與者1對(duì)“B”的最優(yōu)反應(yīng)是“a”.參與者2參與者1策略ABCa3,22,35,4b2,11,23,3c1,61,44,5標(biāo)準(zhǔn)式博弈:均衡分析如果參與者1認(rèn)為參與者2選擇C…參與者1對(duì)“C”的最優(yōu)反應(yīng)是“a”.參與者2參與者1策略ABCa3,22,35,4b2,11,23,3c1,61,44,5占優(yōu)策略不管參與者2是選擇A、B還是C,參與者1都會(huì)選擇“a”!“a”是參與者1的占優(yōu)策略!占優(yōu)策略(上策)

不管對(duì)手做什么,對(duì)一個(gè)參與者都能獲得最高得益的策略參與者2參與者1策略ABCa3,22,35,4b2,11,23,3c1,61,44,5站到對(duì)手的立場(chǎng)上,想?yún)⑴c者2會(huì)怎么做呢?

參與者2沒(méi)有占優(yōu)策略!但是參與者2應(yīng)該能夠推斷出1會(huì)選擇“a”因此參與者2會(huì)選擇“C”參與者2參與者1策略ABCa3,22,35,4b2,11,23,3c1,61,44,5結(jié)果“a”是參與者1對(duì)“C”的最優(yōu)反應(yīng).“C”是參與者2對(duì)“a”的最優(yōu)反應(yīng).此結(jié)果被稱(chēng)為納什均衡:

在給定其他參與者策略情況下,沒(méi)有一個(gè)參與者能通過(guò)單方面改變自己的策略而使自己的得益提高,從而沒(méi)有人有積極性打破這種均衡參與者2參與者1策略ABCa3,22,35,4b2,11,23,3c1,61,44,5關(guān)鍵點(diǎn):尋找占優(yōu)策略

檢查一下你是否存在占優(yōu)策略,如果有,就選擇占優(yōu)策略站在對(duì)手的位置上思考問(wèn)題

如果你沒(méi)有占優(yōu)策略,那么從你對(duì)手角度考慮博弈。如果對(duì)手有占優(yōu)策略,預(yù)期他將按占優(yōu)策略行動(dòng)納什均衡

我所做的是:給定你所做的,我所做的是最好的;你所做的是:給定我所做的,你所做的是最好的同步,一次博弈的應(yīng)用專(zhuān)欄的博弈分析(制藥公司銷(xiāo)售大戰(zhàn))策略適中龐大適中10,105,13龐大13,57,7默克輝瑞納什均衡彩電價(jià)格大戰(zhàn)策略低價(jià)高價(jià)低價(jià)0,03,-1高價(jià)-1,31,1伯特蘭德寡頭壟斷(同質(zhì)產(chǎn)品,價(jià)格競(jìng)爭(zhēng))海信長(zhǎng)虹納什均衡2.1.1博弈的解和納什均衡劃線法

囚徒2

不坦白坦白囚不坦白徒

1坦白箭頭法囚徒2

不坦白坦白囚不坦白徒

1坦白

-1,-1

-8,0

0,-8

-5,-5-1,-1

-8,00,-8

-5,-5

劃線法1,01,30,10,40,22,0-5,-50,-8-8,0-1,-1囚徒困境-1,11,-11,-1-1,1猜硬幣2,10,00,01,3夫妻之爭(zhēng)

箭頭法1,01,30,10,40,22,0-5,-50,-8-8,0-1,-1囚徒困境-1,11,-11,-1-1,1猜硬幣2,10,00,01,3夫妻之爭(zhēng)

2.1.2嚴(yán)格下策反復(fù)消去法嚴(yán)格下策:不管其它博弈方的策略如何變化,給一個(gè)博弈方帶來(lái)的收益總是比另一種策略給他帶來(lái)的收益小的策略嚴(yán)格下策反復(fù)消去:1,01,30,10,40,22,0左中右上下1,01,30,40,2左中1,01,3左中國(guó)家戰(zhàn)略:軍備競(jìng)賽兩國(guó)之間的軍備競(jìng)賽可以用囚徒困境來(lái)描述。兩國(guó)都可以聲稱(chēng)有兩種選擇:增加軍備(背叛)、或是達(dá)成削減武器協(xié)議(合作)兩國(guó)都無(wú)法肯定對(duì)方會(huì)遵守協(xié)議,因此兩國(guó)最終會(huì)傾向增加軍備似乎自相矛盾的是,雖然增加軍備會(huì)是兩國(guó)的“理性”行為,但結(jié)果卻顯得“非理性”(例如會(huì)對(duì)經(jīng)濟(jì)造成都有損壞等)這種被稱(chēng)作“遏制理論”的推論,就是以強(qiáng)大的軍事力量來(lái)遏制對(duì)方的進(jìn)攻,以達(dá)到和平你要給我小心點(diǎn)啊!我也不是好惹的!博弈論與企業(yè)競(jìng)爭(zhēng)企業(yè)、政府與商業(yè)環(huán)境軍事力量是世界制衡的砝碼為什么要削減武器?我們還是好好談?wù)劙刹┺恼撆c企業(yè)競(jìng)爭(zhēng)企業(yè)、政府與商業(yè)環(huán)境彩電價(jià)格大戰(zhàn)策略低價(jià)高價(jià)低價(jià)0,03,-1高價(jià)-1,31,1伯特蘭德寡頭壟斷(同質(zhì)產(chǎn)品,價(jià)格競(jìng)爭(zhēng))海信長(zhǎng)虹納什均衡博弈論與企業(yè)競(jìng)爭(zhēng)企業(yè)、政府與商業(yè)環(huán)境2.2無(wú)限策略的解和反應(yīng)函數(shù)古諾的寡頭模型反應(yīng)函數(shù)伯特蘭德的寡頭模型公共資源問(wèn)題2.2.1古諾的寡頭模型

博弈方1利潤(rùn):博弈方2利潤(rùn):在本博弈中,的納什均衡的充分必要條件是和的最大值問(wèn)題:社會(huì)收益最大化:假設(shè)總產(chǎn)量為Q,總收益為U=QP(Q)-CQ

=Q(8-Q)-2Q=6Q-Q2

其最大值為Q*=3,U=9

該結(jié)果與納什均衡有較大的差異,這就是納什均衡是源于各廠商追求自身利益最大化的結(jié)果。4.5,4.55,3.753.75,54,4不突破突破廠商2不突破突破廠商1以自身最大利益為目標(biāo):各生產(chǎn)2單位產(chǎn)量,各自得益為4以?xún)蓮S商總體利益最大:各生產(chǎn)1.5單位產(chǎn)量,各自得益為4.5兩寡頭間的囚徒困境博弈28分析經(jīng)營(yíng)管理的實(shí)踐案例29誠(chéng)信之道當(dāng)一個(gè)社會(huì)缺乏信用、蔑視契約時(shí),是難以建立人與人之間的互信基礎(chǔ)的。所以從建立對(duì)信用和契約神圣的認(rèn)知,并用強(qiáng)制措施加以保障。30誠(chéng)信的選擇道德乎?策略乎?31社會(huì)學(xué)家和經(jīng)濟(jì)學(xué)家的爭(zhēng)辯社會(huì)學(xué)家云:誠(chéng)信是人在較低層次的需求得到適當(dāng)滿足之后自然出現(xiàn)的一種較高層次的需求;誠(chéng)信帶給人的滿足感會(huì)超過(guò)逐利帶來(lái)的滿足感。經(jīng)濟(jì)學(xué)家云:人們?cè)谥貜?fù)博弈、反復(fù)切磋過(guò)程中謀求長(zhǎng)期的、穩(wěn)定的物質(zhì)利益的一種策略選擇。32誠(chéng)信案例假定A是一名生產(chǎn)商,B是一名銷(xiāo)售商,AB雙方互為博弈對(duì)手,會(huì)出現(xiàn)以下4種博弈的可能性:雙方都講誠(chéng)信,A按約交貨,B按約付款,各得其所,每人都得到的效用都是10;A誠(chéng)信而B(niǎo)不誠(chéng)信,A交了貨而B(niǎo)不付款,那麼B可以獲得自己最大的利益,得15,而A吃虧了,得-10;A不誠(chéng)信而B(niǎo)誠(chéng)信,即A收了錢(qián)而不發(fā)貨,則A的利益實(shí)現(xiàn)了最大化,得15,而B(niǎo)得-10;AB雙方互不信任,也互不守信,生意泡湯了,各自的效用都為0。33矩陣分析

生產(chǎn)方銷(xiāo)售方誠(chéng)信不誠(chéng)信誠(chéng)信1010-1015不誠(chéng)信15-1000交易34案例研討自身利益最大化:

對(duì)方講誠(chéng)信,自己不講誠(chéng)信合理結(jié)果:都不講誠(chéng)信

雙贏:

都講誠(chéng)信35誠(chéng)信缺失的案例安然安達(dá)信丑聞36背景

安達(dá)信是全球五大會(huì)計(jì)事務(wù)所之一。它代理著美國(guó)23000家上市公司的審計(jì)業(yè)務(wù),占美國(guó)上市公司總數(shù)的17%。2002年安達(dá)信卻因?yàn)榧賻?wèn)題被美國(guó)國(guó)會(huì)、司法部、證券交易委員會(huì)調(diào)查,接下來(lái)包括福特汽車(chē)、默克制藥、聯(lián)邦快遞、德?tīng)査娇展驹趦?nèi)的36家大客戶與安達(dá)信解除了合同。37共贏案利中銀消費(fèi)信貸卡38背景中銀消費(fèi)信貸記錄卡是中國(guó)銀行消費(fèi)信貸業(yè)務(wù)中一創(chuàng)新產(chǎn)品,是為客戶提供貸款購(gòu)物且具無(wú)抵押、零首付、減免息等優(yōu)點(diǎn)的消費(fèi)記錄憑證。它依附于中國(guó)銀行長(zhǎng)城信用卡或長(zhǎng)城電子借記卡,由北京市商業(yè)信息資詢(xún)中心監(jiān)制,北京資和信咨詢(xún)公司負(fù)責(zé)發(fā)行管理。39經(jīng)營(yíng)分析得到付出基礎(chǔ)客戶免減息;無(wú)首付;無(wú)抵押;信用循環(huán);便捷年費(fèi)誠(chéng)信銀行收益、人氣信用卡平臺(tái)誠(chéng)信商戶收益、人氣貼息誠(chéng)信中介收益、人氣管理誠(chéng)信2.2.2反應(yīng)函數(shù)

反應(yīng)函數(shù)-每個(gè)博弈方針對(duì)其他博弈方所有策略的最佳反應(yīng)構(gòu)成的函數(shù)。而各個(gè)博弈方反應(yīng)函數(shù)的交點(diǎn)(如果有的話)就是納什均衡。2.2.2反應(yīng)函數(shù)-古諾模型在古諾模型中廠商1和廠商2的反應(yīng)函數(shù)分別為q2q1(0,6)(0,3)R1(q2)R2(q1)(2,2)60(3,0)(6,0)

從左圖可以看出,當(dāng)一方的選擇為0時(shí),另一方的最佳反應(yīng)為3,這正是我們前面所說(shuō)過(guò)的實(shí)現(xiàn)總體最大利益的產(chǎn)量,因?yàn)橐患耶a(chǎn)量為零,意味著另一家壟斷市場(chǎng)。當(dāng)一方的產(chǎn)量達(dá)到6時(shí),另一方則被迫選擇0,因?yàn)閷?shí)際上堅(jiān)持生產(chǎn)已無(wú)利可圖。2.2.3伯特蘭德的寡頭模型在該模型中廠商選擇價(jià)格而不是產(chǎn)量廠商1的價(jià)格與需求函數(shù):P1,廠商2的價(jià)格與需求函數(shù):

P2,其中,d1,d2>0為兩廠商產(chǎn)品的替代系數(shù)。假設(shè)兩廠商無(wú)固定成本,邊際成本分別為c1和c2。收益:納什均衡:公共地悲劇英國(guó)人哈定:十八世紀(jì)以前,蘇格蘭地區(qū)大量草地,由于屬公共資源導(dǎo)致過(guò)度放牧,致使草地消失,生態(tài)破壞2.2.4公共資源問(wèn)題公共產(chǎn)品的供給

如果大家都出錢(qián)興辦公用事業(yè),所有人的福利都會(huì)增加。問(wèn)題是,如果我出錢(qián)你不出錢(qián),我得不償失,而如果你出錢(qián)我不出錢(qián),我就可以占你的便宜。所以每個(gè)人的最優(yōu)選擇都是“不出錢(qián)”,結(jié)果使所有人的福利都得不到提高。軍備競(jìng)賽

兩國(guó)都不搞軍備競(jìng)賽,都把資源用于民用,兩國(guó)福利都變好。但由于都怕受威脅而大搞軍備競(jìng)賽,結(jié)果兩國(guó)福利都變得更糟。經(jīng)濟(jì)改革經(jīng)濟(jì)改革要付出成本(包括風(fēng)險(xiǎn)),而改革的成果大家享受,結(jié)果是,盡管人人都認(rèn)為改革好,卻很難有人真正去改革,大家只好在都不滿意的體制下繼續(xù)生活下去。2.2.4公共資源問(wèn)題2.2.4公共資源問(wèn)題公共資源(1)沒(méi)有哪個(gè)個(gè)人、企業(yè)或其他經(jīng)濟(jì)組織擁有;(2)大家都可以自由利用這兩個(gè)特征的自然資源或人類(lèi)生產(chǎn)的供大眾免費(fèi)使用的設(shè)施或財(cái)貨。例設(shè)某村莊有n個(gè)農(nóng)戶,一公共草地,可養(yǎng)羊數(shù)為qi(i=1,…,n)為n個(gè)農(nóng)戶各自的策略空間,當(dāng)各戶養(yǎng)羊數(shù)為q1,…,qn時(shí),總數(shù)為Q=q1+…+qn,每只羊的產(chǎn)出為羊的總數(shù)Q的減函數(shù)V=V(Q)=V(q1+…+qn),假設(shè)每只羊的成本為c,則農(nóng)戶i養(yǎng)qi只羊的得益為:ui=qiV(Q)-qic2.2.4公共資源問(wèn)題-實(shí)例

設(shè)n=3,V=100-Q=100-(q1+q2+q3),c=4

三農(nóng)戶的得益函數(shù)和反應(yīng)函數(shù):

u1=q1[100-(q1+q2+q3)]-4q1,q1=R1(q2,q3)=48-0.5q2-0.5q3

u2=q2[100-(q1+q2+q3)]-4q2,q2=R1(q1,q3)=48-0.5q1-0.5q3

u3=q3[100-(q1+q2+q3)]-4q3,q3=R1(q1,q2)=48-0.5q1-0.5q2

納什均衡:q1*=q2*=q3*=24,

u1*=u2*=u3*=576

最大總體收益:u*=2304Q*=48

由此說(shuō)明,納什均衡的解常常是低效率的,而在現(xiàn)實(shí)生活中卻經(jīng)常出現(xiàn)。如果采取最佳策略(集體理性),那么個(gè)體的貪婪性將會(huì)來(lái)破壞這一平衡。47系統(tǒng)思維和雙贏策略“商場(chǎng)如戰(zhàn)場(chǎng)”企業(yè)在商戰(zhàn)中的惡性競(jìng)爭(zhēng)不僅僅損害的是企業(yè)的利益,更可怕的是往往將一個(gè)行業(yè)做“爛”。“雙贏”是一種相互的妥協(xié),也是一種良性的競(jìng)爭(zhēng),它可以幫助我們實(shí)現(xiàn)共同利益的最大化。也就是說(shuō),它可以使我們都能分到“蛋糕”,而且可以使我們一起“把蛋糕做大”。48

行業(yè)自律道德約束

組織形式:中介組織;行會(huì);保險(xiǎn)公司每個(gè)博弈者建立各自的“圈子”——A與B的生意可能只是一次性的,但是,A卻要長(zhǎng)期與B所在“圈子”打交道,這樣,通過(guò)“圈子”,A與B的一次性博弈就轉(zhuǎn)化為A與B所在“圈子”的重復(fù)博弈。同時(shí),“圈子”還有另一重作用,就是傳遞信息,是“雙盲”博弈變成“透明”博弈,提高合作的可能性。49

制度保證政府監(jiān)管

保險(xiǎn)制度;信用制度健全法制,完善有關(guān)規(guī)章制度,讓不遵守游戲規(guī)則的投機(jī)取巧者、坑蒙拐騙者和背信棄義者受到應(yīng)有的懲罰。法律旨在使合作利益能夠順利實(shí)現(xiàn),旨在促進(jìn)繁榮,而并非為了威嚇百姓。我國(guó)最早文獻(xiàn)《尚書(shū).呂刑篇》曾明確地指出:典獄非訖于威,唯訖于富。擺脫惡性競(jìng)爭(zhēng),建立規(guī)則。位置博弈商業(yè)布點(diǎn)、飛機(jī)航班、電視節(jié)目、政治選舉01/41/23/41ABAB智豬博弈

豬圈中有一頭大豬一頭小豬,豬圈一端有個(gè)按鈕,每按一下豬圈另一端食槽中會(huì)有10個(gè)單位豬食進(jìn)槽,但按一下會(huì)耗去相當(dāng)于2單位豬食的成本。如果大豬先到食槽,大豬吃到9單位食物,小豬只能吃到1單位;如小豬先到,小豬吃4單位而大豬吃6單位;如果同時(shí)按并同時(shí)到食槽,則大豬吃7單位而小豬吃3單位食物。按等待按5,14,4等待9,-10,0小豬大豬納什均衡關(guān)鍵點(diǎn)處于強(qiáng)勢(shì)的參與者為維護(hù)自己利益采取某種決策時(shí),為其他弱勢(shì)參與者提供了搭便車(chē)的機(jī)會(huì)股市中的機(jī)構(gòu)大戶與散戶新產(chǎn)品研發(fā)與中小企業(yè)可口可樂(lè)、百事可樂(lè)與非品牌軟飲料產(chǎn)品(Scott)小狗策略大智若愚中的智慧貧困縣的教育撥款智豬博弈的進(jìn)一步分析答案是:小豬將選擇“搭便車(chē)”策略,也就是舒舒服服地等在食槽邊;而大豬則為一點(diǎn)殘羹不知疲倦地奔忙于踏板和食槽之間。原因何在?因?yàn)?,小豬踩踏板將一無(wú)所獲,不踩踏板反而能吃上食物。對(duì)小豬而言,無(wú)論大豬是否踩動(dòng)踏板,不踩踏板總是好的選擇。反觀大豬,已明知小豬是不會(huì)去踩動(dòng)踏板的,自己親自去踩踏板總比不踩強(qiáng)吧,所以只好親力親為了?!靶∝i躺著大豬跑”的現(xiàn)象是由于故事中的游戲規(guī)則所導(dǎo)致的。規(guī)則的核心指標(biāo)是:每次落下的食物數(shù)量和踏板與投食口之間的距離。如果改變一下核心指標(biāo),豬圈里還會(huì)出現(xiàn)同樣的“小豬躺著大豬跑”的景象嗎?博弈論與企業(yè)競(jìng)爭(zhēng)企業(yè)、政府與商業(yè)環(huán)境智豬博弈的進(jìn)一步分析

改變一下指標(biāo),情景如何?1.減量方案:投食僅原來(lái)的一半分量。1.結(jié)果是小豬大豬都不去踩踏板了。小豬去踩,大豬將會(huì)把食物吃完;大豬去踩,小豬將也會(huì)把食物吃完。誰(shuí)去踩踏板,就意味著為對(duì)方貢獻(xiàn)食物,所以誰(shuí)也不會(huì)有踩踏板的動(dòng)力了。怎樣才能實(shí)現(xiàn)多勞多得?博弈論與企業(yè)競(jìng)爭(zhēng)企業(yè)、政府與商業(yè)環(huán)境按等待按(3.5-2)1.5,(1.5-2)-0.5-1,4等待5,-20,0小豬大豬納什均衡智豬博弈的進(jìn)一步分析2.增量方案:投食為原來(lái)的一倍分量。.結(jié)果是小豬、大豬都會(huì)去踩踏板。誰(shuí)想吃,誰(shuí)就會(huì)去踩踏板。反正對(duì)方不會(huì)一次把食物吃完。小豬和大豬相當(dāng)于生活在物質(zhì)相對(duì)豐富的“共產(chǎn)主義”社會(huì),所以競(jìng)爭(zhēng)意識(shí)卻不會(huì)很強(qiáng)。3.減量加移位方案:投食僅原來(lái)的一半分量,但同時(shí)將投食口移到踏板附近。小豬和大豬都在拼命地?fù)屩忍ぐ濉5却卟坏檬?,而多勞者多得。每次的收獲剛好消費(fèi)完。企業(yè)、政府與商業(yè)環(huán)境博弈論與企業(yè)競(jìng)爭(zhēng)智豬博弈的進(jìn)一步分析

思考題:“聰明的豬”游戲

在企業(yè)經(jīng)營(yíng)方面有哪些啟示?人力資源市場(chǎng)營(yíng)銷(xiāo)企業(yè)戰(zhàn)略博弈論與企業(yè)競(jìng)爭(zhēng)企業(yè)、政府與商業(yè)環(huán)境斗雞博弈進(jìn)退“大將軍”“猛英雄”進(jìn)

退-3,-32,00,20,0相對(duì)優(yōu)勢(shì)戰(zhàn)略圈定法博弈論與企業(yè)競(jìng)爭(zhēng)57企業(yè)、政府與商業(yè)環(huán)境討論

先動(dòng)優(yōu)勢(shì)先發(fā)制人、志在必得不戰(zhàn)而屈人之兵,善之善者也。后動(dòng)優(yōu)勢(shì)靜觀其變、從容應(yīng)付昔之善戰(zhàn)者,先為不可勝,以待敵之可勝。博弈論與企業(yè)競(jìng)爭(zhēng)企業(yè)、政府與商業(yè)環(huán)境協(xié)調(diào)博弈足球芭蕾足球2,10,0芭蕾0,01,2情侶博弈女男策略220伏110伏220伏$100,$1000,0110伏0,0$100,$100企業(yè)B企業(yè)A此協(xié)調(diào)博弈有兩個(gè)納什均衡產(chǎn)業(yè)標(biāo)準(zhǔn)(軟盤(pán)、CD的大小等)國(guó)家標(biāo)準(zhǔn)(電壓、交通法等)關(guān)鍵點(diǎn)不是所有的博弈都涉及到利益沖突.溝通能夠幫助解決協(xié)調(diào)問(wèn)題.順序行動(dòng)能夠幫助解決協(xié)調(diào)問(wèn)題.先動(dòng)優(yōu)勢(shì)的作用2.3混合策略概念應(yīng)用2.3.1概念的提出在前面的例子,如猜硬幣,齊威王田忌賽馬,夫妻之爭(zhēng)等博弈問(wèn)題不存在納什均衡策略組合,然而這類(lèi)問(wèn)題十分常見(jiàn)。例1小偷與守衛(wèi)的博弈守衛(wèi)睡不睡小偷偷不偷例2猜硬幣

1.若被對(duì)手事先知道出現(xiàn)哪一面,肯定輸

2.若正面出現(xiàn)的概率為p,負(fù)面為1-p,且p>0.5,則猜正面的話贏的幾率就比較大。V,-D-P,00,S0,0猜硬幣博弈

猜硬幣方正面反面蓋硬正面幣方反面該博弈與上一個(gè)例子相似,即取勝的關(guān)鍵都是不能讓另一方猜到自己的策略而同時(shí)自己又要盡可能猜出對(duì)方的策略。若p>1/2,則猜硬幣方全猜正面,他的期望得益為p×1+(1-p)×(-1)=2p-1>0,即平均來(lái)說(shuō),猜硬幣方贏多輸少。

-1,11,-11,-1-1,1請(qǐng)找出這個(gè)博弈的納什均衡。2.3.1概念的提出特點(diǎn):1.自己的選擇不能讓對(duì)手預(yù)先知道2.若重復(fù)多次,則不讓對(duì)手發(fā)現(xiàn)其中的規(guī)律。除非有意輸(一種行賄的手段),注意行賄只是一個(gè)手段,有意無(wú)意間讓對(duì)手了解自己的策略或規(guī)律。2.3.1概念的提出定義:在博弈G={s1,…,sn;u1,…un}中,博弈方i的策略空間為Si={si1,…,sik},則博弈方i以概率分布pi=(pi1,…,pik)隨機(jī)選擇其k個(gè)可選策略稱(chēng)為一個(gè)“混合策略”,其中0≤pik≤1對(duì)k=1,…,k都成立且pi1+…+pik=1。相對(duì)于這種以一定概率分布在一些策略中隨機(jī)選擇的混合策略,確定性的具體的策略我們稱(chēng)為“純策略”混合策略的原則:自己的策略選擇不能被另一方預(yù)知或猜到。即在決策時(shí)利用隨機(jī)性。選擇每種策略的概率一定要恰好使對(duì)方無(wú)機(jī)可乘,即讓對(duì)方無(wú)法通過(guò)有針對(duì)性的傾向某一策略而占上風(fēng)。納什定理納什均衡的存在性定理(納什,1950):每一個(gè)有限博弈至少存在一個(gè)納什均衡。博弈論與企業(yè)競(jìng)爭(zhēng)企業(yè)、政府與商業(yè)環(huán)境納什均衡純戰(zhàn)略均衡是就是,不是就不是混合戰(zhàn)略均衡:純戰(zhàn)略空間的概率分布是也不是,不是也是例:投硬幣博弈

博弈論與企業(yè)競(jìng)爭(zhēng)企業(yè)、政府與商業(yè)環(huán)境混合戰(zhàn)略納什均衡——警察與小偷出工收手警察小偷巡夜

睡覺(jué)1,-10,0-1,11,-1警察巡夜的效用=q。

睡覺(jué)的效用=-q+(1-q)

效用無(wú)差別,q=-q+(1-q)

q*=1/3

P

1-Pq1-q小偷出工的效用=-p+(1-p)。

收手的效用=-(1-p)

效用無(wú)差別,-p+(1-p)==-(1-p)

p*=2/3博弈論與企業(yè)競(jìng)爭(zhēng)68企業(yè)、政府與商業(yè)環(huán)境討論:混合戰(zhàn)略納什均衡度:為與不為之間兩難問(wèn)題的一條出路

博弈論與企業(yè)競(jìng)爭(zhēng)企業(yè)、政府與商業(yè)環(huán)境2.3.2應(yīng)用博弈方1選A、B的概率:pA,pB;博弈方2選C、D的概率:pC,pD。原則應(yīng)用:博弈方1選A和B的概率pA和pB一定要使博弈方2選C的期望得益和選D的期望得益相等。即pA×

3

+pB×1=pA×

2

+pB×5又由pA+pB=1,可得pA=0.8,pB=0.2,此即博弈方1應(yīng)選的混合策略。同理可得博弈方2的混合策略為pC=0.8,pD=0.2。納什均衡:1(0.8,0.2),2(0.8,0.2)期望得益:u1e=pA.pC.u1(A,C)+pA.pD.u1(A,D)+pB.pC.u1(B,C)+pB.pD.u1(B,D)=2.6u2e=2.6

單獨(dú)一次博弈的結(jié)果可能是四種狀態(tài)的任何一種,然而多次獨(dú)立重復(fù)博弈得到如上的結(jié)果是可能的。

2,35,23,11,5

2CDA1B2023年2月1日712.3.2應(yīng)用一、案例:情侶博弈(三)優(yōu)勢(shì)策略均衡(足球,足球),(時(shí)裝,時(shí)裝)2,10,00,01,3時(shí)裝足球時(shí)裝足球丈夫妻子夫妻之爭(zhēng)2.3.2應(yīng)用混合策略的方法不僅可以解決不存在純策略納什均衡的博弈問(wèn)題,同

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論