版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
經(jīng)濟(jì)與博弈思維
山東科技大學(xué)經(jīng)濟(jì)管理學(xué)院授課人:丁黎黎(副教授、博士后)研究方向:物流與供應(yīng)鏈管理;企業(yè)家理論;決策與風(fēng)險(xiǎn)管理;金融物流Email:dinglili0220@163.comTEL:
聯(lián)系方式多算勝,少算不勝,
何況于無(wú)算乎?——摘自《孫子兵法》為什么開(kāi)設(shè)該課程
引起你的思考???“你甚至可以使一只鸚鵡變成一個(gè)訓(xùn)練有素的經(jīng)濟(jì)學(xué)家,因?yàn)樗仨殞W(xué)習(xí)的只有兩個(gè)詞,那就是供給和需求”---薩繆爾森。為什么開(kāi)設(shè)該課程
這么夸張?我也可以成為經(jīng)濟(jì)學(xué)家?“現(xiàn)在這只鸚鵡需要再學(xué)兩個(gè)詞,那就是納什·均衡”---坎多利。為什么開(kāi)設(shè)該課程
現(xiàn)在學(xué)什么呢?為什么開(kāi)設(shè)該課程
“如果你想成為一個(gè)有文化的人,你必須對(duì)博弈論有個(gè)大致了解”。
——薩繆爾森。課堂調(diào)查:囚徒困境?智豬博弈?斗雞博弈?鷹鴿博弈?課程的講授風(fēng)格
文理學(xué)生兼顧不失博弈論的理論嚴(yán)密特點(diǎn)一定程度上反映博弈論的人文學(xué)科特點(diǎn)力求不同專業(yè)的學(xué)生都有所收益體現(xiàn)博弈論的博大博弈論多學(xué)科、多領(lǐng)域交叉性明顯力求理論與實(shí)際的融合推薦書(shū)目《妙趣橫生博弈論》迪克西特、奈爾伯夫機(jī)械工業(yè)出版社《博弈論基礎(chǔ)》吉本斯中國(guó)社會(huì)科學(xué)出版社《博弈論》弗登博格、梯若爾
中國(guó)人民大學(xué)出版社《經(jīng)濟(jì)博弈論》謝識(shí)予編著復(fù)旦大學(xué)出版社《博弈論與信息經(jīng)濟(jì)學(xué)》張維迎著上海人民出版社《博弈學(xué)習(xí)理論》陳學(xué)彬編著上海財(cái)大出版社《博弈論》施錫銓上海財(cái)大出版社為什么教授如此苛刻?許多教授強(qiáng)硬地規(guī)定,不進(jìn)行補(bǔ)考,不允許遲交作業(yè)或論文。教授們?yōu)楹稳绱丝量??如果允許某種遲交,而且教授又不能辨別真?zhèn)?,那么學(xué)生就總是會(huì)遲交。期限本身就毫無(wú)意義了。避免這一“滑梯”通常只有一種辦法,就是“沒(méi)有例外”的策略。為什么教授如此苛刻?問(wèn)題是,一個(gè)好心腸的教授如何維持如此鐵石心腸的承諾?他必須找到某種使拒絕變得強(qiáng)硬和可信的方法。拿行政程序或者學(xué)校政策來(lái)做擋箭牌在課程開(kāi)始時(shí)做出明確和嚴(yán)格的宣布通過(guò)幾次嚴(yán)打來(lái)獲得“冷面殺手”的聲譽(yù)什么是博弈論?博弈論:就是關(guān)于包含相互依存情況中理性行為的研究。局中人理性地采取或選擇自己的策略行為,在相互制約相互影響的依存關(guān)系中,盡可能的提高自己的利益所得,這樣,博弈論就是關(guān)于包含相互依存情況中理性行為的研究。博弈的關(guān)鍵相互依存:通常是指博弈中的任何一個(gè)局中人受到其他局中人的行為的影響,反過(guò)來(lái),他的行為也影響到其他局中人。
相互依存的另一個(gè)方面是局中人可以有某些共同的興趣或利益所在。
理性行為:博弈論中的所謂理性,一般不是指道德標(biāo)準(zhǔn)。行動(dòng)者具有推理能力,在具體策略選擇時(shí)的目的是使自己的利益最大化。萬(wàn)元陷阱
現(xiàn)將10000元錢(qián)拍賣給大家,各位互相競(jìng)價(jià),以100元為加價(jià)單位,直到?jīng)]有人再加價(jià)為止。出價(jià)最高者將以其所出價(jià)格獲得該10000元錢(qián),同時(shí),出價(jià)第二高者將其所出價(jià)格的數(shù)量支付給我。 請(qǐng)問(wèn):您的競(jìng)拍策略?實(shí)驗(yàn):實(shí)驗(yàn):選數(shù)游戲我從1-100間選出某個(gè)數(shù),而你的任務(wù)是猜中這個(gè)數(shù)。若你猜中,我將付給你100美元。規(guī)則:你可猜五次,且每次我都會(huì)告訴你猜得太高還是太低。越早猜中獎(jiǎng)勵(lì)越豐厚,否則在第二輪中你只能得80美元,依次60、40、0。實(shí)驗(yàn):選數(shù)游戲微軟總裁史蒂夫.鮑爾默曾以此題作為面試題:正確答案50,25,37,42…..,他感興趣的是要看看候選人是否用最符合邏輯和最有效的方法去分析所探求的問(wèn)題。實(shí)驗(yàn):一個(gè)簡(jiǎn)單的數(shù)字游戲每位同學(xué)寫(xiě)5個(gè)大于0的自然數(shù),如果某位同學(xué)所寫(xiě)的5個(gè)數(shù)字中有一個(gè)是所有同學(xué)所寫(xiě)的數(shù)字中最小的(在沒(méi)有重合的情況下),那么他將獲得本課程加10分的獎(jiǎng)勵(lì)(在總得分小于100分的情況下)博弈思想自古有之2000年前中國(guó)著名的“田忌賽馬”1500年前巴比倫猶太法典的“婚姻合同問(wèn)題”1838年的古諾(Cournot)模型,被看成是早期博弈研究的起點(diǎn)1883年伯特蘭德(Bertrand)提出的通過(guò)價(jià)格進(jìn)行博弈的寡頭競(jìng)爭(zhēng)模型與古諾模型有異曲同工之妙。艾奇沃斯(Edgeworth)提出的“契約曲線”則是后來(lái)合作博弈論重要概念“核”的特例。博弈論相關(guān)背景知識(shí)博弈論的誕生vonNeumann(諾依曼)和Morgenstern合著的《博弈論和經(jīng)濟(jì)行為》(TheTheoryofGamesandEconomicBehavior)的誕生(1944)該書(shū)首創(chuàng)的博弈一些術(shù)語(yǔ),表示形式,至今仍在使用提出了v-N-M效用,用以表示博弈的支付使博弈論從數(shù)學(xué)家的圈子中走出,建立了數(shù)學(xué)與經(jīng)濟(jì)學(xué)間的橋梁博弈論相關(guān)背景知識(shí)JohnvonNeumann生平
8歲就掌握了微積分,19歲發(fā)表了第一篇學(xué)術(shù)論文30歲成為最年輕的普林斯頓數(shù)學(xué)學(xué)院6名教授之一(Einsteinwasoneoftheothers)(1933年)20世紀(jì)40年代開(kāi)始轉(zhuǎn)向應(yīng)用數(shù)學(xué)領(lǐng)域1943年為Manhattan項(xiàng)目的顧問(wèn)(atomicbomb)1944年第一臺(tái)計(jì)算機(jī)的誕生,他作了主要貢獻(xiàn)1944年與摩根斯坦合作的博弈論第一部著作1957年英年早逝(純粹數(shù)學(xué)、應(yīng)用數(shù)學(xué)、物理學(xué),polymath)1903-1957博弈論相關(guān)背景知識(shí)JohnNashJr.與Nash均衡1950年納什在普林斯頓的博士論文(27pages),首次提出了納什均衡、并證明了納什定理“這是對(duì)博弈論高度的原創(chuàng)性和重要的貢獻(xiàn)”——Tucker30歲后,曾陷于精神疾病數(shù)十年1994與Harsanyi,Selten共獲諾貝爾獎(jiǎng)納什與愛(ài)因斯坦、馮諾依曼的軼事1928-博弈論相關(guān)背景知識(shí)20世紀(jì)50年代是博弈論的第一個(gè)研究高潮Nash均衡理論的建立理論與實(shí)驗(yàn)并行的博弈研究方式1950年蘭德公司的囚徒問(wèn)題的實(shí)驗(yàn)合作博弈論的第一次鼎盛時(shí)期“40年代末50年代初是博弈論歷史上令人振奮時(shí)期,原理已經(jīng)破繭而出,正在試飛它們的雙翅,活躍著一批巨人。”(Aumann,1985)博弈論相關(guān)背景知識(shí)20世紀(jì)50年代中后期到70年代的興盛期博弈研究成果不斷豐富1965年澤爾滕與海薩尼的博弈的精煉理論進(jìn)化博弈(evolutionarygame,1972)的出現(xiàn)“共同知識(shí)(commonknowledge)”假設(shè)的建立博弈論相關(guān)背景知識(shí)20世紀(jì)80~90年代的成熟期Kohlberg的前向歸納法(forwardinduction,1981)Kreps和Wilson的sequentialequilibrium(1982)Smith的“EvolutionaryandTheTheoryofGames”(1982)博弈學(xué)習(xí)理論(learningtheory)的完善博弈論相關(guān)背景知識(shí)20世紀(jì)80~90年代的成熟期博弈論幾乎涉及經(jīng)濟(jì)學(xué)所有領(lǐng)域,改變了微觀經(jīng)濟(jì)學(xué)的理論基礎(chǔ)博弈論在心理學(xué)、行為科學(xué)、認(rèn)知科學(xué)等人文科學(xué)都取得了成功應(yīng)用博弈論在生物學(xué)、智能技術(shù)、計(jì)算機(jī)科學(xué)等也都有著應(yīng)用多名博弈論專家獲得諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)博弈論相關(guān)背景知識(shí)1994年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)授予:?JohnNash?ReinhardSelten?JohnHarsanyi主要貢獻(xiàn):這3位經(jīng)濟(jì)學(xué)家/數(shù)學(xué)家闡述了博弈論這門(mén)學(xué)科,對(duì)博弈論的發(fā)展做出了重要貢獻(xiàn)。博弈論相關(guān)背景知識(shí)1996年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)授予:?JamesA.Mirrlees(莫里斯,劍橋)?WilliamVickrey美國(guó)科學(xué)家JamesA.Mirrlees在信息經(jīng)濟(jì)學(xué)理論領(lǐng)域做出了重大貢獻(xiàn),尤其是不對(duì)稱信息條件下的經(jīng)濟(jì)激勵(lì)理論;WilliamVickrey因在信息經(jīng)濟(jì)學(xué)、激勵(lì)理論、博弈論等方面做出的重大貢獻(xiàn),而共同獲得諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)。博弈論相關(guān)背景知識(shí)1996年維克里,莫里斯獲諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)。2001年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)授予:
?GeorgeA.Kerlof(阿克爾洛夫,檸檬)?A.MichaelSpence(斯彭斯)?JosephE.Stiglitz(斯蒂格利茨)在對(duì)信息不對(duì)稱市場(chǎng)進(jìn)行分析中,做出重大貢獻(xiàn)博弈論相關(guān)背景知識(shí)2001年阿克爾洛夫、斯彭斯和斯蒂格利茨獲諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)。2005年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)授予:?RobertJ.Aumann(奧曼
)?ThomasC.Schelling(謝林
)表彰他們?cè)趧?dòng)態(tài)宏觀經(jīng)濟(jì)學(xué)領(lǐng)域中所作的貢獻(xiàn),增強(qiáng)了我們對(duì)通過(guò)博弈論來(lái)進(jìn)行沖突與合作分析的認(rèn)識(shí)。
博弈論相關(guān)背景知識(shí)2005年奧曼和謝林諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)
2007年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)
為機(jī)制設(shè)計(jì)理論奠定基礎(chǔ)明尼蘇達(dá)大學(xué)的赫維茨、芝加哥大學(xué)的馬斯金,以及美國(guó)普林斯頓高等研究中心的邁爾森
2012年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)
穩(wěn)定配置理論與市場(chǎng)設(shè)計(jì)為什么博弈論在經(jīng)濟(jì)學(xué)領(lǐng)域會(huì)產(chǎn)生如此大的影響呢?
這是因?yàn)椴┺恼搹囊粋€(gè)獨(dú)特的視角幫助我們更加深刻地理解和把握經(jīng)濟(jì)現(xiàn)象,并指導(dǎo)我們制定更加有效的經(jīng)濟(jì)政策。當(dāng)局者迷、旁觀者清。學(xué)習(xí)博弈論的收益:當(dāng)局者清、旁觀者更清博弈的用處一點(diǎn)強(qiáng)調(diào)我們所討論的博弈問(wèn)題都是建立在“個(gè)體行為理性”基礎(chǔ)上的“非合作博弈”。對(duì)一切問(wèn)題的判斷取舍,除非特別聲明,都唯一地以量化的利益,即我們所稱的得益為標(biāo)準(zhǔn)和依據(jù),對(duì)一些不是直接以數(shù)量表示的利益或損害,如個(gè)人的主觀感受、心理影響、公共福利水平等,則必須先利用基數(shù)效用等經(jīng)濟(jì)學(xué)中的常用概念和量化方法加以數(shù)量化以后再進(jìn)行比較、分析和判斷博弈的基礎(chǔ)
幾個(gè)基本假設(shè):博弈的結(jié)果可以量化博弈方在選擇策略時(shí)是理性的
含義:許多博弈論都假定參與者是完美的計(jì)算者和最優(yōu)策略的完美追隨者。這就是理性行為的假設(shè)。
1.完全了解自己的利益所在。
2.準(zhǔn)確無(wú)誤的計(jì)算出最符合自身利益的行動(dòng)。博弈的基礎(chǔ)①參與人:指的是博弈中選擇行動(dòng)以最大化自己效用的決策主體(可能是人,也可能是團(tuán)體,如國(guó)家、企業(yè))在這里,每個(gè)參與人必須有可供選擇的行動(dòng)和一個(gè)很好定義的偏好函數(shù)在博弈論中,“自然”(nature)作為“虛擬參與人”(pseudo-player)來(lái)處理。這里的自然指決定外生隨機(jī)變量的概率分布的機(jī)制博弈的基本要素:博弈的基礎(chǔ)②策略(strategy):參與者可利用的選擇,即全部策略或行為集合:例如,乒乓球團(tuán)體比賽的運(yùn)動(dòng)員出場(chǎng)順序就是一個(gè)策略;這里所說(shuō)的策略,是局中人在競(jìng)爭(zhēng)中,為了對(duì)抗其他局中人所采取的一個(gè)完整的辦法,并不是某一步采取的辦法。例如,下象棋的“當(dāng)頭炮”,只能算是策略的一個(gè)組成部分,并非完整的策略。局中人所有的策略的集合,就構(gòu)成了該局中人的策略集合,可以是有限的,也可以是無(wú)限的。博弈的基礎(chǔ)行動(dòng)與策略:“人不犯我,我不犯人;人若犯我,我必犯人”是一種策略,這里的“犯”與“不犯”是兩種行動(dòng),策略略規(guī)定了什么時(shí)候選擇“犯”,什么時(shí)候選擇“不犯”在靜態(tài)博弈中,策略和行動(dòng)是相同的例如:早晨雨傘博弈的基礎(chǔ)③信息:指的是參與人在博弈中的知識(shí),特別是有關(guān)其他參與人(對(duì)手)的特征和行動(dòng)的知識(shí)完美信息(perfectinformation):指一個(gè)參與人對(duì)其他參與人(包括虛擬參與人與人“自然”)的行動(dòng)選擇有準(zhǔn)確了解的情況,即每一個(gè)信息集只包含一個(gè)值(對(duì)進(jìn)程的不了解)完全信息(completeinformation):指自然不首先行動(dòng)或自然的初始行動(dòng)被所有參與人準(zhǔn)確觀察到的情況,即沒(méi)有事前的不確定性(對(duì)得益的不了解)④得益:在博弈論中,或者是指一個(gè)特定的策略組合下參與人得到的確定效用水平,或者是指參與人得到的期望效用水平博弈的基礎(chǔ)⑤結(jié)果:博弈分析者所感興趣的要素的集合,如均衡戰(zhàn)略組合、均衡行動(dòng)組合、均衡得益組合⑥均衡:是所有參與人的最優(yōu)策略的組合博弈的基礎(chǔ)⑦次序:參與人的策略選擇順序博弈分類完全信息博弈/不完全信息博弈完美信息博弈/不完美信息博弈單人博弈/多人博弈有限策略博弈/無(wú)限策略博弈動(dòng)態(tài)博弈/靜態(tài)博弈課堂作業(yè):二人博弈例子11,10,55,02,2新技術(shù)老技術(shù)新技術(shù)老技術(shù)廠商2廠商①參與人②策略③信息④結(jié)果⑤均衡課堂作業(yè):三人博弈例子11,1,100,5,55,0,52,2,2新技術(shù)老技術(shù)新技術(shù)老技術(shù)廠商2廠商
廠商3—新技術(shù)(A)1
廠商3—老技術(shù)2,2,21,10,110,1,15,5,0新技術(shù)新技術(shù)老技術(shù)老技術(shù)廠商2廠商(B)①參與人②策略③信息④結(jié)果⑤均衡博弈論的求解思路?
想想十年后的自己
十八歲之前,我是個(gè)不知道自己想要什么的人,那時(shí)我每天就在浙江藝術(shù)學(xué)校里跟著同學(xué)唱唱歌,跳跳舞。偶爾有導(dǎo)演來(lái)找我拍戲,我就會(huì)很興奮地去拍,無(wú)論多小的角色。
如果沒(méi)有老師跟我的那次談話,那么也許直到今天,仍然沒(méi)有人知道周迅是誰(shuí)。
那是1993年5月的一天,教我專業(yè)課的趙老師突然找我談話:“周迅,你能告訴我,你對(duì)于未來(lái)的打算嗎?”
我愣住了。我不明白老師怎么突然問(wèn)我如此嚴(yán)肅的問(wèn)題,更不知道該怎么回答。老師問(wèn)我:“現(xiàn)在的生活你滿意嗎?”我搖搖頭。老師笑了:“不滿意的話證明你還有救。你現(xiàn)在就想想,十年以后你會(huì)是什么樣?”
老師的話音很輕,但是落在我心里卻變得很沉重。我腦海里頓時(shí)開(kāi)始風(fēng)起云涌。沉默許久,我看著老師的眼睛,忽然就很堅(jiān)定地說(shuō):“我希望十年后的自己成為最好的女演員,同時(shí)可以發(fā)行一張屬于自己的音樂(lè)專輯?!?/p>
老師問(wèn)我:“你確定了嗎?”
我慢慢地咬緊著嘴唇回答:“Yes”,而且拉了很長(zhǎng)的音。
老師接著說(shuō):“好,既然你確定了,我們就把這個(gè)目標(biāo)倒著算回來(lái)。十年以后,你28歲,那時(shí)你是一個(gè)紅透半邊天的大明星,同時(shí)出了一張專輯?!?/p>
“那么你27歲的時(shí)候,除了接拍各種名導(dǎo)演的戲以外,一定還要有一個(gè)完整的音樂(lè)作品,可以拿給很多很多的唱片公司聽(tīng),對(duì)不對(duì)?”
“25歲的時(shí)候,在演藝事業(yè)上你就要不斷進(jìn)行學(xué)習(xí)和思考。另外在音樂(lè)方面一定要有很棒的作品開(kāi)始錄音了。”“23歲就必須接受各種培訓(xùn)和訓(xùn)練,包括音樂(lè)上和肢體上的?!?/p>
“20歲的時(shí)候就要開(kāi)始作曲,作詞。在演戲方面就要接拍大一點(diǎn)的角色了?!?/p>
老師的話說(shuō)得很輕松,但是我卻感到一陣恐懼。這樣推下來(lái),我應(yīng)該馬上著手為自己的理想做準(zhǔn)備了,可是我現(xiàn)在卻什么都不會(huì),什么都沒(méi)想過(guò),仍然為小丫鬟小舞女之類的角色沾沾自喜。我覺(jué)得有一種強(qiáng)大的壓力忽然朝自己襲來(lái)。老師平靜地笑著說(shuō):“周迅,你是一棵好苗子,但是你對(duì)人生缺少規(guī)劃,散漫而且混亂。我希望你能在空閑的時(shí)候,想想十年以后的自己,到底要過(guò)什么樣的生活,到底要實(shí)現(xiàn)什么樣的目標(biāo)。如果你確定了目標(biāo),那么希望你從現(xiàn)在就開(kāi)始做?!?/p>
一年以后,我從藝校畢業(yè)了,老師的話從那天開(kāi)始一直刻在了我的心底:想想十年后的自己。是的,當(dāng)我意識(shí)到這是一個(gè)問(wèn)題的時(shí)候,我發(fā)現(xiàn)我整個(gè)人都覺(jué)醒了。
從學(xué)校畢業(yè)后,我忙于接拍各種各樣的影視劇。我始終記得,十年后我要做最成功的明星,所以對(duì)角色我開(kāi)始很認(rèn)真地篩選。后來(lái)我拍了《那時(shí)花開(kāi)》,拍了《大明宮詞》,我漸漸被大家接受,也慢慢地嘗到了成功的快樂(lè)。博弈論的求解思路向前展望,倒后推理p31
從得益結(jié)果來(lái)判斷策略(行動(dòng))的選擇靜態(tài)博弈:劃線法動(dòng)態(tài)博弈:博弈樹(shù)例子:解放初,美國(guó)總是尋找各種機(jī)會(huì)來(lái)侵犯我國(guó)。對(duì)此,毛主席提出了“人不犯我、我不犯人,人若犯我、我必犯人”的戰(zhàn)略方針。該動(dòng)態(tài)博弈的戰(zhàn)略式表述:局中人:美國(guó)、中國(guó)行動(dòng)空間:美國(guó)“犯我”或“不犯我”,中國(guó)“犯人”或“不犯人”行動(dòng)順序:美國(guó)先行動(dòng),我國(guó)依美國(guó)的行動(dòng)而后動(dòng)動(dòng)態(tài)博弈:博弈樹(shù)支付:這樣假設(shè)支付情況:若美國(guó)“犯我”,中國(guó)“不犯人”,則支付向量為(2,-4);若美國(guó)“不犯我”,中國(guó)“犯人”,則支付向量為(3,-5);若美國(guó)“犯我”,中國(guó)“犯人”,則支付向量為(-2,-2);若美國(guó)“不犯我”,中國(guó)“不犯人”,則支付向量為(1,1)。動(dòng)態(tài)博弈:博弈樹(shù)犯人犯我不犯我犯人不犯人不犯人美國(guó)我國(guó)我國(guó)(1,1)(3,-5)(2,-4)(-2,-2)
動(dòng)態(tài)博弈:博弈樹(shù)練習(xí)1121(2,0)(5,0)(4,2)(1,1)UDRLU’D’甲不借借乙分不分(2,2)(1,0)(0,4)練習(xí)2怎么改變策略組合?甲不借借乙分不分(2,2)(1,0)(0,4)甲(1,0)打不打練習(xí)3弈基本分類行動(dòng)順序信息練習(xí)--逆推可解的博弈實(shí)驗(yàn):幸存者兩個(gè)參與人共有9支筆兩個(gè)參與人通過(guò)拋硬幣決定先行者、后行者輪到每個(gè)人時(shí),他可以決策取走1支,還是2支,或3支,三個(gè)策略任選其一拿走最后一支筆的人將獲勝(無(wú)論這支筆是最后1支,還是2支或3支中的一支)實(shí)驗(yàn):談判兩個(gè)參與人通過(guò)拋硬幣決定提議人、回應(yīng)人兩個(gè)參與人,一個(gè)是提議人,一個(gè)是回應(yīng)人。首先由提議人提出分配100元的方案,接著由回應(yīng)人來(lái)決定是否同意。如果回應(yīng)人同意,就按該方案分配,博弈結(jié)束;如果不同意,那么兩個(gè)人一無(wú)所獲,博弈結(jié)束。
討論問(wèn)題你怎么去火車站?P35你給出2個(gè)理由可以讓查理相信弗里多的承諾。P35什么是零和博弈,請(qǐng)給出2個(gè)例子P37求解這兩個(gè)樹(shù)。P38綁住自己的雙手可能會(huì)有綁住,請(qǐng)給出2個(gè)例子P45人們?cè)跊Q策的時(shí)候,除了要考慮理性,還要考慮什么,請(qǐng)舉例第二章納什均衡實(shí)驗(yàn):選出三男三女規(guī)則:在線路上行走實(shí)驗(yàn):結(jié)果均衡1:斗雞博弈ChickenGame懦夫
均衡是什么?實(shí)驗(yàn):結(jié)果均衡2:鷹鴿博弈Hawk-Dove對(duì)于為生存競(jìng)爭(zhēng)的每只動(dòng)物而言,如果“贏”相當(dāng)于“+5”,“輸”相當(dāng)于“-5”,“重傷”相當(dāng)于“-10”,“不受傷”即“+5”,靜態(tài)博弈最簡(jiǎn)單的博弈:所有參與人同時(shí)選擇行動(dòng),并且只選擇一次;“同時(shí)”是一個(gè)信息概念,而不一定與日歷上的時(shí)間一致;舉例:拍賣囚徒困境(prisoners’dilemma)囚徒困境B
A坦白不坦白坦白不坦白-8,-80,-10-10,0-1,-1無(wú)論對(duì)方如何選擇,每個(gè)人的最優(yōu)選擇:坦白。所以,我們可以預(yù)測(cè),結(jié)果將是(坦白,坦白)占優(yōu)均衡方法
(dominant-strategyequilibrium)一般來(lái)說(shuō),由于每個(gè)參與人的效用依賴于所有人的選擇,因此每個(gè)人的最優(yōu)選擇(戰(zhàn)略)也依賴于所有其他人的選擇(戰(zhàn)略)。但在上述例子中,一個(gè)人的最優(yōu)選擇并不依賴于他人的選擇。這樣的最優(yōu)戰(zhàn)略,被稱為“占優(yōu)戰(zhàn)略”(dominantstrategy)。由所有參與人的占優(yōu)戰(zhàn)略構(gòu)成的戰(zhàn)略組合被稱為“占優(yōu)均衡”。占優(yōu)戰(zhàn)略均衡的出現(xiàn)只要求所有人都是理性的,但不要求每個(gè)參與人知道其他參與人是否理性。囚徒困境博弈有占優(yōu)均衡,所以其結(jié)果很容易預(yù)測(cè)。“智豬博弈”(boxedpigs)有些博弈沒(méi)有占優(yōu)均衡,但通過(guò)剔除“壞”戰(zhàn)略,我們可以預(yù)測(cè)博弈的結(jié)果。如“智豬博弈”按等待按等待3,12,47,-10,0這個(gè)博弈中,大豬的最優(yōu)選擇依賴于小豬的選擇,但小豬的最優(yōu)選擇與大豬的選擇無(wú)關(guān)。如果大豬知道小豬的理性的,大豬將選擇“按”。均衡是“大豬按,小豬等待”?!傲印睉?zhàn)略:無(wú)論對(duì)方選擇什么,如果自己選擇A得到的總是收益小于選擇B得到的收益,A就是相對(duì)于B的劣戰(zhàn)略。小豬大豬重復(fù)剔除占優(yōu)均衡方法“重復(fù)剔除嚴(yán)格劣戰(zhàn)略”(iteratedeliminationofstrictlydominatedstrategy)的思路:首先找出博弈參與人的劣戰(zhàn)略(dominatedstrategy)(假定存在的話),把這個(gè)劣戰(zhàn)略剔除后,剩下的是一個(gè)不包含已剔除劣戰(zhàn)略的新的博弈;然后在剔除這個(gè)新的博弈中的劣戰(zhàn)略;繼續(xù)這個(gè)過(guò)程,直到?jīng)]有劣戰(zhàn)略存在。如果剩下的戰(zhàn)略組合是唯一的,這個(gè)唯一的戰(zhàn)略組合就是“重復(fù)剔除占優(yōu)均衡”(iterateddominanceequilibrium)。如果這樣的解存在,我們說(shuō)該博弈是“重復(fù)剔除占優(yōu)可解的”(iterateddominancesolvable).理性共識(shí)
(commonknowledgeofrationality)(1)Zero-orderCKR:每個(gè)人都是理性的,但不知道其他人是否是理性的;(2)first-orderCKR:每個(gè)人是理性的,并且知道其他每個(gè)人也都是理性的,但并不知道其他人是否知道自己是理性的;(3)second-orderCKR:(1)+(2)+每個(gè)人知道(2)nth-orderCKR:R(b)C(b)R(b)……C(b)Risrational,你知道其他的人的想法?報(bào)考北大研究生?重復(fù)剔除與理性共識(shí)重復(fù)剔除不僅要求每個(gè)人是理性的,而且要求每個(gè)人知道其他人是理性的,每個(gè)人知道每個(gè)人知道每個(gè)人是理性的,如此等等,即理性是“共同知識(shí)”(共識(shí))C1C2C3R1R2R310,41,598,49,90,398,81,980,100100,98這個(gè)博弈只要求一階理性共識(shí)就可以預(yù)測(cè)均衡結(jié)果。CR好事變壞事?在單人決策中,個(gè)人給定選擇在所有情況下的收益都增加,一個(gè)人的狀況不會(huì)變得更壞,但博弈中則不同。舉例:上課睡覺(jué)和上課不睡覺(jué)不管你的最優(yōu)選擇是什么,都比過(guò)去獲得的收益大了!
給個(gè)枕頭表?yè)P(yáng)好事變壞事?在單人決策中,個(gè)人給定選擇在所有情況下的收益都增加,一個(gè)人的狀況不會(huì)變得更壞,但博弈中則不同。上下左右上下左右-1,32,10,23,41,34,10,23,4不能用重復(fù)剔除解的博弈許多博弈沒(méi)有占優(yōu)均衡,也沒(méi)有重復(fù)剔除的占優(yōu)均衡。考慮如下博弈:C1C2C3R1R2R30,44,05,34,00,45,33,53,56,6納什均衡納什均衡:所有參與人的最優(yōu)戰(zhàn)略的組合:給定該戰(zhàn)略中別人的選擇,沒(méi)有人有積極性改變自己的選擇。納什均衡是局中人戰(zhàn)略選擇上構(gòu)成的一種“僵局”,給定其他局中人的選擇不變,任何一個(gè)局中人的選擇是最好的,他也不會(huì)改變其戰(zhàn)略選擇。例如:乒乓球,生氣敵不動(dòng),我不動(dòng)納什均衡的作用:一致預(yù)期一致預(yù)期:基于信念的選擇是合理的;支持選擇的信念是正確的;預(yù)期的自我實(shí)現(xiàn):如何所有人認(rèn)為這個(gè)結(jié)果會(huì)出現(xiàn),這個(gè)結(jié)果就會(huì)出現(xiàn)。預(yù)期是自我實(shí)現(xiàn)的,預(yù)期不會(huì)錯(cuò)誤。如果你認(rèn)為我預(yù)期你將選擇X,你就真的會(huì)選擇X。當(dāng)你知道這樣的納什均衡結(jié)果將來(lái)會(huì)存在,你會(huì)作怎樣的當(dāng)期決策?實(shí)驗(yàn):信念游戲:10000拍賣,但規(guī)則改成叫價(jià)拍賣,最高者獲得10000.次高者支付對(duì)等價(jià)格。哲學(xué)思考遺產(chǎn)爭(zhēng)奪協(xié)議:哲學(xué)思考如果參與人事前達(dá)成一個(gè)協(xié)議,在不存在外部強(qiáng)制的情況下,每個(gè)人都有積極性遵守這個(gè)協(xié)議,這個(gè)協(xié)議就是納什均衡。(賣東西實(shí)驗(yàn))兩方(或多方)討價(jià)還價(jià)(博弈)浪費(fèi)大量口水,時(shí)間,最終達(dá)成某協(xié)議C(當(dāng)然是個(gè)納什均衡了,沒(méi)均衡一定會(huì)再討價(jià)還價(jià))那么還不如我們一開(kāi)始就拿出協(xié)議C來(lái),這樣就節(jié)約了很多很多時(shí)間和口水!納什均衡:舉例納什均衡:舉例廣告博弈納什均衡:(做廣告,做廣告)企業(yè)1企業(yè)2納什均衡:舉例
在城市街道上,我們常見(jiàn)到一些地段上的商店十分擁擠,構(gòu)成一個(gè)繁榮的商業(yè)中心區(qū),但另一些地段卻十分冷僻,沒(méi)什么商店。對(duì)于這種現(xiàn)象,我們可以運(yùn)用納什均衡的概念來(lái)加以解釋。圖1商業(yè)位置博弈
納什均衡:舉例1/4麥當(dāng)勞3/4肯德基1/20A1B出于這種理性,肯德基分店經(jīng)理肯定會(huì)想到:如果我將店鋪從3/4點(diǎn)處向左移一點(diǎn),那麼1/4點(diǎn)之間的中點(diǎn)不在是1/2點(diǎn)處,而是位于1/2點(diǎn)的靠左邊一點(diǎn)…….。甲乙1/2
圖1商業(yè)位置博弈
··納什均衡:舉例所以給定甲在1/2處設(shè)店,乙在緊靠甲的左邊或右邊設(shè)店是最優(yōu)的。反過(guò)來(lái),給定乙在接近1/2處設(shè)店,甲的最優(yōu)選擇也是在1/2附近設(shè)店。這樣,甲和乙擠在1/2處設(shè)店就是納什均衡,這就是商業(yè)中心區(qū)的形成原理。例如:電視臺(tái)節(jié)目;禁娛、禁廣告插播、禁廣告植入?納什均衡:所有權(quán)配置與等級(jí)結(jié)構(gòu)考慮團(tuán)隊(duì)生產(chǎn):納什均衡是什么?讓其中的一個(gè)人變成所有者?工作偷懶工作偷懶6,62,20,88,0博弈結(jié)果:納什均衡理性人假設(shè)下:博弈結(jié)果完全取決于博弈相關(guān)的各種抽象的數(shù)學(xué)事實(shí),即參與人數(shù)、每個(gè)參與人可選擇策略的個(gè)數(shù),以及所有參與人策略選擇的相聯(lián)系的每個(gè)參與人的盈利。92經(jīng)濟(jì)如局人生如棋博弈之道生活之常運(yùn)用之妙存乎一心送給有心人實(shí)驗(yàn):納什均衡的觀察與驗(yàn)證考慮有N個(gè)人參與的游戲:每個(gè)人可任意放最多100元到一部可以生錢(qián)的機(jī)器(可以選擇不放),機(jī)器把所有人放進(jìn)去的錢(qián)的總和增加到原來(lái)的三倍,然后再平均分給這N個(gè)人。請(qǐng)猜出這N人博弈的納什均衡并給出相應(yīng)的分析。全班范圍內(nèi),請(qǐng)?jiān)?~100這100個(gè)整數(shù)中,選擇一個(gè)數(shù)字。獲勝的條件是,如果你選擇的數(shù)字,滿足:不超過(guò)所有回答數(shù)字的平均值的2/3;在滿足1.的前提下,你所猜得的數(shù)字為最大。請(qǐng)問(wèn)你選擇的數(shù)字是什么?/cqg/article/1973298.html實(shí)驗(yàn):猜數(shù)問(wèn)題零水平的思考:“這個(gè)問(wèn)題對(duì)我太復(fù)雜了,隨便猜一個(gè)碰碰運(yùn)氣吧,就選平均數(shù)50.”第一層次的思考:"別人對(duì)這個(gè)問(wèn)題也不會(huì)有什么靈感,所以我想他們的選擇會(huì)是隨機(jī)的,也就是平均數(shù)50,所以,我選擇33"第二層次的思考:人們可能很聰明,但我更有獨(dú)到的認(rèn)識(shí)。他們無(wú)疑會(huì)選33,因?yàn)樗麄冋J(rèn)為這個(gè)問(wèn)題很簡(jiǎn)單,所以我選擇22“這個(gè)游戲最容易被猜到的數(shù)字是0,1,22和33.塞勒認(rèn)為:“那些選擇0或1的人完全從數(shù)學(xué)角度考慮問(wèn)題,沒(méi)有考慮到人們的行為因素。而那些選擇22或33的人則低估了別人的智慧?!笨紤]到所有因素后的猜測(cè)應(yīng)該是13?。?個(gè)均數(shù))博弈問(wèn)題是否存在多個(gè)納什均衡?如果只有一個(gè)納什均衡,容易找到一致性預(yù)期嗎?如果存在多個(gè)納什均衡,怎么找到一致性預(yù)期呢?約會(huì)博弈問(wèn)題芭蕾舞足球場(chǎng)芭蕾舞足球場(chǎng)1,20,00,02,1在社會(huì)決策過(guò)程中,來(lái)自于文化、習(xí)慣等方面的許多強(qiáng)制力(compellingforce)能讓決策匯集于一點(diǎn)形成共識(shí)。一旦社會(huì)上形成一個(gè)特定的慣例(如語(yǔ)言、習(xí)俗等),那么就很難改變,即使每個(gè)人都知道這種慣例不是最優(yōu)的。聚點(diǎn)均衡法:聚焦點(diǎn):Schelling(1960)認(rèn)為,在現(xiàn)實(shí)生活中,參與人可能使用某些被博弈模型抽象掉的信息來(lái)達(dá)到一個(gè)“聚焦點(diǎn)”(focal
point)均衡。求解多個(gè)納什均衡方法聚點(diǎn)均衡:情侶博弈情侶博弈的課堂實(shí)驗(yàn)請(qǐng)兩名同學(xué)協(xié)助統(tǒng)計(jì)其他同學(xué)參與實(shí)驗(yàn)設(shè)想你是情侶博弈的參與人1——男孩,你將選擇哪個(gè)策略?男女生分開(kāi),男生為參與人1——男孩,女生為參與人2——女孩,請(qǐng)選擇策略設(shè)想你是參與人1——男孩,參與人2已經(jīng)作出了自己的選擇,但你觀察不到她的選擇。現(xiàn)在請(qǐng)你作出自己的選擇。聚點(diǎn)均衡:情侶博弈你仍然是參與人1,在博弈開(kāi)始前,你的對(duì)手有機(jī)會(huì)做一個(gè)宣言(你沒(méi)這個(gè)機(jī)會(huì)),現(xiàn)在她宣布:“我將選擇芭蕾”。博弈開(kāi)始,你將選擇什么策略?你還是參與人1——男孩,博弈開(kāi)始前,你的對(duì)手有機(jī)會(huì)做一個(gè)宣言(你沒(méi)有),但是女孩選擇了沉默。博弈開(kāi)始,你將選擇什么策略?謝林:你要在紐約接一個(gè)人,見(jiàn)面約定在什么時(shí)間什么地點(diǎn)?你要在山東科技大學(xué)接一個(gè)人,見(jiàn)面約定在什么時(shí)間什么地點(diǎn)?實(shí)驗(yàn):見(jiàn)面實(shí)驗(yàn):選美大賽請(qǐng)你猜出哪張面孔是大多數(shù)投標(biāo)者認(rèn)為漂亮的?凱恩斯:熱門(mén)股票就是每個(gè)人認(rèn)為的其他每個(gè)人認(rèn)為的………熱門(mén)股票。選美與選股信息選股地產(chǎn)政策“地震”,地產(chǎn)股則同時(shí)“共振”
政策的猛烈炮火,使地產(chǎn)股儼然成為了近期A股市場(chǎng)的“炮灰”。失守3000點(diǎn)的滬深股市,地產(chǎn)股悲劇持續(xù)演繹。繼4月19日房地產(chǎn)指數(shù)下跌7.58%以后,昨日(4月20日),該指數(shù)再度下跌2.91%。無(wú)論是招、保、萬(wàn)、金等傳統(tǒng)的四大天王,還是先前基金青睞的二三線城市地產(chǎn)股,二級(jí)市場(chǎng)上都遭遇了前所未有的持續(xù)打壓。選股資源價(jià)格改革推進(jìn)帶來(lái)的機(jī)會(huì)
資源價(jià)格改革,主要集中于電力、天然氣、水等資源性產(chǎn)品價(jià)格和排污、污水處理、垃圾處理等環(huán)保收費(fèi)改革。目前,市場(chǎng)最關(guān)注的就是水資源價(jià)格上調(diào)的問(wèn)題。能源、煤炭石油、有色金屬
美麗的均衡均衡可以輕易地由于突發(fā)奇想或一時(shí)狂熱而確定。由社會(huì)中相互影響的人們參與的博弈的結(jié)果,應(yīng)當(dāng)取決于博弈的社會(huì)和心理方面。第三講
囚徒困境專題多種情景,一個(gè)思想五一、商場(chǎng)多種情景,一個(gè)思想美國(guó)大選民主黨共和黨中間策略多種情景,一個(gè)思想漁業(yè)物種滅絕囚徒困境兩個(gè)小偷甲和乙聯(lián)手作案,私入民宅被警方逮住但未獲證據(jù)。警方將兩人分別置于兩間房間分開(kāi)審訊,政策是若一人招供但另一人未招,則招者立即被釋放,未招者判入獄10年;若二人都招則兩人各判刑8年;若兩人都不招則未獲證據(jù)但因私入民宅各拘留1年。表1囚徒困境博弈
乙
招不招招甲不招(問(wèn)題1:甲、乙如何選擇?)
囚徒困境?
條件:允許囚徒甲和乙在審訊室單獨(dú)呆上10分鐘,然后再?zèng)Q定是否坦白。
目的:建立攻守同盟,克服自利心理。
均衡:(坦白,坦白)
戀愛(ài)、低碳、核實(shí)驗(yàn):信息溝通?
假設(shè)每一個(gè)學(xué)生都擁有一家企業(yè),選擇生產(chǎn)產(chǎn)品A還是B,A代表高質(zhì)量產(chǎn)品,B代表低質(zhì)量產(chǎn)品。如果你選擇生產(chǎn)A,則老師獎(jiǎng)勵(lì)你2元,選擇B,則老師獎(jiǎng)勵(lì)你2.15元。選擇A產(chǎn)品可以產(chǎn)生1元總收益,選擇B產(chǎn)品不能產(chǎn)生總收益,最后老師計(jì)算出所有選擇A產(chǎn)品同學(xué)的人數(shù),將所得到的總收益平分給所有同學(xué)。囚徒困境?
條件:囚徒甲和乙都是完全清白的、絕對(duì)具有理性的良好市民。
均衡:(坦白,坦白)
囚徒困境的本質(zhì)個(gè)體理性與集體理性之間存在沖突不合作劣于合作合作不具有約束性囚徒困境的破解不合作合作許諾獎(jiǎng)勵(lì)懲罰可信性囚徒困境的破解合作不合作合作不合作T,TS,RR,SP,P滿足:R>T>P>S;(S+R)<T+T囚徒困境的一般表達(dá)式囚徒困境的破解國(guó)家法律梁?jiǎn)⒊何覈?guó)成文法之起源不可確指,然以數(shù)千年之思想往往視法律與命令為一物國(guó)家法律措施是無(wú)效率還是高效率?用法律解決“囚徒困境”合作不合作合作不合作T,TS,R-XR-X,SP,P滿足:X>R-T公共產(chǎn)品(publicgoods)提供不提供提供不提供4,4-1,55,-10,0無(wú)論對(duì)方如何選擇,每個(gè)人的最優(yōu)選擇:不提供。所以,我們可以預(yù)測(cè),結(jié)果將是(不提供,不提供)公共產(chǎn)品與稅收制度比較私人產(chǎn)品與公共產(chǎn)品的不同:使用上排他性;私人產(chǎn)品是志愿購(gòu)買的,但公共產(chǎn)品可能需要強(qiáng)制購(gòu)買;稅收制度就是保證公共產(chǎn)品的生產(chǎn),解決公共產(chǎn)品生產(chǎn)上的“囚徒困境”
生活中的“囚徒困境”例子
例子1商家價(jià)格戰(zhàn)
出售同類產(chǎn)品的商家之間本來(lái)可以通過(guò)共同將價(jià)格維持在高位而獲利,但實(shí)際上卻是相互殺價(jià),結(jié)果都賺不到錢(qián)。當(dāng)一些商家共謀將價(jià)格抬高,消費(fèi)者實(shí)際上不用著急,因?yàn)樯碳衣?lián)合維持高價(jià)的壟斷行為一般不會(huì)持久,可以等待壟斷的自身崩潰,價(jià)格就會(huì)掉下來(lái)。
譬如,2000年我國(guó)幾家生產(chǎn)彩電的大廠商合謀將彩電價(jià)格維持高位,他們搞了一個(gè)“彩電廠家價(jià)格自律聯(lián)盟”,并在深圳舉行了由多家彩電廠商首腦參加的“彩電廠商自律聯(lián)盟高峰會(huì)議”。當(dāng)時(shí),國(guó)家有關(guān)部門(mén)還未出臺(tái)相關(guān)的反壟斷法律,對(duì)于這種在發(fā)達(dá)國(guó)家明顯屬于違法行為的所謂“自律聯(lián)盟”,國(guó)家在法律上暫時(shí)還是無(wú)能為力的。寡頭廠商在光天化日之下進(jìn)行價(jià)格合謀,并且還通過(guò)媒體大肆炒作,這在發(fā)達(dá)國(guó)家是不可思議的。
但是,盡管政府當(dāng)時(shí)無(wú)力制止這種事情,公眾也不必?fù)?dān)心彩電價(jià)格會(huì)上漲。這是因?yàn)?,“彩電廠商自律聯(lián)盟”只不過(guò)是一種“囚徒困境”,彩電價(jià)格不會(huì)上漲。在高峰會(huì)議之后不到二周,國(guó)內(nèi)彩電價(jià)格不是上漲而是一路下跌。這是因?yàn)閺S商們都有這樣一種心態(tài):無(wú)論其他廠商是否降價(jià),我自己降價(jià)是有利于自己的市場(chǎng)份額擴(kuò)大的。
例子2為什么政府要負(fù)責(zé)修建公共設(shè)施,因?yàn)樗饺藳](méi)有積極性出資修建公共設(shè)施
設(shè)想有兩戶相居為鄰的農(nóng)家,十分需要有一條好路從居住地通往公路。修一條路的成本為4,每個(gè)農(nóng)家從修好的好路上獲得的好處為3。如果兩戶居民共同出資聯(lián)合修路,并平均分?jǐn)傂蘼烦杀?,則每戶居民獲得凈的好處(支付)為3-4/2=1;當(dāng)只有一戶人家單獨(dú)出資修路時(shí),修路的居民獲得的支付為3-4=-1(虧損),“搭便車”不出資但仍然可以使用修好的路的另一戶人家獲得支付3-0=3。修路博弈
乙修不修修甲不修
我們看到,對(duì)甲和乙兩家居民來(lái)說(shuō),“修路”都是劣戰(zhàn)略,因而他們都不會(huì)出資修路。
這就是我們看到的為什么大多數(shù)路、橋等公共設(shè)施都是由政府出資修建的原因。同樣的道理,國(guó)防、教育、社會(huì)保障,環(huán)境衛(wèi)生等都由政府承擔(dān)資金投入,私人一般沒(méi)有積極性承擔(dān)這方面服務(wù)的積極性和能力。例子3蘇格蘭的草地為什么消失了?公共資源經(jīng)常被過(guò)度利用的原因。
在18世紀(jì)以前,英國(guó)蘇格蘭地區(qū)有大量的草地,其產(chǎn)權(quán)沒(méi)有界定,屬公共資源,大家都可以自由地在那里放牧。草地屬于“可再生資源”,如果限制放牧的數(shù)量,沒(méi)有被牛羊吃掉的剩余草皮還會(huì)重新長(zhǎng)出大面積草場(chǎng),但如果不限制放牧規(guī)模,過(guò)多的牛羊?qū)⒉莩缘靡还舛?,則今后不會(huì)再有新草生長(zhǎng)出來(lái),草場(chǎng)就會(huì)消失。
由于草地的產(chǎn)權(quán)沒(méi)有界定,政府也沒(méi)有對(duì)放牧作出規(guī)模限制,每家牧民都會(huì)如此盤(pán)算:如果其他牧民不約束自己的放牧規(guī)模,讓自己的牛羊過(guò)多地到草地上吃草,那么,我自己一家約束自己的放牧規(guī)模規(guī)模對(duì)保護(hù)草場(chǎng)的貢獻(xiàn)是微乎其微的,不會(huì)使草場(chǎng)免于破壞;相反,我也加入過(guò)度放牧的行列,至少在草場(chǎng)消失之前還會(huì)獲得一部分短期的收益。
如果其他牧民約束放牧規(guī)模,我單獨(dú)一家人過(guò)度放牧不會(huì)破壞廣褒的牧場(chǎng),但自己卻獲得了高額的收益。因此,任何一位牧民的結(jié)論都會(huì)是:無(wú)論其他牧民是否過(guò)度放牧,我選擇“約束自己的放牧規(guī)?!倍际橇討?zhàn)略,從而被剔除。大家最終都會(huì)選擇過(guò)度放牧,結(jié)果導(dǎo)致草地消失,生態(tài)破壞。
類似的例子還有:
渤海中的魚(yú)愈來(lái)愈少了,工業(yè)化中的大氣及河流污染,森林植被的破壞等。解決公共資源過(guò)度利用的出路是政府制訂相應(yīng)的規(guī)制政策加強(qiáng)管理,如我國(guó)政府規(guī)定海洋捕魚(yú)中,每年有一段時(shí)間的“休漁期”,此時(shí)禁止捕魚(yú),讓小魚(yú)苗安安靜靜地生長(zhǎng),大魚(yú)好好地產(chǎn)卵,并對(duì)魚(yú)網(wǎng)的網(wǎng)眼大小作出規(guī)定,禁用過(guò)小網(wǎng)眼的捕網(wǎng)打魚(yú),保護(hù)幼魚(yú)的生存。又如在三峽庫(kù)區(qū),為了保護(hù)庫(kù)區(qū)水體環(huán)境,關(guān)閉了前些年泛濫成災(zāi)的許多小造紙廠等。思考1為什么人們?cè)谙M(fèi)各種公共資源時(shí),如果各取所需,留給下一代的越來(lái)越少?而在社會(huì)優(yōu)化分配中,消耗一半,留下一半給后代。也就是說(shuō),當(dāng)一種資源成了公共資源的時(shí)候,還能夠?qū)嵭懈魅∷鑶??思?全球轉(zhuǎn)暖的溫室效應(yīng)是否屬于公共資源悲?。抗操Y源悲哀思考3在我國(guó),利用電話線的網(wǎng)絡(luò)快車(ADSL),包月租或者包年租的時(shí)候,每個(gè)人都想把網(wǎng)絡(luò)打開(kāi)掛在網(wǎng)絡(luò)上(在線游戲的激勵(lì)),這樣是不是公共悲???你家里的網(wǎng)絡(luò)快車是否真的快?公共資源悲哀思考4如何避免悲劇的發(fā)生?公共資源分割私有化行嗎?比如環(huán)境?增加使用稅?比如國(guó)家圖書(shū)館?當(dāng)稅收使得人們的享受公共資源的邊際效用為零的時(shí)候,稅收合理嗎?例子4為什么在城市中心道路上禁止汽車?guó)Q喇叭?
禁鳴喇叭一方面是為了控制城市噪聲污染,另一方面是基于以下的博弈論原因。當(dāng)汽車司機(jī)可以鳴喇叭時(shí),可能為汽車超速搶行提供條件。但當(dāng)大家都搶行時(shí),城市交通擁擠加重,反而都難以順利通行,獲得低支付(2,2)。
但當(dāng)對(duì)方緩行時(shí),自己搶行會(huì)占便宜,獲得支付9。這個(gè)博弈中,“緩行”是劣戰(zhàn)略,剔除后得到“剔除劣戰(zhàn)略后的占優(yōu)戰(zhàn)略均衡”(搶行,搶行),這不是一個(gè)好的均衡。當(dāng)禁止鳴喇叭時(shí),司機(jī)為了避免造成交通事故,只得緩行,從而得到好的結(jié)果(緩行,緩行)。交通博弈
司機(jī)2緩行搶行緩行司機(jī)1搶行
例子5為什么要加入WTO?
WTO是一個(gè)自愿性申請(qǐng)加入的自由貿(mào)易聯(lián)盟,即WTO成員國(guó)之間實(shí)現(xiàn)低關(guān)稅或零關(guān)稅的相互間自由貿(mào)易。為什么需要一個(gè)組織來(lái)協(xié)調(diào)國(guó)家之間的自由貿(mào)易呢?這是因?yàn)椋绻麤](méi)有一個(gè)協(xié)調(diào)組織,國(guó)與國(guó)之間的貿(mào)易就不會(huì)呈現(xiàn)低關(guān)稅或零關(guān)稅的自由貿(mào)易局面,因?yàn)檫@時(shí)國(guó)與國(guó)之間的貿(mào)易是一個(gè)“囚徒困境”。給定一個(gè)國(guó)家對(duì)另一個(gè)國(guó)家的貨物實(shí)行低關(guān)稅,另一個(gè)國(guó)家反過(guò)來(lái)對(duì)這個(gè)國(guó)家的貨物實(shí)行高關(guān)稅是占優(yōu)于實(shí)行低關(guān)稅的戰(zhàn)略的。
如果恰當(dāng)進(jìn)行機(jī)制設(shè)計(jì),前述囚徒困境還是可以避免的,下面是一個(gè)商戰(zhàn)中的真實(shí)例子。
機(jī)制設(shè)計(jì):如何走出囚徒困境凍結(jié)價(jià)格戰(zhàn)的博弈機(jī)制
美國(guó)有兩家銷售音像商品的商店“瘋狂艾迪(CrazyEddie)和紐馬克與露易斯(Newmark&Lewis),它們之間在市場(chǎng)上存在競(jìng)爭(zhēng)。當(dāng)它們進(jìn)行合謀時(shí),如何保證對(duì)方不會(huì)背叛而降價(jià)的一個(gè)前提就是如何能迅速查出對(duì)方的背叛行為并給予懲罰。
“瘋狂艾迪”已作出了承諾“不可能有人賣得比我們更低,我們的價(jià)格最低廉,我們保證價(jià)格最低,而且是超級(jí)瘋狂的低”。而對(duì)手企業(yè)Newmark&Lewis也打出“只要買我們的東西,將得到終生低價(jià)保證”。它承諾:假如你能在別處買到更低的價(jià)格,我們將加倍退錢(qián),廣告還承諾:
假如你在本店買了商品之后,在你一生中于任何本地的銷售商(本行銷區(qū)內(nèi))那里發(fā)現(xiàn)相同的廣告款式而價(jià)格卻較本店低的話(以單據(jù)為憑),本店愿支付百分之百的差價(jià),并額外付給差價(jià)的百分之二十五(以支票支付);或是給你差價(jià)百分之二百的本店換貨單(除了原差價(jià)的百分之一百外,再額外加給百分之百,都是以換貨單方式支付)?!狽ewmark&Lewis公司終身低價(jià)保證
乍一看,這兩家企業(yè)在玩命競(jìng)爭(zhēng),根本不可能形成價(jià)格聯(lián)盟,即使形成也難以維持,因而它們之間似乎是在打價(jià)格戰(zhàn)。但是,一種潛在的偵察降低價(jià)格行為的機(jī)制阻止了價(jià)格戰(zhàn)的發(fā)生。若每臺(tái)錄相機(jī)的批發(fā)價(jià)為150美元,此時(shí)兩家企業(yè)正以每臺(tái)300美元的價(jià)格出售?!隘偪癜稀贝蛩憬禐槊颗_(tái)275美元,從而將對(duì)手的顧客拉過(guò)來(lái),如那些家住在對(duì)手售貨點(diǎn)附近或過(guò)去曾買過(guò)對(duì)手商品的顧客。
但是,對(duì)手的戰(zhàn)略鎖定了“瘋狂艾迪”的行為,因?yàn)椤隘偪癜稀钡倪@一計(jì)劃會(huì)有相反的效果。因?yàn)轭櫩蜁?huì)到對(duì)手那里先以300美元買下錄相機(jī),然后再獲退款50美元。這樣,對(duì)手自然將價(jià)格降到更低的價(jià)格250美元一臺(tái),顧客反而是從“瘋狂艾迪”那里流向?qū)κ侄皇窍喾础?/p>
如果對(duì)手不想以250美元一臺(tái)出售錄相機(jī),他也可以將價(jià)格降到275美元一臺(tái),只要它發(fā)現(xiàn)有顧客來(lái)要求退款,就會(huì)發(fā)現(xiàn)對(duì)手的背叛行為,從而將價(jià)格降到了250美元一臺(tái)。既不以太低價(jià)出售,又快速發(fā)現(xiàn)對(duì)手的背叛從而以降價(jià)予以報(bào)復(fù),使對(duì)手降價(jià)也不能增大顧客量,從而蒙受損失。
這樣,“瘋狂艾迪”就沒(méi)有進(jìn)行價(jià)格戰(zhàn)的意愿了,自然形成價(jià)格聯(lián)盟。在美國(guó),明目張膽的價(jià)格合盟是違法的,但這兩家企業(yè)卻以不違法的方式形成了價(jià)格合盟,顧客成了背叛行為的偵察者,這一戰(zhàn)略是十分巧妙的。
福州國(guó)美電器從2003年9月6日試營(yíng)業(yè),9月13日正式開(kāi)業(yè)至今,一直實(shí)施“誰(shuí)價(jià)比我低,差價(jià)兩倍還”。成都百貨大樓國(guó)美電器火拼最低價(jià)“價(jià)格沒(méi)有最低,只有更低”。
誰(shuí)價(jià)比我低,差價(jià)兩倍還智豬博弈
豬圈中有一頭大豬和一頭小豬,在豬圈的一端設(shè)有一個(gè)按鈕,每按一下,位于豬圈另一端的食槽中就會(huì)有10單位的豬食進(jìn)槽,但每按一下按鈕會(huì)耗去相當(dāng)于2單位豬食的成本。如果大豬先到食槽,則大豬吃到9單位食物,小豬僅能吃到1單位食物;如果兩豬同時(shí)到食槽,則大豬吃7單位,小豬吃3單位食物;如果小豬先到,大豬吃6單位而小豬吃4單位食物。給出這個(gè)博弈的支付矩陣。二、智豬博弈:對(duì)諸多經(jīng)濟(jì)現(xiàn)象的解釋表4智豬博弈
小豬按等待按大豬等待
這個(gè)博弈沒(méi)有“剔除劣戰(zhàn)略均衡”,因?yàn)榇筘i沒(méi)有劣戰(zhàn)略。但是,小豬有一個(gè)劣戰(zhàn)略“按”,因?yàn)闊o(wú)論大豬作何選擇,小豬選擇“等待”是比選擇“按”更好一些的戰(zhàn)略。所以,小豬會(huì)剔除“按”,而選擇“等待”;大豬知道小豬會(huì)選擇“等待”,從而自己選擇“按”,所以,可以預(yù)料博弈的結(jié)果是(按,等待)。這稱為“重復(fù)剔除劣戰(zhàn)略的占優(yōu)戰(zhàn)略均衡”,其中小豬的戰(zhàn)略“等待”占優(yōu)于戰(zhàn)略“按”,而給定小豬剔除了劣戰(zhàn)略“按”后,大豬的戰(zhàn)略“按”又占優(yōu)于戰(zhàn)略“等待”。
在經(jīng)濟(jì)生活中,“智豬博弈—搭便車”
例子1股市博弈在股票市場(chǎng)上,大戶是大豬,他們要進(jìn)行技術(shù)分析,收集信息、預(yù)測(cè)股價(jià)走勢(shì),但大量散戶就是小豬。他們不會(huì)花成本去進(jìn)行技術(shù)分析,而是跟著大戶的投資戰(zhàn)略進(jìn)行股票買賣,即所謂“散戶跟大戶”的現(xiàn)象。
例子2為何股份公司中的大股東才有投票權(quán)?
在股份公司中,大股東是大豬,他們要收集信息監(jiān)督經(jīng)理,因而擁有決定經(jīng)理任免的投票權(quán),而小股東是小豬,不會(huì)直接花精力去監(jiān)督經(jīng)理,因而沒(méi)有投票權(quán)。例子3為什么中小企業(yè)不會(huì)花錢(qián)去開(kāi)發(fā)新產(chǎn)品?
在技術(shù)創(chuàng)新市場(chǎng)上,大企業(yè)是大豬,它們投入大量資金進(jìn)行技術(shù)創(chuàng)新,開(kāi)發(fā)新產(chǎn)品,而中小企業(yè)是小豬,不會(huì)進(jìn)行大規(guī)模技術(shù)創(chuàng)新,而是等待大企業(yè)的新產(chǎn)品形成新的市場(chǎng)后生產(chǎn)模仿大企業(yè)的新產(chǎn)品的產(chǎn)品去銷售。我們寢室七個(gè)人,有一臺(tái)學(xué)校免費(fèi)提供的飲水機(jī)。一桶水八塊錢(qián),在宿舍樓下可以直接買到。但是在買水制度的安排上,卻遇到了許多困難。實(shí)驗(yàn):買水的困境首先想到的辦法是輪流購(gòu)買。但問(wèn)題至少有三個(gè):一、每個(gè)人對(duì)水的消費(fèi)量并不相同,這種平攤的方法可能不會(huì)得到喝水較少的同學(xué)的支持;二、七個(gè)人輪流一次的周期很長(zhǎng),到最后很可能會(huì)出現(xiàn)一部分人比另一部分人多買一桶水的情形,在公平性上存在爭(zhēng)議(雖然一桶水的花費(fèi)并不高);三、節(jié)假日期間,有些同學(xué)回家,可能會(huì)影響輪流購(gòu)買的實(shí)行。另一個(gè)辦法是每人定期出資,設(shè)立一個(gè)買水基金。除了上面的第一個(gè)問(wèn)題外,還可能存在下面的問(wèn)題:一、資金如何妥善管理和使用的問(wèn)題;二、誰(shuí)把水從一樓搬上來(lái)的問(wèn)題(比較費(fèi)力)。因?yàn)榇嬖诟鞣N各樣的問(wèn)題,以上的方法均未有效實(shí)行,所以寢室經(jīng)常發(fā)生水荒。這個(gè)問(wèn)題與公共物品的提供困境類似,但又存在一些特有的問(wèn)題。到最后可能演化成一個(gè)智豬博弈:對(duì)喝水比較看重的人去買水——事實(shí)近似于此——但這并不是長(zhǎng)久之計(jì)。當(dāng)然,同學(xué)友情、兄弟義氣等約束行為的因素并未考慮在內(nèi),只是在純粹經(jīng)濟(jì)人的假設(shè)下給出問(wèn)題?;旌喜呗耘c隨機(jī)行動(dòng)賽場(chǎng)點(diǎn)球射門(mén)攻方的策略是:攻左邊,或攻右邊守方的策略是:守左邊,或守右邊(以守方的方向?yàn)闇?zhǔn))混合策略提出得益:進(jìn)球得分的百分比。根據(jù)1995-2000年間意大利、西班牙和英國(guó)最高聯(lián)盟的數(shù)據(jù)就一次游戲而言,猜測(cè)對(duì)方的策略,保密自己的策略。在多次反復(fù)游戲中,避免任何的傾向性和規(guī)律性。嚴(yán)格競(jìng)爭(zhēng)博弈零和博弈實(shí)驗(yàn)辦法是將行動(dòng)隨機(jī)化?;旌喜呗裕簠⑴c人在每一個(gè)給定信息的情況下以某種概率分布隨機(jī)地選擇不同的行動(dòng)。例如:乒乓球員以60%的概率選擇正手發(fā)球,40%的概率選擇反手發(fā)球。
什么是純策略?混合策略如果你是踢球人,這兩個(gè)純策略中你更喜歡哪一種?(70%)你能不能做得更好?
混合策略(1)以50:50(拋硬幣)的比例隨機(jī)地選擇左邊或右邊。如果守門(mén)員選擇左邊,你混合策略成功的概率:?*58%+?*93%=
75.5%如果守門(mén)員選擇右邊,你混合策略成功的概率:?*95%+?*70%=
82.5%50:50是你最佳混合策略嗎?
混合策略(2)以40:60(在你的口袋里放一本書(shū),如果頁(yè)眉最后一位數(shù)是1到4選左,0到5則選右)的比例隨機(jī)地選擇左邊或右邊。如果守門(mén)員選擇左邊,你混合策略成功的概率:0.4*58%+0.6*93%=
79%如果守門(mén)員選擇右邊,你混合策略成功的概率:0.4*95%+0.6*70%=
80%你的連續(xù)更優(yōu)的混合策略比例就是如何使自己在守門(mén)員選擇左邊時(shí)和選擇右邊的成功概率差距縮小。58%--70%--12%75.5%--82.5%--7.3%79%--80%--1%x--y--0
混合策略不管守門(mén)員選擇他的左邊還是右邊,你的最佳混合比例都會(huì)使你得到相等的成功率
混合策略(3)以x:1-x的比例隨機(jī)地選擇左邊或右邊。如果守門(mén)員選擇左邊,你混合策略成功的概率:x*58%+(1-x)*93%如果守門(mén)員選擇右邊,你混合策略成功的概率:x*95%+(1-x)
*70%兩者相等,求得選x=0.383不管守門(mén)員選擇他的左邊還是右邊,你的最佳混合比例都會(huì)使你得到相等的成功率
混合策略(4)以0.383:0.617的比例隨機(jī)地選擇左邊或右邊。如果守門(mén)員選擇左邊,你混合策略成功的概率:0.383*58%+0.617*93%=79.6%如果守門(mén)員選擇右邊,你混合策略成功的概率:0.383*95%+0.617
*70%=79.6%那么守門(mén)員的策略怎樣?混合策略納什均衡?
混合策略守門(mén)員的最佳策略是使踢球者選擇左邊和選擇右邊的成功率相等的策略。守門(mén)員應(yīng)當(dāng)分別以41.7%和58.3%的比例選擇自己的左邊和右邊,使踢球者成功的概率為79.6%.法則
混合策略在純沖突博弈(零和博弈)中,如果讓你的對(duì)手事先看清楚你的真實(shí)選擇對(duì)你不利,那么你可以通過(guò)隨機(jī)選擇自己備選的純策略而獲益。你的混合比例應(yīng)該是這樣的:對(duì)手采取任何特定的備選純策略,都不可能利用你的選擇,即,當(dāng)你以混合策略對(duì)付他的混合策略中任一純策略時(shí),你得到的平均贏利都相等。實(shí)驗(yàn)拋硬幣
怎樣隨機(jī)行動(dòng)?拋硬幣翻出正面之后再拋一次,這時(shí)出正面的可能性與拋出反面的可能性相等。無(wú)規(guī)律的隨機(jī)行動(dòng)(點(diǎn)名4/18=22%,不點(diǎn)名78%)。例如:一個(gè)秘密的、足夠復(fù)雜以致讓人難以破解的規(guī)則。舉例:秘密約會(huì)博弈芭蕾舞足球場(chǎng)芭蕾舞足球場(chǎng)2,10,00,01,3妻子報(bào)案(reportingacrime)n個(gè)人目睹一樁罪行,每個(gè)人都希望報(bào)警,但是都傾向于其他人打電話。特別的,假定能從報(bào)警中得到v單位的收益,而打電話的人需要付出c單位的成本,v>c>0。分析這個(gè)問(wèn)題的純戰(zhàn)略NE和混合戰(zhàn)略NE。混合策略—案例分析:參與人:n個(gè)每個(gè)參與人的戰(zhàn)略集:{打電話,不打電話}效用:沒(méi)有任何人打,所有人0支付;打,v-c;不打,但其他人至少有一個(gè)人打,v混合策略—案例純戰(zhàn)略NE當(dāng)只有兩個(gè)參與人的時(shí)候(公共產(chǎn)品提供的斗雞博弈)——兩個(gè)NEn個(gè)人的時(shí)候:假設(shè)有m個(gè)人提供,m>1orm=1n個(gè)NE混合策略—案例混合策略—案例混合戰(zhàn)略NE隨著人數(shù)n的增加,p減小,即人越多,每個(gè)人選擇報(bào)案的概率就會(huì)越小,如果n=1,則p=1社會(huì)心理學(xué)與博弈分析混合策略—案例
小孩玩的游戲“石頭,剪子,布”,也是一種博弈。但是,這個(gè)博弈有一種有趣的特征,即給定一方的任何選擇,另一方都有制勝對(duì)方的戰(zhàn)略,所以,給定一方任何一個(gè)戰(zhàn)略,對(duì)方都有制勝這個(gè)戰(zhàn)略的戰(zhàn)略,因而這個(gè)戰(zhàn)略不是最優(yōu)的。任何“純戰(zhàn)略”都不是最優(yōu)的,純戰(zhàn)略是“石頭,剪子,布”中的任何一個(gè)。
但是,我們知道,玩這個(gè)游戲是總是以對(duì)方不易猜出的隨機(jī)方式出招。事實(shí)上,可以通過(guò)數(shù)學(xué)證明,當(dāng)雙方都以每個(gè)戰(zhàn)略按1/3的概率出招時(shí),達(dá)成一種雙方都不愿改變這種概率分布的局面。這被稱為“混合戰(zhàn)略納什均衡”,而這種以隨機(jī)方式選擇純戰(zhàn)略的博弈被稱為“混合戰(zhàn)略博弈”。
實(shí)驗(yàn)顯示:“陷入無(wú)意識(shí)但仍可預(yù)測(cè)的模式”例如:官僚作風(fēng)--連續(xù)出“布”雪崩---連續(xù)出石頭排除策略--省略一個(gè)隨機(jī):秘密的,足夠復(fù)雜以至難以讓人破解的規(guī)則
例子1田忌賽馬新編
春秋戰(zhàn)國(guó)時(shí)期,齊威王常與旗下大將田忌賽馬。規(guī)則是:每次賽三局,每一局齊威王與田忌各出一匹馬比賽奔跑速度。每一局中的勝者贏敗方一千斤銅。田忌有上、中、下三匹馬,而齊威王也有上、中、下三匹馬。每次比賽,第一局田忌出上馬,齊威王也出上馬;第二局田忌出中馬,齊威王也出中馬;第三局,田忌出下馬,齊威王也出下馬。齊威王的上馬比田忌的上馬好,齊威王的中馬也比田忌的中馬好,齊威王的下馬還是比田忌的下馬好。于是,每次比賽的結(jié)果都是田忌連輸三局。
田忌的謀士孫臏了解了田忌的困境后,就打聽(tīng)到這樣一個(gè)消息:盡管齊威王的上、中、下三匹馬都要比田忌的對(duì)應(yīng)上、中、下三匹馬好,但碰巧的是田忌的上馬可勝齊威王的中馬,田忌的中馬可勝齊威王的下馬。于是,孫臏為田忌獻(xiàn)計(jì):下一次比賽中第一局時(shí)田忌出下馬對(duì)齊威王的上馬輸一局,第二局田忌出上馬對(duì)齊威王的中馬,第三局田忌出中馬對(duì)齊威王的下馬,這樣可連贏兩局,最后凈勝一千斤銅。田忌依計(jì)而行,果真贏回一千斤銅。
這個(gè)故事曾經(jīng)被很多人當(dāng)作博弈論的例子來(lái)演繹,但實(shí)際上這個(gè)故事與博弈論無(wú)關(guān)。博弈論會(huì)假定所有局中人都是理性的,不能假定一些局中人聰明而另一些局中人卻是傻子。當(dāng)田忌出下馬時(shí),齊威王最好的選擇是出下馬而不是上馬。孫臏的計(jì)謀中假定齊威王是傻子,當(dāng)田忌出下、上、中馬時(shí),他仍然按上、中、下馬出,當(dāng)然要輸了。事實(shí)上,當(dāng)田忌出下馬時(shí),齊威王應(yīng)出下馬,但齊威王出下馬時(shí),田忌不應(yīng)出下馬而是出中馬,但此時(shí)齊威王又應(yīng)出中馬而不是下馬了,……。這樣,博弈不會(huì)有純戰(zhàn)略的均衡。
兩人只能玩混合戰(zhàn)略博弈,齊威王分別以1/6隨機(jī)的概率選擇出上、中、下馬的任一排列,田忌也如此。由于齊威王存在絕對(duì)優(yōu)勢(shì),他平均看來(lái)仍然會(huì)贏田忌一千斤銅。
例子2如果曹操與諸葛亮一樣聰明:三國(guó)演義中的華容道博弈
在《三國(guó)演義》中,曹操在赤壁大戰(zhàn)中一敗涂地,率殘兵敗將向許都方向逃竄。諸葛亮命關(guān)羽率兵在途中阻截曹軍。當(dāng)時(shí),第一批攔截大軍是趙云率領(lǐng)的,第二批攔截大軍是張飛帶隊(duì)的,第三批才是關(guān)羽率部伏擊。由于曹軍兵多將廣,前二批伏擊軍不能逮住曹操,只是搶劫一些軍械馬匹之類。
待曹軍沖過(guò)趙云、張飛兩道關(guān)后,進(jìn)入關(guān)羽的伏擊地帶。但是,當(dāng)時(shí)關(guān)羽與曹操相遇的地方有兩條道,一條是華容道,除此外還有另一條道。諸葛亮令關(guān)羽伏兵于華容道,并且要求關(guān)羽在華容道上點(diǎn)燃樹(shù)枝冒出煙霧引曹操到來(lái)。當(dāng)時(shí)關(guān)羽不解,問(wèn)諸葛亮,“如果在伏兵之處點(diǎn)火,豈不令曹兵看見(jiàn)而改走另一條道逃脫?”諸荀亮叫關(guān)羽不要再問(wèn),只如此照辦即可。
當(dāng)曹操?zèng)_破趙云、張飛的阻截后,來(lái)到華容道前,看見(jiàn)華容道上靜悄悄的,但有煙火縈繞。曹操大笑道:“孔明以為我會(huì)上他的當(dāng),故意叫人在華容道上點(diǎn)火讓我走另一條道,而他卻伏兵于這條道上好逮住我呢!我偏不上他的當(dāng)!”于是,曹操令大軍徑直上華容道上而去,結(jié)果與關(guān)羽大軍撞個(gè)正著。
曹操為何進(jìn)了孔明的圈套呢?這里的道理是這樣的:孔明知道曹操是聰明人,而聰明人見(jiàn)華容道上有煙火會(huì)認(rèn)為華容道上有伏兵,于是會(huì)避開(kāi)華容道而走另一條路。如果孔明令關(guān)羽在另一條路等著,曹操就被逮住了。但是,曹操不僅聰明,而且還聰明過(guò)人,他也知道孔明的如此盤(pán)算來(lái)誘他上鉤,他偏不上當(dāng),知道點(diǎn)火的華容道上無(wú)人,孔明的隊(duì)伍在另一條道上呢!于是他選擇走華容道。
但是,依《三國(guó)演義》作者羅貫中的邏輯,孔明總是比曹操計(jì)高一籌,按博弈論的術(shù)語(yǔ)來(lái)說(shuō),就是孔明的理性程度要比曹操高上一階??酌饕仓啦懿僦揽酌鞯拇蛩悖谑橇铌P(guān)羽正好在點(diǎn)火的華容道上等著曹操。《三國(guó)演義》中的這個(gè)故事很可能是作者編造的,因?yàn)樵凇度龂?guó)志》中并無(wú)這一情節(jié)。這里,羅貫中假設(shè)了曹操在智力上比孔明差一些,才有華容道上被關(guān)羽抓住,要不是關(guān)羽舊情難忘,曹操就死無(wú)葬身之地了。
但是,如果我們不假定曹操比孔明要笨一些,而是相反假定曹操與孔明一樣聰明,則曹操又知道孔明知道曹操知道孔明的打算,曹操就會(huì)知道關(guān)羽在華容道上等著他呢?此時(shí)曹操就避開(kāi)華容道走另一條路。但是,這還沒(méi)有完,因?yàn)槿艨酌髦啦懿僦揽酌髦馈?。顯然,最終的結(jié)果是曹操與孔明玩混合戰(zhàn)略博弈,曹操隨機(jī)地以1/2的概率選擇走華容道和另一條路,孔明也以1/2的概率令關(guān)羽守華容道或另一條路。
于是,《三國(guó)演義》中的這一情節(jié)就應(yīng)作如下改寫(xiě):
諸葛亮拋出一枚硬幣,決定關(guān)羽是守華容道呢還是另一條道……,而曹操也擲出一枚硬幣,決定是走華容道呢還是走另一條路。平均看來(lái),曹操有1/2的概率逃脫,而關(guān)羽也只有1/2的概率抓住曹操。如果說(shuō)關(guān)羽在華容道上抓住了曹操,則純屬偶然、并非孔明比曹操計(jì)高一籌所致!剪刀-石頭-布爬樓梯游戲策略,石頭、剪子、布布獲勝,向上爬5個(gè)臺(tái)階剪刀獲勝,向上爬2個(gè)臺(tái)階石頭獲勝,向上爬1個(gè)臺(tái)階平局,再來(lái)一遍第一個(gè)爬上樓梯的是獲勝者商業(yè)與其他對(duì)抗中的混合策略商界、政界和戰(zhàn)爭(zhēng)非零和博弈商業(yè)與其他對(duì)抗中的混合策略例如:折扣券博弈問(wèn)題商業(yè)與其他對(duì)抗中的混合策略例1:折扣券博弈問(wèn)題目的?1、都不發(fā)行2、都發(fā)行3、一個(gè)發(fā)行,另一個(gè)不發(fā)行如何占得先機(jī)?商業(yè)與其他對(duì)抗中的混合策略如何占得先機(jī)?避免他人占得先機(jī),唯一的途徑就是保持出人意料的元素。--這一元素源于隨機(jī)化策略的應(yīng)用但是:獨(dú)立隨機(jī)選擇有“出錯(cuò)”的危險(xiǎn)。進(jìn)行合作!商業(yè)與其他對(duì)抗中的混合策略可口可樂(lè)和百事可樂(lè)52個(gè)星期,分別發(fā)放26周優(yōu)惠券沒(méi)有出現(xiàn)兩家同時(shí)的情況計(jì)算:如果兩家獨(dú)立以50%概率隨機(jī)選擇任何一周發(fā)放優(yōu)惠券,那么他們各自發(fā)放26周而不會(huì)出現(xiàn)同時(shí)發(fā)放的概率是1/10005(10億的10億次方)延伸:聯(lián)合營(yíng)銷麥當(dāng)勞與可口可樂(lè),肯德基與百事可樂(lè)從美國(guó)相攜走向全球,許多大的跨國(guó)企業(yè)均與知名連鎖酒店、供應(yīng)商保持全球的合作體系,令人慨嘆中國(guó)的許多企業(yè)盡管軀體龐大,但在經(jīng)營(yíng)的思想和理念上與它們相去甚遠(yuǎn)。
辜鴻銘曾用西文出版過(guò)一本書(shū),書(shū)名為《中國(guó)人的精神》,其中將中國(guó)人的民族性格歸結(jié)為三大特征:“deep,bright,simple”,譯成中文是“深沉、聰明、淳樸”。延伸:聯(lián)合營(yíng)銷深沉就是含而不露,靜水流深,但這種性格與聯(lián)盟的陽(yáng)光與規(guī)則的透明背道而馳。聰明更多是為人為事的創(chuàng)造力與洞察,但似乎缺少更大氣的哲學(xué)和價(jià)值觀思考,這樣也不利于建立通用的制度規(guī)則,大家思考的更多是彼此之間的利益而非聯(lián)盟共事致力追求的長(zhǎng)遠(yuǎn)目標(biāo)—這也是戰(zhàn)國(guó)時(shí)期秦國(guó)以連橫成功打破六國(guó)合縱政策的原因所在。例2:飛機(jī)折扣票博弈航空公司告訴你折扣,不告訴你剩余的空位你隨機(jī)選擇時(shí)點(diǎn)進(jìn)行訂票V,-D-P,00,S0,0睡不睡偷不偷守衛(wèi)小偷混合戰(zhàn)略:守衛(wèi)以n概率選擇睡覺(jué),以1-m的概率選擇不睡小偷以m概率選擇偷,以1-n概率選擇不偷例3監(jiān)督博弈加重對(duì)守衛(wèi)的處罰:短期中的效果是使守衛(wèi)真正盡職在長(zhǎng)期中并不能使守衛(wèi)更盡職,但會(huì)降低盜竊發(fā)生的概率0-D-D’守衛(wèi)得益((睡)S小偷偷的概率1激勵(lì)悖論Sm加重對(duì)小偷的處罰:短期內(nèi)能抑制盜竊發(fā)生率長(zhǎng)期并不能降低盜竊發(fā)生率,但會(huì)使得守衛(wèi)更多的偷懶0-P-P’小偷得益(偷)V守衛(wèi)睡的概率1n激勵(lì)悖論
例5為什么一般人總是小錯(cuò)不斷,大錯(cuò)不犯;偷稅漏稅的一般是中小企業(yè),大企業(yè)會(huì)老老實(shí)實(shí)地交稅?
稅務(wù)部門(mén)不會(huì)對(duì)所有企業(yè)的交稅情況每一次都去檢查,因?yàn)檫@樣做的成本太高,得不償失。所以,稅務(wù)部門(mén)總是隨機(jī)地對(duì)企業(yè)的交稅情況進(jìn)行檢查。
企業(yè)也是隨機(jī)地在交稅與偷漏稅之間進(jìn)行選擇。稅收部門(mén)與企業(yè)間進(jìn)行的是混合戰(zhàn)略博弈。因?yàn)槿绻髽I(yè)總是交稅,稅務(wù)部門(mén)就最好不檢查;但給定不檢查,企業(yè)就會(huì)偷漏稅。所以,兩者只有在隨機(jī)地檢查與不檢查,企業(yè)隨機(jī)地在偷漏稅與交稅之間選擇,才會(huì)達(dá)成均衡。
對(duì)于大企業(yè),因一旦偷稅就數(shù)目巨大,所以,稅務(wù)部門(mén)在隨機(jī)檢查時(shí)放在大企業(yè)上的可能性就大一些;而給定稅務(wù)部門(mén)檢查大企業(yè)的可能性較大,大企業(yè)偷漏稅的行為就較少,否則就容易被逮個(gè)正著。所以,偷漏稅較多的就是一些中小企業(yè),大企業(yè)納稅的積極性較高。同樣,大人物或有錢(qián)人納稅的積極性應(yīng)較高,至于我國(guó)在過(guò)去一段時(shí)期有錢(qián)人反而不交稅的現(xiàn)象主要源于制度不健全或已有的制度得不到貫徹所致。同樣的道理,在犯罪或?qū)﹀e(cuò)誤的監(jiān)督懲罰博弈中,也是混合博弈,人們可能總是大錯(cuò)不犯小錯(cuò)不斷。專題:多重均衡與制度和文化多重納什均衡:交通博弈路上有兩輛車迎面而行,此時(shí),兩個(gè)司機(jī)各有兩個(gè)選擇:走路的左側(cè)和走路的右側(cè)左L左L右R右R1,10,01,10,0乙方甲方這個(gè)博弈被稱為“協(xié)調(diào)博弈”:有兩個(gè)純戰(zhàn)略納什均衡,一個(gè)混合戰(zhàn)略均衡。哪一個(gè)將出現(xiàn)呢?進(jìn)門(mén)博弈先進(jìn)后進(jìn)先進(jìn)后進(jìn)-1,-1-1,-12,11,2分蛋糕博弈x1x211任何滿足x1+x2=1的點(diǎn)都是納什均衡。
多個(gè)納什均衡無(wú)法形成一致的預(yù)期如何協(xié)調(diào)??jī)H僅“理性”是不夠的;聚點(diǎn)均衡:Schelling(1960);帕累托最優(yōu)均衡:可以通過(guò)協(xié)商選擇一個(gè)納什均衡;cheaptalking;文化與制度;行業(yè)組織;聚點(diǎn)均衡:Schelling(1960)認(rèn)為,在現(xiàn)實(shí)生活中,參與人可能使用某些被博弈模型抽象掉的信息來(lái)達(dá)到一個(gè)“聚點(diǎn)”(focal
point)均衡。這些信息可能與社會(huì)文化習(xí)慣、參與人過(guò)去博弈的歷史等有關(guān)。1.聚點(diǎn)均衡方法如果在中國(guó),出現(xiàn)(R,R),如果在英國(guó),出現(xiàn)(L,L)左L左L右R右R1,10,01,10,0乙方甲方聚點(diǎn)均衡2.帕累托最優(yōu)均衡方法3.5“5.5“3.5“5.5“8,83,22,36,6(3.5“,3.5”)帕累托優(yōu)于(5.5“,5.5”)Cheaptalk
可以幫助協(xié)調(diào)到一個(gè)帕累托最優(yōu)均衡產(chǎn)品標(biāo)準(zhǔn)博弈為什么要相信?C1C2R1R29,90,88,07,7不論C選擇什么,他都有積極性告訴R他將選擇C1;所以沒(méi)有理由認(rèn)為R應(yīng)該相信C的話。RC3.風(fēng)險(xiǎn)與均衡方法實(shí)驗(yàn):請(qǐng)同學(xué)選擇?上下左右8,10-1000,97,66,5BA風(fēng)險(xiǎn)與均衡由于納什均衡要求理性共識(shí)和一致預(yù)期,當(dāng)人們可能犯小小的錯(cuò)誤時(shí),納什均衡不一定被選擇。如下面這個(gè)博弈中,多
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 招投標(biāo)課程設(shè)計(jì)五篇
- 中學(xué)體育課程設(shè)計(jì)大全
- 2024年柴油批發(fā)供應(yīng)合同
- 杏脯工廠設(shè)計(jì)課程設(shè)計(jì)
- 機(jī)器人項(xiàng)目管理課程設(shè)計(jì)
- 大學(xué)教室金融課程設(shè)計(jì)
- 2024年精密鑄造工藝服務(wù)協(xié)議版B版
- 2024年新款電腦與打印機(jī)銷售合作合同一
- 2024年租賃合同:辦公室空間3篇
- 智能交互技術(shù)課程設(shè)計(jì)
- 統(tǒng)計(jì)年報(bào)和定報(bào)培訓(xùn)
- 小說(shuō)改編權(quán)改編作品轉(zhuǎn)讓合同
- 隧道坍塌應(yīng)急演練
- 物流行業(yè)物流供應(yīng)鏈金融服務(wù)方案
- 浙江省杭州市2023-2024學(xué)年高二上學(xué)期期末學(xué)業(yè)水平測(cè)試政治試題 含解析
- 體育賽事消防應(yīng)急預(yù)案制定
- 腎膿腫護(hù)理查房
- 專題4.3 平面鏡成像【五大題型】【人教版2024】(原卷版)-2024-2025學(xué)年八年級(jí)上冊(cè)物理舉一反三系列(人教版2024)
- 《義務(wù)教育數(shù)學(xué)課程標(biāo)準(zhǔn)(2022年版)》數(shù)學(xué)新課標(biāo)解讀
- 咪咕在線測(cè)評(píng)題
- 2024年全國(guó)《勞動(dòng)教育》基礎(chǔ)知識(shí)考試題庫(kù)與答案
評(píng)論
0/150
提交評(píng)論