經(jīng)濟與博弈思維

上傳人：2*** IP屬地：湖北上傳時間：2023-02-01 格式：PPT 頁數(shù)：396 大?。?2.30MB 積分：28 舉報 版權(quán)申訴

已閱讀5頁，還剩391頁未讀，繼續(xù)免費閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進行舉報或認領(lǐng)

文檔簡介

經(jīng)濟與博弈思維

山東科技大學(xué)經(jīng)濟管理學(xué)院授課人：丁黎黎（副教授、博士后）研究方向：物流與供應(yīng)鏈管理；企業(yè)家理論；決策與風(fēng)險管理；金融物流Email:dinglili0220@163.comTEL:

聯(lián)系方式多算勝，少算不勝，

何況于無算乎？——摘自《孫子兵法》為什么開設(shè)該課程

引起你的思考？？？“你甚至可以使一只鸚鵡變成一個訓(xùn)練有素的經(jīng)濟學(xué)家，因為它必須學(xué)習(xí)的只有兩個詞，那就是供給和需求”－－－薩繆爾森。為什么開設(shè)該課程

這么夸張？我也可以成為經(jīng)濟學(xué)家？“現(xiàn)在這只鸚鵡需要再學(xué)兩個詞，那就是納什·均衡”－－－坎多利。為什么開設(shè)該課程

現(xiàn)在學(xué)什么呢？為什么開設(shè)該課程

“如果你想成為一個有文化的人，你必須對博弈論有個大致了解”。

——薩繆爾森。課堂調(diào)查：囚徒困境？智豬博弈？斗雞博弈？鷹鴿博弈？課程的講授風(fēng)格

文理學(xué)生兼顧不失博弈論的理論嚴密特點一定程度上反映博弈論的人文學(xué)科特點力求不同專業(yè)的學(xué)生都有所收益體現(xiàn)博弈論的博大博弈論多學(xué)科、多領(lǐng)域交叉性明顯力求理論與實際的融合推薦書目《妙趣橫生博弈論》迪克西特、奈爾伯夫機械工業(yè)出版社《博弈論基礎(chǔ)》吉本斯中國社會科學(xué)出版社《博弈論》弗登博格、梯若爾

中國人民大學(xué)出版社《經(jīng)濟博弈論》謝識予編著復(fù)旦大學(xué)出版社《博弈論與信息經(jīng)濟學(xué)》張維迎著上海人民出版社《博弈學(xué)習(xí)理論》陳學(xué)彬編著上海財大出版社《博弈論》施錫銓上海財大出版社為什么教授如此苛刻？許多教授強硬地規(guī)定，不進行補考，不允許遲交作業(yè)或論文。教授們?yōu)楹稳绱丝量蹋咳绻试S某種遲交，而且教授又不能辨別真?zhèn)?，那么學(xué)生就總是會遲交。期限本身就毫無意義了。避免這一“滑梯”通常只有一種辦法，就是“沒有例外”的策略。為什么教授如此苛刻？問題是，一個好心腸的教授如何維持如此鐵石心腸的承諾？他必須找到某種使拒絕變得強硬和可信的方法。拿行政程序或者學(xué)校政策來做擋箭牌在課程開始時做出明確和嚴格的宣布通過幾次嚴打來獲得“冷面殺手”的聲譽什么是博弈論？博弈論：就是關(guān)于包含相互依存情況中理性行為的研究。局中人理性地采取或選擇自己的策略行為，在相互制約相互影響的依存關(guān)系中，盡可能的提高自己的利益所得，這樣，博弈論就是關(guān)于包含相互依存情況中理性行為的研究。博弈的關(guān)鍵相互依存：通常是指博弈中的任何一個局中人受到其他局中人的行為的影響，反過來，他的行為也影響到其他局中人。

相互依存的另一個方面是局中人可以有某些共同的興趣或利益所在。

理性行為：博弈論中的所謂理性，一般不是指道德標準。行動者具有推理能力，在具體策略選擇時的目的是使自己的利益最大化。萬元陷阱

現(xiàn)將10000元錢拍賣給大家，各位互相競價，以100元為加價單位，直到?jīng)]有人再加價為止。出價最高者將以其所出價格獲得該10000元錢，同時，出價第二高者將其所出價格的數(shù)量支付給我。請問：您的競拍策略？實驗：實驗：選數(shù)游戲我從1－100間選出某個數(shù)，而你的任務(wù)是猜中這個數(shù)。若你猜中，我將付給你100美元。規(guī)則：你可猜五次，且每次我都會告訴你猜得太高還是太低。越早猜中獎勵越豐厚，否則在第二輪中你只能得80美元，依次60、40、0。實驗：選數(shù)游戲微軟總裁史蒂夫.鮑爾默曾以此題作為面試題：正確答案50，25，37，42…..，他感興趣的是要看看候選人是否用最符合邏輯和最有效的方法去分析所探求的問題。實驗：一個簡單的數(shù)字游戲每位同學(xué)寫5個大于0的自然數(shù)，如果某位同學(xué)所寫的5個數(shù)字中有一個是所有同學(xué)所寫的數(shù)字中最小的（在沒有重合的情況下），那么他將獲得本課程加10分的獎勵（在總得分小于100分的情況下）博弈思想自古有之2000年前中國著名的“田忌賽馬”1500年前巴比倫猶太法典的“婚姻合同問題”1838年的古諾(Cournot)模型，被看成是早期博弈研究的起點1883年伯特蘭德(Bertrand)提出的通過價格進行博弈的寡頭競爭模型與古諾模型有異曲同工之妙。艾奇沃斯(Edgeworth)提出的“契約曲線”則是后來合作博弈論重要概念“核”的特例。博弈論相關(guān)背景知識博弈論的誕生vonNeumann（諾依曼）和Morgenstern合著的《博弈論和經(jīng)濟行為》(TheTheoryofGamesandEconomicBehavior)的誕生（1944）該書首創(chuàng)的博弈一些術(shù)語，表示形式，至今仍在使用提出了v-N-M效用，用以表示博弈的支付使博弈論從數(shù)學(xué)家的圈子中走出，建立了數(shù)學(xué)與經(jīng)濟學(xué)間的橋梁博弈論相關(guān)背景知識JohnvonNeumann生平

8歲就掌握了微積分，19歲發(fā)表了第一篇學(xué)術(shù)論文30歲成為最年輕的普林斯頓數(shù)學(xué)學(xué)院6名教授之一(Einsteinwasoneoftheothers)（1933年）20世紀40年代開始轉(zhuǎn)向應(yīng)用數(shù)學(xué)領(lǐng)域1943年為Manhattan項目的顧問(atomicbomb)1944年第一臺計算機的誕生，他作了主要貢獻1944年與摩根斯坦合作的博弈論第一部著作1957年英年早逝（純粹數(shù)學(xué)、應(yīng)用數(shù)學(xué)、物理學(xué),polymath）1903-1957博弈論相關(guān)背景知識JohnNashJr.與Nash均衡1950年納什在普林斯頓的博士論文(27pages)，首次提出了納什均衡、并證明了納什定理“這是對博弈論高度的原創(chuàng)性和重要的貢獻”——Tucker30歲后，曾陷于精神疾病數(shù)十年1994與Harsanyi,Selten共獲諾貝爾獎納什與愛因斯坦、馮諾依曼的軼事1928-博弈論相關(guān)背景知識20世紀50年代是博弈論的第一個研究高潮Nash均衡理論的建立理論與實驗并行的博弈研究方式1950年蘭德公司的囚徒問題的實驗合作博弈論的第一次鼎盛時期“40年代末50年代初是博弈論歷史上令人振奮時期，原理已經(jīng)破繭而出，正在試飛它們的雙翅，活躍著一批巨人?！保ˋumann,1985）博弈論相關(guān)背景知識20世紀50年代中后期到70年代的興盛期博弈研究成果不斷豐富1965年澤爾滕與海薩尼的博弈的精煉理論進化博弈(evolutionarygame,1972)的出現(xiàn)“共同知識(commonknowledge)”假設(shè)的建立博弈論相關(guān)背景知識20世紀80~90年代的成熟期Kohlberg的前向歸納法(forwardinduction,1981)Kreps和Wilson的sequentialequilibrium(1982)Smith的“EvolutionaryandTheTheoryofGames”(1982)博弈學(xué)習(xí)理論(learningtheory)的完善博弈論相關(guān)背景知識20世紀80~90年代的成熟期博弈論幾乎涉及經(jīng)濟學(xué)所有領(lǐng)域，改變了微觀經(jīng)濟學(xué)的理論基礎(chǔ)博弈論在心理學(xué)、行為科學(xué)、認知科學(xué)等人文科學(xué)都取得了成功應(yīng)用博弈論在生物學(xué)、智能技術(shù)、計算機科學(xué)等也都有著應(yīng)用多名博弈論專家獲得諾貝爾經(jīng)濟學(xué)獎博弈論相關(guān)背景知識1994年諾貝爾經(jīng)濟學(xué)獎授予：?JohnNash?ReinhardSelten?JohnHarsanyi主要貢獻：這3位經(jīng)濟學(xué)家/數(shù)學(xué)家闡述了博弈論這門學(xué)科，對博弈論的發(fā)展做出了重要貢獻。博弈論相關(guān)背景知識1996年諾貝爾經(jīng)濟學(xué)獎授予：?JamesA.Mirrlees（莫里斯，劍橋）?WilliamVickrey美國科學(xué)家JamesA.Mirrlees在信息經(jīng)濟學(xué)理論領(lǐng)域做出了重大貢獻，尤其是不對稱信息條件下的經(jīng)濟激勵理論；WilliamVickrey因在信息經(jīng)濟學(xué)、激勵理論、博弈論等方面做出的重大貢獻，而共同獲得諾貝爾經(jīng)濟學(xué)獎。博弈論相關(guān)背景知識1996年維克里，莫里斯獲諾貝爾經(jīng)濟學(xué)獎。2001年諾貝爾經(jīng)濟學(xué)獎授予：

?GeorgeA.Kerlof（阿克爾洛夫，檸檬）?A.MichaelSpence（斯彭斯）?JosephE.Stiglitz（斯蒂格利茨）在對信息不對稱市場進行分析中，做出重大貢獻博弈論相關(guān)背景知識2001年阿克爾洛夫、斯彭斯和斯蒂格利茨獲諾貝爾經(jīng)濟學(xué)獎。2005年諾貝爾經(jīng)濟學(xué)獎授予：?RobertJ.Aumann（奧曼

）?ThomasC.Schelling（謝林

）表彰他們在動態(tài)宏觀經(jīng)濟學(xué)領(lǐng)域中所作的貢獻，增強了我們對通過博弈論來進行沖突與合作分析的認識。

博弈論相關(guān)背景知識2005年奧曼和謝林諾貝爾經(jīng)濟學(xué)獎

2007年諾貝爾經(jīng)濟學(xué)獎

為機制設(shè)計理論奠定基礎(chǔ)明尼蘇達大學(xué)的赫維茨、芝加哥大學(xué)的馬斯金，以及美國普林斯頓高等研究中心的邁爾森

2012年諾貝爾經(jīng)濟學(xué)獎

穩(wěn)定配置理論與市場設(shè)計為什么博弈論在經(jīng)濟學(xué)領(lǐng)域會產(chǎn)生如此大的影響呢？

這是因為博弈論從一個獨特的視角幫助我們更加深刻地理解和把握經(jīng)濟現(xiàn)象，并指導(dǎo)我們制定更加有效的經(jīng)濟政策。當局者迷、旁觀者清。學(xué)習(xí)博弈論的收益：當局者清、旁觀者更清博弈的用處一點強調(diào)我們所討論的博弈問題都是建立在“個體行為理性”基礎(chǔ)上的“非合作博弈”。對一切問題的判斷取舍，除非特別聲明，都唯一地以量化的利益，即我們所稱的得益為標準和依據(jù)，對一些不是直接以數(shù)量表示的利益或損害，如個人的主觀感受、心理影響、公共福利水平等，則必須先利用基數(shù)效用等經(jīng)濟學(xué)中的常用概念和量化方法加以數(shù)量化以后再進行比較、分析和判斷博弈的基礎(chǔ)

幾個基本假設(shè)：博弈的結(jié)果可以量化博弈方在選擇策略時是理性的

含義：許多博弈論都假定參與者是完美的計算者和最優(yōu)策略的完美追隨者。這就是理性行為的假設(shè)。

1.完全了解自己的利益所在。

2.準確無誤的計算出最符合自身利益的行動。博弈的基礎(chǔ)①參與人：指的是博弈中選擇行動以最大化自己效用的決策主體（可能是人，也可能是團體，如國家、企業(yè)）在這里，每個參與人必須有可供選擇的行動和一個很好定義的偏好函數(shù)在博弈論中，“自然”（nature）作為“虛擬參與人”（pseudo-player）來處理。這里的自然指決定外生隨機變量的概率分布的機制博弈的基本要素：博弈的基礎(chǔ)②策略（strategy）：參與者可利用的選擇，即全部策略或行為集合:例如，乒乓球團體比賽的運動員出場順序就是一個策略；這里所說的策略，是局中人在競爭中，為了對抗其他局中人所采取的一個完整的辦法，并不是某一步采取的辦法。例如，下象棋的“當頭炮”，只能算是策略的一個組成部分，并非完整的策略。局中人所有的策略的集合，就構(gòu)成了該局中人的策略集合，可以是有限的，也可以是無限的。博弈的基礎(chǔ)行動與策略：“人不犯我，我不犯人；人若犯我，我必犯人”是一種策略，這里的“犯”與“不犯”是兩種行動，策略略規(guī)定了什么時候選擇“犯”，什么時候選擇“不犯”在靜態(tài)博弈中，策略和行動是相同的例如：早晨雨傘博弈的基礎(chǔ)③信息：指的是參與人在博弈中的知識，特別是有關(guān)其他參與人（對手）的特征和行動的知識完美信息（perfectinformation）：指一個參與人對其他參與人（包括虛擬參與人與人“自然”）的行動選擇有準確了解的情況，即每一個信息集只包含一個值（對進程的不了解）完全信息（completeinformation）：指自然不首先行動或自然的初始行動被所有參與人準確觀察到的情況，即沒有事前的不確定性（對得益的不了解）④得益：在博弈論中，或者是指一個特定的策略組合下參與人得到的確定效用水平，或者是指參與人得到的期望效用水平博弈的基礎(chǔ)⑤結(jié)果：博弈分析者所感興趣的要素的集合，如均衡戰(zhàn)略組合、均衡行動組合、均衡得益組合⑥均衡：是所有參與人的最優(yōu)策略的組合博弈的基礎(chǔ)⑦次序：參與人的策略選擇順序博弈分類完全信息博弈/不完全信息博弈完美信息博弈/不完美信息博弈單人博弈/多人博弈有限策略博弈/無限策略博弈動態(tài)博弈/靜態(tài)博弈課堂作業(yè)：二人博弈例子11，10，55，02，2新技術(shù)老技術(shù)新技術(shù)老技術(shù)廠商2廠商①參與人②策略③信息④結(jié)果⑤均衡課堂作業(yè)：三人博弈例子11，1，100，5，55，0，52，2，2新技術(shù)老技術(shù)新技術(shù)老技術(shù)廠商2廠商

廠商3—新技術(shù)（A）1

廠商3—老技術(shù)2，2，21，10，110，1，15，5，0新技術(shù)新技術(shù)老技術(shù)老技術(shù)廠商2廠商（B）①參與人②策略③信息④結(jié)果⑤均衡博弈論的求解思路？

想想十年后的自己

十八歲之前，我是個不知道自己想要什么的人，那時我每天就在浙江藝術(shù)學(xué)校里跟著同學(xué)唱唱歌，跳跳舞。偶爾有導(dǎo)演來找我拍戲，我就會很興奮地去拍，無論多小的角色。

如果沒有老師跟我的那次談話，那么也許直到今天，仍然沒有人知道周迅是誰。

那是1993年5月的一天，教我專業(yè)課的趙老師突然找我談話：“周迅，你能告訴我，你對于未來的打算嗎?”

我愣住了。我不明白老師怎么突然問我如此嚴肅的問題，更不知道該怎么回答。老師問我：“現(xiàn)在的生活你滿意嗎?”我搖搖頭。老師笑了：“不滿意的話證明你還有救。你現(xiàn)在就想想，十年以后你會是什么樣?”

老師的話音很輕，但是落在我心里卻變得很沉重。我腦海里頓時開始風(fēng)起云涌。沉默許久，我看著老師的眼睛，忽然就很堅定地說：“我希望十年后的自己成為最好的女演員，同時可以發(fā)行一張屬于自己的音樂專輯。”

老師問我：“你確定了嗎?”

我慢慢地咬緊著嘴唇回答：“Yes”，而且拉了很長的音。

老師接著說：“好，既然你確定了，我們就把這個目標倒著算回來。十年以后，你28歲，那時你是一個紅透半邊天的大明星，同時出了一張專輯?！?/p>

“那么你27歲的時候，除了接拍各種名導(dǎo)演的戲以外，一定還要有一個完整的音樂作品，可以拿給很多很多的唱片公司聽，對不對?”

“25歲的時候，在演藝事業(yè)上你就要不斷進行學(xué)習(xí)和思考。另外在音樂方面一定要有很棒的作品開始錄音了。”“23歲就必須接受各種培訓(xùn)和訓(xùn)練，包括音樂上和肢體上的。”

“20歲的時候就要開始作曲，作詞。在演戲方面就要接拍大一點的角色了?！?/p>

老師的話說得很輕松，但是我卻感到一陣恐懼。這樣推下來，我應(yīng)該馬上著手為自己的理想做準備了，可是我現(xiàn)在卻什么都不會，什么都沒想過，仍然為小丫鬟小舞女之類的角色沾沾自喜。我覺得有一種強大的壓力忽然朝自己襲來。老師平靜地笑著說：“周迅，你是一棵好苗子，但是你對人生缺少規(guī)劃，散漫而且混亂。我希望你能在空閑的時候，想想十年以后的自己，到底要過什么樣的生活，到底要實現(xiàn)什么樣的目標。如果你確定了目標，那么希望你從現(xiàn)在就開始做?！?/p>

一年以后，我從藝校畢業(yè)了，老師的話從那天開始一直刻在了我的心底：想想十年后的自己。是的，當我意識到這是一個問題的時候，我發(fā)現(xiàn)我整個人都覺醒了。

從學(xué)校畢業(yè)后，我忙于接拍各種各樣的影視劇。我始終記得，十年后我要做最成功的明星，所以對角色我開始很認真地篩選。后來我拍了《那時花開》，拍了《大明宮詞》，我漸漸被大家接受，也慢慢地嘗到了成功的快樂。博弈論的求解思路向前展望，倒后推理p31

從得益結(jié)果來判斷策略（行動）的選擇靜態(tài)博弈：劃線法動態(tài)博弈：博弈樹例子：解放初，美國總是尋找各種機會來侵犯我國。對此，毛主席提出了“人不犯我、我不犯人，人若犯我、我必犯人”的戰(zhàn)略方針。該動態(tài)博弈的戰(zhàn)略式表述：局中人：美國、中國行動空間：美國“犯我”或“不犯我”，中國“犯人”或“不犯人”行動順序：美國先行動，我國依美國的行動而后動動態(tài)博弈：博弈樹支付：這樣假設(shè)支付情況：若美國“犯我”，中國“不犯人”，則支付向量為(2,-4)；若美國“不犯我”，中國“犯人”，則支付向量為(3,-5)；若美國“犯我”，中國“犯人”，則支付向量為(-2,-2)；若美國“不犯我”，中國“不犯人”，則支付向量為(1,1)。動態(tài)博弈：博弈樹犯人犯我不犯我犯人不犯人不犯人美國我國我國(1,1)(3,-5)(2,-4)(-2,-2)

動態(tài)博弈：博弈樹練習(xí)1121（2，0）（5，0）（4，2）（1，1）UDRLU’D’甲不借借乙分不分(2,2)(1,0)(0,4)練習(xí)2怎么改變策略組合？甲不借借乙分不分(2,2)(1,0)(0,4)甲(1,0)打不打練習(xí)3弈基本分類行動順序信息練習(xí)--逆推可解的博弈實驗：幸存者兩個參與人共有9支筆兩個參與人通過拋硬幣決定先行者、后行者輪到每個人時，他可以決策取走1支，還是2支，或3支，三個策略任選其一拿走最后一支筆的人將獲勝（無論這支筆是最后1支，還是2支或3支中的一支）實驗：談判兩個參與人通過拋硬幣決定提議人、回應(yīng)人兩個參與人，一個是提議人，一個是回應(yīng)人。首先由提議人提出分配100元的方案，接著由回應(yīng)人來決定是否同意。如果回應(yīng)人同意，就按該方案分配，博弈結(jié)束；如果不同意，那么兩個人一無所獲，博弈結(jié)束。

討論問題你怎么去火車站？P35你給出2個理由可以讓查理相信弗里多的承諾。P35什么是零和博弈，請給出2個例子P37求解這兩個樹。P38綁住自己的雙手可能會有綁住，請給出2個例子P45人們在決策的時候，除了要考慮理性，還要考慮什么，請舉例第二章納什均衡實驗：選出三男三女規(guī)則：在線路上行走實驗：結(jié)果均衡1：斗雞博弈ChickenGame懦夫

均衡是什么？實驗：結(jié)果均衡2：鷹鴿博弈Hawk-Dove對于為生存競爭的每只動物而言，如果“贏”相當于“+5”，“輸”相當于“-5”，“重傷”相當于“-10”，“不受傷”即“+5”，靜態(tài)博弈最簡單的博弈：所有參與人同時選擇行動，并且只選擇一次；“同時”是一個信息概念，而不一定與日歷上的時間一致；舉例：拍賣囚徒困境（prisoners’dilemma)囚徒困境B

A坦白不坦白坦白不坦白－8，－80，－10－10，0－1，－1無論對方如何選擇，每個人的最優(yōu)選擇：坦白。所以，我們可以預(yù)測，結(jié)果將是（坦白，坦白）占優(yōu)均衡方法

(dominant-strategyequilibrium)一般來說，由于每個參與人的效用依賴于所有人的選擇，因此每個人的最優(yōu)選擇（戰(zhàn)略）也依賴于所有其他人的選擇（戰(zhàn)略）。但在上述例子中，一個人的最優(yōu)選擇并不依賴于他人的選擇。這樣的最優(yōu)戰(zhàn)略，被稱為“占優(yōu)戰(zhàn)略”(dominantstrategy)。由所有參與人的占優(yōu)戰(zhàn)略構(gòu)成的戰(zhàn)略組合被稱為“占優(yōu)均衡”。占優(yōu)戰(zhàn)略均衡的出現(xiàn)只要求所有人都是理性的，但不要求每個參與人知道其他參與人是否理性。囚徒困境博弈有占優(yōu)均衡，所以其結(jié)果很容易預(yù)測。“智豬博弈”(boxedpigs)有些博弈沒有占優(yōu)均衡，但通過剔除“壞”戰(zhàn)略，我們可以預(yù)測博弈的結(jié)果。如“智豬博弈”按等待按等待3，12，47，－10，0這個博弈中，大豬的最優(yōu)選擇依賴于小豬的選擇，但小豬的最優(yōu)選擇與大豬的選擇無關(guān)。如果大豬知道小豬的理性的，大豬將選擇“按”。均衡是“大豬按，小豬等待”?！傲印睉?zhàn)略：無論對方選擇什么，如果自己選擇A得到的總是收益小于選擇B得到的收益，A就是相對于B的劣戰(zhàn)略。小豬大豬重復(fù)剔除占優(yōu)均衡方法“重復(fù)剔除嚴格劣戰(zhàn)略”(iteratedeliminationofstrictlydominatedstrategy)的思路：首先找出博弈參與人的劣戰(zhàn)略(dominatedstrategy)（假定存在的話），把這個劣戰(zhàn)略剔除后，剩下的是一個不包含已剔除劣戰(zhàn)略的新的博弈；然后在剔除這個新的博弈中的劣戰(zhàn)略；繼續(xù)這個過程，直到?jīng)]有劣戰(zhàn)略存在。如果剩下的戰(zhàn)略組合是唯一的，這個唯一的戰(zhàn)略組合就是“重復(fù)剔除占優(yōu)均衡”(iterateddominanceequilibrium)。如果這樣的解存在，我們說該博弈是“重復(fù)剔除占優(yōu)可解的”(iterateddominancesolvable).理性共識

（commonknowledgeofrationality)(1)Zero-orderCKR:每個人都是理性的，但不知道其他人是否是理性的；(2)first-orderCKR:每個人是理性的，并且知道其他每個人也都是理性的，但并不知道其他人是否知道自己是理性的；(3)second-orderCKR:(1)+(2)+每個人知道（2）nth-orderCKR:R(b)C(b)R(b)……C(b)Risrational,你知道其他的人的想法？報考北大研究生？重復(fù)剔除與理性共識重復(fù)剔除不僅要求每個人是理性的，而且要求每個人知道其他人是理性的，每個人知道每個人知道每個人是理性的，如此等等，即理性是“共同知識”（共識）C1C2C3R1R2R310,41,598,49,90,398,81,980,100100,98這個博弈只要求一階理性共識就可以預(yù)測均衡結(jié)果。CR好事變壞事？在單人決策中，個人給定選擇在所有情況下的收益都增加，一個人的狀況不會變得更壞，但博弈中則不同。舉例：上課睡覺和上課不睡覺不管你的最優(yōu)選擇是什么，都比過去獲得的收益大了！

給個枕頭表揚好事變壞事？在單人決策中，個人給定選擇在所有情況下的收益都增加，一個人的狀況不會變得更壞，但博弈中則不同。上下左右上下左右-1,32,10,23,41,34,10,23,4不能用重復(fù)剔除解的博弈許多博弈沒有占優(yōu)均衡，也沒有重復(fù)剔除的占優(yōu)均衡?？紤]如下博弈：C1C2C3R1R2R30，44，05，34，00，45，33，53，56，6納什均衡納什均衡：所有參與人的最優(yōu)戰(zhàn)略的組合：給定該戰(zhàn)略中別人的選擇，沒有人有積極性改變自己的選擇。納什均衡是局中人戰(zhàn)略選擇上構(gòu)成的一種“僵局”，給定其他局中人的選擇不變，任何一個局中人的選擇是最好的，他也不會改變其戰(zhàn)略選擇。例如：乒乓球，生氣敵不動，我不動納什均衡的作用：一致預(yù)期一致預(yù)期：基于信念的選擇是合理的；支持選擇的信念是正確的；預(yù)期的自我實現(xiàn)：如何所有人認為這個結(jié)果會出現(xiàn)，這個結(jié)果就會出現(xiàn)。預(yù)期是自我實現(xiàn)的，預(yù)期不會錯誤。如果你認為我預(yù)期你將選擇X，你就真的會選擇X。當你知道這樣的納什均衡結(jié)果將來會存在，你會作怎樣的當期決策？實驗：信念游戲：10000拍賣，但規(guī)則改成叫價拍賣，最高者獲得10000.次高者支付對等價格。哲學(xué)思考遺產(chǎn)爭奪協(xié)議：哲學(xué)思考如果參與人事前達成一個協(xié)議，在不存在外部強制的情況下，每個人都有積極性遵守這個協(xié)議，這個協(xié)議就是納什均衡。(賣東西實驗）兩方(或多方)討價還價(博弈)浪費大量口水,時間,最終達成某協(xié)議C(當然是個納什均衡了,沒均衡一定會再討價還價)那么還不如我們一開始就拿出協(xié)議C來,這樣就節(jié)約了很多很多時間和口水！納什均衡：舉例納什均衡：舉例廣告博弈納什均衡：（做廣告，做廣告）企業(yè)1企業(yè)2納什均衡：舉例

在城市街道上，我們常見到一些地段上的商店十分擁擠，構(gòu)成一個繁榮的商業(yè)中心區(qū)，但另一些地段卻十分冷僻，沒什么商店。對于這種現(xiàn)象，我們可以運用納什均衡的概念來加以解釋。圖1商業(yè)位置博弈

納什均衡：舉例1/4麥當勞3/4肯德基1/20A1B出于這種理性，肯德基分店經(jīng)理肯定會想到：如果我將店鋪從3/4點處向左移一點，那麼1/4點之間的中點不在是1/2點處，而是位于1/2點的靠左邊一點…….。甲乙1/2

圖1商業(yè)位置博弈

··納什均衡：舉例所以給定甲在1/2處設(shè)店，乙在緊靠甲的左邊或右邊設(shè)店是最優(yōu)的。反過來，給定乙在接近1/2處設(shè)店，甲的最優(yōu)選擇也是在1/2附近設(shè)店。這樣，甲和乙擠在1/2處設(shè)店就是納什均衡，這就是商業(yè)中心區(qū)的形成原理。例如：電視臺節(jié)目；禁娛、禁廣告插播、禁廣告植入？納什均衡：所有權(quán)配置與等級結(jié)構(gòu)考慮團隊生產(chǎn)：納什均衡是什么？讓其中的一個人變成所有者？工作偷懶工作偷懶6，62，20，88，0博弈結(jié)果：納什均衡理性人假設(shè)下：博弈結(jié)果完全取決于博弈相關(guān)的各種抽象的數(shù)學(xué)事實，即參與人數(shù)、每個參與人可選擇策略的個數(shù)，以及所有參與人策略選擇的相聯(lián)系的每個參與人的盈利。92經(jīng)濟如局人生如棋博弈之道生活之常運用之妙存乎一心送給有心人實驗：納什均衡的觀察與驗證考慮有N個人參與的游戲：每個人可任意放最多100元到一部可以生錢的機器（可以選擇不放），機器把所有人放進去的錢的總和增加到原來的三倍，然后再平均分給這N個人。請猜出這N人博弈的納什均衡并給出相應(yīng)的分析。全班范圍內(nèi)，請在1~100這100個整數(shù)中，選擇一個數(shù)字。獲勝的條件是，如果你選擇的數(shù)字，滿足：不超過所有回答數(shù)字的平均值的2/3；在滿足1.的前提下，你所猜得的數(shù)字為最大。請問你選擇的數(shù)字是什么？/cqg/article/1973298.html實驗：猜數(shù)問題零水平的思考：“這個問題對我太復(fù)雜了，隨便猜一個碰碰運氣吧，就選平均數(shù)50.”第一層次的思考："別人對這個問題也不會有什么靈感，所以我想他們的選擇會是隨機的，也就是平均數(shù)50，所以，我選擇33"第二層次的思考：人們可能很聰明，但我更有獨到的認識。他們無疑會選33，因為他們認為這個問題很簡單，所以我選擇22“這個游戲最容易被猜到的數(shù)字是0，1，22和33.塞勒認為：“那些選擇0或1的人完全從數(shù)學(xué)角度考慮問題，沒有考慮到人們的行為因素。而那些選擇22或33的人則低估了別人的智慧?！笨紤]到所有因素后的猜測應(yīng)該是13！（3個均數(shù)）博弈問題是否存在多個納什均衡？如果只有一個納什均衡，容易找到一致性預(yù)期嗎？如果存在多個納什均衡，怎么找到一致性預(yù)期呢？約會博弈問題芭蕾舞足球場芭蕾舞足球場1，20，00，02，1在社會決策過程中，來自于文化、習(xí)慣等方面的許多強制力（compellingforce）能讓決策匯集于一點形成共識。一旦社會上形成一個特定的慣例（如語言、習(xí)俗等），那么就很難改變，即使每個人都知道這種慣例不是最優(yōu)的。聚點均衡法：聚焦點：Schelling（1960）認為，在現(xiàn)實生活中，參與人可能使用某些被博弈模型抽象掉的信息來達到一個“聚焦點”（focal

point）均衡。求解多個納什均衡方法聚點均衡：情侶博弈情侶博弈的課堂實驗請兩名同學(xué)協(xié)助統(tǒng)計其他同學(xué)參與實驗設(shè)想你是情侶博弈的參與人1——男孩，你將選擇哪個策略？男女生分開，男生為參與人1——男孩，女生為參與人2——女孩，請選擇策略設(shè)想你是參與人1——男孩，參與人2已經(jīng)作出了自己的選擇，但你觀察不到她的選擇?，F(xiàn)在請你作出自己的選擇。聚點均衡：情侶博弈你仍然是參與人1，在博弈開始前，你的對手有機會做一個宣言（你沒這個機會），現(xiàn)在她宣布：“我將選擇芭蕾”。博弈開始，你將選擇什么策略？你還是參與人1——男孩，博弈開始前，你的對手有機會做一個宣言（你沒有），但是女孩選擇了沉默。博弈開始，你將選擇什么策略？謝林：你要在紐約接一個人，見面約定在什么時間什么地點？你要在山東科技大學(xué)接一個人，見面約定在什么時間什么地點？實驗：見面實驗：選美大賽請你猜出哪張面孔是大多數(shù)投標者認為漂亮的？凱恩斯：熱門股票就是每個人認為的其他每個人認為的………熱門股票。選美與選股信息選股地產(chǎn)政策“地震”，地產(chǎn)股則同時“共振”

政策的猛烈炮火，使地產(chǎn)股儼然成為了近期A股市場的“炮灰”。失守3000點的滬深股市，地產(chǎn)股悲劇持續(xù)演繹。繼4月19日房地產(chǎn)指數(shù)下跌7.58%以后，昨日(4月20日)，該指數(shù)再度下跌2.91%。無論是招、保、萬、金等傳統(tǒng)的四大天王，還是先前基金青睞的二三線城市地產(chǎn)股，二級市場上都遭遇了前所未有的持續(xù)打壓。選股資源價格改革推進帶來的機會

資源價格改革，主要集中于電力、天然氣、水等資源性產(chǎn)品價格和排污、污水處理、垃圾處理等環(huán)保收費改革。目前，市場最關(guān)注的就是水資源價格上調(diào)的問題。能源、煤炭石油、有色金屬

美麗的均衡均衡可以輕易地由于突發(fā)奇想或一時狂熱而確定。由社會中相互影響的人們參與的博弈的結(jié)果，應(yīng)當取決于博弈的社會和心理方面。第三講

囚徒困境專題多種情景，一個思想五一、商場多種情景，一個思想美國大選民主黨共和黨中間策略多種情景，一個思想漁業(yè)物種滅絕囚徒困境兩個小偷甲和乙聯(lián)手作案，私入民宅被警方逮住但未獲證據(jù)。警方將兩人分別置于兩間房間分開審訊，政策是若一人招供但另一人未招，則招者立即被釋放，未招者判入獄10年；若二人都招則兩人各判刑8年;若兩人都不招則未獲證據(jù)但因私入民宅各拘留1年。表1囚徒困境博弈

乙

招不招招甲不招（問題1：甲、乙如何選擇？）

囚徒困境？

條件：允許囚徒甲和乙在審訊室單獨呆上10分鐘，然后再決定是否坦白。

目的：建立攻守同盟，克服自利心理。

均衡：（坦白，坦白）

戀愛、低碳、核實驗：信息溝通？

假設(shè)每一個學(xué)生都擁有一家企業(yè)，選擇生產(chǎn)產(chǎn)品A還是B，A代表高質(zhì)量產(chǎn)品，B代表低質(zhì)量產(chǎn)品。如果你選擇生產(chǎn)A，則老師獎勵你2元，選擇B，則老師獎勵你2.15元。選擇A產(chǎn)品可以產(chǎn)生1元總收益，選擇B產(chǎn)品不能產(chǎn)生總收益，最后老師計算出所有選擇A產(chǎn)品同學(xué)的人數(shù)，將所得到的總收益平分給所有同學(xué)。囚徒困境？

條件：囚徒甲和乙都是完全清白的、絕對具有理性的良好市民。

均衡：（坦白，坦白）

囚徒困境的本質(zhì)個體理性與集體理性之間存在沖突不合作劣于合作合作不具有約束性囚徒困境的破解不合作合作許諾獎勵懲罰可信性囚徒困境的破解合作不合作合作不合作T，TS，RR，SP，P滿足：R>T>P>S;(S+R)<T+T囚徒困境的一般表達式囚徒困境的破解國家法律梁啟超：我國成文法之起源不可確指，然以數(shù)千年之思想往往視法律與命令為一物國家法律措施是無效率還是高效率？用法律解決“囚徒困境”合作不合作合作不合作T，TS，R-XR-X，SP，P滿足：X>R-T公共產(chǎn)品（publicgoods)提供不提供提供不提供4，4-1，55，-10，0無論對方如何選擇，每個人的最優(yōu)選擇：不提供。所以，我們可以預(yù)測，結(jié)果將是（不提供，不提供）公共產(chǎn)品與稅收制度比較私人產(chǎn)品與公共產(chǎn)品的不同：使用上排他性；私人產(chǎn)品是志愿購買的，但公共產(chǎn)品可能需要強制購買；稅收制度就是保證公共產(chǎn)品的生產(chǎn)，解決公共產(chǎn)品生產(chǎn)上的“囚徒困境”

生活中的“囚徒困境”例子

例子1商家價格戰(zhàn)

出售同類產(chǎn)品的商家之間本來可以通過共同將價格維持在高位而獲利，但實際上卻是相互殺價，結(jié)果都賺不到錢。當一些商家共謀將價格抬高，消費者實際上不用著急，因為商家聯(lián)合維持高價的壟斷行為一般不會持久，可以等待壟斷的自身崩潰，價格就會掉下來。

譬如，2000年我國幾家生產(chǎn)彩電的大廠商合謀將彩電價格維持高位，他們搞了一個“彩電廠家價格自律聯(lián)盟”，并在深圳舉行了由多家彩電廠商首腦參加的“彩電廠商自律聯(lián)盟高峰會議”。當時，國家有關(guān)部門還未出臺相關(guān)的反壟斷法律，對于這種在發(fā)達國家明顯屬于違法行為的所謂“自律聯(lián)盟”，國家在法律上暫時還是無能為力的。寡頭廠商在光天化日之下進行價格合謀，并且還通過媒體大肆炒作，這在發(fā)達國家是不可思議的。

但是，盡管政府當時無力制止這種事情，公眾也不必擔(dān)心彩電價格會上漲。這是因為，“彩電廠商自律聯(lián)盟”只不過是一種“囚徒困境”，彩電價格不會上漲。在高峰會議之后不到二周，國內(nèi)彩電價格不是上漲而是一路下跌。這是因為廠商們都有這樣一種心態(tài)：無論其他廠商是否降價，我自己降價是有利于自己的市場份額擴大的。

例子2為什么政府要負責(zé)修建公共設(shè)施，因為私人沒有積極性出資修建公共設(shè)施

設(shè)想有兩戶相居為鄰的農(nóng)家，十分需要有一條好路從居住地通往公路。修一條路的成本為4，每個農(nóng)家從修好的好路上獲得的好處為3。如果兩戶居民共同出資聯(lián)合修路，并平均分攤修路成本，則每戶居民獲得凈的好處（支付）為3-4/2=1；當只有一戶人家單獨出資修路時，修路的居民獲得的支付為3-4=-1（虧損），“搭便車”不出資但仍然可以使用修好的路的另一戶人家獲得支付3-0=3。修路博弈

乙修不修修甲不修

我們看到，對甲和乙兩家居民來說，“修路”都是劣戰(zhàn)略，因而他們都不會出資修路。

這就是我們看到的為什么大多數(shù)路、橋等公共設(shè)施都是由政府出資修建的原因。同樣的道理，國防、教育、社會保障，環(huán)境衛(wèi)生等都由政府承擔(dān)資金投入，私人一般沒有積極性承擔(dān)這方面服務(wù)的積極性和能力。例子3蘇格蘭的草地為什么消失了？公共資源經(jīng)常被過度利用的原因。

在18世紀以前，英國蘇格蘭地區(qū)有大量的草地，其產(chǎn)權(quán)沒有界定，屬公共資源，大家都可以自由地在那里放牧。草地屬于“可再生資源”，如果限制放牧的數(shù)量，沒有被牛羊吃掉的剩余草皮還會重新長出大面積草場，但如果不限制放牧規(guī)模，過多的牛羊?qū)⒉莩缘靡还舛?，則今后不會再有新草生長出來，草場就會消失。

由于草地的產(chǎn)權(quán)沒有界定，政府也沒有對放牧作出規(guī)模限制，每家牧民都會如此盤算：如果其他牧民不約束自己的放牧規(guī)模，讓自己的牛羊過多地到草地上吃草，那么，我自己一家約束自己的放牧規(guī)模規(guī)模對保護草場的貢獻是微乎其微的，不會使草場免于破壞；相反，我也加入過度放牧的行列，至少在草場消失之前還會獲得一部分短期的收益。

如果其他牧民約束放牧規(guī)模，我單獨一家人過度放牧不會破壞廣褒的牧場，但自己卻獲得了高額的收益。因此，任何一位牧民的結(jié)論都會是：無論其他牧民是否過度放牧，我選擇“約束自己的放牧規(guī)?！倍际橇討?zhàn)略，從而被剔除。大家最終都會選擇過度放牧，結(jié)果導(dǎo)致草地消失，生態(tài)破壞。

類似的例子還有：

渤海中的魚愈來愈少了，工業(yè)化中的大氣及河流污染，森林植被的破壞等。解決公共資源過度利用的出路是政府制訂相應(yīng)的規(guī)制政策加強管理，如我國政府規(guī)定海洋捕魚中，每年有一段時間的“休漁期”，此時禁止捕魚，讓小魚苗安安靜靜地生長，大魚好好地產(chǎn)卵，并對魚網(wǎng)的網(wǎng)眼大小作出規(guī)定，禁用過小網(wǎng)眼的捕網(wǎng)打魚，保護幼魚的生存。又如在三峽庫區(qū)，為了保護庫區(qū)水體環(huán)境，關(guān)閉了前些年泛濫成災(zāi)的許多小造紙廠等。思考1為什么人們在消費各種公共資源時，如果各取所需，留給下一代的越來越少？而在社會優(yōu)化分配中，消耗一半，留下一半給后代。也就是說，當一種資源成了公共資源的時候，還能夠?qū)嵭懈魅∷鑶?？思?全球轉(zhuǎn)暖的溫室效應(yīng)是否屬于公共資源悲劇？公共資源悲哀思考3在我國，利用電話線的網(wǎng)絡(luò)快車（ADSL），包月租或者包年租的時候，每個人都想把網(wǎng)絡(luò)打開掛在網(wǎng)絡(luò)上（在線游戲的激勵），這樣是不是公共悲??？你家里的網(wǎng)絡(luò)快車是否真的快？公共資源悲哀思考4如何避免悲劇的發(fā)生？公共資源分割私有化行嗎？比如環(huán)境？增加使用稅？比如國家圖書館？當稅收使得人們的享受公共資源的邊際效用為零的時候，稅收合理嗎？例子4為什么在城市中心道路上禁止汽車鳴喇叭？

禁鳴喇叭一方面是為了控制城市噪聲污染，另一方面是基于以下的博弈論原因。當汽車司機可以鳴喇叭時，可能為汽車超速搶行提供條件。但當大家都搶行時，城市交通擁擠加重，反而都難以順利通行，獲得低支付（2,2)。

但當對方緩行時，自己搶行會占便宜，獲得支付9。這個博弈中，“緩行”是劣戰(zhàn)略，剔除后得到“剔除劣戰(zhàn)略后的占優(yōu)戰(zhàn)略均衡”（搶行,搶行），這不是一個好的均衡。當禁止鳴喇叭時，司機為了避免造成交通事故，只得緩行，從而得到好的結(jié)果（緩行,緩行）。交通博弈

司機2緩行搶行緩行司機1搶行

例子5為什么要加入WTO？

WTO是一個自愿性申請加入的自由貿(mào)易聯(lián)盟，即WTO成員國之間實現(xiàn)低關(guān)稅或零關(guān)稅的相互間自由貿(mào)易。為什么需要一個組織來協(xié)調(diào)國家之間的自由貿(mào)易呢？這是因為，如果沒有一個協(xié)調(diào)組織，國與國之間的貿(mào)易就不會呈現(xiàn)低關(guān)稅或零關(guān)稅的自由貿(mào)易局面，因為這時國與國之間的貿(mào)易是一個“囚徒困境”。給定一個國家對另一個國家的貨物實行低關(guān)稅，另一個國家反過來對這個國家的貨物實行高關(guān)稅是占優(yōu)于實行低關(guān)稅的戰(zhàn)略的。

如果恰當進行機制設(shè)計，前述囚徒困境還是可以避免的，下面是一個商戰(zhàn)中的真實例子。

機制設(shè)計：如何走出囚徒困境凍結(jié)價格戰(zhàn)的博弈機制

美國有兩家銷售音像商品的商店“瘋狂艾迪（CrazyEddie）和紐馬克與露易斯（Newmark&Lewis），它們之間在市場上存在競爭。當它們進行合謀時，如何保證對方不會背叛而降價的一個前提就是如何能迅速查出對方的背叛行為并給予懲罰。

“瘋狂艾迪”已作出了承諾“不可能有人賣得比我們更低，我們的價格最低廉，我們保證價格最低，而且是超級瘋狂的低”。而對手企業(yè)Newmark&Lewis也打出“只要買我們的東西，將得到終生低價保證”。它承諾：假如你能在別處買到更低的價格，我們將加倍退錢，廣告還承諾：

假如你在本店買了商品之后，在你一生中于任何本地的銷售商（本行銷區(qū)內(nèi)）那里發(fā)現(xiàn)相同的廣告款式而價格卻較本店低的話（以單據(jù)為憑），本店愿支付百分之百的差價，并額外付給差價的百分之二十五（以支票支付）；或是給你差價百分之二百的本店換貨單（除了原差價的百分之一百外，再額外加給百分之百，都是以換貨單方式支付）。—Newmark&Lewis公司終身低價保證

乍一看，這兩家企業(yè)在玩命競爭，根本不可能形成價格聯(lián)盟，即使形成也難以維持，因而它們之間似乎是在打價格戰(zhàn)。但是，一種潛在的偵察降低價格行為的機制阻止了價格戰(zhàn)的發(fā)生。若每臺錄相機的批發(fā)價為150美元，此時兩家企業(yè)正以每臺300美元的價格出售。“瘋狂艾迪”打算降為每臺275美元，從而將對手的顧客拉過來，如那些家住在對手售貨點附近或過去曾買過對手商品的顧客。

但是，對手的戰(zhàn)略鎖定了“瘋狂艾迪”的行為，因為“瘋狂艾迪”的這一計劃會有相反的效果。因為顧客會到對手那里先以300美元買下錄相機，然后再獲退款50美元。這樣，對手自然將價格降到更低的價格250美元一臺，顧客反而是從“瘋狂艾迪”那里流向?qū)κ侄皇窍喾础?/p>

如果對手不想以250美元一臺出售錄相機，他也可以將價格降到275美元一臺，只要它發(fā)現(xiàn)有顧客來要求退款，就會發(fā)現(xiàn)對手的背叛行為，從而將價格降到了250美元一臺。既不以太低價出售，又快速發(fā)現(xiàn)對手的背叛從而以降價予以報復(fù)，使對手降價也不能增大顧客量，從而蒙受損失。

這樣，“瘋狂艾迪”就沒有進行價格戰(zhàn)的意愿了，自然形成價格聯(lián)盟。在美國，明目張膽的價格合盟是違法的，但這兩家企業(yè)卻以不違法的方式形成了價格合盟，顧客成了背叛行為的偵察者，這一戰(zhàn)略是十分巧妙的。

福州國美電器從2003年9月6日試營業(yè)，9月13日正式開業(yè)至今，一直實施“誰價比我低，差價兩倍還”。成都百貨大樓國美電器火拼最低價“價格沒有最低，只有更低”。

誰價比我低，差價兩倍還智豬博弈

豬圈中有一頭大豬和一頭小豬，在豬圈的一端設(shè)有一個按鈕，每按一下，位于豬圈另一端的食槽中就會有10單位的豬食進槽，但每按一下按鈕會耗去相當于2單位豬食的成本。如果大豬先到食槽，則大豬吃到9單位食物，小豬僅能吃到1單位食物；如果兩豬同時到食槽，則大豬吃7單位，小豬吃3單位食物；如果小豬先到，大豬吃6單位而小豬吃4單位食物。給出這個博弈的支付矩陣。二、智豬博弈：對諸多經(jīng)濟現(xiàn)象的解釋表4智豬博弈

小豬按等待按大豬等待

這個博弈沒有“剔除劣戰(zhàn)略均衡”，因為大豬沒有劣戰(zhàn)略。但是，小豬有一個劣戰(zhàn)略“按”，因為無論大豬作何選擇，小豬選擇“等待”是比選擇“按”更好一些的戰(zhàn)略。所以，小豬會剔除“按”，而選擇“等待”；大豬知道小豬會選擇“等待”，從而自己選擇“按”，所以，可以預(yù)料博弈的結(jié)果是(按,等待）。這稱為“重復(fù)剔除劣戰(zhàn)略的占優(yōu)戰(zhàn)略均衡”，其中小豬的戰(zhàn)略“等待”占優(yōu)于戰(zhàn)略“按”，而給定小豬剔除了劣戰(zhàn)略“按”后，大豬的戰(zhàn)略“按”又占優(yōu)于戰(zhàn)略“等待”。

在經(jīng)濟生活中，“智豬博弈—搭便車”

例子1股市博弈在股票市場上，大戶是大豬，他們要進行技術(shù)分析，收集信息、預(yù)測股價走勢，但大量散戶就是小豬。他們不會花成本去進行技術(shù)分析，而是跟著大戶的投資戰(zhàn)略進行股票買賣，即所謂“散戶跟大戶”的現(xiàn)象。

例子2為何股份公司中的大股東才有投票權(quán)？

在股份公司中，大股東是大豬，他們要收集信息監(jiān)督經(jīng)理，因而擁有決定經(jīng)理任免的投票權(quán)，而小股東是小豬，不會直接花精力去監(jiān)督經(jīng)理，因而沒有投票權(quán)。例子3為什么中小企業(yè)不會花錢去開發(fā)新產(chǎn)品？

在技術(shù)創(chuàng)新市場上，大企業(yè)是大豬，它們投入大量資金進行技術(shù)創(chuàng)新，開發(fā)新產(chǎn)品，而中小企業(yè)是小豬，不會進行大規(guī)模技術(shù)創(chuàng)新，而是等待大企業(yè)的新產(chǎn)品形成新的市場后生產(chǎn)模仿大企業(yè)的新產(chǎn)品的產(chǎn)品去銷售。我們寢室七個人，有一臺學(xué)校免費提供的飲水機。一桶水八塊錢，在宿舍樓下可以直接買到。但是在買水制度的安排上，卻遇到了許多困難。實驗：買水的困境首先想到的辦法是輪流購買。但問題至少有三個：一、每個人對水的消費量并不相同，這種平攤的方法可能不會得到喝水較少的同學(xué)的支持；二、七個人輪流一次的周期很長，到最后很可能會出現(xiàn)一部分人比另一部分人多買一桶水的情形，在公平性上存在爭議（雖然一桶水的花費并不高）；三、節(jié)假日期間，有些同學(xué)回家，可能會影響輪流購買的實行。另一個辦法是每人定期出資，設(shè)立一個買水基金。除了上面的第一個問題外，還可能存在下面的問題：一、資金如何妥善管理和使用的問題；二、誰把水從一樓搬上來的問題（比較費力）。因為存在各種各樣的問題，以上的方法均未有效實行，所以寢室經(jīng)常發(fā)生水荒。這個問題與公共物品的提供困境類似，但又存在一些特有的問題。到最后可能演化成一個智豬博弈：對喝水比較看重的人去買水——事實近似于此——但這并不是長久之計。當然，同學(xué)友情、兄弟義氣等約束行為的因素并未考慮在內(nèi)，只是在純粹經(jīng)濟人的假設(shè)下給出問題?；旌喜呗耘c隨機行動賽場點球射門攻方的策略是：攻左邊，或攻右邊守方的策略是：守左邊，或守右邊（以守方的方向為準）混合策略提出得益：進球得分的百分比。根據(jù)1995-2000年間意大利、西班牙和英國最高聯(lián)盟的數(shù)據(jù)就一次游戲而言，猜測對方的策略，保密自己的策略。在多次反復(fù)游戲中，避免任何的傾向性和規(guī)律性。嚴格競爭博弈零和博弈實驗辦法是將行動隨機化。混合策略：參與人在每一個給定信息的情況下以某種概率分布隨機地選擇不同的行動。例如：乒乓球員以60％的概率選擇正手發(fā)球，40％的概率選擇反手發(fā)球。

什么是純策略？混合策略如果你是踢球人,這兩個純策略中你更喜歡哪一種?（70％）你能不能做得更好?

混合策略(1)以50:50（拋硬幣）的比例隨機地選擇左邊或右邊。如果守門員選擇左邊，你混合策略成功的概率：?*58%+?*93%=

75.5%如果守門員選擇右邊，你混合策略成功的概率：?*95%+?*70%=

82.5%50：50是你最佳混合策略嗎?

混合策略(2)以40:60（在你的口袋里放一本書，如果頁眉最后一位數(shù)是1到4選左，0到5則選右）的比例隨機地選擇左邊或右邊。如果守門員選擇左邊，你混合策略成功的概率：0.4*58%+0.6*93%=

79%如果守門員選擇右邊，你混合策略成功的概率：0.4*95%+0.6*70%=

80%你的連續(xù)更優(yōu)的混合策略比例就是如何使自己在守門員選擇左邊時和選擇右邊的成功概率差距縮小。58％－－70％－－12％75.5%－－82.5%－－7.3％79%－－80%－－1％x－－y－－0

混合策略不管守門員選擇他的左邊還是右邊，你的最佳混合比例都會使你得到相等的成功率

混合策略(3)以x:1－x的比例隨機地選擇左邊或右邊。如果守門員選擇左邊，你混合策略成功的概率：x*58%+（1－x）*93%如果守門員選擇右邊，你混合策略成功的概率：x*95%+（1－x）

*70%兩者相等，求得選x＝0.383不管守門員選擇他的左邊還是右邊，你的最佳混合比例都會使你得到相等的成功率

混合策略(4)以0.383:0.617的比例隨機地選擇左邊或右邊。如果守門員選擇左邊，你混合策略成功的概率：0.383*58%+0.617*93%＝79.6％如果守門員選擇右邊，你混合策略成功的概率：0.383*95%+0.617

*70%＝79.6％那么守門員的策略怎樣？混合策略納什均衡?

混合策略守門員的最佳策略是使踢球者選擇左邊和選擇右邊的成功率相等的策略。守門員應(yīng)當分別以41.7％和58.3％的比例選擇自己的左邊和右邊，使踢球者成功的概率為79.6%.法則

混合策略在純沖突博弈（零和博弈）中，如果讓你的對手事先看清楚你的真實選擇對你不利，那么你可以通過隨機選擇自己備選的純策略而獲益。你的混合比例應(yīng)該是這樣的：對手采取任何特定的備選純策略，都不可能利用你的選擇，即，當你以混合策略對付他的混合策略中任一純策略時，你得到的平均贏利都相等。實驗拋硬幣

怎樣隨機行動？拋硬幣翻出正面之后再拋一次，這時出正面的可能性與拋出反面的可能性相等。無規(guī)律的隨機行動（點名4/18=22%,不點名78％）。例如：一個秘密的、足夠復(fù)雜以致讓人難以破解的規(guī)則。舉例：秘密約會博弈芭蕾舞足球場芭蕾舞足球場2，10，00，01，3妻子報案（reportingacrime）n個人目睹一樁罪行，每個人都希望報警，但是都傾向于其他人打電話。特別的，假定能從報警中得到v單位的收益，而打電話的人需要付出c單位的成本，v>c>0。分析這個問題的純戰(zhàn)略NE和混合戰(zhàn)略NE?；旌喜呗浴咐治觯簠⑴c人：n個每個參與人的戰(zhàn)略集：{打電話，不打電話}效用：沒有任何人打，所有人0支付；打，v-c；不打，但其他人至少有一個人打，v混合策略—案例純戰(zhàn)略NE當只有兩個參與人的時候（公共產(chǎn)品提供的斗雞博弈）——兩個NEn個人的時候：假設(shè)有m個人提供，m>1orm=1n個NE混合策略—案例混合策略—案例混合戰(zhàn)略NE隨著人數(shù)n的增加，p減小，即人越多，每個人選擇報案的概率就會越小，如果n＝1，則p＝1社會心理學(xué)與博弈分析混合策略—案例

小孩玩的游戲“石頭，剪子，布”，也是一種博弈。但是，這個博弈有一種有趣的特征，即給定一方的任何選擇，另一方都有制勝對方的戰(zhàn)略，所以，給定一方任何一個戰(zhàn)略，對方都有制勝這個戰(zhàn)略的戰(zhàn)略，因而這個戰(zhàn)略不是最優(yōu)的。任何“純戰(zhàn)略”都不是最優(yōu)的，純戰(zhàn)略是“石頭，剪子，布”中的任何一個。

但是，我們知道，玩這個游戲是總是以對方不易猜出的隨機方式出招。事實上，可以通過數(shù)學(xué)證明，當雙方都以每個戰(zhàn)略按1/3的概率出招時，達成一種雙方都不愿改變這種概率分布的局面。這被稱為“混合戰(zhàn)略納什均衡”，而這種以隨機方式選擇純戰(zhàn)略的博弈被稱為“混合戰(zhàn)略博弈”。

實驗顯示：“陷入無意識但仍可預(yù)測的模式”例如：官僚作風(fēng)－－連續(xù)出“布”雪崩－－－連續(xù)出石頭排除策略－－省略一個隨機：秘密的，足夠復(fù)雜以至難以讓人破解的規(guī)則

例子1田忌賽馬新編

春秋戰(zhàn)國時期，齊威王常與旗下大將田忌賽馬。規(guī)則是：每次賽三局，每一局齊威王與田忌各出一匹馬比賽奔跑速度。每一局中的勝者贏敗方一千斤銅。田忌有上、中、下三匹馬，而齊威王也有上、中、下三匹馬。每次比賽，第一局田忌出上馬，齊威王也出上馬；第二局田忌出中馬，齊威王也出中馬；第三局，田忌出下馬，齊威王也出下馬。齊威王的上馬比田忌的上馬好，齊威王的中馬也比田忌的中馬好，齊威王的下馬還是比田忌的下馬好。于是，每次比賽的結(jié)果都是田忌連輸三局。

田忌的謀士孫臏了解了田忌的困境后，就打聽到這樣一個消息：盡管齊威王的上、中、下三匹馬都要比田忌的對應(yīng)上、中、下三匹馬好，但碰巧的是田忌的上馬可勝齊威王的中馬，田忌的中馬可勝齊威王的下馬。于是，孫臏為田忌獻計：下一次比賽中第一局時田忌出下馬對齊威王的上馬輸一局，第二局田忌出上馬對齊威王的中馬，第三局田忌出中馬對齊威王的下馬，這樣可連贏兩局，最后凈勝一千斤銅。田忌依計而行，果真贏回一千斤銅。

這個故事曾經(jīng)被很多人當作博弈論的例子來演繹，但實際上這個故事與博弈論無關(guān)。博弈論會假定所有局中人都是理性的，不能假定一些局中人聰明而另一些局中人卻是傻子。當田忌出下馬時，齊威王最好的選擇是出下馬而不是上馬。孫臏的計謀中假定齊威王是傻子，當田忌出下、上、中馬時，他仍然按上、中、下馬出，當然要輸了。事實上，當田忌出下馬時，齊威王應(yīng)出下馬，但齊威王出下馬時，田忌不應(yīng)出下馬而是出中馬，但此時齊威王又應(yīng)出中馬而不是下馬了，……。這樣，博弈不會有純戰(zhàn)略的均衡。

兩人只能玩混合戰(zhàn)略博弈，齊威王分別以1/6隨機的概率選擇出上、中、下馬的任一排列，田忌也如此。由于齊威王存在絕對優(yōu)勢，他平均看來仍然會贏田忌一千斤銅。

例子2如果曹操與諸葛亮一樣聰明：三國演義中的華容道博弈

在《三國演義》中，曹操在赤壁大戰(zhàn)中一敗涂地，率殘兵敗將向許都方向逃竄。諸葛亮命關(guān)羽率兵在途中阻截曹軍。當時，第一批攔截大軍是趙云率領(lǐng)的，第二批攔截大軍是張飛帶隊的，第三批才是關(guān)羽率部伏擊。由于曹軍兵多將廣，前二批伏擊軍不能逮住曹操，只是搶劫一些軍械馬匹之類。

待曹軍沖過趙云、張飛兩道關(guān)后，進入關(guān)羽的伏擊地帶。但是，當時關(guān)羽與曹操相遇的地方有兩條道，一條是華容道，除此外還有另一條道。諸葛亮令關(guān)羽伏兵于華容道，并且要求關(guān)羽在華容道上點燃樹枝冒出煙霧引曹操到來。當時關(guān)羽不解，問諸葛亮，“如果在伏兵之處點火，豈不令曹兵看見而改走另一條道逃脫？”諸荀亮叫關(guān)羽不要再問，只如此照辦即可。

當曹操沖破趙云、張飛的阻截后，來到華容道前，看見華容道上靜悄悄的，但有煙火縈繞。曹操大笑道：“孔明以為我會上他的當，故意叫人在華容道上點火讓我走另一條道，而他卻伏兵于這條道上好逮住我呢！我偏不上他的當！”于是，曹操令大軍徑直上華容道上而去，結(jié)果與關(guān)羽大軍撞個正著。

曹操為何進了孔明的圈套呢？這里的道理是這樣的：孔明知道曹操是聰明人，而聰明人見華容道上有煙火會認為華容道上有伏兵，于是會避開華容道而走另一條路。如果孔明令關(guān)羽在另一條路等著，曹操就被逮住了。但是，曹操不僅聰明，而且還聰明過人，他也知道孔明的如此盤算來誘他上鉤，他偏不上當，知道點火的華容道上無人，孔明的隊伍在另一條道上呢！于是他選擇走華容道。

但是，依《三國演義》作者羅貫中的邏輯，孔明總是比曹操計高一籌，按博弈論的術(shù)語來說，就是孔明的理性程度要比曹操高上一階?？酌饕仓啦懿僦揽酌鞯拇蛩?，于是令關(guān)羽正好在點火的華容道上等著曹操。《三國演義》中的這個故事很可能是作者編造的，因為在《三國志》中并無這一情節(jié)。這里，羅貫中假設(shè)了曹操在智力上比孔明差一些，才有華容道上被關(guān)羽抓住，要不是關(guān)羽舊情難忘，曹操就死無葬身之地了。

但是，如果我們不假定曹操比孔明要笨一些，而是相反假定曹操與孔明一樣聰明，則曹操又知道孔明知道曹操知道孔明的打算，曹操就會知道關(guān)羽在華容道上等著他呢？此時曹操就避開華容道走另一條路。但是，這還沒有完，因為若孔明知道曹操知道孔明知道……。顯然，最終的結(jié)果是曹操與孔明玩混合戰(zhàn)略博弈，曹操隨機地以1/2的概率選擇走華容道和另一條路，孔明也以1/2的概率令關(guān)羽守華容道或另一條路。

于是，《三國演義》中的這一情節(jié)就應(yīng)作如下改寫：

諸葛亮拋出一枚硬幣，決定關(guān)羽是守華容道呢還是另一條道……，而曹操也擲出一枚硬幣，決定是走華容道呢還是走另一條路。平均看來，曹操有1/2的概率逃脫，而關(guān)羽也只有1/2的概率抓住曹操。如果說關(guān)羽在華容道上抓住了曹操，則純屬偶然、并非孔明比曹操計高一籌所致！剪刀-石頭-布爬樓梯游戲策略，石頭、剪子、布布獲勝，向上爬5個臺階剪刀獲勝，向上爬2個臺階石頭獲勝，向上爬1個臺階平局，再來一遍第一個爬上樓梯的是獲勝者商業(yè)與其他對抗中的混合策略商界、政界和戰(zhàn)爭非零和博弈商業(yè)與其他對抗中的混合策略例如：折扣券博弈問題商業(yè)與其他對抗中的混合策略例1：折扣券博弈問題目的？1、都不發(fā)行2、都發(fā)行3、一個發(fā)行，另一個不發(fā)行如何占得先機？商業(yè)與其他對抗中的混合策略如何占得先機？避免他人占得先機，唯一的途徑就是保持出人意料的元素。－－這一元素源于隨機化策略的應(yīng)用但是：獨立隨機選擇有“出錯”的危險。進行合作！商業(yè)與其他對抗中的混合策略可口可樂和百事可樂52個星期，分別發(fā)放26周優(yōu)惠券沒有出現(xiàn)兩家同時的情況計算：如果兩家獨立以50％概率隨機選擇任何一周發(fā)放優(yōu)惠券，那么他們各自發(fā)放26周而不會出現(xiàn)同時發(fā)放的概率是1/10005(10億的10億次方)延伸：聯(lián)合營銷麥當勞與可口可樂，肯德基與百事可樂從美國相攜走向全球，許多大的跨國企業(yè)均與知名連鎖酒店、供應(yīng)商保持全球的合作體系，令人慨嘆中國的許多企業(yè)盡管軀體龐大，但在經(jīng)營的思想和理念上與它們相去甚遠。

辜鴻銘曾用西文出版過一本書，書名為《中國人的精神》，其中將中國人的民族性格歸結(jié)為三大特征：“deep,bright,simple”，譯成中文是“深沉、聰明、淳樸”。延伸：聯(lián)合營銷深沉就是含而不露，靜水流深，但這種性格與聯(lián)盟的陽光與規(guī)則的透明背道而馳。聰明更多是為人為事的創(chuàng)造力與洞察，但似乎缺少更大氣的哲學(xué)和價值觀思考，這樣也不利于建立通用的制度規(guī)則，大家思考的更多是彼此之間的利益而非聯(lián)盟共事致力追求的長遠目標—這也是戰(zhàn)國時期秦國以連橫成功打破六國合縱政策的原因所在。例2：飛機折扣票博弈航空公司告訴你折扣，不告訴你剩余的空位你隨機選擇時點進行訂票V，-D-P，00，S0，0睡不睡偷不偷守衛(wèi)小偷混合戰(zhàn)略：守衛(wèi)以n概率選擇睡覺，以1－m的概率選擇不睡小偷以m概率選擇偷，以1－n概率選擇不偷例3監(jiān)督博弈加重對守衛(wèi)的處罰：短期中的效果是使守衛(wèi)真正盡職在長期中并不能使守衛(wèi)更盡職，但會降低盜竊發(fā)生的概率0-D-D’守衛(wèi)得益((睡)S小偷偷的概率1激勵悖論Sm加重對小偷的處罰：短期內(nèi)能抑制盜竊發(fā)生率長期并不能降低盜竊發(fā)生率，但會使得守衛(wèi)更多的偷懶0-P-P’小偷得益(偷)V守衛(wèi)睡的概率1n激勵悖論

例5為什么一般人總是小錯不斷，大錯不犯；偷稅漏稅的一般是中小企業(yè)，大企業(yè)會老老實實地交稅？

稅務(wù)部門不會對所有企業(yè)的交稅情況每一次都去檢查，因為這樣做的成本太高，得不償失。所以，稅務(wù)部門總是隨機地對企業(yè)的交稅情況進行檢查。

企業(yè)也是隨機地在交稅與偷漏稅之間進行選擇。稅收部門與企業(yè)間進行的是混合戰(zhàn)略博弈。因為如果企業(yè)總是交稅，稅務(wù)部門就最好不檢查；但給定不檢查，企業(yè)就會偷漏稅。所以，兩者只有在隨機地檢查與不檢查，企業(yè)隨機地在偷漏稅與交稅之間選擇，才會達成均衡。

對于大企業(yè)，因一旦偷稅就數(shù)目巨大，所以，稅務(wù)部門在隨機檢查時放在大企業(yè)上的可能性就大一些；而給定稅務(wù)部門檢查大企業(yè)的可能性較大，大企業(yè)偷漏稅的行為就較少，否則就容易被逮個正著。所以，偷漏稅較多的就是一些中小企業(yè)，大企業(yè)納稅的積極性較高。同樣，大人物或有錢人納稅的積極性應(yīng)較高，至于我國在過去一段時期有錢人反而不交稅的現(xiàn)象主要源于制度不健全或已有的制度得不到貫徹所致。同樣的道理，在犯罪或?qū)﹀e誤的監(jiān)督懲罰博弈中，也是混合博弈，人們可能總是大錯不犯小錯不斷。專題：多重均衡與制度和文化多重納什均衡：交通博弈路上有兩輛車迎面而行，此時，兩個司機各有兩個選擇：走路的左側(cè)和走路的右側(cè)左L左L右R右R1,10,01,10,0乙方甲方這個博弈被稱為“協(xié)調(diào)博弈”：有兩個純戰(zhàn)略納什均衡，一個混合戰(zhàn)略均衡。哪一個將出現(xiàn)呢？進門博弈先進后進先進后進-1，-1-1，-12，11，2分蛋糕博弈x1x211任何滿足x1+x2=1的點都是納什均衡。

多個納什均衡無法形成一致的預(yù)期如何協(xié)調(diào)？僅僅“理性”是不夠的；聚點均衡：Schelling（1960）；帕累托最優(yōu)均衡：可以通過協(xié)商選擇一個納什均衡；cheaptalking；文化與制度；行業(yè)組織；聚點均衡：Schelling（1960）認為，在現(xiàn)實生活中，參與人可能使用某些被博弈模型抽象掉的信息來達到一個“聚點”（focal

point）均衡。這些信息可能與社會文化習(xí)慣、參與人過去博弈的歷史等有關(guān)。1.聚點均衡方法如果在中國，出現(xiàn)(R,R)，如果在英國，出現(xiàn)(L,L)左L左L右R右R1,10,01,10,0乙方甲方聚點均衡2.帕累托最優(yōu)均衡方法3.5“5.5“3.5“5.5“8,83,22,36,6（3.5“,3.5”)帕累托優(yōu)于(5.5“,5.5”)Cheaptalk

可以幫助協(xié)調(diào)到一個帕累托最優(yōu)均衡產(chǎn)品標準博弈為什么要相信？C1C2R1R29，90，88，07，7不論C選擇什么，他都有積極性告訴R他將選擇C1；所以沒有理由認為R應(yīng)該相信C的話。RC3.風(fēng)險與均衡方法實驗：請同學(xué)選擇？上下左右8,10-1000,97,66,5BA風(fēng)險與均衡由于納什均衡要求理性共識和一致預(yù)期，當人們可能犯小小的錯誤時，納什均衡不一定被選擇。如下面這個博弈中，多

人人文庫> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負責(zé)。
6. 下載文件中如有侵權(quán)或不適當內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

經(jīng)濟與博弈思維

文檔簡介

溫馨提示

最新文檔

評論

經(jīng)濟與博弈思維

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔