第13講(博弈論的基本概念)_第1頁
第13講(博弈論的基本概念)_第2頁
第13講(博弈論的基本概念)_第3頁
第13講(博弈論的基本概念)_第4頁
第13講(博弈論的基本概念)_第5頁
已閱讀5頁,還剩87頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

邢立寧國防科技大學(xué)五院管理系Email:聯(lián)系弈論的根本理論主要內(nèi)容博弈的要素與分類。教學(xué)重難點(diǎn)博弈的要素。教學(xué)要求理解博弈的構(gòu)成要素,了解博弈的分類方法。假設(shè)你正跟戀人用通,突然信號斷了。這時(shí),你會立即撥過去,還是等你的戀人撥過來?很顯然,你是否應(yīng)撥過去,取決于你的戀人是否會撥過來。如果你們其中一方要撥,那么另一方最好是等待;如果一方等待,那么另一方就最好是撥過去。因?yàn)槿绻p方都撥,那么就會出現(xiàn)線路忙;如果雙方都等待,那么時(shí)間就會在等待中流逝。想一想

在一場博弈中,你必須考慮對方的選擇以確定你自己的最優(yōu)選擇,而對方也必須考慮你的選擇來確定他的最優(yōu)選擇。你從博弈中得到的,不僅取決于你自己的行動(dòng),也取決于對方的行動(dòng)。如果你知道戀人不會打過來〔如以前斷線就是她在等,如果你的包月額度很難用完而她的接聽免費(fèi)〕,那么你的最優(yōu)行動(dòng)就是撥過去。博弈最本質(zhì)的特征是:雙方的行動(dòng)相互影響又相互依賴。這就是博弈!博弈無處不在金庸小說中的珍瓏棋局,多少高手未曾破解;而棋藝淺陋的虛竹“退一步〞,閉了眼睛亂下一子,殺死自己白棋一片,反而天地一寬,破解迷局。比賽規(guī)那么:馬按奔跑的速度分為上中下三等,等次不同裝飾不同,各家的馬依等次比賽,三賽二勝。比賽前田忌按孫臏主意,第一場,用上等馬鞍將下等馬裝飾起來,冒充上等馬,與齊威王的上等馬比賽;第二場,用上等馬與齊威王的中等馬比賽;第三場,田忌的中等馬和齊威王的下等馬比賽。結(jié)果二比一,田忌贏了齊威王。在雙方條件相當(dāng)時(shí),對策得當(dāng)可以戰(zhàn)勝對方;在雙方條件相差很遠(yuǎn)時(shí),對策得當(dāng)也可將損失減低到最低程度。田忌賽馬-1,11,-11,-1-1,1正面反面猜硬幣方蓋硬幣方正面反面猜硬幣博弈石頭剪子布博弈方2石頭剪子布博弈方10,01,-1-1,-1-1,10,01,-11,-1-1,10,0石頭、剪子、布老虎雞蟲杠子老虎0,01,-10,0-1,1雞-1,10,01,-10,0蟲0,0-1,10,01,-1杠子1,-10,0-1,10,0劃拳博弈博弈論,英文為Gametheory,是研究相互依賴、相互影響的決策主體的理性決策行為以及這些決策的均衡結(jié)果的理論。一些相互依賴、相互影響的決策行為及其結(jié)果的組合稱為博弈(Game)。一、博弈論的根本概念一個(gè)博弈一般由以下幾個(gè)要素組成,包括:參與人、行動(dòng)、信息、策略、得益、結(jié)果、均衡等。參與人指的是博弈中選擇行動(dòng)以最大化自己效用的決策主體(可以是個(gè)人,也可以是團(tuán)體);行動(dòng)是指參與人在博弈進(jìn)程中輪到自己選擇時(shí)所作的某個(gè)具體決策;策略是指參與人選擇行動(dòng)的規(guī)那么,即在博弈進(jìn)程中,什么情況下選擇什么行動(dòng)的預(yù)先安排;二、博弈論的組成要素信息指的是參與人在博弈中所知道的關(guān)于自己以及其他參與人的行動(dòng)、策略及其得益函數(shù)等知識;得益是參與人在博弈結(jié)束后從博弈中獲得的效用,一般是所有參與人的策略或行動(dòng)的函數(shù),這是每個(gè)參與人最關(guān)心的東西;均衡是所有參與人的最優(yōu)策略或行動(dòng)的組合;均衡結(jié)果是指博弈結(jié)束后博弈分析者感興趣的一些要素的集合,如在各參與人的均衡策略作用下,各參與人最終的行動(dòng)或效用集合。上述要素中,參與人、行動(dòng)、結(jié)果統(tǒng)稱為博弈規(guī)那么,博弈分析的目的就是使用博弈規(guī)那么來決定均衡。二、博弈論的組成要素根據(jù)參與人的多少,可將博弈分為兩人博弈或多人博弈;根據(jù)參與人是否合作,可將博弈分為合作博弈或非合作博弈;根據(jù)博弈結(jié)果的不同,又可分為零和博弈、常和博弈與變和博弈。三、博弈論的分類從行動(dòng)的先后次序來分,博弈可分為靜態(tài)博弈和動(dòng)態(tài)博弈。靜態(tài)博弈指在博弈中,參與人同時(shí)選擇行動(dòng),或雖非同時(shí)但后行動(dòng)者并不知道前行動(dòng)者采取了什么具體行動(dòng);動(dòng)態(tài)博弈指的是參與人的行動(dòng)有先后順序,且后行動(dòng)者能夠觀察到先行動(dòng)者所選擇的行動(dòng)的博弈。從參與人對其他參與人的各種特征信息的獲得差異來分,博弈可分為完全信息博弈和不完全信息博弈。完全信息指的是每一個(gè)參與人對所有其他參與人的特征,如策略集合及得益函數(shù)都有準(zhǔn)確完備的知識;否那么就是不完全信息。將上述兩個(gè)角度的劃分結(jié)合起來,我們就得到四種不同類型的博弈,這就是:完全信息靜態(tài)博弈,完全信息動(dòng)態(tài)博弈,不完全信息靜態(tài)博弈和不完全信息動(dòng)態(tài)博弈。17行動(dòng)次序信息靜態(tài)動(dòng)態(tài)完全信息納什均衡子博弈完美納什均衡不完全信息貝葉斯納什均衡完美貝葉斯納什均衡博弈的分類和均衡博弈論(GameTheory)又名對策論,游戲論博弈論,英文為Gametheory,是研究相互依賴、相互影響的決策主體的理性決策行為以及這些決策的均衡結(jié)果的理論。博弈論試圖研究既存在沖突又存在合作的情況下(如寡頭壟斷)人們的決策行為。博弈是一種勢態(tài),在該勢態(tài)中,兩個(gè)或更多的參與人都在追求他們各自的利益,沒有人能夠支配結(jié)果。博弈的過程就是一個(gè)策略上的相互作用過程。這使得任何一方的行為都必須考慮到對方可能作出的反映。博弈論是研究理性決策主體在其行為發(fā)生直接的相互作用時(shí)的策略選擇及策略均衡的理論。博弈分析的關(guān)鍵步驟是找出在別人選擇既定的情況下自己的最優(yōu)反響策略(給自己帶來最大收益的策略)。博弈論研究對象《學(xué)弈》(《孟子?告子》):弈秋,通國之善弈也。使弈秋侮二人弈,其一人專心致志,惟弈秋之為聽;一人雖聽之,一心以為有鴻鵠將至,思援弓繳而射之。雖與之俱學(xué),弗假設(shè)之矣。為是其智弗假設(shè)與?吾曰:非然也。1.博弈論在中國博弈論的產(chǎn)生和開展博弈又稱博戲,是一門古老的游戲?!妒辣尽氛f,“烏曹作博〞,烏曹乃是夏代著名之能工巧匠。千百年來,博弈更是與人們的生活緊緊相連,從博棋到牌戲,從斗戲到彩票,中華民族的歷史長河中就這樣形成了別具風(fēng)情的博弈文化。從孫子兵法到三十六計(jì)從田忌賽馬到孫龐斗智從運(yùn)籌帷幄到韜光養(yǎng)晦從曹劌論戰(zhàn)到論持久戰(zhàn)2.博弈論的開山之作1943年,馮·諾依曼和摩根斯頓發(fā)表《博弈論和經(jīng)濟(jì)行為》,標(biāo)志著博弈論作為一門獨(dú)立科學(xué)的開始,也標(biāo)志著新古典經(jīng)濟(jì)學(xué)進(jìn)入了一個(gè)新的開展階段。JohnNashJohnHarsanyLeihadenSelten3.1994年三位獲諾獎(jiǎng)的博弈論學(xué)者4.1996年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)得主:詹姆斯莫里斯主要奉獻(xiàn):不對稱信息條件下的鼓勵(lì)理論5.2001年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)得主:邁克爾·斯賓塞:在不對稱信息市場分析方面所做出開創(chuàng)性研究。

6.2005年二位獲諾獎(jiǎng)的博弈論學(xué)者RobertAumannThomasShelling局中人或參與者(Players)規(guī)那么(rules):規(guī)定博弈各方的行動(dòng)順序、方式、以及最終的結(jié)果等。策略(Strategy):一整套的行動(dòng)方案,規(guī)定了各種情況下的行動(dòng)。比方:敵進(jìn)我退,敵退我追,敵駐我擾,敵疲我打。根本概念回憶相機(jī)策略(contingentstrategy):僅在不確定事件發(fā)生時(shí)才會采取的策略。如:人不犯我,我不犯人;人假設(shè)犯我,我必犯人。行動(dòng):局中人在特定條件下的行為支付(Pay-off):博弈結(jié)束時(shí),各方得到的收益。策略均衡:參與者之間穩(wěn)定的、可預(yù)測的互動(dòng)行為模式,就是策略均衡。上策均衡我所做的是不管你做什么我所能做的最好的你所做的是不管我做什么你所能做的最好的NASH均衡我所做的是給定你所做的我所能做的最好的你所做的是給定我所做的你所能做的最好的上策與上策均衡所謂上策,是指這樣一種策略,即不管對手采取什么策略,這種策略都是最優(yōu)的。而當(dāng)對局者選擇的都是上策的時(shí)候,這種均衡叫做上策均衡。均衡是指一種穩(wěn)定結(jié)局,當(dāng)這種結(jié)局出現(xiàn)的時(shí)候,所有對局者都不想再改變他們所選擇的策略。上策均衡與前面的均衡的區(qū)別:第一,完全競爭、壟斷競爭等市場結(jié)構(gòu)中最終實(shí)現(xiàn)的均衡狀態(tài)都是在假定廠商是追求最大利潤的,而且廠商在均衡狀態(tài)也實(shí)現(xiàn)了最大利潤。第二,在上述幾種競爭模式中,可供廠商選擇的競爭策略也相對較少。上策均衡是博弈均衡的一種特殊狀態(tài)。納什均衡

納什均衡是指在對手策略既定的情況下,各自對局者所選擇的策略都是最好的。上策均衡與納什均衡的區(qū)別:⑴上策均衡是指不管你選擇什么策略,我所選擇的是最好的;不管我選擇什么策略,你所選擇的是最好的。⑵納什均衡是指給定你的策略,我所選擇的是最好的;給定我的策略,你所選擇的是最好的。⑶上策均衡是納什均衡的一種特殊情況,但納什均衡卻不一定是上策均衡。納什均衡的意義納什均衡是指在對手策略既定的情況下,各自對局者所選擇的策略都是最好的。合作是有利的“利己策略〞。但它必須符合以下黃金律:按照你愿意別人對你的方式來對別人,但只有他們也按同樣方式行事才行。也就是中國人說的“己所不欲勿施于人〞。但前提是人所不欲勿施于我?!凹{什均衡〞是一種非合作博弈均衡,在現(xiàn)實(shí)中非合作的情況要比合作情況普遍。“納什均衡〞是對合作博弈理論的重大開展,甚至可以說是一場革命。美麗

心靈約翰追求金發(fā)女郎追求其他女士雷哈德追求金發(fā)女郎0,02,1追求其他女士1,21,1A、B、C三人決斗,每人有2顆子彈,每次發(fā)一槍。A、B、C的命中概率分別為0.3、0.8、1.0。三人依次發(fā)射,兩輪后對決結(jié)束。每次可以選擇向?qū)κ职l(fā)射,也可以放空槍,射中即死。問在這場博弈中A的最優(yōu)策略。B:80%A:30%C:100%故事模型A的行動(dòng)選擇集合(1)對空發(fā)射,(2)射B,(3)射C如A對空發(fā)射,B有80%的可能殺死C(B必然射C,因?yàn)椋靡欢ㄟx擇射擊B,那么B必死);然后A有30%可能殺死B(僅A,B;A必射B);如未能殺死B,那么B向A射擊(A存活概率0.2)。存活概率0.8*(0.3+0.7*0.2)=0.352。如B未射死C,那么C射殺B,然后A要么成功射殺C,要么被C射殺;存活概率為0.2*0.3=0.06??傮w存活概率41.2%。A射空B射死C0.8B未射死C0.2A射死B0.3A未射死B0.7B射A不中0.2A射死C0.3A未射死C0.7C射A不中0對空發(fā)射:存活概率為:0.8×(0.3+0.7×0.2)+0.2×0.3=41.2%向C發(fā)射:存活概率為:0.3×0.2×(0.7+0.3×0.2)+0.7×41.2%=33.4%向B發(fā)射:存活概率為:0.7×41.2%=28.84%A可以采取的行動(dòng)A和B似乎達(dá)成了某種默契:在C被干掉之前,他們相互不是敵人。畢竟人總要優(yōu)先考慮對付最大的威脅,同時(shí)這個(gè)威脅還為他們找到了共同利益,聯(lián)手打倒這個(gè)人,他們的生存時(shí)機(jī)都上升。而且,從悲觀的角度看,他們恐怕也活不到需要相互拼個(gè)你死我活的時(shí)候。但這個(gè)“同盟〞也是很不牢固的,兩個(gè)人都在時(shí)時(shí)權(quán)衡利弊,一旦背叛的好處大于默契的好處,他們馬上就會翻臉。在這個(gè)“同盟〞里,最忠誠的是B—只要C不死,他就不會背叛;A就要滑頭多了,在前面輪流開槍的例子中,他不朝C開槍,從同盟者的角度說,就是沒有履行義務(wù),而把盟友送上危險(xiǎn)的境地,這不是因?yàn)榈赖滤讲煌翘幘巢煌?。B是C的頭號目標(biāo),這個(gè)敵人一定要向他開槍的,完全沒有盤旋的余地;而A不同,他隨時(shí)愿意犧牲B?lián)Q取下次自己的先手之利。除了壓力較小之外,而且還有一個(gè)動(dòng)力驅(qū)使A背叛,那就是一旦干掉C后,B的時(shí)機(jī)比他要大,他至少要保持先下手,才可能一爭高低。諸葛亮在《隆中對》中提出“跨有荊益、東有孫權(quán)、北圖中原〞,他舌戰(zhàn)群儒,力勸東吳孫權(quán)與劉備聯(lián)盟。所以,弱者總是有動(dòng)力去維持一個(gè)穩(wěn)定的三角形結(jié)構(gòu):與次強(qiáng)者聯(lián)盟,但是卻不愿真正消滅強(qiáng)者。三國中的博弈—聯(lián)吳抗魏火燒赤壁一戰(zhàn),孫劉聯(lián)軍大敗曹操,曹操北逃。諸葛亮明知關(guān)羽重義氣,必然放走曹操,為何還將捉曹重任交給關(guān)羽?結(jié)論:諸葛亮并不想殺掉曹操——曹操一死,劉備亦亡矣!有人會問:既然放操,為何又設(shè)三重?cái)r截?如果孫權(quán)知道諸葛放操,那么孫劉聯(lián)盟瓦解,因此,既要放,又不能讓孫權(quán)看出是有意放。三國中的博弈—華容道揭示思想:一個(gè)人,在社會上的生存不僅取決于其能力大小,還要看其威脅到的人?,F(xiàn)實(shí)例子:總統(tǒng)競選,實(shí)力最弱的開始時(shí)總是表現(xiàn)低調(diào),實(shí)力強(qiáng)勁與實(shí)力中等者互相攻擊,狼狽不堪,這時(shí)最弱的競選者粉墨登場。“功高震主〞“木秀于林,風(fēng)必摧之〞一個(gè)對他人利益不構(gòu)成威脅的人,自然不會是他人意欲除掉的對象,反而能在各種政治風(fēng)云中幸存下來。能力最強(qiáng),本領(lǐng)最大的人,反而最有可能走向悲劇結(jié)果。C的存活概率只有14%。能力處于中間狀態(tài)的,是最可能存活的。B:56%能力最弱的,也可以比最強(qiáng)者有更大的生存時(shí)機(jī)。A:41.2%。孫權(quán)不但“火燒赤壁〞打敗曹操,更在此后還長期承擔(dān)了對抗曹操的主要任務(wù)。而劉備雖在赤壁之戰(zhàn)中也出了力,但此后幾年未與曹操打過大仗(也就是沒有盡聯(lián)盟義務(wù))。倒是趁此時(shí)機(jī)掃蕩地方勢力,擴(kuò)充地盤,直至占據(jù)兩川,將曹操趕出漢中,又派關(guān)羽北伐,水淹七軍,不但取代了孫權(quán)原來的老二地位,甚至有可能擊敗曹操,成為新的老大。孫權(quán)地位跌落到老三,他的策略也隨之改變。于是孫權(quán)趁關(guān)羽北伐前方空虛之機(jī),與曹操合謀,奪取了荊州,殺死關(guān)羽。結(jié)果是同盟破裂,劉備興兵報(bào)仇,又被孫權(quán)打敗。蜀漢從此衰落,東吳也面臨了兩面作戰(zhàn)的不利局面。三國中的博弈—孫劉聯(lián)盟的瓦解如果分析一下孫權(quán)的心理,我們可能對他的背信棄義有更多同情。赤壁之戰(zhàn)盡管符合他的利益,但到底是他出力挽救了劉備,此后他不但把荊州長期借給劉備,還把妹妹嫁給了這個(gè)老頭子。他盡了同盟的義務(wù),曾與曹操大戰(zhàn)數(shù)次,不僅損兵折將(他的大將太史慈、董襲、陳武等都在戰(zhàn)斗中陣亡),他自己也險(xiǎn)些在逍遙津送命??蓮氖找嫔险f,他與劉備是“牛打江山馬坐殿〞,感到不平衡是正常的??墒菑膶Σ哒搧砜?,孫權(quán)卻犯了一個(gè)大錯(cuò)誤,由于嫉妒,他過早和劉備翻臉,致使兩敗俱傷。這就好比槍手A突然翻臉向B開火。坐收漁利的當(dāng)然是C。雖然曹操的繼任者曹丕沒能抓住時(shí)機(jī)夾攻孫權(quán),一舉消滅這兩個(gè)敵手,但蜀和吳此后已經(jīng)沒有可能打敗魏國了。那么,孫權(quán)的最優(yōu)策略是什么?回想上面的槍手決斗就明白了。既然已經(jīng)落到A的地位,就該以A的策略行事。讓劉備去和曹操惡斗,自己擴(kuò)充勢力,養(yǎng)精蓄銳,隨機(jī)應(yīng)變。無論兩者勝負(fù),自己都能從中漁利。三國中的博弈—孫劉聯(lián)盟的瓦解面對諸葛亮的空城,司馬懿真的是不敢攻城嗎?非也!正是因?yàn)橹T葛亮的存在,才使曹魏對其有所依賴。一旦諸葛亮倒下,也就是他被逐出朝廷甚至迫害的日子?!巴盟拦放毹暭词惯@個(gè)道理。既然“兔死狗烹〞,那么獵狗最好不要讓兔子全部死掉。三國中的博弈—空城計(jì)公路塞車,大家都遵守交規(guī),一個(gè)人違規(guī)進(jìn)入自行車道,得廉價(jià),但如果每人都這樣,那么人人都吃虧。如每個(gè)人都守規(guī)矩,那么一個(gè)不守規(guī)矩的就會獲得好處,每個(gè)人都不守規(guī)矩,那么人人都失利。兩人因盜竊被捕,警方疑心其有搶劫行為但未獲得確鑿證據(jù)可以判他們犯了搶劫罪,除非有一人供認(rèn)或兩人都供認(rèn)。即使兩人都不供認(rèn),也可以判他們犯盜竊物品的輕罪。囚徒被別離審查,不允許他們之間或通信息,并交代政策如下:如果兩人都供認(rèn),每個(gè)人都將因搶劫罪加盜竊罪被判3年監(jiān)禁;如果兩人都拒供,那么兩人都將因盜竊罪被判半年監(jiān)禁;如果一人供認(rèn)而另一個(gè)拒供,那么供認(rèn)這被認(rèn)為有功而免受處分,拒供者將因搶劫罪、盜竊罪以及拒供重判5年。囚徒困境模型拒供供認(rèn)拒供0.5年,0.5年5年,0年供認(rèn)0年,5年3年,3年乙甲囚徒困境贏利表(PayoffTable)每個(gè)囚徒都會發(fā)現(xiàn)如果對方拒供,那么自己供認(rèn)便可立即獲得釋放,而自己拒供那么會被判0.5年,因此供認(rèn)是較好的選擇。如果對方供認(rèn),那么自己供認(rèn)將被判3年,而自己拒供那么會被判5年,因此供認(rèn)是較好的選擇。由于每個(gè)囚徒都發(fā)現(xiàn)供認(rèn)是自己更好的選擇,因此,博弈的穩(wěn)定結(jié)果是兩個(gè)囚徒都會選擇供認(rèn)。這就是博弈的納什均衡。攻守同盟?很難達(dá)成:隔離審查,每個(gè)人都擔(dān)憂對方背棄盟約。囚徒困境“囚徒的兩難選擇〞有著廣泛而深刻的意義。個(gè)人理性與集體理性的沖突,各人追求利己行為而導(dǎo)致的最終結(jié)局是一個(gè)“納什均衡〞,也是對所有人都不利的結(jié)局。他們兩人都是在坦白與抵賴策略上首先想到自己,這樣他們必然要服長的刑期。只有當(dāng)他們都首先替對方著想時(shí),或者相互合謀(串供)時(shí),才可以得到最短時(shí)間的監(jiān)禁的結(jié)果。囚徒困境的啟示傳統(tǒng)經(jīng)濟(jì)學(xué)的鼻祖亞當(dāng)·斯密在其傳世經(jīng)典《國民財(cái)富的性質(zhì)和原因的研究》中這樣描述市場機(jī)制:“當(dāng)個(gè)人在追求他自己的私利時(shí),市場的看不見的手會導(dǎo)致最正確經(jīng)濟(jì)后果。〞這就是說,每個(gè)人的自利行為在“看不見的手〞的指引下,追求自身利益最大化的同時(shí)也促進(jìn)了社會公共利益的增長。即自利會帶來互利。傳統(tǒng)經(jīng)濟(jì)學(xué)秉承了亞當(dāng)·斯密的思想。傳統(tǒng)經(jīng)濟(jì)學(xué)認(rèn)為:人的經(jīng)濟(jì)行為的根本動(dòng)機(jī)是自利,自私是個(gè)好東西,每個(gè)人都有權(quán)追求自己的利益,沒有私社會就不會進(jìn)步,現(xiàn)代社會的財(cái)富是建立在對每個(gè)人自利權(quán)利的保護(hù)上的。因此經(jīng)濟(jì)學(xué)不必?fù)?dān)憂人們參與競爭的動(dòng)力,只需關(guān)注如何讓每個(gè)求利者能夠自由參與盡可能展開公平競爭的市場機(jī)制。只要市場機(jī)制公正,自然會增進(jìn)社會福利。經(jīng)濟(jì)學(xué)中的理性人成立嗎?但是囚徒困境的結(jié)果,恰恰說明個(gè)人理性不能通過市場導(dǎo)致社會福利的最優(yōu)。每一個(gè)參與者可以相信市場所提供的一切條件,但無法確信其他參與者是否能與自己一樣遵守市場規(guī)那么。佛家講因果律,儒家講究“財(cái)自道生,利緣義取〞。從囚徒困境看來,如果一味地想算計(jì)別人,算來算去,最后算計(jì)到自己頭上來了。如果我們將囚徒困境中的有期徒刑改為死刑,那么“機(jī)關(guān)算盡太聰明,反誤了卿卿性命〞用在這里是再恰當(dāng)不過的了。個(gè)人理性與集體理性的沖突“人質(zhì)”方案長期關(guān)系和重復(fù)博弈報(bào)復(fù)與懲罰(株連制)如何走出囚徒困境奔馳等待前行別克等待0,01,5前行5,1-100,-100開車博弈設(shè)想湯姆和吉米是兩個(gè)頑皮的小孩,他們在小伙伴的煽動(dòng)下要進(jìn)行一場關(guān)于勇氣的比賽:兩人分別從一條獨(dú)木橋的兩端沖向?qū)Ψ?,誰退卻誰就是“小雞〞。顯然,如果兩個(gè)人都向前沖,那么兩敗俱傷,設(shè)支付水平為-2;如果一個(gè)勇進(jìn)而另一個(gè)退卻,那么勇進(jìn)者受到小伙伴的歡呼,退卻者受到嘲諷,設(shè)支付分別為4和-1;假設(shè)兩人同時(shí)退卻,那么一起受到小伙伴的嘲笑,設(shè)支付為0,因?yàn)閮扇艘黄鹗艿匠靶Ρ绕鹨蝗藛为?dú)受到嘲笑要好受些。斗雞博弈(chickengame)(膽小鬼博弈)

吉米退卻勇進(jìn)退卻湯姆勇進(jìn)0,0-1,44,-1-2,-2有兩個(gè)均衡。實(shí)際會怎樣?這個(gè)博弈也有兩個(gè)納什均衡:(進(jìn),退),(退,進(jìn))該例也有許多應(yīng)用。有些公共產(chǎn)品的供給就屬于此類問題。假設(shè)村子里住的是兩戶富人,有一條路要修,一種可能的情況是,一家修路,另一家就不修;一家不修,另一家就得修。(總結(jié)一下,公共產(chǎn)品的供給可能是囚徒博弈,也可能是智豬博弈,還有可能是斗雞博弈,依具體產(chǎn)品而論)

冷戰(zhàn)期間,蘇美兩個(gè)軍事集團(tuán)在世界各地?fù)屨嫉乇P,也是一種斗雞博弈。一般來說,如果一方已經(jīng)搶占了一塊地盤,另一方就設(shè)法占領(lǐng)另一塊地盤,而不是與對手競爭同一塊地盤。

還有警察與游行隊(duì)伍的例子。游行隊(duì)伍與警察越來越近,這時(shí)候,定要有一方退下來。如果警察不讓步,游行隊(duì)伍便會后退;反過來,如果游行隊(duì)伍來勢很猛,警察就得撤退。夫妻間矛盾也是個(gè)斗雞問題。一般來說,吵得厲害了,不是妻子回娘家躲一躲,就是丈夫到院子里抽支煙。當(dāng)然,斗雞博弈的一個(gè)重要問題是,究竟哪一方退下來,因?yàn)橥讼聛黼m比兩敗俱傷好,總歸是一件丟面子的事情。假設(shè)每一方都寄希望于對方退下陣來,兩敗俱傷的結(jié)局也可能出現(xiàn)。流浪漢找工作流浪政府救濟(jì)3,2-1,3不救濟(jì)-1,10,0政府與流浪漢博弈智豬博弈說的是,有兩頭非常聰明的豬(要不怎么叫智豬呢),一大一小共同生活在一個(gè)豬圈里。豬圈的一端有一個(gè)踏板,踏板連著開放飼料的機(jī)關(guān)。只要踏一下,在豬圈的另一端就會出現(xiàn)10個(gè)單位食物。經(jīng)過精確的衡量,任何一頭豬去踏這個(gè)踏板都會付出相當(dāng)于兩個(gè)單位食物的本錢;每只豬都可以選擇“踏〞或者“不踏〞踏板。那么,大豬小豬分別會做什么選擇呢?什么是智豬博弈若小豬去踏,大豬先候在槽邊,則當(dāng)小豬趕到槽邊時(shí)大豬已經(jīng)吃光了10個(gè)單位食物,小豬不僅什么都沒吃到,反而付出了2個(gè)單位成本智豬們的選擇若大豬去踏,小豬先等候在是食槽邊,則大豬因時(shí)間耽擱只食得6個(gè)單位食物,小豬食得4個(gè)單位食物,大豬扣除成本后贏利4單位食物,小豬沒有成本因而贏利也為4單位食物;兩只豬一起去踏,然后一起回槽邊進(jìn)食,則大豬由于食的更快可吃下8個(gè)單位食物,小豬只能吃到2個(gè)單位食物,扣除各自的成本,大豬實(shí)際贏利6個(gè)單位食物,小豬則贏利0個(gè)單位食物;兩只豬都不去踏,則大家都只能贏利0選擇智豬博弈的收益矩陣(4-1)

小豬大豬

觀察此博弈發(fā)現(xiàn):小豬有優(yōu)勢策略——無論大豬踏或不踏,小豬選擇不踏總是最適宜的,但是大豬沒有優(yōu)勢策略踏不踏踏6,04,4不踏10,-20,0投食僅原來的一半分量。結(jié)果是小豬大豬都不去踩踏板了。小豬去踩,大豬將會把食物吃完;大豬去踩,小豬將也會把食物吃完。誰去踩踏板,就意味著為對方奉獻(xiàn)食物,所以誰也不會有踩踏板的動(dòng)力了。如果目的是想讓豬們?nèi)ザ嗖忍ぐ?,這個(gè)游戲規(guī)那么的設(shè)計(jì)顯然是失敗的。改變方案一:減量方案投食為原來的一倍分量。結(jié)果是小豬、大豬都會去踩踏板。誰想吃,誰就會去踩踏板。反正對方不會一次把食物吃完。小豬和大豬相當(dāng)于生活在物質(zhì)相對豐富的“共產(chǎn)主義〞社會,所以競爭意識卻不會很強(qiáng)。對于游戲規(guī)那么的設(shè)計(jì)者來說,這個(gè)規(guī)那么的本錢相當(dāng)高(每次提供雙份的食物);而且因?yàn)楦偁幉粡?qiáng)烈,想讓豬們?nèi)ザ嗖忍ぐ宓男Ч⒉缓?。改變方案二:增量方案投食僅原來的一半分量,但同時(shí)將投食口移到踏板附近。結(jié)果呢,小豬和大豬都在拼命地?fù)屩忍ぐ?。等待者不得食,而多勞者多得。每次的收獲剛好消費(fèi)完。

對于游戲設(shè)計(jì)者,這是一個(gè)最好的方案。本錢不高,但收獲最大。改變方案三:減量加移位方案原版的“智豬博弈〞故事給了競爭中的弱者(小豬)以等待為最正確策略的啟發(fā)。但是對于社會而言,因?yàn)樾∝i未能參與競爭,小豬搭便車時(shí)的社會資源配置的并不是最正確狀態(tài)。為使資源最有效配置,規(guī)那么的設(shè)計(jì)者是不愿看見有人搭便車的,政府如此,公司的老板也是如此。而能否完全杜絕“搭便車〞現(xiàn)象,就要看游戲規(guī)那么的核心指標(biāo)設(shè)置是否適宜了。智豬博弈的啟示智豬博弈深刻的反映了經(jīng)濟(jì)和社會生活中的免費(fèi)搭便車問題。無論大豬踏或不踏,小豬都選擇不踏;給定小豬不踏,大豬最好去踏。有意思的是大豬選擇踏在主觀上是為了自己的利益,但在客觀上小豬也享受到了好處。在經(jīng)濟(jì)學(xué)里,這頭小豬被稱為“搭便車者〞。假設(shè)全部的博弈主體都試圖免費(fèi)搭車,那么就可能陷入囚徒困境搭便車者請列舉“搭便車〞的現(xiàn)象沖開水、搞衛(wèi)生;股市上莊家與散戶20世紀(jì)70年代末80年代初,美國市場上私人標(biāo)簽(privatelabel)的軟飲料價(jià)格廉價(jià)、質(zhì)量較差,因此占有較低的市場份額??煽诳蓸饭竞桶偈驴蓸饭咀畛跄苋萑踢@些私人標(biāo)簽飲料的存在,因?yàn)樗鼈兪切∝i,威脅有限??墒菦]過多久,一家主要的私人標(biāo)簽飲料供給商Cott公司通過挑釁性的定價(jià)和較高的質(zhì)量,從擁有較低市場份額的地區(qū)品牌,成長為一個(gè)擁有三分之一市場份額的、旗鼓相當(dāng)?shù)母偁幷?。此時(shí),可口可樂公司和百事可樂公司通過降低價(jià)格這種進(jìn)攻性的行動(dòng),使私人標(biāo)簽軟飲料的市場份額立即瓦解了。如果一個(gè)制度不是一個(gè)好制度,那么就會有人試圖推翻這項(xiàng)制度并建立新的制度。但是,改革是有本錢的,需要流汗,甚至流血??傆幸恍┤顺洚?dāng)“大豬〞的角色,為改革東奔西走,承擔(dān)為改革而付出的代價(jià),而另一些人就象小豬一樣,沒有為改革付出努力,卻坐享了改革的成果,是“免費(fèi)搭車者〞。如果這個(gè)社會人人都想搭免費(fèi)車,都不站出來向舊制度發(fā)難,那么并不美好的舊制度就會被長期鎖定。這也許可以解釋為什么有些制度明明不合理卻又長期存在的現(xiàn)象。改革與制度鎖定小企業(yè)通常模仿大企業(yè)的產(chǎn)品,等大企業(yè)通過廣告翻開市場后出售廉價(jià)模仿品。大企業(yè)作為“大豬〞常會花錢進(jìn)行研究開發(fā)、技術(shù)創(chuàng)新,而小企業(yè)作為小豬,常常等待大企業(yè)開發(fā)出新技術(shù)、新產(chǎn)品后模仿起技術(shù)和產(chǎn)品并生產(chǎn)和出售類似產(chǎn)品。技術(shù)創(chuàng)新便車小偷與守衛(wèi)的博弈混合策略博弈的幾個(gè)原那么混合策略

守衛(wèi)睡不睡小偷偷6,-2-3,0不偷0,20,0給定工人偷懶,老板的最優(yōu)選擇是監(jiān)督;給定老板監(jiān)督,工人的最優(yōu)選擇是不偷懶;給定工人不偷懶,老板的最優(yōu)選擇是不監(jiān)督;給定老板不監(jiān)督,工人的最優(yōu)選擇是偷懶;如此循環(huán)。小偷與守衛(wèi)的博弈策略組合不可能是單一的策略或者純策略,而必須把不同的策略混合一起使用,這種博弈也稱之為“混合策略〞博弈,所到達(dá)的均衡也稱之為混合策略均衡。不能讓對方事先知道自己可能采取的策略。必須采取隨機(jī)選擇的原那么。選擇策略的概率一定要使對方無機(jī)可乘?;旌喜呗圆┺牡膸讉€(gè)原那么如果博弈不是一次的,而是重復(fù)進(jìn)行的,參與人過去行動(dòng)的歷史是可以觀察到的,參與人就可以將自己的選擇依賴于其他人之前的行動(dòng),因而有了更多的戰(zhàn)略可以選擇,均衡結(jié)果可能與一次博弈大不相同。重復(fù)博弈理論的最大奉獻(xiàn)是對人們之間的合作行為提供了理性解釋;在囚徒困境中,一次博弈的唯一均衡是不合作(即坦白)。但如果博弈無限重復(fù),合作就可能出現(xiàn)。對重復(fù)博奕的研究結(jié)果證明有一種最好的策略:只需將一個(gè)原那么貫穿始終,即“以牙還牙〞。以牙還牙策略的獲勝有一個(gè)十分重要的條件,即博弈是無限次重復(fù)的。例如:小攤小販和黔驢技窮重復(fù)博弈重復(fù)博弈;足夠耐心;相對確定額環(huán)境;欺騙可以被觀察到;受騙人有積極性懲罰。信譽(yù)的條件欺騙的短期收益信譽(yù)的長期收益時(shí)間眼前利益與長遠(yuǎn)利益在傳統(tǒng)社會,人們常年生活在封閉的村莊,村民之間彼此非常熟悉,欺騙行為很容易識別,人們之間的口頭交流足以使任何欺騙行為廣為而知,每個(gè)人的歷史都存儲在別人的腦海里,對欺騙行為的懲罰即使不能施加于欺騙者本人,也可以通過家庭成員而實(shí)現(xiàn),前面講的四個(gè)條件根本是可以得到滿足。因此,即使沒有法律,村民之間也可以建立起高度的信任,欺騙行為很少發(fā)生。傳統(tǒng)社會的個(gè)人信譽(yù)現(xiàn)在社會被稱為“匿名社會〞(anonymoussociety),與鄉(xiāng)村社會不同,居民的流動(dòng)性大,交易雙方通常并不認(rèn)識,相互之間也缺少如鄉(xiāng)村社會中存在的其他制約關(guān)系,使得受害人的懲罰措施受到很大限制;開放的社會也使得人們較不在乎閑言碎語的議論。凡此種種,使得傳統(tǒng)的以個(gè)人為根底的信譽(yù)機(jī)制失靈,這也是都市社會犯罪率高的一個(gè)重要原因。但是,西方市場經(jīng)濟(jì)之所以能發(fā)到達(dá)今天的程度,除了較完善的司法制度之外,是因?yàn)樗麄冊诟叩男螒B(tài)上復(fù)制出了前面講的四個(gè)條件。商業(yè)社會的問題對局者選擇策略有時(shí)間先后的順序,某些對局者可能率先采取行動(dòng)。這種博弈被稱為序列博弈,序列博弈那么是另一種動(dòng)態(tài)博弈形式。市場進(jìn)入的博弈序列博弈

廠商B進(jìn)入不進(jìn)入廠商A進(jìn)入-20,-2050,0不進(jìn)入0,500,0市場進(jìn)入的博弈廠商A·進(jìn)入不進(jìn)入廠商B·廠商B·進(jìn)入(-20,-20)

不進(jìn)入(50,0)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論