版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第頁(yè)博弈論判斷題(每小題1分,共15分)囚徒困境說(shuō)明個(gè)人的理性選擇不一定是集體的理性選擇。(√)子博弈精煉納什均衡不是一個(gè)納什均衡。(×)若一個(gè)博弈出現(xiàn)了皆大歡喜的結(jié)局,說(shuō)明該博弈是一個(gè)合作的正和博弈。()博弈中知道越多的一方越有利。(×)納什均衡一定是上策均衡。(×)上策均衡一定是納什均衡。(√)在一個(gè)博弈中只可能存在一個(gè)納什均衡。(×)在一個(gè)博弈中博弈方可以有很多個(gè)。(√)在一個(gè)博弈中如果存在多個(gè)納什均衡則不存在上策均衡。(√)在博弈中納什均衡是博弈雙方能獲得的最好結(jié)果。(×)在博弈中如果某博弈方改變策略后得益增加則另一博弈方得益減少。(×)上策均衡是帕累托最優(yōu)的均衡。(×)因?yàn)榱愫筒┺闹胁┺姆街g關(guān)系都是競(jìng)爭(zhēng)性的、對(duì)立的,因此零和博弈就是非合作博弈。在動(dòng)態(tài)博弈中,因?yàn)楹笮袆?dòng)的博弈方可以先觀察對(duì)方行為后再選擇行為,因此總是有利的。(×)在博弈中存在著先動(dòng)優(yōu)勢(shì)和后動(dòng)優(yōu)勢(shì),所以后行動(dòng)的人不一定總有利,例如:在斯塔克伯格模型中,企業(yè)就可能具有先動(dòng)優(yōu)勢(shì)。囚徒的困境博弈中兩個(gè)囚徒之所以會(huì)處于困境,無(wú)法得到較理想的結(jié)果,是因?yàn)閮汕敉蕉疾辉诤踝螘r(shí)間長(zhǎng)短本身,只在乎不能比對(duì)方坐牢的時(shí)間更長(zhǎng)。納什均衡即任一博弈方單獨(dú)改變策略都只能得到更小利益的策略組合。(√)不存在純戰(zhàn)略納什均衡和存在惟一的純戰(zhàn)略納什均衡,作為原博弈構(gòu)成的有限次重復(fù)博弈,共同特點(diǎn)是重復(fù)博弈本質(zhì)上不過(guò)是原博弈的簡(jiǎn)單重復(fù),重復(fù)博弈的子博弈完美納什均衡就是每次重復(fù)采用原博弈的納什均衡。(√)多個(gè)純戰(zhàn)略納什均衡博弈的有限次重復(fù)博弈子博弈完美納什均衡路徑:兩階段都采用原博弈同一個(gè)純戰(zhàn)略納什均衡,或者輪流采用不同純戰(zhàn)略納什均衡,或者兩次都采用混合戰(zhàn)略納什均衡,或者混合戰(zhàn)略和純戰(zhàn)略輪流采用。(√)如果階段博弈G={A1,A2,…,An;u1,u2,…,un)具有多重Nash均衡,那么可能(但不必)存在重復(fù)博弈G(T)的子博弈完美均衡結(jié)局,其中對(duì)于任意的t<T,在t階段的結(jié)局并不是G的Nash均衡。(√)(或:如果階段博弈G={A1,A2,…,An;u1,u2,…,un)具有多重Nash均衡,那么該重復(fù)博弈G(T)的子博弈完美均衡結(jié)局,對(duì)于任意的t<T,在t階段的結(jié)局一定是G的Nash均衡。)零和博弈的無(wú)限次重復(fù)博弈中,所有階段都不可能發(fā)生合作,局中人會(huì)一直重復(fù)原博弈的混合戰(zhàn)略納什均衡。(√)(或:零和博弈的無(wú)限次重復(fù)博弈中,可能發(fā)生合作,局中人不一定會(huì)一直重復(fù)原博弈的混合戰(zhàn)略納什均衡。(×))原博弈惟一的納什均衡本身是帕雷托效率意義上最佳戰(zhàn)略組合,符合各局中人最大利益:采用原博弈的純戰(zhàn)略納什均衡本身是各局中人能實(shí)現(xiàn)的最好結(jié)果,符合所有局中人的利益,因此,不管是重復(fù)有限次還是無(wú)限次,不會(huì)和一次性博弈有區(qū)別。(√)原博弈惟一的納什均衡本身是帕雷托效率意義上最佳戰(zhàn)略組合,符合各局中人最大利益,但惟一的納什均衡不是效率最高的戰(zhàn)略組合,存在潛在合作利益的囚徒困境博弈。(√)(或:原博弈惟一的納什均衡本身是帕雷托效率意義上最佳戰(zhàn)略組合,符合各局中人最大利益,不存在潛在合作利益的囚徒困境博弈。(×))根據(jù)參及人行動(dòng)的先后順序,博弈可以劃分為靜態(tài)博弈(staticgame)和動(dòng)態(tài)博弈(dynamicgame)。如果階段博弈G有唯一的Nash均衡,那么對(duì)任意有限次T,重復(fù)博弈G(T)有唯一的子博弈完美結(jié)局:在每一階段取G的Nash均衡策略。(√)四、名詞解釋(每小題3分,共15分)參及人(player)指的是博弈中選擇行動(dòng)以最大化自己效用(收益)的決策主體,參及人有時(shí)也稱局中人,可以是個(gè)人,也可以是企業(yè)、國(guó)家等團(tuán)體;策略(strategy)是參及人選擇行動(dòng)的規(guī)則,如“以牙還牙”是一種策略;信息(information)是指參及人在博弈中的知識(shí),尤其是有關(guān)其他參及人的特征和行動(dòng)的知識(shí);支付(payoff)函數(shù)是參及人從博弈中獲得的效用水平,它是所有參及人策略或行動(dòng)的函數(shù),是每個(gè)參及人很關(guān)心的東西;結(jié)果(outcome)是指博弈分析者感興趣的要素的集合,常用支付矩陣或收益矩陣來(lái)表示;均衡(equilibrium)是所有參及人的最優(yōu)策略或行動(dòng)的組合。靜態(tài)博弈指參及人同時(shí)選擇行動(dòng)或雖非同時(shí)但后行動(dòng)者并不知道先行動(dòng)者采取什么樣的行動(dòng);動(dòng)態(tài)博弈指參及人的行動(dòng)有先后順序,且后行動(dòng)者能夠觀察到先行動(dòng)者所選擇的行動(dòng)。博弈就是一些個(gè)人、隊(duì)組或其他組織,面對(duì)一定的環(huán)境條件,在一定的規(guī)則下,同時(shí)或先后,一次或多次,從各自允許選擇的行為或策略中進(jìn)行選擇并加以實(shí)施,各自取得相應(yīng)結(jié)果的過(guò)程。零和博弈:也稱“嚴(yán)格競(jìng)爭(zhēng)博弈”。博弈方之間利益始終對(duì)立,偏好通常不同變和博弈:零和博弈和常和博弈以外的所有博弈。合作利益存在,博弈效率問(wèn)題的重要性。完全信息靜態(tài)博弈即各博弈方同時(shí)決策,且所有博弈方對(duì)各方得益都了解的博弈。上策:不管其它博弈方選擇什么策略,一博弈方的某個(gè)策略給他帶來(lái)的得益始終高于其它的策略,至少不低于其他策略的策略上策均衡:一個(gè)博弈的某個(gè)策略組合中的所有策略都是各個(gè)博弈方各自的上策,必然是該博弈比較穩(wěn)定的結(jié)果嚴(yán)格下策:不管其它博弈方的策略如何變化,給一個(gè)博弈方帶來(lái)的收益總是比另一種策略給他帶來(lái)的收益小的策略合作博弈非合作博弈零和博弈常和博弈變和博弈上策均衡納什均衡納什均衡:在博弈中,如果由各個(gè)博弈方的各一個(gè)策略組成的某個(gè)策略組合中,任一博弈方的策略,都是對(duì)其余博弈方策略的組合的最佳對(duì)策,也即對(duì)任意都成立,則稱為的一個(gè)納什均衡(或納什均衡是指這樣一種策略組合,這種策略組合由所有參及人的最優(yōu)策略組成,即給定別人策略的情況下,沒(méi)有任何單個(gè)參及人有積極性選擇其他策略,從而沒(méi)有任何參及人有積極性打破這種均衡。)完全信息博弈混合策略:在博弈中,博弈方i的策略空間為,則博弈方以概率分布隨機(jī)在其k個(gè)可選策略中選擇的“策略”,稱為一個(gè)“混合策略”,其中對(duì)都成立,且帕累托上策均衡風(fēng)險(xiǎn)上策均衡聚點(diǎn)均衡重復(fù)博弈指同樣結(jié)構(gòu)的博弈重復(fù)多次,其中的每次博弈稱為“階段博弈”。階段博弈重復(fù)博弈中的每次博弈稱為“階段博弈”。貼現(xiàn)因子下一期的一單位支付在這一期的價(jià)值。觸發(fā)戰(zhàn)略(TriggerStrategy)首先試探合作,一旦發(fā)現(xiàn)對(duì)方不合作,則也用不合作相報(bào)復(fù)的戰(zhàn)略。子博弈精煉納什均衡(夫妻博弈)一對(duì)新婚夫妻為晚上看什么電視節(jié)目爭(zhēng)執(zhí)不下,丈夫(記為I方)要看足球比賽節(jié)目,而妻子(記為Ⅱ方)要看戲曲節(jié)目.他們新婚燕爾,相親相愛,所以若這方面的行動(dòng)不一致,則是很傷感情的.因此,這對(duì)夫妻間的爭(zhēng)執(zhí)是一次非零和對(duì)策。
二、計(jì)算及分析題(每小題15分,共45分)1、無(wú)限次重復(fù)博弈及有限重復(fù)博弈的區(qū)別:無(wú)限次重復(fù)博弈沒(méi)有結(jié)束重復(fù)的確定時(shí)間。在有限次重復(fù)博弈中,存在最后一次重復(fù)正是破壞重復(fù)博弈中局中人利益和行為的相互制約關(guān)系,使重復(fù)博弈無(wú)法實(shí)現(xiàn)更高效率均衡的關(guān)鍵問(wèn)題。無(wú)限次重復(fù)博弈不能忽視不同時(shí)間得益的價(jià)值差異和貼現(xiàn)問(wèn)題,必須考慮后一期得益的貼現(xiàn)系數(shù),對(duì)局中人和博弈均衡的分析必須以平均得益或總得益的現(xiàn)值為根據(jù)。無(wú)限次重復(fù)博弈及有限次重復(fù)博弈的共同點(diǎn):試圖“合作”和懲罰“不合作”是實(shí)現(xiàn)理想均衡的關(guān)鍵,是構(gòu)造高效率均衡戰(zhàn)略的核心構(gòu)件。2、可口可樂(lè)及百事可樂(lè)(參及者)的價(jià)格決策:雙方都可以保持價(jià)格不變或者提高價(jià)格(策略);博弈的目標(biāo)和得失情況體現(xiàn)為利潤(rùn)的多少(收益);利潤(rùn)的大小取決于雙方的策略組合(收益函數(shù));博弈有四種策略組合,其結(jié)局是:
(1)如果雙方都不漲價(jià),各得利潤(rùn)10單位;
(2)如果可口可樂(lè)不漲價(jià),百事可樂(lè)漲價(jià),可口可樂(lè)利潤(rùn)100,百事可樂(lè)利潤(rùn)-30;
(3)如果可口可樂(lè)漲價(jià),百事可樂(lè)不漲價(jià),可口可樂(lè)利潤(rùn)-20,百事可樂(lè)利潤(rùn)30;
(4)如果雙方都漲價(jià),可口可樂(lè)利潤(rùn)140,百事可樂(lè)利潤(rùn)35;求納什均衡。
博弈的穩(wěn)定狀態(tài)有兩個(gè):都不漲價(jià)或者都漲價(jià)(均衡),均衡稱為博弈的解。3、豬圈里有一頭大豬和一頭小豬,豬圈的一頭有一個(gè)飼料槽,另一頭裝有控制飼料供應(yīng)的按鈕。按一下按鈕就會(huì)有10個(gè)單位飼料進(jìn)槽,但誰(shuí)按誰(shuí)就要付出2個(gè)單位的成本。誰(shuí)去按按紐則誰(shuí)后到;都去按則同時(shí)到。若大豬先到,大豬吃到9個(gè)單位,小豬吃到一個(gè)單位;若同時(shí)到,大豬吃7個(gè)單位,小豬吃3個(gè)單位;若小豬先到,大豬吃六個(gè)單位,小豬吃4個(gè)單位。各種情況組合扣除成本后的支付矩陣可如下表示(每格第一個(gè)數(shù)字是大豬的得益,第二個(gè)數(shù)字是小豬的得益):小豬
按等待
大豬按5,14,4
等待9,-10,0求納什均衡。在這個(gè)例子中,我們可以發(fā)現(xiàn),大豬選擇按,小豬最好選擇等待,大豬選擇不按,小豬還是最好選擇等待。即不管大豬選擇按還是不按,小豬的最佳策略都是等待。也就是說(shuō),無(wú)論如何,小豬都只會(huì)選擇等待。這樣的情況下,大豬最好選擇是按,因?yàn)椴话吹脑挾拣I肚子,按的話還可以有4個(gè)單位的收益。所以納什均衡是(大豬按,小豬等待)。4、根據(jù)兩人博弈的支付矩陣回答問(wèn)題:abA2,30,0B0,04,2寫出兩人各自的全部策略,并用等價(jià)的博弈樹來(lái)重新表示這個(gè)博弈(6分)找出該博弈的全部純策略納什均衡,并判斷均衡的結(jié)果是否是Pareto有效。求出該博弈的混合策略納什均衡。(7分)(1)策略甲:AB乙:ab博弈樹(草圖如下:(2)PureNE(A,a);(B,b)都是Pareto有效,僅(B,b)是K-H有效。(3)MixedNE((2/5,3/5);(2/3,1/3))5、用反應(yīng)函數(shù)法求出下列博弈的所有純戰(zhàn)略納什均衡。參及人2abcdA2,33,23,40,3參及人1B4,45,20,11,2C3,14,11,410,2D3,14,1-1,210,1解答:純策略納什均衡為(B,a)及(A,c)分析過(guò)程:設(shè)兩個(gè)參及人的行動(dòng)分別為,player1的反應(yīng)函數(shù)player2的反應(yīng)函數(shù)交點(diǎn)為(B,a)及(A,c),因此純策略納什均衡為(B,a)及(A,c)。6、(entrydeterrence市場(chǎng)威懾)考慮下面一個(gè)動(dòng)態(tài)博弈:首先,在一個(gè)市場(chǎng)上潛在的進(jìn)入者選擇是否進(jìn)入,然后市場(chǎng)上的已有企業(yè)(在位者)選擇是否及新企業(yè)展開競(jìng)爭(zhēng)。在位者可能有兩種類型,溫柔型(左圖)和殘酷型(右圖),回答下面問(wèn)題。.進(jìn)入者在位者進(jìn)入者在位者進(jìn)入不進(jìn)入默許斗爭(zhēng)(20,30)(-10,0)(0,100)進(jìn)入者在位者進(jìn)入不進(jìn)入默許斗爭(zhēng)(-10,25)(0,100)(10,20)左圖:溫柔型右圖:殘酷型找出給定在位者的兩種類型所分別對(duì)應(yīng)的納什均衡,以及子博弈精煉納什均衡(12分)已有企業(yè)為溫柔型的概率至少多少時(shí),新企業(yè)才愿意進(jìn)入(8分)溫柔NE(in,accommodate)和(out,fight)。SPNE為(in,accommodate)殘酷NE(out,fight).SPNE同理8、博弈方1和博弈方2就如何分10,000元錢進(jìn)行討價(jià)還價(jià)。假設(shè)確定了以下規(guī)則:雙方同時(shí)提出自己要求的數(shù)額A和B,0≤A,B≤10,000。如果A+B≤10,000,則兩博弈方的要求得到滿足,即分別得A和B,但如果A+B>10,000,則該筆錢就沒(méi)收。問(wèn)該博弈的納什均衡是什么?如果你是其中一個(gè)博弈方,你會(huì)選擇什么數(shù)額?為什么?答十、納什均衡有無(wú)數(shù)個(gè)。最可能的結(jié)果是(5000,5000)這個(gè)聚點(diǎn)均衡。9、北方航空公司和新華航空公司分享了從北京到南方冬天度假勝地的市場(chǎng)。如果它們合作,各獲得500000元的壟斷利潤(rùn),但不受限制的競(jìng)爭(zhēng)會(huì)使每一方的利潤(rùn)降至60000元。如果一方在價(jià)格決策方面選擇合作而另一方卻選擇降低價(jià)格,則合作的廠商獲利將為零,競(jìng)爭(zhēng)廠商將獲利900000元。(1)將這一市場(chǎng)用囚徒困境的博弈加以表示。(2)解釋為什么均衡結(jié)果可能是兩家公司都選擇競(jìng)爭(zhēng)性策略。答:(1)用囚徒困境的博弈表示如下表:北方航空公司合作競(jìng)爭(zhēng)新華航空公司合作500000,5000000,900000競(jìng)爭(zhēng)900000,060000,60000(2)如果新華航空公司選擇競(jìng)爭(zhēng),則北方航空公司也會(huì)選擇競(jìng)爭(zhēng)(60000>0);若新華航空公司選擇合作,北方航空公司仍會(huì)選擇競(jìng)爭(zhēng)(900000>500000)。若北方航空公司選擇競(jìng)爭(zhēng),新華航空公司也將選擇競(jìng)爭(zhēng)(60000>0);若北方航空公司選擇合作,新華航空公司仍會(huì)選擇競(jìng)爭(zhēng)(900000>0)。由于雙方總偏好競(jìng)爭(zhēng),故均衡結(jié)果為兩家公司都選擇競(jìng)爭(zhēng)性策略,每一家公司所獲利潤(rùn)均為600000元。12、設(shè)啤酒市場(chǎng)上有兩家廠商,各自選擇是生產(chǎn)高價(jià)啤酒還是低價(jià)啤酒,相應(yīng)的利潤(rùn)(單位:萬(wàn)元)由下圖的得益矩陣給出:(1)有哪些結(jié)果是納什均衡?(2)兩廠商合作的結(jié)果是什么?答(1)(低價(jià),高價(jià)),(高價(jià),低價(jià))(2)(低價(jià),高價(jià))13、A、B兩企業(yè)利用廣告進(jìn)行競(jìng)爭(zhēng)。若A、B兩企業(yè)都做廣告,在未來(lái)銷售中,A企業(yè)可以獲得20萬(wàn)元利潤(rùn),B企業(yè)可獲得8萬(wàn)元利潤(rùn);若A企業(yè)做廣告,B企業(yè)不做廣告,A企業(yè)可獲得25萬(wàn)元利潤(rùn),B企業(yè)可獲得2萬(wàn)元利潤(rùn);若A企業(yè)不做廣告,B企業(yè)做廣告,A企業(yè)可獲得10萬(wàn)元利潤(rùn),B企業(yè)可獲得12萬(wàn)元利潤(rùn);若A、B兩企業(yè)都不做廣告,A企業(yè)可獲得30萬(wàn)元利潤(rùn),B企業(yè)可獲得6萬(wàn)元利潤(rùn)。(1)畫出A、B兩企業(yè)的支付矩陣。(2)求納什均衡。3.答:(1)由題目中所提供的信息,可畫出A、B兩企業(yè)的支付矩陣(如下表)。B企業(yè)做廣告不做廣告A企業(yè)做廣告20,825,2不做廣告10,1230,6(2)因?yàn)檫@是一個(gè)簡(jiǎn)單的完全信息靜態(tài)博弈,對(duì)于純策納什均衡解可運(yùn)用劃?rùn)M線法求解。如果A廠商做廣告,則B廠商的最優(yōu)選擇是做廣告,因?yàn)樽鰪V告所獲得的利潤(rùn)8大于不做廣告獲得的利潤(rùn)2,故在8下面劃一橫線。如果A廠商不做廣告,則B廠商的最優(yōu)選擇也是做廣告,因?yàn)樽鰪V告獲得的利潤(rùn)為12,而不做廣告的利潤(rùn)為6,故在12下面劃一橫線。如果B廠商做廣告,則A廠商的最優(yōu)選擇是做廣告,因?yàn)樽鰪V告獲得的利潤(rùn)20大于不做廣告所獲得的利潤(rùn)10,故在20下面劃一橫線。如果B廠商不做廣告,A廠商的最優(yōu)選擇是不做廣告,因?yàn)椴蛔鰪V告獲得的利潤(rùn)30大于做廣告所獲得的利潤(rùn)25,故在30下面劃一橫線。在本題中不存在混合策略的納什均衡解,因此,最終的純策略納什均衡就是A、B兩廠商都做廣告。15、求出下面博弈的納什均衡(含純策略和混合策略)。乙LR甲U5,00,8D2,64,5由劃線法易知,該矩陣博弈沒(méi)有純策略Nash均衡??傻萌缦虏坏仁浇MQ=a+d-b-c=7,q=d-b=4,R=0+5-8-6=-9,r=-1可得混合策略Nash均衡((),()16、某產(chǎn)品市場(chǎng)上有兩個(gè)廠商,各自都可以選擇高質(zhì)量,還是低質(zhì)量。相應(yīng)的利潤(rùn)由如下得益矩陣給出:(1)該博弈是否存在納什均衡?如果存在的話,哪些結(jié)果是納什均衡?參考答案:由劃線法可知,該矩陣博弈有兩個(gè)純策略Nash均衡,即(低質(zhì)量,高質(zhì)量),(高質(zhì)量,低質(zhì)量)。乙企業(yè)高質(zhì)量低質(zhì)量甲企業(yè)高質(zhì)量50,50100,800低質(zhì)量900,600-20,-30該矩陣博弈還有一個(gè)混合的納什均衡Q=a+d-b-c=-970,q=d-b=-120,R=-1380,r=-630,可得因此該問(wèn)題的混合納什均衡為。17、甲、乙兩企業(yè)分屬兩個(gè)國(guó)家,在開發(fā)某種新產(chǎn)品方面有如下收益矩陣表示的博弈關(guān)系。試求出該博弈的納什均衡。如果乙企業(yè)所在國(guó)政府想保護(hù)本國(guó)企業(yè)利益,可以采取什么措施?乙企業(yè)開發(fā)不開發(fā)甲企業(yè)開發(fā)-10,-10100,0不開發(fā)0,1000,0解:用劃線法找出問(wèn)題的純策略納什均衡點(diǎn)。所以可知該問(wèn)題有兩個(gè)純策略納什均衡點(diǎn)(開發(fā),不開發(fā))和(不開發(fā),開發(fā))。該博弈還有一個(gè)混合的納什均衡((),())。如果乙企業(yè)所在國(guó)政府對(duì)企業(yè)開發(fā)新產(chǎn)品補(bǔ)貼a個(gè)單位,則收益矩陣變?yōu)椋?要使(不開發(fā),開發(fā))成為該博弈的唯一納什均衡點(diǎn),只需a>10。此時(shí)乙企業(yè)的收益為100+a。18、博弈的收益矩陣如下表:乙左右甲上a,bc,d下e,fg,h(1)如果(上,左)是占優(yōu)策略均衡,則a、b、c、d、e、f、g、h之間必然滿足哪些關(guān)系?(盡量把所有必要的關(guān)系式都寫出來(lái))(2)如果(上,左)是納什均衡,則(1)中的關(guān)系式哪些必須滿足?(3)如果(上,左)是占優(yōu)策略均衡,那么它是否必定是納什均衡?為什么?(4)在什么情況下,純戰(zhàn)略納什均衡不存在?答:(1),,,。本題另外一個(gè)思考角度是從占優(yōu)策略均衡的定義出發(fā)。對(duì)乙而言,占優(yōu)策略為;而對(duì)甲而言,占優(yōu)策略為。綜合起來(lái)可得到所需結(jié)論。(2)納什均衡只需滿足:甲選上的策略時(shí),,同時(shí)乙選左的策略時(shí),。故本題中納什均衡的條件為:,。(3)占優(yōu)策略均衡一定是納什均衡,因?yàn)檎純?yōu)策略均衡的條件包含了納什均衡的條件。(4)當(dāng)對(duì)每一方來(lái)說(shuō),任意一種策略組合都不滿足納什均衡時(shí),純戰(zhàn)略納什均衡就不存在。19、Smith和John玩數(shù)字匹配游戲,每個(gè)人選擇1、2、3,如果數(shù)字相同,John給Smith3美元,如果不同,Smith給John1美元。(1)列出收益矩陣。(2)如果參及者以1/3的概率選擇每一個(gè)數(shù)字,證明該混合策略存在一個(gè)納什均衡,它為多少?答:(1)此博弈的收益矩陣如下表。該博弈是零和博弈,無(wú)納什均衡。John123Smith13,-3-1,1-1,12-1,13,-3-1,13-1,1-1,13,-3(2)Smith選(1/3,1/3,1/3)的混合概率時(shí),John選1的效用為:John選2的效用為:John選3的效用為:類似地,John選(1/3,1/3,1/3)的混合概率時(shí),Smith選1的效用為:Smith選2的效用為:Smith選3的效用為:因?yàn)?,,所以:是納什均衡,策略值分別為John:;Smith:。20、假設(shè)雙頭壟斷企業(yè)的成本函數(shù)分別為:,,市場(chǎng)需求曲線為,其中,。(1)求出古諾(Cournot)均衡情況下的產(chǎn)量、價(jià)格和利潤(rùn),求出各自的反應(yīng)和等利潤(rùn)曲線,并圖示均衡點(diǎn)。(2)求出斯塔克博格(Stackelberg)均衡情況下的產(chǎn)量、價(jià)格和利潤(rùn),并以圖形表示。(3)說(shuō)明導(dǎo)致上述兩種均衡結(jié)果差異的原因。答:(1)對(duì)于壟斷企業(yè)1來(lái)說(shuō):這是壟斷企業(yè)1的反應(yīng)函數(shù)。其等利潤(rùn)曲線為:對(duì)壟斷企業(yè)2來(lái)說(shuō):這是壟斷企業(yè)2的反應(yīng)函數(shù)。其等利潤(rùn)曲線為:在達(dá)到均衡時(shí),有:均衡時(shí)的價(jià)格為:兩壟斷企業(yè)的利潤(rùn)分別為:均衡點(diǎn)可圖示為:00企業(yè)195200190企業(yè)2企業(yè)1的反應(yīng)線均衡點(diǎn)(2)當(dāng)壟斷企業(yè)1為領(lǐng)導(dǎo)者時(shí),企業(yè)2視企業(yè)1的產(chǎn)量為既定,其反應(yīng)函數(shù)為:則企業(yè)1的問(wèn)題可簡(jiǎn)化為:均衡時(shí)價(jià)格為:利潤(rùn)為:,該均衡可用下圖表示:Stackelberg均衡點(diǎn)Stackelberg均衡點(diǎn)企業(yè)2的反應(yīng)線500企業(yè)195200190企業(yè)2企業(yè)1的反應(yīng)線企業(yè)2領(lǐng)先時(shí)可依此類推。(3)當(dāng)企業(yè)1為領(lǐng)先者時(shí),其獲得的利潤(rùn)要比古諾競(jìng)爭(zhēng)下多。而企業(yè)2獲得的利潤(rùn)較少。這是因?yàn)?,企業(yè)1先行動(dòng)時(shí),其能考慮企業(yè)2的反應(yīng),并以此來(lái)制定自己的生產(chǎn)計(jì)劃,而企業(yè)2只能被動(dòng)地接受企業(yè)1的既定產(chǎn)量,計(jì)劃自己的產(chǎn)出,這是一種“先動(dòng)優(yōu)勢(shì)”21、在一個(gè)由三寡頭操縱的壟斷市場(chǎng)中,逆需求函數(shù)為p=a-q1-q2-q3,這里qi是企業(yè)i的產(chǎn)量。每一企業(yè)生產(chǎn)的單位成本為常數(shù)c。三企業(yè)決定各自產(chǎn)量的順序如下:(1)企業(yè)1首先選擇q1≥0;(2)企業(yè)2和企業(yè)3觀察到q1,然后同時(shí)分別選擇q2和q3。試解出該博弈的子博弈完美納什均衡。答:該博弈分為兩個(gè)階段,第一階段企業(yè)1選擇產(chǎn)量q1,第二階段企業(yè)2和3觀測(cè)到q1后,他們之間作一完全信息的靜態(tài)博弈。我們按照逆向遞歸法對(duì)博弈進(jìn)行求解。(1)假設(shè)企業(yè)1已選定產(chǎn)量q1,先進(jìn)行第二階段的計(jì)算。設(shè)企業(yè)2,3的利潤(rùn)函數(shù)分別為:由于兩企業(yè)均要追求利潤(rùn)最大,故對(duì)以上兩式分別求一階條件:(1)(2)求解(1)、(2)組成的方程組有:(3)(2)現(xiàn)進(jìn)行第一階段的博弈分析:對(duì)及企業(yè)1,其利潤(rùn)函數(shù)為;將(3)代入可得:(4)式(4)對(duì)q1求導(dǎo):解得:(5)此時(shí),(3)將式(5)代回(3)和(4)有該博弈的子博弈完美納什均衡:25、某寡頭壟斷市場(chǎng)上有兩個(gè)廠商,總成本均為自身產(chǎn)量的20倍,市場(chǎng)需求函數(shù)為Q=200-P。求(1)若兩個(gè)廠商同時(shí)決定產(chǎn)量,產(chǎn)量分別是多少?(2)若兩個(gè)廠商達(dá)成協(xié)議壟斷市場(chǎng),共同安排產(chǎn)量,則各自的利潤(rùn)情況如何?答:(1)分別求反應(yīng)函數(shù),180-2Q1-Q2=0,180-Q1-2Q2=0,Q1=Q2=60(2)200-2Q=20,Q=90,Q1=Q2=4526、一個(gè)工人給一個(gè)老板干活,工資標(biāo)準(zhǔn)是100元。工人可以選擇是否偷懶,老板則選擇是否克扣工資。假設(shè)工人不偷懶有相當(dāng)于50元的負(fù)效用,老板想克扣工資則總有借口扣掉60元工資,工人不偷懶老板有150元產(chǎn)出,而工人偷懶時(shí)老板只有80元產(chǎn)出,但老板在支付工資之前無(wú)法知道實(shí)際產(chǎn)出,這些情況雙方都知道。請(qǐng)問(wèn):(1)如果老板完全能夠看出工人是否偷懶,博弈屬于哪種類型?用得益矩陣或擴(kuò)展形表示該博弈并作簡(jiǎn)單分析。(2)如果老板無(wú)法看出工人是否偷懶,博弈屬于哪種類型?用得益矩陣或擴(kuò)展形表示該博弈并作簡(jiǎn)單分析。(1)完全信息動(dòng)態(tài)博弈。博弈結(jié)果應(yīng)該是工人偷懶,老板克扣。(2)完全信息靜態(tài)博弈,結(jié)果仍然是工人偷懶,老板克扣。27、舉一個(gè)你在現(xiàn)實(shí)生活中遇到的囚犯兩難困境的例子。答:在校園的人行道交叉路口,無(wú)需紅綠燈。現(xiàn)在兩人分別騎車從東西方向和南北方向通過(guò)路口。若同時(shí)往前沖,必定相撞,各自支付為(-2,-2);若同時(shí)停下,都不能按時(shí)前進(jìn),支付為(0,0);若一人前進(jìn)一人停下,支付為(2,0)或(0,2)。相應(yīng)的策略和支付矩陣如下表。乙前進(jìn)停下甲前進(jìn)-2,-22,0停下0,20,028、給定兩家釀酒企業(yè)A、B的收益矩陣如下表:A企業(yè)白酒啤酒B企業(yè)白酒700,600900,1000啤酒800,900600,800表中每組數(shù)字前面一個(gè)表示B企業(yè)的收益,后一個(gè)數(shù)字表示B企業(yè)的收益。(1)求出該博弈問(wèn)題的均衡解,是占優(yōu)策略均衡還是納什均衡?(2)存在帕累托改進(jìn)嗎?如果存在,在什么條件下可以實(shí)現(xiàn)?福利增量是多少?(3)如何改變上述A、B企業(yè)的收益才能使均衡成為納什均衡或占優(yōu)策略均衡?如何改變上述A、B企業(yè)的收益才能使該博弈不存在均衡?答:(1)有兩個(gè)納什均衡,即(啤酒,白酒)、(白酒,啤酒),都是納什均衡而不是占優(yōu)策略均衡。(2)顯然,(白酒,啤酒)是最佳均衡,此時(shí)雙方均獲得其最大收益。若均衡解為(啤酒,白酒),則存在帕累托改善的可能。方法是雙方溝通,共同做出理性選擇,也可由一方向另一方支付報(bào)酬。福利由800+900變?yōu)?00+1000,增量為200。(3)如將(啤酒,白酒)支付改為(1000,1100),則(啤酒,白酒)就成為占優(yōu)策略均衡。比如將(啤酒,白酒)支付改為(800,500),將(白酒,啤酒)支付改為(900,500),則該博弈就不存在任何占優(yōu)策略均衡或納什均衡。30、在納稅檢查的博弈中,假設(shè)A為應(yīng)納稅款,C為檢查成本,F(xiàn)是偷稅罰款,且C<A+F;S為稅務(wù)機(jī)關(guān)檢查的概率,E為納稅人逃稅的概率;不存在純戰(zhàn)略納什均衡。(1)寫出支付矩陣。(2)分析混合策略納什均衡。答:(1)該博弈的支付矩陣如下表:納稅人逃稅不逃稅稅收機(jī)關(guān)檢查A-C+F,-A-FA-C,-A不檢查0,0A,-A(2)先分析稅收檢查邊際:因?yàn)镾為稅務(wù)機(jī)關(guān)檢查的概率,E為納稅人逃稅的概率。給定E,稅收機(jī)關(guān)選擇檢查及否的期望收益為:解,得:。如果納稅人逃稅概率小于E,稅收機(jī)關(guān)的最優(yōu)決策是不檢查,否則是檢查。再分析逃稅邊際:給定S,納稅人選擇逃稅及否的期望收益是:解,得:。即如果稅收機(jī)關(guān)檢查的概率小于S,納稅人的最優(yōu)選擇是逃稅,否則是交稅。因此,混合納什均衡是(S,E),即稅收機(jī)關(guān)以S的概率查稅,而納稅人以E的概率逃稅。31、判斷下列說(shuō)法正確:(1)斯塔克博格產(chǎn)量領(lǐng)導(dǎo)者所獲得的利潤(rùn)的下限是古諾均衡下它得到的利潤(rùn)。(2)由于兩個(gè)罪犯只打算犯罪一次,所以被捕后才出現(xiàn)了不合作的問(wèn)題即囚徒困境。但如果他們打算重復(fù)合伙多次,比如說(shuō)20次,那么對(duì)策論預(yù)測(cè)他們將采取彼此合作的態(tài)度,即誰(shuí)都不招供。答:(1)正確。在斯塔克博格模型中,領(lǐng)導(dǎo)者可以根據(jù)跟隨者的反應(yīng)曲線來(lái)制定自己的最優(yōu)產(chǎn)量。其利潤(rùn)一定不會(huì)小于古諾均衡下的利潤(rùn),否則,領(lǐng)導(dǎo)者將采取古諾博弈中雙方同時(shí)行動(dòng)的策略而獲得古諾均衡的利潤(rùn)。(2)錯(cuò)誤。只要兩囚犯只打算合作有限次,其最優(yōu)策略均為招供。比如最后一次合謀,兩小偷被抓住了,因?yàn)閷?lái)沒(méi)有合作機(jī)會(huì)了,最優(yōu)策略均為招供?;赝说降箶?shù)第二次,既然已經(jīng)知道下次不會(huì)合作,這次為什么要合作呢。依此類推,對(duì)于有限次內(nèi)的任何一次,兩小偷均不可能合作。32、簡(jiǎn)要評(píng)論博弈論在微觀經(jīng)濟(jì)學(xué)運(yùn)用中的優(yōu)缺點(diǎn)。答:博弈論是描述和研究行為者之間策略相互依存和相互作用的一種決策理論。它被廣泛應(yīng)用于政治、外交、軍事、經(jīng)濟(jì)等研究領(lǐng)域,但在微觀經(jīng)濟(jì)學(xué)中的應(yīng)用是最成功的。博弈論的研究方法和特征及經(jīng)濟(jì)學(xué)結(jié)合得非常緊密。它強(qiáng)調(diào)個(gè)人理性,即在給定的約束條件下追求效用最大化。但博弈論又比傳統(tǒng)的經(jīng)濟(jì)學(xué)更進(jìn)一步,它研究的不是面臨非人格化的價(jià)格參數(shù)下的決策問(wèn)題,而是研究效用隨各個(gè)主體的行為改變而改變的效用最大化問(wèn)題。除了國(guó)際貿(mào)易、金融、拍賣等經(jīng)濟(jì)領(lǐng)域,博弈論在企業(yè)理論特別是寡頭競(jìng)爭(zhēng)研究方法方面做了大量的有益工作。20世紀(jì)80年代以來(lái),博弈論開始出現(xiàn)在西方經(jīng)濟(jì)學(xué)的教科書中,都將其作為經(jīng)濟(jì)學(xué)研究的最新成果及前沿。特別是產(chǎn)業(yè)組織理論方面的教材,幾乎都是以博弈論為基礎(chǔ)的。博弈論反映了經(jīng)濟(jì)學(xué)的研究對(duì)象越來(lái)越個(gè)體化、微觀化;反映了經(jīng)濟(jì)學(xué)越來(lái)越重視人及人之間關(guān)系及相互作用的研究,特別是協(xié)調(diào)人際的利益及沖突的最佳制度安排傾向;反映了經(jīng)濟(jì)學(xué)越來(lái)越重視信息,即接近現(xiàn)實(shí)的有關(guān)信息不完全對(duì)個(gè)人選擇及制度安排及其影響的傾向??傊┺恼撛诮?jīng)濟(jì)學(xué)中的廣泛應(yīng)用,大大提高了經(jīng)濟(jì)學(xué)對(duì)現(xiàn)實(shí)的解釋能力。應(yīng)該看到,博弈論在微觀經(jīng)濟(jì)學(xué)運(yùn)用中還存在許多疑難問(wèn)題。它無(wú)法提供唯一解,無(wú)法完整地探討個(gè)人發(fā)展及社會(huì)發(fā)展之間的相互依存關(guān)系。現(xiàn)有的博弈論結(jié)構(gòu)可強(qiáng)有力地證明“合作比不合作好”這一命題,但無(wú)法解釋清楚在現(xiàn)實(shí)中沖突及合作之間的復(fù)雜關(guān)系,認(rèn)為個(gè)人組成的集團(tuán)會(huì)采取合作行動(dòng)以實(shí)現(xiàn)他們共同的利益。實(shí)際上,除非一個(gè)集團(tuán)中的人數(shù)很少或者存在強(qiáng)制或其他某些特殊手段以使個(gè)人按照他們的共同利益行事,有理性的、尋求個(gè)人利益最大化的個(gè)人不會(huì)采取行動(dòng)以實(shí)現(xiàn)共同的利益。即使他們采取行動(dòng)實(shí)現(xiàn)共同的利益之后都能獲益,他們也仍然可能不會(huì)自愿地采取合作行動(dòng)以實(shí)現(xiàn)共同利益的目標(biāo)。33、“囚徒困境”的內(nèi)在根源是什么?舉出現(xiàn)實(shí)中囚徒的困境的具體例子。答八:內(nèi)在根源是個(gè)體之間存在行為和利益相互制約的博弈結(jié)構(gòu)中,個(gè)體理性及集體理性的矛盾。34、假設(shè)古諾的雙寡頭模型中雙寡頭面臨如下一條線性需求曲線:P=30-Q其中Q為兩廠商的總產(chǎn)量,即Q=Q1+Q2。再假設(shè)邊際成本為零,即MC1=MC2=0解釋并討論此例的納斯均衡,為什么其均衡是一種囚徒困境。廠商1的總收益TR1由下式給出:廠商1的邊際收益MR1為:MR1=30-2Q1-Q2利用利潤(rùn)最大化條件MR1=MC1=0,得廠商1的反應(yīng)函數(shù)(reactionfunction)或反應(yīng)曲線為:Q1=15-0.5Q2 (6-1)同理可得廠商2的反應(yīng)曲線為:Q2=15-0.5Q1 (6-2)均衡產(chǎn)量水平就是兩反應(yīng)曲線交點(diǎn)Q1和Q2的值,即方程組6-1和6-2的解??梢郧蟮霉胖Z均衡時(shí)的均衡產(chǎn)量水平為:Q1=Q2=10。因此,在本例中,兩個(gè)寡頭的總產(chǎn)量Q為Q1+Q2=20,均衡價(jià)格為P=30-Q=10。剛才我們討論了兩寡頭廠商相互競(jìng)爭(zhēng)時(shí)的均衡產(chǎn)量?,F(xiàn)在我們放松第(6)條不能串謀的假設(shè),假定兩寡頭可以串謀。它們能共同確定產(chǎn)量以使總利潤(rùn)最大化。這時(shí),兩廠商的總收益TR為:TR=PQ=(30-Q)Q=30Q-Q2其邊際收益MR為:MR=30-2Q根據(jù)利潤(rùn)最大化條件MR=MC=0,可以求得當(dāng)Q=15時(shí)總利潤(rùn)最大。如果兩廠商同意平分利潤(rùn),每個(gè)寡頭廠商將各生產(chǎn)總產(chǎn)量的一半,即Q1=Q2=7.5。其實(shí),任何相加為15的產(chǎn)量Q1和Q2的組合都使總利潤(rùn)最大化,因此,把Q1+Q2=15稱為契約曲線,而Q1=Q2=7.5是契約曲線上的一個(gè)點(diǎn)。我們還可以求得當(dāng)價(jià)格等于邊際成本時(shí),Q1=Q2=15,各廠商的利潤(rùn)為零。35、兩家電視臺(tái)競(jìng)爭(zhēng)周末黃金時(shí)段晚8點(diǎn)到10點(diǎn)的收視率,可選擇把較好的節(jié)目放在前面還是后面。他們決策的不同組合導(dǎo)致收視率如下:(1)如果兩家是同時(shí)決策,有納什均衡嗎?有(前面,后面)(2)如果雙方采用規(guī)避風(fēng)險(xiǎn)的策略,均衡的結(jié)果是什么?此題應(yīng)用的思想是最大最小收益法:也就是說(shuō),在對(duì)手采取策略時(shí),所獲得的最小收益中的最大值。電視臺(tái)1:對(duì)方采取前面戰(zhàn)略的最小收益為18對(duì)方采取后面戰(zhàn)略的最小收益為16固電視臺(tái)1會(huì)選擇收益為18的戰(zhàn)略——前面電視臺(tái)2:前面的策略是一個(gè)優(yōu)超策略——前面策略均衡為(前面,前面)(3)如果電視臺(tái)1先選擇,結(jié)果有什么?若電視臺(tái)2先選擇呢?(4)如果兩家談判合作,電視臺(tái)1許諾將好節(jié)目放在前面,這許諾可信嗎?結(jié)果能是什么?電視臺(tái)1許諾將好節(jié)目放在前面的許諾不可信。因?yàn)殡娨暸_(tái)2,前面為占優(yōu)策略,而在電視臺(tái)2,選擇前面的時(shí)候,電視臺(tái)1選擇后面的收益要大于前面的收益。所以,最終結(jié)果為(前面,后面)36、如果將如下的囚徒困境博弈重復(fù)進(jìn)行無(wú)窮次,懲罰機(jī)制為觸發(fā)策略,貼現(xiàn)因子為δ。試問(wèn)δ應(yīng)滿足什么條件,才存在子博弈完美納什均衡?乙甲坦白不坦白坦白4,40,5不坦白5,01,1參考答案:由劃線法求得該博弈的純策略納什均衡點(diǎn)為(不坦白,不坦白),均衡結(jié)果為(1,1),采用觸發(fā)策略,局中人i的策略組合s的最好反應(yīng)支付=5,Pi(s*)=4,Pi(sc)=1。若存在子博弈完美納什均衡,必須滿足:,即只有當(dāng)貼現(xiàn)因子>1/4時(shí),才存在子博弈完美納什均衡。37、在Bertrand價(jià)格博弈中,假定有n個(gè)生產(chǎn)企業(yè),需求函數(shù)為P=a-Q,其中P是市場(chǎng)價(jià)格,Q是n個(gè)生產(chǎn)企業(yè)的總供給量。假定博弈重復(fù)無(wú)窮多次,每次的價(jià)格都立即被觀測(cè)到,企業(yè)使用“觸發(fā)策略”(一旦某個(gè)企業(yè)選擇壟斷價(jià)格,則執(zhí)行“冷酷策略”)。求使壟斷價(jià)格可以作為完美均衡結(jié)果出現(xiàn)的最低貼現(xiàn)因子δ是多少。并請(qǐng)解釋?duì)募皀的關(guān)系。分析:此題可分解為3個(gè)步驟(1)n個(gè)企業(yè)合作,產(chǎn)量總和為壟斷產(chǎn)量,價(jià)格為壟斷價(jià)格,然后平分利潤(rùn)。(2)其中一個(gè)企業(yè)采取欺騙手段降價(jià),那個(gè)這家企業(yè)就占有的全部市場(chǎng),獲得壟斷利潤(rùn)(3)其他企業(yè)觸發(fā)戰(zhàn)略,將價(jià)格降到等于邊際成本,所有的企業(yè)利潤(rùn)為零。參考答案:(1)設(shè)每個(gè)企業(yè)的邊際成本為c,固定成本為0P=a-QTR=P*Q=(a-Q)*QMR=a-2Q因?yàn)椋篗R=MCa-2Q=c則:Q=(a-c)/2P=(a+c)/2π=(P-c)*Q=(a-c)2/4每家企業(yè)的利潤(rùn)為(a-c)2/4n(2)假設(shè)A企業(yè)自主降價(jià),雖然只是微小的價(jià)格調(diào)整,但足以占領(lǐng)整個(gè)市場(chǎng),獲得所有的壟斷利潤(rùn)——(a-c)2/4(3)其他企業(yè)在下一期采取冷酷策略,使得所有企業(yè)的利潤(rùn)為0考慮:A企業(yè)不降價(jià):(a-c)2/4n,(a-c)2/4n,……A企業(yè)降價(jià):(a-c)2/4,0,……使壟斷價(jià)格可以作為完美均衡結(jié)果,就要使得不降價(jià)的貼現(xiàn)值大于等于降價(jià)的貼現(xiàn)值。設(shè)貼現(xiàn)因子為δA不降價(jià)的貼現(xiàn)值:[(a-c)2/4n][1/(1-δ)]A降價(jià)的現(xiàn)值:(a-c)2/4于是:[(a-c)2/4n][1/(1-δ)]≥(a-c)2/4解得:δ≥1-1/n38、假設(shè)某勞動(dòng)市場(chǎng)為完全競(jìng)爭(zhēng)市場(chǎng),其供求函數(shù)如下:SL:W=120+2LDL:W=360-L已知某廠商(在完全競(jìng)爭(zhēng)市場(chǎng)下)的生產(chǎn)函數(shù)為f(L,K)=10L0.5K0.5(K=100)且其產(chǎn)品的需求及供給函數(shù)分別為D:P=60-2qS:P=20+2q試求(a)該廠商的ACL,MCL及VMPL各為多少?(b)勞動(dòng)工資為多少?廠商會(huì)雇用多少勞動(dòng)?由:SL=DL解得:W=280由于產(chǎn)品市場(chǎng)為完全競(jìng)爭(zhēng)市場(chǎng),且要素市場(chǎng)也為完全競(jìng)爭(zhēng)市場(chǎng)所以,滿足:產(chǎn)品市場(chǎng)均衡:P=MR=MC=W/MPL要素市場(chǎng)均衡:W=ACL=MCL=VMPL得到:ACL=MCL=VMPL=280由:D=S解得:P=40,q=10廠商追求利潤(rùn)最大化的情況下:W*=VMPL=P*MPL=P*50/L0.5L*=[100/2*PW*]2=51(取整數(shù))論述題(每小題20分,共20分)解釋“囚犯困境”,并舉商業(yè)案例說(shuō)明。囚徒困境是博弈論里最著名的例子之一,幾乎所有的博弈論著作中都要討論這個(gè)例子。這個(gè)例子是這樣的:兩囚徒被指控是一宗罪案的同案犯。他們被分別關(guān)在不同的牢房無(wú)法互通信息。各囚徒都被要求坦白罪行。如果兩囚徒都坦白,各將被判入獄5年;如果兩人都不坦白,則很難對(duì)他們提起刑事訴訟,因而兩囚徒可以期望被從輕發(fā)落入獄2年;另一方面,如果一個(gè)囚徒坦白而另一個(gè)囚徒不坦白,坦白的這個(gè)囚徒就只需入獄1年,而不坦白的囚徒將被判入獄10年。表6-2給出了囚徒困境的策略式表述。這里,每個(gè)囚徒都有兩種策略:坦白或不坦白。表中的數(shù)字分別代表囚徒甲和乙的得益。(注意,這里的得益是負(fù)值。)表6-2 囚徒困境囚徒乙坦白不坦白囚徒甲坦白-5,-5-1,-10不坦白-10,-1-2,-2在囚徒困境這個(gè)模型中,納什均衡就是雙方都坦白,給定甲坦白的情況下,乙的最優(yōu)策略是坦白;給定乙坦白的情況下,甲的最優(yōu)策略也是坦白。而且這里雙方都坦白不僅是納什均衡,而且是一個(gè)上策(dominantstrategy)均衡,即不論對(duì)方如何選擇,個(gè)人的最優(yōu)選擇是坦白。因?yàn)槿绻也惶拱?,甲坦白的話就被輕判1年,不坦白的話就判2年,坦白比不坦白要好;如果乙坦白,甲坦白的話判5年,不坦白的話判10年,所以,坦白仍然比不坦白要好。這樣,坦白就是甲的上策,當(dāng)然也是乙的上策。其結(jié)果是雙方都坦白。這個(gè)組合是納什均衡。寡頭壟斷廠商經(jīng)常發(fā)現(xiàn)它們自己處于一種囚徒的困境。當(dāng)寡頭廠商選擇產(chǎn)量時(shí),如果寡頭廠商們聯(lián)合起來(lái)形成卡特爾,選擇壟斷利潤(rùn)最大化產(chǎn)量,每個(gè)廠商都可以得到更多的利潤(rùn)。但卡特爾協(xié)定不是一個(gè)納什均衡,因?yàn)榻o定雙方遵守協(xié)議的情況下,每個(gè)廠商都想增加生產(chǎn),結(jié)果是每個(gè)廠商都只得到納什均衡產(chǎn)量的利潤(rùn),它遠(yuǎn)小于卡特爾產(chǎn)量下的利潤(rùn)。解釋“智豬博弈(boxedpigs)”,并舉商業(yè)案例說(shuō)明。智豬博弈的例子講的是:豬圈里有一頭大豬和一頭小豬,豬圈的一頭有一個(gè)豬食槽,另一頭安裝一個(gè)按扭,控制著豬食的供應(yīng)。每按一下按扭會(huì)有10個(gè)單位的豬食進(jìn)槽,但誰(shuí)按按扭誰(shuí)就要付2個(gè)單位的成本并且晚到豬食槽。若大豬先到豬食槽,大豬吃到9個(gè)單位,小豬只能吃到1個(gè)單位;若小豬先到豬食槽,大豬吃到6個(gè)單位,小豬吃4個(gè)單位;若同時(shí)到,大豬吃到7個(gè)單位,小豬只能吃3個(gè)單位。表6-3列出了對(duì)應(yīng)于不同策略組合的得益水平。例如,表中第一格表示大豬小豬同時(shí)按按扭,從而同時(shí)走到豬食槽,大豬吃7個(gè),小豬吃3個(gè),除去2個(gè)單位成本,得益分別為5和1。表6-3 智豬博弈小豬按不按大豬按5,14,4不按9,-10,0從表6-3可以看到,對(duì)于小豬來(lái)說(shuō),如果大豬按,它則不按更好;如果大豬不按,它不按也更好,所以,不論大豬按還是不按,它的最優(yōu)策略都是不按。給定小豬不按,大豬的最優(yōu)選擇只能是按。所以,納什均衡就是大豬按,小豬不按,各得4個(gè)單位豬食。市場(chǎng)中的大企業(yè)及小企業(yè)之間的關(guān)系類似智豬博弈。大企業(yè)進(jìn)行研究及開發(fā),為新產(chǎn)品做廣告,而對(duì)小企業(yè)來(lái)說(shuō)這些工作可能得不償失。所以,小企業(yè)可能把精力花在模仿上,或等待大企業(yè)用廣告打開市場(chǎng)后再出售廉價(jià)產(chǎn)品。解釋““夫妻博弈”(battleofthesexes)”,并舉商業(yè)案例說(shuō)明?!胺蚱薏┺摹?battleofthesexes)的例子講的是一對(duì)談戀愛的男女安排業(yè)余活動(dòng),他們有二種選擇,或去看足球比賽,或去看芭蕾舞演出。男方偏好足球,女方偏好芭蕾,但他們寧愿在一起,不愿分開。表6-6給出了這個(gè)博弈的得益矩陣。在這個(gè)博弈中,如果雙方同時(shí)決定,則有兩個(gè)納什均衡,即都去看足球比賽和都去看芭蕾演出。但是到底最后他們?nèi)タ醋闱虮荣愡€是去看芭蕾演出,并不能從中獲得結(jié)論。如果假設(shè)這是個(gè)序列博弈,例如,當(dāng)女方先作出選擇看芭蕾演出時(shí),男方只能選擇芭蕾;當(dāng)女方先選擇了看足球比賽時(shí),男方也只能選擇足球。反之,當(dāng)男方先選擇了看足球比賽時(shí),女方只能選擇看足球比賽;當(dāng)男方先選擇了看芭蕾演出時(shí),女方只能選擇芭蕾。表6-6 夫妻博弈女足球芭蕾男足球2,10,0芭蕾0,01,2在這個(gè)博弈例子中,先行動(dòng)者具有明顯的優(yōu)勢(shì),女方通過(guò)選擇芭蕾造成一種既成事實(shí),使得男方除了一起去看芭蕾之外別無(wú)選擇。這就是我們?cè)谒顾藸柌衲P椭刑岬降南葎?dòng)優(yōu)勢(shì)(firstmoveradvantage)。在那個(gè)模型中,先行動(dòng)的廠商選擇一個(gè)很高的產(chǎn)量水平,從而使它的競(jìng)爭(zhēng)對(duì)手除了選擇小的產(chǎn)量水平之外沒(méi)有多大的選擇余地。解釋古諾模型。解釋斯塔克爾伯格模型。斯塔克爾貝里(1934)提出一個(gè)雙頭壟斷的動(dòng)態(tài)模型,其中一個(gè)支配企業(yè)(領(lǐng)導(dǎo)者)首先行動(dòng),然后從屬企業(yè)(追隨者)行。比如在美國(guó)汽車產(chǎn)業(yè)發(fā)展史中的某些階段,通用汽車就扮演過(guò)這種領(lǐng)導(dǎo)者的角色(這一例子把模型直接擴(kuò)展到允許不止一個(gè)追隨企業(yè),如福特、克萊斯勒等等)。根據(jù)斯塔克爾貝里的假定,模型中的企業(yè)選擇其產(chǎn)量,這一點(diǎn)和古諾模型是一致的(只不過(guò)古諾模型中企業(yè)是同時(shí)行動(dòng)的,不同于這里的序貫行動(dòng))。博弈的時(shí)間順序如下:(1)企業(yè)1選擇產(chǎn)量q1>0;(2)企業(yè)2觀測(cè)到然后選擇產(chǎn)量q2>0(3)企業(yè)1的收益由下面的利潤(rùn)函數(shù)給出:這里P(Q)=a-Q,是市場(chǎng)上的總產(chǎn)品Q=q1+q2時(shí)的市場(chǎng)出清價(jià)格,c是生產(chǎn)的邊際成本,為一常數(shù)(固定成本為0)。為解出這一博弈的逆向歸納解,我們首先計(jì)算企業(yè)2對(duì)企業(yè)1任意產(chǎn)量的最優(yōu)反應(yīng),R2(q1)應(yīng)滿足:對(duì)上面的通過(guò)求極值可得:已知q1<a-c,在前面我們分析同時(shí)行動(dòng)的古諾博弈中,得出的R2(q1)和上式完全一致,兩者的不同之處在于這里的R2(q1)是企業(yè)2對(duì)企業(yè)1已觀測(cè)到的產(chǎn)量的真實(shí)反應(yīng),而在古諾的分析中,R2(q1)是企業(yè)2對(duì)假定的企業(yè)1的產(chǎn)量的最優(yōu)反應(yīng),且企業(yè)1的產(chǎn)量選擇是和企業(yè)2同時(shí)作出的。由于企業(yè)1也能夠像企業(yè)2一樣解出企業(yè)2的最優(yōu)反應(yīng),企業(yè)1就可以預(yù)測(cè)到他如選擇q1,企業(yè)2將根據(jù)R2(q1)選擇產(chǎn)量。那么在博弈的第一階段,企業(yè)1的問(wèn)題就可表示為:
解得:這就是斯塔克爾貝里雙頭壟斷博弈的逆向歸納解。對(duì)斯塔科爾貝里雙頭壟斷博弈的逆向歸納解的評(píng)價(jià):回顧在古諾博弈的納什均衡中,每一企業(yè)的產(chǎn)量為(a一c)/3,也就是說(shuō),斯塔克爾貝里博弈中逆向歸納解的總產(chǎn)量3(a-c)/4,比古諾博弈中納什均衡的總產(chǎn)量2(a-c)/3要高,從而斯塔克爾貝里博弈相應(yīng)的市場(chǎng)出清價(jià)格就比較低。不過(guò)在斯塔克爾貝里博弈中,企業(yè)1完全可以選擇古諾均衡產(chǎn)量(a一c)/3,這時(shí)企業(yè)2的最優(yōu)反應(yīng)同樣是古諾均衡的產(chǎn)量,也就是說(shuō)在斯塔克爾貝里博弈中,企業(yè)1完全可以使利潤(rùn)水平達(dá)到古諾均衡的水平,而卻選擇了其他產(chǎn)量,那么企業(yè)1在斯塔克爾貝里博弈中的利潤(rùn)一定高于其在古諾博弈中的利潤(rùn)。但斯塔克爾貝里博弈中的市場(chǎng)出清價(jià)格降低了,從而總利潤(rùn)水平也會(huì)下降,那么和古諾博弈的結(jié)果相比,在斯塔克爾貝里博弈中,企業(yè)1利潤(rùn)的增加必定意味著企業(yè)2福利的惡化。和古諾博弈相比,斯塔克爾貝里博弈中企業(yè)2利潤(rùn)水平的降低,揭示了單人決策問(wèn)題和多人決策間題的一個(gè)重要不同之處。在單人決策理論中,占有更多的信息決不會(huì)對(duì)決策制定者帶來(lái)不利,然而在博弈論中,了解更多的信息(或更為精確地說(shuō),是讓其他參加者知道一個(gè)人掌握更多的信息)卻可以讓一個(gè)參及者受損。解釋里昂惕夫的工會(huì)模型。在里昂惕夫(1946)模型中,討論了一個(gè)企業(yè)和一個(gè)壟斷的工會(huì)組織(即作為企業(yè)勞動(dòng)力惟一供給者的工會(huì)組織)的相互關(guān)系:工會(huì)對(duì)工資水平說(shuō)一不二,但企業(yè)卻可以自主決定就業(yè)人數(shù)(在更符合現(xiàn)實(shí)情況的模型中,企業(yè)和工會(huì)間就工資水平討價(jià)還價(jià),但企業(yè)仍自主決定就業(yè),得到的定性結(jié)果及本模型相似)。工會(huì)的效用函數(shù)為U(W,L),其中W為工會(huì)向企業(yè)開出的工資水平,L為就業(yè)人數(shù)。假定U(W,L)是W和L的增函數(shù)。企業(yè)的利潤(rùn)函數(shù)為,其中R(L)為企業(yè)雇傭L名工人可以取得的收入(在最優(yōu)的生產(chǎn)和產(chǎn)品市場(chǎng)決策下),假定R(L)是增函數(shù),并且為凹函數(shù)。假定博弈的時(shí)序?yàn)?(1)工會(huì)給出需要的工資水平W;(2)企業(yè)觀測(cè)到(并接受)W,隨后選擇雇傭人數(shù)L;(3)收益分別為U(W,L)和。即使沒(méi)有假定U(W,L)和R(L)的具體的表達(dá)式,從而無(wú)法明確解出該博弈的逆向歸納解,但我們?nèi)钥梢跃徒獾闹饕卣鬟M(jìn)行討論。首先,對(duì)工會(huì)在第一階段任意一個(gè)工資水平w,我們能夠分析在第二階段企業(yè)最優(yōu)反應(yīng)L*(W)的特征。給定w,企業(yè)選擇L*(W)滿足下式:一階條件為:為了滿足上述一階條件,假設(shè)R’(0)=∞;R’(∞)=0.下面的圖把L*(w)表示為w的函數(shù)(但坐標(biāo)軸經(jīng)過(guò)旋轉(zhuǎn)以便于和以后的數(shù)據(jù)相比較),并表示出它和企業(yè)每條等利潤(rùn)線交于其最高點(diǎn)。若令L保持不變,L保持不變,w降低時(shí)企業(yè)的利潤(rùn)就會(huì)提高,于是較低的等利潤(rùn)曲線代表了較高的利潤(rùn)水平。這張圖描述了工會(huì)的無(wú)差異曲線,若令L不變,當(dāng)w提高時(shí)工會(huì)的福利就會(huì)增加。于是較高的無(wú)差異曲線代表了工會(huì)較高的效用水平。下面我們分析工會(huì)在第一階段的問(wèn)題,由于工會(huì)和企業(yè)同樣可以解出企業(yè)在第二階段的問(wèn)題,工會(huì)就可預(yù)測(cè)到如果它要求的工資水平為w1,企業(yè)最優(yōu)反應(yīng)的就業(yè)人數(shù)將會(huì)是L*(w1)。那么,工會(huì)在第一階段的問(wèn)題可以表示為:表現(xiàn)在圖中的無(wú)差異曲線上就是,工會(huì)希望選擇一個(gè)工資水平w,由此得到的結(jié)果(w,L*(w))處于可能達(dá)到的最高的無(wú)差異線上。這一最優(yōu)化間題的解為w*,這樣一個(gè)工資要求將使得工會(huì)通過(guò)(w*,L*(w*))的無(wú)差異
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 《薄膜材料與器件》教學(xué)大綱
- 教科版品社四下全冊(cè)教案(表格式)
- 玉溪師范學(xué)院《投資學(xué)》2023-2024學(xué)年第一學(xué)期期末試卷
- 玉溪師范學(xué)院《數(shù)值分析》2021-2022學(xué)年第一學(xué)期期末試卷
- 玉溪師范學(xué)院《酒店餐飲服務(wù)實(shí)訓(xùn)》2021-2022學(xué)年第一學(xué)期期末試卷
- 使用權(quán)資產(chǎn)折舊的賬務(wù)處理-記賬實(shí)操
- 2024年離合器面片項(xiàng)目評(píng)估分析報(bào)告
- 2023年流化床干燥設(shè)備項(xiàng)目評(píng)估分析報(bào)告
- 2023年戶外機(jī)柜溫控節(jié)能項(xiàng)目評(píng)估分析報(bào)告
- 草莓大棚買賣合同
- 國(guó)家開放大學(xué)《教育組織行為與管理案例》大作業(yè)參考答案
- 2018年上半年全市中小學(xué)部分學(xué)科德育優(yōu)質(zhì)課評(píng)選結(jié)果
- 【閱讀訓(xùn)練】Unit 8 Read a story 閱讀理解活動(dòng)(五上)
- 低壓開關(guān)柜預(yù)防性試驗(yàn)報(bào)告
- 2023年江蘇蘇州工業(yè)園區(qū)管委會(huì)招聘筆試參考題庫(kù)附帶答案詳解
- DB33-T 1261-2021 全裝修住宅室內(nèi)裝修設(shè)計(jì)標(biāo)準(zhǔn) 附條文說(shuō)明
- 優(yōu)化少先隊(duì)儀式教育的嘗試 論文
- 【知識(shí)解析】化學(xué)促進(jìn)科學(xué)技術(shù)的發(fā)展
- 語(yǔ)言學(xué)概論智慧樹知到答案章節(jié)測(cè)試2023年廣西師范大學(xué)
- 大學(xué)生職業(yè)規(guī)劃-教師職業(yè)規(guī)劃書范文
- 電路理論智慧樹知到答案章節(jié)測(cè)試2023年同濟(jì)大學(xué)
評(píng)論
0/150
提交評(píng)論