博弈理論知識(shí)講義_第1頁(yè)
博弈理論知識(shí)講義_第2頁(yè)
博弈理論知識(shí)講義_第3頁(yè)
博弈理論知識(shí)講義_第4頁(yè)
博弈理論知識(shí)講義_第5頁(yè)
已閱讀5頁(yè),還剩123頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、Evaluation Warning: The document was created with Spire.Doc for .NET.第八章 博弈論前面章節(jié)對(duì)對(duì)經(jīng)濟(jì)人人最優(yōu)決決策的討討論,是是在簡(jiǎn)單單環(huán)境下下進(jìn)行的的,沒有有考慮經(jīng)經(jīng)濟(jì)人之之間決策策相互影影響的問問題。本本章討論論這個(gè)問問題,建建立復(fù)雜雜環(huán)境下下的決策策理論。開開展這種種研究的的的理論論叫做博博弈論,也也稱為對(duì)對(duì)策論(Gamme TTheoory)。最近近十幾年年來,博博弈論在在經(jīng)濟(jì)學(xué)學(xué)中得到到了廣泛泛應(yīng)用,在在揭示經(jīng)經(jīng)濟(jì)行為為相互制制約性質(zhì)質(zhì)方面取取得了重重大進(jìn)展展。大部部分經(jīng)濟(jì)濟(jì)行為都都可視作作博弈的的特殊情情況,比比如

2、把經(jīng)經(jīng)濟(jì)系統(tǒng)統(tǒng)看成是是一種博博弈,把把競(jìng)爭(zhēng)均均衡看成成是該博博弈的古古諾-納什均均衡。博博弈論的的思想精精髓與方方法,已已成為經(jīng)經(jīng)濟(jì)分析析基礎(chǔ)的的必要組組成部分分。第一節(jié) 博博弈事例例博弈是一種種日?,F(xiàn)現(xiàn)象,例例如棋手手下棋,雙雙方都要要根據(jù)對(duì)對(duì)方的行行動(dòng)來決決定自己己的行動(dòng)動(dòng),雙方方的目的的都是要要戰(zhàn)勝對(duì)對(duì)方,互互不相容容,互相相影響,互互相制約約。一般般來講,博博弈現(xiàn)象象的特征征表現(xiàn)為為兩個(gè)或或兩個(gè)以以上具有有利害沖沖突的當(dāng)當(dāng)事人處處于一種種不相容容的狀態(tài)態(tài)中,一一方的行行動(dòng)取決決于對(duì)方方的行動(dòng)動(dòng),每個(gè)個(gè)當(dāng)事人人的收益益都取決決于所有有當(dāng)事人人的行動(dòng)動(dòng)。當(dāng)所所有當(dāng)事事人都拿拿定主意意作出決

3、決策時(shí),博博弈的局局勢(shì)就暫暫時(shí)確定定下來。博博弈論就就是研究究這種不不相容現(xiàn)現(xiàn)象的一一種理論論,并把把當(dāng)事人人叫做局局中人(plaayerr)。博弈論推廣廣了標(biāo)準(zhǔn)準(zhǔn)的一人人決策理理論。在在每個(gè)局局中人的的收益都都依賴于于其他局局中人的的選擇的的情況下下,追求求收益最最大化的的局中人人應(yīng)該如如何采取取行動(dòng)?顯然,為為了確定定出可行行的策略略,每個(gè)個(gè)局中人人都必須須考慮其其他局中中人面臨臨的問題題。下面面來舉例例說明。例1便士士匹配(Mattchiing Pennniees)(二人零零和博弈弈)設(shè)博弈中有有兩個(gè)局局中人甲甲和乙,每每個(gè)局中中人都有有一塊硬硬幣,并并且各自自獨(dú)立安安排硬幣幣是否正正面

4、朝上上。局中中人的收收益情況況是這樣樣的:如如果兩個(gè)個(gè)局中人人同時(shí)出出示硬幣幣正面或或反面,那那么甲贏贏得元元,乙輸輸?shù)粼蝗绻粋€(gè)局局中人出出示硬幣幣正面,另另一個(gè)局局中人出出示硬幣幣反面,那那么甲輸輸?shù)粼?,乙贏贏得元元。表1: 便士匹匹配博弈弈局勢(shì)表表 乙乙甲正面反面正面(正,正)(正,反)反面(反,正)(反,反)對(duì)于這個(gè)博博弈,每每個(gè)局中中人可選選擇的策策略都有有兩種:正面朝朝上和反反面朝上上,即甲甲和乙的的策略集集合都是是正面面,反面。當(dāng)當(dāng)甲和乙乙都作出出選擇時(shí)時(shí),博弈弈的局勢(shì)勢(shì)就確定定了。顯顯然,該該博弈的的局勢(shì)集集合是(正面面,正面),(正正面,反反面),(反面,正面),(反

5、反面,反面),即即各種可可能的局局勢(shì)的全全體,也也稱為局局勢(shì)表,即即表1。表2: 甲和乙乙的收益益表 乙乙甲正面反面正面 ,反面, ,每個(gè)局中人人的收益益都取決決于所有有局中人人的決策策,也就就是說,局局中人的的收益是是博弈局局勢(shì)的函函數(shù)。本本例中,甲甲的收益益函數(shù)為為:,;乙的的收益函函數(shù)為:,。局中中人的收收益函數(shù)數(shù)也可用用表格或或矩陣加加以表示示,并稱稱其為收收益表或或收益矩矩陣。表表2中,甲甲的收益益列在左左邊,乙乙的收益益列在右右邊。該博弈的特特點(diǎn)在于于每個(gè)局局中人的的收益都都是另一一個(gè)局中中人的付付出,即即甲和乙乙的收益益之和為為零,收收支發(fā)生生在局內(nèi)內(nèi),不涉涉及任何何局外人人。這

6、種種博弈就就是所謂謂的二人人零和博博弈。習(xí)習(xí)慣上,人人們喜歡歡把二人人博弈的的第一個(gè)個(gè)局中人人甲叫做做“列”,第二二個(gè)局中中人乙叫叫做“行”,而且且總是把把列的收收益寫在在前面(即左邊邊),行的的收益寫寫在后面面(即右邊邊)。例2囚徒徒難題(Priisonners DDeliimma)(二人變變和博弈弈)表3: 囚徒博博弈局勢(shì)勢(shì)表乙甲合作背叛合作(合作,合合作)(合作,背背叛)背叛(背叛,合合作)(背叛,背背叛)有兩個(gè)狂徒徒甲和乙乙因共同同參與了了一起犯犯罪活動(dòng)動(dòng)而被囚囚禁收審審。他們們可以選選擇合作作,拒絕絕供出任任何犯罪罪事實(shí);也可以以選擇背背叛,供供出對(duì)方方的犯罪罪行徑。這這就是所所謂的

7、囚囚徒博弈弈,也叫叫做囚徒徒難題。博博弈的局局中人甲甲和乙都都有兩種種可選擇擇的策略略:合作作與背叛叛。囚徒博弈的的意義在在于它可可以解釋釋寡頭壟壟斷廠商商的行為為,關(guān)鍵鍵是賦予予合作與與背叛具具體的經(jīng)經(jīng)濟(jì)含義義。比如如在雙頭頭壟斷的的情況下下,合作作可以解解釋為“保持索索要一個(gè)個(gè)高價(jià)”,背叛叛可解釋釋為“降價(jià)以以爭(zhēng)奪對(duì)對(duì)手的市市場(chǎng)”。右表表給出了了囚徒博博弈的局局勢(shì)表。局中人可以以事先討討論這局局博弈,但但實(shí)際決決策必須須獨(dú)立地地做出。如如果甲采采取合作作策略,不不供出乙乙的犯罪罪事實(shí),那那么乙就就能得到到30000元的的收益。同同樣,如如果乙采采取合作作策略,那那么甲就就能得到到30000

8、元的的收益??煽梢?,如如果甲乙乙雙方都都采取合合作策略略,雙方方各得330000元收益益。但是,審訊訊者用110000元獎(jiǎng)賞賞來鼓勵(lì)勵(lì)局中人人采取背背叛策略略。這樣樣,只要要局中人人選擇背背叛,他他就會(huì)得得到10000元元鼓勵(lì),而而不管另另一個(gè)局局中人會(huì)會(huì)采取什什么策略略。需要注意的的是,囚囚徒博弈弈中的貨貨幣支付付來自第第三方局外外人,這這正是囚囚徒博弈弈同便士士匹配博博弈的不不同之處處。奧曼曼(Auumannn)119877年對(duì)囚囚徒博弈弈給出了了一個(gè)特特別簡(jiǎn)單單的描述述:每個(gè)個(gè)局中人人都可以以對(duì)仲裁裁人簡(jiǎn)單單地宣告告“給我110000元”或“給對(duì)方方30000元”。表4: 甲和乙乙的收益

9、益表 乙 甲合作背叛合作3000, 30000 0, 40000背叛4000, 01000, 10000簡(jiǎn)單分析一一下就會(huì)會(huì)發(fā)現(xiàn),如如果一個(gè)個(gè)局中人人采取合合作策略略,而另另一個(gè)局局中人采采取背叛叛策略,那那么采取取合作策策略的局局中人的的收益為為零,而而采取背背叛策略略的局中中人的收收益為440000元(330000元收益益再加上上10000元的的背叛鼓鼓勵(lì))。如如果雙方方都采取取背叛策策略,則則雙方的的收益各各為10000元元。表44列出了了甲乙雙雙方的收收益情況況。從收收益表可可以看出出,甲乙乙雙方的的收益之之和不為為零,而而且收益益和是變變化的。因因此,囚囚徒博弈弈是一種種變和博博弈。

10、直覺上看,甲甲和乙都都應(yīng)采取取合作策策略(互互不供出出對(duì)方的的犯罪事事實(shí)),各各得30000元元收益。但但從收益益表可以以得出這這樣的結(jié)結(jié)論:如如果一個(gè)個(gè)局中人人認(rèn)為另另一個(gè)局局中人將將合作,從從而他將將得到330000元收益益,那么么他若采采取背叛叛策略,就就將總共共能獲得得40000元的的收益;如果他他認(rèn)為另另一個(gè)局局中人為為了得到到10000元鼓鼓勵(lì)而將將背叛,那那么他也也就只好好為了自自己也取取得10000元元鼓勵(lì)而而采取背背叛策略略(否則則,他將將一無所所獲)??偪傊谠谑找孀钭畲蠡瘎?dòng)動(dòng)機(jī)的驅(qū)驅(qū)使下,局局中人的的最優(yōu)選選擇是背背叛。這這樣一來來,甲乙乙雙方都都采取背背叛策略略,各得

11、得10000元收收益;而而不是都都采取合合作策略略,各得得30000元。這這是一個(gè)個(gè)典型的的博弈悖悖論,問問題的關(guān)關(guān)鍵在于于每個(gè)局局中人都都有背叛叛的鼓勵(lì)勵(lì),而不不管其他他局中人人將做什什么。例3古諾諾博弈(雙頭壟壟斷:產(chǎn)產(chǎn)量較量量)法國(guó)經(jīng)濟(jì)學(xué)學(xué)家古諾諾(Coournnot)于18838年年以天然然礦泉井井為例,首首次建立立了簡(jiǎn)單單的雙頭頭壟斷博博弈模型型,其特特點(diǎn)是,壟壟斷廠商商雙方都都天真地地以為對(duì)對(duì)方不會(huì)會(huì)改變?cè)挟a(chǎn)量量水平,雙雙方都追追求各自自利潤(rùn)最最大化。古古諾假定定:有兩個(gè)個(gè)天然礦礦泉在一一起,分分別為廠廠商甲和和乙占有有;兩個(gè)礦礦泉都為為自流井井,生產(chǎn)產(chǎn)成本為為零,邊邊際成本本

12、也為零零;甲和乙乙面對(duì)相相同的需需求曲線線,采用用相同的的價(jià)格;雙方都都以為對(duì)對(duì)方的產(chǎn)產(chǎn)量水平平不會(huì)改改變。在在這些假假設(shè)前提提下,甲甲和乙各各自獨(dú)立立決定自自己的產(chǎn)產(chǎn)量水平平,以求求利潤(rùn)最最大化。設(shè)是甲乙雙雙方共同同面臨的的反需求求函數(shù)。當(dāng)當(dāng)甲的礦礦泉水產(chǎn)產(chǎn)量為,乙乙的產(chǎn)量量為時(shí),礦礦泉水的的市場(chǎng)價(jià)價(jià)格為,甲甲的利潤(rùn)潤(rùn), 乙乙的利潤(rùn)潤(rùn)為。在在這個(gè)博博弈中,甲甲乙雙方方的策略略都表現(xiàn)現(xiàn)為選擇擇產(chǎn)量水水平,局局中人的的收益即即為廠商商的利潤(rùn)潤(rùn)。當(dāng)甲甲的產(chǎn)量量為時(shí),乙乙以為甲甲不會(huì)改改變這一一產(chǎn)量,而而選擇一一個(gè)合適適的產(chǎn)量量水平以以使自己己的利潤(rùn)潤(rùn)達(dá)到最最大。同同樣,當(dāng)當(dāng)乙的產(chǎn)產(chǎn)量水平平為時(shí),甲

13、甲以為乙乙不會(huì)改改變這一一產(chǎn)量,而而選擇一一個(gè)合適適的產(chǎn)量量水平以以使自己己的利潤(rùn)潤(rùn)達(dá)到最最大。為了說明這這個(gè)博弈弈的結(jié)果果,假設(shè)設(shè)甲乙雙雙方面臨臨的反需需求函數(shù)數(shù)。用表示示這局博博弈中甲甲選擇的的最優(yōu)產(chǎn)產(chǎn)量,表表示乙選選擇的最最優(yōu)產(chǎn)量量水平,則則甲乙各各自的收收益分別別為和。由于于實(shí)現(xiàn)了了利潤(rùn)最最大化,因因此解之得:當(dāng)當(dāng)乙的產(chǎn)產(chǎn)量水平平為時(shí),甲甲決定的的產(chǎn)量水水平為(這是甲甲對(duì)乙的的反應(yīng)函函數(shù));當(dāng)甲的的產(chǎn)量水水平為時(shí)時(shí),乙決決定的產(chǎn)產(chǎn)量水平平為(這這是乙對(duì)對(duì)甲的反反應(yīng)函數(shù)數(shù))。其其中,表表示礦泉泉水市場(chǎng)場(chǎng)容量(即價(jià)格格為零時(shí)時(shí)的礦泉泉水需求求量)。進(jìn)進(jìn)一步求求解可得得:, 即博弈弈的結(jié)果果

14、是雙方方最終各各占據(jù)礦礦泉市場(chǎng)場(chǎng)的三分分之一。反反應(yīng)函數(shù)數(shù)說明,古古諾博弈弈中每個(gè)個(gè)局中人人的決策策(選定定的產(chǎn)量量水平)不但依依賴于其其他局中中人的決決策,而而且與市市場(chǎng)的容容量有關(guān)關(guān)。例4貝特特蘭博弈弈(雙頭頭壟斷:價(jià)格較較量)古諾博弈模模型描述述了雙頭頭壟斷廠廠商之間間展開的的產(chǎn)量較較量。實(shí)實(shí)際上廠廠商之間間的產(chǎn)量量較量并并不如價(jià)價(jià)格較量量那么普普遍,寡寡頭之間間應(yīng)該有有激烈的的價(jià)格競(jìng)競(jìng)爭(zhēng)。不不論市場(chǎng)場(chǎng)價(jià)格如如何,只只要某一一廠商降降低價(jià)格格,而其其他競(jìng)爭(zhēng)爭(zhēng)對(duì)手保保持原價(jià)價(jià)格不變變,那么么降價(jià)廠廠商就能能占有全全部市場(chǎng)場(chǎng)。這就就是說,我我們假定定消費(fèi)者者只從最最低價(jià)格格廠商那那里購(gòu)買買產(chǎn)

15、品。為為此,法法國(guó)經(jīng)濟(jì)濟(jì)學(xué)家貝貝特蘭(Berrtraand)于18883年年提出了了以價(jià)格格為選擇擇策略的的貝特蘭蘭博弈模模型,反反對(duì)古諾諾關(guān)于產(chǎn)產(chǎn)量的博博弈模型型。還以礦泉水水為例,在在貝特蘭蘭博弈模模型中各各廠商都都預(yù)期對(duì)對(duì)手不會(huì)會(huì)改變價(jià)價(jià)格,從從而將自自己的價(jià)價(jià)格確定定在利潤(rùn)潤(rùn)最大化化的水平平之上。這這就是說說,貝特特蘭博弈弈的構(gòu)建建同古諾諾博弈相相似,所所不同的的是貝特特蘭博弈弈中局中中人的策策略是選選擇價(jià)格格,而古古諾博弈弈局中人人的策略略是選擇擇產(chǎn)量水水平。貝特蘭博弈弈中兩個(gè)個(gè)局中人人甲和乙乙也是面面臨相同同的市場(chǎng)場(chǎng)需求函函數(shù),不不過現(xiàn)在在價(jià)格是是自變量量,產(chǎn)量量為因變變量(古古諾

16、模型型正好相相反)。設(shè)設(shè)市場(chǎng)需需求函數(shù)數(shù)為, 為了分分析上簡(jiǎn)簡(jiǎn)單起見見,進(jìn)一一步設(shè)(這里,,,即與古諾模型中的市場(chǎng)需求相同)。局中人的收益仍是他所獲得的利潤(rùn)。如果甲和乙乙不相互互勾結(jié)串串通,當(dāng)當(dāng)乙采取取了價(jià)格格水平時(shí)時(shí),甲認(rèn)認(rèn)為乙不不會(huì)改變變這一價(jià)價(jià)格水平平,從而而為了占占領(lǐng)市場(chǎng)場(chǎng)而要采采取低于于乙的價(jià)價(jià)格水平平的價(jià)格格,于是是甲的利利潤(rùn)為,乙乙的利潤(rùn)潤(rùn)為零;同樣,當(dāng)當(dāng)甲采取取了價(jià)格格水平時(shí)時(shí),乙認(rèn)認(rèn)為甲不不會(huì)改變變這一價(jià)價(jià)格水平平,從而而為了占占領(lǐng)市場(chǎng)場(chǎng)而要采采取低于于甲的價(jià)價(jià)格水平平的價(jià)格格,于是是乙的利利潤(rùn)為, 甲的的利潤(rùn)為為零。如果甲和乙乙相互勾勾結(jié)串通通起來,采采取相同同的價(jià)格格策略

17、,即即,那么么甲和乙乙就能索索要一個(gè)個(gè)壟斷價(jià)價(jià)格,并并且每人人可收取取一半的的壟斷利利潤(rùn)。由此可見,甲甲和乙的的利潤(rùn)函函數(shù)分別別為: , 如果甲和乙乙勾結(jié)串串通,合合作起來來,那么么雙方就就能按照照最大利利潤(rùn)價(jià)格格獲得壟壟斷價(jià)格格,并且且各得最最大利潤(rùn)潤(rùn)的一半半。這里里,利潤(rùn)潤(rùn)最大化化價(jià)格是是按照確定的。但但是,占占領(lǐng)市場(chǎng)場(chǎng)的誘惑惑對(duì)每個(gè)個(gè)局中人人都存在在,只要要他稍微微降價(jià),他他就能獲獲得全部部市場(chǎng)。假假如甲先先進(jìn)入該該礦泉市市場(chǎng),那那么甲就就按照利利潤(rùn)最大大化價(jià)格格$P_1=QQ_o/(2bb)$獲獲取最大大利潤(rùn)。 繼而乙乙進(jìn)入這這個(gè)市場(chǎng)場(chǎng),且乙乙認(rèn)為甲甲不會(huì)改改變他的的價(jià)格$P_11$,

18、于于是乙為為了奪取取市場(chǎng)而而采取低低于甲的的價(jià)格水水平的一一個(gè)價(jià)格格(。由于于乙奪走走了市場(chǎng)場(chǎng),甲同同樣又會(huì)會(huì)采取低低于乙的的價(jià)格水水平的價(jià)價(jià)格,以以?shī)Z回市市場(chǎng)。這這樣不斷斷往復(fù)下下去,直直至最后后甲乙雙雙方都把把價(jià)格水水平定為為零時(shí)才才可達(dá)到到均衡,此此時(shí)雙方方的收益益為零,市市場(chǎng)各占占一半(即甲的的銷售量量和乙的的銷售量量相等,且且)。這這就是甲甲乙雙方方不合作作的結(jié)果果,雙方方都變得得更差。以上分析表表明:把把貝特蘭蘭博弈與與古諾博博弈作比比較,對(duì)對(duì)同一市市場(chǎng)來說說,由于于選擇了了不同的的策略集集合(一一個(gè)以產(chǎn)產(chǎn)量作為為策略,另另一個(gè)以以定價(jià)作作為策略略),得得出了不不同的博博弈結(jié)果果,

19、貝特特蘭博弈弈的均衡衡價(jià)格、均均衡產(chǎn)量量和均衡衡利潤(rùn)都都呈完全全競(jìng)爭(zhēng)狀狀態(tài)(超超額利潤(rùn)潤(rùn)為零),而古古諾博弈弈的結(jié)果果不是這這樣;再再把貝特特蘭博弈弈同囚徒徒難題博博弈作比比較,二二者具有有相似的的結(jié)構(gòu),即即局中人人合作會(huì)會(huì)取得最最好的結(jié)結(jié)果,但但利益的的誘惑促促使他們們采取不不合作的的行動(dòng),致致使雙方方博弈的的結(jié)局都都變得更更差。貝特蘭博弈弈也可用用囚徒博博以來解解釋:合合作是指指兩個(gè)廠廠商的勾勾結(jié),背背叛是指指兩個(gè)廠廠商獨(dú)立立行動(dòng),沒沒有勾結(jié)結(jié)。合作作,可以以索要一一個(gè)高的的壟斷價(jià)價(jià)格;背背叛,則則導(dǎo)致市市場(chǎng)價(jià)格格為零,雙雙方利潤(rùn)潤(rùn)為零??煽梢姡p雙方合作作起來,對(duì)對(duì)兩個(gè)廠廠商都有有利,似

20、似乎應(yīng)該該合作。但但博弈的的最終結(jié)結(jié)果是雙雙方都采采取背叛叛策略,導(dǎo)導(dǎo)致誰也也得不到到利潤(rùn)。本節(jié)所舉的的這些事事例說明明,寡頭頭壟斷廠廠商之間間展開的的競(jìng)爭(zhēng)與與較量完完全可以以用博弈弈加以描描述和研研究。實(shí)實(shí)際上,經(jīng)經(jīng)濟(jì)學(xué)中中大部分分經(jīng)濟(jì)現(xiàn)現(xiàn)象都可可以作為為博弈的的特殊情情形進(jìn)行行研究,比比如歷史史上解決決競(jìng)爭(zhēng)均均衡的存存在性這這一經(jīng)濟(jì)濟(jì)學(xué)基本本問題時(shí)時(shí),就把把經(jīng)濟(jì)系系統(tǒng)看成成為一局局博弈。為了研究博博弈,必必須抓住住博弈現(xiàn)現(xiàn)象的基基本要素素,這些些要素是是:局中中人、策策略、收收益。也也就是說說,博弈弈可以用用局中人人集合、策策略集合合和收益益函數(shù)加加以描述述。局中中人從策策略集合合中選擇擇

21、一種策策略后所所獲得的的效用或或利益,就就是局中中人的收收益(ppayooffss),也也叫做得得失。我我們假定定每一個(gè)個(gè)局中人人都知道道他自己己和別人人的策略略集合與與收益函函數(shù),這這就是說說,每個(gè)個(gè)局中人人的策略略集合與與收益函函數(shù)為所所有局中中人所共共知。當(dāng)當(dāng)然,每每個(gè)局中中人都知知道其他他局中人人掌握著著這些信信息和知知識(shí)。局局中人的的收益不不但依賴賴于他自自己的策策略選擇擇,而且且依賴于于其他局局中人的的策略選選擇。我我們?cè)偌偌俣總€(gè)個(gè)局中人人在給定定的主觀觀信念下下會(huì)選擇擇收益最最大化的的行動(dòng),并并且當(dāng)新新的信息息根據(jù)貝貝葉斯規(guī)規(guī)則到來來時(shí),這這些信息息會(huì)得到到修正(即根據(jù)據(jù)貝葉斯

22、斯全概率率公式從從先驗(yàn)概概率計(jì)算算后驗(yàn)概概率)。第二節(jié) 策策略博弈弈為了能夠正正確地應(yīng)應(yīng)用博弈弈論研究究經(jīng)濟(jì)問問題,需需要對(duì)博博弈加以以準(zhǔn)確地地描述和和定義。要要定義一一個(gè)博弈弈,需要要確定三三件事情情:一是是局中人人集合(sett off pllayeers),一是是局中人人的策略略集合(sett off sttrattegiies),一是是局中人人的收益益函數(shù)(payyofff fuuncttionn)。這這三件事事情中,確確定策略略集合是是至關(guān)重重要的。局局中人以以策略決決定勝負(fù)負(fù),目標(biāo)標(biāo)是使他他的收益益最大化化。這種種以策略略定勝負(fù)負(fù)的博弈弈,稱為為策略博博弈(ggamee off s

23、ttrattegyy)。正正象比較較古諾博博弈和貝貝特蘭博博弈時(shí)說說明的問問題一樣樣,用博博弈論研研究經(jīng)濟(jì)濟(jì)問題時(shí)時(shí),對(duì)于于同一經(jīng)經(jīng)濟(jì)現(xiàn)象象,由于于選擇了了不同的的策略集集合,得得到的博博弈結(jié)果果截然不不同。用表示博弈弈的局中中人集合合,表示示局中人人的策略略集合,表示的收益函數(shù),則就表示了一個(gè)博弈。根據(jù)局中人的多少,博弈可分為二人博弈和多人博弈。根據(jù)博弈的策略集合是否有限,博弈還又可分為有限博弈和無限博弈。例如,便士匹配和囚徒難題都是有限博弈,而古諾博弈和貝特蘭博弈都是無限博弈。還可根據(jù)所有局中人的收益總和是否固定,把博弈分為常和博弈和變和博弈。常和博弈分為零和博弈(即收益總和為零的博弈)和

24、非零和博弈。二人零和有限博弈是所有博弈中最簡(jiǎn)單、最重要的一類,通常稱為矩陣博弈。本節(jié)以二人博弈為重點(diǎn),介紹有關(guān)策略博弈的概念與理論。一策略表表與收益益矩陣設(shè)二人博弈弈的局中中人是甲甲和乙。甲甲有種可可選策略略,策略略表為;乙有種種可選策策略,策策略表為為。當(dāng)甲甲采取策策略,乙乙采取策策略時(shí),稱為為博弈的的局勢(shì),集集合就是是局勢(shì)集集合(局勢(shì)表表、局勢(shì)矩矩陣),即即每個(gè)局中人人選擇自自己的策策略時(shí),都都要考慮慮對(duì)手的的行動(dòng)。這這樣每個(gè)個(gè)局中人人的收益益不但與與自己的的選擇有有關(guān),而而且與對(duì)對(duì)手的選選擇有關(guān)關(guān),收益益函數(shù)是是定義在在局勢(shì)集集合上的的函數(shù),這這里假定定了局中中人的收收益是可可以用實(shí)實(shí)數(shù)

25、來都都來計(jì)量量的。用用表示局局中人甲甲的收益益函數(shù),用用表示局局中人乙乙的收益益函數(shù)。由由于局勢(shì)勢(shì)集合是是有限集集合,收收益函數(shù)數(shù)和都可用用矩陣加加以表示示,這些些矩陣就就稱為收收益矩陣陣。記,,則甲甲和乙的的收益矩矩陣分別別為:,當(dāng)(常數(shù))時(shí),該該博弈就就是常和和博弈。否否則,就就是變和和博弈。局局中人的的策略與與收益也也可用收收益表加加以表達(dá)達(dá):表1: 博弈的的收益表表乙的策略甲的策略,一般情況下下,二人人博弈可可表示成成。但對(duì)對(duì)于二人人常和博博弈,則則可簡(jiǎn)單單地表示示成,其其中為收收益的常常數(shù)和。而而矩陣博博弈則可可更簡(jiǎn)單單地表示示成,或或者直接接用甲的的收益矩矩陣來表表示矩陣陣博弈。二

26、最小最最大原理理局中人的目目標(biāo)是選選擇使自自己收益益最大化化的策略略,我們們來分析析局中人人如何決決策。假假定甲乙乙雙方彼彼此了解解對(duì)方的的收益表表。如果果甲通過過間諜獲獲悉乙采采取某種種策略時(shí)時(shí),甲必必然會(huì)采采取相應(yīng)應(yīng)的某種種策略,以以求自己己的收益益最大,即即選擇使使下式成成立:但是,當(dāng)甲甲不知道道乙會(huì)采采取什么么策略時(shí)時(shí),如果果甲是一一個(gè)避險(xiǎn)險(xiǎn)者,那那么他必必將作最最壞的打打算,以以求取得得較好的的效果。首首先,甲甲要從收收益表中中找出自自己的每每一種策策略下至至少可獲獲得的收收益(即所能能獲得的的最小收收益),即先先求解,然然后從這這些最小小收益策策略中選選擇出收收益最大大的策略略,即

27、“從最小小收益中中選擇最最大收益益”。從收收益矩陣陣來看這這個(gè)決策策過程,即即甲首先先選出自自己的收收益矩陣陣的各行行的最小小值,然然后從這這些最小小值中再再選出最最大值:這就是求解解策略博博弈的最最小最大大原理,其其合理性性表現(xiàn)為為:如果果甲采取取按照最最小最大大原理確確定的策策略,那那么不論論乙采取取什么策策略,甲甲都可至至少得到到這個(gè)最最小最大大收益。由由此可見見,最小小最大原原理是能能夠確保保局中人人收益的的一種原原理。今今后,我我們把局局中人甲甲按照最最小最大大原理所所確定的的策略,叫叫做甲的的穩(wěn)妥策策略。對(duì)于局中人人乙來說說,他的的決策行行為和決決策過程程同甲是是一樣的的,只不不過

28、乙要要依賴于于收益矩矩陣。乙乙決策的的最小最最大原理理是:乙乙先選出出收益矩矩陣的各各列的最最小值,然然后從這這些最小小值中選選出最大大值:局中人乙按按照最小小最大原原理確定定的策略略,稱為為乙的穩(wěn)穩(wěn)妥策略略。讀者可能會(huì)會(huì)問:甲甲先找出出他的收收益矩陣陣各列的的最大值值,然后后再?gòu)倪@這些最大大值中選選出最小小值,不不也是一一種很好好的決策策辦法嗎嗎?其實(shí)實(shí),這種種決策辦辦法叫做做最大最最小法,照照此辦法法做出的的決策,在在甲不知知道乙會(huì)會(huì)采取什什么策略略的情況況下不能能保證甲甲的最大大最小收收益能夠夠達(dá)到。原原因在于于最大最最小法需需要確定定出乙的的每種策策略下甲甲的最大大可能的的收益。假假如

29、甲按按照最大大最小法法選出了了策略, 那么么當(dāng)乙采采用策略略時(shí),甲甲可得到到最大最最小收益益。但是是,若乙乙采用的的不是策策略, 而是策策略,那那么甲如如不重新新選擇他他的收益益矩陣第第列的最最大值的的話,他他的最大大最小收收益就不不一定能能夠達(dá)到到,這正正是最大大最小法法同最小小最大原原理的區(qū)區(qū)別。實(shí)際中,在在甲不知知道乙會(huì)會(huì)采取什什么策略略的情況況下選定定了自己己的策略略以后,乙乙的策略略才出臺(tái)臺(tái),為甲甲也獲悉悉了乙的的這一行行動(dòng)時(shí),甲甲很有可可能來不不及調(diào)整整自己原原定的策策略,從從而給甲甲帶來一一定的損損失。因因此,最最大最小小法在保保證局中中人收益益方面不不如最小小最大原原理那么么保

30、險(xiǎn)。當(dāng)甲和乙的的穩(wěn)妥策策略都已已選定時(shí)時(shí),二者者結(jié)合起起來能否否成為博博弈的結(jié)結(jié)果呢?答案是是未必。請(qǐng)請(qǐng)看下面面二人零零和博弈弈的事例例。例1. 高高度不確確定的博博弈考慮二人博博弈,甲甲的策略略集合,乙乙的策略略集合,甲甲和乙的的收益矩矩陣和通過博博弈的收收益表給給出(見表22)。表2: 甲和乙乙的收益益表乙甲4,1,2,3,對(duì)于甲來說說,;對(duì)對(duì)于乙來來說,。這這說明甲甲的穩(wěn)妥妥策略是是,乙的的穩(wěn)妥策策略是。但是,當(dāng)甲甲采取時(shí)時(shí),乙采采取的收收益小于于采取的的收益,因因而乙要要改用策策略。在在乙改用用后,甲甲采取策策略的收收益小于于采取的的收益,因因而甲也也要改用用策略。而而當(dāng)甲改改用后,乙

31、乙采用的的收益小小于采用用的收益益,于是是乙又要要改回到到;在乙乙改回到到后,甲甲也要改改回到收收益最大大的策略略。這就就讓我們們看到:當(dāng)甲采采取時(shí),乙乙要采用用;然后后甲改用用,乙隨隨之改用用;甲再再改用,乙乙又改用用,如此此不斷往往復(fù)下去去,博弈弈的結(jié)局局是高度度不確定定的。一般來講,要要想一個(gè)個(gè)二人博博弈具有有確定的的結(jié)局,必必須存在在這樣的的局勢(shì):滿足這個(gè)條條件的的的局勢(shì),叫叫做博弈弈的均衡或最優(yōu)解解或最優(yōu)局局勢(shì),其其中的和和分別叫叫做局中中人甲和和乙的最最優(yōu)策略略或均衡策策略。這這個(gè)條件件也就叫叫做博弈弈的均衡衡條件。對(duì)于二人常常和博弈弈來說,是是博弈的的最優(yōu)解解當(dāng)且僅僅當(dāng)數(shù)學(xué)中,滿

32、滿足這個(gè)個(gè)條件的的點(diǎn)叫做做函數(shù)的的鞍點(diǎn)。因因此,是是博弈的的最優(yōu)解解當(dāng)且僅僅當(dāng)是收收益函數(shù)數(shù)的鞍點(diǎn)點(diǎn)。下面面的定理理給出了了鞍點(diǎn)的的判別條條件。鞍點(diǎn)定理是收益益函數(shù)的的鞍點(diǎn)的的充要條條件是:證明:必要要性. 設(shè)是的鞍點(diǎn)點(diǎn),即。從可知,對(duì)對(duì)一切成成立,這這就蘊(yùn)含含著,即即。注意,。這這就證明明了。充分性設(shè)設(shè)滿足。從從可知;從從可知。所所以,即即是函數(shù)數(shù)的鞍點(diǎn)點(diǎn)。既然二人常常和博弈弈的最優(yōu)優(yōu)解恰好好就是收收益函數(shù)數(shù)的鞍點(diǎn)點(diǎn),鞍點(diǎn)點(diǎn)定理告告訴我們們,當(dāng)收收益函數(shù)數(shù)的鞍點(diǎn)點(diǎn)存在時(shí)時(shí),利用用最小最最大原理理確定的的博弈局局勢(shì)就是是二人常常和博弈弈的最優(yōu)優(yōu)解。但是,當(dāng)收收益矩陣陣不存在在鞍點(diǎn)時(shí)時(shí),常和和博

33、弈就就沒有最最優(yōu)解,博博弈的結(jié)結(jié)局就是是高度不不確定的的。鑒于于此,我我們將有有鞍點(diǎn)的的常和博博弈稱為為嚴(yán)格確確定的博博弈。三反應(yīng)函函數(shù)博弈的局中中人總是是要考慮慮對(duì)手的的行動(dòng),然然后確定定自己的的對(duì)策。當(dāng)當(dāng)乙采取取了某種種策略,而而且被甲甲所覺察察時(shí),甲甲必然有有所反應(yīng)應(yīng),要確確定出相相應(yīng)的對(duì)對(duì)策以使使自己的的收益在在乙選擇擇的情況況下達(dá)到到最大,即即要使。甲甲對(duì)乙的的行動(dòng)的的這種反反應(yīng),確確定了一一個(gè)從乙乙的策略略集合到到甲的策策略集合合的映射射,即對(duì)對(duì)任何,甲甲的反應(yīng)應(yīng)策略是是按照來來確定的的。這個(gè)個(gè)映射就就叫做甲甲對(duì)乙的的反應(yīng)函函數(shù)。同樣的道理理,可以以確定出出乙對(duì)甲甲的反應(yīng)應(yīng)函數(shù),即

34、即對(duì)任何何,是按照照來確定定的。利用反應(yīng)函函數(shù),我我們也可可以解釋釋博弈的的結(jié)局。就就象古諾諾博弈一一樣,假假如甲先先采取某某種策略略,乙通通過某種種途徑獲獲悉了甲甲的這一一行動(dòng),并并認(rèn)為甲甲不會(huì)改改變他的的策略,于于是作出出反應(yīng),決決定采取取策略,以以使自己己的收益益最大化化。當(dāng)乙乙采取策策略時(shí),甲甲掌握了了這一信信息,并并認(rèn)為乙乙不會(huì)改改變他的的策略,于于是作出出反應(yīng),改改變?cè)瓉韥淼牟呗月?,決定定采用,以以求收益益最大化化。這時(shí)時(shí),乙再再次對(duì)甲甲的行為為作出反反應(yīng),采采取新策策略。甲甲也再次次對(duì)乙的的行動(dòng)作作出反應(yīng)應(yīng),采取取新策略略。這樣樣的反應(yīng)應(yīng)不斷下下去,直直到最后后達(dá)到且且時(shí)博弈弈實(shí)

35、現(xiàn)了了均衡,此此時(shí)的局局勢(shì)就是是博弈的的最優(yōu)解解(均衡、最最優(yōu)局勢(shì)勢(shì))。綜上所述,博博弈的結(jié)結(jié)局是實(shí)實(shí)現(xiàn)均衡衡,并且且均衡由由甲乙雙雙方的反反應(yīng)函數(shù)數(shù)確定,即即由方程程組決定定。事實(shí)實(shí)上,是是該方程程組的解解當(dāng)且僅僅當(dāng),而而這正是是博弈實(shí)實(shí)現(xiàn)均衡衡的含義義。注意意,以上上關(guān)于反反應(yīng)函數(shù)數(shù)的討論論,沒有有要求策策略集合合的有限限性,即即集合和和可以是是任何集集合。下面考慮二二人無限限博弈的的一種特特殊情況況:策略略集合和和都是實(shí)實(shí)數(shù)區(qū)間間。比如如,本章章第一節(jié)節(jié)例3中中古諾博博弈的局局中人策策略集合合就是區(qū)區(qū)間(半半直線),例44中貝特特蘭博弈弈的局中中人策略略集合也也是半直直線。假假設(shè)局中中人

36、甲和和乙的收收益函數(shù)數(shù)和可微,則則甲對(duì)乙乙的反應(yīng)應(yīng)函數(shù)由由方程(一階條條件)決定,乙乙對(duì)甲的的反應(yīng)函函數(shù)由方方程(一階條條件)決定,從從而博弈弈的最優(yōu)優(yōu)解就是是如下方方程組的的解:例2二人人博弈的的反應(yīng)函函數(shù)及最最優(yōu)解設(shè)二人博弈弈中,甲甲和乙的的策略集集合和為,收益益函數(shù)和和分別如如下:求偏導(dǎo)數(shù)得得方程組組。由此此可知局局中人甲甲和乙的的反應(yīng)函函數(shù)分別別為,博博弈的最最優(yōu)解為為。四策略選選擇的經(jīng)經(jīng)濟(jì)模擬擬第一節(jié)中曾曾經(jīng)指出出,描述述一個(gè)博博弈時(shí)策策略集合合的選擇擇至關(guān)重重要。比比較古諾諾博弈和和貝特蘭蘭博弈,雖雖然二者者的目的的都是要要模擬同同一經(jīng)濟(jì)濟(jì)現(xiàn)象雙頭頭壟斷,但但二者的的結(jié)構(gòu)卻卻很不同

37、同。古諾諾博弈中中廠商的的策略是是選擇產(chǎn)產(chǎn)量,廠廠商的收收益是策策略變量量的連續(xù)續(xù)函數(shù);而貝特特蘭博弈弈中廠商商的策略略是選擇擇價(jià)格,廠廠商的收收益是策策略變量量的非連連續(xù)函數(shù)數(shù)。這導(dǎo)導(dǎo)致了相相當(dāng)不同同的均衡衡,究竟竟哪一種種是正確確的呢?如果抽象地地看待這這個(gè)問題題,那么么“哪一種種模型正正確”這樣的的提問并并無什么么意義。要要回答這這個(gè)問題題,就必必須看模模型試圖圖模擬什什么。不不要問哪哪一種模模型是正正確的,而而去問策策略選擇擇中什么么樣的考考慮是切切入主題題的,這這樣的提提問可能能會(huì)更加加有益一一些。比比如,如如果我們們觀察OOPECC公司的的公告,就就會(huì)發(fā)現(xiàn)現(xiàn)OPEEC企圖圖為每一一

38、個(gè)員工工決定產(chǎn)產(chǎn)量配額額,并且且允許按按照世界界石油市市場(chǎng)價(jià)格格定價(jià),這這樣按照照產(chǎn)量水水平而不不是按價(jià)價(jià)格水平平來模擬擬博弈策策略,就就可能更更加合理理。在策略選擇擇的經(jīng)濟(jì)濟(jì)模擬中中還有另另一方面面的考慮慮,乃就就是一旦旦對(duì)手的的行為被被觀察到到,那么么對(duì)手的的策略應(yīng)應(yīng)該是被被承諾的的或者是是難以改改變的。然然而到目目前為止止,所描描述的博博弈是“一次性性”(onne-sshott)博弈弈,其特特點(diǎn)是一一旦知道道對(duì)手的的行動(dòng),策策略變量量可以很很快地進(jìn)進(jìn)行調(diào)整整。例如如,假設(shè)設(shè)我為我我的產(chǎn)品品選擇一一個(gè)價(jià)格格,然后后發(fā)現(xiàn)我我的對(duì)手手制定了了一個(gè)略略低一些些的價(jià)格格,在這這種情況況下我可可以很

39、快快地調(diào)整整我的價(jià)價(jià)格。因因此,盡盡管“一次性性”博弈所所描述的的現(xiàn)象應(yīng)應(yīng)該是發(fā)發(fā)生在實(shí)實(shí)際生活活中的現(xiàn)現(xiàn)實(shí),但但在“一次性性”博弈中中模擬這這種能夠夠很快調(diào)調(diào)整的策策略反應(yīng)應(yīng)并不具具有多大大的意義義。似乎乎應(yīng)該使使用多階階段博弈弈,這樣樣才能捕捕獲到策策略選擇擇行為的的所有可可能的內(nèi)內(nèi)容。另一方面,如如果我們們把古諾諾博弈中中的產(chǎn)量量水平解解釋成為為廠商的的生產(chǎn)能能力,那那么一定定產(chǎn)量的的產(chǎn)品生生產(chǎn)就可可能是不不可撤消消或不可可改變的的資本投投資。這這種情況況下,廠廠商一旦旦發(fā)現(xiàn)對(duì)對(duì)手的產(chǎn)產(chǎn)量水平平,而要要改變廠廠商自己己的產(chǎn)量量水平,則則可能是是難以辦辦到或非非常昂貴貴的。生生產(chǎn)能力力或產(chǎn)

40、量量水平似似乎是廠廠商策略略的天然然選擇,即即使一次次性博弈弈中也是是這樣。同大部分經(jīng)經(jīng)濟(jì)模擬擬一樣,在在策略選選擇的經(jīng)經(jīng)濟(jì)模擬擬中,如如果既要要讓博弈弈簡(jiǎn)單明明了以便便分析,又又要能夠夠說明實(shí)實(shí)際策略略的迭接接要素,那那么如何何表示博博弈的策策略選擇擇,就是是一項(xiàng)藝藝術(shù)。第三節(jié) 重重復(fù)博弈弈到目前為止止,所談?wù)務(wù)摰牟┎┺氖且灰淮涡缘牡?。其?shí)實(shí),任何何博弈都都可以一一次一次次地重復(fù)復(fù)進(jìn)行,且且每一次次重復(fù)都都不是簡(jiǎn)簡(jiǎn)單地重重復(fù)前一一次的著著法,而而會(huì)考慮慮得比前前一次更更全面些些,技法法也會(huì)更更高些。就就好像棋棋手下棋棋一樣,一一局結(jié)束束了再開開一局,前前一局在在某些著著法上吃吃了虧,這這一局

41、中中就會(huì)吸吸取教訓(xùn)訓(xùn)而加以以注意,正正所謂“吃一暫暫,長(zhǎng)一一智”。反反反復(fù)復(fù)地地開局,給給棋手不不斷積累累經(jīng)驗(yàn),讓讓棋手的的技藝越越來越高高。通過博弈的的重復(fù)進(jìn)進(jìn)行,局局中人的的經(jīng)驗(yàn)越越來越豐豐富,這這種經(jīng)驗(yàn)驗(yàn)源于博博弈歷史史。實(shí)際際上,重重復(fù)博弈弈中的每每一點(diǎn)處處,局中中人決定定自己的的選擇時(shí)時(shí)會(huì)考慮慮到達(dá)該該點(diǎn)之前前的全部部博弈歷歷史,比比如象棋棋棋手在在上一局局中因出出車慢而而吃了虧虧,那么么這一局局中就會(huì)會(huì)吸取前前一局的的教訓(xùn)而而趕快把把車開出出來。這這樣一來來,重復(fù)復(fù)博弈中中局中人人的策略略空間隨隨著博弈弈被重復(fù)復(fù)的次數(shù)數(shù)的增加加而變得得越來越越大,也也就是說說,博弈弈歷史越越長(zhǎng),局

42、局中人的的策略空空間越大大,可以以選擇的的著法越越多。由由于“我的對(duì)對(duì)手會(huì)基基于我的的選擇歷歷史而修修正他的的行為,我我必須在在做出自自己的選選擇時(shí)考考慮到這這種影響響”,所以以,重復(fù)復(fù)博弈的的結(jié)果不不絕不是是一次性性博弈的的簡(jiǎn)單重重復(fù)。例1. 囚囚徒博弈弈的重復(fù)復(fù)我們以囚徒徒博弈為為例,來來分析重重復(fù)博弈弈問題。囚囚徒博弈弈中,企企圖獲得得“(合作作,合作作)”解是兩兩個(gè)局中中人的長(zhǎng)長(zhǎng)期利益益所在。對(duì)對(duì)于每個(gè)個(gè)局中人人來說,可可行的做做法是試試著給另另一個(gè)局局中人發(fā)發(fā)出“信號(hào)”以表明明他的“善意”,并且且在博弈弈一開始始移動(dòng)就就進(jìn)行合合作。當(dāng)當(dāng)然,背背叛是另另一個(gè)局局中人的的短期利利益所在在

43、。如果果他不合合作而采采取背叛叛策略,那那么對(duì)方方就可能能失去耐耐心而從從此以后后永遠(yuǎn)只只實(shí)行背背叛。這這樣一來來,背叛叛者就會(huì)會(huì)因只看看到眼前前利益而而喪失合合作的長(zhǎng)長(zhǎng)期利益益?;谟谶@種推推理可以以得到的的事實(shí)是是,一個(gè)個(gè)局中人人目前的的做法將將在未來來將得到到回應(yīng)其他他局中人人的未來來選擇可可能依賴賴于這個(gè)個(gè)局中人人當(dāng)前的的選擇?,F(xiàn)在來分析析一下“(合作作,合作作)”局勢(shì)能能否成為為重復(fù)囚囚徒博弈弈的一個(gè)個(gè)均衡。我我們分兩兩種情況況進(jìn)行討討論,一一種情況況是有限限次重復(fù)復(fù)博弈,另另一種情情況是無無限次重重復(fù)博弈弈。先討論有限限次重復(fù)復(fù)博弈,為為此假定定每個(gè)局局中人都都知道博博弈將重重復(fù)一

44、個(gè)個(gè)固定的的次數(shù)(比比如重復(fù)復(fù)次)。考考慮最后后一輪博博弈實(shí)施施之前局局中人給給予的推推理,此此時(shí)每個(gè)個(gè)人都認(rèn)認(rèn)為他們們?cè)谶M(jìn)行行一次性性博弈。由由于這是是最后一一次移動(dòng)動(dòng),將來來不會(huì)再再有,因因此均衡衡的標(biāo)準(zhǔn)準(zhǔn)邏輯推推理便得得以應(yīng)用用,其結(jié)結(jié)果是局局中人雙雙方都選選擇“背叛”策略。再再考慮最最后一次次移動(dòng)之之前的移移動(dòng),這這里似乎乎每個(gè)局局中人都都重視合合作,以以向?qū)Ψ椒桨l(fā)出他他是“好人”的信號(hào)號(hào),以便便能在下下一次以以及最后后一次移移動(dòng)中合合作。但但是,我我們已經(jīng)經(jīng)看到,最最后一次次移動(dòng)中中雙方都都將采取取背叛,因因此在倒倒數(shù)第二二次的移移動(dòng)中合合作就沒沒有什么么優(yōu)勢(shì)可可言。采采取合作作是為

45、了了得到長(zhǎng)長(zhǎng)期利益益,為了了在將來來最后一一次移動(dòng)動(dòng)中得到到回應(yīng)。然然而,將將來最后后一次移移動(dòng)中并并不能得得到合作作,雙方方都背叛叛了,結(jié)結(jié)果倒數(shù)數(shù)第二次次移動(dòng)中中雙方也也只有采采取背叛叛。同理理不斷向向后歸納納(baackwwardds indducttionn),結(jié)結(jié)果最后后一次移移動(dòng)之前前的所有有移動(dòng)中中,合作作并不能能帶來什什么長(zhǎng)期期利益,沒沒有什么么優(yōu)點(diǎn),局局中人惟惟有相信信其他局局中人將將在最后后一次移移動(dòng)中背背叛,用用現(xiàn)在的的善意企企圖去影影響未來來下一次次的移動(dòng)動(dòng)是無利利可圖的的。因此此,在重重復(fù)某一一固定次次數(shù)的囚囚徒難題題重復(fù)博博弈中,每每一局博博弈的均均衡局勢(shì)勢(shì)都是“(

46、背叛叛,背叛叛)”,而不不是“(合作作,合作作)”。再來考慮博博弈可無無限次重重復(fù)的情情況。當(dāng)當(dāng)博弈的的重復(fù)次次數(shù)為無無限時(shí),情情況就大大不相同同了。此此時(shí),局局中人在在每一個(gè)個(gè)階段都都知道博博弈至少少還要重重復(fù)一次次以上,因因而合作作大有前前景,長(zhǎng)長(zhǎng)期利益益在望。在在這種無無限次重重復(fù)的囚囚徒博弈弈中,每每個(gè)人的的策略都都是一個(gè)個(gè)函數(shù)序序列,它它表明每每個(gè)局中中人在每每個(gè)階段段是選擇擇合作還還是選擇擇背叛,都都是作為為此階段段之前博博弈歷史史的函數(shù)數(shù)。重復(fù)復(fù)博弈中中,局中中人的收收益是各各階段收收益的貼貼現(xiàn)值之之總和貼現(xiàn)現(xiàn)和(向時(shí)刻刻0貼現(xiàn)現(xiàn))。具具體地說說,設(shè)局局中人在在時(shí)刻的的收益(即第

47、局重重復(fù)中的的收益)為,他在在重復(fù)博博弈中的的收益就就是貼現(xiàn)現(xiàn)和,其其中為貼貼現(xiàn)率。只只要貼現(xiàn)現(xiàn)率不很很高,囚囚徒博弈弈每一局局重復(fù)的的均衡局局勢(shì)便都都是“(合作作,合作作)”,每個(gè)個(gè)人在各各個(gè)階段段都會(huì)看看到合作作的利益益。為了了說明這這個(gè)事實(shí)實(shí),我們們采用第第一節(jié)例例2提供供的數(shù)據(jù)據(jù)。假設(shè)兩個(gè)局局中人一一直合作作,移動(dòng)動(dòng)到了時(shí)時(shí)刻。如如果本次次移動(dòng)中中一個(gè)人人決定背背叛,那那么另一一個(gè)人會(huì)會(huì)因本次次移動(dòng)中中采取合合作而未未得收益益,從而而從下次次以后永永遠(yuǎn)采取取背叛策策略,給給對(duì)方以以懲罰。第第一個(gè)背背叛者從從本次開開始,以以后只能能繼續(xù)背背叛(因因?yàn)楹献髯鞯氖找嬉鏋榱悖?,結(jié)結(jié)果他雖雖然在

48、本本次移動(dòng)動(dòng)中立即即得到了了40000元的的收益,但但也以以以后無限限次的110000元收益益這個(gè)低低收益流流來毀滅滅自己,他他從背叛叛中得到到的收益益貼現(xiàn)和和為元。另另一方面面,如果果他持續(xù)續(xù)合作下下去,永永不背叛叛,那么么對(duì)方也也不會(huì)背背叛,于于是他從從合作中中得到的的收益貼貼現(xiàn)和為為元。比比較和可知,只只要貼現(xiàn)現(xiàn)率,就就有。這這就說明明,只要要貼現(xiàn)率率不很高高,當(dāng)一一方背叛叛時(shí),另另一方也也采取背背叛給其其以懲罰罰,就能能使背叛叛者償其其苦果。由由此看來來,只有有雙方互互相合作作下去。如如有一方方背叛,另另一方就就要執(zhí)行行懲罰策策略來使使背叛者者飽償苦苦果,因因而沒有有一方能能夠從背背叛

49、中會(huì)會(huì)有收獲獲。所以以,在貼貼現(xiàn)率不不很高的的情況下下,囚徒徒博弈重重復(fù)的均均衡是局局中人雙雙方在各各階段都都采取合合作策略略。以上論述實(shí)實(shí)際上是是很有力力的,有有一個(gè)稱稱為弗爾爾克(FFolkk)的著著名定理理支持了了這一論論述。該該定理斷斷言:在在重復(fù)的的囚徒博博弈中,任任何收益益如果高高于局中中人雙方方一致背背叛所能能得到的的收益,那那么都將將被作為為重復(fù)博博弈均衡衡而得到到支持。上上面我們們還提到到了懲罰罰策略,實(shí)實(shí)際上這這個(gè)策略略可明確確敘述成成:“在當(dāng)前前移動(dòng)中中合作,除除非其他他局中人人在最后后移動(dòng)中中背叛”。采取取這個(gè)策策略的理理由是,如如果一個(gè)個(gè)局中人人背叛,那那么他將將在收

50、益益上得到到永久性性懲罰。另另外,上上面論述述中還涉涉及到了了貼現(xiàn)率率,并要要求貼現(xiàn)現(xiàn)率不很很高。實(shí)實(shí)際上,當(dāng)當(dāng)貼現(xiàn)率率很高時(shí)時(shí),當(dāng)前前收益就就是特別別重要的的,因?yàn)闉閷淼牡呢泿刨H貶值太大大了,現(xiàn)現(xiàn)在的收收益要抵抵得上將將來收益益的好幾幾倍,因因而當(dāng)事事人只好好顧及當(dāng)當(dāng)前收益益,力求求當(dāng)前收收益越多多越好,而而把未來來長(zhǎng)遠(yuǎn)利利益放在在次要位位置上。下面再看一一個(gè)雙頭頭壟斷的的重復(fù)博博弈事例例。例2維持持卡特爾爾考慮一個(gè)簡(jiǎn)簡(jiǎn)單的重重復(fù)雙頭頭壟斷,如如果兩個(gè)個(gè)廠商都都執(zhí)行古古諾博弈弈均衡策策略,則則得到利利潤(rùn);如如果以共共同利潤(rùn)潤(rùn)最大化化決定產(chǎn)產(chǎn)量水平平,即執(zhí)執(zhí)行卡特特爾行動(dòng)動(dòng),則得得到利潤(rùn)潤(rùn)。

51、我們們知道,一一次性博博弈中共共同利潤(rùn)潤(rùn)最大化化的產(chǎn)量量不是博博弈均衡衡,每個(gè)個(gè)廠商都都有激勵(lì)勵(lì)去傾銷銷額外數(shù)數(shù)量的產(chǎn)產(chǎn)品,如如果他認(rèn)認(rèn)為其他他廠商將將保持產(chǎn)產(chǎn)量不變變的話。但但是在重重復(fù)博弈弈中,只只要貼現(xiàn)現(xiàn)率不太太高,合合作起來來以使共共同利潤(rùn)潤(rùn)最大化化之策略略,將是是重復(fù)博博弈的最最優(yōu)解??梢宰C明,如如果這種種簡(jiǎn)單的的雙頭壟壟斷博弈弈是一次次性的,那那么每個(gè)個(gè)廠商以以古諾產(chǎn)產(chǎn)量生產(chǎn)產(chǎn)將是博博弈的最最優(yōu)解。但但是,如如果這個(gè)個(gè)博弈是是不斷重重復(fù)的,那那么每個(gè)個(gè)廠商都都采取按按照卡特特爾產(chǎn)量量生產(chǎn)的的策略,即即都選擇擇合作,將將是雙頭頭壟斷重重復(fù)博弈弈的最優(yōu)優(yōu)解。對(duì)對(duì)不合作作的適當(dāng)當(dāng)懲罰,是

52、是采取生生產(chǎn)古諾諾產(chǎn)量水水平這一一策略??煽梢?,在在不斷重重復(fù)的雙雙頭壟斷斷博弈中中,由于于一次性性博弈均均衡這種種懲罰策策略的存存在,局局中人都都將以長(zhǎng)長(zhǎng)遠(yuǎn)利益益為重,來來維持卡卡特爾。第四節(jié) 混混合策略略并非所有博博弈都有有嚴(yán)格確確定的結(jié)結(jié)局。進(jìn)進(jìn)一步,實(shí)實(shí)際中博博弈局中中人常常常希望自自己的行行動(dòng)隱秘秘不被暴暴露,不不被對(duì)手手覺察。對(duì)對(duì)于這兩兩個(gè)問題題,目前前意義上上的策略略博弈是是解決不不了的。在在博弈非非嚴(yán)格確確定或者者局中人人希望保保守秘密密的情況況下,局局中人的的最好做做法是采采取混合合策略,即即以一定定的概率率采取某某種策略略。這樣樣做,甚甚至連局局中人自自己也不不知道每每一次

53、行行動(dòng)中究究竟采取取什么策策略,競(jìng)競(jìng)爭(zhēng)對(duì)手手就更不不得而知知了。而而且對(duì)于于非嚴(yán)格格確定的的博弈來來說,采采用混合合策略就就可求得得最優(yōu)解解。當(dāng)一一種混合合策略以以概率11選擇某某種策略略時(shí),這這種策略略就是前前三節(jié)所所談?wù)摰牡摹凹儭辈呗?,可可見混合合策略擴(kuò)擴(kuò)展了策策略概念念。一混合策策略的概概念我們以兩人人博弈為為例,來來對(duì)混合合策略的的概念以以及采取取混合策策略時(shí)局局中人的的行動(dòng)目目標(biāo)進(jìn)行行解釋。至至于更一一般的多多人博弈弈,將在在下一節(jié)節(jié)中討論論。設(shè)為有限二二人策略略博弈,其其中為局局中人甲甲的策略略集合,為乙的策略集合,和分別為甲和乙的收益函數(shù)。局中人為了了保持自自己決策策的秘密密性,

54、不不再象以以前那樣樣選擇純純策略,而而決定采采用隨機(jī)機(jī)辦法來來選擇策策略。也也就是說說,局中中人對(duì)純純策略的的選擇由由某種隨隨機(jī)裝置置來決定定,對(duì)每每個(gè)純策策略來說說,采用用它只有有可能性性的大小小,也就就是用多多大的概概率來選選擇各個(gè)個(gè)純策略略。這樣樣,對(duì)方方就不可可能事先先知道究究竟選擇擇哪個(gè)純純策略,甚甚至連局局中人自自己也不不可能事事先知道道,而純純策略是是在最后后時(shí)刻借借助隨機(jī)機(jī)裝置選選擇出來來的。通通過借助助隨機(jī)裝裝置,局局中人原原來對(duì)純純策略的的選擇變變成為現(xiàn)現(xiàn)在對(duì)各各個(gè)純策策略的概概率大小小的選擇擇。如果還嫌借借助隨機(jī)機(jī)裝置給給出的選選擇各個(gè)個(gè)純策略略的概率率大小具具有一定定的

55、客觀觀性,怕怕被對(duì)方方估計(jì)出出來,局局中人還還可進(jìn)一一步采取取主觀概概率分布布,以使使對(duì)純策策略的選選擇帶有有真正的的不確定定性(參參見第六六章關(guān)于于主觀概概率的介介紹)。這種以某種種概率選選擇的策策略就是是混合策策略,更更準(zhǔn)確地地說,選選擇混合合策略就就是選擇擇一個(gè)概概率分布布,然后后按照這這個(gè)分布布給出的的概率來來選擇各各個(gè)純策策略。假假如甲選選擇策略略的概率率為 ,則向向量代表表著甲選選擇各種種純策略略的概率率分布,實(shí)實(shí)際上就就表示了了甲的一一種混合合策略。這這就是說說,混合合策略是是用概率率分布來來表示的的,混合合策略的的變化完完全反映映為概率率分布的的變化。今今后,我我們把概概率分布

56、布就稱為為局中人人甲的混混合策略略。原來的純策策略可看看成是這這樣的一一種混合合策略:以概率率1選擇擇策略,以以概率00選擇其其他策略略。如此此一來,甲甲的策略略集合由由原來的的純策略略集合擴(kuò)擴(kuò)張成為為混合策策略集合合。同樣樣,局中中人乙的的選擇集集合也由由原來的的純策略略集合擴(kuò)擴(kuò)張成為為混合策策略集合合。當(dāng)甲甲采取混混合策略略,乙采采取混合合策略時(shí)時(shí),就稱稱為博弈弈的混合局局勢(shì)。在采取混合合策略的的情況下下,局中中人的目目標(biāo)是要要使預(yù)期期收益最最大化。當(dāng)當(dāng)甲采取取混合策策略,乙乙采取混混合策略略時(shí),甲甲和乙的的預(yù)期收收益分別別為和:這里,和都都寫成行行向量形形式,“”為轉(zhuǎn)置置運(yùn)算。甲甲的收益

57、益函數(shù)由由原來的的擴(kuò)充成成為,乙乙的收益益函數(shù)由由原來的的擴(kuò)充成成為。在策略集合合和收益益函數(shù)都都得到擴(kuò)擴(kuò)充以后后,原來來的純策策略博弈弈就擴(kuò)充充成為混混合策略略博弈,而而且可看看成是一一般的二二人博弈弈,不過過這個(gè)博博弈的收收益函數(shù)數(shù)具有雙雙線性性性,即對(duì)對(duì)于任何何,及任任何實(shí)數(shù)數(shù),都成成立:的混合局勢(shì)勢(shì)就是的的局勢(shì)。博博弈叫做做純策略略博弈的的混合擴(kuò)擴(kuò)充。關(guān)關(guān)于混合合擴(kuò)充,下下述兩個(gè)個(gè)事實(shí)是是明顯的的:(1) 博博弈是常常和博弈弈當(dāng)且僅僅當(dāng)混合合擴(kuò)充是是常和博博弈。(2) 如如果是常常和博弈弈,則混混合擴(kuò)充充保持了了原來博博弈的收收益和?;旌蠑U(kuò)充的的最優(yōu)解解(均衡),叫做做原博弈弈的最優(yōu)混

58、混合解(混合均均衡)。也即即是的最優(yōu)優(yōu)混合解解,是指指且。當(dāng)是的最優(yōu)優(yōu)混合解解時(shí),和和分別叫叫做甲和和乙的最最優(yōu)混合合策略??煽梢宰C明明:(3) 純純策略博博弈的最最優(yōu)解必必然是混混合擴(kuò)充充的最優(yōu)優(yōu)解。(4) 當(dāng)當(dāng)是常和和博弈時(shí)時(shí),是的最優(yōu)優(yōu)混合解解當(dāng)且僅僅當(dāng)。從(4)可可知,是是常和博博弈的最最優(yōu)混合合解當(dāng)切切僅當(dāng)是是預(yù)期收收益函數(shù)數(shù)的鞍點(diǎn)點(diǎn)。應(yīng)用用第二節(jié)節(jié)的鞍點(diǎn)點(diǎn)定理,我我們得到到常和博博弈的最最優(yōu)混合合解的又又一判別別條件:(5) 設(shè)設(shè)是二人人常和博博弈,則則是的最優(yōu)優(yōu)混合解解的充分分必要條條件是 。二混合策策略的意意義有時(shí),給予予混合策策略一個(gè)個(gè)有意義義的解釋釋是困難難的。第第一節(jié)例例

59、1所述述的便士士匹配博博弈,由由于收益益矩陣沒沒有鞍點(diǎn)點(diǎn),因而而沒有純純策略意意義下的的最優(yōu)解解。但由由于硬幣幣出現(xiàn)正正面或反反面,總總有一個(gè)個(gè)概率分分布情況況,因此此采取混混合策略略來把便便士匹配配博弈加加以擴(kuò)充充,然后后尋找混混合策略略意義下下的最優(yōu)優(yōu)解,這這顯然是是我們大大家都能能夠感覺覺得到的的應(yīng)該采采取的做做法。然然而對(duì)于于象雙頭頭壟斷這這樣的一一些其他他經(jīng)濟(jì)利利益博弈弈來說,采采取混合合策略似似乎是不不現(xiàn)實(shí)的的。除了混合策策略在一一定范圍圍內(nèi)缺乏乏現(xiàn)實(shí)意意義外,還還有一些些邏輯上上的原因因?qū)е聦?duì)對(duì)混合策策略難以以解釋。我我們用一一個(gè)例子子來說明明這一點(diǎn)點(diǎn)。例1性別別博弈(Battt

60、lee off thhe SSexees)性別博弈收收益表卡夫茹達(dá)話劇足球話劇2,10,0足球0,01,2這里介紹的的博弈背背后隱藏藏的故事事是一場(chǎng)場(chǎng)“性別之之戰(zhàn)”。茹達(dá)達(dá)(Rhhondda,女女)和卡卡夫(CCalvvin,男男)本周周末一起起歡度良良宵,但但他們二二人的娛娛樂愛好好不同。茹茹達(dá)喜歡歡看話劇劇,而卡卡夫喜歡歡看足球球比賽。如如果他們們同時(shí)選選擇看話話劇,則則茹達(dá)可可得2個(gè)個(gè)單位的的效用,卡卡夫可得得1個(gè)單單位的效效用;如如果同時(shí)時(shí)選擇看看足球比比賽,則則他們得得到的效效用正好好與此相相反;如如果他們們選擇不不同的娛娛樂,則則得不到到任何效效用。右右表給出出了茹達(dá)達(dá)和卡夫夫的收

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論