博弈論第3次課-博弈信息_第1頁(yè)
博弈論第3次課-博弈信息_第2頁(yè)
博弈論第3次課-博弈信息_第3頁(yè)
博弈論第3次課-博弈信息_第4頁(yè)
博弈論第3次課-博弈信息_第5頁(yè)
已閱讀5頁(yè),還剩35頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

博弈論——博弈信息博弈論與信息經(jīng)濟(jì)學(xué)

郝海天津工程師范學(xué)院經(jīng)濟(jì)管理博弈論的要素博弈論的提法可能太過(guò)于學(xué)術(shù)化,容易讓人們退避三舍。其實(shí)它有一個(gè)非常通俗的名字--游戲理論(博弈論的英文名字叫做"GameTheory",如果直譯,就是"游戲理論")。博弈論在我國(guó)還有一個(gè)名字,叫對(duì)策論。這些名字都很好理解,博弈字面意思就是賭博、下棋,賭博和下棋當(dāng)然是游戲了,賭博和下棋的時(shí)候常常要千方百計(jì)地應(yīng)付對(duì)手,自然是要講究對(duì)策了。

參與人players一個(gè)博弈中的決策主體,他的目的是通過(guò)選擇行動(dòng)(或戰(zhàn)略)以最大化自己的支付(效用水平)。參與人可能是自然人,也可能是團(tuán)體,如企業(yè),國(guó)家等。重要的是:每個(gè)參與人必須有可供選擇的行動(dòng)和一個(gè)很好定義的偏好函數(shù)。不做決策的被動(dòng)主體只能被當(dāng)作環(huán)境參數(shù)。虛擬參與人pseudo-player為了分析方便,自然nature被當(dāng)作虛擬參與人。自然代表決定外生隨機(jī)變量的概率分布的機(jī)制。比如房地產(chǎn)開(kāi)發(fā)中市場(chǎng)需求的大小。行動(dòng)ACTIONSORMOVES參與人在博弈的某個(gè)時(shí)點(diǎn)的決策變量。(坦白)N個(gè)參與人的行動(dòng)的有序集稱(chēng)為行動(dòng)組合(坦白,抵賴(lài))。行動(dòng)的順序?qū)τ诓┺牡慕Y(jié)果非常重要。有關(guān)靜態(tài)和動(dòng)態(tài)博弈的區(qū)分就是基于行動(dòng)的順序做出的。同樣的行動(dòng)集合,行動(dòng)的順序不同,每個(gè)參與人的最有決策就不同,博弈的結(jié)果也不同。尤其在不完全信息博弈中,后行動(dòng)者依賴(lài)觀察先行動(dòng)者的行動(dòng)來(lái)獲取信息。信息information參與人有關(guān)博弈的知識(shí),特別是有關(guān)自然的選擇,其他參與人的特征和行動(dòng)的知識(shí)。完美信息perfectinformation:指一個(gè)參與人對(duì)其他參與人的行動(dòng)選擇有準(zhǔn)確的理解,即每個(gè)信息集只包含一個(gè)值。共同知識(shí)commonknowledge所有參與人知道每一步的信息集。戰(zhàn)略strategies參與人在給定信息集的情況下的行動(dòng)規(guī)則,它規(guī)定參與人在什么時(shí)候選擇什么行動(dòng)。戰(zhàn)略與行動(dòng):戰(zhàn)略是行動(dòng)的規(guī)則而不是行動(dòng)本身。在靜態(tài)博弈中,戰(zhàn)略和行動(dòng)是相同的。戰(zhàn)略必須是完備的,要給出參與人在每一種可想象得到的情況下的行動(dòng)選擇。支付payoff(效用utility)在一個(gè)特定的戰(zhàn)略組合下參與人得到的確定效用水平,或是指參與人得到的期望效用水平。均衡equilibrium指所有參與人的最優(yōu)戰(zhàn)略的組合。博弈分類(lèi)和主要思想

博弈論根據(jù)其所采用的假設(shè)不同而分為合作博弈理論和非合作博弈理論。兩者的區(qū)別在于參與人在博弈過(guò)程中是否能夠達(dá)成一個(gè)具有約束力的協(xié)議。倘若不能,則稱(chēng)非合作博弈

Not-cooperativeGame。合作博弈強(qiáng)調(diào)的是集體主義,團(tuán)體理性Collectiverationality效率、公平、公正非合作博弈非合作博弈則主要研究人們?cè)诶嫦嗷ビ绊懙木謩?shì)中如何選擇策略使得自己的收益最大,強(qiáng)調(diào)個(gè)人理性、個(gè)人最優(yōu)決策,其結(jié)果是有時(shí)有效率,有時(shí)則不然。目前經(jīng)濟(jì)學(xué)家談到博弈論主要指的是非合作博弈,也就是各方在給定的約束條件下如何追求各自利益最大化,最后達(dá)到力量均衡。例子比如兩家企業(yè)A、B合作建設(shè)一條VCD的生產(chǎn)線,協(xié)議由A方提供生產(chǎn)VCD的技術(shù),B方則提供廠房和設(shè)備。在對(duì)技術(shù)和設(shè)備進(jìn)行資產(chǎn)評(píng)估時(shí)就形成非合作博弈,因?yàn)槊恳环蕉荚噲D最大化己方的評(píng)估值,這時(shí)B方如果能夠獲得A方關(guān)于技術(shù)的真實(shí)估價(jià)或參考報(bào)價(jià)這類(lèi)競(jìng)爭(zhēng)情報(bào),則可以使自己在評(píng)估中獲得優(yōu)勢(shì);同理,A方也是一樣。至于自己的資產(chǎn)評(píng)估是否會(huì)影響合作企業(yè)的總體運(yùn)行效率這樣的"集體利益",則不會(huì)非常重視。這就是非合作博弈,參與人在選擇自己的行動(dòng)時(shí),優(yōu)先考慮的是如何維護(hù)自己的利益。順序和信息

博弈論非常強(qiáng)調(diào)時(shí)間和信息的重要性,認(rèn)為時(shí)間和信息是影響博弈均衡的主要因素。在博弈過(guò)程中,參與者之間的信息傳遞決定了其行動(dòng)空間和最優(yōu)戰(zhàn)略的選擇;同時(shí),博弈過(guò)程中始終存在一個(gè)先后問(wèn)題

Sequenceorder參與人的行動(dòng)次序?qū)Σ┺淖詈蟮木庥兄苯拥挠绊憽7诸?lèi)博弈的劃分可以從參與人行動(dòng)的次序和參與人對(duì)其它參與人的特征、戰(zhàn)略空間和支付的知識(shí)、信息,是否了解兩個(gè)角度進(jìn)行。把兩個(gè)角度結(jié)合就得到了4種博弈:完全信息靜態(tài)博弈,完全信息動(dòng)態(tài)博弈,不完全信息靜態(tài)博弈,不完全信息動(dòng)態(tài)博弈.博弈的分類(lèi)及對(duì)應(yīng)的均衡靜態(tài)動(dòng)態(tài)完全信息完全信息靜態(tài)博弈;納什均衡;Nash(1950)完全信息動(dòng)態(tài)博弈;子博弈精煉納什均衡;澤爾騰(1965)不完全信息不完全信息靜態(tài)博弈;貝葉斯納什均衡;海薩尼(1967-1968)不完全信息動(dòng)態(tài)博弈,精煉貝葉斯納什均衡;澤爾騰(1975)Kreps,Wilson(1982),Fudenberg,Tirole(1991)博弈的擴(kuò)展式表述擴(kuò)展式表述所“擴(kuò)展”的主要是參與人的戰(zhàn)略空間戰(zhàn)略式表述簡(jiǎn)單地給出參與人有些什么戰(zhàn)略可以選擇,而擴(kuò)展式表述要給出每個(gè)戰(zhàn)略的動(dòng)態(tài)描述:誰(shuí)在什么時(shí)候行動(dòng),每次行動(dòng)時(shí)有些什么具體行動(dòng)方案可供選擇,以及知道些什么此時(shí)的戰(zhàn)略:如果你這樣,我將怎樣博弈的擴(kuò)展式表述要素:參與人集合參與人的行動(dòng)順序參與人的行動(dòng)空間參與人的信息集參與人的支付函數(shù)外生事件(即“自然”的選擇)的概率分布博弈的擴(kuò)展式表述博弈樹(shù)的基本元素:結(jié)、枝、信息集需要注意的概念:前列集、后續(xù)集;初始結(jié)、決策結(jié)、終點(diǎn)結(jié);直接前列結(jié)、直接后續(xù)結(jié)。以及相應(yīng)的符號(hào)信息集:某個(gè)參與人都知道些什么信息集是用來(lái)標(biāo)注某個(gè)人知道些什么信息的,不同的標(biāo)注表示這個(gè)人知道不同的信息博弈的擴(kuò)展式表述如果博弈樹(shù)的所有信息集都是單結(jié)的,則稱(chēng)為“完美信息博弈”,沒(méi)有任何兩個(gè)決策結(jié)是用虛線連起來(lái)的自然信息集總是假設(shè)為單結(jié)的博弈樹(shù)上是否出現(xiàn)連接不同決策結(jié)的虛線取決于如何劃決策結(jié)的順序p145一個(gè)參與人在決策之前所適當(dāng)?shù)氖虑楸仨毘霈F(xiàn)在該參與人的決策結(jié)之前有了信息集的概念,擴(kuò)展式表述也可用來(lái)表述靜態(tài)博弈擴(kuò)展式表述博弈的納什均衡需求大,開(kāi)發(fā)者利潤(rùn)8千萬(wàn),不開(kāi)發(fā)者利潤(rùn)0。需求大,兩者都開(kāi)發(fā)利潤(rùn)各為4千萬(wàn)。需求小,開(kāi)發(fā)者利潤(rùn)1千萬(wàn),不開(kāi)發(fā)者利潤(rùn)0。需求小,兩者都開(kāi)發(fā)利潤(rùn)各為-3千萬(wàn)兩者都不開(kāi)發(fā)利潤(rùn)各為0。博弈樹(shù):房地產(chǎn)開(kāi)發(fā)博弈IA開(kāi)發(fā)不開(kāi)發(fā)大小大小開(kāi)發(fā)不開(kāi)發(fā)開(kāi)不開(kāi)開(kāi)不開(kāi)開(kāi)不開(kāi)(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)

N1N2

B1B2B3B4博弈樹(shù):不允許的情形結(jié)(nodes):枝(branches):信息集(informationsets):博弈樹(shù)的結(jié)構(gòu)包括決策結(jié)和終點(diǎn)結(jié)。決策結(jié)是參與人采取行動(dòng)的時(shí)點(diǎn);終點(diǎn)結(jié)是博弈行動(dòng)路徑的終點(diǎn)。枝是從一個(gè)決策結(jié)到它的直接后續(xù)結(jié)的連線,每一個(gè)枝代表參與人的一個(gè)行動(dòng)選擇。一個(gè)信息集是決策結(jié)集合的一個(gè)子集(信息集是由決策結(jié)構(gòu)成的集合),該子集包括所有滿(mǎn)足下列條件的決策結(jié):(1)每一個(gè)決策結(jié)都是同一個(gè)參與人的決策結(jié)(2)該參與人知道博弈進(jìn)入該集合的某個(gè)決策結(jié),但不知道自己究竟處于哪一個(gè)決策結(jié)。信息集:房地產(chǎn)博弈IIA開(kāi)發(fā)不開(kāi)發(fā)大小大小開(kāi)發(fā)不開(kāi)發(fā)開(kāi)不開(kāi)開(kāi)不開(kāi)開(kāi)不開(kāi)(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)

N1N2

B1

B2

B3

B4信息集:房地產(chǎn)博弈IIIA開(kāi)發(fā)不開(kāi)發(fā)大小大小開(kāi)發(fā)不開(kāi)發(fā)開(kāi)不開(kāi)開(kāi)不開(kāi)開(kāi)不開(kāi)(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)

N1N2

B1

B2

B3

B4信息集:房地產(chǎn)博弈IVN大小開(kāi)不開(kāi)開(kāi)不開(kāi)開(kāi)發(fā)不開(kāi)發(fā)開(kāi)不開(kāi)開(kāi)不開(kāi)開(kāi)不開(kāi)(4,4)(8,0)(0,8)(0,0)(-3,-3)(1,0)(0,1)(0,0)

B1B2

A1A2A3A4幾個(gè)符號(hào)的意義第i個(gè)人的信息集為Hi,其中某特定信息集為hi,在hi的情況下會(huì)有A(hi)的行動(dòng)。他的所有信息集所對(duì)應(yīng)的所有行動(dòng)A(hi)的集合為Ai,∪表示聚合。第i個(gè)人有信息H,乃有行動(dòng)A此時(shí)的戰(zhàn)略是S(而且是純戰(zhàn)略,以后用其他字母表示“不純”戰(zhàn)略)→mapsinto153頁(yè)第二段:“每一個(gè)純戰(zhàn)略都是從信息集到行動(dòng)集的一個(gè)映射,Si可以表示為在每一個(gè)信息集hi上的行動(dòng)空間A(hi)的笛卡兒積”每一個(gè)純戰(zhàn)略都是原因現(xiàn)象依某種對(duì)應(yīng)關(guān)系所導(dǎo)致的惟一結(jié)果現(xiàn)象(信息集可視為自變量,行動(dòng)集可視為因變量),純戰(zhàn)略的集合Si就是行動(dòng)空間A(hi)中各種行動(dòng)的交叉乘積。完美信息博弈&不完美信息博弈一個(gè)信息集可能包含多個(gè)決策結(jié),也可能只包含一個(gè)決策結(jié)。只包含一個(gè)決策結(jié)的信息集稱(chēng)為單結(jié)信息集;如果博弈樹(shù)的所有信息集都是單結(jié)的,該博弈稱(chēng)為完美信息博弈(Gameofperfectinformation);否則就是不完美信息博弈??尚判裕洪_(kāi)金礦博弈

甲在開(kāi)采一價(jià)值4萬(wàn)元的金礦時(shí)缺1萬(wàn)元資金,而乙正好有1萬(wàn)元資金可以投資。甲希望乙能將1萬(wàn)元資金借給自己用于開(kāi)礦,并許諾在采到金子后與乙對(duì)半分成,乙是否該將錢(qián)借給甲呢?參見(jiàn)謝識(shí)予p128開(kāi)金礦I——無(wú)法律的博弈乙甲借不借分不分(2,2)(0,4)(1,0)開(kāi)金礦II——有法律保障的博弈乙甲借不借分不分(2,2)打不打(1,0)(0,4)(1,0)子博弈由一個(gè)決策結(jié)x和所有該決策結(jié)的后續(xù)結(jié)T(x)(包括終點(diǎn)結(jié))組成,它滿(mǎn)足下列條件:(1)x是一個(gè)單結(jié)信息集;(2)子博弈不改變?cè)┺牡男畔⒓椭Ц断蛄孔硬┺臈l件1說(shuō)的是一個(gè)子博弈必需從一個(gè)單結(jié)信息集開(kāi)始。即:(1)當(dāng)且僅當(dāng)決策者在原博弈中確切地知道博弈進(jìn)入一個(gè)特定的決策結(jié)時(shí),該決策結(jié)才能作為一個(gè)子博弈的開(kāi)始。(2)如果一個(gè)信息集包含兩個(gè)以上決策結(jié),沒(méi)有任何一個(gè)決策結(jié)可以作為子博弈的初始結(jié)。A開(kāi)發(fā)不開(kāi)發(fā)大小大小開(kāi)發(fā)不開(kāi)發(fā)開(kāi)不開(kāi)開(kāi)不開(kāi)開(kāi)不開(kāi)(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)

N1N2

B1B2B3B4A開(kāi)發(fā)不開(kāi)發(fā)大小大小開(kāi)發(fā)不開(kāi)發(fā)開(kāi)不開(kāi)開(kāi)不開(kāi)開(kāi)不開(kāi)(4,4)(8,0)(-3,-3)(1,0)(0,8)(0,0)(0,1)(0,0)

N1N2

B1

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論