完全信息靜態(tài)博弈課件_第1頁
完全信息靜態(tài)博弈課件_第2頁
完全信息靜態(tài)博弈課件_第3頁
完全信息靜態(tài)博弈課件_第4頁
完全信息靜態(tài)博弈課件_第5頁
已閱讀5頁,還剩41頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1完全信息靜態(tài)博弈博弈的基本概念納什均衡納什均衡應用混合策略和混合策略納什均衡1完全信息靜態(tài)博弈博弈的基本概念2伐木工人的決策和一個將軍的決策有什么不同?木頭沒有反抗。將軍的每一步計劃都會引來抵抗,他必須克服這種抵抗。你!你的對手、競爭者都是聰明有主見的!2伐木工人的決策和一個將軍的決策有什么不同?3社會科學研究策略性決策制定過程的分支稱為-博弈論。嚴格講,博弈論不是經濟學的一個分支,它是一種方法,涉及到很多領域:實際上,博弈論是數(shù)學的一個分支。3社會科學研究策略性決策制定過程的分支稱為-博弈論。4策略故事妙手傳奇給貓拴個鈴鐺多管齊下三思而后行4策略故事妙手傳奇5引言博弈論諾貝爾經濟學獎納什(Nash)(1950-1951)澤爾騰(selten)(1965,1975)海薩尼(Harsanyi)(1967-1968)共同獲得1994年諾貝爾經濟學獎5引言博弈論6數(shù)學界的梵高——“瘋子天才”納什

6數(shù)學界的梵高——“瘋子天才”納什

7三位大師主要的貢獻1950年和1951年納什的兩篇關于非合作博弈論的重要論文,徹底改變了人們對競爭和市場的看法。他證明了非合作博弈及其均衡解,并證明了均衡解的存在性,即著名的納什均衡。從而揭示了博弈均衡與經濟均衡的內在聯(lián)系。因為在現(xiàn)實世界中,非合作博弈要比合作博弈普遍得多。7三位大師主要的貢獻1950年和1951年納什的兩篇關于8SeltenandHarsanyi澤爾騰(1965)將納什均衡的概念引入了動態(tài)分析,提出了“精煉納什均衡”概念;以及進一步刻畫不完全信息動態(tài)博弈的“完備貝葉斯納什均衡”。而海薩尼則發(fā)展了刻畫不完全信息靜態(tài)博弈的“貝葉斯納什均衡”(1967-1968)??傊麄z進一步將納什均衡動態(tài)化,加入了接近實際的不完全信息條件。他們的工作為后人繼續(xù)發(fā)展博弈論,提供了基本思路和模型。8SeltenandHarsanyi澤爾騰(1965)將9諾貝爾經濟學獎1968年,瑞典中央銀行成立300周年,是為了紀念諾貝爾獎獎金提供者,設立諾貝爾經濟學獎。1969年開始頒發(fā)。9諾貝爾經濟學獎1968年,瑞典中央銀行成立300周年,是為10從游戲到博弈游戲的特點:下棋,打牌,賭勝,田徑,球類等等,共同的特點是

策略策略的好壞決定游戲的結果游戲的特征:規(guī)則,結果,策略,策略和利益的依存性10從游戲到博弈游戲的特點:下棋,打牌,賭勝,田徑,球類等等11什么是博弈論?博弈論:就是關于包含相互依存情況中理性行為的研究。相互依存:通常是指博弈中的任何一個局中人受到其他局中人的行為的影響,反過來,他的行為也影響到其他局中人。

相互依存的另一個方面是局中人可以有某些共同的興趣或利益所在。

“理性行為”的說明:博弈論中的所謂理性,一般不是指道德標準。

11什么是博弈論?博弈論:就是關于包含相互依存情況中理性行為12博弈三要素博弈方(局中人)----參與博弈但利益不完全一致者。有二人博弈與多人博弈之分。策略集----每個局中人都會有一系列的策略可選,稱為對應于每個局中人的策略集。有限和無限個對策。得益----在每策略組合下每一局中人的得益情況,是選擇策略的標準,稱為得益函數(shù)或支付函數(shù)。12博弈三要素博弈方(局中人)----參與博弈但利益不完全一13博弈的關鍵

局中人理性地采取或選擇自己的策略行為,在相互制約相互影響的依存關系中,盡可能的提高自己的利益所得,這樣,博弈論就是關于包含相互依存情況中理性行為的研究。相互依存理性行為13博弈的關鍵局中人理性地采取或選擇自己的策略行14博弈的四種分類情況完全信息靜態(tài)博弈完全信息動態(tài)博弈不完全信息靜態(tài)博弈不完全信息動態(tài)博弈14博弈的四種分類情況完全信息靜態(tài)博弈15博弈的分類及對應的均衡靜態(tài)動態(tài)完全信息完全信息靜態(tài)博弈;納什均衡;Nash(1950)完全信息動態(tài)博弈;子博弈精煉納什均衡;澤爾騰(1965)不完全信息不完全信息靜態(tài)博弈;貝葉斯納什均衡;海薩尼(1967-1968)不完全信息動態(tài)博弈,精煉貝葉斯納什均衡;澤爾騰(1975)Kreps,Wilson(1982),Fudenberg,Tirole(1991)15博弈的分類及對應的均衡靜態(tài)動態(tài)完全完全信息靜態(tài)博弈;完全16納什均衡納什均衡的定義納什均衡的一致預測性納什均衡與嚴格下策反復消去法16納什均衡納什均衡的定義17納什均衡的定義

各博弈方都不愿或不會單獨改變自己策略的策略組合,只要這種策略組合存在且是唯一的,博弈就有絕對確定的解。這種各博弈方都不愿單獨改變策略的策略組合就是博弈論中最重要的一個概念——“納什均衡”。17納什均衡的定義各博弈方都不愿或不會單獨改變自己策略18

我們常用G表示一個博弈;如G有n個博弈方,每個博弈方的全部可選策略的集合我們稱策略空間,分別用表示;用表示博弈方i的第j個策略,其中j可取有限個值(有限策略博弈),也可取無限個值(無限策略博弈);博弈方i的得益則用表示,是各博弈方策略的多元函數(shù)。n個博弈方的博弈G常寫成18我們常用G表示一個博弈;如G有n個博弈方,每個博弈19定義

在博弈中,如果由各個博弈方的各一個策略組成的某個策略組合中,任一博弈方i的策略,都是對其余博弈方策略的組合的最佳策略,即對任意都成立,則稱為G

的一個“納什均衡”。19定義在博弈20納什均衡的一致預測性

如果所有博弈方預測到一個特定的納什均衡將會出現(xiàn),那么,沒有人有興趣作不同的選擇。納什均衡的特征:博弈方預測到均衡,博弈方預測到其他博弈方預測到均衡,等等。一致性預測,并不意味著納什均衡一定是一個好的預測。20納什均衡的一致預測性如果所有博弈方預測到一個特定的21納什均衡應用

兩個嫌犯受到指控,但除非至少一個招認,否則警方不能將二人判有罪。警察把二人分別帶到不同的房間,告之后果:如果二人均不坦白,將被判入獄一年。如果雙方均坦白,將被判入獄5年。如果一方坦白,另一方不坦白,坦白一方立即釋放,另一方判入獄8年。21納什均衡應用兩個嫌犯受到指控,但除非至少一個招認,22囚徒2囚徒1不坦白坦白不坦白-1,-1-8,0坦白0,-8-5,-522囚徒2不坦白坦白不坦白-1,-1-8,0坦白0,-8-23囚徒困境說明了什么在(坦白、坦白)這個組合中,A和B都不能通過單方面的改變行動增加自己的收益,于是誰也沒有動力游離這個組合,因此這個組合是納什均衡,也叫非合作均衡。囚徒困境反映了個人理性和集體理性的矛盾。如果A和B都選擇不坦白,各判刑1年,顯然比都選擇坦白各判刑8年好得多。當然,A和B可以在被警察抓到之前訂立一個“攻守同盟”,但是這可能不會有用,因為它不構成納什均衡,沒有人有積極性遵守這個協(xié)定,顯然最好的策略是雙方都不坦白。23囚徒困境說明了什么在(坦白、坦白)這個組合中,A和B都不24囚徒困境的意義

“囚徒的兩難選擇”有著廣泛而深刻的意義。個人理性與集體理性的沖突,各人追求利己行為而導致的最終結局是一個“納什均衡”,也是對所有人都不利的結局。他們兩人都是在坦白與不坦白策略上首先想到自己,這樣他們必然要服長的刑期。只有當他們都首先替對方著想時,或者相互合謀(串供)時,才可以得到最短時間的監(jiān)禁的結果。24囚徒困境的意義“囚徒的兩難選擇”有著廣泛而深刻的意義25雙寡頭削價競爭

寡頭2

高價低價寡高價頭2低價100,10020,150150,2070,7025雙寡頭削價競爭寡頭226對經典經濟學的沖擊“納什均衡”首先對亞當·斯密的“看不見的手”的原理提出挑戰(zhàn)。按照斯密的理論,在市場經濟中,每一個人都從利己的目的出發(fā),而最終全社會達到利他的效果?!秶徽摗罚骸巴ㄟ^追求(個人的)自身利益,他常常會比其實際上想做的那樣更有效地促進社會利益?!?6對經典經濟學的沖擊27從“納什均衡”我們引出了“看不見的手”的原理的一個悖論:從利己目的出發(fā),結果損人不利己,既不利己也不利他。兩個囚徒的命運就是如此。從這個意義上說,“納什均衡”提出的悖論實際上動搖了西方經濟學的基石。27從“納什均衡”我們引出了“看不見的手”的原理的一個悖論:28研究囚徒困境問題的目的

利用這種困境達到有利于社會的目的政府在經濟活動中的組織協(xié)調工作的必要性避免囚徒困境28研究囚徒困境問題的目的利用這種困境達到有利于社會的目29混合策略納什均衡混合策略混合策略博弈混合策略納什均衡混合策略和嚴格下策反復消去法29混合策略納什均衡混合策略30

許多現(xiàn)實中決策問題構成的博弈中根本不存在具有穩(wěn)定性的各博弈方都接受的納什均衡策略組合如猜硬幣博弈和齊威王田忌賽馬,而另一些博弈卻有多于一個的納什均衡策略組合,如夫妻之爭博弈。這兩類博弈如果只進行一次,實際結果如何確實取決于機會和運氣,如果多次獨立反復進行這些博弈,這樣博弈方決策的好壞就會從平均得益上反映出來,策略運用得當平均收益會較理想,至少是不吃虧,否則平均得益就會很差。30許多現(xiàn)實中決策問題構成的博弈中根本不存在具有穩(wěn)定性31概念的引進31概念的引進32

在這種博弈中各博弈方決策的第一個原則:自己的策略選擇千萬不能預先被另一方偵知或猜到。這就是說博弈方必須隨機地選擇策略。其次,在本博弈中,如果蓋硬幣方雖然是隨機決定出正面還是反面,但如果在總體上出正面多于出反面,即出正面的概率大于出反面的概率,則猜硬幣方還是有機可乘。32在這種博弈中各博弈方決策的第一個原則:自己的策略選33

設蓋硬幣方出正面的概率為p,則出反面的概率為1-p.出正面多于出反面,即p>1-p或p>1/2。在這種情況下,如猜硬幣方全猜正面,則他的期望得益:即平均來講,猜硬幣方一定是贏多輸少。33設蓋硬幣方出正面的概率為p,則出反面的概率為1-p.34

雙方都按照上述概率隨機選擇策略,即在本博弈中,博弈方的決策內容不是確定性的具體的策略,而是在一些策略中隨機選擇的概率分布,這樣的決策我們稱為“混合策略”。34雙方都按照上述概率隨機選擇策略,即在本博弈中,博弈35定義

在博弈中;博弈方i的策略空間為,則博棄方i以概率分布隨機在其k個可選策略中選擇的“策略”,稱為一個“混合策略”,其中都成立,且35定義在博弈36

相對于這種以一定概率分布在一些策略中隨機選擇的混合策略,確定性的具體的策略我們稱為“純策略”,而我們原來意義上的納什均衡,即任何博弈方都不愿單獨改變策略的純策略組成的策略組合現(xiàn)在可稱為“純策略納什均衡”。當然,純策略也可以看作混合策略的特例。36相對于這種以一定概率分布在一些策略中隨機選擇的混合策37

純策略可以看作,選擇相應純策略的概率為1,選擇其余純策略的概率為0的混合策略。混合策略可以看作純策略的擴展。37純策略可以看作,選擇相應純策略的概率為1,選擇其余38

引進了混合策略的概念以后,我們可將納什均衡的概念擴大到包括混合策略的情況。對各博弈方的一個策略組合,不管它是純策略組成的還是混合策略組成的,只要滿足各博弈方都不會想要單獨偏離它,我們就稱之為一個納什均衡。如果確實是一個嚴格意義上的混合策略組合構成的納什均衡,稱為“混合策略納什均衡”。38引進了混合策略的概念以后,我們可將納什均衡的概念擴大39

猜硬幣博弈中兩博弈方都以(1/2,1/2)的概率分布隨機選擇正面和反面的混合策略組合,就是一個混合策略納什均衡。期望得益:零和博弈!

39猜硬幣博弈中兩博弈方都以(1/2,1/2)的概率分40應用例子40應用例子41

本博弈中兩博弈方決策的第一個原則是不能讓對方知道或猜到自己的選擇,因而必須在決策時利用隨機性。第二個原則是他們選擇每種策略的概率一定要恰好使對方無機可乘。41本博弈中兩博弈方決策的第一個原則是不能讓對方知道或猜42

設博弈方1選A的概率為pA,選B的概率為

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論