對(duì)策理論謝家平學(xué)習(xí)課件_第1頁
對(duì)策理論謝家平學(xué)習(xí)課件_第2頁
對(duì)策理論謝家平學(xué)習(xí)課件_第3頁
對(duì)策理論謝家平學(xué)習(xí)課件_第4頁
對(duì)策理論謝家平學(xué)習(xí)課件_第5頁
已閱讀5頁,還剩41頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、運(yùn)籌學(xué)運(yùn)籌學(xué) Operation s Research 21.4.301 2 第第1010章章 對(duì)策理論對(duì)策理論 理解對(duì)策模型的三大要素理解對(duì)策模型的三大要素 了解矩陣對(duì)策的基本定理了解矩陣對(duì)策的基本定理 通曉純策略和混合策略通曉純策略和混合策略 掌握矩陣對(duì)策方程組法掌握矩陣對(duì)策方程組法 理解納什定理和平衡偶理解納什定理和平衡偶 掌握雙矩陣對(duì)策的求解掌握雙矩陣對(duì)策的求解 3 “田忌賽馬” 對(duì)策論對(duì)策論(Game TheoryGame Theory),亦名),亦名“博弈論博弈論” 研究具有斗爭(zhēng)或競(jìng)爭(zhēng)性質(zhì)現(xiàn)象的數(shù)學(xué)理論研究具有斗爭(zhēng)或競(jìng)爭(zhēng)性質(zhì)現(xiàn)象的數(shù)學(xué)理論 第第1 1節(jié)對(duì)策論簡(jiǎn)介節(jié)對(duì)策論簡(jiǎn)介 具有具

2、有競(jìng)爭(zhēng)或?qū)剐再|(zhì)的行為競(jìng)爭(zhēng)或?qū)剐再|(zhì)的行為 研究對(duì)策行為中競(jìng)爭(zhēng)各方是否存在最合理行動(dòng)方案研究對(duì)策行為中競(jìng)爭(zhēng)各方是否存在最合理行動(dòng)方案, ,以及如何找以及如何找 到最合理行為方案的管理優(yōu)化理論和方法到最合理行為方案的管理優(yōu)化理論和方法 一個(gè)決策主體一個(gè)決策主體, ,面對(duì)不確定環(huán)境下的收益最大化行為面對(duì)不確定環(huán)境下的收益最大化行為 4 對(duì)策模型對(duì)策模型三要素三要素 n 局中人:在一個(gè)對(duì)策行為局中人:在一個(gè)對(duì)策行為( (或一局對(duì)策或一局對(duì)策) )中,有權(quán)中,有權(quán)決定自己行動(dòng)方案的對(duì)策決定自己行動(dòng)方案的對(duì)策參參 加者。加者。I=1,2,.,n。理性人理性人(有很好定義的偏好,在給定的約束下最大化偏好)

3、(有很好定義的偏好,在給定的約束下最大化偏好) n策略集:指一局對(duì)策中策略集:指一局對(duì)策中, ,可供局中人選擇的實(shí)際、可行、完整的行動(dòng)可供局中人選擇的實(shí)際、可行、完整的行動(dòng)方案,方案,Si n贏得函數(shù):對(duì)任一局勢(shì)贏得函數(shù):對(duì)任一局勢(shì)s, ,局中人局中人i可以得到一個(gè)贏得值可以得到一個(gè)贏得值Hi(s)。顯然。顯然, ,Hi(s)是局勢(shì)是局勢(shì) 的函數(shù)的函數(shù), ,稱為第個(gè)局中人的贏得函數(shù)稱為第個(gè)局中人的贏得函數(shù)( (或支付函數(shù)或支付函數(shù)) )。 5 對(duì)策對(duì)策問題的分類問題的分類 n二二人對(duì)策,多人對(duì)策人對(duì)策,多人對(duì)策 n零和對(duì)策,非零和對(duì)策零和對(duì)策,非零和對(duì)策 n合作對(duì)策,非合作對(duì)策合作對(duì)策,非合作

4、對(duì)策 n有限對(duì)策,無限對(duì)策有限對(duì)策,無限對(duì)策 根據(jù)對(duì)策模型的數(shù)學(xué)特征:根據(jù)對(duì)策模型的數(shù)學(xué)特征: 6 第第2 2節(jié)矩陣對(duì)策節(jié)矩陣對(duì)策 一、一、矩陣對(duì)策的矩陣對(duì)策的數(shù)學(xué)模型數(shù)學(xué)模型 設(shè)局中人設(shè)局中人有個(gè)純策略有個(gè)純策略 , ,局中人局中人II有個(gè)純策略有個(gè)純策略 , ,則局中人則局中人 、的策略集分別為的策略集分別為 a1,a2,amb1,b2,bn S 1 = a1,a2,am ,S2 = b1,b2,bn 當(dāng)局中人當(dāng)局中人選定選定純策略純策略 和局中人和局中人II選定選定純策略純策略 后后, ,就形成了一個(gè)純局勢(shì)就形成了一個(gè)純局勢(shì) 。 可見這樣的純局勢(shì)共有可見這樣的純局勢(shì)共有 個(gè)。對(duì)任一純局勢(shì)

5、個(gè)。對(duì)任一純局勢(shì) , ,記局中人記局中人的贏得值的贏得值為為 。 i a j b ij ,a b m n ij ,a b ij a 矩陣對(duì)策矩陣對(duì)策(二人有限零和對(duì)策(二人有限零和對(duì)策, ,finite two-person zero-sum game) A= a 11 a 12 a 1n a21a22a2n am 1 am 2 am n 為局中人為局中人I的贏得矩陣的贏得矩陣( (或?yàn)榫种腥嘶驗(yàn)榫种腥薎I的支付矩陣的支付矩陣) ) 其中:齊王的策略集: : S1= a a1, a a2, a a3, a a4, a a5, a a6 , 田忌的策略集:S2= b b1, b b2, b b3

6、, b b4, b b5, b b6 。 下面矩陣稱齊王的贏得矩陣: 8 例10-1 “田忌賽馬”齊王在各局勢(shì)中的益損值表(單位:千金) 1 2 3 4 5 6 a a a a a a 31111 1 311111 311111 31 1111 311111 3111 11 A = 356124 bbbbbb 當(dāng)贏得矩陣A=(=(ark) )中等式 成立時(shí),雙方才有最優(yōu)純策略 并把(a ar,b bk)稱為最優(yōu)純局勢(shì)或?qū)Σ逩在純策略下的解,又稱鞍點(diǎn)。把其 值v 稱之為對(duì)策G=S1,S2,A的值。 稱G為有鞍點(diǎn)的對(duì)策。 10 rkij ij ij ji aaav=maxminminmax vv

7、kr = * ,bbaa jijiij aaa * 矩陣對(duì)策的純策略 悲觀準(zhǔn)則 11 乙 甲 123min(aij) 1-71-8-8 2342 316-1-3-3 4-305-3 max(aij)1625 例10-2 甲方“小中取大”,乙方“大中取小” rkij ij ij ji aaav=maxminminmax=a22=2 鞍點(diǎn)(a a2, b b2) 對(duì)策G=S1,S2,A的值v=2 。 矩陣對(duì)策的矩陣對(duì)策的混合策略混合策略 設(shè)矩陣對(duì)策 G = S1, S2, A 。當(dāng) 時(shí),不存在最優(yōu)純策略。 例11-4 12 )(maxmin)(minmax ij ij ij ji aa 36 3

8、54 4 56 A = 12 12 maxmin,minmax ijij jjii vava vv = 11122122 11111111 11 3654 3615 14 11 4141292 Ex, yx yx yx yx y x yxyxyxy x/y/ = = = 對(duì)甲對(duì)甲(乙)(乙)給出一個(gè)選取不同策略的概率分布,以使甲給出一個(gè)選取不同策略的概率分布,以使甲(乙)(乙)在各種情況下的在各種情況下的 期望贏得最多期望贏得最多(損失最少)(損失最少)-即即混合策略?;旌喜呗?。 12概率 xi 136x1 254x2 概率 yjy1y2 14 0, 0= = y ER x ER 取取 , ,

9、則則 故故 和和 分別分別為局中人為局中人和和的最優(yōu)策略的最優(yōu)策略, , 對(duì)策對(duì)策值值( (局中人局中人的贏得期望值的贏得期望值) ) 。 1 43 41 21 2 * x/ , /,y/ , /=9 29 2 * E x ,y/ ,E x ,yE x,y/= 1 4 3 4 * x/ , /=1 21 2 * y/ , /= 9 2 G V/= 二階矩陣對(duì)策的通解公式 乙 甲 12甲方概率 xi 1acx1 2bdx2 乙方概率 yjy1y2 dcba bcad dcba bd y dcba cd xdcba dy dcba dc x dcba db xydcba yxdyxcybxaxyE

10、R = = = )()( )( )1)(1 ()1 ()1 ( D bcad v D ca y D bd y D ba x D cd x cbdaD = = = = = = * * 2 * 1 * 2 * 1 )()(令 16 的值為對(duì)策 的解,為對(duì)策 )策略,為甲、乙的最優(yōu)(混合 有 Gv GYX YX YXERYXERm YXERYXERYXERv SYSX YXX XYY * * * * * * 2 * 1 * ),( , ),(minmax),(ax ),(maxmin),(min),( , = = ),(),(),( ),(max),(min),( ),(maxmin ),(minm

11、ax * * 21 2 1 * 1 * 2 * 1 * 2 * 2 * 1 YXEYXEYXE YXEYXEYXE vv YXEv YXEv SXSY SXSY SYSX = = = 二、矩陣對(duì)策的基本原理二、矩陣對(duì)策的基本原理 E x,y =a ij x i yj j i =a ij yj j x i =E i,y xi i i E x,y =a ij x i yj j i =a ij x i i yj=E x, jyj j j ijj j Ei, yay= 當(dāng)局中人當(dāng)局中人取純策略取純策略 時(shí)時(shí), ,記其相應(yīng)的贏得函數(shù)為記其相應(yīng)的贏得函數(shù)為 i a iji i E x, ja x= 當(dāng)局中

12、人當(dāng)局中人取純策略取純策略 時(shí)時(shí), ,記其相應(yīng)的贏得函數(shù)為記其相應(yīng)的贏得函數(shù)為 j b * E i,yE x ,yE x , j則則 是是G的解的的解的充要條件充要條件是:是: * x ,y 則則 是是G的解的充要條件是:存在數(shù)的解的充要條件是:存在數(shù)v, ,使得使得 和和 分別是不等式組分別是不等式組( () ) 和和( () )的的解解, ,且且 。 * x ,y * x * y G vV= aijxiv, j=1,n i xi=1 i xi0, i=1,m ( () ) aijyjv, i=1,m i yj=1 j yj0, j=1,n ( () ) n 矩陣對(duì)策矩陣對(duì)策及其解的性質(zhì)及其

13、解的性質(zhì) l 定理定理1 1:對(duì)任一矩陣:對(duì)任一矩陣 , ,一定存在混合策略意義下的解。一定存在混合策略意義下的解。 12 GS ,S ;A= l 定理定理2 2:設(shè):設(shè) 是矩陣對(duì)策是矩陣對(duì)策G的解的解, , ,則:則: (1) (1)若若 , ,則則 ; (2)2)若若 , ,則則 ; (3) (3)若若 , ,則則 ; (4) (4)若若 , ,則則 。 * x ,y G v V= 0 * i x * ijj j a yv= 0 * j y * iji i a xv= * ijj j a yv 0 * i x = * iji i a xv 0 * j y = 21 記矩陣對(duì)策記矩陣對(duì)策G的

14、解集為的解集為T(G), ,關(guān)于對(duì)策解集的性質(zhì)有如下三個(gè)定理:關(guān)于對(duì)策解集的性質(zhì)有如下三個(gè)定理: l定理定理3 3:設(shè)有兩個(gè)矩陣對(duì)策:設(shè)有兩個(gè)矩陣對(duì)策 其中其中 , , , ,L為為任一常數(shù)任一常數(shù), ,則有則有 (1)(1) (2(2) ) 1121 2122 GS ,S ;A GS ,S ;A = = 1ij Aa=A 2 =aijL 21 GG VVL= 12 T GT G= l 定理定理4 4 設(shè)有兩個(gè)矩陣對(duì)策設(shè)有兩個(gè)矩陣對(duì)策 其中其中 為任一常數(shù)。則為任一常數(shù)。則 (1)(1) (2)(2) 112 212 GS ,S ;A GS ,S ; A = =a 0a 21 GG VV= a

15、 12 T GT G= l 定理定理5 5 設(shè)設(shè) 為為一矩陣對(duì)策一矩陣對(duì)策, ,且且 為斜對(duì)稱矩陣為斜對(duì)稱矩陣( (亦稱對(duì)稱對(duì)亦稱對(duì)稱對(duì) 策策) ),則,則 (1)(1) (2) ,(2) ,其中其中 和和 分別為局中人分別為局中人和和的最優(yōu)策略集。的最優(yōu)策略集。 12 GS ,S ;A= T AA= 2 0 G V= 12 T GT G= 1 T G 2 T G 23 n矩陣對(duì)策的矩陣對(duì)策的優(yōu)超策略優(yōu)超策略 l定義:設(shè)有矩陣對(duì)策定義:設(shè)有矩陣對(duì)策 , ,其中其中 , , , , 如果如果對(duì)一切對(duì)一切 都有都有 , , 則稱則稱局中人局中人的純策略的純策略 優(yōu)優(yōu)超于超于 ; 若若對(duì)一切對(duì)一切

16、, ,都有都有 ,則,則稱局中人稱局中人的純策略的純策略 優(yōu)優(yōu)超超于于 12 GS ,S ;A=S1= a1,am S2= b1,bn ij Aa= j=1,n 00 ijkj aa 0 i a i=1,m00 ijil aa 0 j b 0 l b 0 k a 24 優(yōu)優(yōu)超原則超原則: 設(shè)設(shè) 為為矩陣對(duì)策矩陣對(duì)策,其中其中, , , 如果如果純策略純策略 被被其余其余純策略純策略 中中之一所優(yōu)之一所優(yōu)超,由超,由G可可得到一個(gè)新的得到一個(gè)新的矩陣對(duì)策矩陣對(duì)策 G, ,其中:其中: 于是于是有:有: (1) (2)G中中局中人局中人的最優(yōu)策略就是其的最優(yōu)策略就是其在在G中中的最優(yōu)策略的最優(yōu)策略

17、; (3)若若G是是G中中局中人局中人的最優(yōu)策略的最優(yōu)策略,則則 便是便是其其在在G中中的最優(yōu)策略。的最優(yōu)策略。 若若 不是不是為純策略為純策略 中中之一所優(yōu)超之一所優(yōu)超,而是而是為為 的的某個(gè)凸線性組合所優(yōu)超,定理的結(jié)某個(gè)凸線性組合所優(yōu)超,定理的結(jié) 論仍然成立。論仍然成立。 12 GS ,S ;A= S1= a1,am S2= b1,bn ij Aa= 12 GS ,S ;A= 12 1 1 m ij mn ijj S, Aa aai,mj,n = aa = = = = GG VV = x*= 0,x2 * ,xm * T 1 aa2,am 1 aa2,ama2,am 例10-5 1/3*(

18、1) 2/3*(2) 7395973739 73 6875.564465.54 46 6088360603 30302 50592 73959 6875.54 60883 A = * * (0, 0,1/3, 2/3, 0) (1/ 2,1/ 2, 0, 0, 0) T T x y = = 27 三、矩陣對(duì)策的解法三、矩陣對(duì)策的解法 l方程組法方程組法 例例10-6:求解矩陣對(duì)策求解矩陣對(duì)策“田忌賽馬田忌賽馬” 解:已知齊王的贏得矩陣為解:已知齊王的贏得矩陣為 311111 131111 113111 111311 111131 111113 A = 易知易知, ,A A沒有沒有鞍點(diǎn)鞍點(diǎn), ,

19、即對(duì)齊王和田忌來說都不存在最優(yōu)純策略。即對(duì)齊王和田忌來說都不存在最優(yōu)純策略。 設(shè)齊王和田忌的最優(yōu)混合策略為設(shè)齊王和田忌的最優(yōu)混合策略為 和和 ,從從矩陣矩陣A A的的元素來看元素來看, ,每每 個(gè)局中人選取每個(gè)純策略的可能性都是存在的個(gè)局中人選取每個(gè)純策略的可能性都是存在的, ,故可事先故可事先假定假定 和和 , ,于是求解線性方程組:于是求解線性方程組: 123456 T * xx ,x ,x ,x ,x ,x= 123456 T * yy ,y ,y ,y ,y ,y= 0 * i x 0 * j y 28 123456 123456 123456 123456 123456 123456

20、 123 3 3 3 xxxxxxv xxxxxxv xxxxxxv xxxxxxv xxxxxxv xxxxxxv xxxx = = = = = = 456 1xx = (I) 123456 123456 123456 123456 123456 123456 12 3 yyyyyyv yyyyyyv yyyyyyv yyyyyyv yyyyyyv yyyyyyv yy = = = = = = 3456 1yyyy = (II) 得到:得到: , 故故齊王和田忌的最優(yōu)混合策略齊王和田忌的最優(yōu)混合策略為雙方都以為雙方都以1/6的概率選取每個(gè)純策略。的概率選取每個(gè)純策略。 xi=1/6, yj=

21、1/6, ij=1,6; v=1 l線性規(guī)劃法線性規(guī)劃法 a ijxi v, j=1,n i x i =1 i x i 0, i=1,m ( () ) a ij yjv, i=1,m i yj=1 j yj0, j=1,n ( () ) * 2211 maxmin( , )minmax( , ) y Sy Sx Sx S vE x yE x y = = = = = = mix x njvxa ts v i m i i m i iij ,.,2 , 1, 0 , 1 ,.,2 , 1, . . max)( 1 1 = = = = = njy y mivya ts v j n j j n j ji

22、j ,.,2 , 1, 0 , 1 ,.,2 , 1, . . min)( 1 1 0, i i x vx v = 1 min 1 ( )1 . . 00 1 max 1 ()1 . . 00 iji i i i i iji i i i i ijj j j j jijj jj jj a x zx xPa x v s t xx a y wy yDa y v s t yy = = = = ( () ) ( () ) 32 例例10-7:利用線形規(guī)劃方法求解贏得矩陣?yán)镁€形規(guī)劃方法求解贏得矩陣為為A的的矩陣對(duì)策矩陣對(duì)策 求求最優(yōu)解及最優(yōu)解及值值。 323 234 542 A = 123 Xx ,x

23、,x= 123 Yy ,y ,y= minZX = xi i=1 3 = x1 x2 x3 s.t. 3 x12 x25 x31 2 x13 x24 x31 3 x14 x22 x31 xi 0, i=1,2,3 (P) 解:解:此題無鞍點(diǎn)此題無鞍點(diǎn), ,設(shè)局中人設(shè)局中人、局中人、局中人的混合策略分別為:的混合策略分別為: 并記對(duì)策的值為并記對(duì)策的值為V。則此問題可化為:。則此問題可化為: (D) 3 123 1 123 123 123 max( ) 3231 2341 . . 5421 0 j j j Z Yyyyy yyy yyy st yyy y = = 解得 123 123 32 0

24、16 16 23 0 1616 5 16 Xx ,x ,x, Yy ,y ,y, , Z XZ Y = = = 即原問題的解為:即原問題的解為: 123 123 16 5 3 2 0 5 5 23 0 55 v X*x ,x ,x, Y*y ,y ,y, , = = = 15 (), 16 j i ij y x Z Xxy vvv =由 35 第第3 3節(jié)節(jié) 雙矩陣對(duì)策雙矩陣對(duì)策 n 雙矩陣對(duì)策(二人有限非零和對(duì)策)的雙矩陣對(duì)策(二人有限非零和對(duì)策)的數(shù)學(xué)模型數(shù)學(xué)模型 局中人局中人I選擇選擇 , ,局中人局中人II選擇選擇 , ,則對(duì)策局勢(shì)為則對(duì)策局勢(shì)為 , , 與與這個(gè)局勢(shì)相應(yīng)的局中人這個(gè)局

25、勢(shì)相應(yīng)的局中人I的收入的收入為為aij, ,局中人局中人II的收入不再的收入不再是是- -aij, ,而是而是bij, ,記記作作 ( (aij, , bij) )。 對(duì)對(duì)這種對(duì)策這種對(duì)策, ,通常通常用用G=I, II; S1, S2; A, B表示表示, ,其中其中 A=aij, , B=bij分別分別是局中人是局中人I與與II的的支付矩陣。支付矩陣。 1i Sa 2j Sb , ij ab 囚徒B 坦白 抵賴 坦白 囚徒A 抵賴 (囚徒A ,囚徒B) 囚徒困境 n雙矩陣對(duì)策的解法雙矩陣對(duì)策的解法 l平衡偶平衡偶 在非零和對(duì)策中在非零和對(duì)策中, ,設(shè)設(shè)EI=(X,Y)與與EII=(X,Y)

26、分別是局中人分別是局中人I與與II的收入的收入, ,這里這里 XS1,YS2為任意策略。為任意策略。 如果存在一對(duì)策略如果存在一對(duì)策略X*S1,Y*S2使得使得 EI=(X,Y*) EI=(X*,Y*), EI=(X*,Y) EI=(X*,Y*) 對(duì)任意的對(duì)任意的XS1,YS2均成立均成立, ,則稱策略則稱策略(X*,Y*)為雙矩陣對(duì)策為雙矩陣對(duì)策G的一個(gè)平衡偶的一個(gè)平衡偶 l納什定理納什定理:(:(美國(guó)科學(xué)家美國(guó)科學(xué)家納什納什,1951,1951年年) 任何具有有限個(gè)純策略的二人對(duì)策任何具有有限個(gè)純策略的二人對(duì)策( (包括零和對(duì)策與非零和對(duì)策包括零和對(duì)策與非零和對(duì)策),),至少有一至少有一

27、個(gè)平衡偶個(gè)平衡偶 38 例例10-810-8:智豬博弈智豬博弈 籠子里面有兩只豬籠子里面有兩只豬, ,一只大一只小一只大一只小。籠子?;\子很長(zhǎng)很長(zhǎng), ,一頭有一個(gè)踏板一頭有一個(gè)踏板, ,另一頭是飼料的另一頭是飼料的 出口和食槽出口和食槽。每。每踩一下踏板踩一下踏板, ,在遠(yuǎn)離踏板的豬圈一邊的投食口就會(huì)落下少量的食在遠(yuǎn)離踏板的豬圈一邊的投食口就會(huì)落下少量的食 物物。如果。如果有一只豬去踩踏板有一只豬去踩踏板, ,另一只豬就有機(jī)會(huì)搶先吃到另一邊落下的食物另一只豬就有機(jī)會(huì)搶先吃到另一邊落下的食物。按。按 一下按鈕會(huì)有一下按鈕會(huì)有1010個(gè)單位的豬食進(jìn)槽個(gè)單位的豬食進(jìn)槽, ,但是誰按按鈕就會(huì)首先付出但

28、是誰按按鈕就會(huì)首先付出2 2個(gè)單位的成本個(gè)單位的成本。 若若大豬先到槽邊大豬先到槽邊, ,大小豬吃到食物的比例是大小豬吃到食物的比例是9191;若大小豬同時(shí)到槽邊進(jìn)食;若大小豬同時(shí)到槽邊進(jìn)食, ,它們它們 吃到食物的比例是吃到食物的比例是7373;若小豬先到槽邊;若小豬先到槽邊, ,它們吃到食物的比例是它們吃到食物的比例是6464。如表。如表 102102所示所示, ,那么那么, ,在兩頭豬都有智慧的前提下在兩頭豬都有智慧的前提下, ,最終結(jié)果是什么呢?最終結(jié)果是什么呢? 智豬博弈雙矩陣:智豬博弈雙矩陣: 小豬小豬 按按等待等待 大豬大豬 按按(5,1)(4,4) 等待等待(9,-1)(0,0

29、) 解: : 以智豬博弈為例, ,說明純策略下的納什均衡的求取。 (1)(1)當(dāng)小豬選擇按按鈕時(shí), ,如果大豬也選擇按按鈕, ,大豬的贏得是5 5;如果大豬選擇等待, ,大豬的贏得是9,9,所以在 第一列的9 9下面劃線; (2)(2)當(dāng)小豬選擇等待時(shí), ,如果大豬選擇按按鈕, ,大豬的贏得是4 4;如果大豬也選擇等待, ,大豬的贏得是0,0,所以在第 二列的第一個(gè)分量4 4下面劃線; (3)(3)當(dāng)大豬選擇按按鈕時(shí), ,如果小豬選擇按按鈕, ,小豬的贏得是1 1;如果小豬選擇等待, ,小豬的贏得是4,4,所以在第 一行的第二個(gè)分量的4 4下面劃線; (4)(4)當(dāng)大豬選擇等待時(shí), ,如果小豬

30、選擇按按鈕, ,小豬的贏得是-1-1;如果小豬選擇等待, ,小豬的贏得是0,0,所以在第 二行的第二個(gè)分量0 0下面劃線 小豬小豬 按按等待等待 大豬大豬 按按(5,1)(4,4) 等待等待(9,-1)(0,0) 因此, ,本例中存在唯一的純策略納什平衡偶(4,4),(4,4),即大豬按按鈕, ,小豬選擇等待是唯一可能出現(xiàn)的結(jié)局。 作作 業(yè)業(yè) 3(2) 4 5(1) 6(1) 7 11122122 11111111 11 3654 3615 14 11 4141292 Ex, yx yx yx yx y x yxyxyxy x/y/ = = = 對(duì)甲對(duì)甲(乙)(乙)給出一個(gè)選取不同策略的概率分

31、布,以使甲給出一個(gè)選取不同策略的概率分布,以使甲(乙)(乙)在各種情況下的在各種情況下的 期望贏得最多期望贏得最多(損失最少)(損失最少)-即即混合策略?;旌喜呗?。 12概率 xi 136x1 254x2 概率 yjy1y2 42 n矩陣對(duì)策的矩陣對(duì)策的優(yōu)超策略優(yōu)超策略 l定義:設(shè)有矩陣對(duì)策定義:設(shè)有矩陣對(duì)策 , ,其中其中 , , , , 如果如果對(duì)一切對(duì)一切 都有都有 , , 則稱則稱局中人局中人的純策略的純策略 優(yōu)優(yōu)超于超于 ; 若若對(duì)一切對(duì)一切 , ,都有都有 ,則,則稱局中人稱局中人的純策略的純策略 優(yōu)優(yōu)超超于于 12 GS ,S ;A=S1= a1,am S2= b1,bn ij Aa= j=1,n 00 ijkj aa 0 i a i=

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論