對(duì)策理論謝家平學(xué)習(xí)課件

上傳人：s*** IP屬地：上海上傳時(shí)間：2021-04-30 格式：PPTX 頁數(shù)：46 大?。?.35MB 積分：20 舉報(bào) 版權(quán)申訴

已閱讀5頁，還剩41頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、運(yùn)籌學(xué)運(yùn)籌學(xué) Operation s Research 21.4.301 2 第第1010章章對(duì)策理論對(duì)策理論理解對(duì)策模型的三大要素理解對(duì)策模型的三大要素了解矩陣對(duì)策的基本定理了解矩陣對(duì)策的基本定理通曉純策略和混合策略通曉純策略和混合策略掌握矩陣對(duì)策方程組法掌握矩陣對(duì)策方程組法理解納什定理和平衡偶理解納什定理和平衡偶掌握雙矩陣對(duì)策的求解掌握雙矩陣對(duì)策的求解 3 “田忌賽馬” 對(duì)策論對(duì)策論（Game TheoryGame Theory），亦名），亦名“博弈論博弈論” 研究具有斗爭(zhēng)或競(jìng)爭(zhēng)性質(zhì)現(xiàn)象的數(shù)學(xué)理論研究具有斗爭(zhēng)或競(jìng)爭(zhēng)性質(zhì)現(xiàn)象的數(shù)學(xué)理論第第1 1節(jié)對(duì)策論簡(jiǎn)介節(jié)對(duì)策論簡(jiǎn)介具有具

2、有競(jìng)爭(zhēng)或?qū)剐再|(zhì)的行為競(jìng)爭(zhēng)或?qū)剐再|(zhì)的行為研究對(duì)策行為中競(jìng)爭(zhēng)各方是否存在最合理行動(dòng)方案研究對(duì)策行為中競(jìng)爭(zhēng)各方是否存在最合理行動(dòng)方案, ,以及如何找以及如何找到最合理行為方案的管理優(yōu)化理論和方法到最合理行為方案的管理優(yōu)化理論和方法一個(gè)決策主體一個(gè)決策主體, ,面對(duì)不確定環(huán)境下的收益最大化行為面對(duì)不確定環(huán)境下的收益最大化行為 4 對(duì)策模型對(duì)策模型三要素三要素 n 局中人：在一個(gè)對(duì)策行為局中人：在一個(gè)對(duì)策行為( (或一局對(duì)策或一局對(duì)策) )中，有權(quán)中，有權(quán)決定自己行動(dòng)方案的對(duì)策決定自己行動(dòng)方案的對(duì)策參參加者。加者。I=1,2,.,n。理性人理性人（有很好定義的偏好，在給定的約束下最大化偏好）

3、（有很好定義的偏好，在給定的約束下最大化偏好） n策略集：指一局對(duì)策中策略集：指一局對(duì)策中, ,可供局中人選擇的實(shí)際、可行、完整的行動(dòng)可供局中人選擇的實(shí)際、可行、完整的行動(dòng)方案，方案，Si n贏得函數(shù)：對(duì)任一局勢(shì)贏得函數(shù)：對(duì)任一局勢(shì)s, ,局中人局中人i可以得到一個(gè)贏得值可以得到一個(gè)贏得值Hi(s)。顯然。顯然, ,Hi(s)是局勢(shì)是局勢(shì) 的函數(shù)的函數(shù), ,稱為第個(gè)局中人的贏得函數(shù)稱為第個(gè)局中人的贏得函數(shù)( (或支付函數(shù)或支付函數(shù)) )。 5 對(duì)策對(duì)策問題的分類問題的分類 n二二人對(duì)策，多人對(duì)策人對(duì)策，多人對(duì)策 n零和對(duì)策，非零和對(duì)策零和對(duì)策，非零和對(duì)策 n合作對(duì)策，非合作對(duì)策合作對(duì)策，非合作

4、對(duì)策 n有限對(duì)策，無限對(duì)策有限對(duì)策，無限對(duì)策根據(jù)對(duì)策模型的數(shù)學(xué)特征：根據(jù)對(duì)策模型的數(shù)學(xué)特征： 6 第第2 2節(jié)矩陣對(duì)策節(jié)矩陣對(duì)策一、一、矩陣對(duì)策的矩陣對(duì)策的數(shù)學(xué)模型數(shù)學(xué)模型設(shè)局中人設(shè)局中人有個(gè)純策略有個(gè)純策略 , ,局中人局中人II有個(gè)純策略有個(gè)純策略 , ,則局中人則局中人、的策略集分別為的策略集分別為 a1,a2,amb1,b2,bn S 1 = a1,a2,am ,S2 = b1,b2,bn 當(dāng)局中人當(dāng)局中人選定選定純策略純策略和局中人和局中人II選定選定純策略純策略后后, ,就形成了一個(gè)純局勢(shì)就形成了一個(gè)純局勢(shì) 。可見這樣的純局勢(shì)共有可見這樣的純局勢(shì)共有個(gè)。對(duì)任一純局勢(shì)

5、個(gè)。對(duì)任一純局勢(shì) , ,記局中人記局中人的贏得值的贏得值為為。 i a j b ij ,a b m n ij ,a b ij a 矩陣對(duì)策矩陣對(duì)策（二人有限零和對(duì)策（二人有限零和對(duì)策, ,finite two-person zero-sum game） A= a 11 a 12 a 1n a21a22a2n am 1 am 2 am n 為局中人為局中人I的贏得矩陣的贏得矩陣( (或?yàn)榫种腥嘶驗(yàn)榫种腥薎I的支付矩陣的支付矩陣) ) 其中：齊王的策略集: : S1= a a1, a a2, a a3, a a4, a a5, a a6 ，田忌的策略集：S2= b b1, b b2, b b3

6、, b b4, b b5, b b6 。下面矩陣稱齊王的贏得矩陣： 8 例10-1 “田忌賽馬”齊王在各局勢(shì)中的益損值表（單位：千金） 1 2 3 4 5 6 a a a a a a 31111 1 311111 311111 31 1111 311111 3111 11 A = 356124 bbbbbb 當(dāng)贏得矩陣A=(=(ark) )中等式成立時(shí)，雙方才有最優(yōu)純策略并把（a ar,b bk）稱為最優(yōu)純局勢(shì)或?qū)Σ逩在純策略下的解，又稱鞍點(diǎn)。把其值v 稱之為對(duì)策G=S1，S2，A的值。稱G為有鞍點(diǎn)的對(duì)策。 10 rkij ij ij ji aaav=maxminminmax vv

7、kr = * ,bbaa jijiij aaa * 矩陣對(duì)策的純策略悲觀準(zhǔn)則 11 乙甲 123min(aij) 1-71-8-8 2342 316-1-3-3 4-305-3 max(aij)1625 例10-2 甲方“小中取大”，乙方“大中取小” rkij ij ij ji aaav=maxminminmax=a22=2 鞍點(diǎn)（a a2, b b2）對(duì)策G=S1，S2，A的值v=2 。矩陣對(duì)策的矩陣對(duì)策的混合策略混合策略設(shè)矩陣對(duì)策 G = S1, S2, A 。當(dāng) 時(shí)，不存在最優(yōu)純策略。例11-4 12 )(maxmin)(minmax ij ij ij ji aa 36 3

8、54 4 56 A = 12 12 maxmin,minmax ijij jjii vava vv = 11122122 11111111 11 3654 3615 14 11 4141292 Ex, yx yx yx yx y x yxyxyxy x/y/ = = = 對(duì)甲對(duì)甲（乙）（乙）給出一個(gè)選取不同策略的概率分布，以使甲給出一個(gè)選取不同策略的概率分布，以使甲（乙）（乙）在各種情況下的在各種情況下的期望贏得最多期望贏得最多（損失最少）（損失最少）-即即混合策略?；旌喜呗浴?12概率 xi 136x1 254x2 概率 yjy1y2 14 0, 0= = y ER x ER 取取 , ,

9、則則故故和和分別分別為局中人為局中人和和的最優(yōu)策略的最優(yōu)策略, , 對(duì)策對(duì)策值值( (局中人局中人的贏得期望值的贏得期望值) ) 。 1 43 41 21 2 * x/ , /,y/ , /=9 29 2 * E x ,y/ ,E x ,yE x,y/= 1 4 3 4 * x/ , /=1 21 2 * y/ , /= 9 2 G V/= 二階矩陣對(duì)策的通解公式乙甲 12甲方概率 xi 1acx1 2bdx2 乙方概率 yjy1y2 dcba bcad dcba bd y dcba cd xdcba dy dcba dc x dcba db xydcba yxdyxcybxaxyE

10、R = = = )()( )( )1)(1 ()1 ()1 ( D bcad v D ca y D bd y D ba x D cd x cbdaD = = = = = = * * 2 * 1 * 2 * 1 )()(令 16 的值為對(duì)策的解，為對(duì)策）策略，為甲、乙的最優(yōu)（混合有 Gv GYX YX YXERYXERm YXERYXERYXERv SYSX YXX XYY * * * * * * 2 * 1 * ),( , ),(minmax),(ax ),(maxmin),(min),( , = = ),(),(),( ),(max),(min),( ),(maxmin ),(minm

11、ax * * 21 2 1 * 1 * 2 * 1 * 2 * 2 * 1 YXEYXEYXE YXEYXEYXE vv YXEv YXEv SXSY SXSY SYSX = = = 二、矩陣對(duì)策的基本原理二、矩陣對(duì)策的基本原理 E x,y =a ij x i yj j i =a ij yj j x i =E i,y xi i i E x,y =a ij x i yj j i =a ij x i i yj=E x, jyj j j ijj j Ei, yay= 當(dāng)局中人當(dāng)局中人取純策略取純策略時(shí)時(shí), ,記其相應(yīng)的贏得函數(shù)為記其相應(yīng)的贏得函數(shù)為 i a iji i E x, ja x= 當(dāng)局中

12、人當(dāng)局中人取純策略取純策略時(shí)時(shí), ,記其相應(yīng)的贏得函數(shù)為記其相應(yīng)的贏得函數(shù)為 j b * E i,yE x ,yE x , j則則是是G的解的的解的充要條件充要條件是：是： * x ,y 則則是是G的解的充要條件是：存在數(shù)的解的充要條件是：存在數(shù)v, ,使得使得和和分別是不等式組分別是不等式組( () ) 和和( () )的的解解, ,且且。 * x ,y * x * y G vV= aijxiv, j=1,n i xi=1 i xi0, i=1,m ( () ) aijyjv, i=1,m i yj=1 j yj0, j=1,n ( () ) n 矩陣對(duì)策矩陣對(duì)策及其解的性質(zhì)及其

13、解的性質(zhì) l 定理定理1 1：對(duì)任一矩陣：對(duì)任一矩陣 , ,一定存在混合策略意義下的解。一定存在混合策略意義下的解。 12 GS ,S ;A= l 定理定理2 2：設(shè)：設(shè) 是矩陣對(duì)策是矩陣對(duì)策G的解的解, , ,則：則： (1) (1)若若 , ,則則；（2)2)若若 , ,則則； (3) (3)若若 , ,則則； (4) (4)若若 , ,則則。 * x ,y G v V= 0 * i x * ijj j a yv= 0 * j y * iji i a xv= * ijj j a yv 0 * i x = * iji i a xv 0 * j y = 21 記矩陣對(duì)策記矩陣對(duì)策G的

14、解集為的解集為T(G), ,關(guān)于對(duì)策解集的性質(zhì)有如下三個(gè)定理：關(guān)于對(duì)策解集的性質(zhì)有如下三個(gè)定理： l定理定理3 3：設(shè)有兩個(gè)矩陣對(duì)策：設(shè)有兩個(gè)矩陣對(duì)策其中其中 , , , ,L為為任一常數(shù)任一常數(shù), ,則有則有 (1)(1) (2(2) ) 1121 2122 GS ,S ;A GS ,S ;A = = 1ij Aa=A 2 =aijL 21 GG VVL= 12 T GT G= l 定理定理4 4 設(shè)有兩個(gè)矩陣對(duì)策設(shè)有兩個(gè)矩陣對(duì)策其中其中為任一常數(shù)。則為任一常數(shù)。則 (1)(1) (2)(2) 112 212 GS ,S ;A GS ,S ; A = =a 0a 21 GG VV= a

15、 12 T GT G= l 定理定理5 5 設(shè)設(shè) 為為一矩陣對(duì)策一矩陣對(duì)策, ,且且為斜對(duì)稱矩陣為斜對(duì)稱矩陣( (亦稱對(duì)稱對(duì)亦稱對(duì)稱對(duì) 策策) )，則，則 (1)(1) (2) ,(2) ,其中其中和和分別為局中人分別為局中人和和的最優(yōu)策略集。的最優(yōu)策略集。 12 GS ,S ;A= T AA= 2 0 G V= 12 T GT G= 1 T G 2 T G 23 n矩陣對(duì)策的矩陣對(duì)策的優(yōu)超策略優(yōu)超策略 l定義：設(shè)有矩陣對(duì)策定義：設(shè)有矩陣對(duì)策 , ,其中其中 , , , , 如果如果對(duì)一切對(duì)一切都有都有 , , 則稱則稱局中人局中人的純策略的純策略優(yōu)優(yōu)超于超于；若若對(duì)一切對(duì)一切

16、, ,都有都有，則，則稱局中人稱局中人的純策略的純策略優(yōu)優(yōu)超超于于 12 GS ,S ;A=S1= a1,am S2= b1,bn ij Aa= j=1,n 00 ijkj aa 0 i a i=1,m00 ijil aa 0 j b 0 l b 0 k a 24 優(yōu)優(yōu)超原則超原則：設(shè)設(shè) 為為矩陣對(duì)策矩陣對(duì)策,其中其中, , , 如果如果純策略純策略被被其余其余純策略純策略中中之一所優(yōu)之一所優(yōu)超，由超，由G可可得到一個(gè)新的得到一個(gè)新的矩陣對(duì)策矩陣對(duì)策 G, ,其中：其中：于是于是有：有： (1) (2)G中中局中人局中人的最優(yōu)策略就是其的最優(yōu)策略就是其在在G中中的最優(yōu)策略的最優(yōu)策略

17、; (3)若若G是是G中中局中人局中人的最優(yōu)策略的最優(yōu)策略,則則便是便是其其在在G中中的最優(yōu)策略。的最優(yōu)策略。若若不是不是為純策略為純策略中中之一所優(yōu)超之一所優(yōu)超,而是而是為為的的某個(gè)凸線性組合所優(yōu)超，定理的結(jié)某個(gè)凸線性組合所優(yōu)超，定理的結(jié) 論仍然成立。論仍然成立。 12 GS ,S ;A= S1= a1,am S2= b1,bn ij Aa= 12 GS ,S ;A= 12 1 1 m ij mn ijj S, Aa aai,mj,n = aa = = = = GG VV = x*= 0,x2 * ,xm * T 1 aa2,am 1 aa2,ama2,am 例10-5 1/3*(

18、1) 2/3*(2) 7395973739 73 6875.564465.54 46 6088360603 30302 50592 73959 6875.54 60883 A = * * (0, 0,1/3, 2/3, 0) (1/ 2,1/ 2, 0, 0, 0) T T x y = = 27 三、矩陣對(duì)策的解法三、矩陣對(duì)策的解法 l方程組法方程組法例例10-6：求解矩陣對(duì)策求解矩陣對(duì)策“田忌賽馬田忌賽馬” 解：已知齊王的贏得矩陣為解：已知齊王的贏得矩陣為 311111 131111 113111 111311 111131 111113 A = 易知易知, ,A A沒有沒有鞍點(diǎn)鞍點(diǎn), ,

19、即對(duì)齊王和田忌來說都不存在最優(yōu)純策略。即對(duì)齊王和田忌來說都不存在最優(yōu)純策略。設(shè)齊王和田忌的最優(yōu)混合策略為設(shè)齊王和田忌的最優(yōu)混合策略為和和，從從矩陣矩陣A A的的元素來看元素來看, ,每每個(gè)局中人選取每個(gè)純策略的可能性都是存在的個(gè)局中人選取每個(gè)純策略的可能性都是存在的, ,故可事先故可事先假定假定和和 , ,于是求解線性方程組：于是求解線性方程組： 123456 T * xx ,x ,x ,x ,x ,x= 123456 T * yy ,y ,y ,y ,y ,y= 0 * i x 0 * j y 28 123456 123456 123456 123456 123456 123456

20、 123 3 3 3 xxxxxxv xxxxxxv xxxxxxv xxxxxxv xxxxxxv xxxxxxv xxxx = = = = = = 456 1xx = (I) 123456 123456 123456 123456 123456 123456 12 3 yyyyyyv yyyyyyv yyyyyyv yyyyyyv yyyyyyv yyyyyyv yy = = = = = = 3456 1yyyy = (II) 得到：得到：，故故齊王和田忌的最優(yōu)混合策略齊王和田忌的最優(yōu)混合策略為雙方都以為雙方都以1/6的概率選取每個(gè)純策略。的概率選取每個(gè)純策略。 xi=1/6, yj=

21、1/6, ij=1,6; v=1 l線性規(guī)劃法線性規(guī)劃法 a ijxi v, j=1,n i x i =1 i x i 0, i=1,m ( () ) a ij yjv, i=1,m i yj=1 j yj0, j=1,n ( () ) * 2211 maxmin( , )minmax( , ) y Sy Sx Sx S vE x yE x y = = = = = = mix x njvxa ts v i m i i m i iij ,.,2 , 1, 0 , 1 ,.,2 , 1, . . max)( 1 1 = = = = = njy y mivya ts v j n j j n j ji

22、j ,.,2 , 1, 0 , 1 ,.,2 , 1, . . min)( 1 1 0, i i x vx v = 1 min 1 ( )1 . . 00 1 max 1 ()1 . . 00 iji i i i i iji i i i i ijj j j j jijj jj jj a x zx xPa x v s t xx a y wy yDa y v s t yy = = = = ( () ) ( () ) 32 例例10-7：利用線形規(guī)劃方法求解贏得矩陣?yán)镁€形規(guī)劃方法求解贏得矩陣為為A的的矩陣對(duì)策矩陣對(duì)策求求最優(yōu)解及最優(yōu)解及值值。 323 234 542 A = 123 Xx ,x

23、,x= 123 Yy ,y ,y= minZX = xi i=1 3 = x1 x2 x3 s.t. 3 x12 x25 x31 2 x13 x24 x31 3 x14 x22 x31 xi 0, i=1,2,3 （P) 解：解：此題無鞍點(diǎn)此題無鞍點(diǎn), ,設(shè)局中人設(shè)局中人、局中人、局中人的混合策略分別為：的混合策略分別為：并記對(duì)策的值為并記對(duì)策的值為V。則此問題可化為：。則此問題可化為：（D) 3 123 1 123 123 123 max( ) 3231 2341 . . 5421 0 j j j Z Yyyyy yyy yyy st yyy y = = 解得 123 123 32 0

24、16 16 23 0 1616 5 16 Xx ,x ,x, Yy ,y ,y, , Z XZ Y = = = 即原問題的解為：即原問題的解為： 123 123 16 5 3 2 0 5 5 23 0 55 v X*x ,x ,x, Y*y ,y ,y, , = = = 15 (), 16 j i ij y x Z Xxy vvv =由 35 第第3 3節(jié)節(jié) 雙矩陣對(duì)策雙矩陣對(duì)策 n 雙矩陣對(duì)策（二人有限非零和對(duì)策）的雙矩陣對(duì)策（二人有限非零和對(duì)策）的數(shù)學(xué)模型數(shù)學(xué)模型局中人局中人I選擇選擇 , ,局中人局中人II選擇選擇 , ,則對(duì)策局勢(shì)為則對(duì)策局勢(shì)為 , , 與與這個(gè)局勢(shì)相應(yīng)的局中人這個(gè)局

25、勢(shì)相應(yīng)的局中人I的收入的收入為為aij, ,局中人局中人II的收入不再的收入不再是是- -aij, ,而是而是bij, ,記記作作 ( (aij, , bij) )。對(duì)對(duì)這種對(duì)策這種對(duì)策, ,通常通常用用G=I, II; S1, S2; A, B表示表示, ,其中其中 A=aij, , B=bij分別分別是局中人是局中人I與與II的的支付矩陣。支付矩陣。 1i Sa 2j Sb , ij ab 囚徒B 坦白抵賴坦白囚徒A 抵賴（囚徒A ，囚徒B）囚徒困境 n雙矩陣對(duì)策的解法雙矩陣對(duì)策的解法 l平衡偶平衡偶在非零和對(duì)策中在非零和對(duì)策中, ,設(shè)設(shè)EI=(X,Y)與與EII=(X,Y)

26、分別是局中人分別是局中人I與與II的收入的收入, ,這里這里 XS1,YS2為任意策略。為任意策略。如果存在一對(duì)策略如果存在一對(duì)策略X*S1,Y*S2使得使得 EI=(X,Y*) EI=(X*,Y*), EI=(X*,Y) EI=(X*,Y*) 對(duì)任意的對(duì)任意的XS1,YS2均成立均成立, ,則稱策略則稱策略(X*,Y*)為雙矩陣對(duì)策為雙矩陣對(duì)策G的一個(gè)平衡偶的一個(gè)平衡偶 l納什定理納什定理：（：（美國(guó)科學(xué)家美國(guó)科學(xué)家納什納什,1951,1951年年）任何具有有限個(gè)純策略的二人對(duì)策任何具有有限個(gè)純策略的二人對(duì)策( (包括零和對(duì)策與非零和對(duì)策包括零和對(duì)策與非零和對(duì)策),),至少有一至少有一

27、個(gè)平衡偶個(gè)平衡偶 38 例例10-810-8：智豬博弈智豬博弈籠子里面有兩只豬籠子里面有兩只豬, ,一只大一只小一只大一只小?；\子。籠子很長(zhǎng)很長(zhǎng), ,一頭有一個(gè)踏板一頭有一個(gè)踏板, ,另一頭是飼料的另一頭是飼料的出口和食槽出口和食槽。每。每踩一下踏板踩一下踏板, ,在遠(yuǎn)離踏板的豬圈一邊的投食口就會(huì)落下少量的食在遠(yuǎn)離踏板的豬圈一邊的投食口就會(huì)落下少量的食物物。如果。如果有一只豬去踩踏板有一只豬去踩踏板, ,另一只豬就有機(jī)會(huì)搶先吃到另一邊落下的食物另一只豬就有機(jī)會(huì)搶先吃到另一邊落下的食物。按。按一下按鈕會(huì)有一下按鈕會(huì)有1010個(gè)單位的豬食進(jìn)槽個(gè)單位的豬食進(jìn)槽, ,但是誰按按鈕就會(huì)首先付出但

28、是誰按按鈕就會(huì)首先付出2 2個(gè)單位的成本個(gè)單位的成本。若若大豬先到槽邊大豬先到槽邊, ,大小豬吃到食物的比例是大小豬吃到食物的比例是9191；若大小豬同時(shí)到槽邊進(jìn)食；若大小豬同時(shí)到槽邊進(jìn)食, ,它們它們吃到食物的比例是吃到食物的比例是7373；若小豬先到槽邊；若小豬先到槽邊, ,它們吃到食物的比例是它們吃到食物的比例是6464。如表。如表 102102所示所示, ,那么那么, ,在兩頭豬都有智慧的前提下在兩頭豬都有智慧的前提下, ,最終結(jié)果是什么呢？最終結(jié)果是什么呢？智豬博弈雙矩陣：智豬博弈雙矩陣：小豬小豬按按等待等待大豬大豬按按（5,1）（4,4）等待等待（9，-1）（0,0

29、）解: : 以智豬博弈為例, ,說明純策略下的納什均衡的求取。 (1)(1)當(dāng)小豬選擇按按鈕時(shí), ,如果大豬也選擇按按鈕, ,大豬的贏得是5 5；如果大豬選擇等待, ,大豬的贏得是9,9,所以在第一列的9 9下面劃線； (2)(2)當(dāng)小豬選擇等待時(shí), ,如果大豬選擇按按鈕, ,大豬的贏得是4 4；如果大豬也選擇等待, ,大豬的贏得是0,0,所以在第二列的第一個(gè)分量4 4下面劃線； (3)(3)當(dāng)大豬選擇按按鈕時(shí), ,如果小豬選擇按按鈕, ,小豬的贏得是1 1；如果小豬選擇等待, ,小豬的贏得是4,4,所以在第一行的第二個(gè)分量的4 4下面劃線； (4)(4)當(dāng)大豬選擇等待時(shí), ,如果小豬

30、選擇按按鈕, ,小豬的贏得是-1-1；如果小豬選擇等待, ,小豬的贏得是0,0,所以在第二行的第二個(gè)分量0 0下面劃線小豬小豬按按等待等待大豬大豬按按（5,1）（4,4）等待等待（9，-1）（0,0）因此, ,本例中存在唯一的純策略納什平衡偶(4,4),(4,4),即大豬按按鈕, ,小豬選擇等待是唯一可能出現(xiàn)的結(jié)局。作作業(yè)業(yè) 3（2） 4 5（1） 6（1） 7 11122122 11111111 11 3654 3615 14 11 4141292 Ex, yx yx yx yx y x yxyxyxy x/y/ = = = 對(duì)甲對(duì)甲（乙）（乙）給出一個(gè)選取不同策略的概率分

31、布，以使甲給出一個(gè)選取不同策略的概率分布，以使甲（乙）（乙）在各種情況下的在各種情況下的期望贏得最多期望贏得最多（損失最少）（損失最少）-即即混合策略。混合策略。 12概率 xi 136x1 254x2 概率 yjy1y2 42 n矩陣對(duì)策的矩陣對(duì)策的優(yōu)超策略優(yōu)超策略 l定義：設(shè)有矩陣對(duì)策定義：設(shè)有矩陣對(duì)策 , ,其中其中 , , , , 如果如果對(duì)一切對(duì)一切都有都有 , , 則稱則稱局中人局中人的純策略的純策略優(yōu)優(yōu)超于超于；若若對(duì)一切對(duì)一切 , ,都有都有，則，則稱局中人稱局中人的純策略的純策略優(yōu)優(yōu)超超于于 12 GS ,S ;A=S1= a1,am S2= b1,bn ij Aa= j=1,n 00 ijkj aa 0 i a i=

人人文庫(kù)> 全部分類> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

對(duì)策理論謝家平學(xué)習(xí)課件

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

對(duì)策理論謝家平學(xué)習(xí)課件

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔