數(shù)學(xué)建模對策論5_第1頁
數(shù)學(xué)建模對策論5_第2頁
數(shù)學(xué)建模對策論5_第3頁
數(shù)學(xué)建模對策論5_第4頁
數(shù)學(xué)建模對策論5_第5頁
已閱讀5頁,還剩92頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

GAME

THEORY

對策論第11章2/3/2023111矩陣對策6.1引言6.2對策論的基本概念6.3矩陣對策的概念及模型6.4矩陣對策的純策略解(鞍點(diǎn)解)6.5矩陣對策的混合策略解(mixedstrategicsolution)6.6矩陣對策的解法2/3/20232OperationsResearch6.1.1何謂對策論(GameTheory)?6.1.2對策的例子6.1.3對策論的誕生與發(fā)展簡況6.1引言2/3/20233OperationsResearch6.1.1

何謂對策論(GameTheory)?

定義:對策論亦稱競賽論或博弈論,是研究具有斗爭或競爭性質(zhì)現(xiàn)象的數(shù)學(xué)理論和方法。囚徒困境局中人2坦白不坦白局中人1坦白(-6,-6)(-1,-8)不坦白(-8,-1)(-2,-2)2/3/20234OperationsResearch齊王賽馬決斗問題:神雕俠侶中武林盟主大會6.1.2

對策的例子朱子柳霍都郭靖達(dá)爾巴郝大通金輪法王2/3/20235OperationsResearch6.1.3對策論的誕生與發(fā)展簡況早期工作1912年E.Zermelo‘關(guān)于集合論在象棋對策中的應(yīng)用’

1921年E.Borel引入最優(yōu)策略

1928年J.V.Neumann證明了一些猜想2/3/20236OperationsResearch6.1.3對策論的誕生與發(fā)展簡況產(chǎn)生標(biāo)志

1944年J.V.Neumann和O.Morgenstern”對策論與經(jīng)濟(jì)行為”(TheoryofGamesandEconomicBehavior)發(fā)展成熟

Nash均衡、經(jīng)濟(jì)博奕論、信息不對稱對策和廣義對策2/3/20237OperationsResearch6.2

對策論的基本概念6.2.1局中人(Player)6.2.2策略(Strategy)6.2.3支付與支付函數(shù)2/3/20238OperationsResearch6.2.1

局中人(Player)1、局中人:在一場競爭或斗爭中的決策者稱為該局對策的局中人通常,一局對策具有兩個或兩個以上---決策者,一般用I表示局中人集合:2/3/20239OperationsResearch6.2.1局中人(Player)2、對策分類:依據(jù)局中人的數(shù)量,可將對策分為有限對策無限對策(n>2)對策無限零和對策無限非零和對策有限零和對策有限非零和對策2/3/202310OperationsResearch6.2.2

策略(Strategy)1、策略與策略集局中人指導(dǎo)自己自始至終如何行動的一個方案,稱為策略(Strategy)由所有策略構(gòu)成的集合,稱為策略集(Strategy

Set)2/3/202311OperationsResearch6.2.2

策略(Strategy)2、策略集的元素:對于局中人i,i∈I,都有自己的策略集Si,通常每一局中人的策略集中至少應(yīng)包括兩個策略對于例4的包、剪、錘游戲。假設(shè)有兩個局中人I={甲,乙},甲的策略集為S甲={(包)、(剪)、(錘)}={a1、a2、a3};乙的策略集為S乙={(包)、(剪)、(錘)}={b1、b2、b3};2/3/202312OperationsResearch6.2.3

支付與支付函數(shù)1、局勢:各局中人所選定的策略形成的策略組2、策略組若si是第i個局中人的一個策略,則n個局中人的策略組s=(s1,s2,…,sn)

就是一個局勢。2/3/202313OperationsResearch6.2.3

支付與支付函數(shù)例如,對于包、剪、錘游戲。假設(shè)有兩個局中人I={甲,乙},甲的策略集為S甲={(包)、(剪)、(錘)}={(a1)、(a2)、(a3)};乙的策略集為S乙={(包)、(剪)、(錘)}={(b1)、(b2)、(b3)};

則甲的一個策略ai,和乙的一個策略bj就構(gòu)成一個局勢sij.2/3/202314OperationsResearch6.2.3

支付與支付函數(shù)3、贏得(支付):當(dāng)每個局中人所采取的策略確定后,他們就會得到相應(yīng)的收益或損失,稱為局中人的支付(Payoff)。若甲的一個策略a3(錘),乙的一個策略b2(剪),則構(gòu)成一個局勢s32

。在局勢s32下,甲的支付為:乙的支付2/3/202315OperationsResearch6.2.3

支付與支付函數(shù)4、支付(贏得)函數(shù):不同的策略會導(dǎo)致不同的支付,因此,支付是策略(準(zhǔn)確的說應(yīng)該是局勢)的函數(shù),稱為支付函數(shù)(payofffunction)。對于例4,兩人的支付函數(shù)分別記為:和例如,對于策略a3,b12/3/202316OperationsResearch6.2.3

支付與支付函數(shù)5、零和對策和非零和對策

根據(jù)各局中人支付的代數(shù)和是否為0,將對策分為零和對策和非零和對策(non-zero-sumgames)。若在任一局對策中,全體局中人支付的總和為0,則該對策稱為零和對策,否則稱為非零和對策(non-zero-sumgames)。對于前例,顯然為零和對策,因?yàn)?/3/202317OperationsResearch6.2.3

支付與支付函數(shù)6、對策分類根據(jù)局中人的數(shù)目和支付函數(shù)代數(shù)和有限對策n人對策(n>2)對策合作對策非合作對策2/3/202318OperationsResearch6.3

矩陣對策的概念及模型1、定義:兩個人零和對策稱為矩陣對策例,“包、剪、錘”游戲中,甲、乙雙方各有三種不同的策略,分別為:2/3/202319OperationsResearch6.3

矩陣對策的概念及模型甲的支付情況如下表β1(包)β2(剪)β3(錘)α1(包)0-11α2(剪)10-1α3(錘)-110乙的策略甲的支付甲的策略表6.12/3/202320OperationsResearch6.3

矩陣對策的概念及模型齊王賽馬

β1β2β3β4β5β6α1(上中下)31111-1α2(上下中)1311-11α3(中上下)1-13111α4(中下上)-111311α5(下中上)11-1131α6(下上中)111-113田忌策略齊王贏得齊王策略上中下上下中中上下中下上下中上下上中2/3/202321OperationsResearch6.3

矩陣對策的概念及模型表6.1中的數(shù)字用矩陣的形式表示A稱為甲的支付矩陣。顯然,乙的支付矩陣為-A。因此,該對策可記為:2/3/202322OperationsResearch6.3

矩陣對策的概念及模型2、矩陣對策的模型一般地,若局中人Ⅰ,Ⅱ的策略集分別為:為了與后面的概念區(qū)分開來,我們稱αi為Ⅰ的純策略,βj為Ⅱ的純策略,對于純策略αi,βj構(gòu)成的策略偶(αi,βj)稱為純局勢。

2/3/202323OperationsResearch6.3

矩陣對策的概念及模型若Ⅰ的支付矩陣為:αij表示局勢(αi,βj)下,局中人Ⅰ的支付,則矩陣對策可記為G={S1,S2,A}:即矩陣對策模型。2/3/202324OperationsResearch6.4

矩陣對策的純策略解6.4.1矩陣對策的純策略解例解過程6.4.2矩陣對策的純策略解理論基礎(chǔ)6.4.3矩陣對策的純策略解性質(zhì)2/3/202325OperationsResearch例5設(shè)二人零和對策

G={S1,S2,A},,其中6.4.1矩陣對策的純策略解例解過程而且局中Ⅰ的支付矩陣為:兩位局中人都想自己的支付最大化。2/3/202326OperationsResearch6.4.1矩陣對策的純策略解例解過程這里我們認(rèn)為局中人都是理智的,從矩陣A進(jìn)行邏輯推理可知:如果局中人Ⅰ采取α3作策略,雖有可能獲得最大支付18,但是,局中人Ⅱ分析到Ⅰ的這種心理,就會采取β3策略,使Ⅰ不僅得不到最大值18,反而取得很壞的結(jié)果-8;同樣,局中人Ⅱ?yàn)榱说玫阶畲笾Ц?12(即局中人Ⅰ的支付-12),會采取β2作為策略,但局中人Ⅰ也會猜到Ⅱ的這種心理,而采取α2作策略,這樣局中人Ⅱ只能得到-3。2/3/202327OperationsResearch6.4.1矩陣對策的純策略解例解過程從以上的分析可以看出,局中人Ⅰ選取最優(yōu)策略時應(yīng)該考慮到Ⅱ也是十分理智與精明的,Ⅱ的策略是要以Ⅰ支付最少為目的,所以不能存在任何僥幸心理。局中人Ⅱ也應(yīng)作同樣的考慮。

對于局中人來說,應(yīng)該是從最壞處著想向最好處努力。2/3/202328OperationsResearch6.4.1矩陣對策的純策略解例解過程對局中人Ⅰ來講,各策略的最壞結(jié)果分別為: min{-6,2,-7}=-7 min{5,3,6}=3 min{18,0,-8}=-8 min{-2,-12,7}=-12這些最壞的情況中,最好的結(jié)果是:

max{-7,3,-8,-12}=32/3/202329OperationsResearch6.4.1矩陣對策的純策略解例解過程同樣,對局中人Ⅱ而言,各策略的最壞的結(jié)果分別為:

max{-6,5,18,-2}=18 max{2,3,0,-12}=3 max{-7,6,-18,7}=7在這些最壞的情況中,最好的結(jié)果(損失最?。┦?/p>

min{18,3,7}=32/3/202330OperationsResearch6.4.1矩陣對策的純策略解例解過程β1β2β3α1-62-7-7α25363α3180-8-8α4-2-127-1218372/3/202331OperationsResearch6.4.1矩陣對策的純策略解例解過程課堂練習(xí):求解對策 G=﹛S1,S2,A﹜已知:2/3/202332OperationsResearch定義1對于矩陣對策G=﹛S1,S2,A﹜,如果存在純局勢6.4.2矩陣對策的純策略解理論基礎(chǔ)則稱局勢為對策G在純策略中的解。亦稱其為G的鞍點(diǎn)(saddlepoint):

(列中最大,行中最小)使得對任意j=1,…,n,及任意i=1,…m有:2/3/202333OperationsResearch6.4.2矩陣對策的純策略解理論基礎(chǔ)

分別稱為局中人Ⅰ,Ⅱ的最優(yōu)純策略。稱

為對策G的值(value),記為2/3/202334OperationsResearch6.4.2矩陣對策的純策略解理論基礎(chǔ)定理1矩陣對策G={S1,S2,A}存在最優(yōu)純策略的充分必要條件為:2/3/202335OperationsResearch6.4.2矩陣對策的純策略解理論基礎(chǔ)求對G的解和值。例6已知G={S1,S2,A},其中,2/3/202336OperationsResearch6.4.2矩陣對策的純策略解理論基礎(chǔ)β1β2β3β4α186866α2134-3-3α396766α4-31103-3961066解:根據(jù)A可得2/3/202337OperationsResearch6.4.2矩陣對策的純策略解理論基礎(chǔ)由于:四個局勢均為G的鞍點(diǎn),且故知:2/3/202338OperationsResearch6.4.3矩陣對策的純策略解性質(zhì)從上例可知,對策的解可以是不唯一的,但對策的值是唯一的。對策解不唯一時,應(yīng)滿足下面兩條性質(zhì):1.無差別性:若與

是矩陣對策G的兩個解,則即對策值相等,它們在矩陣中的元素相同。2/3/202339OperationsResearch6.4.3矩陣對策的純策略解性質(zhì)2.可交換性:若與是矩陣對策G的兩個解,則與也是對策的解。2/3/202340OperationsResearch6.4.3矩陣對策的純策略解性質(zhì)是不是每一個矩陣對策都有純策略解(鞍點(diǎn))?β1β2β3α10-11-1α210-1-1α3-110-1111答案是否定的。2/3/202341OperationsResearch6.5矩陣對策的混合策略解6.5.1混合策略與混合擴(kuò)充(mixedstrategicsolution)6.5.2解的基本定理2/3/202342OperationsResearch6.5.1混合策略與混合擴(kuò)充β1β2α1363α2544561、問題提出2/3/202343OperationsResearch6.5.1混合策略與混合擴(kuò)充該對策問題表明不存在使對立雙方達(dá)到平衡的局勢,因此,局中人采取任何一種純策略,都有一定的風(fēng)險。所以,在這種情況下,局中人必須隱瞞自己選取策略的意圖。2/3/202344OperationsResearch6.5.1混合策略與混合擴(kuò)充2、問題處理方案設(shè)計(jì)這時我們可以設(shè)想局中人隨機(jī)地選取純策略來進(jìn)行對策。即在一局對策中,局中人Ⅰ以概率

來選取純策略,其中的滿足

于是得到一個m維的概率向量2/3/202345OperationsResearch6.5.1混合策略與混合擴(kuò)充同樣對于局中人Ⅱ,有相應(yīng)的一個n維的概率向量滿足yj表示局中人Ⅱ選取純策略βj的概率。2/3/202346OperationsResearch6.5.1混合策略與混合擴(kuò)充3、混合策略概念引入定義:若給定一個矩陣對策G={S1,S2,A},其中則我們把純策略集對應(yīng)的概率向量:與分別稱作局中人Ⅰ、Ⅱ的混合策略,(X,Y)稱為一個混合局勢。2/3/202347OperationsResearch6.5.1混合策略與混合擴(kuò)充如果局中人Ⅰ選取的策略為

局中人Ⅱ選取

由于兩局中人分別選取策略

的事件可以看成使相互獨(dú)立4、混合策略的局中人支付

如果局中人Ⅰ選取的策略為2/3/202348OperationsResearch6.5.1混合策略與混合擴(kuò)充就是局中人Ⅰ的支付值。所以局勢(αi,βj)出現(xiàn)的概率是xiyj。從而知局中人Ⅰ支付αij的概率是xiyj。于是,數(shù)學(xué)期望值:2/3/202349OperationsResearch6.5.1混合策略與混合擴(kuò)充令:則稱為G的混合擴(kuò)充。5、混合擴(kuò)充2/3/202350OperationsResearch6.5.1混合策略與混合擴(kuò)充定義2

如果存在,滿足:對任意及均有:則稱為G(在混合策略下的)解.

分別稱為局中人Ⅰ、Ⅱ的最優(yōu)(混合)策略.稱為對策G(在混合意義下的)值,記為2/3/202351OperationsResearch6.5.1混合策略與混合擴(kuò)充例7

設(shè)

,其中求它的解及值。解:顯然該問題無鞍點(diǎn)解。設(shè)局中人Ⅰ、Ⅱ的混合策略分別為:

X=(x1,x2),Y=(y1,y2).則2/3/202352OperationsResearch6.5.1混合策略與混合擴(kuò)充則局中人Ⅰ支付的數(shù)學(xué)期望為:2/3/202353OperationsResearch6.5.1混合策略與混合擴(kuò)充可見:當(dāng)2/3/202354OperationsResearch6.5.1混合策略與混合擴(kuò)充顯然2/3/202355OperationsResearch6.5.1混合策略與混合擴(kuò)充由定義1知:分別是局中人Ⅰ、Ⅱ的的最優(yōu)策略,且2/3/202356OperationsResearch6.5.2

解的基本定理定理2(基本定理)

任意一個矩陣對策其中一定有解(在混合策略意義下),且如果G的值是V,則以下兩組不等式的解是局中人Ⅰ,Ⅱ的最優(yōu)策略:2/3/202357OperationsResearch6.5.2

解的基本定理(11-1)(11-2)2/3/202358OperationsResearch6.5.2

解的基本定理(1)若則(G的值)(2)若則(4)若,則(3)若,則可用例7驗(yàn)證定理3

是對策G(同前)的最優(yōu)混合局勢,則對某一個i或j來說:2/3/202359OperationsResearch6.5.2

解的基本定理y1y2…ynβ1β2…βnx1α1a11a12…a1nV1’x2α2a21a22…a2nV2’…………………xmαmam1am2…amnVm

’V1V2…Vn≤V≥V2/3/202360OperationsResearch6.6

矩陣對策的解法6.6.1圖解法6.6.2優(yōu)勢法6.6.3

簡化計(jì)算法6.6.4

線性規(guī)劃解法2/3/202361OperationsResearch6.6.1圖解法例8

已知:其中求矩陣對策的解和值。2/3/202362OperationsResearch解:設(shè)局中人Ⅰ的混合策略為(x,1-x)T,x∈[0,1]。對局中人Ⅰ而言,他的最少可能收入為局中人Ⅱ選取β1,β2所確定的兩條直線(定理3知):6.6.1圖解法V1=5x+20(1-x)=20-15xV2=35x+10(1-x)=25x+10因?yàn)閤1和x2一定大于0在x處的縱坐標(biāo)中的最小者.局中人Ⅰ用“最大最小”原則選取自己的策略,即:2/3/202363OperationsResearchD點(diǎn)為極值點(diǎn),D點(diǎn)坐標(biāo)為:

即Ⅰ的最優(yōu)混合策略為:

ED(1/4,16?)VV1=5x+20(1-x)=20-15xV2=35x+10(1-x)=25x+10

xF從上圖可以看出:就是折線EDF.2/3/202364OperationsResearch6.6.1

圖解法同理,對局中人Ⅱ而言有V=5y+35(1-y)=35-30yV=20y+10(1-y)=10+10y最小最大點(diǎn)為:即Ⅱ的最優(yōu)解為:對策值為:2/3/202365OperationsResearch6.6.1

圖解法FG(5/8,16?)HYV=5y+35(1-y)=35-30yV=20y+10(1-y)=10+10y2/3/202366OperationsResearch6.6.1

圖解法課堂練習(xí)p145-10.4-3:求解下列矩陣對策,已知贏得矩陣為:2/3/202367OperationsResearch6.6.1

圖解法例9

已知:其中求對策的解和值。解:顯然無鞍點(diǎn),作混合擴(kuò)充:2/3/202368OperationsResearch6.6.1

圖解法對局中人Ⅰ而言,若Ⅱ選取時,Ⅰ的最小可能收入為以下四條直線在x處縱坐標(biāo)中的最小者v=2x+4(1-x)=4-2x (1)v=3x+(1-x)=2x+1 (2)v=x+6(1-x)=-5x+6 (3)v=5x (4)2/3/202369OperationsResearch6.6.1

圖解法從圖上可以看出B點(diǎn)坐標(biāo)即為所求的極值點(diǎn).AB(2)(3)(1)(4)B點(diǎn)坐標(biāo)為:即Ⅰ的最優(yōu)解為2/3/202370OperationsResearch6.6.1

圖解法同理可得:

v=2y1+3y2+y3+5y4 (5) v=4y1+y2+6y3 (6) 由上節(jié)的定理3求出Ⅱ的最優(yōu)解將分別代入方程(1)~(4)得:2/3/202371OperationsResearch6.6.1

圖解法定理3的(4)定理3的(2)定理3的(2)定理3的(4)2/3/202372OperationsResearch6.6.1

圖解法代入(5)、(6)得:解之得:故Ⅱ的最優(yōu)策略為2/3/202373OperationsResearch6.6.2

優(yōu)勢法對于一般的矩陣對策其中定義3

若對固定的i、k有若對固定的j和l,有則稱優(yōu)超,記為則稱優(yōu)超,記為2/3/202374OperationsResearch6.6.2

優(yōu)勢法(1)定理4

設(shè)G中的某個被其余的之一優(yōu)超,由G可得,其中于是有

(2)中局中人Ⅱ的最優(yōu)策略就是G中Ⅱ的最優(yōu)策略;2/3/202375OperationsResearch6.6.2

優(yōu)勢法若是Ⅰ在中的最優(yōu)解,則為Ⅰ在G中的最優(yōu)解.(3)2/3/202376OperationsResearch6.6.2

優(yōu)勢法例10已知某矩陣對策G的支付矩陣為:求解這個矩陣對策。2/3/202377OperationsResearch6.6.2

優(yōu)勢法解:顯然無鞍點(diǎn),由于A的階數(shù)為圖解法失效。由定義可知由定理1可將該問題簡化為:2/3/202378OperationsResearch6.6.2

優(yōu)勢法可用圖解法求得最優(yōu)解和值分別為:由又可看出:從又可看出:,因此得:2/3/202379OperationsResearch6.6.2

優(yōu)勢法即可得到對策G的解為:值為V=5。2/3/202380OperationsResearch6.6.3簡化計(jì)算法定理5若矩陣對策其中d為常數(shù),則G1與G2有相同的解,且對策的值相差一個常數(shù)d,即:2/3/202381OperationsResearch6.6.3簡化計(jì)算法推論1若矩陣對策其中k>0為常數(shù),則G1與G2有相同的解,且2/3/202382OperationsResearch6

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論