混合策略線性規(guī)劃解法

上傳人：1*** IP屬地：湖北上傳時間：2022-01-03 格式：PPT 頁數(shù)：27 大?。?0.50KB 積分：30 舉報 版權(quán)申訴

已閱讀5頁，還剩22頁未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、3 矩陣對策的混合策略矩陣對策的混合策略若不存在若不存在va=v=vb，則局中人甲、乙兩，則局中人甲、乙兩方?jīng)]有最優(yōu)純策略，就要考慮如何方?jīng)]有最優(yōu)純策略，就要考慮如何隨機(jī)地使用自己的策略，使對方捉隨機(jī)地使用自己的策略，使對方捉摸不到自己使用何種策略。即使用摸不到自己使用何種策略。即使用混合策略?；旌喜呗?。設(shè)矩陣對策設(shè)矩陣對策 G = S1, S2, A 。當(dāng)當(dāng) max min aij min max aij i j j i時，不存在最優(yōu)純策略。時，不存在最優(yōu)純策略。例：設(shè)一個贏得矩陣如下例：設(shè)一個贏得矩陣如下: : min min 5 9 5 5 9 5 A = max 6 = max 6

2、策略策略 2 8 6 6 8 6 6 i i max 8 9 max 8 9 min 8 min 8 策略策略 1 j j 當(dāng)甲取當(dāng)甲取策略策略 2 2 ，乙取，乙取策略策略 1 1時，甲實際贏得時，甲實際贏得8比預(yù)比預(yù)期的多期的多2 2，乙當(dāng)然不滿意?？紤]到甲可能取，乙當(dāng)然不滿意?？紤]到甲可能取策略策略 2 2這一點(diǎn)，這一點(diǎn)，乙采取策略乙采取策略 2 2。若甲也分析到。若甲也分析到乙可能采取策略乙可能采取策略 2 2這一點(diǎn)，這一點(diǎn)，取策略取策略 1 1，則贏得更多為則贏得更多為9 9 。此時，對兩個局中人甲、此時，對兩個局中人甲、乙來說，沒有一個雙方均可接受的平衡局勢，乙來說，沒有一個雙方

3、均可接受的平衡局勢，其主要原其主要原因是甲和乙沒有執(zhí)行上述原則的共同基礎(chǔ)，即因是甲和乙沒有執(zhí)行上述原則的共同基礎(chǔ)，即 max min aij min max aij 。 i j j i 一個自然的想法：對甲（乙）給出一個選取不同策一個自然的想法：對甲（乙）給出一個選取不同策略的概率分布，以使甲（乙）在各種情況下的平均贏得略的概率分布，以使甲（乙）在各種情況下的平均贏得（損失）最多（最少）（損失）最多（最少）-即混合策略。即混合策略。求解求解混合策略的混合策略的問題有問題有圖解法、迭代法、線性方程法和圖解法、迭代法、線性方程法和線性規(guī)劃法等，我們這里只介紹線性規(guī)劃法等，我們這里只介紹線性規(guī)劃法

4、線性規(guī)劃法，其他方法略。，其他方法略。例：設(shè)甲使用策略例：設(shè)甲使用策略 1 1的概率為的概率為X1 1，使用策略，使用策略 2 2的概率的概率為為X2 ，并設(shè)在最壞的情況下，甲贏得的平均值為并設(shè)在最壞的情況下，甲贏得的平均值為V（未（未知）。知）。 5 9 A= STEP 1 8 6 1) 1) X1+X2=1 X1, X2 0 2)2)無論乙取何策略，甲的平均贏得應(yīng)不少于無論乙取何策略，甲的平均贏得應(yīng)不少于V:V:對乙取對乙取 1 1： 5X5X1 1+ 8X+ 8X2 2 V V對乙取對乙取 2 2： 9X9X1 1+ 6X+ 6X2 2 V V注意注意 V0,V0,因為因為A A各元素

5、為正。各元素為正。STEP 2 STEP 2 作變換：作變換： X X1 1= X= X1 1/V ; X/V ; X2 2= X= X2 2/V/V得到上述關(guān)系式變?yōu)椋旱玫缴鲜鲫P(guān)系式變?yōu)椋?X X1 1+ X+ X2 2=1/V (V=1/V (V愈大愈好）待定愈大愈好）待定 5X5X1 1+ 8X+ 8X2 2 1 1 9X 9X1 1+ 6X+ 6X2 2 1 1 X X1 1, X, X2 2 0 0建立線性模型：建立線性模型： min Xmin X1 1+X+X2 2 s.t. 5Xs.t. 5X1 1+8X+8X2 2 1 1 X X1 1= 0.048= 0.048 9 9X X

6、1 1+6X+6X2 2 1 1 X X2 2= 0.095= 0.095 X X1 1, X, X2 2 0 0 所以，所以，V=6.993 V=6.993 返回原問題：返回原問題： X X1 1= = X X1 1V= 0.336V= 0.336 X X2 2= = X X2 2V= 0.664V= 0.664于是甲的最優(yōu)混合策略為：于是甲的最優(yōu)混合策略為：以以0.3360.336的概率選的概率選 1 1策略策略，以以0.6640.664的概率選的概率選 2 2策略策略，簡，簡記為記為（0.336,0.664）T ，最優(yōu)值最優(yōu)值V=6.993V=6.993。同樣可求乙的最優(yōu)混合策略：

7、同樣可求乙的最優(yōu)混合策略：設(shè)乙使用策略設(shè)乙使用策略 1 1的概率為的概率為Y Y1 1 Y Y1 1+Y+Y2 2=1=1設(shè)乙使用策略設(shè)乙使用策略 2 2的概率為的概率為Y Y2 2 Y Y1 1,Y,Y2 2 0 0 設(shè)在最壞的情況下，甲贏得的平均值為設(shè)在最壞的情況下，甲贏得的平均值為V V。這也是乙損。這也是乙損失的平均值，越小越好。失的平均值，越小越好。作變換：作變換： Y Y1 1= Y= Y1 1/V /V ， Y Y2 2= Y= Y2 2/V/V 建立線性模型：建立線性模型： max Ymax Y1 1+Y+Y2 2 s.t. 5Ys.t. 5Y1 1+9Y+9Y2 2 1 1

8、 Y Y1 1= 1/14= 1/14 8 8Y Y1 1+6Y+6Y2 2 1 1 Y Y2 2= 1/14= 1/14 Y Y1 1, Y, Y2 2 0 1/V= 0 1/V= Y Y1 1+Y+Y2 2=1/7=1/7 所以，所以，V=6.993V=6.993返回原問題：返回原問題： Y1= Y1V = 1/2 Y2= Y2V = 1/2于是乙的最優(yōu)混合策略為：于是乙的最優(yōu)混合策略為：以以的概率選的概率選 1 1；以以的概率選的概率選 2 2 ，最優(yōu)值，最優(yōu)值 V=7。當(dāng)贏得矩陣中有非正元素時，當(dāng)贏得矩陣中有非正元素時，V 0 的條件不一定成的條件不一定成立立，可以作下列變換：，

9、可以作下列變換：選一正數(shù)選一正數(shù) k，令矩陣中每一元素，令矩陣中每一元素加上加上 k 得到新的正矩陣得到新的正矩陣AA，其對應(yīng)的矩陣對策，其對應(yīng)的矩陣對策G= SG= S1 1, S, S2 2, A , A 與與 G = SG = S1 1, S, S2 2, A , A 解相同，但解相同，但VG = VG k。例例1 1：求解求解“齊王賽馬齊王賽馬”問題。問題。已知齊王的贏得矩陣已知齊王的贏得矩陣A A求得求得故不存在純策略問題下的解，可求其混合策略。故不存在純策略問題下的解，可求其混合策略。A A中有負(fù)元素，可以取中有負(fù)元素，可以取k=2,k=2,在在A A的每個元素上加的每個元素上加

10、2 2得到得到AA如下：如下：311111131111113111111311111131111113A3maxmin1minmaxijijijjiaa533133351333335331333513133353313335A 建立對建立對G G=S=S1 1，S S2 2，A A 中求甲方最佳策略的線性規(guī)劃如下：中求甲方最佳策略的線性規(guī)劃如下： Min xMin x1 1+x+x2 2+x+x3 3+x+x4 4+x+x5 5+x+x6 6 約束條件：約束條件： 5x5x1 1+3x+3x2 2+3x+3x3 3+x+x4 4+3x+3x5 5+3x+3x6 6 11 3x 3x1 1+5x

11、+5x2 2+x+x3 3+3x+3x4 4+3x+3x5 5+3x+3x6 6 11 3x 3x1 1+3x+3x2 2+5x+5x3 3+3x+3x4 4+3x+3x5 5+x+x6 6 11 3x 3x1 1+3x+3x2 2+3x+3x3 3+5x+5x4 4+x+x5 5+3x+3x6 6 11 x x1 1+3x+3x2 2+3x+3x3 3+3x+3x4 4+5x+5x5 5+3x+3x6 6 11 3x 3x1 1+x+x2 2+3x+3x3 3+3x+3x4 4+3x+3x5 5+5x+5x6 6 11 x xi i 0,i=1,2,6 0,i=1,2,6 可解得解為：可解得

12、解為：x x1 1=x=x4 4=x=x5 5=0, x=0, x2 2=x=x3 3=x=x6 6=0.111, v=0.111, v=3, x=3, x1 1=x=x4 4=x=x5 5= 0= 0，x x2 2=x=x3 3=x=x6 6=1/3, =1/3, 即即X X* * =(0,1/3,1/3,0,0,1/3)=(0,1/3,1/3,0,0,1/3)T T，所以甲的最優(yōu)策略為作，所以甲的最優(yōu)策略為作出策略出策略 2 2、 3 3、 6 6的概率都為的概率都為0.333,0.333,而作出而作出 1 1、 4 4、 5 5 的概率為的概率為0 0，此時，此時V VG G=V=V=3

13、=3。同樣可以建立對策同樣可以建立對策G G=S=S1 1，S S2 2，A A 中求乙方最佳策略的線性規(guī)劃如下：中求乙方最佳策略的線性規(guī)劃如下： Min yMin y1 1+y+y2 2+y+y3 3+y+y4 4+y+y5 5+y+y6 6 約束條件：約束條件： 5y5y1 1+3y+3y2 2+3y+3y3 3+3y+3y4 4+y+y5 5+3y+3y6 6 11 3y 3y1 1+5y+5y2 2+3y+3y3 3+3y+3y4 4+3y+3y5 5+y+y6 6 11 3y 3y1 1+y+y2 2+5y+5y3 3+3y+3y4 4+3y+3y5 5+3y+3y6 6 11 y

14、 y1 1+3y+3y2 2+3y+3y3 3+5y+5y4 4+3y+3y5 5+3y+3y6 6 11 3y 3y1 1+3y+3y2 2+3y+3y3 3+y+y4 4+5y+5y5 5+3y+3y6 6 11 3y 3y1 1+3y+3y2 2+y+y3 3+3y+3y4 4+3y+3y5 5+5y+5y6 6 11 y yi i0,i=1,2,60,i=1,2,6 可解得解為：可解得解為： y y1 1=y=y4 4=y=y5 5=0.111, y=0.111, y2 2=y=y3 3=y=y6 6=0, v=0, v=3, y=3, y1 1=y=y4 4=y=y5 5= 1/3=

15、 1/3， y y2 2=y=y3 3=y=y6 6=0=0，即，即Y Y* * =(1/3,0,0,1/3,1/3,0)=(1/3,0,0,1/3,1/3,0)T T。所以田忌的最優(yōu)混合策略為作出策略所以田忌的最優(yōu)混合策略為作出策略 1 1、 4 4、 5 5的概率都為的概率都為1/3,1/3,而作而作出出 2 2， 3 3， 6 6的概率為的概率為0 0，此時，此時V VG G=V=VG G-k=1-k=1。齊王賽馬問題的對策最優(yōu)解可簡記為齊王賽馬問題的對策最優(yōu)解可簡記為X X* *= =(0,1/3,1/3,0,0,1/3)(0,1/3,1/3,0,0,1/3)T T，Y Y* *=

16、=(1/3,0,0,1/3,1/3,0)(1/3,0,0,1/3,1/3,0)T T，對策值，對策值V VG G=1=1。例例 2 2 兩個局中人進(jìn)行對策，規(guī)則是兩人互相獨(dú)立的各自兩個局中人進(jìn)行對策，規(guī)則是兩人互相獨(dú)立的各自從從1 1、2 2、3 3這三個數(shù)字中任意選寫一個數(shù)字。如果兩人所這三個數(shù)字中任意選寫一個數(shù)字。如果兩人所寫的數(shù)字之和為偶數(shù)，則局中人乙支付給局中人甲以數(shù)寫的數(shù)字之和為偶數(shù)，則局中人乙支付給局中人甲以數(shù)量為此和數(shù)的報酬；如果兩人所寫數(shù)字之和為奇數(shù)，則量為此和數(shù)的報酬；如果兩人所寫數(shù)字之和為奇數(shù)，則局中人甲付給局中人乙以數(shù)量為此和數(shù)的報酬。試求出局中人甲付給局中人乙以數(shù)量為

17、此和數(shù)的報酬。試求出其最優(yōu)策略。其最優(yōu)策略。解：首先計算局中人甲的贏得矩陣如下表：解：首先計算局中人甲的贏得矩陣如下表：4-56-34-52-341（出1）2（出2）3（出3）3（出3）2（出2）1（出1）甲的贏甲的贏得得甲的策略甲的策略乙的策略乙的策略即甲的贏得矩陣為即甲的贏得矩陣為A A：可知無純策略意義的解，下面求其在混合策略下的解。可知無純策略意義的解，下面求其在混合策略下的解。A A的各元素都加上的各元素都加上6 6，得到，得到建立線性規(guī)劃模型如下：建立線性規(guī)劃模型如下： Min xMin x1 1+x+x2 2+x+x3 3 Max yMax y1 1+y+y2 2+y+y3

18、 3 S.T.8xS.T.8x1 1+3x+3x2 2+10 x+10 x3 3 1 8y1 8y1 1+3y+3y2 2+10y+10y3 311 3x 3x1 1+10 x+10 x2 2+x+x3 3 1 3y1 3y1 1+10y+10y2 2+y+y3 3 11 10 x 10 x1 1+x+x2 2+12x+12x3 3 1 10y1 10y1 1+y+y2 2+12y+12y3 311 x x1 1,x,x2 2,x,x3 3 0 y0 y1 1,y,y2 2,y,y3 3 00 654543432A1211011031038A得到得到x x1 1=0.25, x=0.25, x

19、2 2=0.50, x=0.50, x3 3=0.25=0.25；y y1 1=0.25, y=0.25, y2 2=0.50, y=0.50, y3 3=0.25=0.25。即此對策的解為即此對策的解為X X* * =(0.25,0.50,0.25)=(0.25,0.50,0.25)T T，Y Y* * =(0.25,0.50,0.25)=(0.25,0.50,0.25)T T。V VG G=V=VG G-k=0-k=0。v 在對策論中可以根據(jù)不同方式對對策問題進(jìn)行分類，通在對策論中可以根據(jù)不同方式對對策問題進(jìn)行分類，通常分類的方式有常分類的方式有:v （1）根據(jù)局中人的個數(shù)，分為二人對策和

20、多人對策；）根據(jù)局中人的個數(shù)，分為二人對策和多人對策；v （2）根據(jù)各局中人的贏得函數(shù)的代數(shù)和是否為零，可分）根據(jù)各局中人的贏得函數(shù)的代數(shù)和是否為零，可分為零和對策和非零和對策；為零和對策和非零和對策；v （3）根據(jù)局中人是否合作，又可分為合作對策和非合作）根據(jù)局中人是否合作，又可分為合作對策和非合作對策；對策；v （4）根據(jù)局中人的策略集中個數(shù)，又分為有限對策和無）根據(jù)局中人的策略集中個數(shù)，又分為有限對策和無限對策（或連續(xù)對策）；限對策（或連續(xù)對策）；v （5）也可根據(jù)局中人掌握信息的情況及決策選擇是否和）也可根據(jù)局中人掌握信息的情況及決策選擇是否和時間有關(guān)可分為完全信息靜態(tài)對策、完全信息動

21、態(tài)對策、時間有關(guān)可分為完全信息靜態(tài)對策、完全信息動態(tài)對策、非完全信息靜態(tài)對策及非完全信息動態(tài)對策；也可以根非完全信息靜態(tài)對策及非完全信息動態(tài)對策；也可以根據(jù)對策模型的數(shù)字特征又分為矩陣對策、連續(xù)對策、微據(jù)對策模型的數(shù)字特征又分為矩陣對策、連續(xù)對策、微分對策、陣地對策、凸對策、隨機(jī)對策。分對策、陣地對策、凸對策、隨機(jī)對策。v 本節(jié)只對對策論中非合作對策的完全信息對策、多本節(jié)只對對策論中非合作對策的完全信息對策、多人非合作對策、非零和對策作一個簡單的敘述性介紹。人非合作對策、非零和對策作一個簡單的敘述性介紹。4其他類型的對策論簡介其他類型的對策論簡介v一、完全信息靜態(tài)對策一、完全信息靜態(tài)對策v 該

22、對策是指掌握了參與人的特征、戰(zhàn)略空該對策是指掌握了參與人的特征、戰(zhàn)略空間、支付函數(shù)等知識和信息并且參與人同時間、支付函數(shù)等知識和信息并且參與人同時選擇行動方案或雖非同時但后行動者并不知選擇行動方案或雖非同時但后行動者并不知道前行動者采取了什么行動方案。道前行動者采取了什么行動方案。v 納什均衡是一個重要概念。在一個戰(zhàn)略組納什均衡是一個重要概念。在一個戰(zhàn)略組合中，給定其他參與者戰(zhàn)略的情況下，任何合中，給定其他參與者戰(zhàn)略的情況下，任何參與者都不愿意脫離這個組合，或者說打破參與者都不愿意脫離這個組合，或者說打破這個僵局，這種均衡就稱為這個僵局，這種均衡就稱為納什均衡納什均衡。下面。下面以著名的以著名

23、的“囚徒困境囚徒困境”來進(jìn)一步闡述來進(jìn)一步闡述 4其他類型的對策論簡介其他類型的對策論簡介例例1 “囚徒困境囚徒困境”說的是兩個囚犯的故事。這兩個囚徒說的是兩個囚犯的故事。這兩個囚徒一起做壞事，結(jié)果被警察發(fā)現(xiàn)抓了起來，分別關(guān)在兩一起做壞事，結(jié)果被警察發(fā)現(xiàn)抓了起來，分別關(guān)在兩個獨(dú)立的不能互通信息的牢房里進(jìn)行審訊。個獨(dú)立的不能互通信息的牢房里進(jìn)行審訊。在這種情形下，兩個囚犯都可以做出自己的選擇：或者在這種情形下，兩個囚犯都可以做出自己的選擇：或者坦白（即與警察合作，從而背叛他的同伙），或者抵坦白（即與警察合作，從而背叛他的同伙），或者抵賴（也就是與他的同伙合作，而不是與警察合作）。賴（也就是與他的

24、同伙合作，而不是與警察合作）。這兩個囚犯都知道，如果他倆都能抵賴的話，就都會這兩個囚犯都知道，如果他倆都能抵賴的話，就都會被釋放，因為只要他們拒不承認(rèn)，警方無法給他們定被釋放，因為只要他們拒不承認(rèn)，警方無法給他們定罪。但警方也明白這一點(diǎn)，所以他們就給了這兩個囚罪。但警方也明白這一點(diǎn)，所以他們就給了這兩個囚犯一點(diǎn)兒刺激：如果他們中的一個人坦白，即告發(fā)他犯一點(diǎn)兒刺激：如果他們中的一個人坦白，即告發(fā)他的同伙，那么他就可以被無罪釋放。而他的同伙就會的同伙，那么他就可以被無罪釋放。而他的同伙就會被按照最重的罪來判決。當(dāng)然，如果這兩個囚犯都坦被按照最重的罪來判決。當(dāng)然，如果這兩個囚犯都坦白，兩個人都會被按

25、照輕罪來判決。如圖白，兩個人都會被按照輕罪來判決。如圖1-1所示。所示。坦白坦白抵賴抵賴輕罪，輕罪輕罪，輕罪重罪，無罪重罪，無罪重罪，無罪重罪，無罪釋放，釋放釋放，釋放坦白坦白抵賴抵賴圖圖1-1 1-1 囚徒困境囚徒困境由分析可知，上例中每個囚犯都會選擇坦白，因此由分析可知，上例中每個囚犯都會選擇坦白，因此這個戰(zhàn)略組合是固定的，這個戰(zhàn)略組合是固定的，( (坦白，坦白坦白，坦白) )就是納什均衡解。就是納什均衡解。而這個均衡是不會被打破的，即使他們在坐牢之前達(dá)成而這個均衡是不會被打破的，即使他們在坐牢之前達(dá)成協(xié)議。協(xié)議。囚徒困境反映了個人理性和集體理性的矛盾。對囚徒困境反映了個人理性和集體

26、理性的矛盾。對于雙方，（抵賴，抵賴）的結(jié)果是最好的，但因為每個于雙方，（抵賴，抵賴）的結(jié)果是最好的，但因為每個囚徒都是理性人，他們追求自身效應(yīng)的最大化，結(jié)果就囚徒都是理性人，他們追求自身效應(yīng)的最大化，結(jié)果就變成了（坦白，坦白）。個人理性導(dǎo)致了集體不理性。變成了（坦白，坦白）。個人理性導(dǎo)致了集體不理性。二、完全信息動態(tài)對策二、完全信息動態(tài)對策在完全信息靜態(tài)對策中，假設(shè)各方都同時選擇行動?，F(xiàn)在情況稍復(fù)在完全信息靜態(tài)對策中，假設(shè)各方都同時選擇行動?，F(xiàn)在情況稍復(fù)雜一些。如果各方行動存在先后順序，后行的一方會參考先行者的策略雜一些。如果各方行動存在先后順序，后行的一方會參考先行者的策略而采取行動，而

27、先行者也會知道后行者會根據(jù)他的行動采取何種行動，而采取行動，而先行者也會知道后行者會根據(jù)他的行動采取何種行動，因此先行者會考慮自己行動會對后行者的影響后選擇行動。這類問題稱因此先行者會考慮自己行動會對后行者的影響后選擇行動。這類問題稱為完全信息動態(tài)對策問題。為完全信息動態(tài)對策問題。例例2 2 某行業(yè)中只有一個壟斷企業(yè)某行業(yè)中只有一個壟斷企業(yè)A A，有一個潛在進(jìn)入者，有一個潛在進(jìn)入者企業(yè)企業(yè)B B。B B可以選擇進(jìn)入或不進(jìn)入該行業(yè)這兩種行動，而可以選擇進(jìn)入或不進(jìn)入該行業(yè)這兩種行動，而A A當(dāng)當(dāng)B B進(jìn)入時，可以選擇默進(jìn)入時，可以選擇默認(rèn)或者報復(fù)兩種行動。如果認(rèn)或者報復(fù)兩種行動。如果B B進(jìn)入后

28、進(jìn)入后A A企業(yè)報復(fù)，將造成兩敗俱傷的結(jié)果，企業(yè)報復(fù)，將造成兩敗俱傷的結(jié)果，但如果但如果A A默認(rèn)默認(rèn)B B進(jìn)入，必然對進(jìn)入，必然對A A的收益造成損失。同樣的，如果的收益造成損失。同樣的，如果B B進(jìn)入而進(jìn)入而A A報報復(fù)，則復(fù)，則B B受損，反之，將受益。把此關(guān)系用圖受損，反之，將受益。把此關(guān)系用圖1-21-2表示。表示。默許默許報復(fù)報復(fù)50,10050,100-20,0-20,00,2000,2000,2000,200進(jìn)入進(jìn)入不進(jìn)入不進(jìn)入圖圖1-2 A1-2 A、B B的行動及結(jié)果的行動及結(jié)果A AB B 由分析可知，上例中（由分析可知，上例中（B B選擇不進(jìn)入，選擇不進(jìn)入，A A選擇報

29、復(fù)）和（選擇報復(fù)）和（B B選擇進(jìn)入，選擇進(jìn)入，A A選擇默許）都是納什均衡解。但在實際中，（選擇默許）都是納什均衡解。但在實際中，（B B選擇不進(jìn)入，選擇不進(jìn)入，A A選擇報復(fù)）這種情況是不可能出現(xiàn)的。因為選擇報復(fù)）這種情況是不可能出現(xiàn)的。因為B B知道他如果進(jìn)入，知道他如果進(jìn)入，A A只能默許，所以只有（只能默許，所以只有（B B選擇進(jìn)入，選擇進(jìn)入，A A選擇選擇默許）會發(fā)生?；蛘哒f，默許）會發(fā)生?；蛘哒f，A A選擇報復(fù)行動是不可置信的威脅。選擇報復(fù)行動是不可置信的威脅。對策論的術(shù)語中，稱（對策論的術(shù)語中，稱（A A選擇默許，選擇默許，B B選擇進(jìn)入）為精煉納什選擇進(jìn)入）為精煉納什均衡。當(dāng)

30、只當(dāng)參與人的戰(zhàn)略在每一個子對策中都構(gòu)成納什均均衡。當(dāng)只當(dāng)參與人的戰(zhàn)略在每一個子對策中都構(gòu)成納什均衡，這個納什均衡才稱為衡，這個納什均衡才稱為精煉納什均衡精煉納什均衡。當(dāng)然，如果當(dāng)然，如果A A下定決心一定要報復(fù)下定決心一定要報復(fù)B B，即使自己暫時損失。，即使自己暫時損失。這時威脅就變成了可置信的，這時威脅就變成了可置信的，B B就會選擇不進(jìn)入，（就會選擇不進(jìn)入，（B B選擇不選擇不進(jìn)入，進(jìn)入，A A選擇報復(fù)）就成為精煉納什均衡。選擇報復(fù)）就成為精煉納什均衡。軍事交戰(zhàn)時，軍事交戰(zhàn)時，“破釜沉舟破釜沉舟”講的就是一種可置信威脅。講的就是一種可置信威脅。實際企業(yè)經(jīng)營中也有很多類似的例子。實際企

31、業(yè)經(jīng)營中也有很多類似的例子。三、多人非合作對策三、多人非合作對策有三個或三個以上對策方參加的對策就是有三個或三個以上對策方參加的對策就是“多人多人對策對策” ” 。多人對策同樣也是對策方在意識到其他對策。多人對策同樣也是對策方在意識到其他對策方的存在，意識到其他對策方對自己決策的反應(yīng)和反方的存在，意識到其他對策方對自己決策的反應(yīng)和反作用存在的情況下尋求自身最大利益的決策活動。因作用存在的情況下尋求自身最大利益的決策活動。因而，它們的基本性質(zhì)和特征與兩人對策是相似的，我而，它們的基本性質(zhì)和特征與兩人對策是相似的，我們常常可以用研究兩人對策同樣的思路和方法來研究們常?？梢杂醚芯績扇藢Σ咄瑯拥乃?/p>

32、路和方法來研究它們，或?qū)扇藢Σ叩慕Y(jié)論推廣到多人對策。它們，或?qū)扇藢Σ叩慕Y(jié)論推廣到多人對策。不過，畢竟多人對策中出現(xiàn)了更多的追求各自利益的不過，畢竟多人對策中出現(xiàn)了更多的追求各自利益的獨(dú)立決策者，因此，策略的相互依存關(guān)系也就更為獨(dú)立決策者，因此，策略的相互依存關(guān)系也就更為復(fù)雜，對任一對策方的決策引起的反應(yīng)也就要比兩復(fù)雜，對任一對策方的決策引起的反應(yīng)也就要比兩人對策復(fù)雜得多。并且，在多人對策中還有一個與人對策復(fù)雜得多。并且，在多人對策中還有一個與兩人對策有本質(zhì)區(qū)別的特點(diǎn)，即可能存在兩人對策有本質(zhì)區(qū)別的特點(diǎn)，即可能存在“破壞破壞者者”。所謂破壞者即一個對策中具有下列特征的對。所謂破壞者即一個對策

33、中具有下列特征的對策方：其策略選擇對自身的得益沒有任何影響，但策方：其策略選擇對自身的得益沒有任何影響，但卻會影響其它對策方的得益，有時這種影響甚至有卻會影響其它對策方的得益，有時這種影響甚至有決定性的作用。例如有三個城市爭奪某屆奧運(yùn)會的決定性的作用。例如有三個城市爭奪某屆奧運(yùn)會的主辦權(quán)。主辦權(quán)。四、非零和對策四、非零和對策所謂零和對策，就是一方的收益必定是另一方的所謂零和對策，就是一方的收益必定是另一方的損失。這種對策的特點(diǎn)是不管各對策方如何決策，最損失。這種對策的特點(diǎn)是不管各對策方如何決策，最后各對策方得益之和總是為零。有某些對策中，每種后各對策方得益之和總是為零。有某些對策中，每種結(jié)果之下各對策方的得益之和不等于結(jié)果之下各對策方的得益之和不等于0 0，但總是等于，但總是等于一個非零常數(shù)，就稱之為一個非零常數(shù)，就稱之為“常和對策常和對策”。當(dāng)然，可以。當(dāng)然，可以將零和對策本身看作是常和對策的特例。將零和對策本身看作是常和對策的特例。 “ “零和對策零和對策”和和“常和對策常和對策”之外的所有對策都之外的所有對策都可被稱為可被稱為“非零和對策非零和對策”。非零和對策即意味著在不。非零和對策即意味著在不同策略組合（結(jié)果）下各對策方的得益之和一般是不同策略組合（結(jié)果）下各對

人人文庫> 全部分類> 教育資料 > 備課教案

溫馨提示

1. 本站所有資源如無特殊說明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽，若沒有圖紙預(yù)覽就沒有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫網(wǎng)僅提供信息存儲空間，僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

混合策略線性規(guī)劃解法

文檔簡介

溫馨提示

最新文檔

評論

混合策略線性規(guī)劃解法

文檔簡介

溫馨提示

最新文檔

評論

相關(guān)文檔