運籌學(xué)對策論_第1頁
運籌學(xué)對策論_第2頁
運籌學(xué)對策論_第3頁
運籌學(xué)對策論_第4頁
運籌學(xué)對策論_第5頁
已閱讀5頁,還剩69頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

運籌學(xué)對策論第一頁,共七十四頁,編輯于2023年,星期三11.1引言Introduction第二頁,共七十四頁,編輯于2023年,星期三對策論(gametheory)亦稱博弈論,是研究具有對抗或競爭性質(zhì)現(xiàn)象的數(shù)學(xué)理論和方法,它既是數(shù)學(xué)的一個分支,也是運籌學(xué)的一個重要學(xué)科。對策論中有一個重要的概念即對策行為,對策行為是指具有競爭或?qū)剐再|(zhì)的行為,在這類行為中,參加斗爭或競爭的各方各自具有不同的利益和目標(biāo),各方需考慮對手的各種可能的行動方案,并力圖選擇對自己最為有利或最為合理的方案

許多游戲具有特征:(1)有一定的規(guī)則(2)有一個結(jié)果(3)有可供選擇的策略(4)策略與利益相互依存12.1.1對策論概述12.1引言第三頁,共七十四頁,編輯于2023年,星期三對策論,不同于日常游戲,它具有理論性,應(yīng)用的范圍也不局限于游戲。對策是一些個人、對組或其它組織,面對一定的環(huán)境條件,在一定的規(guī)則下,同時或先后從各自允許的行為或策略中進行選擇并加以實施,各自取得相應(yīng)結(jié)果的過程。這些規(guī)則應(yīng)用到經(jīng)濟、軍事、政治等領(lǐng)域也有類似的特征。例如,市場競爭、經(jīng)營決策、投資分析、價格制定、費用分攤、財政轉(zhuǎn)移支付、投標(biāo)與拍賣、對抗與追蹤、資源利用、談判、競選、戰(zhàn)爭例如,戰(zhàn)國時代的田忌賽馬、三國時代的曹不興濺墨畫蠅、曹操兵敗華容道、北宋時期的丁渭挖河修皇宮等都是對策論成功應(yīng)用的例子。12.1引言第四頁,共七十四頁,編輯于2023年,星期三著名法國經(jīng)濟學(xué)家泰勒爾(JeanTirole)說:“正如理性預(yù)期使宏觀經(jīng)濟學(xué)發(fā)生革命一樣,對策論廣泛而深遠地改變了經(jīng)濟學(xué)家的思維方式”。是研究決策主體的行為發(fā)生直接相互作用時的決策及這種決策的均衡問題。即它是研究聰明而又理智的決策者在沖突或合作中的策略選擇理論。它將成為當(dāng)代經(jīng)濟管理學(xué)科的前沿領(lǐng)城。對策論就是研究對策行為中斗爭各方是否存在著最合理的行動方案,以及如何找到這個合理方案的數(shù)學(xué)理論和方法。12.1引言第五頁,共七十四頁,編輯于2023年,星期三一個對策需要3個基本要素:(1)局中人(players)(2)策略集(strategies)(3)得益函數(shù)(payoffs)

12.1.2對策三要素是一個局勢策略組全體局勢的集合S可用各局中人的策略集的迪卡爾集表示12.1引言第六頁,共七十四頁,編輯于2023年,星期三12.1.3對策的結(jié)構(gòu)和分類12.1引言第七頁,共七十四頁,編輯于2023年,星期三【例12.1】1943年2月,日本統(tǒng)帥山本五十六大將計劃由南太平洋新不列顛群島的拉包爾出發(fā),3天穿過俾斯麥海,開往新幾內(nèi)亞的萊城,支援困守的日軍。有兩條路線:北線和南線。盟軍統(tǒng)帥麥克阿瑟命令他麾下的太平洋戰(zhàn)區(qū)空軍司令肯尼將軍組織空中打擊。偵察機重點搜索有兩個方案:北線和南線。當(dāng)時未來3天中:北線陰雨,能見度差;南線晴天,能見度佳。日美雙方各自應(yīng)采用哪種方案12.1引言第八頁,共七十四頁,編輯于2023年,星期三北線南線第九頁,共七十四頁,編輯于2023年,星期三日軍盟軍北線()南線()北線()22南線()13【解】局中人:盟軍、日軍;雙方策略:北線、南線,記為:盟軍的贏得矩陣如下:最優(yōu)策略是:,即都選擇北線。日軍艦隊受到重創(chuàng),但未全殲。雙方選擇的策略是:在最不利中選擇最有利的策略。12.1引言第十頁,共七十四頁,編輯于2023年,星期三囚徒的困境(二人非零和對策)-5,-50,-10-10,0-1,-1囚徒1囚徒2坦白不坦白坦白不坦白雙方如何采取對策使結(jié)果對自己最有利?12.1引言第十一頁,共七十四頁,編輯于2023年,星期三【例12.2】雙寡頭削價競爭(兩個廠商)100,10020,150150,2070,70亞貿(mào)中南高價低價高價低價類似地,廣告投資、采用新技術(shù)等方面,廠商之間常常耗資巨大,但不一定有利可圖的爭奪戰(zhàn);對公共資源的掠奪式使用等問題。我們的目的是如何利用這種困境達到有利于社會,合理利用和開發(fā)公共資源,保護環(huán)境。12.1引言第十二頁,共七十四頁,編輯于2023年,星期三多寡頭削價競爭(3個廠商:亞貿(mào),中南,中北)

)100,100,10020,150,20150,20,20130,130,20亞貿(mào)中南高價低價高價低價20,20,15020,130,130130,20,13070,70,70亞貿(mào)中南高價低價高價低價中北采用高價中北采用低價12.1引言第十三頁,共七十四頁,編輯于2023年,星期三【例12.3】動態(tài)對策:甲向乙借一萬元錢經(jīng)營,甲許諾經(jīng)營成功后分給乙總利潤(4萬)的一半,乙是否借給甲?乙甲借不借乙分不分(2,2)(1,0)打乙不打(0,4)(1,0)(-1,0)有法律保障法律保障不足12.1引言第十四頁,共七十四頁,編輯于2023年,星期三下一節(jié):納什均衡12.1引言第十五頁,共七十四頁,編輯于2023年,星期三12.2納什均衡NashEquilibrium第十六頁,共七十四頁,編輯于2023年,星期三12.2納什均衡Nash對對策論的貢獻有:(1)合作對策中的討價還價模型,稱為Nash討價還價解;(2)非合作對策的均衡分析。納什均衡(NashEquilibrium)假定有n個博弈方參加博弈,在給定其他博弈方策略的條件下,每個人選擇自己的最優(yōu)策略(個人最優(yōu)策略可能依賴也可能不依賴他人策略),一起構(gòu)成一個策略組合(StrategyProfile),而Nash均衡是這樣一種策略組合,由所有參與人的最優(yōu)策略組成,給定別人策略的條件下,沒有任何單個參與人有積極性選擇其他策略,從而沒有任何人有積極性打破這種均衡,Nash均衡是一種“僵局”:給定別人不動的情況下,沒有人有興趣動。約翰·納什(JohnF.Nash)

1928年生于美國,1994年獲得諾貝爾經(jīng)濟學(xué)獎在非合作博弈的均衡分析理論方面做出了開創(chuàng)性的貢獻,對博弈論和經(jīng)濟學(xué)產(chǎn)生了重大影響12.2.1納什均衡定義第十七頁,共七十四頁,編輯于2023年,星期三另一種解釋:假定所有博弈方事先達成一項協(xié)議,規(guī)定每個人的行為規(guī)則,在沒有外在的強制力約束時,當(dāng)事人會自覺遵守這個協(xié)議,等于說這個協(xié)議構(gòu)成一個納什均衡:假定別人遵守協(xié)議的情況下,沒有人有積極性偏離協(xié)議規(guī)定的自己的行為規(guī)則。換句話說,如果一個協(xié)議不構(gòu)成納什均衡,它就不可能自動實施,因為至少有一個參與人會違背此協(xié)議,不滿足Nash均衡要求的協(xié)議是沒有意義的。12.2納什均衡第十八頁,共七十四頁,編輯于2023年,星期三用G表示一個對策,若一個對策中有n個局中人,則每個局中人可選策略的集合稱為策略集,分別用S1,S2,…,Sn表示;Sij表示局中人i的第j個策略,其中j可取有限個值(有限策略對策),也可取無限個值(無限策略對策);對策方i的得益則用hi表示;hi是各對策方策略的多元函數(shù),n個局中人的對策G常寫成:【定義12.1】

在對策G={S1,S2…,Sn;h1,h2…h(huán)n}中,如果由各個對策方的各選取一個策略組成的某個策略組合(S1*,S2*…,Sn*)中,任一對策方i的策略Si*,都是對其余策略方策略的組合(S1*,…,S*i-1,S*i+1…,Sn*)的最佳策略,即hi(S1*,…,S*i-1,Si*,S*i+1…Sn*)≥hi(S1*,…,S*i-1,Sij,S*i+1…,Sn*)對任意Sij∈Si都成立,則稱(S1*,…,Sn*)為G的一個純策略“納什均衡”(NashEquilibrium).G={S1,…,Sn;h1,…h(huán)n}12.2納什均衡第十九頁,共七十四頁,編輯于2023年,星期三各選取一個策略組成的某個策略組合構(gòu)成一個局勢,其最優(yōu)局勢稱為純策略意義下的最優(yōu)局勢.【例12.4】假設(shè)有三個廠商在同一市場上生產(chǎn)銷售完全相同的產(chǎn)品,它們各自的產(chǎn)量分別用m1、m2和m3表示,再假設(shè)m1、m2和m3只能取1、2、3……等正整數(shù)值.市場出清價格一定是市場總產(chǎn)量Q=m1+m2+m3的函數(shù),假設(shè)該函數(shù)為:

不妨先假設(shè)三個廠商開始時分別生產(chǎn)3單位,9單位和6單位產(chǎn)量,這時三廠商是否滿意各自的產(chǎn)量,要從利潤進行分析.由于產(chǎn)量不能超過20,則第i個廠商的利潤函數(shù)為12.2納什均衡第二十頁,共七十四頁,編輯于2023年,星期三可算出在產(chǎn)量組合為(3,9,6)時,市場價格為2,三廠商的利潤分8,16和12,再作其它產(chǎn)量組合時亦會有不同的結(jié)果,如表12.2.

表12.2三廠商離散產(chǎn)量結(jié)合對應(yīng)價格和利潤

m1m2m3pπ1π2π33962618123863924185564202024555525252533311333333633848242412.2納什均衡第二十一頁,共七十四頁,編輯于2023年,星期三【定義12.2】在對策G={S1,…,Sn;h1,…,hn}中,局中人i的策略集為Si={Si1,…,Sik},則他以概率分布pi=(pi1,…,pik)隨機在其k個可選策略中選擇的“策略”稱為一個混合策略,其中0≤pij≤1對j=1,…,k都成立,且pi1+…+pik=1.

12.2.2混合策略納什均衡12.2納什均衡第二十二頁,共七十四頁,編輯于2023年,星期三【定義12.3】如果一個策略G={S1,…,Sn,h1,…,hn}中,參予者i的策略集為Si={Si1,…,Sik},如果由各個對策方的策略組成策略集合G*={S1*,S2*,…,Sn*},其中都是對其余對策方策略組合的最佳策略,即∏i(S1*,S2*,…,Si-1*,Si*,…Sn*)≥∏i(S1*,S2*,…,Si-1*,Si*,…Sn*)對任意Sij∈Si都成立,則稱(S1*,…,Sn*)為G的一個混合策略納什均衡.12.2納什均衡第二十三頁,共七十四頁,編輯于2023年,星期三下一節(jié):反應(yīng)函數(shù)法作業(yè):教材P293T1012.2納什均衡第二十四頁,共七十四頁,編輯于2023年,星期三12.3反應(yīng)函數(shù)法第二十五頁,共七十四頁,編輯于2023年,星期三12.3反應(yīng)函數(shù)法當(dāng)?shù)靡媸菍Σ叩亩嘣B續(xù)函數(shù)時,求出每個對策方的反應(yīng)函數(shù),而各個反應(yīng)函數(shù)的交點就是納什均衡【例12.5】設(shè)A,B兩廠家生產(chǎn)同樣產(chǎn)品,廠商A產(chǎn)量為q1,B產(chǎn)量為q2,市場總產(chǎn)量為Q=q1+q2,市場出清價格是市場總產(chǎn)量的函數(shù)P=6-Q。設(shè)產(chǎn)品產(chǎn)量的邊際成本相等,C1=C2=2。求解兩廠商的納什均(假設(shè)產(chǎn)量連續(xù)可分)。分析:這是一個連續(xù)產(chǎn)量的古諾模型,不難看出,該對策中兩廠商各自的利潤分別為各自的銷售收益減去各自成本,即:第二十六頁,共七十四頁,編輯于2023年,星期三12.3反應(yīng)函數(shù)法作反應(yīng)函數(shù):(0,4)(0,2)(2,0)(4,0)(4/3,4/3)納什均衡:(4/3,4/3)第二十七頁,共七十四頁,編輯于2023年,星期三12.3反應(yīng)函數(shù)法【例12.6】考慮上述模型的另一種情況即各廠商所選擇的是價格而不是產(chǎn)量,假設(shè)產(chǎn)量與價格的函數(shù)關(guān)系為:其它條件不變,邊際成本為C1、C2,試求解其納什均衡。各自的策略空間為兩方的得益就是各自的利潤第二十八頁,共七十四頁,編輯于2023年,星期三12.3反應(yīng)函數(shù)法利用得益函數(shù)在偏導(dǎo)數(shù)為0時有最大值,各自的反應(yīng)函數(shù)分別為:為該對策唯一的納什均衡第二十九頁,共七十四頁,編輯于2023年,星期三12.3反應(yīng)函數(shù)法【例12.7】設(shè)有3個農(nóng)戶一起放牧羊群,現(xiàn)有一可供大家自由放牧的草地,由于草地面積有限,只能供有限只羊群吃飽,否則就會影響到羊群的產(chǎn)出,假設(shè)每只羊的產(chǎn)出函數(shù)為成本C=8,且每個農(nóng)戶在決定自己放牧羊群數(shù)的時候并不知道其它農(nóng)戶的決策,試求出該決策問題的納什均衡?!窘狻扛鬓r(nóng)戶的得益函數(shù)分別為第三十頁,共七十四頁,編輯于2023年,星期三12.3反應(yīng)函數(shù)法反應(yīng)函數(shù)因此該對策的納什均衡為(18,18,18)下一節(jié):有限二人零和對策

作業(yè):教材P293T9第三十一頁,共七十四頁,編輯于2023年,星期三12.4有限二人零和對策第三十二頁,共七十四頁,編輯于2023年,星期三矩陣對策就是二人有限零和對策。通常矩陣用來表示局中人1的贏得,局中人2的支付。12.4有限二人零和對策

用Ⅰ、Ⅱ表示兩個局中人,并設(shè)局中人Ⅰ有m個純策略,α1,α2,…,αm,局中人Ⅱ有n個純策略β1,β2,…,βn,則按對策論的相關(guān)要素定義,局中人Ⅰ、Ⅱ的策略集分別為:第三十三頁,共七十四頁,編輯于2023年,星期三可以算出,局中人Ⅰ、Ⅱ所構(gòu)成的策略組合共有m×n個,記局中人Ⅰ在策略(αi,βj)下的贏得aij,則Ⅰ在每個策略的贏得構(gòu)成一個矩陣當(dāng)局中人Ⅰ、Ⅱ的策略集S1,S2及I的贏得矩陣確定后,一個矩陣對策就給定了.通常將矩陣對策記為:

12.4有限二人零和對策

第三十四頁,共七十四頁,編輯于2023年,星期三12.4.1數(shù)學(xué)定義12.4有限二人零和對策

稱A為局中人Ⅰ的贏得矩陣(或為Ⅱ的支付矩陣),由于對策為零和的,故局中人Ⅱ的贏得矩陣為-A。矩陣對策記為第三十五頁,共七十四頁,編輯于2023年,星期三成立,,則稱VG為對策G的值,對應(yīng)的策略組合

12.4.2純策略矩陣對策【定義12.4】設(shè)G={S1,S2;A}為矩陣對策,其中S1={α1,α2,…,αn},S2={β1,β2,…,βn},若等式稱為該對策的納什均衡.12.4有限二人零和對策

第三十六頁,共七十四頁,編輯于2023年,星期三【例12.8】求解矩陣對策,其中則有對策G的解為:【解】12.4有限二人零和對策

第三十七頁,共七十四頁,編輯于2023年,星期三【定理12.1】矩陣對策G={S1,S2;A}在純策略定義下有納什均衡的充要條件是:存在策略組合使得對一切i=1,…,m,j=1,…,n,均有:

矩陣對策在純策略意義下有解且VG=ai*j*的充要條件是:ai*j*是A的鞍點,在對策論中,矩陣A的鞍點也稱為對策的鞍點.

12.4有限二人零和對策

第三十八頁,共七十四頁,編輯于2023年,星期三【定義5】設(shè)f(x,y)為一個定義在x∈A及y∈B上的實函數(shù),如果存在x*∈A及y*∈B,使得對一切x∈A及y∈B有則稱為函數(shù)f的有關(guān)鞍點。矩陣對策在純策略意義下的解且的充要條件是是A的鞍點。12.4有限二人零和對策

第三十九頁,共七十四頁,編輯于2023年,星期三【解】直接在贏得表上計算,有

可知=5,i*=1,3,j*=2,4.故(α1,β2)(α1,β4)(α2,β2)(α2,β4)為對策的納什均衡,VG=5.12.4有限二人零和對策

【例12.9】設(shè)有矩陣對策G={S1,S2;A},贏得矩陣為求納什均衡第四十頁,共七十四頁,編輯于2023年,星期三【性質(zhì)12.1】無差別性.若和為G的兩個解,則:【性質(zhì)12.2】可交換性.若和為G的兩個解,則以上方法也稱“上策均衡法”(Dominant-strategeEqyilibrium)12.4有限二人零和對策

也是對策的解.及第四十一頁,共七十四頁,編輯于2023年,星期三【例12.10】

甲、乙兩個企業(yè)同時生產(chǎn)一種電子產(chǎn)品(假設(shè)市場上只有這兩家,為一雙寡頭競爭局面),兩個企業(yè)都想通過改革管理獲取更多的銷售份額,甲企業(yè)的策略措施有:(1)降低產(chǎn)品價格;(2)提高產(chǎn)品質(zhì)量;(3)推出新產(chǎn)品.乙企業(yè)措施為:(1)增加廣告費用;(2)增設(shè)網(wǎng)點;(3)改進產(chǎn)品性能,通過預(yù)測,兩個企業(yè)市場份額變動情況如表12-4所示,試確定最優(yōu)策略.

乙企業(yè)123min甲企業(yè)112-13-1213103335855*max13105*

【解】則對策最優(yōu)解為VG=5,納什均衡為(α3,β3).甲企業(yè)采用推出新產(chǎn)品策略,乙企業(yè)采用改進產(chǎn)品性能策略,結(jié)果甲企業(yè)贏得5%的市場份額.12.4有限二人零和對策

第四十二頁,共七十四頁,編輯于2023年,星期三12.4.3混合策略矩陣對策純策略矩陣對策的滿足納什均衡是滿足局中人Ⅰ有把握的至少贏得是局中人Ⅱ有把握的至多損失即:

當(dāng)V1≠V2時,這時不存在純策略意義下的納什均衡。

田忌齊王上中下上下中中上下中下上下上中下中上上中下3,-31,-11,-11,-1-1,11,-1上下中1,-13,-31,-11,-11,-1-1,1中上下1,-1-1,13,-31,-11,-11,-1中下上-1,11,-11,-13,-31,-11,-1下上中1,-11,-11,-1-1,13,-31,-1下中上1,-11,-1-1,11,-11,-13,-312.4有限二人零和對策

第四十三頁,共七十四頁,編輯于2023年,星期三利用最大最小和最小最大原則,發(fā)現(xiàn)不存在使得成立的點.12.4有限二人零和對策

第四十四頁,共七十四頁,編輯于2023年,星期三例:對局中人1來說,v1=-2,i*=2,對局中人2來說,v2=3,j*=1,v1≠v2。沒有鞍點?!径x12.6】設(shè)矩陣對策,其中記12.4有限二人零和對策

第四十五頁,共七十四頁,編輯于2023年,星期三則分別稱為局中人Ⅰ、Ⅱ的混合策略集;、分別稱為局中人1、2的混合策略,為一個混合局勢。稱為G的混合擴充。E是贏得期望值?!径x】當(dāng)時,稱為局中人Ⅰ、Ⅱ在混合策略中的納什均衡。稱為局中人Ⅰ在選取混合策略S*1時的贏得函數(shù)

【定理12.2】矩陣對象G={S1,S2;A}在混合策略意義下有解的充要條件是:存在x*∈S1*,y*∈S2*,使(x*,y*)為函數(shù)E(x,y)的一個鞍點,即對一切x∈S1*,y∈S2*有E(x,y*)≤E(x*,y*)≤E(x*,y)12.4有限二人零和對策

第四十六頁,共七十四頁,編輯于2023年,星期三【例12.11】考慮矩陣對策G={S1,S2;A},其中局中人1的贏得期望值:取,滿足試求納什均衡.

【解】純策略納什均衡不存在.設(shè)x=(x1,x2)為局中人Ⅰ的混合策略,y=(y1,y2)為局中人Ⅱ的混合策略,則:12.4有限二人零和對策

第四十七頁,共七十四頁,編輯于2023年,星期三分別為局中人Ⅰ和Ⅱ的最優(yōu)策略.即該對策的納什均衡。

12.4.4納什均衡存在定理【定理12.3】設(shè)x*∈S1*,y*∈S2*,則(x*,y*)為對策G的納什均衡的條件是:對任意i=1,…,m,j=1,…,n,有E(i,y*)≤E(x*,y*)≤E(x*,j)其中:12.4有限二人零和對策

第四十八頁,共七十四頁,編輯于2023年,星期三【定理12.4】設(shè)x*∈S1*,y*∈S2*,則(x*,y*)是對策G的納什均衡的充要條件是:存在數(shù)V,使得x*,y*分別滿足:且V=VG.【定理12.5】對任一矩陣對策G={S1,S2;A},一定存在混合策略意義下的納什均衡.12.4有限二人零和對策

第四十九頁,共七十四頁,編輯于2023年,星期三【定理12.6】設(shè)(x*,y*)為矩陣對策G的一個納什均衡,V=VG,則(1)若xi*>0,則

(2)若yi*>0,則

(3)若,則

(4)若,則12.4有限二人零和對策

例第五十頁,共七十四頁,編輯于2023年,星期三12.4有限二人零和對策

【定理12.7】設(shè)有兩個矩陣對策G1={S1,S2;A},G2={S1,S2;αA}則(1)VG2=αVG1(2)T(G1)=T(G2)其中α>0為一常數(shù),T(G1)、T(G2)為兩個對策的解集合第五十一頁,共七十四頁,編輯于2023年,星期三1.優(yōu)超原則法【例12.12】設(shè)贏得矩陣A為:求納什均衡.

【解】第4行優(yōu)于第1行,第3行優(yōu)于第2行,故可劃去第1行和第2行,得到新的贏得矩陣,x1=x2=012.4有限二人零和對策

12.4.5矩陣對策求解方法“嚴格下策反復(fù)消去法”(IteratedEliminationofStrictly

DominatedStrategies)第五十二頁,共七十四頁,編輯于2023年,星期三對于A1第1列優(yōu)于第3列,第2列優(yōu)于第4列,(1/2)×(第1列)+(1/2)×(第2列)優(yōu)超于第5列,因此去掉第3列,第4列和第5列,y3=y4=y5=0,得到A2:

又由于第1行優(yōu)超于第3行,所以從A2中劃去第3行,x5=0,得到A3,解方程組:該矩陣對策的納什均衡為:

VG=4.8

12.4有限二人零和對策

第五十三頁,共七十四頁,編輯于2023年,星期三2.線性方程組法若最優(yōu)策略中和均不為零時,有

12.4有限二人零和對策

【例12.14】求解矩陣對策【解】建立方程組求解得:x=(0.525,0.275,0.2),y=(0.2,0.05,0.75);VG=-0.45第五十四頁,共七十四頁,編輯于2023年,星期三3.線性規(guī)劃方法任意矩陣對策的求解均等價于一對互為對偶的線性規(guī)劃問題,而定理12.4表明,對策G的解等價于下面兩個不等式的解.【定理12.9】設(shè)矩陣對策的值為v,則:

12.4有限二人零和對策

第五十五頁,共七十四頁,編輯于2023年,星期三則局中人Ⅰ、Ⅱ的最優(yōu)策略等價于線性規(guī)劃問題:

12.4有限二人零和對策

第五十六頁,共七十四頁,編輯于2023年,星期三令有局中人Ⅰ:12.4有限二人零和對策

第五十七頁,共七十四頁,編輯于2023年,星期三同理,令有局中人Ⅱ:12.4有限二人零和對策

第五十八頁,共七十四頁,編輯于2023年,星期三【例12.12】利用線性規(guī)劃方法求解贏得矩陣為

的矩陣對策的納什均衡.【解】此問題可化為兩個互為對偶的線性規(guī)劃問題:12.4有限二人零和對策

第五十九頁,共七十四頁,編輯于2023年,星期三最優(yōu)解:X=(0.1065,0.1448,0.0437),Y=(0.1093,0.1038,0.0819);w=0.29508.利用變換

得到x*=(0.36,0.49,0.15),y*=(0.37,0.35,0.28);v=3.3912.4有限二人零和對策

第六十頁,共七十四頁,編輯于2023年,星期三下一節(jié):有限二人非零和對策

12.4有限二人零和對策

作業(yè):教材P292T3、4、5、6、8第六十一頁,共七十四頁,編輯于2023年,星期三12.5有限二人非零和對策第六十二頁,共七十四頁,編輯于2023年,星期三12.5有限二人非零和對策12.5.1數(shù)學(xué)定義【例11.16】市場上有兩企業(yè)生產(chǎn)同樣商品,甲企業(yè)與乙企業(yè)的贏得矩陣分別為矩陣A1和A2合并為雙矩陣依然在混合擴充意義下考慮有限二人非零和對策,記局中人1的混合策略為x,局中人2的混合策略為y,相應(yīng)的策略集記為第六十三頁,共七十四頁,編輯于2023年,星期三12.5有限二人非零和對策【定義12.8】對于某個有限二人非零和對策,其局中人1的贏得(混合策略下)為局中人2的贏得為第六十四頁,共七十四頁,編輯于2023年,星期三12.5有限二人非零和對策12.5.2有限二人非零和對策納什均衡分別是局中人1和2的贏得,,和如果有一對策略為任意策略,滿足則稱為該對策的納什均衡,稱為對策的納什均衡解(或贏得)【定理12.10】(納什定理)任何矩陣對策及有限二人非零和對策至少有一個納什均衡【定義12.9】在有限二人非零和

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論