版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
Chapter5動(dòng)態(tài)規(guī)劃
(Dynamicprogramming)多階段決策問(wèn)題動(dòng)態(tài)規(guī)劃的基本概念最優(yōu)性原理建模的一般步驟動(dòng)態(tài)規(guī)劃應(yīng)用例解本章主要內(nèi)容:教學(xué)目的與要求【教學(xué)目的與要求】了解動(dòng)態(tài)規(guī)劃的基本思想、基本概念和基本方程,熟悉動(dòng)態(tài)規(guī)劃的最優(yōu)性原理和建模的一般步驟;【教學(xué)重難點(diǎn)】重點(diǎn)是動(dòng)態(tài)規(guī)劃的基本思想方法,難點(diǎn)是基本方程。2511214106104131112396581052C1C3D1AB1B3B2D2EC2例5.1試求下圖中從A地到E地的最短路徑:引例從A到E的最短路徑為19,路線為A→B2→C1→D1→E
多階段決策問(wèn)題動(dòng)態(tài)規(guī)劃(簡(jiǎn)稱:DP)
是解決多階段決策過(guò)程最優(yōu)化問(wèn)題的一種方法,無(wú)特定的數(shù)學(xué)模型。
動(dòng)態(tài)規(guī)劃是求解某類問(wèn)題的一種方法,是考察問(wèn)題的一種途徑,而不是一種算法。必須對(duì)具體問(wèn)題進(jìn)行具體分析,運(yùn)用動(dòng)態(tài)規(guī)劃的原理和方法,建立相應(yīng)的模型,然后再用動(dòng)態(tài)規(guī)劃方法去求解。
動(dòng)態(tài)規(guī)劃是現(xiàn)代企業(yè)管理中的一種重要決策方法,可用于最優(yōu)路徑問(wèn)題、資源分配問(wèn)題、生產(chǎn)計(jì)劃和庫(kù)存問(wèn)題、投資問(wèn)題、裝載問(wèn)題、排序問(wèn)題及生產(chǎn)過(guò)程的最優(yōu)控制等。多階段決策問(wèn)題多階段決策過(guò)程:
是指在一類特殊的活動(dòng)過(guò)程,可將過(guò)程分解成若干相互聯(lián)系的階段,在每個(gè)階段都要做出決策,從而使整個(gè)過(guò)程達(dá)到最優(yōu)的效果,全部過(guò)程的決策是一個(gè)決策序列,所以多階段決策問(wèn)題也稱為序貫決策問(wèn)題。
每個(gè)階段的決策依賴于該階段的狀態(tài),又隨即引起狀態(tài)的轉(zhuǎn)移,一個(gè)決策序列就是在變化的狀態(tài)中產(chǎn)生出來(lái)的,故有“動(dòng)態(tài)”的含義。處理多階段決策問(wèn)題的方法稱為動(dòng)態(tài)規(guī)劃方法。動(dòng)態(tài)規(guī)劃問(wèn)題
動(dòng)態(tài)規(guī)劃(dynamicprogramming)是運(yùn)籌學(xué)的一個(gè)分支,是求解決策過(guò)程(decisionprocess)最優(yōu)化的數(shù)學(xué)方法。20世紀(jì)50年代初美國(guó)數(shù)學(xué)家R.E.Bellman等人在研究多階段決策過(guò)程(multistepdecisionprocess)的優(yōu)化問(wèn)題時(shí),提出了著名的最優(yōu)化原理(principleofoptimality),把多階段過(guò)程轉(zhuǎn)化為一系列單階段問(wèn)題,逐個(gè)求解,創(chuàng)立了解決這類過(guò)程優(yōu)化問(wèn)題的新方法——?jiǎng)討B(tài)規(guī)劃。多階段決策問(wèn)題的典型例子:
1.生產(chǎn)決策問(wèn)題:企業(yè)在生產(chǎn)過(guò)程中,由于需求是隨時(shí)間變化的,因此企業(yè)為了獲得全年的最佳生產(chǎn)效益,就要在整個(gè)生產(chǎn)過(guò)程中逐月或逐季度地根據(jù)庫(kù)存和需求決定生產(chǎn)計(jì)劃。
2.機(jī)器負(fù)荷分配問(wèn)題:某種機(jī)器可以在高低兩種不同的負(fù)荷下進(jìn)行生產(chǎn)。在高負(fù)荷下進(jìn)行生產(chǎn)時(shí),產(chǎn)品的年產(chǎn)量g和投入生產(chǎn)的機(jī)器數(shù)量u1的關(guān)系為g=g(u1)12n狀態(tài)決策狀態(tài)決策狀態(tài)狀態(tài)決策多階段決策問(wèn)題
3.航天飛機(jī)飛行控制問(wèn)題:由于航天飛機(jī)的運(yùn)動(dòng)的環(huán)境是不斷變化的,因此就要根據(jù)航天飛機(jī)飛行在不同環(huán)境中的情況,不斷地決定航天飛機(jī)的飛行方向和速度(狀態(tài)),使之能最省燃料和實(shí)現(xiàn)目的(如軟著落問(wèn)題)。
4.不包含時(shí)間因素的線性規(guī)劃、非線性規(guī)劃等靜態(tài)決策問(wèn)題(本質(zhì)上是一次決策問(wèn)題)也可以適當(dāng)?shù)匾腚A段的概念,作為多階段的決策問(wèn)題用動(dòng)態(tài)規(guī)劃方法來(lái)解決。多階段決策問(wèn)題
5.最短路問(wèn)題:給定一個(gè)交通網(wǎng)絡(luò)圖如下,其中兩點(diǎn)之間的數(shù)字表示距離(或花費(fèi)),試求從A點(diǎn)到E點(diǎn)的最短距離(總費(fèi)用最小)。多階段決策問(wèn)題2511214106104131112396581052C1C3D1AB1B3B2D2EC2k=1k=2k=3k=4基本概念1、階段:
把一個(gè)問(wèn)題的過(guò)程,恰當(dāng)?shù)胤譃槿舾蓚€(gè)相互聯(lián)系的階段,以便于按一定的次序去求解。
描述階段的變量稱為階段變量(k)。k=1,2,3,…,n階段的劃分,一般是根據(jù)時(shí)間和空間的自然特征來(lái)進(jìn)行的,但要便于問(wèn)題轉(zhuǎn)化為多階段決策。2511214106104131112396581052C1C3D1AB1B3B2D2EC2k=1k=2k=3k=4基本概念2、狀態(tài):表示每個(gè)階段開始所處的自然狀況或客觀條件。通常一個(gè)階段有若干個(gè)狀態(tài),描述過(guò)程狀態(tài)的變量稱為狀態(tài)變量sk
(表示第k階段的狀態(tài)變量),可以是一個(gè)數(shù)或數(shù)組。狀態(tài)變量的取值有一定的允許集合或范圍,此集合稱為可達(dá)狀態(tài)集合SK
。2511214106104131112396581052C1C3D1AB1B3B2D2EC2k=1k=2k=3k=4S1={A}S2={B1,B2,B3}S3={C1,C2,C3}S4={D1,D2}狀態(tài)應(yīng)滿足:(1)能描述問(wèn)題的變化過(guò)程。(2)具有無(wú)后效性:當(dāng)某階段狀態(tài)給定后,在這階段以后過(guò)程的發(fā)展不受這階段以前各狀態(tài)的影響。(3)能直接或間接地計(jì)算出來(lái)?;靖拍?/p>
3、決策:表示當(dāng)過(guò)程處于某一階段的某個(gè)狀態(tài)時(shí),可以作出不同的決定,從而確定下一階段的狀態(tài),這種決定稱為決策。
描述決策的變量,稱為決策變量。常用uk(sk)表示第k階段當(dāng)狀態(tài)為sk時(shí)的決策變量。
基本概念2511214106104131112396581052C1C3D1AB1B3B2D2EC2k=1k=2k=3k=4若s2=B2下段選C1,則u2(s2)=u2(B2)
=C1
基本概念在實(shí)際問(wèn)題中決策變量的取值往往在某一范圍之內(nèi),此范圍稱為允許決策集合。
常用Dk(sk)表示第k階段從狀態(tài)sk出發(fā)的允許決策集合,顯然uk(sk)∈Dk(sk)。2511214106104131112396581052C1C3D1AB1B3B2D2EC2k=1k=2k=3k=4D2(s2)=D2(B2)={C1,C2,C3}u2(s2)∈D2(s2)u2(B2)∈D2(B2)
4、策略:相互連接的決策序列稱為一個(gè)策略。
從第k階段開始到第n階段結(jié)束稱為一個(gè)子策略
Pk,n={uk
,uk+1,…,un
}
全策略
P1,n={u1,u2,…,un
}
所有策略當(dāng)中有最優(yōu)值的策略稱為最優(yōu)策略pk,n*(p1,n*)?;靖拍罨靖拍?、狀態(tài)轉(zhuǎn)移方程:是確定過(guò)程由一個(gè)狀態(tài)到另一個(gè)狀態(tài)的演變過(guò)程,描述了狀態(tài)轉(zhuǎn)移規(guī)律。由sk轉(zhuǎn)變?yōu)閟k+1的狀態(tài)轉(zhuǎn)移方程:
sk+1=T(sk,uk)2511214106104131112396581052C1C3D1AB1B3B2D2EC2k=1k=2k=3k=4若s2=B2下段選C1,則s3=u2(s2)
=u2(B2)=C1
sk+1=uk(sk)
6、指標(biāo)函數(shù)和最優(yōu)值函數(shù):用來(lái)衡量所實(shí)現(xiàn)過(guò)程優(yōu)劣的一種數(shù)量指標(biāo),為指標(biāo)函數(shù)。階段指標(biāo)函數(shù):Vk(sk,uk)
表示第
k
階段位于sk
狀態(tài)、決策為
uk
的指標(biāo)值。
策略指標(biāo)函數(shù):各決策序列指標(biāo)值之和。(個(gè)別情況為乘積)基本概念V2(s2,u2)=V2(B2,u2)=d2(B2,C1)=62511214106104131112396581052C1C3D1AB1B3B2D2EC2k=1k=2k=3k=4基本概念指標(biāo)函數(shù)的最優(yōu)值,稱為最優(yōu)值函數(shù)。
在不同的問(wèn)題中,指標(biāo)函數(shù)的含義是不同的,它可能是距離、利潤(rùn)、成本、產(chǎn)量或資源消耗等。動(dòng)態(tài)規(guī)劃模型的指標(biāo)函數(shù),應(yīng)具有可分離性,并滿足遞推關(guān)系。Vk,n(sk,pk,n):狀態(tài)為sk,采用策略pk,n時(shí)后部子策略的指標(biāo)函數(shù)。fk(sk)=optvk,n(sk,pk,n):從第k段狀態(tài),采用最優(yōu)策略pk,n*到過(guò)程終止時(shí)的最優(yōu)值函數(shù)。(opt:optimum—最優(yōu)化)所要求的是:
最優(yōu)解—最優(yōu)策略p1,n*
最優(yōu)值—最優(yōu)指標(biāo)f1(s1)基本概念基本思想1、動(dòng)態(tài)規(guī)劃思想是將問(wèn)題的過(guò)程分成幾個(gè)相互聯(lián)系的階段,恰當(dāng)?shù)倪x取狀態(tài)變量和決策變量及定義最優(yōu)值函數(shù),從而把一個(gè)大問(wèn)題轉(zhuǎn)化成一組同類型的子問(wèn)題,然后逐個(gè)求解。從邊界條件開始,逐段遞推尋優(yōu),在每一個(gè)子問(wèn)題的求解中,均利用了它前面的子問(wèn)題的最優(yōu)化結(jié)果,依次進(jìn)行,最后一個(gè)子問(wèn)題所得的最優(yōu)解,就是整個(gè)問(wèn)題的最優(yōu)解。因此,動(dòng)態(tài)規(guī)劃方法的關(guān)鍵在于正確地寫出基本的遞推關(guān)系式和恰當(dāng)?shù)倪吔鐥l件(簡(jiǎn)稱基本方程)。2、動(dòng)態(tài)規(guī)劃方法是既把當(dāng)前一段和未來(lái)一段分開,又把當(dāng)前效益和未來(lái)效益結(jié)合起來(lái)考慮的一種最優(yōu)化方法。因此,每段決策的選取是從全局來(lái)考慮的,與該段的最優(yōu)選擇答案一般是不同的.基本思想3、在求整個(gè)問(wèn)題的最優(yōu)策略時(shí),由于初始狀態(tài)是已知的,而每段的決策都是該段狀態(tài)的函數(shù),故最優(yōu)策略所經(jīng)過(guò)的各段狀態(tài)便可逐段變換得到,從而確定了最優(yōu)解。最優(yōu)化原理:作為整個(gè)過(guò)程的最優(yōu)策略具有這樣的性質(zhì):無(wú)論過(guò)去的狀態(tài)和決策如何,相對(duì)于前面的決策所形成的狀態(tài)而言,余下的決策序列必然構(gòu)成最優(yōu)子策略?!币簿褪钦f(shuō),一個(gè)最優(yōu)策略的子策略也是最優(yōu)的。最優(yōu)化原理2511214106104131112396581052C1C3D1AB1B3B2D2EC2k=1k=2k=3k=41.指標(biāo)函數(shù)為階段指標(biāo)和的形式
fk(sk)=opt{vk(sk,uk)+fk+1(sk+1)}(遞推公式)
uk∈D(uk)k=n,n-1,…,1
fn+1(sn+1)=0
(邊界條件)
2.指標(biāo)函數(shù)為階段指標(biāo)積的形式
fk(sk)=opt{vk(sk,uk)×fk+1(sk+1)}(遞推公式)
uk∈D(uk)k=n,n-1,…,1
fn+1(sn+1)=0(邊界條件)
基本方程動(dòng)態(tài)規(guī)劃四大要素一個(gè)方程動(dòng)態(tài)規(guī)劃的四大要素:狀態(tài)變量及其可能集合:
sk
∈
SK
決策變量及其允許集合:uk(sk)∈Dk(sk)狀態(tài)轉(zhuǎn)移方程:sk+1=T(sk,uk)指標(biāo)函數(shù):vk
(sk,uk
)
一個(gè)方程:基本方程
fk(sk)=opt{vk(sk,uk)+fk+1(sk+1)}(遞推公式)
uk∈D(uk)k=n,n-1,…,1
fn+1(sn+1)=0
(邊界條件)
建立動(dòng)態(tài)規(guī)劃模型的步驟1、劃分階段k 按時(shí)間或空間先后順序,將過(guò)程劃分為若干相互聯(lián)系的階段。對(duì)于靜態(tài)問(wèn)題要人為地賦予“時(shí)間”概念,以便劃分階段。2、正確選擇狀態(tài)變量sk 一般地,狀態(tài)變量的選擇是從過(guò)程演變的特點(diǎn)中尋找。3、確定決策變量uk(sk)及允許決策集合Dk(sk)
建立動(dòng)態(tài)規(guī)劃模型的步驟4、確定狀態(tài)轉(zhuǎn)移方程
根據(jù)k階段狀態(tài)變量和決策變量,寫出k+1階段狀態(tài)變量,狀態(tài)轉(zhuǎn)移方程應(yīng)當(dāng)具有遞推關(guān)系。
sk+1=Tk(sk,uk
)Tk
—函數(shù)關(guān)系5、確定階段指標(biāo)函數(shù)和最優(yōu)指標(biāo)函數(shù),建立動(dòng)態(tài)規(guī)劃基本方程動(dòng)態(tài)規(guī)劃基本方程:
fk(sk
)=Opt{
Vk(sk
,uk)+fk+1(s
k+1)}
fn+1(s
n+1)=0
Opt
最優(yōu)化(max,min)建立動(dòng)態(tài)規(guī)劃模型的步驟5、確定階段指標(biāo)函數(shù)和最優(yōu)指標(biāo)函數(shù),建立動(dòng)態(tài)規(guī)劃基本方程動(dòng)態(tài)規(guī)劃基本方程:
fk(sk
)=Opt{
Vk(sk
,uk)+fk+1(s
k+1)}
fn+1(s
n+1)=0
Opt
最優(yōu)化(max,min)5、確定階段指標(biāo)函數(shù)和最優(yōu)指標(biāo)函數(shù),建立動(dòng)態(tài)規(guī)劃基本方程:
fk(sk
)=Opt{
Vk(sk
,uk)+fk+1(s
k+1)}
fn+1(s
n+1)=0
Opt
最優(yōu)化(max,min)應(yīng)用舉例——最短路問(wèn)題2511214106104131112396581052C1C3D1AB1B3B2D2EC2例5.1試求下圖中從A地到E地的最短路徑:解:1、將問(wèn)題分為4個(gè)階段,階段變量k=1,2,3,4;2、狀態(tài)變量設(shè)為sk:表示第k階段所處的位置;3、決策變量設(shè)為uk:表示第k階段選擇的路線;4、狀態(tài)轉(zhuǎn)移方程為:sk+1=uk(sk)5、指標(biāo)函數(shù)為:階段指標(biāo)函數(shù)dk(sk,sk+1):表示從k階段到k+1階段的路程。最優(yōu)值函數(shù)fk(sk):表示從sk到E的最短路程。應(yīng)用舉例應(yīng)用舉例基本方程:
fk(sk
)=min{
dk(sk
,sk+1)+fk+1(s
k+1)}
f5(s
5)=f5(E)=02511214106104131112396581052C1C3D1AB1B3B2D2EC2k=1k=2k=3k=4基本方程:
fk
(sk
)=min{
dk
(sk
,sk+1)+fk+1
(s
k+1)}
f5
(s
5)=f5
(E)
=02511214106104131112396581052C1C3D1AB1B3B2D2EC2f5(E)=0應(yīng)用舉例2511214106104131112396581052C1C3D1AB1B3B2D2EC2f4(D1)=5f5(E)=0應(yīng)用舉例2511214106104131112396581052C1C3D1AB1B3B2D2EC2f4(D2)=2f5(E)=0f4(D1)=5應(yīng)用舉例2511214106104131112396581052C1C3D1AB1B3B2D2EC2f4(D2)=2f5(E)=0f3(C1)=8f4(D1)=5應(yīng)用舉例2511214106104131112C3AB1B3B22511214106104131112396581052C1C3D1AB1B3B2D2EC2f4(D2)=2f5(E)=0f3(C2)=7f4(D1)=5f3(C1)=8應(yīng)用舉例2511214106104131112396581052C1C3D1AB1B3B2D2EC2f4(D2)=2f5(E)=0f3(C3)=12f4(D1)=5f3(C1)=8f3(C2)=7應(yīng)用舉例2511214106104131112396581052C1C3D1AB1B3B2D2EC2f4(D2)=2f5(E)=0f3(C3)=12f4(D1)=5f2(B1)=20f3(C2)=7f3(C1)=8應(yīng)用舉例2511214106104131112396581052C1C3D1AB1B3B2D2EC2f4(D2
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2024年度房屋買賣合同詳細(xì)描述房屋信息和交易流程
- 2024年技術(shù)研發(fā)與信息共享協(xié)議
- 2023年橡膠助劑項(xiàng)目評(píng)價(jià)分析報(bào)告
- 描寫兔的作文三篇
- 2024年度虛擬現(xiàn)實(shí)視覺設(shè)計(jì)合同
- 2024年新品專賣店室內(nèi)設(shè)計(jì)協(xié)議
- 2024年房產(chǎn)交易獨(dú)家代理合同
- 2024年教育機(jī)構(gòu)教室租賃合同樣本
- 2024年度某金融機(jī)構(gòu)資產(chǎn)管理合同
- 2024互聯(lián)網(wǎng)游戲運(yùn)營(yíng)與推廣合同
- 雅魯藏布江大拐彎巨型水電站規(guī)劃方案
- 廣西基本醫(yī)療保險(xiǎn)門診特殊慢性病申報(bào)表
- 城市經(jīng)濟(jì)學(xué)習(xí)題與答案
- 國(guó)開成本會(huì)計(jì)第14章綜合練習(xí)試題及答案
- 幼兒園大班科學(xué):《樹葉為什么會(huì)變黃》課件
- 1到50帶圈數(shù)字直接復(fù)制
- 鐵路工程施工組織設(shè)計(jì)(施工方案)編制分類
- 幼兒園中班數(shù)學(xué)《有趣的圖形》課件
- 《規(guī)劃每一天》教案2021
- 草莓創(chuàng)意主題實(shí)用框架模板ppt
- 山大口腔頜面外科學(xué)課件第5章 口腔種植外科-1概論、口腔種植的生物學(xué)基礎(chǔ)
評(píng)論
0/150
提交評(píng)論