運(yùn)籌學(xué)課件:空中交通系統(tǒng)動(dòng)態(tài)規(guī)劃_第1頁
運(yùn)籌學(xué)課件:空中交通系統(tǒng)動(dòng)態(tài)規(guī)劃_第2頁
運(yùn)籌學(xué)課件:空中交通系統(tǒng)動(dòng)態(tài)規(guī)劃_第3頁
運(yùn)籌學(xué)課件:空中交通系統(tǒng)動(dòng)態(tài)規(guī)劃_第4頁
運(yùn)籌學(xué)課件:空中交通系統(tǒng)動(dòng)態(tài)規(guī)劃_第5頁
已閱讀5頁,還剩94頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

空中交通系統(tǒng)優(yōu)化與管理動(dòng)態(tài)規(guī)劃什么是動(dòng)態(tài)規(guī)劃動(dòng)態(tài)規(guī)劃是解決多階段決策過程最優(yōu)化的一種方法。1951年美國數(shù)學(xué)家貝爾曼(R·Bellman)等人提出了解決這類問題的“最優(yōu)化原理”,并研究了許多實(shí)際問題。什么是動(dòng)態(tài)規(guī)劃在工程技術(shù)、企業(yè)管理、工農(nóng)業(yè)生產(chǎn)及軍事部門中都有廣泛應(yīng)用:解決最優(yōu)路徑問題、資源分配問題、生產(chǎn)調(diào)度問題、庫存問題、裝載問題、排序問題、設(shè)備更新問題、生產(chǎn)過程最優(yōu)控制問題等等。動(dòng)態(tài)規(guī)劃模型分類:離散確定型、離散隨機(jī)型、連續(xù)確定型、連續(xù)隨機(jī)型。5.1多階段決策問題的最優(yōu)化多階段決策問題,是指可將過程劃分為若干個(gè)互相聯(lián)系的階段,在它的每一個(gè)階段都需要作出決策,并且一個(gè)階段的決策確定以后,常影響下一階段的決策,從而影響整個(gè)過程的活動(dòng)。各個(gè)階段所確定的決策就構(gòu)成一個(gè)決策序列,通常稱為策略。由于每一個(gè)階段可供選擇的決策往往不只一個(gè),因而就有許多策略可供選擇。多階段的決策問題,就是要在允許選擇的那些策略中,選擇一個(gè)最優(yōu)策略,使在預(yù)定的標(biāo)準(zhǔn)下達(dá)到最好的效果。5.1多階段決策問題的最優(yōu)化5.1多階段決策問題的最優(yōu)化階段往往可以用時(shí)段來表示。在各個(gè)時(shí)間階段,采用不同的決策是隨時(shí)間而變動(dòng)的,這就有“動(dòng)態(tài)”的含義。它是在時(shí)間的推移過程中要在每一段選擇最恰當(dāng)?shù)臎Q策,以期整體上達(dá)到最優(yōu)。5.1多階段決策問題的最優(yōu)化

動(dòng)態(tài)規(guī)劃在一定條件下也可以解決一些與時(shí)間無關(guān)的問題,只要人為地引進(jìn)"時(shí)段"因素以后,這些問題就可變?yōu)橐粋€(gè)多階段決策問題。5.1多階段決策問題的最優(yōu)化

例1

生產(chǎn)與存貯問題

某工廠每月需供應(yīng)市場一定數(shù)量的產(chǎn)品,并將所余產(chǎn)品存入倉庫。一般某月適當(dāng)增加產(chǎn)量可降低生產(chǎn)成本,但超產(chǎn)部分存入倉庫會增加庫存費(fèi)用。要求確定一個(gè)逐月的生產(chǎn)計(jì)劃,在滿足需求條件下,使一年的生產(chǎn)與存貯費(fèi)用之和最小。

全年分為12個(gè)階段逐次決策。5.1多階段決策問題的最優(yōu)化例2投資決策問題某公司現(xiàn)有資金Q萬元,在今后5年內(nèi)考慮給A,B,C,D

4個(gè)項(xiàng)目投資,這些項(xiàng)目投資的回收期限、回報(bào)率均不相同,問該公司應(yīng)如何確定這些項(xiàng)目每年的投資額,使到第5年末擁有資金的本利總額最大。這是一個(gè)5階段決策問題。5.1多階段決策問題的最優(yōu)化例3設(shè)備更新問題

企業(yè)在使用設(shè)備時(shí)都要考慮設(shè)備的更新問題,因?yàn)樵O(shè)備越陳舊所需的維修費(fèi)用越多,但購買新設(shè)備則要一次性支出較大的費(fèi)用;現(xiàn)某企業(yè)要決定一臺設(shè)備未來8年的更新計(jì)劃,已預(yù)測了第j年購買設(shè)備的價(jià)格為Kj,設(shè)Gj為設(shè)備經(jīng)過j年后的殘值,Cj為設(shè)備連續(xù)使用j-1年后在第j年的維修費(fèi)(j=1,2,…,8),問應(yīng)在哪些年更新設(shè)備可使總費(fèi)用最小。這是一個(gè)8階段決策問題

例4:最短路線問題5.1多階段決策問題的最優(yōu)化圖5-35.2動(dòng)態(tài)規(guī)劃的基本概念和基本原理動(dòng)態(tài)規(guī)劃的基本概念使用動(dòng)態(tài)規(guī)劃方法解決多階段決策問題,首先要將實(shí)際問題寫成動(dòng)態(tài)規(guī)劃模型,此時(shí)要用到以下概念:階段;狀態(tài);決策和策略;(4)狀態(tài)轉(zhuǎn)移;(5)指標(biāo)函數(shù)。

例4最短路線問題5.2.1 動(dòng)態(tài)規(guī)劃的基本概念圖5—3如圖5-3所示,給定一個(gè)線路網(wǎng)絡(luò)圖,要從A地向F地鋪設(shè)一條輸油管道,各點(diǎn)間連線上的數(shù)字表示距離,問應(yīng)選擇什么路線,可使總距離最短。階段和階段變量:將所給問題的過程,按時(shí)間或空間特征分解成若干互相聯(lián)系的階段,以便按次序去求每階段的解,常用字母k表示階段變量。例4中,從A到F,

可以分成從A到B(B有兩種選擇),從B到C(C有四種選擇),從C到D(D有三種選擇),從D到E(E有兩種選擇),再從E到F,五個(gè)階段。k=1,2,3,4,5。5.2.1 動(dòng)態(tài)規(guī)劃的基本概念動(dòng)態(tài)規(guī)劃的基本概念狀態(tài)和狀態(tài)變量:狀態(tài)表示某一階段初所處的位置或狀況。通常一個(gè)階段包含若干個(gè)狀態(tài)。描述狀態(tài)的變量稱為狀態(tài)變量,常用sk表示第k階段的某一狀態(tài),狀態(tài)變量sk的集合稱為狀態(tài)集合,用Sk表示。5.2.1 動(dòng)態(tài)規(guī)劃的基本概念在例4中,第一階段狀態(tài)為A,第二階段狀態(tài):B1,B2,或s1=A, s21=B1 ,s22= B2。狀態(tài)變量的集合:S1 = {A}S2 = {B1,B2 }S3 = {C1,C2, C3,C4 }S4={D1,D2,D3}S5={E1,E2 }動(dòng)態(tài)規(guī)劃中的狀態(tài)應(yīng)具有如下性質(zhì):代表性。能夠反映過程的演變特征??芍浴D軌蛲ㄟ^某種方式,直接或間接地確定下來。無后效性。所謂無后效性,是指某階段的狀態(tài),只對該階段狀態(tài)以后過程的演變起作用,而不受以前各階段狀態(tài)的影響。這就是說,過程的過去歷史只能通過當(dāng)前的狀態(tài)去影響它的未來的發(fā)展,當(dāng)前的狀態(tài)就是未來過程的初始狀態(tài)5.2.1 動(dòng)態(tài)規(guī)劃的基本概念5.2.1 動(dòng)態(tài)規(guī)劃的基本概念要正確地定義狀態(tài)變量,就必須對問題具有深入的觀察和理解,可以從下面兩個(gè)方面來考慮:把階段連系在一起的因素是什么?需要用什么信息來進(jìn)行當(dāng)前的決策,而不用檢查以前階段所作決策的可行性。5.2.1 動(dòng)態(tài)規(guī)劃的基本概念決策和決策變量:

決策就是某階段狀態(tài)給定以后,從該狀態(tài)演變到下一階段某狀態(tài)的選擇。描述決策的變量,稱為決策變量。常用uk(sk)表示第k階段當(dāng)狀態(tài)為sk時(shí)的決策變量。在實(shí)際問題中,決策變量的取值往往限制在一定范圍內(nèi),我們稱此范圍為允許決策集合,常用Dk(sk)表示第k階段從狀態(tài)sk出發(fā)的允許決策集合,顯然有:uk(sk)

Dk(sk) 。5.2.1 動(dòng)態(tài)規(guī)劃的基本概念5.2.1 動(dòng)態(tài)規(guī)劃的基本概念在例4中,從第二階段的狀態(tài)集合為S2={B1,B2}

,從B1出發(fā),允許決策集合為:D2(B1)={C1,C2,C3}如我們決定選擇C3:,則可表為:u2(B1)=C3策略和最優(yōu)策略:由第1階段開始到最后一個(gè)階段終點(diǎn)為止的過程,稱為問題的全過程。由每階段的決策uk(sk)組成的決策序列就構(gòu)成一個(gè)全過程策略,簡稱為策略,記為P1,n:P1,n(s1)={u1(s1),u2(s2),…

,un(sn)}由過程的第k階段開始到終點(diǎn)為止的過程,稱為原過程的后部子過程(或稱為k子過程)。其決策函數(shù)序列稱為k子過程策略,簡稱子策略,記為Pk,n

即:Pk,n(sk)={uk(sk),uk+1(sk+1),…

,un(sn)}5.2.1 動(dòng)態(tài)規(guī)劃的基本概念– 允許策略集合用P表示。從允許策略集合中找出達(dá)到最優(yōu)效果的策略稱為最優(yōu)策略。在上圖中,用P1,5={A,B1,C2,D2,E1,F(xiàn)}是一個(gè)策略,P3,5={C2,D2,E1,F(xiàn)}

是P1,5的一個(gè)子策略。5.2.1 動(dòng)態(tài)規(guī)劃的基本概念狀態(tài)轉(zhuǎn)移方程動(dòng)態(tài)規(guī)劃中本階段的狀態(tài)往往是上一階段狀態(tài)和上一階段的決策結(jié)果。如果給定了第k段的狀態(tài)sk

,則第k+1段的狀態(tài)sk+1

也就完全確定。狀態(tài)轉(zhuǎn)移方程:由k段到k十l段的狀態(tài)轉(zhuǎn)移規(guī)律,sk+1

=Tk

(sk,uk)。例4中,狀態(tài)轉(zhuǎn)移方程為:sk+1

= uk(sk)5.2.1 動(dòng)態(tài)規(guī)劃的基本概念動(dòng)態(tài)規(guī)劃的基本概念指標(biāo)函數(shù)及最優(yōu)指標(biāo)函數(shù)在多階段決策過程最優(yōu)化問題中,用來衡量所實(shí)現(xiàn)過程的優(yōu)劣的數(shù)量指標(biāo),稱為指標(biāo)函數(shù);它是一個(gè)定義在全過程和所有后部子過程上的確定的數(shù)量函數(shù),常用Vk,n表示.即:Vk,n=

Vk,n(sk,sk+1,…,sn)指標(biāo)函數(shù)Vk,n的最優(yōu)值,稱為相應(yīng)的最優(yōu)指標(biāo)函數(shù),記為fk(sk)。5.2動(dòng)態(tài)規(guī)劃的基本概念和基本原理5.1.2.動(dòng)態(tài)規(guī)劃的基本原理Bellman最優(yōu)化原理作為整個(gè)過程的最優(yōu)策略具有這樣的性質(zhì):即無論過去的狀態(tài)和決策如何,對前面的決策所形成的狀態(tài)而言,余下的諸決策必須構(gòu)成最優(yōu)策略。結(jié)合例4最短路線問題介紹動(dòng)態(tài)規(guī)劃的基本思想。從過程的最后一段開始,用逆序遞推方法求解,逐步求各段各點(diǎn)到終點(diǎn)廠的最短路線,最后求得A點(diǎn)到F點(diǎn)的最短路線。5.1.2.動(dòng)態(tài)規(guī)劃的基本原理

第一步,從s=5開始,狀態(tài)變量s5可取兩種狀態(tài)E1,E2,它們到F點(diǎn)的路長分別為f5

(E1

)

4 f5

(E2

)

3第二步,k=4,狀態(tài)變量s5可取三個(gè)值D1,D2,D3,這是經(jīng)過一個(gè)中途點(diǎn)到達(dá)終點(diǎn)F的兩級決策問題,從D1到F只有兩條路線,需加以比較,取其中最短的,即:

1 2 5 2

1 1 5 1

5

3

min

7

d(D,E)

f

(E

) 3

4

d(D

,

E )

f

(E )

f4

(D1

)

min

5

2

3

6

4

min

2 2 5 2

d(D

,

E )

f(E

)

d

(D2

,

E1

)

f5

(E1

)f4(D2)

min14 1u*(D)

E2u*(D )

E4 2

53

3

1

4

min

3 2 5 2

d(D,E)

f(E

)

d

(D3,

E1

)

f5

(E1

)f4

(D3

)

minu*(D)

E4 3 1u*(C)

D3 4 3f3

(C4

)

9u*(C)

D3 3 2f3

(C3

)

8u*(C)

D3 2 2f3

(C2

)

103 1 1u*(C)

D3 1k

3時(shí),

f

(C

)

122 2 3u*(B)

Cf2

(B2

)

152u*(B)

C2 1k

2時(shí),

f2

(B1

)

132 11d

(

A,

B

)

f (B

)1

5

15

4

13

min

17

2 2 2

d

(

A,

B

)

f (B

)

k

1時(shí),

f

(

A)

min最短路為17,路徑為A

B1

C2

D2

E2

Fu*(A)

B1 1圖7-2

f6

(s6

)

0)

f (s )} k

5,4,3,2,1k

1 k

1(sk,

ukkfk(sk)

min{duk動(dòng)態(tài)規(guī)劃方法的基本思想:將多階段決策過程劃分階段,恰當(dāng)?shù)剡x取狀態(tài)變量、決策變量及定義最優(yōu)指標(biāo)函數(shù),從而把問題化成一族同類型的子問題,然后逐個(gè)求解。求解時(shí)從邊界條件開始,逆(或順)過程行進(jìn)方向,逐段遞推尋優(yōu)。在每一個(gè)子問題求解時(shí),都要使用它前面已求出的子問題的最優(yōu)結(jié)果,最后一個(gè)子問題的最優(yōu)解,就是整個(gè)問題的最優(yōu)解。動(dòng)態(tài)規(guī)劃方法是既把當(dāng)前一段與未來各段分開,又把當(dāng)前效益和未來效益結(jié)合起來考慮的一種最優(yōu)化方法,因此每段的最優(yōu)決策選取是從全局考慮的,與該段的最優(yōu)選擇一般是不同的。5.1.2.動(dòng)態(tài)規(guī)劃的基本原理Bellman最優(yōu)化原理:作為整個(gè)過程的最優(yōu)策略具有這樣的性質(zhì):即無論過去的狀態(tài)和決策如何,對前面的決策所形成的狀態(tài)而言,余下的諸決策必須構(gòu)成最優(yōu)策略。

n

1

n

1(s )

0

f

動(dòng)態(tài)規(guī)劃的基本方程是遞推逐段求解的根據(jù),一般的動(dòng)態(tài)規(guī)劃基本方程可以表為:

fk(sk

)

opt {vk(sk,

uk)

fk

1(sk

1

)}

uk

Dk(

sk)

k

n,

n

1,...,15.1.2.動(dòng)態(tài)規(guī)劃的基本原理動(dòng)態(tài)規(guī)劃的基本解題步驟如下:第一步:劃分階段;第二步:確定狀態(tài)變量及其取值范圍;代表性。2)可知性。3)無后效性。第三步:確定決策變量及其取值范圍;第四步:建立狀態(tài)轉(zhuǎn)移方程;第五步:確定指標(biāo)函數(shù)第六步:建立動(dòng)態(tài)規(guī)劃基本方程,然后從k=n開始,逐段向前推移,直到求出f1(s1)時(shí),就得到了整個(gè)過程的最優(yōu)解,包括最優(yōu)策略和相應(yīng)的最優(yōu)指標(biāo)函數(shù)值5.1.2.動(dòng)態(tài)規(guī)劃的基本原理動(dòng)態(tài)規(guī)劃模型的建立與求解動(dòng)態(tài)規(guī)劃模型的建立

資源分配問題例5 某公司有資金10萬元,若投資于項(xiàng)目j(j=1,2,3)的投資額為xi時(shí),其收益分別為g1(x1)3=4x1,g2(x2)=9x2,g3(x3)=2x

2,問應(yīng)如何分配投資數(shù)額才能使總收益最大?

x

0 (i

1,2,3)

i

x1

x2

x3

103maxz

4x1

9x2

2x2且滿足約束這是一個(gè)與時(shí)間無明顯關(guān)系的靜態(tài)最優(yōu)化問題,可列出其靜態(tài)模型: 求x1,x2,x2:,使5.3.1動(dòng)態(tài)規(guī)劃模型的建立

用動(dòng)態(tài)規(guī)劃方法求解:基本方程:3階段k:k=1,2,3狀態(tài)變量sk

:第k段可以投資于第k項(xiàng)到第3個(gè)項(xiàng)目的資金數(shù)。決策變量xk

:決定給第k個(gè)項(xiàng)目投資的資金數(shù)。狀態(tài)轉(zhuǎn)移方程:

sk+1=

sk

-

xk

。指標(biāo)函數(shù):Vk

,3

gi

(

xi

)i

k最優(yōu)指標(biāo)函數(shù)人fk(sk):當(dāng)可投資金數(shù)為sk時(shí),投資第k——3項(xiàng)所得的最大收益數(shù)k k k k k

1 k

10

xk

skf (

s )

max

{g (

x )

f (

s )} k

3,

2,1

f4(

s4)

05.3.1動(dòng)態(tài)規(guī)劃模型的建立收益船廠012345A035789B046899C0137910例6 船舶總公司擬將5萬元資金投放到下屬A、B、C三個(gè)船廠,各船廠在獲得資金后的收益如表5-1所示。試用動(dòng)態(tài)規(guī)劃方法求使總收益最大的投資分配方案。表5-15.3.1動(dòng)態(tài)規(guī)劃模型的建立解:階段k:k=1,2,3狀態(tài)變量sk

:第k段可以投資于第k項(xiàng)到第3個(gè)項(xiàng)目的資金數(shù)。

S1

{5}

{0

,1,

2

,

3,

4,

5} k

2,

3

S

k決策變量xk

:為第k階段分配給第k個(gè)船廠的資金數(shù)。顯然:Dk(sk)

{0,1,2,3,

4,

5} k

1,

2

,

3– 狀態(tài)轉(zhuǎn)移方程:sk

1k

1,2,

3

sk

xk5.3.1動(dòng)態(tài)規(guī)劃模型的建立xk

Dk(sk

)–指標(biāo)函數(shù):階段指標(biāo)函數(shù)gk(sk)如表5-1所示–最優(yōu)指標(biāo)函數(shù)人fk(sk):當(dāng)可投資金數(shù)為sk時(shí),投資第

k——3項(xiàng)所得的最大收益數(shù)–基本方程:

fk(sk

)

m

ax {gk(xk

)

f

k

1

(

s

k

1

)}4 4k

3,

2

,

1

f (

s )

0

用逆序法由最后一階段向前推進(jìn)計(jì)算。5.3.1動(dòng)態(tài)規(guī)劃模型的建立x3f3

(s3

)

max{g3

(x3

)

f4

(s4

)}K=3時(shí):階段s3g3

(x3)f3

(s3

)f4(s4

)x3

*k=300000111012330237703499045101005階段s2x2g2(x2

)f

2

(

x2

)f3(s2

x2

)x2

*k=20000001000+1=1f3(1)=1144+0=4f3(0)=012000+3=3f3(2)=3144f3(1)=1266f3(0)=023007f3(3)=7147f3(2)=3267f3(1)=1388f3(0)=034009f3(4)=91411f3(3)=71269f3(2)=3389f3(1)=1499f3(0)=050010f3(5)=101413f3(4)=

912613f3(3)=723811f3(2)=34910f3(1)=1599f3(0)=0階段s1x1g1

(x1

)f2

(5

s1

)x1

*k=1500131313141112513837136481245990f1

(5)

14(萬元)最優(yōu)策略(對船廠A、B、C的資金分配序列)是:分給船廠A 1萬元,分給船廠B 1萬元,分給船廠C3萬元最大收益是14萬元。由上述計(jì)算結(jié)果可知:最大收益是:

例4的順序解法:5.3.2.

逆序法與順序法

從k=0開始,f0

(s1

)

f0

(

A)

0

k=2時(shí),f2

(s3

) 定義有:

f2

(C1

)

d

(B1

,

C1

)

f1

(B1

)

2

4

6

u (C)

B

2 1 1是邊界條件

k=1時(shí),f1

(s2

) 定義有:

f1(B1)

4

f1

(B2

)

5

u1(B1)

A

u1(B2)

Ad

(B1

,

C2

)

f1

(B1

)f2(C2)

min3

4

min

7

d(B

,

C )

f(B

)

2 2 1 2

8

5

u (C )

B

2 2 1

d

(B1

,C3

)

f1

(B1

)2 36

4f (C)

min

min

10

d(B,C)

f(B

)

2 3 1 2

7

5

u(C)

B

2 3 1

f2

(C4

)

d

(B2

,

C4

)

f1

(B2

)

7

5

12

u2(C4)

B2類似有:

f3

(D1

)

11f3

(D2

)

12f3

(D3

)

14f4

(E1

)

14f4

(E2

)

14f5

(F

)

17u3

(D1

)

C1或C2u3

(D2

)

C2u3(D3)

C3u4(E1)

D1u4(E2)

D2u5(F

)

E2路徑為:

A

B1

C2

D2

E2

F動(dòng)態(tài)規(guī)劃模型的求解:1)離散變量的分段窮舉算法動(dòng)態(tài)規(guī)劃模型中的狀態(tài)變量與決策變量若被限定只能取離散值,則可采用分段窮舉法。用分段窮舉法求最優(yōu)指標(biāo)函數(shù)值時(shí),要正確確定每段狀態(tài)變量取值范圍及允許決策集合的范圍。連續(xù)變量的解法當(dāng)動(dòng)態(tài)規(guī)劃模型中狀態(tài)變量與決策變量為連續(xù)變量,就要根據(jù)方程的具體情況靈活選取求解方法,如經(jīng)典解析方法、線性規(guī)劃方法、非線性規(guī)劃法或其它數(shù)值計(jì)算方法等??捎媚嫘蚪夥ê晚樞蚪夥▉砬蠼?。連續(xù)變量的離散化解法5.3.2.

逆序法與順序法

k

3,2,10

xk

sk例5

某公司有資金10萬元,若投資于項(xiàng)目j(j=1,2,3)的投資額為xi時(shí),其收益分別為g1(x1)=4x1,g2(x2)=9x2,g3(x3)=2x32,問應(yīng)如何分配投資數(shù)額才能使總收益最大?解:階段k=1,2,3;狀態(tài)變量sk

為第k段可以投資于第k項(xiàng)到第3個(gè)項(xiàng)目的資金數(shù);決策變量xk

決定給第k個(gè)項(xiàng)目投資的資金數(shù);狀態(tài)轉(zhuǎn)移方程:

sk+1

sk

-

xk

;最優(yōu)指標(biāo)函數(shù)fk(sk)表示當(dāng)可投資金數(shù)為sk時(shí),投資第k到第3項(xiàng)所得的最大收益數(shù);f1(s1)

為所求的總收益;遞推方程:

fk(

sk)

max{gk(xk

)

f

k

1

(

sk

1

)}4 4

f (

s )

0(a)用逆序解法解例5 3 3 33 30

x

sk=3時(shí),f (s

)

max

{2x2}k=2時(shí),

2(s

x )2}2 222 3

2s2}

max

{9x

max

{9x0

x2

s20

x2

s222 2f (s )

max

{9x

f3

(s3)}0

x2

s222

x

)2

9

4(s2

x2

)

0令 h2

(s2

,

x2

)

9x2

2(sdh22

2

4

0 x2

s2

29 d

2

h4 d

2xx2

s2

2則極大值在[0,

s ]端點(diǎn)取得f (0)

2s2

,

f (s )

9s2 2 2 2 294dx是極小值x*

s

時(shí),

有最大值2s23 3 32 22 2 22 22 2 222當(dāng)s

9

時(shí),

f (0)

f (s ),

此時(shí)x*

02s

9

時(shí),

f (0)

f (s ),

此時(shí)x*

sk=1時(shí),f1(s1)

max{4

x1

f2

(

s2)} 當(dāng)f2

(

s2

)

9s2時(shí),但此時(shí)

s2

s1

x1

10

0

9

/

2,

與s2

9

/

2矛盾故舍去0

x

s11f1

(10)

max{4x1

9s1

9x1

)}

max{9s1

5x1

)}

9s1x*

00

x1

10 0

x1

102令f (0)

f (s

)時(shí),2s2

9s

, 則s

92 2 2 2 2 22 2 2 11 1 10

x1

10當(dāng)f (s )

2s

2時(shí),

f

(10)

max

{4

x

2(s

x )2

}211 1 1 1 1 1

4

4(s1

x1)

01d

2hdx2解得x1

s1

1,

1

1

0,

所以x1

s1

1是極小點(diǎn).1比較[0,10]兩個(gè)端點(diǎn),

x1

0時(shí),

f1

(10)

200x

10時(shí),

f

(10)

40

,

所以,

x*

01 1 1再由狀態(tài)方程順推,

s

s

x*

10

0

102 1 1因?yàn)閟

9

/

2,

所以x*

0,

s

s

x*

10

0

102 2 3 2 2所以 x*

s

103 3max

z

200萬元令h

(s

,

x )

4

x

2(s

x ) ,由dhdx階段劃分和決策變量設(shè)置同逆序法;

狀態(tài)變量sk+1

表示可用于第1個(gè)到第k個(gè)項(xiàng)目投資的資金數(shù):s4=10,s3=s4–x3,s2=s3–x2,s1=s2–x1

;狀態(tài)轉(zhuǎn)移方程:

sk=

sk+1

-

xk

;最優(yōu)指標(biāo)函數(shù)fk(sk+1)表示第k階段投資金數(shù)為sk+1時(shí),投資第1到第k項(xiàng)所得的最大收益數(shù);

遞推方程:

f

k

(

sk

1

)

k

1,2,3max {gk(xk

)

f

k

1

(

sk

)}0

xk

sk

10 1

f (s)

0 (b)用順序解法解例5 1 20

x1

s2當(dāng)k

1,

f1(s2

)

max{g1(

x1)

f0

(s1

)}1 2

max

{4x

}

4s0

x

s

max

{5x2

4s3

}

9s30

x2

s3

4(s3

x2

)}

max{9x2

4s2

}

max

{9x20

x2

s3 0

x2

s30

x2

s3當(dāng)k

2,

f2

(s3

)

max

{9x2

f1(s2

)}x*

s1 2x*

s2 33

x )}4

9(s2 3 33 4 3f (

s )

max

{2

x

2

f (

s )}

max

{2

x

20

x3

s4 0

x3

s4當(dāng)k=3時(shí)93所以x*

103dx2則極大值在[0,

s4

]端點(diǎn)取得當(dāng)x3

0時(shí),

f3

(10)

90,當(dāng)x3

10時(shí)f3

(10)

200d2h

4

0 則x3

4

是極小點(diǎn)3解得x

9

/

4333令 h(s,x)

2x2

9(s

x

)4 3 3 4dx由 dh

4

x

9

0再由狀態(tài)方程逆推,

s

10

x*

03 3x*

0,

s

s

x*

0, x*

02 2 3 2 1同逆序法結(jié)果相同max

z

200萬元xksk

1

skk kk k k

1 k

10

xk

skf (

s )

max

{g (

x )

f (

s )} k

n,n

1,...,1

f

n

1

(

sn

1

)

0狀態(tài)轉(zhuǎn)移方程 :

(i

1,2,...,

n)

xi

0n

i

1

xi

an3)連續(xù)變量的離散化解法投資分配問題的一般靜態(tài)模型為:max

z

gi

(

xi

)i

1動(dòng)態(tài)規(guī)劃模型,其基本方程為:5.3.2.

逆序法與順序法由于sk與xk都是連續(xù)變量,當(dāng)各階段指標(biāo)gk(xk)沒有特殊性質(zhì)而較為復(fù)雜時(shí),要求出fk(sk)會比較困難,這時(shí)常常把連續(xù)變量離散化求其數(shù)值解。具體做法如下:把a(bǔ)分成m份,每份

大小。Sk的取值范圍為:{0

,2

,…,m

}

,

的大小可依據(jù)問題所要求的精度以及計(jì)算機(jī)的容量來定。決策變量xk也在離散點(diǎn)0,

,2

, … ,m

上取值,相應(yīng)的指標(biāo)函數(shù)fk(sk)就被定義在這些離散值上,于是:02

1

q

a(m

)… …012qmq

=sk,

xk=p

5.3.2.

逆序法與順序法(c)按逆序(或順序)方法,逐步遞推求出fn(sn),

…,f1(s1) ,最后求出最優(yōu)資金分配方案。

x

0 (i

1,2,3)

i

x1

x2

x3

10maxz

4x

9x

2x2 且滿足約束1 2 3解: 令

=2,將區(qū)間[0,l0]分割成0,2,4,6,8,10六個(gè)點(diǎn),即狀態(tài)變量sk集合為{0,2,4,6,8,10};允許決策集合為0

xk

sk

,xk與sk均在分割點(diǎn)上取值。例5

k

n,n

1,...,1p

0

,1,

2

,...,

q

f

n

1

(

sn

1

)

0

fk(

sk)

max {gk(

p

)

f

k

1

(

sk

p

)}其中q

sk

,

xk

=p

遞推方程就變?yōu)榱耍菏街衳3與s3的集合均為:{0,2,4,6, 8,10}。計(jì)算結(jié)果見表7—1。3 3 30

x3

s3當(dāng)k=3時(shí),

f (s

)

max

{2x2}

表7-1階段skxkvkvkn=vk+fk+1fkPkn

*30022x3

=0000228882443232324667272726881281281288101020020020010指標(biāo) 最優(yōu)指標(biāo)

最優(yōu)決策

表7-2階段skxkvkvkn=vk+fk+1fkPkn

*2009x2=000020002-022x9=1818+0184000+32=324-022x9=1818+8=2644x9=3636+0=36366000+72=72720-622x9=1818+32=5044x9=3636+8=4465454+0=54810指標(biāo)計(jì)算結(jié)果見表7

2最優(yōu)指標(biāo)

最優(yōu)決策k

2時(shí),

f2

(s2

)

max{9x2

f3(s2

x2

)}0

x2

s2階段skxkvkvkn=vk+fk+1fkPkn

*28000+128=1281280-822x9=1818+72=9044x9=3636+32=6865454+8=6287272+0=7210000+200=2002000-1022x9=1818+1282=14644x9=3636+72=10865454+32=8687272+8=80109090+0=90

表7-2指標(biāo)計(jì)算結(jié)果見表7

2最優(yōu)指標(biāo)

最優(yōu)決策k

2時(shí),

f2

(s2

)

max{9x2

f3(s2

x2

)}0

x2

s2

表7-3階段skxkvkvkn=vk+fk+1fkPkn

*11004x1=00+200=2002000-0-10288+128=13644x4=1624+36=6062454+32=8683232+18=50104040+0=40最優(yōu)指標(biāo)

最優(yōu)決策x1

)} 計(jì)算結(jié)果見表7

3指標(biāo)k

1時(shí),

f1

(s1

)

max{4x1

f2

(s10

x1

10計(jì)算結(jié)果表明,最優(yōu)決策為:x1*=0,x2*=0,x3*=10,最大收益為f1(10)=200,與例5結(jié)論完全相同。5.4動(dòng)態(tài)規(guī)劃模型的應(yīng)用5.4.1背包問題(裝載問題)n一位旅行者攜帶背包去登山,已知他所能承受的背包重量限度為a千克,現(xiàn)有n種物品可供他選擇裝入背包,第i種物品的單件重量為ai千克,其價(jià)值(可以是表明本物品對登山的重要性的數(shù)量指標(biāo))是攜帶件數(shù)xi的函數(shù)ci(xi)

(i=1,2,...,n),問旅行者應(yīng)如何選擇攜帶各種物品的件數(shù),以使總價(jià)值最大?靜態(tài)數(shù)學(xué)模型:

max

z

ci

(xi

)i

1ns.t.i ia

x

a

i

1

i

x

0 且為整數(shù)(i

1,

2,...,

n)5.4動(dòng)態(tài)規(guī)劃模型的應(yīng)用

sk

1狀態(tài)轉(zhuǎn)移方程:sk

ak

xk0 1k

1,2,...,

n

f (s)

0xk允許決策集合:Dk

(

sk

1

)

{xk

|

0,1,

2,...,[

sk

1

/

ak

]}–最優(yōu)指標(biāo)函數(shù):

fk

(

sk

+1

)–基本方程:

fk

(

sk

1

)

max{ck

(

xk

)

f

k

1

(

sk

1

ak

xk

)}

動(dòng)態(tài)規(guī)劃順序法:–階段k:(k=1,2,…,n)

按裝入物品排序–狀態(tài)變量sk

:第k段開始時(shí)裝入前k種物品的總重量。–決策變量xk

:裝入第k件物品的件數(shù)。5.4動(dòng)態(tài)規(guī)劃模型的應(yīng)用狀態(tài)轉(zhuǎn)移方程:

sk

1

skak

xkn

1 n

1k

n,...,

2,1xk允許決策集合:Dk(xk)

{0,1,2,...,[sk

/ak]}–最優(yōu)指標(biāo)函數(shù):

fk

(

sk

)–基本方程:

fk

(

sk

)

max{ck

(

xk

)

f

k

1

(

sk

1

)}

f(

s )

0

動(dòng)態(tài)規(guī)劃逆序法:–階段k:(k=1,2,…,n)

按裝入物品排序–狀態(tài)變量sk

:第k段開始時(shí)剩余的空間。–決策變量xk

:裝入第k件物品的件數(shù)。5.4動(dòng)態(tài)規(guī)劃模型的應(yīng)用例7

今有三種貨物需要裝船,各種貨物的重量與運(yùn)輸利潤關(guān)系如圖5-7所示。船的最大裝載能力為w=6(t),問應(yīng)如何裝載才能使總利潤最大?貨物種類(i)貨物質(zhì)量(Wi)(t)利潤(vi)(千元)12823133418動(dòng)態(tài)規(guī)劃逆序法:階段k:(k=1,2,3)

按裝入物品排序狀態(tài)變量sk

:第k段開始時(shí)剩余的空間(可裝載第k種至第n種的載貨量。決策變量xk

:裝入第k件貨物的數(shù)量。5.4動(dòng)態(tài)規(guī)劃模型的應(yīng)用狀態(tài)轉(zhuǎn)移方程: sk

1

skwk

xk

指標(biāo)函數(shù):階段指標(biāo)即為第k階段裝載xk件貨物時(shí)所創(chuàng)的利潤vkxk。– 基本方程:xk

Dk(sk

)sk

{0

,1,...,6}

fk(sk

)

max {vk

xk

f

k

1

(

sk

1

)}

xk

Dk(sk

)sk

{0

,1,...,6}

max {vk

xk

fk

1(sk

wkxk)}k

3,

2,1

f (

s )

0

4 4

5.4動(dòng)態(tài)規(guī)劃模型的應(yīng)用K=3時(shí):s3s4=s3-4x3K=2時(shí):K=1時(shí):5.4.2

生產(chǎn)存貯問題(庫存問題)

如果已知某企業(yè)所生產(chǎn)產(chǎn)品的生產(chǎn)費(fèi)用、存貯費(fèi)用和市場的需要量,在其生產(chǎn)能力和存貯能力許可的前提下,正確確定各個(gè)時(shí)期的生產(chǎn)量,使既完成交貨計(jì)劃,又使總支出最少,這就是生產(chǎn)與存貯問題。例8

某船廠根據(jù)合同,從當(dāng)年起連續(xù)4年年末要為客戶提供規(guī)格型號相同的大型客貨船,每年的交船數(shù)及生產(chǎn)每艘船的生產(chǎn)費(fèi)用如表5—5所示。5.4動(dòng)態(tài)規(guī)劃模型的應(yīng)用5.4動(dòng)態(tài)規(guī)劃模型的應(yīng)用4i

k0

sk

di該廠的生產(chǎn)能力為每年6艘船。在進(jìn)行生產(chǎn)的年度,船廠還要支出經(jīng)常費(fèi)用60萬元。若造出的船當(dāng)年不交貨,則每艘船每積壓一年造成的積壓損失費(fèi)為40萬元。假定開始時(shí)及第四年年未交貸后均無積壓船只,問船廠應(yīng)如何安排這四年的生產(chǎn)計(jì)劃,使所花的總費(fèi)用為最低?解:動(dòng)態(tài)規(guī)劃逆序法:階段k:(k=1,2,3,4)狀態(tài)變量sk

:第k階段初貯存(積壓)的船數(shù)。–決策變量xk

:為第k階段生產(chǎn)的船數(shù)。sk

6

d

k s1

s5

0xk

sk

d

k

最大庫存量4xk

sk

dii

kxk

sk

d

kksk

6(k

1)

dii

15.4動(dòng)態(tài)規(guī)劃模型的應(yīng)用狀態(tài)轉(zhuǎn)移方程:sk

1

sk

xk

dk k

1,2,3,

4– 基本方程:k

1 k

1)

f (

s )} k

1,2,3,

4k kk kk0

xk

6f (

s )

min

{v (

s ,

x

f5(s5)

0– 指標(biāo)函數(shù)vk

:就是第k年度的生產(chǎn)成本(包括生產(chǎn)費(fèi)用與存貯費(fèi)用兩部分)。

0.6

ckxk

0.4

sk 若xk

0vk(sk,xk)

k

1,2,3,

4k k

0.4

s 若x

0k=2時(shí),d2=3k=1時(shí),x1*=1,x2*=5,x3*=0,x4*=25.4.3

設(shè)備更新問題

設(shè)備更新問題一般提法:在已知一臺設(shè)備的效益函數(shù)r(t),維修費(fèi)用函數(shù)u(t)及更新費(fèi)用函數(shù)c(t)條件下,要求在n年內(nèi)的每年年初作出決策,

是繼續(xù)使用舊設(shè)備還是更換一臺新的,使n年總效益最大。rk(t):在第k年設(shè)備已使用過t年(或稱役齡為t年),再使用1年時(shí)的效益。uk(t):在第k年設(shè)備役齡為t年,再使用一年的維修費(fèi)用。ck(t):在第k年賣掉一臺役齡為t年的設(shè)備,買進(jìn)一臺新設(shè)備的更新凈費(fèi)用。a為折扣因子(0

a

1),表示一年以后的單位收入價(jià)值相當(dāng)于現(xiàn)年的a單位。5.4動(dòng)態(tài)規(guī)劃模型的應(yīng)用動(dòng)態(tài)規(guī)劃模型:階段k:表示計(jì)劃使用該設(shè)備的年限數(shù)。(k=1,…,n)狀態(tài)變量sk

:第k年初設(shè)備已使用過的年數(shù),即役齡。決策變量xk

:是第k年初更新(Replacement),還是保留使用(keep)舊設(shè)備,分別用R與K表示。狀態(tài)轉(zhuǎn)移方程為:5.4動(dòng)態(tài)規(guī)劃模型的應(yīng)用–階段指標(biāo)為:k

1ks

s

1 當(dāng)xk

K(keep

)

1 當(dāng)xk

R

(

Replacement

)v (s ,

x )

rk(sk)

uk(sk

)若xk

Kj k kk k kk

k

r(0)

u (0)

c (s ) 若x

R5.4動(dòng)態(tài)規(guī)劃模型的應(yīng)用–指標(biāo)函數(shù)為:k kj kf (

s )

max

{v (

skk

1 k

1,

x )

f (

s )} k

n,n

1,

...,1

xk

K

或R

fn

1

(

sn

1

)

0實(shí)際上:–最優(yōu)指標(biāo)函數(shù)為:Vk

,n(k

1,2,...,

n)nj

k

vj(sk,

xk)k k k

1

kr (

s )

uk(

sk)

f(

s

1)fk(sk)

max當(dāng)xk

Kkk kk

1

r (0)

u (0)

c (

s )

f

kk(1) 當(dāng)x

R

f(

s )

0

n

1 n

1例:設(shè)某臺新設(shè)備的年效益及年均維修費(fèi)用、更新凈費(fèi)用如下表,試確定今后五年內(nèi)的更新策略,使總效益最大。(設(shè)a=1)(單位:萬元)役齡項(xiàng)目012345效益

rk(t)54.543.7532.5運(yùn)行費(fèi)

uk(t)0.511.522.53更新費(fèi)

ck(t)0.51.52.22.533.55.4動(dòng)態(tài)規(guī)劃模型的應(yīng)用解:n=55 5 5 55 5r(s)

u(s

)

k

5 f(s)

max

x5

Kx5

R

r5

(0)

u5

(0)

c5

(s5

)狀態(tài)變量s5可取1,2,3,4f (1)

max

r5

(1)

u

5

(1) x5

K逆序法55 5 55

r(0)

u (0)

c (1) x

R

5

max

4.5

1

3.5x (1)

K

5

0.5

1.5

f (2)

max

r5

(2)

u5

(2)x5

K55 555

r(0)

u (0)

c

(2) x

R

5

max

4

1.5

2.5x(2)

K

5

0.5

2.2

f (3)

max

r5(3)

u5

(3) x5

K55 5 55

r(0)

u (0)

c (3) x

R

5

max

3.75

2

2 x (3)

R

5

0.5

2.5

f(4)

max

r5(4)

u5

(4)x5

K55 555

r(0)

u(0)

c

(4) x

R

5

max

3

2.5

1.5x(4)

R

5

0.5

3

5 5 5 5x5

Kx5

R5 5r(s)

u(s

)

k

5 f(s)

max

r5

(0)

u5

(0)

c5

(s5

)r4

(s4

)

u4

(s4

)

f5

(s4

1)x4

K4 44 4 4 54k

4 f (s )

max

r(0)

u (0)

c

(s )

f (1) x

R

4

狀態(tài)變量s4可取1,2,35 4x4

Kx4

R4r4

(

s4

)

u

4

(

s4

)

f (

s

1)4

max

4.5

1

2.5

6.5x (1)

R

5

0.5

1.5

3.5

f (1)

maxs4

1

r4

(0)

u

4

(0)

c4(

s4

)

f5

(1)

x4

Kx4

R4r4(s4)

u4(s4)

f5(s4

1)4

max

4

1.5

2

5.8x (2)

R

5

0.5

2.2

3.5

f (2)

maxs4

2

r4(0)

u4

(0)

c4

(s4

)

f5

(1)

r4

(s4

)

u4

(s4

)

f5

(s4

1)x4

K4 44 4 4 54k

4f (s )

max

r(0)

u (0)

c

(s )

f (1) x

R

4

r4(s4)

u4(s4)

f5(s4

1)x4

Kx4

R4s4

34f (3)

max

max

3.75

2

1.5

5.5x(3)

R

5

0.5

2.5

3.5

r4

(0)

u4

(0)

c4

(s4

)

f5

(1)

3 3 3 3 4 3x3

Kx3

R3 3r(s)

u(s)

f(s

1)k

3 f(s)

max

r3

(0)

u3

(0)

c3

(s3

)

f4

(1)此時(shí)s3可取1或24 3r3

(

s3

)

u3

(

s3

)

f (s

1)x3

Kx3

R3s3

13f (1)

max

max

4.5

1

5.8

9.5x (1)

R

5

0.5

1.5

6.5

r3

(0)

u3

(0)

c3

(

s3

)

f

4(1)

4 3r3

(

s3

)

u3

(

s3)

f (

s

1)x3

Kx3

R3s3

23f (2)

max

max

4

1.5

5.5

8.8x (2)

R

5

0.5

2.2

6.5

r3

(0)

u3

(0)

c3

(

s3

)

f

4(1)

r2

(

s2

)

u

2

(

s2

)

f

3

(

s2

1)x2

K

x2

R2s2

12f (1)

max

max

4.5

1

8.8

12.5x (1)

R

5

0.5

1.5

9.5

r2

(0)

u

2

(0)

c2(

s2)

f3

(1)

f (s

)

max

r2

(s2

)

u2

(s2

)

f3

(s2

1)x2

K2 22 2 2 32k

2

r(0)

u (0)

c(s)

f (1) x

R

2由于狀態(tài)s2只能取1,所以有f(s)

max

r1(s1)

u1(s1

)

f2(s1

1)x1

K1 11 1 1 21k

1

r(0)

u(0)

c(s

)

f

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論