變分法及其在最優(yōu)控制中的應(yīng)用_第1頁(yè)
變分法及其在最優(yōu)控制中的應(yīng)用_第2頁(yè)
變分法及其在最優(yōu)控制中的應(yīng)用_第3頁(yè)
變分法及其在最優(yōu)控制中的應(yīng)用_第4頁(yè)
變分法及其在最優(yōu)控制中的應(yīng)用_第5頁(yè)
已閱讀5頁(yè),還剩89頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

變分法及其在最優(yōu)控制中的應(yīng)用第1頁(yè),共94頁(yè),2023年,2月20日,星期三主要內(nèi)容§1.1泛函的變分§1.2歐拉方程§1.3橫截條件§1.4泛函局部極值的充分條件§1.5等式約束條件下的變分問(wèn)題§1.6利用變分法求解最優(yōu)控制問(wèn)題課外習(xí)題返回目錄第2頁(yè),共94頁(yè),2023年,2月20日,星期三§1.1泛函的變分一、泛函的定義如果變量J對(duì)于某一函數(shù)類中的每一個(gè)函數(shù)x(t),都有一個(gè)與之對(duì)應(yīng),那么就稱變量J為依賴于函數(shù)x(t)的泛函,記為:J=J[x(t)]。確定的值說(shuō)明:由于函數(shù)的值是由自變量的選取而確定的,而泛函的值是由自變量的函數(shù)的選取而確定的,所以將泛函理解為“函數(shù)的函數(shù)”。例1.1.1函數(shù)的定積分是泛函。因?yàn)樽兞縅的值是由函數(shù)的選取而確定的。第3頁(yè),共94頁(yè),2023年,2月20日,星期三例1.1.2在平面上連接給定兩點(diǎn)A(ta,xa)和B(tb,xb)的曲線的弧長(zhǎng)J是一個(gè)泛函,如圖1-1所示。當(dāng)曲線方程x=x(t)(滿足x(ta)=xa,x(tb)=xb)給定后,可算出它在A、B兩點(diǎn)間的弧長(zhǎng)為:例1.1.3函數(shù)的不定積分不是泛函。泛函的上述概念,可以推廣到含有幾個(gè)函數(shù)的泛函的情況,例如:第4頁(yè),共94頁(yè),2023年,2月20日,星期三從例1.1.2可以知道,連接A、B兩點(diǎn)的曲線之弧長(zhǎng)的泛函,其被積函數(shù)是未知函數(shù)導(dǎo)數(shù)的函數(shù)。在一般情況下,被積函數(shù)是自變量t,未知函數(shù)x(t)及其導(dǎo)數(shù)的函數(shù)。所以最簡(jiǎn)單的一類泛函可表示為:

求函數(shù)的極值時(shí),微分或?qū)?shù)起著重要的作用。求泛函的極值時(shí),變分起著類似的作用。我們將求泛函的極值問(wèn)題稱為變分問(wèn)題,其相應(yīng)的方法稱為變分法。(1.1.1)如圖1-2所示。二、泛函宗量的變分泛函J[x(t)]的宗量是函數(shù)x(t),其變分是指在同一函數(shù)類中的兩個(gè)函數(shù)間的差:第5頁(yè),共94頁(yè),2023年,2月20日,星期三三、泛函的連續(xù)性函數(shù)相近當(dāng)函數(shù)x(t)與x0(t)之差的絕對(duì)值,即∣x(t)-x0(t)∣,t1t

t2(1.1.2)

對(duì)于x(t)的定義域中的一切t(t1

t

t2

)都很小時(shí),稱函數(shù)x(t)與函數(shù)x0(t)是相近的,也稱為零階相近。如圖1-3所示。第6頁(yè),共94頁(yè),2023年,2月20日,星期三一階相近當(dāng)函數(shù)x(t)與x0(t)之差的絕對(duì)值以及它們的一階導(dǎo)數(shù)和之差的絕對(duì)值,即

t1

tt2(1.1.3)

都很小,稱函數(shù)x(t)與函數(shù)x0(t)是一階相近的,如圖1-4所示。注意:一階相近的兩個(gè)函數(shù),必然是零階相近,反之不成立。第7頁(yè),共94頁(yè),2023年,2月20日,星期三k階接近當(dāng)t1

t

t2(1.1.4)都很小時(shí),稱函數(shù)x(t)與函數(shù)x0(t)是k階相近的。函數(shù)間距離

在不同的函數(shù)空間,函數(shù)間的距離定義也不同。在函數(shù)空間C[a,b](在區(qū)間[a,b]上連續(xù)的函數(shù)的全體構(gòu)成的函數(shù)空間)中,通常采用下式定義距離:

(1.1.5)在函數(shù)空間Ck[a,b](在區(qū)間[a,b]上連續(xù)且具有連續(xù)的k階導(dǎo)數(shù)的函數(shù)的全體構(gòu)成的函數(shù)空間)中,任意兩個(gè)函數(shù)間的距離定義為:

(1.1.6)顯然,式(1.1.5)定量地表示兩個(gè)函數(shù)之間的零階相近度,而式(1.1.6)定量地表示兩個(gè)函數(shù)之間的k階相近度。第8頁(yè),共94頁(yè),2023年,2月20日,星期三泛函的連續(xù)性如果對(duì)于任意給定的正數(shù),可以找到這樣一個(gè)>0,當(dāng)

d[x(t),x0(t)]<(1.1.7)時(shí),存在∣J[x(t)]-J[x0(t)]<(1.1.8)

那么,就說(shuō)泛函J在點(diǎn)x0(t)處是連續(xù)的。根據(jù)所采用的函數(shù)之間距離定義的不同,是按式(1.1.5)還是式(1.1.6),其對(duì)應(yīng)的泛函分別稱為零階連續(xù)泛函或k階連續(xù)泛函。四、線性泛函連續(xù)泛函如果滿足下列條件:(1)J[x1(t)+x2(t)]=J[x1(t)]+J[x2(t)](2)J[cx(t)]=c

J[x(t)]第9頁(yè),共94頁(yè),2023年,2月20日,星期三其中,c是任意常數(shù),就稱為線性泛函。例如都滿足上述兩個(gè)條件,故均為線性泛函。五、泛函的變分如果連續(xù)泛函J[x(t)]的增量可以表示為:(泰勒級(jí)數(shù))其中,L[x(t),x(t)]是關(guān)于x(t)的線性連續(xù)泛函,而r[x(t),x(t)]是關(guān)于x(t)的高階無(wú)窮小。L[x(t),x(t)]稱為泛函的變分,記為(1.1.9)第10頁(yè),共94頁(yè),2023年,2月20日,星期三(1.1.10)也就是說(shuō),泛函的變分是泛函增量的線性主部。當(dāng)一個(gè)泛函具有變分時(shí),即泛函的增量可以用式(1.1.9)來(lái)表示時(shí),稱該泛函是可微的。例如,泛函的增量為:于是,其變分為:第11頁(yè),共94頁(yè),2023年,2月20日,星期三可以證明,泛函的變分是唯一的。因?yàn)?,若泛函的變分不是唯一的,則泛函的增量可以寫(xiě)為:引理1.1.1泛函J[x(t)]的變分為:證明:如上所述,泛函J[x(t)]的增量為:其中,(0≤≤1)是一個(gè)參變量。由于L[x(t),

x(t)]是關(guān)于

x(t)的線性連續(xù)泛函,根據(jù)線性泛函的性質(zhì)(2),有(1.1.11)第12頁(yè),共94頁(yè),2023年,2月20日,星期三又由于r[x(t),

x(t)]是關(guān)于

x(t)的高階無(wú)窮小,所以利用上述兩點(diǎn)結(jié)論,便得根據(jù)偏微分的定義第13頁(yè),共94頁(yè),2023年,2月20日,星期三因?yàn)榉汉疛[x(t)]的變分為:所以Q.E.D第14頁(yè),共94頁(yè),2023年,2月20日,星期三例1.1.4求泛函的變分。根據(jù)式(1.1.11),該泛函的變分為:第15頁(yè),共94頁(yè),2023年,2月20日,星期三例1.1.5求泛函的變分根據(jù)式(1.1.11),所求泛函的變分為:第16頁(yè),共94頁(yè),2023年,2月20日,星期三若設(shè)則六、泛函的極值如果泛函J[x(t)]在函數(shù)空間中點(diǎn)x=x0(t)的鄰域內(nèi),其增量為:就稱泛函J[x(t)]在點(diǎn)x0(t)處達(dá)到極小值;如果泛函J[x(t)]在函數(shù)空間中點(diǎn)x=x0(t)的鄰域內(nèi),其增量為:就稱泛函J[x(t)]在點(diǎn)x0(t)處達(dá)到極大值;x0(t)的鄰域包含滿足條件:的所有點(diǎn)x(t)的球(即以x0(t)為圓心,以為半徑的球)。第17頁(yè),共94頁(yè),2023年,2月20日,星期三注意:所采用的函數(shù)間的距離的定義的不同,點(diǎn)x0(t)的鄰域內(nèi)所包含的函數(shù)也不同。

*若→強(qiáng)極值*若→弱極值

顯然,如果泛函J[x(t)]在點(diǎn)x0(t)處達(dá)到強(qiáng)極值,那么它在點(diǎn)x0(t)處也一定達(dá)到弱極值。反之不成立。定理1.1.1(必要條件)若泛函J[x(t)]是連續(xù)可微的,并且在點(diǎn)x0(t)處達(dá)到極值,則泛函在點(diǎn)x0(t)處的變分等于零,即(1.1.12)第18頁(yè),共94頁(yè),2023年,2月20日,星期三證明:對(duì)于任意給定的x(t),J[x0(t)+x(t)]既是函數(shù)x(t)的泛函,又是變量的函數(shù)。泛函J[x0(t)+x(t)]在x0(t)處達(dá)到極值,也可看成是函數(shù)J[x0(t)+x(t)]在=0處達(dá)到極值,所以函數(shù)J[x0(t)+x(t)]對(duì)變量的偏導(dǎo)數(shù)在=0處應(yīng)等于零,即而由式(1.1.11)有比較上面兩式,又考慮x(t)是任意給定的,所以,Q.E.D.第19頁(yè),共94頁(yè),2023年,2月20日,星期三從定理1.1.1的推證中可見(jiàn),泛函達(dá)到強(qiáng)極值與弱極值的必要條件是相同的。應(yīng)當(dāng)指出:本節(jié)所討論的定義、引理和定理,稍加變動(dòng)就可以應(yīng)用于含有多個(gè)未知函數(shù)的泛函:J[x1(t),x2(t),…,xn(t)]第20頁(yè),共94頁(yè),2023年,2月20日,星期三拉格朗日(Lagrange)問(wèn)題—基本問(wèn)題(1.2.1)麥耶耳(Mayer)問(wèn)題(1.2.2)波爾扎(Bolza)問(wèn)題(1.2.3)§1.2歐拉方程最優(yōu)控制問(wèn)題中,根據(jù)性能指標(biāo)的類型(積分型性能指標(biāo)、終值型性能指標(biāo)、復(fù)合型性能指標(biāo))的不同,分別對(duì)應(yīng)了古典變分法中的三類基本問(wèn)題。第21頁(yè),共94頁(yè),2023年,2月20日,星期三固定端點(diǎn)的Lagrange問(wèn)題問(wèn)題描述:假定點(diǎn)A(t0,x0)和B(tf,xf)是所要尋求的泛函(1.2.1)的極值曲線x(t)的兩個(gè)固定端點(diǎn),如圖1-5所示,其坐標(biāo)為:(1.2.4)現(xiàn)在的問(wèn)題是:從滿足邊界條件(1.2.4)的二階可微的函數(shù)中,選擇使泛函(1.2.1)達(dá)到極小值的函數(shù)x(t)。

解:設(shè)x*(t)是使泛函(1.2.1)達(dá)到極小值且滿足邊界條件(1.2.4)的極值條件?,F(xiàn)用表示滿足邊界條件(1.2.4)的極值曲線x*(t)的鄰域曲線。其中(1.2.5)第22頁(yè),共94頁(yè),2023年,2月20日,星期三x(t)是泛函宗量x(t)的變分,(01)是一參變量。為使x(t)是滿足邊界條件(1.2.4)的極值曲線x*(t)的鄰域曲線,x(t)應(yīng)具有連續(xù)導(dǎo)數(shù)且滿足條件:x(t0)=x(tf)=0(1.2.6)于是,由式(1.2.5)得到(1.2.7)由于x*(t)是極值曲線,所以泛函(1.2.1)在極值曲線x*(t)上的變分等于零(定理1.1.1),即由引理1.1.1知,泛函的變分為(1.2.8)(1.2.9)第23頁(yè),共94頁(yè),2023年,2月20日,星期三將式(1.2.1)代入式(1.2.9),得(1.2.10)第24頁(yè),共94頁(yè),2023年,2月20日,星期三對(duì)式(1.2.10)右端第二項(xiàng)進(jìn)行分部積分(1.2.12)將式(1.2.11)代入式(1.2.10),并考慮式(1.2.8)得利用條件(1.2.6),則上式變?yōu)椋?.2.13)(1.2.11)考慮到泛函宗量的變分x(t)是任意的函數(shù),不妨選擇(1.2.14)其中w(t)是任一滿足下列條件的函數(shù):第25頁(yè),共94頁(yè),2023年,2月20日,星期三將式(1.2.14)代入式(1.2.13),可得由上式可見(jiàn),一個(gè)非負(fù)的函數(shù)的定積分為零,只能是被積函數(shù)恒等于零,因此有(1.2.15)將上式左端第二項(xiàng)展開(kāi),可得(1.2.16)歐拉(Euler)方程歐拉方程第26頁(yè),共94頁(yè),2023年,2月20日,星期三式中若時(shí),歐拉方程是一個(gè)二階微分方程。定理1.2.1若給定曲線x(t)的始端x(t0)=x0和終端x(tf)=xf,則泛函達(dá)到極值的必要條件是,曲線x(t)滿足歐拉方程其中x(t)應(yīng)有連續(xù)的二階導(dǎo)數(shù),則至少應(yīng)是二次連續(xù)可微的。第27頁(yè),共94頁(yè),2023年,2月20日,星期三幾種特殊的歐拉方程(可以得到封閉形式的解)被積函數(shù)L不依賴于,即被積函數(shù)L不依賴于x,即

被積函數(shù)L不依賴于t,即

在這種情況下,歐拉方程的首次積分為

(1.2.17)

其中c是待定的積分常數(shù)。實(shí)際上,將上式左邊對(duì)t求全導(dǎo)數(shù),有被積函數(shù)L

線性地依賴于,即式(1.2.16)第28頁(yè),共94頁(yè),2023年,2月20日,星期三

對(duì)于向量空間的泛函,也存在著歐拉方程,不過(guò)是歐拉方程組(即向量歐拉方程)。定理1.2.2在n維函數(shù)空間中,若極值曲線X(t)=[x1(t),x2(t),…,xn(t)]T的始端X(t0)=[x1(t0),x2(t0),…,xn(t0)]T和終端X(tf)=[x1(tf),x2(tf),…,xn(tf)]T是給定的,則泛函達(dá)到極值的必要條件是曲線X(t)滿足向量歐拉方程其中X(t)應(yīng)有連續(xù)的二階導(dǎo)數(shù),而則至少應(yīng)是二次連續(xù)可微的。(1.2.18)第29頁(yè),共94頁(yè),2023年,2月20日,星期三例1.2.1求泛函滿足邊界條件的極值函數(shù)。解:由式(1.2.18)得:其特征方程為:特征根為:從而得第30頁(yè),共94頁(yè),2023年,2月20日,星期三由給定的邊界條件得于是得極值函數(shù):可以利用MATLAB符號(hào)工具箱求解,求解過(guò)程如下:symsx1x2;s=dsolve('D2x1-x2=0,D2x2-x1=0','x1(0)=0,x1(pi/2)=1,x2(0)=0,x2(pi/2)=-1','t');x1=s.x1x2=s.x2運(yùn)行結(jié)果如下:x1=sin(t)x1=-sin(t)第31頁(yè),共94頁(yè),2023年,2月20日,星期三例1.2.2

最速降線(又稱捷線)問(wèn)題所謂最速降線問(wèn)題是:設(shè)在豎直平面內(nèi)有兩點(diǎn)A和B,它們不在同一條鉛垂線上,現(xiàn)有一質(zhì)點(diǎn)受重力的作用自較高的A點(diǎn)向較低的B點(diǎn)滑動(dòng),如果不考慮各種阻力的影響,問(wèn)應(yīng)取怎樣的路徑,才能使所經(jīng)歷的時(shí)間最短?解:在A、B兩點(diǎn)所在的豎直平面內(nèi)選擇一坐標(biāo)系,如圖1-6所示。A點(diǎn)為坐標(biāo)原點(diǎn),水平線為x軸,鉛垂線為y軸。設(shè)質(zhì)點(diǎn)的初速度為零,則由力學(xué)的知識(shí)可知,質(zhì)點(diǎn)在重力的作用下,不考慮各種阻力的影響,從A點(diǎn)向B點(diǎn)下滑的速度的大小為(1.2.19)第32頁(yè),共94頁(yè),2023年,2月20日,星期三由圖1-6得(1.2.20)將式(1.2.20)代入式(1.2.19)中,并變換,得對(duì)上式兩邊進(jìn)行積分,可得質(zhì)點(diǎn)自點(diǎn)A(0,0)滑動(dòng)到點(diǎn)B(xf,yf)所需的時(shí)間為(1.2.21)

設(shè)y=y(x)是連接點(diǎn)A(0,0)和點(diǎn)B(xf,yf)的任一光滑曲線,則最速降線問(wèn)題的數(shù)學(xué)提法是:在XOY平面上確定一條滿足邊界條件(1.2.22)第33頁(yè),共94頁(yè),2023年,2月20日,星期三的極值曲線y=y(x),使泛函(1.2.23)達(dá)到極小值。這時(shí)被積函數(shù)為:不顯含自變量x,由(1.2.17)知,它的首次積分為化簡(jiǎn)上式得第34頁(yè),共94頁(yè),2023年,2月20日,星期三這種方程宜于利用參數(shù)法求解,為此,令于是,又由對(duì)上式積分,得由邊界條件y(0)知,c2=0,于是第35頁(yè),共94頁(yè),2023年,2月20日,星期三令最后得這是圓滾線的參數(shù)方程。式中r是滾動(dòng)圓半徑,其值由另一邊界條件y(xf)=yf確定。所以,最速降線是一條圓滾線。第36頁(yè),共94頁(yè),2023年,2月20日,星期三§1.3橫截條件當(dāng)極值曲線x*(t)的端點(diǎn)變化時(shí),要使泛函達(dá)到極小值,x*(t)首先應(yīng)當(dāng)滿足歐拉方程:若端點(diǎn)固定,可以利用端點(diǎn)條件:確定歐拉方程中的兩個(gè)待定的積分常數(shù)。問(wèn)題:若端點(diǎn)可變,如何確定這兩個(gè)積分常數(shù)?第37頁(yè),共94頁(yè),2023年,2月20日,星期三橫截條件推導(dǎo)過(guò)程問(wèn)題描述:假定極值曲線的始端A(t0,x0)是固定的,而終端B(tf,xf)是可變的,并沿著給定的曲線(1.3.1)變動(dòng),如圖1-7所示?,F(xiàn)在的問(wèn)題是需要確定一條從給定的點(diǎn)A(t0,x0)到給定的曲線(1.3.1)上的某一點(diǎn)B(tf,xf)的連續(xù)可微的曲線x(t),使得泛函達(dá)到極小值。(1.3.2)第38頁(yè),共94頁(yè),2023年,2月20日,星期三解:設(shè)x*(t)是泛函(1.3.2)的極值曲線。x*(t)的鄰域曲線可表示為:(1.3.3)(1.3.4)由圖1-7可見(jiàn),每一條鄰域曲線x(t)都對(duì)應(yīng)一個(gè)終端時(shí)刻tf,設(shè)極值曲線x*(t)所對(duì)應(yīng)的終端時(shí)刻為tf*,則鄰域曲線x(t)所對(duì)應(yīng)的終端時(shí)刻tf可以表示為:(1.3.5)將式(1.3.3)~(1.3.5)代入式(1.3.2),得(1.3.6)第39頁(yè),共94頁(yè),2023年,2月20日,星期三根據(jù)泛函達(dá)到極值的必要條件則有:(1.3.7)式(1.3.7)左邊第一項(xiàng)相當(dāng)于tf固定時(shí)的泛函的變分,按照上一節(jié)推導(dǎo)的結(jié)果可得(1.3.8)第40頁(yè),共94頁(yè),2023年,2月20日,星期三式(1.3.7)左邊第二項(xiàng)先利用中值定理,然后求導(dǎo),則得(1.3.9)將式(1.3.8)和式(1.3.9)代入式(1.3.7),得考慮到歐拉方程和始端固定所以(1.3.10)若x(t*f)與dtf互不相關(guān),則由上式得第41頁(yè),共94頁(yè),2023年,2月20日,星期三(1.3.11)但是,終端點(diǎn)沿曲線(1.3.1)變動(dòng),所以x(t*f)與dtf相關(guān)。為了進(jìn)一步簡(jiǎn)化式(1.3.10),應(yīng)當(dāng)求出x(t*f)與dtf之間的關(guān)系。根據(jù)終端約束條件(1.3.1),應(yīng)有將上式對(duì)取偏導(dǎo)數(shù),并令=0,利用式(1.3.4),整理得將上式代入式(1.3.10),可得第42頁(yè),共94頁(yè),2023年,2月20日,星期三由于dtf是任意的,所以(1.3.12)橫截條件定理1.3.1

若曲線x(t)由一給定的點(diǎn)(t0,x0)到給定的曲線x(tf)=(tf)上的某一點(diǎn)(tf,xf),則泛函達(dá)到極值的必要條件是,x(t)滿足歐拉方程和橫截條件其中x(t)應(yīng)有連續(xù)的二階導(dǎo)數(shù),則至少應(yīng)是二次連續(xù)可微的,而(t)則應(yīng)有連續(xù)的一階導(dǎo)數(shù)。第43頁(yè),共94頁(yè),2023年,2月20日,星期三若極值曲線的始端不是固定的,并沿著曲線(1.3.13)變動(dòng),則同樣可以推導(dǎo)出始端的橫截條件(1.3.14)根據(jù)定理1.3.1和式(1.3.14),可得到端點(diǎn)可變時(shí),Lagrange問(wèn)題的解,除有歐拉方程外,還有橫截條件:(1)始端、終端可變,即x(t0)=(t0),x(tf)=(tf),則橫截條件為:(2)當(dāng)t0、

tf

可變,而x(t0)與x(tf)固定時(shí),則橫截條件為:第44頁(yè),共94頁(yè),2023年,2月20日,星期三(3)當(dāng)t0、

tf

固定,而x(t0)與x(tf)可變時(shí),即始端與終端分別在t=t0、t=tf上滑動(dòng),則橫截條件為:定理1.3.1和以上幾種情況的橫截條件,都可以將其推廣到n維函數(shù)向量X(t)=[x1(t),x2(t),…,xn(t)]T的泛函的情形。定理1.3.2在n維函數(shù)空間中,若曲線X(t)=[x1(t),x2(t),…,xn(t)]T的始端X(t0)=[x1(t0),x2(t0),…,xn(t0)]T是固定的,而終端X(tf)=[x1(tf),x2(tf),…,xn(tf)]T是可變的,且在曲面X(tf)=(tf)上變動(dòng),則泛函達(dá)到極值的必要條件是,曲線X(t)滿足向量歐拉方程第45頁(yè),共94頁(yè),2023年,2月20日,星期三其中X(t)應(yīng)有連續(xù)的二階導(dǎo)數(shù),而則至少應(yīng)是二次連續(xù)可微的,而(t)=[1(t),2(t),,n(t)]T則應(yīng)有連續(xù)的一階導(dǎo)數(shù)。和橫截條件若曲線X(t)=[x1(t),x2(t),…,xn(t)]T的始端不是固定的,而是可變的,并在給定的曲面上變動(dòng),其中,則同樣可以推導(dǎo)出始端的橫截條件為:第46頁(yè),共94頁(yè),2023年,2月20日,星期三例1.3.1求t-x平面上由給定A(0,1)至給定直線x=2-t的弧長(zhǎng)最短的曲線方程。解:由圖1-8,弧長(zhǎng)根據(jù)題意,目標(biāo)泛函應(yīng)選為:這是一個(gè)始端固定,終端可變的泛函的變分問(wèn)題。由于泛函的被積函數(shù)中不顯含x(t),所以Euler方程為:第47頁(yè),共94頁(yè),2023年,2月20日,星期三由初始條件x(0)=1,得c2=1,從而有由橫截條件(1.3.12),得經(jīng)整理得,所以c1=1。最優(yōu)軌線方程為:最優(yōu)軌線與給定直線垂直。第48頁(yè),共94頁(yè),2023年,2月20日,星期三§1.4泛函局部極值的充分條件泛函二階變分推導(dǎo)過(guò)程:給定泛函為其一階變分為(1.4.1)(1.4.2)第49頁(yè),共94頁(yè),2023年,2月20日,星期三而二階變分為第50頁(yè),共94頁(yè),2023年,2月20日,星期三(1.4.3)于是,為使泛函(1.4.1)在曲線x(t)上達(dá)到極小(或極大)值,其一階變分(1.4.2)應(yīng)為零,而其二階變分(1.4.3)必須為正(或負(fù))。由此,得到下面的定理。第51頁(yè),共94頁(yè),2023年,2月20日,星期三定理1.4.1若泛函的一階變分則J[x(t)]達(dá)到極小值的充分條件是二階型矩陣(1.4.4)是正定的或半正定的;而J[x(t)]達(dá)到極大值的充分條件是式(1.4.4)是負(fù)定的或半負(fù)定的。

定理1.4.1可以推廣到含有n個(gè)未知函數(shù)的泛函的情形。第52頁(yè),共94頁(yè),2023年,2月20日,星期三§1.5等式約束條件下的變分問(wèn)題一、回顧等式約束條件下函數(shù)極值問(wèn)題的解法設(shè)有函數(shù)(1.5.2)現(xiàn)在需要求函數(shù)Z在約束條件為(1.5.1)情況下的極值。(1)消元法:從約束條件(1.5.2)中將y解出來(lái)。用x表示y,即y=y(x)然后將y(x)代入f(x,y)中,得到

Z=f[x,y(x)](1.5.3)這樣,函數(shù)Z就只含有一個(gè)自變量x了,在等式(1.5.2)約束條第53頁(yè),共94頁(yè),2023年,2月20日,星期三件下的函數(shù)(1.5.1)的極值問(wèn)題,就變成無(wú)約束條件的函數(shù)(1.5.3)的極值問(wèn)題了。但是,消元法存在兩個(gè)問(wèn)題:①?gòu)姆匠蹋?.5.2)中將y解出來(lái)往往是很困難的;②對(duì)x和y這兩個(gè)自變量未能平等看待。(2)拉格朗日乘子法(Lagrangefactor)

步驟如下:①作一個(gè)輔助函數(shù)F=f(x,y)+g(x,y)式中,是待定的常數(shù),稱為拉格朗日乘子;②求輔助函數(shù)F的無(wú)條件極值,即令(1.5.4)

③聯(lián)立求解方程(1.5.2)和(1.5.4),求出駐點(diǎn)(x0,y

0)和待定常數(shù)值;④判斷(x0,y

0)是否是函數(shù)f(x,y)的極值點(diǎn)。第54頁(yè),共94頁(yè),2023年,2月20日,星期三拉格朗日乘子法對(duì)于求n元函數(shù)

y=f(x1,x2,…,xn)在多個(gè)約束方程gi(x1,x2,…,xn)=0,i=1,2,…,m;m<n條件下的極值問(wèn)題,同樣適用。二、等式約束條件下泛函極值問(wèn)題的解法求泛函(1.5.5)在約束方程為(1.5.6)和端點(diǎn)條件為(1.5.7)第55頁(yè),共94頁(yè),2023年,2月20日,星期三利用拉格朗日乘子法求解上述等式約束條件下的泛函極值問(wèn)題,其具體步驟為構(gòu)造輔助泛函

其中(t)=[

1(t),

2(t),…,

m(t)]T是m維待定向量乘子。于是,就將有約束條件(1.5.6)的泛函(1.5.5)的極值問(wèn)題轉(zhuǎn)化成無(wú)約束條件的泛函(1.5.8)的極值問(wèn)題。令(1.5.9)寫(xiě)出向量形式的歐拉方程(1.5.10)情況下的極值曲線。這里X(t)=[x1(t),x2(t),…,xn(t)]T,f=[f1,f2,…,fm]T,m<n。而是x1(t),x2(t),…,xn(t)和t的標(biāo)量函數(shù)。(1.5.8)第56頁(yè),共94頁(yè),2023年,2月20日,星期三聯(lián)立求解歐拉方程(1.5.10)和約束方程(1.5.6),可以得到n維向量函數(shù)X(t)和m維向量乘子

(t)。利用端點(diǎn)條件(1.5.7)確定歐拉方程解中的2n個(gè)積分常數(shù),得到候選函數(shù)X(t)。檢驗(yàn)候選函數(shù)X(t)是否使泛函(1.5.8)達(dá)到極值以及是極大值還是極小值。說(shuō)明:

①利用拉格朗日乘子法求得的函數(shù)X(t),如果(1.5.8)達(dá)到極值,就一定是原泛函(1.5.5)的極值函數(shù)。因?yàn)橛杉s束方程(1.5.6)和歐拉方程(1.5.10)聯(lián)立解出的向量函數(shù)X(t)和(t)一定滿足約束方程(1.5.6),所以必有J0=J,另外,當(dāng)將所解出的(t)代入輔助泛函(1.5.8)時(shí),函數(shù)X(t)將使輔助泛函(1.5.8)達(dá)到無(wú)條件極值,因?yàn)楹瘮?shù)X(t)是輔助泛函(1.5.8)的歐拉方程(1.5.10)的解。第57頁(yè),共94頁(yè),2023年,2月20日,星期三②上面的論述僅僅指出了利用拉格朗日乘子法求出的輔助泛函(1.5.8)的無(wú)條件的極值函數(shù),一定是原泛函(1.5.5)在等式(1.5.6)約束條件下的極值函數(shù)。但是,卻沒(méi)有說(shuō)明原泛函(1.5.5)在等式(1.5.6)約束條件下的所有極值函數(shù)是否都能利用拉格朗日乘子法求出來(lái)?下面的定理將回答這個(gè)問(wèn)題。定理1.5.1如果n維向量函數(shù)X(t)=[x1(t),x2(t),…,xn(t)]T(1.5.11)能使泛函(1.5.15)在等式約束(1.5.12)條件下達(dá)到極值,這里f是m維向量函數(shù),m<n,必存在適當(dāng)?shù)膍維向量函數(shù)(t)=[

1(t),

2(t),…,

m(t)]T(1.5.14)使泛函(1.5.13)第58頁(yè),共94頁(yè),2023年,2月20日,星期三達(dá)到無(wú)條件極值。即函數(shù)X(t)是泛函(1.5.15)的歐拉方程的解,其中(1.5.16)而X(t)和(t)由歐拉方程(1.5.16)和約束方程(1.5.13)共同確定。說(shuō)明:①定理1.5.1表明,泛函(1.5.12)在等式(1.5.13)約束條件下的極值函數(shù)X(t),同時(shí)也使泛函(1.5.15)達(dá)到無(wú)條件極值。這就進(jìn)一步說(shuō)明泛函(1.5.12)在等式(1.5.13)約束條件下的極值函數(shù)X(t)都可通過(guò)拉格朗日乘子法求得。②如果不僅將X(t),而且連函數(shù)(t)在內(nèi),都看成是泛函(1.5.15)的宗量,那么,約束方程(1.5.13)也可以看成是泛函(1.5.15)的歐拉方程。方程(1.5.13)和(1.5.16)共有n+m個(gè)方程,恰好可以解出n維和m維未知函數(shù)X(t)和(t)。③當(dāng)約束方程中(1.5.13)中的函數(shù)f不包括有X(t)的導(dǎo)數(shù)時(shí),則式(1.5.13)便成為一種代數(shù)方程約束。定理1.5.1仍然成立。第59頁(yè),共94頁(yè),2023年,2月20日,星期三例1.5.1已知受控系統(tǒng)的動(dòng)態(tài)結(jié)構(gòu)如圖1-9所示。求最優(yōu)控制u*(t),使目標(biāo)泛函取極小值。給定的邊界條件為解:令則得系統(tǒng)的狀態(tài)方程為:現(xiàn)在的目標(biāo)泛函為應(yīng)用拉格朗日乘子法,構(gòu)造輔助泛函(1.5.17)第60頁(yè),共94頁(yè),2023年,2月20日,星期三令則向量形式的歐拉方程為根據(jù)狀態(tài)方程(1.5.17),得第61頁(yè),共94頁(yè),2023年,2月20日,星期三利用邊界條件,可得所以,最優(yōu)控制第62頁(yè),共94頁(yè),2023年,2月20日,星期三§1.6利用變分法求解最優(yōu)控制問(wèn)題

對(duì)于最優(yōu)控制問(wèn)題來(lái)說(shuō),當(dāng)狀態(tài)變量和控制變量均不受約束,即X(t)Rn,U(t)

Rm時(shí),是個(gè)在等式約束條件下求泛函極值的變分問(wèn)題,因此,可以利用在上一節(jié)中介紹的拉格朗日乘子法來(lái)求解。在這一節(jié)中,利用拉格朗日乘子法求解最優(yōu)控制問(wèn)題時(shí),將引入哈密頓(Hamilton)函數(shù),推導(dǎo)出幾種典型的最優(yōu)控制問(wèn)題應(yīng)滿足的必要條件。1.6.1

拉格朗日問(wèn)題的解問(wèn)題1.6.1給定系統(tǒng)狀態(tài)方程(1.6.2)初始條件(1.6.1)終端條件:tf固定,X(tf)自由和性能泛函(1.6.3)第63頁(yè),共94頁(yè),2023年,2月20日,星期三要求從容許控制U(t)

Rm中確定最優(yōu)控制U*(t),使系統(tǒng)(1.6.1)從給定的初態(tài)X(t0)轉(zhuǎn)移到某個(gè)終態(tài)X(tf),并使性能泛函(1.6.3)達(dá)到極小值。這是拉格朗日問(wèn)題,又稱為積分型最優(yōu)控制問(wèn)題。

解:將狀態(tài)方程(1.6.1)改寫(xiě)為(1.6.4)于是,上述最優(yōu)控制問(wèn)題就變成為在微分方程(1.6.4)約束條件下求泛函(1.6.3)極值的變分問(wèn)題。利用拉格朗日乘子法,引入n維拉格朗日乘子向量

(t)=[

1(t),

2(t),…,

n(t)]T

(t)稱為協(xié)態(tài)變量,以便與狀態(tài)變量相對(duì)應(yīng)。構(gòu)造輔助泛函(1.6.5)第64頁(yè),共94頁(yè),2023年,2月20日,星期三其中,(1.6.6)于是,求泛函(1.6.3)在等式(1.6.1)約束條件下的極值問(wèn)題,就轉(zhuǎn)變成為求泛函(1.6.5)的無(wú)約束條件的極值問(wèn)題。定義哈密頓(Hamilton)函數(shù)為(1.6.7)它是一標(biāo)量函數(shù),則式(1.6.6)變?yōu)槔米兎址梢詫?xiě)出輔助泛函(1.6.5)的歐拉方程(1.6.8)第65頁(yè),共94頁(yè),2023年,2月20日,星期三將式(1.6.8)代入上式,得(1.6.11)(1.6.10)(1.6.9)協(xié)態(tài)方程(或共軛方程)狀態(tài)方程規(guī)范方程(或正則方程)控制方程第66頁(yè),共94頁(yè),2023年,2月20日,星期三(1.6.12)初始狀態(tài)為由于終端時(shí)刻tf固定,終端狀態(tài)X(tf)自由,所以橫截條件為考慮式(1.6.8),得(1.6.13)式(1.6.9)~(1.6.13)就是式(1.6.1)~(1.6.3)所給定的最優(yōu)控制問(wèn)題的解應(yīng)滿足的必要條件。這些條件也可以由求輔助泛函J0對(duì)狀態(tài)變量X(t)和控制變量U(t)的變分中推導(dǎo)出來(lái)。聯(lián)立求解規(guī)范方程(1.6.9)和(1.6.10)可以得到兩個(gè)未知函數(shù)X(t)和

(t),其一個(gè)邊界在始端(1.6.12),另一個(gè)邊界在終端(1.6.13),故稱為混合邊界問(wèn)題或兩點(diǎn)邊界值問(wèn)題。第67頁(yè),共94頁(yè),2023年,2月20日,星期三求解兩點(diǎn)邊界值問(wèn)題步驟由控制方程(1.6.11)求得

U=U[X(t),(t),t](1.6.14)將式(1.6.14)代入規(guī)范方程(1.6.9)和(1.6.10)消去其中的U(t),得到(1.6.15)(1.6.16)

利用邊界條件(1.6.12)和(1.6.13)聯(lián)立求解方程(1.6.15)和(1.6.16),可得唯一確定的解X(t)和(t)。將所求得的X(t)和(t)代入式(1.6.14)中,可求得相應(yīng)的U(t)。第68頁(yè),共94頁(yè),2023年,2月20日,星期三說(shuō)明:(1)對(duì)于兩點(diǎn)邊界值問(wèn)題,一般難以求得其解析解,通常需要采用數(shù)值計(jì)算方法求其數(shù)值解。(2)利用引入哈密頓函數(shù)的方法求解拉格朗日型最優(yōu)控制問(wèn)題,是將求泛函(1.6.3)在等式(1.6.1)約束條件下對(duì)控制函數(shù)U(t)的條件極值問(wèn)題轉(zhuǎn)化為求哈密頓函數(shù)H對(duì)控制變量U(t)的無(wú)條件極值問(wèn)題。這種方法稱為哈密頓方法。定理1.6.1設(shè)系統(tǒng)的狀態(tài)方程則為將系統(tǒng)從給定的初態(tài)轉(zhuǎn)移到終端時(shí)刻tf固定,終端狀態(tài)X(tf)自由的某個(gè)終態(tài),并使性能泛函第69頁(yè),共94頁(yè),2023年,2月20日,星期三達(dá)到極小值的最優(yōu)控制應(yīng)滿足的必要條件是(1)設(shè)U*(t)是最優(yōu)控制,X*(t)是對(duì)應(yīng)于U*(t)的最優(yōu)軌線,則必存在一與U*(t)和X*(t)相對(duì)應(yīng)的n維協(xié)態(tài)變量(t),使得X(t)與(t)滿足規(guī)范方程其中(2)邊界條件為第70頁(yè),共94頁(yè),2023年,2月20日,星期三(3)哈密頓函數(shù)H對(duì)控制變量U(t)(t0ttf)取極值,即*沿著最優(yōu)控制和最優(yōu)軌線,哈密頓函數(shù)H對(duì)時(shí)間t求全導(dǎo)數(shù),得若H不顯含t時(shí),則有

H(t)=常數(shù)t[t0,tf];

也就是說(shuō),當(dāng)H不顯含t時(shí),哈密頓函數(shù)H是不依賴于t的常數(shù)。第71頁(yè),共94頁(yè),2023年,2月20日,星期三例1.6.1已知系統(tǒng)方程和邊界條件為求使性能泛函為極小值的最優(yōu)控制函數(shù)與最優(yōu)軌線。解:這是一個(gè)最小能量控制問(wèn)題。其哈密頓函數(shù)為由控制方程得第72頁(yè),共94頁(yè),2023年,2月20日,星期三協(xié)態(tài)方程為解協(xié)態(tài)方程,得于是由狀態(tài)方程解得第73頁(yè),共94頁(yè),2023年,2月20日,星期三利用邊界條件求得積分常數(shù)為于是,最優(yōu)控制與最優(yōu)軌線分別為第74頁(yè),共94頁(yè),2023年,2月20日,星期三可以利用MATLAB符號(hào)工具箱求解上述微分方程,程序如下:symsl1l2x1x2;s=dsolve('D1l1=0,D1l2=-l1-l2,D1x1=x2,D1x2=x2-l2','x1(0)=1,x2(0)=1,x1(1)=0,x2(1)=0','t')l1=s.l1,l2=s.l2,x1=s.x1,x2=s.x2運(yùn)行結(jié)果為:s=l1:[1x1sym]l2:[1x1sym]x1:[1x1sym]x2:[1x1sym]第75頁(yè),共94頁(yè),2023年,2月20日,星期三l1=-2*exp(1)/(exp(1)-3)l2=2*exp(1)/(exp(1)-3)-2*exp(1)/(exp(1)-3)*exp(-t)-2*exp(-t)*exp(1)/(exp(1)-1)/(exp(1)-3)x1=-exp(1)/(exp(1)-3)*exp(t)+2*exp(1)/(exp(1)-3)*t+exp(1)/(exp(1)-3)*exp(-t)+exp(1)/(exp(1)-1)/(exp(1)-3)*exp(t)+exp(-t)*exp(1)/(exp(1)-1)/(exp(1)-3)-2*exp(1)/(exp(1)-1)/(exp(1)-3)+exp(t)x2=2*exp(1)/(exp(1)-3)-exp(1)/(exp(1)-3)*exp(-t)-exp(1)/(exp(1)-3)*exp(t)-exp(-t)*exp(1)/(exp(1)-1)/(exp(1)-3)+exp(1)/(exp(1)-1)/(exp(1)-3)*exp(t)+exp(t)例1.6.2問(wèn)題同例1.6.1,只是終端條件為x1(1)=0,x2(1)自由,求該最優(yōu)控制問(wèn)題。解:?jiǎn)栴}的規(guī)范方程和控制方程均與例1.6.1相同,但邊界條件變?yōu)榈?6頁(yè),共94頁(yè),2023年,2月20日,星期三由這些邊界條件求得的積分常數(shù)為于是,所求得的最優(yōu)解為

由例1.6.1和例1.6.2可見(jiàn),對(duì)于兩個(gè)相同的最優(yōu)控制問(wèn)題,只是部分終端狀態(tài)不相同,所得到的最優(yōu)解則完全不同。第77頁(yè),共94頁(yè),2023年,2月20日,星期三1.6.2

波爾扎問(wèn)題的解問(wèn)題1.6.2給定系統(tǒng)狀態(tài)方程(1.6.18)初始條件(1.6.17)和性能泛函(1.6.19)要求從容許控制U(t)

Rm中確定最優(yōu)控制U*(t),使系統(tǒng)(1.6.17)從給定的初態(tài)X(t0)轉(zhuǎn)移到某個(gè)終態(tài)X(tf),并使性能泛函(1.6.19)達(dá)到極小值。這是波爾扎問(wèn)題,

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論