第三章變分法泛函極值問題_第1頁
第三章變分法泛函極值問題_第2頁
第三章變分法泛函極值問題_第3頁
第三章變分法泛函極值問題_第4頁
第三章變分法泛函極值問題_第5頁
已閱讀5頁,還剩102頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第三章用變分法解最優(yōu)控制

—泛函極值問題

整理課件本章主要內(nèi)容3.1變分法根底3.2無約束條件的泛函極值問題3.3有約束條件的泛函極值——?jiǎng)討B(tài)系 統(tǒng)的最優(yōu)控制問題3.4小結(jié)返回主目錄整理課件在動(dòng)態(tài)系統(tǒng)最優(yōu)控制問題中,性能指標(biāo)是一個(gè)泛函,性能指標(biāo)最優(yōu)即泛函到達(dá)極值。解決泛函極值問題的有力工具是變分法。所以下面就來列出變分法中的一些主要結(jié)果,大局部不加證明,但讀者可對(duì)照微分學(xué)中的結(jié)果來理解。整理課件3.1變分法根底

如果對(duì)某一類函數(shù)中的每一個(gè)函數(shù),有一個(gè)實(shí)數(shù)值與之相對(duì)應(yīng),則稱為依賴于函數(shù)的泛函,記為粗略來說,泛函是以函數(shù)為自變量的函數(shù)。1、泛函:先來給出下面的一些定義。整理課件

若對(duì)任給的,存在當(dāng)時(shí),就有則稱在處是連續(xù)的。

2、泛函的連續(xù)性:

整理課件滿足下面條件的泛函稱為線性泛函這里是實(shí)數(shù),和是函數(shù)空間中的函數(shù)。

3、線性泛函:

整理課件4、自變量函數(shù)的變分:自變量函數(shù)的變分是指同屬于函數(shù)類中兩個(gè)函數(shù)、之差這里,t看作為參數(shù)。當(dāng)為一維函數(shù)時(shí),可用圖3-1來表示。整理課件圖3-1自變量函數(shù)的變分整理課件這里,是的線性泛函,若時(shí),有,則稱是泛函的變分。是的線性主部。當(dāng)自變量函數(shù)有變分時(shí),泛函的增量為

5、泛函的變分:整理課件6、泛函的極值:

若存在,對(duì)滿足的 一切X, 具有同一符號(hào),則稱在處有極值。整理課件

定理:在處有極值的必要條件是對(duì)于所有容許的增量函數(shù)(自變量的變分),泛函在處的變分為零為了判別是極大還是極小,要計(jì)算二階變分。但在實(shí)際問題中根據(jù)問題的性質(zhì)容易判別是極大還是極小,故一般不計(jì)算。整理課件3.2無約束條件的泛函極值問題3.2.1泛函的自變量函數(shù)為標(biāo)量函數(shù)的情況

為簡單起見,先討論自變量函數(shù)為標(biāo)量函數(shù)(一維)的情況。我們要尋求極值曲線,使下面的性能泛函取極值(3-1)整理課件于是泛函J的增量可計(jì)算如下(以下將*號(hào)省去)上式中是高階項(xiàng)。為此,讓自變量函數(shù)、在極值曲線、附近發(fā)生微小變分、,即整理課件

根據(jù)定義,泛函的變分是的線性主部,即對(duì)上式第二項(xiàng)作分部積分,按公式可得(3-2)整理課件

J取極值的必要條件是等于零。因是任意的,要使(3-2)中第一項(xiàng)(積分項(xiàng))為零,必有(3-3)上式稱為歐拉——拉格朗日方程?!?-2〕式中第二項(xiàng)為零的條件要分兩種情況來討論:整理課件

1、固定端點(diǎn)的情況

這時(shí),它們不發(fā)生變化,所以。而(3-2)中第二項(xiàng)可寫成當(dāng)時(shí),(3-4)式自然為零。(3-4)整理課件2、自由端點(diǎn)的情況

這時(shí)和可以發(fā)生化,,而且可以獨(dú)立地變化。于是要使(3-2)中第二項(xiàng)為零,由(3-4)式可得(3-6)(3-5)整理課件因?yàn)檫@里討論是標(biāo)量函數(shù)的情況,和也是標(biāo)量,且是任意的,故(3-5)、(3-6)可化為〔3-7〕、〔3-8〕稱為橫截條件。(3-8)(3-7)整理課件當(dāng)邊界條件全部給定(即固定端點(diǎn))時(shí),不需要這些橫截條件。當(dāng) 給定時(shí),不要(3-8)。當(dāng) 給定時(shí),不要(3-7)。整理課件3.2.2泛函的自變量函數(shù)為向量函數(shù)的情況

現(xiàn)在,將上面對(duì)是標(biāo)量函數(shù)時(shí)所得到的公式推廣到是n維向量函數(shù)的情況。這時(shí),性能泛函為(3-9)(3-10)式中整理課件向量歐拉——拉格朗日方程為(3-11)式中泛函變分由〔3-2〕式改為整理課件

(當(dāng)和時(shí))橫截條件為〔自由端點(diǎn)情況〕整理課件

例3-1取極值的軌跡。求通過點(diǎn)〔0,0〕及〔1,1〕且使整理課件

即它的通解形式為式中:這是固定端點(diǎn)問題,相應(yīng)的歐拉——拉格朗日方程為整理課件

由初始條件,可得A=0。再由終端條件,可得,因而極值軌跡為整理課件

例3-2求使指標(biāo)

取極值的軌跡,并要求,但對(duì)沒有限制。整理課件解即常數(shù)于是是常數(shù),則是時(shí)間的線性函數(shù),令由可得,又終端是自由的,由式(3-7)可得橫截條件為這是終端自由的情況。歐拉—拉格朗日方程為整理課件容易驗(yàn)證時(shí),對(duì)應(yīng)局部極小;時(shí),,對(duì)應(yīng)局部極大。由上式解得或。時(shí)的極值軌跡為;時(shí)的極值軌跡為。即整理課件3.3有約束條件的泛函極值

——?jiǎng)討B(tài)系統(tǒng)的最優(yōu)控制問題前面討論泛函極值問題時(shí),對(duì)極值軌跡沒有附加任何約束條件。但在動(dòng)態(tài)系統(tǒng)最優(yōu)控制問題中,極值軌跡必須滿足系統(tǒng)的狀態(tài)方程,也就是要受到狀態(tài)方程的約束??紤]下列系統(tǒng)(3-13)整理課件這是綜合指標(biāo)。我們要求出最優(yōu)控制和滿足狀態(tài)方程的極值軌跡,使性能指標(biāo)取極值。式中,為維狀態(tài)向量,為維控制向量(這里假定不受限制.否則不能用變分法求解,而要用極小值原理或動(dòng)態(tài)規(guī)劃法求解)是n維連續(xù)可微的向量函數(shù)。性能指標(biāo)如下:(3-14)整理課件

在下面的討論中,假定初始時(shí)刻和初始狀態(tài) 是給定的,終端則可能有幾種情況。我們將就幾種常見的情況來討論,即給定,自由和自由,屬于一個(gè)約束集。整理課件3.3.1終端時(shí)刻給定,終端狀態(tài)自由(3-16)(3-15)與有約束條件的函數(shù)極值情況類似,引入待定的n維拉格朗日乘子向量函數(shù)將狀態(tài)方程〔3-13〕寫成等式約束方程的形式整理課件

與以前不同的是,在動(dòng)態(tài)問題中拉格朗日乘子向量是時(shí)間函數(shù)。在最優(yōu)控制中經(jīng)常將稱為伴隨變量,協(xié)態(tài)(協(xié)狀態(tài)向量)或共軛狀態(tài)。引入后可作出下面的增廣泛函(3-17)整理課件

于是有約束條件的泛函的極值問題化為無約束條件的增廣泛函的極值問題。(3-18)再引入一個(gè)標(biāo)量函數(shù)它稱為哈密頓〔Hamilton〕函數(shù),在最優(yōu)控制中起著重要的作用整理課件

于是可寫成(3-19)對(duì)上式積分號(hào)內(nèi)第二項(xiàng)作分部積分后可得整理課件 設(shè)、相對(duì)于最優(yōu)值、的變分分別為和 因?yàn)樽杂桑蔬€要考慮變分。下面來計(jì)算由這些變分引起的泛函的變分 。整理課件為極小的必要條件是:對(duì)任意的、、,變分等于零。由(3-18)及(3-20)可得下面的一組關(guān)系式整理課件(協(xié)態(tài)方程)(3-21)(狀態(tài)方程)(3-22)(控制方程)(3-23)(橫截條件)(3-24)整理課件

(3-21)~(3-24)即為取極值的必要條件,由此即可求得最優(yōu)值,,。 (3-22)式即為狀態(tài)方程,這可由的定義式(3-18)看出,實(shí)際解題時(shí)無需求,只要直接用狀態(tài)方程即可,這里為形式上對(duì)稱而寫成(3-22)式?!?-21〕與〔3-22〕一起稱為哈密頓正那么程。整理課件

(3-23)是控制方程,它表示在最優(yōu)控制處取極值。注意,這是在為任意時(shí)得出的方程,當(dāng)有界且在邊界上取得最優(yōu)值時(shí),就不能用這方程,這時(shí)要用極小值原理求解。 (3-24)是在固定、自由時(shí)得出的橫截條件。當(dāng)固定時(shí),,就不需要這個(gè)橫截條件了。橫截條件表示協(xié)態(tài)終端所滿足的條件。整理課件在求解〔3-21〕~〔3-24〕時(shí),我們只知道初值和由橫截條件〔3-24〕求得的協(xié)態(tài)終端值,這種問題稱為兩點(diǎn)邊值問題,一般情況下它們是很難求解的。因?yàn)椴恢?,如果假定一個(gè),然后正向積分(3-21)~(3-24),則在時(shí)的值一般與給定的不同,于是要反復(fù)修正的值,直至與給定值的差可忽略不計(jì)為止。整理課件 非線性系統(tǒng)最優(yōu)控制兩點(diǎn)邊值問題的數(shù)值求解是一個(gè)重要的研究領(lǐng)域。對(duì)于線性系統(tǒng)兩點(diǎn)邊值問題的求解,那么可尋找缺少的邊界條件并只要進(jìn)行一次積分,下面的例3-4給出了求解過程。

整理課件例3-3設(shè)系統(tǒng)狀態(tài)方程為的邊界條件為。求最優(yōu)控制,使下列性能指標(biāo)為最小。整理課件

解這里、均給定,故不需要橫截條件(3-24)式。作哈密頓函數(shù)那么協(xié)態(tài)方程和控制方程為即整理課件故可得正那么方程對(duì)正那么方程進(jìn)行拉氏變換,可得(3-25)(3-26)(3-27)由〔3-25〕式可求得整理課件

于是,解出為(3-28)代入〔3-26〕,即得整理課件(3-29)反變換可求得整理課件將〔3-28〕代入〔3-26〕可得

故整理課件

由,從上式可得把代入(3-29),可得,而最優(yōu)控制為整理課件設(shè)系統(tǒng)的狀態(tài)方程為要求確定最優(yōu)控制,使指標(biāo)泛函例3-4初始條件為取極小值終端條件為自由整理課件這里是自由的,所以要用到橫截條件〔3- 24〕式,因終端指標(biāo)

解:作哈密頓函數(shù)由〔3-21〕~〔3-23〕可求得所以(3-30)(3-31)整理課件將代入狀態(tài)方程,可得即得(3-32)整理課件邊界條件為(3-37)(3-36)(3-35)(3-34)(3-33)整理課件

(3-39)(3-38)(3-40)(3-41)可見這是兩點(diǎn)邊值問題,對(duì)正那么方程〔3-33〕~〔3-36〕進(jìn)行拉氏變換,可得整理課件代入初始條件,,可得故由〔3-38〕~〔3-41〕可解出整理課件

同樣可解得

利用終端條件,,由(3-42)、(3-43)可得(3-43)(3-42)整理課件

由上二式可解出

由〔3-42〕式可得最優(yōu)狀態(tài)軌跡整理課件 由〔3-43〕式可得最優(yōu)協(xié)態(tài)

由〔3-32〕式可得最優(yōu)控制同理還可求出整理課件圖3-2最優(yōu)控制和最優(yōu)狀態(tài)軌跡解整理課件

注意,這個(gè)系統(tǒng)是線性定常系統(tǒng),這種線性兩點(diǎn)邊值問題的解可以通過尋找缺少的邊界條件,并且進(jìn)行一次積分而求得其解。對(duì)非線性兩點(diǎn)邊值問題,那么要借助于迭代方法產(chǎn)生一個(gè)序列,來屢次修正缺少的初始條件的試探值,直到滿足兩點(diǎn)邊值的條件。圖3-2是最優(yōu)解的軌跡曲線。整理課件3.3.2終端時(shí)刻自由,終端狀態(tài)受約束

設(shè)終端狀態(tài)滿足下面約束方程(3-46)(3-45)(3-44)性能指標(biāo)為其中整理課件引入n維拉格朗日乘子向量函數(shù)和維拉格朗日乘子向量,作出增廣性能泛函

將代入(3-47),可得(3-49)(3-48)(3-47)引入哈密頓函數(shù)整理課件與固定時(shí)的情況不同,現(xiàn)在由、、和所引起。這里不再為零,而可計(jì)算如下(參見圖3-3):(3-51)則(3-50)令整理課件圖3-3各種變分的表示整理課件(3-52)令整理課件一是在時(shí)函數(shù)相對(duì)的變化.另一是因的變化所引起的函數(shù)值的變化量后者可用它的線性主部來近似。注意,這里和不同,故*號(hào)不能省去。上式表明由兩部分組成:整理課件

現(xiàn)在來計(jì)算(只計(jì)算到一階小量)。整理課件上式中方括號(hào)外的下標(biāo)*表示、、是最優(yōu)值、、。是上式的線性主部,故整理課件

對(duì)第三項(xiàng)作分部積分,可得整理課件第四項(xiàng)可表示為〔忽略二階小量〕整理課件

上式最后一個(gè)等號(hào)用到了(3-52)式。表示的自變量取最優(yōu)值時(shí)的值。根據(jù)上面的結(jié)果可得整理課件取極值的必要條件為因、、、為任意,故得〔省去*號(hào)〕(協(xié)態(tài)方程)(3-53)(狀態(tài)方程)(3-54)(控制方程)(3-55)(橫截方程)(3-56)整理課件與固定情況相比,這里多了一個(gè)方程,,用它可求出最優(yōu)終端時(shí)間。

(3-57)整理課件要求確定最優(yōu)控制,使最小。例3-5設(shè)系統(tǒng)狀態(tài)方程為邊界條件為自由性能指標(biāo)為整理課件

解這是自由問題。終端狀態(tài)固定,是滿足約束集的特殊情況,即作哈密頓函數(shù)整理課件正那么方程是控制方程是整理課件將代入,可得因邊界條件全部給定,故不用橫截條件。確定最優(yōu)終端時(shí)刻的條件〔3-57〕式為整理課件因?yàn)橛烧齽t方程,所以,于是最優(yōu)控制再由正則方程,可得由上式求得整理課件

由初始條件,求得,故最優(yōu)軌跡為以終端條件代入上式,即求得最優(yōu)終端時(shí)刻整理課件火箭發(fā)射最優(yōu)程序問題。設(shè)火箭在垂直平面內(nèi)運(yùn)動(dòng),加速度與水平面夾角為,是控制作用,見圖3-4。令

例3-6(水平速度)(垂直速度)(水平距離)(垂直高度)整理課件圖3-4火箭發(fā)射示意圖整理課件忽略重力和空氣阻力時(shí),系統(tǒng)的狀態(tài)方程和初始條件為(3-58)整理課件要求選擇最優(yōu)控制程序,使性能指標(biāo)自由終端狀態(tài)為為最小。整理課件 因?yàn)橐笞钚。适亲杂蓡栴}。由給 定的終端狀態(tài)可得三個(gè)約束方程為解(3-59)整理課件

作哈密頓函數(shù)協(xié)態(tài)方程為(3-60)整理課件

橫截條件為即整理課件上式右端矩陣中的自變量已省略。由(3-59)式求出上式中的偏導(dǎo)數(shù),可得協(xié)態(tài)的終值為(3-61)整理課件

常數(shù)積分協(xié)態(tài)方程可得常數(shù)整理課件代入?yún)f(xié)態(tài)終值條件后,得故(3-62)整理課件由控制方程,得(3-63)即整理課件下面來積分狀態(tài)方程(3-58),為此將自變量變成。由(3-63)式得為了確定最優(yōu)程序,還需確定拉格朗日未定常數(shù)、。整理課件將上面關(guān)系代入狀態(tài)方程,即得積分上面兩式得整理課件由初始條件可求得(3-64)(3-65)整理課件

將上面的和代入狀態(tài)方程(3-58)的后兩式,積分并經(jīng)較復(fù)雜運(yùn)算得

(3-66)(3-67)整理課件

(注:另一解為,但這時(shí)由(3-67)式可得出與給定終端條件不符,故略去的解)由終端條件和(3-65)式得

故(3-68)整理課件由〔3-63〕式得于是(3-70)故(3-69)整理課件將終端條件和(3-69)式代入(3-64)式,可得(3-71)整理課件將終端條件,(3-69)式和(3-71)式代入(3-67)式可得(3-72)整理課件現(xiàn)在歸納一下所得的結(jié)果:由(3-72)式可確定,由(3-71)式確定最短時(shí)間,由(3-70)式即可求得最優(yōu)推力方向角。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論