非線(xiàn)性最優(yōu)控制問(wèn)題的保辛多層次求解方法_第1頁(yè)
非線(xiàn)性最優(yōu)控制問(wèn)題的保辛多層次求解方法_第2頁(yè)
非線(xiàn)性最優(yōu)控制問(wèn)題的保辛多層次求解方法_第3頁(yè)
非線(xiàn)性最優(yōu)控制問(wèn)題的保辛多層次求解方法_第4頁(yè)
非線(xiàn)性最優(yōu)控制問(wèn)題的保辛多層次求解方法_第5頁(yè)
已閱讀5頁(yè),還剩11頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、1193彭海軍高 強(qiáng)吳志剛鐘萬(wàn)勰文章編號(hào):10(X)-0887(2010) 10-119M0©應(yīng)用數(shù)學(xué)和力學(xué)編委會(huì)JSSN l(XXh()887非線(xiàn)性最優(yōu)控制問(wèn)題的保辛多層次求解方法彭海軍高強(qiáng)吳志剛2,鐘萬(wàn)勰,(1.大連理工大學(xué)工程力學(xué)系工業(yè)裝笛結(jié)構(gòu)分析國(guó)家重點(diǎn)實(shí)驗(yàn)室遼寧大連116024;2.大連理工大學(xué)航空航天學(xué)院工業(yè)裝備結(jié)構(gòu)分析國(guó)家重點(diǎn)實(shí)驗(yàn)室遼寧大連116()24)(我刊編委鐘萬(wàn)勰來(lái)稿)摘要:將非線(xiàn)性系統(tǒng)的最優(yōu)控制問(wèn)題導(dǎo)向Hamilton系統(tǒng)提出了求解非線(xiàn)性最優(yōu)控制問(wèn)題的保 辛多層次方法首先以時(shí)間區(qū)段兩端狀態(tài)為獨(dú)立變量并在區(qū)段內(nèi)采用grange插值近似狀態(tài)和 協(xié)態(tài)變量通過(guò)對(duì)偶變量

2、變分原理將非線(xiàn)性最優(yōu)控制問(wèn)題轉(zhuǎn)化為非線(xiàn)性方程組的求解然后,在保 辛算法的具依實(shí)施過(guò)程中提出了多層次求解思想,以2'類(lèi)算法為基礎(chǔ)由低層次到高層次加密離散 時(shí)間區(qū)段.利用Lagrange 值得到網(wǎng)格加密后的初始狀態(tài)與協(xié)態(tài)變量作為求解非線(xiàn)性方稈組的初 值,可提高計(jì)算效率數(shù)值算例驗(yàn)證了算法在求解效率與求解精度上的有效性.關(guān)鍵詞:非線(xiàn)性最優(yōu)控制;對(duì)偶變量;變分原浬;多層次迭代;保辛中圖分類(lèi)號(hào):()231.2;()241X1文獻(xiàn)標(biāo)志碼:ADOI: 10. 3879/j. issn. 1000-0887.2010. 10.006引 言線(xiàn)性系統(tǒng)的最優(yōu)控制問(wèn)題在理論分析以及實(shí)際應(yīng)用中都取得了顯著成果,尤

3、其在航空 航天領(lǐng)域得到比較廣泛的實(shí)際應(yīng)用隨著實(shí)際工程問(wèn)題越來(lái)越復(fù)雜,對(duì)最優(yōu)控制提出了更高的 要求,進(jìn)而非線(xiàn)性系統(tǒng)的最優(yōu)控制方法成為解決這些問(wèn)題的一個(gè)頗受關(guān)注的研究課題在 經(jīng)典文獻(xiàn)B中都講述了非線(xiàn)性最優(yōu)控制問(wèn)題的一些解決方案,包括梯度法、共覘梯度法、邊界 迭代法、擬線(xiàn)性化法以及鄰域最優(yōu)控制等等近年來(lái),文獻(xiàn)4采用迭代的思想將非線(xiàn)性最優(yōu) 控制問(wèn)題轉(zhuǎn)化為非線(xiàn)性?xún)牲c(diǎn)邊值問(wèn)題并采用Newton法求解文獻(xiàn)5 提出保辛攝動(dòng)方法求解 非線(xiàn)性最優(yōu)控制問(wèn)題文獻(xiàn)6綜合比較了級(jí)數(shù)展開(kāi)近似、狀態(tài)相關(guān)Riccati方程方法、序列Calerkin近似以及兩點(diǎn)邊值插值解等4種方法在求解非線(xiàn)性最優(yōu)控制問(wèn)題方面的優(yōu)缺點(diǎn)文獻(xiàn)7基于迭

4、代的思想將非線(xiàn)性最優(yōu)控制問(wèn)題轉(zhuǎn)化為在每一個(gè)時(shí)間步內(nèi)求解線(xiàn)性二次最優(yōu)控 制問(wèn)題并求解Kiccati微分方程文獻(xiàn)89將非線(xiàn)性最優(yōu)控制問(wèn)題轉(zhuǎn)化為參數(shù)優(yōu)化問(wèn)題求解.*收稿日期:2010-03-04 ;修訂日期:2010-08-30基金項(xiàng)目:國(guó)家自然科學(xué)基金資助項(xiàng)目(10632030; 10902020; 10721062);高等學(xué)校博士點(diǎn)基金資 助項(xiàng)目(20070141067);遼寧省博士啟動(dòng)基金資助項(xiàng)目(20081091 );遼寧省重點(diǎn)實(shí)驗(yàn)室資 助項(xiàng)冃(2009S018)作者簡(jiǎn)介:彭海軍(1982),男,河北邯鄲人,博士生(Tel: +86-411-84706574; E-mail: hjpengd

5、lut. edu.on);高強(qiáng)(1978),男,內(nèi)蒙古赤峰人,講師.博士(聯(lián)系人Tel: +86-411-84707608; E-mail: qgao dlul. en).非線(xiàn)性最優(yōu)控制系統(tǒng)從數(shù)學(xué)結(jié)構(gòu)上來(lái)講可以導(dǎo)向Hamilton體系,即可以采用Hamilton正 則方程描述Hamilton系統(tǒng)的一個(gè)主要性質(zhì)是其相流保持辛幾何結(jié)構(gòu)沢心匕近年來(lái).從動(dòng)力學(xué) 積分角度發(fā)展起來(lái)的變分時(shí)間積分方法逐漸在最優(yōu)控制領(lǐng)域得到發(fā)展該方法在一類(lèi)變量 Lagrange體系內(nèi)對(duì)連續(xù)的動(dòng)力學(xué)方程離散,并且由于采用離散形式的Euler-Lagrange方程而達(dá) 到離散方程過(guò)程保辛的目的因而保持了原有最優(yōu)控制系統(tǒng)的辛幾何結(jié)

6、構(gòu)有鑒于此,不僅 是動(dòng)力學(xué)數(shù)值積分方面,在非線(xiàn)性最優(yōu)控制的數(shù)值求解方面也應(yīng)當(dāng)設(shè)法保持Hamilton系統(tǒng)的 辛幾何結(jié)構(gòu)'.本文基于兩類(lèi)變量體系,采用兩端狀態(tài)變量表示的對(duì)偶變量變分原理"來(lái)達(dá)到整個(gè) Hamilton系統(tǒng)保辛的目的在連續(xù)時(shí)間離散成一系列區(qū)段的過(guò)程中,時(shí)間區(qū)段內(nèi)部的狀態(tài)和協(xié) 態(tài)變量采用Lagrange插值函數(shù)近似,并采用時(shí)間區(qū)段兩端狀態(tài)為獨(dú)立變量然后,根據(jù)對(duì)偶變 量變分原理導(dǎo)致的必要條件將非線(xiàn)性最優(yōu)控制問(wèn)題轉(zhuǎn)化為非線(xiàn)性方程組的求解,也就是說(shuō)采 用保辛的數(shù)值算法求解非線(xiàn)性系統(tǒng)的最優(yōu)控制問(wèn)題進(jìn)一步,在保持Hamilton系統(tǒng)的辛幾何 結(jié)構(gòu)基礎(chǔ)上提出了多層次求解方法用以提

7、高數(shù)值求解效率先將連續(xù)時(shí)間離散成稀疏時(shí)間區(qū) 段采用對(duì)偶變量保辛方法求解,然后采用將時(shí)間網(wǎng)格加密一倍,并將稀疏時(shí)間區(qū)段的數(shù)值結(jié)果 采用Lagrange插值的方法分配到新的時(shí)間節(jié)點(diǎn)上,以此作為初值再次求解非線(xiàn)性最優(yōu)控制問(wèn) 題將時(shí)間網(wǎng)格再加密一倍以此類(lèi)推直到得到滿(mǎn)意精度的數(shù)值結(jié)果這種多層次求解非線(xiàn)性迭 代問(wèn)題的思想可以較大幅度地提高收斂速度,減少迭代次數(shù)1非線(xiàn)性最優(yōu)控制與對(duì)偶變量變分原理(1)考慮非線(xiàn)性系統(tǒng)的最優(yōu)控制問(wèn)題,其狀態(tài)方程為 x(z) =/(x(0 ,w(z) 3),性能指標(biāo)為Z. =。(兀上山,(2)JI)其中,X是d維狀態(tài)向量上是P維控制向量.通過(guò)引入L略nm驢乘子入將狀態(tài)方程(1)作

8、為約束條件引入到性能指標(biāo)(2)中,采用變 分法得到關(guān)于最優(yōu)控制輸入的必要條件,進(jìn)一步將控制輸入”(門(mén)表示成狀態(tài)變量x與協(xié)態(tài)變 量A的函數(shù),即W(/)=g(x(/) ,A(/).此時(shí)Hamilton函數(shù)只是關(guān)于狀態(tài)變量x與協(xié)態(tài)變量A 兩類(lèi)變量的函數(shù)H(x9A9g(x9A) = 0(x(0 ,g(x,A),0 +Arf(x(t) ,g(x,A) 9t)那么Hamilton函數(shù)(3 )對(duì)應(yīng)的變分原理為A'x - H(x,A)dt9 8S =0.0作用量s取駐值,即對(duì)式(4)進(jìn)行變分:dlldx 8S= I (8x)T-Adt +dt + A*8x |(, = 0>(3)(4)(5)若認(rèn)

9、為在兩端邊界狀態(tài)給定,則可以在域內(nèi)得到Hamilton正則方程,求解此Hamilton正則方 程即可得到狀態(tài)和協(xié)態(tài)變量,進(jìn)而求出控制輸入.在數(shù)值求解Hamilton正則方程時(shí),可從另一個(gè)角度利用變分原理(5 ),即若認(rèn)為在域內(nèi)已 經(jīng)滿(mǎn)足Hamilton正則方程,則可以得到作用量與兩端狀態(tài)的關(guān)系:dS =- AjJdXo.(6)非線(xiàn)性最優(yōu)控制問(wèn)題的保辛多層次求解方法1195下面考慮以式(6)為出發(fā)點(diǎn),研究?jī)啥藸顟B(tài)作為獨(dú)立變量情況的多層次保辛算法求解非線(xiàn)性 最優(yōu)控制問(wèn)題.2以初始狀態(tài)變量必和終端狀態(tài)變量“為獨(dú)立狀態(tài)變量的保辛算法將整個(gè)非線(xiàn)性最優(yōu)控制問(wèn)題的求解時(shí)間(0山)等分成./個(gè)子區(qū)段,子區(qū)段的

10、長(zhǎng)度為其 中第j個(gè)子區(qū)段內(nèi)的狀態(tài)變量x(f)與協(xié)態(tài)變量入分別采用等間距加-1和"-1次Lagrange 插值:x(O = (M, ®I) j + (A/®/) i. +x,.,(7)A(O = (V®/) A.,(8)其中,巧“和巧表示第j個(gè)子區(qū)段最左端和最右端的狀態(tài)變量,而無(wú)由第j個(gè)子區(qū)段中間插值點(diǎn) 的狀態(tài)向量組成人由第j個(gè)子區(qū)段所有插值點(diǎn)的協(xié)態(tài)向量組成.由于將區(qū)段最左端和最右端 的狀態(tài)變量作為獨(dú)立變量,因此它們用普通的兀鬥和兀表示,而其他不獨(dú)立的狀態(tài)向量和協(xié)態(tài) 向量用形和人表示方程(7)和(8)中的/表示單位矩陣.其他符號(hào)的含義如下:M二也,也,-,

11、(9)N 范 N、,N“ ,NJ,(10)并且.t 1- t (7 1)77/(77? 1). ./ii也=11 ( I,.、( , “1,2,皿,(11)(12)yy _ fl f _ (八 1 ) ”( _ 1) * ;=i(i j)y/(n 1)符號(hào)g表示矩陣的Kronecker積,其意義為:k xl維矩陣A和sxt維矩陣B的Kronecker積為ks x It維矩陣A (g)B可以采用如下式子表示:(iuB 5B(13)A (x) B =:.:gB aklB將方程(7)和(8)的近似狀態(tài)和協(xié)態(tài)向量代入方程(4)表示的作用量,可得到22,無(wú),舛)=JJ (A*x -/(x,A)y(l/.

12、(14)Sj(XjZ)=statV/(x._I,xpxpAy) 因?yàn)榉匠?15)的駐值條件有方程(6)表明若認(rèn)為在域內(nèi)已經(jīng)滿(mǎn)足微分方程,則作用量應(yīng)該僅是兩端狀態(tài)的函數(shù),因此第j 個(gè)子區(qū)段內(nèi)的近似作用量為(15)dA.j二1,2,,/(17)(16)將所有子區(qū)段的近似作用量Sg 沖 相加,并對(duì)中間的狀態(tài)取駐值,可得到整個(gè)區(qū)域的近似 作用量,即非線(xiàn)性最優(yōu)控制問(wèn)題的保辛多層次求解方法#非線(xiàn)性最優(yōu)控制問(wèn)題的保辛多層次求解方法#s(w).戕(孕(宀), 因此有7(18)(19)as, as,、 于+ 嚴(yán)=0,;= 1,2,-,./- 1.d Xj3 x.得到整個(gè)求解區(qū)域上的近似作用量5(x0,xy)后,

13、根據(jù)方程(6)可給出(20)、 as 、 as° 紙o' J dXj因此,非線(xiàn)性最優(yōu)控制問(wèn)題被轉(zhuǎn)換為一組非線(xiàn)性方程(16).( 17)、( 19)和(20)的求解由 于非線(xiàn)性方程組的由來(lái)是基于對(duì)偶變量變分原理的所以說(shuō)這種求解非線(xiàn)性最優(yōu)控制問(wèn)題算 法是一種保辛的數(shù)值方法.為了方便實(shí)施計(jì)算,首先做如下定義:dS山,(21)汨丿:弦1入W g薯)'吩鐵訂制去,F=蛍:f, a m o其中 x(0 =(麻®I) X., + (Af ® Z) X. + (.億 ®/) Xy,則方程(16)、(17)、(19)和(20)可以表示為F + Ao =0;

14、= 0;= 0;+ Fi =0;- Aj = 0.=- Mm ® dH(22)(23)(24)(25) 本文采用Newton法求解非線(xiàn)性方程組,因此需要計(jì)算非線(xiàn)性方程組的Jacobi矩陣將所非線(xiàn)性最優(yōu)控制問(wèn)題的保辛多層次求解方法1197有向量排列為站;耳,心対用禹用;廚閃,x;T,方程組(25)按順序?qū)λ邢蛄壳髮?dǎo) 可得到Jacobi矩陣其形式為(26) 方程(26)中的具體元素的表達(dá)見(jiàn)附錄同時(shí)可得到非線(xiàn)性方程組Newton迭代所需要的右端 向量為(F 嚴(yán))(F/+,)r 丁(27)至此,完成了 Newton法求解非線(xiàn)性方程組的所需的Jacobi矩陣式(26)以及右端向量式(27 )

15、 從方程(26)可以看岀Ja(ol)i矩陣為稀疏帶狀對(duì)稱(chēng)矩陣,采用稀疏帶狀對(duì)稱(chēng)的線(xiàn)性代數(shù)方程組 求解算法可獲得良好的計(jì)算效率這里需要注意的是Jacobi矩陣的對(duì)稱(chēng)性正是算法保辛性質(zhì) 的體現(xiàn).在計(jì)算中,還應(yīng)該結(jié)合非線(xiàn)性最優(yōu)控制的終端邊界條件(終端狀態(tài)固定、自由)對(duì)Jacol)i 矩陣式(26)與右端向量式(27)做相應(yīng)的修改對(duì)于初始狀態(tài)必給定,而終端時(shí)間固定和終端狀態(tài)自由的邊界條件,未知變量為耳,口川臥足,理;巧,A;/;1;需要?jiǎng)h除Jacobi矩 陣K的前d行和前d列(d是狀態(tài)向量兀的維數(shù)),刪除右端向量F的前d行然后,求解得到未 知變量后,進(jìn)一步再利用以下方程求解協(xié)態(tài)變量,即(28)非線(xiàn)性最

16、優(yōu)控制問(wèn)題的保辛多層次求解方法#非線(xiàn)性最優(yōu)控制問(wèn)題的保辛多層次求解方法#對(duì)于初始狀態(tài)X)給定,而終端時(shí)間固定和終端狀態(tài)固定的邊界條件,未知變量為耳,入“:;云,足,£;用,罔八 需要?jiǎng)h除Jacobi矩陣的前/行和最后d行以及前d列和最后/列,并刪 除右端向量的前d行和最后d行通過(guò)求解得到未知變量,進(jìn)一步再利用以下兩個(gè)方程求解協(xié) 態(tài)變量,即入/ =豊=I 伉” A - M,” ® 薯)f (30)以上對(duì)邊界條件處理的說(shuō)明是為了容易理解,具體實(shí)現(xiàn)過(guò)程中為提高效率,對(duì)不同邊界條件可(29)非線(xiàn)性最優(yōu)控制問(wèn)題的保辛多層次求解方法#直接形成Jacobi矩陣和右端向量.3保辛多層次算法

17、以上部分給出了以區(qū)段兩端狀態(tài)為獨(dú)立變量的保辛算法,用以求解非線(xiàn)性最優(yōu)控制問(wèn)題. 而這種保辛算法歸結(jié)為非線(xiàn)性方程組的求解,那么非線(xiàn)性方程組迭代速度的快慢便成為非線(xiàn) 性最優(yōu)控制在線(xiàn)實(shí)施的主要決定因素因此,本文進(jìn)一步提出一種多層次求解算法,以提髙非 線(xiàn)性最優(yōu)控制問(wèn)題的求解速度,其主要思想是先在比較粗的網(wǎng)格劃分上求解,然后將粗網(wǎng)格上 的解插值到密網(wǎng)格上作為初值,再迭代求解具體實(shí)現(xiàn)過(guò)程如下:1) 對(duì)給定求解時(shí)間區(qū)域長(zhǎng)度為L(zhǎng)的非線(xiàn)性最優(yōu)控制問(wèn)題,最終希望得到將求解區(qū)域等分 為2丫份時(shí)的解;2) 首先將求解區(qū)域等分為2%(他 /V)份,并選取迭代初值,記k =3) 按照本文的保辛算法求解非線(xiàn)性最優(yōu)控制問(wèn)題,

18、求得各個(gè)離散時(shí)間點(diǎn)的狀態(tài)變量和協(xié) 態(tài)變量;第點(diǎn)-1層圖1多層次遞推實(shí)現(xiàn)4)如果達(dá)到1)的劃分要求,則結(jié)束;否則將 時(shí)間網(wǎng)格劃分加密一倍,并記+ 1,然后將狀 態(tài)變量和協(xié)態(tài)變量通過(guò)Lagrange插值分配到新增 的時(shí)間點(diǎn)上即通過(guò)插值式(7)和式(8)實(shí)現(xiàn)狀態(tài) 變量與協(xié)態(tài)變量的分配示意圖如圖1所示;非線(xiàn)性最優(yōu)控制問(wèn)題的保辛多層次求解方法12035)返回第3)步.多層次求解算法開(kāi)始時(shí),時(shí)間網(wǎng)格離散的區(qū)段數(shù)較少,因此非線(xiàn)性代數(shù)方程組的維數(shù)小, 并且收斂精度控制得較低,故迭代的計(jì)算量不大當(dāng)逐步加密網(wǎng)格劃分時(shí),計(jì)算已經(jīng)繼承上一 次i十算的結(jié)果雖然不理想但狀態(tài)變量與協(xié)態(tài)變量對(duì)真解的近似已經(jīng)好多了,故迭代的收

19、斂會(huì) 加快,迭代次數(shù)會(huì)降低.4數(shù)值算例算例1為了說(shuō)明算法在不同參數(shù)下的計(jì)算精度與效率問(wèn)題,首先考慮一個(gè)終端狀態(tài)固 定的非線(xiàn)性最優(yōu)控制問(wèn)題,極小化性能指標(biāo)如下:人二 t J(X + U2)(1/,2丿0系統(tǒng)的微分方程及初始與終端狀態(tài)為% = 2% + 2u-Jx , %(0) = 2, %(5) = 1.此問(wèn)題具有解析解最優(yōu)狀態(tài)x*(/),協(xié)態(tài)入氣()與控制輸入/Q)分別為= (8.483 061 678 223 284 884 5 x l(V4e屈 +1.413 365 256 205 272 720 3-e_7T/)2,A *(/) = ( - 1.490 388 765 892 852 x

20、+ o.ooi 198 966 464 225 +2.411 318 132 612 103e-2)/(x*(0),zz *(O =- 2( 0 A "(f)通過(guò)大量數(shù)值實(shí)驗(yàn)表明,狀態(tài)變量的插值參數(shù)加與協(xié)態(tài)變量的插值參數(shù)的最佳匹配情 況是皿二 +1,這種搭配計(jì)算精度與效率能夠達(dá)到最佳因此,在這里將狀態(tài)變量與協(xié)態(tài)變量 分別采用m =2,7? = 1 ;ni =3,7? =2和m = 4,n = 3這3種插值方法求解此問(wèn)題將求解區(qū)域等 分為16份,狀態(tài)變量、協(xié)態(tài)變量與控制輸入的數(shù)值精度如圖2所示,其中虛線(xiàn)、點(diǎn)畫(huà)線(xiàn)和實(shí)線(xiàn) 分別表示m =2,7? = 1 ;?7? =3= 2和7 =4,n

21、= 3計(jì)算的結(jié)果,可以看到隨著插值次數(shù)的增加,計(jì)算精度也隨之提高圖3給出了性能指標(biāo)隨步長(zhǎng)減小的變化情況,可以看到隨著步長(zhǎng)的減 小,性能指標(biāo)趨于收斂狀態(tài)變量、協(xié)態(tài)變量與控制輸入的數(shù)值精度隨步長(zhǎng)減小的變化如圖4 所示,從圖4可以計(jì)算得到本文算法的精度,即參數(shù)為 2 =2,z? = 1 ;/7? = 3,n =2和m =4,a = 3 這3種情況下,算法分別為2階、4階和6階精)5. Hamilton函數(shù)的相對(duì)誤差如圖5所示.對(duì)于此問(wèn)題,假如將求解區(qū)域劃分為"份,即可宜接求解,也可按照第3節(jié)的多層次算法 求解在多層次求解過(guò)程中,我們首先將求解區(qū)域劃分為2%(他 N)份,然后按照第3節(jié)的 多

22、層次算法求解表1給出了多層次求解與直接求解的計(jì)算效率比較,可以看到多層次求解比 直接求解的效率顯著提高.表1多層次求解與直接求解CPU時(shí)間的比較(飩=4)N =5N =6N =7N =8N =9N 二 10多層次求解(加=2,”=1)0. 1938710. 28()8160.5858000.9564651.3835912.781 027直接求解(皿=2,n =1)0. 2387460.5275951.2514142.3262524.6562208.859 753多層次求解(m=3,71=2)0.2720810.4311580.7548521.2916982.2768724.493 142直接求

23、解(皿=3=:2)0. 3495190. 9055911 690 4733.7314067.77969220. (X)6 846多層次求解(加=4=3)0. 362()73().71()1311.1781311.8873483.6761047.495 801直接求解(m =4=:3)0. 7063641.5585773.116()715.79141110.85635529.247 ()88加=4 n=3加=3,=2m=2.n=m=4.n=3加=3, n=2m=2, w = lw=4, w=3/w=3, w=2m=2, w = l圖2狀態(tài)、協(xié)態(tài)與控制輸入的相對(duì)誤差 (m = 2= 1 ;z

24、87; = 3 m = 2 ;圖3性能指標(biāo)隨不同時(shí)間步長(zhǎng)的變化(t = 5/2v;Az = 2,3,。)w=4, w=3m = 4, n = 3)圖4 狀態(tài)、協(xié)態(tài)與控制輸入隨不同時(shí)間圖5 Hamilton函數(shù)相對(duì)誤差隨不同步長(zhǎng)變化的相對(duì)誤差時(shí)間步長(zhǎng)變化情況算例2本算例考慮另一種邊界條件,即考慮一個(gè)終端狀態(tài)自由的強(qiáng)非線(xiàn)性最優(yōu)控制問(wèn) 題其性能指標(biāo)為r ifJe = 2%|(zf) + 2 兀;(“)+(x, + %2 +,)(k,J 0系統(tǒng)的微分方程及初始狀態(tài)為X| = ( 1 - x - %2 )X1 一兀2 + ",X,(0) = 0,x2 = x,%2(0) = 3 由于這個(gè)強(qiáng)非線(xiàn)

25、性最優(yōu)控制問(wèn)題沒(méi)有分析解,因此采用Matlab提供的l)v,)4c函數(shù)求解H“mil 伽兩端邊值問(wèn)題,得到的系統(tǒng)狀態(tài)/,協(xié)態(tài)入)與控制輸入/(/)作為參考解(其中 hvp4c函數(shù)的絕對(duì)誤差和相對(duì)誤差選項(xiàng)分別設(shè)定為1()-12和10-*°).同樣,根據(jù)大量的數(shù)值計(jì)算,狀態(tài)變量的插值參數(shù)加與協(xié)態(tài)變量的插值參數(shù)的最佳匹配 情況是m = n + 1.因此,在這里仍然將狀態(tài)變量與協(xié)態(tài)變量分別采用m = 2 , z? = 1= 3,/?= 2和加=4,n =3這3種插值方法求解此問(wèn)題將求解區(qū)域等分為16份時(shí)狀態(tài)變量、協(xié)態(tài)變量與 控制輸入的相對(duì)誤差如圖6所示,其中虛線(xiàn)、點(diǎn)畫(huà)線(xiàn)和實(shí)線(xiàn)分別表示m =

26、2,n = 1 = 3,w =2 和m=4.n=3計(jì)算的結(jié)果,同樣隨著插值次數(shù)的增加,計(jì)算精度也隨之提高圖7給出了性能 指標(biāo)隨步長(zhǎng)減小的變化情況,可以看到隨著步長(zhǎng)的減小,性能指標(biāo)趨于收斂狀態(tài)變量、協(xié)態(tài)變量與控制輸入數(shù)值計(jì)算精度隨步長(zhǎng)減小的變化以及Hamilton函數(shù)的相對(duì)誤差如圖8和圖9所 示.從圖8中可以計(jì)算得到本文算法的精度,從左到右在參數(shù)為m = 2 , n = 1 ; m =3,幾二2和 zn=4,n=3的情況下算法分別為是2階、4階和6階精度表2給出了多層次求解與直接求解的計(jì)算效率比較,同樣可以看到多層次求解比直接求 解的效率顯著提高.圖7性能指標(biāo)隨不同時(shí)間步長(zhǎng)的變化(t = 6/2

27、' ; N = 4,5,()圖8狀態(tài)、協(xié)態(tài)與控制輸入隨不同時(shí)間圖9 Hamilton函數(shù)相對(duì)誤差隨不同非線(xiàn)性最優(yōu)控制問(wèn)題的保辛多層次求解方法1205時(shí)間步長(zhǎng)變化情況步長(zhǎng)變化的相對(duì)誤差表2多層次求解與直接求解CPU時(shí)間的比較(A; = 4)N =5N =6N =7N =8N =9N =10多層次求解(m :=2tn=1)0. 1491320. 2823060.5226660.9720411.7412153.86873()直接求解(m =2=:1)0. 1724330.3349830.7650281.4381752.7133925.360466多層次求解(m := 3,”=2)0. 238

28、5970.3652850.6906891.4573582.9531556.655046直接求解(加=3,” =:2)0. 28()5000.5494771.2622982.2304304.4133728.810797多層次求解(加:=4.n=3)0. 3846430.5981301. 1309182.2997524.8567729. 128909直接求解(巾=4=:3)0.4438850.9236()41.9611413.6850397.39452315.1614345結(jié) 論采用對(duì)偶變量變分原理并以時(shí)間區(qū)段兩端狀態(tài)為獨(dú)立變量,將非線(xiàn)性最優(yōu)控制問(wèn)題轉(zhuǎn)化 為非線(xiàn)性方程組的求解,此方法可保持原Ham

29、ilton系統(tǒng)的辛幾何結(jié)構(gòu)多層次的求解思想進(jìn) 一步提高了非線(xiàn)性最優(yōu)控制問(wèn)題的求解效率使得在線(xiàn)實(shí)時(shí)計(jì)算成為可能通過(guò)數(shù)值算例得到 如下結(jié)論:1 )大量數(shù)值實(shí)驗(yàn)表明,狀態(tài)變量的插值參數(shù)皿與協(xié)態(tài)變量的插值參數(shù)的最佳匹配情況 是m = n + 1,這種參數(shù)搭配計(jì)算精度與效率能夠達(dá)到最佳,此時(shí)的算法精度為2階;2) 非線(xiàn)性最優(yōu)控制的性能指標(biāo)隨網(wǎng)格加密而趨于收斂,而Hamilton函數(shù)的相對(duì)誤差隨 網(wǎng)格加密也越來(lái)越小;3) 在采用本文保辛算法的基礎(chǔ)上,通過(guò)實(shí)施多層次求解算法,可顯著提高求解效率.附 錄每個(gè)子區(qū)段內(nèi)子矩陣K的具體表達(dá)式:略(M網(wǎng)®笄)山,丿o a x丿j% =-f(A/.Af

30、4;0) dt = (K£)T,K 厶=f 他n 3-MN 0 翳)d/ = (KJ,昭(mm器)dt = (KU,理ar.&3 = J:dt = (K£)T,略=-fJ® 0) dt = (KGSK. =-fJ 何N® 需)<k,K£ = JJf =(&JT,m a x 丿 j致謝 感謝大連理工大學(xué)青年教師培養(yǎng)基金和大連理工大學(xué)理學(xué)基金(SFDUTO7OO2)對(duì) 本文的資助.參考文獻(xiàn):| 1 |Sage A P, White C C. Optimum Systems Control M . New Jersey: Pre

31、ntice-Hal1, 1977.2 Bryson A E, IIo Y C. Applied Optimal Conhx)l M. New York: Hemisphere Publishing Corporation, 1975.3 鐘萬(wàn)勰,吳志剛,譚述君.狀態(tài)空間控制理論與計(jì)算M.北京:科學(xué)出版社,2007.4 Schley C II, Lee I. Optimal control computation by the Newton-Raplison method and the Ric- cati transformation| J . IEEE Transactions on Aut

32、omatic Control. 1967, 12(2): 139-144.5 譚述君鐘萬(wàn)勰.非線(xiàn)性最優(yōu)控制系統(tǒng)的保辛攝動(dòng)近似求解J.自動(dòng)化學(xué)報(bào),2007, 33(9): 1004-1008.6 Beeler S C. Trail II T, Banks II T Feedback control methodologies for nonlinear systemsJ.Joumal of Optimization Theory and Applications, 2000, 107( 1) : 1-33.7 Ncdeykovic N. New algorithms for unconstrai

33、ned nonlinear optimal control problems J. IEEE Transactions on Automatic Contwl, 1981,26(4): 868-884.f 8 Benson D A, Iluiitmgton G T, Thorvaldsen T P, Rao A V. Direct trajectory optimization and costate estimation via an orthogonal collocation method J Journal of Guidance Control and Dynamics, 2(X)6

34、, 29(6) : 1435-1439.9 Badakhshan K P, Kamyad A V. Numerical solution of nonlinear optimal control problems vising nonlinear programming J . Applied Mathematics and Computation. 2007, 187 ( 2): 1511-1519.10 Arnold V I. Mathematical Methods of Classical Mechanics NlJ. New York: Springer-Verlag, 1989.1

35、1 高強(qiáng),譚述君,張洪武,鐘萬(wàn)勰.基于對(duì)偶變量變分原理和兩端動(dòng)量獨(dú)立變量的保辛方法J. 動(dòng)力學(xué)與控制學(xué)扌(?,2009, 7(2): 97-103.12 Lew A. Marsden J E, Ortiz M. West M Variational time integrators J. International Journal for Numerical Methods in Engineering. 2004, 60: 153-212.13 de Leon M. de Diego D Martin, Santamaria- Merino A. Discrete variational i

36、ntegrators and optimal control theory J. Advances in Computational Mathematics. 2007, 26( 1/3): 251-268.14 Sriiiivas R, Vadali R S Optimal finite-time feedback controllers for nonlinear systems with temimal constraints J. Journal of Guidance Conhvl and Dynamics. 2006, 29(4): 921-928.Symplectic Multi-Level Method for SolvingNonlinear Optimal Control ProblemPENG Hai-jun*, GAO Qiang1, WU Zhi-gang2, ZHONG Wan-xie*(1. Department of Engineering Mechanics. State Key Laboratory of StructuredAnalysis of Industrial Equipment. Dalian Uni ver

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論