最優(yōu)控制講授提綱_第1頁(yè)
最優(yōu)控制講授提綱_第2頁(yè)
最優(yōu)控制講授提綱_第3頁(yè)
最優(yōu)控制講授提綱_第4頁(yè)
最優(yōu)控制講授提綱_第5頁(yè)
已閱讀5頁(yè),還剩86頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

最優(yōu)控制講授提綱第一頁(yè),共九十二頁(yè),2022年,8月28日使用說(shuō)明講課開(kāi)始時(shí),學(xué)生需人手一冊(cè)教材,已可開(kāi)講。講授提綱用幻燈片放映,僅起畫(huà)龍點(diǎn)睛作用(若無(wú)幻燈片放映,可用板書(shū)代之)。關(guān)鍵是:任課教師是否習(xí)慣此種講課方式。實(shí)踐表明:學(xué)生的收效卻更好。任課教師都有自己的習(xí)慣、風(fēng)格,都喜愛(ài)自己的講稿,因此,只適宜于列出講授提綱供參考,逐次的講稿宜自己用PowerPoint編寫(xiě)。此時(shí),教材和講授提綱可供參照,并亦可各自按需補(bǔ)充些內(nèi)容。此外,講課進(jìn)度的安排也因人而異,有40學(xué)時(shí)全講課的,有壓縮課時(shí)并添加大作業(yè)的,有寫(xiě)讀文獻(xiàn)的報(bào)告的,故不宜編寫(xiě)劃一的講稿(寫(xiě)了也是白寫(xiě))。2第二頁(yè),共九十二頁(yè),2022年,8月28日緒論從經(jīng)典的反饋控制到最優(yōu)控制從特點(diǎn)看控制器設(shè)計(jì)經(jīng)歷的“改朝換代”

3第三頁(yè),共九十二頁(yè),2022年,8月28日特

點(diǎn)

經(jīng)典反饋控制最優(yōu)控制上世紀(jì)40-50年代起的炮火控制SISO,輸入輸出描寫(xiě)低階傳遞函數(shù)應(yīng)無(wú)未建模動(dòng)態(tài)手算,作圖,憑經(jīng)驗(yàn)不計(jì)控制能耗模擬器件實(shí)現(xiàn)軍工及民用工業(yè)上世紀(jì)60年代起延伸至今的航空航天MIMO,內(nèi)部描寫(xiě)低階狀態(tài)方程應(yīng)無(wú)未建模動(dòng)態(tài)計(jì)算機(jī),優(yōu)化,算法考慮控制能耗數(shù)字器件實(shí)現(xiàn)航空航天工業(yè)4第四頁(yè),共九十二頁(yè),2022年,8月28日第1章變分法引言變分問(wèn)題求解的兩條路本章的重要性5第五頁(yè),共九十二頁(yè),2022年,8月28日

泛函定義1-1(泛函)圖1-1弧長(zhǎng),目標(biāo)泛函定義1-2(函數(shù)空間中的距離)圖1-2曲線(xiàn)間的距離定義1-3(n級(jí)ε鄰區(qū)和泛函的局部極值)圖1-3泛函求局部極值定義1-4(泛函的全局極值)6第六頁(yè),共九十二頁(yè),2022年,8月28日

變分的推演泛函求極值從式(1-1)推導(dǎo)式(1-6)的過(guò)程:寫(xiě)出目標(biāo)值的差,式(1-2)用導(dǎo)數(shù)中值定理,得式(1-5)式(1-5)的第二項(xiàng)為高階無(wú)窮小改用變分記號(hào),式(1-6)7第七頁(yè),共九十二頁(yè),2022年,8月28日(續(xù))變分的推演式(1-1)的被積函數(shù)用Taylor

級(jí)數(shù)展開(kāi)后的線(xiàn)性主部,即式(1-6)第一項(xiàng)的被積函數(shù)定義1-5(函數(shù)的一次變分)式(1-7),式(1-8)定義1-6(泛函的一次變分)式(1-9)8第八頁(yè),共九十二頁(yè),2022年,8月28日(續(xù))變分的推演定義

1-7(泛函的二次變分)式(1-10)泛函的高次變分,式(1-11)泛函極值存在的必要條件,式(1-12)泛函局部極大值存在的充分條件,式(1-13)泛函局部極小值存在的充分條件,式(1-14)9第九頁(yè),共九十二頁(yè),2022年,8月28日

Euler方程和橫截條件泛函求極值從式(1-16)推導(dǎo)式(1-21)的過(guò)程:用分部積分得式(1-18)用推論1-1得式(1-19)及式(1-20)用推論1-2得式(1-21)TPBVP(兩點(diǎn)邊值問(wèn)題)例1-310第十頁(yè),共九十二頁(yè),2022年,8月28日

向量情況泛函求極值從式(1-25)推導(dǎo)式(1-32)的過(guò)程:成對(duì)應(yīng)用式(1-18),得式(1-26)分類(lèi)及合并,得式(1-27)仿式(1-21)及式(1-23),得式(1-30)

及式(1-31)向量形式,式(1-32)11第十一頁(yè),共九十二頁(yè),2022年,8月28日

有約束的情況

函數(shù)的約束優(yōu)化與Lagrange乘子式(1-33)化為無(wú)約束優(yōu)化,式(1-34)兩個(gè)默認(rèn)的特點(diǎn)函數(shù)的向量約束優(yōu)化與Lagrange乘子向量式(1-35)12第十二頁(yè),共九十二頁(yè),2022年,8月28日(續(xù))有約束的情況

化為無(wú)約束優(yōu)化,式(1-37)兩個(gè)默認(rèn)的特點(diǎn)泛函的約束優(yōu)化約束方程變量多、方程少化為無(wú)約束優(yōu)化定理1-1的敘述:式(1-39)與式(1-40)等價(jià)

13第十三頁(yè),共九十二頁(yè),2022年,8月28日(續(xù))有約束的情況

定理1-1的證明過(guò)程:為何要分兩步走第1步證明式(1-40)改寫(xiě)為式(1-42)泛函極值存在的必要條件,式(1-43)結(jié)合約束方程求解,結(jié)果滿(mǎn)足約束方程,式(1-40)的解即為式(1-39)的解第2步證明14第十四頁(yè),共九十二頁(yè),2022年,8月28日(續(xù))有約束的情況

式(1-39)的構(gòu)成:式(1-25)及約束方程式(1-25)所示泛函極值存在的必要條件,式(1-44)對(duì)約束方程取一次變分,式(1-45)即式(1-46)構(gòu)造式(1-49)式(1-44)的第一式與式(1-49)合成,得式(1-51)用約束方程和式(1-51),構(gòu)造式(1-52)15第十五頁(yè),共九十二頁(yè),2022年,8月28日(續(xù))有約束的情況

式(1-53)與式(1-52)的差別,得式

(1-55)及式(1-56),式(1-39)的解即為式(1-40)的解兩步證明的完成,才說(shuō)明式(1-39)與式(1-40)完全等價(jià)定理1-1推廣到微分系統(tǒng)16第十六頁(yè),共九十二頁(yè),2022年,8月28日

端點(diǎn)可變的情況兩端可變可化為一端可變,終端可變目標(biāo)值的差推演得式(1-61)利用積分中值定理及式(1-6),式

(1-18)由式(1-61)得式(1-62)圖1-4與式(1-63)從式(1-64)得式(1-65)推廣到式(1-67)17第十七頁(yè),共九十二頁(yè),2022年,8月28日

變分的另一種定義定義1-8(函數(shù)的一次變分)定義1-9(泛函的一次變分)式(1-69)對(duì)β求導(dǎo),得J的一次變分,式(1-71)式(1-72)同式(1-9)18第十八頁(yè),共九十二頁(yè),2022年,8月28日變分與Fréchet微分定義1-10(Fréchet微分)線(xiàn)性逼近的誤差ε,式(1-74)對(duì)照

圖1-5及式(1-75)規(guī)定了線(xiàn)性逼近方式Fréchet微分,式(1-76)計(jì)算Fréchet微分的方法,式(1-77)泛函的一次變分即Fréchet微分,對(duì)照式(1-78),式(1-79)19第十九頁(yè),共九十二頁(yè),2022年,8月28日

小結(jié)

泛函求極值→變分→常微分方程的TPBVP本章僅為尋求極值曲線(xiàn),并未涉及尋求極值曲面變分法的現(xiàn)代進(jìn)展為變分原理(不是第5章的最大值原理)20第二十頁(yè),共九十二頁(yè),2022年,8月28日第2章連續(xù)系統(tǒng)最優(yōu)控制

引言

了解受控對(duì)象→建?!岢龈拍钚阅繕?biāo)→優(yōu)化問(wèn)題提法式(2-1)Bolza問(wèn)題,Lagrange問(wèn)題,Mayer問(wèn)題折衷?xún)?yōu)化如何套用第1章公式21第二十一頁(yè),共九十二頁(yè),2022年,8月28日

時(shí)間端點(diǎn)固定的情況

式(2-2)的背景化為無(wú)約束優(yōu)化問(wèn)題式(2-3),Hamilton函數(shù)式(2-3)取一次變分,分兩部分式(2-7)由式(2-4)及式(2-6)組成橫截條件,伴隨方程,耦合方程,狀態(tài)方程,式(2-10)22第二十二頁(yè),共九十二頁(yè),2022年,8月28日(續(xù))時(shí)間端點(diǎn)固定的情況

沿最優(yōu)軌線(xiàn)H為常量的條件橫截條件三種情況TPBVP例2-1,例2-2,例2-3,例2-423第二十三頁(yè),共九十二頁(yè),2022年,8月28日

有終端函數(shù)約束的情況

式(2-60)的背景化為無(wú)約束優(yōu)化問(wèn)題,式(2-61)式(2-61)取一次變分,式(2-63)橫截條件,伴隨方程,耦合方程,狀態(tài)方程,終端函數(shù),式(2-67)例2-524第二十四頁(yè),共九十二頁(yè),2022年,8月28日

終時(shí)不指定的情況式(2-78)的背景化為無(wú)約束優(yōu)化問(wèn)題,式(2-79)式(2-79)取一次變分,分三部分式(2-84)由式(2-80),式(2-

81)及式(2-83)組成橫截條件,伴隨方程,耦合方程,狀態(tài)方程,終端函數(shù),式(2-88)例2-625第二十五頁(yè),共九十二頁(yè),2022年,8月28日考慮其它幾種約束

積分約束化為微商約束和終態(tài)約束狀態(tài)和控制的等式約束狀態(tài)和控制的不等式約束用松弛變量化為狀態(tài)和控制的等式約束角隅條件,式(2-120)26第二十六頁(yè),共九十二頁(yè),2022年,8月28日用符號(hào)數(shù)學(xué)工具箱

求TPBVP的解析解

見(jiàn)程序集

27第二十七頁(yè),共九十二頁(yè),2022年,8月28日

小結(jié)

TPBVP的解析解多謝MATLAB的符號(hào)數(shù)學(xué)工具箱,它改變了求取TPBVP的解析解的面貌要關(guān)注符號(hào)計(jì)算的進(jìn)展(包括新版本MATLAB中的符號(hào)數(shù)學(xué)工具箱)確定性最優(yōu)控制開(kāi)環(huán)與閉環(huán)不分28第二十八頁(yè),共九十二頁(yè),2022年,8月28日第3章線(xiàn)性連續(xù)系統(tǒng)的

二次型調(diào)節(jié)器引言?xún)?yōu)化問(wèn)題提法,式(3-1)物理意義重視LQR的原因29第二十九頁(yè),共九十二頁(yè),2022年,8月28日有限時(shí)間(狀態(tài))調(diào)節(jié)器

時(shí)變情況式(3-1)化為無(wú)約束優(yōu)化問(wèn)題泛函極值存在的必要條件:橫截條件,伴隨方程,耦合方程,狀態(tài)方程TPBVP,式(3-6)Hamilton矩陣Г(t)式(3-7)→式(3-12)矩陣Riccati微分方程,式(3-17)30第三十頁(yè),共九十二頁(yè),2022年,8月28日

全狀態(tài)反饋,Kalman增益,式(3-19)P(t)的性質(zhì)對(duì)稱(chēng),半正定P(t)的計(jì)算,Euler法最優(yōu)反饋控制的結(jié)構(gòu),圖3-1x(t)的重構(gòu),圖3-2對(duì)加權(quán)矩陣的要求31(續(xù))有限時(shí)間(狀態(tài))調(diào)節(jié)器第三十一頁(yè),共九十二頁(yè),2022年,8月28日

(續(xù))有限時(shí)間(狀態(tài))調(diào)節(jié)器

非時(shí)變情況式(3-1)→式(3-1)’式(3-17)→式(3-17)’式(3-18)→式(3-18)’式(3-19)→式(3-19)’P(t)的解析解,式(3-28),幾種解法例3-1,例3-2觀察終時(shí)tf對(duì)Kalman增益K(t)的影響見(jiàn)程序集和圖3-3

32第三十二頁(yè),共九十二頁(yè),2022年,8月28日(續(xù))有限時(shí)間(狀態(tài))調(diào)節(jié)器P(t)的數(shù)值解見(jiàn)程序集33第三十三頁(yè),共九十二頁(yè),2022年,8月28日有限時(shí)間輸出調(diào)節(jié)器

優(yōu)化問(wèn)題提法式(3-58)矩陣Riccati微分方程,式(3-60)全狀態(tài)反饋,Kalman增益K(t)式(3-62)34第三十四頁(yè),共九十二頁(yè),2022年,8月28日無(wú)限時(shí)間輸出調(diào)節(jié)器

優(yōu)化問(wèn)題提法,式(3-63)

定理3-1有4部份:(a)

P(t)=Pbar=const的充要條件為(A,B)能穩(wěn)定能觀性分解,式(3-66)代入系數(shù)矩陣,式(3-64)即式(3-68)從式(3-69)的第二式、第三式和邊界條件得P12(t)=O

,P22(t)=O,得式(3-70)不能觀極點(diǎn)在A22中,不影響P(t)35第三十五頁(yè),共九十二頁(yè),2022年,8月28日(續(xù))無(wú)限時(shí)間輸出調(diào)節(jié)器

設(shè)能觀,不會(huì)影響證明P(t)=Pbar=const從能控性分解{式(3-71)}出發(fā)證必要條件(能穩(wěn)定):

設(shè)(A,B)不能穩(wěn)定(不穩(wěn)定極點(diǎn)不能控)不能控極點(diǎn)在A22中,輸出z(t)和J都發(fā)散按式(3-25),P(t)不存在,Pbar不存在證充分條件(能穩(wěn)定):設(shè)能穩(wěn)定(不穩(wěn)定極點(diǎn)能控)式(3-73)說(shuō)明P(t)有上界36第三十六頁(yè),共九十二頁(yè),2022年,8月28日(續(xù))無(wú)限時(shí)間輸出調(diào)節(jié)器

式(3-73)單調(diào)非減,得P(t)單調(diào)非減有唯一極限P(t)=Pbar=const(b)若能穩(wěn)定,能檢測(cè),則唯一的Pbar半正定

P(t)=Pbar=const,式(3-64)退化為矩陣Riccati代數(shù)方程,式(3-65),前已證有唯一極限Pbar

能檢測(cè)(不能觀極點(diǎn)穩(wěn)定),不考慮不能觀部分由式(3-24)及式(3-25)得Pbar半正定(c)u(t)穩(wěn)定的充要條件為能穩(wěn)定,能檢測(cè)37第三十七頁(yè),共九十二頁(yè),2022年,8月28日(續(xù))無(wú)限時(shí)間輸出調(diào)節(jié)器證必要條件:必需能穩(wěn)定和能檢測(cè),否則不穩(wěn)定極點(diǎn)不能控,不能觀極點(diǎn)不穩(wěn)定證充分條件:能控性分解{式(3-71)},得式(3-75)從式(3-75)可寫(xiě)出式(3-76),解出P11(t)能控性分解中的A11含能控的極點(diǎn)(包括不穩(wěn)定的極點(diǎn)),A11-B1R-1(B1)TP11漸近穩(wěn)定A22含不能控的極點(diǎn)(但包括穩(wěn)定的極點(diǎn))

38第三十八頁(yè),共九十二頁(yè),2022年,8月28日(續(xù))無(wú)限時(shí)間輸出調(diào)節(jié)器

(A11,B1)能控包含(A11,B1)能穩(wěn)定,按本定理

(a)

P11(t)=P11bar=const的充要條件為(A11,B1)能穩(wěn)定最優(yōu)反饋控制為式(3-77)反饋系統(tǒng)為式(3-78)分塊上三角形矩陣的特征值取決于對(duì)角塊各矩陣的,因A11-B1R-1(B1)TP11漸近穩(wěn)定及A22漸近穩(wěn)定,故反饋系統(tǒng)漸近穩(wěn)定39第三十九頁(yè),共九十二頁(yè),2022年,8月28日(續(xù))無(wú)限時(shí)間輸出調(diào)節(jié)器

(d)設(shè)Q’正定,Pbar正定的充要條件為能觀證必要條件(能觀):

設(shè)部分能觀,能觀性分解,式(3-66),在本定理(a)中有式(3-70)detP(t)=0,P(t)非正定,Pbar非正定證充分條件(能觀):反設(shè)能觀,但Pbar非正定

存在x0≠0,不加控制,卻可使輸出為0,荒謬,故Pbar正定40第四十頁(yè),共九十二頁(yè),2022年,8月28日(續(xù))無(wú)限時(shí)間輸出調(diào)節(jié)器

Pbar的解析解令非異變換T,式(3-82)對(duì)Hamilton矩陣Г可驗(yàn)證式(3-83)式(3-84)表示Г陣有特征值λ式(3-85)表示Г陣有特征值-λ

Г陣無(wú)復(fù)特征值模態(tài)陣M使Г陣分塊對(duì)角化,式(3-87)有相異特征值時(shí),分塊對(duì)角化

41第四十一頁(yè),共九十二頁(yè),2022年,8月28日(續(xù))無(wú)限時(shí)間輸出調(diào)節(jié)器

有重復(fù)特征值時(shí),Jordan塊從式(3-87)→式(3-92)Pbar=M21(M11)-1見(jiàn)程序集Pbar的數(shù)值解見(jiàn)程序集用控制系統(tǒng)工具箱見(jiàn)程序集

42第四十二頁(yè),共九十二頁(yè),2022年,8月28日使用LQR的系統(tǒng)的穩(wěn)定裕量式(3-102)→式(3-109),Kalman不等式單輸入系統(tǒng)的Kalman不等式式(3-110)→式(3-111)系統(tǒng)方框圖,圖3-6開(kāi)環(huán)傳遞函數(shù)與開(kāi)環(huán)頻率特性圖3-7,頻率特性幅度余量無(wú)限大相位余量至少600以全狀態(tài)反饋為條件

43第四十三頁(yè),共九十二頁(yè),2022年,8月28日小結(jié)

有限時(shí)間調(diào)節(jié)器的設(shè)計(jì),只需求解矩陣Riccati微分方程,為終值問(wèn)題,它比TPBVP容易解無(wú)限時(shí)間調(diào)節(jié)器的設(shè)計(jì),僅需求解矩陣Riccati代數(shù)方程,它又比有限時(shí)間調(diào)節(jié)器的設(shè)計(jì)簡(jiǎn)單,又容易實(shí)現(xiàn)有限時(shí)間調(diào)節(jié)器的設(shè)計(jì),得K(t)無(wú)限時(shí)間調(diào)節(jié)器的設(shè)計(jì),得K44第四十四頁(yè),共九十二頁(yè),2022年,8月28日(續(xù))小結(jié)必須先選取幾組加權(quán)矩陣Q及R,通過(guò)設(shè)計(jì)和仿真,修改Q及R,直至獲得滿(mǎn)意的暫態(tài)過(guò)程,控制器設(shè)計(jì)才告終LQR的優(yōu)異性能(幅度余量無(wú)限大,相位余量至少600)以全狀態(tài)反饋為條件LQR是自動(dòng)控制理論發(fā)展中的一個(gè)里程碑(雖然有缺點(diǎn))45第四十五頁(yè),共九十二頁(yè),2022年,8月28日第4章離散系統(tǒng)最優(yōu)控制引言?xún)煞N離散系統(tǒng)優(yōu)化問(wèn)題提法離散變分法與Euler方程

泛函求極值(無(wú)約束)泛函的一次變分

式(4-3),式(4-4)

46第四十六頁(yè),共九十二頁(yè),2022年,8月28日(續(xù))離散變分法與Euler方程

泛函極值存在的必要條件式(4-5)Euler方程和橫截條件式(4-8)

47第四十七頁(yè),共九十二頁(yè),2022年,8月28日

離散系統(tǒng)最優(yōu)控制

泛函求極值

式(4-9)化為無(wú)約束優(yōu)化問(wèn)題式(4-10),Lagrange乘子向量λ(k+1)泛函極值存在的必要條件橫截條件,伴隨方程,耦合方程,狀態(tài)方程,式(4-15)例4-1

48第四十八頁(yè),共九十二頁(yè),2022年,8月28日有限時(shí)間離散LQR問(wèn)題時(shí)變情況泛函求極值,式(4-17)泛函極值存在的必要條件

伴隨方程,耦合方程,橫截條件兩點(diǎn)邊值問(wèn)題,式(4-24),Hamilton矩陣H(k)矩陣Riccati差分方程三種形式式(4-26a),式(4-26b),式(4-26c)最優(yōu)反饋控制結(jié)構(gòu),圖4-1式(4-27),式(4-28),Kalman增益K(k)

49第四十九頁(yè),共九十二頁(yè),2022年,8月28日(續(xù))有限時(shí)間離散LQR問(wèn)題非時(shí)變情況

泛函求極值,式(4-17)’矩陣Riccati差分方程三種形式式(4-26a)’,式(4-26b)’,式(4-26c)’最優(yōu)反饋控制結(jié)構(gòu)式(4-27)’,式(4-28)’,Kalman增益K(k)P(k)的解析解,式(4-30)例4-250第五十頁(yè),共九十二頁(yè),2022年,8月28日(續(xù))有限時(shí)間離散LQR問(wèn)題P(k)的數(shù)值解見(jiàn)程序集

例4-351第五十一頁(yè),共九十二頁(yè),2022年,8月28日無(wú)限時(shí)間離散LQR問(wèn)題矩陣Riccati代數(shù)方程式(4-26a)’退化為式(4-41a)式(4-26b)’退化為式(4-41b)式(4-26c)’退化為式(4-41c)式(4-27)’退化為式(4-42a)’式(4-28)’退化為式(4-42b)’全狀態(tài)反饋52第五十二頁(yè),共九十二頁(yè),2022年,8月28日(續(xù))無(wú)限時(shí)間離散LQR問(wèn)題Pbar的解析解式(4-44)→式(4-48)求H-1的過(guò)程:

令非異變換T,同式(3-82)對(duì)Hamilton矩陣H可驗(yàn)證式(4-46)T及H的內(nèi)容代入式(4-46),得式(4-48)設(shè)H-1的特征值μ和相應(yīng)的特征向量[fTgT]T,求H的特征值:

H-1的內(nèi)容代入式(4-49),得式(4-50)展開(kāi)并重組,得式(4-52)

53第五十三頁(yè),共九十二頁(yè),2022年,8月28日(續(xù))無(wú)限時(shí)間離散LQR問(wèn)題

向量形式,式(4-53),即式(4-54)式(4-54)說(shuō)明H有特征值μ故H-1有特征值1/μ(前已設(shè)H-1有特征值μ)故H有特征值μ和1/μH只含實(shí)特征值(無(wú)復(fù)特征值),并只分為穩(wěn)定的和不穩(wěn)定的兩種,即只分為位于單位圓內(nèi)的和單位圓外的兩種(若μ在單位圓內(nèi),1/μ必在單位圓外)

54第五十四頁(yè),共九十二頁(yè),2022年,8月28日(續(xù))無(wú)限時(shí)間離散LQR問(wèn)題模態(tài)陣M使Г陣分塊對(duì)角化,式(4-56)有相異特征值時(shí),分塊對(duì)角化有重復(fù)特征值時(shí),Jordan塊M和H的內(nèi)容代入式(4-56)從式(4-56)→式(4-65)Pbar=M22(M12)-1例4-4

55第五十五頁(yè),共九十二頁(yè),2022年,8月28日(續(xù))無(wú)限時(shí)間離散LQR問(wèn)題Pbar的數(shù)值解見(jiàn)程序集

例4-5用控制系統(tǒng)工具箱見(jiàn)程序集

例4-6,例4-7

56第五十六頁(yè),共九十二頁(yè),2022年,8月28日第5章最大值原理引言式(5-1)不能用變分法求解的原因最小值原理引理5-1的敘述:非線(xiàn)性、非時(shí)變系統(tǒng),給定初始條件,控制有界

57第五十七頁(yè),共九十二頁(yè),2022年,8月28日(續(xù))最小值原理xi(t)為連續(xù)函數(shù),用最大值范數(shù);在不同的i時(shí),從xi(t)的最大值范數(shù)中取最大的一個(gè)作為x向量的范數(shù)ui(t)可為按段光滑的函數(shù),取p范數(shù),當(dāng)p=1,則為1范數(shù);在不同的i時(shí),從ui(t)的1范數(shù)中取上確界(最小的上界)作為u向量的范數(shù)求證:δx和δu的范數(shù)為同階無(wú)窮小

58第五十八頁(yè),共九十二頁(yè),2022年,8月28日(續(xù))最小值原理引理5-1的證明過(guò)程:設(shè)微分方程滿(mǎn)足Lipschitz條件(即設(shè)為壓縮映射),式(5-2)

附錄5A賦范線(xiàn)性向量空間最大值范數(shù),p范數(shù)Banach空間Cauchy序列,完備性壓縮映射與不動(dòng)點(diǎn)壓縮映射原理

59第五十九頁(yè),共九十二頁(yè),2022年,8月28日(續(xù))最小值原理60第六十頁(yè),共九十二頁(yè),2022年,8月28日(續(xù))最小值原理引理5-2的敘述:非線(xiàn)性、非時(shí)變系統(tǒng),給定初始條件,控制有界目標(biāo)函數(shù),式(5-12)求證:目標(biāo)值的差為式(5-13)引理5-2的證明過(guò)程:化為無(wú)約束優(yōu)化問(wèn)題,式(5-14)

61第六十一頁(yè),共九十二頁(yè),2022年,8月28日(續(xù))最小值原理

推演式(5-15),并類(lèi)似得式(5-16)推演式(5-17)定理5-1的敘述:泛函求極值,式(5-18),控制有界泛函極值存在的必要條件伴隨方程,狀態(tài)方程,H全局最小,式(5-19)定理5-1的證明過(guò)程:62第六十二頁(yè),共九十二頁(yè),2022年,8月28日(續(xù))最小值原理耦合方程已不復(fù)存在,但伴隨方程和狀態(tài)方程仍為必要條件證明H全局最小為必要條件時(shí),用反證法設(shè)tbar∈[t0,tf],?w∈Ω,有式(5-21)因f及φ連續(xù),?tbar的鄰域[ta,tb],tbar∈[ta,tb]為[t0,tf]的子集,?ε

>0,有式(5-22)取特殊控制u當(dāng)t不屬于[ta,tb]時(shí),u=ucap當(dāng)t屬于[ta,

tb]時(shí),u=w63第六十三頁(yè),共九十二頁(yè),2022年,8月28日(續(xù))最小值原理卻有J(ucap)-J(u)≤0式(5-23)表明事實(shí)相反,故上述特殊控制u非最優(yōu)控制因tbar任取,故式(5-23)之證明有普遍意義因伴隨方程、狀態(tài)方程均為必要條件,故式(5-19)仍為必要條件64第六十四頁(yè),共九十二頁(yè),2022年,8月28日Bang-Bang控制式(5-24)的兩個(gè)特點(diǎn)Hamilton函數(shù)使用“H全局最小”ui取兩個(gè)極端值,Bang-BangBang-Bang產(chǎn)生的條件65第六十五頁(yè),共九十二頁(yè),2022年,8月28日時(shí)間最優(yōu)控制系統(tǒng)的性質(zhì)線(xiàn)性非時(shí)變系統(tǒng)的時(shí)間最優(yōu)控制式(5-25)的物理概念Hamilton函數(shù)H,式(5-26)橫截條件,式(5-27)協(xié)態(tài)方程,式(5-29)狀態(tài)方程H全局最小,式(5-30)ui(t)=-sgn[BTλ(t)]i式(5-25)’為另一種形式的提法,本質(zhì)不變66第六十六頁(yè),共九十二頁(yè),2022年,8月28日(續(xù))時(shí)間最優(yōu)控制系統(tǒng)的性質(zhì)命題5-1的敘述:式(5-25)所示時(shí)間最優(yōu)控制問(wèn)題ui(t)=-sgn[BTλ(t)]i為唯一的命題5-1的證明過(guò)程:協(xié)態(tài)方程的解中,λ(0)≠0,否則矛盾λ(t)≠0,ui(t)不發(fā)生奇異情況若設(shè)?u1,u2兩個(gè)不同的最優(yōu)控制向量,

則與狀態(tài)方程解的唯一性相矛盾67第六十七頁(yè),共九十二頁(yè),2022年,8月28日(續(xù))時(shí)間最優(yōu)控制系統(tǒng)的性質(zhì)命題5-2的敘述:式(5-25)所示時(shí)間最優(yōu)控制問(wèn)題若存在最優(yōu)控制ui(t)=-sgn[BTλ(t)]i

式(5-30)ui(t)至多切換n-1次命題5-2的證明過(guò)程:協(xié)態(tài)方程的解,式(5-31)最優(yōu)控制可改寫(xiě)為ui(t)=-sgn[(e-Atbi)Tλ0]68第六十八頁(yè),共九十二頁(yè),2022年,8月28日(續(xù))時(shí)間最優(yōu)控制系統(tǒng)的性質(zhì)切換條件為(e-Atbi)Tλ0=0,式(5-32)

設(shè)有相異特征值,式(5-32)改為式(5-33)滿(mǎn)足此式t的個(gè)數(shù),即為切換次數(shù)用數(shù)學(xué)歸納法證之n=1時(shí)成立n=2時(shí)成立設(shè)n-1時(shí)成立,應(yīng)證明n時(shí)也成立,用反證法:先反設(shè)式(5-33)有n個(gè)實(shí)根,結(jié)果自相矛盾;有n-1個(gè)實(shí)根,才能自圓其說(shuō)69第六十九頁(yè),共九十二頁(yè),2022年,8月28日無(wú)阻尼運(yùn)動(dòng)的時(shí)間最優(yōu)控制

物理背景,式(5-36)優(yōu)化問(wèn)題提法,式(5-39)H函數(shù)協(xié)態(tài)方程H全局最小,式(5-40)啟發(fā)式求解u=+1,式(5-41a)u=-1,式(5-41b)70第七十頁(yè),共九十二頁(yè),2022年,8月28日(續(xù))無(wú)阻尼運(yùn)動(dòng)的時(shí)間最優(yōu)控制

式(5-41a)及式(5-41b)示于圖5-1分析圖5-2開(kāi)關(guān)函數(shù),式(5-43)控制系統(tǒng)方框圖,圖5-371第七十一頁(yè),共九十二頁(yè),2022年,8月28日存在恢復(fù)力時(shí),無(wú)阻尼運(yùn)動(dòng)的

時(shí)間最優(yōu)控制

物理背景,式(5-45)優(yōu)化問(wèn)題提法,式(5-47)H函數(shù)H全局最小,式(5-48)協(xié)態(tài)方程,式(5-49),從圖5-4看出切換的持續(xù)時(shí)間為π啟發(fā)式求解u=+1,式(5-51)u=-1,式(5-52)72第七十二頁(yè),共九十二頁(yè),2022年,8月28日(續(xù))存在恢復(fù)力時(shí),無(wú)阻尼運(yùn)

動(dòng)的時(shí)間最優(yōu)控制式(5-51)及式(5-52)示于圖5-5,基本的開(kāi)關(guān)線(xiàn)分析圖5-5,衍生出開(kāi)關(guān)線(xiàn)的總體,圖5-6開(kāi)關(guān)函數(shù),式(5-54)控制系統(tǒng)方框圖,圖5-773第七十三頁(yè),共九十二頁(yè),2022年,8月28日燃料最優(yōu)控制系統(tǒng)的性質(zhì)物理背景泛函求極值,式(5-55)H函數(shù)H全局最小,式(5-58)式(5-58)的圖示,圖5-8(a),(b),兩者疊合得圖5-9的陰影區(qū)陰影區(qū)的下部邊界即為式(5-58)的解式(5-60)與式(5-61)對(duì)照,用死區(qū)函數(shù)表示,圖5-10,Bang-off-Bang74第七十四頁(yè),共九十二頁(yè),2022年,8月28日無(wú)阻尼運(yùn)動(dòng)的燃料最優(yōu)控制

優(yōu)化問(wèn)題提法,式(5-63)物理背景H函數(shù)協(xié)態(tài)方程H全局最小啟發(fā)式求解u=+1,式(5-41a)u=-1,式(5-41b)u=0,式(5-65),式(5-66)75第七十五頁(yè),共九十二頁(yè),2022年,8月28日(續(xù))無(wú)阻尼運(yùn)動(dòng)的燃料最優(yōu)控制

若初速為0,又u=0,則不能控圖5-11,四個(gè)區(qū)域分析圖5-12,開(kāi)關(guān)線(xiàn)控制系統(tǒng)方框圖,圖5-1376第七十六頁(yè),共九十二頁(yè),2022年,8月28日SIMULINK用于Bang-Bang控制

的仿真

見(jiàn)程序集77第七十七頁(yè),共九十二頁(yè),2022年,8月28日小結(jié)

最大值原理是自動(dòng)控制理論發(fā)展中的一個(gè)里程碑,至今尚無(wú)取代物最大值原理與LQR思路各不相同:前者在約束條件中直接考慮控制有界;后者在目標(biāo)函數(shù)中間接考慮控制能量消耗要少Bang-Bang控制有產(chǎn)生的條件,并有適用的范圍78第七十八頁(yè),共九十二頁(yè),2022年,8月28日第6章動(dòng)態(tài)規(guī)劃引言定積分與無(wú)窮和式最優(yōu)控制與最優(yōu)決策序列單段決策過(guò)程和多段決策過(guò)程不同的求解方法79第七十九頁(yè),共九十二頁(yè),2022年,8月28日多段決策過(guò)程動(dòng)態(tài)系統(tǒng)的遞推關(guān)系,圖6-1多段決策過(guò)程泛函求極值,式(6-2)加性可分目標(biāo)函數(shù)u(N)不存在,圖6-280第八十頁(yè),共九十二頁(yè),2022年,8月28日動(dòng)態(tài)規(guī)劃的基本思想

假定現(xiàn)在和將來(lái)的決策不影響過(guò)去的狀態(tài)、決策和目標(biāo)在k時(shí)刻,由x(k)立即作出決策u(k)改寫(xiě)為普遍形式,式(6-3)簡(jiǎn)記I(x,k),式(6-4)81第八十一頁(yè),共九十二頁(yè),2022年,8月28日(續(xù))動(dòng)態(tài)規(guī)劃的基本思想

Bellman方程的推演過(guò)程:按假定1,先對(duì)u(k+1),u(k+2),…,u(N-1)求min,后對(duì)u(k)求min和式分開(kāi)寫(xiě)Φ(x(k),u(k),k)和u(k+1),u(k+2),…,u(N-1)無(wú)關(guān),可提至min記號(hào)外再次使用式(6-4)之定義式(6-5),Bellman方程,遞推關(guān)系,動(dòng)態(tài)規(guī)劃82第八十二頁(yè),共九十二頁(yè),2022年,8月28日(續(xù))動(dòng)態(tài)規(guī)劃的基本思想動(dòng)態(tài)規(guī)劃的特點(diǎn)目標(biāo)值反向掃掠狀態(tài)值正向掃掠兩者聯(lián)系的紐帶為最優(yōu)決策序列每一段中尋求最優(yōu)決策的方法是關(guān)鍵例6-1及例6-2使用求導(dǎo)(局部極值)和解代數(shù)方程,可使用符號(hào)計(jì)算(見(jiàn)程序集)例6-3及例6-4,用數(shù)值比大?。ㄈ謽O值),見(jiàn)表6-2,表6-3,表6-483第八十三頁(yè),共九十二頁(yè),2022年,8月28日用動(dòng)態(tài)規(guī)劃求解離散LQ

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論