最優(yōu)控制講授提綱

上傳人：石*** IP屬地：廣東上傳時(shí)間：2023-02-25 格式：PPT 頁(yè)數(shù)：91 大?。?.69MB 積分：28 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩86頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶(hù)提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

最優(yōu)控制講授提綱第一頁(yè)，共九十二頁(yè)，2022年，8月28日使用說(shuō)明講課開(kāi)始時(shí)，學(xué)生需人手一冊(cè)教材，已可開(kāi)講。講授提綱用幻燈片放映，僅起畫(huà)龍點(diǎn)睛作用（若無(wú)幻燈片放映，可用板書(shū)代之）。關(guān)鍵是：任課教師是否習(xí)慣此種講課方式。實(shí)踐表明：學(xué)生的收效卻更好。任課教師都有自己的習(xí)慣、風(fēng)格，都喜愛(ài)自己的講稿，因此，只適宜于列出講授提綱供參考，逐次的講稿宜自己用PowerPoint編寫(xiě)。此時(shí)，教材和講授提綱可供參照，并亦可各自按需補(bǔ)充些內(nèi)容。此外，講課進(jìn)度的安排也因人而異，有40學(xué)時(shí)全講課的，有壓縮課時(shí)并添加大作業(yè)的，有寫(xiě)讀文獻(xiàn)的報(bào)告的，故不宜編寫(xiě)劃一的講稿（寫(xiě)了也是白寫(xiě)）。2第二頁(yè)，共九十二頁(yè)，2022年，8月28日緒論從經(jīng)典的反饋控制到最優(yōu)控制從特點(diǎn)看控制器設(shè)計(jì)經(jīng)歷的“改朝換代”

3第三頁(yè)，共九十二頁(yè)，2022年，8月28日特

點(diǎn)

經(jīng)典反饋控制最優(yōu)控制上世紀(jì)40-50年代起的炮火控制SISO，輸入輸出描寫(xiě)低階傳遞函數(shù)應(yīng)無(wú)未建模動(dòng)態(tài)手算，作圖，憑經(jīng)驗(yàn)不計(jì)控制能耗模擬器件實(shí)現(xiàn)軍工及民用工業(yè)上世紀(jì)60年代起延伸至今的航空航天MIMO，內(nèi)部描寫(xiě)低階狀態(tài)方程應(yīng)無(wú)未建模動(dòng)態(tài)計(jì)算機(jī)，優(yōu)化，算法考慮控制能耗數(shù)字器件實(shí)現(xiàn)航空航天工業(yè)4第四頁(yè)，共九十二頁(yè)，2022年，8月28日第1章變分法引言變分問(wèn)題求解的兩條路本章的重要性5第五頁(yè)，共九十二頁(yè)，2022年，8月28日

泛函定義1-1（泛函）圖1-1弧長(zhǎng)，目標(biāo)泛函定義1-2（函數(shù)空間中的距離）圖1-2曲線(xiàn)間的距離定義1-3（n級(jí)ε鄰區(qū)和泛函的局部極值）圖1-3泛函求局部極值定義1-4（泛函的全局極值）6第六頁(yè)，共九十二頁(yè)，2022年，8月28日

變分的推演泛函求極值從式（1-1）推導(dǎo)式（1-6）的過(guò)程：寫(xiě)出目標(biāo)值的差，式（1-2）用導(dǎo)數(shù)中值定理，得式（1-5）式（1-5）的第二項(xiàng)為高階無(wú)窮小改用變分記號(hào)，式（1-6）7第七頁(yè)，共九十二頁(yè)，2022年，8月28日（續(xù)）變分的推演式（1-1）的被積函數(shù)用Taylor

級(jí)數(shù)展開(kāi)后的線(xiàn)性主部，即式（1-6）第一項(xiàng)的被積函數(shù)定義1-5（函數(shù)的一次變分）式（1-7），式（1-8）定義1-6（泛函的一次變分）式（1-9）8第八頁(yè)，共九十二頁(yè)，2022年，8月28日（續(xù)）變分的推演定義

1-7（泛函的二次變分）式（1-10）泛函的高次變分，式（1-11）泛函極值存在的必要條件，式（1-12）泛函局部極大值存在的充分條件，式（1-13）泛函局部極小值存在的充分條件，式（1-14）9第九頁(yè)，共九十二頁(yè)，2022年，8月28日

Euler方程和橫截條件泛函求極值從式（1-16）推導(dǎo)式（1-21）的過(guò)程：用分部積分得式（1-18）用推論1-1得式（1-19）及式（1-20）用推論1-2得式（1-21）TPBVP（兩點(diǎn)邊值問(wèn)題）例1-310第十頁(yè)，共九十二頁(yè)，2022年，8月28日

向量情況泛函求極值從式（1-25）推導(dǎo)式（1-32）的過(guò)程：成對(duì)應(yīng)用式（1-18），得式（1-26）分類(lèi)及合并，得式（1-27）仿式（1-21）及式（1-23），得式（1-30）

及式（1-31）向量形式，式（1-32）11第十一頁(yè)，共九十二頁(yè)，2022年，8月28日

有約束的情況

函數(shù)的約束優(yōu)化與Lagrange乘子式（1-33）化為無(wú)約束優(yōu)化，式（1-34）兩個(gè)默認(rèn)的特點(diǎn)函數(shù)的向量約束優(yōu)化與Lagrange乘子向量式（1-35）12第十二頁(yè)，共九十二頁(yè)，2022年，8月28日（續(xù)）有約束的情況

化為無(wú)約束優(yōu)化，式（1-37）兩個(gè)默認(rèn)的特點(diǎn)泛函的約束優(yōu)化約束方程變量多、方程少化為無(wú)約束優(yōu)化定理1-1的敘述：式（1-39）與式（1-40）等價(jià)

13第十三頁(yè)，共九十二頁(yè)，2022年，8月28日（續(xù)）有約束的情況

定理1-1的證明過(guò)程：為何要分兩步走第1步證明式（1-40）改寫(xiě)為式（1-42）泛函極值存在的必要條件，式（1-43）結(jié)合約束方程求解，結(jié)果滿(mǎn)足約束方程，式（1-40）的解即為式（1-39）的解第2步證明14第十四頁(yè)，共九十二頁(yè)，2022年，8月28日（續(xù)）有約束的情況

式（1-39）的構(gòu)成：式（1-25）及約束方程式（1-25）所示泛函極值存在的必要條件，式（1-44）對(duì)約束方程取一次變分，式（1-45）即式（1-46）構(gòu)造式（1-49）式（1-44）的第一式與式（1-49）合成，得式（1-51）用約束方程和式（1-51），構(gòu)造式（1-52）15第十五頁(yè)，共九十二頁(yè)，2022年，8月28日（續(xù)）有約束的情況

式（1-53）與式（1-52）的差別，得式

（1-55）及式（1-56），式（1-39）的解即為式（1-40）的解兩步證明的完成，才說(shuō)明式（1-39）與式（1-40）完全等價(jià)定理1-1推廣到微分系統(tǒng)16第十六頁(yè)，共九十二頁(yè)，2022年，8月28日

端點(diǎn)可變的情況兩端可變可化為一端可變，終端可變目標(biāo)值的差推演得式（1-61）利用積分中值定理及式（1-6），式

（1-18）由式（1-61）得式（1-62）圖1-4與式（1-63）從式（1-64）得式（1-65）推廣到式（1-67）17第十七頁(yè)，共九十二頁(yè)，2022年，8月28日

變分的另一種定義定義1-8（函數(shù)的一次變分）定義1-9（泛函的一次變分）式（1-69）對(duì)β求導(dǎo),得J的一次變分，式（1-71）式（1-72）同式（1-9）18第十八頁(yè)，共九十二頁(yè)，2022年，8月28日變分與Fréchet微分定義1-10（Fréchet微分）線(xiàn)性逼近的誤差ε，式（1-74）對(duì)照

圖1-5及式（1-75）規(guī)定了線(xiàn)性逼近方式Fréchet微分，式（1-76）計(jì)算Fréchet微分的方法，式（1-77）泛函的一次變分即Fréchet微分，對(duì)照式（1-78），式（1-79）19第十九頁(yè)，共九十二頁(yè)，2022年，8月28日

小結(jié)

泛函求極值→變分→常微分方程的TPBVP本章僅為尋求極值曲線(xiàn)，并未涉及尋求極值曲面變分法的現(xiàn)代進(jìn)展為變分原理（不是第5章的最大值原理）20第二十頁(yè)，共九十二頁(yè)，2022年，8月28日第2章連續(xù)系統(tǒng)最優(yōu)控制

引言

了解受控對(duì)象→建?！岢龈拍钚阅繕?biāo)→優(yōu)化問(wèn)題提法式（2-1）Bolza問(wèn)題，Lagrange問(wèn)題，Mayer問(wèn)題折衷?xún)?yōu)化如何套用第1章公式21第二十一頁(yè)，共九十二頁(yè)，2022年，8月28日

時(shí)間端點(diǎn)固定的情況

式（2-2）的背景化為無(wú)約束優(yōu)化問(wèn)題式（2-3），Hamilton函數(shù)式（2-3）取一次變分，分兩部分式（2-7）由式（2-4）及式（2-6）組成橫截條件，伴隨方程，耦合方程，狀態(tài)方程，式（2-10）22第二十二頁(yè)，共九十二頁(yè)，2022年，8月28日（續(xù)）時(shí)間端點(diǎn)固定的情況

沿最優(yōu)軌線(xiàn)H為常量的條件橫截條件三種情況TPBVP例2-1，例2-2，例2-3，例2-423第二十三頁(yè)，共九十二頁(yè)，2022年，8月28日

有終端函數(shù)約束的情況

式（2-60）的背景化為無(wú)約束優(yōu)化問(wèn)題，式（2-61）式（2-61）取一次變分，式（2-63）橫截條件，伴隨方程，耦合方程，狀態(tài)方程，終端函數(shù)，式（2-67）例2-524第二十四頁(yè)，共九十二頁(yè)，2022年，8月28日

終時(shí)不指定的情況式（2-78）的背景化為無(wú)約束優(yōu)化問(wèn)題，式（2-79）式（2-79）取一次變分，分三部分式（2-84）由式（2-80)，式（2-

81)及式（2-83）組成橫截條件，伴隨方程，耦合方程，狀態(tài)方程，終端函數(shù)，式（2-88）例2-625第二十五頁(yè)，共九十二頁(yè)，2022年，8月28日考慮其它幾種約束

積分約束化為微商約束和終態(tài)約束狀態(tài)和控制的等式約束狀態(tài)和控制的不等式約束用松弛變量化為狀態(tài)和控制的等式約束角隅條件，式（2-120）26第二十六頁(yè)，共九十二頁(yè)，2022年，8月28日用符號(hào)數(shù)學(xué)工具箱

求TPBVP的解析解

見(jiàn)程序集

27第二十七頁(yè)，共九十二頁(yè)，2022年，8月28日

小結(jié)

TPBVP的解析解多謝MATLAB的符號(hào)數(shù)學(xué)工具箱，它改變了求取TPBVP的解析解的面貌要關(guān)注符號(hào)計(jì)算的進(jìn)展（包括新版本MATLAB中的符號(hào)數(shù)學(xué)工具箱）確定性最優(yōu)控制開(kāi)環(huán)與閉環(huán)不分28第二十八頁(yè)，共九十二頁(yè)，2022年，8月28日第3章線(xiàn)性連續(xù)系統(tǒng)的

二次型調(diào)節(jié)器引言?xún)?yōu)化問(wèn)題提法，式（3-1）物理意義重視LQR的原因29第二十九頁(yè)，共九十二頁(yè)，2022年，8月28日有限時(shí)間（狀態(tài)）調(diào)節(jié)器

時(shí)變情況式（3-1）化為無(wú)約束優(yōu)化問(wèn)題泛函極值存在的必要條件：橫截條件，伴隨方程，耦合方程，狀態(tài)方程TPBVP,式（3-6）Hamilton矩陣Г(t)式（3-7）→式（3-12）矩陣Riccati微分方程，式（3-17）30第三十頁(yè)，共九十二頁(yè)，2022年，8月28日

全狀態(tài)反饋，Kalman增益，式（3-19）P(t)的性質(zhì)對(duì)稱(chēng)，半正定P(t)的計(jì)算，Euler法最優(yōu)反饋控制的結(jié)構(gòu)，圖3-1x(t)的重構(gòu)，圖3-2對(duì)加權(quán)矩陣的要求31（續(xù)）有限時(shí)間（狀態(tài)）調(diào)節(jié)器第三十一頁(yè)，共九十二頁(yè)，2022年，8月28日

（續(xù)）有限時(shí)間（狀態(tài)）調(diào)節(jié)器

非時(shí)變情況式（3-1）→式(3-1)’式（3-17）→式(3-17)’式（3-18）→式(3-18)’式（3-19）→式(3-19)’P(t)的解析解，式（3-28），幾種解法例3-1，例3-2觀察終時(shí)tf對(duì)Kalman增益K(t)的影響見(jiàn)程序集和圖3-3

32第三十二頁(yè)，共九十二頁(yè)，2022年，8月28日（續(xù)）有限時(shí)間（狀態(tài)）調(diào)節(jié)器P(t)的數(shù)值解見(jiàn)程序集33第三十三頁(yè)，共九十二頁(yè)，2022年，8月28日有限時(shí)間輸出調(diào)節(jié)器

優(yōu)化問(wèn)題提法式（3-58）矩陣Riccati微分方程，式（3-60）全狀態(tài)反饋，Kalman增益K(t)式（3-62）34第三十四頁(yè)，共九十二頁(yè)，2022年，8月28日無(wú)限時(shí)間輸出調(diào)節(jié)器

優(yōu)化問(wèn)題提法，式（3-63）

定理3-1有4部份：(a)

P(t)=Pbar=const的充要條件為（A,B）能穩(wěn)定能觀性分解，式（3-66）代入系數(shù)矩陣，式（3-64）即式（3-68）從式（3-69）的第二式、第三式和邊界條件得P12(t)=O

，P22(t)=O，得式（3-70)不能觀極點(diǎn)在A22中，不影響P(t）35第三十五頁(yè)，共九十二頁(yè)，2022年，8月28日（續(xù)）無(wú)限時(shí)間輸出調(diào)節(jié)器

設(shè)能觀，不會(huì)影響證明P(t)=Pbar=const從能控性分解{式（3-71)}出發(fā)證必要條件(能穩(wěn)定)：

設(shè)（A,B）不能穩(wěn)定（不穩(wěn)定極點(diǎn)不能控）不能控極點(diǎn)在A22中,輸出z(t)和J都發(fā)散按式（3-25），P(t)不存在，Pbar不存在證充分條件(能穩(wěn)定)：設(shè)能穩(wěn)定（不穩(wěn)定極點(diǎn)能控）式（3-73）說(shuō)明P(t)有上界36第三十六頁(yè)，共九十二頁(yè)，2022年，8月28日（續(xù)）無(wú)限時(shí)間輸出調(diào)節(jié)器

式（3-73）單調(diào)非減，得P(t)單調(diào)非減有唯一極限P(t)=Pbar=const(b)若能穩(wěn)定，能檢測(cè)，則唯一的Pbar半正定

P(t)=Pbar=const，式（3-64）退化為矩陣Riccati代數(shù)方程，式（3-65），前已證有唯一極限Pbar

能檢測(cè)（不能觀極點(diǎn)穩(wěn)定），不考慮不能觀部分由式（3-24）及式（3-25）得Pbar半正定(c)u(t)穩(wěn)定的充要條件為能穩(wěn)定，能檢測(cè)37第三十七頁(yè)，共九十二頁(yè)，2022年，8月28日（續(xù)）無(wú)限時(shí)間輸出調(diào)節(jié)器證必要條件：必需能穩(wěn)定和能檢測(cè)，否則不穩(wěn)定極點(diǎn)不能控，不能觀極點(diǎn)不穩(wěn)定證充分條件：能控性分解{式(3-71)},得式（3-75）從式（3-75）可寫(xiě)出式（3-76），解出P11(t)能控性分解中的A11含能控的極點(diǎn)（包括不穩(wěn)定的極點(diǎn)）,A11-B1R-1(B1)TP11漸近穩(wěn)定A22含不能控的極點(diǎn)（但包括穩(wěn)定的極點(diǎn)）

38第三十八頁(yè)，共九十二頁(yè)，2022年，8月28日（續(xù)）無(wú)限時(shí)間輸出調(diào)節(jié)器

(A11,B1)能控包含(A11,B1)能穩(wěn)定，按本定理

(a)

P11(t)=P11bar=const的充要條件為(A11,B1)能穩(wěn)定最優(yōu)反饋控制為式（3-77）反饋系統(tǒng)為式（3-78）分塊上三角形矩陣的特征值取決于對(duì)角塊各矩陣的，因A11-B1R-1(B1)TP11漸近穩(wěn)定及A22漸近穩(wěn)定，故反饋系統(tǒng)漸近穩(wěn)定39第三十九頁(yè)，共九十二頁(yè)，2022年，8月28日（續(xù)）無(wú)限時(shí)間輸出調(diào)節(jié)器

(d)設(shè)Q’正定，Pbar正定的充要條件為能觀證必要條件(能觀)：

設(shè)部分能觀，能觀性分解，式（3-66）,在本定理(a)中有式（3-70）detP(t)=0,P(t)非正定，Pbar非正定證充分條件(能觀)：反設(shè)能觀，但Pbar非正定

存在x0≠0，不加控制，卻可使輸出為0，荒謬，故Pbar正定40第四十頁(yè)，共九十二頁(yè)，2022年，8月28日（續(xù)）無(wú)限時(shí)間輸出調(diào)節(jié)器

Pbar的解析解令非異變換T，式（3-82）對(duì)Hamilton矩陣Г可驗(yàn)證式（3-83）式（3-84）表示Г陣有特征值λ式（3-85）表示Г陣有特征值-λ

Г陣無(wú)復(fù)特征值模態(tài)陣M使Г陣分塊對(duì)角化，式（3-87）有相異特征值時(shí)，分塊對(duì)角化

41第四十一頁(yè)，共九十二頁(yè)，2022年，8月28日（續(xù)）無(wú)限時(shí)間輸出調(diào)節(jié)器

有重復(fù)特征值時(shí)，Jordan塊從式（3-87）→式（3-92）Pbar=M21(M11)-1見(jiàn)程序集Pbar的數(shù)值解見(jiàn)程序集用控制系統(tǒng)工具箱見(jiàn)程序集

42第四十二頁(yè)，共九十二頁(yè)，2022年，8月28日使用LQR的系統(tǒng)的穩(wěn)定裕量式（3-102)→式（3-109），Kalman不等式單輸入系統(tǒng)的Kalman不等式式（3-110）→式（3-111）系統(tǒng)方框圖，圖3-6開(kāi)環(huán)傳遞函數(shù)與開(kāi)環(huán)頻率特性圖3-7，頻率特性幅度余量無(wú)限大相位余量至少600以全狀態(tài)反饋為條件

43第四十三頁(yè)，共九十二頁(yè)，2022年，8月28日小結(jié)

有限時(shí)間調(diào)節(jié)器的設(shè)計(jì)，只需求解矩陣Riccati微分方程，為終值問(wèn)題，它比TPBVP容易解無(wú)限時(shí)間調(diào)節(jié)器的設(shè)計(jì)，僅需求解矩陣Riccati代數(shù)方程，它又比有限時(shí)間調(diào)節(jié)器的設(shè)計(jì)簡(jiǎn)單，又容易實(shí)現(xiàn)有限時(shí)間調(diào)節(jié)器的設(shè)計(jì)，得K(t)無(wú)限時(shí)間調(diào)節(jié)器的設(shè)計(jì)，得K44第四十四頁(yè)，共九十二頁(yè)，2022年，8月28日（續(xù)）小結(jié)必須先選取幾組加權(quán)矩陣Q及R，通過(guò)設(shè)計(jì)和仿真，修改Q及R，直至獲得滿(mǎn)意的暫態(tài)過(guò)程，控制器設(shè)計(jì)才告終LQR的優(yōu)異性能（幅度余量無(wú)限大，相位余量至少600）以全狀態(tài)反饋為條件LQR是自動(dòng)控制理論發(fā)展中的一個(gè)里程碑（雖然有缺點(diǎn)）45第四十五頁(yè)，共九十二頁(yè)，2022年，8月28日第4章離散系統(tǒng)最優(yōu)控制引言?xún)煞N離散系統(tǒng)優(yōu)化問(wèn)題提法離散變分法與Euler方程

泛函求極值（無(wú)約束）泛函的一次變分

式（4-3），式（4-4）

46第四十六頁(yè)，共九十二頁(yè)，2022年，8月28日（續(xù)）離散變分法與Euler方程

泛函極值存在的必要條件式（4-5）Euler方程和橫截條件式（4-8）

47第四十七頁(yè)，共九十二頁(yè)，2022年，8月28日

離散系統(tǒng)最優(yōu)控制

泛函求極值

式（4-9）化為無(wú)約束優(yōu)化問(wèn)題式（4-10），Lagrange乘子向量λ(k+1)泛函極值存在的必要條件橫截條件，伴隨方程，耦合方程，狀態(tài)方程，式（4-15）例4-1

48第四十八頁(yè)，共九十二頁(yè)，2022年，8月28日有限時(shí)間離散LQR問(wèn)題時(shí)變情況泛函求極值，式（4-17）泛函極值存在的必要條件

伴隨方程，耦合方程，橫截條件兩點(diǎn)邊值問(wèn)題，式（4-24），Hamilton矩陣H(k)矩陣Riccati差分方程三種形式式（4-26a），式（4-26b），式（4-26c）最優(yōu)反饋控制結(jié)構(gòu)，圖4-1式（4-27），式（4-28），Kalman增益K(k)

49第四十九頁(yè)，共九十二頁(yè)，2022年，8月28日（續(xù)）有限時(shí)間離散LQR問(wèn)題非時(shí)變情況

泛函求極值，式（4-17）’矩陣Riccati差分方程三種形式式（4-26a）’，式（4-26b)’，式（4-26c）’最優(yōu)反饋控制結(jié)構(gòu)式（4-27）’，式（4-28)’，Kalman增益K(k)P(k)的解析解，式（4-30）例4-250第五十頁(yè)，共九十二頁(yè)，2022年，8月28日（續(xù)）有限時(shí)間離散LQR問(wèn)題P(k)的數(shù)值解見(jiàn)程序集

例4-351第五十一頁(yè)，共九十二頁(yè)，2022年，8月28日無(wú)限時(shí)間離散LQR問(wèn)題矩陣Riccati代數(shù)方程式（4-26a)’退化為式（4-41a)式（4-26b)’退化為式（4-41b)式（4-26c)’退化為式（4-41c)式（4-27)’退化為式（4-42a)’式（4-28)’退化為式（4-42b)’全狀態(tài)反饋52第五十二頁(yè)，共九十二頁(yè)，2022年，8月28日（續(xù)）無(wú)限時(shí)間離散LQR問(wèn)題Pbar的解析解式（4-44)→式（4-48)求H-1的過(guò)程:

令非異變換T，同式（3-82）對(duì)Hamilton矩陣H可驗(yàn)證式（4-46)T及H的內(nèi)容代入式（4-46)，得式（4-48)設(shè)H-1的特征值μ和相應(yīng)的特征向量[fTgT]T，求H的特征值：

H-1的內(nèi)容代入式（4-49)，得式（4-50)展開(kāi)并重組，得式（4-52)

53第五十三頁(yè)，共九十二頁(yè)，2022年，8月28日（續(xù)）無(wú)限時(shí)間離散LQR問(wèn)題

向量形式，式（4-53)，即式（4-54)式（4-54)說(shuō)明H有特征值μ故H-1有特征值1/μ（前已設(shè)H-1有特征值μ）故H有特征值μ和1/μH只含實(shí)特征值(無(wú)復(fù)特征值)，并只分為穩(wěn)定的和不穩(wěn)定的兩種，即只分為位于單位圓內(nèi)的和單位圓外的兩種（若μ在單位圓內(nèi)，1/μ必在單位圓外）

54第五十四頁(yè)，共九十二頁(yè)，2022年，8月28日（續(xù)）無(wú)限時(shí)間離散LQR問(wèn)題模態(tài)陣M使Г陣分塊對(duì)角化，式（4-56）有相異特征值時(shí)，分塊對(duì)角化有重復(fù)特征值時(shí)，Jordan塊M和H的內(nèi)容代入式（4-56)從式（4-56）→式（4-65）Pbar=M22(M12)-1例4-4

55第五十五頁(yè)，共九十二頁(yè)，2022年，8月28日（續(xù)）無(wú)限時(shí)間離散LQR問(wèn)題Pbar的數(shù)值解見(jiàn)程序集

例4-5用控制系統(tǒng)工具箱見(jiàn)程序集

例4-6,例4-7

56第五十六頁(yè)，共九十二頁(yè)，2022年，8月28日第5章最大值原理引言式（5-1）不能用變分法求解的原因最小值原理引理5-1的敘述：非線(xiàn)性、非時(shí)變系統(tǒng)，給定初始條件，控制有界

57第五十七頁(yè)，共九十二頁(yè)，2022年，8月28日（續(xù)）最小值原理xi(t)為連續(xù)函數(shù)，用最大值范數(shù)；在不同的i時(shí)，從xi(t)的最大值范數(shù)中取最大的一個(gè)作為x向量的范數(shù)ui(t)可為按段光滑的函數(shù)，取p范數(shù)，當(dāng)p=1,則為1范數(shù)；在不同的i時(shí)，從ui(t)的1范數(shù)中取上確界（最小的上界）作為u向量的范數(shù)求證：δx和δu的范數(shù)為同階無(wú)窮小

58第五十八頁(yè)，共九十二頁(yè)，2022年，8月28日（續(xù)）最小值原理引理5-1的證明過(guò)程：設(shè)微分方程滿(mǎn)足Lipschitz條件（即設(shè)為壓縮映射），式（5-2）

附錄5A賦范線(xiàn)性向量空間最大值范數(shù)，p范數(shù)Banach空間Cauchy序列，完備性壓縮映射與不動(dòng)點(diǎn)壓縮映射原理

59第五十九頁(yè)，共九十二頁(yè)，2022年，8月28日（續(xù)）最小值原理60第六十頁(yè)，共九十二頁(yè)，2022年，8月28日（續(xù)）最小值原理引理5-2的敘述：非線(xiàn)性、非時(shí)變系統(tǒng)，給定初始條件，控制有界目標(biāo)函數(shù)，式（5-12）求證：目標(biāo)值的差為式（5-13）引理5-2的證明過(guò)程：化為無(wú)約束優(yōu)化問(wèn)題，式（5-14）

61第六十一頁(yè)，共九十二頁(yè)，2022年，8月28日（續(xù)）最小值原理

推演式（5-15），并類(lèi)似得式（5-16）推演式（5-17）定理5-1的敘述：泛函求極值，式（5-18），控制有界泛函極值存在的必要條件伴隨方程，狀態(tài)方程，H全局最小，式（5-19）定理5-1的證明過(guò)程：62第六十二頁(yè)，共九十二頁(yè)，2022年，8月28日（續(xù)）最小值原理耦合方程已不復(fù)存在，但伴隨方程和狀態(tài)方程仍為必要條件證明H全局最小為必要條件時(shí)，用反證法設(shè)tbar∈[t0,tf],?w∈Ω，有式（5-21）因f及φ連續(xù)，?tbar的鄰域[ta,tb]，tbar∈[ta,tb]為[t0,tf]的子集，?ε

＞0，有式（5-22）取特殊控制u當(dāng)t不屬于[ta,tb]時(shí),u=ucap當(dāng)t屬于[ta,

tb]時(shí),u=w63第六十三頁(yè)，共九十二頁(yè)，2022年，8月28日（續(xù)）最小值原理卻有J(ucap)-J(u)≤0式（5-23）表明事實(shí)相反，故上述特殊控制u非最優(yōu)控制因tbar任取，故式（5-23）之證明有普遍意義因伴隨方程、狀態(tài)方程均為必要條件，故式（5-19）仍為必要條件64第六十四頁(yè)，共九十二頁(yè)，2022年，8月28日Bang-Bang控制式（5-24）的兩個(gè)特點(diǎn)Hamilton函數(shù)使用“H全局最小”ui取兩個(gè)極端值，Bang-BangBang-Bang產(chǎn)生的條件65第六十五頁(yè)，共九十二頁(yè)，2022年，8月28日時(shí)間最優(yōu)控制系統(tǒng)的性質(zhì)線(xiàn)性非時(shí)變系統(tǒng)的時(shí)間最優(yōu)控制式（5-25）的物理概念Hamilton函數(shù)H，式（5-26）橫截條件，式（5-27）協(xié)態(tài)方程，式（5-29）狀態(tài)方程H全局最小，式（5-30）ui(t)=-sgn[BTλ(t)]i式（5-25）’為另一種形式的提法，本質(zhì)不變66第六十六頁(yè)，共九十二頁(yè)，2022年，8月28日（續(xù)）時(shí)間最優(yōu)控制系統(tǒng)的性質(zhì)命題5-1的敘述：式（5-25）所示時(shí)間最優(yōu)控制問(wèn)題ui(t)=-sgn[BTλ(t)]i為唯一的命題5-1的證明過(guò)程：協(xié)態(tài)方程的解中，λ(0)≠0，否則矛盾λ(t)≠0,ui(t)不發(fā)生奇異情況若設(shè)?u1,u2兩個(gè)不同的最優(yōu)控制向量，

則與狀態(tài)方程解的唯一性相矛盾67第六十七頁(yè)，共九十二頁(yè)，2022年，8月28日（續(xù)）時(shí)間最優(yōu)控制系統(tǒng)的性質(zhì)命題5-2的敘述：式（5-25）所示時(shí)間最優(yōu)控制問(wèn)題若存在最優(yōu)控制ui(t)=-sgn[BTλ(t)]i

式（5-30）ui(t)至多切換n-1次命題5-2的證明過(guò)程：協(xié)態(tài)方程的解,式（5-31）最優(yōu)控制可改寫(xiě)為ui(t)=-sgn[(e-Atbi)Tλ0]68第六十八頁(yè)，共九十二頁(yè)，2022年，8月28日（續(xù)）時(shí)間最優(yōu)控制系統(tǒng)的性質(zhì)切換條件為(e-Atbi)Tλ0=0，式（5-32）

設(shè)有相異特征值，式（5-32）改為式（5-33）滿(mǎn)足此式t的個(gè)數(shù)，即為切換次數(shù)用數(shù)學(xué)歸納法證之n=1時(shí)成立n=2時(shí)成立設(shè)n-1時(shí)成立，應(yīng)證明n時(shí)也成立，用反證法：先反設(shè)式（5-33）有n個(gè)實(shí)根，結(jié)果自相矛盾；有n-1個(gè)實(shí)根，才能自圓其說(shuō)69第六十九頁(yè)，共九十二頁(yè)，2022年，8月28日無(wú)阻尼運(yùn)動(dòng)的時(shí)間最優(yōu)控制

物理背景，式（5-36）優(yōu)化問(wèn)題提法，式（5-39）H函數(shù)協(xié)態(tài)方程H全局最小，式（5-40）啟發(fā)式求解u=+1,式（5-41a）u=-1,式（5-41b）70第七十頁(yè)，共九十二頁(yè)，2022年，8月28日（續(xù)）無(wú)阻尼運(yùn)動(dòng)的時(shí)間最優(yōu)控制

式（5-41a）及式（5-41b）示于圖5-1分析圖5-2開(kāi)關(guān)函數(shù)，式（5-43）控制系統(tǒng)方框圖，圖5-371第七十一頁(yè)，共九十二頁(yè)，2022年，8月28日存在恢復(fù)力時(shí),無(wú)阻尼運(yùn)動(dòng)的

時(shí)間最優(yōu)控制

物理背景，式（5-45）優(yōu)化問(wèn)題提法，式（5-47）H函數(shù)H全局最小，式（5-48）協(xié)態(tài)方程，式（5-49），從圖5-4看出切換的持續(xù)時(shí)間為π啟發(fā)式求解u=+1,式（5-51）u=-1,式（5-52）72第七十二頁(yè)，共九十二頁(yè)，2022年，8月28日（續(xù)）存在恢復(fù)力時(shí),無(wú)阻尼運(yùn)

動(dòng)的時(shí)間最優(yōu)控制式（5-51）及式（5-52）示于圖5-5，基本的開(kāi)關(guān)線(xiàn)分析圖5-5，衍生出開(kāi)關(guān)線(xiàn)的總體，圖5-6開(kāi)關(guān)函數(shù)，式（5-54）控制系統(tǒng)方框圖，圖5-773第七十三頁(yè)，共九十二頁(yè)，2022年，8月28日燃料最優(yōu)控制系統(tǒng)的性質(zhì)物理背景泛函求極值，式（5-55）H函數(shù)H全局最小，式（5-58）式（5-58）的圖示，圖5-8(a),(b)，兩者疊合得圖5-9的陰影區(qū)陰影區(qū)的下部邊界即為式（5-58）的解式（5-60）與式（5-61）對(duì)照，用死區(qū)函數(shù)表示，圖5-10，Bang-off-Bang74第七十四頁(yè)，共九十二頁(yè)，2022年，8月28日無(wú)阻尼運(yùn)動(dòng)的燃料最優(yōu)控制

優(yōu)化問(wèn)題提法，式（5-63）物理背景H函數(shù)協(xié)態(tài)方程H全局最小啟發(fā)式求解u=+1,式（5-41a）u=-1,式（5-41b）u=0,式（5-65）,式（5-66）75第七十五頁(yè)，共九十二頁(yè)，2022年，8月28日（續(xù)）無(wú)阻尼運(yùn)動(dòng)的燃料最優(yōu)控制

若初速為0，又u=0，則不能控圖5-11，四個(gè)區(qū)域分析圖5-12，開(kāi)關(guān)線(xiàn)控制系統(tǒng)方框圖，圖5-1376第七十六頁(yè)，共九十二頁(yè)，2022年，8月28日SIMULINK用于Bang-Bang控制

的仿真

見(jiàn)程序集77第七十七頁(yè)，共九十二頁(yè)，2022年，8月28日小結(jié)

最大值原理是自動(dòng)控制理論發(fā)展中的一個(gè)里程碑，至今尚無(wú)取代物最大值原理與LQR思路各不相同：前者在約束條件中直接考慮控制有界；后者在目標(biāo)函數(shù)中間接考慮控制能量消耗要少Bang-Bang控制有產(chǎn)生的條件，并有適用的范圍78第七十八頁(yè)，共九十二頁(yè)，2022年，8月28日第6章動(dòng)態(tài)規(guī)劃引言定積分與無(wú)窮和式最優(yōu)控制與最優(yōu)決策序列單段決策過(guò)程和多段決策過(guò)程不同的求解方法79第七十九頁(yè)，共九十二頁(yè)，2022年，8月28日多段決策過(guò)程動(dòng)態(tài)系統(tǒng)的遞推關(guān)系，圖6-1多段決策過(guò)程泛函求極值，式（6-2）加性可分目標(biāo)函數(shù)u(N)不存在，圖6-280第八十頁(yè)，共九十二頁(yè)，2022年，8月28日動(dòng)態(tài)規(guī)劃的基本思想

假定現(xiàn)在和將來(lái)的決策不影響過(guò)去的狀態(tài)、決策和目標(biāo)在k時(shí)刻，由x(k)立即作出決策u(k)改寫(xiě)為普遍形式，式（6-3）簡(jiǎn)記I(x,k),式（6-4）81第八十一頁(yè)，共九十二頁(yè)，2022年，8月28日（續(xù)）動(dòng)態(tài)規(guī)劃的基本思想

Bellman方程的推演過(guò)程：按假定1，先對(duì)u(k+1),u(k+2),…,u(N-1)求min,后對(duì)u(k)求min和式分開(kāi)寫(xiě)Φ(x(k),u(k),k)和u(k+1),u(k+2),…,u(N-1)無(wú)關(guān)，可提至min記號(hào)外再次使用式（6-4）之定義式（6-5），Bellman方程，遞推關(guān)系，動(dòng)態(tài)規(guī)劃82第八十二頁(yè)，共九十二頁(yè)，2022年，8月28日（續(xù)）動(dòng)態(tài)規(guī)劃的基本思想動(dòng)態(tài)規(guī)劃的特點(diǎn)目標(biāo)值反向掃掠狀態(tài)值正向掃掠兩者聯(lián)系的紐帶為最優(yōu)決策序列每一段中尋求最優(yōu)決策的方法是關(guān)鍵例6-1及例6-2使用求導(dǎo)（局部極值）和解代數(shù)方程,可使用符號(hào)計(jì)算（見(jiàn)程序集）例6-3及例6-4,用數(shù)值比大?。ㄈ謽O值），見(jiàn)表6-2,表6-3,表6-483第八十三頁(yè)，共九十二頁(yè)，2022年，8月28日用動(dòng)態(tài)規(guī)劃求解離散LQ

人人文庫(kù)> 全部分類(lèi)> 教育資料 > 課件下載

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最優(yōu)控制講授提綱

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

最優(yōu)控制講授提綱

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔