變分法與最優(yōu)控制PPT課件.ppt_第1頁(yè)
變分法與最優(yōu)控制PPT課件.ppt_第2頁(yè)
變分法與最優(yōu)控制PPT課件.ppt_第3頁(yè)
變分法與最優(yōu)控制PPT課件.ppt_第4頁(yè)
變分法與最優(yōu)控制PPT課件.ppt_第5頁(yè)
已閱讀5頁(yè),還剩82頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第二講變分法與最優(yōu)控制 主要內(nèi)容 2 1變分法概述2 2無(wú)約束最優(yōu)化問(wèn)題無(wú)約束固定端點(diǎn)泛函極值必要條件無(wú)約束自由端點(diǎn)泛函極值必要條件2 3等式約束最優(yōu)化問(wèn)題2 4變分法求解最優(yōu)控制問(wèn)題引入哈密頓函數(shù)求解拉格朗日問(wèn)題求解綜合型 波爾扎 問(wèn)題 2 1變分法概述1 泛函定義2 泛函的連續(xù)性3 泛函的極值4 線性泛函5 泛函的變分6 泛函變分的求法7 泛函變分的規(guī)則8 泛函極值的條件 2 1變分法概述 1 泛函定義定義 如果變量y對(duì)于某一函數(shù)類中的每一個(gè)函數(shù)x t 都有一個(gè)確定的值與之對(duì)應(yīng) 那么就稱變量y為依賴于函數(shù)x t 的泛函 記為 y J x t 說(shuō)明 由于函數(shù)的值是由自變量的選取而確定的 而泛函的值是由自變量的函數(shù)的選取而確定的 所以將泛函理解為 函數(shù)的函數(shù) 例2 1 是一個(gè)泛函 變量J的值是由函數(shù)x t 的選取而確定 當(dāng)時(shí) 有 當(dāng)時(shí) 有 例2 2 曲線的弧長(zhǎng)求 平面上連接給定兩點(diǎn)A x0 y0 和B x1 y1 的曲線的弧長(zhǎng)J A B兩點(diǎn)間的曲線方程為 y f x A B兩點(diǎn)間的弧長(zhǎng)為 泛函的上述概念 可以推廣到含有幾個(gè)函數(shù)的泛函的情況 例如 求一般函數(shù)極值微分法求泛函極值變分法 2 泛函的連續(xù)性 函數(shù)相近 零階相近 當(dāng)函數(shù)x t 與x0 t 之差的絕對(duì)值 即 x t x0 t t1 t t2對(duì)于x t 的定義域中的一切t t1 t t2 都很小時(shí) 稱函數(shù)x t 與函數(shù)x0 t 是相近的 也稱為零階相近 一階相近當(dāng)函數(shù)x t 與x0 t 之差的絕對(duì)值以及它們的一階導(dǎo)數(shù)和之差的絕對(duì)值 即t1 t t2都很小 稱函數(shù)x t 與函數(shù)x0 t 是一階相近的 注意 一階相近的兩個(gè)函數(shù) 必然是零階相近 反之不成立 K階相近當(dāng)t1 t t2都很小時(shí) 稱函數(shù)x t 與函數(shù)x0 t 是k階相近的 函數(shù)間距離在不同的函數(shù)空間 函數(shù)間的距離定義也不同 在函數(shù)空間C a b 在區(qū)間 a b 上連續(xù)的函數(shù)的全體構(gòu)成的函數(shù)空間 中 通常采用下式定義距離 在函數(shù)空間Ck a b 在區(qū)間 a b 上連續(xù)且具有連續(xù)的k階導(dǎo)數(shù)的函數(shù)的全體構(gòu)成的函數(shù)空間 中 任意兩個(gè)函數(shù)間的距離定義為 顯然 式 2 1 定量地表示兩個(gè)函數(shù)之間的零階相近度 而式 2 1 定量地表示兩個(gè)函數(shù)之間的k階相近度 2 1 2 2 零階距離 零階距離 函數(shù)間距離在不同的函數(shù)空間 函數(shù)間的距離定義也不同 在函數(shù)空間C a b 在區(qū)間 a b 上連續(xù)的函數(shù)的全體構(gòu)成的函數(shù)空間 中 通常采用下式定義距離 在函數(shù)空間Ck a b 在區(qū)間 a b 上連續(xù)且具有連續(xù)的k階導(dǎo)數(shù)的函數(shù)的全體構(gòu)成的函數(shù)空間 中 任意兩個(gè)函數(shù)間的距離定義為 2 1 函數(shù)間距離在不同的函數(shù)空間 函數(shù)間的距離定義也不同 在函數(shù)空間C a b 在區(qū)間 a b 上連續(xù)的函數(shù)的全體構(gòu)成的函數(shù)空間 中 通常采用下式定義距離 在函數(shù)空間Ck a b 在區(qū)間 a b 上連續(xù)且具有連續(xù)的k階導(dǎo)數(shù)的函數(shù)的全體構(gòu)成的函數(shù)空間 中 任意兩個(gè)函數(shù)間的距離定義為 函數(shù)間距離在不同的函數(shù)空間 函數(shù)間的距離定義也不同 在函數(shù)空間C a b 在區(qū)間 a b 上連續(xù)的函數(shù)的全體構(gòu)成的函數(shù)空間 中 通常采用下式定義距離 在函數(shù)空間Ck a b 在區(qū)間 a b 上連續(xù)且具有連續(xù)的k階導(dǎo)數(shù)的函數(shù)的全體構(gòu)成的函數(shù)空間 中 任意兩個(gè)函數(shù)間的距離定義為 函數(shù)間距離在不同的函數(shù)空間 函數(shù)間的距離定義也不同 在函數(shù)空間C a b 在區(qū)間 a b 上連續(xù)的函數(shù)的全體構(gòu)成的函數(shù)空間 中 通常采用下式定義距離 在函數(shù)空間Ck a b 在區(qū)間 a b 上連續(xù)且具有連續(xù)的k階導(dǎo)數(shù)的函數(shù)的全體構(gòu)成的函數(shù)空間 中 任意兩個(gè)函數(shù)間的距離定義為 函數(shù)間距離在不同的函數(shù)空間 函數(shù)間的距離定義也不同 在函數(shù)空間C a b 在區(qū)間 a b 上連續(xù)的函數(shù)的全體構(gòu)成的函數(shù)空間 中 通常采用下式定義距離 在函數(shù)空間Ck a b 在區(qū)間 a b 上連續(xù)且具有連續(xù)的k階導(dǎo)數(shù)的函數(shù)的全體構(gòu)成的函數(shù)空間 中 任意兩個(gè)函數(shù)間的距離定義為 函數(shù)間距離在不同的函數(shù)空間 函數(shù)間的距離定義也不同 在函數(shù)空間C a b 在區(qū)間 a b 上連續(xù)的函數(shù)的全體構(gòu)成的函數(shù)空間 中 通常采用下式定義距離 在函數(shù)空間Ck a b 在區(qū)間 a b 上連續(xù)且具有連續(xù)的k階導(dǎo)數(shù)的函數(shù)的全體構(gòu)成的函數(shù)空間 中 任意兩個(gè)函數(shù)間的距離定義為 函數(shù)間距離在不同的函數(shù)空間 函數(shù)間的距離定義也不同 在函數(shù)空間C a b 在區(qū)間 a b 上連續(xù)的函數(shù)的全體構(gòu)成的函數(shù)空間 中 通常采用下式定義距離 在函數(shù)空間Ck a b 在區(qū)間 a b 上連續(xù)且具有連續(xù)的k階導(dǎo)數(shù)的函數(shù)的全體構(gòu)成的函數(shù)空間 中 任意兩個(gè)函數(shù)間的距離定義為 函數(shù)間距離在不同的函數(shù)空間 函數(shù)間的距離定義也不同 在函數(shù)空間C a b 在區(qū)間 a b 上連續(xù)的函數(shù)的全體構(gòu)成的函數(shù)空間 中 通常采用下式定義距離 在函數(shù)空間Ck a b 在區(qū)間 a b 上連續(xù)且具有連續(xù)的k階導(dǎo)數(shù)的函數(shù)的全體構(gòu)成的函數(shù)空間 中 任意兩個(gè)函數(shù)間的距離定義為 零階距離 零階距離 函數(shù)間距離在不同的函數(shù)空間 函數(shù)間的距離定義也不同 在函數(shù)空間C a b 在區(qū)間 a b 上連續(xù)的函數(shù)的全體構(gòu)成的函數(shù)空間 中 通常采用下式定義距離 在函數(shù)空間Ck a b 在區(qū)間 a b 上連續(xù)且具有連續(xù)的k階導(dǎo)數(shù)的函數(shù)的全體構(gòu)成的函數(shù)空間 中 任意兩個(gè)函數(shù)間的距離定義為 泛函的連續(xù)性如果對(duì)于任意給定的正數(shù) 可以找到這樣一個(gè) 0 當(dāng)d x t x0 t 時(shí) 存在 J x t J x0 t 那么 就說(shuō)泛函J在點(diǎn)x0 t 處是連續(xù)的 根據(jù)所采用的函數(shù)之間距離定義的不同 對(duì)應(yīng)的泛函分別稱為零階連續(xù)泛函 2 1 或k階連續(xù)泛函 2 2 3 泛函的極值 如果是在與僅僅具有零階接近度的曲線的泛函中比較得出的極值 稱為強(qiáng)極值 如果是在與具有一階或一階以上接近度的曲線的泛函中比較得出的極值 則稱為弱極值 4 線性泛函 連續(xù)泛函如果滿足下列條件 1 疊加原理 J x1 t x2 t J x1 t J x2 t 2 齊次性 J cx t cJ x t 其中 c是任意常數(shù) 就稱為線性泛函 例如 都滿足上述兩個(gè)條件 故均為線性泛函 5 泛函的變分 宗量的變分若函數(shù)x t 是變量J的自變量函數(shù) 則稱x t 為泛函J x t 的宗量函數(shù) 宗量的變分是指在同一函數(shù)類中的兩個(gè)宗量函數(shù)間的差 也就是說(shuō) 泛函的變分是泛函增量的線性主部 當(dāng)一個(gè)泛函具有變分時(shí) 稱該泛函是可微的 泛函的變分當(dāng)宗量x t 有變分時(shí) 泛函的增量可以表示為 其中 L x t x t 是關(guān)于 x t 的線性連續(xù)泛函 r x t x t 是關(guān)于 x t 的高階無(wú)窮小 L x t x t 稱為泛函的變分 記為 線性主部 6 泛函變分的求法 定理2 1連續(xù)泛函J x 的變分 等于泛函對(duì) 的導(dǎo)數(shù)在 0時(shí)的值 即 定理2 2連續(xù)泛函J x 的二次變分定義為 證明略 證明略 7 泛函變分的規(guī)則 求泛函的變分 例2 3 8 泛函極值的條件 泛函極值的必要條件 定理2 3連續(xù)可微泛函J x 在x0 t 上達(dá)到極值的必要條件為 J x 在x x0處必有 泛函極值的充要條件 定理2 4設(shè)可微泛函J x 存在二次變分 則在x x0處達(dá)到極小值的充要條件為 同理 設(shè)可微泛函J x 存在二次變分 則在x x0處達(dá)到極大值的充要條件為 主要內(nèi)容 2 1變分法概述2 2無(wú)約束最優(yōu)化問(wèn)題無(wú)約束固定端點(diǎn)泛函極值必要條件無(wú)約束自由端點(diǎn)泛函極值必要條件2 3等式約束最優(yōu)化問(wèn)題2 4變分法求解最優(yōu)控制問(wèn)題引入哈密頓函數(shù)求解拉格朗日問(wèn)題求解綜合型 波爾扎 問(wèn)題 2 2無(wú)約束最優(yōu)化問(wèn)題 1 無(wú)約束固定端點(diǎn)泛函極值必要條件 問(wèn)題2 1 無(wú)約束固定終端泛函極值問(wèn)題為 其中 及x t 在 t0 tf 上連續(xù)可微 t0及tf固定 求滿足上式的極值軌線x t x t0 x0 x tf xf 定理2 5若給定曲線x t 的始端x t0 x0和終端x tf xf 則泛函 達(dá)到極值的必要條件是 曲線x t 滿足歐拉方程 其中x t 應(yīng)有連續(xù)的二階導(dǎo)數(shù) 則至少應(yīng)是二次連續(xù)可微的 歐拉 Euler 方程 證明略 邊界條件 或 歐拉方程的全導(dǎo)數(shù)形式 在中 第二項(xiàng)為全導(dǎo)數(shù) 令 得歐拉方程的全導(dǎo)數(shù)形式 或 例2 4 求泛函在邊界條件 下的極值曲線及極值 幾種特殊的歐拉方程 可以得到封閉形式的解 被積函數(shù)L不依賴于 即被積函數(shù)L不依賴于x 即被積函數(shù)L不依賴于t 即在這種情況下 歐拉方程的首次積分為其中c是待定的積分常數(shù) 實(shí)際上 將上式左邊對(duì)t求全導(dǎo)數(shù) 有 被積函數(shù)L線性地依賴于 即 例2 5 最速降線 又稱捷線 問(wèn)題 設(shè)在豎直平面內(nèi)有兩點(diǎn)A和B 它們不在同一條鉛垂線上 現(xiàn)有一質(zhì)點(diǎn)受重力的作用自較高的A點(diǎn)向較低的B點(diǎn)滑動(dòng) 如果不考慮各種阻力的影響 問(wèn)應(yīng)取怎樣的路徑 才能使所經(jīng)歷的時(shí)間最短 在A B兩點(diǎn)所在的豎直平面內(nèi)選擇一坐標(biāo)系 如上圖所示 A點(diǎn)為坐標(biāo)原點(diǎn) 水平線為x軸 鉛垂線為y軸 結(jié)論 最速降線是一條圓滾線 對(duì)于向量空間的泛函 也存在著歐拉方程 不過(guò)是歐拉方程組 即向量歐拉方程 定理2 6在n維函數(shù)空間中 若極值曲線X t x1 t x2 t xn t T的始端X t0 x1 t0 x2 t0 xn t0 T和終端X tf x1 tf x2 tf xn tf T是給定的 則泛函 達(dá)到極值的必要條件是曲線X t 滿足向量歐拉方程 其中X t 應(yīng)有連續(xù)的二階導(dǎo)數(shù) 而則至少應(yīng)是二次連續(xù)可微的 向量歐拉方程 或 向量歐拉方程 向量歐拉方程 可寫成標(biāo)量方程組 例2 6 求泛函滿足邊界條件的極值函數(shù) 思考 能否利用MATLAB符號(hào)工具箱求解微分方程組 當(dāng)極值曲線x t 的端點(diǎn)變化時(shí) 要使泛函達(dá)到極小值 x t 首先應(yīng)當(dāng)滿足歐拉方程 若端點(diǎn)固定 可以利用端點(diǎn)條件 確定歐拉方程中的兩個(gè)待定的積分常數(shù) 問(wèn)題 若端點(diǎn)可變 如何確定這兩個(gè)積分常數(shù) 2 2無(wú)約束最優(yōu)化問(wèn)題 2 無(wú)約束自由端點(diǎn)泛函極值必要條件 橫截條件 圖形分析 都固定 圖a 即 即 固定 自由圖b 即 因?yàn)樽杂伤?終端僅在上滑動(dòng) 求出最優(yōu) 許多狀態(tài)軌線 自由 固定 圖c則橫截條件變?yōu)?始端僅在上滑動(dòng) 端點(diǎn)變動(dòng)的情況 自由端點(diǎn) 無(wú)約束條件的變分 如圖 始點(diǎn)在曲線上變動(dòng) 終點(diǎn)在曲線上變動(dòng) 問(wèn)題描述 假定極值曲線的始端A t0 x0 是固定的 而終端B tf xf 是可變的 并沿著給定的曲線 現(xiàn)在的問(wèn)題是 需要確定一條從給定的點(diǎn)A t0 x0 到給定的曲線上的某一點(diǎn)B tf xf 的連續(xù)可微的曲線x t 使得泛函 達(dá)到極小值 變動(dòng) 如右下圖所示 橫截條件 定理2 7若曲線x t 由一給定的點(diǎn) t0 x0 到給定的曲線x tf tf 上的某一點(diǎn) tf xf 則泛函 達(dá)到極值的必要條件是 x t 滿足歐拉方程 和橫截條件 其中x t 應(yīng)有連續(xù)的二階導(dǎo)數(shù) 則至少應(yīng)是二次連續(xù)可微的 而 t 則應(yīng)有連續(xù)的一階導(dǎo)數(shù) 證明略 若極值曲線的始端不是固定的 并沿著曲線 變動(dòng) 則同樣可以推導(dǎo)出始端的橫截條件 定理2 7擴(kuò)展 根據(jù)定理2 7和上式 可得到端點(diǎn)可變時(shí) Lagrange問(wèn)題的解 除有歐拉方程外 還有橫截條件 1 始端 終端可變 即x t0 t0 x tf tf 則橫截條件為 2 當(dāng)t0 tf可變 而x t0 與x tf 固定時(shí) 則橫截條件為 3 當(dāng)t0 tf固定 而x t0 與x tf 可變時(shí) 即始端與終端分別在t t0 t tf上滑動(dòng) 則橫截條件為 橫截條件總結(jié) 定理2 7和以上幾種情況的橫截條件 都可以將其推廣到n維函數(shù)向量X t x1 t x2 t xn t T的泛函的情形 定理2 8在n維函數(shù)空間中 若曲線X t x1 t x2 t xn t T的始端X t0 x1 t0 x2 t0 xn t0 T是固定的 而終端X tf x1 tf x2 tf xn tf T是可變的 且在曲面X tf tf 上變動(dòng) 則泛函 達(dá)到極值的必要條件是 曲線X t 滿足向量歐拉方程 和橫截條件 若曲線X t x1 t x2 t xn t T的始端不是固定的 而是可變的 并在給定的曲面 上變動(dòng) 其中 則同樣可以推導(dǎo)出始端的橫截條件為 例2 7 泛函求極值 若x 0 與x 2 任意 求極值曲線x 及極值J x 例2 8 求固定點(diǎn)A 0 1 到給定直線的弧長(zhǎng)最短的曲線方程 主要內(nèi)容 2 1變分法概述2 2無(wú)約束最優(yōu)化問(wèn)題無(wú)約束固定端點(diǎn)泛函極值必要條件無(wú)約束自由端點(diǎn)泛函極值必要條件2 3等式約束最優(yōu)化問(wèn)題2 4變分法求解最優(yōu)控制問(wèn)題引入哈密頓函數(shù)求解拉格朗日問(wèn)題求解綜合型 波爾扎 問(wèn)題 回顧等式約束條件下函數(shù)極值問(wèn)題的解法 設(shè)有函數(shù) 2 2 現(xiàn)在需要求函數(shù)Z在以下約束條件下的極值 2 1 1 消元法 從約束條件 2 2 中將y解出來(lái) 用x表示y 即y y x 然后將y x 代入g x y 中 得到Z g x y x 2 3 這樣 函數(shù)Z只含有一個(gè)自變量x 等式 2 2 約束條件下的函數(shù) 2 1 極值問(wèn)題 無(wú)約束條件的函數(shù) 2 3 極值問(wèn)題 存在兩個(gè)問(wèn)題 從方程 2 2 中將y解出來(lái)往往很困難 對(duì)x和y這兩個(gè)自變量未能平等看待 2 拉格朗日乘子法 Lagrangefactor 步驟如下 作一個(gè)輔助函數(shù)F g x y f x y 式中 是待定常數(shù) 稱為拉格朗日乘子 2 4 聯(lián)立求解方程 2 2 和 2 4 求出駐點(diǎn) x0 y0 和待定常數(shù) 值 判斷 x0 y0 是否是函數(shù)g x y 的極值點(diǎn) 2 2 約束條件 求輔助函數(shù)F的無(wú)條件極值 即令 Lagrange函數(shù) 等式約束條件下的函數(shù)極值問(wèn)題 無(wú)約束條件的函數(shù)極值問(wèn)題 2 拉格朗日乘子法 Lagrangefactor 擴(kuò)展 1 拉格朗日乘子法對(duì)于求n元函數(shù)Z g x1 x2 xn 在約束條件下的極值問(wèn)題 同樣適用 2 拉格朗日乘子法對(duì)于求在多個(gè)約束方程fi x1 x2 xm 0 i 1 2 m 下的極值問(wèn)題 同樣適用 3 m n是必要的 向量函數(shù) 向量方程約束 2 3等式約束最優(yōu)化問(wèn)題 1 等式約束固定終端泛函極值必要條件 問(wèn)題2 2 等式約束固定端點(diǎn)泛函極值問(wèn)題為 情況下的極值軌線X t 2 5 求泛函 在約束方程為 和端點(diǎn)條件為 2 6 解決方法 引入拉格朗日向量乘子 將等式約束泛函極值問(wèn)題轉(zhuǎn)化為無(wú)約束泛函極值問(wèn)題 步驟如下 1 構(gòu)造輔助泛函其中 t 1 t 2 t m t T是m維待定向量乘子 2 7 無(wú)約束條件的泛函 2 7 極值問(wèn)題 有約束條件 2 6 的泛函 2 5 極值問(wèn)題 2 令寫出歐拉方程 3 聯(lián)立求解歐拉方程 2 8 和約束方程 2 6 可以得到n維向量函數(shù)X t 和m維向量乘子 t 4 利用端點(diǎn)條件確定歐拉方程解中的2n個(gè)積分常數(shù) 得到候選函數(shù)X t 5 檢驗(yàn)候選函數(shù)X t 是否使泛函 2 7 達(dá)到極值 以及是極大值還是極小值 2 8 定理2 9如果n維向量函數(shù)X t x1 t x2 t xn t T能使泛函 在等式約束 條件下達(dá)到極值 這里f是m維向量函數(shù) m n 必存在適當(dāng)?shù)膍維向量函數(shù) t 1 t 2 t m t T使泛函 達(dá)到無(wú)條件極值 即函數(shù)X t 是上述泛函J0的歐拉方程 的解 其中 而X t 和 t 由歐拉方程和約束方程共同確定 無(wú)約束條件的泛函J0極值問(wèn)題 有約束條件的泛函J極值問(wèn)題 等價(jià) 證明 取極小值 給定的邊界條件為 例2 9已知受控系統(tǒng)的動(dòng)態(tài)結(jié)構(gòu)如圖所示 求最優(yōu)控制u t 及最優(yōu)軌線x t 使目標(biāo)泛函 2 3等式約束最優(yōu)化問(wèn)題 2 等式約束自由端點(diǎn)泛函極值必要條件 如何求解 主要內(nèi)容 2 1變分法概述2 2無(wú)約束最優(yōu)化問(wèn)題無(wú)約束固定端點(diǎn)泛函極值必要條件無(wú)約束自由端點(diǎn)泛函極值必要條件2 3等式約束最優(yōu)化問(wèn)題2 4變分法求解最優(yōu)控制問(wèn)題引入哈密頓函數(shù)求解拉格朗日問(wèn)題求解綜合型 波爾扎 問(wèn)題 2 4變分法求解最優(yōu)控制問(wèn)題 當(dāng)狀態(tài)變量和控制變量均不受約束 即X t Rn U t Rm時(shí) 最優(yōu)控制問(wèn)題是個(gè)在等式約束條件下求泛函極值的變分問(wèn)題 因此 可以利用在上一節(jié)中介紹的拉格朗日乘子法來(lái)求解 在這一節(jié)中 利用拉格朗日乘子法求解最優(yōu)控制問(wèn)題時(shí) 將引入哈密頓 Hamilton 函數(shù) 推導(dǎo)出幾種典型的最優(yōu)控制問(wèn)題應(yīng)滿足的必要條件 2 4變分法求解最優(yōu)控制問(wèn)題 1 引入哈密頓函數(shù)求解拉格朗日問(wèn)題 2 10 初始條件 2 9 終端條件 tf固定 X tf 自由和性能泛函 2 11 給定系統(tǒng)狀態(tài)方程 要求從容許控制U t Rm中確定最優(yōu)控制U t 使系統(tǒng) 2 9 從給定的初態(tài)X t0 轉(zhuǎn)移到某個(gè)終態(tài)X tf 并使性能泛函 2 11 達(dá)到極小值 這是拉格朗日問(wèn)題 又稱為積分型最優(yōu)控制問(wèn)題 問(wèn)題2 3 解 將狀態(tài)方程 2 9 改寫為 2 12 最優(yōu)控制問(wèn)題微分方程 2 12 在約束條件下求泛函極值的變分問(wèn)題 利用拉格朗日乘子法 引入n維拉格朗日乘子向量 t 1 t 2 t n t T t 稱為協(xié)態(tài)變量 以便與狀態(tài)變量相對(duì)應(yīng) 2 13 求泛函在等式約束條件下的極值問(wèn)題求泛函 2 13 J0的無(wú)約束條件的極值問(wèn)題 構(gòu)造輔助泛函 定義哈密頓 Hamilton 函數(shù)為 輔助泛函 標(biāo)量函數(shù) 哈密頓函數(shù)與輔助函數(shù)之間關(guān)系為 將代入歐拉方程 得 協(xié)態(tài)方程 共軛方程 狀態(tài)方程 規(guī)范方程 正則方程 控制方程 利用變分法寫出輔助泛函的歐拉方程 初始狀態(tài)為 由于終端時(shí)刻tf固定 終端狀態(tài)X tf 自由 所以橫截條件為 得 聯(lián)立求解規(guī)范方程可以得到兩個(gè)未知函數(shù)X t 和 t 由邊界條件確定積分常量 混合邊界問(wèn)題或兩點(diǎn)邊界值問(wèn)題 求解兩點(diǎn)邊值問(wèn)題步驟 由控制方程求得U U X t t t 將上式代入規(guī)范方程消去其中的U t 得到利用邊界條件聯(lián)立求解方程以上方程 可得唯一確定的解X t 和 t 將所求得的X t 和 t 代入U(xiǎn) U X t t t 求得相應(yīng)的U t 說(shuō)明 利用引入哈密頓函數(shù)的方法求解拉格朗日型最優(yōu)控制問(wèn)題 是將求泛函在等式約束條件下對(duì)控制函數(shù)U t 的條件極值問(wèn)題轉(zhuǎn)化為求哈密頓函數(shù)H對(duì)控制變量U t 的無(wú)條件極值問(wèn)題 這種方法稱為哈密頓方法 定理2 10設(shè)系統(tǒng)的狀態(tài)方程為 為將系統(tǒng)從給定的初態(tài) 轉(zhuǎn)移到終端時(shí)刻tf固定 終端狀態(tài)X tf 自由的某個(gè)終態(tài) 并使性能泛函 達(dá)到極小值的最優(yōu)控制應(yīng)滿足的必要條件是 1 設(shè)U t 是最優(yōu)控制 X t 是對(duì)應(yīng)于U t 的最優(yōu)軌線 則必存在一與U t 和X t 相對(duì)應(yīng)的n維協(xié)態(tài)變量 t 使得X t 與 t 滿足規(guī)范方程 其中 2 邊界條件為 3 哈密頓函數(shù)H對(duì)控制變量U t t0 t tf 取極值 即 沿著最優(yōu)控制和最優(yōu)軌線 哈密頓函數(shù)H對(duì)時(shí)間t求全導(dǎo)數(shù) 得 若H不顯含t時(shí) 則有H t 常數(shù)t t0 tf 也就是說(shuō) 當(dāng)H不顯含t時(shí) 哈密頓函數(shù)H是不依賴于t的常數(shù) 取極小值 給定的邊界條件為 解法2 哈密頓方法 例2 9已知受控系統(tǒng)的動(dòng)態(tài)結(jié)構(gòu)如圖所示 求最優(yōu)控制u t 及最優(yōu)軌線x t 使目標(biāo)泛函 取極小值 給定的邊界條件為 自由 例2 10已知受控系統(tǒng)的動(dòng)態(tài)結(jié)構(gòu)如圖所示 求最優(yōu)控制u t 及最優(yōu)軌線x t 使目標(biāo)泛函 由例2 9哈密頓方法 由協(xié)態(tài)方程得 由控制方程得 由狀態(tài)方程得 例2 11已知系統(tǒng)方程和邊界條件為 1 求使性能泛函 為極小值的最優(yōu)控制函數(shù)與最優(yōu)軌線 可以利用MATLAB符號(hào)工具箱求解微分方程 2 若終端條件為x1 1 0 x2 1 自由 求該最優(yōu)控制問(wèn)題 2 4變分法求解最優(yōu)控制問(wèn)題 2 求解綜合型 波爾扎 問(wèn)題 2 10 初始條件 2 9 和性能泛函 2 14 給定系統(tǒng)狀態(tài)方程 要求從容許控制U t Rm中確定最優(yōu)控制U t 使系統(tǒng) 2 9 從給定的初態(tài)X t0 轉(zhuǎn)移到某個(gè)終態(tài)X tf 并使性能泛函 2 14 達(dá)到極小值 這是波爾扎問(wèn)題 又稱為復(fù)合型最優(yōu)控制問(wèn)題 問(wèn)題2 4 注意 給定的端點(diǎn)條件不同 上述最優(yōu)控制問(wèn)題的解將不同 1 終端時(shí)刻tf固定 終端狀態(tài)X tf 自由的情況構(gòu)造輔助泛函為 若令哈密頓函數(shù)為 2 15 2 16 并對(duì)式 2 15 積分號(hào)內(nèi)第三項(xiàng)進(jìn)行分部積分 則輔助泛函變?yōu)?2 17 求上式對(duì)狀態(tài)變量X t 和控制變量U t 的變分 得 2 19 由于泛函J0達(dá)到極值的必要條件為 2 18 由于 X t0 0 X tf 0 X t 0 U t 0 則由式 2 18 和 2 19 可得上述波爾扎型最優(yōu)控制問(wèn)題的解應(yīng) 終端時(shí)刻tf固定 終端狀態(tài)X tf 自由的波爾扎型最優(yōu)控制問(wèn)題的解應(yīng)滿足的必要條件為 這些關(guān)系與拉格朗日型最優(yōu)控制問(wèn)題的完全相同 所不同的只是橫截條件 即協(xié)態(tài)變量的終端值 2 終端時(shí)刻tf固定 終端狀態(tài)X tf 受約束的情況設(shè)終端狀態(tài)受到如下等式的約束 2 20 其中 為r 當(dāng)L 0 r n 1 當(dāng)L 0 r n 維向量 即 這時(shí) 終端狀態(tài)X tf 即不是固定的 也不是完全自由的 只能在終端流型 2 20 上變動(dòng) 在構(gòu)造輔助泛函時(shí) 應(yīng)考慮終端約束條件 2 20 為此 需要引入待定的拉格朗日乘子向量 考慮到哈密頓函數(shù)為 2 21 并對(duì)式 2 21 積分號(hào)內(nèi)第三項(xiàng)進(jìn)行分部積分 則輔助泛函變?yōu)?構(gòu)造的輔助泛函為 求J0對(duì)狀態(tài)變量X t 和控制變量U t 的變分 得 考慮到 J0 0

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論