中南大學(xué)最優(yōu)控制論文

上傳人：b*** IP屬地：遼寧上傳時(shí)間：2023-05-21 格式：DOCX 頁(yè)數(shù)：15 大?。?06.51KB 積分：20 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩10頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

《最優(yōu)控制理論》課程總結(jié)姓名：班級(jí)：學(xué)號(hào)：任課老師：一、摘要最優(yōu)控制理論（optimalcontroltheory），是現(xiàn)代控制理論的一個(gè)主要分支，著重于研究使控制系統(tǒng)的性能指標(biāo)實(shí)現(xiàn)最優(yōu)化的基本條件和綜合方法。最優(yōu)控制理論是研究和解決從一切可能的控制方案中尋找最優(yōu)解的一門學(xué)科。它是現(xiàn)代控制理論的重要組成部分。其所研究的問(wèn)題可以概括為：對(duì)一個(gè)受控的動(dòng)力學(xué)系統(tǒng)或運(yùn)動(dòng)過(guò)程，從一類允許的控制方案中找出一個(gè)最優(yōu)的控制方案，使系統(tǒng)的運(yùn)動(dòng)在由某個(gè)初始狀態(tài)轉(zhuǎn)移到指定的目標(biāo)狀態(tài)的同時(shí)，其性能指標(biāo)值為最優(yōu)。這類問(wèn)題廣泛存在于技術(shù)領(lǐng)域或社會(huì)問(wèn)題中。這類問(wèn)題廣泛存在于技術(shù)領(lǐng)域或社會(huì)問(wèn)題中。例如，確定一個(gè)最優(yōu)控制方式使空間飛行器由一個(gè)軌道轉(zhuǎn)換到另一軌道過(guò)程中燃料消耗最少，選擇一個(gè)溫度的調(diào)節(jié)規(guī)律和相應(yīng)的原料配比使化工反應(yīng)過(guò)程的產(chǎn)量最多。因此最優(yōu)控制理論對(duì)于解決實(shí)際問(wèn)題和促進(jìn)科學(xué)的發(fā)展具有重要的意義和作用。關(guān)鍵字：最優(yōu)控制變分法極大值原理動(dòng)態(tài)規(guī)劃二、引言控制工程領(lǐng)域早期的經(jīng)典控制方法和技術(shù)早已被工程師們所熟知并進(jìn)行廣泛的應(yīng)用。一般而言經(jīng)典控制非常適合解決單輸入單輸出線性定長(zhǎng)系統(tǒng)的控制器設(shè)計(jì)問(wèn)題。然而對(duì)于高階系統(tǒng)或多輸入多輸出系統(tǒng)，采用經(jīng)典控制方法很難獲得令人滿意的控制性能。在這種情況下，控制學(xué)者于20世紀(jì)60年代初開(kāi)始研究狀態(tài)空間方法，并依此發(fā)展出現(xiàn)代控制的理論框架。其中最優(yōu)控制則是現(xiàn)代控制理論的主要分支，解決最優(yōu)控制問(wèn)題的主要方法有變分法、極值原理和動(dòng)態(tài)規(guī)劃。從數(shù)學(xué)的觀點(diǎn)來(lái)看，最優(yōu)控制研究的問(wèn)題是求解一類帶有約束條件的泛函極值問(wèn)題，屬于變分學(xué)的范疇，但它只能解決一類簡(jiǎn)單的最優(yōu)控制問(wèn)題，因?yàn)樗粚?duì)無(wú)約束或開(kāi)集性約束是有效的，而無(wú)法解決工程實(shí)際中經(jīng)常碰到的容許控制屬于閉集的一類最優(yōu)控制問(wèn)題。這就促使了控制學(xué)者們開(kāi)辟求解最優(yōu)控制問(wèn)題的新途徑。蘇聯(lián)學(xué)者Л.С.龐特里亞金1958年提出的極大值原理和美國(guó)學(xué)者R.貝爾曼1956年提出的動(dòng)態(tài)規(guī)劃，對(duì)最優(yōu)控制理論的形成和發(fā)展起了重要的作用，而這兩種理論則被稱作是最優(yōu)控制理論的兩大基石，它們對(duì)現(xiàn)代控制理論的發(fā)展起了重要的推動(dòng)作用。三、最優(yōu)控制問(wèn)題的分類

①

按狀態(tài)方程分類：連續(xù)最優(yōu)化系統(tǒng)、離散最優(yōu)化系統(tǒng)。

②

按控制作用實(shí)現(xiàn)方法分類：開(kāi)環(huán)最優(yōu)控制系統(tǒng)、閉環(huán)最優(yōu)控制系統(tǒng)。

③

按性能指標(biāo)分類：最小時(shí)間控制問(wèn)題、最少燃料控制問(wèn)題、線性二次型性能指標(biāo)最優(yōu)控制問(wèn)題、非線性性能指標(biāo)最優(yōu)控制問(wèn)題。

④

按終端條件分類：固定終端最優(yōu)控制問(wèn)題、自由終端（可變）最優(yōu)控制問(wèn)題、終端時(shí)間固定最優(yōu)控制問(wèn)題、終端時(shí)間可變最優(yōu)控制問(wèn)題。

⑤

按應(yīng)用領(lǐng)域來(lái)分：終端控制問(wèn)題、調(diào)節(jié)器問(wèn)題、跟蹤問(wèn)題、伺服機(jī)構(gòu)問(wèn)題、效果研究問(wèn)題、最小時(shí)間問(wèn)題、最少燃料問(wèn)題。四、主要方法為了解決最優(yōu)控制問(wèn)題，必須建立描述受控運(yùn)動(dòng)過(guò)程的運(yùn)動(dòng)方程，給出控制變量的允許取值范圍，指定運(yùn)動(dòng)過(guò)程的初始狀態(tài)和目標(biāo)狀態(tài)，并且規(guī)定一個(gè)評(píng)價(jià)運(yùn)動(dòng)過(guò)程品質(zhì)優(yōu)劣的性能指標(biāo)。通常，性能指標(biāo)的好壞取決于所選擇的控制函數(shù)和相應(yīng)的運(yùn)動(dòng)狀態(tài)。系統(tǒng)的運(yùn)動(dòng)狀態(tài)受到運(yùn)動(dòng)方程的約束，而控制函數(shù)只能在允許的范圍內(nèi)選取。解決最優(yōu)控制問(wèn)題的主要方法有變分法、極大值原理和動(dòng)態(tài)規(guī)劃。1、變分法變分法的發(fā)展可追溯到17世紀(jì)末，后來(lái)在20世紀(jì)60年代被引入解決最優(yōu)控制問(wèn)題。它是處理函數(shù)的函數(shù)的數(shù)學(xué)領(lǐng)域，與處理數(shù)的函數(shù)的普通微積分相對(duì)。變分法最終尋求的是極值函數(shù)：它們使得泛函取得極大或極小值。變分法的關(guān)鍵定理是歐拉方程。它對(duì)應(yīng)于泛函的臨界點(diǎn)。在尋找函數(shù)的極大和極小值時(shí)，在一個(gè)解附近的微小變化的分析給出一階的一個(gè)近似。它不能分辨是找到了最大值或者最小者（或者兩者都不是）。其基本思想是將變分問(wèn)題轉(zhuǎn)化為微分方程的邊值問(wèn)題進(jìn)行求解，是一種非常經(jīng)典的方法，但它只能解決容許控制屬于開(kāi)集的最優(yōu)控制問(wèn)題，無(wú)法解決工程實(shí)際中經(jīng)常遇到的容許控制屬于閉集的最優(yōu)控制。下面將分一些基本情況對(duì)變分法進(jìn)行簡(jiǎn)要概述。1）、無(wú)等式約束在無(wú)等式約束下求取函數(shù)極值的必要條件為?LL當(dāng)然僅滿足必要條件并不能保證泛函取得極值，還應(yīng)考慮下列情況①端點(diǎn)固定此時(shí)X(t0)=X0,X(tf則只需δX②端點(diǎn)可變考慮端點(diǎn)約束Xt0=則需加入橫截條件[α若當(dāng)端點(diǎn)時(shí)刻固定，端點(diǎn)狀態(tài)自由時(shí)，其橫截條件簡(jiǎn)化為δL(2）、有等式約束處理有等式約束的泛函極值問(wèn)題通常通過(guò)構(gòu)造拉格朗日方程將有等式約束的問(wèn)題轉(zhuǎn)化為無(wú)等式約束的問(wèn)題，下面列舉一些常見(jiàn)的等式約束，求泛函極值的必要條件。(1)連續(xù)時(shí)間①差分方程在起點(diǎn)時(shí)刻，終點(diǎn)時(shí)刻，起點(diǎn)狀態(tài)固定，終點(diǎn)狀態(tài)自由的情況下，其必要條件為狀態(tài)方程：x協(xié)調(diào)方程：λ極值條件：δ初始條件：X橫截條件：λ②積分約束在起點(diǎn)時(shí)刻，終點(diǎn)時(shí)刻，起點(diǎn)狀態(tài)固定，終點(diǎn)狀態(tài)自由，積分約束為t0狀態(tài)方程：xt=f[x協(xié)態(tài)方程：λλt=-極值條件：?約束條件：x橫截條件：λ③狀態(tài)和控制等式約束給定的等式約束為：φxt,ut狀態(tài)方程：x協(xié)態(tài)方程：λ極值條件：?等式約束：φ約束條件：x橫截條件：λ④終端約束在起點(diǎn)固定，終點(diǎn)約束為ξx狀態(tài)方程：x協(xié)態(tài)方程：λ極值條件：?約束條件：xt0橫截條件：λt⑤內(nèi)點(diǎn)等式約束在內(nèi)點(diǎn)等式約束為Nx起點(diǎn)固定，終點(diǎn)約束為ξx狀態(tài)方程：x協(xié)態(tài)方程：λ=極值條件：?H約束條件：xt0橫截條件：λt內(nèi)點(diǎn)約束:N角條件：λ(2)離散時(shí)間在離散的情況下求得目標(biāo)函數(shù)的最優(yōu)控制序列{u(k)狀態(tài)方程：X協(xié)態(tài)方程：λ極值條件：?終端條件：ξx橫截條件：λk2、極大值原理用變分法求泛函極值建立在系統(tǒng)控制向量不收任何限制的基礎(chǔ)上，容許控制為一個(gè)開(kāi)集，即δu任意，u不收限制，它遍及整個(gè)空間，且δH1)連續(xù)時(shí)間在端點(diǎn)約束為ξxt0,t正則方程：xtλ=極值條件：H終端條件：ξ橫截條件：λtHxλtf可見(jiàn)利用最大值原理和變分法求解最優(yōu)控制問(wèn)題時(shí)，除了控制方程的形式不同外，其余條件是相同的2）離散時(shí)間在起點(diǎn)時(shí)刻，終點(diǎn)時(shí)刻，起點(diǎn)狀態(tài)固定，終點(diǎn)狀態(tài)自由的情況下，求使目標(biāo)函數(shù)取得極值的控制序列u*狀態(tài)方程：X協(xié)態(tài)方程：λ極值條件：H初始條件：x(0)*=x橫截條件：λ3、動(dòng)態(tài)規(guī)劃在Л.С.龐特里亞金等人發(fā)展極大值原理期間，在1953年至1957年間，美國(guó)數(shù)學(xué)家R.貝爾曼等人發(fā)展了變分法中的哈密頓-雅可比（Hamilton-Jacobi）理論，并逐步形成了與最大值原理并稱為最優(yōu)控制理論兩大基石的動(dòng)態(tài)規(guī)劃，它可以卓有成效的解決各種最優(yōu)控制問(wèn)題，并且與變分發(fā)，極大值原理有非常密切的聯(lián)系。其基本思想為：不論現(xiàn)在的狀態(tài)和過(guò)去的決策如何，隨后各段的決策對(duì)于現(xiàn)在的狀態(tài)必定構(gòu)成最優(yōu)決策。由于它最初是應(yīng)用于多級(jí)決策過(guò)程的一種優(yōu)化方案，所以下面首先闡述時(shí)間離散問(wèn)題。1)時(shí)間離散若需求一個(gè)控制序列{u(k)*逐步求出u(N-1),u(N-2)……u(0)2)時(shí)間連續(xù)時(shí)間連續(xù)問(wèn)題可通過(guò)求解HJB方程：?來(lái)求得u(t)*,其約束條件為可見(jiàn)HJB方程是V(x,t)的一階偏微分方程，并帶有取極小值的運(yùn)算，因此求解是非常困難的，只能用計(jì)算機(jī)求數(shù)值解。五、三種方法的優(yōu)劣及相互的關(guān)系變分法是求解泛函極值的一種經(jīng)典方法，也是研究最優(yōu)控制問(wèn)題的一種重要工具。但由于它不能解決控制函數(shù)的取值受到封閉性的邊界限制的情況，變分法對(duì)于解決許多重要的實(shí)際最優(yōu)控制問(wèn)題，是無(wú)能為力的。極大值原理則彌補(bǔ)了變分法的這種不足，可用于控制變量受限制的情況，能給出問(wèn)題中最優(yōu)控制所必須滿足的條件。雖然最小值原理為解決帶有閉集約束的最優(yōu)控制問(wèn)題提供了有效的方法，但遺憾的是它只是一個(gè)必要條件。也就是說(shuō)，由最大值原理所求得的解能否使性能泛函J達(dá)到極小值，還需要進(jìn)一步分析與判定。但是，如果根據(jù)物理意義已經(jīng)能夠斷定所討論的最優(yōu)控制問(wèn)題的解是存在的，而由最大值原理所得到的解只有一個(gè)，那么，該解就是最優(yōu)解。實(shí)際上，我們遇到的問(wèn)題往往屬于這種情況。動(dòng)態(tài)規(guī)劃與極大值原理一樣，是處理控制變量有有界閉集約束時(shí)，確定最優(yōu)控制解的有效數(shù)學(xué)方法。利用動(dòng)態(tài)規(guī)劃求解控制有約束的最優(yōu)控制問(wèn)題特別方便，但必須滿足最優(yōu)化原理和無(wú)后效性的限制，其應(yīng)用有一定的局限性。而在實(shí)際應(yīng)用中，動(dòng)態(tài)規(guī)劃需要很大的空間以存儲(chǔ)中間產(chǎn)生的結(jié)果，這樣可以使包含同一個(gè)子問(wèn)題的所有問(wèn)題共用一個(gè)子問(wèn)題解，從而體現(xiàn)動(dòng)態(tài)規(guī)劃的優(yōu)越性，但這是以犧牲空間為代價(jià)的，為了有效地訪問(wèn)已有結(jié)果，數(shù)據(jù)也不易壓縮存儲(chǔ)，因而空間矛盾是比較突出的。另一方面，動(dòng)態(tài)規(guī)劃的高時(shí)效性往往要通過(guò)大的測(cè)試數(shù)據(jù)體現(xiàn)出來(lái)（以與搜索作比較），因而，對(duì)于大規(guī)模的問(wèn)題如何在基本不影響運(yùn)行速度的條件下，解決空間溢出的問(wèn)題，也是動(dòng)態(tài)規(guī)劃解決問(wèn)題時(shí)一個(gè)普遍會(huì)遇到的問(wèn)題。雖然動(dòng)態(tài)規(guī)劃的實(shí)現(xiàn)受到了許多的限制，但它比最大值原理應(yīng)用的范圍要廣泛得多，并且所得到的結(jié)論是關(guān)于最優(yōu)控制問(wèn)題的充分條件。作為解決最優(yōu)控制問(wèn)題的三種重要方法，它們也不是獨(dú)立存在的，相反，三者有著重要的聯(lián)系。由動(dòng)態(tài)規(guī)劃的哈密頓-雅克比方程，可以推得變分法中的歐拉方程和橫截條件；也可以推得極小值原理的必要條件。并且在所要求的條件都滿足的情況下，使用這三種方法所得結(jié)論相同。六、最優(yōu)控制理論存在的問(wèn)題常見(jiàn)的實(shí)際物理系統(tǒng)，性能指標(biāo)的提法合理則一般存在最優(yōu)解，而且在一定的范圍內(nèi)有唯一解。但是，對(duì)于一個(gè)比較復(fù)雜的問(wèn)題，最優(yōu)控制問(wèn)題解的存在性和唯一性的判定是比較復(fù)雜的，有時(shí)甚至是不可能的。現(xiàn)在的研究一般都假定是有唯一解的最優(yōu)控制問(wèn)題，即可以求出一個(gè)最優(yōu)的解來(lái)。我們還應(yīng)該了解，我們希望找到的是“整體”的最優(yōu)控制，也就是在允許的范圍內(nèi)，尋找的控制作用使動(dòng)態(tài)系統(tǒng)的性能指標(biāo)達(dá)到最小或者最大。但是，在實(shí)際情況中除二次型性能指標(biāo)的最優(yōu)控制問(wèn)題外，一般是很難用定量方法求得整體最優(yōu)控制的，因此常常是求出許多局部最優(yōu)控制，再挑選整體最優(yōu)控制。七、結(jié)束語(yǔ)21世紀(jì)是科技迅猛發(fā)展的時(shí)代，各門學(xué)術(shù)都將有令人耳目一新的成就出現(xiàn)。而最優(yōu)控制仍是一個(gè)十分活躍的研究領(lǐng)域，在理論和實(shí)踐兩方面都得到了充

人人文庫(kù)> 全部分類> 教育資料 > 課設(shè)設(shè)計(jì)

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

中南大學(xué)最優(yōu)控制論文

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

中南大學(xué)最優(yōu)控制論文

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔