復(fù)雜機電控制7-迭代學(xué)習(xí)控制-2013-11-19_第1頁
復(fù)雜機電控制7-迭代學(xué)習(xí)控制-2013-11-19_第2頁
復(fù)雜機電控制7-迭代學(xué)習(xí)控制-2013-11-19_第3頁
復(fù)雜機電控制7-迭代學(xué)習(xí)控制-2013-11-19_第4頁
復(fù)雜機電控制7-迭代學(xué)習(xí)控制-2013-11-19_第5頁
已閱讀5頁,還剩34頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

復(fù)雜機電控制7-迭代學(xué)習(xí)控制-2013-11-19第一頁,共39頁。第七章迭代學(xué)習(xí)控制

ILC(IterativeLearningControl)7.1迭代學(xué)習(xí)控制概述7.2迭代學(xué)習(xí)控制律7.3迭代學(xué)習(xí)控制簡單實例第二頁,共39頁。遺傳學(xué)習(xí)(RacialLearning):

具有生存能力的動物,使那些在它的一生中,能被它所經(jīng)歷的環(huán)境所改造的動物,一個能繁殖的動物,至少能夠產(chǎn)生與它大略相似的動物,這種從一代到下一代的種族學(xué)習(xí)或系統(tǒng)發(fā)育學(xué)習(xí).學(xué)習(xí)控制系統(tǒng):

它能通過與被控對象和環(huán)境的閉環(huán)交互作用,根據(jù)過去獲得的經(jīng)驗信息,逐步改進系統(tǒng)自身的未來性能。第三頁,共39頁。第七章迭代學(xué)習(xí)控制

ILC(IterativeLearningControl)1978年,Uchiyama(內(nèi)山)在一篇有關(guān)機器人控制的論文中提出ILC思想(日文雜志Repetive),因文章是日文發(fā)表的,當時并未引起人們的重視。1984年,Arimoto

(有本)和其合作者們將內(nèi)山的初步思想加以完善,建立了實用的算法,從理論上證明了這種算法的可行性而成為正規(guī)的迭代學(xué)習(xí)控制理論,并以英文發(fā)表了他們的研究成果,迭代學(xué)習(xí)控制ILC(IterativeLearningControl)才得以推廣。第四頁,共39頁。迭代學(xué)習(xí)是模擬人的學(xué)習(xí)過程與特性,類似于人的“循序漸進”。

“Learningbytrail”邊學(xué)邊干的學(xué)習(xí)規(guī)律,使得對被控對象的動力學(xué)描述和參數(shù)化估計的復(fù)雜計算均可以簡化或省略。第五頁,共39頁。第七章迭代學(xué)習(xí)控制

ILC(IterativeLearningControl)7.1迭代學(xué)習(xí)控制概述7.2迭代學(xué)習(xí)控制律7.3迭代學(xué)習(xí)控制簡單實例第六頁,共39頁。7.1迭代學(xué)習(xí)控制概述迭代學(xué)習(xí)控制適用的場合,以及與其它控制方法的區(qū)別1.適合場合

可用于不確定的對象或非線性系統(tǒng),但系統(tǒng)動作過程應(yīng)具有自己的重復(fù)性。2.ILC和ANNC(人工神經(jīng)網(wǎng)絡(luò)控制)的區(qū)別

a.ANNC給定一樣本,包含輸入對應(yīng)的輸出結(jié)果。

b.ILC只給出期望的輸出,需要獲得合適的輸入達到或接近期望的輸出。兩者通常都是離線使用學(xué)習(xí)結(jié)果。第七頁,共39頁。7.1迭代學(xué)習(xí)控制概述3.ILC和最優(yōu)控制的區(qū)別最優(yōu)控制通過對描述的數(shù)學(xué)模型的理論優(yōu)化得到所需的控制量。ILC是通過先前多次的實驗結(jié)果改進,來獲得最優(yōu)的控制量。第八頁,共39頁。7.1迭代學(xué)習(xí)控制概述4.ILC和自適應(yīng)控制的區(qū)別

兩者都是用來解決系統(tǒng)不確定的問題,均基于在線的參數(shù)調(diào)整算法,都要使用與環(huán)境、對象閉環(huán)交互得到的實驗信息。自適應(yīng)控制是在線的控制,用于緩慢的時變特性以及新型的控制局勢,對嚴重的非線性問題失效。ILC的控制是在線的,而學(xué)習(xí)是離線的,適合于建模不良的非線性系統(tǒng),但不宜用于時變動態(tài)系統(tǒng)。

ILC是在每次試驗后離線實現(xiàn)控制,而自適應(yīng)控制的算法是在線算法,且需要進行大量的計算。第九頁,共39頁。自適應(yīng)控制和常規(guī)的反饋控制和最優(yōu)控制一樣,也是一種基于數(shù)學(xué)模型的控制方法,所不同的只是自適應(yīng)控制所依據(jù)的關(guān)于模型和擾動的先驗知識比較少,需要在系統(tǒng)的運行過程中去不斷提取有關(guān)模型的信息,使模型逐步完善。具體地說,可以依據(jù)對象的輸入輸出數(shù)據(jù),不斷地辨識模型參數(shù),這個過程稱為系統(tǒng)的在線辯識。隨著生產(chǎn)過程的不斷進行,通過在線辯識,模型會變得越來越準確,越來越接近于實際。在這個意義下,控制系統(tǒng)具有一定的適應(yīng)能力。比如說,當系統(tǒng)在設(shè)計階段,由于對象特性的初始信息比較缺乏,系統(tǒng)在剛開始投入運行時可能性能不理想,但是只要經(jīng)過一段時間的運行,通過在線辯識和控制以后,控制系統(tǒng)逐漸適應(yīng),最終將自身調(diào)整到一個滿意的工作狀態(tài)。再比如某些控制對象,其特性可能在運行過程中要發(fā)生較大的變化,但通過在線辯識和改變控制器參數(shù),系統(tǒng)也能逐漸適應(yīng)。第十頁,共39頁。7.1迭代學(xué)習(xí)控制概述ILC的定義1.從控制的角度定義它是通過對具有重復(fù)性的被控對象系統(tǒng),利用先前的控制經(jīng)驗嘗試,以輸出的軌跡與給定的期望軌跡偏差修正不理想的控制信號,最終找出一個理想的輸入特性曲線,使得系統(tǒng)跟蹤期望輸出結(jié)果的能力提高,最終達到所期望的輸出或接近于許可的輸出。第十一頁,共39頁。7.1

迭代學(xué)習(xí)控制概述2.數(shù)學(xué)描述ILC在有限的時間域[0,T]內(nèi),給定的被控對象期望的響應(yīng)為yd(t),t∈[0,T],尋找某種給定的控制量uk(t),t∈[0,T],使其響應(yīng)yk(t),t∈[0,T],在某種意義上對y0(t)(可理解為yk-1(t))有所改善,其中k為尋找次數(shù),這樣的過程稱為學(xué)習(xí)控制過程。第十二頁,共39頁。7.1迭代學(xué)習(xí)控制概述3.ILC過程的機理是尋找并求得動態(tài)控制系統(tǒng)的輸入、輸出之間比較簡單的關(guān)系。執(zhí)行每一個由前一步控制學(xué)習(xí)結(jié)束更新的控制過程。改善每一個控制過程,使其性能優(yōu)于前一個過程。

希望通過重復(fù)執(zhí)行這種學(xué)習(xí)過程和記錄全過程的結(jié)果,能夠穩(wěn)步改善受控系統(tǒng)的性能。第十三頁,共39頁。7.1迭代學(xué)習(xí)控制概述ILC的特點ILC適用于某種具有重復(fù)學(xué)習(xí)運動的被控對象,每次都做同樣的工作??蓪崿F(xiàn)完全的跟蹤。學(xué)習(xí)過程只需要測量實際的輸出結(jié)果和期望的信號,對被控對象的動力學(xué)模型描述和參數(shù)估計的一些復(fù)雜計算均可簡化或省略。在不明確已知(甚至未知)的被控對象動力學(xué)特性的情況下設(shè)計控制器,故適合非線性系統(tǒng)。第十四頁,共39頁。7.1迭代學(xué)習(xí)控制概述5.在線控制負擔(dān)小進行快速的運動控制,實時性好6.具有記憶功能,遇到類似的控制功能時,它能根據(jù)記憶錄中的任務(wù),快速調(diào)整控制任務(wù)。7.對干擾和系統(tǒng)的變化量有一定的魯棒性。第十五頁,共39頁。7.1迭代學(xué)習(xí)控制概述四.適用工業(yè)領(lǐng)域具備重復(fù)運動的場合:計算機搬運,裝配,生產(chǎn)線焊接工業(yè),噴涂工藝,機器人數(shù)控加工中間的送進。第十六頁,共39頁。第七章迭代學(xué)習(xí)控制

ILC(IterativeLearningControl)7.1迭代學(xué)習(xí)控制概述7.2迭代學(xué)習(xí)控制律7.3迭代學(xué)習(xí)控制簡單實例第十七頁,共39頁。7.2迭代學(xué)習(xí)控制律一、ILC的被控對象需滿足的具體條件每次運行的時間間隔為固定的周期T;期望的給定輸出yd(t)是t∈[0,T]域內(nèi)的已知函數(shù);每次運行前動力系統(tǒng)的初始狀態(tài)Xk(0)相同,k是學(xué)習(xí)次數(shù),k=(1.2.3…);每次運行的輸出yk(t)均可測,誤差值可獲得e

k(t)=yd(t)–y

k(t);第十八頁,共39頁。6.系統(tǒng)的動力學(xué)結(jié)構(gòu)在一次運行中保持不變ILC在線性定常系統(tǒng),線性時變系統(tǒng)和非線性的系統(tǒng)中均收斂,但對系統(tǒng)滯后等不收斂。

5.下一次運行的給定uk+1(t)滿足以下遞推條件:一、ILC的被控對象需滿足的具體條件第十九頁,共39頁。二、ILC的學(xué)習(xí)過程若第k次訓(xùn)練時期望輸出與實際輸出的誤差為ek(t)=yd(t)–yk(t);t∈[0,T]第k+1次訓(xùn)練的輸入控制uk+1(t)則為第k次訓(xùn)練的輸入控制uk(t)與輸出誤差e

k(t)的加權(quán)和uk+1(t)

=uk(t)

+we

k(t)

在ILC中,控制用的學(xué)習(xí)是通過對以往控制經(jīng)驗(控制作用與誤差的加權(quán)和)的記憶實現(xiàn)的,算法的收斂性依賴加權(quán)因子w的確定。這種ILC的核心是系統(tǒng)不變的假設(shè)以及基于記憶單元間斷的重復(fù)訓(xùn)練過程,學(xué)習(xí)規(guī)律極為簡單。第二十頁,共39頁。反饋通道控制器被控對象加權(quán)因子反饋通道控制器被控對象加權(quán)因子+++++++----+記憶學(xué)習(xí)控制器學(xué)習(xí)控制器可有多種不同的變化加權(quán)因子也可以用學(xué)習(xí)控制量代替即(可用于不同的控制方法)ILC的學(xué)習(xí)過程第k次操作第k+1次操作第k+2次操作…第二十一頁,共39頁。7.2迭代學(xué)習(xí)控制律三.迭代學(xué)習(xí)控制的任務(wù)

給出系統(tǒng)的當前輸入和當前輸出,確定寫個期望輸入,使系統(tǒng)的實際輸出收斂于期望值。第二十二頁,共39頁。7.2迭代學(xué)習(xí)控制律四、迭代學(xué)習(xí)控制律兩種基本形式的學(xué)習(xí)律是D型學(xué)習(xí)律和P型學(xué)習(xí)律,其中D型學(xué)習(xí)律是首先被提出來的一種。單純的D型學(xué)習(xí)律可調(diào)整的參數(shù)只有學(xué)習(xí)增益KD,當KD確定后,學(xué)習(xí)系統(tǒng)的跟蹤性能和收斂速度也基本上隨之確定,為了提高收斂速度,改善跟蹤性能,需要在學(xué)習(xí)律中增添可調(diào)整的參數(shù)項,因而產(chǎn)生了PD型、DI型學(xué)習(xí)律、PID型學(xué)習(xí)律,PID型學(xué)習(xí)律是三者中最為完善的學(xué)習(xí)律。第二十三頁,共39頁。7.2迭代學(xué)習(xí)控制律迭代學(xué)習(xí)的PID控制律第二十四頁,共39頁。7.2迭代學(xué)習(xí)控制律PID型學(xué)習(xí)控制律的增量算式:ek(t)=yd(t)–yk(t)對于采樣時刻t=nT(T為采樣時間)令第二十五頁,共39頁。第二十六頁,共39頁。7.2迭代學(xué)習(xí)控制律令u0(t)

=yd(t)

,將輸出轉(zhuǎn)化為增量形式:初始化條件為:第二十七頁,共39頁。五、迭代學(xué)習(xí)控制律的算法流程(1)置k=0,給定并存儲期望的軌跡yd(t)以及初始的控制u0(t),t∈[0,T](2)通過初始的定位操作,使系統(tǒng)初始輸出位于yk(0),相應(yīng)的初態(tài)位于xk(0)(3)對被控對象施加輸入uk(t),t∈[0,T],開始反復(fù)操作,同時采樣并存儲系統(tǒng)的輸出yk(t),t∈[0,T],(4)計算輸出的誤差ek(t)=yd(t)-yk(t),t∈[0,T](5)由學(xué)習(xí)控制律計算并存儲新的控制輸入uk+1(t)=uk(t)+△uk(t),t∈[0,T](6)將uk+1(t)施加給系統(tǒng),產(chǎn)生yk+1(t),ek+1(t)(7)檢驗迭代停止條件:‖yd(t)-y0(t)‖<ε,式中ε為給定的允許跟蹤精度。若條件滿足則停止運行,否則置k=k+1,轉(zhuǎn)步驟(2)第二十八頁,共39頁。第七章迭代學(xué)習(xí)控制

ILC(IterativeLearningControl)7.1迭代學(xué)習(xí)控制概述7.2迭代學(xué)習(xí)控制律7.3迭代學(xué)習(xí)控制簡單實例第二十九頁,共39頁。7.3迭代學(xué)習(xí)控制簡單實例例如直流電動機驅(qū)動的單自由度線形機械系統(tǒng),如下圖所示為系統(tǒng)方框圖,其中y(t)為電動機的角速度,u(t)為輸入電壓。K1+-K2(1)系統(tǒng)描述該閉環(huán)系統(tǒng)用微分方程表示為:其中第三十頁,共39頁。當初始時刻取為零時,方程的解為:(2)控制任務(wù)在區(qū)間[0,T]上給定一個期望的角速度yd(t),尋求電壓u(t)使得電機輸出角速度y(t)在[0,T]上與yd(t)盡可能一致(3)確定輸入數(shù)據(jù)選擇任何一個輸入電壓u0(t),t∈[0,T],將y

d(t)和u0(t)存入存儲器中,通過初始定位操作,使系統(tǒng)位于yk(0)(4)施加初始的輸入電壓u0(t)使系統(tǒng)運行得到y(tǒng)0(t),則e0(t)=yd(t)-y0(t)第三十一頁,共39頁。(5)以D型學(xué)習(xí)律計算新的輸入電壓,并獲得下一次誤差(6)迭代過程第三十二頁,共39頁。y

k(t)t設(shè)期望軌跡為yd(t)=t,t∈[0,1],初始條件yk(t)=

yd(t)(k=0,1,2,…)下,選取初始控制u0(t)=0,迭代輸出軌跡如圖所示。圖中y9(t)與yd(t)(紅色的線)重合,即迭代第9次達到期望。第三十三頁,共39頁。

移動機器人軌跡跟蹤迭代學(xué)習(xí)控制

移動機器人是一種在復(fù)雜的環(huán)境下工作的具有自規(guī)劃、自組織、自適應(yīng)能力的機器人。在移

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論