版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第五章神經(jīng)網(wǎng)絡(luò)控制論2
引言1234
非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)5
神經(jīng)網(wǎng)絡(luò)控制的學(xué)習(xí)機(jī)制神經(jīng)網(wǎng)絡(luò)控制器的設(shè)計(jì)由于神經(jīng)網(wǎng)絡(luò)本質(zhì)上是一個(gè)大規(guī)模并行分布處理的非線性動(dòng)力學(xué)系統(tǒng),并在更高層次上體現(xiàn)出一些人腦的智能行為,為智能控制提供了新途徑。神經(jīng)網(wǎng)絡(luò)控制的優(yōu)越性體現(xiàn)在:神經(jīng)網(wǎng)絡(luò)可以處理那些難以用模型或規(guī)則描述的過(guò)程或系統(tǒng)。神經(jīng)網(wǎng)絡(luò)采用并行分布式信息處理,具有很強(qiáng)的容錯(cuò)性。神經(jīng)網(wǎng)絡(luò)是本質(zhì)的非線性系統(tǒng)。神經(jīng)網(wǎng)絡(luò)具有很強(qiáng)的信息綜合能力。神經(jīng)網(wǎng)絡(luò)的硬件實(shí)現(xiàn)愈趨方便。一、引言神經(jīng)網(wǎng)絡(luò)控制器的分類(lèi)根據(jù)神經(jīng)網(wǎng)絡(luò)在控制系統(tǒng)中的作用不同,又可分為兩大類(lèi)一是神經(jīng)控制,它是以神經(jīng)網(wǎng)絡(luò)為基礎(chǔ)而形成的獨(dú)立智能控制系統(tǒng)二是混合神經(jīng)網(wǎng)絡(luò)控制,它代表著那些利用神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)和優(yōu)化能力來(lái)改善傳統(tǒng)的控制方法一、引言神經(jīng)網(wǎng)絡(luò)控制器的典型分類(lèi)導(dǎo)師指導(dǎo)下的控制器逆控制器自適應(yīng)網(wǎng)絡(luò)控制器前饋控制結(jié)構(gòu)自適應(yīng)評(píng)價(jià)網(wǎng)絡(luò)混合控制系統(tǒng)一、引言導(dǎo)師指導(dǎo)下的控制器:神經(jīng)網(wǎng)絡(luò)控制結(jié)構(gòu)的學(xué)習(xí)樣本直接取自于專(zhuān)家的控制經(jīng)驗(yàn)。一旦神經(jīng)網(wǎng)絡(luò)的訓(xùn)練達(dá)到了能夠充分描述人的控制行為時(shí),則網(wǎng)絡(luò)訓(xùn)練結(jié)束一、引言逆控制器:如果一個(gè)動(dòng)力學(xué)系統(tǒng)可以用一個(gè)逆動(dòng)力學(xué)函數(shù)來(lái)表示,則采用簡(jiǎn)單的控制結(jié)構(gòu)和方式是可能的一、引言模型參考自適應(yīng)網(wǎng)絡(luò)控制器:利用神經(jīng)網(wǎng)絡(luò)將線性系統(tǒng)經(jīng)典的自適應(yīng)控制設(shè)計(jì)理論和思想方法直接引到非線性系統(tǒng)自適應(yīng)控制系統(tǒng)中來(lái)是可能的一、引言神經(jīng)內(nèi)模控制結(jié)構(gòu):系統(tǒng)的實(shí)際輸出與模型M的輸出信號(hào)差用于反饋的目的。這個(gè)反饋信號(hào)通過(guò)前向通道上的控制子系統(tǒng)G預(yù)處理。通常G是一個(gè)濾波器,用于提高系統(tǒng)的魯棒性。系統(tǒng)模型M和控制器C可以由神經(jīng)網(wǎng)絡(luò)來(lái)實(shí)現(xiàn)一、引言前饋控制結(jié)構(gòu):通常單純的求逆控制結(jié)構(gòu)不能很好地起到抗干擾能力,因此結(jié)合反饋控制的思想組成前饋補(bǔ)償器的網(wǎng)絡(luò)控制結(jié)構(gòu)一、引言自適應(yīng)評(píng)價(jià)網(wǎng)絡(luò)是由Barto,Sutten和Anderson在1983年提出來(lái)的。整個(gè)學(xué)習(xí)系統(tǒng)由一個(gè)相關(guān)的搜索單元和一個(gè)自適應(yīng)評(píng)價(jià)單元組成,在這個(gè)算法中,相關(guān)搜索單元是作用網(wǎng)絡(luò)。自適應(yīng)評(píng)價(jià)單元為評(píng)價(jià)網(wǎng)絡(luò)。它不需要控制系統(tǒng)數(shù)學(xué)模型,只是通過(guò)對(duì)某一指標(biāo)準(zhǔn)則J的處理和分析得到獎(jiǎng)勵(lì)或懲罰信號(hào)。一、引言神經(jīng)網(wǎng)絡(luò)的逼近能力首先要搞清楚到底什么樣的被控系統(tǒng)可以用神經(jīng)網(wǎng)絡(luò)來(lái)描述。對(duì)于眾多的神經(jīng)網(wǎng)絡(luò)類(lèi)型來(lái)說(shuō),要得到一個(gè)統(tǒng)一的神經(jīng)網(wǎng)絡(luò)逼近理論是不現(xiàn)實(shí)的,況且,還有很多神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的逼近性問(wèn)題至今尚未得到證明多層前向傳播神經(jīng)網(wǎng)絡(luò)能夠相當(dāng)好地逼近許多實(shí)際問(wèn)題中的非線性函數(shù)。這一節(jié)就要回答這個(gè)問(wèn)題。一、引言神經(jīng)網(wǎng)絡(luò)的逼近能力含有兩個(gè)隱含層的前向傳播神經(jīng)網(wǎng)絡(luò),且神經(jīng)元激勵(lì)函數(shù)為單調(diào)的S型函數(shù),則此神經(jīng)網(wǎng)絡(luò)能夠得到合適的逼近精度對(duì)于在緊湊集中的任何平方可積函數(shù)可以通過(guò)有限個(gè)隱含神經(jīng)元組成的二層前向傳播神經(jīng)網(wǎng)絡(luò)來(lái)逼近,并能達(dá)到任意逼近精度??紤]具有單個(gè)隱含層的前向傳播神經(jīng)網(wǎng)絡(luò),其輸出屬于集合:
其中:x表示n維輸入矢量,=(1,xT)T;vj表示隱含層第j個(gè)神經(jīng)元到輸出層的權(quán)值;wj表示輸入矢量到隱含層第j個(gè)神經(jīng)元的權(quán)值矢量j=1,2,...,q;q為隱含層神經(jīng)元個(gè)數(shù);
Ψ(·)為隱含層神經(jīng)元特性。一、引言神經(jīng)網(wǎng)絡(luò)的逼近能力定義5-1:S型函數(shù)如果函數(shù)Ψ(·):R→[0,1]是非遞減函數(shù),且滿(mǎn)足則稱(chēng)函數(shù)Ψ(·)為S型函數(shù)。定義5-2:距離函數(shù)ρ-給定的函數(shù)空間S,設(shè)f,g,h∈S。則距離函數(shù)ρ滿(mǎn)足以下條件:
①.正定性ρ(f,g)≥0,且僅當(dāng)f=g時(shí)等號(hào)成立;
②.對(duì)稱(chēng)性ρ(f,g)=ρ(g,f);
③.三角不等式關(guān)系ρ(f,g)≤ρ(f,h)+ρ(h,g)。定義5-3:ρ-稠密-一個(gè)度量空間(X,ρ)中的子集S稱(chēng)為是在子集T上的ρ-稠密,只有當(dāng)對(duì)于任意一個(gè)給定的ε>0,對(duì)所有的t∈T,存在一個(gè)s∈S,有ρ(s,t)<ε。一、引言神經(jīng)網(wǎng)絡(luò)的逼近能力定理5-1:若神經(jīng)元的激勵(lì)函數(shù)Ψ(·)是S-型連續(xù)函數(shù)。那么,Σ(Ψ)在C(U)中是ρ-稠密。這個(gè)定理說(shuō)明,只要是有限空間中的連續(xù)函數(shù)g(x),總存在具有上述神經(jīng)元特性Ψ(·)的三層網(wǎng)絡(luò)Σ(Ψ),使得其輸出函數(shù)f(x)能夠以任意精度逼近g(x)。對(duì)于非連續(xù)函數(shù)是否也有類(lèi)似的神經(jīng)網(wǎng)絡(luò)來(lái)逼近它呢?如果能夠?qū)崿F(xiàn)這樣的逼近,則非連續(xù)函數(shù)g(x)應(yīng)該滿(mǎn)足什么樣的條件?Hornik等人在1989年發(fā)表論文中闡明了多層前向傳播神經(jīng)網(wǎng)絡(luò)可以逼近任意連續(xù)函數(shù)或分段連續(xù)函數(shù)一、引言16
引言1234
非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)5
神經(jīng)網(wǎng)絡(luò)控制的學(xué)習(xí)機(jī)制神經(jīng)網(wǎng)絡(luò)控制器的設(shè)計(jì)系統(tǒng)建模是神經(jīng)網(wǎng)絡(luò)的最早應(yīng)用。什么叫系統(tǒng)辨識(shí)?L.A.Zadch曾經(jīng)下過(guò)這樣的定義:“辨識(shí)是在輸入和輸出數(shù)據(jù)的基礎(chǔ)上,從一組給定的模型中,確定一個(gè)與所測(cè)系統(tǒng)等價(jià)的模型”。使用非線性系統(tǒng)的輸入輸出數(shù)據(jù)來(lái)訓(xùn)練神經(jīng)網(wǎng)絡(luò)可認(rèn)為是非線性函數(shù)的逼近問(wèn)題。多層前向傳播網(wǎng)絡(luò)能夠逼近任意L2非線性函數(shù)。二、非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)系統(tǒng)辨識(shí)的三要素:模型的選擇輸入信號(hào)的選擇誤差準(zhǔn)則的選擇二、非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)系統(tǒng)辨識(shí)的三要素:模型的選擇神經(jīng)網(wǎng)絡(luò)用于系統(tǒng)辨識(shí)的實(shí)質(zhì)就是選擇適當(dāng)?shù)纳窠?jīng)網(wǎng)絡(luò)模型來(lái)逼近實(shí)際系統(tǒng),即
為神經(jīng)網(wǎng)絡(luò)模型類(lèi),
∈
為一神經(jīng)網(wǎng)絡(luò)??紤]到多層前向傳播網(wǎng)絡(luò)具備良好的學(xué)習(xí)算法,本章我們選擇多層前向傳播網(wǎng)絡(luò)為模型類(lèi)
,
為一能充分逼近實(shí)際系統(tǒng)而又不過(guò)分復(fù)雜的多層網(wǎng)絡(luò)。
二、非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)系統(tǒng)辨識(shí)的三要素:輸入信號(hào)的選擇從時(shí)域上來(lái)看,要求系統(tǒng)的動(dòng)態(tài)過(guò)程在辨識(shí)時(shí)間內(nèi)必須被輸入信號(hào)持續(xù)激勵(lì),即輸入信號(hào)必須充分激勵(lì)系統(tǒng)的所有模態(tài);從頻域來(lái)看,要求輸入信號(hào)的頻譜必須足以覆蓋系統(tǒng)的頻譜二、非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)系統(tǒng)辨識(shí)的三要素:誤差準(zhǔn)則的選擇誤差準(zhǔn)則是用來(lái)衡量模型接近實(shí)際系統(tǒng)的標(biāo)準(zhǔn),它通常表示為一個(gè)誤差的泛函二、非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)一旦三大要素確定以后,神經(jīng)網(wǎng)絡(luò)的辨識(shí)就歸結(jié)為一個(gè)最優(yōu)化問(wèn)題。神經(jīng)網(wǎng)絡(luò)辨識(shí)具有以下五個(gè)特點(diǎn)。(1)不要求建立實(shí)際系統(tǒng)的辨識(shí)格式。(2)可以對(duì)本質(zhì)非線性系統(tǒng)進(jìn)行辨識(shí),而且辨識(shí)是通過(guò)在網(wǎng)絡(luò)外部擬合系統(tǒng)的輸入/輸出,網(wǎng)絡(luò)內(nèi)部隱含著系統(tǒng)的特性。因此這種辨識(shí)是由神經(jīng)網(wǎng)絡(luò)本身實(shí)現(xiàn)的,是非算法式的。(3)辨識(shí)的收斂速度不依賴(lài)于待辨識(shí)系統(tǒng)的維數(shù),只與神經(jīng)網(wǎng)絡(luò)本身及其所采用的學(xué)習(xí)算法有關(guān),傳統(tǒng)的辨識(shí)方法隨模型參數(shù)維數(shù)的增大而變得很復(fù)雜。(4)由于神經(jīng)網(wǎng)絡(luò)具有大量的連接,這些連接之間的權(quán)值在辨識(shí)中對(duì)應(yīng)于模型參數(shù),通過(guò)調(diào)節(jié)這些權(quán)值使網(wǎng)絡(luò)輸出逼近系統(tǒng)輸出(5)神經(jīng)網(wǎng)絡(luò)作為實(shí)際系統(tǒng)的辨識(shí)模型,實(shí)際上也是系統(tǒng)的一個(gè)物理實(shí)現(xiàn),可以用于在線控制。二、非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)神經(jīng)網(wǎng)絡(luò)辨識(shí)模型的結(jié)構(gòu)前向建模法逆模型法二、非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)前向建模法:利用神經(jīng)網(wǎng)絡(luò)來(lái)逼近非線性系統(tǒng)的前向動(dòng)力學(xué)模型。yN(k+1)=f~(y(k),...,y(k-n+1),u(k),...,u(k-m+1))二、非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)逆模型法直接法:逆向建模是最直接的方法是將系統(tǒng)輸出作為網(wǎng)絡(luò)的輸入,網(wǎng)絡(luò)輸出與其期望輸出即系統(tǒng)的輸入進(jìn)行比較得到誤差作為此神經(jīng)網(wǎng)絡(luò)訓(xùn)練的信號(hào)二、非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)逆模型法存在的問(wèn)題學(xué)習(xí)過(guò)程不一定是目標(biāo)最優(yōu)的,可以采用下圖所示的實(shí)用逆模型法一旦非線性系統(tǒng)對(duì)應(yīng)關(guān)系不是一對(duì)一的,那么不準(zhǔn)確的逆模型可能會(huì)被建立二、非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)非線性系統(tǒng)的前向建模辨識(shí)的兩種結(jié)構(gòu)并行結(jié)構(gòu)串行結(jié)構(gòu)串行結(jié)構(gòu)收斂性較好二、非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)對(duì)于非線性系統(tǒng):其中X(k)、U(k)、Y(k)分別為n維、p維、m維狀態(tài)矢量序列神經(jīng)網(wǎng)絡(luò)系統(tǒng)辨識(shí)的基本思想是利用神經(jīng)網(wǎng)絡(luò)的非線性映射特性來(lái)逼近動(dòng)態(tài)系統(tǒng)的非線性函數(shù)Φ和ψ。如下圖所示。二、非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)設(shè)系統(tǒng)的輸入空間為Ωu,輸出空間為Ωg,實(shí)際系統(tǒng)可以表示為一個(gè)從輸入空間到輸出空間的算子P:Ωu→Ωg;給定一個(gè)模型類(lèi)SM,設(shè)P∈SM,則辨識(shí)的目的就是確定一個(gè)SM的子集類(lèi)
,使其中存在
,且P在給定的準(zhǔn)則下,
為P的一個(gè)最佳逼近二、非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)討論非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)的四種辨識(shí)模型IIIIIIIV其中f、g分別為非線性函數(shù)。[u(k),y(k)]表示在k時(shí)刻的輸入-輸出對(duì)二、非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)假定:(1)線性部分的階次n、m已知;(2)系統(tǒng)是穩(wěn)定的,即對(duì)于所有給定的有界輸入其輸出響應(yīng)必定也是有界的。反映在模型Ⅰ上要求線性部分的特征多項(xiàng)式
的根應(yīng)全部位于單位圓內(nèi)。(3)系統(tǒng)是最小相位系統(tǒng),反映在模型Ⅱ上要求
的零點(diǎn)全部位于單位圓內(nèi)。(4){u(k-i),i=0,1,...}與{y(k-j),j=0,1,...}可以量測(cè)二、非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)神經(jīng)網(wǎng)絡(luò)的辨識(shí)途徑有二種:線性部分的參數(shù)已知
可歸結(jié)為帶時(shí)滯的多層感知網(wǎng)絡(luò)模型的學(xué)習(xí)問(wèn)題,只是導(dǎo)師學(xué)習(xí)信號(hào)有所不同。線性部分的參數(shù)未知
可歸結(jié)為帶時(shí)滯的多層感知網(wǎng)絡(luò)模型的學(xué)習(xí)和線性系統(tǒng)的參數(shù)估計(jì)問(wèn)題。二、非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)對(duì)于模型I、II如果線性部分已知,系統(tǒng)實(shí)際輸出與模型輸出(神經(jīng)網(wǎng)絡(luò)輸出與線性部分輸出之和)的差可以用BP算法來(lái)訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型二、非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)對(duì)于模型I、II,如果線性部分未知。采用改進(jìn)的BP迭代學(xué)習(xí)算法二、非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)設(shè)線性部分的未知參數(shù)用矢量α表示,非線性部分的神經(jīng)網(wǎng)絡(luò)模型參數(shù)用W陣表示針對(duì)模型I二、非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)由于線性模型和非線性模型的期望輸出Z(l+1)和tpj
在這里都是未知的,已知的只是兩個(gè)模型的輸出之和。而它們的期望值應(yīng)該是系統(tǒng)在當(dāng)前時(shí)刻k+1的實(shí)際輸出矢量y(k+1)值。因此在實(shí)際對(duì)如上算法進(jìn)行計(jì)算時(shí)可交替使用y(k+1)-y2(k+1)和y(k+1)-y1(k+1)去近似地代替Z(k+1)和tpj
在初始條件完全未知的情況下可以?。?/p>
其中ρ為比較大的數(shù)字。二、非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)舉例5-1考慮以下模型:
y(k+1)=a·y(k)+b·y(k-1)+g(u)
其中a=0.3,b=0.6g(u)=u3+0.3u2-0.4u試辨識(shí)該系統(tǒng)二、非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)解:線性部分,采用遞推最小二乘學(xué)習(xí)法非線性部分采用前向傳播多層神經(jīng)網(wǎng)絡(luò)來(lái)逼近 選擇神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)為Π1,8,4,1,η=0.2,β=0
二、非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)為了驗(yàn)證辨識(shí)效果,采用校驗(yàn)輸入信號(hào):二、非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)對(duì)于模型Ⅲ,可以用一個(gè)NN來(lái)逼近,也可以用兩個(gè)NN來(lái)逼近。下面考慮第二種情況:Nf
網(wǎng)絡(luò)用來(lái)逼近可分離的非線性函數(shù)之一
f(·)Ng
網(wǎng)絡(luò)用來(lái)逼近可分離的非線性函數(shù)之二
g(·)二、非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)選指標(biāo)函數(shù):根據(jù)BP算法的推導(dǎo)思路可得廣義誤差為:二、非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)神經(jīng)網(wǎng)絡(luò)系數(shù)更新公式為:在整個(gè)算法的計(jì)算過(guò)程中,交替使用網(wǎng)絡(luò)的實(shí)際輸出值opj1(L)和opj2(L),使得廣義誤差信號(hào)可以不斷地進(jìn)行計(jì)算和修正,直至最終收斂二、非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)43
引言1234
非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)5
神經(jīng)網(wǎng)絡(luò)控制的學(xué)習(xí)機(jī)制神經(jīng)網(wǎng)絡(luò)控制器的設(shè)計(jì)神經(jīng)元控制器的目的在于如何設(shè)計(jì)一個(gè)有效的神經(jīng)元網(wǎng)絡(luò)去代替?zhèn)鹘y(tǒng)控制器的作用,使得系統(tǒng)的輸出跟隨系統(tǒng)的期望輸出。為了達(dá)到這個(gè)目的,神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)方法就是尋找一種有效的途徑進(jìn)行網(wǎng)絡(luò)連接權(quán)陣或網(wǎng)絡(luò)結(jié)構(gòu)的修改,從而使得網(wǎng)絡(luò)控制器輸出的控制信號(hào)能夠保證系統(tǒng)輸出跟隨系統(tǒng)的期望輸出。三、神經(jīng)網(wǎng)絡(luò)控制的學(xué)習(xí)機(jī)制學(xué)習(xí)機(jī)制分為:監(jiān)督式學(xué)習(xí)(有導(dǎo)師指導(dǎo)下的控制網(wǎng)絡(luò)學(xué)習(xí))離線學(xué)習(xí)法在線學(xué)習(xí)法反饋誤差學(xué)習(xí)法多網(wǎng)絡(luò)學(xué)習(xí)法增強(qiáng)式學(xué)習(xí)(通過(guò)某一評(píng)價(jià)函數(shù)指定下的學(xué)習(xí))三、神經(jīng)網(wǎng)絡(luò)控制的學(xué)習(xí)機(jī)制1、離線學(xué)習(xí)法適合靜態(tài)環(huán)境,網(wǎng)絡(luò)離線訓(xùn)練中選擇的性能指標(biāo)為u-uc的平方誤差極小,這一指標(biāo)并不能保證系統(tǒng)的最終性能yd-y的平方誤差極小三、神經(jīng)網(wǎng)絡(luò)控制的學(xué)習(xí)機(jī)制2、在線學(xué)習(xí)法:
找出一個(gè)最優(yōu)控制量u使得系統(tǒng)輸出y趨于期望輸出yd。權(quán)陣的調(diào)整應(yīng)該使得yd-y的誤差減少最快適合模型已知的動(dòng)態(tài)環(huán)境三、神經(jīng)網(wǎng)絡(luò)控制的學(xué)習(xí)機(jī)制學(xué)習(xí)算法:采用最速下降法假設(shè)系統(tǒng)的Jacobian矩陣已知三、神經(jīng)網(wǎng)絡(luò)控制的學(xué)習(xí)機(jī)制3、反饋誤差學(xué)習(xí)法適用于非線性系統(tǒng)線性絕對(duì)占優(yōu)條件下的網(wǎng)絡(luò)學(xué)習(xí)
三、神經(jīng)網(wǎng)絡(luò)控制的學(xué)習(xí)機(jī)制4、多神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)法(兩種)三、神經(jīng)網(wǎng)絡(luò)控制的學(xué)習(xí)機(jī)制增強(qiáng)式學(xué)習(xí)當(dāng)某些被控系統(tǒng)的導(dǎo)師信號(hào)無(wú)法得到時(shí),期望輸出就沒(méi)有了。增強(qiáng)型學(xué)習(xí)就是利用當(dāng)前控制是否成功來(lái)決定下一次控制該如何走的學(xué)習(xí)方式。修正的辦法是對(duì)某一成功的行為進(jìn)行鼓勵(lì),而對(duì)不成功的行為進(jìn)行懲罰。用神經(jīng)網(wǎng)絡(luò)來(lái)實(shí)現(xiàn)時(shí),則可在權(quán)值空間進(jìn)行調(diào)整。三、神經(jīng)網(wǎng)絡(luò)控制的學(xué)習(xí)機(jī)制52
引言1234
非線性動(dòng)態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡(luò)辨識(shí)5
神經(jīng)網(wǎng)絡(luò)控制的學(xué)習(xí)機(jī)制神經(jīng)網(wǎng)絡(luò)控制器的設(shè)計(jì)四、神經(jīng)網(wǎng)絡(luò)控制器的設(shè)計(jì)神經(jīng)網(wǎng)絡(luò)控制的設(shè)計(jì)方法有四種:直接逆模型控制法直接網(wǎng)絡(luò)控制法多網(wǎng)絡(luò)自學(xué)習(xí)控制法單一神經(jīng)元控制1、直接逆模型控制法:
最直觀的一種神經(jīng)網(wǎng)絡(luò)控制器實(shí)現(xiàn)方法,其基本思想就是假設(shè)被控系統(tǒng)可逆,通過(guò)離線建模得到系統(tǒng)的逆模型網(wǎng)絡(luò),然后用這一逆網(wǎng)絡(luò)模型去直接控制被控對(duì)象訓(xùn)練結(jié)構(gòu)示意圖四、神經(jīng)網(wǎng)絡(luò)控制器的設(shè)計(jì)四、神經(jīng)網(wǎng)絡(luò)控制器的設(shè)計(jì)考慮如下單輸入單輸出系統(tǒng):y(k+1)=f(y(k-1),...,y(k-n+1),u(k),...,u(k-m))y:系統(tǒng)的輸出變量;u:系統(tǒng)的輸入變量;n:系統(tǒng)的階數(shù);m:輸入信號(hào)滯后階f(·):任意的線性或非線性函數(shù)如果已知系統(tǒng)階次n、m,并假設(shè)系統(tǒng)可逆,則存在函數(shù)g(·),有:u(k)=g(y(k+1),...,y(k-n+1),u(k-1),...,u(k-m))四、神經(jīng)網(wǎng)絡(luò)控制器的設(shè)計(jì)若能用一個(gè)多層前向傳播神經(jīng)網(wǎng)絡(luò)來(lái)實(shí)現(xiàn),則網(wǎng)絡(luò)的輸入輸出關(guān)系為:uN=Π(x)式中:uN為神經(jīng)網(wǎng)絡(luò)的輸出,它表示訓(xùn)練完成后神經(jīng)網(wǎng)絡(luò)產(chǎn)生的控制作用;
Π為神經(jīng)網(wǎng)絡(luò)的輸入輸出關(guān)系式,它用來(lái)逼近被控系統(tǒng)的逆模型函數(shù)g(·);X為神經(jīng)網(wǎng)絡(luò)的輸入矢量,X=[y(k+1),y(k),...,y(k-n+1),u(k-1),...,,u(k-m)]T將神經(jīng)網(wǎng)絡(luò)輸入矢量X中的y(k+1)用期望系統(tǒng)輸出值yd(k+1)去代替就可以通過(guò)神經(jīng)網(wǎng)絡(luò)Π產(chǎn)生期望的控制量u。即:X=[yd(k+1),y(k),...,y(k-n+1),u(k-1),...,u(k-m)]T直接網(wǎng)絡(luò)控制法:直接逆模型控制法由于缺乏學(xué)習(xí)機(jī)制,且在控制器的設(shè)計(jì)中又沒(méi)有考慮到系統(tǒng)本身的輸入輸出狀態(tài),因此,一旦系統(tǒng)運(yùn)行的環(huán)境、參數(shù)發(fā)生變化時(shí),這類(lèi)控制器就無(wú)法適應(yīng)了。直接網(wǎng)絡(luò)控制法是在神經(jīng)網(wǎng)絡(luò)的輸入端引入了系統(tǒng)的狀態(tài)信號(hào),并將學(xué)習(xí)機(jī)制實(shí)時(shí)在線地用于網(wǎng)絡(luò)控制器的調(diào)整和改善四、神經(jīng)網(wǎng)絡(luò)控制器的設(shè)計(jì)以例子來(lái)說(shuō)明設(shè)計(jì)方法:考慮被控系統(tǒng)假設(shè)動(dòng)力學(xué)逆模型成立,即有
u(k)=g[y(k+1),y(k),y(k-1),y(k-1)
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 《偵查策略》課件
- 外陰濕疹的臨床護(hù)理
- 孕期中暑的健康宣教
- 傳導(dǎo)性耳鳴的健康宣教
- 這位廳官的講話火了
- 雙曲線定義課件
- 你們想錯(cuò)了課件
- 化膿性腮腺炎的健康宣教
- 科學(xué)探究:物質(zhì)的比熱容課件滬科
- 鼻毛孔粗大伴白色分泌物的臨床護(hù)理
- 收購(gòu)公司法律盡職調(diào)查合同(2篇)
- 第六單元多邊形的面積 (單元測(cè)試)-2024-2025學(xué)年五年級(jí)上冊(cè)數(shù)學(xué)人教版
- 公路養(yǎng)護(hù)培訓(xùn)知識(shí)
- 國(guó)家安全教育高教-第六章堅(jiān)持以經(jīng)濟(jì)安全為基礎(chǔ)
- 鋰電儲(chǔ)能產(chǎn)品設(shè)計(jì)及案例詳解-筆記
- 廣東開(kāi)放大學(xué)2024年秋《國(guó)家安全概論(S)(本專(zhuān))》形成性考核作業(yè)參考答案
- 小兒靜脈留置針操作與護(hù)理
- 期末試卷(試題)-2024-2025學(xué)年三年級(jí)上冊(cè)數(shù)學(xué)蘇教版
- 水資源基礎(chǔ)調(diào)查項(xiàng)目招標(biāo)文件
- 中歐班列課件
- 天津市南開(kāi)區(qū)2023-2024學(xué)年四年級(jí)上學(xué)期期末英語(yǔ)試題
評(píng)論
0/150
提交評(píng)論