版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、智智 能能 控控 制制Intelligent ControlIntelligent Control第九章第九章 其他智能控制其他智能控制9.1 9.1 仿人控制仿人控制9.1.1 9.1.1 仿人控制原理與原型算法仿人控制原理與原型算法 1. 1. 仿人控制的基本原理仿人控制的基本原理 仿人控制的基本思想就是在模擬人的控制結(jié)構(gòu)的基礎(chǔ)上,進(jìn)一步研究和模仿人控制的基本思想就是在模擬人的控制結(jié)構(gòu)的基礎(chǔ)上,進(jìn)一步研究和模擬人的控制行為與功能,并把它用于控制系統(tǒng),實(shí)現(xiàn)控制目標(biāo)。擬人的控制行為與功能,并把它用于控制系統(tǒng),實(shí)現(xiàn)控制目標(biāo)。 仿人控制研究的主要目標(biāo)不是被控對象,而是控制器本身如何對控制專家仿人控
2、制研究的主要目標(biāo)不是被控對象,而是控制器本身如何對控制專家結(jié)構(gòu)和行為的模擬。結(jié)構(gòu)和行為的模擬。 仿人控制理論的具體研究方法是:從遞階控制系統(tǒng)的最底層(執(zhí)行級)仿人控制理論的具體研究方法是:從遞階控制系統(tǒng)的最底層(執(zhí)行級)入手,充分應(yīng)用已有各種控制理論和計(jì)算機(jī)仿真結(jié)果直接對人的控制經(jīng)驗(yàn)、入手,充分應(yīng)用已有各種控制理論和計(jì)算機(jī)仿真結(jié)果直接對人的控制經(jīng)驗(yàn)、技巧和各種直覺推理能力進(jìn)行測辨和總結(jié),編制成各種實(shí)用、精度高、能實(shí)技巧和各種直覺推理能力進(jìn)行測辨和總結(jié),編制成各種實(shí)用、精度高、能實(shí)時運(yùn)行的控制算法,并把它們直接應(yīng)用于實(shí)際控制系統(tǒng),進(jìn)而建立起系統(tǒng)的時運(yùn)行的控制算法,并把它們直接應(yīng)用于實(shí)際控制系統(tǒng),
3、進(jìn)而建立起系統(tǒng)的仿人控制理論體系,最后發(fā)展成智能控制理論。仿人控制理論體系,最后發(fā)展成智能控制理論。 (4 4)啟發(fā)式和直覺推理問題求)啟發(fā)式和直覺推理問題求解解. . 仿人控制在結(jié)構(gòu)和功能上具有以下基本特征:仿人控制在結(jié)構(gòu)和功能上具有以下基本特征:(1 1)遞階信息處理和決策機(jī)構(gòu);)遞階信息處理和決策機(jī)構(gòu);(2 2)在線特征辨識和特征記憶;)在線特征辨識和特征記憶; (3 3)開閉環(huán)結(jié)合和定性與定量結(jié)合的多模態(tài)控制;)開閉環(huán)結(jié)合和定性與定量結(jié)合的多模態(tài)控制;2. 2. 仿人控制的原型算法仿人控制的原型算法 )00( )000( 1,11,eeeekKeeeeekKeKuniimpniimpp
4、 (9.1) 圖圖9.1 9.1 仿人控制系統(tǒng)的一般結(jié)構(gòu)仿人控制系統(tǒng)的一般結(jié)構(gòu)任務(wù)適應(yīng)層任務(wù)適應(yīng)層+_擾動受控對象擾動受控對象反饋反饋參數(shù)校正層參數(shù)校正層直接控制層直接控制層公共數(shù)據(jù)庫公共數(shù)據(jù)庫ERUYee 0ee 0ee niimpnmpnnekKekKutu0,)1(0 )(eKutupnn )1(0)(圖圖9.2 誤差相平面上的特征和控制模態(tài)誤差相平面上的特征和控制模態(tài) 當(dāng)系統(tǒng)誤差處于誤差相平面的第一與第三象限,即當(dāng)系統(tǒng)誤差處于誤差相平面的第一與第三象限,即 或或 且且 時,仿人智能控制器工作于比例控制模態(tài);而當(dāng)誤差處于時,仿人智能控制器工作于比例控制模態(tài);而當(dāng)誤差處于誤差相平面的第二與
5、第四象限,即誤差相平面的第二與第四象限,即 或或 時,仿人智能時,仿人智能控制器工作于保持控制模態(tài)??刂破鞴ぷ饔诒3挚刂颇B(tài)。 0ee 0e0e 0ee 0e 9.1.2 9.1.2 仿人控制器的智能屬性仿人控制器的智能屬性(1)一般傳統(tǒng)控制器的輸入輸出關(guān)系是一種單映射關(guān)系,而仿人控制器原型)一般傳統(tǒng)控制器的輸入輸出關(guān)系是一種單映射關(guān)系,而仿人控制器原型 是一種雙映射關(guān)系,即一種變模態(tài)控制,一種開閉環(huán)交替的控制模式。是一種雙映射關(guān)系,即一種變模態(tài)控制,一種開閉環(huán)交替的控制模式。 (2)在仿人控制原型算法中,控制策略與控制模態(tài)的選擇和確定是按照誤差)在仿人控制原型算法中,控制策略與控制模態(tài)的選擇
6、和確定是按照誤差變化趨勢的特征進(jìn)行的,而確定誤差變化趨勢特征的集合反映在誤差相平面上變化趨勢的特征進(jìn)行的,而確定誤差變化趨勢特征的集合反映在誤差相平面上的全部特征,構(gòu)成整個控制決策的依據(jù),即特征模型。的全部特征,構(gòu)成整個控制決策的依據(jù),即特征模型。 (3)仿人控制器原型在維持模態(tài)時對誤差極值的記憶和利用,與人的記憶方)仿人控制器原型在維持模態(tài)時對誤差極值的記憶和利用,與人的記憶方式及對記憶的利用相似,即兩者具有相似的特征記憶作用。式及對記憶的利用相似,即兩者具有相似的特征記憶作用。 9.1.3 9.1.3 仿人控制的特征模型和決策模態(tài)仿人控制的特征模型和決策模態(tài)1. 1. 描述動態(tài)系統(tǒng)特征狀態(tài)
7、的特征基元和特征模式描述動態(tài)系統(tǒng)特征狀態(tài)的特征基元和特征模式 仿人控制的特征模式與特征辨識仿人控制的特征模式與特征辨識e 系統(tǒng)動態(tài)特征的模式識別主要是對動態(tài)特征模式的分類。根據(jù)受控系統(tǒng)輸出系統(tǒng)動態(tài)特征的模式識別主要是對動態(tài)特征模式的分類。根據(jù)受控系統(tǒng)輸出偏差偏差e、偏差導(dǎo)數(shù)、偏差導(dǎo)數(shù) 以及它們的適當(dāng)組合構(gòu)成的特征變量以及它們的適當(dāng)組合構(gòu)成的特征變量, ,劃分動態(tài)特征模式劃分動態(tài)特征模式, ,并并通過這些特征模式描述系統(tǒng)的動態(tài)行為特征通過這些特征模式描述系統(tǒng)的動態(tài)行為特征, ,或用這些特征模式直觀地反映系統(tǒng)或用這些特征模式直觀地反映系統(tǒng)的動態(tài)過程的動態(tài)過程, ,以期
8、為智能控制決策提供依據(jù)。以期為智能控制決策提供依據(jù)。 受控系統(tǒng)動態(tài)過程的輸入和輸出數(shù)據(jù)受控系統(tǒng)動態(tài)過程的輸入和輸出數(shù)據(jù)( (序列序列) )包含受控過程的全部信息。由系統(tǒng)輸包含受控過程的全部信息。由系統(tǒng)輸出偏差出偏差e、偏差導(dǎo)數(shù)、偏差導(dǎo)數(shù) 、偏差二階導(dǎo)數(shù)、偏差二階導(dǎo)數(shù) 構(gòu)成描述受控系統(tǒng)特征狀態(tài)的特征信構(gòu)成描述受控系統(tǒng)特征狀態(tài)的特征信息源息源, ,并用集合并用集合E表示表示: :e e e e E =e, , 2. 2. 特征模型的定義及形式化描述特征模型的定義及形式化描述 特征模型特征模型是一種智能控制系統(tǒng)動態(tài)特性的定量與定性綜合描述的模是一種智能控制系統(tǒng)動態(tài)特性的定量與定性綜合描述的模型型,
9、,是根據(jù)不同的控制問題求解和控制指標(biāo)要求而對系統(tǒng)動態(tài)信息空間是根據(jù)不同的控制問題求解和控制指標(biāo)要求而對系統(tǒng)動態(tài)信息空間的的一種劃分;劃分出的每個子區(qū)域表示系統(tǒng)的一種特征狀態(tài)一種劃分;劃分出的每個子區(qū)域表示系統(tǒng)的一種特征狀態(tài)i。特征模型。特征模型為為全部特征狀態(tài)的集合全部特征狀態(tài)的集合, ,即即: : = 1,2,r,i 定義定義9.1 9.1 特征模型特征模型特征狀態(tài)由一些特征基元特征狀態(tài)由一些特征基元qi的組合來描述。的組合來描述。 特征辨識是智能控制系統(tǒng)根據(jù)特征模型對采樣信息進(jìn)行在線處理和模式識特征辨識是智能控制系統(tǒng)根據(jù)特征模型對采樣信息進(jìn)行在線處理和模式識別,確定系統(tǒng)當(dāng)前所處狀態(tài)的過程。
10、別,確定系統(tǒng)當(dāng)前所處狀態(tài)的過程。3.3.特征辨識與特征記憶特征辨識與特征記憶定義定義9.2 9.2 特征辨識特征辨識 特征記憶是智能控制對反映前期決策與控制效果的特征量及反映控制任務(wù)特征記憶是智能控制對反映前期決策與控制效果的特征量及反映控制任務(wù)要求和受控對象性質(zhì)的特征量的記憶。令特征記憶量的集合為要求和受控對象性質(zhì)的特征量的記憶。令特征記憶量的集合為: : = = 1, , 2, p , ,i 定義定義9.3 9.3 特征記憶特征記憶 在仿人智能控制系統(tǒng)中在仿人智能控制系統(tǒng)中, ,往往利用特征記憶來消除偏差往往利用特征記憶來消除偏差, ,改善控制品質(zhì)改善控制品質(zhì), ,直直接影響控制輸出。接影
11、響控制輸出。 特征辨識根據(jù)特征模型在線確定系統(tǒng)當(dāng)前所處特征運(yùn)動狀態(tài)特征辨識根據(jù)特征模型在線確定系統(tǒng)當(dāng)前所處特征運(yùn)動狀態(tài), ,而控制器按而控制器按照特征辨識結(jié)果選擇相應(yīng)的控制模態(tài)。照特征辨識結(jié)果選擇相應(yīng)的控制模態(tài)。 仿人控制的多模態(tài)控制仿人控制的多模態(tài)控制1. 1. 多模態(tài)控制(決策)多模態(tài)控制(決策) 控制控制( (決策決策) )模態(tài)集合模態(tài)集合是控制輸出是控制輸出U與誤差信息與誤差信息E和特征記憶和特征記憶信息信息 ( (合記為合記為R) )間的一種定量或定性映射關(guān)系間的一種定量或定性映射關(guān)系F的集合的集合, ,記為記為: : =1, , 2, r 1 : :
12、Ui = = Fi( (e, , ,i ,),)或者或者Fi IF( IF(條件條件) THEN() THEN(操作或結(jié)論操作或結(jié)論) )稱智能控制中這種不斷變化的控制策略為多模態(tài)控制稱智能控制中這種不斷變化的控制策略為多模態(tài)控制( (決策決策) )。 e 定義定義9.4 9.4 多模態(tài)控制(決策)多模態(tài)控制(決策) 典型的仿人控制模態(tài)基元有比例典型的仿人控制模態(tài)基元有比例( (m1 1) )控制模態(tài)基元、微分控制控制模態(tài)基元、微分控制( (m2 2) )模態(tài)模態(tài)基元、積分控制基元、積分控制( (m3 3) )模態(tài)基元及其組合模態(tài)基元及其組合( (如如PID)PID)模態(tài)基元、極值采樣保持模態(tài)
13、基元、極值采樣保持( (m5 5) )與穩(wěn)態(tài)保持與穩(wěn)態(tài)保持( (m4 4) )模態(tài)基元、開關(guān)控制模態(tài)基元、開關(guān)控制( (m6 6) )模態(tài)基元等。模態(tài)基元等。 啟發(fā)與直覺推理規(guī)則集啟發(fā)與直覺推理規(guī)則集是對人決策過程的一種模仿是對人決策過程的一種模仿; ;它根據(jù)特征辨識結(jié)它根據(jù)特征辨識結(jié)果確定控制與決策策略。可用產(chǎn)生式規(guī)則果確定控制與決策策略??捎卯a(chǎn)生式規(guī)則“IFTHEN”IFTHEN”進(jìn)行描述。進(jìn)行描述。2. 2. 啟發(fā)與直覺推理啟發(fā)與直覺推理定義定義9.5 9.5 啟發(fā)與直覺推理啟發(fā)與直覺推理 通過特征辯識識別出系統(tǒng)的當(dāng)前狀態(tài)并采用相應(yīng)控制模態(tài)的過程通過特征辯識識別出系統(tǒng)的當(dāng)前狀態(tài)并采用相應(yīng)
14、控制模態(tài)的過程, ,可看可看成對人的啟發(fā)式和直覺推理的一種模仿。成對人的啟發(fā)式和直覺推理的一種模仿。 . 仿人控制系統(tǒng)的設(shè)計(jì)依據(jù)仿人控制系統(tǒng)的設(shè)計(jì)依據(jù)9.1.4 仿人控制器的設(shè)計(jì)與實(shí)現(xiàn)仿人控制器的設(shè)計(jì)與實(shí)現(xiàn) 仿人控制器的設(shè)計(jì)建立在系統(tǒng)特征模型和特征辨識的多模態(tài)控制方式基礎(chǔ)仿人控制器的設(shè)計(jì)建立在系統(tǒng)特征模型和特征辨識的多模態(tài)控制方式基礎(chǔ)上,為設(shè)計(jì)受控系統(tǒng)的特征模型和控制模態(tài)集,并設(shè)定其參數(shù),需要建立一種上,為設(shè)計(jì)受控系統(tǒng)的特征模型和控制模態(tài)集,并設(shè)定其參數(shù),需要建立一種能夠根據(jù)系統(tǒng)瞬態(tài)響應(yīng)來判斷系統(tǒng)當(dāng)前狀態(tài)與目標(biāo)狀態(tài)差別以及當(dāng)前運(yùn)行趨勢能夠根據(jù)系統(tǒng)瞬態(tài)響應(yīng)來判斷系統(tǒng)當(dāng)前狀態(tài)與目標(biāo)狀
15、態(tài)差別以及當(dāng)前運(yùn)行趨勢的指標(biāo),并以該指標(biāo)作為設(shè)計(jì)的目標(biāo)函數(shù)。的指標(biāo),并以該指標(biāo)作為設(shè)計(jì)的目標(biāo)函數(shù)。 定義定義9.6 瞬態(tài)性能指標(biāo)瞬態(tài)性能指標(biāo) 一個能評價(jià)智能控制系統(tǒng)運(yùn)行的瞬態(tài)品質(zhì),并能兼顧系統(tǒng)的快速性、穩(wěn)一個能評價(jià)智能控制系統(tǒng)運(yùn)行的瞬態(tài)品質(zhì),并能兼顧系統(tǒng)的快速性、穩(wěn)定性和精確性指標(biāo)要求的理想誤差時相軌跡稱為仿人控制系統(tǒng)的瞬態(tài)性能指定性和精確性指標(biāo)要求的理想誤差時相軌跡稱為仿人控制系統(tǒng)的瞬態(tài)性能指標(biāo)。標(biāo)。 o2/e ee4/e e3/e e1/e ee BAC D圖圖9.12具有理想性能的系統(tǒng)誤差時相軌跡具有理想性能的系統(tǒng)誤差時相軌跡 仿人智能控制器設(shè)計(jì)與實(shí)現(xiàn)的一般步驟仿人智能控制
16、器設(shè)計(jì)與實(shí)現(xiàn)的一般步驟 2. 2. 建立對象的數(shù)理模型建立對象的數(shù)理模型 1. 1. 確定設(shè)計(jì)目標(biāo)軌跡確定設(shè)計(jì)目標(biāo)軌跡 根據(jù)用戶對受控對象控制性能指標(biāo)(如上升時間、超調(diào)量、穩(wěn)態(tài)精度等)根據(jù)用戶對受控對象控制性能指標(biāo)(如上升時間、超調(diào)量、穩(wěn)態(tài)精度等)的要求,確定理想的單位階躍響應(yīng)過程,并把它變換到(的要求,確定理想的單位階躍響應(yīng)過程,并把它變換到( )時相)時相空間中去,構(gòu)成理想的誤差時相軌跡??臻g中去,構(gòu)成理想的誤差時相軌跡。 ee t 根據(jù)受控對象或系統(tǒng)的生產(chǎn)流程、機(jī)電結(jié)構(gòu)、工藝特點(diǎn)和控制要求等,根據(jù)受控對象或系統(tǒng)的生產(chǎn)流程、機(jī)電結(jié)構(gòu)、工藝特點(diǎn)和控制要求等,結(jié)合自動控制和相關(guān)基礎(chǔ)理論和專業(yè)知
17、識或經(jīng)驗(yàn),建立相應(yīng)的過程物理與數(shù)結(jié)合自動控制和相關(guān)基礎(chǔ)理論和專業(yè)知識或經(jīng)驗(yàn),建立相應(yīng)的過程物理與數(shù)學(xué)模型,作為進(jìn)一步設(shè)計(jì)與分析的數(shù)學(xué)基礎(chǔ)。學(xué)模型,作為進(jìn)一步設(shè)計(jì)與分析的數(shù)學(xué)基礎(chǔ)。 3. 建立各控制級的特征模型或控制算法建立各控制級的特征模型或控制算法 根據(jù)目標(biāo)軌跡在誤差相平面(根據(jù)目標(biāo)軌跡在誤差相平面( )上的位置或誤差時間平面()上的位置或誤差時間平面( )上)上的位置,以及控制器的不同級別(運(yùn)行控制級、參數(shù)校正級、任務(wù)適應(yīng)級),的位置,以及控制器的不同級別(運(yùn)行控制級、參數(shù)校正級、任務(wù)適應(yīng)級),確定特征基元集確定特征基元集 劃分出特征狀態(tài)集劃分出特征狀態(tài)集 ,從而構(gòu)成不同級別的特征模型,從
18、而構(gòu)成不同級別的特征模型 ee teiQiPiiQ3 , 2 , 1i 4. 4. 設(shè)計(jì)控制器的結(jié)構(gòu)設(shè)計(jì)控制器的結(jié)構(gòu) 2e1e1U2U*2U*1U+HSIC1 協(xié)調(diào)算法HSIC2G22G21G12G11R1_R2+_Y2Y1圖圖9.14 某軋鋼機(jī)控制系統(tǒng)整體結(jié)構(gòu)框圖某軋鋼機(jī)控制系統(tǒng)整體結(jié)構(gòu)框圖5. 5. 設(shè)計(jì)控制模態(tài)集與控制規(guī)則設(shè)計(jì)控制模態(tài)集與控制規(guī)則 針對系統(tǒng)運(yùn)動狀態(tài)處于特征模型中某特征狀態(tài)時與瞬態(tài)指標(biāo)(理想軌跡)針對系統(tǒng)運(yùn)動狀態(tài)處于特征模型中某特征狀態(tài)時與瞬態(tài)指標(biāo)(理想軌跡)之間的差距,以及理想軌跡的運(yùn)動趨勢,模仿人的控制決策行為,設(shè)計(jì)控制之間的差距,以及理想軌跡的運(yùn)動趨勢,模仿人的控制決
19、策行為,設(shè)計(jì)控制規(guī)則或校正模態(tài),并設(shè)計(jì)出模態(tài)中的具體參數(shù)。規(guī)則或校正模態(tài),并設(shè)計(jì)出模態(tài)中的具體參數(shù)。6. 6. 仿真和試驗(yàn)研究仿真和試驗(yàn)研究 選擇典型狀況和參數(shù)對控制系統(tǒng)進(jìn)行仿真實(shí)驗(yàn),并通過仿真調(diào)整系統(tǒng)設(shè)選擇典型狀況和參數(shù)對控制系統(tǒng)進(jìn)行仿真實(shí)驗(yàn),并通過仿真調(diào)整系統(tǒng)設(shè)定的參數(shù),以至修正系統(tǒng)控制結(jié)構(gòu),使仿真結(jié)果滿足動態(tài)和靜態(tài)控制要求。定的參數(shù),以至修正系統(tǒng)控制結(jié)構(gòu),使仿真結(jié)果滿足動態(tài)和靜態(tài)控制要求。如果條件許可,應(yīng)在仿真研究的基礎(chǔ)上,進(jìn)行系統(tǒng)實(shí)時實(shí)驗(yàn)或工業(yè)試驗(yàn),以如果條件許可,應(yīng)在仿真研究的基礎(chǔ)上,進(jìn)行系統(tǒng)實(shí)時實(shí)驗(yàn)或工業(yè)試驗(yàn),以進(jìn)一步驗(yàn)證系統(tǒng)設(shè)計(jì)的正確性和系統(tǒng)品質(zhì)的優(yōu)越性。進(jìn)一步驗(yàn)證系統(tǒng)設(shè)計(jì)的正確
20、性和系統(tǒng)品質(zhì)的優(yōu)越性。4e ( , )dfe e e 3e 2e 1e 1e2e(a) (b)e3e4e5e 圖圖9.15 9.15 設(shè)計(jì)擬人智能控制器的誤差相平面圖設(shè)計(jì)擬人智能控制器的誤差相平面圖9.1.5 仿人控制器的設(shè)計(jì)與實(shí)現(xiàn)示例仿人控制器的設(shè)計(jì)與實(shí)現(xiàn)示例 1. 1. 小車單擺系統(tǒng)的數(shù)學(xué)模型小車單擺系統(tǒng)的數(shù)學(xué)模型 小車單擺系統(tǒng)仿人控制器的設(shè)計(jì)小車單擺系統(tǒng)仿人控制器的設(shè)計(jì) - 0 +r - u + 0 - +圖圖9.16 小車小車-單擺系統(tǒng)結(jié)構(gòu)示意圖單擺系統(tǒng)結(jié)構(gòu)示意圖 (7.25) 0sincossincos22 mlJmglrmlumlrmM dtdtdrmlmlJmgl
21、dtdrmludrdtdtdrmlrmMttttttttrrtttt212121212121212222222sin2cos1sinsin2符號符號含義含義M小車及轉(zhuǎn)動裝置的等效質(zhì)量小車及轉(zhuǎn)動裝置的等效質(zhì)量m單擺質(zhì)量單擺質(zhì)量J單擺以質(zhì)心為轉(zhuǎn)動軸心時的轉(zhuǎn)動單擺以質(zhì)心為轉(zhuǎn)動軸心時的轉(zhuǎn)動慣量慣量l單擺質(zhì)心與軸心距離單擺質(zhì)心與軸心距離u控制作用(控制作用(u)r小車位移小車位移單擺擺角(角位移)單擺擺角(角位移)2. 2. 小車單擺系統(tǒng)仿人控制器的結(jié)構(gòu)設(shè)計(jì)小車單擺系統(tǒng)仿人控制器的結(jié)構(gòu)設(shè)計(jì) + 協(xié)調(diào)控制器仿人智能控制器小車控制回路G2單擺控制回路G1小車UC2單擺UC1CC 耦合回路 1u2u 圖圖9.
22、17 小車單擺系統(tǒng)仿人控制器結(jié)構(gòu)圖小車單擺系統(tǒng)仿人控制器結(jié)構(gòu)圖+3. 3. 各控制階段的控制作用、控制模態(tài)集和控制規(guī)則集各控制階段的控制作用、控制模態(tài)集和控制規(guī)則集 小車單擺系統(tǒng)的單擺擺起定位控制分為兩個階段進(jìn)行,即起擺控制階小車單擺系統(tǒng)的單擺擺起定位控制分為兩個階段進(jìn)行,即起擺控制階段和穩(wěn)擺控制階段。段和穩(wěn)擺控制階段。 4. 仿人控制器參數(shù)的確定仿人控制器參數(shù)的確定 小車單擺系統(tǒng)仿人控制器的實(shí)現(xiàn)小車單擺系統(tǒng)仿人控制器的實(shí)現(xiàn) yeu 人鍵盤顯示器和打印機(jī)小車-單擺系統(tǒng)HSIC控制器干擾期望值圖圖9.19 小車單擺仿人控制的小車單擺仿人控制的CAD學(xué)習(xí)訓(xùn)練系統(tǒng)學(xué)習(xí)訓(xùn)練系統(tǒng)(b)(
23、a) 圖圖9.21 小車單擺擺起倒立試驗(yàn)穩(wěn)態(tài)位置小車單擺擺起倒立試驗(yàn)穩(wěn)態(tài)位置(c) (d)9. 2 進(jìn)化控制 遺傳算法(Genetic Algorithms,GA) 進(jìn)化策略(Evolution Strategies) 進(jìn)化規(guī)劃(Evolutionary Programming) 遺傳編程(Genetic Programming)把進(jìn)化計(jì)算,特別是遺傳算法機(jī)制和傳統(tǒng)的反饋機(jī)制用于控制過程,則可實(shí)現(xiàn)一種新的控制-進(jìn)化控制進(jìn)化控制進(jìn)化計(jì)算進(jìn)化計(jì)算(Evolution Computation)9.2.1 遺傳算法的基本原理 遺傳算法是模仿生物遺傳學(xué)和自然選擇機(jī)理,通過人工方式構(gòu)造的一類優(yōu)化搜索算法,
24、是對生物進(jìn)化過程進(jìn)行的一種數(shù)學(xué)仿真,是進(jìn)化計(jì)算的一種最重要的形式。1975年,霍蘭德(Holland)Adaptation in Natural and Artificial Systems簡單遺傳算法(SGA)銷售員旅行問題(TSP) 設(shè)有n個城市,城市i和城市j之間的距離為d(i,j) i,j=1,n。TSP問題是要找遍訪每個城市恰好一次的一條回路,且其路徑總長度為最短。1 編碼與解碼編碼將問題結(jié)構(gòu)變換為位串形式編碼表示的過程。解碼或譯碼將位串形式編碼表示變換為原問題結(jié)構(gòu)的過程。把位串形式編碼表示叫染色體,有時也叫個體。每個染色體的每一位稱為遺傳因子。編碼二進(jìn)制編碼浮點(diǎn)數(shù)編碼格雷碼符號編碼
25、多參數(shù)編碼二進(jìn)制編碼 假設(shè)某一參數(shù)的取值范圍是A,B,AB。我們用長度為l的二進(jìn)制編碼串來表示該參數(shù),將A,B等分成2l-1個子部分,記每一個等分的長度為,則它能夠產(chǎn)生2l種不同的編碼。二進(jìn)制編碼參數(shù)編碼的對應(yīng)關(guān)系如下:00000000 00000000 = 0 A00000000 00000001 = 1 A+ 11111111 11111111 = 2l-1 B 其中12 lAB解碼1221:xxxxxXlll假設(shè)某一個體的編碼是liiilxABAx11212則上述二進(jìn)制編碼所對應(yīng)的解碼公式為:編碼解碼舉例例1 用遺傳算法求解函數(shù)的最大值,其中 。0 . 1)10sin()(xxxf 2
26、, 1x 用一個二進(jìn)制矢量表示一個染色體,由染色體來代表變量x的實(shí)數(shù)值。矢量的長度取決于所要求的精度,在此取小數(shù)點(diǎn)后6位數(shù)。編碼解碼舉例 由于變量x的域長為3,則-1,2將被均勻地分為31000000個等長的區(qū)間。這表明每個染色體由22位字節(jié)的二進(jìn)制矢量表示。因?yàn)?19430423000000220971522221編碼解碼舉例區(qū)間-1,2中的x和二進(jìn)制串之間的映射是直接的,并由以下兩步進(jìn)行:21010202021)2()(iiixbbbb(a) 將二進(jìn)制串轉(zhuǎn)化為相應(yīng)的十進(jìn)制:1230 . 122xx(b) 找到相應(yīng)的實(shí)數(shù)x:其中-1.0為區(qū)間-1,2的左邊界,3為區(qū)間長度。編碼解碼舉例顯然(
27、0000000000000000000000)和(1111111111111111111111)分別表示區(qū)間的邊界-1.0和2.0這樣就可以將實(shí)數(shù)以二進(jìn)制數(shù)(染色體)來表述,如,(1000101110110101000111)表示實(shí)數(shù)0.637197,因?yàn)?288967)1111010100011000101110(2x637197. 04194303322889670 . 1x浮點(diǎn)數(shù)編碼個體的每個染色體用某一范圍內(nèi)的一個浮點(diǎn)數(shù)來表示,個體的編碼長度等于其問題變量的個數(shù)。特點(diǎn):使用的是變量的真實(shí)值(真值編碼方法)適用:多維、高精度要求的連續(xù)函數(shù)優(yōu)化問題。格雷碼 連續(xù)的兩個整數(shù)所對應(yīng)的編碼值之間
28、只有一個碼位是不相同的,其余碼位都完全相同。 解碼的方法:用0和采集來的4位格雷碼的最高位(第4位)異或,結(jié)果保留到4位,再將異或的值和下一位(第3位)相異或,結(jié)果保留到3位,再將相異或的值和下一位(第2位)異或,結(jié)果保留到2位,依次異或,直到最低位,依次異或轉(zhuǎn)換后的值(二進(jìn)制數(shù))就是格雷碼轉(zhuǎn)換后自然碼的值。幾種自然二進(jìn)制碼與格雷碼的對照表十進(jìn)制數(shù)自然二進(jìn)制數(shù)格雷碼格雷碼十進(jìn)制數(shù)自然二進(jìn)制數(shù)格雷碼格雷碼0000000008100011001000100019100111012001000111010101111300110010111011111040100011012110010105010
29、1011113131101101160110010114111010017011101001511111000符號編碼 個體染色體編碼串中的基因值取自一個無數(shù)值含義,而只有代碼含義的符號集。這個符號集可以是一個字母表,如A,B,C,D,;也可以是一個數(shù)字序號表,如1,2,3,4,5,,還可以是一個代碼表,如x1,x2,x3,x4,x5,等。旅行問題(TSP)編碼 按一條回路中城市的次序進(jìn)行編碼,例如,碼串134567829表示從城市1開始,依次是城市3,4,5,6,7,8,2,9,最后回到城市1。采用符號編碼方法采用符號編碼方法 一般情況是從城市w1開始,依次經(jīng)過城市w2,wn,最后回到城市w
30、1,我們就用如下編碼表示:w1w2wn其實(shí)是1,n的一個循環(huán)排列。2 適應(yīng)度函數(shù)(Fitness Function) 為了體現(xiàn)染色體的適應(yīng)能力,引入對問題中的每一個染色體都能進(jìn)行度量的適應(yīng)度函數(shù),通過適應(yīng)度函數(shù)來決定染色體的優(yōu)劣程度,它體現(xiàn)了自然進(jìn)化中的優(yōu)勝劣汰原則。 對優(yōu)化問題,適應(yīng)度函數(shù)就是目標(biāo)函數(shù)。旅行問題(TSP)的適應(yīng)度函數(shù)TSP的目標(biāo)是路徑總長度為最短適應(yīng)度函數(shù)111121),(1)(w,wwwdwwwfnnjjjn其中3 遺傳操作簡單遺傳算法的遺傳操作主要有3種:選擇(Selection)交叉(Crossover)變異(Mutation )選擇操作(Selection) 選擇操作
31、也叫復(fù)制(Reproduction)操作,根據(jù)個體的適應(yīng)度函數(shù)值所度量的優(yōu)劣程度決定它在下一代是被淘汰還是被遺傳。賭輪選擇機(jī)制簡單遺傳算法采用賭輪選擇機(jī)制: 令 表示群體的適應(yīng)度值之總和, 表示群體中第 個染色體的適應(yīng)度值,它產(chǎn)生后代的能力正好為其適應(yīng)度值所占份額ififiiiff /交叉操作(Crossover) 將選擇出的兩個個體P1和P2作為父母個體,將兩者的部分碼值進(jìn)行交換。 假設(shè)有如下八位長的二個個體:P21 0 0 0 1 1 1 01 1 0 1 1 0 0 1P1交叉演示 產(chǎn)生一個在1到7之間的隨機(jī)數(shù)c,假如現(xiàn)在產(chǎn)生的是3,將P1和P2的低三位交換:P1的高五位與P2的低3位組
32、成數(shù)串10001001,這就是P1和P2的一個后代Q1個體;P2的高5位與P1的低3位組成數(shù)串11011110,這就是P1和P2的一個后代Q2個體。其交換過程如下圖所示:01110001100100011001101101111011P1P2Q1Q2變異操作(Mutation) 變異操作的簡單方式是改變數(shù)碼串的某個位置上的數(shù)碼。我們先以最簡單的二進(jìn)制編碼表示方式來說明,二進(jìn)制編碼表示的每一個位置的數(shù)碼只有0與1這兩個可能。二進(jìn)制編碼表示時的簡單變異操作是將0與1互換:0變異為1,1變異為0。二進(jìn)制變異演示 設(shè)碼長為8,隨機(jī)產(chǎn)生一個1至8之間的數(shù)k,假如現(xiàn)在k=5,對從右往左的第5位進(jìn)行變異操作
33、,將原來的0變?yōu)?,得到如下數(shù)碼串(紅色的數(shù)字1是被變異操作后出現(xiàn)的):0110010101101101 隨機(jī)產(chǎn)生一個1至n之間的數(shù)k,決定對回路中的第k個城市的代碼wk進(jìn)行變異操作,又產(chǎn)生一個1至n之間的數(shù)w,替代wk,并將wk加到尾部,得到這個串有n+1個數(shù)碼,注意數(shù)w在此串中重復(fù)了,必須刪除與數(shù)w相重復(fù)的數(shù),從而得到合法的染色體。TSP變異操作knkkwwwwwww11219.2.2 遺傳算法的求解步驟 遺傳算法是對參數(shù)集合的編碼而非針對參數(shù)本身進(jìn)行進(jìn)化; 遺傳算法是從問題解的編碼組開始而非從單個解開始搜索; 遺傳算法利用目標(biāo)函數(shù)的適應(yīng)度這一信息而非利用導(dǎo)數(shù)或其他輔助信息來指導(dǎo)搜索; 遺
34、傳算法利用選擇、交叉、變異等算子而不是利用確定性規(guī)則進(jìn)行隨機(jī)操作。遺傳算法的基本原理: 通過隨機(jī)方式產(chǎn)生若干個所求解問題的數(shù)字編碼,即染色體,形成初始群體;通過適應(yīng)度函數(shù)給每個個體一個數(shù)值評價(jià),淘汰低適應(yīng)度的個體,選擇高適應(yīng)度的個體參加遺傳操作,經(jīng)過遺傳操作后的個體集合形成下一代群體。再對這個新群體進(jìn)行下一輪進(jìn)化。2. 遺傳算法的框圖(1) 初始化群體;(2) 計(jì)算群體上每個個體的適應(yīng)度值;(3) 按由個體適應(yīng)度值所決定的某個規(guī)則,選擇將進(jìn)入下一代的個體;(4) 按概率Pc進(jìn)行交叉操作;(5) 按概率Pm進(jìn)行突變操作;(6) 若沒有滿足某種停止條件,則轉(zhuǎn)第(2)步,否則進(jìn)入下一步。(7) 輸出
35、群體中適應(yīng)度值最優(yōu)的染色體,作為問題的滿意解或最優(yōu)解。簡單遺傳算法的求解步驟簡單遺傳算法的框圖初始化種群初始化種群變異操作變異操作計(jì)算適應(yīng)度值計(jì)算適應(yīng)度值選擇操作選擇操作交叉操作交叉操作輸出結(jié)果輸出結(jié)果終止條件終止條件開始開始否是是一般遺傳算法的主要步驟(1) (1) 隨機(jī)產(chǎn)生一個由確定長度的特征字符串組成的初始隨機(jī)產(chǎn)生一個由確定長度的特征字符串組成的初始群體。群體。(2)(2) 對該字符串群體迭代的執(zhí)行下面的步對該字符串群體迭代的執(zhí)行下面的步和和 ,直到,直到滿足停止標(biāo)準(zhǔn):滿足停止標(biāo)準(zhǔn): 計(jì)算群體中每個個體字符串的適應(yīng)值;計(jì)算群體中每個個體字符串的適應(yīng)值; 應(yīng)用復(fù)制、交叉和變異等遺傳算子產(chǎn)生
36、下一代應(yīng)用復(fù)制、交叉和變異等遺傳算子產(chǎn)生下一代群體。群體。(3)(3) 把在后代中出現(xiàn)的最好的個體字符串指定為遺傳算把在后代中出現(xiàn)的最好的個體字符串指定為遺傳算法的執(zhí)行結(jié)果,這個結(jié)果可以表示問題的一個解。法的執(zhí)行結(jié)果,這個結(jié)果可以表示問題的一個解?;具z傳算法框圖產(chǎn)生初始群體產(chǎn)生初始群體計(jì)算每個個體的適應(yīng)值計(jì)算每個個體的適應(yīng)值GEN:=GEN+1依概率選擇遺傳操作依概率選擇遺傳操作執(zhí)行復(fù)制執(zhí)行復(fù)制選擇一個個體選擇一個個體i:=i+1選擇兩個個體選擇兩個個體選擇一個個體選擇一個個體執(zhí)行變異執(zhí)行變異i:=0復(fù)制到新群體復(fù)制到新群體i:=i+1將兩個后代插入新群體將兩個后代插入新群體插入到新群體插入
37、到新群體執(zhí)行雜交執(zhí)行雜交否否是是否否變異變異復(fù)制復(fù)制交叉交叉GEN:=0開始開始是是指定結(jié)果指定結(jié)果結(jié)束結(jié)束i=M?是否滿足停止準(zhǔn)則是否滿足停止準(zhǔn)則遺傳算法的一般結(jié)構(gòu)表示 Procedure: Genetic Algorithmsbegin t 0; initialize P(t);evaluate P(t); while (not termination condition ) do begin recombine P(t) to yield C(t); evaluate C(t); select P(t+1) from P(t) and C(t); t t+1; endend9.2.3 進(jìn)
38、化控制及其形式化描述 進(jìn)化控制(進(jìn)化控制(evolutionary control)源于生物的進(jìn)化機(jī)制。)源于生物的進(jìn)化機(jī)制。 進(jìn)化控制是建立在進(jìn)化計(jì)算和反饋控制相結(jié)合的基礎(chǔ)上的。進(jìn)化控制是建立在進(jìn)化計(jì)算和反饋控制相結(jié)合的基礎(chǔ)上的。2. 進(jìn)化控制系統(tǒng)的結(jié)構(gòu)和形式化描述 人機(jī)接口人機(jī)接口 適應(yīng)度函數(shù)適應(yīng)度函數(shù)問題解空間的表示問題解空間的表示 進(jìn)化操作進(jìn)化操作 廣義被控對象廣義被控對象 性能評價(jià)性能評價(jià) 轉(zhuǎn)換轉(zhuǎn)換YU進(jìn)化控制器進(jìn)化控制器 圖圖9.6 進(jìn)化控制系統(tǒng)的結(jié)構(gòu)進(jìn)化控制系統(tǒng)的結(jié)構(gòu) Ta進(jìn)化控制系統(tǒng)的形式化描述定義定義9.7 9.7 一個進(jìn)化控制系統(tǒng)可由六元組( , , , , , )來描述。
39、其中 給定任務(wù), 適應(yīng)度函數(shù), 進(jìn)化操作算子, 解空間表示, 控制作用, 廣義被控制對象輸出(或反饋信息)。 aTf&XYPaTf&PUY進(jìn)化控制系統(tǒng)的形式化描述定義定義9.8 9.8 進(jìn)化控制的優(yōu)化問題一般可描述為 式中, 為適應(yīng)度函數(shù), 為解空間的個體, 為解空間。進(jìn)化控制的最優(yōu)控制器的求解過程是該最優(yōu)化問題的迭代計(jì)算過程。即在開始時刻產(chǎn)生初始種群 ,進(jìn)入相應(yīng)的進(jìn)化操作過程,直到第K代種群中,有個體 使得 滿足要求, 即為所要求的 ,即 = 。 Pppfu)(min)( pfpP0Pkip)(minkiPppfkkikipUUkip9.2.4 移動機(jī)器人進(jìn)化控制系統(tǒng)的體系結(jié)
40、構(gòu)和算法 這里介紹基于功能/行為集成的移動機(jī)器人進(jìn)化控制系統(tǒng)。該系統(tǒng)由進(jìn)化規(guī)劃模塊和基于行為的控制模塊組成。這種綜合體系結(jié)構(gòu)的優(yōu)點(diǎn)是既具有基于行為系統(tǒng)的實(shí)時性,又保持了基于功能系統(tǒng)的目標(biāo)可控性。協(xié)調(diào)控制協(xié)調(diào)控制 人機(jī)接口人機(jī)接口 知識庫知識庫 經(jīng)驗(yàn)庫經(jīng)驗(yàn)庫 地圖構(gòu)造器地圖構(gòu)造器 進(jìn)化規(guī)劃器進(jìn)化規(guī)劃器 目標(biāo)驅(qū)動行為目標(biāo)驅(qū)動行為環(huán)境環(huán)境動作動作協(xié)調(diào)組合協(xié)調(diào)組合進(jìn)化規(guī)劃模塊進(jìn)化規(guī)劃模塊狀態(tài)狀態(tài) 性能判斷性能判斷行為控制模塊行為控制模塊任務(wù)描述任務(wù)描述感知感知任務(wù)任務(wù) 反射式行為反射式行為圖圖9.7 規(guī)劃、行為綜合的進(jìn)化控制體系結(jié)構(gòu)規(guī)劃、行為綜合的進(jìn)化控制體系結(jié)構(gòu) 2.進(jìn)化規(guī)劃器的結(jié)構(gòu)與算法先驗(yàn)知識先
41、驗(yàn)知識驅(qū)動驅(qū)動行為驅(qū)動行為驅(qū)動目標(biāo)行為目標(biāo)行為基本基本路徑選擇路徑選擇運(yùn)動規(guī)劃器運(yùn)動規(guī)劃器感知信息感知信息任務(wù)任務(wù)地圖地圖傳感數(shù)據(jù)傳感數(shù)據(jù)路徑路徑離線進(jìn)化算法離線進(jìn)化算法協(xié)調(diào)策略協(xié)調(diào)策略協(xié)調(diào)控制協(xié)調(diào)控制在線進(jìn)化算法在線進(jìn)化算法圖圖9.8 9.8 進(jìn)化規(guī)劃器結(jié)構(gòu)進(jìn)化規(guī)劃器結(jié)構(gòu)9.3 9.3 免疫控制免疫控制 把免疫控制和計(jì)算方法用于控制系統(tǒng),即可構(gòu)成免疫控制系統(tǒng)把免疫控制和計(jì)算方法用于控制系統(tǒng),即可構(gòu)成免疫控制系統(tǒng) 9.3.1 9.3.1 免疫算法的提出和定義免疫算法的提出和定義 1 1免疫算法的提出免疫算法的提出 免疫是生物體的特異性生理反應(yīng),由具有免疫功能的器官、免疫是生物體的特異性生理反應(yīng)
42、,由具有免疫功能的器官、組織、細(xì)胞、免疫效應(yīng)分子及基因等組成。組織、細(xì)胞、免疫效應(yīng)分子及基因等組成。 人工免疫系統(tǒng)是由免疫學(xué)理論和觀察到的免疫功能、原理和人工免疫系統(tǒng)是由免疫學(xué)理論和觀察到的免疫功能、原理和模型啟發(fā)而產(chǎn)生的適應(yīng)性系統(tǒng)。模型啟發(fā)而產(chǎn)生的適應(yīng)性系統(tǒng)。 免疫算法的關(guān)鍵在于系統(tǒng)對受侵害部分的屏蔽、保護(hù)和學(xué)習(xí)免疫算法的關(guān)鍵在于系統(tǒng)對受侵害部分的屏蔽、保護(hù)和學(xué)習(xí)控制??刂啤?2. 2. 免疫算法的有關(guān)定義免疫算法的有關(guān)定義 定義定義9.3 9.3 免疫算法是模仿生物免疫學(xué)和基因進(jìn)化機(jī)理,通過人工方式構(gòu)免疫算法是模仿生物免疫學(xué)和基因進(jìn)化機(jī)理,通過人工方式構(gòu)造的一類優(yōu)化搜索算法,是對生物免疫過程的一種數(shù)學(xué)仿真,是免疫計(jì)算造的一類優(yōu)化搜索算法,是對生物免
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 克孜勒蘇職業(yè)技術(shù)學(xué)院《移動應(yīng)用開發(fā)A》2023-2024學(xué)年第一學(xué)期期末試卷
- 江蘇聯(lián)合職業(yè)技術(shù)學(xué)院《全球衛(wèi)生》2023-2024學(xué)年第一學(xué)期期末試卷
- 湖南農(nóng)業(yè)大學(xué)《數(shù)字視頻處理》2023-2024學(xué)年第一學(xué)期期末試卷
- 湖北孝感美珈職業(yè)學(xué)院《公共部門人力資源管理實(shí)驗(yàn)》2023-2024學(xué)年第一學(xué)期期末試卷
- 【物理】《功率》(教學(xué)設(shè)計(jì))-2024-2025學(xué)年人教版(2024)初中物理八年級下冊
- 高考物理總復(fù)習(xí)《電場》專項(xiàng)測試卷含答案
- 重慶文理學(xué)院《建筑設(shè)計(jì)二》2023-2024學(xué)年第一學(xué)期期末試卷
- 重慶工程職業(yè)技術(shù)學(xué)院《數(shù)字化設(shè)計(jì)與制造雙語》2023-2024學(xué)年第一學(xué)期期末試卷
- 浙江經(jīng)濟(jì)職業(yè)技術(shù)學(xué)院《太極拳》2023-2024學(xué)年第一學(xué)期期末試卷
- 中國美術(shù)學(xué)院《電工與電子技術(shù)(B)》2023-2024學(xué)年第一學(xué)期期末試卷
- 一年級口算天天練(可直接打印)
- 軟件無線電原理與應(yīng)用第3版 課件 【ch02】軟件無線電理論基礎(chǔ)
- 國網(wǎng)山東電力生產(chǎn)技術(shù)改造原則
- 鐵路運(yùn)輸安全現(xiàn)場管理
- 2023年某保險(xiǎn)公司春節(jié)經(jīng)營教材
- 劉都才-南方水稻田雜草發(fā)生動態(tài)及防控技術(shù)
- 全自動化學(xué)發(fā)光分析儀操作規(guī)程
- 深藍(lán)的故事(全3冊)
- GB/T 42461-2023信息安全技術(shù)網(wǎng)絡(luò)安全服務(wù)成本度量指南
- 職校開學(xué)第一課班會PPT
- 央國企信創(chuàng)白皮書 -基于信創(chuàng)體系的數(shù)字化轉(zhuǎn)型
評論
0/150
提交評論