




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領
文檔簡介
1、第五章第五章 神經(jīng)網(wǎng)絡控制論神經(jīng)網(wǎng)絡控制論2 引言引言1234 非線性動態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡辨識非線性動態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡辨識5 神經(jīng)網(wǎng)絡控制的學習機制神經(jīng)網(wǎng)絡控制的學習機制神經(jīng)網(wǎng)絡控制器的設計神經(jīng)網(wǎng)絡控制器的設計n由于神經(jīng)網(wǎng)絡本質(zhì)上是一個大規(guī)模并行分布處由于神經(jīng)網(wǎng)絡本質(zhì)上是一個大規(guī)模并行分布處理的非線性動力學系統(tǒng),并在更高層次上體現(xiàn)理的非線性動力學系統(tǒng),并在更高層次上體現(xiàn)出一些人腦的智能行為,為智能控制提供了新出一些人腦的智能行為,為智能控制提供了新途徑。途徑。n神經(jīng)網(wǎng)絡控制的優(yōu)越性體現(xiàn)在:神經(jīng)網(wǎng)絡控制的優(yōu)越性體現(xiàn)在: n神經(jīng)網(wǎng)絡可以處理那些難以用模型或規(guī)則描述的過神經(jīng)網(wǎng)絡可以處理那些難以用模型或
2、規(guī)則描述的過程或系統(tǒng)。程或系統(tǒng)。 n神經(jīng)網(wǎng)絡采用并行分布式信息處理,具有很強的容神經(jīng)網(wǎng)絡采用并行分布式信息處理,具有很強的容錯性。錯性。 n神經(jīng)網(wǎng)絡是本質(zhì)的非線性系統(tǒng)。神經(jīng)網(wǎng)絡是本質(zhì)的非線性系統(tǒng)。 n神經(jīng)網(wǎng)絡具有很強的信息綜合能力。神經(jīng)網(wǎng)絡具有很強的信息綜合能力。 n神經(jīng)網(wǎng)絡的硬件實現(xiàn)愈趨方便。神經(jīng)網(wǎng)絡的硬件實現(xiàn)愈趨方便。 一、引言一、引言n神經(jīng)網(wǎng)絡控制器的分類神經(jīng)網(wǎng)絡控制器的分類n根據(jù)神經(jīng)網(wǎng)絡在控制系統(tǒng)中的作用不同根據(jù)神經(jīng)網(wǎng)絡在控制系統(tǒng)中的作用不同,又可分為兩大類,又可分為兩大類n一一是是神經(jīng)控制,它是以神經(jīng)網(wǎng)絡為基礎而形神經(jīng)控制,它是以神經(jīng)網(wǎng)絡為基礎而形成的獨立智能控制系統(tǒng)成的獨立智能控制
3、系統(tǒng)n二是二是混合神經(jīng)網(wǎng)絡控制,它代表著那些利用混合神經(jīng)網(wǎng)絡控制,它代表著那些利用神經(jīng)網(wǎng)絡學習和優(yōu)化能力來改善傳統(tǒng)的控制神經(jīng)網(wǎng)絡學習和優(yōu)化能力來改善傳統(tǒng)的控制方法方法一、引言一、引言n神經(jīng)網(wǎng)絡控制器的典型分類神經(jīng)網(wǎng)絡控制器的典型分類n導師指導下的控制器導師指導下的控制器n逆控制器逆控制器 n自適應網(wǎng)絡控制器自適應網(wǎng)絡控制器 n前饋控制結(jié)構(gòu)前饋控制結(jié)構(gòu) n自適應評價網(wǎng)絡自適應評價網(wǎng)絡 n混合控制系統(tǒng)混合控制系統(tǒng) 一、引言一、引言XUY專家經(jīng)驗控制器動力學系統(tǒng)動力學系統(tǒng)神經(jīng)網(wǎng)絡UYX利用專家經(jīng)驗圖3-2-1 導師指導下的神經(jīng)控制結(jié)構(gòu)圖動力學系統(tǒng)神經(jīng)網(wǎng)絡YYUd動力學系統(tǒng)UYYdF-1Y=FU圖3-
4、2-2 逆控制器的結(jié)構(gòu)圖網(wǎng)絡控制器N神經(jīng)網(wǎng)絡N參考模型非線性系統(tǒng)ryecipmceecpyyiu+-圖3-2-3自適應網(wǎng)絡控制結(jié)構(gòu)圖n導師指導下的控制器:導師指導下的控制器:神經(jīng)網(wǎng)絡控制結(jié)構(gòu)的學神經(jīng)網(wǎng)絡控制結(jié)構(gòu)的學習樣本直接取自于專家的控制經(jīng)驗習樣本直接取自于專家的控制經(jīng)驗。一旦神經(jīng)一旦神經(jīng)網(wǎng)絡的訓練達到了能夠充分描述人的控制行為網(wǎng)絡的訓練達到了能夠充分描述人的控制行為時,則網(wǎng)絡訓練結(jié)束時,則網(wǎng)絡訓練結(jié)束一、引言一、引言n逆控制器:逆控制器:如果一個動力學系統(tǒng)可以用一個逆如果一個動力學系統(tǒng)可以用一個逆動力學函數(shù)來表示,則采用簡單的控制結(jié)構(gòu)和動力學函數(shù)來表示,則采用簡單的控制結(jié)構(gòu)和方式是可能的方
5、式是可能的XUY專家經(jīng)驗控制器動力學系統(tǒng)動力學系統(tǒng)神經(jīng)網(wǎng)絡UYX利用專家經(jīng)驗圖3-2-1 導師指導下的神經(jīng)控制結(jié)構(gòu)圖動力學系統(tǒng)神經(jīng)網(wǎng)絡YYUd動力學系統(tǒng)UYYdF-1Y=FU圖3-2-2 逆控制器的結(jié)構(gòu)圖網(wǎng)絡控制器N神經(jīng)網(wǎng)絡N參考模型非線性系統(tǒng)ryecipmceecpyyiu+-圖3-2-3自適應網(wǎng)絡控制結(jié)構(gòu)圖一、引言一、引言n模型參考自適應網(wǎng)絡控制器:模型參考自適應網(wǎng)絡控制器:利用神經(jīng)網(wǎng)絡將利用神經(jīng)網(wǎng)絡將線性系統(tǒng)經(jīng)典的自適應控制設計理論和思想方線性系統(tǒng)經(jīng)典的自適應控制設計理論和思想方法直接引到非線性系統(tǒng)自適應控制系統(tǒng)中來是法直接引到非線性系統(tǒng)自適應控制系統(tǒng)中來是可能的可能的XUY專家經(jīng)驗控制
6、器動力學系統(tǒng)動力學系統(tǒng)神經(jīng)網(wǎng)絡UYX利用專家經(jīng)驗圖3-2-1 導師指導下的神經(jīng)控制結(jié)構(gòu)圖動力學系統(tǒng)神經(jīng)網(wǎng)絡YYUd動力學系統(tǒng)UYYdF-1Y=FU圖3-2-2 逆控制器的結(jié)構(gòu)圖網(wǎng)絡控制器N神經(jīng)網(wǎng)絡N參考模型非線性系統(tǒng)ryecipmceecpyyiu+-圖3-2-3自適應網(wǎng)絡控制結(jié)構(gòu)圖一、引言一、引言n神經(jīng)內(nèi)??刂平Y(jié)構(gòu)神經(jīng)內(nèi)??刂平Y(jié)構(gòu):系統(tǒng)的實際輸出與模型系統(tǒng)的實際輸出與模型M M的輸出信號差用于反饋的目的。這個反饋信號的輸出信號差用于反饋的目的。這個反饋信號通過前向通道上的控制子系統(tǒng)通過前向通道上的控制子系統(tǒng)G G預處理。通常預處理。通常G G是一個濾波器,用于提高系統(tǒng)的魯棒性。系統(tǒng)是一個濾波
7、器,用于提高系統(tǒng)的魯棒性。系統(tǒng)模型模型M M和控制器和控制器C C可以由神經(jīng)網(wǎng)絡來實現(xiàn)可以由神經(jīng)網(wǎng)絡來實現(xiàn)一、引言一、引言n前饋控制結(jié)構(gòu):前饋控制結(jié)構(gòu):通常單純的求逆控制結(jié)構(gòu)不能通常單純的求逆控制結(jié)構(gòu)不能很好地起到抗干擾能力,因此結(jié)合反饋控制的很好地起到抗干擾能力,因此結(jié)合反饋控制的思想組成前饋補償器的網(wǎng)絡控制結(jié)構(gòu)思想組成前饋補償器的網(wǎng)絡控制結(jié)構(gòu)一、引言一、引言n自適應評價網(wǎng)絡是由自適應評價網(wǎng)絡是由Barto,Sutten Barto,Sutten 和和AndersonAnderson在在19831983年提出來的。整個學習系統(tǒng)由一個相關的搜索單元和年提出來的。整個學習系統(tǒng)由一個相關的搜索單元
8、和一個自適應評價單元組成,在這個算法中,相關搜索一個自適應評價單元組成,在這個算法中,相關搜索單元是作用網(wǎng)絡。自適應評價單元為評價網(wǎng)絡。它不單元是作用網(wǎng)絡。自適應評價單元為評價網(wǎng)絡。它不需要控制系統(tǒng)數(shù)學模型,只是通過對某一指標準則需要控制系統(tǒng)數(shù)學模型,只是通過對某一指標準則J J的的處理和分析得到獎勵或懲罰信號。處理和分析得到獎勵或懲罰信號。一、引言一、引言n神經(jīng)網(wǎng)絡的逼近能力神經(jīng)網(wǎng)絡的逼近能力n首先要搞清楚到底什么樣的被控系統(tǒng)可以用神首先要搞清楚到底什么樣的被控系統(tǒng)可以用神經(jīng)網(wǎng)絡來描述。對于眾多的神經(jīng)網(wǎng)絡類型來說經(jīng)網(wǎng)絡來描述。對于眾多的神經(jīng)網(wǎng)絡類型來說,要得到一個統(tǒng)一的神經(jīng)網(wǎng)絡逼近理論是不現(xiàn)
9、,要得到一個統(tǒng)一的神經(jīng)網(wǎng)絡逼近理論是不現(xiàn)實的,況且,還有很多神經(jīng)網(wǎng)絡結(jié)構(gòu)的逼近性實的,況且,還有很多神經(jīng)網(wǎng)絡結(jié)構(gòu)的逼近性問題至今尚未得到證明問題至今尚未得到證明n多層前向傳播神經(jīng)網(wǎng)絡能夠相當好地逼近許多多層前向傳播神經(jīng)網(wǎng)絡能夠相當好地逼近許多實際問題中的非線性函數(shù)。實際問題中的非線性函數(shù)。n這一節(jié)就要回答這個問題。這一節(jié)就要回答這個問題。一、引言一、引言n神經(jīng)網(wǎng)絡的逼近能力神經(jīng)網(wǎng)絡的逼近能力n含有兩個隱含層的前向傳播神經(jīng)網(wǎng)絡,且神經(jīng)元激勵函數(shù)為單調(diào)的含有兩個隱含層的前向傳播神經(jīng)網(wǎng)絡,且神經(jīng)元激勵函數(shù)為單調(diào)的S S型函數(shù),則此神經(jīng)網(wǎng)絡能夠得到合適的逼近精度型函數(shù),則此神經(jīng)網(wǎng)絡能夠得到合適的逼近精
10、度n對于在緊湊集中的任何平方可積函數(shù)可以通過有限個隱含神經(jīng)元組對于在緊湊集中的任何平方可積函數(shù)可以通過有限個隱含神經(jīng)元組成的二層前向傳播神經(jīng)網(wǎng)絡來逼近,并能達到任意逼近精度??紤]成的二層前向傳播神經(jīng)網(wǎng)絡來逼近,并能達到任意逼近精度??紤]具有單個隱含層的前向傳播神經(jīng)網(wǎng)絡,其輸出屬于集合:具有單個隱含層的前向傳播神經(jīng)網(wǎng)絡,其輸出屬于集合:n n其中:其中:x x表示表示n n維輸入矢量,維輸入矢量, =(1,xT)T; =(1,xT)T;n vj vj 表示隱含層第表示隱含層第j j個神經(jīng)元到輸出層的權(quán)值;個神經(jīng)元到輸出層的權(quán)值;n wj wj 表示輸入矢量到隱含層第表示輸入矢量到隱含層第j j個
11、神經(jīng)元的權(quán)值矢量個神經(jīng)元的權(quán)值矢量n j=1,2,.,q j=1,2,.,q; q q為隱含層神經(jīng)元個數(shù);為隱含層神經(jīng)元個數(shù);n ( () )為隱含層神經(jīng)元特性。為隱含層神經(jīng)元特性。一、引言一、引言n神經(jīng)網(wǎng)絡的逼近能力神經(jīng)網(wǎng)絡的逼近能力n定義定義5-15-1: S: S型函數(shù)型函數(shù)如果函數(shù)如果函數(shù)( () ):R R0 0,1 1是非遞減函是非遞減函數(shù),且滿足數(shù),且滿足n則稱函數(shù)則稱函數(shù)( () )為為 S S型函數(shù)。型函數(shù)。n定義定義5-25-2: : 距離函數(shù)距離函數(shù)- -給定的函數(shù)空間給定的函數(shù)空間S S,設,設f,g,hf,g,hS S。則距離。則距離函數(shù)函數(shù)滿足以下條件:滿足以下條件
12、:n . . 正定性正定性(f,g)(f,g)0 0,且僅當,且僅當 f=g f=g 時等號成立;時等號成立;n . . 對稱性對稱性(f,g)=(f,g)=(g(g,f)f);n . . 三角不等式關系三角不等式關系(f,g)(f,g)(f,h)+(f,h)+(h,g)(h,g)。n定義定義5-35-3: : - -稠密稠密 - - 一個度量空間(一個度量空間(X X,)中的子集)中的子集S S稱為是稱為是在子集在子集T T上的上的 - -稠密,只有當對于任意一個給定的稠密,只有當對于任意一個給定的00,對所,對所有的有的t tT T,存在一個,存在一個s sS S,有,有 (s,t)(s,
13、t)。一、引言一、引言n神經(jīng)網(wǎng)絡的逼近能力神經(jīng)網(wǎng)絡的逼近能力n定理定理5-15-1: : 若神經(jīng)元的激勵函數(shù)若神經(jīng)元的激勵函數(shù)( () )是是S-S-型連續(xù)函數(shù)型連續(xù)函數(shù)。那么,。那么,( () )在在C C(U U)中是)中是 - -稠密。稠密。n這個定理說明,只要是有限空間中的這個定理說明,只要是有限空間中的連續(xù)函數(shù)連續(xù)函數(shù)g(x),g(x),總總存在具有上述存在具有上述神經(jīng)元特性神經(jīng)元特性( () )的三層網(wǎng)絡的三層網(wǎng)絡( () ),使得其使得其輸出函數(shù)輸出函數(shù)f(x)f(x)能夠以任意精度逼近能夠以任意精度逼近g(x)g(x)。n對于非連續(xù)函數(shù)是否也有類似的神經(jīng)網(wǎng)絡來逼近它呢對于非連續(xù)
14、函數(shù)是否也有類似的神經(jīng)網(wǎng)絡來逼近它呢?如果能夠?qū)崿F(xiàn)這樣的逼近,則非連續(xù)函數(shù)?如果能夠?qū)崿F(xiàn)這樣的逼近,則非連續(xù)函數(shù)g(x)g(x)應該應該滿足什么樣的條件?滿足什么樣的條件?HornikHornik等人在等人在19891989年發(fā)表論文中年發(fā)表論文中闡明了多層前向傳播神經(jīng)網(wǎng)絡可以逼近任意連續(xù)函數(shù)闡明了多層前向傳播神經(jīng)網(wǎng)絡可以逼近任意連續(xù)函數(shù)或分段連續(xù)函數(shù)或分段連續(xù)函數(shù)一、引言一、引言16 引言引言1234 非線性動態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡辨識非線性動態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡辨識5 神經(jīng)網(wǎng)絡控制的學習機制神經(jīng)網(wǎng)絡控制的學習機制神經(jīng)網(wǎng)絡控制器的設計神經(jīng)網(wǎng)絡控制器的設計n系統(tǒng)建模是神經(jīng)網(wǎng)絡的最早應用。系統(tǒng)建模是神經(jīng)網(wǎng)
15、絡的最早應用。n什么叫系統(tǒng)辨識?什么叫系統(tǒng)辨識?nL.A.ZadchL.A.Zadch曾經(jīng)下過這樣的定義:曾經(jīng)下過這樣的定義:“辨識是在輸入和輸辨識是在輸入和輸出數(shù)據(jù)的基礎上,從一組給定的模型中,確定一個與出數(shù)據(jù)的基礎上,從一組給定的模型中,確定一個與所測系統(tǒng)等價的模型所測系統(tǒng)等價的模型”。n使用非線性系統(tǒng)的輸入輸出數(shù)據(jù)來訓練神經(jīng)網(wǎng)絡可認使用非線性系統(tǒng)的輸入輸出數(shù)據(jù)來訓練神經(jīng)網(wǎng)絡可認為是非線性函數(shù)的逼近問題。為是非線性函數(shù)的逼近問題。 n多層前向傳播網(wǎng)絡能夠逼近任意多層前向傳播網(wǎng)絡能夠逼近任意L2L2非線性函數(shù)。非線性函數(shù)。 二、非線性動態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡辨識二、非線性動態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡辨識n系
16、統(tǒng)辨識的三要素:系統(tǒng)辨識的三要素:n模型的選擇模型的選擇 n輸入信號的選擇輸入信號的選擇 n誤差準則的選擇誤差準則的選擇 二、非線性動態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡辨識二、非線性動態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡辨識n系統(tǒng)辨識的三要素:系統(tǒng)辨識的三要素:n模型的選擇模型的選擇n神經(jīng)網(wǎng)絡用于系統(tǒng)辨識的實質(zhì)就是選擇適當?shù)纳窠?jīng)神經(jīng)網(wǎng)絡用于系統(tǒng)辨識的實質(zhì)就是選擇適當?shù)纳窠?jīng)網(wǎng)絡模型來逼近實際系統(tǒng),即網(wǎng)絡模型來逼近實際系統(tǒng),即 為神經(jīng)網(wǎng)絡模型類為神經(jīng)網(wǎng)絡模型類, 為一神經(jīng)網(wǎng)絡??紤]到多層前向傳播網(wǎng)絡為一神經(jīng)網(wǎng)絡??紤]到多層前向傳播網(wǎng)絡具備良好的學習算法,本章我們選擇多層前向傳播具備良好的學習算法,本章我們選擇多層前向傳播網(wǎng)絡為模型類網(wǎng)
17、絡為模型類 , 為一能充分逼近實際系統(tǒng)而又為一能充分逼近實際系統(tǒng)而又不過分復雜的多層網(wǎng)絡。不過分復雜的多層網(wǎng)絡。 二、非線性動態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡辨識二、非線性動態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡辨識n系統(tǒng)辨識的三要素:系統(tǒng)辨識的三要素:n輸入信號的選擇輸入信號的選擇 n從時域上來看,要求系統(tǒng)的動態(tài)過程在辨識時間從時域上來看,要求系統(tǒng)的動態(tài)過程在辨識時間內(nèi)必須被輸入信號持續(xù)激勵,即輸入信號必須充內(nèi)必須被輸入信號持續(xù)激勵,即輸入信號必須充分激勵系統(tǒng)的所有模態(tài);分激勵系統(tǒng)的所有模態(tài);n從頻域來看,要求輸入信號的頻譜必須足以覆蓋從頻域來看,要求輸入信號的頻譜必須足以覆蓋系統(tǒng)的頻譜系統(tǒng)的頻譜二、非線性動態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡辨識
18、二、非線性動態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡辨識n系統(tǒng)辨識的三要素:系統(tǒng)辨識的三要素:n誤差準則的選擇誤差準則的選擇 n誤差準則是用來衡量模型接近實際系統(tǒng)的標準,它誤差準則是用來衡量模型接近實際系統(tǒng)的標準,它通常表示為一個誤差的泛函通常表示為一個誤差的泛函E Wf e kk()( ( )f e kek ( )( )2二、非線性動態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡辨識二、非線性動態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡辨識n 一旦三大要素確定以后,神經(jīng)網(wǎng)絡的辨識就歸結(jié)為一一旦三大要素確定以后,神經(jīng)網(wǎng)絡的辨識就歸結(jié)為一個最優(yōu)化問題。神經(jīng)網(wǎng)絡辨識具有以下五個特點。個最優(yōu)化問題。神經(jīng)網(wǎng)絡辨識具有以下五個特點。n(1)(1)不要求建立實際系統(tǒng)的辨識格式。不要求
19、建立實際系統(tǒng)的辨識格式。n(2)(2)可以對本質(zhì)非線性系統(tǒng)進行辨識,而且辨識是通過在網(wǎng)絡外可以對本質(zhì)非線性系統(tǒng)進行辨識,而且辨識是通過在網(wǎng)絡外部擬合系統(tǒng)的輸入部擬合系統(tǒng)的輸入/ /輸出,網(wǎng)絡內(nèi)部隱含著系統(tǒng)的特性。因此這輸出,網(wǎng)絡內(nèi)部隱含著系統(tǒng)的特性。因此這種辨識是由神經(jīng)網(wǎng)絡本身實現(xiàn)的,是非算法式的。種辨識是由神經(jīng)網(wǎng)絡本身實現(xiàn)的,是非算法式的。n(3)(3)辨識的收斂速度不依賴于待辨識系統(tǒng)的維數(shù),只與神經(jīng)網(wǎng)絡辨識的收斂速度不依賴于待辨識系統(tǒng)的維數(shù),只與神經(jīng)網(wǎng)絡本身及其所采用的學習算法有關,傳統(tǒng)的辨識方法隨模型參數(shù)維本身及其所采用的學習算法有關,傳統(tǒng)的辨識方法隨模型參數(shù)維數(shù)的增大而變得很復雜。數(shù)的
20、增大而變得很復雜。n(4)(4)由于神經(jīng)網(wǎng)絡具有大量的連接,這些連接之間的權(quán)值在辨識由于神經(jīng)網(wǎng)絡具有大量的連接,這些連接之間的權(quán)值在辨識中對應于模型參數(shù),通過調(diào)節(jié)這些權(quán)值使網(wǎng)絡輸出逼近系統(tǒng)輸出中對應于模型參數(shù),通過調(diào)節(jié)這些權(quán)值使網(wǎng)絡輸出逼近系統(tǒng)輸出n(5) (5) 神經(jīng)網(wǎng)絡作為實際系統(tǒng)的辨識模型,實際上也是系統(tǒng)的一個神經(jīng)網(wǎng)絡作為實際系統(tǒng)的辨識模型,實際上也是系統(tǒng)的一個物理實現(xiàn),可以用于在線控制。物理實現(xiàn),可以用于在線控制。二、非線性動態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡辨識二、非線性動態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡辨識n神經(jīng)網(wǎng)絡辨識模型的結(jié)構(gòu)神經(jīng)網(wǎng)絡辨識模型的結(jié)構(gòu) n前向建模法前向建模法n逆模型法逆模型法二、非線性動態(tài)系統(tǒng)的神
21、經(jīng)網(wǎng)絡辨識二、非線性動態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡辨識n前向建模法:利用神經(jīng)網(wǎng)絡來逼近非線性系統(tǒng)前向建模法:利用神經(jīng)網(wǎng)絡來逼近非線性系統(tǒng)的前向動力學模型的前向動力學模型 。yN(k+1)=f(y(k),.,y(k-n+1),u(k),.,u(k-m+1) 二、非線性動態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡辨識二、非線性動態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡辨識n逆模型法逆模型法n直接法:直接法:逆向建模是最直接的方法是將系統(tǒng)逆向建模是最直接的方法是將系統(tǒng)輸出作為網(wǎng)絡的輸入,網(wǎng)絡輸出與其期望輸輸出作為網(wǎng)絡的輸入,網(wǎng)絡輸出與其期望輸出即系統(tǒng)的輸入進行比較得到誤差作為此神出即系統(tǒng)的輸入進行比較得到誤差作為此神經(jīng)網(wǎng)絡訓練的信號經(jīng)網(wǎng)絡訓練的信號二、非線性動
22、態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡辨識二、非線性動態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡辨識n逆模型法存在的問題逆模型法存在的問題n 學習過程不一定是目標最優(yōu)的學習過程不一定是目標最優(yōu)的,可以采用,可以采用下圖所示的實用逆模型法下圖所示的實用逆模型法n一旦非線性系統(tǒng)對應關系不是一對一的,那一旦非線性系統(tǒng)對應關系不是一對一的,那么不準確的逆模型可能會被建立么不準確的逆模型可能會被建立二、非線性動態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡辨識二、非線性動態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡辨識n非線性系統(tǒng)的前向建模非線性系統(tǒng)的前向建模n辨識的兩種結(jié)構(gòu)辨識的兩種結(jié)構(gòu)n并行結(jié)構(gòu)并行結(jié)構(gòu)n串行結(jié)構(gòu)串行結(jié)構(gòu))1(),.,1(),(),1( ),.,1( ),( ) 1( mkukukunk
23、ykykyNky)1(),.,1(),(),1(),.,1(),() 1( mkukukunkykykyNky串行結(jié)構(gòu)收斂性較好串行結(jié)構(gòu)收斂性較好二、非線性動態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡辨識二、非線性動態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡辨識n對于非線性系統(tǒng):對于非線性系統(tǒng):n其中其中 X(k) X(k)、U(k)U(k)、Y(k)Y(k)分別為分別為n n維、維、p p維、維、m m維狀態(tài)維狀態(tài)矢量序列矢量序列n神經(jīng)網(wǎng)絡系統(tǒng)辨識的基本思想是利用神經(jīng)網(wǎng)絡的非線神經(jīng)網(wǎng)絡系統(tǒng)辨識的基本思想是利用神經(jīng)網(wǎng)絡的非線性映射特性來逼近動態(tài)系統(tǒng)的非線性函數(shù)性映射特性來逼近動態(tài)系統(tǒng)的非線性函數(shù)和和。如如下圖所示。下圖所示。二、非線性動態(tài)系統(tǒng)的
24、神經(jīng)網(wǎng)絡辨識二、非線性動態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡辨識n設系統(tǒng)的輸入空間為設系統(tǒng)的輸入空間為u,u,輸出空間為輸出空間為g,g,實際系統(tǒng)可以表實際系統(tǒng)可以表示為一個從輸入空間到輸出空間的算子示為一個從輸入空間到輸出空間的算子P:P:u ug;g;給定給定一個模型類一個模型類SMSM,設,設P PSMSM,則辨識的目的就是確定一個,則辨識的目的就是確定一個SMSM的子集類的子集類 ,使其中存在,使其中存在 ,且,且P P在給定的準在給定的準則下,則下, 為為P P的一個最佳逼近的一個最佳逼近二、非線性動態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡辨識二、非線性動態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡辨識yyP uP uuNpu ( )( )n討論討論非線
25、性動態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡辨識非線性動態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡辨識的的四種辨識模型四種辨識模型nI InIIIInIIIIIInIVIVn其中其中f f、g g分別為非線性函數(shù)。分別為非線性函數(shù)。u(u(k k),y(),y(k k)表示在表示在k k時刻的時刻的輸入輸入- -輸出對輸出對二、非線性動態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡辨識二、非線性動態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡辨識n假定:假定:n(1) (1) 線性部分的階次線性部分的階次n n、m m已知;已知;n(2) (2) 系統(tǒng)是穩(wěn)定的,即對于所有給定的有界輸入其輸出響系統(tǒng)是穩(wěn)定的,即對于所有給定的有界輸入其輸出響應必定也是有界的。反映在模型應必定也是有界的。反映在模型上要求線
26、性部分的特征上要求線性部分的特征多項式多項式 的根應全部位于單位圓內(nèi)。的根應全部位于單位圓內(nèi)。n(3) (3) 系統(tǒng)是最小相位系統(tǒng),反映在模型系統(tǒng)是最小相位系統(tǒng),反映在模型上要求上要求 的零點全部位于單位圓內(nèi)。的零點全部位于單位圓內(nèi)。n(4) u(k-i),i=0,1,.(4) u(k-i),i=0,1,.與與y(k-j),j=0,1,.y(k-j),j=0,1,.可以量測可以量測二、非線性動態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡辨識二、非線性動態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡辨識n神經(jīng)網(wǎng)絡的辨識途徑有二種:神經(jīng)網(wǎng)絡的辨識途徑有二種:n線性部分的參數(shù)已知線性部分的參數(shù)已知 可可歸結(jié)為帶時滯的多層感知網(wǎng)絡模型的學習問題歸結(jié)為帶時滯的
27、多層感知網(wǎng)絡模型的學習問題,只是,只是導師學習信號有所不同。導師學習信號有所不同。n線性部分的參數(shù)未知線性部分的參數(shù)未知 可可歸結(jié)為帶時滯的多層感知網(wǎng)絡模型的學習和線性系歸結(jié)為帶時滯的多層感知網(wǎng)絡模型的學習和線性系統(tǒng)的參數(shù)估計問題統(tǒng)的參數(shù)估計問題。二、非線性動態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡辨識二、非線性動態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡辨識n對于模型對于模型I I、IIIIn如果如果線性部分已知,系統(tǒng)實際輸出線性部分已知,系統(tǒng)實際輸出與模型輸出(神經(jīng)網(wǎng)絡輸出與線性與模型輸出(神經(jīng)網(wǎng)絡輸出與線性部分輸出之和)的差可以用部分輸出之和)的差可以用BPBP算法算法來來訓練神經(jīng)網(wǎng)絡模型訓練神經(jīng)網(wǎng)絡模型)1(),.,1(),()()
28、1(10mkukukugikykynii)()1(),.,1(),() 1(10ikunkykykyfkymii二、非線性動態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡辨識二、非線性動態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡辨識n對于模型對于模型I I、IIII,如果,如果線性部分線性部分未知。采用改進未知。采用改進的的BPBP迭代學習算法迭代學習算法二、非線性動態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡辨識二、非線性動態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡辨識n設線性部分的未知參數(shù)用矢量設線性部分的未知參數(shù)用矢量表示,非線性部表示,非線性部分的神經(jīng)網(wǎng)絡模型參數(shù)用分的神經(jīng)網(wǎng)絡模型參數(shù)用W W陣表示陣表示n 針對模型I二、非線性動態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡辨識二、非線性動態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡辨識n由于線性模
29、型和非線性模型的期望輸出由于線性模型和非線性模型的期望輸出Z(l+1)Z(l+1)和和t tpjpj 在這里都是未知的,已知的只是兩個模型的在這里都是未知的,已知的只是兩個模型的輸出之和。而它們的期望值應該是系統(tǒng)在當前時輸出之和。而它們的期望值應該是系統(tǒng)在當前時刻刻k+1k+1的實際輸出矢量的實際輸出矢量y(k+1)y(k+1)值。因此在實際對值。因此在實際對如上算法進行計算時可交替使用如上算法進行計算時可交替使用y(k+1)-yy(k+1)-y2 2(k+1)(k+1)和和y(k+1)-yy(k+1)-y1 1(k+1)(k+1)去近似地代替去近似地代替Z(k+1)Z(k+1)和和t tpj
30、pj n 在初始條件完全未知的情況下可以?。涸诔跏紬l件完全未知的情況下可以取:n n其中其中為比較大的數(shù)字。為比較大的數(shù)字。二、非線性動態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡辨識二、非線性動態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡辨識n舉例舉例 5-15-1n考慮以下模型:考慮以下模型:y(k+1y(k+1)=ay(k)+by(k-1)+g(u) =ay(k)+by(k-1)+g(u) 其中其中a=0.3, b=0.6a=0.3, b=0.6 g(u)=u g(u)=u3 3+0.3u+0.3u2 2-0.4u-0.4un試辨識該系統(tǒng)試辨識該系統(tǒng)二、非線性動態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡辨識二、非線性動態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡辨識n解:線性部分,采用遞推最小二
31、乘學習法解:線性部分,采用遞推最小二乘學習法n非線性部分采用前向傳播多層神經(jīng)網(wǎng)絡來逼近非線性部分采用前向傳播多層神經(jīng)網(wǎng)絡來逼近選擇神經(jīng)網(wǎng)絡結(jié)構(gòu)為選擇神經(jīng)網(wǎng)絡結(jié)構(gòu)為1,8,4,1, 1,8,4,1, )( ) 1() 1()(1()( ) 1( lllZlKllT1)1()() 1() 1()1()() 1(llPllllPlKT)()1() 1() 1(lPllKIlPT00)0( ba100010)0(=0.2, =0 二、非線性動態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡辨識二、非線性動態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡辨識n為了驗證辨識效果,采用校驗輸入信號為了驗證辨識效果,采用校驗輸入信號 :100.2 , 1 , 01002s
32、in)(kkku二、非線性動態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡辨識二、非線性動態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡辨識n對于對于模型模型,可以用一個,可以用一個NNNN來逼近,也可以用來逼近,也可以用兩個兩個NNNN來逼近。下面考慮第二種情況:來逼近。下面考慮第二種情況:n Nf f 網(wǎng)絡用來逼近可分離的非線性函數(shù)之一網(wǎng)絡用來逼近可分離的非線性函數(shù)之一 f()n Ng g 網(wǎng)絡用來逼近可分離的非線性函數(shù)之二網(wǎng)絡用來逼近可分離的非線性函數(shù)之二 g()1(),.,1(),()1(),.,1(),() 1(mkukukugnkykykyfky二、非線性動態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡辨識二、非線性動態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡辨識n選指標函數(shù)選指標函數(shù):n根據(jù)根
33、據(jù)BP算法的推導思路可得廣義誤差為:算法的推導思路可得廣義誤差為:pjLpjpjLpjLpjLpjLpjpjLpjLpjLtoooNettoofNet112111211( )( )( )( )( )( )( )( )()()()pjLpjpjLpjLpjLtoofNet21222( )( )( )( )()()pjrpjrpkrkkjrfNetw1111111( )( )()()()pjrpjrpkrkkjrfNetw2222121( )( )()()()二、非線性動態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡辨識二、非線性動態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡辨識n神經(jīng)網(wǎng)絡系數(shù)更新公式為:神經(jīng)網(wǎng)絡系數(shù)更新公式為:n在整個算法的計算過程中,
34、交替使用網(wǎng)絡的實在整個算法的計算過程中,交替使用網(wǎng)絡的實際輸出值際輸出值opj1(L)和和o opj2(L),使得廣義誤差信號可,使得廣義誤差信號可以不斷地進行計算和修正,直至最終收斂以不斷地進行計算和修正,直至最終收斂二、非線性動態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡辨識二、非線性動態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡辨識43 引言引言1234 非線性動態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡辨識非線性動態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡辨識5 神經(jīng)網(wǎng)絡控制的學習機制神經(jīng)網(wǎng)絡控制的學習機制神經(jīng)網(wǎng)絡控制器的設計神經(jīng)網(wǎng)絡控制器的設計n神經(jīng)元控制器的目的在于如何設計一個有效的神經(jīng)元控制器的目的在于如何設計一個有效的神經(jīng)元網(wǎng)絡去代替?zhèn)鹘y(tǒng)控制器的作用,使得系神經(jīng)元網(wǎng)絡去代替?zhèn)鹘y(tǒng)控制器
35、的作用,使得系統(tǒng)的輸出跟隨系統(tǒng)的期望輸出。為了達到這個統(tǒng)的輸出跟隨系統(tǒng)的期望輸出。為了達到這個目的,神經(jīng)網(wǎng)絡的學習方法就是尋找一種有效目的,神經(jīng)網(wǎng)絡的學習方法就是尋找一種有效的途徑進行網(wǎng)絡連接權(quán)陣或網(wǎng)絡結(jié)構(gòu)的修改,的途徑進行網(wǎng)絡連接權(quán)陣或網(wǎng)絡結(jié)構(gòu)的修改,從而使得網(wǎng)絡控制器輸出的控制信號能夠保證從而使得網(wǎng)絡控制器輸出的控制信號能夠保證系統(tǒng)輸出跟隨系統(tǒng)的期望輸出。系統(tǒng)輸出跟隨系統(tǒng)的期望輸出。 三、神經(jīng)網(wǎng)絡控制的學習機制三、神經(jīng)網(wǎng)絡控制的學習機制n學習機制分為:學習機制分為:n監(jiān)督式學習(有導師指導下的控制網(wǎng)絡學習監(jiān)督式學習(有導師指導下的控制網(wǎng)絡學習 )n離線學習法離線學習法n在線學習法在線學習法
36、n反饋誤差學習法反饋誤差學習法n多網(wǎng)絡學習法多網(wǎng)絡學習法n增強式學習(通過某一評價函數(shù)指定下的學習)增強式學習(通過某一評價函數(shù)指定下的學習) 三、神經(jīng)網(wǎng)絡控制的學習機制三、神經(jīng)網(wǎng)絡控制的學習機制n1 1、離線學習法、離線學習法 適合靜態(tài)環(huán)境,適合靜態(tài)環(huán)境,網(wǎng)絡離線訓練中選擇的性能指標為網(wǎng)絡離線訓練中選擇的性能指標為u-uu-uc的平方誤差極小,這一指標并不能保證系統(tǒng)的最終性能的平方誤差極小,這一指標并不能保證系統(tǒng)的最終性能y yd-y-y的平方誤差極小的平方誤差極小三、神經(jīng)網(wǎng)絡控制的學習機制三、神經(jīng)網(wǎng)絡控制的學習機制2 2、在線學習法:、在線學習法: 找出一個最優(yōu)控制量找出一個最優(yōu)控制量u
37、u使得系統(tǒng)輸出使得系統(tǒng)輸出y y趨于期望趨于期望輸出輸出y yd。權(quán)陣的調(diào)整應該使得。權(quán)陣的調(diào)整應該使得y yd-y-y的誤差減少最快的誤差減少最快適合模型已知的動態(tài)環(huán)境適合模型已知的動態(tài)環(huán)境三、神經(jīng)網(wǎng)絡控制的學習機制三、神經(jīng)網(wǎng)絡控制的學習機制n學習算法:學習算法:n采用最速下降法采用最速下降法 wkwkEwwkyky ky kwkwkyky ky ku ku kwkjijipjijidjijidji()( )( )( )( )( )( )( )( )( )( )( )( )( )1假設系統(tǒng)的假設系統(tǒng)的Jacobian矩陣已知矩陣已知三、神經(jīng)網(wǎng)絡控制的學習機制三、神經(jīng)網(wǎng)絡控制的學習機制n3 3
38、、反饋誤差學習法 適用于非線性系統(tǒng)線性絕對占優(yōu)條件下的網(wǎng)絡學習適用于非線性系統(tǒng)線性絕對占優(yōu)條件下的網(wǎng)絡學習 三、神經(jīng)網(wǎng)絡控制的學習機制三、神經(jīng)網(wǎng)絡控制的學習機制n4 4、多神經(jīng)網(wǎng)絡學習法(兩種)三、神經(jīng)網(wǎng)絡控制的學習機制三、神經(jīng)網(wǎng)絡控制的學習機制n增強式學習增強式學習n當某些被控系統(tǒng)的導師信號無法得到當某些被控系統(tǒng)的導師信號無法得到時,期時,期望輸出就沒有了。增強型學習就是利用當前望輸出就沒有了。增強型學習就是利用當前控制是否成功來決定下一次控制該如何走的控制是否成功來決定下一次控制該如何走的學習方式。學習方式。 n修正的辦法是對某一成功的行為進行鼓勵,修正的辦法是對某一成功的行為進行鼓勵,而
39、對不成功的行為進行懲罰。而對不成功的行為進行懲罰。 n用神經(jīng)網(wǎng)絡來實現(xiàn)時,用神經(jīng)網(wǎng)絡來實現(xiàn)時, 則可在權(quán)值空間進則可在權(quán)值空間進行調(diào)整。行調(diào)整。三、神經(jīng)網(wǎng)絡控制的學習機制三、神經(jīng)網(wǎng)絡控制的學習機制52 引言引言1234 非線性動態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡辨識非線性動態(tài)系統(tǒng)的神經(jīng)網(wǎng)絡辨識5 神經(jīng)網(wǎng)絡控制的學習機制神經(jīng)網(wǎng)絡控制的學習機制神經(jīng)網(wǎng)絡控制器的設計神經(jīng)網(wǎng)絡控制器的設計四、神經(jīng)網(wǎng)絡控制器的設計四、神經(jīng)網(wǎng)絡控制器的設計n神經(jīng)網(wǎng)絡控制的設計方法有四種:神經(jīng)網(wǎng)絡控制的設計方法有四種:n直接逆模型控制法直接逆模型控制法 n直接網(wǎng)絡控制法直接網(wǎng)絡控制法n多網(wǎng)絡自學習控制法多網(wǎng)絡自學習控制法n單一神經(jīng)元控制單一神
40、經(jīng)元控制 1 1、直接逆模型控制法:、直接逆模型控制法: 最直觀的一種神經(jīng)網(wǎng)絡控制器實現(xiàn)方法,其最直觀的一種神經(jīng)網(wǎng)絡控制器實現(xiàn)方法,其基本思想就是假設被控系統(tǒng)可逆,通過基本思想就是假設被控系統(tǒng)可逆,通過離線建模離線建模得到系統(tǒng)的逆模型網(wǎng)絡,然后用這一逆網(wǎng)絡模型得到系統(tǒng)的逆模型網(wǎng)絡,然后用這一逆網(wǎng)絡模型去直接控制被控對象去直接控制被控對象u(k)y(k+1)u (k)NZZZZ-1-1-n+1-m神經(jīng)網(wǎng)絡對象+圖3-2-27 直接逆控制的訓練結(jié)構(gòu)示意圖Z神經(jīng)網(wǎng)絡對象u (k)Ny(k+1)y(k+1)d-1-1ZZZ-n+1-m圖3-2-28 直接網(wǎng)絡逆模型控制的結(jié)構(gòu)示意圖訓練結(jié)構(gòu)示意圖訓練結(jié)構(gòu)
41、示意圖 四、神經(jīng)網(wǎng)絡控制器的設計四、神經(jīng)網(wǎng)絡控制器的設計四、神經(jīng)網(wǎng)絡控制器的設計四、神經(jīng)網(wǎng)絡控制器的設計n考慮如下單輸入單輸出系統(tǒng)考慮如下單輸入單輸出系統(tǒng):ny(k+1)=f(y(k-1),.,y(k-n+1),u(k),.,u(k-m)ny: 系統(tǒng)的輸出變量;系統(tǒng)的輸出變量; nu: 系統(tǒng)的輸入變量;系統(tǒng)的輸入變量;nn:系統(tǒng)的階數(shù);:系統(tǒng)的階數(shù);nm:輸入信號滯后階:輸入信號滯后階nf():任意的線性或非線性函數(shù):任意的線性或非線性函數(shù)n如果已知系統(tǒng)階次如果已知系統(tǒng)階次n、m,并假設系統(tǒng)可逆,則存在函,并假設系統(tǒng)可逆,則存在函數(shù)數(shù)g(),有:,有:n u(k)=g(y(k+1),.,y(k
42、-n+1),u(k-1),.,u(k-m)四、神經(jīng)網(wǎng)絡控制器的設計四、神經(jīng)網(wǎng)絡控制器的設計n若能用一個多層前向傳播神經(jīng)網(wǎng)絡來實現(xiàn),則網(wǎng)絡的輸若能用一個多層前向傳播神經(jīng)網(wǎng)絡來實現(xiàn),則網(wǎng)絡的輸入輸出關系為入輸出關系為: :n u uN= =(x) (x) n式中:式中:u uN為神經(jīng)網(wǎng)絡的輸出,它表示訓練完成后神經(jīng)網(wǎng)為神經(jīng)網(wǎng)絡的輸出,它表示訓練完成后神經(jīng)網(wǎng)絡產(chǎn)生的控制作用;絡產(chǎn)生的控制作用;n 為神經(jīng)網(wǎng)絡的輸入輸出關系式,它用來逼近被控為神經(jīng)網(wǎng)絡的輸入輸出關系式,它用來逼近被控系統(tǒng)的逆模型函數(shù)系統(tǒng)的逆模型函數(shù)g(g() );n X X為神經(jīng)網(wǎng)絡的輸入矢量,為神經(jīng)網(wǎng)絡的輸入矢量, X=y(k+1),
43、y(k),.,y(k-n+1),u(k-1),.,u(k-m)TX=y(k+1),y(k),.,y(k-n+1),u(k-1),.,u(k-m)Tn將神經(jīng)網(wǎng)絡輸入矢量將神經(jīng)網(wǎng)絡輸入矢量X X中的中的y(k+1)y(k+1)用期望系統(tǒng)輸出值用期望系統(tǒng)輸出值y yd(k+1)(k+1)去代替就可以通過神經(jīng)網(wǎng)絡去代替就可以通過神經(jīng)網(wǎng)絡產(chǎn)生期望的控制量產(chǎn)生期望的控制量u u。即:。即:X=yX=yd(k+1),y(k),.,y(k-n+1),u(k-(k+1),y(k),.,y(k-n+1),u(k-1),.,u(k-m)1),.,u(k-m)Tn直接網(wǎng)絡控制法直接網(wǎng)絡控制法: :直接逆模型控制法由于
44、缺乏學習機制直接逆模型控制法由于缺乏學習機制,且在控制器的設計中又沒有考慮到系統(tǒng)本身的輸入,且在控制器的設計中又沒有考慮到系統(tǒng)本身的輸入輸出狀態(tài),因此,一旦系統(tǒng)運行的環(huán)境、參數(shù)發(fā)生變輸出狀態(tài),因此,一旦系統(tǒng)運行的環(huán)境、參數(shù)發(fā)生變化時,這類控制器就無法適應了化時,這類控制器就無法適應了。直接網(wǎng)絡控制法直接網(wǎng)絡控制法是在神經(jīng)網(wǎng)絡的輸入端引入了系統(tǒng)的狀態(tài)信號,并將學在神經(jīng)網(wǎng)絡的輸入端引入了系統(tǒng)的狀態(tài)信號,并將學習機制實時在線地用于網(wǎng)絡控制器的調(diào)整和改善習機制實時在線地用于網(wǎng)絡控制器的調(diào)整和改善四、神經(jīng)網(wǎng)絡控制器的設計四、神經(jīng)網(wǎng)絡控制器的設計n以例子來說明設計方法:以例子來說明設計方法:n考慮被控系統(tǒng)考慮被控系統(tǒng) 假設動力學逆模型成立假設動力學逆模型成立 ,即有,即有u(k)=gy(k+1),y(k),y(k-1),y(k-1),u(k-1) u(k)=gy(k+1),y(k),y(k-1),y(k-1),u(k-1) n試用直接網(wǎng)絡控制法控制。試用直接網(wǎng)絡控制法控制。y ky k y ky ku ky ku kykyk()( ) () () ()( ()( )()()11211111222四、神經(jīng)網(wǎng)絡控
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025【合同范本】財產(chǎn)分割協(xié)議
- 腳踝韌帶拉傷個案護理
- 2025年山東省棗莊市滕州市初中學業(yè)水平考試模擬試題(四)道德與法治試題
- 普通心理學(第2版)課件 第十四章 社會心理
- 2025年食品從業(yè)人員培訓試題
- 關于初中物理2024
- 《艾滋病小斗士》教學設計
- 護理管理計劃活動實施綱要
- 學校開展實驗室安全檢查工作總結(jié)模版
- 信用社新終總結(jié)模版
- 2025-2030白酒行業(yè)市場發(fā)展現(xiàn)狀及競爭形勢與投資前景研究報告
- 成人腸造口護理-中華護理學會團體標準
- 2025年湖北省初中學業(yè)水平考試地理模擬卷(三)(學生版)
- 園林綠化安全培訓課件
- DB14T 3231-2025安全風險分級管控和隱患排查治理雙重預防機制建設通則
- 腔隙性腦梗塞護理常規(guī)
- 2025年入團積極分子培訓考試題庫及答案
- 人工智能在價格預測中的應用-深度研究
- 《新聞傳播學》課件
- Unit 3 The world of Science 大單元教學設計-2023-2024學年高中英語外研版(2019)必修第三冊
- 延邊大學《物聯(lián)網(wǎng)技術(shù)1》2023-2024學年第二學期期末試卷
評論
0/150
提交評論