資料介紹
本文針對快速、多變量、強非線性的復(fù)雜系統(tǒng)的控制問題,在強化學(xué)習(xí)方式的基礎(chǔ)上,提出一種新的自適應(yīng)控制方法。該方法在沒有先驗知識的條件下,基于遞歸神經(jīng)網(wǎng)絡(luò)并結(jié)合強化學(xué)習(xí)的自調(diào)節(jié)能力,通過自身神經(jīng)網(wǎng)絡(luò)的在線學(xué)習(xí),有效控制不穩(wěn)定的非線性系統(tǒng)。本文以一級倒立擺系統(tǒng)為實驗對象,仿真實驗結(jié)果表明:所提出的控制方法具有非常好的控制效果和穩(wěn)定精度,抗干擾能力強。
隨著智能控制研究的不斷深入,人們通過模擬人的決策過程,將強化學(xué)習(xí)方式融入控制
策略,用來解決復(fù)雜非線性系統(tǒng)的控制問題。強化學(xué)習(xí)(Reinforcement Learning)是一種試探學(xué)習(xí)方式,外界沒有明顯的教師信號給出正確的指令,只通過與環(huán)境的交互得到評價信息來學(xué)習(xí)如何執(zhí)行恰當(dāng)?shù)膭幼?。近年來,強化學(xué)習(xí)在算法和應(yīng)用上已取得了大量的研究成果,如用靜態(tài)神經(jīng)網(wǎng)絡(luò)控制倒立擺系統(tǒng)[1,2]、多種動態(tài)規(guī)劃算法的提出[3,4]等。
遞歸神經(jīng)網(wǎng)絡(luò)(RNN)由于存在輸出變量到輸入端的反饋,因而其變量中包含時間延時網(wǎng)
絡(luò),是真正的動態(tài)網(wǎng)絡(luò)系統(tǒng),為動態(tài)系統(tǒng)的辨識和控制開辟了一個極有前途的領(lǐng)域。本文在強化學(xué)習(xí)方式的基礎(chǔ)上,提出一種基于遞歸神經(jīng)網(wǎng)絡(luò)的自適應(yīng)控制方法。該控制方法采用的強化學(xué)習(xí)學(xué)習(xí)方式基于“動作網(wǎng)絡(luò)/評價網(wǎng)絡(luò)”的框架結(jié)構(gòu)。其中,動作網(wǎng)絡(luò)部分由BP 神經(jīng)網(wǎng)絡(luò)構(gòu)成的,它將系統(tǒng)狀態(tài)量映射為一個可能的實際動作;評價網(wǎng)絡(luò)部由遞歸神經(jīng)網(wǎng)絡(luò)構(gòu)成的,根據(jù)系統(tǒng)狀態(tài)和系統(tǒng)的控制量來評價系統(tǒng)的運行狀態(tài),檢驗當(dāng)前的控制效果,產(chǎn)生“獎勵/懲罰”值作為反饋,以進行自適應(yīng)學(xué)習(xí)。通過對一級倒立擺系統(tǒng)的控制實驗仿真研究,驗證了所提控制方法的可行性。
隨著智能控制研究的不斷深入,人們通過模擬人的決策過程,將強化學(xué)習(xí)方式融入控制
策略,用來解決復(fù)雜非線性系統(tǒng)的控制問題。強化學(xué)習(xí)(Reinforcement Learning)是一種試探學(xué)習(xí)方式,外界沒有明顯的教師信號給出正確的指令,只通過與環(huán)境的交互得到評價信息來學(xué)習(xí)如何執(zhí)行恰當(dāng)?shù)膭幼?。近年來,強化學(xué)習(xí)在算法和應(yīng)用上已取得了大量的研究成果,如用靜態(tài)神經(jīng)網(wǎng)絡(luò)控制倒立擺系統(tǒng)[1,2]、多種動態(tài)規(guī)劃算法的提出[3,4]等。
遞歸神經(jīng)網(wǎng)絡(luò)(RNN)由于存在輸出變量到輸入端的反饋,因而其變量中包含時間延時網(wǎng)
絡(luò),是真正的動態(tài)網(wǎng)絡(luò)系統(tǒng),為動態(tài)系統(tǒng)的辨識和控制開辟了一個極有前途的領(lǐng)域。本文在強化學(xué)習(xí)方式的基礎(chǔ)上,提出一種基于遞歸神經(jīng)網(wǎng)絡(luò)的自適應(yīng)控制方法。該控制方法采用的強化學(xué)習(xí)學(xué)習(xí)方式基于“動作網(wǎng)絡(luò)/評價網(wǎng)絡(luò)”的框架結(jié)構(gòu)。其中,動作網(wǎng)絡(luò)部分由BP 神經(jīng)網(wǎng)絡(luò)構(gòu)成的,它將系統(tǒng)狀態(tài)量映射為一個可能的實際動作;評價網(wǎng)絡(luò)部由遞歸神經(jīng)網(wǎng)絡(luò)構(gòu)成的,根據(jù)系統(tǒng)狀態(tài)和系統(tǒng)的控制量來評價系統(tǒng)的運行狀態(tài),檢驗當(dāng)前的控制效果,產(chǎn)生“獎勵/懲罰”值作為反饋,以進行自適應(yīng)學(xué)習(xí)。通過對一級倒立擺系統(tǒng)的控制實驗仿真研究,驗證了所提控制方法的可行性。
下載該資料的人也在下載
下載該資料的人還在閱讀
更多 >
- 神經(jīng)網(wǎng)絡(luò)自適應(yīng)控制及其發(fā)展應(yīng)用 11次下載
- 基于不同神經(jīng)網(wǎng)絡(luò)的文本分類方法研究對比 49次下載
- 基于自適應(yīng)神經(jīng)網(wǎng)絡(luò)的PID控制移相方法 11次下載
- 一種改進的深度神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)搜索方法 3次下載
- 一種新型的自適應(yīng)神經(jīng)網(wǎng)絡(luò)遙感場景分類模型 5次下載
- 基于擴展反向傳播神經(jīng)網(wǎng)絡(luò)的自適應(yīng)控制方法 0次下載
- 基于自適應(yīng)果蠅算法的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)訓(xùn)練 0次下載
- 基于神經(jīng)網(wǎng)絡(luò)自適應(yīng)諧波電流抑制方法 14次下載
- 加工過程的神經(jīng)網(wǎng)絡(luò)模型參考自適應(yīng)控制
- 一種基于自適應(yīng)模糊神經(jīng)網(wǎng)絡(luò)的VSLMS算法及應(yīng)用
- 半主動懸架神經(jīng)網(wǎng)絡(luò)自適應(yīng)控制研究
- 基于神經(jīng)網(wǎng)絡(luò)的拉絲機恒張力自適應(yīng)控制
- 基于神經(jīng)網(wǎng)絡(luò)PID控制的交流伺服系統(tǒng)
- 一種基于PID神經(jīng)網(wǎng)絡(luò)的解耦控制方法的研究
- 自適應(yīng)模糊神經(jīng)網(wǎng)絡(luò)研究
- 遞歸神經(jīng)網(wǎng)絡(luò)和循環(huán)神經(jīng)網(wǎng)絡(luò)的模型結(jié)構(gòu) 701次閱讀
- 遞歸神經(jīng)網(wǎng)絡(luò)的實現(xiàn)方法 357次閱讀
- 神經(jīng)網(wǎng)絡(luò)預(yù)測模型的構(gòu)建方法 744次閱讀
- 人工神經(jīng)網(wǎng)絡(luò)的工作原理和基本特征 1723次閱讀
- 電機控制系統(tǒng)的神經(jīng)網(wǎng)絡(luò)優(yōu)化策略 724次閱讀
- 基于單個自適應(yīng)神經(jīng)元的非模型直接控制方法在汽車懸架系統(tǒng)中的應(yīng)用 2020次閱讀
- 基于神經(jīng)網(wǎng)絡(luò)模型參考自適應(yīng)實現(xiàn)混合動力汽車電子差速控制系統(tǒng)的設(shè)計 3739次閱讀
- 一種新型神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu):膠囊網(wǎng)絡(luò) 5904次閱讀
- 一種基于FPGA的神經(jīng)網(wǎng)絡(luò)硬件實現(xiàn)方案詳解 1.3w次閱讀
- 一種遞歸神經(jīng)網(wǎng)絡(luò)在FPGA平臺上的實現(xiàn)方案詳解 2210次閱讀
- BP神經(jīng)網(wǎng)絡(luò)概述 4.4w次閱讀
- 什么是神經(jīng)網(wǎng)絡(luò)?學(xué)習(xí)人工智能必會的八大神經(jīng)網(wǎng)絡(luò)盤點 2.5w次閱讀
- 自適應(yīng)模糊神經(jīng)網(wǎng)絡(luò)的交通燈控制系統(tǒng)的設(shè)計 3174次閱讀
- 基于FPGA的神經(jīng)網(wǎng)絡(luò)算法的設(shè)計 5650次閱讀
- 一種基于模糊神經(jīng)網(wǎng)絡(luò)的機器人控制技術(shù) 1943次閱讀
下載排行
本周
- 1DC電源插座圖紙
- 0.67 MB | 2次下載 | 免費
- 2AN158 GD32VW553 Wi-Fi開發(fā)指南
- 1.51MB | 2次下載 | 免費
- 3AN148 GD32VW553射頻硬件開發(fā)指南
- 2.07MB | 1次下載 | 免費
- 4AN111-LTC3219用戶指南
- 84.32KB | 次下載 | 免費
- 5AN153-用于電源系統(tǒng)管理的Linduino
- 1.38MB | 次下載 | 免費
- 6AN-283: Σ-Δ型ADC和DAC[中文版]
- 677.86KB | 次下載 | 免費
- 7SM2018E 支持可控硅調(diào)光線性恒流控制芯片
- 402.24 KB | 次下載 | 免費
- 8AN-1308: 電流檢測放大器共模階躍響應(yīng)
- 545.42KB | 次下載 | 免費
本月
- 1ADI高性能電源管理解決方案
- 2.43 MB | 450次下載 | 免費
- 2免費開源CC3D飛控資料(電路圖&PCB源文件、BOM、
- 5.67 MB | 138次下載 | 1 積分
- 3基于STM32單片機智能手環(huán)心率計步器體溫顯示設(shè)計
- 0.10 MB | 130次下載 | 免費
- 4使用單片機實現(xiàn)七人表決器的程序和仿真資料免費下載
- 2.96 MB | 44次下載 | 免費
- 53314A函數(shù)發(fā)生器維修手冊
- 16.30 MB | 31次下載 | 免費
- 6美的電磁爐維修手冊大全
- 1.56 MB | 24次下載 | 5 積分
- 7如何正確測試電源的紋波
- 0.36 MB | 17次下載 | 免費
- 8感應(yīng)筆電路圖
- 0.06 MB | 10次下載 | 免費
總榜
- 1matlab軟件下載入口
- 未知 | 935121次下載 | 10 積分
- 2開源硬件-PMP21529.1-4 開關(guān)降壓/升壓雙向直流/直流轉(zhuǎn)換器 PCB layout 設(shè)計
- 1.48MB | 420062次下載 | 10 積分
- 3Altium DXP2002下載入口
- 未知 | 233088次下載 | 10 積分
- 4電路仿真軟件multisim 10.0免費下載
- 340992 | 191367次下載 | 10 積分
- 5十天學(xué)會AVR單片機與C語言視頻教程 下載
- 158M | 183335次下載 | 10 積分
- 6labview8.5下載
- 未知 | 81581次下載 | 10 積分
- 7Keil工具MDK-Arm免費下載
- 0.02 MB | 73810次下載 | 10 積分
- 8LabVIEW 8.6下載
- 未知 | 65988次下載 | 10 積分
評論