資料介紹
針對經(jīng)典深度Q網(wǎng)絡(luò)(DepΩ Network,DQN)算法在訓(xùn)練初期收斂速度慢的問題,文中提岀一種新的基于函數(shù)逼近協(xié)同更新的DQN算法。該算法在經(jīng)典的DQN算法的基礎(chǔ)上融合了線性函數(shù)方法,在訓(xùn)練的初期利用線性函數(shù)逼近器來代替神經(jīng)網(wǎng)絡(luò)中的行為值函數(shù)網(wǎng)絡(luò),并提出一種離策略值函數(shù)更新規(guī)則,與DQN協(xié)同更新值函數(shù)參數(shù),加快神經(jīng)網(wǎng)絡(luò)的參數(shù)優(yōu)化,進(jìn)而加快算法的收斂速度。將改進(jìn)后的算法與DQN算法用于 Cartpole和 Mountain car問題,實(shí)驗(yàn)結(jié)果表明,改進(jìn)后的算法具有更快的收斂速度。
- 基于DDPG算法的智能車匯流模型 7次下載
- 基于光華逼近函數(shù)的求解凸二次規(guī)劃方法 3次下載
- 基于狀態(tài)信息的動態(tài)更新蟻群優(yōu)化算法 5次下載
- 一種融合多種類型上下文信息的協(xié)同過濾算法 10次下載
- 基于協(xié)同過濾推薦模型的評分函數(shù)研究綜述 7次下載
- 基于隨機(jī)森林與轉(zhuǎn)換算法實(shí)現(xiàn)海洋數(shù)據(jù)的協(xié)同轉(zhuǎn)換 1次下載
- 針對協(xié)同過濾推薦算法的相似度計(jì)算方法 6次下載
- 結(jié)合搜索與Double DQN的非完備信息博弈算法 10次下載
- 一種改進(jìn)的基于半自動編碼器的協(xié)同過濾推薦算法 4次下載
- 一種融合知識圖譜和協(xié)同過濾的混合推薦模型 10次下載
- 基于SVDPP算法的新型協(xié)同過濾推薦算法 17次下載
- pade逼近方法的介紹與泰勒級數(shù)展開式相匹配的詳細(xì)資料概述 5次下載
- 基于容積約束Power圖的圖像分片逼近 1次下載
- 參數(shù)優(yōu)化模型的正交逼近算法
- 模2n加整體逼近模2 加產(chǎn)生的噪聲函數(shù)的概率分布研究
- 深度解析CORDIC算法原理 2953次閱讀
- 硬件算法協(xié)同設(shè)計(jì) 994次閱讀
- 斜坡函數(shù)發(fā)生器算法的公式是什么 3784次閱讀
- 嵌入式的單向散列算法 1026次閱讀
- 三種常見的損失函數(shù)和兩種常用的激活函數(shù)介紹和可視化 7230次閱讀
- 一種替代性的基于模擬的搜索方法,即策略梯度搜索 2856次閱讀
- 激活函數(shù)中sigmoid、ReLU等函數(shù)的一些性質(zhì) 1.1w次閱讀
- 基于傳感器溫度補(bǔ)償方法的雙指數(shù)函數(shù)模型的溫度補(bǔ)償算法設(shè)計(jì) 1w次閱讀
- 高分辨率逐次逼近型ADC基準(zhǔn)電壓源電路設(shè)計(jì)的要求是什么? 2677次閱讀
- 一個(gè)神經(jīng)元的ResNet就是一個(gè)通用的函數(shù)逼近器 5547次閱讀
- 機(jī)器學(xué)習(xí)經(jīng)典損失函數(shù)比較 8589次閱讀
- 逐次逼近型ADC的原理 2.6w次閱讀
- 蟻群算法解決tsp問題 7536次閱讀
- 基于新閾值函數(shù)的小波閾值去噪算法 9982次閱讀
- 引導(dǎo)濾波的軟硬件協(xié)同加速器設(shè)計(jì)與實(shí)現(xiàn) 1561次閱讀
下載排行
本周
- 1DD3118電路圖紙資料
- 0.08 MB | 1次下載 | 免費(fèi)
- 2AD庫封裝庫安裝教程
- 0.49 MB | 1次下載 | 免費(fèi)
- 3PC6206 300mA低功耗低壓差線性穩(wěn)壓器中文資料
- 1.12 MB | 1次下載 | 免費(fèi)
- 4網(wǎng)絡(luò)安全從業(yè)者入門指南
- 2.91 MB | 1次下載 | 免費(fèi)
- 5DS-CS3A P00-CN-V3
- 618.05 KB | 1次下載 | 免費(fèi)
- 6海川SM5701規(guī)格書
- 1.48 MB | 次下載 | 免費(fèi)
- 7H20PR5電磁爐IGBT功率管規(guī)格書
- 1.68 MB | 次下載 | 1 積分
- 8IP防護(hù)等級說明
- 0.08 MB | 次下載 | 免費(fèi)
本月
- 1貼片三極管上的印字與真實(shí)名稱的對照表詳細(xì)說明
- 0.50 MB | 103次下載 | 1 積分
- 2涂鴉各WiFi模塊原理圖加PCB封裝
- 11.75 MB | 89次下載 | 1 積分
- 3錦銳科技CA51F2 SDK開發(fā)包
- 24.06 MB | 43次下載 | 1 積分
- 4錦銳CA51F005 SDK開發(fā)包
- 19.47 MB | 19次下載 | 1 積分
- 5PCB的EMC設(shè)計(jì)指南
- 2.47 MB | 16次下載 | 1 積分
- 6HC05藍(lán)牙原理圖加PCB
- 15.76 MB | 13次下載 | 1 積分
- 7802.11_Wireless_Networks
- 4.17 MB | 12次下載 | 免費(fèi)
- 8蘋果iphone 11電路原理圖
- 4.98 MB | 6次下載 | 2 積分
總榜
- 1matlab軟件下載入口
- 未知 | 935127次下載 | 10 積分
- 2開源硬件-PMP21529.1-4 開關(guān)降壓/升壓雙向直流/直流轉(zhuǎn)換器 PCB layout 設(shè)計(jì)
- 1.48MB | 420064次下載 | 10 積分
- 3Altium DXP2002下載入口
- 未知 | 233089次下載 | 10 積分
- 4電路仿真軟件multisim 10.0免費(fèi)下載
- 340992 | 191390次下載 | 10 積分
- 5十天學(xué)會AVR單片機(jī)與C語言視頻教程 下載
- 158M | 183342次下載 | 10 積分
- 6labview8.5下載
- 未知 | 81588次下載 | 10 積分
- 7Keil工具M(jìn)DK-Arm免費(fèi)下載
- 0.02 MB | 73815次下載 | 10 積分
- 8LabVIEW 8.6下載
- 未知 | 65989次下載 | 10 積分
評論