強(qiáng)化學(xué)習(xí)的雙權(quán)重最小二乘Sarsa算法
資料介紹
強(qiáng)化學(xué)習(xí)是人工智能領(lǐng)域中的一個(gè)研究熱點(diǎn)。在求解強(qiáng)化學(xué)習(xí)問(wèn)題時(shí),傳統(tǒng)的最小二乘法作為一類(lèi)特殊的函數(shù)逼近學(xué)習(xí)方法,具有收斂速度快、充分利用樣本數(shù)據(jù)的優(yōu)勢(shì)。通過(guò)對(duì)最小二乘時(shí)序差分算法( Least-squares Temporal DifferenceLSTD)的研究與分析,并以該方法為基礎(chǔ)提出了雙權(quán)重最小二乘 Sarsa算法( Double Weights With Least Squares Sarsa,DWLSrsa)。 Dwls-sarsa算法將兩權(quán)重通過(guò)一定方式進(jìn)行關(guān)聯(lián)得到目標(biāo)權(quán)重,并利用 Sarsa方法對(duì)時(shí)序差分誤差進(jìn)行控制。在算法訓(xùn)練過(guò)程中,兩權(quán)重會(huì)因?yàn)楦聵颖镜牟煌a(chǎn)生不同的值,保證了算法可以有效地進(jìn)行探索;兩權(quán)重也會(huì)因?yàn)闃颖緮?shù)據(jù)的分布而逐漸縮小之間的差距直到收斂至同一最優(yōu)值,確保了算法的收斂性能。最后將DwLS- Sarsa算法與其他強(qiáng)化學(xué)習(xí)算法進(jìn)行實(shí)驗(yàn)對(duì)比,結(jié)果表明 Dwls-sarsa算法具有較優(yōu)的學(xué)習(xí)性能與魯棒性,可以有效地處理局部最優(yōu)問(wèn)題并提高算法收斂時(shí)的表現(xiàn)效果。
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉
- 一种新型的多智能体深度强化学习算法36次下载
- 机器学习中的无模型强化学习算法及研究综述11次下载
- 增量式约简最小二乘孪生攴持向量回归机算法15次下载
- 最小二乘修正的随机Hough变换直线检测1次下载
- 【智能控制】最小二乘参数辨识方法及原理0次下载
- 最小二乘法_(C语言)17次下载
- 基于递推总体最小二乘的北斗T_R_n型被动雷达定位_李文超0次下载
- 改进递归最小二乘RBF神经网络溶解氧预测_袁红春1次下载
- 偏最小二乘回归在气温预测中的研究与应用汪春辉0次下载
- 类最小二乘调度与控制的耦合设计_赵顺利0次下载
- 永磁同步电机双率残差增广最小二乘参数辨识0次下载
- 基于空间响应偏差约束的最小二乘宽带波束形成0次下载
- 算法大全_偏最小二乘回归0次下载
- 基于最小二乘法的K-NN航迹关联算法研究26次下载
- 基于子空间的线性约束最小二乘恒模算法9次下载
- 使用最小二乘法解决曲线拟合问题1441次阅读
- Python实现最小二乘法是什么1092次阅读
- 浅谈时序差分的在线控制算法—SARSA2402次阅读
- 懒惰强化学习算法在发电调控REG框架的应用999次阅读
- 对NAS任务中强化学习的效率进行深入思考5225次阅读
- 量化深度强化学习算法的泛化能力2568次阅读
- 如何构建强化学习模型来训练无人车算法5023次阅读
- 基于强化学习的MADDPG算法原理及实现22049次阅读
- 基于目标图像的视觉强化学习算法,让机器人可以同时学习多个任务7191次阅读
- 用PopArt进行多任务深度强化学习5849次阅读
- 强化学习和监督式学习, 非监督式学习的区别21270次阅读
- 什么是强化学习?纯强化学习有意义吗?强化学习有什么的致命缺陷?17887次阅读
- Q Learning算法学习3811次阅读
- 一种新型的强化学习算法,能够教导算法如何在没有人类协助的情况下解开魔方3986次阅读
- 强化学习究竟是什么?它与机器学习技术有什么联系?14296次阅读
下載排行
本周
- 1電子電路原理第七版PDF電子教材免費(fèi)下載
- 0.00 MB | 1491次下載 | 免費(fèi)
- 2單片機(jī)典型實(shí)例介紹
- 18.19 MB | 95次下載 | 1 積分
- 3S7-200PLC編程實(shí)例詳細(xì)資料
- 1.17 MB | 27次下載 | 1 積分
- 4筆記本電腦主板的元件識(shí)別和講解說(shuō)明
- 4.28 MB | 18次下載 | 4 積分
- 5開(kāi)關(guān)電源原理及各功能電路詳解
- 0.38 MB | 11次下載 | 免費(fèi)
- 6100W短波放大電路圖
- 0.05 MB | 4次下載 | 3 積分
- 7基于單片機(jī)和 SG3525的程控開(kāi)關(guān)電源設(shè)計(jì)
- 0.23 MB | 4次下載 | 免費(fèi)
- 8基于AT89C2051/4051單片機(jī)編程器的實(shí)驗(yàn)
- 0.11 MB | 4次下載 | 免費(fèi)
本月
- 1OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234313次下載 | 免費(fèi)
- 2PADS 9.0 2009最新版 -下載
- 0.00 MB | 66304次下載 | 免費(fèi)
- 3protel99下載protel99軟件下載(中文版)
- 0.00 MB | 51209次下載 | 免費(fèi)
- 4LabView 8.0 專(zhuān)業(yè)版下載 (3CD完整版)
- 0.00 MB | 51043次下載 | 免費(fèi)
- 5555集成電路應(yīng)用800例(新編版)
- 0.00 MB | 33562次下載 | 免費(fèi)
- 6接口電路圖大全
- 未知 | 30320次下載 | 免費(fèi)
- 7Multisim 10下載Multisim 10 中文版
- 0.00 MB | 28588次下載 | 免費(fèi)
- 8開(kāi)關(guān)電源設(shè)計(jì)實(shí)例指南
- 未知 | 21539次下載 | 免費(fèi)
總榜
- 1matlab軟件下載入口
- 未知 | 935053次下載 | 免費(fèi)
- 2protel99se軟件下載(可英文版轉(zhuǎn)中文版)
- 78.1 MB | 537793次下載 | 免費(fèi)
- 3MATLAB 7.1 下載 (含軟件介紹)
- 未知 | 420026次下載 | 免費(fèi)
- 4OrCAD10.5下載OrCAD10.5中文版軟件
- 0.00 MB | 234313次下載 | 免費(fèi)
- 5Altium DXP2002下載入口
- 未知 | 233046次下載 | 免費(fèi)
- 6電路仿真軟件multisim 10.0免費(fèi)下載
- 340992 | 191183次下載 | 免費(fèi)
- 7十天學(xué)會(huì)AVR單片機(jī)與C語(yǔ)言視頻教程 下載
- 158M | 183277次下載 | 免費(fèi)
- 8proe5.0野火版下載(中文版免費(fèi)下載)
- 未知 | 138039次下載 | 免費(fèi)
評(píng)論