批量更新 | 师大云端图书馆

最小二乘策略迭代算法研究 06月30日

【摘要】强化学习是一种通过与环境的交互，将状态映射到动作，以获取最大累积奖赏的机器学习方法。在大规模和连续状态或动作空间强化学习问题中，通过使用函数逼近方法拟合策略形成了近似强化学习方法。最小二乘策略迭代是一类前沿的近似强化学习方法，其最小二乘逼近可以从样本中获取更多有效信息，并可以应用到在线算法中。本文着眼于在线最小二乘策略迭代算法，对其进行了以下几方面的扩展，提出了相应的算法：（1）针对在线最 […]

分类：参考文献
标签：中国知网免费入口, 多媒体技术论文, 学位论文, 强化学习, 德育论文网, 批量更新, 最小二乘策略迭代, 特征选择, 自动步长评估
喜欢：2810
阅读全文

最小二乘策略迭代算法研究 06月30日

广而告之

最新推荐

随机推荐