策略迭代 | 师大云端图书馆

基于非参函数逼近的强化学习算法研究 06月30日

【摘要】强化学习主要通过与环境交互的方式获得输入信息，继而对策略进行改进。近年来，强化学习受到了学术界的广泛关注，已经成为机器学习领域的一个重要分支。传统的强化学习在大规模状态空间下通常采用带参的函数逼近器来表示值函数，但是无法解决算法收敛速度过慢与策略精度较低的问题。而非参函数逼近作为一种灵活的、完全基于样本的函数逼近方法，具有精度高、收敛速度快等特点，且与强化学习基于反馈进行学习的根本原理相一 […]

分类：参考文献
标签： sci收录期刊, 中国知网免费入口, 强化学习, 核函数, 毕业论文提纲格式, 策略迭代, 论文提纲格式范文, 非参函数逼近, 高斯过程
喜欢：1615
阅读全文

基于非参函数逼近的强化学习算法研究 06月30日

广而告之

最新推荐

随机推荐