首页

基于非参函数逼近的强化学习算法研究 06月30日

【摘要】强化学习主要通过与环境交互的方式获得输入信息,继而对策略进行改进。近年来,强化学习受到了学术界的广泛关注,已经成为机器学习领域的一个重要分支。传统的强化学习在大规模状态空间下通常采用带参的函数逼近器来表示值函数,但是无法解决算法收敛速度过慢与策略精度较低的问题。而非参函数逼近作为一种灵活的、完全基于样本的函数逼近方法,具有精度高、收敛速度快等特点,且与强化学习基于反馈进行学习的根本原理相一 […]