GPRV | 师大云端图书馆

基于高斯过程回归的强化学习算法研究 06月30日

【摘要】强化学习（ReinforcementLearning）是机器学习方法中重要的一类，在人工智能领域中有着举足轻重的地位，在博弈、电梯调度和智能机器人等领域得到广泛的应用。在强化学习框架下，Agent不断和周围环境进行交互，学习从环境状态到行为的映射，以期望获得最大累积奖赏。本文针对强化学习方法在大规模离散状态空间和连续空间所面临的“维数灾”问题，以值函数逼近技术为基础，提出相应的改进算法，对 […]

分类：参考文献
标签： Dyna结构, GPRV, sci期刊, 中国知网免费入口, 值函数逼近, 强化学习, 法律论文发表, 聚类分析论文, 高斯过程回归
喜欢：1616
阅读全文

基于高斯过程回归的强化学习算法研究 06月30日

广而告之

最新推荐

随机推荐