首页

基于高斯过程回归的强化学习算法研究 06月30日

【摘要】强化学习(ReinforcementLearning)是机器学习方法中重要的一类,在人工智能领域中有着举足轻重的地位,在博弈、电梯调度和智能机器人等领域得到广泛的应用。在强化学习框架下,Agent不断和周围环境进行交互,学习从环境状态到行为的映射,以期望获得最大累积奖赏。本文针对强化学习方法在大规模离散状态空间和连续空间所面临的“维数灾”问题,以值函数逼近技术为基础,提出相应的改进算法,对 […]

【论文下载 - 中国知网/万方数据/维普/读秀/超星/国研/龙源/博看等资源库】

强化学习中值函数逼近方法的研究 06月30日

【摘要】强化学习是一类无需先验知识的机器学习方法,以Agent与环境不断的交互为主要特征,以寻找能带来最大期望累积折扣奖赏的策略为目标。强化学习中环境可能具有大状态空间甚至连续状态空间,Agent所能执行的动作可能为离散的或连续的,这必然带来一定的复杂性。本文着眼于大规模空间或连续空间可能带来的问题,以值函数逼近为出发点,针对对当前值函数逼近方法中存在的若干问题提出若干值函数逼近模型及其相应的强化 […]