首页

基于高斯过程回归的强化学习算法研究 06月30日

【摘要】强化学习(ReinforcementLearning)是机器学习方法中重要的一类,在人工智能领域中有着举足轻重的地位,在博弈、电梯调度和智能机器人等领域得到广泛的应用。在强化学习框架下,Agent不断和周围环境进行交互,学习从环境状态到行为的映射,以期望获得最大累积奖赏。本文针对强化学习方法在大规模离散状态空间和连续空间所面临的“维数灾”问题,以值函数逼近技术为基础,提出相应的改进算法,对 […]