性能势 | 师大云端图书馆

基于性能势的改进平均奖赏强化学习算法研究 06月25日

【摘要】强化学习是人工智能领域内用于解决学习控制问题的一个重要方法。机器人仿真足球比赛是一个多智能体系统研究的标准问题,具有动态实时、分布式控制、不确定环境中的合作和对抗等特点,是人工智能、控制决策和智能机器人领域发展的一项重要研究。传统的强化学习算法在解决RoboCup智能体策略问题时,仍存在算法收敛速度慢,环境不确定性强、参数敏感性高等问题。针对强化学习算法存在的上述问题,本文提出了相应的改进 […]

分类：参考文献
标签：万方数据库免费账号, 三农问题论文, 中国知网免费入口, 多智能体, 就业指导论文, 平均强化学习算法, 强化学习算法, 性能势, 足球机器人
喜欢：2148
阅读全文

基于性能势的改进平均奖赏强化学习算法研究 06月25日

广而告之

最新推荐

随机推荐