首页

基于高斯过程回归的强化学习算法研究 06月30日

【摘要】强化学习(ReinforcementLearning)是机器学习方法中重要的一类,在人工智能领域中有着举足轻重的地位,在博弈、电梯调度和智能机器人等领域得到广泛的应用。在强化学习框架下,Agent不断和周围环境进行交互,学习从环境状态到行为的映射,以期望获得最大累积奖赏。本文针对强化学习方法在大规模离散状态空间和连续空间所面临的“维数灾”问题,以值函数逼近技术为基础,提出相应的改进算法,对 […]

【论文下载 - 中国知网/万方数据/维普/读秀/超星/国研/龙源/博看等资源库】

复杂工程结构可靠度分析的高斯过程动态响应面方法研究 10月21日

【摘要】中国正处在土木建筑行业的黄金机遇期,大型结构如雨后春笋,复杂程度越来越高,不确定因素越来越多,随着而来的是安全问题越来越重要。这就要求提出结构可靠度评估的与信息化时代相吻合的新理论和新方法。本文将针对大型复杂结构对应的功能函数具有计算代价高、隐式表达和高度非线性等特征,而传统方法难以或准确或快速地解决的问题,利用高斯过程机器学习方法善于处理高维数、小样本、非线性等复杂问题、能自适应获取最优 […]