首页

连续空间非参函数逼近方法研究 06月30日

【摘要】强化学习是一种试错学习,可解决无模型问题,在没有任何先验知识的情况下,Agent通过与环境不断交互实现基于自身经验的学习。本文研究的是连续状态动作空间的问题,传统的解决方法是离散化状态或动作空间,为了保证一定的精度,离散化方法会导致状态动作空间非常大,从而引起“维数灾”。本文提出三种基于行动者-评论家(Actor-Critic,AC)架构的算法,其中Critic部分使用非参函数逼近来解决连 […]

【论文下载 - 中国知网/万方数据/维普/读秀/超星/国研/龙源/博看等资源库】

卡尔曼滤波和卡尔曼预测方法的改进及其在结构损伤识别中的应用 05月24日

【摘要】结构健康监测技术在结构安全以及可靠度评估方面起着重要作用。目前,结构健康监测技术中关于结构损伤识别的理论研究已得到极大发展,其中基于时域振动信号的结构物理参数识别方法是结构无损检测的重要研究方向。在结构物理参数的时域识别研究中,基于最小二乘方法(LSE)以及扩展卡尔曼滤波方法(EKF)的研究得到了广泛关注。传统的扩展卡尔曼滤波方法(EKF)在应用于结构损伤识别时存在两个局限:1)EKF仅适 […]

附有先验信息的测量数据处理理论及在大地测量中的应用 07月02日

【摘要】摘要:在大地测量的各个领域,经常能够预先得到参数间的先验约束信息,包括参数的先验期望、方差等随机信息,也包括参数间应满足的等式或不等式约束信息。深入挖掘测量实际中的先验信息并纳入到观测模型中,能够提高参数估计的精度和可靠性,改善平差结果。本文分析了大地测量中各种有用先验信息的来源,按照各类先验信息的表达形式,建立起相应的附有约束先验信息的测量平差模型。研究了附有先验信息平差模型的算法和精度 […]