首页> 中国专利> 一种基于多Agent强化学习的团队机器人决策方法

一种基于多Agent强化学习的团队机器人决策方法

摘要

本发明涉及一种基于多Agent强化学习的团队机器人决策方法,包括以下步骤:采用DQN强化学习方法,初始化网络,随机生成权重,初始化经验回放区;进行网络训练,在每一次与环境的交互中,使用∈‑greedy策略生成机器人的下一步动作;将执行动作后的过渡样本存入经验回放区,随机抽取部分数据用于网络更新;使用梯度下降法更新网络,循环以上步骤,通过不断与环境交互,训练出具有优秀决策能力的值函数网络。本发明采用DQN方法训练团队机器人的决策能力,避免了多Agent带来的的状态空间与动作空间过于复杂的问题,能让机器人具备更加优秀的决策能力。

著录项

  • 公开/公告号CN111898728A

    专利类型发明专利

  • 公开/公告日2020-11-06

    原文格式PDF

  • 申请/专利权人 东南大学;

    申请/专利号CN202010490427.X

  • 发明设计人 田宇飞;

    申请日2020-06-02

  • 分类号G06N3/04(20060101);G06N20/20(20190101);B25J9/16(20060101);

  • 代理机构32206 南京众联专利代理有限公司;

  • 代理人杜静静

  • 地址 210096 江苏省南京市玄武区四牌楼2号

  • 入库时间 2023-06-19 08:00:20

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号