首页> 中国专利> 一种基于状态分类与指派的多Agent深度强化学习框架及方法

一种基于状态分类与指派的多Agent深度强化学习框架及方法

页面导航

摘要
著录项
法律信息
相似文献

摘要

本发明属于人工智能领域，具体涉及一种基于状态分类与指派的多agent深度强化学习框架及方法。包括：执行M1，对生成的环境虚拟状态样本进行分类，并求解一个指派问题，得到状态分类模型F和agent的指派规则A；设置Multi‑Agents中的所有agent的网络结构，以及它们的学习模式、行动选择策略、更新方式和reward的计算方法；执行M2，首先初始化多个符合上述步骤设置的同质agent，然后初始化环境，最后多个agent与环境交互，学习行动策略，并更新各自的网络。本发明中将复杂的环境状态分解为简单易学习多个状态空间，并可以将多个agent指派到多个状态空间，克服单个agent面对人工划分的局部状态或者全局状态时学习效率低的缺陷，最终实现MADRL整体学习效果的提升。

著录项

公开/公告号CN115563527A

专利类型发明专利
公开/公告日2023-01-03

原文格式PDF
申请/专利权人西南交通大学;
展开▼

申请/专利号CN202211182519.7
发明设计人徐进;补金凤;
展开▼

申请日2022-09-27
分类号G06F18/24;G06F18/23213;G06N3/00;
代理机构成都智言知识产权代理有限公司;
代理人蒋秀清
地址 610031 四川省成都市二环路北一段111号
入库时间 2023-06-19 18:11:21

法律信息

法律状态公告日

法律状态信息

法律状态
2023-01-03

公开

发明专利申请公布

相似文献

专利
中文文献
外文文献

1. 一种基于深度强化学习的多agent协作框架 [P] . 中国专利： CN110084375B . 2021-09-17
2. 一种基于深度强化学习的多agent协作框架 [P] . 中国专利： CN110084375A . 2019-08-02
3. Method for performing multi-agent reinforcement learning in the presence of unreliable communications via distributed consensus [P] . 美国专利： US11321635B2 . 2022-05-03

机译：一种通过分布式共识在存在不可靠通信的情况下执行多agent强化学习的方法
4. DEEP REINFORCEMENT LEARNING FOR A GENERAL FRAMEWORK FOR MODEL-BASED LONGITUDINAL CONTROL [P] . 美国专利： US2020010084A1 . 2020-01-09

机译：基于模型的纵向控制的通用框架的深度强化学习
5. DEEP REINFORCEMENT LEARNING FOR A GENERAL FRAMEWORK FOR MODEL-BASED LONGITUDINAL CONTROL [P] . 欧洲知识产权局专利： EP3594770A1 . 2020-01-15

机译：基于模型的纵向控制的通用框架的深度强化学习