cognition; learning (artificial intelligence); multi-agent systems; self-organising feature maps; Q-learning value estimation formula; TD-FALCON; e-greedy action policy; minefield navigation task; minefield pursuit task; multiagent environment; reinforcement learn;
机译:通过多功能钢筋学习在多个场景环境中学习对抗性政策
机译:在合作多剂型无代理模型加强学习计划下认知无线电网络中的节能资源分配
机译:基于多智能强化学习的移动认知无线电自组织网络的机会路由和信道分配
机译:多助理环境中的自组织认知代理和加强学习
机译:多代理虚拟环境的协作强化学习框架。
机译:多主体强化学习和近似模型学习的竞技游戏
机译:在多主体环境中自组织认知主体并加强学习