机译:RoboCup足球禁区的强化学习
Department of Computer Sciences, The University of Texas at Austin, 1 University Station C0500, Austin, TX 78712-0233, USA;
multiagent systems; machine learning; multiagent learning; reinforcement learning; robot soccer;
机译:多Agent连续任务中奖励设计的实验考虑-以RoboCup足球禁忌任务为例
机译:多售后持续任务 - Robocup足球昆虫淘场任务的补偿设计实验研究作为示例
机译:用内核学习RoboCup-Keepaway
机译:借助基于案例的启发式技术进行RoboCup足球禁运的强化学习
机译:针对RoboCup客户的场景学习和识别框架。
机译:延迟奖励的结构保留模仿学习:Robocup Soccer 2D模拟环境中的评估
机译:两步强化学习en robocup-soccer keepaway