computer games; learning (artificial intelligence); multi-agent systems; environmental model; model-based reinforcement learning; multiplayer card game; one-step-ahead utility prediction; optimal control; partial observability; sampling method; state estimation;
机译:具有基于采样状态估计的部分可观察游戏的基于模型的强化学习
机译:具有部分可观察性的基于模型的强化学习中的临时扩展功能
机译:利用加固学习的多人追求逃避游戏的合作控制
机译:基于模型的强化学习,用于部分可观察性的多人纸牌游戏
机译:了解基于模型的强化学习及其在安全强化学习中的应用
机译:PRISM游戏:具有多个目标的随机多玩家游戏的验证和策略综合
机译:基于模型的具有部分可观察性的多人纸牌游戏强化学习