机译:通用和游戏中的分散学习:L_(R-I)滞后锚算法
Department of Systems and Computer Engineering Carleton University 1125 Colonel By Drive, Ottawa, ON, Canada;
Department of Systems and Computer Engineering Carleton University 1125 Colonel By Drive, Ottawa, ON, Canada;
multiagent learning; matrix games; game theory;
机译:通过策略梯度滞后锚定,在双人矩阵游戏中学习
机译:滞后锚算法:具有不完善信息的两人零和游戏的强化学习
机译:用于某一般性加速游戏的多功能逆钢筋学习
机译:双人零和游戏中分散学习:一个L_(R-I)滞后锚算法
机译:纳什均衡问题的分散算法-在多主体网络拦截游戏及其他应用中的应用。
机译:改变游戏规则:人工智能和深度学习算法时代的脊柱护理
机译:N-player中学习纳什均衡的演员批评算法 一般和游戏