Manipulators; Approximate/adaptive dynamic programming (ADP); Wheeled inverted pendulum (WIP); Output feedback control;
机译:用于轮式移动机器人系统的自适应部分加强学习神经网络跟踪控制
机译:基于单位评论家的机器人系统在线优化控制基于NN的强化学习
机译:用于多机罗系统的自适应增强学习 - 增强的运动/力控制策略
机译:基于机器人控制系统的加强学习自适应最优策略
机译:基于平均场模型的深增强学习策略,机器人群控制
机译:基于中央模式生成器的控制器和强化学习探索类似卡特彼勒的软机器人的行为
机译:基于单位评论家的机器人系统在线优化控制基于NN的强化学习