...
机译:高斯过程回归深增强学习的奖励功能预测
Yonsei Univ Sch Mech Engn Seoul 03722 South Korea;
Yonsei Univ Sch Mech Engn Seoul 03722 South Korea;
Yonsei Univ Sch Mech Engn Seoul 03722 South Korea;
Gaussian processes; inverse reinforcement learning; mobile robots;
机译:主观和模型估计的奖励预测:与强化学习任务中与反馈相关的负性(FRN)和奖励预测错误相关联。
机译:使用内在奖励功能的工业人员机器人合作的深度增强基于学习的安全互动
机译:具有可调节参数的深增强学习动态调整奖励功能方法
机译:通过深度学习实现激光束焊接过程中加固学习的奖励
机译:机器人任务规划加速奖励功能技术的深增强学习
机译:主观和模型估计奖励预测:与反馈相关的消极性(FRN)关联并在加固学习任务中奖励预测误差
机译:具有优化奖励功能的深度加强学习,用于机器人轨迹规划