...
机译:通过概率图形模型使用任务成就奖励使用盖尔和强化学习的模仿学习
Ritsumeikan Univ Dept Human &
Comp Intelligence Kusatsu Japan;
Ritsumeikan Univ Dept Human &
Comp Intelligence Kusatsu Japan;
Imitation learning; reinforcement learning; probabilistic inference; control as inference; generative adversarial imitation learning;
机译:通过概率图形模型使用任务成就奖励使用盖尔和强化学习的模仿学习
机译:他人的行为充当伪奖励,以便在社会强化学习背景下驾驶模仿
机译:“主动”学习模型:利用基于联合学习的主动脑概念进行无模型和基于模型的强化学习的集成框架
机译:生成内部奖励的仿制学习和加强学习的有效整合
机译:使用分布式奖励制定学习基于模型的强化学习的政策
机译:扩展的基底神经节强化学习模型以了解5-羟色胺和多巴胺在基于风险的决策奖励预测和惩罚学习中的作用
机译:概率图形模型使用盖爪和加固学习的仿制学习的集成
机译:学习嘈杂和延迟奖励:强化学习对国防建模和仿真的价值。