Algorithm design and analysis; Heuristic algorithms; Dynamic programming; Approximation algorithms; Target tracking; Trajectory; Mathematical model;
机译:基于Q学习算法的无模型离散时间系统的随机线性二次最优控制。
机译:通过截止策略强化学习对线性离散时间系统非零和游戏的最佳跟踪控制
机译:结合强化Q学习和内部模型方法的未知离散时间线性系统的自适应最优输出反馈跟踪控制
机译:通过模型脱离政策Q学习方法对离散时间系统的最佳跟踪控制
机译:不确定系统的最优跟踪控制:基于策略和基于策略的强化学习方法
机译:一种新的流行病建模方法:具有旅行阻塞的最优控制策略的多区域离散时间模型
机译:输出反馈H∞控制线性离散时间多人多人系统,使用脱离策略Q-Learning具有多源干扰
机译:全系统流量控制的最优信号光定时模型