Department of Computer Science The University of Texas at Austin 2317 Speedway, Stop D9500, Austin, TX, USAc;
Connect Four; Evolutionary Algorithms; Reinforcement Learning; feature selectien; online learning;
机译:使用强化学习的一类未知非仿射非线性系统的离散时间在线学习控制
机译:采用加固学习的一类未知非共和非线性系统的离散时间在线学习控制
机译:在线学习塑造强化学习中的奖励。
机译:在线加固学习进化腐烂评估
机译:基于规则的进化型在线学习系统:学习范围,分类和预测
机译:在线强化学习实现的突触可塑性
机译:在线强化学习的进化特征评估
机译:进化瓷砖编码:一种用于强化学习的自动状态抽象算法。