退出
我的积分:
中文文献批量获取
外文文献批量获取
宫瑞敏; 吕艳辉;
沈阳理工大学,信息科学与工程学院,辽宁,沈阳,110159;
TD算法; BP神经网络; 估值函数; PVS算法;
机译:实时强化学习的基于博弈论的控制系统算法:如何在线解决多人游戏
机译:研究搜索方法和机器学习相结合的算法在区域能源系统优化中的发展(第二次报告)与强化学习在建筑物之间换热系统运行优化中的比较。
机译:Dyna-H:一种启发式计划强化学习算法,应用于角色扮演游戏策略决策系统
机译:使用强化学习训练神经网络玩五子棋变种
机译:CloudStack网络中基于Stackelberg博弈和强化学习的实时负载均衡
机译:强化学习在认知无线电网络中的应用:模型和算法
机译:简单的强化学习代理:帕累托在算法博弈论研究中击败纳什
机译:利用博弈论和强化学习预测中等规模情景中的飞行员行为。
机译:基于强化学习的智能五子棋系统方法
机译:逆向强化学习方法,用于向逆向强化学习过程执行指令存储指令的存储介质,逆向强化学习系统以及包含逆向强化学习系统的预测系统
机译:博弈依赖验证方法,博弈依赖验证服务器,用户终端,信息处理设备,博弈依赖验证程序和博弈依赖验证系统
抱歉,该期刊暂不可订阅,敬请期待!
目前支持订阅全部北京大学中文核心(2020)期刊目录。