首页> 中文期刊> 《辽宁科技学院学报》 >改进强化学习算法在AGV路径规划中的应用研究

改进强化学习算法在AGV路径规划中的应用研究

         

摘要

物流AGV小车的路径规划问题受到了广大学者的关注,传统的强化学习的Q-learning路径规划算法为了平衡探索与利用问题,在智能体的动作选择策略中引入一个探索因子的概率值ε,由于每次都选择最大的Q值函数的状态-动作对,这导致整个过程的收敛速度放慢且结果不稳定。为了解决探索和利用之间的矛盾,文章提出一种改进的动态调整探索因子ε策略,即在强化学习的不同阶段选择不同的探索因子ε值。通过仿真实验及实物实验后,证明了改进后的强化学习算法的收敛速度较快且收敛结果的稳定性也得到了提升。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号