基于人工情感的Q-学习算法在机器人行为决策中的应用

谷学静; 高贝贝; 朱朝月

首页> 中文期刊> 《自动化与仪表》 >基于人工情感的Q-学习算法在机器人行为决策中的应用

基于人工情感的Q-学习算法在机器人行为决策中的应用

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

为了提高经典强化学习算法在机器人行为最优控制策略中学习的效率和收敛速度,在利用环境模型提高强化学习速度方法的基础上,将人类情感具有的趋利避害生存机理应用于环境模型经验知识的学习中,提出了基于人工情感的Q-学习算法,并将该算法应用于机器人的行为决策.在有障碍的二维栅格环境下对机器人路径寻优进行了仿真测试,仿真实验结果表明该算法较基于环境模型的Q-学习算法具有更高的学习效率和收敛速度.其改进算法对于提高机器人自主决策能力具有较高的理论意义及推广应用价值.

著录项

来源
《自动化与仪表》 |2015年第7期|13-16,48|共5页
作者
谷学静; 高贝贝; 朱朝月;
展开▼
作者单位

华北理工大学电气工程学院,唐山063009;

华北理工大学电气工程学院,唐山063009;

华北理工大学电气工程学院,唐山063009;

展开▼
原文格式 PDF
正文语种 chi
中图分类 TP273.22;
关键词
强化学习; Q-学习算法; 人工情感; 机器人; 最优控制策略;

相似文献

中文文献
外文文献
专利

1. 基于人工情感与Q学习的机器人行为决策 [J] . 祝宇虹 ,毛俊鑫 . 机械与电子 . 2011,第007期
2. 基于情感认知的学习与决策算法在移动机器人行为协调中的应用 [J] . 张惠娣 ,刘士荣 ,俞金寿 . 华东理工大学学报（自然科学版） . 2008,第003期
3. 基于Q-学习的果园机器人避障算法研究 [J] . 毛鹏军 ,张家瑞 ,黄传鹏 . 农机化研究 . 2020,第011期
4. Q-学习及其在智能机器人局部路径规划中的应用研究 [J] . 张汝波 ,杨广铭 ,顾国昌 . 计算机研究与发展 . 1999,第12期
5. 软件定义网络中基于Q-学习的负载均衡算法 [J] . 王炜发 ,张大明 ,刘堃钤 . 电讯技术 . 2021,第009期
6. Q-学习算法在CGF系统中的应用 [C] . 徐如燕 ,郭齐胜 . 第一届全国虚拟现实与可视化学术会议 . 2001
7. 基于人工情感的机器人行为决策研究 [A] . 毛俊鑫 . 2011

基于人工情感的Q-学习算法在机器人行为决策中的应用

摘要

著录项

相似文献

相关主题

期刊订阅