一种基于Q学习的有限理性博弈模型及其应用

陈荣钦; 林君焕; 陈月芬

首页> 中文期刊> 《系统仿真技术》 >一种基于Q学习的有限理性博弈模型及其应用

一种基于Q学习的有限理性博弈模型及其应用

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

传统博弈理论模型建立在人的完全理性基础之上,难以切合实际.有限理性博弈则能够很好地描述实际问题.有限理性的博弈者参与到不完全信息博弈中,对博弈的规则、结构以及对手等博弈信息有一个逐渐适应和了解的过程,因此博弈应是动态进化的模型.针对这一问题,提出了一种基于Q学习算法的不完全信息博弈模型,根据Littman的最大最小原则建立了多指标体系下的策略选择概率分布;构建了Q学习与博弈融合的数学模型,使用Q学习机制来实现博弈模型的动态进化;最后将模型应用于两人追逐的仿真实验,结果表明所提出的模型能够很好地再现追逐情景.

著录项

来源
《系统仿真技术》 |2014年第3期|203-210|共8页
作者
陈荣钦; 林君焕; 陈月芬;
展开▼
作者单位

台州学院数学与信息工程学院,浙江台州318000;

台州职业技术学院机电学院,浙江台州318000;

台州学院物理与电子工程学院,浙江台州318000;

展开▼
原文格式 PDF
正文语种 chi
中图分类自动推理、机器学习;
关键词
Q学习; 有限理性博弈; 追逐; 多指标收益;

相似文献

中文文献
外文文献
专利

1. 基于有限理性的一级密封价格拍卖灰博弈模型研究——基于准确的价值和经验理想报价估价的最优灰报价模型 [J] . 方志耕 ,刘思峰 ,谢敦礼 . 管理工程学报 . 2006,第003期
2. 基于Q学习的DDoS攻防博弈模型研究 [J] . 史云放 ,武东英 ,刘胜利 . 计算机科学 . 2014,第011期
3. 论辩:一种基于有限理性的多主体认知博弈 [J] . 黄华新 ,李海波 . 自然辩证法通讯 . 2008,第4期
4. 基于多期有限理性的可再生资源寡头博弈模型与分析 [J] . 丁占文 ,葛栋梁 ,蒋书敏 . 运筹与管理 . 2013,第005期
5. 基于演化博弈理论的有限理性交通选择行为模型 [J] . 关宏志 ,浦亮 . 北京工业大学学报 . 2010,第008期
6. 有限理性博弈问题和自适应博弈学习模型 [C] . 陈其坤 ,林元庆 . 中南六省(区)自动化学会学术年会 . 2003
7. 基于入世有限理性双寡头投资博弈混沌模型的分析与控制 [A] . 吴承尧 . 2006

一种基于Q学习的有限理性博弈模型及其应用

摘要

著录项

相似文献

相关主题

期刊订阅