首页> 中文学位 >演化博弈中个体决策行为研究——基于真人实验和Agent建模的方法
【6h】

演化博弈中个体决策行为研究——基于真人实验和Agent建模的方法

代理获取

目录

声明

第一章 绪论

1.1 研究背景与意义

1.2 国内外研究现状

1.2.1 个体策略更新规则

1.2.2 重复雪堆博弈

1.3 研究内容与研究方法

1.4 本章小结

第二章 实验与数据

2.1 实验设计

2.1.1 雪堆博弈

2.1.2 实验情景

2.1.3 实验软件

2.2 实验实施

2.3 数据概况

2.4 本章小结

第三章 基于IPM算法的决策规则提取

3.1 聚类分析

3.1.1 数据预处理

3.1.2 聚类结果

3.2 IPM序列挖掘算法

3.2.1 问题要求

3.2.2 算法步骤

3.3 特征模式提取

3.3.1 重要定义和参数设定

3.3.2 不同群体的特征分析

3.3.3 高收益群体的特征分析

3.4 基于Agent建模

3.4.1 参数估计

3.4.2 模型检验

3.5 本章小结

第四章 基于EWA学习模型的个体决策建模

4.1 EWA学习模型

4.1.1 经典学习理论

4.1.2 模型和参数含义

4.1.3 异质个体EWA模型

4.2 建立Agent模型

4.2.1 参数估计

4.2.2 模型检验

4.3 聚类分析

4.3.1 个体参数的空间分布

4.3.2 个体决策特征分析

4.4 策略与排名

4.5 讨论

4.6 本章小结

第五章 结论与展望

5.1 结论

5.2 展望

5.3 本章小结

参考文献

发表论文和参加科研情况说明

致谢

展开▼

摘要

对于演化博弈动态的分析,关键在于确定博弈人的学习机制和策略演化的过程,而如何对个体决策过程建模是国内外学者一直致力解决的问题。本文选取重复雪堆博弈的研究框架,采用随机配对的实验设置,组织开展由人参与的实验室实验。随后,从序列数据挖掘算法和经验加权吸引力学习理论(简称EWA学习)两个视角来研究个体在实验中所表现出的决策规则的形式、特征、异质性,并据此尝试对个体决策行为进行多Agent建模。 首先,分别基于“过去一轮影响当期决策”和“过去两轮影响当期决策”的假设,通过k均值聚类和IPM序列数据挖掘算法,将个体聚类为特征鲜明的三类:执着激进型、前景理论型和友善包容型。随后,使用“条件—行动—概率”组合作为个体决策规则的形式,为三类个体分别建立反应式Agent模型。针对六组实验分别进行多Agent仿真,结果均再现了实际实验中的宏观合作率状态,从而验证了模型的有效性。 其次,基于EWA学习理论为每个个体的决策行为建模。模型检验说明EWA学习模型成功捕捉了75%的实验参与者的策略演化过程,并发现了参与者之间显著的异质性。依据模型参数将所有通过模型检验的参与者聚为四类,其中两类人(63.9%)近似符合经典的加权或累积强化学习模型。进一步观察持有不同策略的参与者在收益和排名竞争中的表现,发现:加权强化学习者表现出了明显的劣势,同类的累积强化学习者之间表现差异较大,相反,另外两类参与者均有较好的表现。因此,虽然大多数人采用了类似于强化学习的策略,然而这种策略在重复雪堆博弈并不能带来明显的或稳定的优势,而存在两个因素可能会提升参与者的表现——对于未选择策略可能收益的综合思考以及对于环境变化的敏锐感知。 以上工作对于演化博弈中的个体决策行为建模具有一定的启示作用,也对于使用Agent模拟演化博弈现象铺垫了理论基础。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号