首页> 中国专利> 一种可解释的策略游戏多玩家风格评估方法及装置

一种可解释的策略游戏多玩家风格评估方法及装置

页面导航

摘要
著录项
说明书
相似文献

摘要

本发明提供一种可解释的策略游戏多玩家风格评估方法及装置，涉及数据处理技术领域，该方法包括以下步骤，获取待预测玩家的游戏数据，并提取待预测玩家的算子动作特征；基于待预测玩家的每个算子在各阶算子动作特征频繁项的累计支持度，获取待预测玩家的操作行为特征；按照时序关系，获取待预测玩家某一类算子动作特征后连续出现的至少一类其他算子动作特征，得到待预测玩家的协同行为特征；将操作行为特征以及协同行为特征输入至玩家作战风格模型中，得到玩家作战风格模型输出的待预测玩家的预估作战风格。本发明以较低门槛得到待预测玩家的预估作战风格，玩家据此可以设计该地图下更加具有针对性的游戏战术，进而在战争策略游戏中占据先机。

著录项

公开/公告号CN113868527A

专利类型发明专利
公开/公告日2021-12-31

原文格式PDF
申请/专利权人中国科学院自动化研究所;
展开▼

申请/专利号CN202111145620.0
发明设计人刘禹;牟佳;胡睿;
展开▼

申请日2021-09-28
分类号G06F16/9535(20190101);G06K9/62(20060101);
代理机构11002 北京路浩知识产权代理有限公司;
代理人王宇杨
地址 100190 北京市海淀区中关村东路95号
入库时间 2023-06-19 13:29:16

说明书

技术领域

本发明涉及数据处理技术领域，尤其涉及一种可解释的策略游戏多玩家风格评估方法及装置。

背景技术

战争策略游戏具备“以人为中心”的特点，旨在提升玩家指挥决策与行动能力。玩家若想要对战争策略游戏进行熟练地掌握，一方面需要具备充分的指挥知识，另一方面需要从大量的对战中学习经验，这两点要求就对玩家学习与训练形成了较高的门槛，为了解决该问题，需要提出一种玩家风格评估方案，以帮助玩家进行学习与训练。

发明内容

本发明提供一种可解释的策略游戏多玩家风格评估方法及装置，用以解决现有技术中玩家学习与训练门槛较高的缺陷，实现以较低门槛得到待预测玩家的预估作战风格，玩家据此可以设计该地图下更加具有针对性的游戏战术，进而在战争策略游戏中占据先机。

本发明提供一种可解释的策略游戏多玩家风格评估方法，包括以下步骤：

获取待预测玩家的游戏数据，并提取所述待预测玩家的算子动作特征；其中，所述待预测玩家在游戏中可动作的可操纵对象为算子；

基于待预测玩家的每个算子在各阶算子动作特征频繁项的累计支持度，获取待预测玩家的操作行为特征；

按照时序关系，获取待预测玩家某一类算子动作特征后连续出现的至少一类其他算子动作特征，得到待预测玩家的协同行为特征；

将所述操作行为特征以及所述协同行为特征输入至玩家作战风格模型中，得到所述玩家作战风格模型输出的所述待预测玩家的预估作战风格；其中，所述玩家作战风格模型是基于目标风格、样本操作行为特征以及样本协同行为特征训练得到的。

根据权本发明提供的可解释的策略游戏多玩家风格评估方法，所述基于待预测玩家的每个算子在各阶算子动作特征频繁项的累计支持度，获取待预测玩家的操作行为特征，具体包括以下步骤：

对所述算子动作特征按照动作时序从前到后排列的方式进行编码，形成0阶时序动作数据；

基于预设支持度，利用关联规则挖掘算法挖掘N-1阶时序动作数据中的N阶算子动作特征频繁项以及对应的支持度；其中，N为正整数，N-1阶时序动作数据中包含有不小于所述预设支持度的N-1阶算子动作特征频繁项；

累计每个算子在0至N阶各阶算子动作特征频繁项分别对应的支持度，得到所述累计支持度，并基于所述累计支持度，得到待预测玩家的操作行为特征。

根据权本发明提供的可解释的策略游戏多玩家风格评估方法，所述对所述算子动作特征按照动作时序从前到后排列的方式进行编码，形成0阶时序动作数据，具体包括：

所述编码是基于who-type-how的形式的；其中，who代表了动作特征的执行算子类型，type代表了玩家动作特征类型，how代表每种动作特征的属性或者参数。

根据权本发明提供的可解释的策略游戏多玩家风格评估方法，所述基于预设支持度，利用关联规则挖掘算法挖掘N-1阶时序动作数据中的N阶算子动作特征频繁项以及对应的支持度，具体包括：

在关联规则挖掘算法挖掘过程中对小于等于N-2阶的各阶算子动作特征频繁项进行剪枝。

根据权本发明提供的可解释的策略游戏多玩家风格评估方法，所述按照时序关系，获取待预测玩家某一类算子动作特征后连续出现的至少一类其他算子动作特征，得到待预测玩家的协同行为特征，具体包括以下步骤：

基于预设时间，在0阶时序动作数据内按照时序关系，获取某一类算子动作特征后连续出现的至少一类其他算子动作特征，得到所述协同行为特征。

根据权本发明提供的可解释的策略游戏多玩家风格评估方法，所述玩家作战风格模型通过以下步骤训练得到：

获取所述样本操作行为特征以及所述样本协同行为特征，并进行降维处理；

以降维处理后的所述样本操作行为特征以及所述样本协同行为特征为单位，根据相关聚类算法，对降维处理后的所述样本操作行为特征以及所述样本协同行为特征进行聚类划分；

将聚类划分后的所述样本操作行为特征以及所述样本协同行为特征作为训练用数据，采用机器学习的方式，得到用于生成所述待预测玩家的所述预估作战风格的所述玩家作战风格模型；其中，所述玩家作战风格模型的损失函数是基于所述样本操作行为特征与所述目标风格之间的向量相似度，以及所述样本协同行为特征与所述目标风格之间的向量相似度确定的。

本发明还提供一种可解释的策略游戏多玩家风格评估装置，包括：

特征提取模块，用于获取待预测玩家的游戏数据，并提取所述待预测玩家的算子动作特征；其中，所述待预测玩家在游戏中可动作的可操纵对象为算子；

第一获取模块，用于基于待预测玩家的每个算子在各阶算子动作特征频繁项的累计支持度，获取待预测玩家的操作行为特征；

第二获取模块，用于按照时序关系，获取待预测玩家某一类算子动作特征后连续出现的至少一类其他算子动作特征，得到待预测玩家的协同行为特征；

风格评估模块，用于将所述操作行为特征以及所述协同行为特征输入至玩家作战风格模型中，得到所述玩家作战风格模型输出的所述待预测玩家的预估作战风格；其中，所述玩家作战风格模型是基于目标风格、样本操作行为特征以及样本协同行为特征训练得到的。

本发明还提供一种电子设备，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，所述处理器执行所述程序时实现如上述任一种所述可解释的策略游戏多玩家风格评估方法的步骤。

本发明还提供一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现如上述任一种所述可解释的策略游戏多玩家风格评估方法的步骤。

本发明还提供一种计算机程序产品，包括计算机程序，所述计算机程序被处理器执行时实现如上述任一种所述可解释的策略游戏多玩家风格评估方法的步骤。

本发明提供的可解释的策略游戏多玩家风格评估方法及装置，提出了面向策略游戏的频繁项数据挖掘方案，通过选取作为对手的玩家训练后生成的游戏数据例如对局复盘信息，将作为对手的玩家作为待预测玩家，再通过挖掘待预测玩家的单算子操作的操作行为特征和多算子协同操作的协同动作特征，使得玩家获得作为对手的玩家对于某地图想定的主要战术与操作风格，再基于训练好的玩家作战风格模型，以较低门槛得到待预测玩家的预估作战风格，玩家据此可以设计该地图下更加具有针对性的游戏战术，进而在战争策略游戏中占据先机。此过程中，一方面为了挖掘地图想定的重要战术点并且分析玩家的微操习惯与常用战术搭配，开展了单算子操作的操作行为特征挖掘工作；另一方面为了更好的支持不具备专业知识的玩家快速完成核心策略学习，开展了多算子协同操作的协同动作特征挖掘工作，在战争策略游戏上开展了特征挖掘，挖掘的特征可以辅助不懂得战术知识的玩家快速完成进化能力训练；此外，为了对玩家的能力进行归因分析，以操作行为特征以及协同行为特征作为输入数据，基于玩家作战风格模型进行智能定型评估，对多个玩家作战风格进行判别，同时，评估的结果具有较高可解释性。

附图说明

为了更清楚地说明本发明或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍，显而易见地，下面描述中的附图是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1是本发明提供的可解释的策略游戏多玩家风格评估方法的流程示意图；

图2是本发明提供的可解释的策略游戏多玩家风格评估方法中步骤S200具体的流程示意图；

图3是本发明提供的可解释的策略游戏多玩家风格评估方法中玩家作战风格模型训练过程的流程示意图；

图4是本发明提供的可解释的策略游戏多玩家风格评估装置的结构示意图；

图5是本发明提供的可解释的策略游戏多玩家风格评估装置中第一获取模块具体的结构示意图；

图6是本发明提供的电子设备的结构示意图。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚，下面将结合本发明中的附图，对本发明中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

兵棋推演作为典型的战争策略游戏，特别是战术级陆战兵棋推演，其环境具有较高的复杂度，本发明以战术级陆战兵棋推演进行举例说明。同样的，玩家若想要对战术级陆战兵棋推演进行熟练地掌握，需要具备充分的指挥知识，还需要从大量的对战中学习经验。由战术级陆战兵棋推演规则可知，红蓝两个敌对阵营的玩家(例如作为红方阵营操纵兵棋的A玩家，以及作为蓝方阵营操纵兵棋的B玩家)会围绕地图想定的重要战术点来部署战术，具备指挥素养的玩家会认真地研究地图想定内容，分析出地图的重要战术点，再针对己方的兵力情况做出最有利的战术安排。然而对于不具备专业知识的玩家，难以通过游戏战场态势对当前局面进行分析，因此如何建立并模拟对手的战术及操作风格，对于大多数玩家进行学习和训练具有非常重要的意义。通常有经验的游戏玩家会利用个人主观判断来对对手风格进行分析，比如善于穿插、擅长防守等，也有人利用图灵测试模式利用其他玩家对某个特定玩家的特定能力进行量表评价，但受到其他玩家的配合因素影响，评价结果可靠性稍显不足。

假设一个具备较高战术水平的玩家在部署行动时会充分利用地形地貌和作战战术来获得优势，可以理解的是，该假设显然是符合基本常识的，由此可以得出结论，该玩家在游戏中的复盘数据信息将有助于对该位玩家的战术风格以及操作风格进行建模。

下面结合图1描述本发明的可解释的策略游戏多玩家风格评估方法，该方法包括以下步骤：

S100、获取待预测玩家的游戏数据，并提取待预测玩家的算子动作特征，待预测玩家在游戏中可动作的可操纵对象为算子，对于战争策略游戏而言，算子可以为作战单位例如各种作战兵种、作战建筑物等。

该方法中，待预测玩家可以为作为对手的玩家，那么之后的玩家风格评估就是对作为对手的玩家的在战争策略游戏中的作战风格进行评估。需要是说明的是，作为对手的玩家可以是一位玩家，也可以是多位玩家。

由于战术级陆军兵棋推演的对局复盘数据以帧为单位存储了每帧内所有算子信息以及该帧内双方玩家所做动作，因此步骤S100中获取的待预测玩家的游戏数据可以为标记了对阵双方玩家信息且包含待预测玩家的对局复盘数据，对局复盘数据可以是待预测玩家与其他玩家进行对战的对局数据，也可以是待预测玩家与游戏人工智能(ArtificialIntelligence，AI)进行对战的对局数据。

S200、基于待预测玩家的每个算子在各阶算子动作特征频繁项的累计支持度，获取待预测玩家的操作行为特征。

S300、按照时序关系，获取待预测玩家某一类算子动作特征后连续出现的至少一类其他算子动作特征，得到待预测玩家的协同行为特征。

S400、将操作行为特征以及协同行为特征输入至玩家作战风格模型中，得到玩家作战风格模型输出的待预测玩家的预估作战风格。该方法中，玩家作战风格模型是基于目标风格、样本操作行为特征以及样本协同行为特征训练得到的。

在本发明的可解释的策略游戏多玩家风格评估方法中，提出了面向策略游戏的频繁项数据挖掘方案，通过选取作为对手的玩家训练后生成的游戏数据例如对局复盘信息，将作为对手的玩家作为待预测玩家，再通过挖掘待预测玩家的单算子操作的操作行为特征和多算子协同操作的协同动作特征，使得玩家获得作为对手的玩家对于某地图想定的主要战术与操作风格，再基于训练好的玩家作战风格模型，以较低门槛得到待预测玩家的预估作战风格，玩家据此可以设计该地图下更加具有针对性的游戏战术，进而在战争策略游戏中占据先机。此过程中，一方面为了挖掘地图想定的重要战术点并且分析玩家的微操习惯与常用战术搭配，开展了单算子操作的操作行为特征挖掘工作；另一方面为了更好的支持不具备专业知识的玩家快速完成核心策略学习，开展了多算子协同操作的协同动作特征挖掘工作，在战争策略游戏上开展了特征挖掘，挖掘的特征可以辅助不懂得战术知识的玩家快速完成进化能力训练；此外，为了对玩家的能力进行归因分析，以操作行为特征以及协同行为特征作为输入数据，基于玩家作战风格模型进行智能定型评估，对多个玩家作战风格进行判别，同时，评估的结果具有较高可解释性。

下面结合图2描述本发明的可解释的策略游戏多玩家风格评估方法，步骤S100具体包括以下步骤：

S110、对算子动作特征按照动作时序从前到后排列的方式进行编码，形成0阶时序动作数据。具体的，提取后的算子动作特征采用了WTH(who-type-how)的形式来进行编码，编码的值与玩家训练环境保持了一致，其中W(who)代表了动作特征的执行算子类型，如表1所示包括了总计8种类型，T(type)代表了玩家动作特征类型，如表2所示，包括了13类不同的动作特征，H(how)代表每种动作特征具备的不同的属性或参数。

表1战术级陆军兵棋推演算子类型编码表

表2战术级陆军兵棋推演动作特征类型与属性表

WTH编码包含了每个动作特征的重要信息，如0-2-1-12-4938，转义后为坦克-射击-战车-展开武器-4938，其代表的意思为：己方坦克在坐标4938处对敌方战车展开武器。基于WTH编码，对所有对战复盘数据进行了算子动作特征提取以及编码，WTH编码包含了该对局中双方阵营玩家做出的所有有效动作，并按照动作时序从前到后排列进行编码存储。

由于战术级兵棋推演的决策空间巨大，理论上的0阶动作数量巨大，然而并不是所有动作都具有实际意义，一方面是因为动作合法性限制，例如战车不能跨越具有极大高程差的地形；另一方面是因为战术任务限制，例如在距离夺控点极远的地方进行地图探索。以上两类情况在玩家的有限的实际操作中极小概率甚至不可能出现。该方法可以基于战术级陆军兵棋推演的高质量对局，因此可以认为对战复盘数据中存在的动作皆有效且合理，通过提取出对应对战复盘数据中的所有一阶动作，并进行去重便得到精简版的0阶元动作，该方法中的单动作都基于该0阶元动作。

在战术级陆军兵棋推演当中，玩家间的交互具有显著的时序特性，故此，在处理对战复盘数据时保留了玩家决策动作的先后顺序，其中单动作的表述采用了WTH编码。对所有复盘数据采用了同样的处理方式，考虑到玩家处于不同阵营时，动作属性尤其是坐标差异较大，本挖掘任务对玩家区分了红蓝两个敌对阵营，因此从一局比赛中提取出了红蓝两个敌对阵营分别对应的0阶时序动作数据以及0阶时序动作数据表。

S220、基于预设支持度，利用关联规则挖掘算法挖掘N-1阶时序动作数据中的N阶算子动作特征频繁项以及对应的支持度。N为正整数，N-1阶时序动作数据中包含有不小于预设支持度的N-1阶算子动作特征频繁项。

在本实施例中，定义玩家一局比赛的数据为一个事务，每个可能的动作为项。如上所述，战术级陆战兵棋推演是一种典型的动态博弈对抗环境，玩家与环境的交互是一个时序的过程，因此在频繁项的挖掘过程中需要考虑时序性，综合考虑本发明的可解释的策略游戏多玩家风格评估方法选取了时序频繁项挖掘算法AprioriAll，其挖掘的高阶频繁项考虑了时序性。

时序频繁项挖掘算法AprioriAll首先通过组合N-1阶算子动作特征频繁项形成所有可行的N阶算子动作特征频繁项候选，通过设定对应的支持度的阈值可以筛选出意义较低的算子动作特征频繁项候选。因此，如何快速高效地从N-1阶算子动作特征频繁项中形成N阶算子动作特征频繁项候选是性能提升的主要途径之一。从频繁项的定义中推导出，N阶频繁项的任意子项都为频繁项，因此可以通过N-1阶频繁项两两组合来得到初步的频繁项候选，组合方式为找出前N-2算子动作特征频繁项相同的两个N-1阶算子动作特征频繁项，并分别拼接其后的两元素(项)，便组成了两个N阶第一候选算子动作特征频繁项，如表3中所示，3阶算子动作特征频繁项生成了4个4阶第一候选算子动作特征频繁项，随后在N-1阶算子动作特征频繁项中查找是否存在N阶第一候选算子动作特征频繁项的后N-1元素(项)所对应的N-1阶算子动作特征频繁项，如存在，则为N-1阶第二候选算子动作特征频繁项，如表3所示，最终生成了1个4阶第二候选算子动作特征频繁项。

表3频繁项候选生成算法

针对挖掘出的N阶第二候选算子动作特征频繁项，通过设定的预设支持度即支持度阈值，遍历N-1阶时序动作数据，便得到了N阶算子动作特征频繁项，该频繁项生成算法利用了时序频繁项的定义，避免了大规模排列组合导致的极大遍历开销。

在关联规则挖掘算法挖掘过程中对小于等于N-2阶的各阶算子动作特征频繁项进行剪枝，即删除不包含N阶算子动作特征频繁项的动作特征集合。如何递归地生成高阶频繁项，由表3可以看出生成N阶算子动作特征频繁项只需要N-1阶算子动作特征频繁项既可，因此可以将小于等于N-2的各阶算子动作特征频繁项进行保存，并对内存数据进行剪枝，这样可以减少内存消耗，一种实现方式是在每次生成N阶算子动作特征频繁项后，将其替换原有的N-1阶算子动作特征频繁项即替换N-1阶时序动作数据，再循环执行步骤220。

经过步骤S220的循环式处理，该方法得到了针对待预测玩家的最大阶数(N阶)算子动作特征频繁项，与时序频繁项挖掘算法AprioriAll不同的是本发明的可解释的策略游戏多玩家风格评估方法保存了该待预测玩家所有阶的动作特征支持度，同时因为WTH具有标准的形式，可以实现对玩家特性多维度特性的聚类分析，如想知道玩家操作战车的频率，可以从1阶算子动作特征频繁项中累加战车频繁项的支持度，相较于直接统计玩家的动作频率，该方法等价于只关注了玩家的惯用动作，因而排除了小概率动作带来的偏差，除此之外，通过查询坦克、步兵的高阶时序动作也可以挖掘出如步坦协同等特殊战术动作。

S230、累计每个算子在0至N阶各阶算子动作特征频繁项分别对应的支持度，得到累计支持度，并基于累计支持度，得到待预测玩家的操作行为特征。

通过时序频繁项挖掘算法AprioriAll得到的结果是数据驱动的，并不包含任何规则或者游戏先验知识。本发明的可解释的策略游戏多玩家风格评估方法在战术级陆军兵棋推演上开展了实验，所用数据总计1332局对战，一共32个玩家，其中玩家分为两组，即一组16位玩家个进行对战，对上述所有WTH编码动作利用时序频繁项挖掘算法AprioriAll进行了挖掘，考虑到部分动作稀少但重要性极高，实验设置的频繁项的预设支持度为0.1，同时考虑到玩家获胜的主要途径来自于夺控与攻击，因此分析主要从这两方面出发。

每个玩家对于地图想定的认知不是完全一致的，其中包括了地图重要战术点的选取、行动方式和战术组织等，因此每个玩家所挖掘出的单算子频繁项特征具有一定的差异，同时因为兵棋推演的规则限定，各玩家想要获胜也必然在一些认知上达成共识。利用单算子频繁项挖掘挖掘玩家行为特性，其对特定玩家复盘数据进行挖掘，提取出玩家常用行为模式，进而得出玩家战术特点。

要挖掘每个玩家的行动习惯与特性，需要分析各自的单算子的频繁项。本发明的可解释的策略游戏多玩家风格评估方法提取了10位玩家的攻击与夺控频繁项特征进行分析，如表4所示，分别计算了10个玩家在红蓝阵营的一阶算子动作特征频繁项所对应的累计支持度，支持度越高说明该类动作越常被使用，按照发起算子与动作种类的不同分为：坦克攻击支持度、战车攻击支持度、士兵攻击支持度、无人战车攻击支持度、巡飞弹支持度、主要夺控点夺控支持度、次要夺控点夺控支持度，表5中同时展示了玩家在不同阵营的频繁项阶数与对局胜率情况，WTH编码“：”后的内容表示该WTH编码的支持度。

表4红蓝阵营算子动作特征频繁项分析表

通过对玩家惯用动作进行分析可以得出玩家的战术风格，这里以A、B玩家为例进行说明：

A玩家在红方进行对抗时，坦克分队、步兵分队的攻击支持度较高，并多次利用巡飞弹进行打击，同时偏向于夺取主要夺控点，可以看出其充分发挥了坦克分队的机动突击能力和步兵分队的隐蔽打击和夺占能力，利用步坦协同完成打击和夺占行动，也充分发扬了坦克和步战车。因此可以推断，A玩家分析该想定对于红方而言适合通过快速冲击并夺取主要夺控点来取得胜利，从而采取尖刀突进型风格的决策方式；而在蓝方时，却转向采用步兵分队配合步战车作为主要火力源，并偏向于夺取次要夺控点，可以推断A玩家分析认定该想定的地形不利于蓝方夺取主要夺控点，从而采取夺次保分的支援守卫型风格来获取胜利。

B玩家在红方时，倾向于采用便于隐蔽的轻型分队，步兵、无人车和巡飞弹相互协同，来对敌方进行远程袭扰，以实现作战目的，而全程没有去夺取主要夺控点，因此可以推断，B玩家分析红方玩家夺取该想定的夺控点风险较大，而通过袭扰的方式，避开正面战场的交锋，采用特种作战对敌方造成重创能够获得较大收益，这种风格属于特种协同型风格；在蓝方时，B玩家均衡地使用三大主战兵种，并充分发扬了它们的火力，同时将作战企图平均分配在夺取主、次要夺控点的任务上，因此可以推断，B玩家分析蓝方玩家夺取该想定的夺控点较为容易，从而采用了稳健突击型风格决策。

算子动作特征频繁项的阶数对应某类动作持续时间，可以用来代表玩家战术的灵活性，阶数越高表示玩家单一动作持续时间长，战术灵活度低。例如，C玩家的频繁项在红方有8阶，在蓝方有14阶，可以认为C玩家在面对不同的对手时，战术相对固定。通过查看高阶频繁项可以对玩家战术风格有更为细致的认知，这里列举两个玩家(简称1队与2队)在蓝方时的单算子频繁项进行说明，1队常在4731点附近利用大号直瞄炮攻击敌方算子，并在4435附近采用便携导弹、小号直瞄炮等武器攻击，通过查看想定发现4731点为地图的高程点，说明1队习惯用远程攻击掩护己方算子占领主要夺控点。而2队常在4626点附近利用大号直瞄炮攻击敌方算子，同样在4435附近采用便携导弹、小号直瞄炮等武器攻击，可以看出2队的战术是在占领主要夺控点的同时，对敌方占领次要夺控点的算子进行打击与干扰。

因此，步骤S300具体包括以下步骤：

基于预设时间，在0阶时序动作数据内按照时序关系，获取某一类算子动作特征后连续出现的至少一类其他算子动作特征，得到协同行为特征。

步骤S300中，战术级陆军兵棋推演的玩家常会安排多算子协同来完成特定任务，多算子协同动作特征往往包括了玩家观察(Obser ve)、调整(Orient)、决定(Decide)和行动(Act)步骤，即重要的军事理论OODA循环过程。具体的，在本实施例中将通过挖掘多算子协同动作特征即协同行为特征来获取玩家的战术风格，提出了四类协同动作特征：情报支援、火力支援、防御支持、备份与接替，以下将分别介绍这四类协同动作，并对多算子协同动作特征挖掘的结果进行分析。

首先对本实施例中的多算子协同动作特征定义进行说明：

情报支援：己方算子之间共享敌情情况，某算子在获得了新的敌情变化，使得其他若干算子分队改变动作类型，可以认为出现了情报支援协同；

火力支援：己方算子通过观察得到敌方某算子具体位置，发现该敌方算子正在靠近己方算子，先于己方其他算子开火制止该敌方算子突袭己方算子，可以认为出现了火力支援协同；

防御支持：己方算子通过在某个地域进行防御，能够对己方算子构成加强防御或者阻挡来袭的效果，可以认为出现了防御支持协同；

备份与接替：己方算子在执行某个任务时，突然战损或者突然改变行动转移，此时己方其他算子迅速接替该算子行动或位置，可以认为出现了备份与接替协同。

与单算子动作特征频繁项挖掘类似，多算子协同动作特征即协同行为特征的挖掘同样采用了WTH编码来对玩家动作进行处理，并且在多算子协同动作特征的挖掘过程中可以结合与专家协商的具体抽取规则，在时序的帧数据上进行搜索。为了分析多算子协同动作特征挖掘的效果，同样在1332局对战上开展了实验，对10个玩家复盘数据的挖掘结果进行了分析，如表6所示，表中记录了每个玩家所完成的协同动作的数量。以下结合表5的分析结论，对表6中的A、B玩家进行分析。

A玩家在红方时，火力支援的协同动作特征较其他协同动作特征更为明显，可以判断A玩家在此想定红方阵营的决策中，较为突出火力协同，正好与表5的结论相互对应；而在A玩家在蓝方时，防御支援的协同动作特征较其他特征更为明显，可以判断A玩家在此想定蓝方阵营的决策中，较为突出夺点守卫的作战企图，也正好与表5的结论相互对应。

B玩家在红方时，情报支援、火力支援和防御支援三种协同动作特征值相当，可以判断B玩家在此想定红方阵营的决策中，充分发扬了算子的优劣互补，而由表5的数据得知，B玩家在决策时有部分分队战技术性能未发挥或未完全发挥，导致其所有协同动作特征值都处于一个比较低的水平，但横向对比自身各协同动作特征值是比较均衡的，这与表5的结论也正好能够对应，B玩家运用特种和轻型分队进行了有效的袭扰；而B玩家在蓝方时，火力支援和情报支援这两个协同动作特征相同并且较另外两个值较高，可以判断B玩家在较好的情报支撑协同下，充分发扬火力优势，并能够合理分配主战兵种算子的火力，最大限度的保证火力输出和协同，这正好与表5的结论也相互对应起来。

通过表5与表6分别对单算子动作特征与多算子协同动作特征进行分析，两表内容互为补充，一起对各个玩家的决策风格和策略选择习惯进行分析。需要说明的是，协同动作特征之间并不是互斥的，同一时刻可能发生多种协同动作特征，此时会并列的记录下来，以下为挖掘的几条连续协同动作特征信息：

1176:情报支援：己方算子400<无人战车>发现敌方算子10000<坦克>，该敌方算子视野内的己方算子0<坦克>在1191帧采取了行动(0-射击-10000-中号直瞄炮-4436)；火力支援：敌方算子10000<坦克>正在靠近己方算子400<无人战车>，己方算子0<坦克>在1191帧采取行动(0-射击-10000-中号直瞄炮-4436)；

1201:备份与接替：己方算子0<坦克>在4436点执行任务，突然转移后己方算子400<无人战车>在1282帧接替了其位置

1202:火力支援：敌方算子10000<坦克>正在靠近己方算子0<坦克>，己方算子400<无人战车>在1221帧采取行动(400-射击-10000-中型导弹-4837)

1220:防御支持：己方算子200<士兵>正处于防御状态，敌方算子10000<坦克>试图突破防御，附近同处于防御状态的算子400<无人战车>在1221帧采取了行动(400-射击-10000-中型导弹-4837)

通过汇总上述信息在结合地图想定，可以得出在该局比赛的1176帧处，己方无人战车算子(400)发现了敌方坦克算子(10000)正在靠近己方坦克算子(0)、士兵算子(200)、无人战车算子(400)防守的主要夺控点，在1191帧己方坦克算子(0)在4436坐标利用中号直瞄炮攻击了该敌方坦克算子(10000)，在1201帧，己方坦克算子(0)离开了4436坐标，1202帧己方无人战车算子(400)在4837坐标利用中型导弹攻击了敌方坦克算子(10000)，并在1282帧到达4436完成防守位置接替。以上一系列动作包含了本专利挖掘的四类协同动作特征，涉及了士兵、坦克、无人战车三类算子，可以看出玩家具有较高的协同决策能力。

表5玩家算子动作特征频繁项分析表

表6玩家协同行为特征(多算子协同动作特征)分析表

对于具备指挥知识的玩家可以通过观看对战复盘来获取到以上信息，而对于不具备指挥知识的玩家单纯查看的与钻杆复盘往往费时且得不到有用的信息，通过本发明的可解释的策略游戏多玩家风格评估方法所提供的多算子协同动作特征挖掘能够对一局比赛的信息进行快速扫描，捕获到玩家决策的重要时刻，并赋予具备游戏指挥知识的标签，以供玩家完成训练与学习。

对于具备较高战术水平的玩家在部署行动时会充分利用地形地貌和作战战术来获得优势，本发明的可解释的策略游戏多玩家风格评估方法，还能够得知某一坐标点是否具有部署行动时的战术意义。

从单算子动作特征频繁项挖掘与多算子协同动作特征挖掘两个维度对玩家行为进行了汇总，得到了待预测玩家的操作行为特征以及协同行为特征，上述挖掘的特征能够有效表述玩家在博弈对抗环境中的表现。在本发明的可解释的策略游戏多玩家风格评估方法，可以为操作行为特征打上对应的偏好标签，为协同行为特征偏好标签也打上对应的偏好标签，汇总待预测玩家的操作行为特征偏好标签与协同行为特征偏好标签，便于在步骤S400中以模型拟合的方式开展智能定性评估研究。

下面结合图3描述本发明的可解释的策略游戏多玩家风格评估方法，玩家作战风格模型通过以下步骤训练得到：

A100、获取样本操作行为特征以及样本协同行为特征，并进行降维处理。

策略游戏中不同玩家具有不同的作战风格，在协作时，恰当的风格搭配能够使协作效果得到极大的提升，让各个玩家都达到扬长避短。作战风格不同于作战能力，没有特定的指标来标识，因而该方法中以玩家行为特征为基础，采用无监督学习方法中的聚类分析对模型进行训练以及玩家作战风格进行划分。

A200、以降维处理后的样本操作行为特征以及样本协同行为特征为单位，根据相关聚类算法，对降维处理后的样本操作行为特征以及样本协同行为特征进行聚类划分。

聚类的依据为单算子动作特征频繁项挖掘与多算子协同动作特征挖掘所提取的各种类的行为特征，对所有特征采用了二范数归一化处理。为了将上述数据可视化，该方法采用了PCA算法将高维数据降到三维。考虑到数据分布的多样性，该方法选用了对数据分布适应性较强的谱聚类方法，其中聚类中心数量设定为3，最终针对红蓝方分别聚类出多类的玩家作战风格。

A300、将聚类划分后的样本操作行为特征以及样本协同行为特征作为训练用数据，采用机器学习的方式，得到用于生成待预测玩家的预估作战风格的玩家作战风格模型。玩家作战风格模型的损失函数是基于样本操作行为特征与目标风格之间的向量相似度，以及样本协同行为特征与目标风格之间的向量相似度确定的。

例如，对于红方{A,C,F,I}玩家，从动作支持度来看，坦克分队、步兵分队占比较高，偏向于抢占主、次要夺控点，结合协同动作来看，火力支援与防御支持占比较大，可以判断出该类玩家擅长利用步坦协同冲击并进行夺控，可以认定为善攻、激进型风格。

对于红方{B,D,E}玩家，从动作支持度来看，步兵分队、无人战车、巡飞弹占比均衡，该类兵种轻便、灵活，能够有效对敌方进行袭扰，并且夺控行为较少，协同动作占比基本均衡，没有明显偏向，可以判断出该类玩家灵活地安排轻型兵种，避开夺控风险，以袭扰形式进行战斗，可以认定为稳健、灵活型风格。

该玩家作战风格模型是采用无监督聚类的方式进行训练的，因此使用该玩家作战风格模型采用无监督聚类分析方法对多玩家作战风格进行分类和划分，完成玩家的风格评估。

同时，玩家风格与胜率并无线性的关联，这是因为单场对局的胜负更多的是由玩家战术决策能力决定，特定风格的玩家在对局中展现出的战术排布、执行差异会造成胜率的极大差异，如玩家A在红方时胜率为0.933，而玩家I在红方时胜率为0.533。此外，不同风格的战术在比赛中的表现受到了地图想定特性的影响，在红方时，善攻、激进型更有利于获取胜利，而在蓝方时，支援、灵活型更加有利。

本发明提供的可解释的策略游戏多玩家风格评估方法，可以深入挖掘出玩家的特性，同时避免因胜率带来的评估偏差，聚类玩家的特性可以通过专家知识进行标注，对于未知玩家可以用玩家作战风格模型计算出所属类别，进而快速完成风格评估。

下面对本发明提供的可解释的策略游戏多玩家风格评估装置进行描述，下文描述的可解释的策略游戏多玩家风格评估装置与上文描述的可解释的策略游戏多玩家风格评估方法可相互对应参照。

下面结合图4描述本发明的可解释的策略游戏多玩家风格评估装置，该装置包括：

特征提取模块100，用于获取待预测玩家的游戏数据，并提取所述待预测玩家的算子动作特征；其中，所述待预测玩家在游戏中可动作的可操纵对象为算子.

第一获取模块200，用于基于待预测玩家的每个算子在各阶算子动作特征频繁项的累计支持度，获取待预测玩家的操作行为特征。

第二获取模块300，用于按照时序关系，获取待预测玩家某一类算子动作特征后连续出现的至少一类其他算子动作特征，得到待预测玩家的协同行为特征。

风格评估模块400，用于将所述操作行为特征以及所述协同行为特征输入至玩家作战风格模型中，得到所述玩家作战风格模型输出的所述待预测玩家的预估作战风格；其中，所述玩家作战风格模型是基于目标风格、样本操作行为特征以及样本协同行为特征训练得到的。

下面结合图5描述本发明的可解释的策略游戏多玩家风格评估装置，该装置中第一获取模块200具体包括：

编码单元210，用于对所述算子动作特征按照动作时序从前到后排列的方式进行编码，形成0阶时序动作数据。

获取单元，用于基于预设支持度，利用关联规则挖掘算法挖掘N-1阶时序动作数据中的N阶算子动作特征频繁项以及对应的支持度；其中，N为正整数，N-1阶时序动作数据中包含有不小于所述预设支持度的N-1阶算子动作特征频繁项。

累计单元230，用于累计每个算子在0至N阶各阶算子动作特征频繁项分别对应的支持度，得到所述累计支持度，并基于所述累计支持度，得到待预测玩家的操作行为特征。

图6示例了一种电子设备的实体结构示意图，如图6所示，该电子设备可以包括：处理器(processor)810、通信接口(Communications Interface)820、存储器(memory)830和通信总线840，其中，处理器810，通信接口820，存储器830通过通信总线840完成相互间的通信。处理器810可以调用存储器830中的逻辑指令，以执行可解释的策略游戏多玩家风格评估方法，该方法包括以下步骤：

S100、获取待预测玩家的游戏数据，并提取所述待预测玩家的算子动作特征；其中，所述待预测玩家在游戏中可动作的可操纵对象为算子；

S200、基于待预测玩家的每个算子在各阶算子动作特征频繁项的累计支持度，获取待预测玩家的操作行为特征；

S300、按照时序关系，获取待预测玩家某一类算子动作特征后连续出现的至少一类其他算子动作特征，得到待预测玩家的协同行为特征；

S400、将所述操作行为特征以及所述协同行为特征输入至玩家作战风格模型中，得到所述玩家作战风格模型输出的所述待预测玩家的预估作战风格；其中，所述玩家作战风格模型是基于目标风格、样本操作行为特征以及样本协同行为特征训练得到的。

此外，上述的存储器830中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

另一方面，本发明还提供一种计算机程序产品，所述计算机程序产品包括计算机程序，计算机程序可存储在非暂态计算机可读存储介质上，所述计算机程序被处理器执行时，计算机能够执行上述各方法所提供的可解释的策略游戏多玩家风格评估方法，该方法包括以下步骤：

S100、获取待预测玩家的游戏数据，并提取所述待预测玩家的算子动作特征；其中，所述待预测玩家在游戏中可动作的可操纵对象为算子；

S200、基于待预测玩家的每个算子在各阶算子动作特征频繁项的累计支持度，获取待预测玩家的操作行为特征；

S300、按照时序关系，获取待预测玩家某一类算子动作特征后连续出现的至少一类其他算子动作特征，得到待预测玩家的协同行为特征；

又一方面，本发明还提供一种非暂态计算机可读存储介质，其上存储有计算机程序，该计算机程序被处理器执行时实现以执行上述各方法提供的可解释的策略游戏多玩家风格评估方法，该方法包括以下步骤：

S100、获取待预测玩家的游戏数据，并提取所述待预测玩家的算子动作特征；其中，所述待预测玩家在游戏中可动作的可操纵对象为算子；

S200、基于待预测玩家的每个算子在各阶算子动作特征频繁项的累计支持度，获取待预测玩家的操作行为特征；

S300、按照时序关系，获取待预测玩家某一类算子动作特征后连续出现的至少一类其他算子动作特征，得到待预测玩家的协同行为特征；

以上所描述的装置实施例仅仅是示意性的，其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下，即可以理解并实施。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件。基于这样的理解，上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在计算机可读存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。

最后应说明的是：以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 一种可解释的策略游戏多玩家风格评估方法及装置 [P] . 中国专利： CN113868527A . 2021-12-31
2. 可解释性电网作业风险评估方法与装置 [P] . 中国专利： CN113111189A . 2021-07-13
3. A DISTRIBUTED MULTI-PLAYER STRATEGY GAME AND METHOD FOR COLLABORATIVE COMPETITION [P] . IL218070D0 . 2012-04-30

机译：分布式多玩家策略游戏及协作竞赛方法
4. A DISTRIBUTED MULTI-PLAYER STRATEGY GAME AND METHOD FOR COLLABORATIVE COMPETITION [P] . IL218070A . 2012-04-30

机译：分布式多玩家策略游戏及协作竞赛方法
5. military strategy game for three or more players [P] . ITFR20010022U1 . 2002-02-28

机译：三个或更多玩家的军事策略游戏