首页> 中国专利> 一种军民融合政策信息数据分析优化系统

一种军民融合政策信息数据分析优化系统

摘要

本发明公开了一种军民融合政策信息数据分析优化系统,该系统采用的数据统计及分析方法包括以下步骤:S1,数据建模和计算,根据分析任务,采用批量数据对模型进行训练或拟合,确定数据模型参数,搭建特定的计算引擎进行计算;S2,数据分析和服务,利用数据模型参数,采用预设的数据分析方法对政策制度信息进行数据的统计与分析,对于统计与分析输出的结果提供数据服务;S3,自洽性校验,通过对政策制度关键信息检索及语义比对,自动分析政策制度文件的冲突性,得出政策制度自洽性等级,所述方法和系统能够提供更高质量的统计分析数据结果。

著录项

  • 公开/公告号CN113254512A

    专利类型发明专利

  • 公开/公告日2021-08-13

    原文格式PDF

  • 申请/专利号CN202110452347.X

  • 发明设计人 刘庚冉;贺超;左磊;梅阳;丁一珊;

    申请日2021-04-26

  • 分类号G06F16/248(20190101);G06F16/25(20190101);G06F16/36(20190101);G06F40/289(20200101);G06F40/30(20200101);G06K9/62(20060101);

  • 代理机构11483 北京云科知识产权代理事务所(特殊普通合伙);

  • 代理人张飙

  • 地址 100070 北京市丰台区东大街53号院

  • 入库时间 2023-06-19 12:13:22

说明书

技术领域

本发明涉及一种信息技术领域,尤其是一种军民融合政策信息数据分析优化系统。

背景技术

军民融合工作政策制度管理体系不健全以及信息化管理辅助决策手段运用不足,是困扰政策制度建设的重要原因。

当前,虽然相关政策制度的文件总量已经十分庞大,但不系统、不全面以及存在“漏项”的问题仍然比较突出。在现有管理模式下,对政策制度研究、制定和使用者来说,在精准查询、高效使用和对比分析等方面都存在比较大的困难。

军民融合工作政策数据挖掘平台的基础,是细致而全面的政策制度数据信息。由于政策制度文件系统庞大、内容复杂、设计主体众多,通过人工方式搜集整理并进行精准查询、高效使用和对比分析等工作都存在比较大的困难,而在自动化数据统计与分析方面则存在自洽性和可操作性较差的技术问题。

发明内容

针对现有技术存在的问题,本发明的目的在于解决现有技术中基于人工方式搜集整理政策制度文件存在工作量大、效率低,而使用目前统计和分析方法存在自洽性和可操作性较差的技术问题,提供一种军民融合政策信息平台数据统计与分析方法及系统,提供高质量的数据统计和分析处理,实现政策制度文件类数据统计分析结果具有更好的自洽性和可操作性,提供高质量的统计分析数据结果。

根据本发明提供的一种军民融合政策信息数据分析优化系统,该系统采用的数据统计及分析方法包括以下步骤:

S1,数据建模和计算,根据分析任务,采用批量数据对模型进行训练或拟合,确定数据模型参数,搭建特定的计算引擎进行计算;

S2,数据分析和服务,利用数据模型参数,采用预设的数据分析方法对政策制度信息进行数据的统计与分析,对于统计与分析输出的结果提供数据服务;

S3,自洽性校验,通过对政策制度关键信息检索及语义比对,自动分析政策制度文件的冲突性,得出政策制度自洽性等级。

进一步,步骤S1中,数据建模流程分为模型选择、模型训练、模型评估、模型优化四个部分,根据不同的分析任务,选择不同的模型进行实验;通过自洽性校验的反馈结果调整模型类型以及模型参数,优化训练集与训练方法,反复迭代,不断优化模型。

进一步,步骤S1中,对于计算量大的批量数据进行模型更新,搭建基于 MapReduce的分布式数据计算引擎;对于需要更新与实时计算的数据,搭建基于内存存储的流式计算引擎。

进一步,步骤S2中,所述预设的数据分析方法包括以下算法之一或多种算法组合:

a.回归分析:用于找到输入变量和输出变量关系;

b.分类算法:构造一个分类函数,把具有某些特征的数据项映射到某个设定的类别上,分类模式采用离散预测值;

c.聚类算法:将数据项分组成多个类,使得不同类之间的数据差别大于第一阈值,类内的数据差别小于第二阈值。

d.关联模式:是数据项之间存在的关联规则,计算在同一时间中出现的不同样本之间的相关性;

e.时间序列:以时间为基础参数,对于时间序列型数据,根据其历史和当前的取值预测未来的值。

进一步,步骤S2中,数据的统计与分析包括关联关系分析、生命周期分析和响应层级分析,其中

所述关联关系分析为使用自然语言处理技术解析出政策制度、专家解读、事件活动之间引用情况,构建知识图谱描述政策制度、专家解读、事件活动之间的引用关系,使用时间发布序列进行展示;

所述生命周期分析为使用自然语言处理技术,从海量制度文件中解析出同类型政策制度的设立、生效、版本迭代、废止情况,构建知识图谱政策制度的生命周期关系,使用直观的方式展示展示该制度的状态和有效时间范围;

所述响应层级分析为使用自然语言处理技术解析出政策制度、专家解读、事件活动之间引用情况,直观分析一条政策主体在部门体系中上下游发文相应情况,用来分析某一政策的部门响应情况。

进一步,步骤S3中,所述政策制度关键信息为政策制度标签、标题和政策制度目标;所述自洽性为逻辑自洽;通过语义比对单元判断是否存在政策制度规定内容矛盾冲突或含义重复但解释不同的数据;所述语义比对单元根据语言相似度分析技术进行分析,通过分词技术、文章摘要算法以及时效性检验分析结果来分析政策制度的自洽性,所述自洽性包括文章内部自洽性、历史版本自洽性分析、相近政策制度的自洽性和与中央、上级机构发布的政策的自洽性。

进一步,步骤S3中,自洽性校验的流程为:

首先,根据录入内容进行政策法规关联标签检索,获得政策法规文本内容;

其次,将政策法规文本内容进行内容比对,判断是否存在内容矛盾冲突的数据并记录;

再次,进行重复和语义相近分析,获得含义重复但解释不同的数据;

最后,矛盾点统计,将内容矛盾冲突和含义重复但解释不同的数据进行统计计算获得评分,并根据自洽性预设阈值比对获得自洽性等级。

进一步,所述自洽性等级分为四级,将评分90以上设为优秀级,80-90 分设为良好级,60-80分设为一般级,低于60分设为较差级,对于自洽性属于较差级的数据反馈到步骤S1,再次对模型进行训练,确定数据模型参数。

进一步,所述方法还包括时效性分析,提取数据库中所有政策制度数据文件内容中实施时间信息,建立政策制度时间轴,从而辅助分析出长久未修订的政策和不符合新形势新任务要求的政策。

另一方面,本发明提供的一种军民融合政策信息数据分析优化系统,其特征在于,包括数据建模和计算模块、数据分析和服务模块、自洽性校验模块。

通过本平台的建设可以从多个维度对军民融合政策制度进行全方位的智能处理和功能输出。系统实现自动化政策数据采集,实现对政策制度数据的搜集整理工作;通过智能分析模型对各种军民融合政策制度进行梳理、加工、解构、重组、标签、优化,并存入数据库,为后续查询、分析做准备;通过大数据技术和人工智能技术的应用,提供政策制度精准匹配、体系分类、政策制度关联度分析、生命周期分析、自洽性、时效性、可操作性等多种功能模块,形成体系化、多维度、智能化政策法规管理系统。

为实现相关政策制度文件的数字化以及政策制度态势分析、数据聚合、数据管理、统计分析、矛盾研判、政策评估、综合查询等功能,本发明使用机器学习、智能分析等手段对政策制度数据库中的数据进行分析、处理。按照不同的分析目标,采用不同的分析方法和数据模型。在统计与分析模块中增加了自洽性校验功能,解决了现有技术中常出现的逻辑矛盾问题,能够提供高质量的统计分析数据结果。

附图说明

图1示出了根据本发明的军民融合政策信息数据分析优化系统的构建结构示意图;

图2示出了根据本发明的军民融合政策信息数据分析优化系统的工作流程图;

图3示出了根据本发明的军民融合政策信息数据分析优化系统的自洽性校验流程示意图;

图4示出了根据本发明的军民融合政策信息数据分析优化系统的自洽性校验等级计算流程示意图;

图5示出了根据本发明的军民融合政策信息数据分析优化系统的时效性校验流程示意图。

具体实施方式

下面将结合附图,对本发明的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

在本发明的描述中,需要说明的是,术语“中心”、“上”、“下”、“左”、“右”、“竖直”、“水平”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。此外,术语“第一”、“第二”、“第三”仅用于描述目的,而不能理解为指示或暗示相对重要性。

以下结合附图对本发明的具体实施方式进行详细说明。应当理解的是,此处所描述的具体实施方式仅用于说明和解释本发明,并不用于限制本发明。

根据附图1,军民融合工作政策数据挖掘平台的基础,是细致而全面的政策制度数据信息。为实现相关政策制度文件的数字化以及政策制度态势分析、数据聚合、数据管理、统计分析、矛盾研判、政策评估、综合查询等功能,平台需使用机器学习、智能分析等手段对政策制度数据库中的数据进行分析、处理。数据统计与分析需要按照不同的分析目标,采用不同的分析方法和数据模型。

如图2所示,根据本发明的军民融合政策信息数据分析优化系统,该系统采用的数据统计及分析方法包括以下步骤:

S1,数据建模和计算,根据分析任务,采用批量数据对模型进行训练或拟合,确定数据模型参数,搭建特定的计算引擎进行计算;

S2,数据分析和服务,利用数据模型参数,采用预设的数据分析方法对政策制度信息进行数据的统计与分析,对于统计与分析输出的结果提供数据服务;

S3,自洽性校验,通过对政策制度关键信息检索及语义比对,自动分析政策制度文件的冲突性,得出政策制度自洽性结论,对于自洽性低于预设阈值的统计分析结果进行反馈。

相应地,根据本发明的军民融合政策信息平台的数据统计与分析系统包括数据建模和计算模块、数据分析和服务模块、自洽性校验模块。

具体地,根据本发明的军民融合政策信息数据分析优化系统的技术手段如下:

数据建模和计算模块:

对军民融合工作政策制度的统计分析,是本项目的重点内容。数据模型与分析方法紧密结合,需要根据不同的数据分析内容建立不同的数据模型。数据建模的研究任务分为模型选择、模型训练、模型评估、模型优化四个部分。在研究过程中,根据不同的分析任务,选择不同的模型进行实验;采用大量数据对模型进行训练或拟合,确定模型参数;通过验证集对模型分析效果进行定量验证;通过理论分析结合实验的方式,调整模型类型以及模型超参,优化训练集与训练方法,反复迭代,不断优化模型。通过大量的研究及验证工作,找出适合军民融合工作政策制度分析内容的数据模型及其训练方式。

针对不同的数据统计与分析类型,搭建特定的计算引擎进行计算。对于计算量大的批量数据进行模型更新,搭建基于MapReduce的分布式数据计算引擎。对于实时性要求高的数据更新与实时计算,搭建基于内存存储的流式计算引擎。通过对计算引擎的不断优化,平衡分析系统实时性与成本之间的矛盾。

数据分析和服务模块:

数据分析和服务模块着眼于军民融合工作政策制度的分析内容,结合不同的数据模型,采用如回归、分类、聚类、关联、时间序列、主题模型等数据分析方法,传统算法配合机器学习算法,对政策制度信息进行数据的统计与分析,进而提供各种相关数据的数据检索服务、数据分析、政策评估等服务。数据服务模块需要基于军民融合政策制度研究团队的研究成果,进行数据服务功能及技术架构设计,研究不同数据服务的技术实现方案,并通过反复的验证和优化。

此部分采用的数据分析方法有:

a.回归分析:统计回归是建立在对客观事物大量实验和观察的基础之上,用来寻找隐藏在看上去不确定的现象中的统计规律和数理统计方法。它具有广泛的应用领域,一般用来找到输入变量和输出变量关系之间的最佳模型。

b.分类算法:分类就是构造一个分类函数,把具有某些特征的数据项映射到某个给定的类别上,分类模式采用离散预测值。

c.聚类算法:聚类就是将数据项分组成多个类或簇,类之间的数据差别应尽可能大,类内的数据差别应尽可能小。

d.关联模式:是数据项之间存在的关联规则,是在同一时间中出现的不同样本之间的相关性。

e.时间序列:以时间为关键参数,对于时间序列型数据,根据其历史和当前的取值预测其未来的值。

此外,本发明所采用的分析类型如下:

A.关联关系分析

使用自然语言处理技术解析出政策制度、专家解读、事件活动之间引用情况,构建知识图谱描述政策制度、专家解读、事件活动之间的引用关系,使用时间发布序列进行展示,综合生命周期关系,直观分析制度、解读、事件在某一个事件点是所依赖的政策制度否合理。后续将以此数据为基础对制度、解读、事件设立的合理性、及时性分析提供必要的输入。

B.生命周期分析

使用自然语言处理技术,从海量制度文件中解析出同类型政策制度的设立、生效、版本迭代(修订)、废止情况,构建知识图谱政策制度的生命周期关系,使用直观的方式展示展示该制度的状态和有效时间范围。用来分析该制度当前状态,后续将分析修订内容,逐条对政策制度内容进行解析并详细展示政策制度各条款的生命情况,最终根据历史数据形成当前有效的政策制度条款。

在解构模型的基础上,需要构建知识图谱网络,分析大量数据抽象出顶点 (主体)、边(关系),对关系种类进行拟合。

C.响应层级分析

使用自然语言处理技术解析出政策制度、专家解读、事件活动之间引用情况,并分析出海量文件的发文主体之间的关系,构建知识图谱描述发文主体与政策制度、专家解读、事件活动之间的关系,直观分析一条政策主体在部门体系中上下游发文相应情况,用来分析某一政策的部门响应情况。响应层级分析将为分析法律法规执行情况提供必要的输入。

自洽性校验模块:

军民融合政策制度建设的内在逻辑自洽是重要的性能标准。

首先,国家军民融合战略及基本法、基本制度和具体制度的逻辑自洽。

其次,国家军民融合战略及基本法、实施体系与保障体系的逻辑自洽。

本发明的方法和系统通过对政策制度标签、标题以及政策制度目标等关键信息检索及语义比对,自动分析相关部门发布政策制度文件的冲突性,同时辅助人工判读和复核,得出政策制度自洽性结论。(即是否存在政策制度规定内容矛盾冲突、含义重复但解释不同等)。根据语言相似度分析技术进行分析,配合分词技术、文章摘要算法以及时效性检验分析结果来分析政策制度的自洽性,主要包含文章内部自洽性、历史版本自洽性分析、类似政策制度的自洽性、与中央、上级机构发布的政策的自洽性分析等。

如图3所示,在政策制度自洽性检验模块中,根据录入的政策法规名称、设计领域、覆盖范围和目标等,在政策法规数据库中进行自洽性检验,检验流程为:

1.根据录入内容进行政策法规关联标签检索,获得政策法规文本内容;

2.将政策法规文本内容进行内容比对,判断是否存在内容矛盾冲突的数据并记录;

3.进行重复和语义相近分析,获得含义重复但解释不同的数据;

4.矛盾点统计,将内容矛盾冲突和含义重复但解释不同的数据进行统计计算获得评分,并根据自洽性预设阈值比对获得自洽性等级。

同时,采用人工接入抽检复核自洽性的判断准确率。

如图4所示,自洽性等级分为四级,将评分90以上设为优秀级,80-90 分设为良好级,60-80分设为一般级,低于60分设为较差级,通过政策制度输入、政策制度自洽性检验获得检验结论输出,检验包括政策制度对象比对、目标比对、手段比对和内容比对,对于自洽性属于较差级的数据反馈到步骤S1,再次对模型进行训练,确定数据模型参数。

通过标签检索,对同一范围内的发文主体发布的政策制度、同一领域的政策制度、同一地区的政策制度进行总体自洽性检验,分析既定范围内相关政策制度是否存在政策之间的冲突、重复或同一内容各有所表等自洽性主要指标,形成四个等级的自洽性分析结论。

此外,本系统还包括可操作性分析。

军民融合政策制度的可操作性是指军民融合政策制度的具体措施在实践中易于推行,是军民融合政策制度的有效执行在技术层面的体现。但是,进一步的分析表明,仅仅是军民融合政策制度措施的简单易行,并不能确保军民融合政策制度的可操作性;因为任何军民融合政策制度的制订都是为了实现特定的经济和社会发展目标,所以军民融合政策制度可操作性的核心是要使得军民融合政策制度能够在成本较低的基础上顺利实现预期的目标。

1、对政策制度的操作项进行评分,得出该项在操作时政策制度规定的奖励及惩罚措施明确程度、政策制度监督执行者是否明确、政策制度约束团体是否明确、具体事项说明是否存在歧义等方面进行操作性评分。

2、对整篇政策制度的操作性进行评分,根据1的评分结果,对整篇政策制度的操作性进行整体评分,评估整篇文档的可操作性。

本系统还包括时效性分析:

时效性校验通过对整个数据库中所有政策制度数据文件内容中实施时间等结构化信息自动提取,并与新的形势任务要求进行对比分析,同时检索其发布时间和修订情况,形成政策制度体系时效性分析结论。

如图5所示,系统使用感知机分词模型、CRF算法模型、WMD语义相似分析算法,同时采用图数据库构建政策制度版本、从属等信息,实现法律时效性检验。最终以统计图表的形式展示政策制度总体时效性结论。用户可从政策制度时间轴分析出哪些政策长久未修订,哪些政策不符合新形势新任务要求,需要做进一步调整。

在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程 ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双倍数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路 (Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号