首页> 中国专利> 基于多输入LSTM-CNN的工作票安全措施识别方法及终端

基于多输入LSTM-CNN的工作票安全措施识别方法及终端

摘要

本发明提供了基于多输入LSTM‑CNN的工作票安全措施识别方法及终端,获取工作票训练数据集,工作票训练数据集中的每一工作票包括工作内容和安全措施;按照预设规则对工作内容和安全措施分别进行分词后得到工作内容词向量集合和安全措施词向量集合;根据工作内容词向量集合和安全措施词向量集合训练预设的LSTM‑CNN网络得到目标LSTM‑CNN网络;根据目标LSTM‑CNN网络对待验证工作票数据集进行自动验证;本发明得到目标LSTM‑CNN网络,后续需要对待验证工作票数据集进行验证时,直接通过目标LSTM‑CNN网络就能实现对待验证工作票数据集的自动验证筛选,将不符合现行规范的工作票剔除,保证操作安全。

著录项

说明书

技术领域

本发明涉及电力系统管理领域,尤其涉及基于多输入LSTM-CNN的工作票安全措施识别方法及终端。

背景技术

电力工作票中安全措施填写是一个要求比较专业、复杂、规范的工作。目前,因为地域差别、人员专业水平差别、书写习惯差别、错误或歧义等原因,导致填写的安全措施内容不规范、甚至不合格,这给填写、审核等工作带来大量重复性工作,也影响现场操作施工的规范。因此,自动过滤数据库中非法的安规条例,构建优质数据集是十分必要的;

最开始是采用手工筛选工作票的方式,但该方式有许多重复性的冗杂工作,速度慢、耗时长;同时电力工作票的工作量大,随着工作量的增加,人工效率降低,容易发生错漏的情况,开票规则错误容易威胁到设备和人身安全。为了减轻工作人员在筛选工作票时的压力,减少筛选过程中的重复性工作,人们尝试使用基于正则化的安规条例过滤方式,对工作内容和安全措施的进行模糊匹配,使工作人员从复杂的手工劳动中解放。但是基于正则化的安规条例过滤方式需将填写安全措施的所有流程及知识梳理成一个个具有逻辑规则的知识库。该领域知识庞大,涉及知识方方面面,梳理过程将是个工作量巨大的工程。同时,该领域内在规则复杂,即使是经验丰富的专家,也很难将所有情况都采用固定规则描述完整,并且其通用性还有待提高,存在泛用性不强的问题。此外,即使将规则梳理完成,在实际应用中也需要随着现场设置、操作规程及操作任务的变更而不断地修改、完善、扩充,而正则化筛选系统的智能性差,自学习功能不强,因此该方式无法接收新的知识而自我完善,用户虽具有丰富的专家经验,但苦于不懂计算机编程而难以介入,导致软件缺乏生命力及后期修改维护困难等局限性。

发明内容

本发明所要解决的技术问题是:提供基于多输入LSTM-CNN的工作票安全措施识别方法及终端,实现对工作票的自动筛选。

为了解决上述技术问题,本发明采用的一种技术方案为:

基于多输入LSTM-CNN的工作票安全措施识别方法,包括步骤:

获取工作票训练数据集,所述工作票训练数据集中的每一工作票包括工作内容和安全措施;

按照预设规则对所述工作内容和所述安全措施分别进行分词后得到工作内容词向量集合和安全措施词向量集合;

根据所述工作内容词向量集合和所述安全措施词向量集合训练预设的LSTM-CNN网络得到目标LSTM-CNN网络;

根据所述目标LSTM-CNN网络对待验证工作票数据集进行自动验证。

为了解决上述技术问题,本发明采用的另一种技术方案为:

基于多输入LSTM-CNN的工作票安全措施识别终端,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:

获取工作票训练数据集,所述工作票训练数据集中的每一工作票包括工作内容和安全措施;

按照预设规则对所述工作内容和所述安全措施分别进行分词后得到工作内容词向量集合和安全措施词向量集合;

根据所述工作内容词向量集合和所述安全措施词向量集合训练预设的LSTM-CNN网络得到目标LSTM-CNN网络;

根据所述目标LSTM-CNN网络对待验证工作票数据集进行自动验证。

本发明的有益效果在于:获取工作票训练数据集,分离其中的工作内容和安全措施,并将其分词得到词向量,根据词向量训练预设的LSTM-CNN网络得到目标LSTM-CNN网络,后续需要对待验证工作票数据集进行验证时,直接通过目标LSTM-CNN网络就能实现对待验证工作票数据集的自动验证筛选,将不符合现行规范的工作票剔除,保证操作安全。

附图说明

图1为本发明实施例的基于多输入LSTM-CNN的工作票安全措施识别方法的步骤流程图;

图2为本发明实施例的基于多输入LSTM-CNN的工作票安全措施识别终端的结构示意图;

图3为本发明实施例的一种LSTM-CNN网络结构示意图;

标号说明:

1、基于多输入LSTM-CNN的工作票安全措施识别终端;2、处理器;3、存储器。

具体实施方式

为详细说明本发明的技术内容、所实现目的及效果,以下结合实施方式并配合附图予以说明。

请参照图1,基于多输入LSTM-CNN的工作票安全措施识别方法,包括步骤:

获取工作票训练数据集,所述工作票训练数据集中的每一工作票包括工作内容和安全措施;

按照预设规则对所述工作内容和所述安全措施分别进行分词后得到工作内容词向量集合和安全措施词向量集合;

根据所述工作内容词向量集合和所述安全措施词向量集合训练预设的LSTM-CNN网络得到目标LSTM-CNN网络;

根据所述目标LSTM-CNN网络对待验证工作票数据集进行自动验证。

从上述描述可知,本发明的有益效果在于:获取工作票训练数据集,分离其中的工作内容和安全措施,并将其分词得到词向量,根据词向量训练预设的LSTM-CNN网络得到目标LSTM-CNN网络,后续需要对待验证工作票数据集进行验证时,直接通过目标LSTM-CNN网络就能实现对待验证工作票数据集的自动验证筛选,将不符合现行规范的工作票剔除,保证操作安全。

进一步地,按照预设规则对所述工作内容和所述安全措施分别进行分词后得到工作内容词向量集合和安全措施词向量集合包括:

对所述工作内容中进行分词得到第一词集合,并抽取所述词集合中的动词组成动词集合;

对所述安全措施按字进行分词得到第二词集合;

获取所述动词集合中每一动词所对应的第一词向量组成工作内容词向量集合;

获取所述第二词集合中每一字的第二词向量组成安全措施词向量集合。

由上述描述可知,将工作内容和安全措施分别进行分词,获取工作内容中的动词得到动词集合,将安全措施按字进行分词,工作内容的主要信息是某一类的操作,通过提取该信息中的动词信息可以表示工作内容中对应的具体操作,而安全措施的信息依赖于工作内容的信息,所以需要使用工作内容中的信息来指导模型对安全措施信息的学习,提高对工作票是否有效的判断准确率。

进一步地,所述工作票训练数据集还包括有效标识;

所述根据所述工作内容词向量集合和所述安全措施词向量集合训练预设的LSTM-CNN网络得到目标LSTM-CNN网络包括:

将所述工作内容词向量集合输入第一LSTM-CNN模块,得到第一组合表示;

将所述安全措施词向量集合输入第二LSTM-CNN模块,得到第二组合表示;

将所述第一组合表示及所述第二组合表示拼接后输入全连接层,得到验证结果,根据所述验证结果和所述有效标识调整所述预设的LSTM-CNN网络的参数得到目标LSTM-CNN网络。

由上述描述可知,通过两个互相独立的LSTM-CNN模块对词向量集合进行处理,得到对应的组合表示,最后通过全连接层输出组合表示对应的分类结果即对工作票是否有效的验证结果,将该验证结果和工作票训练数据集中工作票对应的有效性进行对比,并根据对比结果调整参数,确保最终模型的验证准确率。

进一步地,所述将所述安全措施词向量集合输入第二LSTM-CNN模块,得到第二组合表示包括:

将所述安全措施词向量集合输入第二LSTM-CNN模块后,再通过多头自注意力模块,得到第二组合表示。

由上述描述可知,处理安全措施词向量时引入多头自注意力模块,能够使得词向量中融合与其距离较远的词向量的特征,不会被限于周围的词向量,进一步提升对模型的训练效果。

进一步地,将所述第一组合表示及所述第二组合表示拼接后输入全连接层,得到验证结果包括:

将所述第一组合表示及所述第二组合表示拼接后输入全连接层后通过归一化层得到验证结果。

由上述描述可知,通过归一化层能够将全连接层多个通道的输出结果整合得到一个预测结果,方便进行验证结果是否正确的判断。

进一步地,所述通过多头自注意力模块,得到第二组合表示具体为:

MultiHeadAttention(x

其中,x

由上述描述可知,限定了多头自注意力模块中的各个参数,提供了一种具体实现方式。

进一步地,所述归一化层为softmax层。

由上述描述可知,softmax在处理多通道的分类时效果较好,能够保证最终验证结果的准确性。

进一步地,所述通过归一化层得到验证结果具体为:

y

Linear(y

Y=softmax(Linear(y

其中,P(P1,P2,…,Pn)为第二组合表示;V(V1,V2,…,Vm)为第一组合表示;W和b为所述预设的LSTM-CNN网络的参数。

由上述描述可知,提供了归一化层的一种具体实现方式,并提供了可调整的网络参数,能够在训练过程中不断提高验证的准确性。

请参照图2,基于多输入LSTM-CNN的工作票安全措施识别终端,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:

获取工作票训练数据集,所述工作票训练数据集中的每一工作票包括工作内容和安全措施;

按照预设规则对所述工作内容和所述安全措施分别进行分词后得到工作内容词向量集合和安全措施词向量集合;

根据所述工作内容词向量集合和所述安全措施词向量集合训练预设的LSTM-CNN网络得到目标LSTM-CNN网络;

根据所述目标LSTM-CNN网络对待验证工作票数据集进行自动验证。

本发明的有益效果在于:获取工作票训练数据集,分离其中的工作内容和安全措施,并将其分词得到词向量,根据词向量训练预设的LSTM-CNN网络得到目标LSTM-CNN网络,后续需要对待验证工作票数据集进行验证时,直接通过目标LSTM-CNN网络就能实现对待验证工作票数据集的自动验证筛选,将不符合现行规范的工作票剔除,保证操作安全。

请参照图1,本发明的实施例一为:

一种基于多输入LSTM-CNN的工作票安全措施识别方法,包括步骤:

S1、获取工作票训练数据集,所述工作票训练数据集中的每一工作票包括工作内容、安全措施和有效标识;

S2、按照预设规则对所述工作内容和所述安全措施分别进行分词后得到工作内容词向量集合和安全措施词向量集合,包括:

S21、对所述工作内容中进行分词得到第一词集合,并抽取所述词集合中的动词组成动词集合;对所述安全措施按字进行分词得到第二词集合;

S22、获取所述动词集合中每一动词所对应的第一词向量组成工作内容词向量集合;获取所述第二词集合中每一字的第二词向量组成安全措施词向量集合;

在一种可选的实施方式中,通过jieba工具进行分词;

S3、根据所述工作内容词向量集合和所述安全措施词向量集合训练预设的LSTM-CNN网络得到目标LSTM-CNN网络,包括:

S31、将所述工作内容词向量集合输入第一LSTM-CNN模块,得到第一组合表示;将所述安全措施词向量集合输入第二LSTM-CNN模块后,再通过多头自注意力模块,得到第二组合表示;

在一种可选的实施方式中,LSTM-CNN网络包括正向LSTM网络和反向LSTM网络;

S32、将所述第一组合表示及所述第二组合表示拼接后输入全连接层后通过归一化层,得到验证结果,根据所述验证结果和所述有效标识调整所述预设的LSTM-CNN网络的参数得到目标LSTM-CNN网络,具体的,验证结果包括工作票有效及工作票无效,有效标识标识该工作票是否有效,若有效标识标识该工作票有效且验证结果为有效,则验证结果为正确,可通过设置正确率、损失函数等对LSTM-CNN网络的参数回归进行限制,再次不做限定;

S4、根据所述目标LSTM-CNN网络对待验证工作票数据集进行自动验证。

请参照图3,本发明的实施例二为:

基于多输入LSTM-CNN的工作票安全措施识别方法,其余实施例一的不同之处在于,限定了具体的计算方式:

所述通过多头自注意力模块,得到第二组合表示具体为:

MultiHeadAttention(x

其中,x

归一化层为softmax层,所述通过归一化层得到验证结果具体为:

y

Linear(y

Y=softmax(Linear(y

其中,P(P1,P2,…,Pn)为第二组合表示;V(V1,V2,…,Vm)为第一组合表示;W和b为所述预设的LSTM-CNN网络的参数。

请参照图2,本发明的实施例三为:

基于多输入LSTM-CNN的工作票安全措施识别终端1,包括处理器2、存储器3及存储在存储器3上并可在所述处理器2上运行的计算机程序,所述处理器2执行所述计算机程序时实现实施例一或实施例二中的各个步骤。

综上所述,本发明提供了一种基于多输入LSTM-CNN的工作票安全措施识别方法及终端,通过已有的确认有效性的工作票训练数据集对预设的LSTM-CNN网络进行训练得到目标LSTM-CNN网络,在需要判断工作票有效性,直接通过目标LSTM-CNN网络进行判断,若工作票中同一工作内容所对应的安全措施更新,能够通过训练学习处理新的需求,代替人工过滤,并且能够处理大量数据,提高过滤安全措施不合格的工作票的效率,并且在LSTM-CNN模型中引入了多头注意力机制,可以将安全措施序列中其他所有词向量的信息以一定的权重加入当前的词向量的信息中,使得当前向量可以获取到整体的上下文信息,从多个角度入手优化模型,最终实现对工作票是否有效即其中安全措施是否有效的判断的准确性的提高。

以上所述仅为本发明的实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等同变换,或直接或间接运用在相关的技术领域,均同理包括在本发明的专利保护范围内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号