首页> 中国专利> 情感分类的方法和情感分类模型的训练方法、装置

情感分类的方法和情感分类模型的训练方法、装置

摘要

本公开提供了一种采用情感分类模型进行情感分类的方法和情感分类模型的训练方法,涉及人工智能领域,具体涉及自然语言处理领域、深度学习领域和云计算领域,可以但不限于应用于智慧城市等场景中。采用情感分类模型进行情感分类的方法的具体实现方案为:将待处理文本输入情感分类模型的特征提取网络,得到待处理文本的第一文本特征;基于第一文本特征,采用情感分类模型的方面分类网络确定待处理文本的第一方面类别特征和多个预定方面类别中待处理文本的方面类别;以及基于第一方面类别特征和第一文本特征,采用情感分类模型的情感分类网络确定待处理文本在多个预定方面类别的情感类别。

著录项

  • 公开/公告号CN113806541A

    专利类型发明专利

  • 公开/公告日2021-12-17

    原文格式PDF

  • 申请/专利权人 北京百度网讯科技有限公司;

    申请/专利号CN202111102932.3

  • 发明设计人 杨哲;卓泽城;龚建;黄强;潘旭;

    申请日2021-09-16

  • 分类号G06F16/35(20190101);G06N3/04(20060101);G06N3/08(20060101);

  • 代理机构11021 中科专利商标代理有限责任公司;

  • 代理人吕朝蕙

  • 地址 100085 北京市海淀区上地十街10号百度大厦2层

  • 入库时间 2023-06-19 13:45:04

说明书

技术领域

本公开涉及人工智能技术领域,具体涉及自然语言处理领域、深度学习领域和云计算领域,尤其涉及一种情感分类的方法和情感分类模型的训练方法、装置、设备和介质。

背景技术

随着计算机技术和网络技术的发展,深度学习技术在自然语言处理中得到了广泛应用。情感分析是自然语言处理中一项重要的任务,它是指通过计算机等辅助手段,判断人们在文本中对产品、对象、事件、服务、主题及其属性所持有的情感、看法等感受。

发明内容

基于此,本公开提供了一种提高情感分类精度和避免模型欠拟合的采用情感分类模型进行情感分类的方法和情感分类模型的训练方法、装置、设备和存储介质。

根据本公开的一个方面,提供了一种采用情感分类模型进行情感分类的方法,其中,情感分类模型包括特征提取网络、方面分类网络和情感分类网络;该方法包括:将待处理文本输入特征提取网络,得到待处理文本的第一文本特征;基于第一文本特征,采用方面分类网络确定待处理文本的第一方面类别特征和多个预定方面类别中待处理文本的方面类别;以及基于第一方面类别特征和第一文本特征,采用情感分类网络确定待处理文本在多个预定方面类别的情感类别。

根据本公开的另一个方面,提供了一种情感分类模型的训练方法,其中,情感分类模型包括特征提取网络、方面分类网络和情感分类网络,该方法包括:将文本样本输入特征提取网络,得到文本样本的第二文本特征;文本样本包括文本的实际方面类别和实际方面类别的情感类别;基于第二文本特征,采用方面分类网络确定文本样本的第二方面类别特征和多个预定方面类别中文本样本的预测方面类别;基于第二方面类别特征和第二文本特征,采用情感分类网络确定文本样本在多个预定方面类别的预测情感类别;以及基于实际方面类别、预测方面类别、实际方面类别的情感类别和文本样本在实际方面类别的预测情感类别,对情感分类模型进行训练。

根据本公开的另一方面,提供了一种采用情感分类模型进行情感分类的装置,其中,情感分类模型包括特征提取网络、方面分类网络和情感分类网络;该装置包括:第一文本特征获得模块,用于将待处理文本输入特征提取网络,得到待处理文本的第一文本特征;第一方面类别预测模块,用于基于第一文本特征,采用方面分类网络确定待处理文本的第一方面类别特征和多个预定方面类别中待处理文本的方面类别;以及第一情感类别预测模块,用于基于第一方面类别特征和第一文本特征,采用情感分类网络确定待处理文本在多个预定方面类别的情感类别。

根据本公开的另一方面,提供了一种情感分类模型的训练装置,其中,情感分类模型包括特征提取网络、方面分类网络和情感分类网络;该装置包括:第二文本特征获得模块,用于将文本样本输入特征提取网络,得到文本样本的第二文本特征;文本样本包括文本的实际方面类别和实际方面类别的情感类别;第二方面类别预测模块,用于基于第二文本特征,采用方面分类网络确定文本样本的第二方面类别特征和多个预定方面类别中文本样本的预测方面类别;第二情感类别预测模块,用于基于第二方面类别特征和第二文本特征,采用情感分类网络确定文本样本在多个预定方面类别的预测情感类别;以及模型训练模块,用于基于实际方面类别、预测方面类别、实际方面类别的情感类别和文本样本在实际方面类别的预测情感类别,对情感分类模型进行训练。

根据本公开的另一个方面,提供了一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行本公开提供的采用情感分类模型进行情感分类的方法和/或情感分类模型的训练方法。

根据本公开的另一个方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,计算机指令用于使计算机执行本公开提供的采用情感分类模型进行情感分类的方法和/或情感分类模型的训练方法。

根据本公开的另一个方面,提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现本公开提供的采用情感分类模型进行情感分类的方法和/或情感分类模型的训练方法。

应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

附图说明

附图用于更好地理解本方案,不构成对本公开的限定。其中:

图1是根据本公开实施例的采用情感分类模型进行情感分类的方法和情感分类模型的训练方法、装置的应用场景示意图;

图2是根据本公开实施例的采用情感分类模型进行情感分类的方法的流程示意图;

图3是根据本公开实施例的得到待处理文本的第一文本特征的原理示意图;

图4是根据本公开实施例的确定第一方面类别特征和待处理文本的方面类别的原理示意图;

图5是根据本公开实施例的确定待处理文本在多个预定方面的情感类别的原理示意图;

图6是根据本公开另一实施例的确定待处理文本在多个预定方面的情感类别的原理示意图;

图7是根据本公开实施例的情感分类模型的训练方法的流程示意图;

图8是根据本公开实施例的采用情感分类模型进行情感分类的装置的结构框图;

图9是根据本公开实施例的情感分类模型的训练装置的结构框图;以及

图10是用来实施本公开实施例的采用情感分类模型进行情感分类的方法和/或情感分类模型的训练方法的电子设备的框图。

具体实施方式

以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。

本公开提供了一种采用情感分类模型进行情感分类的方法,其中,情感分类模型包括特征提取网络、方面分类网络和情感分类网络。该方法包括文本特征提取阶段、方面类别预测阶段和情感类别预测阶段。在文本特征提取阶段中,将待处理文本输入特征提取网络,得到待处理文本的第一文本特征。在方面类别预测阶段中,基于第一文本特征,采用方面分类网络确定待处理文本的第一方面类别特征和多个预定方面类别中待处理文本的方面类别。在情感类别预测阶段中,基于第一方面类别特征和第一文本特征,采用情感分类网络确定待处理文本在多个预定方面类别的情感类别。

以下将结合图1对本公开提供的方法和装置的应用场景进行描述。

图1是根据本公开实施例的采用情感分类模型进行情感分类的方法和情感分类模型的训练方法、装置的应用场景示意图。

如图1所示,该应用场景100可以包括终端设备110。

示例性地,该终端设备110可以为具有处理功能的各种电子设备,包括但不限于智能手机、平板电脑、膝上型便携计算机、台式电脑等。该终端设备110例如可以用于对文本120进行识别,以对文本进行分类,得到分类结果130。其中,分类结果130可以包括预定数量个方面(Aspect)中文本所涉及的方面,还可以包括该文本所涉及的各个方面的情感极性。其中,文本120可以为用户输入或上传的文本,也可以为终端设备110对语音数据转换所得到的文本,本公开对此不做限定。

例如,文本所涉及的方面可以包括环境方面、口味方面、服务方面等。情感极性可以包括好、一般、不好等预定极性。具体方面和情感极性可以根据实际需求预先设定,本公开对此不做限定。

在一实施例中,如图1所示,该应用场景100还可以包括服务器140。终端设备110可以通过网络与服务器140通信连接。服务器140可以是为终端设备110中应用程序的运行提供支持的各种后台管理服务器。

例如,该服务器140可以从数据库150中获取具有标签的文本,并根据获取的文本对情感分类模型160进行训练。其中,标签指示文本所涉及的方面及该方面的情感极性。在服务器140完成对情感分类模型160的训练后,例如可以响应于终端设备110发送的请求,向终端设备110发送训练好的情感分类模型160。如此,终端设备110可以根据接收到的情感分类模型160来对文本120进行处理。

在一实施例中,终端设备110还可以将文本120发送给服务器140,由服务器140采用情感分类模型对该文本120进行识别,实现对文本120的分类。

需要说明的是,本公开所提供的采用情感分类模型进行情感分类的方法一般可以由终端设备110执行,也可以由服务器140执行。相应地,本公开所提供的采用情感分类模型进行情感分类的装置一般可以设置在终端设备110中,也可以设置在服务器140中。本公开所提供的情感分类模型的训练方法一般可以由服务器140执行,或者由与服务器140通信连接的其他服务器执行。相应地,本公开所提供的情感分类模型的训练装置一般可以设置在服务器140中,或者设置在与服务器140通信连接的其他服务器中。

应该理解,图1中的终端设备、服务器和数据库的数目和类型仅仅是示意性的。根据实现需要,可以具有任意数目和类型的终端设备、服务器和数据库。

以下将结合图1,通过以下图2~图6对本公开提供的采用情感分类模型进行情感分类的方法进行详细描述。

图2是根据本公开实施例的采用情感分类模型进行情感分类的方法的流程示意图。

如图2所示,该实施例的采用情感分类模型进行情感分类的方法200可以包括操作S210~操作S230。其中,情感分类模型可以包括特征提取网络、方面分类网络和情感分类网络。

在操作S210,将待处理文本输入特征提取网络,得到待处理文本的第一文本特征。

根据本公开的实施例,可以对待处理文本进行分词处理,得到词序列。随后将待处理文本以词序列的形式输入特征提取网络。其中,特征提取网络可以为词嵌入网络,用于利用词嵌入矩阵,将词序列转换为向量序列。该向量序列可以组成特征矩阵,得到待处理文本的文本特征。

在一实施例中,特征提取网络还可以包括有循环神经网络,该循环神经网络例如可以为长短期记忆(Long-Short Term Memory)网络。在得到向量序列后,可以将该向量序列输入循环神经网络,将循环神经网络输出的特征数据作为第一文本特征。

在操作S220,基于第一文本特征,采用方面分类网络确定待处理文本的第一方面类别特征和多个预定方面类别中待处理文本的方面类别。

根据本公开的实施例,方面分类网络可以用于执行方面类别检测(AspectCategory Detection)任务。该方面分类网络可以采用由多层感知器(Multi-LayerPerception,MLP)和基于激活函数的输出层组成的架构。

该实施例可以将第一文本特征输入方面分类网络,经由多层感知器的处理得到待处理文本的第一方面类别特征。该第一方面类别特征经由输出层处理后,可以输出概率向量,该概率向量包括多个概率值,分别表示待处理文本属于多个预定方面类别的概率。该实施例可以将概率向量中大于预定阈值的概率值对应的预定方面类别作为待处理文本的方面类别。

在操作S230,基于第一方面类别特征和第一文本特征,采用情感分类网络确定待处理文本在多个预定方面类别的情感类别。

根据本公开的实施例,情感分类网络的结构可以与前述方面分类网络的结构类似,区别在于,情感分类网络中多层感知器的网络参数与方面分类网络中多层感知器的网络参数存在区别,且情感分类网络中输出层的网络参数与方面分类网络中输出层的网络参数存在区别。

该实施例可以将第一方面类别特征和第一文本特征的内积作为情感分类网络的输入。经由情感分类网络处理后,输出待处理文本在多个预定方面类别中各类别的情感概率。例如,该情感分类网络的输出包括针对每个预定方面类别的二分类概率。根据该二分类概率与情感阈值之间的大小关系,可以确定每个预定方面类别的情感类别。

根据本公开的实施例,可以根据前述确定的待处理文本的方面类别,基于针对该待处理文本的方面类别的情感概率,确定针对该待处理文本的方面类别的情感类别。从而完成对待处理文本的方面分类任务和基于方面的情感分类任务。

本公开实施例的技术方案,通过将方面分类任务和基于方面的情感分类任务进行联合执行,可以避免相关技术中因针对每个方面类别分别进行情感预测,而存在一些方面类别的数据不足而情感分类模型欠拟合的问题。这是由于本公开实施例通过将实现方面分类任务的方面类别特征和文本特征相结合来完成情感分类,可以为情感分类提供方面信息,针对多个方面类别来进行情感预测,因此模型的精度不受数据量的影响,可以进一步提高情感分类精度。

图3是根据本公开实施例的得到待处理文本的第一文本特征的原理示意图。

根据本公开的实施例,在提取第一文本特征时,可以提取文本的语义特征,以此提高基于第一文本特征得到的方面类别和情感类别的准确性。

例如,该实施例中的特征提取网络可以包括文本转换子网络和语义提取子网络。其中,文本转换子网络可以为前文描述的词嵌入网络,语义提取子网络可以为双向长短期记忆(Bi-directional LSTM,Bi-LSTM)网络,或者基于注意力的模型(例如Transformer模型等)。

相应地,前述将待处理文本输入特征提取网络,得到待处理文本的第一文本特征的操作可以先将待处理文本输入文本转换子网络,得到文本向量特征。然后将文本向量特征输入语义提取子网络,得到文本语义特征。该文本向量特征和文本语义特征构成第一文本特征。

例如,如图3所示,在该实施例300中,若待处理文本的词序列301为{w

根据本公开的实施例,还可以在特征提取网络中设置注意力层,该注意力层可以基于注意力机制对前述的文本向量特征和/或文本语义特征进行加权,以使得加权得到的特征更能表达待处理文本的方面类别。其中,注意力机制可以比拟为一种池化处理,通常可以包括三步:第一步是输入信息;第二步是计算注意力分布;第三步是根据注意力分布计算输入信息的加权平均。

例如,如图3所示,该实施例300中,特征提取网络除了文本转换子网络310和语义提取子网络320外,还包括第一方面注意力子网络330和第二方面注意力子网络340。

在得到文本向量特征后,可以将作为文本向量特征的矩阵302输入第一方面注意力子网络,得到第一方面特征304,以更为准确地表示待处理文本的方面特征。在得到语义特征后,可以将作为文本语义特征的矩阵303输入第二方面注意力子网络,得到第二方面特征305。该第二方面特征除了表征待处理文本的语义外,还可以更为准确地表示待处理文本的方面特征。

如此,可以将得到的第一方面特征和第二方面特征均作为第一文本特征的一部分。

图4是根据本公开实施例的确定第一方面类别特征和待处理文本的方面类别的原理示意图。

根据本公开的实施例,在第一文本特征包括文本向量特征和文本语义特征的情况下,可以先将该两部分特征融合。随后基于融合后的特征来确定待处理文本的第一方面类别特征和待处理文本的方面类别。

示例性地,前述方面类别特征提取子网络可以包括第一融合子网络、方面类别特征提取子网络和第一分类子网络。其中,第一融合子网络例如可以通过concat()函数来对输入的两部分特征进行融合。方面类别特征提取子网络可以为前文描述的MLP。第一分类子网络可以为前文提及的输出层,该输出层可以基于sigmoid等逻辑回归函数对输入输出层的数据映射至(0,1)的区间。

根据本公开的实施例,如图4所示,该实施例400中,在第一文本特征还包括词序列401经由文本转换子网络410和第一方面注意力子网络430的处理而得到的第一方面特征404,以及词序列401经由文本转换子网络410、语义提取子网络420和第二方面注意力子网络440依次处理而得到的第二方面特征405的情况下,可以将第一方面特征404和第二方面特征405输入方面分类网络包括的第一融合子网络450,得到融合方面特征406。例如,拼接第一方面特征和第二方面特征可以得到该融合方面特征。将融合方面特征输入方面分类网络包括的方面类别特征提取子网络460,可以由该方面类别特征提取子网络460输出第一方面类别特征。该第一方面类别特征输入方面分类网络包括的第一分类子网络470,由该第一分类子网络470输出待处理文本的方面类别。或者由第一分类子网络470输出待处理文本涉及多个预定方面类别中各个类别的概率所组成的概率向量。由该概率向量可以确定待处理文本的方面类别。

该实施例通过融合第一方面特征和第二方面特征,可以使得融合方面特征能够更为准确、完整地表达待处理文本的方面倾向。因此,基于该融合方面特征来完成方面类别预测任务,可以提高预测得到的方面类别的准确性。

图5是根据本公开实施例的确定待处理文本在多个预定方面的情感类别的原理示意图。

根据本公开的实施例,在提取第一文本特征时,还可以基于注意力机制对前述的文本向量特征和/或文本语义特征进行加权,以使得加权得到的特征更能表达待处理文本的情感极性。该注意力机制与前文使得特征更能表达待处理文本的方面类别的注意力机制类似,区别仅在于两个注意力机制的输入信息和计算得到的注意力分布不同,计算加权平均采用的权重不同。

根据本公开的实施例,还可以基于注意力机制对前述的第一方面特征和第二方面特征进行加权,以使得加权得到的特征能够表达情感极性与方面类别之间的关系。也可以对文本向量特征和第一方面特征的整体进行加权。

根据本公开的实施例,还可以采用注意力机制对前述的文本向量特征和第一方面特征的拼接特征进行处理,并采用注意力机制对前述的文本语义特征和所述第二方面特征进行处理。通过该方式,可以在表达情感极性与方面类别之间的关系的同时,保证对除方面特征外其他非方面特征信息的完整表达。从而可以保证采用注意力机制得到的特征能够更为完整的表达情感特征。

示例性地,如图5所示,该实施例500中,特征提取网络除了文本转换子网络510、语义提取子网络520、第一方面注意力子网络530和第二方面注意力子网络540外,还可以包括第一情感注意力子网络530’、第二情感注意力子网络540’和第二融合子网络580。在词序列501经由文本转换子网络510处理而得到文本向量特征,文本向量特征经由第一方面注意力子网络530处理而得到第一方面特征504后,可以将文本向量特征和第一方面特征504输入第一情感注意力子网络530’,经由该第一情感注意力子网络530’处理,得到第一情感特征。在文本向量特征经由语义提取子网络520处理而得到文本语义特征,且文本语义特征经由第二方面注意力子网络540处理而得到第二方面特征505后,可以将文本语义特征和第二方面特征505输入第二情感注意力子网络540’,经由该第二情感注意力子网络540’处理,得到第二情感特征。在得到第一情感特征和第二情感特征后,可以将该第一情感特征和第二情感特征输入第二融合子网络580,经由该第二融合子网络处理,得到融合情感特征。如此,第一文本特征还应包括该融合情感特征。

例如,第一情感注意力子网络530’可以先对文本向量特征和第一方面特征进行拼接。然后采用注意力机制对拼接后的特征进行处理,得到第一情感特征。类似地,第二情感注意力子网络540’采用注意力机制对拼接文本语义特征和所述第二方面特征得到的特征进行处理,得到第二情感特征。

例如,第二融合子网络用于通过concat()函数来对第一情感特征和第二情感特征进行融合,得到融合情感特征。

在得到融合情感特征后,该实施例可以将融合情感特征作为情感分类网络的一部分输入,将第一方面特征和第二方面特征经由第一融合子网络550和方面类别特征提取子网络560处理后得到的第一方面类别特征输入情感分类网络590,经由该情感分类网络590处理后,输出待处理文本针对多个预定方面的二分类概率。基于该二分类概率来确定每个预定方面类别的情感类别。

该实施例通过设置采用注意力机制对从待处理文本中提取的语义特征、方面特征进行处理,可以使得处理得到的情感特征能够更为准确地表达待处理文本在预定方面的情感倾向。因此,基于采用注意力机制处理后得到的特征来完成情感类别的预测任务,可以提高预测得到的各方面类别的情感类别的准确性。

图6是根据本公开另一实施例的确定待处理文本在多个预定方面的情感类别的原理示意图。

根据本公开的实施例,前述情感分类网络例如可以采用注意力交互模型(Attention-Over-Attention,AOA)来完成情感类别的预测任务。通过该模型,可以充分考虑待处理文本的语义到方面特征的关注度和方面特征到待处理文本的语义的关注度,从而可以提高情感分类结果的精度。

如图6所示,该实施例600中,情感分类网络可以包括关系提取子网络691、第一回归子网络692、第二回归子网络693和分类子网络694。

在得到融合情感特征601和第一方面类别特征602后,可以将该融合情感特征601和第一方面类别特征602输入关系提取子网络691,经由该关系提取子网络691处理后,得到关系特征。其中,关系提取子网络691例如可以用于对融合情感特征601和第一方面类别特征602进行点乘,将点乘得到的特征作为关系特征。该关系特征可以表示方面类别与情感类别之间的匹配关系。

在得到关系特征后,可以将关系特征分别输入第一回归子网络692和第二回归子网络693,由该第一回归子网络692和第二回归子网络693处理后,分别得到第一注意力特征和第二注意力特征。其中,第一回归子网络692例如可以采用softmax函数对表示关系特征的矩阵进行列方向的归一化,即针对表示关系特征的矩阵中的每一列做softmax归一化,得到表示方面类别到语义的注意力的关注,即给定一个方面类别,对待处理文本中每个词的注意力。第二回归子网络693例如可以采用softmax函数对表示关系特征的矩阵进行行方向的归一化,即针对表示关系特征的矩阵中的每一行做softmax归一化,得到表示语义到方面类别的注意力的关注,即给定一个待处理文本中的词,对方面类别中每个方面的注意力。该第二回归子网络例如还可以对针对每一行做softmax归一化得到的特征进行平均,以得到平均的方面级别关注。将表示平均的方面级别关注的量作为第二注意力特征。

在得到第一注意力特征和第二注意力特征后,可以基于该第一注意力特征和第二注意力特征,采用分类子网络694来确定待处理文本在多个预定方面的情感类别。

在一实施例中,可以综合考虑第一注意力特征、第二注意力特征和融合情感特征,来采用分类子网络完成情感分类任务。通过该方式,可以避免因归一化过程中一些情感特征的丢失而导致的分类结果不精准的问题。因此,通过该方式,可以提高情感分类任务的精度。在得到第一注意力特征和第二注意力特征后,可以将该两个注意力特征输入第一融合层6941,经由该第一融合层6941处理后得到融合后特征。该第一融合层6941例如可以通过计算两个注意力特征的点集,实现对两个注意力特征的融合。在得到融合后特征后,可以将融合后特征和融合情感特征输入第二融合层6942,经由该第二融合层6942处理后得到情感类别特征。该第二融合层6942与第一融合层6941的工作原理类似,在此不再赘述。在得到情感类别特征后,将情感类别特征输入归一化层6943,获得待处理文本在多个预定方面的情感类别。

例如,该归一化层6943可以采用softmax函数作为归一化函数,情感类别特征经由该归一化层6943处理后,可以得到针对多个预定方面的情感类别概率。基于该概率,可以得到待处理文本在多个预定方面的情感类别。

为了便于实现前文描述的采用情感分类模型进行情感分类的方法,本公开还提供了一种情感分类模型的训练方法。以下将结合图7对该情感分类模型的训练方法进行详细描述。

图7是根据本公开实施例的情感分类模型的训练方法的流程示意图。

如图7所示,该实施例的情感分类模型的训练方法700可以包括操作S710~操作S740。其中,情感分类模型包括特征提取网络、方面分类网络和情感分类网络。

在操作S710,将文本样本输入所述特征提取网络,得到文本样本的第二文本特征。其中,文本样本包括文本的实际方面类别和实际方面类别的情感类别。该操作S710与前文描述的操作S210类似,在此不再赘述。

在操作S720,基于第二文本特征,采用方面分类网络确定文本样本的第二方面类别特征和多个预定方面类别中文本样本的预测方面类别。该操作S720与前文描述的操作S220类似,在此不再赘述。

在操作S730,基于第二方面类别特征和第二文本特征,采用情感分类网络确定文本样本在多个预定方面类别的预测情感类别。该操作S730与前文描述的操作S230类似,在此不再赘述。

在操作S740,基于实际方面类别、预测方面类别、实际方面类别的情感类别和文本样本在实际方面类别的预测情感类别,对情感分类模型进行训练。

根据本公开的实施例,可以先根据实际方面类别与预测方面类别来确定第一预定损失函数的取值。并根据实际方面类别的情感类别和文本样本在实际方面类别的预测情感类别,确定第二预定损失函数的取值。最后将该第一预定损失函数的取值与第二预定损失函数的取值的加权和作为情感分类模型的损失。采用反向传播算法对该情感分类模型进行训练,以最小化情感分类模型的损失。

例如,第一预定损失函数和第二预定损失函数均可以采用交叉熵损失函数、铰链损失函数、平方铰链损失函数中的任一种损失函数,也可以采用相关技术中的其他可以用于二分类场景的损失函数,本公开对此不做限定。

通过本公开实施例设置的情感分类模型,可以使多个预定方面类别使用共享的情感预测层,从而可以在各方面类别之间传递情感知识。相较于相关技术,可以缓解数据缺失带来的过拟合的问题,并因此可以提高采用情感分类模型得到的情感分类结果的准确性。

基于前文描述的采用情感分类模型进行情感分类的方法,本公开还提供了一种采用情感分类模型进行情感分类的装置。以下将结合图8对该装置进行详细描述。

图8是根据本公开实施例的采用情感分类模型进行情感分类的装置的结构框图。

如图8所示,该实施例的采用情感分类模型进行情感分类的装置800可以包括第一文本特征获得模块810、第一方面类别预测模块820和第一情感类别预测模块830。其中,情感分类模型包括特征提取网络、方面分类网络和情感分类网络。

第一文本特征获得模块810用于将待处理文本输入特征提取网络,得到待处理文本的第一文本特征。在一实施例中,第一文本特征获得模块810可以用于执行前文描述的操作S210,在此不再赘述。

第一方面类别预测模块820用于基于第一文本特征,采用方面分类网络确定待处理文本的第一方面类别特征和多个预定方面类别中待处理文本的方面类别。在一实施例中,第一方面类别预测模块820可以用于执行前文描述的操作S220,在此不再赘述。

第一情感类别预测模块830用于基于第一方面类别特征和第一文本特征,采用情感分类网络确定待处理文本在多个预定方面类别的情感类别。在一实施例中,第一情感类别预测模块830可以用于执行前文描述的操作S230,在此不再赘述。

根据本公开的实施例,特征提取网络包括文本转换子网络和语义提取子网络。上述第一文本特征获得模块810可以包括文本向量获得子模块和文本语义获得子模块。文本向量获得子模块用于将待处理文本输入文本转换子网络,得到文本向量特征。文本语义获得子模块用于将文本向量特征输入语义提取子网络,得到文本语义特征。其中,第一文本特征包括文本向量特征和文本语义特征。

根据本公开的实施例,特征提取网络还包括第一方面注意力子网络和第二方面注意力子网络。上述第一文本特征获得模块还可以包括第一方面特征获得子模块和第二方面特征获得子模块。第一方面特征获得子模块用于将文本向量特征输入第一方面注意力子网络,得到第一方面特征。第二方面特征获得子模块用于将文本语义特征输入第二方面注意力子网络,得到第二方面特征。其中,第一文本特征还包括第一方面特征和第二方面特征。

根据本公开的实施例,方面分类网络包括第一融合子网络、方面类别特征提取子网络和第一分类子网络。第一方面类别预测模块可以包括方面特征融合子模块、方面类别特征获得子模块和方面类别预测子模块。方面特征融合子模块用于将第一方面特征和第二方面特征输入第一融合子网络,得到融合方面特征。方面类别特征获得子模块用于将融合方面特征输入方面类别特征提取子网络,得到第一方面类别特征。方面类别预测子模块用于将第一方面类别特征输入第一分类子网络,获得多个预定方面类别中待处理文本的方面类别。

根据本公开的实施例,特征提取网络还包括第一情感注意力子网络、第二情感注意力子网络和第二融合子网络。第一文本特征获得模块还包括第一情感特征获得子模块、第二情感特征获得子模块和情感特征融合子模块。第一情感特征获得子模块用于将文本向量特征和第一方面特征输入第一情感注意力子网络,得到第一情感特征。第二情感特征获得子模块用于将文本语义特征和第二方面特征输入第二情感注意力子网络,得到第二情感特征。情感特征融合子模块用于将第一情感特征和第二情感特征输入第二融合子网络,得到融合情感特征。其中,第一文本特征还包括融合情感特征。

根据本公开的实施例,上述第一情感类别预测模块830用于将融合情感特征和第一方面类别特征输入情感分类网络,得到待处理文本在多个预定方面的情感类别。

根据本公开的实施例,情感分类网络包括关系提取子网络、第一回归子网络、第二回归子网络和分类子网络。第一情感类别预测模块830包括关系特征获得子模块、注意力特征获得子模块和情感类别预测子模块。关系特征获得子模块用于将融合情感特征和第一方面类别特征输入关系提取子网络,得到关系特征。注意力特征获得子模块用于将关系特征分别输入第一回归子网络和第二回归子网络,分别得到第一注意力特征和第二注意力特征。情感类别预测子模块用于基于第一注意力特征和第二注意力特征,采用分类子网络确定待处理文本在多个预定方面的情感类别。

根据本公开的实施例,分类子网络包括第一融合层、第二融合层和归一化层。上述情感类别预测子模块可以包括第一特征融合单元、第二特征融合单元和情感类别预测单元。第一特征融合单元用于将第一注意力特征和第二注意力特征输入第一融合层,得到融合后特征。第二特征融合单元用于将融合后特征和融合情感特征输入第二融合层,得到情感类别特征。情感类别预测单元用于将情感类别特征输入归一化层,获得待处理文本在多个预定方面的情感类别。

基于前文描述的情感分类模型的训练方法,本公开还提供了一种情感分类模型的训练装置。以下将结合图9对该装置进行详细描述。

图9是根据本公开实施例的情感分类模型的训练装置的结构框图。

如图9所示,该实施例的情感分类模型的训练装置900可以包括第二文本特征获得模块910、第二方面类别预测模块920、第二情感类别预测模块930和模型训练模块940。其中,情感分类模型包括特征提取网络、方面分类网络和情感分类网络。

第二文本特征获得模块910用于将文本样本输入特征提取网络,得到文本样本的第二文本特征。其中,文本样本包括文本的实际方面类别和实际方面类别的情感类别。在一实施例中,第二文本特征获得模块910可以用于执行前文描述的操作S710,在此不再赘述。

第二方面类别预测模块920用于基于第二文本特征,采用方面分类网络确定文本样本的第二方面类别特征和多个预定方面类别中文本样本的预测方面类别。在一实施例中,第二方面类别预测模块920可以用于执行前文描述的操作S720,在此不再赘述。

第二情感类别预测模块930用于基于第二方面类别特征和第二文本特征,采用情感分类网络确定文本样本在多个预定方面类别的预测情感类别。在一实施例中,第二情感类别预测模块930可以用于执行前文描述的操作S730,在此不再赘述。

模型训练模块940用于基于实际方面类别、预测方面类别、实际方面类别的情感类别和文本样本在实际方面类别的预测情感类别,对情感分类模型进行训练。在一实施例中,模型训练模块940可以用于执行前文描述的操作S740,在此不再赘述。

需要说明的是,本公开的技术方案中,所涉及的用户个人信息的获取、收集、存储、使用、加工、传输、提供和公开等处理,均符合相关法律法规的规定,且不违背公序良俗。

根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。

图10示出了可以用来实施本公开实施例的采用情感分类模型进行情感分类的方法和/或情感分类模型的训练方法的示例电子设备1000的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。

如图10所示,设备1000包括计算单元1001,其可以根据存储在只读存储器(ROM)1002中的计算机程序或者从存储单元1008加载到随机访问存储器(RAM)1003中的计算机程序,来执行各种适当的动作和处理。在RAM 1003中,还可存储设备1000操作所需的各种程序和数据。计算单元1001、ROM 1002以及RAM 1003通过总线1004彼此相连。输入/输出(I/O)接口1005也连接至总线1004。

设备1000中的多个部件连接至I/O接口1005,包括:输入单元1006,例如键盘、鼠标等;输出单元1007,例如各种类型的显示器、扬声器等;存储单元1008,例如磁盘、光盘等;以及通信单元1009,例如网卡、调制解调器、无线通信收发机等。通信单元1009允许设备1000通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。

计算单元1001可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元1001的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元1001执行上文所描述的各个方法和处理,例如采用情感分类模型进行情感分类的方法和/或情感分类模型的训练方法。例如,在一些实施例中,采用情感分类模型进行情感分类的方法和/或情感分类模型的训练方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元1008。在一些实施例中,计算机程序的部分或者全部可以经由ROM 1002和/或通信单元1009而被载入和/或安装到设备1000上。当计算机程序加载到RAM 1003并由计算单元1001执行时,可以执行上文描述的采用情感分类模型进行情感分类的方法和/或情感分类模型的训练方法的一个或多个步骤。备选地,在其他实施例中,计算单元1001可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行采用情感分类模型进行情感分类的方法和/或情感分类模型的训练方法。

本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。

在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。其中,服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与VPS服务(″Virtual Private Server″,或简称″VPS″)中,存在的管理难度大,业务扩展性弱的缺陷。服务器也可以为分布式系统的服务器,或者是结合了区块链的服务器。

应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本发公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。

上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号