SentiBERT:结合情感信息的预训练语言模型

杨晨; 宋晓宁; 宋威

首页> 中文期刊> 《计算机科学与探索》 >SentiBERT:结合情感信息的预训练语言模型

SentiBERT:结合情感信息的预训练语言模型

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

在大规模无监督语料上预训练的语言模型正逐渐受到自然语言处理领域研究者的关注.现有模型在预训练阶段主要提取文本的语义和结构特征,针对情感类任务的复杂情感特征,在最新的预训练语言模型BERT(双向transformers编码表示)的基础上,提出了一种侧重学习情感特征的预训练方法.在目标领域的预训练阶段,利用情感词典改进了B E RT的预训练任务.同时,使用基于上下文的词粒度情感预测任务对掩盖词情感极性进行分类,获取偏向情感特征的文本表征.最后在少量标注的目标数据集上进行微调.实验结果表明,相较于原B E RT模型,可将情感任务的精度提升1个百分点,特别是训练样本较少时,能取得更先进的效果.

著录项

来源
《计算机科学与探索》 |2020年第9期|1563-1570|共8页
作者
杨晨; 宋晓宁; 宋威;
展开▼
作者单位

江南大学人工智能与计算机学院江苏无锡 214122;

江南大学人工智能与计算机学院江苏无锡 214122;

江南大学人工智能与计算机学院江苏无锡 214122;

展开▼
原文格式 PDF
正文语种 chi
中图分类信息处理（信息加工）;
关键词
BERT; 情感分类; 预训练语言模型; 多任务学习;

相似文献

中文文献
外文文献
专利

1. 基于跨语种预训练语言模型XLM-R的神经机器翻译方法 [J] . 王倩 ,李茂西 ,吴水秀 . 北京大学学报:自然科学版 . 2022,第1期
2. 基于预训练语言模型的关键词感知问题生成 [J] . 于尊瑞 ,毛震东 ,王泉 . 计算机工程 . 2022,第2期
3. CPLM-CSC:基于单字级别预训练语言模型的中文错别字纠正方法 [J] . 谢海华 ,李奥林 ,李亚博 . 中文信息学报 . 2021,第005期
4. 基于预训练语言模型的建筑施工安全事故文本的命名实体识别研究 [J] . 宋建炜 ,邓逸川 ,苏成 . 图学学报 . 2021,第002期
5. 基于预训练语言模型的建筑施工安全事故文本的命名实体识别研究 [J] . 宋建炜 ,邓逸川 ,苏成 . 图学学报 . 2021,第002期
6. CPLM-CSC:基于单字级别预训练语言模型的中文错别字纠正方法 [C] . Haihua XIE ,谢海华 ,Aolin LI . 第十八届中国计算语言学大会暨中国中文信息学会2019学术年会 . 2018
7. 基于预训练语言模型的中文短文本分类研究 [A] . 夏梓渊 . 2021

SentiBERT:结合情感信息的预训练语言模型

摘要

著录项

相似文献

相关主题

期刊订阅