首页> 中文期刊> 《通信技术》 >基于XLNET的抽取式多级语义融合模型

基于XLNET的抽取式多级语义融合模型

         

摘要

机器阅读理解的公开数据集有许多,根据答案类型的不同可分为抽取式数据集(如SQuAD)、生成式数据集(如MS MARCO)、完形填空数据集(如CNN/Daily Mail)、多项选择数据集(如MCTest)等等.抽取式数据集的特点为其问题的答案为原文中的一个序列.针对于SQuAD提出了新的机器阅读理解模型:模型的表示层采用了XLNET语言模型生成词向量以替代了GloVe传统词向量与BERT预训练词向量.该模型的编码层采用两层双向LSTM网络对表示层输出的文本向量进行编码,提取文本的多级语义.该模型在交互层利用注意力机制对多级语义进行融合,并在输出层通过指针网络输出答案.最后在SQuAD 2.0数据集上测试,获得了78.2%的EM与81.75%的F1成绩.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号