首页> 中文期刊> 《软件》 >基于EDA的中文语义相似度数据集增强方法

基于EDA的中文语义相似度数据集增强方法

         

摘要

语义文本相似度计算在自然语言处理实际应用中有着重要的作用,但由于当前可用的中文语义文本相似度数据集缺乏,因此目前的中文语义文本相似度研究还存在很多局限性.针对这一问题,本文引入EDA和反向翻译方法共计五种数据增强策略对中文语义相似度数据集进行数据增强,并基于ABCNN和ESIM模型进行实验,实验数据显示:五种数据增强策略均有助于模型性能的提升且在数据集数量越少时效果越明显,其中在最小比例的训练集上使用同义词替换数据增强策略达到了3.6%的准确率提升.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号