基于EDA的中文语义相似度数据集增强方法

张豪; 张华熊

首页> 中文期刊> 《软件》 >基于EDA的中文语义相似度数据集增强方法

基于EDA的中文语义相似度数据集增强方法

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

语义文本相似度计算在自然语言处理实际应用中有着重要的作用,但由于当前可用的中文语义文本相似度数据集缺乏,因此目前的中文语义文本相似度研究还存在很多局限性.针对这一问题,本文引入EDA和反向翻译方法共计五种数据增强策略对中文语义相似度数据集进行数据增强,并基于ABCNN和ESIM模型进行实验,实验数据显示:五种数据增强策略均有助于模型性能的提升且在数据集数量越少时效果越明显,其中在最小比例的训练集上使用同义词替换数据增强策略达到了3.6％的准确率提升.

著录项

来源
《软件》 |2021年第5期|125-127|共3页
作者
张豪; 张华熊;
展开▼
作者单位

浙江理工大学浙江杭州 310018;

浙江理工大学浙江杭州 310018;

展开▼
原文格式 PDF
正文语种 chi
中图分类信息处理（信息加工）;
关键词
中文语义相似度; 数据增强; EDA; 反向翻译;

相似文献

中文文献
外文文献
专利

1. 基于动态语义编码双向LSTM的中文语义相似度计算 [J] . 初雅莉 ,郑虹 ,侯秀萍 . 计算机应用与软件 . 2020,第006期
2. 基于《现代汉语词典》语义空间的中文文本语义相似度研究 [J] . 高俊芳 ,夏劲伟 . 情报探索 . 2018,第011期
3. 基于WV-CNN的中文文本语义相似度计算方法 [J] . 张春英1 ,李春虎1 ,付其峰2 . 华北理工大学学报：自然科学版 . 2019,第001期
4. 基于WV-CNN的中文文本语义相似度计算方法 [J] . . 河北联合大学学报（自然科学版） . 2019,第001期
5. 一种基于语义的中文文本相似度算法 [J] . 夏志明 ,刘新 . 计算机与现代化 . 2015,第004期
6. 基于非对称语义相似度的语义Web服务匹配 [C] . 彭晖 ,史忠植 ,常亮 . 中国人工智能学会第12届全国学术年会 . 2007
7. 基于语义相似度的中文文本相似度算法研究 [A] . 金希茜 . 2009

基于EDA的中文语义相似度数据集增强方法

摘要

著录项

相似文献

相关主题

期刊订阅