基于孪生网络和字词向量结合的文本相似度匹配

李奕霖; 周艳平

首页> 中文期刊> 《计算机系统应用》 >基于孪生网络和字词向量结合的文本相似度匹配

基于孪生网络和字词向量结合的文本相似度匹配

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

文本相似度匹配是许多自然语言处理任务的基础,本文提出一种基于孪生网络和字词向量结合的文本相似度匹配方法,采用孪生网络的思想对文本整体建模,实现两个文本的相似性判断.首先,在提取文本特征向量时,使用BERT和WoBERT模型分别提取字和词级别的句向量,将二者结合使句向量具有更丰富的文本语义信息;其次,针对特征信息融合过程中出现的维度过大问题,加入PCA算法对高维向量进行降维,去除冗余信息和噪声干扰;最后,通过Softmax分类器得到相似度匹配结果.通过在LCQMC数据集上的实验表明,本文模型的准确率和F1值分别达到了89.92%和88.52%,可以更好地提取文本语义信息,更适合文本相似度匹配任务.

著录项

来源
《计算机系统应用》 |2022年第10期|295-302|共8页
作者
李奕霖; 周艳平;
展开▼
作者单位

青岛科技大学信息科学技术学院;

展开▼
原文格式 PDF
正文语种 chi
中图分类文字信息处理;
关键词
文本相似度匹配; 字词向量结合; 孪生网络; PCA算法; BERT;

相似文献

中文文献
外文文献
专利

1. 基于向量空间模型结合语义的文本相似度算法 [J] . 冯高磊 ,高嵩峰 . 现代电子技术 . 2018,第011期
2. 基于声学音素向量和孪生网络的二语者发音偏误确认 [J] . 王振宇 ,解焱陆 ,张劲松 . 中文信息学报 . 2019,第4期
3. 基于孪生神经网络的异源图像匹配方法 [J] . 陶凯 ,武龙龙 ,韩培林 . 探测与控制学报 . 2022,第1期
4. 基于深度孪生网络的船舶名称匹配方法 [J] . 隋远 ,段然 ,朱德理 . 指挥信息系统与技术 . 2022,第3期
5. 基于超像素分割的孪生网络双目立体匹配方法研究 [J] . 陆玮 ,刘翔 ,薛冕 . 电子科技 . 2021,第9期
6. 基于声学音素向量和孪生网络的二语者发音偏误确认 [C] . Zhenyu Wang ,王振宇 ,Yanlu Xie . 第十七届全国计算语言学学术会议暨第六届基于自然标注大数据的自然语言处理国际学术研讨会（CCL 2018） . 2018
7. 基于孪生神经网络与混合神经网络的文本向量化表示研究 [A] . 刘佳琦 . 2019

基于孪生网络和字词向量结合的文本相似度匹配

摘要

著录项

相似文献

相关主题

期刊订阅