面向长文本的两阶段文本匹配模型TP-TM

王佳睿; 彭程; 范敏

首页> 中文期刊> 《计算机应用》 >面向长文本的两阶段文本匹配模型TP-TM

面向长文本的两阶段文本匹配模型TP-TM

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

针对传统文本匹配方法无法学习文本间深度语义匹配特征,深度短文本匹配模型难以捕获长文本细粒度匹配信号等问题,提出一种面向长文本的两阶段文本匹配模型TP-TM(Two-Phase Text Matching)。首先使用句子级过滤器过滤噪声句并提取关键句,然后将所获关键句输入词语级过滤器,利用融入了改进版删减策略的BERT(Bidirectional Encoder Representations from Transformers)模型挖掘文本间深度交互特征,对关键句进行词语级噪声过滤和细粒度匹配操作,最终通过拼接BERT不同位置特征预测文本对关系。在中文长文本公开新闻数据集CNSE(Chinese News Same Event)和CNSS(Chinese News Same Story)上进行实验,结果显示,相较于基线模型,TP-TM模型在CNSE和CNSS数据集上的准确率分别提升了0.99和1.55个百分点,F1值分别提升了0.98和1.46个百分点,有效提升了长文本匹配任务的准确度。

著录项

来源
《计算机应用》 |2023年第s01期|33-38|共6页
作者
王佳睿; 彭程; 范敏;
展开▼
作者单位

中国科学院成都计算机应用研究所;

中国科学院大学计算机科学与技术学院;

展开▼
原文格式 PDF
正文语种 chi
中图分类文字信息处理;
关键词
文本匹配; 长文本; BERT; 过滤器; 特征删减;

相似文献

中文文献
外文文献
专利

1. TP-AS:一种面向长文本的两阶段自动摘要方法 [J] . 王帅 ,赵翔 ,李博 . 中文信息学报 . 2018,第6期
2. 文本线局部极值区域两阶段场景文本序列识别 [J] . 董引娣 ,赵晓祎 . 计算机科学与探索 . 2018,第8期
3. 一种基于谱归一化的两阶段堆叠结构生成对抗网络的文本生成图像模型 [J] . 王霞 ,徐慧英 ,朱信忠 . 计算机工程与科学 . 2022,第6期
4. 结合邻居辅助策略的两阶段层次文本分类模型 [J] . 古平 ,王春元 . 计算机工程与应用 . 2017,第9期
5. 基于协同聚类的两阶段文本聚类方法研究 [C] . . 第四届全国信息检索与内容安全学术会议 . 2008
6. 面向心理危机问题的两阶段微博短文本摘要方法 [A] . 刘敏哲 . 2020

面向长文本的两阶段文本匹配模型TP-TM

摘要

著录项

相似文献

相关主题

期刊订阅