基于词项语义组合的文本相似度计算方法研究

周丽杰; 于伟海; 郭成

首页> 中文期刊> 《计算机工程与应用》 >基于词项语义组合的文本相似度计算方法研究

基于词项语义组合的文本相似度计算方法研究

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

Similarity comparison between texts is mainly based on keywords matching, while lacking of analysis of com-bination relationship among keywords deeply. Aiming at the combination of keywords, the larger of the sum of keywords which appears orderly, the greater significance for the similarity comparison between texts, a novel non-linear semantic relevance function is proposed based on the sum of keywords combination cooperatively, under the foundation of LCS the-ory, it extracts all the combination blocks of keywords. The experimental results on an open benchmark dataset from Microsoft Research Paraphrase corpus(MSRP)show that the proposed algorithm acquires a well accuracy and F1 perfor-mance particularly compared with traditional algorithm under the circumstance of short text similarity comparison.%文本之间在相似度比较时主要考虑关键词的匹配特性，缺乏对关键词间组合关系的深入分析。针对关键词间组合特性，按序组合的关键词数目越大，对文本之间相似度贡献越大，并提出基于关键词组合数目的非线性语义关联性函数，在LCS基础上提取文本中所有关键词组合块。将这种结合关键词组合关系的相似度比较方法运用于短文本的相似度比较中，数据采用微软语义释义语料库，实验结果表明，短文本相似度计算的准确率和F1值都有了提高，其中F1值的提高较为明显。

著录项

来源
《计算机工程与应用》 |2016年第19期|90-93|共4页
作者
周丽杰; 于伟海; 郭成;
展开▼
作者单位

烟台职业学院电教中心;

山东烟台 264670;

烟台市普通话培训测试中心;

山东烟台 264670;

大连理工大学软件学院;

辽宁大连 116620;

展开▼
原文格式 PDF
正文语种 chi
中图分类信息处理（信息加工）;
关键词
组合; 非线性语义关联; 语义关联函数; 文本相似度;

相似文献

中文文献
外文文献
专利

1. 基于加权语义网的文本相似度计算方法研究 [J] . 张弛 ,周艳玲 ,张贯虹 . 赤峰学院学报（自然科学版） . 2019,第005期
2. 基于词项和语义融合的地铁信号设备故障文本预处理 [J] . 胡小溪 ,牛儒 ,唐涛 . 铁道学报 . 2021,第002期
3. 基于词项聚类的文本语义标签抽取研究 [J] . 李雄 ,丁治明 ,苏醒 . 计算机科学 . 2018,第0z2期
4. 基于词项语义映射的短文本相似度算法 [J] . 黄贤英 ,张金鹏 ,刘英涛 . 计算机工程与设计 . 2015,第006期
5. 基于概念语义树的语义相似度计算方法研究 [J] . 韩欣 ,秦帆 . 电脑知识与技术 . 2011,第016期
6. 基于语义构词的汉语词语语义相似度计算 [C] . Kang Sichen ,康司辰 ,Liu Yang . 第十五届全国计算语言学学术会议（CCL2016）暨第四届基于自然标注大数据的自然语言处理国际学术研讨会（NLP-NABD-2016） . -1
7. 基于神经网络的短文本语义相似度计算方法研究 [A] . 杨晨 . 2020

基于词项语义组合的文本相似度计算方法研究

摘要

著录项

相似文献

相关主题

期刊订阅