结合语义和结构的短文本相似度计算

倪高伟; 李涛; 刘峥

首页> 中文期刊> 《计算机技术与发展》 >结合语义和结构的短文本相似度计算

结合语义和结构的短文本相似度计算

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

短文本相似度不仅包括语义相似度,还包括语法相似度.目前在短文本相似度度量算法中,大多只分析短文本语义层次的相似性,往往忽略了短文本的语法结构对短文本相似度的重要影响,导致无法捕获大量的文本语义信息,同时在短文本分类任务中召回率不够理想.通过分析短文本的特征,将EMD(earth mover's distance)求解线性规划中运输问题的最优解应用于度量两个短文本的相似度,用Word2Vec度量两个单词的语义相似性,提出了词序位置相似度的概念,即在计算短文本相似度的同时考虑语句词组顺序对相似度的贡献.实验结果表明,在捕获大量文本语义信息的基础上,将算法应用于k近邻(k-nearest neighbor,KNN)文本分类中,有较好的准确率和召回率.

著录项

来源
《计算机技术与发展》 |2018年第8期|104-108113|共6页
作者
倪高伟; 李涛; 刘峥;
展开▼
作者单位

南京邮电大学计算机学院;

江苏南京 210046;

南京邮电大学计算机学院;

江苏南京 210046;

南京邮电大学计算机学院;

江苏南京 210046;

展开▼
原文格式 PDF
正文语种 chi
中图分类自动推理、机器学习;
关键词
EMD; Word2Vec; 短文本相似度计算; 语义相似度; 词序结构;

相似文献

中文文献
外文文献
专利

1. 一种基于语义与句法结构的短文本相似度计算方法 [J] . 赵谦 ,荆琪 ,李爱萍 . 计算机工程与科学 . 2018,第007期
2. 基于短文本相似度计算的工序卡片相似度计算方法 [J] . 童伟 ,王淑营 . 黑龙江科技信息 . 2021,第017期
3. 基于短文本相似度计算的工序卡片相似度计算方法 [J] . 童伟 ,王淑营 . 科学技术创新 . 2021,第017期
4. 结合语义扩展和卷积神经网络的中文短文本分类方法 [J] . 卢玲 ,杨武 ,杨有俊 . 计算机应用 . 2017,第012期
5. 结合语义改进的K-means短文本聚类算法 [J] . 邱云飞 ,赵彬 ,林明明 . 计算机工程与应用 . 2016,第019期
6. 一种结合语义和TF-IDF模型的文本相似度量方法 [C] . 黄承慧 ,印鉴 . 2010年中国计算机大会 . 2010
7. 关于web服务组合的结合语义和结构的定制需求分析的研究 [A] . 周书湘 . 2014

结合语义和结构的短文本相似度计算

摘要

著录项

相似文献

相关主题

期刊订阅