首页> 中文期刊> 《计算机工程》 >一种潜在文档相似模型

一种潜在文档相似模型

         

摘要

This paper proposes a Latent Document Similarity Modei(LDSM). It denotes each document pair as a bipartite graph, where each node is a latent topic, and each edge is weighted with the similarity between the corresponding topics, and it represents the document similarity as the optimal matching of the bipartite graph. Experimental results show that LDSM outperforms the document similarity model based on TextTiling and the optimal matching of bipartite graph at both average precision and average recall.%提出一种潜在文档相似模型(LDSM),把每对文档看作一个二分图,把文档的潜在主题看作二分图的顶点,用主题间的加权相似度为相应边赋权值,并用二分图的最佳匹配表示文档的相似度.实验结果表明,LDSM的平均查准率和平均查全率都优于用TextTiling和二分图最佳匹配方法构建的文档相似模型.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号