一种潜在文档相似模型

贾西平; 刘海珠

首页> 中文期刊> 《计算机工程》 >一种潜在文档相似模型

一种潜在文档相似模型

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

This paper proposes a Latent Document Similarity Modei(LDSM). It denotes each document pair as a bipartite graph, where each node is a latent topic, and each edge is weighted with the similarity between the corresponding topics, and it represents the document similarity as the optimal matching of the bipartite graph. Experimental results show that LDSM outperforms the document similarity model based on TextTiling and the optimal matching of bipartite graph at both average precision and average recall.%提出一种潜在文档相似模型(LDSM),把每对文档看作一个二分图,把文档的潜在主题看作二分图的顶点,用主题间的加权相似度为相应边赋权值,并用二分图的最佳匹配表示文档的相似度.实验结果表明,LDSM的平均查准率和平均查全率都优于用TextTiling和二分图最佳匹配方法构建的文档相似模型.

著录项

来源
《计算机工程》 |2009年第15期|32-34|共3页
作者
贾西平; 刘海珠;
展开▼
作者单位

广东技术师范学院计算机科学学院;

广州510665;

华南师范大学增城学院;

广州511363;

展开▼
原文格式 PDF
正文语种 chi
中图分类程序设计、软件工程;
关键词
主题; 文档相似度; 文档检索; 信息检索;

相似文献

中文文献
外文文献
专利

1. 一种基于LDA的潜在语义区划分及Web文档聚类算法 [J] . 刘振鹿 ,王大玲 ,冯时 . 中文信息学报 . 2011,第001期
2. 一种新型EPB渣土改良相似模型试验系统及功能验证 [J] . 杨振兴 ,陈馈 ,常家东 . 重庆交通大学学报（自然科学版） . 2018,第006期
3. 一种将XML文档转换为HTML格式文档的算法 [J] . 彭婉仪 ,吴家菊 ,纪斌 . 电脑与信息技术 . 2018,第004期
4. 一种提高企业内部文档输出安全性的途径——文档输出监控与审计系统综述 [J] . 袁萌 . 信息安全与通信保密 . 2011,第007期
5. 一种提高企业内部文档输出安全性的途径——文档输出监控与审计系统综述 [J] . 袁萌 . 计算机安全 . 2011,第007期
6. 一种基于LDA的潜在语义区划分及Web文档聚类算法 [C] . 刘振鹿 ,王大玲 ,冯时 . 第六届全国信息检索学术会议 . 2010
7. 基于LDA的潜在语义空间分析及Web文档聚类的研究与实现 [A] . 刘振鹿 . 2010

一种潜在文档相似模型

摘要

著录项

相似文献

相关主题

期刊订阅