首页> 外文期刊>Computing and informatics >COMPARISON OF LATENT SEMANTIC ANALYSIS AND PROBABILISTIC LATENT SEMANTIC ANALYSIS FOR DOCUMENTS CLUSTERING
【24h】

COMPARISON OF LATENT SEMANTIC ANALYSIS AND PROBABILISTIC LATENT SEMANTIC ANALYSIS FOR DOCUMENTS CLUSTERING

机译:文档聚类的潜在语义分析和概率潜在语义分析的比较

获取原文
获取原文并翻译 | 示例
           

摘要

In this paper we compare usefulness of statistical techniques of dimensionality reduction for improving clustering of documents in Polish. We start with partitional and agglomerative algorithms applied to Vector Space Model. Then we investigate two transformations: Latent Semantic Analysis and Probabilistic Latent Semantic Analysis. The obtained results showed advantage of Latent Semantic Analysis technique over probabilistic model. We also analyse time and memory consumption aspects of these transformations and present runtime details for IBM BladeCenter HS21 machine.
机译:在本文中,我们比较了降维统计技术对改进波兰语中的文档聚类的有用性。我们从应用于矢量空间模型的分区和凝聚算法开始。然后,我们研究了两种转换:潜在语义分析和概率潜在语义分析。获得的结果表明,潜在语义分析技术优于概率模型。我们还将分析这些转换的时间和内存消耗方面,并提供IBM BladeCenter HS21计算机的运行时详细信息。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号