首页> 外文会议>The Second International Conference on Information Jul 24-27, 2002 Beijing, China >Latent Semantic Indexing based on Simple Principal Component Analysis
【24h】

Latent Semantic Indexing based on Simple Principal Component Analysis

机译:基于简单主成分分析的潜在语义索引

获取原文
获取原文并翻译 | 示例

摘要

In this paper, we propose to use the Simple Principal Component Analysis (SPCA) for dimensionality reduction of the vector space information retrieval model. The SPCA algorithm is a data-oriented fast method which does not require the computation of the variance-covariance matrix. In SPCA principal components are estimated iteratively so we also propose a criteria to determine the convergence. The optimum number of iterations for each principal component can be detem-ined using the criteria. Experimentally, we show that the SPCA-based method offers improvement over the conventional SVD-based method despite its small amount of computation.
机译:在本文中,我们建议使用简单主成分分析(SPCA)减少向量空间信息检索模型的维数。 SPCA算法是一种面向数据的快速方法,不需要计算方差-协方差矩阵。在SPCA中,主要成分是迭代估计的,因此我们还提出了确定收敛的标准。可以使用准则确定每个主成分的最佳迭代次数。实验表明,尽管计算量很小,但基于SPCA的方法仍比基于SVD的常规方法有所改进。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号