首页> 外文会议>IEEE international conference on signal processing systems >An Improved Text Clustering Method based on Maximal Frequent Itemsets and K-means
【24h】

An Improved Text Clustering Method based on Maximal Frequent Itemsets and K-means

机译:一种基于最大频繁项目集和k均值的改进的文本聚类方法

获取原文

摘要

In this paper, we present an improved text clustering method by integrating K-means with a novel maximal frequent itemsets based clustering method. This approach automatically extract the clusters in two stages, and in each stage, we use maximal frequent itemsets to locate the initial cenlroids in the dense area. Experiments show 3-10% improvement on clustering accuracy comparing with the traditional MEI K-means clustering method. Another advantage of our method is we can get an approximate cluster number without giving a k value in K-means.
机译:在本文中,我们通过与基于新的基于最大频繁项目集的聚类方法集成了K-ilit来提出改进的文本聚类方法。该方法在两个阶段中自动提取群集,在每个阶段,我们使用最大频繁的项目集来定位密集区域中的初始Cenlroid。实验表明,与传统的Mei K均值聚类方法比较的聚类精度提高了3-10%。我们的方法的另一个优点是我们可以获得近似的簇号而不在k均值中提供k值。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号