首页> 中文期刊> 《计算机科学与探索》 >高维数据流的自适应子空间聚类算法

高维数据流的自适应子空间聚类算法

         

摘要

高维数据流聚类是数据挖掘领域中的研究热点.由于数据流具有数据量大、快速变化、高维性等特点,许多聚类算法不能取得较好的聚类质量.提出了高维数据流的自适应子空间聚类算法SAStream.该算法改进了.HPStream中的微簇结构并定义了候选簇,只在相应的子空间内计算新来数据点到候选簇质心的距离,减少了聚类时被检查微簇的数目,将形成的微簇存储在金字塔时间框架中,使用时间衰减函数删除过期的微簇;当数据流量大时,根据监测的系统资源使用情况自动调整界限半径和簇选择因子,从而调节聚类的粒度.实验结果表明,该算法具有良好的聚类质量和快速的数据处理能力.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号