在聚类算法DBSCAN(Density Based Spatial Clustering of Applications with Noise)的基础上,提出了一种基于密度的高效聚类算法.该算法首先对样本集按某一维排序,然后通过在核心点的邻域外按顺序选择一个未标记的样本点来扩展种子点,以便减少查询次数,降低聚类的时间花费.对样本进行非线性核变换后再进行聚类可以有效地改善聚类的质量.理论分析表明,该算法的时间复杂性接近于线性复杂度.同时测试结果也表明新算法的时间复杂度和聚类质量都显著优于DBSCAN算法.
展开▼