文章在传统聚类算法的基础上,提出了一种基于密度和约束的数据流聚类算法——C-DBDStream(Constraint and Density Based Clustering of Data Stream).该算法使用数据流聚类在线和离线两阶段框架.在线聚类阶段使用衰减窗口模型,对数据流中的数据对象进行初步的聚类,应用约束条件生成微簇,并将实例级的约束扩展到了微簇级,并将结果以快照的形式保存下来为下一阶段做准备;离线聚类阶段则利用微簇级约束规则聚类,采用DBSCAN算法中的密度可达寻找密度连通区域以产生最终结果.经实验证明,与CluStream算法的对比中,C-DBDStream算法提高了聚类效果.
展开▼