首页> 中文期刊> 《计算机工程与科学》 >混合属性数据集的基于近邻连接的两阶段聚类算法

混合属性数据集的基于近邻连接的两阶段聚类算法

         

摘要

面对混合属性数据集的数据预处理需求,本文在给出若干定义及相关性质之后,提出了一种基于近邻连接的两阶段聚类算法.为提高算法的时间效率,给出了算法改进的思路与技术.多个人工数据集和UCI标准数据集的仿真实验结果表明,对于一些具有明显聚类分布结构的数据集,该算法经常能取得比k-means算法和AP算法更好的聚类精度,说明它具有一定的有效性.为进一步推广并在实际中发掘出该算法的应用价值,最后给出了几点研究展望.%In order to effectively preprocess some mixed data sets,this paper first gives some definitions and related properties,then presents a two-phase clustering algorithm based on near neighbor connection. To improve the time efficiency of this algorithm, some improving ideas and techniques are described. Through the simulation experiments of some artificial data sets and UCI standard data sets,we can verify that this clustering algorithm can often obtain better clustering quality than the k-means algorithm and the AP algorithm when facing to some data sets with apparent clusters. So we can say that this clustering algorithm has certain value. In the end,several research expectations are given to disinter and popularize this method.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号