首页> 外文会议>IEEE International Conference on Data Science and Advanced Analytics >MapReduce-based k-prototypes clustering method for big data
【24h】

MapReduce-based k-prototypes clustering method for big data

机译:基于MapReduce的大数据k原型聚类方法

获取原文

摘要

Big data clustering is one of the recently challenging tasks that is used in many application domains. Traditional clustering methods are not able to deal with large-scale of data. Furthermore, Big data are often characterized by the mixed type of data, including numerical and categorical attributes. Thus, we propose in this paper the parallelization of k-prototypes clustering method (MR-KP) using MapReduce model to handle large-scale of mixed data. Experiments results show that MR-KP scales well with increasing data set sizes and achieves a close to linear speedup while maintaining the clustering accuracy.
机译:大数据集群是许多应用程序领域中使用的最近具有挑战性的任务之一。传统的群集方法无法处理大规模数据。此外,大数据通常以混合类型的数据为特征,包括数字和分类属性。因此,我们在本文中提出了使用MapReduce模型并行处理k原型聚类方法(MR-KP)来处理大规模混合数据的方法。实验结果表明,随着数据集大小的增加,MR-KP可以很好地扩展,并且在保持聚类精度的同时,实现了接近线性的加速。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号