基于Hash改进的k-means算法并行化设计

张波; 徐蔚鸿; 陈沅涛; 朱玲

首页> 中文期刊> 《计算机工程与科学》 >基于Hash改进的k-means算法并行化设计

基于Hash改进的k-means算法并行化设计

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

为了解决k-means算法在Hadoop平台下处理海量高维数据时聚类效果差,以及已有的改进算法不利于并行化等问题,提出了一种基于Hash改进的并行化方案.将海量高维的数据映射到一个压缩的标识空间,进而挖掘其聚类关系,选取初始聚类中心,避免了传统k-means算法对随机选取初始聚类中心的敏感性,减少了k-means算法的迭代次数.又结合MapReduce框架将算法整体并行化,并通过Partition、Combine等机制加强了并行化程度和执行效率.实验表明,该算法不仅提高了聚类的准确率和稳定性,同时具有良好的处理速度.

著录项

来源
《计算机工程与科学》 |2016年第10期|1980-1985|共6页
作者
张波; 徐蔚鸿; 陈沅涛; 朱玲;
展开▼
作者单位

长沙理工大学计算机与通信工程学院;

湖南长沙410114;

长沙理工大学计算机与通信工程学院;

湖南长沙410114;

长沙理工大学计算机与通信工程学院;

湖南长沙410114;

长沙理工大学计算机与通信工程学院;

湖南长沙410114;

展开▼
原文格式 PDF
正文语种 chi
中图分类在其他方面的应用;
关键词
海量数据; Hadoop; Hash; 并行k-means聚类; 中心选取;

相似文献

中文文献
外文文献
专利

1. 基于Hadoop平台的K-means聚类算法并行化改进研究 [J] . 禤世丽 ,刘建明 . 玉林师范学院学报 . 2020,第3期
2. 基于Spark的K-means改进算法的并行化实现 [J] . 宋董飞 ,徐华 . 计算机系统应用 . 2018,第004期
3. 一种基于K-means改进蚁群算法的船舶航线设计方法 [J] . 马俊 ,董良雄 ,李军 . 中国修船 . 2020,第003期
4. 基于改进k-means算法的入侵检测方法设计 [J] . 汪莉 . 科技广场 . 2010,第005期
5. 一种基于改进的K-means算法的人名消歧系统的设计与实现 [J] . 杨欣欣 ,李培峰 ,朱巧明 . 计算机与数字工程 . 2010,第008期
6. 一种基于改进的K-means算法的人名消歧系统的设计与实现 [C] . 杨欣欣 ,李培峰 ,朱巧明 . 第七届全国Web信息系统及其应用学术会议、第五届全国语义Web与本体论学术研讨会、第四届全国电子政务技术及应用学术研讨会 . 2010
7. 布谷鸟搜索改进的K-means聚类算法及其并行化实现 [A] . 余相君 . 2017

基于Hash改进的k-means算法并行化设计

摘要

著录项

相似文献

相关主题

期刊订阅