首页> 中文期刊> 《自动化与仪器仪表》 >基于改进聚类和spark的数据信息分析建模及可视化平台研究

基于改进聚类和spark的数据信息分析建模及可视化平台研究

         

摘要

针对海量的互联网大数据信息,提出一种基于改进K-Means聚类算法和spark并行框架的数据信息分析建模及可视化平台。首先,基于Lambda架构进行数据信息分析建模及可视化构建;然后,将平行坐标可视化技术和K-Means聚类算法结合,同时利用spark计算框架完成K-Means聚类的并行化改造,以此更好的挖掘互联网数据中的隐藏信息。结果表明,基于平行坐标可视化技术的K-Means聚类平均准确率为96.25%,相较于传统K-Means算法的平均聚类准确率高11.38%;且随着数据规模的不断扩大,并行化改进后算法的加速比越来越大。由此得出,采用平行坐标可视化技术结合并行化的K-Means聚类能实现海量互联网大数据的挖掘与整合,并通过可视化实现模型的优化。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号