首页> 中国专利> 一种基于Spark改进的K-Means算法的电商餐饮数据分析方法

一种基于Spark改进的K-Means算法的电商餐饮数据分析方法

摘要

一种基于Spark改进的K‑Means算法的电商餐饮数据分析方法,包括以下步骤:步骤1,搭建实验平台及其配置,为实现并行K‑Means聚类算法搭建执行环境;步骤2,原始数据集的获取;步骤3,对原始数据集进行预处理;步骤4,使用Scalable语言实现K‑Means算法在Spark中的开发;步骤5,将编辑好的程序进行编译执行,最终完成聚类过程。本发明利用Spark提供的Map和Combine算子;采用RDD的数据结构;Spark中间计算结果存于内存,与一种对K‑Means算法的初始化聚类中心部分进行改进的聚类算法结合,实现电商餐饮数据分析,处理速度较快,聚类效果较好。

著录项

  • 公开/公告号CN109657712B

    专利类型发明专利

  • 公开/公告日2021-06-18

    原文格式PDF

  • 申请/专利权人 浙江工业大学;

    申请/专利号CN201811507426.0

  • 申请日2018-12-11

  • 分类号G06K9/62(20060101);G06F16/2458(20190101);G06Q50/12(20120101);

  • 代理机构33241 杭州斯可睿专利事务所有限公司;

  • 代理人王利强

  • 地址 310014 浙江省杭州市下城区朝晖六区潮王路18号

  • 入库时间 2022-08-23 11:59:15

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号