首页> 中国专利> 基于流处理大数据框架的电力用户数据仿生聚类分析模型

基于流处理大数据框架的电力用户数据仿生聚类分析模型

摘要

在新兴技术飞速发展的时代,诸如云计算、大数据和人工智能等技术使得各类信息产业产生了近8060EB的海量数据。对于海量数据的处理成为了数据挖掘和机器学习的一个极具挑战性的任务。针对传统聚类算法K‑means在处理海量数据时存在计算效率低和易陷入局部最优结果的问题,本发明提出了一种基于Flink计算框架的仿生并行聚类算法PSO‑FK‑means。该算法首先以PSO粒子群仿生算法对数据集进行计算得到的初始最优位置为依据,对传统K‑means算法的初始质心选取进行优化。然后为了有效提高海量数据下K‑means算法的计算效率,提出在Flink框架上划分数据集,从而实现K‑means算子的并行化。

著录项

  • 公开/公告号CN113591912A

    专利类型发明专利

  • 公开/公告日2021-11-02

    原文格式PDF

  • 申请/专利权人 南京工业大学;

    申请/专利号CN202110715694.7

  • 发明设计人 汪文豪;史雪荣;

    申请日2021-06-25

  • 分类号G06K9/62(20060101);G06N3/00(20060101);G06Q30/02(20120101);G06Q50/06(20120101);

  • 代理机构

  • 代理人

  • 地址 211816 江苏省南京市浦口区浦珠南路30号

  • 入库时间 2023-06-19 13:05:40

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号