首页> 中国专利> 一种基于GraphX的分布式幂迭代聚类方法和装置

一种基于GraphX的分布式幂迭代聚类方法和装置

摘要

本发明公开了一种基于GraphX的分布式幂迭代聚类方法和装置。该方法包括:获取分布式存储的多个数据;对所述多个数据分别进行数据清洗,得到多个清洗数据;基于所述多个清洗数据中两两之间的相似度,构建亲和矩阵;基于GraphX,利用设置的随机初始向量对所述亲和矩阵进行迭代处理;利用KMeans++算法,对迭代向量进行聚类处理,并根据处理结果得到所述多个清洗数据的聚类结果。本发明有效地解决了基于图的聚类算法可扩展性不强、计算复杂度高的问题。

著录项

  • 公开/公告号CN107480685B

    专利类型发明专利

  • 公开/公告日2021-02-23

    原文格式PDF

  • 申请/专利号CN201610402954.4

  • 申请日2016-06-08

  • 分类号G06K9/62(20060101);

  • 代理机构11010 工业和信息化部电子专利中心;

  • 代理人田卫平

  • 地址 100029 北京市朝阳区裕民路甲3号

  • 入库时间 2022-08-23 11:32:39

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号