首页> 中文会议>2010年全国高性能计算学术年会(HPC china2010) >基于并行K-means聚类构建的分布式M-Tree

基于并行K-means聚类构建的分布式M-Tree

摘要

并行索引技术是提高相似度检索性能的关键技术之一.结合Beowalf 并行计算集群系统的特点,提出了 一种新颖的分布式M-tree 索引结构.该索引由一系列位于计算节点的小规模子索引组成,并利用k-means 聚类 算法作为数据分发策略的核心,能够准确地检测出数据集的全局邻近度,进而确定需要将哪些对象分发到不同 节点.为了充分发挥集群系统的性能以及在处理大规模数据集方面的优势,提出了分布式M-tree的并行构建算 法和并行k-NN 查询算法.实验结果表明,通过分布式M-tree 及其数据分发策略能够保证各节点的静态和动态 负载平衡,而且并行构建算法和查询算法能够大幅度提高索引的构建速度以及相似度检索的性能.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号