首页> 外国专利> USE OF SIMILARITY HASH TO ROUTE DATA FOR IMPROVED DEDUPLICATION IN A STORAGE SERVER CLUSTER

USE OF SIMILARITY HASH TO ROUTE DATA FOR IMPROVED DEDUPLICATION IN A STORAGE SERVER CLUSTER

机译:在存储服务器集群中使用相似性哈希来路由数据以改善重复数据删除

摘要

A technique for routing data for improved deduplication in a storage server cluster includes computing, for each node in the cluster, a value collectively representative of the data stored on the node, such as a “geometric center” of the node. New or modified data is routed to the node which has stored data identical or most similar to the new or modified data, as determined based on those values. Each node stores a plurality of chunks of data, where each chunk includes multiple deduplication segments. A content hash is computed for each deduplication segment in each node, and a similarity hash is computed for each chunk from the content hashes of all segments in the chunk. A geometric center of a node is computed from the similarity hashes of the chunks stored in the node.
机译:用于在存储服务器群集中路由数据以改进重复数据删除的技术包括针对群集中的每个节点计算共同代表该节点上存储的数据的值,例如该节点的“几何中心”。根据这些值确定,将新数据或修改过的数据路由到已存储与新数据或修改过的数据相同或最相似的数据的节点。每个节点存储多个数据块,其中每个块包括多个重复数据删除段。为每个节点中的每个重复数据删除段计算一个内容哈希,并根据该块中所有段的内容哈希为每个块计算一个相似性哈希。根据存储在节点中的块的相似性哈希值计算节点的几何中心。

著录项

  • 公开/公告号US2013018854A1

    专利类型

  • 公开/公告日2013-01-17

    原文格式PDF

  • 申请/专利权人 MICHAEL N. CONDICT;

    申请/专利号US201213619826

  • 发明设计人 MICHAEL N. CONDICT;

    申请日2012-09-14

  • 分类号G06F17/30;

  • 国家 US

  • 入库时间 2022-08-21 16:48:42

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号