【24h】

GRAMS~3: An Efficient Framework for XML Structural Similarity Search

机译:GRAMS〜3:XML结构相似性搜索的有效框架

获取原文

摘要

Structural similarity search is a fundamental technology for XML data management. However, existing methods do not scale well with large volume of XML document. The pq-gram is an efficient way of extracting substructure from the tree-structured data for approximate structural similarity search. In this paper, we propose an effective framework GRAMS~3 for evaluating structural similarity of XML data. First pq-grams of XML document are extracted; then we study the characteristics of pq-gram of XML and generate doc-gram vector using TGF-IGF model for XML tree; finally we employ locality sensitive hashing for efficiently structural similarity search of XML documents. An empirical study using both synthetic and real datasets demonstrates the framework is efficient.
机译:结构相似性搜索是XML数据管理的一项基本技术。但是,现有方法无法很好地扩展大量XML文档。 pq-gram是从树状结构数据中提取子结构以进行近似结构相似性搜索的有效方法。在本文中,我们提出了一个有效的框架GRAMS〜3,用于评估XML数据的结构相似性。首先提取XML文档的pq-gram。然后研究XML的pq-gram的特性,并使用TGF-IGF模型为XML树生成doc-gram矢量。最后,我们使用局部敏感哈希来有效地搜索XML文档的结构相似性。使用综合数据集和实际数据集进行的实证研究表明该框架是有效的。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号