首页> 中文期刊> 《软件学报》 >基于SQL的图相似性查询方法

基于SQL的图相似性查询方法

         

摘要

Graphs are widely used to model complicated data in many areas such as social networking,knowledge base,semantic web,bioinformatics and cheminformatics.More and more graph data are collected such that it has become a rather challenging problem to manage such complex data.The database community has had a long-standing interest in querying graph databases,and graph similarity search is one of most popular topics.This paper focuses on the graph similarity search problem with edit distance constraints.Firstly,several state-of-the-art methods are investigated to reveal that all the proposed pruning rules have limitations and none of them can outperform others on various queries.To address this problem,then a novel approach is proposed to support the graph similarity search in the framework of query evaluation using the relational model.The proposed approach develops a novel unified filtering framework by combing all the existing pruning rules.It can avoid limitations on existing pruning rules,and have more widely applications.A series of experiments are also conducted to evaluate the proposed approach.The results show that the new approach can outperform all existing state-of-the-art methods.%图作为一种表示复杂信息的数据结构,被广泛应用于社交网络、知识图谱、语义网、生物信息学和化学信息学等领域.随着各领域应用的普及和深入开展,如何管理这些复杂图数据,是目前图数据库技术面临的巨大挑战.图的相似性查询是图数据管理中的热点问题之一,对图查询问题的研究主要包括图的相似性查询等.重点研究基于编辑距离(graph edit distance)的图相似性查询处理问题.首先,通过对目前代表性的问题求解算法分析发现,目前已提出的过滤规则都具有自己的优缺点和适用性.其次,针对已有方法在过滤阶段自身存在的优缺点和适用性的问题,提出一种面向关系型数据库的过滤框架,新的过滤框架可以支持所有已有的过滤规则,从而通过结合不同的过滤规则来优化图相似查询算法以提高查询效率.该方法可以最大程度地保留不同过滤规则的优点并克服其缺点,从而对不同查询具有普遍适用性.最后,基于PubChem数据集,通过比较算法在求解查询结果的时间消耗,验证所提出算法的高效性及可扩展性.实验结果表明,所提出的方法优于现有算法.

著录项

  • 来源
    《软件学报》 |2018年第3期|689-702|共14页
  • 作者单位

    中国人民大学信息学院;

    北京 100872;

    数据工程与知识工程教育部重点实验室(中国人民大学);

    北京 100872;

    中国人民大学信息学院;

    北京 100872;

    数据工程与知识工程教育部重点实验室(中国人民大学);

    北京 100872;

    厦门大学软件学院;

    福建厦门361000;

    中国人民大学信息学院;

    北京 100872;

    数据工程与知识工程教育部重点实验室(中国人民大学);

    北京 100872;

    中国人民大学信息学院;

    北京 100872;

    数据工程与知识工程教育部重点实验室(中国人民大学);

    北京 100872;

  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类 程序设计、软件工程;
  • 关键词

    图编辑距离; 图相似查询; PostgreSQL; 过滤和验证;

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号