首页> 中文学位 >一种面向近似查询的图数据库索引方法
【6h】

一种面向近似查询的图数据库索引方法

代理获取

目录

文摘

英文文摘

第一章 引言

1.1 图的基本概念

1.2 图数据库概述

1.2.1 背景知识介绍

1.2.2 图数据的存储方式

1.2.3 图数据库定义

1.2.4 生物信息学中与图相关的数据库简介

1.2.5 SDFile格式

1.2.6 图数据库索引相关工作简介

1.3 问题提出以及本文的研究目的及意义

1.4 论文组织结构

第二章 图的相似性度量

2.1 图同构和子图同构

2.1.1 图同构的定义

2.1.2 同构判定及算法

2.2 最大公共子图

2.2.1 最大公共子图算法

2.3 图编辑距离

2.3.1 GE算法

2.3.2 BE算法

第三章 邻接子图索引

3.1 子图挖掘技术

3.1.1 FSG

3.1.2 gSpan

3.1.3 CloseGraph

3.2 子图索引技术

3.2.1 GraphGrep

3.2.2 G-Index

3.3 邻接子图索引

3.3.1 k-邻接子图

3.3.2 过滤原理

3.3.3 优化索引结构

3.3.4 索引维护

第四章 邻接树索引

4.1 子树挖掘技术

4.2 子树索引方法

4.2.1 TreePi

4.2.2 Closure-Tree

4.2.3 Tree+Δ

4.3 k-邻接树定义

4.4 k-邻接树索引的时间效率

4.5 时间复杂度分析

4.6 k-AT lattice

4.7 索引的建立与维护算法

4.8 利用倒排表优化索引结构

第五章 实验结果与分析

5.1 实验环境与测试数据介绍

5.2 邻接子图索引实验

5.3 邻接树索引实验

5.3.1 时间与空间性能测试

5.3.2 过滤性能测试

第六章 结论与进一步工作

参考文献

致谢

攻读硕士期间发表的论文和参加的项目

展开▼

摘要

图论是组合数学领域的一个分支,20世纪60年代末,随着计算机技术的产生和发展,组合数学,特别是图论理论得到了人们越来越多的关注,时至今日,人们面对的计算模型以及数据结构仍然在变得越来越复杂,由于图可以很方便的表示关系数据模型,因此图论中的许多与关系数据表示相关的理论及算法被广泛的应用到数据建模以及数据库设计领域中来。
   在数据库设计中,图结构经常被用来存储以及表示关系数据,例如一些复杂的文档格式(XML文档),蛋白质化学结构,大分子的化学式,向量图形等等,图论中的一些基本算法如最小生成树算法,最短路径算法,以及完美匹配算法也是许多最优调度问题的基础,最近的一些图论的成果已经被大量应用在图像处理,生物信息学,以及网络拓扑结构的研究中。
   图的匹配是图数据库领域中近年来一个热点的研究问题,即对于一个包含大量图的集合,如何在这个集合中迅速找到满足给定查询要求的答案。相比于精确图查询,相似性查询是一个较为新颖且难度较大的问题。针对这个问题,本文对图数据库中的相似性查询方法以及数据库的索引方法进行了深入研究,提出了一种在大规模图数据库上建立索引以加快相似查询速度的高效方法。本文的主要工作总结如下:
   (1)本文首先提出了一种新的衡量图相似性的标准,这种标准利用编辑距离的定义方式,很精确地表达了两个图之间的近似程度,相对于其他度量方式,编辑距离能好的反映两个图之间基于编辑操作的相似性,从而更方便地描述图和图之间的转化关系。
   (2)针对以往方法只能在两个图上做编辑距离计算的不足,利用一种新的索引结构——k-邻接子图,提出了一种基于邻接子图比对的数据库倒排索引方法以避免时间和空间效率都很差的顺序查找。这种方法在编辑距离阈值相对不大的稀疏图数据库查询中有很好的过滤性能。
   (3)由于邻接子图匹配在子图规模较大时的高复杂性,我们进一步提出将邻接子图以邻接树的形式表示的方法,通过放宽严格的同构匹配条件,并利用在图的邻接树上做伪同构匹配的方法,加快了数据库索引的构造以及提取在线查询的特征信息的速度。
   (4)在邻接子树以及邻接子图索引过滤原理的基础上,本文设计了一种高效的相似性查询过滤算法,并将其与目前应用广泛的另外一种方法G-Index作了全面的比较。实验证明,k-邻接子图索引在编辑距离查询阈值相对不大的情况下过滤后所得到的候选集可以很好的趋近真实结果集,并且k-邻接子图索引的平均运行时间要远远小于G-Index索引。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号