首页> 中文学位 >共享内存环境下图查询并行处理
【6h】

共享内存环境下图查询并行处理

代理获取

目录

第一个书签之前

展开▼

摘要

RDF作为语义网框架的一项核心概念,因其具有简洁灵活等优点,常被用于表示图数据。SPARQL是一种标准的RDF数据查询语言,是一种常用的图查询语言。随着RDF数据的爆炸式增长,现有的一些SPARQL查询处理系统已无法在合理时间内处理复杂查询。为此,SPARQL查询引擎应当使用并行处理技术来实现对复杂查询的高效处理。然而,当前的一些SPARQL查询并行处理技术有着查询优化效率低下且生成的查询计划不利于并行,系统并行程度较低等不足。 ParTriple旨在为多核计算机环境下的SPARQL图查询提供并行处理。首先,该系统提出了一种高效,易于并行的查询计划生成算法。这种算法生成的查询计划可以使用流水线处理技术,且不同的流水线之间不需要相互等待。进一步地,这种查询计划可以更有效地削减中间结果,提高查询处理性能。接着,提出了一种数据块级与模式级的两级并行执行框架,将查询执行分解成基于数据存储分块的子任务与基于中间结果分块的子任务,从操作符间并行与操作符内并行两个层面开发了系统的并行性。最后,开发了三种不同的并行操作符,分别针对数据扫描,连接处理,数据洗牌等操作,进一步提升了系统查询处理的性能。 实验表明,在LUBM,WATDIV,BTC三个数据集上,对于复杂的SPARQL连接查询,ParTriple与目前流行的RDF数据管理系统RDF-3X,TripleBit,Virtuoso相比,均有显著的性能提升。与此同时,ParTriple也展现了良好的关于线程数目的可扩展性。

著录项

  • 作者

    王磊;

  • 作者单位

    华中科技大学;

  • 授予单位 华中科技大学;
  • 学科 计算机软件与理论
  • 授予学位 硕士
  • 导师姓名 谢夏;
  • 年度 2018
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类
  • 关键词

    共享内存; 环境;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号