一种Spark环境下的高效率大规模图数据处理机制

杨天晴; 王津; 杨旭涛; 张学杰

首页> 中文期刊> 《计算机应用研究》 >一种Spark环境下的高效率大规模图数据处理机制

一种Spark环境下的高效率大规模图数据处理机制

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

Due to the inefficiency problems in processing,storage and management framework of graph data,this paper pro-posed a feasible processing mechanism of large-scale graph data.It first reviewed the advantages and shortages of existing graph processing models and graph data storage frameworks.By analyzing the characteristics of distributed computing,it im-plemented a new graph data framework including three main parts:segmentation algorithm of large-scale graph,caching and optimization for data extraction,and combination mechanism of calculation and persistence layer.By applying PageRank and SSSP algorithm,it conducted experiments to compare the performance of the proposed framework,MapReduce and Spark with HDFS.Results show that the proposed framework is more 90 times faster than MapReduce,and 2 times faster than Spark with HDFS,and the proposed framework can satisfy the needs of high performance graph data processing.%针对现有的图处理和图管理框架存在的效率低下以及数据存储结构等问题，提出了一种适合大规模图数据的处理机制。首先分析了目前的一些图处理模型以及图存储框架的优势与存在的不足。其次，通过对分布式计算的特性分析采取适合大规模图的分割算法、数据抽取的优化以及缓存、计算层与持久层结合机制三方面来设计图数据处理框架。最后通过PageRank和SSSP算法设计实验，与MapReduce框架和采用HDFS作持久层的Spark框架进行性能对比。实验证明提出的框架要比 MapReduce 框架快90倍，比采用 HDFS 作持久层的Spark框架快2倍，能够满足高效率图数据处理的应用前景。

著录项

来源
《计算机应用研究》 |2016年第12期|3730-37343747|共6页
作者
杨天晴; 王津; 杨旭涛; 张学杰;
展开▼
作者单位

云南大学信息学院;

昆明650091;

云南大学信息学院;

昆明650091;

云南大学信息学院;

昆明650091;

云南大学信息学院;

昆明650091;

展开▼
原文格式 PDF
正文语种 chi
中图分类信息处理（信息加工）;
关键词
图计算; 内存计算; 图数据库; Hadoop; Spark; PageRank;

相似文献

中文文献
外文文献
专利

1. Spark环境下基于频繁边的大规模单图采样算法 [J] . 李龙洋 ,董一鸿 ,严玉良 . 计算机研究与发展 . 2017,第009期
2. 基于Spark的大规模图数据并行计算研究 [J] . 段剑峰 . 现代计算机（专业版） . 2016,第007期
3. 一种基于云存储环境下的数据处理机制 [J] . 戚建国 ,丁金扣 ,张华 . 软件 . 2015,第001期
4. 一种基于Spark的大规模语义数据分布式推理框架 [J] . 陈恒 . 计算机科学 . 2016,第0z2期
5. 大规模RDF图数据上高效率分布式查询处理 [J] . 王鑫 ,徐强 ,柴乐乐 . 软件学报 . 2019,第003期
6. 云计算环境下的大规模图数据处理技术 [C] . 于戈 ,谷峪 ,鲍玉斌 . 第28届中国数据库学术会议 . 2011
7. 分布式环境下大规模图数据的密集子图发现方法研究 [A] . 李荣荣 . 2019

一种Spark环境下的高效率大规模图数据处理机制

摘要

著录项

相似文献

相关主题

期刊订阅