首页> 中文会议>第33届中国数据库学术会议(NDBC2016 ) >Helius:一个轻量级大数据运算系统

Helius:一个轻量级大数据运算系统

摘要

本文阐述随着内存容量呈指数级增长,基于内存计算的大数据运算平台Spark得到广泛关注.Spark在性能上远超传统的MapReduce模型.然而,Spark有两方面的局限性:第一,数据集不可变;第二,依赖JVM运行环境,从而引起代码执行、内存管理、数据序列化/反序列化等开销.为此,采用C/C++语言,设计并实现了一种轻量级的大数据运算系统——Helius.Helius支持Spark的基本操作,同时允许数据集整体修改,利用C/C++优化了内存管理和网络传输,采用一种stateless worker的机制,简化了分布式计算平台的容错恢复过程.Helius相对Spark而言有以下几个优势:一、节约内存,二、不需要序列化和反序列化、三、减少网络交互,四、容错简单.实验表明,Helius在处理迭代任务时速度比Spark快至少3倍,TPCH性能提高了43%.集群环境下,worker节点的内存开销节省35%,master和worker间的网络传输量减少4倍.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号