首页> 中文会议>2011年中国计算机学会服务计算学术会议(CCF NCSC2011) >HugeTable:一种面向电信行业的云数据仓库

HugeTable:一种面向电信行业的云数据仓库

摘要

本文对面向电信行业的云数据仓库进行了研究。在过去的三年中,随着用户的增加和移动互联网的发展,企业,尤其是电信运营商,面临着数据的爆炸式增长,比如,电信运营商拥有上亿的用户和提供成千上万的服务。这些用户和服务每天产生的数据达到了PB级。为了存储和分析海量的数据,主流电信运营商都引入了云计算系统,比如Hadoop分布式文件系统(HDFS)。然而以hadoop为基础的开源系统并不能完全满足电信运营商的全部需求,比如说实时响应。为了克服该问题,针对电信运营商的在线服务一种名叫HugeTable的数据仓库被提出。HugeTable提出了两种新颖的存储引擎,半随机的HT-HFile和半列存储的HT-RCFile。和开源系统相比,Hugetable可以同时创建密集索引和稀疏索引,用来加快查询速度。在查询过程中,HugeTable首先查询索引。如果查询列上没有索引,则利用HT-HFile和HT-RCFile存储引擎来优化MapReduce查询过程。通过部署在现网中的服务中之后,HugeTable的索引和存储引擎能够极大地提高查询性能,满足了现网服务系统的性能需求。现网系统的实际使用证明了HugeTable的高性能。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号