基于SQL-on-Hadoop的不同数据格式的试飞数据查询性能研究

摘要

随着国内民用大飞机行业的快速发展,产生了海量试飞数据,使用大数据技术存储处理试飞数据的需求日益增长.针对试飞数据的特性,结合现有Hadoop生态,从数据存储格式、SQL-on-Hadoop技术等维度出发,通过数据查询实验,确定数据存储、数据处理的技术路线.实验结果表明,以ORC或Parquet格式存储试飞数据,能节省大量存储空间,且对试飞数据获取速度无影响甚至有提升;Spark SQL因其计算框架优势能在一秒内完成单次数据查询,适合在少量试飞数据集中快速查询的场景;从硬件成本角度,Hive技术在实时要求不高的试飞数据查询中能发挥关键作用.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号