首页> 中文学位 >分布式的大数据采集存储方法研究与系统实现
【6h】

分布式的大数据采集存储方法研究与系统实现

代理获取

目录

第一个书签之前

摘 要

Abstract

目 录

1 绪论

1.1 研究背景及意义

1.1.1 研究背景

1.1.2 研究意义

1.2 国内外研究概况

1.3 本文主要研究内容

1.4 论文组织结构

2 分布式大数据采集方法研究

2.1 传统集中式数据采集方案分析

2.2 分布式数据采集方案设计目标

2.3 分布式数据采集方案关键技术研究

2.3.1 负载均衡技术研究

2.3.2 方案高可用性方法研究

2.3.3 分布式消息队列技术研究

2.4 分布式数据采集方案设计

2.5 本章小结

3 分布式大数据存储方法研究

3.1 传统单点数据库数据存储方案分析

3.2 分布式数据存储方案设计目标

3.3 分布式数据存储方案关键技术研究

3.3.1 数据分片技术

3.3.2 数据库中间件技术

3.4 分布式数据存储方案设计

3.4.1 分布式数据存储方案整体架构

3.4.2 分布式存储模块方案设计

3.4.4 负载均衡模块方案设计

3.4.5 存储集群监控模块方案设计

3.5 全局自增序列方法设计

3.6 分片数据的数据仓库方案设计

3.7 本章小结

4 分布式数据采集与存储系统实现

4.1 分布式数据采集与存储系统需求分析

4.1.1 数据采集需求分析

4.1.2 数据存储需求分析

4.2 分布式数据采集与存储系统整体架构

4.3 分布式数据采集系统实现

4.3.1 数据接收模块实现

4.3.2 解析上传模块实现

4.3.3 采集监控模块实现

4.4 分布式数据存储系统实现

4.4.1 数据表关系分析

4.4.2 分片策略设计

4.4.3 数据节点扩展方法

4.4.4 数据迁移方法

4.4.5 基于分片表数据仓库模块实现

4.4.6 负载均衡模块实现

4.5 本章小结

5 分布式数据采集与存储系统验证与分析

5.1 数据采集系统验证与分析

5.1.1 实验环境

5.1.2 实验方案

5.1.3 实验结果分析

5.2 数据分布式存储验证与分析

5.2.1 实验环境

5.2.2 实验方案

5.2.3 实验结果分析

5.3 数据仓库模块验证与分析

5.3.1 实验环境

5.3.2 实验方案

5.3.3 实验结果分析

5.4 本章小结

6 总结与展望

6.1 论文总结

6.2 研究展望

致谢

参考文献

展开▼

摘要

随着大数据时代的到来;传统的集中式系统应用以及存储架构面对海量数据逐渐表现出其局限性;数据的采集和存储逐渐向分布式形式倾斜。论文就是在此背景下;以实验室承接某机电企业大数据分布式采集与存储系统的科研项目为基础而研究设计;目标在于研究设计一套分布式大数据采集与存储方案;解决企业传统集中式系统数据采集堆积延迟、数据存储单点瓶颈以及存取缓慢问题;以保障海量数据的采集与存储;为后期大数据分析打下坚实的基础。 论文首先分析了企业传统集中式数据采集和存储方案面对大数据时产生的瓶颈问题以及解决问题的重难点;明确了分布式数据采集与存储方案的设计目标。然后;在对关键技术进行研究分析后;设计了结合使用 HAProxy 和 Keepalive 实现高可用与负载均衡;以及使用 Kafka 对业务进行解耦的分布式数据采集方案;研究了使用MyCat 对数据进行水平分片;以及使用 Kettle 实现分片数据统计的分布式数据存储方案。接着;将所设计方案应用到了企业的分布式数据采集与存储系统中;解决了企业数据采集存储瓶颈问题。最后;针对各个功能模块设计了实验;验证了论文所设计方案的可行性。 论文主要成果为研究设计了一套高可用、分布式、易扩展的大数据采集与存储方案;并结合企业需求对其原始集中式系统进行了改进与优化;为企业搭建了一套分布式大数据采集与存储系统;解决了企业的海量数据采集堆积延迟、数据存储单节点瓶颈问题;提升了数据的查询速度;提高了系统的可用性和稳定性。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号