声明
摘要
1绪论
1.1研究背景与研究意义
1.2研究思路
1.3主要研究内容
1.4论文组织结构
2相关理论及关键技术基础
2.1 Hadoop技术框架
2.1.1 Hadoop生态系统
2.1.2 Hadoop关键技术
2.1.3 Hadoop应用研究
2.2专题信息服务
2.2.1专题信息服务发展
2.2.2大数据与专题信息服务
2.3文本分析相关技术研究
2.3.1专题信息文本挖掘
2.3.2专题信息文本处理
2.3.3 LDA主题模型
2.4信息可视化技术发展
3系统总体框架与存储方案
3.1专题信息资源特征
3.1.1大数据时代信息资源基本特征
3.1.2大数据时代专题信息资源特征
3.2系统需求设计与功能分析
3.2.1系统需求和目标
3.2.2系统功能分析
3.2.3系统模块分析
3.3基于HBase的专题信息资源存储方案设计
3.3.2HBase与关系型数据库的异同
3.3.3专题信息存储方案设计
3.4本章小结
4专题信息多维分析系统方案设计
4.1基于文本统计特征的资源分布分析
4.1.1统计分布分析方案设计
4.1.2期刊信息资源分布分析
4.1.3专利信息资源分布分析
4.1.4网页信息资源分布分析
4.2基于文本内容特征的资源主题分析
4.2.1资源预处理
4.2.2文本特征权重计算
4.2.3特征词选择
4.2.4文本向量化
4.2.5基于LDA的主题分析
4.3分析结果可视化
4.3.1统计分布分析结果展示
4.3.2主题分析结果展示
4.4本章小结
5专题信息多维分析系统开发与实现
5.1开发平台搭建与环境部署
5.1.1开发与运行环境准备
5.1.2 Hadoop的安装部署
5.1.3 HBase及相关组件部署
5.2数据存储实现
5.3统计分布分析实现
5.4主题分析实现
5.4.1文本预处理
5.4.2主题发现
5.4.3主题演化
5.5系统性能测试
5.5.1主题分析功能测试
5.5.2主题分析性能测试
5.6本章小结
6总结与展望
6.1论文主要工作概述
6.2研究创新
6.3研究局限与展望
致谢
参考文献
附录