文摘
英文文摘
第一章概述
1.1数据仓库的产生背景
1.2数据仓库的发展及技术热点
1.3铁路货票信息应用现状
1.4本文的工作
1.5数据仓库的前景
第二章数据仓库体系结构
2.1体系结构框图
2.2数据抽取和转换
2.3元数据管理
2.4数据仓库的数据组织
2.4.1数据粒度的设计
2.4.2数据模型
2.5数据仓库的视图组织
2.5.1视图存在的必要性
2.5.2选择实视图
2.6数据仓库的分析处理
2.6.1联机分析处理OLAP
2.6.2数据挖掘
第三章视图存储量估计和实体化视图选择算法
3.1数据立方体
3.1.1基于关系表的数据立方体操作的提出
3.1.2具有维层次结构的数据立方体运算和存储容量的爆炸
3.2视图实体化的选择
3.2.1格框架
3.2.2维层次及复合依赖格
3.2.3数据立方体聚集视图代价模型
3.2.4实体化视图选择算法
3.3视图存储量估计
3.3.1视图存储量估计的复杂性
3.3.2视图存储量估计的方案
3.4位图索引机制
3.4.1使用位图索引的必要性
3.4.2位图索引原理
3.4.3位图索引在数据仓库中的应用
3.5其他问题
第四章视图存储量估计的DW-PCSA算法和DW-SPEA算法
4.1对现有算法的综合评价
4.2我对PCSA算法的实验验证及结论
4.2.1 PCSA算法的实验验证
4.2.2实验结论
4.3 PCSA算法分析
4.3.1关于PCSA算法的假设
4.3.2 hashing函数的可行性和局限性
4.3.3关于修正因子
4.4 hashing函数的设计
4.4.1 hash血g函数的设计原则
4.4.2长字符串hashing函数的构造
4.4.3我构造的hashing函数
4.4.4参数的选取
4.5 DW-PCSA算法
4.5.1算法描述
4.5.2其他语言环境下的DW-PCSA算法
4.6 DW-SPEA算法
4.6.1基本思路
4.6.2选择合适的估计量
4.6.3 DW-SPEA算法描述
4.7其他算法
第五章原型系统FTDW-1系统体系结构设计
5.1三层体系结构
5.2为什么采用高层开发
第六章视图存储量估计及实体化视图选择算法的实现
6.1实验系统的开发工具及开发环境
6.2算法实验环境的搭建
6.2.1为什么不使用系统的数据公共定义
6.2.2元数据管理
6.2.3实验环境中数据模型和立方体数据结构的定义
6.3算法DW-PCSA和算法DW-SPEA的实现
6.3.1算法DW-PCSA实现
6.3.2算法DW-SPEA实现
6.4贪心算法的实现
6.5确定为哪些属性建立位图索引
6.6增量估值算法D-PCSA
第七章算法性能测试
7.1实验测试数据
7.2辅助向量数量对算法DW-PCSA的精度影响
7.3数据集中互不相同元素数目很少时,辅助向量数目对算法DW-PCSA性能的影响
7.4不同修正因子下算法DW-PCSA的精度测试
7.5极优修正因子的确定
7.6不同类型数据集修正因子的测试
7.5在货票数据库上的测试
第八章探讨和展望
8.1建立Bitmap索引管理模块
8.2在邻接表的弧节点中加入弧访问频度域
8.3关于视图实体化策略
8.4一种采样策略
8.5维护hashing函数库和估计量函数库
8.6并行的必要性
参考文献
致谢