首页> 中文学位 >铁路货运数据仓库原型系统视图存储量估计及实体化视图选拔算法的研究
【6h】

铁路货运数据仓库原型系统视图存储量估计及实体化视图选拔算法的研究

代理获取

目录

文摘

英文文摘

第一章概述

1.1数据仓库的产生背景

1.2数据仓库的发展及技术热点

1.3铁路货票信息应用现状

1.4本文的工作

1.5数据仓库的前景

第二章数据仓库体系结构

2.1体系结构框图

2.2数据抽取和转换

2.3元数据管理

2.4数据仓库的数据组织

2.4.1数据粒度的设计

2.4.2数据模型

2.5数据仓库的视图组织

2.5.1视图存在的必要性

2.5.2选择实视图

2.6数据仓库的分析处理

2.6.1联机分析处理OLAP

2.6.2数据挖掘

第三章视图存储量估计和实体化视图选择算法

3.1数据立方体

3.1.1基于关系表的数据立方体操作的提出

3.1.2具有维层次结构的数据立方体运算和存储容量的爆炸

3.2视图实体化的选择

3.2.1格框架

3.2.2维层次及复合依赖格

3.2.3数据立方体聚集视图代价模型

3.2.4实体化视图选择算法

3.3视图存储量估计

3.3.1视图存储量估计的复杂性

3.3.2视图存储量估计的方案

3.4位图索引机制

3.4.1使用位图索引的必要性

3.4.2位图索引原理

3.4.3位图索引在数据仓库中的应用

3.5其他问题

第四章视图存储量估计的DW-PCSA算法和DW-SPEA算法

4.1对现有算法的综合评价

4.2我对PCSA算法的实验验证及结论

4.2.1 PCSA算法的实验验证

4.2.2实验结论

4.3 PCSA算法分析

4.3.1关于PCSA算法的假设

4.3.2 hashing函数的可行性和局限性

4.3.3关于修正因子

4.4 hashing函数的设计

4.4.1 hash血g函数的设计原则

4.4.2长字符串hashing函数的构造

4.4.3我构造的hashing函数

4.4.4参数的选取

4.5 DW-PCSA算法

4.5.1算法描述

4.5.2其他语言环境下的DW-PCSA算法

4.6 DW-SPEA算法

4.6.1基本思路

4.6.2选择合适的估计量

4.6.3 DW-SPEA算法描述

4.7其他算法

第五章原型系统FTDW-1系统体系结构设计

5.1三层体系结构

5.2为什么采用高层开发

第六章视图存储量估计及实体化视图选择算法的实现

6.1实验系统的开发工具及开发环境

6.2算法实验环境的搭建

6.2.1为什么不使用系统的数据公共定义

6.2.2元数据管理

6.2.3实验环境中数据模型和立方体数据结构的定义

6.3算法DW-PCSA和算法DW-SPEA的实现

6.3.1算法DW-PCSA实现

6.3.2算法DW-SPEA实现

6.4贪心算法的实现

6.5确定为哪些属性建立位图索引

6.6增量估值算法D-PCSA

第七章算法性能测试

7.1实验测试数据

7.2辅助向量数量对算法DW-PCSA的精度影响

7.3数据集中互不相同元素数目很少时,辅助向量数目对算法DW-PCSA性能的影响

7.4不同修正因子下算法DW-PCSA的精度测试

7.5极优修正因子的确定

7.6不同类型数据集修正因子的测试

7.5在货票数据库上的测试

第八章探讨和展望

8.1建立Bitmap索引管理模块

8.2在邻接表的弧节点中加入弧访问频度域

8.3关于视图实体化策略

8.4一种采样策略

8.5维护hashing函数库和估计量函数库

8.6并行的必要性

参考文献

致谢

展开▼

摘要

该文分析了数据立方体视图存储量估计的三种策略:解析法、采样法、概率统计法.其中概率统计法是以P.Flajolet于1985年提出的PCSA算法为核心的.该文还提出一种新的基于采样估计的算法DW-SPEA.数据立方体中视图大小随数据仓库的数据导入发生变化,这种变化影响基于视图存储量的实视图选择算法的结果视图集.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号