首页> 中文学位 >关系数据库中多表间关联规则算法研究
【6h】

关系数据库中多表间关联规则算法研究

代理获取

目录

文摘

英文文摘

声明

第1章 绪论

1.1 引言

1.2 研究现状及发展前景

1.2.1 数据挖掘研究现状

1.2.2 关联规则研究现状

1.2.3 发展前景

1.3 主要内容和组织结构

1.3.1 主要内容

1.3.2 组织结构

第2章 数据挖掘技术及相关理论

2.1 引言

2.2 数据挖掘的基本概念及特点

2.2.1 数据挖掘的基本概念

2.2.2 数据挖掘的特点

2.3 数据挖掘的分类

2.3.1 按照数据库的类型分类

2.3.2 按照挖掘的知识类型分类

2.3.3 按照使用的挖掘技术分类

2.4 数据挖掘的系统结构

2.5 数据挖掘的应用

2.6 本章小结

第3章 关联规则挖掘及算法分析

3.1 引言

3.2 关联规则的基本概念

3.3 关联规则的分类

3.4 传统关联规则挖掘算法分析

3.4.1 Aprioti算法与分析

3.4.2 FP_growth算法与分析

3.5 常见多关系间关联规则算法

3.5.1 关系数据库中数据的特点

3.5.2 多关系间关联规则算法

3.6 本章小结

第4章 关系数据库中多表关联的挖掘算法

4.1 引言

4.2 关系数据库中多表间关联规则的特征

4.3 元组标识传播

4.4 改进 Apriori算法

4.4.1 Apriori算法的缺陷

4.4.2 改进策略

4.4.3 定性分析

4.5 多表关联的算法BMM

4.5.1 数据预处理

4.5.2 查找频繁项集

4.5.3 算法的数据结构

4.5.4 算法的流程

4.5.5 算法描述

4.6 本章小结

第5章 算法验证分析

5.1 引言

5.2 实验环境

5.3 算法实现

5.3.1 数据导入

5.3.2 查找频繁项集

5.3.3 算法比较分析

5.4 本章小结

结论

参考文献

攻读学位期间发表的学术论文

致谢

展开▼

摘要

随着数据库技术的飞速发展以及Internet的迅猛普及,数据库技术已成为信息社会中对大量数据进行有效组织与管理的重要技术。特别是近些年在各大商场、书店等使用的条码技术,更为各企业方便快捷地收集数据提供了帮助。数据挖掘技术正好可以从大量数据中发现隐藏在数据背后的知识,从而帮助人们更好地理解事物的本质。 关联规则是数据挖掘中一种重要的知识类型。随着关系数据库的广泛使用,研究关系数据库中的关联规则挖掘算法有着广阔的发展前景。当前这方面的常用算法是基于单表的,这些算法虽可以应用于多个表上,但需进行相应的转化-将多个表转换为一个表后才可应用。另外,还有基于ILP技术提出的算法等,这些算法分别在挖掘效率及应用范围、模式表示等方面存在一些不足,这就要求提出新的关联规则挖掘算法以适应需求。 本文通过研究分析,借鉴传统的Apriori关联规则算法的先进思想,分析了该算法在时间复杂度以及只应用于事务数据库的不足的基础上,结合CrossMine算法中的元组标识传播(Tuple ID Propagation)的思想,提出了一种新的应用于关系数据库中多表间关联规则挖掘的算法BMM。该算法通过分析关系数据库中关联规则的多值、多维等特性,针对这些特征采取相应的措施来解决:首先对关系数据集进行数据预处理,以适应关联规则的发现,然后,通过扩展元组标识传播的思想得到每个属性所对应的目标关系ID,以此可以通过目标关系ID将所有考察的多表间的属性联系起来,从而可以直接作用在多个表上;最后,算法中的数据结构采用了链表结构来表示频繁项集及其对应的目标关系ID,以达到减少对数据库的访问次数。 最后通过实验验证BMM算法。同时将BMM算法与基于SQL的算法进行比较做出了比较分析,实验证明该BMM算法表现出更好的时间性能。

著录项

  • 作者

    毛弟弟;

  • 作者单位

    哈尔滨理工大学;

  • 授予单位 哈尔滨理工大学;
  • 学科 计算机应用技术
  • 授予学位 硕士
  • 导师姓名 郝忠孝;
  • 年度 2009
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类 TP311.132.3;
  • 关键词

    关系数据库; 数据挖掘; 关联规则; BMM算法;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号