首页> 中文学位 >析取闭合项集的快速生成和恢复算法研究
【6h】

析取闭合项集的快速生成和恢复算法研究

代理获取

目录

封面

声明

中文摘要

英文摘要

致谢

目录

插图清单

表格清单

第1章绪论

1.1研究背景和意义

1.2国内外研究现状

1.3本文研究的主要内容

1.4本文的组织结构

1.5本章小结

第2章 频繁项集精简表示研究

2.1频繁项集基本概念

2.2精简表示模型概述

2.3几种精简表示模型的对比

2.4本章小结

第3章 快速生成析取闭合项集算法

3.1引言

3.2基于FP树的析取闭合项集挖掘算法

3.3针对FP树挖掘的性质

3.4算法

3.5实验结果分析

3.6本章小结

第4章 频繁项集的动态恢复算法

4.1引言

4.2动态规划

4.3恢复算法

4.4实例

4.5实验结果分析

4.6本章小结

第5章结束语

5. 1本文总结

5.2未来工作展望

参考文献

攻读硕士学位期间参加研究的课题和发表的论文

展开▼

摘要

传统关联分析需要处理大量的频繁项集以得到可用的关联规则。为提高规则的抽取效率,已有多种频繁项集的精简模型被提出。但是目前关于频繁精简项集的快速挖掘和处理算法的研究还相对缺乏,这制约了关联分析在实际中的应用范围,尤其是在在线分析领域。
  基于析取闭合项集的频繁项集精简表示模型是现有最优的一种精简表示模型。本文在深入分析析取闭合项集性质和特点的基础上,以寻找能改善析取闭合项集挖掘和恢复过程性能的技术,并设计出针对性的快速算法。
  本文的主要研究工作如下:
  (1)针对目前析取闭合项集挖掘效率低下的问题,提出了基于FP树的快速生成算法MDCPBFP。首先设计了利用FP树挖掘析取闭合项集的基本方法,然后探讨了挖掘过程中可提高剪枝效率的几个性质,并将其用于加速析取闭合项集的生成和析取支持度的计算。实验结果表明,本算法比基于逐层迭代方法的挖掘算法DCPRMINER执行效率大大提高。
  (2)针对从频繁项集的精简集恢复全体频繁项集的问题,提出了一种恢复算法DCPTFI。该算法基于集合的容斥原理,采用动态规划思想,通过保存公共子项集及其析取支持度,可由频繁项集Lk-1快速生成候选项集Ck,并使用Apriori性质对Ck进行剪枝,提高从析取闭合项集恢复频繁项集的效率。实验表明,该算法比传统的频繁项集生成算法效率高得多。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号