首页> 中文学位 >Study on New Approach for Effective Mining Association Rules from Huge Databases
【6h】

Study on New Approach for Effective Mining Association Rules from Huge Databases

代理获取

摘要

数据挖掘是一项在大规模数据中寻找有用规则的逻辑过程。过去三十年间,计算机硬件和系统软件的指数倍增长使得功能强大的计算机、数据采集仪器和存储媒体被大规模采购。这项技术刺激了数据库和信息产业的发展,带动了工业界交易管理信息检索和数据分析,从这些数据中抽取关联规则成为数据挖掘中一项重要和有挑战的任务。
   关联规则挖掘是数据挖掘中的一种描述性的技术,它可以定义为从大规模数据中发现有意义模式的过程(在交易数据中共同出现的项目集)。挖掘频繁模式是关联规则挖掘的一个基础部分。数据挖掘指的是从大规模数据中抽取或挖掘知识。然而,关联规则挖掘之前的研究大多采用一种类似Apriogi算法从交易数据中产生关联规则。这种类Apriori算法有两个缺点:需要产生数量庞大的候选集合,需要反复扫描数据库并且从候选集合中检查模式匹配。
   此论文的目的是探索关联规则挖掘算法并且提出一种新的关联规则挖掘算法,得到比类Apri耐算法更好的性能。本文提出的算法结合了模式增长方式和apriori规则生成方式。本文的另一个目的是将提出的模型应用到真实购物篮分析中,以评估其有效性。从算法分析得到的知识可以提高商品促销活动的效果。
   通过在搜集的和已有的数据集上进行的实验,本文提出的算法在稠密数据集和稀疏数据集上都优于类Apriori算法的性能。本文主要分为五个部分:第一章介绍了数据挖掘的背景基础知识。第二章正式提出了频繁项目集挖掘问题并且介绍了关联规则挖掘领域最近的研究状况。第三章比较了频繁模式增长策略,并且提出了本文的算法。第四章利用提出的算法在一个超市数据集上进行了实验。第五章进行了算法的评估并最后总结并指出了未来工作。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号