首页> 中文会议>第33届中国数据库学术会议(NDBC2016 ) >有效地挖掘一种新的高效用序列代表形式

有效地挖掘一种新的高效用序列代表形式

摘要

从序列数据库挖掘高效用序列是数据挖掘的一项重要任务.尽管大量的高效用序列挖掘算法被提出,可是它们展现了太多的高效用序列,使得用户需要继续从中挑选有用的序列.这不仅需要对大量高效用序列的二次开发建立理论基础,而且需要将二次开发的算法融入到现有的高效用序列挖掘算法中,提高算法的效率及有效性.在高效用项集挖掘中,研究人员对高效用项集提出了一种新的代表形式——闭合高效用项集.有了这个概念,高效用项集的数量被大量减少了.同时,闭合高效用项集在现实生活中是有意义的.受“闭合高效用项集”的启发,本文提出了一种新的高效用序列代表形式——闭合高效用序列,并在理论上证明了在对序列数据库的挖掘过程中效用限制与闭合属性的不同连接顺序产生相同的结果集。本文同时提出了一个有效的算法CloHUS挖掘闭合高效用序列。在CloHUS中原始数据集经过两次扫描被转化为效用列表,搜索空间为一棵字典序列树,三个有效的策略被采用修剪搜索空间.在合成效用值的真实数据集上进行了大量的实验,用于评估CloHUS和高效用序列挖掘算法Uspan的性能.实验结果表明在序列数据库中闭合高效用序列的数量远小于高效用序列的数量,CloHUS在运行时间和内存消耗方面均优于Uspan.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号