首页> 中文期刊> 《计算机应用研究》 >基于双阈值Apriori算法和非频繁项集的关联规则挖掘方法

基于双阈值Apriori算法和非频繁项集的关联规则挖掘方法

         

摘要

针对从数据集中的正负关联规则挖掘问题,提出一种基于双阈值Apriori算法和非频繁项集的挖掘方法.首先,对通过逆文档频率(IDF)对语料库中的项(项集)进行加权,筛选出前N%的项集;然后,通过提出的双支持度阈值Apriori算法来提取频繁项集和非频繁项集,以此降低非频繁项集的数量;最后,通过置信度和升降度阈值的判断,分别从频繁项集和非频繁项集中挖掘正负关联规则.其中,创新性地利用了非频繁项集来挖掘正负关联规则.在一个医学文本数据集上的实验结果表明,提出的方法能够有效地挖掘出正负关联规则,且能够大大降低项集和规则数量.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号