首页> 中文期刊> 《科技通报》 >海量有噪声Web数据优化挖掘方法研究

海量有噪声Web数据优化挖掘方法研究

         

摘要

Web页面包含复杂的、无结构的、动态的数据信息,包含大量的、不完全的、有噪声的、模糊的、随机的数据,干扰了正常的提取过程。为此提出一种改进Apriori算法的海量Web数据高效挖掘方法。在自然连接产生候选集以前先进行一个修剪过程,减少参加连接的项集数量,因而减小生成的候选项集规模,减少了循环迭代次数和运行时间,同时在连接判断步骤中减少多余的判断次数。实验表明,该方法能够迅速排除冗余数据干扰,提高了挖掘的准确性。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号