首页> 中文期刊> 《电脑知识与技术》 >重复网页检测算法综述

重复网页检测算法综述

         

摘要

重复网页检测是搜索引擎的关键技术之一,算法的选择直接影响搜索引擎的检索效率。该文详细分析了现目前常用的重复网页检测算法,并从算法所采取的两个步骤(特征提取,特征比较)入手,比较了各算法的异同与其各自的优缺点,为进一步优化算法找出思路。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号