首页> 中文会议>第33届中国数据库学术会议(NDBC2016 ) >基于顺序检测的阈值为k的近似串匹配

基于顺序检测的阈值为k的近似串匹配

摘要

本文阐述近似串匹配是计算机科学的基础问题,在文本检索、生物信息学、信号处理、入侵检测、模式识别、数据挖掘和实体识别等领域具有广泛的应用,近似串匹配的效率决定了这些应用的效率.传统的动态规划方法效率低,基于自动机方法构造复杂,过滤验证方法以其高效、简明成为使用最广泛的近似串匹配方法.为了进一步提高过滤验证算法的效率,本文提出了基于局部最优规则的顺序检测方法,该方法可估计两字符串编辑距离的上界,利用该上界可过滤筛选近似串.然后将本文算法应用于阈值为k的近似串匹配中得到基于顺序检测的阈值为k的近似串匹配算法.实验结果表明,相比目前高效的Merge Filter算法,本文方法在DBLP、IMDB、WEB Corpus数据集中的时间效率至少提高37.3%.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号