首页> 外文会议>Discovery science >String Kernels Based on Variable-Length-Don't-Care Patterns
【24h】

String Kernels Based on Variable-Length-Don't-Care Patterns

机译:基于可变长度免维护模式的字符串核

获取原文
获取原文并翻译 | 示例

摘要

We propose a new string kernel based on variable-length-don't-care patterns (VLDC patterns). A VLDC pattern is an element of (Σ_∪{★})*, where Σ is an alphabet and ? is the variable-length-don't-care symbol that matches any string in Σ*. The number of VLDC patterns matching a given string s of length n is O(2~(2n)). We present an O(n~5) algorithm for computing the kernel value. We also propose variations of the kernel which modify the relative weights of each pattern. We evaluate our kernels using a support vector machine to classify spam data.
机译:我们提出了一种基于可变长度无关模式(VLDC模式)的新字符串内核。 VLDC模式是(Σ_∪{★})*的元素,其中Σ是字母,而?是字母。是与Σ*中的任何字符串匹配的可变长度无关符号。匹配长度为n的给定字符串s的VLDC模式的数量为O(2〜(2n))。我们提出了一种O(n〜5)算法来计算内核值。我们还提出了内核的变体,这些变体会修改每个模式的相对权重。我们使用支持向量机对垃圾邮件数据进行分类来评估内核。

著录项

  • 来源
    《Discovery science》|2008年|308-318|共11页
  • 会议地点 Budapest(HU);Budapest(HU)
  • 作者单位

    Department of Informatics, Kyushu University;

    Department of Informatics, Kyushu University;

    Department of Informatics, Kyushu University;

    Graduate School of Information Science and Electrical Engineering, Kyushu University 744 Motooka, Nishiku, Fukuoka, 819-0395 Japan;

    Department of Informatics, Kyushu University;

  • 会议组织
  • 原文格式 PDF
  • 正文语种 eng
  • 中图分类 人工智能理论;
  • 关键词

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号