首页> 中国专利> 一种基于决策树及变体识别的敏感词检测方法

一种基于决策树及变体识别的敏感词检测方法

摘要

本发明属于自然语言处理技术领域,提供了一种基于决策树及变体识别的敏感词检测方法,方法如下,S1.构建敏感词词典并按预设周期更新,敏感词按照首字母顺序将汉字字形和对应的拼音添加至所述敏感词词典中,并根据敏感词词典构建决策树;S2.将文本输入至敏感词检测模型中,所述敏感词检测模型以所述决策树为基础通过匹配算法以及匹配标准检测文本中的敏感词,并对所述敏感词进行定位;通过本申请对字形与拼音的直接对比以及相似度对比,可有效解决未收入敏感词问题以及修改敏感词字形、拼音或英文来逃避检测的问题。

著录项

  • 公开/公告号CN114091436A

    专利类型发明专利

  • 公开/公告日2022-02-25

    原文格式PDF

  • 申请/专利权人 万商云集(成都)科技股份有限公司;

    申请/专利号CN202210072534.X

  • 发明设计人 王飞;田文洪;刘文鑫;

    申请日2022-01-21

  • 分类号G06F40/242(20200101);G06F40/194(20200101);

  • 代理机构51217 成都睿道专利代理事务所(普通合伙);

  • 代理人薛波

  • 地址 610023 四川省成都市锦江区工业园区金石路166号天府宝座A座6楼682号

  • 入库时间 2023-06-19 14:15:58

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-03-15

    实质审查的生效 IPC(主分类):G06F40/242 专利申请号:202210072534X 申请日:20220121

    实质审查的生效

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号