要解决的问题:提供一种文本分类程序,服务器和方法,用于防止在使用预先注册的关键字进行分类时将非非法或有害文本信息分类为非法/有害类别。
解决方案:多个不属于特定类别的合法学习文本信息和多个属于特定类别的非法学习文本信息被存储在学习文本存储装置中。搜索包括搜索关键字的学习到的文本信息。提取用于搜索关键字的修改关键字。将每个修改关键词的合法性率计算为合法学习文本信息的数量相对于所有学习文本信息的数量。将合法性不低于预定阈值的修改关键字注册为非搜索关键字,以生成非搜索关键字词典。防止搜索包括非搜索关键字作为搜索关键字的修改关键字的文本信息。
版权:(C)2011,日本特许厅&INPIT
公开/公告号JP5364010B2
专利类型
公开/公告日2013-12-11
原文格式PDF
申请/专利权人 株式会社KDDI研究所;
申请/专利号JP20100033208
申请日2010-02-18
分类号G06F17/30;
国家 JP
入库时间 2022-08-21 16:13:16