【24h】

2-Way Text Classification for Harmful Web Documents

机译:有害Web文档的2向文本分类

获取原文
获取原文并翻译 | 示例

摘要

The openness of the Web allows any user to access almost any type of information. However, some information, such as adult content, is not appropriate for all users, notably children. Additionally for adults, some contents included in abnormal porn sites can do ordinary people's mental health harm. In this paper, we propose an efficient 2-way text filter for blocking harmful web documents and also present a new criterion for clear classification. It filters off 0-grade web texts containing no harmful words using pattern matching with harmful words dictionaries, and classifies 1-grade, 2-grade and 3-grade web texts using a machine learning algorithm.
机译:Web的开放性允许任何用户访问几乎任何类型的信息。但是,某些信息(例如成人内容)并不适合所有用户,尤其是儿童。此外,对于成年人来说,色情网站中包含的某些内容可能会损害普通人的心理健康。在本文中,我们提出了一种用于阻止有害Web文档的高效2向文本过滤器,并提出了一种清晰分类的新标准。它使用与有害词词典匹配的模式过滤掉不包含有害词的0级网络文本,并使用机器学习算法对1级,2级和3级网络文本进行分类。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号