【24h】

Hierarchical Classification of Chinese Documents Based on N-grams

机译:基于N元语法的中文文档层次分类

获取原文
获取原文并翻译 | 示例

摘要

This paper explores the techniques of utilizing N-gram information to categorize Chinese text documents hierarchically so that the classifier can shake off the burden of large dictionaries and complex segmentation processing, and subsequently be domain and time independent. A hierarchical Chinese text classifier is implemented. Experimental results show that hierarchically classifying Chinese text documents based N-grams can achieve satisfactory performance and outperforms the other traditional Chinese text classifiers.
机译:本文探讨了利用N-gram信息对中文文本文档进行分层分类的技术,从而使分类器摆脱了大型词典和复杂的分割处理的负担,并因此具有时域独立性。实现了分层的中文文本分类器。实验结果表明,对基于N-gram的中文文本文档进行分层分类可以取得令人满意的性能,并且优于其他传统的中文文本分类器。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号