首页> 外文会议>Conference of the European Chapter of the Association for Computational Linguistics;Web as corpus workshop >Some issues on the normalization of a corpus of products reviews in Portuguese
【24h】

Some issues on the normalization of a corpus of products reviews in Portuguese

机译:关于在葡萄牙语中的产品评论中的正常化若干问题

获取原文

摘要

This paper describes the analysis of different kinds of noises in a corpus of products reviews in Brazilian Portuguese. Case folding, punctuation, spelling and the use of internet slang are the major kinds of noise we face. After noting the effect of these noises on the POS tagging task, we propose some procedures to minimize them.
机译:本文介绍了在巴西葡萄牙语中的产品审查中的不同类型噪声的分析。 案例折叠,标点符号,拼写和互联网俚语的使用是我们面临的主要噪音。 在注意到这些噪声对POS标记任务的影响之后,我们提出了一些程序来最小化它们。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号