首页> 外文会议>Thirteenth workshop on innovative use of NLP for building educational applications 2018 >Complex Word Identification Based on Frequency in a Learner Corpus
【24h】

Complex Word Identification Based on Frequency in a Learner Corpus

机译:学习者语料库中基于频率的复杂词识别

获取原文
获取原文并翻译 | 示例

摘要

We introduce the TMU systems for the complex word identification (CWI) shared task 2018. TMU systems use random forest classifiers and regressors whose features are the number of characters and words and the frequency of target words in various corpora. Our simple systems performed best on 5 of the 12 tracks. Ablation analysis confirmed the usefulness of a learner corpus for a CWI task.
机译:我们介绍了用于复杂单词识别(CWI)共享任务2018的TMU系统。TMU系统使用随机森林分类器和回归器,其特征是各种语料库中字符和单词的数量以及目标单词的频率。我们的简单系统在12条轨道中的5条上表现最佳。消融分析证实了学习者语料库对CWI任务的有用性。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号