首页> 外文会议>Annual meeting of the Association for Computational Linguistics >NNE: A Dataset for Nested Named Entity Recognition in English Newswire
【24h】

NNE: A Dataset for Nested Named Entity Recognition in English Newswire

机译:NNE:英语新闻专线中的嵌套命名实体识别数据集

获取原文

摘要

Named entity recognition (NER) is widely used in natural language processing applications and downstream tasks. However, most NER tools target flat annotation from popular datasets, eschewing the semantic information available in nested entity mentions. We describe NNE—a fine-grained, nested named entity dataset over the full Wall Street Journal portion of the Penn Treebank (PTB). Our annotation comprises 279,795 mentions of 114 entity types with up to 6 layers of nesting. We hope the public release of this large dataset for English newswire will encourage development of new techniques for nested NER.
机译:命名实体识别(NER)被广泛用于自然语言处理应用程序和下游任务中。但是,大多数NER工具都以流行的数据集中的平面注释为目标,而避开了嵌套实体提及中可用的语义信息。我们描述了NNE-宾夕法尼亚州树银行(PTB)整个《华尔街日报》部分上的细粒度,嵌套的命名实体数据集。我们的注释包括对279,795条114种实体类型的提及,最多可嵌套6层。我们希望该大型英语新闻专线数据集的公开发布会鼓励开发嵌套式NER的新技术。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号