首页> 中文会议>全国第七届计算语言学联合学术会议 >使用互信息辅助在篇章范围内识别命名实体

使用互信息辅助在篇章范围内识别命名实体

摘要

识别命名实体(本文指专有名称、未登录普通词和篇章术语)是中文处理的一个重要问题.本文采用篇章内统计的方法,计算文本文档初步切分后任意两个邻接项(包括词和落单字)的互信息,以此作为判定这两个领接项是否可能形成新的命名实体的依据.对于可能形成新命名实体的串,继续利用互信息并结合构词法向左右两个方向扩展来确定其边界.最后根据串的内部构造和篇章上下文确定命名实体的类别.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号