首页> 中文会议>第十八届中国计算语言学大会暨中国中文信息学会2019学术年会 >面向儿科疾病的实体及实体关系标注语料库构建

面向儿科疾病的实体及实体关系标注语料库构建

摘要

针对当前医学语料库涵盖实体分类以及实体关系难以满足精准医学发展需求的问题,本文从儿科疾病入手,参考现有的医学命名实体和实体关系标注体系,在医学领域专家的指导下,制定了适合儿科学的命名实体和实体关系的标注体系及详细标注规范;利用自行开发的标注工具,在采用机器学习进行预标注实体及实体关系后;以标注规范为指导,进行多轮人工标注,完成了298余万字的儿科医学文本中的实体及关系进行标注,形成了面向儿科疾病的实体及实体关系标注语料库.所构建的语料库包含504种儿科常见疾病,共标注命名实体23,603个,实体关系36,513个,多轮标注一致性分别为0.85和0.82.抽取已构建实体及关系标注语料库中的多元组,形成了儿科医学知识图谱,并开发了基于知识图谱的儿科医学知识问答系统.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号