首页> 外文会议>Traitement automatique des langues naturelles >Identification automatique de zones dans des documents pour la constitution d'un corpus médical en fran?ais
【24h】

Identification automatique de zones dans des documents pour la constitution d'un corpus médical en fran?ais

机译:自动识别法国医疗语料库宪法的文献区域

获取原文

摘要

De nombreuses informations cliniques sont contenues dans le texte des dossiers électroniques de patients et ne sont pas directement accessibles à des fins de traitement automatique. Pour pallier cela, nous préparons un large corpus annoté de documents cliniques. Une première étape de ce travail consiste à séparer le contenu médical des documents et les informations administratives contenues dans les en-têtes et pieds de page. Nous présentons un système d'identification automatique de zones dans les documents cliniques qui offre une F-mesure de 0,97, équivalente à l'accord inter-annoteur de 0,98. Notre étude montre que le contenu médical ne représente que 60% du contenu total de notre corpus, ce qui justifie la nécessité d'une segmentation en zones. Le travail d'annotation en cours porte sur les sections médicales identifiées.
机译:许多临床信息包含在患者电子记录的文本中,并且不能直接访问自动处理目的。为了克服这一点,我们准备了一个宽的临床文献语料库。这项工作的第一步是将医疗内容与页眉和页脚中包含的行政信息分开。我们在临床文献中提出了一个自动区域识别系统,提供0.97 F级,相当于年龄协议0.98。我们的研究表明,医疗内容仅代表我们的语料库总数的60%,这证明了区域中的细分。当前的注释工作重点是所确定的医疗部分。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号