首页> 外文OA文献 >Metodología para la extracción de metadatos semánticos de textos en español utilizando procesamiento de lenguaje natural: subaplicación para la identificación de contextos espaciales y temporales en textos que describan interacciones entre actores
【2h】

Metodología para la extracción de metadatos semánticos de textos en español utilizando procesamiento de lenguaje natural: subaplicación para la identificación de contextos espaciales y temporales en textos que describan interacciones entre actores

机译:使用自然语言处理从西班牙语文本中提取语义元数据的方法:子应用程序,用于识别描述参与者之间交互的文本中的时空上下文

摘要

En este trabajo describe el proceso por el cual se ha efectuado la extracción de información e identificación de eventos en un corpus construido para estos fines y compuesto por textos históricos pertenecientes a la Iglesia Católica en el s. XIX en Colombia entre los años 1869 y 1880, con un tamaño de 224 documentos. Este material pertenece a los archivos de la Arquidiócesis de Medellín y ha sido recopilado y suministrado por el padre Iván Darío Toro, Decano de la facultad de Filosofía y Teología de la Fundación Universitaria Luis Amigó y docente de la Escuela de Administración y Negocios de la Universidad EAFIT. Los procesos de extracción de información incluyeron la identificación automática de personajes, lugares y fechas por medio de la aplicación de algoritmos y heurísticas empleadas en las bibliotecas digitales. La identificación de eventos se llevó a cabo utilizando la combinatoria de las etiquetas extraídas previamente del corpus.
机译:这项工作描述了在为此目的而构建的语料库中进行信息提取和事件识别的过程,该语料库由属于天主教堂的历史文本组成。 1869年至1880年在哥伦比亚的XIX,文件大小为224。该材料属于麦德林大主教管区的档案,由路易斯·阿米米奥大学基金会哲学与神学学院院长,大学行政与商业学院教授伊万·达里奥·托罗神父编辑和提供。 EAFIT。信息提取过程包括通过应用数字图书馆中使用的算法和启发式方法来自动识别字符,位置和日期。使用先前从语料库中提取的标记的组合来进行事件的识别。

著录项

  • 作者

    Duque Bedoya Erika Teresa;

  • 作者单位
  • 年度 2014
  • 总页数
  • 原文格式 PDF
  • 正文语种 spa
  • 中图分类

相似文献

  • 外文文献
  • 中文文献
  • 专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号