首页> 外文期刊>RISTI - Revista Ibérica de Sistemas e Tecnologias de Informao >Heurísticas para Data Augmentation en NLP: Aplicación a Revisiones de Artículos Científicos
【24h】

Heurísticas para Data Augmentation en NLP: Aplicación a Revisiones de Artículos Científicos

机译:NLP中数据增强的启发式方法:在科学文章评论中的应用

获取原文
       

摘要

Las técnicas de data augmentation son esenciales para entrenar algoritmos de machine learning, donde el conjunto de datos inicial es más peque?o que lo requerido debido a la complejidad del modelo. En modelos de aprendizaje automático, la robustez del proceso de entrenamiento depende altamente de grandes volúmenes de datos etiquetados, los cuales son costosos de producir. Un enfoque eficaz para tratar con este problema es generar automáticamente nuevos ejemplos etiquetados usando técnicas de data augmentation. En el procesamiento del lenguaje natural, en particular en el idioma espa?ol, hay una falta de técnicas bien definidas que permitan incrementar un conjunto de datos. En este artículo, se proponen un conjunto de heurísticas para data augmentation en NLP, las cuales son aplicadas en el dominio de las revisiones de artículos científicos.
机译:数据增强技术对于训练机器学习算法至关重要,在该机器学习算法中,由于模型的复杂性,初始数据集小于所需的数据集。在机器学习模型中,训练过程的鲁棒性高度依赖于大量标记数据,而这些标记数据的生产成本很高。解决此问题的有效方法是使用数据增强技术自动生成新的标记样本。在自然语言处理中,尤其是在西班牙语中,缺少定义明确的技术来增加数据集。在本文中,提出了一套在NLP中用于数据增强的启发式方法,这些启发式方法被应用于科学论文评论领域。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号