Heurísticas para Data Augmentation en NLP: Aplicación a Revisiones de Artículos Científicos

Rubén Sánchez Acosta; Claudio Meneses Villegas; Brian Keith Norambuena

首页> 外文期刊>RISTI - Revista Ibérica de Sistemas e Tecnologias de Informao >Heurísticas para Data Augmentation en NLP: Aplicación a Revisiones de Artículos Científicos

【24h】

Heurísticas para Data Augmentation en NLP: Aplicación a Revisiones de Artículos Científicos

机译：NLP中数据增强的启发式方法：在科学文章评论中的应用

获取原文

掌桥外文数据库（机构版） >>

开具论文收录证明 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

Las técnicas de data augmentation son esenciales para entrenar algoritmos de machine learning, donde el conjunto de datos inicial es más peque?o que lo requerido debido a la complejidad del modelo. En modelos de aprendizaje automático, la robustez del proceso de entrenamiento depende altamente de grandes volúmenes de datos etiquetados, los cuales son costosos de producir. Un enfoque eficaz para tratar con este problema es generar automáticamente nuevos ejemplos etiquetados usando técnicas de data augmentation. En el procesamiento del lenguaje natural, en particular en el idioma espa?ol, hay una falta de técnicas bien definidas que permitan incrementar un conjunto de datos. En este artículo, se proponen un conjunto de heurísticas para data augmentation en NLP, las cuales son aplicadas en el dominio de las revisiones de artículos científicos.

机译：数据增强技术对于训练机器学习算法至关重要，在该机器学习算法中，由于模型的复杂性，初始数据集小于所需的数据集。在机器学习模型中，训练过程的鲁棒性高度依赖于大量标记数据，而这些标记数据的生产成本很高。解决此问题的有效方法是使用数据增强技术自动生成新的标记样本。在自然语言处理中，尤其是在西班牙语中，缺少定义明确的技术来增加数据集。在本文中，提出了一套在NLP中用于数据增强的启发式方法，这些启发式方法被应用于科学论文评论领域。

著录项

来源
《RISTI - Revista Ibérica de Sistemas e Tecnologias de Informao》 |2019年第34期|共10页
作者
Rubén Sánchez Acosta; Claudio Meneses Villegas; Brian Keith Norambuena;
展开▼
作者单位

展开▼
收录信息
原文格式 PDF
正文语种
中图分类计算技术、计算机技术;
关键词
Data AugmentationNLPRevisiones de Artículos;

机译：数据增强NLPR文章评论;

相似文献

外文文献
中文文献
专利

1. Tesis en formato de artículo científico: oportunidad para incrementar la producción científica universitaria [J] . Mayta-Tristán Percy Acta Médica Peruana . 2016,第2期

机译：科学论文形式的论文：增加大学科学产量的机会
2. Propuestas para el control de la coautoría “de pago” en la producción de artículos científicos [J] . Jorge Caldera Serrano Cuadernos de Documentación Multimedia . 2020,第43期

机译：科学文章生产中Coautoría“付款”的建议
3. Artículos científicos sobre turismo para personas con discapacidad en revistas Iberoamericanas de turismo. Una propuesta de categorización [J] . Alexandre Panosso Netto, José Jonathan Ibarra Coronel Pasos: revista de turismo y patrimonio cultural . 2016,第1期

机译：伊比利亚-美洲旅游杂志上有关残疾人旅游的科学文章。分类建议
4. Modelo de verificación de palabras clave en artículos científicos [C] . Alexander Castro-Romero, Juan Sebastián González-Sanabria, Javier Antonio Ballesteros-Ricaurte IEEE Biennial Congress of Argentina . 2016

机译：科学文章中的关键字验证模型
5. Theoretical and Empirical Contributions for a Scientific Understanding of Attitudes toward Same-Sex Families in Portugal =Contribuições teóricas e empíricas para um conhecimento científico das atitudes em relação às famílias homoparentais em Portugal [D] . Costa, Pedro Alexandre Nunes da. 2013

机译：科学地了解葡萄牙对同性家庭的态度的理论和经验贡献=葡萄牙对同性家庭的态度对科学知识的理论和经验贡献
6. Lectura crítica de artículos científicos que la industria farmacéutica ofrece a los médicos de familia [O] . Jose Ángel Cortés Márquez, Miguel Jiménez Blázquez, Eva Monge Casares, 2006

机译：阅读制药行业提供家庭医生的科学文章批评
7. Fundamentos para la Elaboración de Artículos Científicos en Trauma y Cuidado Agudo de Emergencias (Parte 4): Recomendaciones para Organizacióny Publicación de la Escritura Científica en Lenguaje Nó Nativo [O] . Andres M Rubiano, Raúl A Echeverri, Erica Johnson, 2018

机译：基础是制备创伤和急性急护理科学文章（第4部分）：母语中的科学写作的组织和出版的建议

Heurísticas para Data Augmentation en NLP: Aplicación a Revisiones de Artículos Científicos

摘要

著录项

相似文献

相关主题

期刊订阅