【24h】

Tagged Back-Translation

机译:标记回译

获取原文

摘要

Recent work in Neural Machine Translation (NMT) has shown significant quality gains from noised-beam decoding during back-translation, a method to generate synthetic parallel data. We show that the main role of such synthetic noise is not to diversify the source side, as previously suggested, but simply to indicate to the model that the given source is synthetic. We propose a simpler alternative to noising techniques, consisting of tagging back-translated source sentences with an extra token. Our results on WMT outperform noised back-translation in English-Romanian and match performance on English-German, re-defining state-of-the-art in the former.
机译:神经机器翻译(NMT)的最新工作表明,在反向翻译过程中,噪声波束解码可显着提高质量,这是一种生成合成并行数据的方法。我们表明,这种合成噪声的主要作用不是像先前建议的那样使源侧多样化,而只是向模型表明给定源是合成的。我们提出了一种更简单的噪声技术替代方案,包括用额外的标记标记反向翻译的源语句。我们在WMT上的结果胜过英语-罗马尼亚语的杂音反向翻译,而在英语-德语中的表现则更好,从而重新定义了前者的最新技术。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号