首页> 外文会议>Workshop on discourse in machine translation >Treatment of Markup in Statistical Machine Translation
【24h】

Treatment of Markup in Statistical Machine Translation

机译:统计机器翻译中标记的处理

获取原文

摘要

We present work on handling XML markup in Statistical Machine Translation (SMT). The methods we propose can be used to effectively preserve markup (for instance inline formatting or structure) and to place markup correctly in a machine-translated segment. We evaluate our approaches with parallel data that naturally contains markup or where markup was inserted to create synthetic examples. In our experiments, hybrid reinsertion has proven the most accurate method to handle markup, while alignment masking and alignment reinsertion should be regarded as viable alternatives. We provide implementations of all the methods described and they are freely available as an open-source framework.
机译:我们介绍在统计机器翻译(SMT)中处理XML标记的工作。我们提出的方法可用于有效保留标记(例如,内联格式或结构)并将标记正确放置在机器翻译的段中。我们使用自然包含标记或在其中插入标记以创建综合示例的并行数据评估我们的方法。在我们的实验中,混合重新插入已被证明是处理标记的最准确方法,而对齐遮罩和重新插入对齐应被视为可行的选择。我们提供了所描述的所有方法的实现,它们可以作为开放源代码框架免费获得。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号