首页> 外文会议>Workshop on discourse in machine translation >Treatment of Markup in Statistical Machine Translation
【24h】

Treatment of Markup in Statistical Machine Translation

机译:统计机器翻译中标记的治疗

获取原文

摘要

We present work on handling XML markup in Statistical Machine Translation (SMT). The methods we propose can be used to effectively preserve markup (for instance inline formatting or structure) and to place markup correctly in a machine-translated segment. We evaluate our approaches with parallel data that naturally contains markup or where markup was inserted to create synthetic examples. In our experiments, hybrid reinsertion has proven the most accurate method to handle markup, while alignment masking and alignment reinsertion should be regarded as viable alternatives. We provide implementations of all the methods described and they are freely available as an open-source framework.
机译:我们在统计机器翻译(SMT)中处理XML标记的工作。我们提出的方法可用于有效地保护标记(例如内联格式或结构)并在机器翻译的段中正确地将标记放置。我们评估我们的方法与天然包含标记的并行数据或插入标记以创建合成示例。在我们的实验中,混合重新插入已经证明了处理标记的最准确的方法,而对准遮蔽和对准再引用应被视为可行的替代品。我们提供所描述的所有方法的实现,它们是可自由的作为开源框架提供的。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号