【24h】

A Joint Model of Orthography and Morphological Segmentation

机译:正字法和形态学分割的联合模型

获取原文

摘要

We present a model of morphological segmentation that jointly learns to segment and restore orthographic changes, e.g., funniest → fun-y-est. We term this form of analysis canonical segmentation and contrast it with the traditional surface segmentation, which segments a surface form into a sequence of substrings, e.g., funniest → funn-i-est. We derive an importance sampling algorithm for approximate inference in the model and report experimental results on English, German and Indonesian.
机译:我们提供了一种形态学分割模型,该模型可共同学习以分割和恢复正交变化,例如,最有趣的→最有趣的。我们将这种形式的分析称为标准分割,并将其与传统的表面分割进行对比,传统的表面分割将表面形式分割为一系列子串,例如funnest→funn-i-est。我们推导了模型中用于近似推断的重要性采样算法,并报告了英语,德语和印尼语的实验结果。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号