首页> 外文会议>;42nd Annual Meeting of the Association for Computational Linguistics >A Statistical Model for Hangeul-Hanja Conversion in Terminology Domain
【24h】

A Statistical Model for Hangeul-Hanja Conversion in Terminology Domain

机译:术语领域中韩文-汉字转换的统计模型

获取原文

摘要

Sino-Korean words, which are historicallyborrowed from Chinese language, could berepresented with both Hanja (Chinesecharacters) and Hangeul (Korean characters)writings. Previous Korean Input MethodEditors (IMEs) provide only a simpledictionary-based approach for Hangeul-Hanjaconversion. This paper presents a sentencebasedstatistical model for Hangeul-Hanjaconversion, with word tokenization includedas a hidden process. As a result, we reach91.4% of character accuracy and 81.4% ofword accuracy in terminology domain, whenonly very limited Hanja data is available.
机译:中韩文字,在历史上 从中国借来的,可能是 均由Hanja代表(中文 字符)和韩文(韩文字符) 著作。以前的韩文输入法 编辑器(IME)仅提供一个简单的 基于字典的Hangeul-Hanja方法 转换。本文提出了一个基于句子的 Hangeul-Hanja的统计模型 转换,包括单词标记化 作为一个隐藏的过程。结果,我们达到 91.4%的字符准确度和81.4%的字符准确度 术语领域中的单词准确性,何时 仅提供非常有限的Hanja数据。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号