基于DFA的蒙古文自动校对算法

摘要

随着蒙古文信息处理和电子出版业的迅猛发展,文本校对的工作量大大增加,自动校对已成为一个亟待解决的课题。本文首先分析了蒙古文电子文本中存在的错误类型,出错原因以及常用的查错纠错方法,然后根据蒙古文特有的书写习惯和编码特点提出一种基于有限状态自动机的校对算法。该算法采用了常用的基于词典和规则的校对方法,但用有限状态自动机组织词典数据和规则后大大提高了算法的响应速度。在扩建蒙古文语料库的过程中试用该算法后发现与基于字符串比较的词典查找相比在速度上提高了99%以上,在实时校对中对单个词的响应时间在0.2毫秒以内。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号