首页> 中文期刊> 《中文信息学报》 >多文种环境下汉字内码识别算法的研究

多文种环境下汉字内码识别算法的研究

         

摘要

汉字内码向ISO/ IEC 10646过渡是实现计算机用文字编码统一的必然趋势,但目前在一段时间内仍将存在多种汉字内码并存的情况,所以实现汉字内码的自动识别是保证汉字多内码并存的关键.本文主要探讨了如何在多内码并存的多文种环境中实现汉字内码自动识别的问题,并提供了多种汉字内码识别算法,包括基于内码分布、标点符号特征、字频特征和语义特征的识别算法等.在此基础上,本文对不同的识别算法进行分析和评估.在对目标样本的测试中,以上算法的识别率最高可以达到99.9%以上.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号