首页> 中文期刊> 《计算机工程与应用》 >朝汉混排古籍的文字切分方法

朝汉混排古籍的文字切分方法

         

摘要

为解决朝鲜语古籍数字化中朝汉文种混排字符切分困难的问题,提出一种朝鲜语古籍图像的文字切分算法.针对古籍列与列之间存在不连续间隔线、倾斜或者粘连等问题,提出一种基于连通域投影的列切分方法.利用连通域的删除、合并、拆分等操作对文字进行切分.使用一种多步切分法完成了具有文字大小不一,横向、纵向混合排版特点图像的字符切分工作.对于粘连字,采用改进的滴水算法进行有效切分.实验结果表明所提出的算法能够很好地完成朝、汉文种混排,文字大小不一,排版情况复杂的朝鲜语古籍图像的文字切分工作.该算法的列切分准确率为97.69%,字切分准确率为87.79%.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号