首页> 外国专利> Method and apparatus for automatic character type classification of european script documents

Method and apparatus for automatic character type classification of european script documents

机译:欧洲文字文件的自动字符类型分类的方法和设备

摘要

An automatic abstract character coding system automatically generates abstract coded characters (Figs. 5,6) from the text image of a document (100;Fig. 2) when the gross script-type is known to be, or is determined to be, a European type script. A connected component generating means (28) generates connected components from the pixels comprising the text image. A spatial feature determining means (30) generates a character cell (Fig. 4) surrounding one or more aligned connected component. A character-type classifying means (32) converts the character cell to one of a plurality of abstract character codes (Fig. 5).
机译:当已知总脚本类型为或确定为总脚本类型时,自动抽象字符编码系统会自动从文档(100;图2)的文本图像中生成抽象编码字符(图5,6)。欧式脚本。连接成分产生装置(28)从包括文本图像的像素产生连接成分。空间特征确定装置(30)产生围绕一个或多个对准的连接部件的字符单元(图4)。字符类型分类装置(32)将字符单元转换为多个抽象字符代码之一(图5)。

著录项

  • 公开/公告号EP0621555A3

    专利类型

  • 公开/公告日1995-05-17

    原文格式PDF

  • 申请/专利权人 XEROX CORPORATION;

    申请/专利号EP19940302735

  • 发明设计人 SPITZ A. LAWRENCE;

    申请日1994-04-18

  • 分类号G06F15/20;G06K9/72;

  • 国家 EP

  • 入库时间 2022-08-22 04:13:20

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号