首页> 中国专利> 文档图像中的表格底部有编号附注识别技术

文档图像中的表格底部有编号附注识别技术

摘要

本发明涉及一种文档图像中的无边框表格解析方法,所述方法包括步骤:获取待识别范围内的所有非页眉页脚的页面元素;根据表格在页面中的位置信息,定位出表格结束后的第一个页面元素并获取相关信息;判断上述页面元素是否为纯文本,是则获取文本内容,否则继续判断后面的页面元素;针对通过上述判断的页面文本,首先进行文本内容预处理,再进行多次正则表达式匹配,并根据匹配结果判断是否为有编号附注;根据上述匹配结果,如果文本符合匹配结果判断标准,则此文本行为潜在的有编号附注起始行,同时根据匹配结果可知是否为无编号底部附注;针对有编号底部附注,获取编号模式后遍历下方的所有文本行,获取有编号附注的结束为止。

著录项

  • 公开/公告号CN110399801A

    专利类型发明专利

  • 公开/公告日2019-11-01

    原文格式PDF

  • 申请/专利权人 南京智录信息科技有限公司;

    申请/专利号CN201910582520.0

  • 发明设计人 徐茂龙;杨鸿健;程晨;

    申请日2019-06-26

  • 分类号

  • 代理机构

  • 代理人

  • 地址 210000 江苏省南京市江北新区星火路11号动漫大厦B座101-4室

  • 入库时间 2024-02-19 14:26:01

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2019-11-26

    实质审查的生效 IPC(主分类):G06K9/00 申请日:20190626

    实质审查的生效

  • 2019-11-01

    公开

    公开

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号