首页> 中文期刊> 《北京信息科技大学学报(自然科学版)》 >基于融合特征与语法规则的流式文档理解方法

基于融合特征与语法规则的流式文档理解方法

         

摘要

针对流式文档结构理解中构件识别特征分析的不足,提出一种基于融合特征的构件识别方法.首先建立格式向量表示字体等构件格式特征,提取文档构件中关键字等内容特征作为内容向量,分别计算待识别构件两种特征与候选构件的得分并对其加权计算,得出候选的构件标签;结合自顶向下和自底向上的结构识别方法,得到文档的逻辑结构.通过实验验证了该方法能有效提高文档构件识别的准确率,同时提高了文档结构识别的准确率.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号