首页> 外文学位 >Symbolic and Visual Retrieval of Mathematical Notation using Formula Graph Symbol Pair Matching and Structural Alignment
【24h】

Symbolic and Visual Retrieval of Mathematical Notation using Formula Graph Symbol Pair Matching and Structural Alignment

机译:使用公式图符号对匹配和结构对齐的数学符号的符号和视觉检索

获取原文
获取原文并翻译 | 示例

摘要

Large data collections containing millions of math formulae in different formats are available on-line. Retrieving math expressions from these collections is challenging. We propose a framework for retrieval of mathematical notation using symbol pairs extracted from visual and semantic representations of mathematical expressions on the symbolic domain for retrieval of text documents. We further adapt our model for retrieval of mathematical notation on images and lecture videos. Graph-based representations are used on each modality to describe math formulas. For symbolic formula retrieval, where the structure is known, we use symbol layout trees and operator trees. For image-based formula retrieval, since the structure is unknown we use a more general Line of Sight graph representation. Paths of these graphs define symbol pairs tuples that are used as the entries for our inverted index of mathematical notation. Our retrieval framework uses a three-stage approach with a fast selection of candidates as the first layer, a more detailed matching algorithm with similarity metric computation in the second stage, and finally when relevance assessments are available, we use an optional third layer with linear regression for estimation of relevance using multiple similarity scores for final re-ranking. Our model has been evaluated using large collections of documents, and preliminary results are presented for videos and cross-modal search. The proposed framework can be adapted for other domains like chemistry or technical diagrams where two visually similar elements from a collection are usually related to each other.
机译:可以在线获取包含数百万种不同格式的数学公式的大型数据集合。从这些集合中检索数学表达式具有挑战性。我们提出了一种使用符号对检索数学符号的框架,该符号对是从符号域上的数学表达式的视觉和语义表示中提取的,用于检索文本文档。我们进一步调整了模型,以检索图像和讲座视频上的数学符号。在每个模态上使用基于图的表示形式来描述数学公式。对于已知结构的符号公式检索,我们使用符号布局树和运算符树。对于基于图像的公式检索,由于结构未知,我们使用更通用的视线图表示。这些图的路径定义了符号对元组,它们用作我们的数学符号倒排索引的条目。我们的检索框架使用三阶段方法,快速选择候选对象作为第一层,第二阶段使用具有相似性度量计算的更详细的匹配算法,最后当相关性评估可用时,我们使用线性的可选第三层使用多个相似度评分进行最终估计,以进行相关性回归分析。我们的模型已使用大量文档进行了评估,并为视频和跨模式搜索提供了初步结果。所提出的框架可以适用于其他领域,例如化学或技术图,其中来自集合的两个视觉相似的元素通常彼此相关。

著录项

  • 作者

    Castellanos, Kenny Davila.;

  • 作者单位

    Rochester Institute of Technology.;

  • 授予单位 Rochester Institute of Technology.;
  • 学科 Computer science.
  • 学位 Ph.D.
  • 年度 2017
  • 页码 120 p.
  • 总页数 120
  • 原文格式 PDF
  • 正文语种 eng
  • 中图分类 公共建筑;
  • 关键词

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号