基于注意力机制编码器-解码器的手写数学公式识别模型

陈路; 陈道喜; 陆一鸣; 陆卫忠

首页> 中文期刊> 《计算机应用》 >基于注意力机制编码器-解码器的手写数学公式识别模型

基于注意力机制编码器-解码器的手写数学公式识别模型

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

针对现有的手写数学公式识别(HMER)方法经过卷积神经网络(CNN)多次池化后,图像分辨率降低、特征信息丢失,从而引起解析错误的问题,提出基于注意力机制编码器-解码器的HMER模型。首先,采用稠密卷积网络(DenseNet)作为编码器,使用稠密连接加强特征提取,促进梯度传播,并缓解梯度消失;其次,采用门控循环单元(GRU)作为解码器,并引入注意力机制,将注意力分配到图像的不同区域,从而准确地实现符号识别和结构分析;最后,对手写数学公式图像进行编码,将编码结果解码为LaTeX序列。在在线手写数学公式识别竞赛(CROHME)数据集上的实验结果表明,所提模型的识别率提升到40.39%,而在3个级别的允许误差范围内,识别率分别提升到52.74%、58.82%和62.98%。相较于双向长短期记忆(BLSTM)网络模型,所提模型的识别率提高了3.17个百分点;而在3个级别的允许误差范围内,识别率分别提高了8.52、11.56和12.78个百分点。可见,所提模型能够准确地解析手写数学公式图像,生成LaTeX序列,提升识别率。

著录项

来源
《计算机应用》 |2023年第4期|1297-1302|共6页
作者
陈路; 陈道喜; 陆一鸣; 陆卫忠;
展开▼
作者单位

苏州科技大学电子与信息工程学院;

江苏省苏州技师学院信息工程系;

苏州科技大学天平学院;

江苏省建筑智慧节能重点实验室(苏州科技大学);

展开▼
原文格式 PDF
正文语种 chi
中图分类信息处理（信息加工）;
关键词
手写数学公式识别; 编码器-解码器; 稠密卷积网络; 门控循环单元; 注意力机制;

相似文献

中文文献
外文文献
专利

1. 基于编码器-解码器的离线手写数学公式识别 [J] . 杜永涛 ,余元辉 . 集美大学学报:自然科学版 . 2022,第6期
2. 基于双向编码器表示模型和注意力机制的食品安全命名实体识别 [J] . 姜同强 ,王岚熙 . 科学技术与工程 . 2021,第3期
3. DNeStCount:数据相关的拆分注意力机制的编码器-解码器结构的人群计数方法 [J] . 孟晓龙 . 计算机与现代化 . 2022,第9期
4. 基于自注意力机制与图自编码器的路网交通流数据修复模型 [J] . 张伟斌 ,张蒲璘 ,苏子毅 . 交通运输系统工程与信息 . 2021,第4期
5. 基于ResNet与Transformer的离线手写数学公式识别 [J] . 周名杰 . 科技创新与应用 . 2022,第21期
6. 一种基于带语言模型并行音节解码器的语种识别系统 [C] . 索宏彬 ,李明 ,吕萍 . 2007年全国网络与信息安全技术研讨会 . 2007
7. 基于编码器--解码器的联机手写数学公式识别方法研究 [A] . 张文君 . 2019

基于注意力机制编码器-解码器的手写数学公式识别模型

摘要

著录项

相似文献

相关主题

期刊订阅