光学字符识别
光学字符识别的相关文献在1985年到2022年内共计430篇,主要集中在自动化技术、计算机技术、无线电电子学、电信技术、财政、金融
等领域,其中期刊论文280篇、会议论文11篇、专利文献388880篇;相关期刊199种,包括光电工程、福建电脑、互联网周刊等;
相关会议10种,包括第十六届全国图象图形学学术会议 暨第六届立体图象技术学术研讨会、2008中国计算机大会、湖北省机械工程学会机械设计与传动专业委员会第十五届学术年会等;光学字符识别的相关文献由836位作者贡献,包括S.加利奇、内森·莱斯利·桑德兰德、文森特·迪罗等。
光学字符识别—发文量
专利文献>
论文:388880篇
占比:99.93%
总计:389171篇
光学字符识别
-研究学者
- S.加利奇
- 内森·莱斯利·桑德兰德
- 文森特·迪罗
- D·哈门
- B.拉达科维奇
- 亚历山大·杰·卡斯贝特
- 姚锟
- 彭健
- 徐鹏
- 梁捷
- 汪同庆
- 谢群义
- 路克·文森特
- 钦夏孟
- 雷蒙德·W·史密斯
- 丁晓青
- 冯歆鹏
- 刘幺和
- 周骥
- 彭伟
- 李鹏
- 段荧
- 王庆人
- 王恺
- 瞿于荃
- 胡东鑫
- 蔡海蛟
- 谭保华
- 靳简明
- 龙华
- A.乌泽拉奇
- A.库马
- A·乌泽拉茨
- A·阿勒丁
- B.H.尼德哈姆
- B.德雷塞维奇
- B·德雷舍维奇
- B·拉达科维奇
- C·E·雅各布斯
- C·霍夫曼
- D.尼耶姆塞维奇
- J.R.库马
- J·R·林克
- K.C.维尔斯
- M.乌德利亚
- M.琴波瓦
- M·武格代利亚
- N.托迪奇
- N·托迪奇
- P·A·维奥拉
-
-
王海丰
-
-
摘要:
光学字符识别(OCR)时,输出的文本行顺序需与实际的顺序相符。文章在字符Blob分析的基础上,对两个字符Blob外接矩形的相对位置关系进行划分,确定了各位置关系下同一文本行的判断方法,据此对排序后的字符Blob进行文本行初次生成和文本行二次合并,实现了任意方向文本行的生成。实际测试结果验证了所述方法生成任意方向文本行的有效性。
-
-
肖晓霞;
刘明婷;
杨冯天赐;
刘鉴建县;
杨阳;
石月
-
-
摘要:
中医医案是中医医生学习临床经验的重要文献资料,对中医医案进行结构化处理有利于采用机器学习等方法总结临床经验,加速中医传承。为了实现中医医案快速结构化,提出了一种基于自然语言处理的中医医案文本快速结构化方法。将《中国现代名中医医案精粹》作为结构化对象,采用光学字符识别技术识别医案截图的文本,同时对文本做初步结构化。构建简单症状词典,采用结合词典的改进的N-gram模型获取医案文本中的症状、体征等词,并在结构化过程中更新词典,实现了对4754份文本医案的结构化。随机选取666份医案文本对最终模型进行测试,其F1值达到82.99%。
-
-
张科昌;
生绿伟;
刘国辉;
茅时群
-
-
摘要:
集装箱号码作为集装箱的唯一标识,是码头、海关和船运公司管理集装箱的基本依据。自动集装箱箱号OCR系统,在港口理货环节中采集集装箱号图像,利用计算机视觉技术进行处理和识别,获得并记录集装箱箱号,可以有效地提升港口作业效率和作业安全。对现有集装箱码头中的箱号识别系统进行调研,分析存在的问题,归纳集装箱箱号OCR系统的构成、主要设备和关键技术,并对目前市场上典型的OCR系统性能进行对比分析,最后对OCR系统的研究进展进行总结。
-
-
曲超然;
陈立伟;
王建生;
王水根
-
-
摘要:
仪表读数的检测与识别被广泛应用在工业中,然而工程领域中复杂的背景环境为获取仪表信息带来了困难。为了解决光照不均、背景复杂、图像模糊、仪表倾斜以及遮挡等多种干扰问题,本文设计了一种基于深度学习的数字仪表读数算法。首先使用图像增广方法丰富数字仪表检测数据集,并利用数据合成的方法构建了数字仪表文本识别数据集;然后通过可微分二值化处理(DB)分割算法进行文符区域检测简化后处理过程,同时提出了一种适用于数字仪表图像的预处理方法,通过引入注意力机制改进卷积循环神经网络(CRNN)算法,对检测后的数据进行文符识别。在上述测试集中检测率可达到88.3%,识别准确率可达到96%。通过实验发现,该算法不仅可以提高整体识别准确率至90%以上,同时降低了复杂度,提高了识别效率。
-
-
夏峻;
白英;
郭科;
邵雪瑾;
张志龙
-
-
摘要:
在变电站巡检的过程中,巡检员需要对端子排的电缆套管标号进行录入,由于传统的字符识别方法难以应对变电站字符密集、字体细小等问题,巡检员往往只能够依赖人工手段对电缆套管标号进行核查。因此,为了提高巡检的智能化水平和巡检效率,需要设计一种新型的端子排自动化字符识别方法,提高变电站场景下的字符识别性能,从而代替高重复高强度的人工劳动。针对上述问题,本文提出一种基于LSTM文本区域融合的端子排字符识别方法。论文将本文提出的新方法与两种代表性的光学字符识别方法进行了对比实验,实验结果显示,本文所提出的方法在字符识别性能上具有明显优势。
-
-
李阳娟
-
-
摘要:
为全面深入地掌握汉字识别技术的研究现状与应用进展,基于WOS数据库中汉字识别研究领域的文献数据,利用CiteSpace可视化软件进行文献计量与知识图谱分析。结果表明:中国的高校和研究所是汉字识别研究的核心力量;汉字识别技术的发展历程由早期的传统方法OCR技术演化为中期的联机手写汉字识别,再到近期基于深度学习的汉字识别研究;研究前沿为手写汉字识别、混合语言模型、生成对抗网络和场景文本识别;汉字识别技术将朝着高效率及智能化方向发展。
-
-
毛存礼;
谢旭阳;
余正涛;
高盛祥;
王振晗;
刘福浩
-
-
摘要:
与传统的图像文本识别任务不同,缅甸语光学字符识别(Optical character recognition,OCR)需要计算机在一个感受野内识别由多个字符嵌套组合的复杂字符,这给缅甸语OCR任务带来了巨大的挑战。为了解决该问题,提出了一种基于知识蒸馏的缅甸语OCR方法,构建了使用卷积神经网络(Convolutional neural networks,CNN)+循环神经网络(Recurrent neural network,RNN)框架的教师网络和学生网络,以集成学习的方式进行训练的模型架构,在训练过程中通过教师集成的子网络与学生网络进行耦合,实现学生网络中单个感受野对应的局部字符图像特征与教师网络中整体字符图像特征的对齐,以此增强对长序列字符图像中局部特征的获取。实验结果表明,在没有背景噪声图像和有背景噪声图像作为训练数据集的情况下,本文模型的性能分别优于基线2.9%和2.7%。
-
-
黄婧
-
-
摘要:
为了提高食品抽检工作中样品信息的录入速度,本文开发了一个食品抽检登记助手软件。该软件通过调用百度智能云提供的通用文字识别功能,自动识别食品生产经营者证照及食品包装上的文字;利用正则表达式提取和保存识别结果中抽检管理系统需要的相关信息。在测试中,该软件对食品样品相关信息的提取准确率超过了98%。利用这种方式代替传统的人工录入方式,提高了工作效率。
-
-
向明华;
赵菊云
-
-
摘要:
本文从医学档案管理与应用的角度出发,介绍了基于WEB技术的医学档案管理系统,利用深度学习技术对复杂场景下医学档案高准确率识别的研究,实现了医学档案的全文检索、360全息视图和全程闭环管理,简化信息高速共享流程,提高医学档案管理效率,为临床提供高效数据服务,促进精准医疗和个性化医疗快速发展。
-
-
胡璟懿;
匡尧;
余铮;
王敬靖;
张兰澜;
刘云飞
-
-
摘要:
传统Canny算子需要手动设定高低阈值,当输入图像光照均匀且均值变化较小时,可以采用预先设定阈值的方式实现,但当输入图像遭遇大光度变化,灰度值均值产生较大波动时,预先设定高低阈值往往无法适应实际工况。提出了一种通过结合图像预处理和自适应阈值来解决Canny算子阈值调整困难的方法,克服了大光度变化图像中的阈值设定问题,并将其应用到透视变换过程中,解决了输入图像角度问题。实验结果表明,所提方法能够很好地解决大光度变化的应用场景问题。
-
-
WANG Qiang;
王强;
QI Min;
齐敏
- 《第十四届全国信号和智能信息处理与应用学术会议》
| 2021年
-
摘要:
针对模糊低品质光学字符识别准确率低的问题,在研究已有光学字符识别算法的基础上,改进优化相关算法,调整识别结构,设计完成一套模糊低品质字符串识别系统.在图像增强方面,提出一种以Canny算子为卷积核,结合Laplace锐化操作,对模糊字符进行图像增强的算法;在文本检测方面,实现了基于MSER算法的文本检测;在模糊字符识别方面,设计了一种两层结构分类器,缩短了识别时间,提高了识别准确率.
-
-
-
Cai Qiawu;
蔡洽吾;
Liao Ruizhi;
廖睿之;
Chent Qiang;
陈强
- 《第十六届全国图象图形学学术会议 暨第六届立体图象技术学术研讨会》
| 2012年
-
摘要:
OCR(光学字符识别)是指先获取带汉字的图像,然后对图像文件进行分析处理,获取文字信息的过程.在识别出文字之后,如何利用上下文信息来纠正识别错误的字,也是就所谓的错误校正,进而提高识别正确率,是OCR中重要的课题.本文介绍了一种基于最大熵模型的校正方法,很大限度地利用了上下文信息,可以同时纠正多个识别错误的汉字,在实验中取得了很好的效果.通过对比几种不同的校正方案,可以看出基于最大熵模型的错误校正方法是最有效的,也是扩展性最好的方法,它可以方便地利用各种语言特征,更进一步的提高准确率.实验结果表明基于最大熵的模型是一个很适合OCR校正的模型.
-
-
刘娟;
郭钧天;
范依林
- 《2008中国计算机大会》
| 2008年
-
摘要:
字符分割是光学字符识别(OCR)的过程中一个重要的部分,错误的分割导致错误的识别是必然的,这也就是中英文混排的识别率没有单一的中文或者英丈识别的识别率高的主要原因。本文依据汉字字符和英文字符在混排时所表现出的不同字符特性以及排列特性提出了一种中英文印刷体混排的字符分割技术,并用此技术做出了一个印刷体识别系统验证了字符分割的效率。
-
-
-
-
-
-