首页> 中文期刊> 《赤峰学院学报:自然科学版》 >基于决策树和加权KNN混合算法的光学符号识别技术

基于决策树和加权KNN混合算法的光学符号识别技术

         

摘要

光学字符识别是针对印刷体字符,采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,并且通过字符识别模型将图像中的文字处理成可编辑的文本格式.本文首先对样本数据进行预处理,采用局部离群因子法剔除无效数据,通过信息增益率计算各个自变量相关性的强弱来找出恰当的特征,并将样本分为五类,建立决策树法和加权KNN算法相结合的混合算法,预测每类数据的结果并给出准确率,将结果中未识别的样本放在所有训练集下再次通过混合算法进行训练预测,最终总预测正确率达到了96.406%.最后通过混淆矩阵来评价模型,结果表明其拒识率较低,准确率较高,训练预测时间较短,具有可行性.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号