首页> 中国专利> 基于差分进化算法-深度森林算法的废旧手机识别方法

基于差分进化算法-深度森林算法的废旧手机识别方法

摘要

本发明公开一种基于差分进化算法‑深度森林算法的废旧手机识别方法,将DE和DF算法进行结合应用于废旧手机回收识别;首先,基于经验选择对识别结果影响较大的多尺度特征参数和DF参数;接着,将DF废旧手机识别准确率作为适应度函数,通过DE算法找出模型参数的最优解集;最后,将最优解集传入手机识别模型中,基于工信部手机图像的仿真结果证明了该方法的有效性。

著录项

  • 公开/公告号CN113298107A

    专利类型发明专利

  • 公开/公告日2021-08-24

    原文格式PDF

  • 申请/专利权人 北京工业大学;

    申请/专利号CN202011235020.9

  • 发明设计人 汤健;王子轩;崔城瑜;乔俊飞;

    申请日2020-11-08

  • 分类号G06K9/62(20060101);G06N3/00(20060101);

  • 代理机构11203 北京思海天达知识产权代理有限公司;

  • 代理人吴荫芳

  • 地址 100124 北京市朝阳区平乐园100号

  • 入库时间 2023-06-19 12:19:35

说明书

技术领域

本发明属于手机回收技术领域,尤其涉及一种基于差分进化算法-深度森林算法的废旧手机识别方法。

背景技术

手机逐渐成为人们生活中不可或缺的一部分,这导致手机相关产业和废旧手机识别产业发展迅速。废旧手 机回收装备成为最主要的手机回收方式之一。然而其对废旧手机的识别准确率和识别效率并不能令人满意。当 前基于回收装备的废旧手机识别方法分为手机图像识别,IMEI码识别,箱内机械手识别和USB接口识别四种。 总结前人研究,找到提高回收装备中废旧手机识别效率的方法是当前的研究难点。

随着人工智能技术的不断发展,图像识别算法已成功应用于许多领域。然而,图像识别算法的改进并未促 进手机图像识别技术的改善。目前,仅有BP神经网络和卷积神经网络(CNN)应用于废旧手机识别领域。CNN 需要大量数据来训练模型,十分耗时且鲁棒性差。在废旧手机识别这一问题中,虽然拥有大量的手机图像样本, 但是按照型号划分的手机标签也很庞大,这导致每个标签下的手机图片十分稀少。因此,废旧手机识别仍是一 个小样本问题,非常有必要研究相应识别算法。

基于深度学习的思想的深度森林(DF)算法通过实验证明了其在手写字符分类和人脸识别等问题上的优 越性。DF算法被证实在小样本问题中具有显著的优越性。与CNN相比,DF的参数更少,即使样本量很小, 它仍然具有更好的分类精度。最重要的是,DF可以根据具体问题进行深度自适应,减少模型冗余。

然而,DF仍存在一些缺陷。在废旧手机识别这一问题中,原始手机图片像素过大会导致模型运转缓慢, 为了解决这一问题,可以使用多尺度HOG特征代替原始手机图片。HOG特征尺度、滑动窗口的选择以及DF 中的随机森林相关参数决定了模型的准确性。如何调整模型参数已成为当前待解决的主要问题。

发明内容

随着手机产业的不断发展,废旧手机回收已成为热门话题。目前,基于手机回收装备的废旧手机识别方法 研究在国内外鲜有听闻。因此提出了一种基于差分进化(DE)算法-深度森林(DF)算法的废旧手机识别方法。 本申请将DE和DF算法进行结合应用于废旧手机回收识别。首先,基于经验选择对识别结果影响较大的多尺 度特征参数和DF参数。接着,将DF废旧手机识别准确率作为适应度函数,通过DE算法找出模型参数的最 优解集。最后,将最优解集传入手机识别模型中进行识别,基于工信部手机图像的仿真结果证明了该方法的有 效性。

附图说明

图1废旧手机回收流程

图2DE-DF废旧手机识别流程

图3废旧手机识别模型策略图;

图4多尺度HOG特征组合;

图5多粒度扫描示意图;

图6级联森林示意图;

图7不同迭代次数优化曲线,图7(a)15次迭代曲线,图7(b)20次迭代曲线,图7(c)25次迭代曲线。

具体实施方式

如图1所示:用户在手机回收装备内投放手机后,填写手机各项评估特征,回收机通过用户填写信息对手 机型号、内存、外观磨损等状态进行估价,并通过人机交互模块将手机价格信息反馈给用户;用户通过人机界 面确认是否进行回收;用户同意回收后,传动模块将手机传送至回收仓内,回收机内置识别模块对手机进行检 测,若检测结果与用户填写一致则完成本次回收,将返利汇入用户账户内,若不一致则退还手机。

由上述描述可知,手机识别是回收最为关键的一步,只有回收装备正确识别待回收手机的各项信息后才能 完成回收中的估价、返利等操作。目前手机回收装备存在存储空间有限,无法存储和承载运行复杂算法,每类 手机图片数量有限,不能使用大量数据对模型进行训练,手机更迭速度快、模型需要实时更新,目前广泛应用 的CNN模型训练时间慢、计算消耗需求大等问题,这些因素制约着手机图像识别方法的发展。

本发明提供一种基于差分进化(DE)算法-深度森林(DF)算法的废旧手机识别方法,将DE和DF算法 进行结合应用于废旧手机回收识别;首先,基于经验选择多尺度特征参数和对识别结果影响较大的DF参数作 为寻优对象;;将DF废旧手机识别准确率作为适应度函数,通过DE算法找出上述寻优对象的最优解集;最 后,将寻优所得最优参数集应用于手机识别模型中进行识别。

DE-DF算法

本申请在废旧手机回收装备的基础上提出了一种采用DE算法优化建模参数的多尺度DF手机识别模型, 即DE-DF废旧手机识别方法。该算法对输入特征尺度和DF模型参数进行编码,通过“初始化”,“交叉”,“变 异”,“选择”逐步对参数进行优化。最后将寻优得到的最优参数集合传入DF模型中。本申请所提DE-DF废旧 手机识别方法的流程图如图2所示,图2中各参数含义如下表所示。

表1DE-DF变量名称表

如图2所示:首先,DE对多尺度特征提取参数

DF参数编码

DE及其衍生算法可以看作是遗传算法(GA)的特例。因此,DE和GA算法的第一步是相同的,两类算 法都要对寻优问题进行编码。在废旧手机识别这一实际问题中,DE算法对多尺度特征DF识别模型中的 Win

图3显示了废旧手机的多尺度特征DF识别模型的策略图。如图3所示,手机识别模型由三部分组成:多 尺度HOG特征提取,多粒度扫描和级联森林(后两个部分构成DF模型)。

不同尺度的HOG功能表征手机图像的不同上下文信息。拼接不同尺度的HOG功能可提高手机识别的准 确性。因此,我们选择了多尺度HOG特征并将拼接的HOG特征尺度表示为

其中,

需要特别说明的是,如果直接对不同尺度HOG进行编码,维度相同的HOG特征将具有不同的组合方式, 识别准确率也会不同。为了消除歧义,需要对多尺度HOG特征进行了预编码。首先,对废旧手机图片进行单 尺度HOG特征提取,获得

上述HOG特征提取,线性组合,手动预编码过程可由图4表示。

在DF模型中,滑动窗Win

DE参数初始化

此处需要设置DE参数以使DE具有良好的收敛速度,确保DE可以快速找到最优解。种群NP的大小及 其迭代次数决定了DE算法的运行时间。因此,需要在算法运行前人为设定种群规模。

DE算法内置两个基本参数F和CR。其中:F∈(0,1]代表比例因子,CR∈(0,1]代表交叉率。这两个参 数通常设置为固定值。如果F值设定太大,算法的收敛速度将减慢。如果F的值太小,种群的多样性将会减 小,进而导致过早地结束进化。不合适的CR值也会导致上述问题。

DF参数解码

首先,进化过程需要解码输入尺度和DF参数。以初始种群W(0)为例,W

图5废旧手机识别模型第0代种群

其中,每个参数的阈值和数值类型如表2所示。

表2参数阈值

表中

适应度评估

为了将DE与废旧手机识别模型结合起来,本申请以废旧手机识别准确率f

其中,F

种群解码后将每条染色体中的数据传入DF模型中。接着,DF模型会根据输入的训练集Z

进化过程

计算当前参数适合度后,将根据f

①.变异:综合各变异算子性能考虑,DE/current-to-best/1的收敛速度最快。因此本申请使用 DE/current-to-best/1作为DE算法的变异算子。该算子表达式如下所示:

V

其中,W

②.交叉:由图4可知,每条染色体有5个变量。因此,第t代种群第i条新染色体U

其中,k

③.选择:将DF识别准确率作为评价父代W

最优参数获取

在种群染色体执行进化操作后,DE将根据当前最优染色体的适应度值和规定的最大迭代次数判断是否终 止进化操作。进化操作多次迭代后,DE算法将获得最优解集

DF手机识别模型对手机进行识别过程分为图像剪裁、多尺度HOG特征提取和DF模型识别三个部分,具 体过程如下:

①图像剪裁:

初始化背景区域和前景区域高斯混合模型(GMM)。用户通过设定矩形框,将矩形框外像素设置为背景T

其中,α表示当前手机图片像素RGB三通道向量,π

对图像中每个像素分配GMM模型的高斯分量,针对给定数据集学习GMM参数,通过最小能量得到初始 前景背景分割,多次迭代后完成对前景像素点提取,获得只含手机信息的图像数据集X

基于边界跟踪的数字化二值图像拓扑结构分析对手机图像轮廓进行检测,并标记轮廓坐标。首先将数据图 像进行二值化处理,将黑白手机图片原始边界标记为0,接着从图片边界开始查找非0像素,将最先寻找到的 非0像素标记为外轮廓。

最后对X

②多尺度HOG特征提取:

多尺度HOG特征表现形式如DF参数编码所示,根据上述DE寻优过程,最佳多尺度HOG特征由

③DF识别模型:

DF模型的核心思想是利用级联森林(决策树集成)方法生成模型,具有参数少、执行效率高等优点,在一 定程度上弥补了神经网络模型参数多、训练需要数据量大等问题。该模型由多粒度扫描(Multi-Grained Scanning) 和级联森林(Cascade Forest)两部分构成。

(1)多粒度扫描

多粒度扫描的目的在于提取原始输入对象中更多的特征,其使用不同大小的滑动窗口进行像素点的采样扫 描,由此获取更多的特征子样本。多粒度扫描示意图如图5所示。

以HOG特征提取后的序列数据为例,假设输入特征是720维,扫描窗口大小是10维,可得到711个10 维的特征向量,其中:每个10维的特征向量对应一个6分类的类向量,即得到711个6维类向量,最终每个 森林得到4266维的衍生特征变量,图中随机森林特征拼接后得到级联森林输入特征

(2)级联森林

级联森林是DF模型中的核心部分,每层级联森林由若干决策树森林构成,在图6所示级联森模型中每层 森林由两个极端随机森林和两个普通随机森林构成。级联森林模型示意图如图6所示。

首先,训练样本通过10折交叉验证对第一层级联森林中各随机森林进行训练,每个随机森林会输出一个 预测类别概率向量;接着,第一层中所有森林输出的类别概率向量与原始输入特征向量拼接后作为级联森林下 一层的输入特征,每层结束后都会通过测试集对当前识别准确率ACC

表3给出了基于DE-DF的废旧手机识别模型伪代码。

表3DE-D伪代码

应用验证

实验设备与建模数据

本实验所用软硬件配置如下:硬件:英特尔COREi7-8750HQ(CPU),RTX2070mq(GPU);软件:Pycharm2019.3.3。

本实验选择了工信部注册的手机正面和背面图像作为数据集,共808张原始手机图像。图像的初始像素比 为480*300。手机图像按品牌标记,分为六个类别。训练和测试数据集的划分比例为8:2。

参数设置

多尺度特征选择会将输入图像Z

DF模型中的多粒度扫描会进一步增加输入尺寸。显然,过大的数据维度不仅会增加训练时间,还有可能 导致级联森林模型的崩溃。因此,在预编码时删除了

表4多尺度特征对比

F和CR的值将影响DE算法的收敛速度和运算时间,此处手动将F值设置为0.5,CR值设置为0.1。

根据DF参数解码,每个编码参数将有一个预先设置的阈值。阈值如下表所示。

表5阈值设定

在选择滑动窗的时候要特别注意,滑动窗的上界Win

DE-DF算法的终止条件包括两部分:最大迭代次数和DF识别的准确性。在本实验中,最大迭代次数设置 为15、20和25。在DF准确率方面,准确率连续五代保持不变则终止进化,动态判断DF准确率可以减少计 算冗余。准确率停滞代数设置值过小会导致DE陷入局部最优解,设置值过大又会导致实验时间过长,本申请 将其设置为5代。

仿真结果分析

在本实验中,最大迭代次数设置为15、20、25时优化曲线如图7(a)、7(b)、7(c)所示。

在以上实验结果中,上方曲线代表当前种群的最佳染色体。下方曲线代表当前种群染色体的平均水平。两 条曲线趋于一致表示当前种群染色体平均水平趋于最佳染色体。当两条线重合后,进化也随之结束。显然,前 两次迭代设定值下并未找到最优解集。图7(c)表明,种群在20代后达到了最佳状态。

本申请比较了SVM、CNN、DF、DE-SVM和DE-DF模型针对废旧手机的识别结果。其中:除CNN外其 他模型的输入均为多尺度HOG特征;CNN模型使用LeNet5模型(卷积层*3,池化层*2,全连接层*2), 输入大小为480*300手机图像;在SVM模型中,核函数使用径向基函数核(RBF),惩罚系数为1,核半径 为0.1。DF模型的滑动窗口的大小为[10,15],最大特征数量为170,决策树数量为550;多尺度特征使用表2 中编号为4的HOG特征。统计结果如表6所示。

表6不同识别模型准确率统计表

本申请提出了一种基于DE-DF的废旧手机识别方法,主要贡献如下:(1)使用DE算法优化DF识别模 型参数和其输入特征,通过预编码方式将多尺度特征加入优化参数中;(2)将DE-DF识别模型应用于废旧手 机回收的实际问题中。通过手机图像数据集验证了该方法的有效性。但是,DE-DF算法仅处于研究的初期。 当前DE算法寻优时间过长,如何优化模型和减少CPU负载并提高硬件利用率,进而缩短寻优时间为下一步 亟待解决的问题。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号