公开/公告号CN112926361A
专利类型发明专利
公开/公告日2021-06-08
原文格式PDF
申请/专利权人 中国科学院沈阳自动化研究所;
申请/专利号CN201911239107.0
申请日2019-12-06
分类号G06K9/00(20060101);G06K9/62(20060101);G06N3/04(20060101);G06N3/08(20060101);
代理机构21002 沈阳科苑专利商标代理有限公司;
代理人王倩
地址 110016 辽宁省沈阳市沈河区南塔街114号
入库时间 2023-06-19 11:19:16
技术领域
本发明涉及目标识别技术领域,特别提供了一种流形上的智能目标识别方法。
背景技术
成像目标识别是无人飞行器实现精确制导的关键核心技术。在目标识别过程中,不仅有光照条件、物体姿态、复杂背景等外部因素影响,还有目标本身成像中的几何变换和类内差异较小等内部因素影响。如何在复杂的环境因素下进行高效的识别一直是自动目标识别领域的一个重大难题。近年来,深度学习以其强大的学习能力在目标识别领域取得了优异表现,而针对目标识别领域中具有良好特性的流形结构数据,深度学习方法的优势则受到限制。现有的多数深度学习方法都是针对向量数据而设计,若直接将流形数据作为其输入,将无法同时发挥流形数据与深度学习方法的各自优势。
发明内容
鉴于此,本发明的目的在于提供一种流形上的智能目标识别方法,以解决无人飞行器在复杂环境下的目标识别问题。
本发明提供的技术方案是:一种流形上的智能目标识别方法,包括以下步骤:
1)对输入图像进行预处理,预处理后的多个图像构成图像集,建立图像集的协方差特征矩阵;
2)将协方差特征矩阵输入至智能学习网络进行训练,得到目标识别的分类;
3)通过Grassmann流形上的随机梯度下降法更新智能学习网络的参数;
4)在反向传播阶段,使用基于矩阵链式法则的反向传播算法更新智能学习网络的参数;
5)将待测图像输入更新参数后的智能学习网络,得到目标识别的分类。
所述建立图像集的协方差特征模型,包括以下步骤:
对于每个包含n张图片的图像集M
所述将协方差特征矩阵输入至智能学习网络进行训练,得到目标识别的分类,包括以下步骤:
协方差特征矩阵X作为输入,即X为输入的高维流形,Y为学习到的新流形作为输出,则对于流形学习层,有:Y=f(X)=W
将流形学习层的输出Y作为流形转换层的输入,经过流形转换层输出为Q,即有f
Q输入至欧氏映射层得到G,则有G=f
G作为全连接层的输入,再经过softmax层进行分类。
所述通过Grassmann流形上的随机梯度下降法更新智能学习网络的参数,包括以下步骤:
W
其中,W
根据矩阵链式法则求得相应的欧氏梯度
其中L(Y)表示流形转换层的代价函数;
将W
所述在反向传播阶段,使用基于矩阵链式法则的反向传播算法更新智能学习网络的参数,包括以下步骤:
对于流形学习层,参数更新的公式为:
上式中X为流形学习层的输入,Y为流形学习层的输出;L(W)表示流形学习层的代价函数,L(Y)表示流形转换层的代价函数;
将
对于流形转换层,参数更新的公式为:
上式中A
将
本发明提供的一种流形上的智能目标识别方法,有益效果如下:基于数据的流形几何结构来设计深度学习网络,将微分几何理论与深度学习理论相结合,提出一种基于流形的深度图像集识别网络。同时在模型训练过程中,使用基于矩阵链式法则的反向传播算法来更新模型,并将权值的优化过程转换为Grassmann流形上的优化问题,此发明有效利用数据的几何结构,降低了计算复杂度,不仅在识别准确率上有所提高,同时在训练和测试速度上也有大幅度提升。
附图说明
下面结合附图及实施方式对本发明作进一步详细的说明:
图1为本发明提供的一种流形上的智能目标识别方法流程示意图;
图2为本发明提供的一种流形上的智能目标识别方法中图像集识别结果示意图。
具体实施方式
下面将结合具体的实施方案对本发明进行进一步的解释,但并不局限本发明。
一种流形上的智能目标识别方法,包括:
步骤一:输入原始图像。
步骤二,对输入的原始图像进行特征提取,并构建协方差特征矩阵,实现流形特征建模。
步骤三,基于数据的流形几何结构来设计深度学习网络。
步骤四,推导流形上的深度学习网络的梯度模型。
步骤五,使用基于矩阵链式法则的反向传播算法更新网络参数。
步骤六,输出识别结果。
所述步骤二对输入的原始图像进行特征提取,并构建协方差特征矩阵,实现流形特征建模中包括如下步骤:
步骤2-1,提取每幅图像对应的特征,构成特征向量
步骤2-2,构建每个图像集中所有图像的特征向量矩阵,并计算图像集中所有矩阵特征向量的平均值。
步骤2-3,构建每个图像集的协方差特征矩阵。
所述步骤三中包括基于数据的流形几何结构来设计深度学习网络。针对图像的流形结构,设计智能学习网络的各种操作层来实现流形学习、欧氏映射、智能分类等功能。
所述步骤四包括推导流形上的深度学习网络的梯度模型。在流形学习层中,为了学习到几何结构更好的流形数据,需要在优化的过程中保持数据的流形结构,因此需要在流形空间中进行参数优化过程。在参数优化时,使用黎曼优化方法在流形空间进行求解,首先推导黎曼流形上的梯度下降模型,然后使用黎曼梯度下降方法在参数空间中搜索待求参数的最优解。
所述步骤五包括使用基于矩阵链式法则的反向传播算法更新网络参数。由于向量的反向传播算法不再使用于流形结构数据,首先在智能学习网络的前向传播阶段,计算模型的参数传播公式;在网络的反向传播阶段,利用矩阵链式法则,使用矩阵的反向传播算法来更新网络参数。
如图1所示,本发明提供了一种流形上的智能目标识别方法,包括如下步骤:
步骤一:输入图像,并对输入图像进行预处理。实际中,为了降低图像中的光照影响,通常对图像进行归一化操作。
步骤二,建立图像集的协方差特征模型。对于每个包含n张图片的图像集M
步骤三,基于数据的流形几何结构,设计流形上的智能学习网络。首先提出流形学习层,该层以步骤二中计算得到的协方差特征矩阵X作为输入,即X为输入的高维流形,Y为学习到的新流形作为输出,则对于流形学习层,有:Y=f(X)=W
步骤四,基于黎曼优化方法推导流形上的深度学习网络的梯度模型。针对输入数据为协方差特征矩阵,采用黎曼梯度下降方法,对参数赋予正交几何结构,将求解的参数空间优化为Grassmann流形空间。我们将使用Grassmann流形上的随机梯度下降法来更新转换层中的权值参数。具体地,对于流形学习层的代价函数L(W),其黎曼梯度grad
其中
此时,L(W)具体的表达式为
其中,L为softmax层的代价函数,f表示f(X)。
该层在黎曼流形上的权值更新公式为:
W
其中W
根据矩阵链式法则可以求得,相应的欧氏梯度
其中,L(Y)为流形转换层的代价函数,其具体的表达式为:
步骤五,在反向传播阶段,使用基于矩阵链式法则的反向传播算法更新网络参数。
对于流形学习层,参数更新的公式为:
上式中X为流形学习层的输入,Y为流形学习层的输出。
对于流形转换层,参数更新的公式为:
上式中A
本发明提出的流形上的智能目标识别方法所使用的样本库示意图如图2所示,整体识别准确率为92.5%。
其中识别准确率定义:
机译: 由目标识别系统执行的目标识别系统和目标识别方法,在目标识别系统上执行的目标识别程序以及存储该目标识别程序的记录介质
机译: 由目标识别系统执行的目标识别系统和目标识别方法,在目标识别系统上执行的目标识别程序以及存储该目标识别程序的记录介质
机译: 目标识别系统,由目标识别系统执行的目标识别方法,在目标识别系统上执行的目标识别程序以及存储该目标识别程序的记录介质