首页> 中国专利> 害虫稀疏表征分类识别方法与分类识别装置

害虫稀疏表征分类识别方法与分类识别装置

页面导航

摘要
著录项
法律信息
说明书
相似文献

摘要

本发明涉及一种害虫稀疏表征分类识别方法与分类识别装置，包括对k类害虫进行编号；对包含k类害虫的所有图片进行图像预处理；对预处理后的所有图片进行特征提取：满足约束等距性条件的特征字典的构造；对预处理后的任一待识别图片进行特征提取；求解分类模型；对害虫进行识别。由于本发明的特征字典符合RIP条件，所以本发明所提出的识别方法准确度高、可靠性与稳定性强，性能优于现有技术。

著录项

公开/公告号CN102819748A

专利类型发明专利
公开/公告日2012-12-12

原文格式PDF
申请/专利权人河南工业大学;
展开▼

申请/专利号CN201210251566.2
发明设计人傅洪亮;陶华伟;张元;张德贤;杨铁军;樊超;梁义涛;管爱红;张建华;
展开▼

申请日2012-07-19
分类号G06K9/62(20060101);
代理机构41119 郑州睿信知识产权代理有限公司;
代理人陈浩
地址 450001 河南省郑州市高新技术产业开发区莲花街河南工业大学信息科学与工程学院
入库时间 2023-12-18 07:36:17

法律信息

法律状态公告日

法律状态信息

法律状态
2017-09-01

未缴年费专利权终止 IPC(主分类):G06K9/62 授权公告日:20150311 终止日期:20160719 申请日:20120719

专利权的终止
2015-03-11

授权

授权
2013-01-30

实质审查的生效 IPC(主分类):G06K9/62 申请日:20120719

实质审查的生效
2012-12-12

公开

公开

说明书

技术领域

本发明属于图像处理技术领域，涉及害虫稀疏表征分类和害虫稀疏表征分类字典的构建方法。

背景技术

储粮害虫对粮食储藏的危害十分巨大，据有关报道，全世界每年至少有5% 的粮食被害虫糟蹋，如果人力、物力和技术跟不上，损失可能达到20%-30%，而中国的粮库粮食损失率约为0.2%，但中国基数大，0.2%数量任然很多，因此开展针对害虫的检测研究是一件很有必要且有意义的研究课题”。而害虫的图像识别法由于可操作性强且易于实现，受到了国内外众多科学家的重视。

压缩感知理论是应用数学与信号处理领域中一个非常新的研究方向，自从 2006年起有正式论文发表之后，迅速引起国内外相关领域研究者的高度重视。该理论表明当信号具有稀疏性或可压缩性时,即原始信号经过变换后仅有小部分大系数，其他变换域系数都为0或接近于0，通过采集少量的信号投影值就可实现信号准确或近似重构。压缩感知研究主要集中在信号的稀疏分解、传感矩阵、重构算法三个方面。对于稀疏方面，主要包括傅里叶变换、离散小波变换、多尺度分析、小波包“冗余字典”等。关于传感矩阵的研究，主要包括高斯矩阵、贝努利矩阵，傅里叶矩阵、哈达玛矩阵等。此外还包括确定性矩阵的构造。在信号重构方面，主要包括有三类算法：凸优化，贪婪算法，组合算法。在硬件实现上， Rice大学的Baraniuk教授等研制出单像素相机和A/I转换器，经过近六年的发展，压缩传感在理论方面已经取得了许多重要的成果，在许多实际应用方面，各国科学家也开始投身其中，压缩感知的应用包括：医学图像，语音信号处理，机器学习等等诸多方面。

目前，针对害虫的图像识别的主要研究集中在特征提取和分类器的设计上，传统的特征提取主要提取害虫的形态、纹理等特征，分类器的选择主要包括：神经网络、物元可拓法、支持向量机等分类器。尽管大量关于害虫的研究已经取得了一些效果，但仍然存在很多问题。首先，已有的害虫分类都是在害虫种类较少的情况下实现的分类，而当害虫种类增多时，识别率下降严重；其次，部分分类器对害虫进行分类时，需要对算法的参数进行优化选择，当害虫种类增加时，上述步骤需要从新设置，这就大大增加了系统的复杂性。2006年Donoho等人提出压缩感知后，在人脸识别领域引起了巨大的反响，并且在2008年，由Wright J 等人提出一种系数表征人脸识别算法，它主要是建立在压缩感知及Serre提出的人类视觉系统具有对图像稀疏表示特性的基础上。该算法采用降采样的特征提取方法提取特征，运用提取到的特征构建欠定方程，再通过优化方法对欠定方程进行求解，最后通过残差计算公式计算出残差最小的项作为分类判别的标准，最终实现分类目的。稀疏表征分类器相比已有的分类器，它在害虫种类较多时，能取得更好的分类效果，同时由于不用对分类器的参数进行相关的优化设计，因此在后期对分类矩阵进行改进时，具有更大的优势。国内已有部分科学工作者将该方法运用到农业生产的分类中，例如蔡骋等人已尝试将此方法应用于杂草种子的分类中，韩安太等人尝试将此方法应用于害虫的分类中。

现有技术仅将稀疏表征分类直接的应用，重构过程缺乏理论性，无法保证解的唯一性，因此分类结果缺乏可靠性及稳定性。

发明内容

本发明的目的是提供一种害虫稀疏表征分类识别方法及分类识别装置，用于解决现有分类识别方法准确性低，稳定性、可靠性差的问题。

名词解释。约束等距性条件：即“RIP条件”，Restricted Isometry Property。训练集：模式识别中数据分为训练集和测试集，本文中的训练集指的是构造样本矩阵的包含k类害虫的所有图片。字典：指的是冗余字典（overcomplete dictionary），即本文提到的由害虫特征构成的训练样本矩阵（A和）。“稀疏性或可压缩性”指的是原始信号经过变换后仅有小部分大系数，其他变换域系数都为0或接近于0。

为实现上述目的，本发明的方法方案是：一种害虫稀疏表征分类识别方法，步骤如下：

a)对k类害虫进行编号，每类害虫序号为t，t＝1,2,…,k；

b)对包含k类害虫的所有图片进行图像预处理；

c)对预处理后的所有图片进行特征提取：提取得到样本矩阵A∈R^m×n,m＜n， A＝[A₁,A₂…,A_k]，A₁,A₂…,A_k分别与1,2,…,k类害虫对应；

d)构造一个满足i,j＝1,2...,m的高斯矩阵Φ∈R^m×m，其中φ_ij为 Φ中的元素，高斯矩阵Φ左乘样本矩阵A得到满足约束等距性条件的特征字典 $\tilde{A} = ΦA;$

e)对预处理后的任一待识别图片进行特征提取，得到待识别样本向量b，高斯矩阵Φ左乘待识别样本向量b得到求解分类模型中的 x₀，noise是一个服从高斯分布的随机噪声，由于实际中存在误差，通过算法重构的系数向量x₀用表示；

f)对害虫进行识别：运用残差函数对进行残差求解，得到残差值向量 t＝1,2,…,k，如果最终残差值向量中值最小项为项z_t，则待识别的害虫图像为第t类害虫。

步骤b）中，图像预处理包括：对图片采用中值滤波的方法进行去噪；采用最大类间方差求解自适应阈值，对图像进行分割。

步骤c）中， $A = [A_{1}, A_{2}, . . ., A_{k}] = [v_{11}, v_{12}, . . ., v_{{tn}_{k}}],$ $A_{t} = [v_{t 1}, v_{t 2}, . . ., v_{{tn}_{t}}] \in R^{m \times n_{t}}$ 表示第t(1≤t≤k)类害虫的特征，其中n_t为t类害虫样本个数，v_tp，p＝1,…,n_t为第t类害虫的训练样本，它由15个分类特征构成：面积、周长、延伸率、标准积、复杂度、占空比、等效半径、偏心率、1阶不变矩，2阶不变矩，3阶不变矩，4 阶不变矩，5阶不变矩，6阶不变矩，7阶不变矩；得到样本矩阵A后，利用归一化函数t＝1,2...,k，q＝1,2...,m对15个特征进行归一化，式中α_tq表示第t类害虫第q个特征，min_q和max_q分别表示害虫第q个特征的最小值和最大值。

步骤e）中，分类模型通过如下步骤获得：

Φb＝ΦAx

$\tilde{b} = Φb = ΦA (x_{0} + x_{noise})$

$= ΦA (x_{0} + x_{noise})$

$= Φ {Ax}_{0} + ΦA x_{noise}$

$= \tilde{A} x_{0} + noise$

x_noise为向量元素值很小的噪声向量，其中是一个线性表述的系数向量，仅有第t类的系数不为零，其他系数都为零；

对于分类模型中的线性表述系数向量x₀的求解，通过线性规划中的内点法求解优化方程（7）得到；

${\hat{x}}_{0} = \arg \min {| | x_{0} | |}_{1} subjectto {| | {\tilde{A} x}_{0} - \tilde{b} | |}_{2} \leq ϵ - - - (7),$

其中为通过内点法求解方程（7）得到的线性表述的系数向量，ε为噪声noise的能量。

步骤f）中，所述的残差函数为

$z_{t} = r_{t} ({\hat{x}}_{0}) = {| | \tilde{b} - \tilde{A} δ_{t} ({\hat{x}}_{0}) | |}_{2} - - - (8),$

残差函数（8）中t＝1,2,…,k，δ_t(x)函数表示：向量x经过函数δ_t(x)映射后，仅有第t类害虫所对应的系数保持不变，其他系数全部为0；t＝1,2,…,k为残差值向量。

本发明的装置方案是：一种害虫稀疏表征分类识别装置，包括：

a)对k类害虫进行编号的模块，该模块将每类害虫分配序号t，t＝1,2,…,k；

b)对包含k类害虫的所有图片进行图像预处理的模块；

c)对预处理后的所有图片进行特征提取的模块：该模块提取图片特征，得到样本矩阵A∈R^m×n,m＜n，A＝[A₁,A₂…,A_k]，A₁,A₂…,A_k分别与1,2,…,k类害虫对应；

d)特征字典构造模块，该模块构造一个满足i,j＝1,2...,m的高斯矩阵Φ∈R^m×m，其中φ_ij为Φ中的元素，高斯矩阵Φ左乘样本矩阵A得到满足约束等距性条件的特征字典

e)求解模块，该模块对预处理后的任一待识别图片进行特征提取，得到待识别样本向量b，高斯矩阵Φ左乘待识别样本向量b得到求解分类模型中的x₀，noise是一个服从高斯分布的随机噪声，由于实际中存在误差，通过算法重构的系数向量x₀用表示；

f)对步骤e）所述任一待识别图片进行害虫识别的模块，该模块运用残差函数对进行残差求解，得到残差值向量t＝1,2,…,k，如果最终残差值向量中值最小项为项z_t，则待识别的害虫图像为第t类害虫。

模块b）中，图像预处理包括：对图片采用中值滤波的方法进行去噪；采用最大类间方差求解自适应阈值，对图像进行分割。

模块c）中， $A = [A_{1}, A_{2}, . . ., A_{k}] = [v_{11}, v_{12}, . . ., v_{{tn}_{k}}],$ $A_{t} = [v_{t 1}, v_{t 2}, . . ., v_{{tn}_{t}}] \in R^{m \times n_{t}}$ 表示第t(1≤t≤k)类害虫的特征，其中n_t为t类害虫样本个数，v_tp，p＝1,…,n_t为第t类害虫的训练样本，它由15个分类特征构成：面积、周长、延伸率、标准积、复杂度、占空比、等效半径、偏心率、1阶不变矩，2阶不变矩，3阶不变矩，4 阶不变矩，5阶不变矩，6阶不变矩，7阶不变矩；得到样本矩阵A后，利用归一化函数t＝1,2...,k，q＝1,2...,m对15个特征进行归一化，式中α_tq表示第t类害虫第q个特征，min_q和max_q分别表示害虫第q个特征的最小值和最大值。

模块e）中，分类模型通过如下步骤获得：

Φb＝ΦAx

$\tilde{b} = Φb = ΦA (x_{0} + x_{noise})$

$= ΦA (x_{0} + x_{noise})$

$= Φ {Ax}_{0} + ΦA x_{noise}$

$= \tilde{A} x_{0} + noise$

x_noise为向量元素值很小的噪声向量，其中是一个线性表述的系数向量，仅有第t类的系数不为零，其他系数都为零；

对于分类模型中的线性表述系数向量x₀的求解，通过线性规划中的内点法求解优化方程（7）得到；

${\hat{x}}_{0} = \arg \min {| | x_{0} | |}_{1} subjectto {| | {\tilde{A} x}_{0} - \tilde{b} | |}_{2} \leq ϵ - - - (7),$

其中为通过内点法求解方程（7）得到的线性表述的系数向量，ε为噪声 noise的能量。

模块f）中，所述的残差函数为

$z_{t} = r_{t} ({\hat{x}}_{0}) = {| | \tilde{b} - \tilde{A} δ_{t} ({\hat{x}}_{0}) | |}_{2} - - - (8),$

残差函数（8）中t＝1,2,…,k，δ_t(x)函数表示：向量x经过函数δ_t(x)映射后，仅有第t类害虫所对应的系数保持不变，其他系数全部为0； $\tilde{z} = [z_{1}, z_{2}, . . ., z_{t}, . . ., z_{k}] (t = 1,2, . . ., k)$ 为残差值向量。

对于k类害虫分类识别，本发明特征字典和分类数学模型的构建及证明如下：

1.字典构建

构造传统的k类害虫的样本矩阵A，其中第t类害虫v_t,p(p＝1,2,…,n_t)由第t 类害虫的归一化面积、周长、延伸率、标准积、复杂度、占空比、等效半径、偏心率、1阶不变矩，2阶不变矩，3阶不变矩，4阶不变矩，5阶不变矩，6阶不变矩，7阶不变矩，共15个特征组成；

$A = [A_{1}, A_{2,} . . ., A_{k}] = [v_{1,1}, v_{1,2}, . . ., v_{k, n_{k}}]$

其中n＝n₁+n₂+…+n_k，且矩阵A∈R^m×n(m＜n)。害虫的线性表述的系数可通过求解方程（3）求得

b＝Ax （3），

为了使（3）式中的样本矩阵A满足约束等距性条件，构造高斯矩阵Φ∈R^m×n且每个元素的随机变量，将3式的等式两边分别左乘一个高斯矩阵Φ，则：

Φb＝ΦAx （4），

即

$\tilde{b} = \tilde{A} x - - - (5),$

由于在实际中存在噪声及模型误差，（5）式的数学模型不符合实际情况，在此基础上构造了形如（6）的数学模型：

$\tilde{b} = \tilde{A} x_{0} + noise - - - (6),$

其中x₀＝[0,0,…,α_i1，α_i2，…,α_in，0,…,0]^T∈Rⁿ是一个系数向量，即仅有第i类的系数不为零，其他系数都为零;noise是一个服从高斯分布的随机噪声。

2.理论证明

设矩阵A是R^m×n样本矩阵，矩阵Φ∈R^m×m高斯矩阵，其中的独立高斯随机变量

对于中的任一个元素，由于则

$E (Σ_{k = 1}^{m} φ_{kj} a_{jk}) = Σ_{k = 1}^{m} a_{jk} E (φ_{kj}) = 0$

$D (Σ_{k = 4}^{m} φ_{kj} a_{jk}) = Σ_{k = 1}^{m} \frac{a_{jk}}{m}$

根据概率理论，有限个相互独立的正态随机变量的线性组合仍然服从正态分布，即中的每个元素由于矩阵中的每个元素服从高斯分布，根据压缩感知相关定理可知，新特征字典以的概率满足约束等距性条件。

3.带噪声的分类数学模型推导：

由于模型及噪声误差，在实际中的线性表征很难出现形如（5）式的数学模型，考虑到实际应用问题，我们现在推导（6）式的数学模型。假设x₀是除了第i 类外系数都为0的向量，x_noise∈Rⁿ是系数值很小的向量。

$\tilde{b} = \tilde{A} (x_{0} + x_{noise})$

$= ΦA (x_{0} + x_{noise})$

$= Φ {Ax}_{0} + Φ {Ax}_{noise}$

在前面我们已经证明了一个高斯矩阵乘以一个向量仍然服从高斯分布，因此上式可以变为

$\tilde{b} = \tilde{A} x_{0} + noise - - - (7),$

式（7）是经典的压缩感知数学模型。

x₀，x，为3个不同模型的变量，其中x为b＝Ax模型的线性表征系数向量，x₀为模型中的线性表征系数向量，为运用算法重构后的线性表征系数向量，由于重构算法重构x₀时存在误差，因此为了与x₀区别，新添加了一个变量

由于本发明的特征字典符合RIP条件，所以本发明所提出的识别方法准确度高、可靠性与稳定性强，性能优于现有技术。

附图说明

图1是满足约束等距性特征字典构建方法图；

图2是害虫分类流程图；

图3是分类成功率及分类时间比较图表。

具体实施方式

下面结合附图对本发明做进一步说明。由于识别装置与识别方法本质相同、模块与步骤相一致，下面主要介绍识别方法。

识别方法的主要步骤在于：首先对待提取特征的害虫图片进行去噪、分割等预处理，对训练集中的所有害虫图像进行特征提取，得到样本矩阵A∈R^m×n,m＜n，构造一个满足的高斯矩阵Φ∈R^m×m，高斯矩阵Φ左乘样本矩阵A得到对任一副图片（图2中待分类害虫图片，也是下文待识别样本），提取待识别害虫图像特征，得到待识别样本向量b，高斯矩阵Φ左乘待识别样本向量b得到可以由中与同类害虫的训练样本线性表述，可以得到新的害虫分类数学模型其中n（即上文中noise）是高斯噪声，由于m＜n，且满足约束等距性，因此运用l₁最小化的方法求解出系数向量x（即用（7）求解），将重构出的系数向量进行残差计算；残差最小的作为待识别样本的识别结果。

识别方法的主要步骤如图2所示，下面进行具体解释。

图像预处理

由于图片在采集过程中由于背景环境等因素影响会引入噪声，因此首先采用中值滤波的方法对噪声进行抑制。然后为了方便特征提取，采用最大类间方差求解自适应阈值，对图像进行分割，将分割后的图像用作后期的特征提取。

满足约束等距性字典的构建

害虫稀疏表征分类系统中满足约束等距性条件的字典构造方法模型如图1所示。构造传统的构建k类害虫的样本矩阵A，其中第t类害虫v_i,pp＝1,2,…,n_t由第t类害虫的归一化面积、周长、延伸率、标准积、复杂度、占空比、等效半径、偏心率、1-7阶不变矩特征组成；

$A = [A_{1}, A_{2}, . . ., A_{k}] = [v_{1,1}, v_{1,2}, . . ., v_{k {, n}_{k}}]$

其中n＝n₁+n₂+…+n_k，且矩阵A∈R^m×n(m＜n)。害虫的线性表述的系数可通过求解方程（3）求得

b＝Ax （3），

为了使（3）式中的特征字典满足约束等距性条件，构造高斯矩阵Φ∈R^m×m且每个元素的随机变量，将（8）式的等式两边分别左乘一个高斯矩阵Φ，则：

Φb＝ΦAx (4)，即

$\tilde{b} = \tilde{A} x - - - (5),$

由于在实际中存在噪声及模型误差，（5）式的数学模型不符合实际情况，在此基础上构造了形如（6）的数学模型：

$\tilde{b} = \tilde{A} x_{0} + noise - - - (6),$

其中 $x_{0} = [0,0, . . ., α_{t 1}, α_{t 2}, . . ., α_{{tn}_{t}}, 0, . . ., 0^{T}] \in R^{n}$ 是一个系数向量，即仅有第t类的系数不为零，其他系数都为零;noise是一个服从高斯分布的随机噪声。

害虫识别

首先求解公式（6），公式（6）可以求解如下约束：

${\hat{x}}_{0} = \arg \min {| | x_{0} | |}_{1} subject>{| | \tilde{A} x_{0} - \tilde{b} | |}_{2}\leqϵ---(7),$

（7）式可以通过线性规划中的内点法求解出结果，求出的为线性表述的系数向量；为了进行分类，通过式（8）求解残差：

$r_{t} ({\hat{x}}_{0}) = {| | \tilde{b} - \tilde{A} δ_{t} ({\hat{x}}_{0}) | |}_{2} - - - (8),$

其中t＝1,2,…,k，其中函数δ_t(·)表示一个向量x通过函数δ_t(·)映射后，除第 t类害虫所对应的系数不变外，其他类害虫系数都变为0。求出残差后，残差最小的项即为害虫所属的类，从而达到了分类识别的目的。

下面通过一个仿真实例具体说明。

仿真实例

系统仿真参数设置如下：采用9种粮仓中常见的害虫作为实验仿真数据，9 种害虫包括：大谷盗、谷蠹、黑菌虫、锯谷盗、扁谷盗、绿豆象、米象、长头谷盗和拟谷盗；选取135副图像构成特征字典（每种害虫的15幅图像），45个样本（每种害虫5幅图像）作为待识别样本。由于高斯矩阵具有随机性，因此在本实验中对每个分类进行100次仿真求其平均值。本发明考虑采用识别率及时间开销对各个方法进行仿真并分析。

一、图像预处理

采集各类害虫的图片，运用photoshop（或其他图像处理软件）对图片进行处理，做成大小为640×480的图片，其中每类害虫20张图片；

对各类害虫图片采用中值滤波的方法进行去噪；

采用最大类间方差求解自适应阈值，对图像进行分割。

二、特征提取

对预处理后的图像进行特征提取，害虫的面积、周长、延伸率、标准积、复杂度、占空比、等效半径、偏心率、1-7阶不变矩特征，为了保证分类时各特征的量级相同采用归一化函数对特征进行归一化：

$α_{tq} = \frac{α_{tq} - \min_{q}}{\max_{q} - \min_{q}}$

得到归一化特征，将归一化特征组成样本矩阵A＝[A₁,A₂,…,A₉]；

三、构造满足约束等距性条件的特征字典

构造高斯矩阵Φ∈R^m×m且每个元素的随机变量，对步骤1中的样本矩阵A左乘高斯矩阵得则即为满足约束等距性条件的字典。

四、重构系数向量及害虫分类

提取待识别害虫图像的特征，构成待识别样本b，待识别样本b左乘高斯矩阵得由于待识别的害虫样本能够被同类的害虫的训练样本线性表述，因此，求解优化方程：

${\hat{x}}_{0} = \arg \min {| | x_{0} | |}_{1} subjectto {| | {\tilde{A} x}_{0} - \tilde{b} | |}_{2} \leq ϵ - - - (7),$

运用线性规划中的内点法对上式进行求解，得到线性表示系数x₀，直接运用x₀进行分类比较麻烦，采用残差函数：

$r_{t} ({\hat{x}}_{0}) = {| | \tilde{b} - \tilde{A} δ_{t} ({\hat{x}}_{0}) | |}_{2} - - - (8),$

计算残差，残差最小项即为所属类。

图3给出采用本发明方法的分类识别方法效果比较。从仿真的结果来看，由于本发明的特征字典符合RIP条件，因此不论从识别的成功率还是时间的消耗都要优于现有技术的特征字典，因此实际的仿真结果证明了本文特征字典的有效性。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 害虫稀疏表征分类识别方法与分类识别装置 [P] . 中国专利： CN102819748B . 2015.03.11
2. 害虫稀疏表征分类识别方法与分类识别装置 [P] . 中国专利： CN102819748A . 2012-12-12
3. Incoming wave classification distinction device, incoming wave classification distinction method, dispatch position presumption device and dispatch position presumption method [P] . 日本专利： JPWO2010038468A1 . 2012-03-01

机译：进波分类识别装置，进波分类识别方法，调度位置推测装置和调度位置推测方法
4. INCOMING WAVE CLASSIFYING AND DISTINGUISHING DEVICE, INCOMING WAVE CLASSIFYING AND DISTINGUISHING METHOD, ORIGINATING POSITION ESTIMATING DEVICE AND ORIGINATING POSITION ESTIMATING METHOD [P] . 美国专利： US2011181472A1 . 2011-07-28

机译：包含波分类识别装置，包含波分类识别方法，起始位置估计装置和起始位置估计方法
5. INCOMING WAVE CLASSIFYING AND DISTINGUISHING DEVICE, INCOMING WAVE CLASSIFYING AND DISTINGUISHING METHOD, ORIGINATING POSITION ESTIMATING DEVICE AND ORIGINATING POSITION ESTIMATING METHOD [P] . 世界知识产权组织专利： WO2010038468A1 . 2010-04-08

机译：包含波分类识别装置，包含波分类识别方法，起始位置估计装置和起始位置估计方法