首页> 中国专利> 基于半监督稀疏鉴别嵌入的高光谱遥感影像分类方法

基于半监督稀疏鉴别嵌入的高光谱遥感影像分类方法

摘要

本发明提供一种基于半监督稀疏鉴别嵌入的高光谱遥感影像分类方法,其采用半监督稀疏鉴别嵌入算法对高光谱遥感影像进行维数简约,结合了近邻流形结构及稀疏性的优点,不仅保留样本间的稀疏重构关系,而且利用稀疏表示的自然判别能力,无需人为地选择近邻参数值,一定程度上缓解了近邻参数选择的困难,同时利用少量有标记训练样本以及部分无标记训练样本来发现蕴藏在高维数据的内在属性以及低维流形结构,能够提高对高光谱遥感影像中地物类别的分类精度;同时,本发明方法通过有区别的对待已标注数据与无标注数据,最大程度的增加相同地物类别的数据点之间的可聚性,从而在另一方面帮助提高对高光谱遥感影像中地物类别的分类精度。

著录项

  • 公开/公告号CN103593676A

    专利类型发明专利

  • 公开/公告日2014-02-19

    原文格式PDF

  • 申请/专利权人 重庆大学;

    申请/专利号CN201310635210.3

  • 发明设计人 黄鸿;曲焕鹏;

    申请日2013-11-29

  • 分类号G06K9/62;G06K9/66;

  • 代理机构重庆博凯知识产权代理有限公司;

  • 代理人钟继莲

  • 地址 400044 重庆市沙坪坝区沙正街174号

  • 入库时间 2024-02-19 22:14:31

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2018-11-23

    未缴年费专利权终止 IPC(主分类):G06K9/62 授权公告日:20160817 终止日期:20171129 申请日:20131129

    专利权的终止

  • 2016-08-17

    授权

    授权

  • 2014-03-19

    实质审查的生效 IPC(主分类):G06K9/62 申请日:20131129

    实质审查的生效

  • 2014-02-19

    公开

    公开

说明书

技术领域

本发明涉及高光谱数据处理方法与应用技术领域,具体涉及一种基于半监督稀疏鉴别 嵌入的高光谱遥感影像分类方法。

背景技术

高光谱遥感技术自20世纪80年代以来快速发展,其影像记录了地物目标的连续光谱, 包含的信息更丰富,具备了识别更多种类的地物目标以及更高精度进行目标分类的能力。 但由于高光谱数据由大量波段构成高维特征空间,大多数算法的复杂度随维数呈指数关系 增长,对其处理需要更大的计算量,且其波段间具有高度相关性和冗余性,同时存在维数 很高,分类时易因Hughes现象而无法获得理想结果等问题。科学家通过研究发现:高光 谱数据可被描述为在低维嵌入空间上的流形(Manifold),即:高维空间的点是在少数独立 变量的共同作用下在观测空间张成一个流形,如果能有效的发现其内在的主要变量,便能 更好地了解高维数据的本质属性和特点。维数约减是解决以上问题的有效办法,能够降低 数据的维数,得到高维数据有意义的低维表示,以便理解其内在的结构及后续处理。

迄今为止,在高维数据处理的研究领域中,国内外学者已经提出了一系列经典算法, 其中应用较广泛的降维算法主要包括:主成分分析(Principal Component Analysis,PCA) 和线性判别分析(Linear Discriminant Analysis,LDA)等子空间学习方法。而PCA和LDA 基于的假设是高维数据空间的嵌入子空间是线性的,隐藏在高维数据中的内在属性较难被 发现,因此无法揭示高光谱数据的低维流形结构。局部保持投影(Local Preserving  Projrction,LPP)及邻域保持嵌入算法(Neighborhood Preserving Embedding,NPE)等局 部方法通过近邻图保留样本的局部近邻结构,在一定程度上保持了原始数据的非线性流 形,但是这两种算法依赖于人工预定义的近邻图,要获得好的性能往往需要更多的训练样 本,存在如近邻参数选择困难(如近邻数k、核宽σ)、噪声敏感等问题,分类效果受到限 制。

稀疏保持投影(Sparsity Preserving Projections,SPP)是最近提出的一种基于稀疏表示 理论的无监督降维算法。该算法不同于传统方法的图构建方式(如K-近邻),其利用样本 间的稀疏重构关系建图,是全局性的稀疏构图算法,并归结为L1范数最小化问题。SPP 算法不仅利用稀疏表示的自然判别能力,而且无需人为地选择近邻参数值,一定程度上缓 解了近邻参数选择的困难。在高光谱图像分类中,常面对的是大量的未标记数据以及相对 较少的有标记数据。虽然SPP算法无需对训练样本进行标记,但是没有有效利用标记样本 中所提供的鉴别信息。因此,如何从标记数据以及未标记数据中提取出有用的知识来改善 学习性能、提高分类精度,在高光谱图像分类领域中尤为重要。

发明内容

针对现有技术存在的上述不足,本发明的目的在于提供一种基于半监督稀疏鉴别嵌入 的高光谱遥感影像分类方法,其通过半监督稀疏鉴别嵌入算法对高光谱遥感影像进行维数 简约,利用少量有标记训练样本以及部分无标记训练样本来发现蕴藏在高维数据的内在属 性以及低维流形结构,以提高对高光谱遥感影像中地物类别的分类精度。

为了实现上述目的,本发明采用了如下的技术手段:

基于半监督稀疏鉴别嵌入的高光谱遥感影像分类方法,包括如下步骤:

1)读入高光谱遥感影像数据;

2)将高光谱遥感影像中每一个数据点根据其光谱波段生成一个光谱数据向量,从而 由各个数据点的光谱数据向量组成整幅高光谱遥感影像的光谱数据矩阵;

3)从高光谱遥感影像中选取部分数据点作为样本数据点,由各个样本数据点的光谱 数据向量组成样本数据矩阵,并根据先验知识从样本数据矩阵中选取部分样本数据点的光 谱数据向量进行已知地物类别的标注,生成相应的样本类别标签;

4)将样本数据矩阵中的每个光谱数据向量进行稀疏表示,求得各个光谱数据向量的 最优稀疏系数向量,从而得到样本数据矩阵对应的稀疏系数矩阵;

5)借助样本数据矩阵中标注有向量类别标签的样本数据点的光谱数据向量,构建用 于度量样本数据矩阵中光谱数据向量之间相似性的近邻图;

6)根据近邻图计算样本数据矩阵对应的近邻权重矩阵;

7)根据目标优化函数,利用样本数据矩阵对应的稀疏系数矩阵和近邻权重矩阵计算 高光谱遥感影像的投影矩阵;

8)通过投影矩阵将高光谱遥感影像投影到低维嵌入空间,得到高光谱遥感影像的嵌 入特征矩阵;

9)以嵌入特征矩阵作为高光谱遥感影像中地物类别的分类识别特征,利用K-近邻分 类算法对高光谱遥感影像进行地物类别的分类,得出地物类别的分类结果。

上述基于半监督稀疏鉴别嵌入的高光谱遥感影像分类方法中,作为进一步改进方案, 所述步骤2)具体为:

根据不同光谱波段对地物的光谱反射特性,将高光谱遥感影像转换为Q行B列的光谱 数据矩阵XQ={x1,x2,…,xq,…,xQ}T,其中,Q表示高光谱遥感影像的数据点空间尺寸且 Q=M×N,B表示高光谱遥感影像的光谱波段数;光谱数据矩阵XQ中的每一行表示高光 谱遥感影像中的一个数据点在各个光谱波段上的光谱数据值,每一列表示高光谱遥感影像 中各个数据点在一个光谱波段的光谱数据值;xq表示高光谱遥感影像中一个数据点在各个 光谱波段上的光谱数据值所构成的光谱数据向量,q∈{1,2,…,Q};T为矩阵转置符号。

上述基于半监督稀疏鉴别嵌入的高光谱遥感影像分类方法中,作为进一步改进方案, 所述步骤3)得到的样本数据矩阵具体为:

X={(x1,l1),(x2,l2),…,(xi,li),…,(xC,lC),xC+1,xC+2,…,xn}T

其中,X表示样本数据矩阵,xi表示从高光谱遥感影像中选取的一个样本数据点的光 谱数据向量,li表示对光谱数据向量xi标注的样本类别标签,i∈{1,2,…,n},n表示从高光 谱遥感影像中选取作为样本数据点的数量,样本数据矩阵X中前C个光谱数据向量具有样 本类别标签,其余的n-C个光谱数据向量无样本类别标签。

上述基于半监督稀疏鉴别嵌入的高光谱遥感影像分类方法中,作为进一步改进方案, 所述步骤4)具体为:

41)对样本数据矩阵X中的任一个光谱数据向量xi,i∈{1,2,…,n},n表示从高光谱 遥感影像中选取作为样本数据点的数量,利用样本数据矩阵X中的其它各个光谱数据向量 建立xi的稀疏线性方程:

Xjsi=si,1x1+si,2x2+…+si,jxj+…+si,i-1xi-1+si,i+1xi+1+…+si,nxn

其中,Xjsi表示光谱数据向量xi的稀疏表示向量,Xj表示样本数据矩阵X中除xi以 外的光谱数据向量集,si表示光谱数据向量xi的稀疏系数向量,即:

si={si,1,si,2,…,si,j,…,si,i-1,si,i+1,…,si,n};

si,j表示xi的稀疏线性方程中对应于光谱数据向量xj的稀疏系数,j∈{1,2,…,n}且 j≠i;

42)根据稀疏表示约束条件和松弛约束条件||xi-Xjsi||≤ε对xi的稀疏线性方 程进行求解,得到xi的同时满足稀疏表示约束条件和松弛约束条件的最优稀疏系数向量 为L1范数运算符;||·||为欧氏距离运算符;ε为松弛变量值,且0<ε<10;

43)重复步骤41)~42),求得样本数据矩阵X中的每一个光谱数据向量xi的最优稀 疏系数向量构成样本数据矩阵对应的稀疏系数矩阵

S~={S~1,S~2,...,S~i,...,S~n}.

上述基于半监督稀疏鉴别嵌入的高光谱遥感影像分类方法中,作为进一步改进方案, 所述步骤5)中,近邻图构建方法具体为:

51)对于样本数据矩阵X中任一个标注有向量类别标签的光谱数据向量xi对应的数据 点,利用该数据点的k个近邻数据点构建的近邻数据集表示光谱数据向量xi所对应数据点的k个近邻数据点之中任一个近邻数据点的光谱数据向 量,d∈{1,2,…,k};

52)将近邻数据集knn(xi)为两部分:

|如果和xi标注有不同的样本类别标签};

knnS(xi)=knn(xi)-knnD(xi);

其中,knnD(xi)表示光谱数据向量xi的k个近邻数据点中来自于不同地物类别的数据 点组成的相异近邻数据子集,knnS(xi)则为近邻数据集knn(xi)中除相异近邻数据子集 knnD(xi)以外的部分组成的相似近邻数据子集;

53)重复步骤51)~52),对样本数据矩阵X中每一个标注有向量类别标签的光谱数据 向量构建对应的相似近邻数据子集;

53)构建近邻图Gw:对于样本数据矩阵X中每一个标注有向量类别标签的光谱数据 向量xi,考虑样本数据矩阵X中每一个其它的光谱数据向量xj∈X,j≠i,若满足 xj∈knnS(xi),则在近邻图GS中用一条边连接xi和xj所对应的两个数据点,由此遍历完成 近邻图GS的构建。

上述基于半监督稀疏鉴别嵌入的高光谱遥感影像分类方法中,作为进一步改进方案, 所述步骤6)中的近邻权重矩阵Ww按如下公式计算:

其中,ωw,ij表示样本数据矩阵X中两个不同光谱数据向量xi和xj之间的权重因子,从 而由样本数据矩阵X中每两个不同光谱数据向量的权重因子构成近邻权重矩阵Ww; knnS(xi)和knnS(xj)分别表示光谱数据向量xi和xj在近邻图GS中的相似近邻数据子集; α为同类权重参数,且α>1。

上述基于半监督稀疏鉴别嵌入的高光谱遥感影像分类方法中,作为进一步改进方案, 所述步骤7)具体为:

目标函数J(V)为:

J(V)=minV[tr[VTX(Dw-WwS~T-S~Ww+S~DwS~T)XTV]tr(VTXXTV)];

其中,表示样本数据矩阵X对应的稀疏系数矩阵,Ww表示样本数据矩阵X对应的 近邻权重矩阵,V表示投影矩阵;Dw为对角矩阵,且其对角线元素ωw,ij表 示样本数据矩阵X中两个不同光谱数据向量xi和xj之间的权重因子,i∈{1,2,…,n}, j∈{1,2,…,n},n表示从高光谱遥感影像中选取作为样本数据点的数量;tr(·)表示对矩阵 的求迹运算符,T为矩阵转置符号;

在VTXXTV=E的约束条件下,根据目标函数J(V)得到投影特征方程:

XSγXTV=λXXTV,其中Sγ=Dw-WwS~T-S~Ww+S~DwS~T;

对投影特征方程进行广义特征值求解得到投影矩阵V={v1,v2,…,vd};其中,v1,v2,…,vd表示对投影特征方程求解得到的前d个最大特征值λ12>…>λd对应的d个特征向量, d<B;其中,B表示高光谱遥感影像的光谱波段数,E表示单位矩阵。

上述基于半监督稀疏鉴别嵌入的高光谱遥感影像分类方法中,作为进一步改进方案, 所述步骤8)中,高光谱遥感影像的嵌入特征矩阵通过下式进行投影得到:

Y=VTXQ

其中,Y表示高光谱遥感影像的光谱数据矩阵XQ通过投影矩阵V投影到低维嵌入空 间的嵌入特征矩阵,T为矩阵转置符号。

与现有技术相比,本发明具有以下优点:

1、本发明基于半监督稀疏鉴别嵌入的高光谱遥感影像分类方法,采用半监督稀疏鉴 别嵌入算法对高光谱遥感影像进行维数简约,结合了近邻流形结构及稀疏性的优点,不仅 保留样本间的稀疏重构关系,而且利用稀疏表示的自然判别能力,无需人为地选择近邻参 数值,一定程度上缓解了近邻参数选择的困难,同时利用少量有标记训练样本以及部分无 标记训练样本来发现蕴藏在高维数据的内在属性以及低维流形结构,能够提高对高光谱遥 感影像中地物类别的分类精度。

2、本发明基于半监督稀疏鉴别嵌入的高光谱遥感影像分类方法中,利用了一种基于 半监督的稀疏鉴别嵌入模型,即仅通过对数据样本中的少量数据点进行标注,并结合部分 未标注数据点来进行学习,即可实现对整幅高光谱遥感影像的地物类别分类,适宜于对数 据量大、含混度高、地面已知样本数据少的高光谱遥感影像数据进行地物类别的分类。

3、本发明基于半监督稀疏鉴别嵌入的高光谱遥感影像分类方法中,通过有区别的对 待已标注数据与无标注数据,通过权重参数的区别设置突出已标注数据与无标注数据在得 到低维鉴别特征重要程度的差异,实现在低维嵌入空间中相同地物类别数据点之间依然保 持其近邻关系,最大程度的增加相同地物类别的数据点之间的可聚性,从而在另一方面帮 助提高对高光谱遥感影像中地物类别的分类精度。

附图说明

图1为本发明基于半监督稀疏鉴别嵌入的高光谱遥感影像分类方法的流程图;

图2为本发明实施例二中Indian Pine数据集中“Hay_windrowed”,“Soybeans_min”, “Woods”,“Corn_notill”,“Grass_pasture”,“Grass_trees”六种真实地物类别的地面分布 情况图;

图3为本发明实施例二中对Indian Pine数据集采用PCA+1NN方法分类得到的分类效 果图;

图4为本发明实施例二中对Indian Pine数据集采用LDA+1NN方法分类得到的分类效 果图;

图5为本发明实施例二中对Indian Pine数据集采用NPE+1NN方法分类得到的分类效 果图;

图6为本发明实施例二中对Indian Pine数据集采用SPP+1NN方法分类得到的分类效 果图;

图7为本发明实施例二中对Indian Pine数据集采用SSDE+1NN方法(即本发明方法) 分类得到的分类效果图;

具体实施方式

下面结合附图和具体实施方式对本发明作进一步详细说明。

为了解决监督算法需要大量有标记数据以及无监督算法没有有效利用有标记数据提 供的鉴别信息的不足,本发明提出了一种基于半监督稀疏鉴别嵌入(Semi-supervised  Sparsity Discriminant Embedding,可缩写为SSDE)的高光谱遥感影像分类方法,该方法结 合了近邻流形结构及稀疏性的优点,不仅保留样本间的稀疏重构关系,而且利用稀疏表示 的自然判别能力,无需人为地选择近邻参数值,一定程度上缓解了近邻参数选择的困难, 同时利用少量有标记训练样本以及大量无标记训练样本来发现蕴藏在高维数据的内在属 性以及低维流形结构,从而提高对高光谱遥感影像中地物类别的分类精度。

参照图1,本发明基于半监督稀疏鉴别嵌入的高光谱遥感影像分类方法,包括如下步 骤:

1)读入高光谱遥感影像数据;

2)将高光谱遥感影像中每一个数据点根据其光谱波段生成一个光谱数据向量,从而 由各个数据点的光谱数据向量组成整幅高光谱遥感影像的光谱数据矩阵;

3)从高光谱遥感影像中选取部分数据点作为样本数据点,由各个样本数据点的光谱 数据向量组成样本数据矩阵,并根据先验知识从样本数据矩阵中选取部分样本数据点的光 谱数据向量进行已知地物类别的标注,生成相应的样本类别标签;

4)将样本数据矩阵中的每个光谱数据向量进行稀疏表示,求得各个光谱数据向量的 最优稀疏系数向量,从而得到样本数据矩阵对应的稀疏系数矩阵;

5)借助样本数据矩阵中标注有向量类别标签的样本数据点的光谱数据向量,构建用 于度量样本数据矩阵中光谱数据向量之间相似性的近邻图;

6)根据近邻图计算样本数据矩阵对应的近邻权重矩阵;

7)根据目标优化函数,利用样本数据矩阵对应的稀疏系数矩阵和近邻权重矩阵计算 高光谱遥感影像的投影矩阵;

8)通过投影矩阵V将高光谱遥感影像投影到低维嵌入空间,得到高光谱遥感影像的 嵌入特征矩阵Y;

9)以嵌入特征矩阵Y作为高光谱遥感影像中地物类别的分类识别特征,利用K-近邻 分类算法对高光谱遥感影像进行地物类别的分类,得出地物类别的分类结果。

作为本发明基于半监督稀疏鉴别嵌入的高光谱遥感影像分类方法的进一步改进方案, 高光谱遥感影像数据反映了地物对不同波段的光谱反射特性,根据高光谱遥感影像的数据 点空间尺寸M×N(M行N列个数据点)以及光谱波段数B,若令Q=M×N,则可以将 高光谱遥感影像中每一个数据点根据其光谱波段生成一个光谱数据向量,从而将高光谱遥 感影像转换为Q行B列的光谱数据矩阵。由此,所述步骤2)具体为:

根据不同光谱波段对地物的光谱反射特性,将高光谱遥感影像转换为Q行B列的光谱 数据矩阵XQ={x1,x2,…,xq,…,xQ}T,其中,Q表示高光谱遥感影像的数据点空间尺寸且 Q=M×N,B表示高光谱遥感影像的光谱波段数;光谱数据矩阵XQ中的每一行表示高光 谱遥感影像中的一个数据点在各个光谱波段上的光谱数据值,每一列表示高光谱遥感影像 中各个数据点在一个光谱波段的光谱数据值;xq表示高光谱遥感影像中一个数据点在各个 光谱波段上的光谱数据值所构成的光谱数据向量,q∈{1,2,…,Q};T为矩阵转置符号。

作为本发明基于半监督稀疏鉴别嵌入的高光谱遥感影像分类方法的进一步改进方案, 本发明方法中,是从高光谱遥感影像中选取部分数据点作为样本数据点组成样本数据矩 阵,并且在这些样本数据点中,可以根据先验知识得知其中的部分样本数据点的地物类别, 并加以标注。因此,所述步骤3)得到的样本数据矩阵具体为:

X={(x1,l1),(x2,l2),…,(xi,li),…,(xC,lC),xC+1,xC+2,…,xn}T

其中,X表示样本数据矩阵,xi表示从高光谱遥感影像中选取的一个样本数据点的光 谱数据向量,li表示对光谱数据向量xi标注的样本类别标签,i∈{1,2,…,n},n表示从高光 谱遥感影像中选取作为样本数据点的数量,样本数据矩阵X中前C个光谱数据向量具有样 本类别标签,其余的n-C个光谱数据向量无样本类别标签。也就是说,根据先验知识从样 本数据矩阵中选取进行已知地物类别标注的光谱数据向量的数量记为C个。

作为本发明基于半监督稀疏鉴别嵌入的高光谱遥感影像分类方法的进一步改进方案, 本发明采用了稀疏表示的方法从样本数据矩阵中来提取整个高光谱遥感影像中不同地物 类别的数据点的内在流行结构特征。稀疏表示(Sparsity Representation,SR;可参见现有 技术文献“FKInaba,EOTSalles.Face Recognition Based on Sparse Representation and Joint  Sparsity Model with Matrix Completion[J].IEEE Latin America Transactions,2012.Vol.10(1): 1344-1351.”)最初用于信号的压缩和表示,对于残缺和强干扰的数据具有良好的鲁棒性, 现已成功应用于信号处理、统计学及模式识别等领域。其核心思想是将信号x∈Rm分解为 一系列基信号的线性组合并希望尽可能多的si系数为0(即 向量S=[s1,s2,...,sn]T尽可能稀疏),具有非零系数的信号揭示了原信号的主要特征和内在结 构。其数学模型如下:

minsi||si||0;s.t.xi=Xjsi;

式中,X=[x1,x2,...,xn]∈Rm×n为基信号矩阵,si∈Rn是用基信号矩阵X中除信号xi剩下 的信号样本集合Xj进行稀疏表示重建的稀疏系数向量,||si||0表示si的L0范数,用于衡量 si的稀疏性。其中向量的L0范数表示向量中非零元素的数目。但由于最小化L0范数问题 是一个NP-hard问题,求解困难,因此在系数足够稀疏的条件下,L0范数最小化问题可以 转化为L1范数最小化问题:

minsi||si||1;s.t.xi=Xjsi,1={1}Tsi;

式中,||si||1表示稀疏系数向量si的L1范数,{1}∈Rn表示全1向量。向量si的L1范 数可表示为:Σi=1n|si|,si=[si1,...,sij,...,sii-1,0,sii+1,...,sin]TRn;sij表示对样本xi进行重构 的稀疏系数,即:

xi=si,1x1+si,2x2+…+si,jxj+…+si,i-1xi-1+si,i+1xi+1+…+si,nxn

对于每一个xi∈X,计算相应的稀疏系数向量si,就可以得到训练样本的稀疏系数矩阵 S=[s1,s2,...,sn]。

然而,由于高光谱遥感图像数据中可能存在噪声,因此可能导致xi的稀疏表示存在误 差。为此,本发明基于半监督稀疏鉴别嵌入的高光谱遥感影像分类方法中,考虑了高光谱 遥感图像中的可能存在噪声误差问题,对光谱数据向量进行稀疏表示求解过程引入了松弛 变量ε构建的松弛约束条件。基于此,所述步骤4)具体为:

41)对样本数据矩阵X中的任一个光谱数据向量xi,i∈{1,2,…,n},n表示从高光谱 遥感影像中选取作为样本数据点的数量,利用样本数据矩阵X中的其它各个光谱数据向量 建立xi的稀疏线性方程:

Xjsi=si,1x1+si,2x2+…+si,jxj+…+si,i-1xi-1+si,i+1xi+1+…+si,nxn

其中,Xjsi表示光谱数据向量xi的稀疏表示向量,Xj表示样本数据矩阵X中除xi以 外的光谱数据向量集,si表示光谱数据向量xi的稀疏系数向量,即:

si={si,1,si,2,…,si,j,…,si,i-1,si,i+1,…,si,n};

si,j表示xi的稀疏线性方程中对应于光谱数据向量xj的稀疏系数,j∈{1,2,…,n}且 j≠i;

42)根据稀疏表示约束条件和松弛约束条件||xi-Xjsi||≤ε对xi的稀疏线性方 程进行求解,得到xi的同时满足稀疏表示约束条件和松弛约束条件的最优稀疏系数向量 为L1范数运算符,即||si||1表示稀疏系数向量si的L1范数;||·||为欧氏距离运算符, 即||xi-Xjsi||表示求光谱数据向量xi与其稀疏表示向量Xjsi的欧氏距离值;ε为松弛变量 值,且0<ε<10;

43)重复步骤41)~42),求得样本数据矩阵X中的每一个光谱数据向量xi的最优稀 疏系数向量构成样本数据矩阵对应的稀疏系数矩阵

S~={S~1,S~2,...,S~i,...,S~n}.

作为本发明基于半监督稀疏鉴别嵌入的高光谱遥感影像分类方法的进一步改进方案, 所述步骤5)中,近邻图构建方法具体为:

51)对于样本数据矩阵X中任一个标注有向量类别标签的光谱数据向量xi对应的数据 点,利用该数据点的k个近邻数据点构建的近邻数据集表示光谱数据向量xi所对应数据点的k个近邻数据点之中任一个近邻数据点的光谱数据向 量,d∈{1,2,…,k};

52)将近邻数据集knn(xi)为两部分:

如果和xi标注有不同的样本类别标签};

knnS(xi)=knn(xi)-knnD(xi);

其中,knnD(xi)表示光谱数据向量xi的k个近邻数据点中来自于不同地物类别的数据 点组成的相异近邻数据子集,knnS(xi)则为近邻数据集knn(xi)中除相异近邻数据子集 knnD(xi)以外的部分组成的相似近邻数据子集;

53)重复步骤51)~52),对样本数据矩阵X中每一个标注有向量类别标签的光谱数据 向量构建对应的相似近邻数据子集;

53)构建近邻图Gw:对于样本数据矩阵X中每一个标注有向量类别标签的光谱数据 向量xi,考虑样本数据矩阵X中每一个其它的光谱数据向量xj∈X,j≠i,若满足 xj∈knnS(xi),则在近邻图GS中用一条边连接xi和xj所对应的两个数据点,由此遍历完成 近邻图GS的构建。

在近邻图GS中,一个光谱数据向量xi的相似近邻数据子集knnS(xi)中可能有部分光谱 数据向量述是没有标注类别标签的,但是这些光谱数据向量对应的数据点都与光谱数据向 量xi对应的数据点足够近,很有可能与光谱数据向量xi属于相同的地物类别,由此体现了 样本数据矩阵中光谱数据向量之间的相似性。

作为本发明基于半监督稀疏鉴别嵌入的高光谱遥感影像分类方法的进一步改进方案, 所述步骤6)中的近邻权重矩阵Ww按如下公式计算:

其中,ωw,ij表示样本数据矩阵X中两个不同光谱数据向量xi和xj之间的权重因子,从 而由样本数据矩阵X中每两个不同光谱数据向量的权重因子构成近邻权重矩阵Ww; knnS(xi)和knnS(xj)分别表示光谱数据向量xi和xj在近邻图GS中的相似近邻数据子集; α为同类权重参数,且α>1。

若两个数据点具有相同的类别标签,则表明两数据点属于相同地物类别,为了通过权 重因子体现已标注数据点(具有样本类别标签的数据点)与未标注数据点(无样本类别标 签的数据点)在得到低维鉴别特征重要程度的差异性,对近邻图GS中连接未标注数据点的 边赋予权重因子的值为1,而对近邻图GS中连接相同地物类别的数据点之间的边赋予更高 的同类权重参数α,以同类权重参数α突出标注的相同地物类别的数据点的作用,使维数 约简处理得到的低维嵌入空间中相同地物类别的数据点更加聚集;因此α的取值大于1, 以实现在低维嵌入空间中相同地物类别的数据点之间依然保持其近邻关系,不同地物类别 的数据点之间的距离尽可能最大化,最大程度的增加相同地物类别的数据点之间的可聚 性,从而在另一方面帮助提高对高光谱遥感影像中地物类别的分类精度。同类权重参数α 的取值也不宜过大,通常情况下,同类权重参数α的取值范围为1<α<100较为适宜。

作为本发明基于半监督稀疏鉴别嵌入的高光谱遥感影像分类方法的进一步改进方案, 所述步骤7)具体为:

目标函数J(V)为:

J(V)=minV[tr[VTX(Dw-WwS~T-S~Ww+S~DwS~T)XTV]tr(VTXXTV)];

其中,表示样本数据矩阵X对应的稀疏系数矩阵,Ww表示样本数据矩阵X对应的 近邻权重矩阵,V表示投影矩阵;Dw为对角矩阵,且其对角线元素ωw,ij表 示样本数据矩阵X中两个不同光谱数据向量xi和xj之间的权重因子,i∈{1,2,…,n}, j∈{1,2,…,n},n表示从高光谱遥感影像中选取作为样本数据点的数量;tr(·)表示对矩阵 的求迹运算符,即表示求取 的迹,tr(VTXXTV)表示求取VTXXTV的迹;T为矩 阵转置符号。

上述的目标函数J(V)借鉴了稀疏保持投影(SparsityPreservingProjections,SPP)。SPP 通过稀疏重构处理,保留样本稀疏重构信息的同时也保留样本全局近邻结构,这样可从原 始样本中提取具备一定鉴别性的内在特征,而且不需要人为地选择近邻参数值(可参见现 有技术文献“Y Fu,S C Yan,T S Huang.Classification and feature extraction by  simplexization[J].IEEE Trans.on Information Forensics and Security,2008,Vol.3(1):91-100.”)。 由此可将目标函数定义为:

J(v)=minV||VTxi-Xs~i||2ωw,ij;

经过简单的代数运算:

Σij||VTxi-VTXs~j||2ωw,ij=Σij(VTxi-VTXs~j)(VTxi-VTXs~j)Tωw,ij=VT(Σij(xi-Xs~j)ωw,ij(xi-Xs~j)T)V=VT(Σij(Xei-Xs~j)ωw,ij(Xei-Xs~j)T)V=VTX(Σij(eiωw,ijeiT-eiωw,ijs~jT-s~jωw,ijeiT+s~jωw,ijs~jT)XTV=VTX(Σijeiωw,ijeiT-Σijeijωw,ijs~jT-Σijs~jωw,ijeiT+Σijsjωw,ijsjT)XTV=VTX(Dw-WwS~T-S~Ww+S~Ww+S~DwS~T)XTV=VTXSγXTV

其中,ei为n维向量(其中第i个元素为1,其余为0);由此便得到了目标函数J(V):

J(V)=minV[tr[VTX(Dw-WwS~T-S~Ww+S~DwS~T)XTV]tr(VTXXTV)];

为了避免退化解,增加约束条件tr(VTXXTV)=1,即VTXXTV=E,同时为了表述简 便,令Sγ=Dw-WwS~T-S~Ww+S~DwS~T;目标函数可表达为:

J(V)=argminVTXSγXTV,s.t.VTXXTV=E;

对其进行拉格朗日乘数法求解,即另J(V)对V的偏导数为零,可得到:

V(VTXSγXTV-λ(VTXXTV-E))=0;

上式可表示为以下的广义特征值求解问题:

XSγXTV=λXXTV。

因此,在VTXXTV=E的约束条件下,根据目标函数J(V)得到投影特征方程:

XSγXTV=λXXTV,其中Sγ=Dw-WwS~T-S~Ww+S~DwS~T;

对投影特征方程进行广义特征值求解得到投影矩阵V={v1,v2,…,vd};其中,v1,v2,…,vd表示对投影特征方程求解得到的前d个最大特征值λ12>…>λd对应的d个特征向量, d<B;其中,B表示高光谱遥感影像的光谱波段数,E表示单位矩阵。

特征向量个数d的选择可通过下式计算:

λ1+λ1+...+λdλ1+λ1+...+λBη;

其中,η为能量保持系数,即从特征值中选择保持能量η的d个特征值,取0<η≤1, 进而选择d个最大特征值对应的特征向量v1,v2,…,vd,构成投影矩阵V={v1,v2,…,vd}。

作为本发明基于半监督稀疏鉴别嵌入的高光谱遥感影像分类方法的进一步改进方案, 所述步骤8)中,高光谱遥感影像的嵌入特征矩阵通过下式进行投影得到:

Y=VTXQ

其中,Y表示高光谱遥感影像的光谱数据矩阵XQ通过投影矩阵V投影到低维嵌入空 间的嵌入特征矩阵,T为矩阵转置符号。由此,利用投影矩阵V对高光谱遥感影像的光谱 数据矩阵XQ通进行维数简约得到的嵌入特征矩阵Y,能够更好地发现数据的内在流形结 构,提取鉴别特征,因此获得更好的投影方向,更有利于分类,因此即便利用简单的分类 处理方案,以嵌入特征矩阵Y作为高光谱遥感影像中地物类别的分类识别特征,能够获得 更好的分类精度。本发明方法中,采用了K-近邻分类算法对高光谱遥感影像进行地物类别 的分类。

本发明基于半监督稀疏鉴别嵌入的高光谱遥感影像分类方法,采用半监督稀疏鉴别嵌 入算法(Semi-supervised Sparsity Discriminant Embedding,简称为SSDE)对高光谱遥感影 像进行维数简约,结合K-近邻分类算法实现对高光谱遥感影像中地物类别的分类。为了验 证本发明方法的有效性,下面通过两个实施例,在Indian Pine和Washington DC Mall高光 谱遥感影像数据集上进行实验,并在相同的样本条件下,将本发明基于半监督稀疏鉴别嵌 入的高光谱遥感影像分类方法与基于PCA(Principal Component Analysis,主成分分析)、 LDA(Linear Discriminant Analysis,线性判别分析)、NPE(Neighborhood Preserving  Embedding,邻域保持嵌入)及SPP(Sparsity Preserving Projections,稀疏保持投影)算法 所构建的高光谱遥感影像分类方法进行比较。在实验中,通过调整其参数,使各个算法达 到最佳效果,具体设置为:PCA降到50维,LDA维数降到类别数-1维,NPE近邻k=5; 本发明分类方法以及基于PCA、LDA、NPE、SPP算法所构建的分类方法均采用最近邻分 类算法进行分类,Baseline则表示将原始数据直接用最近邻分类算法(即K=1的K-近邻分 类算法)进行分类。

实施例一:

本实验中采用的Washington DC Mall高光谱遥感影像数据集为华盛顿特区国家广场的 局部区域。该数据集有191个波段,波段间隔为10nm,空间分辨率为3m。其中已知的地 物类别包括“建筑”、“树林”、“(石径)小路”、“道路”、“草坪”、“湖泊”和“阴影”7类。 在实验中分别针对参与对比的每种分类方法进行四种分类实验,四种分类实验分别从每类 地物中随机选取2、4、6、8个数据点作为有类别点,从剩余训练样本中随机选取60个无 类别标签的数据作为无标记样本,组成训练样本集,剩下全部数据点作为测试样本,四种 分类实验分别记做2-lab、4-lab、6-lab、8-lab,参与对比的每种分类方法针对每一种分类实 验的最终分类精度取重复实验十次所得分类精度的平均值。在Washington DC Mall数据集 进行实验,分别用PCA、LDA、NPE、SPP以及SSDE算法(基本发明分类方法中所采用 半监督稀疏鉴别嵌入算法)对其进行降维,然后利用最近邻分类算法(即K=1的K-近邻 分类算法)进行分类。表1列出了各种不同分类方法在本实验对Washington DC Mall数据 集的最终分类精度。

表1

表1中,Baseline表示将原始数据直接用最近邻分类算法进行分类,PCA+1NN、 LDA+1NN、NPE+1NN、SPP+1NN分别表示基于PCA、LDA、NPE、SPP结合最近邻分类 算法所构建的高光谱遥感影像分类方法,SSDE+1NN则表示本发明基于半监督稀疏鉴别嵌 入的高光谱遥感影像分类方法。由表1可以看出,训练样本越多,从样本中获得的先验信 息就越全面,就能更有效地反映数据的低维流形结构,各种分类方法的总体分类精度也随 之升高。LDA+1NN是监督算法,利用有标记样本的类别信息提取鉴别特征,因此分类精 度比PCA+1NN高。NPE+1NN和SPP+1NN虽然都是利用了训练数据的局部近邻结构,但 是SPP+1NN通过保留样本稀疏重构信息的同时从训练样本中提取具备一定鉴别性的低维 特征,所以分类效果要优于NPE+1NN。本发明的SSDE+1NN分类方法在利用训练样本的 稀疏重构关系建图的同时,能够充分利用少量有类别标记和大量无标记的训练样本,发现 隐藏在高光谱数据中的内在几何结构,更有利于降维,相比较其他方法分类精度有不同程 度的提高,能够在较低维数获得最优分类精度。

实施例二:

实验中采用的Indian Pine高光谱遥感影像数据集为覆盖了美国Indiana州西北的一块 农业区域。该数据集的数据点空间大小为145×145,共有220个波段以及17类已知地物 类别。考虑到噪声的影响,本实验从中选取200个波段并从数据点较多的地物类别中选择 6类进行实验,该6类第五类别分别为“Hay_windrowed”,“Soybeans_min”,“Woods”, “Corn_notill”,“Grass_pasture”,“Grass_trees”。在实验中分别针对参与对比的每种分类方 法进行四种分类实验,四种分类实验分别从每类地物中随机选取2、4、6、8个有类别标 签的数据点,从剩余训练样本中随机选取60个无类别标签的数据作为无标记样本,组成 训练样本集,剩下全部数据点作为测试样本集,四种分类实验分别记做2-lab、4-lab、6-lab、 8-lab,参与对比的每种分类方法针对每一种分类实验的最终分类精度取重复实验十次所得 分类精度的平均值。表2列出了各种不同分类方法在本实验对Indian Pine数据集的最终分 类精度。

表2

表2中,Baseline表示将原始数据直接用最近邻分类算法进行分类,PCA+1NN、 LDA+1NN、NPE+1NN、SPP+1NN分别表示基于PCA、LDA、NPE、SPP结合最近邻分类 算法所构建的高光谱遥感影像分类方法,SSDE+1NN则表示本发明基于半监督稀疏鉴别嵌 入的高光谱遥感影像分类方法。由表2可得出,本发明的SSDE+1NN分类方法的分类精度 依然最高,本发明的SSDE+1NN分类方法在有标记样本比较少的情况下,不仅可以利用稀 疏表示的自然鉴别能力,而且可以利用少量标记和大量无标记样本来发现数据中的流形结 构,以提高分类精度。本发明分类在2、4、6、8个有标记训练样本的情况下,其最终分 类精度比SPP+1NN分类方法分别提高了4.19%,7.75%,6.72和10.18%,而且能够更快地 达到较高的分类率。

图2~图7显示的是Indian Pine数据集中“Hay_windrowed”,“Soybeans_min”,“Woods”, “Corn_notill”,“Grass_pasture”,“Grass_trees”六种真实地物类别的地面分布情况,以及 分别用PCA、LDA、NPE、SPP以及SSDE算法对其进行降维、然后利用最近邻分类算法 尽心分类得到的实验分类效果图。其中,图2为Indian Pine数据集中“Hay_windrowed”, “Soybeans_min”,“Woods”,“Corn_notill”,“Grass_pasture”,“Grass_trees”六种真实地 物类别的地面分布情况图;图3为对Indian Pine数据集采用PCA+1NN方法分类得到的分 类效果图;图4为对Indian Pine数据集采用LDA+1NN方法分类得到的分类效果图;图5 为对Indian Pine数据集采用NPE+1NN方法分类得到的分类效果图;图6为对Indian Pine 数据集采用SPP+1NN方法分类得到的分类效果图;图7为对Indian Pine数据集采用 SSDE+1NN方法(即本发明分类方法)分类得到的分类效果图。从图2~图7可以得出, SPP相比较PCA、LDA、NPE等算法,分类精度有一定程度的提高,体现出利用稀疏表示 进行自然判别能力的优势,但由于其本质仍然是无监督算法,不能有效利用标记样本提供 的鉴别信息,所以分类效果提升相对有限。本发明提出的基于半监督稀疏鉴别嵌入的高光 谱遥感影像分类方法在保留样本间的稀疏重构关系的同时,通过利用少量有标记和大量无 标记训练样本提取鉴别特征,相比较其他算法得到分类效果图更好,分类精度也有较明显 的提升。

综上所述,通过上述的实施例一和实施例二可以看到,在高光谱遥感影像分类中,常 面对的是大量的未标记数据以及相对较少的有标记数据,而且标记训练样本成本较高,有 时是不现实的,因此如何引入半监学习来提升分类精度显得尤为重要。本发明提出一种新 的基于半监督稀疏鉴别嵌入的高光谱遥感影像分类方法,该方法结合了近邻流形结构及稀 疏性的优点,不仅保留样本间的稀疏重构关系,而且利用稀疏表示的自然判别能力,无需 人为地选择近邻参数值,一定程度上缓解了近邻参数选择的困难,同时通过引入少量有标 记的训练样本以及大量无标记训练样本来获得数据的内在流形结构,实现鉴别特征提取, 能够提高对高光谱遥感影像中地物类别的分类精度,更有利于分类。在上述实施例对Indian  Pine和Washington DC Mall高光谱遥感影像数据集的分类实验结果表明,本发明提出的分 类方法能够利用较少有标记训练样本发现高光谱遥感影像中的内蕴结构。在随机选取2、4、 6、8个有类别标记和60个无类别标记的数据作为训练样本的情况下,本发明分类方法的 最终分类精度最高分别达到了77.36%和97.85%,分类精度明显高于其它参与对比的高光 谱遥感影像分类方法。

需要说明的是,以上实施例仅以说明本发明技术方案而非限制本发明。尽管参照较佳 实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术 方案进行修改或者等同替换,而不脱离本发明技术方案的精神和范围,其均应涵盖在本发 明的权利要求范围之中。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号