首页> 中文学位 >统计稀疏学习:特征提取、聚类、分类及多特征融合
【6h】

统计稀疏学习:特征提取、聚类、分类及多特征融合

代理获取

目录

声明

摘要

第1章 绪论

1.1 研究背景与意义

1.2 国内外研究现状

1.3 本文的研究工作

1.4 内容安排

第2章 高阶张量数据的稀疏分解和特征提取

2.1 引言

2.2 张量数据的分解

2.3 稀疏高维主元分析

2.3.1 稀疏高维主元分析的导出

2.3.2 目标方程

2.4 求解策略

2.5 初始化及参数调整

2.6 测度——校正的累计可解释方差

2.7 实验及结果分析

2.7.1 实验数据及测量准则

2.7.2 合成数据上的验证实验

2.7.3 图片及动作视频的分类

2.8 本章小结

第3章 基于类字典的多任务聚类

3.1 引言

3.2 相关工作

3.2.1 k-means算法

3.2.2 利用字典来表达类信息

3.3 MtCluster算法及求解步骤

3.3.1 目标函数的优化过程

3.4 聚类实验

3.4.1 参数设定

3.4.2 数据集及聚类结果

3.5 本章小结

第4章 面向聚类的异构无标签数据的迁移

4.1 引言

4.2 基于稀疏表达及字典学习的异构特征迁移学习

4.2.1 优化目标函数(4.1)的求解步骤

4.3 基于保持结构连接性的异构数据选择及迁移

4.4 实验验证

4.4.1 数据集

4.4.2 参数设置及测量准则

4.4.3 实验对照

4.5 本章小结

第5章 基于稀疏表达及字典学习的分类

5.1 引言

5.2 相关工作

5.3 特色字典与共享字典

5.4 优化策略

5.4.1 固定字典D以更新稀疏系数矩阵Ac

5.4.2 固定稀疏系数矩阵Ac以更新字典D

5.4.3 字典的初始化

5.5 模型的物理意义

5.6 实验及结果分析

5.6.1 分类机制

5.6.2 合成数据的测试

5.6.3 现实数据的测试

5.7 本章小结

第6章 面向分类的多特征数据融合方法

6.1 引言

6.2 相关工作

6.3 基于字典学习的多特征融合

6.3.1 利用多个特征进行字典学习

6.3.2 多特征融合

6.3.3 初始化和约束项的问题

6.4 分类策略

6.5 实验及结果分析

6.5.1 特征与参数的说明

6.5.2 人脸识别

6.5.3 在不同融合条件下人脸识别的分析

6.6 展望

第7章 总结与展望

7.1 本文的贡献及总结

7.2 未来展望

参考文献

攻读硕士学位期间主要研究成果

致谢

展开▼

摘要

统计学习作为统计学和人工智能的交叉学科,近年来得到快速发展,并在诸多领域得到了广泛的应用,例如数据挖掘、机器学习、内容检索、计算机视觉等等。其中基于稀疏理论的统计学习方法因稀疏分解理论、压缩传感理论的研究及其成功的广泛应用,引起了信息科学与统计学等领域研究者的极大关注,并对当前统计学习的研究产生了深刻影响。当前,统计学习领域的学者结合稀疏特性对传统统计学习理论和方法进行了丰富和拓展,正逐步形成有特色的统计稀疏学习学科,并成为统计学习与信息处理的重要研究方向。
   本文以统计稀疏学习方法为主线,着重在基于统计稀疏学习的数据降维、特征提取、迁移学习、聚类及分类等任务方面进行了深入的调研及探讨,并提出了相应的新方法和研究的新思路。其主要内容如下:
   1.本文首先对于统计稀疏学习方法的研究背景和意义进行了介绍,并对其在视觉问题上的应用进行了探索,然后分析了统计稀疏学习方法在国内外的研究现状。
   2.本文对当前的稀疏主元分析进行了调研,并分析了其若干局限性,特别是当前的方法无法对高阶的数据进行直接处理,而只能先把数据转换成向量进行操作。这样的转换必然破坏了数据之间的空间关系。对于这个问题,本文提出了一个崭新的稀疏高阶数据主元分析算法。我们的算法可以直接对基于张量表达的高阶数据进行分析,以达到数据降维和特征提取的效果。
   3.对于聚类问题,我们对于当前的一个基于字典学习的方法进行的分析,并对当前最广泛应用的k-means算法进行考查,然后指出了其在某些方面的局限性。针对这些局限性,我们提出了一个基于稀疏表达和字典学习的多任务聚类算法。我们的算法对于每一个潜在类学习一个字典以表达这个类的特征信息,同时对于所有数据学习一个公共字典以捕捉那些被多个类共享的信息。我们的算法以多任务学习的方式进行运作,并相应地提高了聚类性能。
   4.本文考察了当前的迁移学习领域中学者还未涉及到的方向,即如何对于无标签的异构数据进行无监督地迁移以达到增强求解目标任务性能的目的。面对这个问题,我提出了一个基于稀疏表达及字典学习的无监督迁移学习算法。我们的算法可以对源域数据寻找一个投影空间,以使驱使着这些异构数据像目标域数据空间靠拢。之后,我们的算法有选择性的地挑取更有意义的数据进行迁移,以提高目标域任务的性能。
   5.对于基于稀疏表达和字典学习的图片分类问题,本文进行了深刻地探讨和分析,并指出了当前的前沿方法的缺陷。针对这些缺陷,我们提出了一个新的基于字典学习的图片分类算法。我们的算法对于每个类都学习一个字典以捕捉那些最具有特色的信息,同时对于所有类学习一个共享字典以表达那些被多个类共享的必要的数据重构信息。通过我们的算法学习到的字典更加紧凑、更加具有判别能力,更重要的是,我们的算法可以把每个类中最具有判别特征的信息和那些被其他类也共享的信息分离开来,以达到提高分类正确率的效果。
   6.本文进一步把基于字典学习的图片分类算法扩展到了多特征分类任务中。与基于一种特征的图片分类相比,对于一张图片的多个特征同时进行分析并依据多个特征进行分类将能得到更好的分类结果。为此,我们提出了一个基于稀疏表达和字典学习的面向分类任务的多特征数据融合算法,以达到处理多特征分类的问题。我们的算法不只是单单处理多个特征,还能对这些特征进行融合,以取得一个可以表达图片高级语义信息的更加紧凑、更具有判别性的新特征。
   7.最后,本文总结了研究工作,并提出了一些值得进一步探究的方向。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号