首页> 中文学位 >基于线性最小二乘问题的ELBD算法在化学模式识别中的应用
【6h】

基于线性最小二乘问题的ELBD算法在化学模式识别中的应用

代理获取

目录

声明

摘要

第一章 绪论

1.1 化学模式识别概述

1.2 最小二乘问题概述

1.3 研究目的

1.4 本文结构

第二章 数值代数基本理论

2.1 矩阵分解

2.2 Krylov子空间法

2.3 Lanczos方法

第三章 LBD和扩展的LBD

3.1 LBD

3.2 扩展的LBD

3.3 数值试验

3.4 总结

第四章 模式识别基础知识

4.1 数据预处理

4.2 建模算法

4.2.1 多元线性回归算法

4.2.2 主成分回归算法

4.2.3 偏最小二乘回归算法

4.3 模型评价标准

第五章 ELBD算法在化学模式识别中的应用

5.1 测量石油黏度的预测模型的数值实验

5.2 总结与展望

参考文献

致谢

展开▼

摘要

化学计量学是由数理统计,计算机科学以及化学三者相互融汇而成的一门边缘学科,是化学中很具有实力和广泛应用前景的新兴分支学科.化学模式识别是化学计量学中的一个重要研究内容.它是通过提取量测数据中的隐含信息,从而为科学家提供有实用价值的信息.模式识别的第一步就是获取数据,一般数据类型是近红外光谱数据,因为它具有快速,直接,无需化学剂等优点.但由于光谱数据较大,而且可能存在重要信息被覆盖的情况,我们一般对数据采用主成分回归,偏最小二乘回归等模型算法进行降维,以起到简化模型,提高模型稳定性的目的.
  偏最小二乘法(partialleast-squaresregression,PLS)是近年来,应实际需要而迅速发展的一门广泛应用的多对多线性回归建模的统计分析方法,它最早起源于化学计量领域.当样本变量的个数很多,又都存在多重相关性,而且样本量又很少时,用偏最小二乘回归分析建立模型便具有传统回归分析等所不具有的优点.因为它不仅克服了自变量共线的问题,还充分考虑了主成分分析不曾考虑到的因变量对自变量的影响.
  Woldetal.在[63]中提到PLS算法与基于线性最小二乘问题的Lanczos双对角化算法(简记为LBD)是等价的.尽管两者算法在数值上是等价的,但在计算量和空间复杂上却大不一样.首先,PLS算法在计算过程中,无法保持矩阵A的结构性质,如稀疏性等.此外,PLS算法另一个不利的地方便是必须计算矩阵PTkWk,这大大增加了计算复杂度.而这些劣势在LBD算法中均可以避免.鉴于此,本文重点研究学习基于线性最小二乘问题的LBD算法,并且在数值试验中,也将采用LBD算法代替PLS算法建模.
  Eldén在[35]中提出用LBD算法求解线性最小二乘问题,并与TSVD比较残差下降值,从而证明了采用LBD算法求解的残差下降速度更快.Lanczos算法在空间复杂度上有较强的优势,特别是当矩阵A的阶数较大的时候.并且随着子空间维数k的增加,所构成的Krylov子空间将包含更多的信息量,这将更加有利于我们有效求解.但另一方面,随着子空间维数k的增加,需求的计算机存储空间也越来越大,而且其基向量所构成的Krylov矩阵也将越来越变态.所以,我们希望子空间维数k能尽可能的小.但这样可能会出现一个问题,便是子空间维数k较小时,其对角化矩阵Bk并没有足够的信息来解决我们想解决的问题.也就是说,当子空间维数k较小时,利用Lanczos算法求解并不能得到很好的结果.
  在[19]中,作者提到一种扩展的Lanczos算法来改进Lanczos算法,并将其运用在人脸识别上,得到一个较好的实验结果.因此,本文也将用扩展的Lanczos算法来改进BD算法,然后求其线性最小二乘问题的近似解.第三章的数值例子证明了当子空间维数k较小时,我们改进的ELBD算法是非常有效的.由此,我们也得到了一个基于线性最小二乘问题的ELBD算法.
  最后,我们将ELBD算法运用于化学模式识别上.实验中,我们采用232个不同品质石油的近红外光谱数据,构成232个样本.其中样本平均分为两组,一组训练集,一组为预测集.分别采用PCR算法,LBD算法和ELBD算法对训练集样本数据建立模型,并通过预测预测集中的化学性质,然后与预测集原始化学性质作比较,从而来检验模型的预测效果.实验效果良好,再次证明了ELBD算法的有效性,可行性和适用性。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号