首页> 中国专利> 一种GC‑MS非靶标方法快速筛查植物差异性代谢物的方法

一种GC‑MS非靶标方法快速筛查植物差异性代谢物的方法

摘要

一种GC‑MS非靶标方法快速筛查植物差异性代谢物的方法,具体涉及香精香料、代谢组学研究技术领域。该方法利用现代GC‑MS全扫描技术获得植物中挥发性物质化学组分信息,随后利用多尺度高斯平滑提取TIC图中物质信息,根据物质的质谱信息,采用动态规划算法校正样本间的色谱峰时间漂移,对齐属于同一物质的色谱峰,使得物质信息在不同样本间具有可比性,然后采用最邻近聚类实现化合物注册,最后采用方差分析筛选不同组之间具有显著性差异的化合物。本发明将化合物质谱信息输出为MSP文件,该文件可直接导入至NIST库搜索化合物。该方法能够实现快速锁定植物样本中存在差异性的化合物,适用于大批量样本快速分析测定。

著录项

  • 公开/公告号CN106970161A

    专利类型发明专利

  • 公开/公告日2017-07-21

    原文格式PDF

  • 申请/专利权人 宁夏医科大学;

    申请/专利号CN201710125438.6

  • 发明设计人 于永杰;佘远斌;付海燕;

    申请日2017-03-04

  • 分类号G01N30/02(20060101);G01N30/06(20060101);

  • 代理机构11203 北京思海天达知识产权代理有限公司;

  • 代理人张立改

  • 地址 750004 宁夏回族自治区银川市兴庆区胜利街692号

  • 入库时间 2023-06-19 02:52:30

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2019-09-27

    授权

    授权

  • 2017-08-15

    实质审查的生效 IPC(主分类):G01N30/02 申请日:20170304

    实质审查的生效

  • 2017-07-21

    公开

    公开

说明书

技术领域

本发明利用GC-MS技术筛选植物样本在不同组间中存在差异性的挥发性物质的方法,具体涉及香精香料、代谢组学研究技术领域。

背景技术

天然植物香精香料中呈香呈味物质主要是植物自然生长环境下的次生代谢产物,由于地域、气候、品种等因素的差别,即使由同一种植物采用相同工艺制成的香精香料成品,其呈现出来的感官也存在较大差异。通过研究植物中具有差异性的代谢产物,则能够筛选出对外在感官品质具有重要作用的化学物质成分,对于香精香料的加工具有重要的实际意义。由于植物中具有上千种化学成分,利用GC-MS非靶标代谢分析方法能够更为全面地表征植物中的挥发性香味成分,如何从复杂繁琐的物质中快速筛选出具有差异性的代谢产物,是一个非常困难的工作。

目前时间范围内能够实现GC-MS分析物质准确提取分析,进而用于筛查不同组别之间具有差异性化学成分的方法非常少,当前能够完成这一工作的方法有AMDIS-MET-IDEA,XCMS等。这些方法中存在大量的假阳性和假阴性问题,导致利用这些方法进行分析时,难免会漏掉重要的物质信息,进而导致所筛选出的差异性代谢物无法有效表征组别差异,对明确呈香呈味成分帮助不大。本发明针对当前分析方法中存在的苦难,提出了一个新的分析方法,用于快速筛查植物差异性代谢物。该方法利用现代GC-MS全扫描技术获得植物中挥发性物质化学组分信息,随后利用多尺度高斯平滑提取TIC图中物质信息,根据物质的质谱信息,采用动态时间规划校正样本间的时间漂移,使得物质信息在不同样本间具有可比性,然后采用最近邻聚类实现化合物注册,最后采用多元统计分析筛选不同组之间具有显著性差异的化合物。物质的质谱信息输出为MSP文件,可直接导入到NIST库搜索化学物。该方法能够实现快速筛查植物样本中差异性化合物信息,适用于大批量样本快速分析测定。

发明内容

本发明的目的是提供一种方法,找出植物差异性代谢物的方法。

该方法利用现代GC-MS全扫描技术获得植物中不同挥发性物质化学组分信息,利用多尺度高斯平滑提取TIC图中物质信息,根据物质的质谱信息,采用动态规划算法校正样本间的时间漂移,对齐属于同一物质的色谱峰,使得物质信息在不同样本间具有可比性,采用最邻近聚类实现化合物注册,最后采用多方差分析筛选不同组之间具有显著性差异的化合物,并将质谱信息输出为MSP文件,该文件可直接导入至NIST库进行化合物匹配。该方法适用于大批量样本快速分析测定。

一种GC-MS非靶标方法快速筛查植物差异性代谢物的方法,其特征在于,针对GC-MS中的TIC进行分析,提取其中的物质信息并进行分析,具体包括以下步骤:

(1)收集待区分的不同组别的植物样本(可以为不同产地、不同批次等);

(2)对收集的每一个植物样本进行前处理,过程为:

样本冷冻干燥后,粉碎处理,过60目筛;称量样本1g,加入浓度为100μg/ml氘代苯乙酮溶液100μl作为内标,氘代苯乙酮溶液是以甲醇为溶剂,然后加入二氯甲烷5ml作为提取液,提取植物样本化学成分,涡旋3min、超声1h后,13000r/min离心10min,取1ml上清液,加入100μl BSTFA衍生化试剂,于60℃环境下衍生1h。随后进入GC-MS进行分析;

(3)GC-MS分析条件为:

色谱条件:色谱柱为Agilent DB-5MS柱(60m×2.5mm,i.d.,2.5μm)。程序升温,初始柱温50℃,以5℃/min升温至300℃。进样口温度280℃,传输线温度230℃。He气作为载气,分流比为10:1,流速为1ml,进样量1μl;

质谱条件:EI源,全扫模式,扫描范围50-500,采样频率3Points/s;

(4)对步骤(3)所有样本经过GC-MS分析后的原始采集的数据转化为CDF格式,然后进行数据分析,针对每个样本中物质信息的提取分为色谱峰提取和质谱信息表征;

色谱峰提取部分步骤为:(i)提取色谱信号中的局部极小值(一般绝大多数局部极小值对应为仪器噪声),利用迭代优化剔除属于色谱峰的极小值;然后再将剩余的对应于仪器噪声的极小值,通过线性差值完成TIC图中的基线漂移校正;(ii)针对非仪器噪声的物质色谱信号为局部极大值的特点,采用不同尺度的高斯函数对基线漂移校正后的色谱信号进行平滑卷积运算(高斯函数尺度范围1-13,步长为0.1),获得平滑后的信号,提取出各尺度平滑后色谱信号的局部极大值,通过脊线寻优的方法,将不同平滑尺度下的局部极大值位置链接在一起得到色谱,并获得物质色谱峰位置;

质谱信息表征:对色谱峰提取部分的步骤(ii)通过脊线寻优方法得到的色谱,在提取物质色谱峰信号后,根据剩余的信号部分估计出仪器噪声水平,剔除信噪比小于3的色谱峰;针对每一个物质色谱峰,提取保留时间下的质谱谱图,用于表征该物质;

(5)不同样本间的时间漂移校正

选择物质色谱峰数量最多的样本作为参照样本,对其余样本中的时间漂移逐个校正,使得属于同一个物质的色谱峰进行对齐;将所有样本中的时间漂移校正后,利用最邻近聚类方法将保留时间较为接近的物质注册成一个化合物,最终建立一个样本和色谱峰的注册图或表;经过内标校正后,用于后续的分析;

进一步优选样本的时间漂移的校正采用如下方法:利用物质的质谱信号,通过计算相关系数来表征其相似度,两个质谱信号的相似度越高,则属于同一个化学成分的可能性就越大,针对每一个测试样本,均构建一个“测样物质×参照物质”的相似度矩阵,针对每一个相似度矩阵,利用动态规划算法,获得一组测样色谱峰和参照色谱峰唯一匹配的结果(注:该组匹配结果的质谱相似度总和最大),从而实现时间漂移校正。

(6)利用方差分析计算样本间差异性大的物质,置信水平阈值设定为0.05,将置信水平小于0.05的物质视作差异性化合物,将所有差异性物质的质谱信息输入成MSP文件,导入到NIST库中进行匹配,确定物质结构,从而得到差异性物质;然后通过色谱的峰面积确定含量差异。

同经典方法相比,本方法的优势在于色谱峰信号经过背景漂移校正后,结合高斯平滑脊线提取优化方法,并利用噪声估计剔除信噪比低的色谱峰,能够有效避免假阳性和假阴性的色谱峰提取结果。本发明中提出的利用质谱相似度结合动态规划算法实现样本间色谱峰对齐工作,能够克服时间漂移导致无法获得准确结果的问题,使得样本间的结果具有直接的可以比。此外,本发明能够实现植物样本中具有差异性代谢物的快速筛查,降低工作量,提高分析效率。

附图说明

图1.本发明的色谱峰提取结果示例。(A)给出了某一样本的部分原始信号以及不同尺度高斯函数平滑后的信号。局部极大值用’O’标出。(B)给出了脊线寻优获得色谱峰位置,并标记于图(C)中。通过估计噪声水平,提出信噪比低于3的色谱峰后,最终提取出的色谱峰(D)(其中数字代表9个不同的峰)。图2.本发明时间漂移校正原理示例。(A)给出了对照样和一个测样中的部分时间漂移色谱峰。(B)给出了测样中每一个物质与对照样本中质谱的相关系数。箭头给出了动态规划算法下的几个候选路径。(C)经过动态规划算法,最终实现了的色谱峰对齐结果。(其中数字对应不同的峰号,A、B、C的数字一一对应);

图3.时间漂移校正前后对比示例。(A)30个茶叶样本的TIC图。(B)经过时间漂移校正后,色谱峰的对齐结果。(C)时间漂移校正前,每一个样本中色谱的色谱峰流出状况。(D)经过本发明进行时间漂移校正后,各色谱峰的对齐情况。(E)在时间漂移校正基础上,利用最近邻聚类获得的色谱峰注册示例图。图4.利用本发明筛选出的差异性代谢物在两个产地上的含量上的差异示例,以及利用这些差异性代谢物进行聚类的结果。

图5.本发明解析GC-MS所得代谢物NIST库匹配结果示例。

图6.本发明同文献以及人工分析的直接对比。

具体实施方式

下面结合具体的示例对本发明方法做进一步的详细说明,以使相关领域技术人员更加清楚地理解本发明,本发明并不限于以下实施例,以下内容不应理解为是对本发明的权利要求书保护的范围限制。

实施例1

将来自2个地区的共30个茶叶样本于-80℃下冷冻除水,随后通过粉碎机粉碎,过60目筛,于-20℃下避光保存。样本分析前,转移至室温放置半小时。

针对每一个茶叶样本,加入浓度为100μg/ml氘代苯乙酮溶液(甲醇定容)100μl作为内标,加入二氯甲烷5ml作为提取液,提取植物样本化学成分。涡旋3min、超声1h后,13000r/min离心10min,取1ml上清液,加入100μl BSTFA衍生化试剂,于60℃环境下衍生1h。随后进入GC-MS进行分析。

设置GC-MS分析条件:

色谱条件:色谱柱为Agilent DB-5MS柱(60m×2.5mm,i.d.,2.5μm)。程序升温,初始柱温50℃,以5℃/min升温至300℃。进样口温度280℃,传输线温度230℃。He气作为载气,分流比为10:1,流速为1ml,进样量1μl。

质谱条件:EI源,全扫模式,扫描范围50-500,采样频率3Points/s。

所有样本经过GC-MS分析后,将原始采集的数据转化为CDF格式。进入MATLAB平台进行分析。

在MATLAB环境中利用本发明进行分析。这一过程全自动完成,直接给出结果不同组织间的聚类结果和化合物质谱信息的MSP文件。

为解释本发明具体工作原理,图1给出了本发明进行色谱峰提取示例。其中图(A)给出了原始信号以及不同尺度高斯函数平滑后的信号。色谱信号中的色谱峰在不同高斯平滑尺度下愈加明显。经过(B)脊线寻优后,可以清晰地看出色谱峰获得的提取(C)。通过过滤掉信噪比低于3的色谱峰,能够实现色谱信号中色谱峰的提取(D)。

图2中给出了本发明进行时间漂移校正原理,图(A)中给出了色谱峰提取结果,其中的插图给出了参照4号色谱峰和测样4号色谱峰的质谱图及其相关系数:0.9969。图(B)给出了动态规划算法进行搜索最优路径示例,在多个候选路径中,动态规划算法选择质谱相关系数加和最大的路径。最终,给出图(C)中的匹配结果。

为进一步阐明时间漂移校正的重要性,图3给出时间漂移校正前后的结果进行对比。图(A)中给出了GC-MS采集的TIC图,图(B)给出了本发明进行时间漂移校正后的色谱峰对齐的结果。详细的对比展示于图(C)和图(D)中,图(C)给出了时间漂移校正前的色谱峰流出区间范围,从图中可以看出各样本流出峰范围不同,时间漂移严重,难以区分不同样本中属于不同化合物的色谱峰。经过本方法校正后,能够将属于同一物质的色谱峰准确区分(D)。图(E)给出了在时间校正基础上,利用最近邻聚类获得注册色谱峰结果。

利用本发明将注册色谱峰结果用内标进行校正后,对注册的色谱峰进行方差分析,最终获得具有差异性的色谱峰,图4(A)给出了10中存在差异的代谢物,其中A地区7种化合物高于B地区。利用这些差异性成分进行聚类分析,能够将两个地区的样本进行区分,见图B。

将差异性化合物信息写入MSP文件,导入至NIST库中进行搜索,图5给出了匹配结果的一个示例。

将本发明同当前文献中报道的方法进行了比较,结果展示于图6中。从中可以看出,本发明给出的效果最优。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号