首页> 中国专利> 一种对非数据依赖型采集模式质谱数据的分析方法及其应用

一种对非数据依赖型采集模式质谱数据的分析方法及其应用

页面导航

摘要
著录项
法律信息
说明书
相似文献

摘要

本发明提供了一种对非数据依赖型采集模式质谱数据的分析方法，包括以下步骤：将多个分析样本中不存在的、重同位素标记的标准品混入被检样品中；利用气相或液相色谱与质谱连用分析样品；获得各DDA模式采集的数据中重同位素标记的标准品、被检样品中各成份的质谱信息，并制作相应的质谱数据库文件；搜索出各DIA模式采集的数据中重同位素标记的标准品的质谱信息；制作适用于每个DIA模式采集的数据文件分析的质谱数据库文件；利用质谱数据商业软件对该DIA数据进行搜索，获得该样品各组份的定性、定量结果。本发明提供的质谱DIA分析方法是一种全新的方法，能够更大量地检出样品中的成份并能够更准确地对各成份进行定量分析。

著录项

公开/公告号CN106290684A

专利类型发明专利
公开/公告日2017-01-04

原文格式PDF
申请/专利权人谱天(天津)生物科技有限公司;
展开▼

申请/专利号CN201610810870.4
发明设计人李捷;唐琦;
展开▼

申请日2016-09-09
分类号G01N30/88(20060101);
代理机构32273 南京苏创专利代理事务所(普通合伙);
代理人沈振涛
地址 300384 天津市西青区华苑产业区华天道2号807房屋
入库时间 2023-06-19 01:18:44

法律信息

法律状态公告日

法律状态信息

法律状态
2017-09-05

授权

授权
2017-02-01

实质审查的生效 IPC(主分类):G01N30/88 申请日:20160909

实质审查的生效
2017-01-04

公开

公开

说明书

技术领域

本发明属于生物及其他样品成份检测领域，特别涉及一种对非数据依赖型采集(DIA)模式质谱数据的分析方法，还涉及该方法使不同时间点采集的、有不同程度采集差异的质谱数据得以同步分析的应用。

背景技术

液相及气相色谱仪与质谱仪联用(LC/GC-MS/MS)技术发展迅速，是当今世界上最为先进的灵敏、准确的物质组成成份分析平台。其中，近年来发展起来的非数据依赖型采集(Data-Independent Acquisition,DIA)模式，能够在不依赖于所检样本成份的前提下，将样本内所有的、关于样本组成成份的质谱数据全部、无遗漏地采集下来。与传统的数据依赖型采集(Data-Dependent Acquisition,DDA)模式相比，DIA具有明显优势：(1)即便是目前科学水平下没有被人类认知的成份也同样可以被采集、记录于数据库中，在未来某成份被认知后，可以在不对该样本重新测试(可能已经遗失、腐败)，而对原始数据进行回顾性分析；(2)由于数据采集无遗漏，DIA数据还可以提供样本内各成份的、准确的含量信息。

但是，质谱数据主要包括样品内各组成成份在质谱中的出现时间(又称保留时间，RetentionTime，RT)和其对应的质谱特征，而DIA只是将杂乱无章地将RT和质谱特征储存下来。这样，DIA的使用需要参照一个含有全部成份RT及其质谱特征的标准质谱数据库(Library)来进行解析，才能将杂乱无章的数据梳理出样品内各组份的鉴定信息(Identification)和定量信息(Quantification)。没有一个完善的数据库(Library)就没有对DIA数据的完整解析，DIA分析就失去了其优势。一个完整的数据库(Library)是由不同时间点采集的、对同类样品的、多次DDA检测数据中所得到的RT和质谱特征数据组合而成。以单次DDA检测数据做数据库(Library)，会受到所检样品成份的限制，严重削减DIA所能鉴定和定量的成份种类；而以多次DDA检测数据做Library，又会由于检测时间不同而出现多个不同的RT值。传统的DIA Library制作方法，是将当时所拥有的、全部DDA数据合并计算，找到对应于样品中各个成份的平均RT值，仅建立一个数据库(Library)用于项目中所有DIA的分析。这种DIA Library制作方法的缺点是：(1)由于RT的跨度大，使得在DIA数据搜索过程中需要扩大搜索的时间窗口，使得大量非特异性质谱数据涌入，导致DIA定量数据不准确；(2)甚至在所分析的DIA与前期DDA RT差别较大的情况下，样品中的成份会被漏检，导致DIA定性的样品成份减少。

发明内容

发明目的：本发明的目的在于提供一种能够克服传统DIA分析方法缺点的、提高样品成份检出率和定量精度的分析方法及其应用。

技术方案：本发明提供的一种对非数据依赖型采集模式质谱数据的分析方法，包括以下步骤：

(1)将多个分析样本中不存在的、重同位素标记的标准品混入被检样品中；

(2)利用气相或液相色谱与质谱连用分析样品；

(2.1)采用DDA模式采集被检样品和重同位素标记的标准品中所有成份的质谱信息；

(2.2)采用DIA模式采集被检样品和重同位素标记的标准品中所有成份的质谱信息；

(3)以质谱数据商业软件，获得各DDA模式采集的数据中重同位素标记的标准品、被检样品中各成份的质谱信息，并制作相应的质谱数据库Library文件；

(4)以质谱数据商业软件，参照由步骤(3)中DDA模式获得的重同位素标记的标准品的Library，搜索出各DIA模式采集的数据中重同位素标记的标准品的质谱信息；

(5)制作适用于每个DIA模式采集的数据文件分析的质谱数据库Library文件：

(5.1)利用多个重同位素标记的标准品的保留时间，以DIA模式获得的保留时间为靶向，将各个已有DDA数据与该DIA数据进行保留时间校正，使每个DDA文件经过校正后转化成一个适用于该DIA分析的质谱数据库Library文件；

(5.2)合并(5.1)中所有纠正后的质谱信息，形成一个适用于该DIA分析的修正DIA依赖型标准质谱数据库(DIA-dependent Library)；

(6)以步骤(5)制作的质谱数据库Library文件为参照，利用质谱数据商业软件对该DIA数据进行搜索，获得该样品各组份的定性、定量结果。

作为改进，所述质谱信息包括质谱保留时间(RT)及其质谱特征。

作为另一种改进，步骤(3)和(4)中，所述质谱数据商业软件包括Skyline软件。

作为另一种改进，步骤(5.1)中，如果一个样品成份拥有多个保留时间时，指定中位数值为该成份的保留时间。

本发明还提供了上述对非数据依赖型采集模式质谱数据的分析方法在蛋白质分析的应用。该方法应用广泛，具有很强的实用性，可在检测多种蛋白质中应用，具有很高的商业前景，例如可在精准医疗中对患者个体化临床样本蛋白质分析的应用。

该方法的原理为：

本发明提供的DIA分析方法是一种以质谱为手段定性、定量分析被检样品中各个组份的分析方法。

利用已知质谱特征的重同位素标记的标准品作为RT的参照物，在DDA与DIA数据之间建立质谱保留时间的桥梁，以DIA数据为骨架制作适用于自身的Library，并通过多组DDA数据的RT对此Library做进一步的校正，使得最终获得的DIA-dependent Library中样品各成份的种类最大化、各成份对应的RT与该DIA数据中RT差距达到最小化。

在DIA模式分析样品内成份的时候，依据每个被分析的DIA数据采集情况，校正已经存在于前期数据库中的、所有同类样品的DDA RT信息，并汇总出一个与该DIA数据采集情况最为相似的质谱数据库(DIA-dependent Library)，此Library是该DIA所独有的、被该DIA参照、用于对被检样品组份含量进行搜索的、量身定做的Library。

有益效果：本发明提供的质谱DIA分析方法是一种全新的Library算法，属于开拓性的发明，其能够更大量地检出样品中的成份并能够更准确地对各成份进行定量分析。

本发明相对于现有技术具有以下突出的优势：

1.开拓性发明：首次提出为每个DIA数据文件建立适用于其自身的Library，目前属于一个崭新的研究进展。

2.全面而准确：由于利用了所有DDA的质谱数据并制作了“量体裁衣”式的Library，使得DIA分析时对数据的搜索更为全面、数据搜索时间窗口小而结果更为精确。本发明提高了对样品内成份分析的全面性和准确性。

3.经济：DIA分析模式，由于其对样品质谱信息的无缝保留，极为适用于作为数据库储存(例如疾病样本的数据库)，对未来发现的新物质、提出的新问题进行回顾性研究。本发明提出的对DIA分析方法的改进，无疑使DIA这样耗资巨大组建的大数据库得到更有效的使用，因而具有经济价值。

4.应用范围广：DIA质谱采集是近期兴起的、在生物、医药、农林、食品、法医等多个领域内重要的检测方法。本发明对DIA数据的分析方法的改进具有广阔的应用领域。

附图说明

图1为在分析某个DIA数据时根据以往同类型样品DDA信息制作此DIA-dependent Library及其使用的过程。

图2A和图2B为使用传统方法机械合并所有DDA制作Library与使用本发明制作Library对于DIA分析质量的比较。其中，图2A柱状图显示使用本发明制作的Library对于5例脑脊液样品蛋白分析时可定量蛋白数的提高(平均提高9.67％的蛋白数目)；图2B为如上脑脊液样品的质谱峰图：显示使用本发明制作的Library进行搜索时，原先由于RT偏差大而检测不到的成份(未能定位任何符合肽段GLEWVANIK特征的质谱峰，左上：完整成份的质谱图；左下：碎片成份的质谱图)经过个体化制作的DIA-dependent Library搜索，可以被准确捕捉到(右上：完整成份的质谱图；右下：碎片成份的质谱图)。

具体实施方式

下面结合附图对本发明做出进一步说明。

对非数据依赖型采集模式质谱数据的分析方法，见图1，包括以下步骤：

(1)将多个分析样本中不存在的、重同位素标记的标准品混入被检样品中；

(2)利用气相或液相色谱与质谱连用分析样品；

(2.1)采用DDA模式采集被检样品和重同位素标记的标准品中所有成份的质谱信息；所述质谱信息包括质谱保留时间(RT)及其质谱特征；

(2.2)采用DIA模式采集被检样品和重同位素标记的标准品中所有成份的质谱信息；所述质谱信息包括质谱保留时间(RT)及其质谱特征；

(3)以质谱数据商业软件如Skyline软件，获得各DDA模式采集的数据中重同位素标记的标准品、被检样品中各成份的质谱信息，并制作相应的质谱数据库Library文件；所述质谱信息包括质谱保留时间(RT)及其质谱特征；

(4)以质谱数据商业软件如Skyline软件，参照由步骤(3)中DDA模式获得的重同位素标记的标准品的Library，搜索出各DIA模式采集的数据中重同位素标记的标准品的质谱信息；所述质谱信息包括质谱保留时间(RT)及其质谱特征；

(5)制作适用于每个DIA模式采集的数据文件分析的质谱数据库Library文件：

(5.1)利用多个重同位素标记的标准品的保留时间，以DIA模式获得的保留时间为靶向，将各个已有DDA数据与该DIA数据进行保留时间校正，使每个DDA文件经过校正后转化成一个适用于该DIA分析的质谱数据库Library文件；如果一个样品成份拥有多个保留时间时，指定中位数值为该成份的保留时间；

(5.2)合并(5.1)中所有纠正后的质谱信息，形成一个适用于该DIA分析的修正DIA依赖型标准质谱数据库(DIA-dependent Library)；

(6)以步骤(5)制作的质谱数据库Library文件为参照，利用质谱数据商业软件对该DIA数据进行搜索，获得该样品各组份的定性、定量结果。

图1为在分析某个DIA数据时根据以往同类型样品DDA信息制作此DIA-dependent Library及其使用的过程；其中，左侧限制框内代表以往数据库中的3个DDA文件(DDA1，DDA2，DDAn)，由于不同时间点采集的DDA数据RT不一致(示意为每个DDA左侧竖线重同位素标记的标准品在RT时间横轴上的偏移)，样品内某成份(RT时间横轴中部的竖线)的RT也由DDA1中的5分钟(5’)向时间轴右侧偏移。图中心部显示的为某个DIA中重同位素标记的标准品的RT。上述DDA数据分别参照此DIA的标准品RT，对其内部各成份的RT进行校正(如同右侧限制框内所示：各DDA数据经过校正分别产生3个文件，其内的重同位素标记的标准品已经校正到与该DIA一致，而示例用的样品内某成份的RT也根据其与标准品RT的相对距离进行了校正，分别得到5.5、6、6.5分钟三个RT值，那么该成份最适用于此DIA数据的RT值应为3个时间的中间值(6分钟)。图中部下方显示将样品内所有成份的RT值校正后，数据合并制作成适用于此DIA数据的专属Library。进而根据Library信息搜索此DIA数据，可以得到样品内所有成份的定性与定量信息。

具体地，本发明实施例利用上述方法在精准医疗实践中，检测、定量分析脑脊液中蛋白成份，如对新加入的5例脑肿瘤脑脊液样品以DIA模式进行蛋白质谱分析。

1.脑脊液样品蛋白提取：

5例髓母细胞瘤患者脑脊液300微升，分装于5个1.7毫升微量离心管中，加入900微升丙酮负80度沉淀蛋白1小时，离心，移除液体部分，得到脑脊液蛋白混合物。

2.蛋白酶切、去盐：

将提取的脑脊液蛋白混合物经还原剂、碱化剂处理后，以1微克胰蛋白酶:50微克蛋白的比例混合，过夜消化；以C18反相柱去盐纯化，再经真空抽干离心机除去有机溶剂后，用含有乙腈和三氟醋酸的溶液稀释到最终0.5～1微克/微升浓度溶液，即为待测蛋白混合液。

3.质谱检测：

将各待测蛋白混合液分别取12微升，加入重同位素标记的标准品1(其氨基酸序列见SEQ NO.1)、重同位素标记的标准品2(其氨基酸序列见SEQ NO.2)，上样于美国Waters公司的nanoACQUITY与美国Thermo公司的Q-Exactive连接成的超高压液相色谱仪－质谱仪系统，按照质谱厂家提供的程序在DIA模式下进行质谱信号采集。标准品1和标准品2可采用现有常规氨基酸合成方法合成。

4.现存DDA数据库及已知重同位素标记的标准品的质谱信息与Library：

采用DDA模式采集被检样品和重同位素标记的标准品中所有成份的质谱信息，所述质谱信息包括质谱保留时间(RT)及其质谱特征；由商业软件Skyline制作成标准品的Library，以备后用；

例如，申请人2014年至2016年间存储了69例脑脊液质谱DDA质谱数据文件的数据库，其中包括重同位素标记的标准品1(其氨基酸序列见SEQ NO.1)、重同位素标记的标准品2((其氨基酸序列见SEQ NO.2)的单独质谱分析的文件，并已经由商业软件Skyline制作成标准品的Library，以备后用。

5.DIA文件的预处理：

5例新脑脊液样品的DIA文件，以重同位素标记的标准品的Library为参照在Skyline中搜索出重同位素标记的标准品的RT。

6.DIA-dependent Library的制作

利用重同位素标记的标准品的RT，将每个DDA数据向各DIA数据进行RT校正，使每个DDA文件经过校正后转化成一个适用于各DIA分析的Library；将各DIA校正后的所有Library合并，制作一个新的、适用于每个DIA分析的DIA-dependent Library；其中如果一个样本中某多肽组份拥有多个RT值时，指定中位数值(Median)为该多肽的RT。

7.以DIA-dependent Library为参照标准分析DIA数据：

利用步骤6.制作的Library为参照，以Skyline等商业质谱分析软件对该DIA数据进行搜索，获得该样品各组份的定性、定量结果。

图2A和图2B为使用传统方法机械合并所有DDA制作Library与使用本发明制作Library对于DIA分析质量的比较。

其中，图2A柱状图显示使用本发明制作的Library对于5例脑脊液样品蛋白分析时可定量蛋白数的提高(平均提高9.67％的蛋白数目)。

图2B为如上脑脊液样品的质谱峰图：显示使用本发明制作的Library进行搜索时，原先由于RT偏差大而检测不到的成份(未能定位任何符合肽段GLEWVANIK特征的质谱峰，左上：完整成份的质谱图；左下：碎片成份的质谱图)经过个体化制作的DIA-dependent Library搜索，可以被准确捕捉到(右上：完整成份的质谱图；右下：碎片成份的质谱图)。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 一种对非数据依赖型采集模式质谱数据的分析方法及其应用 [P] . 中国专利： CN106290684B . 2017.09.05
2. 一种对非数据依赖型采集模式质谱数据的分析方法及其应用 [P] . 中国专利： CN106290684A . 2017-01-04
3. Data-dependent acquisition system for mass spectrometry and method for its application [P] . 德国专利： DE102010019590B4 . 2019-09-05

机译：质谱数据依赖的采集系统及其应用方法
4. DATA-INDEPENDENT MASS SPECTRAL DATA ACQUISITION INCLUDING DATA-DEPENDENT PRECURSOR-ION SURVEYS [P] . EP3340275B1 . 2021-11-03

机译：独立于数据的质谱数据采集，包括数据依赖性前体 - 离子调查
5. Removal of the dynamic background signal in data dependancy data acquisition of kuromatogurahui/mass spectrometry [P] . 日本专利： JP2008542767A . 2008-11-27

机译： kuromatogurahui /质谱法数据依赖数据采集中动态背景信号的去除