首页> 中国专利> 测定DNA甲基化的分析法和癌症的DNA甲基化标记

测定DNA甲基化的分析法和癌症的DNA甲基化标记

摘要

提供用于测定DNA样品中的基因组甲基化特征的方法。在某些方面中,所述方法可以用于确定受试者是否患有膀胱癌或其它泌尿道癌症或是否处于产生膀胱癌或其它泌尿道癌症的风险中。同样提供治疗这类受试者的方法。

著录项

  • 公开/公告号CN113186288A

    专利类型发明专利

  • 公开/公告日2021-07-30

    原文格式PDF

  • 申请/专利权人 兹莫研究公司;

    申请/专利号CN202110508348.1

  • 发明设计人 郭为;P·皮亚提;X·杨;X-Y·贾;

    申请日2016-02-24

  • 分类号C12Q1/6886(20180101);C12Q1/6851(20180101);

  • 代理机构31100 上海专利商标事务所有限公司;

  • 代理人陶家蓉;余颖

  • 地址 美国加利福尼亚州

  • 入库时间 2023-06-19 12:04:09

说明书

本申请要求2015年2月24日提交的美国临时专利申请第62/120,373号的权益,所述美国临时专利申请以全文引用的方式并入本文中。

技术领域

本发明大体上涉及分子生物学、实验胚胎学和预测医学的领域。更具体地说,其涉及测定样品的基因组DNA甲基化特征的方法。

背景技术

泌尿道癌症包括膀胱癌、尿道癌、肾癌和前列腺癌,其细胞可通过尿液或活检检测到。膀胱癌是2011年男性中10种最盛行恶性病之一,就死亡和新病例来说分别排第四和第八(Siegel等人,2011;Morgan和Clark,2010)。非肌肉浸润性膀胱癌(NMIBC) 在所有病例中占80%,且可以进一步分类成单独粘膜(Ta)、原位癌(Tis)和固有层浸润(T1)病变(Babjuk等人,2011;Sobin等人,2009)。NMIBC的主要疗法是在使用或不使用膀胱内化学或免疫疗法的情况下对膀胱肿瘤进行经尿道切除术(TURBT);然而,超过50%的患者在TURBT程序后复发,其中在患有高风险疾病的患者中复发率最高(Shelley等人,2010;Millan-Rodríguez等人,2000)。因此,患者在TURBT之后需要终身频繁的监测,使得膀胱癌成为管控成本最高的癌症类型之一。

用于监测膀胱癌复发的现行标准涉及使用膀胱镜检查和细胞学(Morgan和Clark,2010;Babjuk等人,2011)。由于膀胱镜检查的有创性质和泌尿细胞学在检测低级别肿瘤时的灵敏度低,因此疾病监控繁琐麻烦(Lintula和Hotakainen,2010)。添加核基质蛋白22(NMP-22)、膀胱肿瘤抗原或UroVysion FISH已表明有助于增加细胞学的灵敏度(Parker和Spiess,2011)。然而,由于其在特异性或灵敏度方面的表现不一致,因此迄今提出的标记尚未在常规临床实践中广泛采用(Reinert 2012)。因此,需要发现可靠的标记来监测膀胱癌患者以及区分与泌尿道相关的不同癌症。此外,需要新的方法来评估生物样品中的基因组DNA甲基化特征。

发明内容

在第一实施例中,本发明提供一种测定样品中的基因组DNA甲基化特征的方法,所述方法包含:(a)获得基本上提纯的基因组DNA测试样品;(b)使样品中的一部分测试基因组DNA与第一反应混合物接触,所述第一反应混合物包含:(i)至少两种甲基化敏感性限制核酸内切酶;(ii)热启动DNA聚合酶;(iii)pH缓冲盐溶液;(iv)dNTP; (v)用于对DNA样品中的至少第一、第二和第三不同基因组区域进行聚合酶链反应 (PCR)扩增的DNA引物对;以及(vi)与所述第一、第二和第三不同基因组区域中的序列互补的荧光探针,用于定量检测从第一、第二和第三不同基因组区域扩增的序列,其中每个探针包含不同的荧光标记;其中(I)第一基因组区域是已知未甲基化的裂解对照物,(II)第二基因组区域是不包括第一反应混合物中的甲基化敏感性限制核酸内切酶的任何切点的拷贝数对照物,且(III)第三基因组区域是具有未知量的甲基化且包括第一反应混合物中的甲基化敏感性限制核酸内切酶的至少三个切点的测试区域;(c)对第一反应混合物进行消化和热循环,同时检测来自荧光探针的荧光信号,由此在第一和第二反应混合物中对样品进行实时PCR;以及(d)使用所检测到的荧光信号测定样品中的基因组DNA甲基化特征。

在其它方面中,所述方法另外包含:(a)获得基本上提纯的基因组DNA测试样品;(b)使样品中的一部分测试基因组DNA与第一反应混合物以及第二反应混合物接触,所述第一反应混合物包含:(i)至少两种甲基化敏感性限制核酸内切酶;(ii)热启动DNA 聚合酶;(iii)pH缓冲盐溶液;(iv)dNTP;(v)用于对DNA样品中的至少第一、第二和第三不同基因组区域进行聚合酶链反应(PCR)扩增的DNA引物对;以及(vi)与所述第一、第二和第三不同基因组区域中的序列互补的荧光探针,用于定量检测从第一、第二和第三不同基因组区域扩增的序列,其中每个探针包含不同的荧光标记;所述第二反应混合物与第一反应混合物相同,但缺乏所述至少两种甲基化敏感性限制核酸内切酶,其中:(I)第一基因组区域是已知未甲基化的裂解对照物;(II)第二基因组区域是不包括第一反应混合物中的甲基化敏感性限制核酸内切酶的任何切点的拷贝数对照物;且(III)第三基因组区域是具有未知量的甲基化且包括第一反应混合物中的甲基化敏感性限制核酸内切酶的至少三个切点的测试区域;(c)对第一和第二反应混合物进行消化和热循环,同时检测来自荧光探针的荧光信号,由此在第一和第二反应混合物中对样品进行实时PCR;以及(d)使用所检测到的荧光信号测定样品中的基因组DNA甲基化特征。

在一些方面中,第一反应混合物进一步包含PCR增强剂。在特定方面中,PCR增强剂可以包含DMSO。在某些方面中,获得基本上提纯的基因组DNA测试样品可以包含对DNA样品进行提纯。在若干个方面中,基本上提纯的基因组DNA测试样品的纯度足以供所述至少两种甲基化敏感性限制核酸内切酶在30℃下、在2小时内对DNA达到至少85%、90%、95%或99%的消化。在特定方面中,基本上提纯的基因组DNA测试样品包含50pg到1,000ng的DNA。在一些特定方面中,基本上提纯的基因组DNA测试样品包含小于50ng的DNA。

在某些方面中,基本上提纯的基因组DNA测试样品可以获自尿液、粪便、唾液、血液或组织样品。在一些特定方面中,基本上提纯的基因组DNA测试样品是获自活检样品。在其它特定方面中,基本上提纯的基因组DNA测试样品是获自尿液样品。在若干个方面中,第一反应混合物包含至少三种甲基化敏感性限制核酸内切酶。在其它方面中,至少三种甲基化敏感性限制核酸内切酶包含AciI、HinP1l和HpaII。

在一些方面中,步骤(b)可以进一步包含使样品中的一部分测试基因组DNA与第一反应混合物接触,所述第一反应混合物包含:(i)至少两种甲基化敏感性限制核酸内切酶;(ii)热启动DNA聚合酶;(iii)pH缓冲盐溶液;(iv)dNTP;(v)用于对DNA 样品中的至少第一、第二、第三和第四不同基因组区域进行聚合酶链反应(PCR)扩增的DNA引物对;以及(vi)与所述第一、第二、第三和第四不同基因组区域中的序列互补的荧光探针,用于定量检测从第一、第二、第三和第四不同基因组区域扩增的序列,其中每个探针包含不同的荧光标记,其中:(I)第一基因组区域是已知未甲基化的裂解对照物,(II)第二基因组区域是不包括第一反应混合物中的甲基化敏感性限制核酸内切酶的任何切点的拷贝数对照物,且(III)第三和第四基因组区域是具有未知量的甲基化且包括第一反应混合物中的甲基化敏感性限制核酸内切酶的至少三个切点的测试区。

在其它方面中,步骤(b)可以另外包含使样品中的一部分测试基因组DNA与第一反应混合物接触,所述第一反应混合物包含:(i)至少两种甲基化敏感性限制核酸内切酶;(ii)热启动DNA聚合酶;(iii)pH缓冲盐溶液;(iv)dNTP;(v)用于对DNA样品中的至少第一、第二、第三、第四和第五不同基因组区域进行聚合酶链反应(PCR) 扩增的DNA引物对;以及(vi)与所述第一、第二、第三、第四和第五不同基因组区域中的序列互补的荧光探针,用于定量检测从第一、第二、第三、第四和第五不同基因组区域扩增的序列,其中每个探针包含不同的荧光标记,且其中(I)第一基因组区域是已知未甲基化的裂解对照物,(II)第二基因组区域是不包括第一反应混合物中的甲基化敏感性限制核酸内切酶的任何切点,且(III)第三、第四和第五基因组区域是具有未知量的甲基化且包括第一反应混合物中的甲基化敏感性限制核酸内切酶的至少三个切点的测试区域。在某些方面中,第三、第四和第五基因组区域可以是Unk05、Unk09和SOX17 的区域。在又其它方面中,实施例方法进一步包含确定细胞是否包含关于一个或多个基因区域的非整倍体。

在若干方面中,第一反应混合物中的甲基化敏感性限制核酸内切酶的切点有至少4、5、6、7或8个。在一些方面中,引物对与相隔不超过300、275、250、225、200、190、 180、170、160、150、140、130、120、110、100、90、80、70、60或50个核苷酸的序列互补。在某些方面中,第一基因组区域是管家基因的基因组区域。管家基因可以是 GAPDH。在又其它方面中,第二基因组区域可以是POLR2A基因的基因组区域。在一些方面中,第三基因组区域选自表1A或表2中所提供的群组。在一些特定方面中,第三基因组区域选自由以下组成的群组:DMRTA2、EVX2、Unk21、OTX1、SOX1、SEPT9、 Unk05、Unk09、GALR1、Unk07、Unk19、TBX15、EEF1A2、TFAP2B、DCHS2和SOX17。在一个特定方面中,使用所检测到的荧光信号测定样品中的基因组DNA甲基化特征包含计算样品的相对甲基化百分比。在又其它方面中,实施例方法包含使用表1C中所提供的一个或多个探针或引物对。

在另一个实施例中,本发明提供一种反应混合物,其包含:(i)至少两种甲基化敏感性限制核酸内切酶;(ii)热启动DNA聚合酶;(iii)pH缓冲盐溶液;(iv)dNTP;(v) 基本上提纯的基因组DNA样品;(vi)用于对DNA样品中的至少第一、第二和第三不同基因组区域进行聚合酶链反应(PCR)扩增的DNA引物对;(vii)与所述第一、第二和第三不同基因组区域中的序列互补的荧光探针,用于定量检测从第一、第二和第三不同基因组区域扩增的序列,其中每个探针包含不同的荧光标记,其中:(I)第一基因组区域是已知未甲基化的裂解对照物;(II)第二基因组区域是不包括第一反应混合物中的甲基化敏感性限制核酸内切酶的任何切点的拷贝数对照物;且(III)第三基因组区域是具有未知量的甲基化且包括第一反应混合物中的甲基化敏感性限制核酸内切酶的至少三个切点的测试区域。在一些方面中,第三基因组区域选自表1A或表2中所提供的群组。在又其它方面中,与所述第一、第二和第三不同基因组区域中的序列互补的探针是选自表1C中所提供的探针。

在又另一个实施例中,提供一种测定样品中的基因组DNA甲基化特征的方法,所述方法包含:(a)获得已用亚硫酸氢盐转化的基因组DNA测试样品;(b)使测试样品与第一反应混合物接触,所述第一反应混合物包含:(i)热启动DNA聚合酶;(ii)pH 缓冲盐溶液;(iii)dNTP;(iv)用于对DNA样品中的至少第一和第二不同基因组区域进行聚合酶链反应(PCR)扩增的DNA引物对,其中引物对与相隔不超过200个核苷酸的序列互补;以及(v)与所述第一和第二不同基因组区域中的序列互补的荧光探针,用于定量检测从第一和第二不同基因组区域扩增的序列,其中每个探针包含不同的荧光标记,其中:(I)第一基因组区域是不包含CpG二核苷酸的拷贝数对照区域;且(II) 第二基因组区域是具有未知量的甲基化的测试区域,所述测试区域包括与第二基因组区域的DNA引物对和探针互补的序列中的至少五个CpG二核苷酸;(c)对第一反应混合物进行热循环,同时检测来自荧光探针的荧光信号,由此在第一反应混合物中对样品进行实时PCR;以及(d)使用所检测到的荧光信号和得自DNA甲基化标准曲线的荧光信号测定样品中的基因组DNA甲基化特征。

在又又另一个实施例中,本发明提供一种测定样品中的基因组DNA甲基化特征的方法,所述方法包含:(a)获得已用亚硫酸氢盐转化的基因组DNA测试样品,以及已经完全甲基化的甲基化基因组DNA对照样品;(b)使测试样品与第一反应混合物接触,所述第一反应混合物包含:(i)热启动DNA聚合酶;(ii)pH缓冲盐溶液;(iii)dNTP; (iv)用于对DNA样品中的至少第一和第二不同基因组区域进行聚合酶链反应(PCR) 扩增的DNA引物对,其中引物对与相隔不超过200个核苷酸的序列互补;以及(v)与所述第一和第二不同基因组区域中的序列互补的荧光探针,用于定量检测从第一和第二不同基因组区域扩增的序列,其中每个探针包含不同的荧光标记,其中:(I)第一基因组区域是不包含CpG二核苷酸的拷贝数对照区域;且(II)第二基因组区域是具有未知量的甲基化的测试区域,所述测试区域包括与第二基因组区域的DNA引物对和探针互补的序列中的至少五个CpG二核苷酸;(c)使亚硫酸氢盐转化的甲基化基因组DNA对照样品与第二反应混合物接触,所述第二反应混合物具有与所述第一反应混合物相同的组分;(d)对第一和第二反应混合物进行热循环,同时检测来自荧光探针的荧光信号,由此在第一和第二反应混合物中对样品进行实时PCR;以及(e)使用所检测到的荧光信号和得自DNA甲基化标准曲线的荧光信号测定样品中的基因组DNA甲基化特征。

在本文所述实施例的一些方面中,所述方法进一步包含使用所检测到的第一基因组区域的荧光信号将所有测试样品的DNA数量标准化。在某些方面中,第一反应混合物可以进一步包含PCR增强剂。在特定方面中,PCR增强剂包含DMSO。在若干方面中,测定基因组DNA甲基化特征包含测定甲基化DNA分子的拷贝数。在又其它方面中,所述方法可以另外包含使用所检测到的荧光信号测定测试样品相对于参照甲基化对照物的甲基化比率。在特定方面中,基因组DNA样品包含50pg到10ng的DNA。在某些方面中,基因组DNA样品可以包含从6到1,500个细胞中分离出的DNA。

在本文所述实施例的又其它方面中,所述方法可以另外包含获得基因组DNA样品以及对基因组DNA样品进行亚硫酸氢盐转化。在特定方面中,基因组DNA是获自尿液、粪便、唾液、血液或组织样品。在其它方面中,基因组DNA是获自活检样品。在一个特定方面中,基因组DNA是获自尿液样品。

在某些方面中,步骤(b)进一步包含使测试样品与第一反应混合物接触,所述第一反应混合物包含:(i)热启动DNA聚合酶;(ii)pH缓冲盐溶液;(iii)dNTP;(iv) 用于对DNA样品中的至少第一、第二和第三不同基因组区域进行PCR扩增的DNA引物对,其中引物对与相隔不超过200个核苷酸的序列互补;以及(v)与所述第一、第二和第三不同基因组区域中的序列互补的荧光探针,用于定量检测从第一、第二和第三不同基因组区域扩增的序列,其中每个探针包含不同的荧光标记,其中:(I)第一基因组区域是不包含CpG二核苷酸的拷贝数对照区域;且(II)第二和第三基因组区域是具有未知量的甲基化的测试区域,所述测试区域包括与第二和第三基因组区域的DNA引物对和探针互补的序列中的至少五个CpG二核苷酸。在一个特定方面中,步骤(b)可以再进一步包含使测试样品与第一反应混合物接触,所述第一反应混合物包含:(i)热启动DNA聚合酶;(ii)pH缓冲盐溶液;(iii)dNTP;(iv)用于对DNA样品中的至少第一、第二、第三、第四和第五不同基因组区域进行PCR扩增的DNA引物对,其中引物对与相隔不超过200个核苷酸的序列互补;以及(v)与所述第一、第二、第三、第四和第五不同基因组区域中的序列互补的荧光探针,用于定量检测从第一、第二、第三、第四和第五不同基因组区域扩增的序列,其中每个探针包含不同的荧光标记,其中:(I) 第一基因组区域是不包含CpG二核苷酸的拷贝数对照区域;且(II)第二、第三、第四和第五基因组区域是具有未知量的甲基化的测试区域,所述测试区域包括与第二、第三、第四和第五基因组区域的DNA引物对和探针互补的序列中的至少五个CpG二核苷酸。

在本文所述实施例的若干方面中,第二基因组区域包括与第二区域的DNA引物对和探针互补的序列中的至少6、7、8、9或10个CpG二核苷酸。在一些特定方面中,与 DNA引物对互补的序列中的所述CpG二核苷酸之一包括定位于DNA引物对的3'端的最后五个核苷酸中的C。在另一个方面中,C可以是定位于DNA引物对的3'端。

在某些方面中,引物对与相隔不超过170、160、150、140、130、120、110或100 个核苷酸的序列互补。在一些方面中,每个探针的长度不超过40bp。在一些特定方面中,每个探针的长度不超过30bp。在若干方面中,每个探针包含30-80%的CG比率。在特定方面中,每种引物具有55-62℃的Tm。在另一个方面中,每个探针可以具有65-72℃的Tm。

在又其它方面中,拷贝数对照区域是COL2A1基因的区域。在一些方面中,第二基因组区域选自表1A中所提供的群组。在一些特定方面中,第二基因组区域选自由以下组成的群组:DMRTA2、EVX2、Unk21、OTX1、SOX1、SEPT9、Unk05、Unk09、GALR1、 Unk07、Unk19、TBX15、EEF1A2、TFAP2B、DCHS2和SOX17。在某些方面中,使用所检测到的荧光信号测定样品中的基因组DNA甲基化特征包含计算样品的相对甲基化百分比。

在又另一个实施例中,提供一种合成的聚核苷酸序列,其包含与选自表1B或1C中所提供序列的探针序列之一具有至少90%、91%、92%、93%、94%、95%、96%、97%、 98%或99%一致性的序列,其中聚核苷酸与报告分子结合。在一些方面中,合成聚核苷酸包含与表1B或1C中的探针之一一致的序列。在某些方面中,报告分子是荧光团。

在又另一个实施例中,提供引物对,其中引物包含与选自表1B或1C中所提供序列的引物序列之一具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%一致的序列。在一些方面中,引物对包含序列与表1B或1C中的引物对一致的引物。

在又其它方面中,提供一种试剂盒,其包含用于执行qPCR的试剂和重组聚核苷酸序列,所述重组聚核苷酸序列包含与选自表1B或1C中所提供序列的探针序列之一具有至少90%、91%、92%、93%、94%、95%、96%、97%、98%或99%一致性的序列,其中聚核苷酸与报告分子结合。

在另一个实施例中,本发明提供一种治疗患者的方法,所述方法包含根据上述任一实施例和方面测定患者的基因组甲基化特征以及根据基因组甲基化特征对患者进行治疗。在某些方面中,治疗包含对患者进行活检。在一些方面中,治疗包含向患者投与抗癌疗法。抗癌疗法可以是化学疗法、放射疗法、基因疗法、外科手术、激素疗法、抗血管生成疗法或细胞介素疗法。

在另一个实施例中,提供一种检测患者的膀胱癌或泌尿道的其它癌症的存在或风险增加的方法,所述包含测定患者样品中的选自表1A所提供群组的一个或多个基因组区域的甲基化状况,其中表1A中的一个或多个基因组区域的甲基化水平相对于参考水平增加表示患者患有膀胱癌或处于产生膀胱癌的风险中。

在一些方面中,一个或多个基因组区域选自由以下组成的群组:Unk 09、Unk 05、DCHS2、OTX1、Unk 07、EVX2、SEPT9、SOX1、Unk 19、Unk 21和SOX17(如表1A中所指示)。在某些方面中,一个或多个基因组区域是选自所述基因组区域中的 2、3、4、5、6、7、8、9、10或11个,所述基因组区域选自由以下组成的群组:Unk 09、 Unk 05、DCHS2、OTX1、Unk 07、EVX2、SEPT9、SOX1、Unk 19、Unk 21和SOX17 (如表1A中所指示)。

在其它方面中,一个或多个基因组区域选自由以下组成的群组:GALR1、TBX15、EEF1A2、DMRTA2和TFAP2B(如表1A中所指示)。在一些方面中,一个或多个基因组区域是选自所述基因组区域中的2、3、4或5个,所述基因组区域选自由以下组成的群组:GALR1、TBX15、EEF1A2、DMRTA2和TFAP2B(如表1A中所指示)。

在某些方面中,一个或多个基因组区域选自由以下组成的群组:SCT、Unk 14、Unk29、CERKL和SHH(如表1A中所指示)。在其它方面中,一个或多个基因组区域是选自所述基因组区域中的2、3、4或5个,所述基因组区域选自由以下组成的群组:SCT、 Unk 14、Unk 29、CERKL和SHH(如表1A中所指示)。

在一些方面中,所述测定包含测定两个、三个或更多个所述基因组区域的甲基化状况。在某些方面中,所述测定包含测定2、3、4、5、6、7、8、9、10个或更多个所述基因组区域的甲基化状况。在一些方面中,所述测定包含测定2、3、4、5、6、7、8、9、 10个或更多个所述基因组区域的甲基化状况,其中所述基因组区域选自由以下组成的群组:Unk 09、Unk 05、DCHS2、OTX1、Unk 07、EVX2、SEPT9、SOX1、Unk 19、Unk 21、SOX17、GALR1、TBX15、EEF1A2、DMRTA2和TFAP2B(如表1A中所指示)。在其它方面中,所述测定包含测定如下基因组区域中的每一个的甲基化:Unk 09、Unk 05、DCHS2、OTX1、Unk 07、EVX2、SEPT9、SOX1、Unk 19、Unk21、SOX17、GALR1、 TBX15、EEF1A2、DMRTA2和TFAP2B(如表1A中所指示)。

在某些方面中,患者预先已经治疗或诊断患有膀胱癌。在一些方面中,所述方法进一步定义为一种检测膀胱癌复发或膀胱癌复发风险的方法。

在其它方面中,所述测定包含使用限制性核酸内切酶消化和qPCR分析样品中的DNA甲基化。在其它方面中,消化反应是在第一步骤中完成,随后在第二步骤中进行 qPCR反应。

在一些方面中,患者是人类。在某些方面中,样品是尿液样品。在其它方面中,样品是血液样品。在其它方面中,通过从患者抽血来获得样品。在其它方面中,样品获自第三方。

在某些方面中,测定甲基化状况包含测定基因组区域中的包含甲基化的核苷酸位置。在一些方面中,测定甲基化状况包含测定基因组区域中的核苷酸位置发生甲基化的比例。在其它方面中,测定甲基化状况包含测定基因组区域中发生甲基化的核苷酸位置的比例。

在一些方面中,参考水平是不患有膀胱癌的患者的甲基化水平。在某些方面中,方法进一步定义为一种测定膀胱癌严重度的方法。

在另一个实施例中,本发明提供一种检测患者的膀胱癌的存在或风险增加的方法,所述方法包含获得患者样品、测定选自表1中的基因组区域的一个或多个基因组区域的甲基化状况,以及根据一个或多个基因组区域中的甲基化水平相对于参考水平增加,鉴别出患者存在膀胱癌或膀胱癌的风险增加。

在又另一个实施例中,本发明提供一种治疗患有膀胱癌或处于患膀胱癌风险中的患者的方法,所述方法包含向患者投与疗法,其中患者经预先测定,在选自表1中所提供基因组区域的一个或多个基因组区域中相对于参考水平具有增加的甲基化水平。在一些方面中,疗法包含向受试者投与抗癌疗法。在其它方面中,抗癌疗法是化学疗法、放射疗法、基因疗法、外科手术、激素疗法、抗血管生成疗法或细胞介素疗法。在某些方面中,抗癌疗法是BCG疗法。

在又另一个实施例中,本发明提供用于分析DNA甲基化的试剂盒。在一些方面中,提供一种试剂盒,所述试剂盒包含密封的容器,所述容器包含为了检测表1A中的一、二、三、四、五、六、七、八、九、十、十一、十二、十三、十四、十五、十六个或更多个基因组区域中的甲基化所设计的引物或探针。举例来说,试剂盒可以包含用于扩增表1中的基因组区域之一的序列间隔的引物对和用于分析DNA甲基化的试剂(例如甲基化敏感性限制性核酸内切酶)。在另一个方面中,试剂盒可以包含用于分析总DNA甲基化水平的试剂。

在另一个方面中,提供用于测定DNA样品中的一个或多个甲基化位置的试剂盒。举例来说,试剂盒可以至少包含活性葡萄糖基转移酶和DNA核酸内切酶(例如MspI、 TaqI或甲基化依赖性DNA核酸内切酶,如BisI、GlaI或McrBC)。根据本发明的试剂盒可以进一步包含一种或多种MSE;DNA甲基转移酶(例如M.SssI和/或M.CviPI甲基转移酶);将5'mC转化成5'hmC的酶(例如重组Tet1、Tet2和/或Tet3蛋白质);一个或多个参照DNA样品;亲和提纯柱;DNA连接酶;DNA聚合酶;DNA测序试剂;PCR 缓冲液;说明书;甲基化特异性抗体;和/或DNA引物(还有测定一般尿液参数(pH、血红素的量、白血球)试剂,例如Osumex 10P测试试剂盒,Uriscan(YD诊断剂公司))。

如本文在说明书中所用,“一(a或an)”可以意指一个或多个。如本文在权利要求书中所使用,当结合词语“包含(comprising)”使用时,词语“一(a或an)”可意指一个或超过一个。

尽管本公开支持提及单独替代物和“和/或”的定义,但是除非明确指示提及单独替代物或替代物相互排斥,否则权利要求书中使用的术语“或(or)”用于指“和/或(and/or)”。如本文所用,“另一个(another)”可以意指至少第二个或更多个。

在通篇本申请中,术语“约”用于表示,对于测定一种值所用的装置、方法来说,所述值包括误差的固有差异,或研究个体之间存在的差异。

本发明的其它目的、特征及优点将通过以下详细说明而变得显而易见。然而应了解,虽然指出了本发明的优选实施例,但是详细说明和具体实例仅为了说明而给出,因为所属领域的技术人员根据这个详细说明将显而易见属于本发明精神和范围内的各种变更和润饰。

附图说明

以下附图形成本说明书的一部分且为了进一步展现本发明的某些方面而包括在内。通过参考这些附图中的一个或多个以及本文中所呈现具体实施例的详细说明的组合可以更好地理解本发明。

图1A-B:(A)甲基化分析系统示意图。(B)限制酶和其相应消化部位的清单。所述酶仅在未发生甲基化的C(放大图示)处切割含CG序列。

图2:多重相对于单重qPCR反应;每个泳道装载7.5μl PCR反应物(次完全扩增; 35个循环);未消化的血液gDNA用作模板。每个孔下方的编号对应于表1中的标记编号。

图3:检测极限和一步法相对于两步法。0.25-1%扩增视为高于背景水平;0.25%给予低置信度且1%给予高置信度。将LD583膀胱癌细胞系(Isabel D.C.Markl和Peter A.Jones,《癌症研究(Cancer Research)》58,5348-5353,1998年12月1日)gDNA与正常的尿液gDNA混合。使用一步法(用箭头标记)进行反应A、B和C,所述一步法说明了一步反应不适用于所有标记。

图4-8:限制性核酸内切酶消化和实时qPCR之后的相对甲基化值。Y轴表示相对于未消化的血液DNA值(血液-)的甲基化水平;这是值=1的参考样品。-=未消化的模板;+=消化的模板。血液=从血液(健康男性,53岁)中提取的基因组DNA;LD583 =从膀胱癌细胞系中提取的基因组DNA;尿液=从非膀胱癌人体中提取的基因组 DNA。

图9:使用POLR2A引物(内参照标记)和未消化/消化的gDNA作为模板(三种不同的样品类型)进行qPCR之后的典型结果的实例。每个反应使用15ng DNA。所示为CT值。

图10:所消化的临床样品中的16种不同标记(表3中的A类和B类)的甲基化百分比。nnU=正常尿液。高于1%的值用红色标记,而>0.25%且<1%的值用蓝色标记。红色箭头和圆圈表示观察到较高背景(nnU)的那些样品的标记。

图11:图10中的样品基于不同标记的信号%分成三类:展现癌症存在/发展的样品用红色标记(在多个标记中,值高于1%);具有多个低置信度阳性值(>0.5%且<1%) 的边缘型样品用橙色标记;所有标记的值<0.5%的样品视为无癌症且用绿色标记。

图12:标记GALR1的初始qPCR反应结果。LD583是膀胱癌细胞系且标记GALR1 在这种细胞系中发生甲基化,但在血液中未发生甲基化(450K数据)。未消化的LD583 样品(红色箭头所示)根本未扩增且消化的LD583样品(绿色箭头)展现了扩增,但比未消化的血液DNA对照物(第一个条形柱)弱得多。血液和LD583所用的模板的量均为10ng且POLR2A标记扩增在两个样品之间是类似的。这种问题通过向PCR反应物中添加5%DMSO(最终浓度)来规避。

图13:实例2中所执行的分析实例,其通过标记19展现结果。通过与未消化的相应样品中的信号(100%)比较来计算消化样品的信号(+)。还使用POLR2A作为内参考物(内部对照)来校正数据且使用GAPDH对照标记来检测完全DNA消化。

图14A-E:膀胱癌用于训练样品和分级聚类的概率(使用所选DNA甲基化生物标记)。(A-B)利用肿瘤组织和对照组的HM450人类甲基化阵列数据推导出的甲基化标记。(C)利用来自膀胱癌患者和健康对照者的尿液样品的HM450阵列数据所推导出的甲基化标记。(D-E)利用肿瘤组织和对照组的简化代表性亚硫酸氢盐测序(Reduced RepresentationBisulfite Sequencing,RRBS)数据所推导出的甲基化标记。

图15:CARE分析示意图。使用CARE分析法对未甲基化(A)和甲基化(B)的 DNA进行分析。DNA甲基化阻碍了消化反应物中的DNA裂解,因而在后续qPCR步骤期间,在B)中出现稳健的扩增,但在A)中则未出现。每个实验中并行进行无消化的对照反应。

图16:描绘CARE分析法通用工作流程的示意图。

图17A-17B:CARE分析法对添加有不同量的人工甲基化尿液DNA(100%甲基化; X轴)的正常尿液DNA样品的分析。A)CARE分析法能够在未甲基化的尿液DNA背景下检测到0.5%的完全甲基化尿液DNA的存在。B)当正常尿液DNA样品中添加有 50%和100%的人工甲基化尿液DNA时的CARE分析情况。每个反应中使用10ng的输入DNA(DNA量大致对应于约1500个细胞)。为简单起见,仅呈现属于集合A的癌症标记。使用三次技术性重复操作来进行实验。

图18A-18C:示例性CARE分析法试剂盒和反应物的说明。A)基本的CARE分析法试剂盒组件;最终的试剂盒中可以包括其它组件,如

图19A-19F:计算两个不同样品(Spl 01和02)和外部消化对照物(E.D.C.)中的属于CARE分析集合A的标记的甲基化百分比所用的算法。收集平均CT值(CTm)(A) 和ΔCT(B),通过CFX96TM-实时系统机来计算ΔΔCT(C)和RQ(D)值。然后用百分比表示数据,每个未消化样品中的每个单一标记的RQ值视为等于100%(E)。在以上实例中,由于内源性消化对照物GAPDH(灰色圆圈)的甲基化水平和外源性消化对照物E.D.C.(黑色圆圈)中的所有标记的甲基化水平低于消化样品(+)中的最大可接受背景限值(1%),因此所述分析可以视为有效的。(F)因此,就所得数据来说,Spl 01对于膀胱癌呈阴性,而Spl 02呈阳性。使用三次技术性重复操作来进行实验。结果也可以用耐受消化的经校正DNA拷贝数而非百分比来表示(参见段落[00127])。

图20:标记#27和#15的基线阈值的调整实例。

图21A:多重甲基化特异性qPCR分析(MMSP)中对用于亚硫酸氢盐转化的DNA 的输入量的分析。

图21B:四个随机选择的膀胱患者样品的尿液DNA尺寸分布。

图22:描绘MMSP分析法工作流程的示意图,其包括皆在一天内进行的亚硫酸氢盐转化、多重实时PCR和数据分析。

图23:供MMSP分析用的96孔分析盘配置的示例性描绘,所述96孔分析盘装置包括甲基化标准样品S1-S7、甲基化对照物(MC)以及无模板对照物(NC)。

图24:各组A-D的供MMSP分析用的每个目标区域的标准曲线和PCR效率。

图25:基于DNA混合物的相对甲基化百分比值的重复测量,显示16种目标基因的MMSP分析线性度的结果,所述DNA混合物含有100%、50%、5%、1%、0.5%和0%甲基化(M.SssI处理)正常尿液DNA。

图26:MMSP分析法对35种正常尿液样品和9种膀胱癌肿瘤组织的16种生物标记的分析结果,所述生物标记分成四组A、B、C和D。

图27A-27B:使用B组标记和MMSP分析法对膀胱癌复发进行的分析。

图28:反映膀胱癌中的尿液肿瘤标记的敏感性和特异性的表。

图29:在CARE分析中,通过随机森林(Random Forest)来选择RMSE误差最低的一组三个CpG位点。

图30:在MMSP中,通过随机森林来选择RMSE错误最低和次低的一个和两个CpG 位点。

具体实施方式

I.本发明的实施例

癌细胞的甲基化组与正常细胞的甲基化组差异极大。一般来说,癌细胞展现CpG岛甲基化增加,而其它基因组元件(包括转座子)失去其正常的甲基化状况。因此,通过分析癌细胞中特异性甲基化的CpG元件的甲基化状况,可以检测出细胞群中的癌细胞的存在。本文提供用于测定受试者中的基因组甲基化特征的多重方法。这些新技术可供由患者样品高度定量且快速测定甲基化特征的方法用。这些特征继而可以用于确定患者的疾病风险。举例来说,甲基化特征可以单独使用或结合其它诊断性测试使用以确定患者是否患有癌症或评估癌症的侵袭性。此外,甲基化特征可以用于选择针对患有疾病的受试者的最有效疗法。举例来说,所述特征可以用于确定癌症是否可对指定化疗剂有反应,或外科手术除去癌细胞是否可提供有效的治疗和防止复发。

在一些方面中,本发明人鉴别了一组甲基化标记(例如基因组区域),其可以评估甲基化状况以确定受试者是否患有膀胱癌或处于产生膀胱癌的风险中。简单来说,通过使用HM450人类甲基化阵列和RRBS下一代测序法分析来自膀胱癌患者的组织和/或泌尿道的其它癌症(即利用存在于尿液或尿液沉降物中的细胞检测或替代地利用正常样品活检)样品来鉴别癌症特异性甲基化标记。利用线性回归模型选择区分肿瘤和正常样品的最显著甲基化生物标记(图14A-E)。可以通过实施例方法评估的基因组区域(和特定的潜在甲基化位置)列举于下表1A中。供实时qPCR分析法(如MMSP分析法和CARE 分析法)用的实例引物和探针集合(分别)展现于表1B和1C中。

表1A:

*表示在血液中发生甲基化的非癌症标记。

表1B:供MMSP分析法用的实例引物和探针集合。

表1C:供CARE分析法用的实例引物和探针集合。

确切地说,本发明人使用独特的甲基化标记组以及对照物和甲基化敏感性限制酶来产生一种新颖的反应设计,其允许在同一缓冲液中发生多重消化和qPCR反应以检测在特定的CpG二核苷酸处发生的甲基化。在某些方面中,优选这种方法的原因可能在于,其具有无需在高温下用亚硫酸氢钠处理DNA(强烈影响DNA序列且降低DNA在下游实验中的品质的反应)的情况下对CpG甲基化实现分析的巨大优势。

II.试剂和试剂盒

试剂盒可以包含经适当等分的本发明试剂,如葡萄糖基转移酶(例如β-葡萄糖基转移酶)和一种或多种甲基化敏感性DNA核酸内切酶(例如MspI、ClaI、Csp6I、HaeIII、Taq

试剂盒的组分可以包装在水性介质中或以冻干形式包装。试剂盒的容器构件一般将包括至少一个小瓶、试管、烧瓶、瓶子、注射器或其它容器构件,其中可以放置有组分,且优选经适当等分试样。在试剂盒中存在超过一种组分的情况下,试剂盒一般还将含有第二、第三或其它额外容器,其中可分别放置有额外组分。然而,小瓶中可以包含组分的多种组合。本发明的试剂盒还将典型地包括紧密围束包含试剂容器以供商业销售的构件。这类容器可以包括其中保留有所期望小瓶的纸板容器或注塑或吹塑成型的塑料容器。

当试剂盒的组分于一种或多种液态溶液中提供时,液态溶液是水溶液,其中优选无菌水溶液。

然而,试剂盒的组分可以干燥粉末形式提供。当试剂和/或组分以干粉形式提供时,可以通过添加适合的溶剂使粉末复水。设想溶剂还可以在另一容器构件中提供。

在一些方面中,标记的探针可以用于检测和/或定量PCR扩增。可以用于标记核酸探针的多种报告分子已为人所知。直接的报告分子包括荧光团、发色团和放射性基团。荧光团的非限制性实例包括红色荧光方酸染料,如2,4-双[1,3,3-三甲基-2-亚吲哚啉基甲基]环丁烯二鎓-1,3-二乙二酸盐;红外染料,如2,4-双[3,3-二甲基-2-(1H-苯并[e]亚吲哚啉基甲基)]环丁烯二鎓-1,3-二乙二酸盐;或橙色荧光方酸染料,如2,4-双[3,5-二甲基-2-吡咯基] 环丁烯二鎓-1,3-二乙二酸盐。荧光团的其它非限制性实例包括量子点、阿莱克萨氟

III.定义

如本文所用,“甲基化敏感性限制性核酸内切酶”(MSRE)是一种包括CG作为其识别位点的一部分且当C发生甲基化时活性改变(相较于当C未发生甲基化时)的限制性核酸内切酶(例如SmaI)。甲基化敏感性限制核酸内切酶的非限制性实例包括HpaII、 BssHII、BstUI、SacII、EagI和NotI。甲基化敏感性限制性核酸内切酶的“同切点酶”是一种识别与甲基化敏感性限制性核酸内切酶相同的识别位点、但使甲基化CG和未甲基化CG均裂解的限制性核酸内切酶,例如,MspI是HpaII的同切点酶。“限制性核酸内切酶”和“限制酶”在本文中可互换使用。

如本文所用,术语“基因组区域”是指编码特定RNA或多肽且控制其表达的基因组DNA区域(如外显子编码序列、插入型内含子和相关表达控制序列)和其侧接序列或所关注的其它基因组区域(例如基因组DNA的重复元件或重复区域,如分散或散置的逆转录元件SINES;LINES;以及其它这类元件)。因此,在一些方面中,基因组区域通过编码表1中所列的基因组区域的区域来定义。然而,所属领域中知道,特定区域(例如指定的CpG位置或扩增区间)中的甲基化通常指示邻近基因组位点的甲基化状况。对于调节元件(如CpG岛)来说,这尤其是真的。因此,测定特定基因组区域的甲基化状况可以包含测定约100kb、50kb或25kb的指定基因组区域内的位点的甲基化状况。因此,在一些方面中,评估基因组区域(如表1中的基因组区域)中的甲基化包含评估表1中所列的潜在甲基化位置的100kb、50kb或25kb(或优选10kb)内的一个或多个潜在甲基化位点的甲基化。

如本文所用,术语“基因组扩增区间”是指可以通过PCR扩增的基因组DNA区域。如本文所用,扩增区间包含至少一个作为潜在甲基化位点的CpG位置。在一些情况下,扩增区间包含2、3、4个或更多个潜在的CpG甲基化位点(例如其中CpG存在于MSE 所识别的序列中)。一般来说,扩增区间小于约1,200bp,如在约50bp与100、200、300、 400或500bp之间。在某些方面中,扩增区间是130bp或更小。

如本文所用,对于指定的基因组区域来说,“测定甲基化状况”意指测定基因组DNA区域中的多个位置之一是否发生甲基化。因此,在某些方面中,测定基因组区域的甲基化状况包含测定至少1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、 50个或更多个潜在的DNA甲基化位点的甲基化状况。在其他方面中,测定甲基化状况意指测定差异性甲基化区域(DMR,例如约1-10bp、10-100bp、100-200bp、100-1,000 bp窗口或更大的窗口)中的一个或多个甲基化位点的甲基化状况。

IV.实例

以下实例是为了展现本发明的优选实施例而包括在内。所述领域的技术人员应了解,以下实例中所公开的技术代表了本发明人所发现的在实施本发明时充分发挥作用的技术且因此可以视为构成其优选实施方式。然而,所属领域的技术人员根据本发明应该了解,可以在不背离本发明精神和范围的情况下对所公开的特定实施例作出许多变更且仍获得相同或类似结果。

实例1-使用限制性核酸内切酶消化和实时PCR来分析甲基化

分析系统所基于的原理是,一些限制酶只有当C未甲基化时才可以切割含有CG二核苷酸的序列(图1A-B)。

标记设计-鉴别膀胱癌中发生甲基化的一组39个基因组区域(参见下表1)且选用于进一步分析。许多所选标记仍未注释(即,与CpG岛相关的基因仍是未知的;指名的未知(Unk)#)。下表2中包括若干个对照区域。LINE-1对照物由本发明人设计且在正常组织中高度甲基化,而在癌症中较少发生甲基化。GAPDH对照物由本发明人设计,以充当消化效率的测定手段。其CpG岛在所有正常和癌组织中均未发生甲基化。POLR2A 对照标记也由本发明人设计且其不含有任何限制位点,因此其是拷贝数对照物(用于测定每个反应中所用的模板的量)。其它LINE-1对照物可以用作拷贝数对照物(扩增子不含有任何限制位点)。这种对照物将使LINE-1元件在人类基因组中扩增约16,500个拷贝,规避了影响单拷贝拷贝数对照物的缺失将消弱分析的问题。LINE-1用作拷贝数标记的用途尚未得到证实且本发明人已经使用POLR2A对照物。

表2:膀胱癌样品(组织、尿液和细胞系)中在特定CG位点发生甲基化的基因组区域。区域22、42和43是甲基化对照区域。GAPDH=消化对照物;含有若干个限制位点;始终未发生甲基化。POLRA=拷贝数对照物;不含有任何限制位点(对消化不敏感)。

*标记#22在血液中发生甲基化,但在膀胱癌中未发生甲基化;在优选方面中,使用GALR1(#15)标记,而非使用GALR1(#08)。

MSRE qPCR设计-选择四种不同的甲基化敏感性限制核酸内切酶(AciI、HpyCH4IV、HinP1l和Hpall)。每种限制性核酸内切酶是一种四碱基切割酶,其只有当目标CpG二核苷酸中的胞嘧啶未甲基化时才能够切割限制位点。为了含有四种不同限制核酸内切酶中的至少三种的一个或多个识别位点,设计所有扩增子(包括引物序列)。这确保了消化的高度可靠性(靶向相同扩增子内的多个限制位点,但足以切割仅一个位点以消弱下一步骤中的DNA扩增)且使DNA序列中的较小变化(例如SNP)可能导致假阳性的可能性降低。

此外,扩增子长度范围是70bp到158bp且所有引物经设计和检验以具有90%与110%之间的效率和60℃的粘接温度。这些是qPCR数据可靠性以及qPCR条件标准化的前提条件。

消化条件-所有限制核酸内切酶均购自新英格兰生物实验室(New EnglandBiolabs)且混合在一起,得到储备溶液,其中每种酶的最终浓度是2.5U/μl。消化反应溶液如下制备:CutSmart 1X、核酸内切酶混合物0.125U/μl、模板5或2.5ng/μl;MgCl

qPCR反应条件-使用BioRad CFX机器进行实时反应。初始试验证明模板的完全变性是qPCR反应的关键步骤。对于富含甲基化CpG的模板来说,这尤其是真的,所述富含甲基化CpG的模板比非甲基化DNA稍微更难以变性(例如参见图12)。这个问题 (其量值对于不同标记来说是不同的,参见图12)是通过向qPCR反应物中添加最终浓度为5%的DMSO和将变性温度从95℃提高到97℃(注意到这是不会降低ZymoTaq

本发明人还验证了进行多重反应而不降低扩增效率的可能性。图2描绘了可以在同一反应中对多达5种标记进行多重分析而不影响总体PCR效率(相较于进行多重反应时的色带强度,注意到了凝胶左侧的单重单一标记色带的强度)。

根据下式制备PCR反应溶液:ZymoTaq预混物(2X),10μl;正向引物,0.4μM(最终浓度);反向引物,0.4μM(最终浓度);模板,10ng(2μl消化反应);DMSO,5% (最终浓度);以及双蒸水直至20μl。在CFX BioRad qPCR机器上,根据热曲线进行扩增反应:97℃维持2分钟;然后进行四十五个以下循环:95℃维持20秒、60℃维持30 秒,且在72℃下最终延伸1分钟(新条件是60℃维持一分钟,从而避免在72℃下进行的延长步骤)。然后通过荧光测量对所有扩增进行解链曲线分析,以确保特异性扩增和一致性。解链曲线是60℃到97℃。然后在15℃下储存扩增子。

由于单步骤反应大幅度降低了所述方法对一些标记的灵敏度(图3),因此消化和qPCR反应在单独的试管中进行(两步)。当将酶混合物添加至含有模板的qPCR混合物中时,观察到一些标记的扩增效率大幅度降低。由于在单步反应与两步反应之间, POLR2A对照标记的扩增是类似的,因此这种大幅度降低不是由消化效率的变化引起,也不是由聚合酶活性的变化引起。

使用MSRE qPCR方法测试表2中所列的所有标记(包括LINE-1和DPM2对照物),以检验其在癌症中的甲基化状况。使用获自血液、LD583膀胱癌细胞系和正常尿液(来自非癌症个体)的未消化和已消化基因组DNA如此进行qPCR反应。所有样品均相对于未消化的血液gDNA(参考样品;被视为100%)进行标准化且根据反应中所装载的模板的量(这使用POLR2A对照标记测定)校正数值。使用GAPDH对照标记测定消化效率。结果描绘于图4-9中。

优选的标记是在血液和正常尿液gDNA中不展现任何甲基化而在癌细胞系DNA中100%甲基化的标记。根据此分析,将血液或正常尿液DNA中小于2%甲基化的标记再分成三类(参见下表3)。

表3.A类-正常血液和尿液中的甲基化水平<1%,LD583膀胱癌细胞系中的甲基化水平>70%;B类-正常血液和尿液中的甲基化水平<1%,LD583膀胱癌细胞系中的甲基化水平>50%、<70%;C类-正常血液和尿液中的甲基化水平>1%、<2%,LD583 膀胱癌细胞系中的甲基化水平>70%。

血液已知是主要的尿液污染物,然而精子也可能会污染尿液样品。因此,也使用精子DNA来测试表3中的21种以上所验证的所有标记的甲基化水平。结果证实精子DNA 中的所有21种标记均未发生甲基化(<1%)。

另外,对于表3中的属于A类和B类的16种标记来说,测定MSRE qPCR系统的甲基化检测极限且从而测定可以视为高于背景信号的最低扩增值(背景是在未发生甲基化的已消化正常尿液gDNA中测定;例如参见图3)。一般来说,所有16种标记的背景信号均低于0.25%。此值因此被视为低置信度背景极限,因此甲基化信号高于0.25%的已消化样品假定视为阳性。为了增强MSRE qPCR系统的可靠性,本发明人将置信度极限提高到1%且将此值视为高置信度背景极限。值高于1%的样品视为真阳性。对于癌症来说,值在0.5与1%之间的样品视为低置信度阳性,而甲基化水平高于1%的消化样品视为高置信度阳性。

实例2-使用示例性标记的人类样品分析

使用表3中所列的A类和B类标记,对来自膀胱癌肿瘤患者的临床试验尿液样品和正常(非癌症)尿液样品进行分析。通过与相同但未消化的样品的信号(100%)比较来计算针对特定消化样品所检测的信号%(在实例1中,相较于未消化的血液样品的信号来计算所有信号)(例如图13)。

已消化临床样品中的甲基化信号与相同的未消化样品的比较描绘于图10中。基于MSRE数据的不知情患者状况分类描绘于图11中。结果表明,13名患者中有4名呈现为健康(用绿色标记),而有5名最可能在各个阶段产生癌症(用红色标记)。其它四名患者对于癌症呈低置信度的阳性(边缘型病例,用橙色标记)。

标记01、16和04(参见图10中的红色箭头)在正常尿液中展现的背景(尽管<1%;红色圆圈)高于其它标记。最终临床样品分类(图11)不考虑这三种标记的值。

实例3-使用增强型CARE分析法分析甲基化

进一步研发出实例1的分析法以增强其总体表现,包括灵敏度、简单性和检测极限。首先,进一步分析甲基化水平在LD583膀胱癌细胞系中为至少50%且在正常尿液、血液和精子样品中通常低于1%的16种癌症标记组(表4),以获得可验证临床样品的12种标记组。

表4:可以将膀胱癌(LD583膀胱癌细胞系)与正常样品(从健康个体收集的血液和尿液)充分区分开来的16种生物标记的清单。

利用实例1的分析法来分析从年龄、性别和种族不同的个体所收集的一小组正常尿液DNA样品(n=9)。如表5中所示,所有9种样品归类为膀胱癌阴性。尽管存在群组极小的事实,但是甲基化背景水平的显著差异与年龄、性别或种族无关。

表5:利用第一版CARE分析法来分析从9名健康个体收集的DNA尿液样品。第一栏指示样品代码,而第一行中列出标记。指明每个样品的年龄(岁)、性别和种族。 GAPDH表示消化对照物。白色指示甲基化水平<0.25%;灰色指示>0.25%,但<1%;黑色指示>1%。使用两次技术性重复操作来进行实验。

此外,结果还指出四种标记(表5中最右侧的四种标记)的背景水平提高。具体地说,标记#04在大部分样品中的甲基化水平>1%(直到4%),而标记#01在九个样品中的四个中具有升高的背景。与相关恶性病(包括结肠直肠癌、前列腺癌、胰脏癌、乳癌和卵巢癌)相关的标记#16(SEPT9)和#32(EEF1A2)在几个、但不是所有的样品中还具有高背景。然而,令人感兴趣的是这两种标记的背景水平就样品图案和量值来说非常类似。应注意,通过基于DNA亚硫酸氢盐转化的并行实验、而非CARE分析法来证实样品#03和#05中的SEPT9甲基化水平。这种类似性可能表示这些样品中的甲基化水平提高并非归因于技术问题(例如不完全消化),而是在一些样品中产生特异性地升高。这表明,这两种标记的甲基化的稍微增加可能不是随机的且可能是指示或预测了特定的临床状况(即,产生特定临床病状的风险)。因此,标记#32保留在标记组中。相反,标记#04、#01和#16不考虑用于进一步验证实验,从而将膀胱癌生物标记组减少到13个基因座。

接下来,使用一小组(n=10+10)膀胱癌样品和其相应调整的正常组织(在去除肿瘤时连同肿瘤一起分离的非癌症膀胱组织)测试所选的13种膀胱癌生物标记(表6)。 13种癌症生物标记在肿瘤样品中的总体甲基化水平显著高于经调整的正常样品。10个肿瘤样品中有7个具有显著甲基化的所有13种标记(>1%)。一些标记(具体地说,#27、 #36和#30)在经调整的正常样品中也具有高度甲基化。

表6:使用CARE分析法分析从10个膀胱癌组织和其相应调整的正常样品中提取的DNA(后者用斜体表示)。第一栏指示样品代码,而第一行中列出标记。如同表5,每个生物标记和样品值用消化之后存在的甲基化百分比表示。GAPDH表示消化对照物。白色指示甲基化水平<0.25%;灰色指示>0.25%,但<1%;黑色指示>1%。使用两次技术性重复操作来进行实验。

利用此分析所产生的数据对每种单一标记评分;具体地说,评估每种标记A)识别膀胱恶性疾病的能力;这种参数是作为被特定标记识别为阳性(甲基化水平>1%)的肿瘤样品的数目来确定。每种癌症特异性标记在所有肿瘤样品中应该发生显著的甲基化; B)相较于相同样品中的所有标记之间的平均甲基化水平,特定标记在特定肿瘤样品中的甲基化水平(希望癌症样品中的甲基化水平较高);C)未被识别为正常样品的经调整的正常样品的数目;此后一参数被认为重要的原因在于,与血液或正常尿液相反,经调整的正常样品预期展现膀胱癌标记甲基化水平的增加,因为其是通常含有倾向于产生癌症的细胞的组织样品,一种称为“场效应”的现象(例如Giovannucci和Ogino,2005; Bernstein等人,2007);因此预期经调整的正常样品的甲基化组在某种程度上发生变化。理由是良好的癌症标记应该能检测出这些差异。基于这些标准将13种标记分类成三类标记集合(A、B和C;表7)。集合A和B含有对照物和很可能包括于最终标记集合中的标记,而集合C包括所有其它标记。应注意,标记#23作为癌症标记展现不良的表现 (相较于其它标记,在许多肿瘤样品中的甲基化水平较低),因此其不包括于任何集合中。因此,标记组含有12种生物标记。

表7:基于表6呈现的实验中所得的结果,将12种所选生物标记(每个集合的右侧一栏)分成三个集合。集合A和B含有表现最佳的标记和两种内部对照物POLR2A和 GAPDH(用灰色方框指示),而集合C含有所有其它标记。

使用从正常尿液样品中分离出的DNA进一步验证新的一组三个集合中所包括的所有标记(表7),所述正常尿液样品从更大群组(n=31)中收集。这个实验证实了已于表5中呈现的数据且发现除标记#32之外的所有标记的甲基化背景较低(在一些样品中发现其升高)。

在另一个实验中,测试所选生物标记组是否可以用于鉴别不同类型的恶性病。为此目的,分析从膀胱、前列腺、子宫内膜和肾脏肿瘤和其相应调整的正常样品中提取的DNA。此外,分析中还包括一个从健康个体中分离出的膀胱样品(作为阴性对照)和三个多发性骨髓瘤样品(HA、MM1.S和CRF30)。

表8:从不同癌症样品(TU)、其相应调整的正常样品(AN)和三个不同多发性骨髓瘤样品(HA、MM1.S和CRF30)中提取的DNA的CARE分析。分析中包括了健康膀胱对照物。第一栏中列出了样品,而第一行中指示了标记。每个生物标记和样品的值用消化之后存在的甲基化百分比表示。GAPDH表示内部消化对照物。白色指示甲基化水平<0.25%;灰色指示>0.25%,但<1%;黑色指示>1%。使用两次技术性重复操作来进行实验。

尽管使用了较小群组,但是结果清楚地证明,集合A、B和C中所列的许多生物标记在不同类型的癌症(包括膀胱、前列腺、子宫内膜和多发性骨髓瘤肿瘤)中发生严重甲基化。惊人的是,在肾癌中未检测到甲基化增加。正如所预期,在从健康膀胱分离出的DNA中,未发现标记发生显著甲基化(甲基化水平>1%)。仅使用尿液样品还可以潜在地检测到其它不同类型的癌症。

除上述试验之外,还进行临床前研究,其中使用增强型CARE分析法分析一小组63个尿液样品。如表9中所示,此组包括从具有不同年龄、性别和关于膀胱癌发展的风险行为的健康个体中收集的20个样品(“正常样品”)(所述群组实际上包括四位年轻的吸烟者个体-<55岁-)。所述群组的其余样品(n=43;“癌症样品”)代表了从患有膀胱癌和其它类型肿瘤的个体中收集的样品;具体地说,33个样品是从在癌症去除之前受膀胱癌影响的个人中收集(“手术之前的膀胱癌”),8个样品是从最近接受膀胱肿瘤去除的个体中收集(“手术之后的膀胱癌”)且其它2个样品(统称为“非膀胱癌”)是从分别受胃癌和结肠腺癌影响的个体#48N和#34S中收集。

表9:从尿液样品中提取的DNA的CARE分析,所述尿液样品从20位健康个体(正常样品;在表的上部部分中指示)和43位受癌症影响的患者(癌症样品)中收集。第一栏指示子组描述(YO=岁),而第二栏中列出了样品代码。第一行中指示了标记。分析中包括了血液样品对照物(第二行),而GAPDH代表了内部消化对照物。白色指示甲基化水平<0.25%;灰色指示>0.25%,但<1%;黑色指示>1%。使用两次技术性重复操作来进行实验。

基于从这种分析中获得的数据,#05、#36和#09标记组具有最高的诊断值,因此其用于统计学癌症诊断模型中,所述模型使用广义线性模型构建。这种模型仅基于利用CARE分析法获得的数据将群体分类为膀胱癌阳性或阴性。群组中的3/4和1/4(只考虑 20种正常样品和33种膀胱癌样品)分别用作训练集合和测试集合且结果呈现于表10中。结果表明,增强型CARE分析法能够正确地对大部分测试集样品(85.71%的对照样品和 100%的膀胱癌样品)进行分类。另外,对于测试集来说,增强型CARE分析法具有100%的灵敏度和85.71%的特异性。

还令人感兴趣的是注意到,“手术之后的膀胱癌样品”样品中的大部分通过CARE分析法诊断为阳性(表9)。这种令人非常感兴趣的数据支持了“场效应”概念且与表6中呈现的此前数据一致,其中使用CARE分析法发现经调整的正常组织样品中的大部分呈阳性。然而,此时不明确暴露于癌症环境是否还能够触发存在于肿瘤附近的正常细胞发生表观遗传变化。因此,定期收集接受膀胱肿瘤去除的患者的尿液且使用CARE分析法分析,以监测膀胱癌生物标记的甲基化水平随时间发生的演变。

表10:受膀胱癌影响或不受膀胱癌影响的53位个体组的统计分析。所述分析是基于使用CARE分析法针对标记#05、#36和#09所检测的甲基化值。所述群体随机地再分成训练集(3/4)和测试集(1/4)且计算每个集合和整个群组的灵敏度%{[TP/(TP+FN)] *100}、特异性%{[TN/(TN+FP)]*100}、阳性预测值%{[TP/(TP+FP)]*100}以及阴性预测值%{[TN/(TN+FN)]*100}。

另一个令人感兴趣的结果是结肠腺癌尿液样品(男性个体)在CARE分析中明显呈阳性。这可能归因于转移存在于膀胱中,或再次归因于“场效应”现象(倘若解剖学上靠近结肠和膀胱)。第二个这种假设进一步受到如下事实的支持:通过CARE分析法发现胃癌尿液样品(#48N;在解剖学上远离膀胱)呈阴性。

关于正常尿液组,除年龄大于55岁(M>55YO)外的健康男性亚群之外,不同样品之间未观察到较大差异;在此组中,四位个体中有三位个体的生物标记经CARE分析法测试有至少一半出现甲基化背景稍微升高(通常<1%)。应注意,老龄化是膀胱癌发展的主要风险因素之一且男性群体(尤其是白种人)是比女性更受此病理学影响。CARE 分析法能够检测到正常群组中的老年男性子组的甲基化稍微增加,这表明CARE分析可以将产生膀胱癌风险更大的个体与不产生膀胱癌的个体区分开来。就这种观点而言,其可能还与如下事实相关:年龄大于55年的四位女性之一(F>55YO)还出现六种生物标记的甲基化水平升高,而属于同一子组的其它三位个体的膀胱癌标记甲基化特征类似于较年轻个体中所发现的甲基化特征。应注意,使用增强型CARE分析法,所有四位年轻的吸烟者个体归类为阴性。

总之,增强型CARE分析法能够正确地对测试集群组中所包括的大部分正常和膀胱癌样品进行分类且分别具有100%和85.71%的灵敏度和特异性(表9和表10)。另外,所述分析法检测到从一位受结肠腺癌影响个体中收集的尿液样品呈阳性,这表明CARE 分析法具有使用尿液样品检测非泌尿道癌症的潜力。此外,所述分析能够在属于健康群组(与膀胱癌发展有关的风险群体)的老年男性(>55岁)组中检测到生物标记甲基化的稍微增加;这表明增强型CARE分析法可能代表着一种潜在令人感兴趣的工具,其不仅用于膀胱癌复发诊断,而且用于充分确定首次出现膀胱癌风险较高的亚群。

实例4-增强型CARE分析方法

实例3的增强型CARE分析法相较于实例1的分析法具有若干项改进。首先,增强型CARE分析法中的反应缓冲液与消化和qPCR步骤均相容。因此,操作者需要执行的唯一手动步骤是将适量的模板(5-10ng)添加到反应缓冲液中。混合之后,在自动执行消化和qPCR步骤的qPCR机器中培育反应物。这种新的缓冲液允许在30℃下在培育仅 2小时内完全消化。反应混合物含有两个步骤所必需的所有组分,包括Taq聚合酶、限制酶混合物、脱氧核糖核苷酸、DNA引物和探针、镁、添加剂(例如DMSO)和盐,且确定每种组分的最佳浓度以便使CARE分析性能在准确度、灵敏度和特异性方面最大化。使用ZymoTaq

另外,增强型CARE分析法允许在单一反应中对多达5种生物标记进行多重且同时的分析。因此将存在于集合A、B和C(上文所述)中的所有12种膀胱癌生物标记和两种内部对照物按照三种多重反应分组(每种集合一组;参见表11)。检视每种扩增子且专门设计新引物和双重标记的TaqMan探针以便最大化CARE分析法的稳定性和系统的总体性能。对于每种标记来说,扩增效率范围在90%与110%之间且当单重和多重反应既不并行操作时,消化和qPCR步骤又不在一个机器中进行而是在两个单独步骤中进行时(在热循环仪或培育箱中进行消化且在实时PCR机器中进行qPCR),未能观察到显著差异(在扩增效率和背景水平方面)。重要的是,引物和探针是在缺乏任何经注释的 SNP和重复元件的序列上设计。尽管qPCR步骤可以潜在地使用不同方法和实时机器,但是我们通过将TaqMan方法与CFX96TM实时系统(Bio Rad)组合来获得最佳结果。在新的CARE分析形式中,双重标记的TaqMan探针用FAM、HEX、德克萨斯红-X、 Cy5和Quasar 705标记且用BHQ1或BHQ2分子淬灭。然而,其它染料,如生物研究蓝 (Biosearch Blue)、TET、卡尔氟金540(CAL Fluor Gold 540)、JOE、VIC、卡尔氟橙560 (CAL Fluor Orange 560)、Quasar 570、Cy3、NED、TAMRA、卡尔氟红590、Cy3.5、 ROX、卡尔氟红610、德克萨斯红、卡尔氟红636、Pulsar 650、Quasar 670、Cy5.5、TEX615、TYE 563、TYE 665、MAX、雅基马黄(Yakima Yellow)、ABI和JUN和不同淬灭剂,如TAMRA、QSY、BHQ2、BHQ3、爱荷华黑(Iowa Black),可以成功地用于qPCR 步骤。其它系统变异体,如分子信标和蝎子探针,也可以成功地用于qPCR步骤。

表11:存在于集合A、B和C中的生物标记(每种集合的右栏)经多重分析。每种多重反应能够同时扩增多达5种标记。集合A和B含有表现最佳的标记和两种内部对照物POLR2A和GAPDH(用灰色方框指示),而集合C含有所有其它标记。每种标记所用的染料和淬灭剂指示于每个集合的右栏中。Q705=Quasar 705,TR=德克萨斯红,BHQ=黑洞淬灭剂。

增强型CARE分析法中得到的第三项重要改进是针对每种扩增子所研究的限制位点数目增加。新设计的扩增子含有至少6个不同限制位点,这些限制位点至少被选用于这种分析法的三种限制核酸内切酶(AciI、HinP1l和HpaII)中的两种所靶向。此与新反应混合物的新颖化学性质组合,确保了在2小时内完全消化(表13)且使导致假象和非特异性背景信号的风险最小化。

另外,所有寡核苷酸(引物和探针)序列皆不含有前述限制核酸内切酶的共同基元;这似乎阻止了寡核苷酸在消化反应期间的降解(尽管非常少),所述降解潜在地由与其它DNA分子发生的暂时且可能仅部分的特异性相互作用引起,所述特异性相互作用可能在消化温度(30℃)下发生。

若干种其它限制酶,包括AatII、Acc65I、AccI、AciI、AclI、AfeI、AgeI、AhdI、AleI、ApaI、ApaLI、ApeKI、AscI、AsiSI、AvaI、AvaII、BaeI、BanI、BbvCI、BceAI、 BcgI、BcoDI、BfuAI、BfuCI、BglI、BmgBI、BsaAI、BsaBI、BsaHI、BsaI、BseYI、 BsiEI、BsiWI、BslI、BsmAI、BsmBI、BsmFI、BspDI、BspEI、BsrBI、BsrFI、BssHII、 BssKI、BstAPI、BstBI、BstUI、BstZ17I、BtgZI、Cac8I、ClaI、DpnI、DraIII、DrdI、 EaeI、EagI、EarI、EciI、Eco53kI、EcoRI、EcoRV、FauI、Fnu4HI、FokI、FseI、FspI、 HaeII、HgaI、HhaI、HincII、HinfI、HinP1I、HpaI、HpaII、Hpy166II、Hpy188III、Hpy99I、 HpyAV、HpyCH4IV、KasI、MboI、MluI、MmeI、MspA1I、MwoI、NaeI、NarI、NciI、 NgoMIV、NheI、NlaIV、NotI、NruI、Nt。BbvCI、Nt。BsmAI、Nt。CviPII、PaeR7I、 PhoI、PleI、PluTI、PmeI、PmlI、PshAI、PspOMI、PspXI、PvuI、RsaI、RsrII、SacII、SalI、Sau3AI、Sau96I、ScrFI、SfaNI、SfiI、SfoI、SgrAI、SmaI、SnaBI、StyD4I、TfiI、 TliI、TseI、TspMI、XhoI、XmaI、ZraI,原则上可以用于CARE分析法。

对照物:增强型CARE分析中的另一种核心组分由对照物表示。实际CARE分析形式涵盖4种不同对照物:A)内源性拷贝数对照物(POLR2A)、B)内源性消化对照物 (GAPDH)、C)未消化的样品对照物和D)外源性消化对照物(标准化血液样品)。应注意,CARE分析法所用的对照物并非在活体外操控(例如化学或酶修饰),从而以那种方式减少了引入假象和误差的机会。

内源性拷贝数对照物-POLR2A:分析可靠性的一个点是是从每种标记中获得的信号相对于每个反应中所装载的DNA样品的量标准化。不同反应中所装载的模板的量的微小差异在qPCR中是常见且如果未对其进行监测,那么其可能影响分析结果。因此,需要使用内部拷贝数对照物,其允许精确地定量每个反应中所用的模板的量且校正从分析中获得的值。选择人类POLR2A基因的编码序列的一部分作为拷贝数对照物。作出那种选择的原因是A)POLR2A是必需的基因,因此始终检测控制信号;B)这种对照标记是单拷贝基因且其在多重qPCR中的使用不会干扰其它标记的扩增(如使用多拷贝标记(如可转座元件)所可以发生的);C)所选序列不含有分析法中所用的任一种限制核酸内切酶的靶点,因此拷贝数对照物的信号将独立于样品被消化与否的事实,始终反映所用DNA的量。原则上,满足上列三点的每个基因座可以成功地用作内源性拷贝数对照物。

内源性消化对照物-GAPDH:CARE分析可靠性的另一个点是达成完全的酶消化。原则上,特定基因座内的单一裂解事件足以阻止相关目标区域的扩增。尽管如此,如先前所述,仍然设计扩增子以便包括至少6个限制位点,所属限制位点被分析法中所用的三种限制核酸内切酶中的至少两种识别。这种设计与新反应混合物组成的组合允许达成最大的特异性酶活性且大幅度降低不完全消化的可能性。然而,通过在最终CARE分析法中包括内源性消化对照物来监测每个反应的消化完全。这由DNA基因座表示,所述 DNA基因座是A)细胞存活所必需的;B)含有CARE分析法中所用的全部三种酶的多个限制位点和C)在任何类型的细胞和组织中始终未甲基化。在人类GAPDH基因的CpG 岛上设计内部消化对照物;这种管家基因在糖酵解中具有基本的作用且作为基因表达分析的拷贝数对照物广泛地用于RT-qPCR反应和免疫印迹中,原因是其在所有细胞类型中的表达始终处于几乎恒定的水平。在CARE分析法所测试的所有消化样品(多种试样,包括生物学流体、组织和细胞类型)中,GAPDH信号始终低于最大可接受的背景水平 (1%)且在大部分病例中,其根本检测不到(例如表5中)。另外,在这种情况下,满足前述三点的基因座可以用作内源性消化对照物;可以在基因ATP5C1、TBP、GARS、LDHA 和PGK1的CpG岛上设计所有可能的替代内源性消化对照基因座。

未消化的样品对照物:这种对照物由以下组成:经恰当处理的DNA样品,如将进行消化、但不添加限制核酸内切酶混合物的样品。因此,在这种样品中,DNA将保持完整且最初添加到反应物中的所有标记拷贝将适合于扩增。此样品中的每种标记的放大信号因此可以被视为100%,且相应地计算并行消化样品中所检测的甲基化(未切割)标记的百分比。首先,使用从健康血液供者中分离的DNA样品作为未消化的样品对照物。然而,为了使这个标准样品与尿液DNA样品之间可能存在的可能差异最小化,针对将用CARE分析法分析的每个尿液样品进行未消化的反应(与消化反应并行操作)。于是,最终分析因此将包括供每种标记集合用的两种不同预混合反应溶液,称为D和U;仅反应溶液D(而非U)将含有消化步骤所需的限制核酸酶混合物。一般来说,推断出的结论是,针对每个单一样品操作未消化的对照物代表着精确定量每种标记在每个样品中的甲基化水平的量的最可靠方式。

为了进一步提高分析的精确度,包括以血液DNA的标准化样品为代表的第二消化对照物。现行分析法中所包括的所有癌症标记在血液DNA中均未(或仅仅是微弱地) 甲基化的事实(表12)可以检测到在消化步骤期间可能发生的潜在问题且所述潜在问题列举如下:

A)不同标记通过限制核酸内切酶的不同组合来裂解(一些标记是通过所有三种酶来裂解,一些其它标记仅通过两种酶来裂解);此外,询问不同标记中的CpG二核苷酸的不同数目(范围为6到12个)。因此,尽管是足够的,但是仅使用GAPDH对照标记评估消化效率是不精确的(所有3种限制核酸内切酶靶向GAPDH基因座的6个不同位点)。在三种酶中只有一种具有完全活性的极不可能情形中,GAPDH对照物完全被消化,而仅被其它两种酶靶向的癌症标记仅部分地被消化。这将引起一些癌症标记甲基化状况出现不真实的增加,从而产生可能的假阳性情形。E.D.C.对照物中的一些癌症标记出现的甲基化异常增加立即使操作者大致知悉此情形

B)此外,如果观察到特定样品中的甲基化背景水平(包括GAPDH内源性消化对照物)出现一般性增加,那么不可能知道(在E.D.C.缺乏的情况下)这是否由限制酶的活性降低而引起(在这种情况下,反应混合物需要用新批料替换)或由DNA样品的不良品质引起(在这个第二种情况下,样品需要提纯)。由于外源性消化对照物具有标准的品质且这个样品中的所有标记未甲基化,因此外源性消化对照物中的所有标记的背景水平提高均清楚地表明,存在于反应混合物中的限制酶的酶活性被削弱且混合物必须用新批料置换。

表12:CARE分析法对外源性消化对照物(标准化血液DNA)的分析。标记列举于第一栏中。每种标记的值用消化之后存在的甲基化百分比表示。GAPDH表示内部消化对照物。超过0.25%(低置信度背景极限)的值用灰色指示。使用三次技术性重复操作来进行实验。

除前述四种对照物之外,收集信息以在进行DNA提取之前监测尿液样品的不同生物化学参数。主要理由是确定特定条件(例如尿液中存在的蛋白质和酮增加、尿液pH 值等)对CARE分析性能的可能影响。其次,其它参数或许可以支持CARE分析诊断。

使用

CARE分析法的最显著特征之一在于高性能(就稳定性、检测极限、灵敏度和准确度而言)与极其简单性和通用性之间的组合。确实,基于迄今获得的数据,CARE分析法具有100%的灵敏度和85.71%的特异性(表11)。另外,CARE分析法具有显著低的检测极限;其确实能够在含有超过1500个细胞的样品中可信赖地检测出少于7个癌细胞(如图17所示)。

另一方面,CARE分析法非常简单、快速且对使用者友好。整个分析(包括消化、qPCR步骤和数据分析)可以在不到5小时内进行。针对每种标记集合,提供两种预混合反应溶液(D和U)和外源性消化对照样品(E.D.C.)(图18)。两种反应混合物均含有执行qPCR步骤所需要的所有组分,但只有反应溶液D(而非U)含有消化步骤所需限制核酸酶混合物。因此,使用者仅须将5到10ng样品DNA(或E.D.C.样品)添加到 15μl的每种反应溶液中且使用试剂盒中所提供的DNA稀释剂缓冲液将体积调节到20 μl。混合之后,反应物直接在CFX96TM实时系统机器(Bio Rad)中培育,所述机器在不到4小时内执行消化和qPCR步骤以及数据分析(在30℃下仅培育2小时之后便可以实现完全消化;参见表13)。

表13:来自反应的CARE分析结果,其中将正常尿液样品在CFX96TM实时系统机器中、在30℃下培育0、2、4、8和16小时,随后启动qPCR步骤。培育仅2小时之后便实现完全消化(背景<1%)。为了实用性,仅分析属于集合A的标记。每种标记的值用消化之后的甲基化百分比表示,例外的是POLR2A用平均CT值表示。使用三次技术性重复操作来进行实验。

测试两种反应混合物D和U的稳定性且发现在-20℃下稳定数月。此外,10个解冻 /冷冻循环不改变反应性能(表14)。

表14:使用解冻和冷冻多次的反应混合物D和U进行的CARE分析。未检测到背景显著增加(消化活性减弱)或扩增效率降低(Taq聚合酶活性减弱;可通过比较内部拷贝数对照物POLR2A的CT值来观察)。No Tw-Fz=反应混合物未进行解冻-冷冻循环;5X Tw-Fz=反应混合物解冻且冷冻5次;10X Tw-Fz=反应混合物解冻且冷冻10次。每种标记的值用消化之后的甲基化百分比表示,例外的是POLR2A用平均CT值表示。

使用三次技术性重复操作来进行实验。

为了获得上述CARE分析性能,尿液DNA品质(就纯度和完整性而言)应该高足以保证在消化和qPCR步骤期间分别发生的有效消化和扩增。因此,收集尿液之后立即添加防腐剂(UCBTM,兹莫研究公司(Zymo Research)),以便在DNA分离步骤之前防止核酸降解。注意到,当使用Quick-DNATM尿液试剂盒(兹莫研究公司)分离DNA (表15)时,在长期良好地保持样品中的DNA完整性的同时添加UCBTM(表15)不干扰CARE分析性能。

表15:使用从新鲜尿液(无UCB)和从用UCB储存一周(UCB 7天)或一个月(UCB 30天)的尿液中提取的DNA进行的CARE分析(标记集合A)。这个实验所必需的尿液来源于单一个体的单次捐献。不同样品之间未观察到甲基化背景或扩增潜力(POLR2A CT值)有实质性变化。每种标记的值用消化之后的甲基化百分比表示,例外的是POLR2A 用平均CT值表示。使用三次技术性重复操作来进行实验。

如前所提及,DNA品质可能代表着CARE分析法成功分析的关键前提条件。因此,决定测试不同的尿液DNA分离试剂盒是否同样能够提供品质足以执行CARE分析的 DNA。在提取之前的2小时,使用单一尿液样品并行测试三种试剂盒(Quick-DNATM 尿液试剂盒-兹莫研究公司、供应商QI和供应商NG)(表16)。当使用不同试剂盒分离 DNA时,既未观察到所回收的DNA的总量(使用FemtoTM人类DNA定量试剂盒(兹莫研究公司)定量DNA;数据未示出)出现实质性差异,也未观察到DNA扩增潜力(POLR2A内部对照物在不同CARE反应中的CT平均值非常相似;表16)出现实质性差异。然而惊人的是,使用供应商NG的试剂盒所分离的DNA的品质不足以获得良好的CARE分析性能。具体地说,对于内部消化对照物GAPDH和标记#27而言,甲基化背景水平高于置信度上限(1%)。此外,这个问题在添加有UCBTM的样品中更明显(表16)。这表明虽然用不同试剂盒分离的DNA品质足以供qPCR步骤用,但是对于消化步骤而言,未必如此。因此,推断出的结论是,极高的DNA品质是成功CARE分析的前提条件。

表16:CARE分析与上游样品操控的相容性。虽然所有三种试剂盒均能够以适于qPCR的品质(内部拷贝数对照物的CT值非常相似)分离出尿液DNA,但只有 Quick-DNATM尿液试剂盒(兹莫研究公司)和供应商QI分离的DNA适用于CARE分析法(消化和qPCR步骤)。用供应商NG试剂盒分离的DNA具有增加的甲基化背景,尤其是当将UCBTM添加至尿液样品(+UCB;灰色细胞)中时。每种标记的值用消化之后的甲基化百分比表示,例外的是POLR2A用平均CT值表示。使用两次技术性重复操作来进行实验。-UCB=未添加UCBTM;+UCB=添加UCBTM。

数据分析所用的算法:如上文所提及,CFX96TM实时系统机器还将基于ΔΔCT算法执行数据分析。简单地说(图19中呈现了一个实例),对于每个样品而言,首先将针对每种标记获得的平均CT值(平均循环阈值;图19A)相对于拷贝数对照物POLR2A 的平均CT值(以这种方式获得ΔCT值;图19B)标准化。然后,对于每种标记而言,将未消化样品(参考样品)的ΔCT值与消化样品的ΔCT值相减,以这种方式获得ΔΔCT 值(图19C)。此时,通过应用公式“RQ=2^-ΔΔCT”将容易计算出相对定量值(RQ;在我们的情况下,表示相对甲基化水平)(图19D)。操作者仅须调整(需要时)每种标记的基线阈值(图20),从分析中排除最终异常技术重复值且确保获自消化对照物的值在可接受的范围之间。消化样品的甲基化水平将用未消化样品所得值的百分比表示(100%;图19E和F)。

或者,可以用甲基化DNA拷贝(耐消化)表示每种标记的甲基化程度。根据此观点,应该认为尽管可以相应地计算出消化样品(来源于癌细胞的DNA拷贝)中所检测的信号,但是当使用10ng DNA(来源于约1500个细胞的DNA量,其对应于3000个 DNA拷贝)时,获自未消化样品的信号来源于3000个DNA拷贝的扩增。

此外,通过分析每个样品和标记所得的信号可以根据利用正常尿液组中的每种单一标记获得的平均背景信号水平加以校正。这将进一步提高分析的精确度,然而必须使用CARE分析法分析适当选择的较大正常尿液组,以便确立最可靠的校正值来应用于每种单一标记。

因此,本文中提供癌症特异性生物标记与优化系统设计的独特组合,从而使这种分析法成为利用尿液样品实现膀胱癌早期检测的稳健、准确、灵敏、无创且非常简单的基于表观遗传的方法。归功于新设计的反应混合物和高度的自动化,可以在不到5小时内、在最低限度的样品操控下、使用CARE分析法进行完全分析。此外,内源性和外源性对照物的独特组合、缜密的扩增子设计和优化的反应化学过程使得这种系统具有不可思议的稳健性、可再现性和准确性。CARE分析法具有100%的灵敏度、85.71%的特异性和非常低的检测极限(可以在含有超过1500个细胞的样品中检测到少于7个癌细胞)。另外,CARE分析法具有检测染色体非整倍性、除膀胱癌之外的肿瘤类型的潜力且或许具有个性化诊断首次产生膀胱癌的风险最高的个人的潜力。

实例5-使用MMSP分析法分析甲基化

为了利用来自患者的有限活检样品或液体活检样品精确地检测膀胱癌的倾向性或发病率,研发出一种高度灵敏且专门的多重分析法来分析大量未甲基化背景下的甲基化DNA分子的数目。

亚硫酸氢盐转化:对从患者活检样品(包括尿液、血液或组织样品)中提取的基因组DNA进行亚硫酸氢盐转化。作为DNA甲基化研究中的标准方法,亚硫酸氢盐转化法是利用化学方法专门地将未甲基化的胞嘧啶残基转化成尿嘧啶,从而允许使用聚合酶链反应来选择性地从未甲基化DNA扩增甲基化基因组DNA。这种分析法的转化效率超过 99.5%且供亚硫酸氢盐转化用的gDNA的最低输入量是50pg DNA,因此所述分析法对于处理低到10个二倍体细胞来说是可行的(图21)。

PCR设计:靶向生物标记基因组区域的引物和探针是在考虑解链温度(Tm)(对于引物,相同的Tm=58-60℃且对于探针,Tm=68-70℃)、探针长度(小于30bp)以及引物和探针的CG比率(30-80%)的指导方针下设计。另外,谨慎地控制引物和探针所涵盖的CpG二核苷酸的数目。举例来说,一组引物和探针应该涵盖至少7个CpG基因座以达成这种分析法的期望特异性。还考虑CpG二核苷酸在引物和探针上的位置(例如至少一个C位于引物3'端的最后5个核苷酸中)

为了克服活检样品中的DNA片段的尺寸偏差,PCR扩增子的长度限制在130bp到150bp,以避免尿液样品中缺失小片段DNA。(图21B;参见Yang等人,2010)。将得自上游统计分析的十六个最佳表现目标区域分成如下4组。

A组:DMRTA2、EVX2、Unk21、OTX1、CNC

B组:SOX1、SEPT9、Unk05、Unk09、CNC

C组:GALR1、Unk07、Unk19、TBX15、CNC

D组:EEF1A2、TFAP2B、DCHS2、SOX17、CNC

对照物:分析法中的内部拷贝数对照物(CNC)是II型胶原蛋白α1基因(COL2A1),其是单一拷贝基因。COL2A1的完整扩增子缺乏原始基因组序列中的任何CpG二核苷酸。因此,不论模板DNA的甲基化状况,可以测量输入DNA用于每个反应的量 (Widschwendter等人,《癌症研究(Cancer Research)》,64:3807-3813,2004)。因此,对于每一组来说,均包括CNC反应以检查样品在同一反应孔中的数量和完整性。

经M.SssI修饰的gDNA(D5014-2)用作100%甲基化(MC)的阳性对照物。在每个测试盘(例如96孔盘)中,10ng MC样品测试两次或三次。MC对照物允许对分析内差异(包括试剂批次和PCR仪器)进行标准化。(图23)。此分析法的标准曲线是基于已知数量(单倍体基因组的12-3000个拷贝)的经MssI修饰的基因组DNA的7点连续稀释。报告测试组中的每个量化目标的扩增效率用于品质控制。最重要的是,对于每种分析物来说,根据引物集合自身的标准曲线来计算每个量化区域的原始拷贝数。因此,使用这种分析法可以最小化引物集合之间的扩增有效差异的影响(图23和24)。每个 96孔测试盘中还包括非模板对照物(NTC)以及0%甲基化对照物(图23)。因此,这些对照物中的每一种的使用显著增强了分析法的精确度和再现性。

所述分析法基于DNA混合物的相对甲基化百分比值的重复测量,还展现所有16种目标基因的良好线性度,所述DNA混合物含有100%、50%、5%、1%、0.5%和0%的甲基化(M.SssI处理)正常尿液DNA(图25)。

甲基化分析:对于每种分析物来说,根据标准曲线自动计算每种目标区域和内部对照物的原始拷贝数。如果对样品执行超过一个PCR反应,那么计算双重复或三重复的平均值用于以下分析。基于以下等式计算相对甲基化百分比。

如果不执行标准曲线,那么如下基于△CT执行甲基化百分比的替代计算:

验证:从正常健康人中收集35个尿液样品且使用Quick-DNA

分别预制A组、B组、C组、D组的25ul反应预混液(1U AmpliGold Taq酶、1XampliGold缓冲液、400uM dNTP、5.5mM MgCl2、300nM引物、100nM探针、PCR 增强剂(任选))且装载到96孔盘中(图23)。每个反应使用5ul样品DNA。每个样品双重复测试。将5ul DNA标准物装载到每个指定孔中。针对每个96孔盘执行标准曲线的技术复制。还对5ul 100%甲基化阳性对照(MC)样品测试两次。

在CFX96 Touch

验证#2:从15个膀胱癌尿液样品中提取DNA且进行亚硫酸氢盐转化且在-20℃下储存超过一年。这些样品用80ul H2O稀释供此分析法用。分别预制B组的25ul反应预混液(1UAmpliGold Taq酶、1X ampliGold缓冲液、400uM dNTP、5.5mM MgCl2、 300nM引物、100nM探针、1.5ul DMSO)且装载到96孔盘。每个反应使用5ul样品 DNA。每个样品双重复测试。针对每个96孔盘执行标准曲线的技术复制。还对5ul 100%甲基化阳性对照(MC)样品测试两次。

在CFX96 Touch

另外,治疗后的第3个月,B组标记检测到DNA甲基化显著下降,表明治疗成功。在以下检查中,B组标记证实膀胱癌不复发(图27A)。对于膀胱癌复发的患者来说,B 组标记展现DNA甲基化早在首次临床问诊之后的第18个月出现适度增加且在第31.5 个月出现显著增加。这个患者经诊断在第39.5个月出现膀胱癌复发。因此,这些数据强有力地表明,这些标记可以用于检测和预测膀胱癌复发(图27B)。

验证#3:进行临床前研究以进一步验证对来自健康个体和膀胱癌患者的尿液样品的分析。来自膀胱癌患者的33个尿液样品购自Geneticist-IIBGR(加利福尼亚州格伦达(Glendale,CA))。在经尿道切除膀胱肿瘤(TURBT)之前且在不使用任何化学疗法的情况下收集尿液样品。在年龄、性别和吸烟史多样化的情况下内部(同意)收集20个正常尿液样品。所有尿液样品在收集后均在尿液调理缓冲液(兹莫研究公司,D3061-1) 中保存。使用Quick-DNA

如在分析验证#1中测试A组、B组、C组、D组中的生物标记,例外为每个样品测试三次。对每个样品的RMP结果进行进一步统计分析。基于特殊算法来选择最佳生物标记(B组中的Unk05)。使用Unk05(截止值1.5%)可对膀胱癌群组和不含膀胱癌的群组中的样品进行分层(灵敏度90.9%;特异性85%)。因此,相较于膀胱癌中的基于尿液的现行肿瘤标记,所述分析法具有增强的灵敏度和特异性(图28)。

实例6-针对临床前尿液组的统计分析

使用随机森林算法铲除无足轻重的生物标记:构建统计学模型,通过测量尿液样品中的一组CpG位点的DNA甲基化来预测膀胱癌的存在概率。使用CARE分析法和多重甲基化特异性qPCR(MMSP)分析法获得尿液样品中的十二个膀胱癌特异性CpG位点 (表7)的DNA甲基化水平。分别按75%和25%的比率随机地将尿液样品分成训练集和测试集。通过使用称为随机森林的递归特征选择算法(Svetnik 2003;用R程序包caret 执行)来鉴别具有最低根均方误差(RMSE)的十二个生物标记的子组。

通过广义线性模型向所选生物标记赋予不同权重:向所选CpG位点中的每一个赋予系数且使用广义线性回归模型获得截距(Friedman,2008;用R程序包glmnet执行),从而根据尿液样品的癌症状况(膀胱癌的缺乏或存在)对DNA甲基化进行回归。对具有较小偏差和较少变数的其余部分使用α参数0.5,且使用训练数据的交叉验证来选择有助于达成最小误差的λ参数。

使用逻辑回归法计算膀胱癌的存在概率:逻辑回归使二元结果变数(如癌症的存在或不存在)与一组预测因子变数(如一组CpG位点)关联(Freedman 2009)。利用下式计算膀胱癌的存在概率:log(p/(1-p))=X0+CpG1*X1+…+CpGn*Xn=X,其中p 表示膀胱癌的概率,n是所选CpG位点的数目,X0是截距,X1是CpG位点1的系数, CpG1是CpG位点1的DNA甲基化值等。X是截距和每个生物标记的加权DNA甲基化值的总和,所述加权的DNA甲基化值是CpG*系数。因此,p=exp(X)/(1+exp(X))。

CARE分析结果:根据来自20位健康个体和33位膀胱癌患者的53个尿液样品获得十二个CpG位点的DNA甲基化值。将样品随机分成训练集(39个样品;13个健康样品和26个癌症样品)和测试集(14个样品;7个健康样品和7个癌症样品)。通过随机森林算法来鉴别具有最低RMSE误差的#05(Unk 05)、#36(SOX17)和#09(Unk09) 的三个CpG位点的子组(图29)。glmnet函数向其分别赋予39.0831、104.1071和21.5371 的系数,以及-0.5092的截距。然后计算所有样品的膀胱癌概率。如果其概率等于或大于 50%,那么样品归类为膀胱癌阳性且如果其概率小于50%,那么样品归类为膀胱癌阴性。 CARE分析法在训练集中实现88.46%和84.62%的灵敏度和特异性,且在测试集中实现 100%和85.71%的灵敏度和特异性(表10)。

表17.利用多重甲基化敏感性qPCR分析法对临床前尿液组的统计分析。

灵敏度%=[TP/(TP+FN)]*100

特异性%=[TN/(TN+FP)]*100

阳性预测值%=[TP/(TP+FP)]*100

阴性预测值%=[TN/(TN+FN)]*100

MMSP分析结果:使用MMSP分析法测量同一样品集合的DNA甲基化作为CARE 分析结果。随机森林算法鉴别具有最低RMSE误差的一个单一CpG位点R3N5[参见表 12](图30)。glmnet不能向单一变数赋予系数。然而,如果样品的甲基化值等于或大于 1.5%,那么其归类为膀胱癌阳性且如果样品的甲基化值小于1.5%,那么其归类为膀胱癌阴性。MMSP分析法分别具有90.9%和85.00%的灵敏度和特异性(表17)。

实例7-非整倍性检测

癌细胞的另一个标志是染色体不稳定性,其频繁地导致染色体倍性增加或缺失。具体地说,染色体3、7和17的四倍性以及染色体区域9p21的缺失常常与尿道上皮癌瘤相关且从诊断之前的三年开始,在膀胱癌发展期间聚积(Bonberg等人,2014)。应注意,标记#05、#07和POLR2A(集合A和B)分别位于染色体7、17和17上,使得其适用于检测与膀胱癌相关的频繁染色体畸变。

尽管迄今为止,我们尚未深入研究这个方面,但是CARE分析法的令人感兴趣的方面在于,其可以提供关于染色体非整倍性在所分析样品中的存在的信息。确实,从未消化样品中的每种标记获得的qPCR信号等于最初添加到反应物中的DNA的拷贝数(每种标记,包括内源性对照物,是单拷贝基因座)。因此,对从未消化的整倍体样品(例如针对E.D.C.对照物执行的未消化反应)中的特定标记获得的信号与针对未消化的临床样品(未消化的样品对照物)中的相同标记所检测的信号之间作出的比较可以根据分析来指出标记的额外拷贝的最终存在或标记的拷贝缺失。举例来说,如果我们分析从受膀胱癌影响的个体所收集的尿液样品,其中标记SOX1(#27)被复制,那么我们在原则上可以预期从未消化的临床样品中的SOX1(而非其它标记)检测到的信号相较于从未消化的EDC对照物中获得的信号加倍。

尽管这个方面因其可以提供关于膀胱癌诊断目的的其它信息而令人感兴趣,但是我们必须考虑到,利用CARE分析法鉴别染色体畸变的可能性与原始样品中存在的正常细胞和癌细胞(且更具体地说,非整倍体细胞)的量强烈相关。确实,如果异常癌细胞仅代表存在于尿液样品中的细胞群的一小部分,那么使用CARE分析法将不可能检测出非整倍性。关于这个方面的更多数据将从未来的实验中收集。

***

本文中所公开和要求的所有方法均可以在无需过度实验的情况下根据本公开形成和执行。虽然本发明的组合物和方法已结合优选实施例描述,但是对于所属领域的技术人员显而易见的是,可以对方法和本文所述方法中的步骤或步骤顺序进行变更而这些变更不脱离本发明的构思、精神和范围。更具体地说,显然,在化学上和生理学上相关的某些药剂可以取代本文所述的药剂,同时实现相同或相似的结果。对所属领域的技术人员显而易见的所有这类类似取代和修饰视为属于由所附权利要求书限定的本发明的精神、范围和构思内。

序列表

<110> 兹莫研究公司

<120> 测定DNA甲基化的分析法和癌症的DNA甲基化标记

<130> ZYMO.P0030WO

<150> US 62/120,373

<151> 2015-02-24

<160> 90

<170> PatentIn version 3.5

<210> 1

<211> 16

<212> DNA

<213> 人工序列

<220>

<223> 合成寡核苷酸

<400> 1

tcgcggaagt agcggc 16

<210> 2

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 合成寡核苷酸

<400> 2

cacctcctcc cgcataaaaa 20

<210> 3

<211> 29

<212> DNA

<213> 人工序列

<220>

<223> 合成寡核苷酸

<400> 3

aacgcctcga acacgtccaa ctataaacg 29

<210> 4

<211> 23

<212> DNA

<213> 人工序列

<220>

<223> 合成寡核苷酸

<400> 4

ggagggatta ttattcggtt cgt 23

<210> 5

<211> 18

<212> DNA

<213> 人工序列

<220>

<223> 合成寡核苷酸

<400> 5

ccatacccgc gtccaaac 18

<210> 6

<211> 27

<212> DNA

<213> 人工序列

<220>

<223> 合成寡核苷酸

<400> 6

atacgccgaa tacaacaaca cgtccga 27

<210> 7

<211> 27

<212> DNA

<213> 人工序列

<220>

<223> 合成寡核苷酸

<400> 7

tcgtacgtaa gtcgcgtata gtattgt 27

<210> 8

<211> 18

<212> DNA

<213> 人工序列

<220>

<223> 合成寡核苷酸

<400> 8

aatccgaact aaccgccg 18

<210> 9

<211> 17

<212> DNA

<213> 人工序列

<220>

<223> 合成寡核苷酸

<400> 9

cgccgcccaa aacgcga 17

<210> 10

<211> 19

<212> DNA

<213> 人工序列

<220>

<223> 合成寡核苷酸

<400> 10

aggtaagagt ttcggcggc 19

<210> 11

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 合成寡核苷酸

<400> 11

cctcaaccct cgaacccaac 20

<210> 12

<211> 24

<212> DNA

<213> 人工序列

<220>

<223> 合成寡核苷酸

<400> 12

tcgcgacaaa cacgcttccg ccta 24

<210> 13

<211> 18

<212> DNA

<213> 人工序列

<220>

<223> 合成寡核苷酸

<400> 13

tcggcgaaga tttggagc 18

<210> 14

<211> 19

<212> DNA

<213> 人工序列

<220>

<223> 合成寡核苷酸

<400> 14

cgcgaccacg aaacctaaa 19

<210> 15

<211> 25

<212> DNA

<213> 人工序列

<220>

<223> 合成寡核苷酸

<400> 15

ttttatttgc gcggttgtag tcggc 25

<210> 16

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 合成寡核苷酸

<400> 16

cgcgtaaaag gtaggatcgc 20

<210> 17

<211> 21

<212> DNA

<213> 人工序列

<220>

<223> 合成寡核苷酸

<400> 17

aactcgaaac tctacccccg a 21

<210> 18

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成寡核苷酸

<400> 18

aacgccgact caacaaaaaa ttatttcgaa 30

<210> 19

<211> 23

<212> DNA

<213> 人工序列

<220>

<223> 合成寡核苷酸

<400> 19

agcgatagta gcgtttgtgg ttt 23

<210> 20

<211> 17

<212> DNA

<213> 人工序列

<220>

<223> 合成寡核苷酸

<400> 20

gcgaaccccc aaatacg 17

<210> 21

<211> 29

<212> DNA

<213> 人工序列

<220>

<223> 合成寡核苷酸

<400> 21

tcgcaaccat aacgtaatat cgaccctca 29

<210> 22

<211> 26

<212> DNA

<213> 人工序列

<220>

<223> 合成寡核苷酸

<400> 22

gtttttgagt ttataggtcg ggattt 26

<210> 23

<211> 15

<212> DNA

<213> 人工序列

<220>

<223> 合成寡核苷酸

<400> 23

ctatcaccgc cgccg 15

<210> 24

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成寡核苷酸

<400> 24

aaattaaacg acaacgcacg cgactaacaa 30

<210> 25

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 合成寡核苷酸

<400> 25

agcggtgacg gtagtggttt 20

<210> 26

<211> 23

<212> DNA

<213> 人工序列

<220>

<223> 合成寡核苷酸

<400> 26

ctacacccta atacaaccgt ccg 23

<210> 27

<211> 28

<212> DNA

<213> 人工序列

<220>

<223> 合成寡核苷酸

<400> 27

aacccgttct tccaattacg ctaccgaa 28

<210> 28

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 合成寡核苷酸

<400> 28

gcggacgtta gttagtcggc 20

<210> 29

<211> 19

<212> DNA

<213> 人工序列

<220>

<223> 合成寡核苷酸

<400> 29

cccgaatccc tatccgaaa 19

<210> 30

<211> 21

<212> DNA

<213> 人工序列

<220>

<223> 合成寡核苷酸

<400> 30

cgcccactcc gacaccaacg t 21

<210> 31

<211> 19

<212> DNA

<213> 人工序列

<220>

<223> 合成寡核苷酸

<400> 31

cgcgtttaat tggttgcga 19

<210> 32

<211> 19

<212> DNA

<213> 人工序列

<220>

<223> 合成寡核苷酸

<400> 32

tatctattcg tcccgcccg 19

<210> 33

<211> 23

<212> DNA

<213> 人工序列

<220>

<223> 合成寡核苷酸

<400> 33

aaatccgcct cctcgacccg aaa 23

<210> 34

<211> 26

<212> DNA

<213> 人工序列

<220>

<223> 合成寡核苷酸

<400> 34

ggttggtata tcgaggtttc gtagtt 26

<210> 35

<211> 15

<212> DNA

<213> 人工序列

<220>

<223> 合成寡核苷酸

<400> 35

cgcgtctacc cgccc 15

<210> 36

<211> 26

<212> DNA

<213> 人工序列

<220>

<223> 合成寡核苷酸

<400> 36

aaacgacgaa cgaatcaaac gcgact 26

<210> 37

<211> 29

<212> DNA

<213> 人工序列

<220>

<223> 合成寡核苷酸

<400> 37

ggtatttggg attagtatat gtttagcgt 29

<210> 38

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 合成寡核苷酸

<400> 38

cctcaacgac ctccaactcg 20

<210> 39

<211> 29

<212> DNA

<213> 人工序列

<220>

<223> 合成寡核苷酸

<400> 39

actacaactt ctaacaaaac gacgcgccg 29

<210> 40

<211> 23

<212> DNA

<213> 人工序列

<220>

<223> 合成寡核苷酸

<400> 40

gattcgcgtt agagtcggag tta 23

<210> 41

<211> 21

<212> DNA

<213> 人工序列

<220>

<223> 合成寡核苷酸

<400> 41

cgtcgaactc aaacctcgaa a 21

<210> 42

<211> 17

<212> DNA

<213> 人工序列

<220>

<223> 合成寡核苷酸

<400> 42

cgtcgcgttt tcgtcgt 17

<210> 43

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 合成寡核苷酸

<400> 43

gcgtatacgg ttttggggtc 20

<210> 44

<211> 18

<212> DNA

<213> 人工序列

<220>

<223> 合成寡核苷酸

<400> 44

caaacttccg cgcccaac 18

<210> 45

<211> 27

<212> DNA

<213> 人工序列

<220>

<223> 合成寡核苷酸

<400> 45

ctcgccacgc tcaatacccg ttttacc 27

<210> 46

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 合成寡核苷酸

<400> 46

ggacgtggga ttcggattac 20

<210> 47

<211> 31

<212> DNA

<213> 人工序列

<220>

<223> 合成寡核苷酸

<400> 47

ttttctacac aaatataacc aataaaacga c 31

<210> 48

<211> 22

<212> DNA

<213> 人工序列

<220>

<223> 合成寡核苷酸

<400> 48

cgaaccgatc ccgcgtcgtt aa 22

<210> 49

<211> 21

<212> DNA

<213> 人工序列

<220>

<223> 合成寡核苷酸

<400> 49

acctacctct ccaagctatt c 21

<210> 50

<211> 21

<212> DNA

<213> 人工序列

<220>

<223> 合成寡核苷酸

<400> 50

ggtgtaattg ggactggttg g 21

<210> 51

<211> 23

<212> DNA

<213> 人工序列

<220>

<223> 合成寡核苷酸

<400> 51

tactcaccca ccagcccgaa cta 23

<210> 52

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 合成寡核苷酸

<400> 52

cgtagctcag gcctcaagac 20

<210> 53

<211> 19

<212> DNA

<213> 人工序列

<220>

<223> 合成寡核苷酸

<400> 53

gaggagcaga gagcgaagc 19

<210> 54

<211> 21

<212> DNA

<213> 人工序列

<220>

<223> 合成寡核苷酸

<400> 54

ctcagccagt cccagcccaa g 21

<210> 55

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 合成寡核苷酸

<400> 55

ccacgactgc acctgtttgc 20

<210> 56

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 合成寡核苷酸

<400> 56

ggcagaaaca cacgcactcg 20

<210> 57

<211> 23

<212> DNA

<213> 人工序列

<220>

<223> 合成寡核苷酸

<400> 57

tcggcctctt tggcaagtgg ttt 23

<210> 58

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 合成寡核苷酸

<400> 58

acccaccctc tctcagaagg 20

<210> 59

<211> 21

<212> DNA

<213> 人工序列

<220>

<223> 合成寡核苷酸

<400> 59

agtttaggag tctgagcttc c 21

<210> 60

<211> 21

<212> DNA

<213> 人工序列

<220>

<223> 合成寡核苷酸

<400> 60

cgcaaagacg gtgccaccag g 21

<210> 61

<211> 19

<212> DNA

<213> 人工序列

<220>

<223> 合成寡核苷酸

<400> 61

gcagtgccgt agagcagct 19

<210> 62

<211> 22

<212> DNA

<213> 人工序列

<220>

<223> 合成寡核苷酸

<400> 62

ccctcaaggg ccacaaacgc ta 22

<210> 63

<211> 24

<212> DNA

<213> 人工序列

<220>

<223> 合成寡核苷酸

<400> 63

cacaggcagt ccttccagcg acag 24

<210> 64

<211> 21

<212> DNA

<213> 人工序列

<220>

<223> 合成寡核苷酸

<400> 64

cactcacgtc ttcgtagtca g 21

<210> 65

<211> 21

<212> DNA

<213> 人工序列

<220>

<223> 合成寡核苷酸

<400> 65

ttggagtgtg acggtaaaag c 21

<210> 66

<211> 21

<212> DNA

<213> 人工序列

<220>

<223> 合成寡核苷酸

<400> 66

cgtacagcac tgcagggtcc g 21

<210> 67

<211> 19

<212> DNA

<213> 人工序列

<220>

<223> 合成寡核苷酸

<400> 67

gggaggaccc ctcgttagc 19

<210> 68

<211> 19

<212> DNA

<213> 人工序列

<220>

<223> 合成寡核苷酸

<400> 68

ctcagcgtcc gaccccact 19

<210> 69

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 合成寡核苷酸

<400> 69

tgggctcgag ggctgagggc 20

<210> 70

<211> 19

<212> DNA

<213> 人工序列

<220>

<223> 合成寡核苷酸

<400> 70

aggcttccga ggcctgagc 19

<210> 71

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 合成寡核苷酸

<400> 71

agcgactctc cttcctgacg 20

<210> 72

<211> 23

<212> DNA

<213> 人工序列

<220>

<223> 合成寡核苷酸

<400> 72

cgtaccctgg caaacaaacg acc 23

<210> 73

<211> 19

<212> DNA

<213> 人工序列

<220>

<223> 合成寡核苷酸

<400> 73

tgggcgtggg cctaacgac 19

<210> 74

<211> 19

<212> DNA

<213> 人工序列

<220>

<223> 合成寡核苷酸

<400> 74

cccgtgttct ggcctgtcg 19

<210> 75

<211> 22

<212> DNA

<213> 人工序列

<220>

<223> 合成寡核苷酸

<400> 75

tgggtacgct gtagaccaga cc 22

<210> 76

<211> 18

<212> DNA

<213> 人工序列

<220>

<223> 合成寡核苷酸

<400> 76

cgcacgcgac agacctcg 18

<210> 77

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 合成寡核苷酸

<400> 77

tggatgagaa cgacaacccg 20

<210> 78

<211> 23

<212> DNA

<213> 人工序列

<220>

<223> 合成寡核苷酸

<400> 78

cggtactcgt cctgctcaaa gac 23

<210> 79

<211> 18

<212> DNA

<213> 人工序列

<220>

<223> 合成寡核苷酸

<400> 79

accgaggccc ctacctgg 18

<210> 80

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 合成寡核苷酸

<400> 80

gttagaaacg caggccaggc 20

<210> 81

<211> 22

<212> DNA

<213> 人工序列

<220>

<223> 合成寡核苷酸

<400> 81

cactgaacga ccccttctcc ag 22

<210> 82

<211> 19

<212> DNA

<213> 人工序列

<220>

<223> 合成寡核苷酸

<400> 82

gccgacttgg tgaccttgc 19

<210> 83

<211> 19

<212> DNA

<213> 人工序列

<220>

<223> 合成寡核苷酸

<400> 83

ggccagagcc ctggggttg 19

<210> 84

<211> 23

<212> DNA

<213> 人工序列

<220>

<223> 合成寡核苷酸

<400> 84

ccacgttctt gatgacgcct acg 23

<210> 85

<211> 21

<212> DNA

<213> 人工序列

<220>

<223> 合成寡核苷酸

<400> 85

gacgtggtgt tcgcttttgg c 21

<210> 86

<211> 19

<212> DNA

<213> 人工序列

<220>

<223> 合成寡核苷酸

<400> 86

cgcacgtgca gctcgtagg 19

<210> 87

<211> 23

<212> DNA

<213> 人工序列

<220>

<223> 合成寡核苷酸

<400> 87

cccgtggatt accagagtca gga 23

<210> 88

<211> 19

<212> DNA

<213> 人工序列

<220>

<223> 合成寡核苷酸

<400> 88

acacgccgaa cacacgtgc 19

<210> 89

<211> 19

<212> DNA

<213> 人工序列

<220>

<223> 合成寡核苷酸

<400> 89

ccgtccgtgt gtcctgtgc 19

<210> 90

<211> 22

<212> DNA

<213> 人工序列

<220>

<223> 合成寡核苷酸

<400> 90

cctaattggc tgcgaacggt cc 22

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号