首页> 中国专利> 一种用于与微卫星不稳定性相关微卫星位点进行杂交的DNA探针库、检测方法和试剂盒

一种用于与微卫星不稳定性相关微卫星位点进行杂交的DNA探针库、检测方法和试剂盒

摘要

本发明提供一种用于与微卫星不稳定性(MSI)检测相关的微卫星位点进行杂交的DNA探针库,所述DNA探针库包括一个或多个能够与MSI状态相关微卫星位点进行杂交的DNA探针。所述DNA探针中,MSI相关微卫星位点探针如以下序列所示:SEQ ID NO.1~66。此外,本发明提供利用该探针库对MSI相关微卫星位点进行富集及检测的方法,采用此方法与下一代测序技术(NGS)相结合可以极大地提高MSI检测的敏感性,准确性与全面性。

著录项

  • 公开/公告号CN107475375A

    专利类型发明专利

  • 公开/公告日2017-12-15

    原文格式PDF

  • 申请/专利权人 南京世和基因生物技术有限公司;

    申请/专利号CN201710647677.8

  • 申请日2017-08-01

  • 分类号C12Q1/68(20060101);C40B40/06(20060101);

  • 代理机构32243 南京正联知识产权代理有限公司;

  • 代理人邓唯

  • 地址 210061 江苏省南京市高新开发区新锦湖路3-1号中丹生态生命科学产业园02栋18楼

  • 入库时间 2023-06-19 04:01:06

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2023-08-15

    专利权的转移 IPC(主分类):C12Q 1/6886 专利号:ZL2017106476778 登记生效日:20230803 变更事项:专利权人 变更前权利人:北京世和医学检验实验室有限公司 变更后权利人:南京世和基因生物技术股份有限公司 变更事项:地址 变更前权利人:100176 北京市大兴市北京经济技术开发区科创六街88号院7号楼3单元101室 变更后权利人:210032 江苏省南京市高新开发区华康路128号

    专利申请权、专利权的转移

  • 2018-12-21

    专利实施许可合同备案的生效 IPC(主分类):C12Q1/6886 合同备案号:2018320000359 让与人:北京世和医学检验实验室有限公司 受让人:南京世和医疗器械有限公司 发明名称:一种用于与微卫星不稳定性相关微卫星位点进行杂交的DNA探针库、检测方法和试剂盒 申请公布日:20171215 授权公告日:20180824 许可种类:普通许可 备案日期:20181128 申请日:20170801

    专利实施许可合同备案的生效、变更及注销

  • 2018-11-06

    专利权的转移 IPC(主分类):C12Q1/6886 登记生效日:20181017 变更前: 变更后: 申请日:20170801

    专利申请权、专利权的转移

  • 2018-08-24

    授权

    授权

  • 2018-01-09

    实质审查的生效 IPC(主分类):C12Q1/68 申请日:20170801

    实质审查的生效

  • 2017-12-15

    公开

    公开

查看全部

说明书

技术领域

本发明涉及基因检测领域,具体而言,本发明涉及一种针对微卫星不稳定性(MSI)相关微卫星位点的富集及检测方法。该方法可以精准地富集MSI相关微卫星位点的特定片段,所得DNA样本库可进一步结合下一代测序技术(NGS),并通过生物信息学分析定量评估病人的MSI状态,为肿瘤的诊断,预后,及临床治疗方案的设计提供指导及理论基础。

背景技术

微卫星不稳定性(Micro-Satellite Instability, MSI)是指DNA复制过程中由于重复序列非正常插入或移除导致微卫星等位基因长度发生变化,且该变化因为种种原因(如DNA错配修复机制的基因发生启动子甲基化抑制基因表达或发生失活、截短突变)无法通过DNA错配修复系统(MMR)进行修正。MSI具体表现为正常组织中重复单位数目较稳定的微卫星位点的长度在异常组织中变的不稳定,出现长度变化。

从1993年Aaltonen等发现遗传性非息肉病性大肠癌(HNPCC),亦称Lynch综合征,细胞中存在高频率的MSI之后,研究者相继在肺癌,胃癌,子宫内膜癌等一系列癌种中发现了MSI的存在。MSI在特定癌种中存在率较高,如结直肠癌中约15%为MSI瘤,其中早发型结直肠癌MSI出现率达到30%,而HNPCC中MSI瘤的比例高达90%。临床研究表明,具有高频MSI(MSI-H)的二/三期肠癌患者预后较好,并且不能从氟尿嘧啶类药物(例如5-FU)辅助化疗中获益。由此可见,MSI的检测具有多重临床病理意义。

针对MSI检测在结直肠癌治疗方面的运用,美国国家肿瘤研究所(NCI)于1997年颁布了Bethesda指导纲要。Bethesda纲要推荐了5个可用来进行结直肠癌MSI检测的微卫星位点(BAT-26, BAT-25, D2S123, D5S346, D17S250)。此外,纲要将MSI进行了分类并对各分类进行了定义,分别为:

1.高频MSI(MSI-H):推荐位点中两个或以上检测出重复序列的长度变化;

2.低频MSI(MSI-L):推荐位点中有一个检测出重复序列的长度变化;

3.微卫星稳定(MSS):推荐位点中重复序列的长度无变化。

Bethesda纲要最早提出的5个推荐位点中,三个双碱基重复位点(D2S123, D5S346与D17S250)是否稳定在2002年NCI会议中受到争议:Suraweera研究小组指出,对MSI-H级别患者,将以上三个双碱基重复位点替换为NR21, NR22与NR24三个单碱基位点可以增进检测敏感度。2004年Bacher小组的研究显示,使用单碱基位点的检测敏感度在92%-100%之间,而针对MSI-H级别病例的特异性高达99.5%-100%。这一结论在2007年Rosa M. Xicola小组的研究中得到进一步证实。Bethesda纲要之外,普洛麦格(Promega)生物技术有限公司研制了自己的MSI分析系统,其中使用单碱基位点Mono27替代Suraweera提出的NR22,另外加入了两个在人群中高度多样性的五碱基位点Penta C与Penta D用于样品质控。

因为MSI检测具有高敏感性与高特异性,在2011年国际肿瘤综合网络结直肠癌筛查指南中正式将MSI检测作为首要检测项目,其中认为以下人群应该接受MSI检测:

-50岁以下,诊断出结直肠癌的病人

-病人带有同时或异时性HNPCC类肿瘤,无论年龄。

-病人有一位或多位一级亲属被诊断为HNPCC肿瘤,且其中至少有一位小于50岁。

-病人有两位或以上一级或二级亲属被诊断出HNPCC类肿瘤,无论年龄。

近期研究表明,MSI检测在肿瘤免疫治疗中也起到了重要的指导作用。多项研究显示MSI-H较MSI-L和MSS的结肠患者接受PD-1抗体治疗后效果更好,并陆续在其他癌种中得到验证。2017年5月,美国FDA加速批准了免疫治疗药物Perbrolizumab(Keytruda)用于具有MSI-H或DNA错配修复缺陷的不可手术或晚期转移,并在之前的治疗后出现进展的实体瘤患者。这是FDA批准的首款不依照肿瘤来源的治疗方法。可见MSI检测具有广泛的临床指导意义。

现有的MSI检测主要使用以下两方面技术:

1.PCR检测(MSI-PCR): 使用特异的引物,对微卫星位点进行逐一PCR或多重荧光PCR扩增,扩增产物经过凝胶电泳显像或Sanger片段大小分析其产物片段与正常对照相比,有无迁移率的改变,从而判定MSI的状态。

2.DNA错配修复缺陷检测:直接对导致MSI现象的相关基因,主要是DNA错配修复系统(MMR)基因进行基因突变检测,或对其表达的蛋白水平运用免疫组化的方法进行检测。

这两类技术中,PCR检测为现阶段普及程度最高,也公认为性价比最高的检测方法。然而普通的PCR方法存在操作程序繁琐,耗时长,灵敏度低,检测结果不确定性高等问题,而多重PCR检测中,不同引物之间的干扰关系十分复杂,扩增产物混杂度较高,因此在引物的选择及浓度上都有较高的要求,这些因素无疑极大地抬高了检测成本。对于DNA错配修复基因缺陷的检测,传统的基因测序方法,如Sanger测序等,同样具有高成本,低通量,低精度等问题。而免疫组化的方法特异性和可重复性较低,对样本质量要求高,操作也比较复杂。最后,由于现有的常规MSI检测方法所能检测的微卫星位点数有限,使得高频MSI-H与低频MSI-L较难区分。因此急需开发一种能够同时检测更多微卫星位点,且更简单,快捷,灵敏度和可重复性都较高的MSI检测方法,以满足临床上的迫切需求。

发明内容

下一代测序技术(NGS)技术在MSI检测方面具有巨大的应用潜力,本发明提供一套完整的基于NGS技术的MSI状态检测方案可以极大程度的简化检测过程并降低检测成本,本发明人通过大量文献检索和实验验证,确定了优化的适于进行MSI状态评估的22个微卫星位点,并开发了基于杂交选择而捕获MSI相关微卫星位点的方法,采用该方法可以靶向富集MSI相关微卫星位点片段,经该方法富集的微卫星位点片段可以被选择性地应用于各种基因检测技术中,特别是可以应用于NGS为基础的MSI检测中。

本发明的第一个方面:

确定了用于MSI状态检测的22个人类基因组中的单碱基重复微卫星位点(见表1)。其特征在于,在正常细胞中其重复单元数较固定,并在超过2000例中国人群中进行验证其稳定性;而在MSI状态下,其重复单元数出现多态性。

表1 微卫星位点信息

本发明的第二个方面:

用于与微卫星不稳定性(MSI)相关微卫星位点进行杂交的DNA探针库,其特征在于,包括有可以与基因组区域中的22个单碱基重复微卫星位点进行杂交的DNA探针库。

所述的探针库的设计方法是:

针对每一个微卫星位点,分别设计第一探针和第二探针,所述的第一探针的一端特异性结合微卫星位点序列的上游且另一端特异性结合微卫星位点内部区域,所述的第二探针的一端特异性结合微卫星位点的内部区域且另一端特异性结合微卫星位点序列的下游区域,所述第三探针具有与微卫星特异性结合的区域并且两端分别特异性结合微卫星位点的上游和下游区域。

所述的探针库中的探针长度为80~120个碱基,更优选是120个碱基。

所述的DNA探针库中包括有核苷酸序列如SEQ ID NO. 1~66所示的任意一条探针,或者与其具有相同功能的探针。

优选的:探针库中包括上述的全部探针;

优选的:所述的具有相同功能的探针,是指将SEQ ID NO. 1~66任意一条探针经过一个或几个核苷酸的取代和/或缺失和/或添加且具有相同杂交捕获功能的探针。

优选的:所述的具有相同功能的探针与原探针具有80%以上相同的碱基,更优选是90%以上相同碱基,再优选是95%以上相同碱基。

本发明的第三个方面:

本发明提供一种富集MSI相关微卫星位点片段的方法,所述方法包括以下步骤:

1)获得受试者的DNA样本库;

2)获得能够与MSI相关微卫星位点杂交的DNA探针库;

3)使所述DNA探针库与所述DNA样本库进行杂交;和

4)分离步骤3)的杂交产物,然后释放经杂交富集的MSI相关微卫星位点片段。

其中,所述步骤1)中的DNA样本库由双链DNA片段组成,并且,所述步骤1)包括提取全基因组DNA,然后将其片段化;

其中,所述受试者为哺乳动物,优选人,且从受试者的细胞、组织或体液样本中提取全基因组DNA;

优选地,所述DNA片段的长度为150~600bp;

进一步优选地,所述DNA片段的长度为200bp或350bp。

所述步骤2)中的DNA探针库为如上所述的DNA探针库。具体而言,所述DNA探针库包括一个或多个能够与MSI相关微卫星位点片段杂交的DNA探针,所述DNA探针如以下序列所示:SEQ ID NO. 1~66。

此外,所述步骤3)包括:

3-1)采用选择性标记标记DNA探针库中的DNA探针;和

3-2)使所述DNA探针库与DNA样本库进行杂交;

优选地,所述步骤3-1)中的选择性标记为生物素;进一步优选地,所述步骤3-2)包括在PCR扩增仪中,在65℃下将所述DNA探针库与DNA样本库孵育24小时。

因此,所述方法的步骤4)中,优选利用DNA探针上的选择性标记分离杂交产物。进一步优选地,所述步骤3-1)中的选择性标记为生物素,所述步骤4)中利用链霉亲和素-生物素的亲和作用分离杂交产物。

本发明的第四个方面:

本发明还提供一种检测MSI相关微卫星位点的重复单元数变化的方法,所述方法包括以下步骤:

1)根据上述方法富集MSI相关微卫星位点片段;和

2)检测所述MSI相关微卫星位点的重复单元数变化。

优选地,所述步骤2)中采用NGS下一代测序技术,通过对富集到的MSI相关微卫星位点片段进行测序而检测所述MSI相关微卫星位点的重复单元数变化。

本发明的第五个方面:

本发明提供一种用于富集MSI相关微卫星位点片段的试剂盒,所述试剂盒包含上述的DNA探针库。

本发明的第六个方面:

所述的试剂盒在用于非治疗与诊断目的的微卫星不稳定性(MSI)相关微卫星位点检测中的应用。

有益效果

综上所述,本发明人开发了基于杂交选择而捕获特定MSI相关微卫星位点的方法,采用该方法可以获得数万倍富集的MSI相关微卫星位点片段,该经富集的MSI相关微卫星位点片段样本可以选择性地应用于各种基因检测技术,特别是可以应用下一代测序技术进行基因突变、缺失、增加、和颠换等方面的检测,以取得高效且准确的结果,对相关症状的后续治疗提供有意义的理论及临床指导。

并且,对于将通过本发明的方法富集得到的MSI相关微卫星位点片段用于基于下一代测序技术的结构突变检测的应用而言,还具有以下有益效果:

使用本发明的基因富集方法及筛选得到的特定DNA探针库,能够成数万倍地富集MSI相关微卫星位点,从而可以应用下一代测序技术、利用该MSI相关微卫星位点序列的测序,而准确地获得MSI相关微卫星位点重复序列的各种突变。并且,由于采用下一代测序技术,因此能够一次性检测多个位点的多种类型基因突变;准确性高,传统技术例如基因芯片技术,通常需要重复两次以上才能确定检测结果,而本发明在一次反应中,对单个碱基进行反复测序,保证了数据的精准度,并且缩短了检测周期;敏感性高,和传统检测技术相比,本发明产生的数据能够达到碱基级的分辨率,使敏感度有了大幅度提高。

附图说明

图1为本发明技术方案的示例性工艺流程图,其中富集得到目标DNA片段,并用于基于下一代测序技术的基因结构突变检测。

图2为本发明的探针设计策略的示意图。

图3是一例MSI-H样本的PCR分型图。

图4~9分别是MSI-H患者不同的MSI敏感位点的测序图。

图10是一例MSS样本的PCR分型图。

图11~16是分别是MSS样本的MSI敏感位点的测序图。

具体实施方式

下面通过具体实施方式对本发明作进一步详细说明。但本领域技术人员将会理解,下列实施例仅用于说明本发明,而不应视为限定本发明的范围。实施例中未注明具体技术或条件者,按照本领域内的文献所描述的技术或条件或者按照产品说明书进行。所用试剂或仪器未注明生产厂商者,均为可以通过市购获得的常规产品。

在本文中所使用的术语“DNA”为脱氧核糖核酸(英文:Deoxyribonucleic acid,缩写为DNA)是一种由脱氧核糖核苷酸组成的双链分子。可组成遗传指令,引导生物发育与生命机能运行,其碱基排列顺序构成了遗传信息,所以在遗传病的诊断中具有重要的作用。

在本文中所使用的术语“下一代测序技术”指的是第二代高通量测序技术及之后发展的更高通量的测序方法。下一代测序平台包括但不限于Illumina (Miseq、Hiseq2000、Hiseq2500、Hiseq3000、Hiseq4000、HiseqX Ten等)、ABI-Solid和Roche-454测序平台等。随着测序技术的不断发展,本领域技术人员能够理解的是还可以采用其他方法的测序方法和装置进行本检测。根据本发明的具体示例,可以将根据本发明实施例的核酸标签用于Illumina、ABI-Solid和Roche-454测序平台等的至少一种进行测序。下一代测序技术,例如Illumina测序技术具有以下优势:(1)高灵敏度:下一代测序,例如Miseq的测序通量大,目前一个实验流程下来可以产生最多15G碱基数据,高的数据通量可以在测序序列数一定的情况下,使得每条序列获得更高的测序深度,所以可以检测到含量更低的突变,同时因其测序深度高,突变位点被多次覆盖,其测序结果也更为可靠。(2)高通量,低成本:利用根据本发明实施例的标签序列,通过一次测序可以检测上万份样本,从而大大降低了成本。

本发明中的“突变”、“核酸变异”、“基因变异”可通用,本发明中的“SNP”(SNV)、“CNV”、“插入缺失”(indel)和“结构变异”(SV)同通常定义,但本发明中对各种变异的大小不作特别限定,这样这几种变异之间有的有交叉,比如当插入/缺失的为大片段甚至整条染色体时,也属于发生拷贝数变异(CNV)或是染色体非整倍性,也属于SV。这些类型变异的大小交叉并不妨碍本领域人员通过上述描述执行实现本发明的方法和/或装置并且达到所描述的结果。

本发明提供一种富集MSI相关微卫星位点的方法。具体而言,本发明的方法包括:从哺乳动物例如人的细胞、体液或组织样本中提取基因组DNA,经处理获得片段化的双链DNA作为DNA样本库;此外,针对要富集的MSI相关微卫星位点,设计与该MSI相关微卫星位点杂交的DNA探针,从中筛选出多个探针作为DNA探针库;然后,将该DNA样本库与DNA探针库进行杂交,从而从DNA样本库中富集得到MSI相关微卫星位点片段。根据本发明的具体实施方式,可以先将DNA探针库中的各个探针进行生物素化,然后在杂交后用链霉亲和素磁珠吸附杂交产物,再从磁珠上释放出富集的MSI相关微卫星位点片段。经适应性处理,可以采用下一代测序基因对MSI相关微卫星位点片段进行基因结构突变的检测,以确认MSI相关微卫星位点的突变情况。

下面以富集得到的MSI相关微卫星位点片段用于基于下一代测序技术的基因结构突变检测为例,示例性地说明本发明,其中总体工艺流程见图1。

一、准备DNA样本库

1. 准备基因组DNA样本(采用此种方式获得的DNA样本库称为“源自全基因组的DNA样本库”)

1.1 DNA提取

DNA提取,包括新鲜组织,新鲜血液和细胞,固定和石蜡样本,商业化公司提取试剂盒。以上均按说明书指示方法操作。

使用分光光度定量仪以及凝胶电泳系统检测DNA模板质量和浓度。dsDNA模板260nm吸光率大于0.05以上,吸光率A260/A280比值在1.8到2之间为合格。

1.1 DNA片段化

将3微克高质量的基因组DNA用低TE缓冲液稀释至120微升。按照组织匀浆机使用说明书,将DNA片段化,片段长度为150~600bp、优选200bp或350bp 。

DNA过柱纯化,商业化公司纯化试剂盒。

1.2 DNA样本库质量检测

用生物分析仪进行DNA定性定量分析,确认DNA片段长度峰值合理。

2. DNA末端修补

将DNA片段进行末端修复可以利用Klenow片段、T4DNA聚合酶和T4多核苷酸激酶进行,其中,所述Klenow片段具有5’-3’’聚合酶活性和3’-5’聚合酶活性,但缺少5’-3’外切酶活性。由此,能够方便准确地对DNA片段进行末端修复。根据本发明的实施例,还可以进一步包括对经过末端修复的DNA片段进行纯化的步骤,由此能够方便地进行后续处理。

利用T4聚合酶及Klenow大肠杆菌聚合酶片断,对于DNA 5'突出粘末端补平以及3'突出粘末端打平,产生平末端,用于后续的平端连接。反应在PCR扩增仪中进行,20摄氏度,30分钟。

表2 DNA末端修复反应液组成

DNA过柱纯化,商业化公司纯化试剂盒。

4. 在DNA样本3'末端加上碱基A

在经过末端修复的DNA片段的3’末端添加碱基A,以便获得具有粘性末端A的DNA片段。根据本发明的一个实施例,可以利用Klenow(3’-5’exo-),即具有3’-5’外切酶活性的Klenow,在经过末端修复的DNA片段的3’末端添加碱基A。由此,能够方便准确地将碱基A添加到经过末端修复的DNA片段的3’末端。根据本发明的实施例,还可以进一步包括对具有粘性末端A的DNA片段进行纯化的步骤,由此能够方便地进行后续处理。

反应在PCR扩增仪中进行,37℃,30分钟。

表3 末端加A反应液组成

DNA过柱纯化,商业化公司纯化试剂盒。

5. 在DNA两端加上接头

表4 DNA两端加接头反应液组成

DNA过柱纯化,商业化公司纯化试剂盒。

7. 扩增DNA模板

聚合酶链反应(PCR),在PCR扩增仪中进行。

表5 PCR反应液组成

PCR条件:置于PCR扩增仪中,98℃预变性30秒,98℃变性30秒,65℃退火30秒,72℃延伸30秒,共循环4-6次。最后在72℃延伸5分钟。

PCR扩增产物过柱纯化,商业化公司纯化试剂盒。

9. 扩增后DNA样本库质量检测

使用生物分析仪,进行DNA定性定量分析,并确认纯化后片段长度峰值合理,约200bp。

对于得到的DNA样本库,如果DNA浓度小于150纳克/微升,须将样品经过真空浓缩机低温干燥(低于45℃),再用无核酸酶水溶解至所需浓度。

二、MSI基因位点的选择依据

本发明通过查找数据库,并经过大量的实际健康人和临床样本分析工作后,确定了如表1中所示的22个MSI高危位点。基因组的位置是从基因组数据库Hg19版本所确定;表1中chr及其后续代表的数字表示第几条染色体。

三、探针的设计

针对MSI基因准备DNA探针库。

本领域技术人员知晓:捕获的特异性受各种因素影响,如捕获探针的设计不佳,捕获条件不理想,基因组DNA中重复序列的封闭不充分及基因组DNA与捕获探针的比例不合适等因素都会影响捕获的特异性、敏感性、测序覆盖率等诸多结果。为了实现目标基因的高度富集和低脱靶率,本领域技术人员需要对探针的类型、长度、序列、杂交条件等进行大量实验摸索,需要通过创造性的探索工作才能够获得最佳的参数组合,没有在相应的证据证明下,其是否能够达到相同的效果,是本领域技术人员无法预期的。同时,对于产生突变的样本进行检测时,由于突变样本在组织样本中所占的比例会因个体而不同,因此,如果突变样本的丰度较低时,较容易导致的问题是探针往往无法准确地与突变的片断杂交,而导致检测的灵敏度低,这也需要对探针序列进行试验进行摸索。

由于基因组中的高GC、重复序列等复杂结构的存在,测序最终拼接组装获得的序列往往无法覆盖有所的区域,这部分没有获得的区域就称为Gap。例如一个细菌基因组测序,覆盖率是95%,那么还有5%的序列区域是没有通过测序获得的。

针对MSI高发位点的探针设计策略主要考虑如下要点:由于微卫星本身为连续重复的碱基序列,直接将探针区域放在位点周围区间有较大几率导致探针之间发生杂交,也会增加脱靶率,而且富集A,T的序列一般富集效率较低,因此在微卫星位点的两侧各加了一个探针,只和微卫星位点两侧有少许重叠,以增加微卫星位点的覆盖度;另外,在设计策略上将MSI高发位点探针中心设计在目标位点左右,尽可能减少探针中连续重复碱基序列的长度。如此在最大程度上避免探针之间杂交的同时,亦可提高目标位点区域的覆盖率。对于一个微卫星位点来说,分别采用两条探针区域位于位点的左右时,可以避免微卫星位点重复碱基而导致的探针杂交的问题,同时再采用第三条探针放在位点周围区间并覆盖整个微卫星位点,可以保证具有较好的覆盖率、测序深度、特异性和灵敏性。另外有的微卫星位点还与基因组中的一些重复序列相近,需要尽量绕开,但是又不能距离靶向位点太远,否则会降低微卫星位点的覆盖度。

构建一个基于杂交原理的目标序列捕获系统,有两点需要考虑,即探针的长度和探针的合成成本。一般来说一个8碱基的探针就有了足够的杂交特异性,而探针越长,杂交的特异性就越高。目前商业试剂盒的探针长度都在60nt到200nt之间,这其中的一个重要考虑是,杂交的特异性限定(或者说杂交的错配容忍度)。由于微卫星位点为一连串的A或者T,有的长度达到二三十个碱基,这在基因组中算是重复序列,如果探针太短,会降低其特异性,增加脱靶率。如果探针太长,容易形成二级结构,也对富集效率不利。我们对不同长度的探针进行了系统的测试,最后优选了119-120bp长度的探针。

示例性地,最后将探针长度确定为119-120个碱基,以保证对SNP的容忍度和对基因颠换的敏感性。通过对primer软件的改进,对设计的探针进行分析,以准确的知道探针的退火温度、GC成分连续重复单基数量(如CCCCCCC)。使用每个探针分别对全基因组进行了富集和扩增并根据结果进行筛选。通过IDT DNA Technologies,单独合成了每一个探针并用质谱分析保证质量,在5’端连有生物素(Biotin)以用于链霉亲和素磁珠富集。

四、DNA捕获探针杂交

1. 将DNA样本库与生物素化的DNA探针库杂交

将DNA样本库与杂交缓冲液混合,反应条件为95℃ 5分钟,之后保持在欲使用杂交温度上。反应在PCR扩增仪中进行。

然后将该混合物与探针库混合。将杂交反应置于PCR扩增仪中,进行孵育,分别在58℃、62℃、65℃的条件下进行孵育,并在每个相应的孵育温度下,测试分别孵育4小时、8小时、16小时、24小时,在一个优选实施例中采用65℃孵育8小时。

五、得到经杂交富集的MSI相关基因片段

1. 准备链霉亲和素(Streptavidin-Coated)磁珠

使用Dynabeads链霉亲和素磁珠或者其它商业化公司链霉亲和素磁珠。将磁珠置于混匀仪上混匀,每个样本需要50微升磁珠。

磁珠洗涤:混合50微升磁珠和200微升结合缓冲液,在混匀仪上混匀,使用Dynal磁选机或者其它商业化公司磁选机,将磁珠与缓冲液分离纯化,缓冲液弃掉不用。重复三次,每次加入200微升结合缓冲液。

2. 分离杂交产物

混合1中的杂交反应混合物与2中的链霉亲和素磁珠,反复颠倒试管5次。在室温下振摇30分钟。使用Dynal磁选机或者其它商业化公司磁选机,将磁珠分离纯化。

然后向磁珠中加入500微升洗涤缓冲液,在65℃孵育10分钟,每隔5分钟混匀一次。使用Dynal磁选机或者其它商业化公司磁选机,将磁珠分离纯化。

以上步骤重复三次。

3. DNA富集样本释放

将磁珠与50微升洗脱缓冲液混合,室温孵化10分钟,每隔5分钟混匀一次。使用Dynal磁选机或者其它商业化公司磁选机,将磁珠分离弃掉。此时上清液中即含有富集过的MSI相关基因片段DNA样本库。

将样本库过柱纯化,商业化公司纯化试剂盒。

六、PCR扩增与纯化

因杂交捕获会损耗一定量的核酸,第二扩增能使捕获下的目标片段获得再次扩增以满足上机测序和质控检测的要求。本发明的这一文库构建方法特别适用于总游离核酸不低于10ng或者常规组织基因组DNA不低于1μg的样本的测序文库构建。

将富集DNA样本库进一步扩增,为测序仪器上样做准备。

表6 富集过程反应液组成

PCR条件:置于PCR扩增仪中,98℃预变性30秒,98℃变性30秒,65℃退火30秒,72℃延伸30秒,共循环4-6次。最后在72℃延伸5分钟。

PCR扩增产物过柱纯化,商业化公司纯化试剂盒。

七、采用下一代测序技术检测MSI相关基因的基因结构突变

使用下一代商业化的测序仪器进行测序,如Roche 454、Illumina Hiseq等。测序结果用已有的测序软件分析包进行分析。

示例性地,使用TruSeq PE Cluster Kit v3-cBot-HS,使用桥式PCR对DNA样本库模板进行扩增:每个DNA样本片段将会在芯片上形成克隆簇,每条泳道上产生数百万这样的克隆簇。使用Illumina HiSeq2000下一代测序系统,PE-90bp其原理是边合成边测序。和传统Sanger方法相比,利用“可逆性末端终结反应”技术,四种dNTP碱基末端被保护基团封闭,并分别以不同颜色荧光标记。

下面结合具体实施方式对本发明进行进一步的详细描述,给出的实施例仅为了阐明本发明,而不是为了限制本发明的范围。

实施例1:富集并检测MSI相关基因

一、准备待检测的DNA样本库

1. 提取患病血浆样本中ctDNA,然后将其片段化。

1.1 DNA提取

一例结肠癌患者的临床血液样本经采集后,立即于2700xg,10min,收集上层血清于干净的tube管中,-80℃保存备用,采用 QIAGEND Neasy Blood & Tissue Kit(QIAGEN, Hilden, Germany)抽提外周血 DNA,QIAamp Circulating Nucleic Acid Kit抽提循环肿瘤DNA。按说明书指示方法操作。

使用分光光度定量仪以及凝胶电泳系统检测DNA的质量和浓度。DNA的260nm吸光率大于0.05以上,吸光率A260/A280比值在1.8到2之间为合格。

1.1 DNA片段化

将3微克高质量的基因组DNA用低TE缓冲液稀释至120微升。按照组织匀浆机使用说明书,将DNA片段化,使片段长度为150-200碱基。

使用Beckman Coulter Ampure Beads试剂盒将DNA过柱纯化。

1.2 DNA样本库质量检测

用生物分析仪进行DNA定性定量分析,确认DNA片段长度峰值合理。

3. DNA末端修补

利用T4聚合酶及Klenow大肠杆菌聚合酶片断,对于DNA 5'突出粘末端补平以及3'突出粘末端打平,产生平末端,用于后续的平端连接。反应在PCR扩增仪中进行,20摄氏度,30分钟。

表7 末端修补反应液组成

使用Beckman Coulter Ampure Beads试剂盒将DNA过柱纯化。

4. 在DNA样本3'末端加上碱基A

反应在PCR扩增仪中进行,37℃,30分钟。

表8 末端加A反应液组成

使用Beckman Coulter Ampure Beads试剂盒(货号:A63880)将DNA过柱纯化。

1.在DNA两端加上接头

表9 DNA两端加接头反应液组成

使用Beckman Coulter Ampure Beads试剂盒(货号:A63880)将DNA过柱纯化。

6. 扩增步骤5获得的DNA片段样本库

聚合酶链反应(PCR),在PCR扩增仪中进行。

表10 PCR反应液组成

PCR条件:置于PCR扩增仪中,98℃预变性30秒,98℃变性30秒,65℃退火30秒,72℃延伸30秒,共循环4-6次(DNA样本库)。最后在72℃延伸5分钟。

使用Beckman Coulter Ampure Beads试剂盒(货号:A63880)将PCR扩增产物过柱纯化。

9. 扩增后DNA样本库的质量检测

使用生物分析仪,进行DNA定性定量分析,并确认纯化后片段长度峰值合理,约200bp。因此,分别获得了ctDNA样本库。

对于得到的DNA样本库,如果DNA浓度小于150纳克/微升,须将样品经过真空浓缩机低温干燥(低于45℃),再用无核酸酶水溶解至所需浓度。本实施例的下文将采用获得的源自全基因组的DNA样本库进行富集和检测。

二、针对MSI位点准备DNA探针库

根据上述的探针设计方法和思路,设计并合成探针进行试验,在5’端有生物素(Biotin)。

三、将DNA样本库与生物素化的DNA探针库杂交

将DNA样本库与杂交缓冲液(Nimblegen的SeqCap Hybridization and wash kit)混合(混合后,DNA样本库浓度至多不超过50ng/ul),反应条件为95℃ 5分钟,之后保持在65℃。反应在PCR扩增仪中进行。

然后将3pmole探针库加入上述混合物,反应条件为65℃ 5分钟。将杂交反应置于PCR扩增仪中,65℃孵育8小时。

四、得到经杂交富集的MSI相关基因片段

1. 准备链霉亲和素磁珠

使用Dynabeads(Life technologies, 货号:11206D)链霉亲和素磁珠或者其它商业化公司链霉亲和素磁珠。将磁珠置于混匀仪上混匀。

磁珠洗涤:混合50微升磁珠和200微升结合缓冲液(Nimblegen的SeqCap Hybridization and wash kit),在混匀仪上混匀,使用Dynal磁选机或者其它商业化公司磁选机,将磁珠与缓冲液分离纯化,缓冲液弃掉不用。重复三次,每次加入200微升结合缓冲液。

2. 分离杂交产物

混合步骤三中得到的杂交反应混合物与步骤四的1中得到的链霉亲和素磁珠,反复颠倒试管5次。在室温下振摇30分钟。使用Dynal磁选机或者其它商业化公司磁选机,将磁珠分离纯化。

然后向磁珠中加入500微升洗涤缓冲液(Nimblegen的SeqCap Hybridization and wash kit),在65℃孵育10分钟,每隔5分钟混匀一次。使用Dynal磁选机或者其它商业化公司磁选机,将磁珠分离纯化。以上步骤重复三次。

3. DNA富集样本释放

将磁珠与50微升洗脱缓冲液(10mM氢氧化钠溶液)混合,室温孵化10分钟,每隔5分钟混匀一次。使用Dynal磁选机或者其它商业化公司磁选机,将磁珠分离弃掉。此时上清液中即含有富集过的MSI相关基因片段DNA样本库。

使用Beckman Coulter Ampure Beads试剂盒(货号:A63880)将样本库过柱纯化。

五、PCR扩增与纯化

将富集DNA样本库进一步扩增,为测序仪器上样做准备。

表11 富集过程反应液组成

PCR条件:置于PCR扩增仪中,98℃预变性30秒,98℃变性30秒,65℃退火30秒,72℃延伸30秒,共循环4-6次(DNA样本库)。最后在72℃延伸5分钟。

使用Beckman Coulter Ampure Beads试剂盒(货号:A63880)将PCR扩增产物过柱纯化。

六、采用下一代测序技术检测MSI相关基因的基因结构突变

使用TruSeq PE Cluster Kit v3-cBot-HS,使用桥式PCR对DNA样本库模板进行扩增:每个DNA样本片段将会在芯片上形成克隆簇,每条泳道上产生数百万这样的克隆簇。使用Illumina HiSeq4000下一代测序系统,PE-150bp其原理是边合成边测序。和传统Sanger方法相比,利用“可逆性末端终结反应”技术,四种dNTP碱基末端被保护基团封闭,并分别以不同颜色荧光标记。

经过QC筛选后,对测序结果使用了Bowtie对所得片段进行序列映射。

利用Bioconductor软件,成功映射片段进行突变分析。

根据以上方法,采用不同探针进行测试结果如下:

探针长度对于检测的特异性、中靶率具有较大的影响,因此,在2X覆盖倍数的条件下设计了不同长度的探针,我们设计了3种探针长度,分别是100nt、120nt和140nt,通过中靶率和经济性来来确定什么长度下的探针最适合用于检测。

三次重复检测结果如下:

表12 探针长度检测效果对比

根据测序结果可以得到,120nt的探针中靶率最高,100nt探针的中靶率最低。其中140nt探针明显优于100nt探针,这两者之间有显著性差异;120nt探针优于140nt探针,这两者之间也有显著性差异。从中靶率来看,120nt探针的效果最好。

最后将探针长度确定为120个碱基,保证目标序列的捕获中靶率。通过对primer软件的改进,对设计的探针进行分析,以准确的知道探针的退火温度、GC成分连续重复单基数量(如CCCCCCC)。

另外,还设计了3组实验来确定最优化的探针浓度。采用120nt长度探针,实验结果如下:

表13 探针浓度检测效果对比

根据测序结果可以得到,采用1pmol浓度探针进行捕获时,平均中靶率明显低于采用3pmole,而采用6pmole时的中靶率略低于采用3pmole浓度时的结果,但是仍然显著高于采用1pmole时的结果。

并且我们分析了每个探针目标区域DNA序列的测序深度,结果如下:

表14探针覆盖倍数检测效果对比

注:>0.2x平均覆盖占比的意思是大于目标区域DNA序列平均覆盖倍数20%的区域在总区域中的占比,同理0.5x和1x平均覆盖占比的意思是大于目标区域平均覆盖倍数50%/100%的区域在总区域中的占比。

根据测序结果可以得到,随着探针浓度的增加,目标区域的平均覆盖倍数逐渐增加,并且均一性更好。综合中靶率、经济性,最后选择3pmole的探针作为外显子区域的覆盖倍数。

由于在探针设计过程中,需要捕获的微卫星位点众多,并且微卫星位点存在着重复碱基,容易导致探针之间的杂交、探针的特异性、目标序列的覆盖率、灵敏度等诸多综合问题,需要对探针设计进行大量反复摸索。

最后,由于每一个微卫星位点的序列特异性,导致每一个微卫星位点富集的效率会有所不同,具体体现在靶向富集的均一性。为了增强覆盖的均一性,富集每一个微卫星位点的探针先按照等摩尔的比例进行混合,富集和测序。根据测序结果,我们对探针的比例进行调整,即增加覆盖倍数较低的位点的探针比例,降低覆盖倍数过高的位点的探针比例。经过几轮的探针比例的优化,我们使得所有的微卫星位点的覆盖倍数达到均一,一致。

对于微卫星不稳定性的检测灵敏度也是需要经过试验进行考察。我们针对PKHD-18位点构建了质控质粒。

阳性质控质粒:构建PKHD-18位点缺失突变的质粒。

内控质粒:与上阳性质粒相对应的同序列的野生型质粒。

将阳性质控质粒和内控质粒按照拷贝数比例混合,获得不同缺失突变频率的质粒样本溶液,然后用Tris-HCl 缓冲液(10mM,pH8.5)调整DNA浓度,得到DNA浓度为5μg/μL的溶液。

在针对PKHD-18位点的探针设计中,采用了如下的一些探针:

表15 不同探针对比

以上四组探针检测结果如下:

表16 检测结果

可以看出,经过优选后的探针在检测时,可以检测到1%丰度的缺失突变,具有较高的灵敏性。另外,通过ARMS-PCR的方法将以上突变进行了验证。

最终确定的优选的探针序列如SEQ ID NO.1~66所示。

表17探针序列

为进一步确定与评估探针的序列捕获效果以及高通量测序情况,分别在MSI-H细胞系(HCT116)和26例肿瘤患者样本中同时进行IHC技术、PCR技术和本发明优选的探针技术检测,对比验证不同平台检测结果:细胞系验证结果见图3,PCR检测和本专利探针检测均显示为MSI-H;26例肿瘤患者验证结果见表18和表19。

表18NGS检测结果与PCR和IHC方法的对比

表19 各个样本在22个位点上的MSI检测结果

本专利探针检测结果与PCR、IHC均高度吻合,本发明优选的探针技术与PCR检测结果对比敏感性和特异性均为100%,与IHC技术对比敏感性为90.5%,特异性为100%。

其中MSI-H和MSS各一例患者的PCR检测数据和本专利检测数据分别见图3-9(MSI-H)和图10-16(MSS)。表明本发明的方法对上述MSI检测的结果真实可靠。

SEQUENCE LISTING

<110> 南京世和基因生物技术有限公司

<120> 一种用于与微卫星不稳定性相关微卫星位点进行杂交的DNA探针库、检测方

法和试剂盒

<130> 无

<160> 75

<170> PatentIn version 3.5

<210> 1

<211> 120

<212> DNA

<213> 人工序列

<400> 1

agacttgctg agcttttctt accaggtggc aaagggcatg gctttcctcg cctccaagaa 60

tgtaagtggg agtgattctc taaagagttt tgtgttttgt ttttttgatt tttttttttt 120

<210> 2

<211> 120

<212> DNA

<213> 人工序列

<400> 2

tttttttttt tttgagaaca gagcatttta gagccatagt taaaatgcag aatgtcattt 60

tgaagtgtgg taaccaaaag cagaggaaat ttagtttctt catgttccaa ctgctgtctc 120

<210> 3

<211> 120

<212> DNA

<213> 人工序列

<400> 3

aagaatgtaa gtgggagtga ttctctaaag agttttgtgt tttgtttttt tgattttttt 60

tttttttttt ttttttttga gaacagagca ttttagagcc atagttaaaa tgcagaatgt 120

<210> 4

<211> 120

<212> DNA

<213> 人工序列

<400> 4

ttatcagatg attccaactt tggacagttt gaactgacta cttttgactt cagccagtat 60

atgaaattgg atattgcagc agtcagagcc cttaaccttt ttcaggtaaa aaaaaaaaaa 120

<210> 5

<211> 120

<212> DNA

<213> 人工序列

<400> 5

aaaaaaaaaa aaaagggtta aaaatgttga atggttaaaa aatgttttca ttgacatata 60

ctgaagaagc ttataaagga gctaaaatat tttgaaatat tattatactt ggattagata 120

<210> 6

<211> 120

<212> DNA

<213> 人工序列

<400> 6

agtatatgaa attggatatt gcagcagtca gagcccttaa cctttttcag gtaaaaaaaa 60

aaaaaaaaaa aaaaaaaaag ggttaaaaat gttgaatggt taaaaaatgt tttcattgac 120

<210> 7

<211> 120

<212> DNA

<213> 人工序列

<400> 7

atttagtgaa aaattatctg aatatttaag gtctgcctta acgtgatccc cattgctgaa 60

ttttacctcc tgactccaaa aactcttctc ttccctgggc ccagtcctat tttttttttt 120

<210> 8

<211> 120

<212> DNA

<213> 人工序列

<400> 8

tttttttttt ttgtgagaca gagtctcact ctgtcaccca ggttggaatg caatggcaca 60

atctccgctc actgcaagct ccgcctcccg ggttcacgcc attctcctgc ctcagcctcc 120

<210> 9

<211> 120

<212> DNA

<213> 人工序列

<400> 9

ctgaatttta cctcctgact ccaaaaactc ttctcttccc tgggcccagt cctatttttt 60

tttttttttt tttttttgtg agacagagtc tcactctgtc acccaggttg gaatgcaatg 120

<210> 10

<211> 120

<212> DNA

<213> 人工序列

<400> 10

actgctactc tctaaaaaag gcaagcagat aaaagagaac acgaaaaata ttcctactcc 60

gcattcacac tttctggtca ctcgcgttta caaacaagaa aagtgttgct aaaaaaaaaa 120

<210> 11

<211> 120

<212> DNA

<213> 人工序列

<400> 11

aaaaaaaaaa aggccagggg agacatacat ttaaatataa aaatagaact gtgccagcga 60

ctccggctgg aattctgctg aaagggatgt gtcttcagaa accaggatgg ttctgctctg 120

<210> 12

<211> 120

<212> DNA

<213> 人工序列

<400> 12

actccgcatt cacactttct ggtcactcgc gtttacaaac aagaaaagtg ttgctaaaaa 60

aaaaaaaaaa aaaaaaggcc aggggagaca tacatttaaa tataaaaata gaactgtgcc 120

<210> 13

<211> 120

<212> DNA

<213> 人工序列

<400> 13

ctaaggctat actacttaca agttcatgat gtggttctgt ctcctttctt aagggtggat 60

caaatttcac ttggccaact aaaaaagaaa aaaaagtaaa accaggattt tttttttttt 120

<210> 14

<211> 120

<212> DNA

<213> 人工序列

<400> 14

tttttttttt ttttgaggca gagtcttgct ctgtctccca cgctggagtg cagtggcgca 60

atctcagctc actgcaatct ccaccccctg ggttcccacc atttccctgc ctcagcctcc 120

<210> 15

<211> 120

<212> DNA

<213> 人工序列

<400> 15

tggatcaaat ttcacttggc caactaaaaa agaaaaaaaa gtaaaaccag gatttttttt 60

tttttttttt tttttttttg aggcagagtc ttgctctgtc tcccacgctg gagtgcagtg 120

<210> 16

<211> 120

<212> DNA

<213> 人工序列

<400> 16

ttatgttgca ggtaaaggac ctggataatc gaggcttgtc aaggacataa atgtcacgtc 60

cagctctgat atgcttcgca ctgagcacat cacatttagg acgttgaaga tttttttttt 120

<210> 17

<211> 120

<212> DNA

<213> 人工序列

<400> 17

tttttttttt taatatgcag tttgtaagaa caaaactgga tggcatcaga attgtctgga 60

agttttgtct tgggcagtat gggctgggcc aaatgaaatg atttttataa ttctaaacag 120

<210> 18

<211> 120

<212> DNA

<213> 人工序列

<400> 18

acgtccagct ctgatatgct tcgcactgag cacatcacat ttaggacgtt gaagattttt 60

tttttttttt ttttttaata tgcagtttgt aagaacaaaa ctggatggca tcagaattgt 120

<210> 19

<211> 120

<212> DNA

<213> 人工序列

<400> 19

atgagatgtg atgtttctcc tgccacctgg aaacaaagca ttgaagtctg cagttgaaaa 60

gcccaacgtc tgtgagatcc aggaaaccat gcttgcaaac cactggtaaa aaaaaaaaaa 120

<210> 20

<211> 120

<212> DNA

<213> 人工序列

<400> 20

aaaaaaaaaa aaagccacag tgacttgctt attggtcatt gctagtatta tcgactcaga 60

acctctttac taatggctag taaatcataa ttgagaaatt ctgaattttg acaaggtctc 120

<210> 21

<211> 120

<212> DNA

<213> 人工序列

<400> 21

gaaaagccca acgtctgtga gatccaggaa accatgcttg caaaccactg gtaaaaaaaa 60

aaaaaaaaaa aaaaaaaagc cacagtgact tgcttattgg tcattgctag tattatcgac 120

<210> 22

<211> 120

<212> DNA

<213> 人工序列

<400> 22

ctcaaatccc ctataccagt ccattttata tcctcaagcc aagattaact tcctacacca 60

caaccctgct tttgttcctt tttttgttgt tgcttgtgtg gttttctttt tttttttttt 120

<210> 23

<211> 120

<212> DNA

<213> 人工序列

<400> 23

tttttttttt tttttttttt tttgagacaa ggtggtcttg ctctaccacc caggctagag 60

tgcagaggtg tgatcttggc tcactgccag gaaccagaga ccccagcctc catttatcct 120

<210> 24

<211> 120

<212> DNA

<213> 人工序列

<400> 24

caaccctgct tttgttcctt tttttgttgt tgcttgtgtg gttttctttt tttttttttt 60

tttttttttt tttttttttt tttgagacaa ggtggtcttg ctctaccacc caggctagag 120

<210> 25

<211> 120

<212> DNA

<213> 人工序列

<400> 25

accactgtta ttcttacgct ggatttcttg aattgcattt ttcagaaggt cccaaatgct 60

gtttacatat ttttcatcca tggtcatctg taatatccaa gagagagaag agacaaaaaa 120

<210> 26

<211> 120

<212> DNA

<213> 人工序列

<400> 26

aaaaaccaat ggttgaaagt ctttctatat ttgtccatat atagtaaata ttgtattata 60

tagatatgat tataaatcta tgacacataa gaacattaac aacctatttt aacaggggga 120

<210> 27

<211> 120

<212> DNA

<213> 人工序列

<400> 27

ttacatattt ttcatccatg gtcatctgta atatccaaga gagagaagag acaaaaaaaa 60

aaaaaaaaaa aaaaccaatg gttgaaagtc tttctatatt tgtccatata tagtaaatat 120

<210> 28

<211> 120

<212> DNA

<213> 人工序列

<400> 28

ttagtatcat agaatcgtgt gccttggcaa acaacatggc ctgtgtttgc agtatattta 60

tattcctttg ccattgttag cattcctgca gaactgtgaa gtgttaacaa cctttttttt 120

<210> 29

<211> 120

<212> DNA

<213> 人工序列

<400> 29

ttttttttcc tttcagggaa atgatattga ccctgaagca gttaaaggtg aagtgttaaa 60

agttggaaat aagagctgtg agaatataca cttacattct gaagccgttt tatgcacggt 120

<210> 30

<211> 120

<212> DNA

<213> 人工序列

<400> 30

tattcctttg ccattgttag cattcctgca gaactgtgaa gtgttaacaa cctttttttt 60

tttttttcct ttcagggaaa tgatattgac cctgaagcag ttaaaggtga agtgttaaaa 120

<210> 31

<211> 120

<212> DNA

<213> 人工序列

<400> 31

ttaaaaataa attagtgcag ttttaaaatc ctttttctgt atgggattat ggaatattta 60

agttaaattg taacatttaa tacattttga tttttaaaaa atcatgacta ataatttttt 120

<210> 32

<211> 120

<212> DNA

<213> 人工序列

<400> 32

ttttttaaga attgttctct gtgtacttca ggctctatct gaaaccttca caagatgttc 60

atagagtttt agtggctaga ataattcatg ctgttaccaa aggatgctgt tctcagactg 120

<210> 33

<211> 120

<212> DNA

<213> 人工序列

<400> 33

gttaaattgt aacatttaat acattttgat ttttaaaaaa tcatgactaa taattttttt 60

ttttttttaa gaattgttct ctgtgtactt caggctctat ctgaaacctt cacaagatgt 120

<210> 34

<211> 120

<212> DNA

<213> 人工序列

<400> 34

gccaagattg tgccatttca ccccagcctg gcaacagagc aagacaccat ctaaaaaaaa 60

aaaaaaaaaa aaaaaaaatt caatgctgac acaaataagg tttcaattaa acaacttctt 120

<210> 35

<211> 120

<212> DNA

<213> 人工序列

<400> 35

ttttttaaat tatctgtttc aggaagaaga acgattatcc attcaaaatt ttaggtaaat 60

tttttacttt tagtaaaaaa tttttttctt tttatagaag taagtatttt ataatctttt 120

<210> 36

<211> 120

<212> DNA

<213> 人工序列

<400> 36

aaaaaaaaaa aaaattcaat gctgacacaa ataaggtttc aattaaacaa cttctttttt 60

tttttttaaa ttatctgttt caggaagaag aacgattatc cattcaaaat tttaggtaaa 120

<210> 37

<211> 120

<212> DNA

<213> 人工序列

<400> 37

tgctaataat ttgtttaatg aaataggtag ttcctaaggt ttatatctgt tagtaagagg 60

tttatttgag gggaagtgaa agaacttgaa agattcatgg tctctaaatt tttttttttt 120

<210> 38

<211> 120

<212> DNA

<213> 人工序列

<400> 38

tttttttttt cagagatttg gaccaggcaa gcatggaagc agtagtttca cttctagctg 60

gtctccctct gcagcctgaa gaaggagatg gtgtggaatt gatggaagcc aaatcacagt 120

<210> 39

<211> 120

<212> DNA

<213> 人工序列

<400> 39

gtttatttga ggggaagtga aagaacttga aagattcatg gtctctaaat tttttttttt 60

tttttttttt tttttcagag atttggacca ggcaagcatg gaagcagtag tttcacttct 120

<210> 40

<211> 120

<212> DNA

<213> 人工序列

<400> 40

catgccattg cactccatcc tgagggacag aacaagactc tatctcagga aaaaaaaaaa 60

gtaataaaac agtagcaaga aaacaaaaca gtagcaagag caagaataag cagaagtatt 120

<210> 41

<211> 120

<212> DNA

<213> 人工序列

<400> 41

gacagaacaa gactctatct caggaaaaaa aaaaagtaat aaaacagtag caagaaaaca 60

aaacagtagc aagagcaaga ataagcagaa gtattaaggt ggcatcttcc ataattatcc 120

<210> 42

<211> 120

<212> DNA

<213> 人工序列

<400> 42

aagtaataaa acagtagcaa gaaaacaaaa cagtagcaag agcaagaata agcagaagta 60

ttaaggtggc atcttccata attatcctca aggaacaggg tctacctcca tgtttccagt 120

<210> 43

<211> 120

<212> DNA

<213> 人工序列

<400> 43

aggcaacaga acaaaactcc atctcaaaaa aaaaaaaaaa aaaaaagatt tgtctctgaa 60

attaggttga aaatattttt attggtttca tcaggcaaga aacttgggtt tttagagaag 120

<210> 44

<211> 120

<212> DNA

<213> 人工序列

<400> 44

ctcaaaaaaa aaaaaaaaaa aaaagatttg tctctgaaat taggttgaaa atatttttat 60

tggtttcatc aggcaagaaa cttgggtttt tagagaagga aaactatggt aggaaactgg 120

<210> 45

<211> 120

<212> DNA

<213> 人工序列

<400> 45

aaaagatttg tctctgaaat taggttgaaa atatttttat tggtttcatc aggcaagaaa 60

cttgggtttt tagagaagga aaactatggt aggaaactgg tgaccagctc ttcttttttc 120

<210> 46

<211> 120

<212> DNA

<213> 人工序列

<400> 46

tgtatgcagg tactgaatga cttggcagcc tgaggatgaa cactttgtaa tgagaatcta 60

tatttgtggt ggatcacacc ttcctgaaaa cttaagcatt tttttccccc attgtttttt 120

<210> 47

<211> 120

<212> DNA

<213> 人工序列

<400> 47

ttttttttat agagaaagct aggaacattg ccattttcct catagtatct catgattaaa 60

taatgacaag ggagaataaa ctaaaatgtg tttttcccct aagttgctgc aaagattaaa 120

<210> 48

<211> 120

<212> DNA

<213> 人工序列

<400> 48

ttgtggtgga tcacaccttc ctgaaaactt aagcattttt ttcccccatt gttttttttt 60

tttttataga gaaagctagg aacattgcca ttttcctcat agtatctcat gattaaataa 120

<210> 49

<211> 120

<212> DNA

<213> 人工序列

<400> 49

ctttcttctc aagcttaatg atacagtcaa gtgaatttat tttctaaact atgatgacct 60

cttattcatg atagtagcta ttcccactat aagggagaaa ggattatctt ctcaaaaaaa 120

<210> 50

<211> 120

<212> DNA

<213> 人工序列

<400> 50

aaaaaacaca gaataaaagc acactgtata aaattacctg gaggagaagt gacagtaaaa 60

ataaagtgcc agtttgaccc agagatcaag actgccaagt tgtagaagct aacataacca 120

<210> 51

<211> 120

<212> DNA

<213> 人工序列

<400> 51

tcatgatagt agctattccc actataaggg agaaaggatt atcttctcaa aaaaaaaaaa 60

aaaaaacaca gaataaaagc acactgtata aaattacctg gaggagaagt gacagtaaaa 120

<210> 52

<211> 120

<212> DNA

<213> 人工序列

<400> 52

gatatgcaag agctgtacta agctgatagg catacaggat caaagatgct agatccaaac 60

tgtatttcct tacttgcaaa aatgacctca gcttttggaa caatgaccaa aagaaaaaaa 120

<210> 53

<211> 120

<212> DNA

<213> 人工序列

<400> 53

aaagaattag tggcagtgaa tcgaaatcaa aagcaaaaaa gctacattca acaataatgc 60

tgttttcaat gcatttttaa taatattaga atggcttcaa gtctcttcta ataaagcata 120

<210> 54

<211> 120

<212> DNA

<213> 人工序列

<400> 54

tgtatttcct tacttgcaaa aatgacctca gcttttggaa caatgaccaa aagaaaaaaa 60

aaaaaaaaag aattagtggc agtgaatcga aatcaaaagc aaaaaagcta cattcaacaa 120

<210> 55

<211> 120

<212> DNA

<213> 人工序列

<400> 55

tttaaagcag ttcttttcta gcccgtgtgt aactatacaa ataattgagt gttcatgttc 60

tcaggaacag agatgaaaaa ctcctgctaa gatcggaatt ttaaattaat gatttttttt 120

<210> 56

<211> 120

<212> DNA

<213> 人工序列

<400> 56

tttttgtcct tgaagaagcc ttattctcac catccctcac tcacttccct acttcccaca 60

gtggcattgg gcctctactt ctcgagggat gcttactggg agaagctgta tgtggaccag 120

<210> 57

<211> 120

<212> DNA

<213> 人工序列

<400> 57

ctcaggaaca gagatgaaaa actcctgcta agatcggaat tttaaattaa tgattttttt 60

tttttttgtc cttgaagaag ccttattctc accatccctc actcacttcc ctacttccca 120

<210> 58

<211> 120

<212> DNA

<213> 人工序列

<400> 58

tgacctgcaa tgattatatt tcggtttttg aatttgacat ctttacccga ctctttcagg 60

taggacacta aaaaagttga ctaaactggt tactgctact tcggtgaaga gaaagctttt 120

<210> 59

<211> 120

<212> DNA

<213> 人工序列

<400> 59

ttttaaataa catttggggt ttttgtctgt atgaaagtat tttaattcat tttaggaact 60

atgccaaaaa aaagattaaa actatctcat attaaaaata tatgtatgtg tgtgtatgta 120

<210> 60

<211> 120

<212> DNA

<213> 人工序列

<400> 60

ctaaaaaagt tgactaaact ggttactgct acttcggtga agagaaagct tttttttttt 60

ttttttaaat aacatttggg gtttttgtct gtatgaaagt attttaattc attttaggaa 120

<210> 61

<211> 120

<212> DNA

<213> 人工序列

<400> 61

atacattttc tggctgaaca gaaaacacgg tgaaacgatt tgaaaacttt tattgtgaat 60

tacagggtcc tatgaaccct ctgtccgtgc ctttatgaat atcaacatag acatgttttt 120

<210> 62

<211> 120

<212> DNA

<213> 人工序列

<400> 62

ttttttttgc attaacaccg ttttctgtaa tattttcttt attttacatc aactgctgta 60

ctcgatcagc cccttaacac gactcgtata aatgctgctg aaatagaaag cagagttcga 120

<210> 63

<211> 120

<212> DNA

<213> 人工序列

<400> 63

cagggtccta tgaaccctct gtccgtgcct ttatgaatat caacatagac atgttttttt 60

tttttttttt gcattaacac cgttttctgt aatattttct ttattttaca tcaactgctg 120

<210> 64

<211> 120

<212> DNA

<213> 人工序列

<400> 64

cagcgccata atcggcaata tataacatgt ggcaatcctt ttcgatggga tacctggaga 60

cgaccatcaa gagacctgtt gggaagcaag gggaaaagaa aggagggaac tttaaaaaaa 120

<210> 65

<211> 120

<212> DNA

<213> 人工序列

<400> 65

aaaaaagtgc agtcaaatgg gctaaattag tacaataaaa gcataaagaa aagaatgaca 60

gccatttagt tagttttagt gagaatcaag aacaaaaatg tactatttaa tggatctgat 120

<210> 66

<211> 120

<212> DNA

<213> 人工序列

<400> 66

cgaccatcaa gagacctgtt gggaagcaag gggaaaagaa aggagggaac tttaaaaaaa 60

aaaaaaaaaa agtgcagtca aatgggctaa attagtacaa taaaagcata aagaaaagaa 120

<210> 67

<211> 120

<212> DNA

<213> 人工序列

<400> 67

ttctcaagct taatgataca gtcaagtgaa tttattttct aaactatgat gacctcttat 60

tcatgatagt agctattccc actataaggg agaaaggatt atcttctcaa aaaaaaaaaa 120

<210> 68

<211> 120

<212> DNA

<213> 人工序列

<400> 68

aaaaaaaaac acagaataaa agcacactgt ataaaattac ctggaggaga agtgacagta 60

aaaataaagt gccagtttga cccagagatc aagactgcca agttgtagaa gctaacataa 120

<210> 69

<211> 120

<212> DNA

<213> 人工序列

<400> 69

atagtagcta ttcccactat aagggagaaa ggattatctt ctcaaaaaaa aaaaaaaaaa 60

acacagaata aaagcacact gtataaaatt acctggagga gaagtgacag taaaaataaa 120

<210> 70

<211> 120

<212> DNA

<213> 人工序列

<400> 70

agctttcttc tcaagcttaa tgatacagtc aagtgaatcc attttctaaa ctatgatgac 60

ctcttattca tgatagtagc tattcccact ataagggaga aaggattatc ttctcaaaaa 120

<210> 71

<211> 120

<212> DNA

<213> 人工序列

<400> 71

aaaacacaga ataaaagcac actgtataaa attacctgga ggagaagtga cagtaaaaat 60

aaagtgccag tttgacccag agatcaagac tgccaagttg tagaagctaa cataaccatg 120

<210> 72

<211> 120

<212> DNA

<213> 人工序列

<400> 72

tattcatgat agtagctatt cccactataa gctagaaagg attatcttct caaaaaaaaa 60

aaaaaaaaac acagaataaa agcacactgt ataaaattac ctggaggaga agtgacagta 120

<210> 73

<211> 120

<212> DNA

<213> 人工序列

<400> 73

tttcttctca agcttaatga tacagtcaag tgaatttatt ttctaaacta tgatgacctc 60

ttattcatga tagtagctat tcccactata agggagaaag gattatcttc tcaaaaaaaa 120

<210> 74

<211> 120

<212> DNA

<213> 人工序列

<400> 74

aaaaacacag aataaaagca cactgtataa aattacctgg aggagaagtg acagtaaaaa 60

taaagtgcca gtttgaccca gagatcaaga ctgccaagtt gtagaagcta acataaccag 120

<210> 75

<211> 120

<212> DNA

<213> 人工序列

<400> 75

tcatgatagt agctattccc tctataaggg agaaaggatt atcttctcaa aaaaaaaaaa 60

aaaaaacaca gaataaaagc acactgtata aaattacctg gaggagaagt gacagtaaaa 120

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号