首页> 中国专利> 用于改善文库富集的组合物和方法

用于改善文库富集的组合物和方法

摘要

本披露描述了包括拥挤剂的杂交缓冲液,包括使用所述杂交缓冲液的方法,和包括所述杂交缓冲液的试剂盒。本发明还描述了用于在杂交捕获方法中使用的封闭剂,使用这些封闭剂的方法和包括这些封闭剂的试剂盒。另外,本披露描述了杂交捕获的方法,所述方法不包括在对文库成员测序之前使用PCR扩增文库成员。

著录项

说明书

相关申请的交叉引用

本申请根据35U.S.C.§119(e)要求2018年8月15日提交的美国临时申请号62/764,753的权益,其全部内容通过引用并入本文中。

发明内容

尽管下一代测序(next-generation sequencing,NGS)通量快速提高,但是经典的文库制备和富集方法仍然耗时,并且可能导致通量受限的瓶颈。本披露描述了包含封闭剂(blocker)和/或杂交缓冲液的组合物,使用这些组合物的方法以及在测序前改善核酸选择效率的方法。

在一方面,本披露描述了杂交缓冲液,其包含人Cot-1 DNA、去稳定剂、盐和封闭剂中的至少一种以及拥挤剂(crowding agent)。

在另一方面,本披露描述了包括使用杂交缓冲液的方法。本披露还描述了包括杂交缓冲液的试剂盒。

在另一方面,本披露描述了包括寡核苷酸的封闭剂,其中所述封闭剂能够结合衔接子。衔接子包括通用引物序列、以及索引区(index region)或唯一分子标识符(uniquemolecular identifier,UMI)中的至少一种。能够结合衔接子的索引区和/或UMI的封闭剂的区域包括:至少三个胸腺嘧啶碱基或通用碱基和至少一个非通用碱基。

在又另一方面,本披露描述了包括两个未连接的寡核苷酸的封闭剂。所述封闭剂能够结合衔接子的至少一部分,其中所述衔接子包括通用引物序列、以及索引区或唯一分子标识符(UMI)中的至少一种。未连接的寡核苷酸包括不对应于衔接子的索引区和/或UMI的碱基。

本披露还描述了包括使用本文所述的封闭剂的方法和包括本文所述的封闭剂的试剂盒。

在另一方面,本披露描述了一种方法,其包括在杂交缓冲液的存在下使文库与封闭剂接触;以及使所述文库与探针接触,其中所述探针与文库成员内的目的区域杂交。该方法不包括在对文库成员测序之前使用PCR扩增文库成员。

如本文所用,术语“核酸”旨在与其在本领域中的用途一致,并且包括天然存在的环状核酸或其功能类似物。特别有用的功能类似物能够以序列特异性的方式与核酸杂交,或者能够用作特定核苷酸序列复制的模板。天然存在的核酸通常具有含有磷酸二酯键的主链。类似物结构可具有替代的主链连接,包括本领域已知的各种主链连接。天然存在的核酸通常具有脱氧核糖(例如在脱氧核糖核酸(DNA)中发现)或核糖(例如在核糖核酸(RNA)中发现)。核酸可含有本领域已知的这些糖部分的多种类似物中的任意。核酸可包括天然或非天然碱基。在这方面,天然脱氧核糖核酸可以具有一个或多个选自由腺嘌呤、胸腺嘧啶、胞嘧啶或鸟嘌呤组成的组的碱基,而核糖核酸可以具有一个或多个选自由尿嘧啶、腺嘌呤、胞嘧啶或鸟嘌呤组成的组的碱基。可以包含在核酸中的有用的非天然碱基是本领域已知的。当用于核酸时,术语“靶”在本文所述的方法或组合物的上下文中旨在作为核酸的语义标识符,并且不一定限制核酸的结构或功能,除非另有明确指出。

如本文所用,术语“T

如本文所用,术语“衔接子”及其派生词(例如通用衔接子,非靶衔接子等)通常是指可以连接(ligated)至本披露的核酸分子的任何线性、单链寡核苷酸。在一些实施例中,衔接子与样品中存在的任何靶序列的3'端或5'端基本上不互补。在一些实施例中,合适的衔接子长度为10-100个核苷酸、12-60个核苷酸和15-50个核苷酸。通常,衔接子可以包括核苷酸和/或核酸的任何组合。在一些方面,衔接子可在一个或多个位置处包括一个或多个可裂解基团。在另一方面,衔接子可以包括与引物(例如通用引物)的至少一部分基本上相同或基本上互补的序列。在一些实施例中,衔接子可以包括索引或标签以辅助下游纠错、识别或测序。

如本文所用,术语“通用序列”是指两个或更多个核酸分子(例如衔接子-靶衔接子分子)所共有的序列区域,其中所述分子还具有彼此不同的序列区域。存在于分子集合的不同成员中的通用序列可以允许使用与通用序列的一部分(例如通用延伸引物结合位点)互补的通用捕获核酸的群体来捕获多个不同的核酸。通用延伸引物结合位点的非限制性实例包括与P5和P7引物相同或互补的序列。类似地,存在于分子集合的不同成员中的通用序列可以允许使用与通用序列的一部分(例如通用引物结合位点)互补的通用引物的群体来复制或扩增多个不同的核酸。因此,通用捕获核酸或通用引物包括可以与通用序列特异性杂交的序列。如本文所述,可以修饰靶核酸分子以例如在不同靶序列的一个或两个末端连接通用衔接子。

当提及扩增引物例如通用引物延伸引物时,可以使用术语“P5”和“P7”。术语“P5'”(P5prime)和“P7'”(P7prime)分别是指P5和P7的互补序列。应理解,任何合适的扩增引物可用于本文提出的方法中,并且P5和P7的使用仅是示例性实施例。扩增引物如P5和P7在流动池上的使用是本领域已知的,如WO 2007/010251、WO2006/064199、WO 2005/065814、WO2015/106941、WO 1998/044151和WO2000/018957的披露中所例示。例如,任何合适的正向扩增引物,无论是固定的还是在溶液中,都可用于本文提出的方法中与互补序列杂交和扩增序列。类似地,任何合适的反向扩增引物,无论是固定的还是在溶液中,都可用于本文提出的方法中与互补序列杂交和扩增序列。本领域技术人员将理解如何设计和使用适合于捕获和扩增本文所述核酸的引物序列。

如本文所用,“扩增(amplify)”,“扩增…(amplifying)”或“扩增反应”及其派生词通常是指至少一部分核酸分子被复制或拷贝为至少一个另外的核酸分子的任何动作或过程。该另外的核酸分子任选地包括与模板核酸分子的至少一些部分基本上相同或基本上互补的序列。模板核酸分子可以是单链的或双链的,另外的核酸分子可以独立地是单链的或双链的。扩增任选地包括核酸分子的线性或指数复制。在一些实施例中,可以使用等温条件进行此类扩增;在其他实施例中,此类扩增可以包括热循环。在一些实施例中,扩增是多重扩增,其包括在单个扩增反应中同时扩增多个靶序列。在一些实施例中,“扩增”包括单独地或组合地扩增基于DNA和RNA的核酸的至少一些部分。扩增反应可以包括本领域普通技术人员已知的任何扩增方法。在一些实施例中,扩增反应包括聚合酶链式反应(PCR)。

如本文所用,“扩增条件”及其派生词通常是指适于扩增一个或多个核酸序列的条件。这种扩增可以是线性的或指数的。在一些实施例中,扩增条件可包括等温条件或可替代地可包括热循环条件,或等温和热循环条件的组合。在一些实施例中,适合于扩增一种或多种核酸序列的条件包括聚合酶链式反应(PCR)条件。通常,扩增条件是指足以扩增核酸(例如一种或多种靶序列),或扩增与一种或多种衔接子连接的经扩增的靶序列(例如与衔接子连接的经扩增的靶序列)的反应混合物。通常,扩增条件包括用于扩增或用于核酸合成的催化剂,例如聚合酶;与待扩增核酸具有某种程度的互补性的引物;和核苷酸,例如三磷酸脱氧核糖核苷酸(dNTP),一旦与核酸杂交,用于促进引物的延伸。扩增条件可能需要引物与核酸的杂交或退火,引物延伸以及变性步骤,其中将延伸的引物与进行扩增的核酸序列分离。通常,但不是必须的,扩增条件可以包括热循环;在一些实施例中,扩增条件包括多个循环,其中重复退火、延伸和分离步骤。通常,扩增条件包括阳离子(如Mg

如本文所用,术语“聚合酶链式反应”(“PCR”)是指如美国专利号4,683,195和4,683,202所述的方法,其描述了一种无需克隆或纯化即可增加基因组DNA混合物中目的多核苷酸片段浓度的方法。该扩增目的多核苷酸的方法由以下组成:将大量过量的两种寡核苷酸引物引入含有所需目的多核苷酸的DNA混合物中,然后在DNA聚合酶存在下进行一系列热循环。这两种引物与它们各自的目的双链多核苷酸的链互补。首先将混合物在较高温度下变性,然后将引物与目的多核苷酸分子内的互补序列退火。退火后,用聚合酶延伸引物以形成一对新的互补链。变性、引物退火和聚合酶延伸的步骤可以重复多次(称为热循环)以获得高浓度的所需目的多核苷酸的扩增片段。所需目的多核苷酸的扩增片段(扩增子)的长度由引物相对于彼此的相对位置确定,因此,该长度是可控制的参数。通过重复该过程,该方法被称为“聚合酶链式反应”(以下称为“PCR”)。由于目的多核苷酸的所需扩增片段成为混合物中的主要核酸序列(就浓度而言),因此将它们称为“PCR扩增的”。在对以上讨论的方法的改进中,可以使用多个不同的引物对来PCR扩增靶核酸分子,在某些情况下,每个目的靶核酸分子一个或多个引物对,从而形成多重PCR反应。

如本文所定义,“多重扩增”是指样品中两个或更多个靶序列的同时扩增。在一些实施例中,进行多重扩增,使得靶序列中的一些或全部在单个反应容器中被扩增。给定的多重扩增的“多重性(plexy)”或“多重(plex)”通常是指在该单一多重扩增期间扩增的不同靶特异性序列的数目。还可以通过几种不同的方法来检测扩增的靶序列(例如,凝胶电泳,然后进行光密度测定,用生物分析仪或定量PCR进行定量,与标记探针杂交;掺入生物素化引物,然后进行抗生物素蛋白-酶缀合物检测(avidin-enzyme conjugate detection);将32P标记的脱氧核苷酸三磷酸掺入扩增的靶序列)。

如本文所用,术语“引物”及其派生词通常是指可以与目的靶序列杂交的任何多核苷酸。通常,引物作为核苷酸可通过聚合酶聚合在其上的底物;然而,在一些实施例中,引物可并入合成的核酸链中,并提供另一引物可与其杂交以引发与合成的核酸分子互补的新链的合成的位点。引物可以由核苷酸或其类似物的任何组合构成。在一些实施例中,引物是单链寡核苷酸或多核苷酸(polynucleotide)。术语“多核苷酸”和“寡核苷酸”在本文可互换使用,是指任何长度的核苷酸的聚合形式,并且可以包含核糖核苷酸、脱氧核糖核苷酸、其类似物或其混合物。该术语应理解为包括由核苷酸类似物制成的DNA或RNA的类似物作为等同物,并且适用于单链(例如有义或反义)和双链多核苷酸。本文所用的术语还涵盖cDNA,其是例如通过逆转录酶的作用由RNA模板产生的互补或拷贝DNA。该术语仅指分子的一级结构。因此,该术语包括三链、双链和单链脱氧核糖核酸(“DNA”),以及三链、双链和单链核糖核酸(“RNA”)。

如本文所用,术语“连接…(ligating)”,“连接(ligation)”及其派生词通常是指将两个或多个分子共价连接在一起的过程,例如将两个或多个核酸分子彼此共价连接。在一些实施例中,连接包括连接核酸的相邻核苷酸之间的切口(nicks)。在一些实施例中,连接包括在第一核酸分子的末端和第二核酸分子的末端之间形成共价键。在一些实施例中,连接可包括在一个核酸的5'磷酸基团和第二核酸的3'羟基之间形成共价键,从而形成连接的核酸分子。在一些实施例中,靶序列可以与衔接子连接以产生衔接子-靶序列。技术人员将认识到,连接反应不会导致反应中存在的所有分子连接。

如本文所用,“连接酶”及其派生词通常是指能够催化两个底物分子连接的任何试剂。在一些实施例中,连接酶包括能够催化核酸的相邻核苷酸之间的切口连接的酶。在一些实施例中,连接酶包括能够催化一个核酸分子的5'磷酸与另一核酸分子的3'羟基之间的共价键形成从而形成连接的核酸分子的酶。合适的连接酶可以包括但不限于T4 DNA连接酶、T4 RNA连接酶、热稳定的T4 DNA连接酶和大肠杆菌DNA连接酶(E.coli DNA ligase)。

如本文所用,术语“流动池”是指包括固体表面的腔室,一种或多种流体试剂可以流过该固体表面。可以容易地在本披露的方法中使用的流动池以及相关的流体系统和检测平台的实例在例如Bentley等人,Nature[自然]456:53-59(2008);WO 04/018497;WO 91/06678;WO 07/123744;美国专利号7,057,026;美国专利号7,211,414;美国专利号7,315,019;美国专利号7,329,492;美国专利号7,405,281;以及美国专利公开号2008/0108082中描述。

如本文所用,术语“文库”是指成员的集合。在一个实施例中,文库包括核酸成员的集合,例如全基因组、亚基因组片段(subgenomic fragments)、cDNA、cDNA片段、RNA、RNA片段或其组合的集合。在一些实施例中,部分或全部文库成员包括非靶衔接子序列。衔接子序列可以位于一个末端或两个末端。衔接子序列可以用于例如测序方法(例如,NGS方法),用于扩增,用于逆转录或用于克隆到载体中。

如本文所用,“成员”或“文库成员”或其他类似术语是指作为文库成员的核酸分子,例如DNA、RNA或其组合。通常,成员是DNA分子,例如基因组DNA或cDNA。成员可以被片段化,例如剪切或酶促制备的基因组DNA。成员包括来自实验对象的序列,并且还可以包括不是源自实验对象的序列,例如非靶序列,例如衔接子序列、引物序列和/或允许鉴定的其他序列,例如索引。

如本文所用,“索引(index)”(也称为“索引区”或“索引衔接子”)是指可用于鉴定核酸材料的样品或来源的核酸标签。当核酸样品源自多个来源时,每个核酸样品中的核酸可以用不同的核酸标签标记,使得可以鉴定样品的来源。可以使用任何合适的索引或索引集(set of indexes),如本领域中已知的并且如美国专利号8,053,192,PCT公开号WO 05/068656和美国专利公开号2013/0274117的披露所例示的。在一些实施例中,索引可以包括来自Illumina,Inc.(Illumina公司)(加利福尼亚州圣地亚哥)的六碱基索引1(i7)序列、八碱基索引1(i7)序列、八碱基索引2(i5)序列、十碱基索引1(i7)序列、或十碱基索引2(i5)序列。

如本文所用,术语“唯一分子标识符(unique molecular identifier)”或“UMI”或“条形码(barcode)”是指可以接附于核酸分子的分子标签。UMI当并入核酸分子时可通过直接计数扩增后测序的唯一分子标识符(UMI)来校正随后的扩增偏差(amplificationbias)。

如本文所用,术语“标签片段化(tagmentation)”是指通过转座体复合物对DNA的修饰,所述转座体复合物包括与包括双链识别序列(杂交的转座子末端序列)的衔接子复合的转座酶。标签片段化导致DNA的片段化和衔接子与双链体片段的两条链的5'末端的连接同时发生。纯化除去转座酶、缺口填充(gap-filling)和连接后,得到完全双链产物。可以例如通过PCR、连接或本领域技术人员已知的任何其他合适的方法将另外的序列添加至经衔接的片段的末端。参见,例如,美国专利公开号2017/0044525。

术语“和/或”是指所列要素中的一个或多个或所列要素中任两个或多个的组合。

词语“优选的”和“优选地”是指在某些情况下可以提供某些益处的本发明的实施例。然而,在相同或其他情况下,其他实施例也可以是优选的。此外,对一个或多个优选实施例的叙述并不意味着其他实施例不是有用的,并且不旨在将其他实施例排除在本发明的范围之外。

术语“包括”及其变型在这些术语出现在说明书和权利要求书中的地方不具有限制性含义。

应该理解的是,在本文中用语言“包括(include)”,“包括(includes)”或“包括(including)”等描述实施例的任何地方,也提供了用“由…组成”和/或“基本上由…组成”描述的其它类似实施例。术语“由…组成”限于短语“由…组成”之后的任何内容。也就是说,“由…组成”表示所列出的要素是必需的或强制性的,并且可不存在其他要素。术语“基本上由…组成”表示包括在该短语之后列出的任何要素,并且可以包括除了那些列出的要素之外的其他要素,条件是那些其他要素不干扰或有助于对于列出要素本披露中指定的活性或动作。

除非另有说明,否则“一个(a)”,“一种(an)”,“所述”和“至少一个”可互换使用并且表示一个或多于一个。

如本文所用,术语“每个”当用于指项目的集合时,旨在标识集合中的单个项目,但不一定指集合中的每个项目,除非上下文另有明确指明。

通过端点对数值范围的表述包括该范围内包含的所有数值(例如,1至5包括1、1.5、2、2.75、3、3.80、4、5等)。

对于本文披露的包括离散步骤的任何方法,这些步骤可以以任何可行的顺序进行。并且,适当地,两个或更多个步骤的任何组合可以同时进行。

本发明的以上概述并非旨在描述本发明的每个披露的实施例或每个实施方式。下面的描述更具体地例示了示例性实施例。在整个申请中的多个地方,通过示例的列表提供了指导,这些示例可以以各种组合使用。在每种情况下,所列举的列表仅用作代表组,而不应解释为排他性列表。

在整个说明书中对“一个实施例”,“实施例”,“某些实施例”或“一些实施例”等的提及是指结合该实施例描述的特定特征、配置、组成或特性包括在本披露的至少一个实施例中。因此,这些短语在整个说明书中不同地方的出现不一定是指本披露的相同实施例。此外,特定特征、配置、组成或特性可以在一个或多个实施例中以任何合适的方式组合。

除非另有说明,否则在说明书和权利要求书中使用的表示组分的量、分子量等的所有数值均应理解为在所有情况下均被术语“约”修饰。因此,除非另有相反指示,否则说明书和权利要求书中列出的数字参数是近似值,其可以根据本发明试图获得的期望性质而变化。至少,并非试图将等同原则限制于权利要求的范围,每个数值参数应至少根据所报道的有效数字的数值并通过应用普通的舍入技术来解释。

所有标题都是为了方便读者,除非另有说明,否则不应将其用于限制标题后面的文本的含义。

尽管阐述本发明的广泛范围的数值范围和参数是近似值,但是在具体实例中阐述的数值被尽可能精确地报道。但是,所有数值固有地包含由在它们各自的测试测量中发现的标准偏差必然产生的范围。

附图说明

图1A-图1B是示出在富集期间的杂交捕获的示例性实施例和比较的脱靶(off-target)捕获的示意图。图1A。探针包括设计为与靶基因组内的目的区域杂交的区域和允许随后捕获探针的配体(例如,生物素基团)。一旦杂交完成并形成DNA模板-探针杂交体,就使用捕获装置(即,对探针具有亲和力的组分,包括例如链霉亲和素包被的磁珠)来结合与DNA靶杂交的探针,从寡核苷酸池中除去靶。图1B。由于靶序列中的末端衔接子序列与脱靶文库制备产物中的末端衔接子序列之间的相互作用,可以在杂交捕获期间回收不需要的或脱靶的寡核苷酸。

图2示出了封闭剂阻止衔接子序列杂交和阻止脱靶捕获的示例性机制。

图3A-图3I显示了示例性封闭剂的示意图。图3A。具有与衔接子的8-或10-碱基索引区互补的碱基的Nextera封闭剂的图示。图3B。在对应于衔接子的索引区的封闭剂的区域中用8或10个脱氧肌苷碱基修饰的Nextera封闭剂的图示。图3C。在对应于衔接子的索引区的封闭剂的区域中用6、8或10个脱氧肌苷碱基修饰的TruSeq封闭剂的图示。图3D。在对应于衔接子的索引区的封闭剂的区域中具有6或8个胸腺嘧啶的Nextera和TruSeq封闭剂的图示。图3E。包括对应于至8-或10-碱基索引区的区域5'的组分和对应于至索引区的区域3'的组分的分裂的Nextera封闭剂的图示。这些构建体不包括对应于衔接子的索引区的任何碱基(由对应于索引区的8-或10-碱基缺口表示)。图3F。包括对应于至8-或10-碱基索引区的区域5'的组分和对应于至索引区的区域3'的组分的分裂的TruSeq封闭剂的图示。这些构建体不包括对应于衔接子的索引区的任何碱基(由对应于索引区的8-或10-碱基缺口表示)。图3G。仅对应于衔接子的索引区3'的区域的一部分的Nextera封闭剂的图示。图3H。仅与衔接子的索引区3'的区域的一部分配对的TruSeq封闭剂的图示。图3I。仅对应于衔接子的索引区5'的区域的一部分的Nextera或TruSeq封闭剂的图示(例如,p5或p7序列)。

图4是使用实例2中所述的封闭剂获得的填充读数富集结果(捕获的中靶DNA的量的量度)的图表。

图5显示了在对应于索引序列的封闭剂序列的部分的第五位置处包含经修饰的G(+G)或随机(A、T、G或C)(N)核苷酸的封闭剂的图示,如实例3中所述。

图6A-图6B显示了实例4所述的封闭剂构建体和结果。图6A显示了各种封闭剂构建体的图示,其包括(1)具有与索引区的5'25-30-mer区域互补的第一序列和与索引区的3'34-35-mer区域互补的第二序列的一对分裂封闭剂,(2)仅与衔接子的3'部分配对的封闭剂(“内部”封闭剂),(3)仅与衔接子的5'部分配对的封闭剂(“外部”封闭剂),以及(4)对应于索引区的短(8个核苷酸)封闭剂(“短8nt”)。图6B显示了使用xGen封闭寡核苷酸(综合DNA技术公司,科勒尔维尔,爱荷华州(Integrated DNA Technologies,Coralville,IA))、分裂封闭剂或仅与衔接子的一部分结合的封闭剂获得的填充读数富集结果。

图7A-图7F显示了使用包括硫酸葡聚糖的增强型杂交缓冲液的结果,如实例5所描述的。图7A显示了在杂交缓冲液中使用不同浓度的硫酸葡聚糖获得的填充读数富集结果。图7B显示了使用100μL杂交体积和四个不同的探针组和三种不同的缓冲液条件(IDT杂交缓冲液,Illumina非增强型杂交缓冲液和Illumina增强型杂交缓冲液)获得的填充读数富集结果。图7C显示了所有四个探针组在不同杂交孵育时间下以及进行和不进行额外的温度渐变步骤的情况下的填充读数富集和覆盖均匀性结果。左图中的黑色虚线指示在没有硫酸葡聚糖的缓冲液中杂交的结果。显示了三组测序结果,包括NovaSeq(图7D)、NextSeq(图7E)和iSeq(图7F)(针对NovaSeq和NextSeq为鉴定的读数百分比(percent reads identified,PF),针对iSeq为索引百分比(%))以及使用硫酸葡聚糖杂交缓冲液和30μL文库体积运行时的相关变异系数(CV)。

图8A-图8C显示了实例6中描述的杂交测定的结果。图8A显示了当在杂交缓冲液中使用经修饰的封闭剂、洗涤温度升高和/或拥挤剂(硫酸葡聚糖)时的填充读数富集结果。图8B显示了与使用IDT xGen Lockdown试剂盒方案的IDT外显子组小组结果相比,使用实例6中描述的方法在使用具有xGEN封闭剂的增强型杂交缓冲液的九个探针组中获得的填充读数富集结果。图8C显示了使用12基因,535探针组通过单杂交富集方案检测体细胞变体,以富集由Horizon Discover HD701定量多重(QM)DNA标准产生的文库。

图9A-图9D显示了示例性工作流程的示意图。eBBN表示使用珠结合的转座体复合物进行的基于珠的标签片段化;H表示杂交;C表示捕获;W表示洗涤;E表示洗脱;PCR表示PCR扩增;S表示测序;Q表示量化;SpVac表示快速真空浓缩。图9A显示了用于杂交捕获的示例性工作流程的示意图,其显示了使用基于珠的标签片段化方案进行的文库制备;在富集之前可以使用任何合适的文库制备方法。值得注意的是,仅包括一轮杂交和捕获。图9B显示了用于杂交捕获的示例性工作流程的示意图。图9C显示了用于无PCR的杂交捕获的示例性工作流程的示意图。图9D显示了用于具有缩短的杂交时间的无PCR的杂交捕获的示例性工作流程的示意图。

图10显示了使用BN001和BN002(未修饰的封闭剂);BX003和BX007(G-钳修饰的封闭剂);BN007和BN008(用BNA和脱氧肌苷修饰的封闭剂);BN005和BN006(BNA和经修饰的序列特异性封闭剂);或BN023、BN024、BN025和BN026(用LNA修饰的分裂封闭剂)获得的填充读数富集结果,如实例8中所述。

图11显示了当相应的衔接子包含8-核苷酸索引或10-核苷酸索引时,使用BN001和BN002(未修饰的封闭剂)或BN023、BN024、BN025和BN026(LNA修饰的分裂封闭剂)获得的填充读数富集结果,如实例9中所述。

具体实施方式

本披露描述了包括封闭剂和/或杂交缓冲液的组合物,以及用于在测序之前改善核酸选择效率的方法,其包括使用这些组合物的方法和包括杂交捕获的方法。

杂交捕获富集

可以使用多种方法来从复杂的核酸池中富集所需序列。这些方法包括聚合酶链式反应(PCR)、分子倒置探针(MIP)或通过杂交形成进行序列捕获(“杂交捕获”)。参见,例如,Mamanova等人,Nat.Methods[自然方法]7:111-118(2010));美国专利公开号2014/0031240;和美国专利公开号2017/0114404。

下一代测序(NGS)应用通常使用富集的杂交捕获方法。将制备的NGS模板池(文库)进行热变性,并与捕获探针寡核苷酸(“探针”)池混合。探针被设计为与靶基因组内的目的区域杂交,通常长度为60至200个碱基,并进一步被修饰以包含允许随后捕获结合探针的配体。常见的捕获方法是在探针上掺入生物素基团(或多个基团)。杂交形成DNA模板-探针杂交体完成后,用仅对探针具有亲和力的组分进行捕获,如图1A的一个实施例所示。例如,链霉亲和素包被的磁珠可用于结合与来自文库的所需DNA靶杂交的生物素化的探针的生物素部分。洗涤除去未结合的核酸,降低了保留的材料的复杂性。然后将保留的材料从磁珠上洗脱下来,并引入自动测序过程中。

尽管DNA与探针的杂交可能是非常特异性的,但是不需要的序列仍保留在杂交捕获方法完成后的富集池中。这些不需要的序列的最大部分是由于与探针不具有互补性的文库成员和与探针具有互补性的文库成员(即,中靶(on-target)文库成员)之间不期望的杂交事件而存在的。在杂交捕获方法中,两种类型的序列会导致不期望的杂交:(1)在内源基因组DNA中发现的高度重复的DNA元件;和(2)工程化到每个文库成员中的末端衔接子序列。

复杂池中的一个DNA片段中存在的重复内源DNA元件(例如Alu序列或长散布核元件(LINE)序列)可以与另一个无关DNA片段中存在的另一个相似元件杂交。这些最初可能来源于基因组中非常不同的位置的片段在杂交捕获方法的杂交过程中连接。如果这些DNA片段中的一个代表包含探针的结合位点的所需片段,则不需要的片段将与所需片段一起被捕获。可以通过向杂交反应的杂交缓冲液中加入过量的重复元件来减少此类脱靶文库成员。最常见的是,将人Cot-1 DNA(其结合靶中的Alu、LINE和其他重复位点并基于此封闭NGS模板彼此相互作用的能力)加入到杂交缓冲液中。

由于各个文库成员中末端衔接子序列之间的相互作用,也可以捕获脱靶(也称为非靶)文库成员。通常,文库成员包括来自目的基因的序列片段,例如用于测序的片段。如果成员中靶,则来自目的基因的序列与捕获探针形成双链体(duplex)。中靶序列可以包括例如外显子或内含子(或其片段)、编码区或非编码区、增强子、非翻译区、特异性SNP等。通常,文库成员还包括一个或多个非靶序列。这些非靶序列通常不包括目的靶序列,但是包括例如衔接子。因为文库成员池通常包含至少一些相同的末端衔接子序列,所以衔接子序列在杂交溶液中以非常高的有效浓度存在。因此,包含脱靶序列的文库成员可以通过其附加的衔接子序列的部分与捕获的靶序列退火,从而导致脱靶序列与中靶文库成员一起捕获(例如,通过连接在一起的序列的串联或“菊花链(daisy chain)”),如图1B中的一个实施例所示。因为退火的靶序列包括探针的结合位点,所以可以捕获整个菊花链。这样,单个期望片段的捕获会带来大量不期望的片段,从而降低了期望片段的富集总效率。

在一些方面,本披露描述了用于通过杂交捕获使脱靶核酸的选择最小化的方法和组合物。

封闭剂寡核苷酸

在一方面,本披露描述了“封闭剂寡核苷酸(blocker oligonucleotide)”(本文也称为“封闭剂(blocker)”)和通过使用封闭剂与衔接子序列的至少一部分结合(例如,形成双链体)来防止杂交捕获期间脱靶核酸的选择的方法。如图2中的一个实施例所示,当使用时,封闭剂与衔接子序列的结合防止脱靶文库制备产物中衔接子序列之间的相互作用(包括例如形成链状链),这种相互作用可导致在杂交捕获期间回收不需要的文库成员。

在一些实施例中,可以使用至少两种封闭剂,其中第一封闭剂与第一衔接子序列结合(例如,与第一衔接子序列形成双链体),第二封闭剂与第二衔接子序列结合(例如,与第二衔接子序列形成双链体)。在一些实施例中,第一衔接子序列可以在文库成员的5'末端,第二衔接子序列可以在文库成员的3'末端。在一些实施例中,可以使用多种不同的封闭剂。

在一些实施例中,封闭寡核苷酸与至少1个、至少2个、至少5个、至少10个、至少20个、至少50个、至少100个或至少200个文库成员的衔接子序列形成双链体,所得双链体的T

在一些实施例中,封闭剂-衔接子复合物表现出比衔接子-衔接子复合物更大的T

在一些实施例中,封闭寡核苷酸与至少1个、至少2个、至少5个、至少10个、至少20个、至少50个、至少100个或至少200个文库成员的衔接子序列的缔合速率(associationrate)高于衔接子序列与包括例如衔接子序列的互补序列的背景核酸的缔合速率。在一些实施例中,缔合速率高至少2倍、高至少4倍、高至少6倍、高至少8倍或高至少10倍。在一些实施例中,缔合速率高最多可达4倍、高最多可达6倍、高最多可达8倍、高最多可达10倍或高最多可达12倍。

在一些实施例中,封闭寡核苷酸与至少1个、至少2个、至少5个、至少10个、至少20个、至少50个、至少100个或至少200个文库成员的衔接子序列的解离速率(dissociationrate)低于衔接子序列与包括例如衔接子序列的互补序列的背景核酸的解离速率。在一些实施例中,解离速率低至少2倍、低至少4倍、低至少6倍、低至少8倍或低至少10倍。在一些实施例中,解离速率低最多可达4倍、低最多可达6倍、低最多可达8倍、低最多可达10倍或低最多可达12倍。

在一些实施例中,在封闭寡核苷酸和至少1个、至少2个、至少5个、至少10个、至少20个、至少50个、至少100个或至少200个文库成员的衔接子序列之间形成的双链体长于衔接子序列与其互补序列之间(包括例如双链衔接子的Watson和Crick链之间)形成的双链体。在一些实施例中,封闭寡核苷酸和衔接子序列之间的双链体比衔接子序列和其互补序列之间形成的双链体长至少1个、至少2个、至少3个、至少4个、至少5个、至少6个、至少7个、至少8个、至少9个、至少10个、至少15个或至少20个核苷酸。

在一些实施例中,封闭剂优选包括修饰,相对于具有与不包括修饰的封闭剂相同序列的寡核苷酸,该修饰增加封闭剂的T

在一些实施例中,封闭剂包括一个或多个非天然存在的核苷酸。在一些实施例中,在具有非天然存在的核苷酸的封闭寡核苷酸与至少1个、至少2个、至少5个、至少10个、至少20个、至少50个、至少100个或至少200个文库成员的衔接子序列之间形成的双链体的与结合相互作用相关的参数值(例如,亲和力、缔合速率、解离速率的倒数或T

在一些实施例中,封闭剂包括经修饰的碱基。封闭剂中可以包括任何合适的经修饰的碱基。在一些实施例中,修饰优选包括增强T

在一些实施例中,相对于具有与不包括修饰的封闭剂相同的序列的寡核苷酸增加封闭剂的T

在一些实施例中,封闭寡核苷酸的长度为至少20个、至少30个、至少40个、至少50个、至少60个、至少70个、至少80个、至少90个、至少100个核苷酸。在一些实施例中,封闭寡核苷酸的长度为最多可达45个、最多可达50个、最多可达55个、最多可达60个、最多可达70个、最多可达80个、最多可达90个、最多可达100个、最多可达150个或最多可达200个核苷酸。

在一些实施例中,封闭寡核苷酸将包括增加封闭剂T

在一些实施例中,封闭寡核苷酸将包括封闭寡核苷酸中至少2%(%)、至少5%、至少10%、至少20%、至少30%、至少40%、至少50%、至少60%、至少70%、至少80%或至少90%的碱基的修饰。在一些实施例中,封闭寡核苷酸将包括封闭寡核苷酸中最多可达5%、最多可达10%、最多可达20%、最多可达30%、最多可达40%、最多可达50%、最多可达60%、最多可达70%、最多可达80%、最多可达90%或最多可达100%的碱基的修饰。

在一些实施例中,对封闭剂的修饰将包括在特定模式中。例如,每2个碱基(参见例如表2A,BN021和BN022)、每3个碱基(参见例如表2A,BN035和BN036)、每4个碱基或每5个碱基或其一些组合(参见例如表2A,BN036)可以包括经修饰的碱基。在一些实施例中,封闭剂中的每个碱基可以被修饰(参见例如表2A,BN027和BN028)。在一些实施例中,鸟嘌呤(当被修饰时其具有比其他核苷酸高的亲和力)可以被优先修饰。例如,在一些实施例中,鸟嘌呤的LNA或BNA形式可以被包括在封闭剂中。

在一些实施例中,封闭剂可以包括末端修饰。例如,封闭剂可以包括3'末端基团,其阻止封闭剂作为DNA合成的引物的可用性。这样的3'末端基团可包括例如3'-dC、2',3'-ddC(在本文中也称为3ddc)、反向dT(inverted dT)、3'-间隔物C3(3'-spacer C3,在本文中也称为3SpC3)等。

封闭剂可以结合任何合适的衔接子序列(包括其任何部分)(例如,形成双链体)。如本文所用,封闭剂序列的与衔接子序列的一部分结合(例如形成双链体)的部分被称为封闭剂序列的“对应于”衔接子序列的部分的部分。在一些实施例中,相应的序列可以是衔接子序列的精确的互补序列。然而,在一些实施例中,相应的序列中最多可达1个、最多可达2个、最多可达3个、最多可达4个、最多可达5个、最多可达6个、最多可达7个、最多可达8个、最多可达9个或最多可达10个碱基可能不是互补的。

在一些示例性实施例中,封闭剂可结合至表1中所示的衔接子。(衔接子序列示于表1A中,关于序列组分的其他信息示于表1B中。)在一些示例性实施例中,封闭剂可以结合至包含Illumina衔接子序列中披露的序列(可在万维网上获得,网址为support.illumina.com/content/dam/illumina-support/documents/documentation/chemistry_documentation/experiment-design/illumina-adapter-sequences-1000000002694-07.pdf)的衔接子。

在一些实施例中,封闭剂结合至衔接子,其中该衔接子包括通用序列,该通用序列包括例如通用衔接子和/或通用引物序列。在一些实施例中,通用引物序列可以包括P5、P7、P5'和/或P7'。在一些实施例中,通用引物序列可包括V2.A14.METS序列、V2.B15.METS序列、V2.A14.METS序列的互补序列和/或V2.B15.METS序列的互补序列。例如,如表2A所示,BN001包括P5和V2.A14.METS序列;如表2A所示,BN002包括P7和V2.B15.METS序列;如表2A所示,BN003包括P5'和V2.A14.METS序列的反向互补序列;如表2A所示,BN004包括P7′和V2.B15.METS序列的反向互补序列。

在一些测序应用中,期望文库成员包括至少一个索引和/或UMI序列。因此,在一些实施例中,封闭剂与衔接子结合,其中该衔接子包括索引和UMI中的至少一个。美国专利公开号2014/0031240描述了用于包含索引(美国专利公开号2014/0031240称为“条形码结构域(barcode domain)”)的衔接子的“可用于制备封闭寡核苷酸的三种方法”:“1)合成与每个衔接子完美匹配的一系列封闭剂,2)合成具有与衔接子的条形码结构域配对的N-mer结构域的单个封闭剂,或3)合成具有与衔接子的条形码结构域配对的通用碱基结构域的单个封闭剂。”由于每个不同的索引和/或UMI具有独特的序列,因此如方法1中的完全互补的封闭剂将是包括与存在的每个索引和/或UMI序列完美互补匹配的序列(参见图3A)。但是,如果使用许多不同的索引和/或UMI,则包括具有完美互补匹配的封闭剂将需要数十或数百个独特的封闭剂用于多重扩增-这种方法的成本效益不高。

在一些方面,本披露描述了用于包括索引和/或UMI的衔接子的封闭剂,以及使用这种封闭剂的方法,例如,在对应于索引和/或UMI的封闭剂区域中包含胸腺嘧啶的封闭剂(图3D和实例2);

包含通用碱基和至少一个非通用碱基的封闭剂(图5和实例3);或不包含索引区域的封闭剂(包括例如“分裂封闭剂(split blocker)”或仅与衔接子的一部分配对的封闭剂)(图3E-图3I,图6A和实例4、8和9)。

在一些实施例中,封闭剂包括表2A,表2B,表2C或表3的序列中的至少一个。在一些实施例中,表2A的序列可以在标签片段化(例如,Nextera)文库制备(Illumina公司,加利福尼亚州圣地亚哥)后使用。在一些实施例中,表2B的序列可以在基于连接的文库制备和/或TruSeq制备(Illumina公司,加利福尼亚州圣地亚哥)后使用。在一些实施例中,表2C的序列可以在标签片段化(例如,Nextera)文库制备(Illumina公司,加利福尼亚州圣地亚哥)后使用。在一些实施例中,如果表2的序列包含BNA修饰的核酸,则BNA修饰的核酸可包含来自生物合成公司(德克萨斯州刘易斯维尔)的2'-O,4'-氨基亚乙基桥连核酸。在一些实施例中,如果表2的序列包含LNA修饰的核酸,则LNA修饰的核酸可包含来自凯杰公司(Qiagen)(德国希尔登(Hilden,Germany))的含LNA的寡核苷酸。有关表2A、表2B和表2C的序列的组分的其他信息可以在表1B和表2D中找到。

在另一方面,本披露描述了包括封闭寡核苷酸的试剂盒。封闭寡核苷酸可包括本文所述的封闭剂。在一些实施例中,封闭寡核苷酸是多种封闭寡核苷酸。试剂盒可进一步包括以下中的一种或多种:杂交缓冲液、探针、探针组(a panel of probes)和流动池。杂交缓冲液可包括如本披露中其他地方所描述的杂交缓冲液。在一些实施例中,探针如本披露中其他地方所描述。在一些实施例中,可以将组分提供在单独的容器中。例如,可以将封闭寡核苷酸提供在第一容器中,而可以将另一组分(例如杂交缓冲液或探针或探针组)提供在不同的容器中。替代地,可以将封闭寡核苷酸和杂交缓冲液提供在第一容器中,并且可以将探针或探针组提供在不同的容器中。

具有胸腺嘧啶的封闭剂

在一些实施例中,封闭剂在对应于衔接子的索引区和/或衔接子的UMI的封闭剂区域中(例如,与衔接子的索引区和/或UMI结合的封闭剂区域)可包括至少三个胸腺嘧啶碱基、至少四个胸腺嘧啶碱基、至少五个胸腺嘧啶碱基、至少六个胸腺嘧啶碱基、至少七个胸腺嘧啶碱基、至少八个胸腺嘧啶碱基、至少九个胸腺嘧啶碱基或至少十个胸腺嘧啶碱基。

在一些实施例中,对应于衔接子的索引区和/或衔接子的UMI的封闭剂区域(例如,与衔接子的索引区和/或UMI结合的封闭剂区域)包括与所述衔接子的索引区和/或所述衔接子的UMI中的碱基数目一样多的胸腺嘧啶碱基。

在一些实施例中,封闭剂包括表2A、表2B、表2C或表3的至少一个序列。在实例2中描述了这种封闭剂的一些示例性实施例。

具有通用碱基和至少一个非通用碱基的封闭剂

在一些实施例中,封闭剂可以在对应于索引区的封闭剂区域中包括通用碱基和至少一个非通用碱基。如本文所用,“通用碱基”是与至少两个常见碱基(例如,脱氧腺苷(A)、脱氧胸苷(T)、脱氧胞苷(C)、脱氧鸟苷(G)和尿苷(U))杂交的经修饰的核碱基。在一些实施例中,通用碱基与任何常见碱基杂交。如本文所用,“非通用碱基”是仅在传统的Watson-Crick碱基对相互作用(例如,脱氧腺苷(A)-脱氧胸苷(T)或脱氧鸟苷(G)-脱氧胞苷(C))中杂交的核碱基(在一些实施例中包括经修饰的核碱基)。

在一些实施例中,对应于索引区的封闭剂序列的每第三个碱基可包括至少一个非通用碱基。在一些实施例中,至少一个非通用碱基可以在对应于索引区的封闭剂序列的(从5'末端开始)第三和/或第五位置处。在一些实施例中,至少一个非通用碱基可以在对应于索引区的封闭剂序列的第二和/或第四位置处。在一些实施例中,至少一个非通用碱基包括经修饰的鸟嘌呤。在一些实施例中,经修饰的鸟嘌呤可以是LNA修饰的或BNA修饰的。在一些实施例中,至少一个非通用碱基包括随机(A、T、G或C)核苷酸。

不希望受理论的束缚,据信在对应于索引区的封闭剂区域中除了通用碱基之外包括经修饰的鸟嘌呤或随机核苷酸(如图5中一个实施例所示)提高了封闭剂对文库成员的亲和力。在实例3中描述了这种封闭剂的一些示例性实施例。

通用碱基可以包括任何已知的通用碱基。在一些实施例中,在索引区中使用的通用碱基可以包括例如2'-脱氧肌苷、2'-脱氧水粉蕈素(2'-deoxynebularine)、3-硝基吡咯2'-脱氧核苷或5-硝基吲哚2'-脱氧核苷。在一些实施例中,可以在索引区中使用通用碱基的组合。

经修饰的鸟嘌呤可以是以任何合适方式修饰的鸟嘌呤,包括例如LNA修饰的鸟嘌呤、BNA修饰的鸟嘌呤等。在一些实施例中,经修饰的鸟嘌呤优选为LNA修饰的鸟嘌呤。

在一些实施例中,封闭剂包括表2A、表2B、表2C或表4的至少一个序列。

分裂封闭剂

在一些实施例中,封闭剂可包括至少两个未连接的寡核苷酸,其中未连接的寡核苷酸包括不对应于衔接子的索引区和/或UMI的碱基(例如,包括不结合衔接子的索引区和/或UMI的碱基)或包括仅部分对应于衔接子的索引区和/或UMI的碱基(例如,包括仅结合衔接子的索引区和/或UMI的一部分的碱基)。在一些实施例中,封闭剂包括四个未连接的寡核苷酸。

在一些实施例中,至少两个未连接的寡核苷酸与靶序列的相同链杂交。在一些实施例中,封闭剂的至少一部分将对应于衔接子的5'末端,并且封闭剂的至少一部分将对应于同一衔接子的3'末端。在一些实施例中,包括例如当封闭剂包括四个未连接的寡核苷酸时,两个未连接的寡核苷酸可以与第一靶序列的相同链杂交,并且两个未连接的寡核苷酸可以与第二靶序列的相同链杂交。这种封闭剂的示例性实施例示于图3E-图3I和图6A中,并描述于实例4、8和9中。

在一些实施例中,封闭剂的至少一部分将对应于通用延伸引物。在一些实施例中,封闭剂的至少一部分将对应于P5、P7、P5'和/或P7'。在一些实施例中,封闭剂的至少一部分将对应于V2.A14.METS、V2.B15.METS、V2.A14.METS的互补序列和/或V2.B15.METS的互补序列。

在一些实施例中,封闭剂将包括与排除包含衔接子的索引区和/或UMI的碱基的衔接子部分的衔接子相同数量的碱基。在一些实施例中,封闭剂将比构成排除衔接子的索引区和/或UMI的碱基的衔接子部分的碱基的数目少一个碱基、少两个碱基、少三个碱基、少四个碱基或少五个碱基。

在一些实施例中,包括例如当需要增加的富集性能时,包括更多碱基的封闭剂可能是优选的。在一些实施例中,包括例如当封闭剂的成本、合成纯度和/或产率是因素时,包括更少碱基的封闭剂可能是优选的。

在一些实施例中,封闭剂的最多可达五个碱基、封闭剂的最多可达四个碱基、封闭剂的最多可达三个碱基、封闭剂的最多可达两个碱基、封闭剂的仅一个碱基、或封闭剂中没有碱基将与衔接子的索引区和/或衔接子的UMI配对。

在一些实施例中,封闭剂包括表2A、表2B、表2C或表5的至少一个序列(或序列的一部分)。在一些实施例中,封闭剂包括表2A的BN023、BN024、BN025和BN026中的至少一个。在一些实施例中,封闭剂包括表2A的BN023和BN025。在一些实施例中,封闭剂包括表2A的BN024和BN026。

杂交缓冲液

在另一方面,本披露描述了包括拥挤剂(crowding agent)的杂交缓冲液和使用该杂交缓冲液的方法。如本文所用,“拥挤剂”包括允许、增强或促进分子拥挤的化合物。在一些实施例中,拥挤剂包括以改变DNA-蛋白质相互作用的浓度使用的惰性大分子。“杂交缓冲液”定义为在其中可以形成作为杂交捕获测定的一部分的核苷酸-探针杂交体的任何缓冲液。

在一些实施例中,拥挤剂可以包括葡聚糖、硫酸葡聚糖、聚乙二醇(PEG)、Ficoll、甘油、甜菜碱等中的至少一种。葡聚糖和硫酸葡聚糖可以包括高分子量葡聚糖(例如,具有至少500,000Da的分子量的葡聚糖)和/或低分子量葡聚糖(例如,具有最高可达10,000Da、最高可达50,000Da、或最高可达100,000Da的分子量的葡聚糖)。在一些实施例中,拥挤剂优选包括硫酸葡聚糖。

在一些实施例中,拥挤剂可以以至少0.5%重量/体积(w/v)、至少1%(w/v)、至少1.5%(w/v)、至少2%(w/v)、至少3%(w/v)或至少4%(w/v)的量包含在杂交缓冲液中。在一些实施例中,拥挤剂可以以最多可达1%(w/v)、最多可达1.5%(w/v)、最多可达2%(w/v)、最多可达3%(w/v)、最多可达4%(w/v)、最多可达5%(w/v)、最多可达6%(w/v)、最多可达8%(w/v)或最多可达10%(w/v)的量包含在杂交缓冲液中。

如实例5中的一些实施例中所描述的(参见,例如,图7D-7F),在一些实施例中,在杂交缓冲液中包含拥挤剂(例如,硫酸葡聚糖)可允许比不具有拥挤剂的杂交缓冲液减少的杂交时间和/或在更大体积(例如,靶寡核苷酸的更高稀释度)的杂交缓冲液中杂交。例如,在杂交缓冲液中包含硫酸葡聚糖能够在单一温度下将杂交时间从过夜减少到约80分钟,或在额外温度渐变(temperature ramping)步骤情况下60分钟。

在一些实施例中,包含拥挤剂可以改善富集特异性。例如,实例5中显示了一个实施例(见图8A),其中富集特异性从45%增加到80%-95%。在一些实施例中,由于包含拥挤剂而导致的富集特异性的提高在较短的孵育时间内会更加明显。

在一些实施例中,在杂交缓冲液中包含拥挤剂使得富集反应可以在较低浓度的DNA下更快地发生(包括例如在较大相对体积的杂交缓冲液中)。这样的增加可以用于促进“按体积合并(pooling-by-volume)”和/或消除样品浓缩步骤。通常,为了实现快速杂交反应,需要使用由文库制备产生的高浓度DNA和高浓度探针,因此,在某些实施例中,需要使用相应小体积的杂交缓冲液(例如,小于20μL)。实现这种小体积需要在文库制备后进行样品浓缩步骤(结果是整个测定的时间和成本增加)。在杂交缓冲液中包含拥挤剂的情况下,可以在较低DNA浓度和/或探针浓度下(并且在一些实施例中在较大体积中)更快地实现富集反应。在一些实施例中,在杂交缓冲液中包含拥挤剂允许在杂交之前组合多个文库制备样品而无需浓缩步骤。在一些实施例中,可以将由不同文库制备产生的样品按体积合并,如本披露中进一步描述的,以允许多重富集。给定的多重富集的“多重性”或“多重”是指在富集(例如,杂交和捕获)之前组合的不同文库制备的数目。在一些实施例中,多重富集的多重性可以最高达2重、最高达4重、最高达6重、最高达12重、最高达24重、最高达48重、最高达96重或更高。

在一些实施例中,包括拥挤剂的杂交缓冲液进一步包括人Cot-1 DNA、去稳定剂、盐和封闭剂中的至少一种。在一些实施例中,使杂交缓冲液的例如Cot-1 DNA和封闭剂的组分与包括去稳定剂和拥挤剂的杂交缓冲液的组分保持分离,直到进行杂交反应。

在一些实施例中,杂交缓冲液可以以至少0.05mg/mL、至少0.1mg/mL、至少0.2mg/mL或至少0.3mg/mL的量包含人Cot-1 DNA。在一些实施例中,杂交缓冲液可以以最多可达0.1mg/mL、最多可达0.2mg/mL、最多可达0.3mg/mL或最多可达0.5mg/mL的量包含人Cot-1DNA。在一些实施例中,杂交缓冲液可优选以0.2mg/mL的量包含人Cot-1 DNA。

在一些实施例中,杂交缓冲液可包含去稳定剂(destabilizing agent)。在一些实施例中,去稳定剂可以包括甲酰胺和/或尿素。在一些实施例中,杂交缓冲液可包含至少1%(v:v)、至少5%(v:v)或至少10%(v:v)甲酰胺。在一些实施例中,杂交缓冲液可包含最多可达5%(v:v)、最多可达10%(v:v)或最多可达15%(v:v)甲酰胺。在一些实施例中,杂交缓冲液可包含至少1M尿素、至少2M尿素或至少4M尿素。在一些实施例中,杂交缓冲液可包含最多可达2M尿素、最多可达4M尿素或最多可达6M尿素。在一些实施例中,杂交缓冲液可优选包含10%甲酰胺。

在一些实施例中,杂交缓冲液可包括缓冲剂。可以使用任何合适的缓冲剂。在一些实施例中,缓冲剂可包括磷酸盐,包括例如磷酸钾或磷酸钠;Tris-HCl;哌嗪-N,N'-双(2-乙磺酸)(PIPES);哌嗪-N,N′-双(3-丙磺酸)(PIPPS);2-(N-吗啉代)乙磺酸(MES);(4-(2-羟乙基)-1-哌嗪乙磺酸)(HEPES)等。在一些实施例中,杂交缓冲液可包含至少40mM、至少50mM、至少55mM、至少60mM、至少65mM、或至少70mM磷酸盐。在一些实施例中,杂交缓冲液可包含最多可达50mM、最多可达55mM、最多可达60mM、最多可达65mM、最多可达70mM、最多可达75mM或最多可达80mM磷酸盐。在一些实施例中,含磷酸盐的缓冲液可包括单碱的磷酸二氢盐(monobasic dihydrogen phosphate)和/或二元碱的磷酸单氢盐(dibasic monohydrogenphosphate)。在一些实施例中,含磷酸盐的缓冲液可包含KH

在一些实施例中,杂交缓冲液可包含盐。可以包括任何合适的盐。在一些实施例中,盐可以是例如NaCl或柠檬酸钠(例如柠檬酸三钠)等。在一些实施例中,杂交缓冲液可以包含至少0.1M、至少0.2M、至少0.3M、至少0.4M、至少0.5M、至少0.6M、至少0.7M、至少0.8M、至少0.9M或至少1M的盐。在一些实施例中,杂交缓冲液可包含最多可达0.2M、最多可达0.3M、最多可达0.4M、最多可达0.5M、最多可达0.6M、最多可达0.7M、最多可达0.8M、最多可达0.9M、最多可达1M、最多可达2M、最多可达3M或最多可达4M的盐。在一些实施例中,杂交缓冲液可优选包含0.8M NaCl。

在一些实施例中,杂交缓冲液可包含去污剂(detergent),其包括例如阴离子去污剂(例如十二烷基硫酸钠、磺酸盐、醇硫酸盐、烷基苯磺酸盐、磷酸酯或羧酸盐)、非离子去污剂(例如,聚氧乙烯或糖苷去污剂,例如Tween、Triton或Brij去污剂)、阳离子去污剂(例如,季铵阳离子表面活性剂)或两性离子去污剂(例如CHAPS)。在一些实施例中,去污剂是阴离子去污剂。在一些实施例中,去污剂是非离子去污剂。在一些实施例中,去污剂是Tween 20、Tween 80、十二烷基硫酸钠(SDS)等。在一些实施例中,去污剂可占杂交缓冲液的至少0.001%体积/体积(v/v)、至少0.01%(v/v)、至少0.05%(v/v)、至少0.1%(v/v)、至少1%(v/v)或至少5%(v/v)。在一些实施例中,去污剂可占杂交缓冲液的最多可达0.01%(v/v)、最多可达0.05%(v/v)、最多可达0.1%(v/v)、最多可达1%(v/v)、最多可达5%(v/v)或最多可达10%(v/v)。在一些实施例中,杂交缓冲液可优选包含0.04%(v/v)Tween 20。

例如,在一些实施例中,杂交缓冲液可包含0.5%至10%硫酸葡聚糖、0.05mg/mL至0.5mg/mL人Cot-1 DNA、1%至15%(v/v)甲酰胺、40mM至80mM KH

在一些实施例中,杂交缓冲液可包含封闭剂。在一些实施例中,封闭剂如本披露中其他地方所述。在一些实施例中,封闭剂以至少0.001mM、至少0.005mM、至少0.01mM、至少0.05mM或至少0.1mM的浓度存在。在一些实施例中,封闭剂以最多可达0.01mM、最多可达0.05mM、最多可达0.1mM、最多可达0.2mM或最多可达0.5mM的浓度存在。

在另一方面,本披露描述了一种试剂盒,其包括例如本文所描述的杂交缓冲液。在一个实施例中,试剂盒进一步包括封闭剂和探针中的至少一种。在实施例中,将组分提供在单独的容器中。例如,可以将杂交缓冲液提供在第一容器中,并且可以将另一组分(例如封闭剂或探针)提供在不同的容器中。在一些实施例中,封闭剂和/或探针如本披露中其他地方所描述的。

杂交捕获

在另一方面,本披露描述了一种杂交捕获方法。在一些实施例中,该方法包括使探针与文库成员杂交并捕获探针的步骤。在一些实施例中,该方法还包括在杂交探针之前合并(pooling)文库。在一些实施例中,该方法还包括在捕获后扩增捕获的序列。在一些实施例中,该方法可以与本披露中描述的封闭剂寡核苷酸组合使用。在一些实施例中,该方法可包括使用包含如本披露中所描述的拥挤剂的杂交缓冲液。

合并文库(Pooling Libraries)

在一些实施例中,将由不同文库制备产生的样品在杂交之前组合。在一些实施例中,要组合的每个文库优选地包括具有与要组合的任何其他文库中的序列的索引区可区分的索引区的序列。

在一些实施例中,可以将由不同文库制备产生的样品按体积合并,以允许多重富集。给定的多重富集的“多重性”或“多重”是指在富集(例如,杂交和捕获)之前组合的不同文库制备的数目。在一些实施例中,多重富集的多重性最高可达2重、最高可达4重、最高可达6重、最高可达12重、最高可达24重、最高可达48重、最高可达96重或更高。

在一些实施例中,由文库制备产生的样品由标签片段化反应(tagmentationreaction)产生。参见,例如,美国专利号9,574,226。在一些实施例中,由文库制备产生的样品由Nextera文库制备产生(Illumina公司,加利福尼亚州圣地亚哥)。在一些实施例中,可以将文库制备直接加入杂交反应中。

在一些实施例中,合并的由文库制备产生的每个样品的DNA浓度将为至少0.1ng/μL、至少0.3ng/μL、至少0.4ng/μL、至少0.5ng/μL、至少1ng/μL、至少2ng/μL、至少4ng/μL、至少6ng/μL、至少8ng/μL、至少10ng/μL、至少12ng/μL、至少20ng/μL、至少50ng/μL、至少60ng/μL、至少100ng/μL或至少200ng/μL。在一些实施例中,合并的由文库制备产生的每个样品的DNA浓度将为最多可达0.4ng/μL、最多可达0.5ng/μL、最多可达1ng/μL、最多可达2ng/μL、最多可达4ng/μL、最多可达6ng/μL、最多可达8ng/μL、最多可达10ng/μL、最多可达12ng/μL、最多可达15ng/μL、最多可达20ng/μL、最多可达50ng/μL、最多可达100ng/μL、最多可达120ng/μL、最多可达200ng/μL、最多可达300ng/μL、或最多可达400ng/μL。例如,在一些实施例中,由文库制备产生的每个样品的DNA浓度将在0.3ng/μL至400ng/μL的范围内。例如,在一些实施例中,由文库制备产生的每个样品的DNA浓度将在0.1ng/μL至120ng/μL的范围内。例如,在一些实施例中,由文库制备产生的样品的组合的DNA浓度将在0.1ng/μL至120ng/μL的范围内(例如,在100μL)。例如,在一些实施例中,由文库制备产生的每个样品的DNA浓度将在0.5ng/μL至12ng/μL的范围内。在一些实施例中,由文库制备产生的样品的组合的DNA浓度将在0.5ng/μL至12ng/μL的范围内(例如,在100μL)。例如,在一些实施例中,由文库制备产生的每个样品的DNA浓度将在0.5ng/μL至120ng/μL的范围内。在一些实施例中,由文库制备产生的样品的组合的DNA浓度将在0.5ng/μL至120ng/μL的范围内(例如,在100μL)。

在一些实施例中,将至少1μL、至少2μL、至少3μL、至少5μL、至少10μL、至少15μL、至少20μL或至少25μL的由文库制备产生的每个样品组合。在一些实施例中,将最多可达2μL、最多可达3μL、最多可达5μL、最多可达10μL、最多可达15μL、最多可达20μL、最多可达25μL、最多可达30μL、最多可达40μL或最多可达50μL的由文库制备产生的每个样品组合。

在一些实施例中,将至少10ng、至少15ng、至少25ng、至少50ng、至少100ng、至少200ng、至少500ng、至少1,000ng或至少5,000ng的来自每个文库制备的DNA组合。在一些实施例中,将最多可达15ng、最多可达25ng、最多可达50ng、最多可达100ng、最多可达200ng、最多可达500ng、最多可达1,000ng、最多可达5,000ng、最多可达10,000ng或最多可达12,000ng的来自每个文库制备的DNA组合。例如,在一些实施例中,可以将10ng至12,000ng的来自每个文库制备的DNA组合。

杂交探针

在一些方面,杂交捕获方法包括使文库与探针接触,其中探针与文库成员内的目的区域杂交。目的区域与衔接子区域分开,并且包括目的基因组材料。探针包括允许随后捕获探针的配体。在一些实施例中,配体优选包括生物素基团。

在杂交缓冲液存在下使文库与探针接触。在一些实施例中,杂交缓冲液可包含拥挤剂,如本披露中所描述的。在一些实施例中,杂交缓冲液可包含封闭剂,如本披露中所描述的。

在一些实施例中,杂交捕获方法包括热变性步骤。例如,可将杂交缓冲液中包含文库成员、封闭剂和探针的杂交混合物加热到至少90℃、至少92℃或至少95℃。在一些实施例中,可将杂交混合物加热到最高可达92℃、最高可达95℃、最高可达97℃或最高可达100℃。在一些实施例中,杂交混合物优选进一步包含Cot-1 DNA。在一些实施例中,杂交缓冲液可以在加入杂交混合物中之前包含封闭剂;在一些实施例中,封闭剂可以独立于杂交缓冲液加入杂交混合物中。

在一些实施例中,杂交混合物(例如,最终杂交反应)中的DNA浓度将为至少0.1ng/μL、至少0.3ng/μL、至少0.4ng/μL、至少0.5ng/μL、至少1ng/μL、至少2ng/μL、至少4ng/μL、至少6ng/μL、至少8ng/μL、至少10ng/μL、至少12ng/μL、至少15ng/μL、至少20ng/μL、至少50ng/μL、至少75ng/μL、至少100ng/μL、至少120ng/μL、至少150ng/μL、至少200ng/μL。在一些实施例中,杂交混合物(例如,最终杂交反应)中的DNA浓度将为最多可达0.3ng/μL、最多可达0.4ng/μL、最多可达0.5ng/μL、最多可达1ng/μL、最多可达2ng/μL、最多可达4ng/μL、最多可达6ng/μL、最多可达8ng/μL、最多可达10ng/μL、最多可达12ng/μL、最多可达15ng/μL、最多可达20ng/μL、最多可达50ng/μL、最多可达75ng/μL、最多可达100ng/μL、最多可达120ng/μL、最多可达150ng/μL、最多可达200ng/μL、或最多可达500ng/μL。例如,在一些实施例中,杂交混合物(例如,最终杂交反应)中的DNA浓度将在0.1ng/μL至120ng/μL的范围内。

在一些实施例中,该方法可包括使用最多可达150μL、最多可达140μL、最多可达130μL、最多可达120μL、最多可达110μL、最多可达100μL、最多可达90μL、最多可达80μL、最多可达70μL、最多可达60μL或最多可达50μL的体积的杂交混合物。在一些实施例中,该方法可以包括使用至少10μL、至少20μL、至少30μL、至少40μL、至少50μL、至少60μL或至少70μL的体积的杂交混合物。

在一些实施例中,杂交混合物可以以至少1℃/分钟、至少1.5℃/分钟、至少2℃/分钟、至少2.5℃/分钟、至少3℃/分钟或至少5℃/分钟的速率加热。在一些实施例中,杂交混合物可以以最多可达1.5℃/分钟、最多可达2℃/分钟、最多可达2.5℃/分钟、最多可达3℃/分钟、最多可达5℃/分钟或最多可达10℃/分钟的速率加热。在一些实施例中,可以将杂交混合物在热变性的温度下保持至少1分钟、至少2分钟、至少5分钟、至少10分钟或至少20分钟。在一些实施例中,可以将杂交混合物在热变性的温度下保持最多可达2分钟、最多可达5分钟、最多可达10分钟、最多可达20分钟或更长时间。

在热变性步骤之后,杂交捕获方法包括冷却杂交混合物。当杂交混合物从热变性步骤温度冷却到杂交温度时,将形成探针:靶杂交体(即探针:文库成员杂交体)。

在一些实施例中,杂交温度可以为至少50℃、至少55℃、至少56℃、至少57℃、至少58℃、至少59℃、至少60℃、至少61℃、至少62℃、至少63℃、至少64℃、至少65℃或至少70℃。在一些实施例中,杂交温度可以为最多可达56℃、最多可达58℃、最多可达60℃、最多可达61℃、最多可达62℃、最多可达63℃、最多可达64℃、最多可达65℃或最多可达70℃。在一些实施例中,杂交可包括温度从变性温度到杂交温度的下降。在一些实施例中,温度渐变可包括至少-5℃/分钟、至少-2℃/分钟、至少-1℃/分钟、至少-0.5℃/分钟或至少-0.2℃/分钟的速率。

在一些实施例中,该方法可以包括使文库与探针保持接触和/或将杂交混合物在杂交温度下保持最多可达3天、最多可达2天、最多可达24小时、最多可达20小时、最多可达16小时、最多可达12小时、最多可达6小时、最多可达3小时、最多可达2小时、最多可达90分钟、最多可达1小时或最多可达30分钟。在一些实施例中,该方法可以包括使文库与探针保持接触和/或将杂交混合物在杂交温度下保持至少30分钟、至少45分钟、至少1小时、至少90分钟、至少2小时、至少3小时、至少6小时、至少12小时、至少16小时、至少20小时或至少24小时。在一些实施例中,包括当封闭剂的T

捕获

在一些方面,杂交捕获方法包括一旦探针与文库成员杂交就使用捕获装置捕获探针。探针可以通过任何合适的装置捕获。例如,当探针包括生物素基团时,可以使用链霉亲和素珠(包括例如链霉亲和素包被的磁珠)捕获探针。在一些实施例中,探针可以包括FITC,并且捕获装置可以包括抗FITC(anti-FITC)。在一些实施例中,探针可包括半抗原,并且捕获装置可包括结合该半抗原的分子(例如抗体)。可以使用其他捕获装置,例如等速电泳、尺寸排阻色谱、液相色谱、磁性装置等。

在一些实施例中,包括例如当捕获装置包括链霉亲和素包被的珠时,该方法可以包括形成包括探针(包括例如探针:靶杂交体)和捕获装置的捕获混合物。

在一些实施例中,该方法可以包括将捕获混合物保持在捕获温度。在一些实施例中,捕获温度可以为至少50℃、至少55℃、至少56℃、至少57℃、至少58℃、至少59℃、至少60℃、至少61℃、至少62℃、至少63℃、至少64℃、至少65℃或至少70℃。在一些实施例中,捕获温度可以为最多可达56℃、最多可达58℃、最多可达60℃、最多可达61℃、最多可达62℃、最多可达63℃、最多可达64℃、最多可达65℃或最多可达70℃。在一些实施例中,可以将捕获混合物在捕获温度下保持至少2分钟、至少5分钟、至少10分钟或至少15分钟。在一些实施例中,可以将捕获混合物在捕获温度下保持最多可达5分钟、最多可达10分钟、最多可达15分钟、最多可达20分钟、最多可达30分钟、最多可达45分钟或更长时间。在一些实施例中,和/或可以每5或10分钟添加振荡混合。

在一些实施例中,该方法可以进一步包括洗涤捕获的探针(捕获的探针可以包括例如探针:靶杂交体和/或捕获的文库成员)。在一些实施例中,可以将捕获的探针洗涤至少一次、至少两次、至少三次或更多次。在一些实施例中,可以将捕获的探针洗涤最多可达一次、最多可达两次、最多可达三次或最多可达五次。

在一些实施例中,洗涤捕获的文库成员可以包括在洗涤缓冲液中将捕获的探针加热至洗涤温度。在一些实施例中,洗涤缓冲液可包含去污剂。可以使用任何合适的缓冲液,包括例如Tris-HCl;哌嗪-N,N'-双(2-乙磺酸)(PIPES);哌嗪-N,N′-双(3-丙磺酸)(PIPPS);2-(N-吗啉代)乙磺酸(MES);(4-(2-羟乙基)-1-哌嗪乙磺酸)(HEPES)等。可以使用任何合适的去污剂,包括例如Tween 20、Tween 80、十二烷基硫酸钠(SDS)等。在一些实施例中,洗涤缓冲液可以包括旨在减少在富含GC的区域中形成二级结构的化合物,包括例如甜菜碱。在一些实施例中,洗涤缓冲液可包括铁螯合剂,其包括例如去铁胺甲磺酸(deferoxaminemesylate)、EGTA、EDTA等。

洗涤温度可以是至少20℃、至少23℃、至少25℃、至少30℃、至少35℃、至少40℃、至少45℃、至少50℃、至少55℃、至少56℃、至少57℃、至少58℃、至少59℃、至少60℃、至少61℃、至少62℃、至少63℃、至少64℃、至少65℃或至少70℃。在一些实施例中,洗涤温度可以是最多可达30℃、最多可达35℃、最多可达40℃、最多可达45℃、最多可达50℃、最多可达55℃、最多可达56℃、最多可达60℃、最多可达61℃、最多可达62℃、最多可达63℃、最多可达64℃、最多可达65℃或最多可达70℃。

在一些实施例中,该方法可以进一步包括从捕获装置和/或探针洗脱捕获的文库成员。例如,可以将捕获的文库成员从链霉亲和素珠和/或从生物素化探针上洗脱。在其中链霉亲和素珠包括磁性链霉亲和素珠的实施例中,洗脱可包括使用磁体。在一些实施例中,洗脱可包括使用强碱,包括例如NaOH、KOH、Ca(OH)

在一些实施例中,固体支持介质可以用作捕获装置,包括例如包含链霉亲和素的固体支持介质。在一些实施例中,可以在低于估计的探针:靶T

在一些实施例中,可以将捕获的文库成员从配体(例如,从生物素化探针洗脱)或捕获装置(例如,从链霉亲和素珠洗脱)洗脱,并直接加载到流动池上。

在一些实施例中,可以洗脱至少60飞摩尔(femtomoles)、至少80飞摩尔、至少90飞摩尔、至少100飞摩尔或至少150飞摩尔的DNA。在一些实施例中,可以洗脱最多可达150飞摩尔、最多可达500飞摩尔、最多可达1皮摩尔(picomole)、最多可达2皮摩尔或最多可达3皮摩尔的DNA。例如,在一些实施例中,可以洗脱100飞摩尔至2皮摩尔的DNA。

在一些实施例中,可以将洗脱的文库成员以小于100μL的体积、小于90μL的体积、小于80μL的体积、小于70μL的体积或小于60μL的体积加载到流动池上。在一些实施例中,可以将捕获的文库成员以约55μL的体积加载到流动池上。

在一些实施例中,洗脱后,洗脱液可具有至少1.1皮摩尔(pM)、至少1.2pM、至少1.3pM、至少10pM或至少100pM的DNA浓度。在一些实施例中,洗脱液可具有最多可达100pM、最多可达200pM、最多可达250pM或最多可达300pM的DNA浓度。例如,在一些实施例中,洗脱液可具有在1.3pM至250pM的范围内的DNA浓度。在一些实施例中,洗脱液可以不进一步稀释和/或不改变DNA浓度而加载到流动池上。

扩增

在另一方面,本披露描述了一种方法,该方法包括在杂交捕获之后但在对捕获的文库成员进行测序之前,使用PCR扩增文库成员。可替代地,本披露描述了一种方法,该方法不包括在杂交捕获之后在对文库成员进行测序之前将所捕获的文库成员暴露于扩增条件(例如,不包括在对文库成员测序之前将捕获的文库成员暴露于PCR步骤以扩增捕获的文库成员)。对捕获的文库成员测序的方法通常包括在对文库成员进行测序之前扩增文库成员(例如,使用PCR步骤)。

杂交和杂交捕获过程中捕获的DNA量可能太低而不能通过荧光或分析方法(例如Bioanalyzer)直接定量。扩增文库使得能够对过程进行量化和质量控制。

此外,通常在杂交捕获之后和在测序之前稀释已经使用PCR扩增的样品。例如,Illumina公司的Nextera Rapid Capture样品在PCR后的典型量化在中纳摩尔范围内,而测序浓度在低皮摩尔范围内。因此,通过扩增捕获的文库成员产生比测序所需多几个数量级的分子。

在一些实施例中,本披露描述了在杂交捕获之后对捕获的文库成员进行测序的方法。这样的方法可以包括将捕获的文库成员和/或洗脱的文库成员直接加载到流动池上(例如,使用直接流动池加载夹具(direct flowcell loading jig),例如2017年9月28日提交的美国临时专利申请号62/564,466中所描述的)。

在一些实施例中,方法可以进一步包括在杂交捕获之后对捕获的文库成员进行测序。

实施例

示例性封闭剂实施例

1.一种封闭剂,所述封闭剂包括寡核苷酸;

其中所述封闭剂能够与衔接子结合,其中所述衔接子包括通用引物序列、以及索引区或唯一分子标识符(UMI)中的至少一个;

并且其中能够结合至所述衔接子的所述索引区和/或UMI的所述封闭剂的区域包括:

至少三个胸腺嘧啶碱基、至少四个胸腺嘧啶碱基、至少五个胸腺嘧啶碱基、至少六个胸腺嘧啶碱基、至少七个胸腺嘧啶碱基、至少八个胸腺嘧啶碱基、至少九个胸腺嘧啶碱基、或至少十个胸腺嘧啶碱基;或者

通用碱基和至少一个非通用碱基。

2.如封闭剂实施例1所述的封闭剂,其中能够结合至所述衔接子的所述索引区或UMI的所述封闭剂的区域包括与所述衔接子的所述索引区和/或所述UMI中的碱基数目一样多的胸腺嘧啶碱基。

3.如封闭剂实施例1所述的封闭剂,其中所述至少一个非通用碱基位于所述封闭剂序列的对应于所述索引区和/或UMI的区域中并且其中所述非通用碱基相对于所述索引区的5'末端位于所述封闭剂序列的第三位置或第五位置或这两个位置。

4.如封闭剂实施例1或封闭剂实施例3所述的封闭剂,其中所述至少一个非通用碱基包括经修饰的鸟嘌呤。

5.如封闭剂实施例1、3或4中任一项所述的封闭剂,其中所述至少一个非通用碱基包括随机核苷酸。

6.如封闭剂实施例1、3、4或5中任一项所述的封闭剂,其中所述通用碱基包括2'-脱氧肌苷、2'-脱氧水粉蕈素、3-硝基吡咯2'-脱氧核苷或5-硝基吲哚2'-脱氧核苷。

7.如前述封闭剂实施例中任一项所述的封闭剂,其中所述通用引物序列包括P5、P7、P5'、P7'、V2.A14.METS、V2.B15.METS、V2.A14.METS的互补序列和V2.B15.METS的互补序列中的至少一个。

8.如前述封闭剂实施例中任一项所述的封闭剂,其中所述封闭剂包括修饰,所述修饰相对于不包括所述修饰的相同封闭剂增加所述封闭剂的T

9.如前述封闭剂实施例中任一项所述的封闭剂,其中所述封闭剂包括经修饰以捕获低GC区域的DNA或RNA寡核苷酸;交联的寡核苷酸;经修饰的5-甲基脱氧胞苷(5-甲基-dc);2,6-二氨基嘌呤;锁核酸(LNA);桥接核酸(BNA);三环核酸;肽核酸(PNA);C5修饰的嘧啶碱基;丙炔基嘧啶;吗啉代;亚磷酰胺;和5'-芘帽中的至少一个。

10.如前述封闭剂实施例中任一项所述的封闭剂,其中所述封闭剂在每个碱基、至少每2个碱基、至少每3个碱基、至少每4个碱基或至少每5个碱基处包括经修饰的碱基。

11.如前述封闭剂实施例中任一项所述的封闭剂,其中所述封闭剂包括3'末端基团,其阻止所述封闭剂作为DNA合成的引物的可用性。

12.如封闭剂实施例11所述的封闭剂,其中所述3'末端基团包括3'-dC、2',3'-ddC、反向dT或3'-间隔物C3。

13.如前述封闭剂实施例中任一项所述的封闭剂,其中所述封闭剂包括表2A、表2B、表2C或表3的序列。

14.一种试剂盒,其包括如前述封闭剂实施例中任一项所述的封闭剂。

示例性分裂封闭剂实施例

1.一种封闭剂,所述封闭剂包括两个未连接的寡核苷酸;

其中所述封闭剂能够与衔接子的至少一部分结合,其中所述衔接子包括通用引物序列、以及索引区或唯一分子标识符(UMI)中的至少一个;

并且其中所述未连接的寡核苷酸包括不对应于所述衔接子的所述索引区和/或所述UMI的碱基。

2.如分裂封闭剂实施例1所述的封闭剂,其中所述未连接的寡核苷酸不包括对应于所述衔接子的所述索引区和/或所述UMI的碱基。

3.如前述分裂封闭剂实施例中任一项所述的封闭剂,其中所述通用引物序列包括P5、P7、P5'、P7'、V2.A14.METS、V2.B15.METS、V2.A14.METS的互补序列和V2.B15.METS的互补序列中的至少一个。

4.如前述分裂封闭剂实施例中任一项所述的封闭剂,其中所述封闭剂包括修饰,所述修饰相对于不包括所述修饰的相同封闭剂增加所述封闭剂的T

5.如前述分裂封闭剂实施例中任一项所述的封闭剂,其中所述封闭剂包括经修饰以捕获低GC区域的DNA或RNA寡核苷酸;交联的寡核苷酸;经修饰的5-甲基脱氧胞苷(5-甲基-dc);2,6-二氨基嘌呤;锁核酸(LNA);桥接核酸(BNA);三环核酸;肽核酸(PNA);C5修饰的嘧啶碱基;丙炔基嘧啶;吗啉代;亚磷酰胺;和5'-芘帽中的至少一个。

6.如前述分裂封闭剂实施例中任一项所述的封闭剂,其中所述封闭剂在每个碱基、至少每2个碱基、至少每3个碱基、至少每4个碱基或至少每5个碱基处包括经修饰的碱基。

7.如前述分裂封闭剂实施例中任一项所述的封闭剂,其中所述封闭剂包括3'末端基团,其阻止所述封闭剂作为DNA合成的引物的可用性。

8.如分裂封闭剂实施例11所述的封闭剂,其中所述3'末端基团包括3'-dC、2',3'-ddC、反向dT或3'-间隔物C3。

9.如前述分裂封闭剂实施例中任一项所述的封闭剂,其中所述封闭剂包括表2A、表2B、表2C或表3的序列。

10.如前述分裂封闭剂实施例中任一项所述的封闭剂,其中所述封闭剂包括表2A的BN023、BN024、BN027和BN028中的至少一个。

11.一种试剂盒,其包括如前述分裂封闭剂实施例中任一项所述的封闭剂。

示例性杂交缓冲液实施例

1.一种杂交缓冲液,其包括拥挤剂。

2.如杂交缓冲液实施例1所述的杂交缓冲液,其中所述拥挤剂包括葡聚糖、硫酸葡聚糖、聚乙二醇(PEG)、Ficoll、甘油和甜菜碱中的至少一种。

3.如前述杂交缓冲液实施例中任一项所述的杂交缓冲液,其中所述拥挤剂以至少0.5%、至少1%、至少1.5%、至少2%、至少3%或至少4%的量包含在所述杂交缓冲液中。

4.如前述杂交缓冲液实施例中任一项所述的杂交缓冲液,其中所述拥挤剂以最多可达1%、最多可达1.5%、最多可达2%、最多可达3%、最多可达4%、最多可达5%、最多可达6%、最多可达8%或最多可达10%的量包含在所述杂交缓冲液中。

5.如前述杂交缓冲液实施例中任一项所述的杂交缓冲液,其中所述杂交缓冲液包括人Cot-1 DNA、去稳定剂、盐和封闭剂中的至少一种。

6.如杂交缓冲液实施例5所述的杂交缓冲液,其中所述杂交缓冲液包括至少0.05mg/mL、至少0.1mg/mL、至少0.2mg/mL或至少0.3mg/mL的量的Cot-1 DNA。

7.如杂交缓冲液实施例5或6所述的杂交缓冲液,其中所述杂交缓冲液包括最多可达0.1mg/mL、最多可达0.2mg/mL、最多可达0.3mg/mL或最多可达0.5mg/mL的量的Cot-1DNA。

8.如杂交缓冲液实施例5至7中任一项所述的杂交缓冲液,其中所述去稳定剂占所述杂交缓冲液的至少1%(v/v)、至少5%(v/v)或至少10%(v/v)。

9.如杂交缓冲液实施例5至8中任一项所述的杂交缓冲液,其中所述去稳定剂占所述杂交缓冲液的最多可达5%(v/v)、最多可达10%(v/v)或最多可达15%(v/v)。

10.如杂交缓冲液实施例5至9中任一项所述的杂交缓冲液,其中所述去稳定剂包括甲酰胺。

11.如杂交缓冲液实施例5至10中任一项所述的杂交缓冲液,其中所述杂交缓冲液包括至少0.1M、至少0.2M、至少0.3M、至少0.4M、至少0.5M、至少0.6M、至少0.7M、至少0.8M、至少0.9M或至少1M的盐。

12.如杂交缓冲液实施例5至11中任一项所述的杂交缓冲液,其中所述杂交缓冲液包括最多可达0.2M、最多可达0.3M、最多可达0.4M、最多可达0.5M、最多可达0.6M、最多可达0.7M、最多可达0.8M、最多可达0.9M、最多可达1M、最多可达2M、最多可达3M或最多可达4M的盐。

13.如杂交缓冲液实施例5至11中任一项所述的杂交缓冲液,其中所述盐包括NaCl。

14.如前述杂交缓冲液实施例中任一项所述的杂交缓冲液,其中所述杂交缓冲液包括磷酸盐。

15.如杂交缓冲液实施例14所述的杂交缓冲液,其中所述杂交缓冲液包括至少40mM、至少50mM、至少55mM、至少60mM、至少65mM或至少70mM的磷酸盐。

16.如杂交缓冲液实施例14或15所述的杂交缓冲液,其中所述杂交缓冲液包括最多可达50mM、最多可达55mM、最多可达60mM、最多可达65mM、最多可达70mM、最多可达75mM或最多可达80mM的磷酸盐。

17.如杂交缓冲液实施例14至16中任一项所述的杂交缓冲液,其中所述磷酸盐包括KH

18.如前述杂交缓冲液实施例中任一项所述的杂交缓冲液,其中所述杂交缓冲液包括去污剂。

19.如杂交缓冲液实施例18所述的杂交缓冲液,其中所述杂交缓冲液包括至少0.001%(v/v)、至少0.01%(v/v)、至少0.05%(v/v)、至少0.1%(v/v)、至少1%(v/v)或至少5%(v/v)的去污剂。

20.如杂交缓冲液实施例18或19所述的杂交缓冲液,其中所述杂交缓冲液包括最多可达0.01%(v/v)、最多可达0.05%(v/v)、最多可达0.1%(v/v)、最多可达1%(v/v)、最多可达5%(v/v)或最多可达10%(v/v)的去污剂。

21.如杂交缓冲液实施例18至20中任一项所述的杂交缓冲液,其中所述去污剂包括Tween 20。

22.如前述杂交缓冲液实施例中任一项所述的杂交缓冲液,其中所述杂交缓冲液包括

0.5%至10%硫酸葡聚糖,

0.05mg/mL至0.5mg/mL人Cot-1 DNA,

1%至15%(v/v)甲酰胺,

40mM至80mM KH

0.1M至4M NaCl,以及

0.001%至10%(v/v)Tween 20。

23.如前述杂交缓冲液实施例中任一项所述的杂交缓冲液,其中所述杂交缓冲液包括

1.5%硫酸葡聚糖,

0.2mg/mL人Cot-1 DNA,

10%(v/v)甲酰胺,

66.6mM KH

0.2mM增强型衔接子封闭剂,(对于每个衔接子,0.1mM)

0.8M NaCl和

0.04%(v/v)Tween 20。

24.如前述杂交缓冲液实施例中任一项所述的杂交缓冲液,其中所述杂交缓冲液包括封闭剂。

25.如杂交缓冲液实施例24所述的杂交缓冲液,其中所述封闭剂包括T

26.如杂交缓冲液实施例24或25所述的杂交缓冲液,其中所述封闭剂包括多个增强T

27.如杂交缓冲液实施例26所述的杂交缓冲液,其中增加所述封闭剂的T

28.如前述杂交缓冲液实施例中任一项所述的杂交缓冲液,其中所述杂交缓冲液包括封闭剂,

其中所述封闭剂包括寡核苷酸;

其中所述封闭剂能够与衔接子结合,其中所述衔接子包括通用引物序列、以及索引区或唯一分子标识符(UMI)中的至少一个;

并且其中能够结合至所述衔接子的所述索引区和/或UMI的所述封闭剂的区域包括:

至少三个胸腺嘧啶碱基、至少四个胸腺嘧啶碱基、至少五个胸腺嘧啶碱基、至少六个胸腺嘧啶碱基、至少七个胸腺嘧啶碱基、至少八个胸腺嘧啶碱基、至少九个胸腺嘧啶碱基、或至少十个胸腺嘧啶碱基;或者

通用碱基和至少一个非通用碱基。

29.如前述杂交缓冲液实施例中任一项所述的杂交缓冲液,其中所述杂交缓冲液包括封闭剂,

其中所述封闭剂包括两个未连接的寡核苷酸;

其中所述封闭剂能够与衔接子的至少一部分结合,其中所述衔接子包括通用引物序列、以及索引区或唯一分子标识符(UMI)中的至少一个;

并且其中所述未连接的寡核苷酸包括不对应于所述衔接子的所述索引区和/或所述衔接子的所述UMI的碱基。

30.如杂交缓冲液实施例28或29所述的杂交缓冲液,其中所述封闭剂包括多个增强T

31.一种试剂盒,其包括如前述杂交缓冲液实施例中任一项所述的杂交缓冲液。

使用杂交缓冲液的示例性方法(缓冲液方法实施例)

1.一种方法,其包括使用包括拥挤剂的杂交缓冲液来杂交捕获。

2.如缓冲液方法实施例1所述的方法,其中所述拥挤剂包括葡聚糖、硫酸葡聚糖、聚乙二醇(PEG)、Ficoll、甘油和甜菜碱中的至少一种。

3.如前述缓冲液方法实施例中任一项所述的方法,其中所述拥挤剂以至少0.5%(w/v)、至少1%(w/v)、至少1.5%(w/v)、至少2%(w/v)、至少3%(w/v)或至少4%(w/v)的量包含在所述杂交缓冲液中。

4.如前述缓冲液方法实施例中任一项所述的方法,其中所述拥挤剂以最多可达1%、最多可达1.5%(w/v)、最多可达2%(w/v)、最多可达3%(w/v)、最多可达4%(w/v)、最多可达5%(w/v)、最多可达6%(w/v)、最多可达8%(w/v)或最多可达10%(w/v)的量包含在所述杂交缓冲液中。

5.如前述缓冲液方法实施例中任一项所述的方法,其中所述杂交缓冲液包括人Cot-1 DNA、去稳定剂和盐中的至少一种。

6.如缓冲液方法实施例5所述的方法,其中所述杂交缓冲液包括至少0.05mg/mL、至少0.1mg/mL、至少0.2mg/mL或至少0.3mg/mL的量的人Cot-1 DNA。

7.如缓冲液方法实施例5或6所述的方法,其中所述杂交缓冲液包括最多可达0.1mg/mL、最多可达0.2mg/mL、最多可达0.3mg/mL或最多可达0.5mg/mL的量的人Cot-1DNA。

8.如缓冲液方法实施例5至7中任一项所述的方法,其中所述去稳定剂占所述杂交缓冲液的至少1%(v/v)、至少5%(v/v)或至少10%(v/v)。

9.如缓冲液方法实施例5至8中任一项所述的方法,其中所述去稳定剂占所述杂交缓冲液的最多可达5%(v/v)、最多可达10%(v/v)或最多可达15%(v/v)。

10.如缓冲液方法实施例5至9中任一项所述的方法,其中所述去稳定剂包括甲酰胺。

11.如缓冲液方法实施例5至10中任一项所述的方法,其中所述杂交缓冲液包括至少0.1M、至少0.2M、至少0.3M、至少0.4M、至少0.5M、至少0.6M、至少0.7M、至少0.8M、至少0.9M或至少1M的盐。

12.如缓冲液方法实施例5至11中任一项所述的方法,其中所述杂交缓冲液包括最多可达0.2M、最多可达0.3M、最多可达0.4M、最多可达0.5M、最多可达0.6M、最多可达0.7M、最多可达0.8M、最多可达0.9M、最多可达1M、最多可达2M、最多可达3M或最多可达4M的盐。

13.如缓冲液方法实施例5至12中任一项所述的方法,其中所述盐包括NaCl。

14.如前述缓冲液方法实施例中任一项所述的方法,其中所述杂交缓冲液包括磷酸盐。

15.如缓冲液方法实施例14所述的方法,其中所述杂交缓冲液包括至少40mM、至少50mM、至少55mM、至少60mM、至少65mM或至少70mM的磷酸盐。

16.如缓冲液方法实施例14或15所述的方法,其中所述杂交缓冲液包括最多可达50mM、最多可达55mM、最多可达60mM、最多可达65mM、最多可达70mM、最多可达75mM或最多可达80mM的磷酸盐。

17.如缓冲液方法实施例14至16中任一项所述的方法,其中所述磷酸盐包括KH

18.如前述缓冲液方法实施例中任一项所述的方法,其中所述杂交缓冲液包括去污剂。

19.如缓冲液方法实施例17所述的方法,其中所述杂交缓冲液包括至少0.001%(v/v)、至少0.01%(v/v)、至少0.05%(v/v)、至少0.1%(v/v)、至少1%(v/v)或至少5%(v/v)的去污剂。

20.如缓冲液方法实施例18或19所述的方法,其中所述杂交缓冲液包括最多可达0.01%(v/v)、最多可达0.05%(v/v)、最多可达0.1%(v/v)、最多可达1%(v/v)、最多可达5%(v/v)或最多可达10%(v/v)的去污剂。

21.如缓冲液方法实施例18至20中任一项所述的方法,其中所述杂交缓冲液包括Tween 20。

22.如前述缓冲液方法实施例中任一项所述的方法,其中所述杂交缓冲液包括

0.5%至10%硫酸葡聚糖,

0.05mg/mL至0.5mg/mL Cot-1,

1%至15%(v/v)甲酰胺,

40mM至80mM KH

0.1M至4M NaCl,以及

0.001%至10%(v/v)Tween 20。

23.如前述缓冲液方法实施例中任一项所述的方法,其中所述杂交缓冲液包括

1.5%硫酸葡聚糖,

0.2mg/mL Cot-1,

10%(v/v)甲酰胺,

66.6mM KH

0.8M NaCl和

0.04%(v/v)Tween 20。

24.如前述缓冲液方法实施例中任一项所述的方法,其中所述杂交缓冲液包括封闭剂。

25.如缓冲液方法实施例24所述的方法,其中所述封闭剂以至少0.001mM、至少0.005mM、至少0.01mM、至少0.05mM或至少0.1mM的浓度存在。

26.如缓冲液方法实施例24或25所述的方法,其中所述封闭剂以最多可达0.01mM、最多可达0.05mM、最多可达0.1mM、最多可达0.2mM或最多可达0.5mM的浓度存在。

27.如前述缓冲液方法实施例中任一项所述的方法,其中所述方法包括由包括人Cot-1 DNA和封闭剂的第一组合物和包括甲酰胺和硫酸葡聚糖的第二组合物形成杂交缓冲液。

28.如前述缓冲液方法实施例中任一项所述的方法,其中所述方法包括使文库与所述杂交缓冲液接触,其中所述杂交缓冲液包括封闭剂。

29.如缓冲液方法实施例28所述的方法,其中所述方法包括在所述杂交缓冲液存在下在使所述文库与所述封闭剂接触之前,合并来自至少两个文库制备的样品。

30.如缓冲液方法实施例29所述的方法,其中将至少1μL、至少2μL、至少3μL、至少5μL、至少10μL、至少15μL或至少20μL的由每个文库制备产生的样品合并。

31.如缓冲液方法实施例29或30所述的方法,其中将最多可达2μL、最多可达3μL、最多可达5μL、最多可达10μL、最多可达15μL、最多可达20μL、最多可达25μL、最多可达30μL、最多可达40μL或最多可达50μL的由每个文库制备产生的样品合并。

32.如缓冲液方法实施例29至31中任一项所述的方法,其中将至少10ng、至少15ng、至少25ng、至少50ng、至少100ng、至少200ng、至少500ng、至少1,000ng或至少5,000ng的来自每个文库制备的DNA合并。

33.如缓冲液方法实施例29至32中任一项所述的方法,其中将最多可达15ng、最多可达25ng、最多可达50ng、最多可达100ng、最多可达200ng、最多可达500ng、最多可达1,000ng、最多可达5,000ng、最多可达10,000ng或最多可达12,000ng的来自每个文库制备的DNA合并。

34.如缓冲液方法实施例29至33中任一项所述的方法,其中合并的由文库制备产生的每个样品的DNA浓度为至少0.1ng/μL、至少0.3ng/μL、至少0.4ng/μL、至少0.5ng/μL、至少1ng/μL、至少2ng/μL、至少4ng/μL、至少6ng/μL、至少8ng/μL、至少10ng/μL、至少12ng/μL、至少20ng/μL、至少50ng/μL、至少60ng/μL、至少100ng/μL或至少200ng/μL。

35.如缓冲液方法实施例29至34中任一项所述的方法,其中合并的由文库制备产生的每个样品的DNA浓度为最多可达0.4ng/μL、最多可达0.5ng/μL、最多可达1ng/μL、最多可达2ng/μL、最多可达4ng/μL、最多可达6ng/μL、最多可达8ng/μL、最多可达10ng/μL、最多可达12ng/μL、最多可达15ng/μL、最多可达20ng/μL、最多可达50ng/μL、最多可达100ng/μL、最多可达120ng/μL、最多可达200ng/μL、最多可达300ng/μL或最多可达400ng/μL。

36.如缓冲液方法实施例29至35中任一项所述的方法,其中合并文库制备后的DNA浓度在0.3ng/μL至400ng/μL的范围内。

37.如缓冲液方法实施例29至36中任一项所述的方法,其中所述方法还包括使文库成员与探针接触,其中所述探针与文库成员内的目的区域杂交,并且其中所述探针包括配体。

38.如缓冲液方法实施例37所述的方法,其中所述配体包括生物素基团。

39.如缓冲液方法实施例29至38中任一项所述的方法,其中所述方法包括形成杂交混合物,所述杂交混合物包括文库成员、所述杂交缓冲液(其中所述杂交缓冲液包括封闭剂)和探针。

40.如缓冲液方法实施例39所述的方法,其中所述杂交混合物还包括人Cot-1DNA。

42.如缓冲液方法实施例39或40所述的方法,其中所述方法包括使用最多可达150μL、最多可达140μL、最多可达130μL、最多可达120μL、最多可达110μL、最多可达100μL、最多可达90μL、最多可达80μL、最多可达70μL、最多可达60μL或最多可达50μL的体积的杂交混合物。

42.如缓冲液方法实施例39至41中任一项所述的方法,其中所述方法包括使用至少10μL、至少20μL、至少30μL、至少40μL、至少50μL、至少60μL或至少70μL的体积的杂交混合物。

43.如缓冲液方法实施例39至42中任一项所述的方法,其中所述杂交混合物中的DNA浓度为至少0.1ng/μL、至少0.3ng/μL、至少0.4ng/μL、至少0.5ng/μL、至少1ng/μL、至少2ng/μL、至少4ng/μL、至少6ng/μL、至少8ng/μL、至少10ng/μL、至少12ng/μL、至少15ng/μL、至少20ng/μL、至少50ng/μL、至少75ng/μL、至少100ng/μL、至少120ng/μL、至少150ng/μL、至少200ng/μL。

44.如缓冲液方法实施例39至43中任一项所述的方法,其中所述杂交混合物中的DNA浓度为最多可达0.3ng/μL、最多可达0.4ng/μL、最多可达0.5ng/μL、最多可达1ng/μL、最多可达2ng/μL、最多可达4ng/μL、最多可达6ng/μL、最多可达8ng/μL、最多可达10ng/μL、最多可达12ng/μL、最多可达15ng/μL、最多可达20ng/μL、最多可达50ng/μL、最多可达75ng/μL、最多可达100ng/μL、最多可达120ng/μL、最多可达150ng/μL、最多可达200ng/μL或最多可达500ng/μL。

45.如缓冲液方法实施例37至44中任一项所述的方法,其中将所述文库与所述探针接触最多可达3天、最多可达2天、最多可达24小时、最多可达20小时、最多可达16小时、最多可达12小时、最多可达6小时、最多可达3小时、最多可达2小时、最多可达90分钟、最多可达1小时或最多可达30分钟。

46.如缓冲液方法实施例37至45中任一项所述的方法,其中将所述文库与所述探针接触至少30分钟、至少45分钟、至少1小时、至少90分钟、至少2小时、至少3小时、至少6小时、至少12小时、至少16小时、至少20小时或至少24小时。

47.如缓冲液方法实施例39至46中任一项所述的方法,其中方法包括将所述杂交混合物保持在杂交温度下,并且其中所述杂交温度为至少50℃、至少55℃、至少56℃、至少57℃、至少58℃、至少59℃、至少60℃、至少61℃、至少62℃、至少63℃、至少64℃、至少65℃或至少70℃。

48.如缓冲液方法实施例39至47中任一项所述的方法,其中方法包括将所述杂交混合物保持在杂交温度下,并且其中所述杂交温度为最多可达56℃、最多可达58℃、最多可达60℃、最多可达61℃、最多可达62℃、最多可达63℃、最多可达64℃、最多可达65℃或最多可达70℃。

49.如缓冲液方法实施例39至48中任一项所述的方法,其中所述方法包括将所述杂交混合物在杂交温度下保持最多可达3天、最多可达2天、最多可达24小时、最多可达20小时、最多可达16小时、最多可达12小时、最多可达6小时、最多可达3小时、最多可达2小时、最多可达90分钟、最多可达1小时或最多可达30分钟。

50.如缓冲液方法实施例39至49中任一项所述的方法,其中所述方法包括将所述杂交混合物在杂交温度下保持至少30分钟、至少45分钟、至少1小时、至少90分钟、至少2小时、至少3小时、至少6小时、至少12小时、至少16小时、至少20小时或至少24小时。

51.如缓冲液方法实施例37至50中任一项所述的方法,其中所述方法还包括在探针杂交后使用捕获装置捕获所述探针。

52.如缓冲液方法实施例51所述的方法,其中捕获所述探针包括使用链霉亲和素珠。

53.如缓冲液方法实施例37至52中任一项所述的方法,其中所述方法包括形成包括所述探针和捕获装置的捕获混合物。

54.如缓冲液方法实施例53所述的方法,其中所述方法包括将所述捕获混合物保持在至少50℃、至少55℃、至少56℃、至少57℃、至少58℃、至少59℃、至少60℃、至少61℃、至少62℃、至少63℃、至少64℃、至少65℃或至少70℃的捕获温度下。

55.如缓冲液方法实施例53或54所述的方法,其中所述方法包括将所述捕获混合物保持在最多可达56℃、最多可达58℃、最多可达60℃、最多可达61℃、最多可达62℃、最多可达63℃、最多可达64℃、最多可达65℃或最多可达70℃的捕获温度下。

56.如缓冲液方法实施例53至55中任一项所述的方法,其中所述方法包括将所述捕获混合物在捕获温度下保持至少2分钟、至少5分钟、至少10分钟或至少15分钟。

57.如缓冲液方法实施例53至56中任一项所述的方法,其中所述方法包括将所述捕获混合物在捕获温度下保持最多可达5分钟、最多可达10分钟、最多可达15分钟、最多可达20分钟、最多可达30分钟或最多可达45分钟。

58.如缓冲液方法实施例53至57中任一项所述的方法,其中所述方法包括洗涤所述捕获的探针。

59.如缓冲液方法实施例53至58中任一项所述的方法,其中所述方法还包括将所捕获的文库成员从所述捕获装置洗脱到洗脱液中。

60.如缓冲液方法实施例53至59中任一项所述的方法,其中所述方法还包括将所捕获的文库成员从所述探针洗脱到洗脱液中。

61.如缓冲液方法实施例60所述的方法,其中至少60飞摩尔、至少80飞摩尔、至少90飞摩尔、至少100飞摩尔或至少150飞摩尔的DNA被洗脱。

62.如缓冲液方法实施例60或61所述的方法,其中最多可达150飞摩尔、最多可达500飞摩尔、最多可达1皮摩尔、最多可达2皮摩尔或最多可达3皮摩尔的DNA被洗脱。

63.如缓冲液方法实施例60至62中任一项所述的方法,其中洗脱液的DNA浓度为至少1.1pM、至少1.2pM、至少1.3pM、至少10pM或至少100pM。

64.如缓冲液方法实施例60至63中任一项所述的方法,其中洗脱液的DNA浓度为最多可达100pM、最多可达200pM、最多可达250pM或最多可达300pM。

65.如缓冲液方法实施例60至64中任一项所述的方法,其中洗脱液的DNA浓度在1.3pM至250pM的范围内。

66.如缓冲液方法实施例37至65中任一项所述的方法,其中所述方法还包括对所述文库成员测序。

67.如缓冲液方法实施例66所述的方法,其中所述方法包括在对所述文库成员测序之前扩增所述文库成员。

68.如缓冲液方法实施例66所述的方法,其中所述方法不包括在对所述文库成员测序之前扩增所述文库成员。

69.如缓冲液方法实施例24至68中任一项所述的方法,其中所述封闭剂包括T

70.如缓冲液方法实施例24至69中任一项所述的方法,其中所述封闭剂包括多个增强T

71.如缓冲液方法实施例70所述的方法,其中增加所述封闭剂的T

72.如缓冲液方法实施例24至71中任一项所述的方法,其中所述封闭剂包括寡核苷酸;

其中所述封闭剂能够与衔接子结合,其中所述衔接子包括通用引物序列、以及索引区或唯一分子标识符(UMI)中的至少一个;

并且其中能够结合至所述衔接子的所述索引区和/或UMI的所述封闭剂的区域包括:

至少三个胸腺嘧啶碱基、至少四个胸腺嘧啶碱基、至少五个胸腺嘧啶碱基、至少六个胸腺嘧啶碱基、至少七个胸腺嘧啶碱基、至少八个胸腺嘧啶碱基、至少九个胸腺嘧啶碱基、或至少十个胸腺嘧啶碱基;或者

通用碱基和至少一个非通用碱基。

73.如缓冲液方法实施例24至72中任一项所述的方法,其中所述封闭剂包括两个未连接的寡核苷酸;

其中所述封闭剂能够与衔接子的至少一部分结合,其中所述衔接子包括通用引物序列、以及索引区或唯一分子标识符(UMI)中的至少一个;

并且其中所述未连接的寡核苷酸包括不对应于所述衔接子的所述索引区和/或所述衔接子的所述UMI的碱基。

无PCR杂交捕获的示例性方法(捕获方法实施例)

1.一种方法,其包括

在杂交缓冲液存在下使文库与封闭剂接触;

以及使所述文库与探针接触,其中所述探针与文库成员内的目的区域杂交;

其中所述方法不包括在对所述文库成员测序之前使用PCR扩增所述文库成员。

2.如捕获方法实施例1所述的方法,其中所述探针进一步包括配体,并且其中在对所述文库成员进行测序之前,从所述配体洗脱所述文库成员。

3.如捕获方法实施例2所述的方法,其中所述配体包括生物素。

4.如捕获方法实施例2或3中任一项所述的方法,所述方法包括在从所述配体洗脱后将所述文库成员加载到流动池上。

5.如捕获方法实施例1至4中任一项所述的方法,其中所述方法还包括在探针杂交后使用捕获装置捕获所述探针。

6.如捕获方法实施例5所述的方法,其中所述捕获装置包括链霉亲和素。

7.如捕获方法实施例5或6中任一项所述的方法,所述方法包括在从所述捕获装置洗脱后将所述文库成员加载到流动池上。

8.如捕获方法实施例4或7所述的方法,所述方法包括将所述文库成员以小于100μL的体积、小于90μL的体积、小于80μL的体积、小于70μL的体积或小于60μL的体积加载到流动池上。

9.如捕获方法实施例4或7所述的方法,所述方法包括将所述文库成员以至少1.1pM、至少1.2pM、至少1.3pM、至少10pM或至少100pM的浓度加载到流动池上。

10.如捕获方法实施例4、7或9所述的方法,所述方法包括将所述文库成员以最多可达100pM、最多可达200pM、最多可达250pM或最多可达300pM的浓度加载到流动池上。

11.如捕获方法实施例4、或7-10中任一项所述的方法,所述方法包括使用直接流动池加载夹具将所述文库成员加载到流动池上。

12.如前述捕获方法实施例中任一项所述的方法,其中所述杂交缓冲液包括拥挤剂。

13.如捕获方法实施例12所述的方法,其中所述杂交缓冲液包括

0.5%至10%硫酸葡聚糖,

0.05mg/mL至0.5mg/mL人Cot-1 DNA,

1%至15%(v/v)甲酰胺,

40mM至80mM KH

0.1M至4M NaCl,以及

0.001%至10%(v/v)Tween 20。

14.如前述捕获方法实施例中任一项所述的方法,其中所述封闭剂包括T

15.如前述捕获方法实施例中任一项所述的方法,其中所述封闭剂包括多个增强T

16.如捕获方法实施例15所述的方法,其中增加所述封闭剂的T

17.如前述捕获方法实施例中任一项所述的方法,其中所述封闭剂包括寡核苷酸;

其中所述封闭剂能够与衔接子结合,其中所述衔接子包括通用引物序列、以及索引区或唯一分子标识符(UMI)中的至少一个;

并且其中能够结合至所述衔接子的所述索引区和/或UMI的所述封闭剂的区域包括:

至少三个胸腺嘧啶碱基、至少四个胸腺嘧啶碱基、至少五个胸腺嘧啶碱基、至少六个胸腺嘧啶碱基、至少七个胸腺嘧啶碱基、至少八个胸腺嘧啶碱基、至少九个胸腺嘧啶碱基、或至少十个胸腺嘧啶碱基;或者

通用碱基和至少一个非通用碱基。

18.如前述捕获方法实施例中任一项所述的方法,其中所述封闭剂包括两个未连接的寡核苷酸;

其中所述封闭剂能够与衔接子的至少一部分结合,其中所述衔接子包括通用引物序列、以及索引区或唯一分子标识符(UMI)中的至少一个;

并且其中所述未连接的寡核苷酸包含不对应于所述衔接子的所述索引区和/或所述衔接子的所述UMI的碱基。

通过以下实例说明本发明。应该理解地是,具体的实例、材料、量和程序应根据如本文所阐述的本发明的范围和精神来宽泛地解释。

实施例

以下编号的条目提供了本文所述的实施例,但文中所述的实施例不是限制性的。

条目1.一种杂交缓冲液,所述杂交缓冲液包括人Cot-1 DNA、去稳定剂、盐和封闭剂中的至少一种以及拥挤剂。

条目2.如条目1所述的杂交缓冲液,其中所述拥挤剂包括葡聚糖、硫酸葡聚糖、聚乙二醇(PEG)、Ficoll、甘油和甜菜碱中的至少一种。

条目3.如前述条目中任一项所述的杂交缓冲液,其中所述杂交缓冲液包括:0.5%至10%硫酸葡聚糖、0.05mg/mL至0.5mg/mL Cot-1、1%至15%(v/v)甲酰胺、40mM至80mMKH

条目4.如前述条目中任一项所述的杂交缓冲液,其中所述封闭剂包括多个增强T

条目5.一种方法,其包括使用如前述条目中任一项所述的杂交缓冲液。

条目6.如条目5所述的方法,所述方法包括形成杂交混合物,所述杂交混合物包括文库成员、杂交缓冲液、人Cot-1 DNA、封闭剂和探针。

条目7.如条目6所述的方法,其中所述杂交混合物包括来自至少两个文库制备的样品,其中将来自每个文库制备的至少10ng、至少25ng、至少50ng、至少100ng、至少200ng、或至少500ng的DNA合并。

条目8.如条目6或条目7所述的方法,其中所述杂交混合物的DNA浓度在0.1ng/μL至120ng/μL的范围内。

条目9.如条目6至8中任一项所述的方法,其中所述方法包括:使所述文库成员与所述探针接触,其中所述探针与文库成员内的目的区域杂交,并且其中所述探针包括配体;在所述探针杂交后使用捕获装置捕获所述探针,并将捕获的文库成员从所述捕获装置洗脱到洗脱液中,其中所述洗脱液的DNA浓度在1.3pM至250pM的范围内。

条目10.如条目6至9中任一项所述的方法,其中所述方法进一步包括对所述文库成员进行测序,并且其中所述方法不包括在对所述文库成员进行测序之前扩增所述文库成员。

条目11.如条目10所述的方法,其中所述方法包括使用直接流动池加载夹具将所述文库成员加载到流动池上。

条目12.一种封闭剂,所述封闭剂包括寡核苷酸;其中所述封闭剂能够与衔接子结合,其中所述衔接子包括通用引物序列、以及索引区或唯一分子标识符(UMI)中的至少一个;并且其中能够结合至所述衔接子的所述索引区和/或UMI的所述封闭剂的区域包括:至少三个胸腺嘧啶碱基、至少四个胸腺嘧啶碱基、至少五个胸腺嘧啶碱基、至少六个胸腺嘧啶碱基、至少七个胸腺嘧啶碱基、至少八个胸腺嘧啶碱基、至少九个胸腺嘧啶碱基、或至少十个胸腺嘧啶碱基;或通用碱基和至少一个非通用碱基。

条目13.一种封闭剂,所述封闭剂包括两个未连接的寡核苷酸;其中所述封闭剂能够与衔接子的至少一部分结合,其中所述衔接子包括通用引物序列、以及索引区或唯一分子标识符(UMI)中的至少一个;并且其中所述未连接的寡核苷酸包括不对应于所述衔接子的所述索引区和/或所述UMI的碱基。

条目14.如条目12或13所述的封闭剂,其中所述通用引物序列包括P5、P7、P5'、P7'、V2.A14.METS、V2.B15.METS、V2.A14.METS的互补序列和V2.B15.METS的互补序列中的至少一个。

条目15.如条目12至14中任一项所述的封闭剂,其中所述封闭剂包括修饰,所述修饰相对于不包含所述修饰的相同封闭剂增加所述封闭剂的T

条目16.如条目12至15中任一项所述的封闭剂,其中所述封闭剂包括经修饰以捕获低GC区域的DNA或RNA寡核苷酸;交联的寡核苷酸;经修饰的5-甲基脱氧胞苷(5-甲基-dc);2,6-二氨基嘌呤;锁核酸(LNA);桥接核酸(BNA);三环核酸;肽核酸(PNA);C5修饰的嘧啶碱基;丙炔基嘧啶;吗啉代;亚磷酰胺;和5'-芘帽中的至少一个。

条目17.一种方法,其包括在杂交缓冲液存在下使文库与封闭剂接触;以及使所述文库与探针接触,其中所述探针与文库成员内的目的区域杂交;其中所述方法不包括在对所述文库成员测序之前使用PCR扩增所述文库成员。

条目18.如条目17所述的方法,其中所述方法包括将所述文库成员以至少1.1pM、至少1.2pM、至少1.3pM、至少10pM或至少100pM的浓度以及最多可达100pM、最多可达200pM、最多可达250pM或最多可达300pM的浓度加载到流动池上。

条目19.如条目17或18所述的方法,其中所述封闭剂包括多个增强T

条目20.如条目17至19中任一项所述的方法,其中所述杂交缓冲液包括拥挤剂。

条目21.如条目17至20中任一项所述的方法,其中所述杂交缓冲液包括0.5%至10%硫酸葡聚糖、0.05mg/mL至0.5mg/mL人Cot-1 DNA、1%至15%(v/v)甲酰胺、40mM至80mMKH

条目22.如条目17至21中任一项所述的方法,所述方法包括使用直接流动池加载夹具将所述文库成员加载到流动池上。

条目23.一种试剂盒,其包括如条目1至4中任一项所述的杂交缓冲液。

条目24.一种试剂盒,其包括如条目12至16中任一项所述的封闭剂。

实例

实例1-杂交和捕获

杂交

非增强型杂交缓冲液在100μL杂交反应中包含以下组分/最终浓度:人Cot-10.2mg/ml,甲酰胺10%(v/v),KH

增强型杂交缓冲液在100μL杂交反应中包含以下组分/最终浓度:硫酸葡聚糖1.5%(w/v),人Cot-1 0.2mg/ml,甲酰胺10%(v/v),KH

在每种情况下,100μL最终反应还含有:浓度为125pM/探针(总探针浓度为至少30nM)的探针(具有至少500个探针和最多可达500,000个探针),以及最多可达30μL(50ng-6μg)的DNA样品。如果包含,封闭剂以0.2mM存在。

杂交反应在具有精确温度控制的热循环仪或HYBEX系统中进行。在95℃变性5分钟后,将杂交反应在58℃或62℃孵育90分钟(总杂交时间约(~)100分钟)或最多可达24小时。以2℃/分钟从95℃渐降至58℃或62℃(另外20分钟),然后,取决于探针设计,在58℃或62℃孵育。(对于本文所描述的实验,将样品在62℃下孵育)。

捕获

在杂交孵育温度下(例如,如果杂交反应在62℃孵育90分钟,则使用62℃),对于每100μL杂交反应,使用250μL链霉亲和素珠SMB(链霉亲和素磁珠,Illumina公司,加利福尼亚州圣地亚哥)进行15分钟的捕获靶向DNA。然后使用洗涤缓冲液EEW(增强型富集洗涤缓冲液,Illumina公司,加利福尼亚州圣地亚哥(Tris-HCL,去铁胺甲磺酸(DFO),甜菜碱和Tween20))在相同温度(例如62℃)下洗涤靶向DNA 5分钟,总共4次。使用新鲜的变性溶液(0.1%(v/v)Tween 20(EE1)和2NNaOH(HP3))洗脱靶向DNA,用ET2(洗脱靶标缓冲液2,Illumina公司,加利福尼亚州圣地亚哥(Tris碱,Tris乙酸盐))中和,并进一步用引物混合物(PPC;测序衔接子引物组,包括5μM P5和P7引物,Illumina公司)和增强型PCR Mix(EPM)(Illumina公司,加利福尼亚州圣地亚哥)扩增,并使用0.9x固相载体可逆固定化(Solid PhaseReversible Immobilization,SPRI)珠进行清除。

实例2-包含胸腺嘧啶的封闭剂

该实例描述了在对应于索引和/或UMI的封闭剂的区域中包含胸腺嘧啶的封闭剂(见图3D)。

使用表3的封闭剂,如实例1中所述,使用增强型杂交缓冲液和0.2mM封闭剂进行杂交和捕获。对所得的所捕获的DNA进行测序,并使用Enrichment v3.0BASESPACE App(Illumina公司,加利福尼亚州圣地亚哥)来计算填充读数富集(Padded ReadEnrichment)。

在索引序列位置包括一段T的封闭剂在不对应于索引的封闭剂的区域中需要至少8或10个经修饰的核苷酸以实现对中靶DNA的高捕获(如通过填充读数富集所测量的)。

具有与索引区互补的序列的寡核苷酸需要较少的经修饰核苷酸(测试了8个核苷酸和10个核苷酸),并显示了较高的填充读数富集。结果示于图4中。在封闭剂中具有相同数目的修饰(8个或10个核苷酸)的情况下,具有与索引区互补的序列的封闭剂(最后一个柱)显示出比在索引区中具有一段T的封闭剂(在图4中标记为“10个修饰和(T)8”)更高的填充读数富集。

实例3-包含通用碱基和经修饰的碱基的封闭剂

在增强型杂交缓冲液中使用0.2mM的表4的封闭剂,如实例1中所描述的进行杂交和捕获。如表4所示,对应于索引区的封闭剂的区域包括通用碱基(脱氧肌苷)和LNA修饰的鸟嘌呤或随机核苷酸。

不希望被理论所束缚,据信在对应于索引区的封闭剂序列的每第三个碱基处(例如,在对应于索引区的封闭剂序列的(从5’末端开始的)第三和/或第五位置处,如图5中一个实施例所示,或在对应于索引区的封闭剂序列的第二和/或第四位置处)包含经修饰的G或随机核苷酸提高了封闭剂对文库成员的亲和力。

实例4-分裂封闭剂

该实例显示,分裂LNA封闭剂与包含8-核苷酸索引的文库很好地起作用。

使用表5的封闭剂,使用增强型杂交缓冲液进行如实例1所描述的杂交和捕获。如表5所示,封闭剂TiLNAS1(BN025),TiLNAS2(BN026),P5LNA(BN023)和P7LNA(BN024)不包括对应于索引区的区域。P5LNA(BN023)和P7LNA(BN024)各自包含8个LNA修饰的碱基。TiLNAS1(BN025)和TiLNAS2(BN026)各自包含10个LNA修饰的碱基。TiLNA17(BN027)和TiLNA18(BN028)在对应于索引区的封闭剂的区域中包括通用碱基(脱氧肌苷),但包括对应于衔接子的其他区域的缩短的封闭剂的区域。

对所得的捕获的DNA进行测序,并使用Enrichment v3.0 BaseSpace App(Illumina公司,加利福尼亚州圣地亚哥)计算填充读数富集。封闭剂的示意图在图6A和图3E-图3I中示出;结果示于图6B中。样品“分裂4pc(Split 4pc)”含有表5的TiLNAS1(BN025),TiLNAS2(BN026),P5LNA(BN023)和P7LNA(BN024);样品“内部(Inner)”含有表5中的TiLNAS1(BN025)和TiLNAS2(BN026);样品“外部(Outer)”含有表5中的P5LNA(BN023)和P7LNA(BN024);样品Short8nt包含表5中的TiLNA17(BN027)和TiLNA18(BN028)。包括BN023、BN024、BN025和BN026的两种两件式封闭剂(“分裂封闭剂”)与xGen封闭寡核苷酸(综合DNA技术公司,Integrated DNA Technologies,科勒尔维尔,爱荷华州)一样很好地起作用,如通过填充读数富集所测量的;使用仅封闭部分衔接子的封闭剂的实验没有一样很好地起作用。

实例5-杂交缓冲液

该实例显示了使用非增强型杂交缓冲液和增强型杂交缓冲液的中靶捕获的比较。

使用xGen封闭寡核苷酸(综合DNA技术公司,科勒尔维尔,爱荷华州)和包含图7A所示的硫酸葡聚糖浓度的增强型杂交缓冲液进行如实例1中所描述的杂交和捕获。对所得的捕获的DNA进行测序,并使用Enrichment v3.0 BaseSpace App(Illumina公司,加利福尼亚州圣地亚哥)计算填充读数富集。结果示于图7A中。包含硫酸葡聚糖允许在大体积(100μL)杂交缓冲液中快速杂交(60分钟至90分钟)。

使用四个不同探针组评估使用100μL杂交缓冲液体积的富集:编码外显子组寡核苷酸(Coding Exome Oligos,CEX)(Illumina公司,加利福尼亚州圣地亚哥),IDT外显子组研究组(IDT Exome Research Panel,IDT外显子组)(综合DNA技术公司,科勒尔维尔,爱荷华州),TruSight癌症组(TRUSIGHT Cancer Panel,癌症)(Illumina公司,加利福尼亚州圣地亚哥)和TruSight One测序组(TRUSIGHT One Sequencing Panel,TSO)(Illumina公司,加利福尼亚州圣地亚哥)。如实例1所描述的,测试了在三种杂交缓冲液中的杂交:来自xGenLockdown试剂盒的IDT缓冲液(综合DNA技术公司,科勒尔维尔,爱荷华州),以及具有和不具有硫酸葡聚糖的杂交缓冲液。结果示于图7B中。对于所有四个探针组(范围从4,000到450,000个探针),与IDT缓冲液相比,增强型杂交缓冲液提供相似或更高的中靶结果。

在不同杂交孵育时间下以及在进行和不进行额外的温度渐变步骤的情况下,使用具有IDT xGen封闭剂的Illumina增强型杂交缓冲液,获得四个组(CEX,IDT外显子组,癌症和TSO)的两个关键富集指标(填充读数富集和覆盖均匀性(Uniformity of Coverage))。结果示于图7C中。左图中的黑色虚线指示在没有硫酸葡聚糖的缓冲液中杂交的结果。

将3轮12重文库输入按体积合并至总计30μL,并使用具有IDT xGen封闭剂的Illumina增强型杂交缓冲液进行富集。样品在各种Illumina公司测序仪(NovaSeq,NextSeq和iSeq)上运行。无需样品浓缩步骤。结果显示在图7D-7F中。结果表明,当使用包含硫酸葡聚糖的增强型杂交缓冲液时,在杂交反应中可以容纳最多可达30μL样品(例如,单次15μL样品或12重运行,每次2.5μL)。使用增强型杂交缓冲液允许在一个反应中富集最多可达12个样品,而不用使用快速真空、离心柱或SPRI珠来进一步减少池体积。

实例6-改进的衔接子+增强型杂交缓冲液

使用以下测试IDT外显子组小组(IDT exome panel,目录号1056114,综合DNA技术公司,科勒尔维尔,爱荷华州)的富集性能:(1)来自xGen Lockdown试剂盒(综合DNA技术公司,科勒尔维尔,爱荷华州)的IDT缓冲液(17μL);(2)小(11μL)反应体积(TiE0)的具有非增强型衔接子封闭剂(表2中的Nextera封闭剂1i5(BN001)和Nextera封闭剂2i7(BN002))的非增强型杂交缓冲液;(3)小(11μL)反应体积(TiE3)的具有增强型衔接子封闭剂(xGen封闭剂)的非增强型杂交缓冲液;(4)大(100μL)反应体积(TiE4)的具有增强型衔接子封闭剂(xGen封闭剂)的非增强型杂交缓冲液;以及(5)大(100μL)反应体积(TiE9)的具有增强型衔接子封闭剂(xGen封闭剂)的增强型杂交缓冲液。结果示于图8A中并表明当在杂交缓冲液中使用经修饰的封闭剂、洗涤温度升高和/或拥挤剂(硫酸葡聚糖)时,富集性能得到改善。

使用IDT富集测定法(目录号1080584,综合DNA技术公司,科勒尔维尔,爱荷华州)以及在使用增强型杂交缓冲液的Illumina富集测定法中,在九个探针组中评估富集性能(如使用填充读数富集进行测量)。使用各种探针组(500-450,000个探针)在100μL反应体积中实现高填充读数富集。探针组包括:(1)xGen外显子组研究组(IDT外显子组)(目录号1056114,综合DNA技术公司,科勒尔维尔,爱荷华州);(2)Twist人核心外显子组(推斯特生物科学公司(Twist Bioscience,Inc.),目录号100254);(3)编码外显子组寡核苷酸(CEX)(目录号15034575,Illumina公司,加利福尼亚州圣地亚哥);(4)TruSight One(Illumina公司,加利福尼亚州圣地亚哥,目录号FC-141-1007;探针目录号15046658);(5)TruSight OneExpanded(Illumina公司,圣地亚哥,目录号FC-141-2007;探针目录号20015656);(6)TruSight癌症(Illumina公司,加利福尼亚州圣地亚哥,目录号FC-121-0202;探针目录号15035642);(7)TruSight Cardio(Illumina公司,加利福尼亚州圣地亚哥,目录号FC-141-1010;探针目录号15069654);(8)TruSight RNA融合组(TruSight RNA Fusion Panel,Illumina公司,加利福尼亚州圣地亚哥,目录号20000906);(9)肿瘤学DNA探针主池(OPD1)(Oncology DNA Probes Master Pool,Illumina公司,目录号OP-101-1004;探针目录号20001565)。结果示于图8B中。白色柱(第1列)显示了在具有Nextera快速捕获文库制备(Illumina公司,加利福尼亚州圣地亚哥)的IDT lockdown富集工作流程中IDT外显子组小组的性能。灰色柱显示了使用具有增强型杂交缓冲液和IDT xGEN衔接子封闭剂的Illumina富集测定法情况下的各组性能。黑色水平线显示在使用Twist富集测定法(Twistenrichment assay,推斯特生物科学公司)(第3列)、Nextera快速捕获文库制备(第4-8列),或TruSight Tumor 170工作流程(在OPD1组情况下)(第10列)的对应组的情况下获得的比较结果。在至少三个独立的实验中评估各组在使用增强型杂交缓冲液的Illumina富集测定中的性能;误差条表示标准偏差。

对12-基因,535-探针组使用增强型杂交缓冲液和xGen封闭剂通过单杂交富集方案以富集从Horizon Discover HD701定量多重(QM)DNA(Horizon DiscoverHD701quantitative multiplex(QM)DNA)标准产生的文库来检测体细胞变体。图8C中呈现的数据示出了预期的变体频率(x轴)相比于所调用的变体频率(called variantfrequency)(y轴)。图8C中的每个图代表不同浓度的高亲和力衔接子封闭剂(IDT xGen衔接子封闭剂,0.1x(0.02mM)和0.5x(0.1mM)和阴性对照(无高亲和力衔接子封闭剂)。每个点代表体细胞变体调用(somatic variant call),按读取深度进行着色。红色虚线代表已知变体频率和所调用的变体频率之间的预测的完美相关性。蓝色和灰色阴影分别表示所调用的变体频率与已知的变体频率相比的最佳拟合线和95%置信区间。对于IDT xGen衔接子封闭剂(0.1X(0.02mM),0.5X(0.1mM)),预期的变体频率(x轴)与已知(所调用的)变体频率(y轴)相关,但对于阴性对照(无高亲和力衔接子封闭剂)不相关。

实例7A-使用TruSeq衔接子连接的文库进行无PCR杂交捕获

该实例显示了无PCR杂交捕获。

根据包装说明(具有以下修改),使用xGen Lockdown试剂(综合DNA技术公司,科勒尔维尔,爱荷华州)进行杂交。使用TruSeq衔接子连接方法制备靶向DNA,并使用100μLDynabeads M-270链霉亲和素(综合DNA技术公司,科勒尔维尔,爱荷华州)捕获。杂交仅孵育30分钟,而不是建议的4小时。然后遵循以下方案:

1.用10μL 0.1N NaOH孵育珠,使捕获的文库从探针变性,然后将其释放到溶液中。

2.(使用磁体)从珠除去捕获的文库溶液,并用10μL 200mM Tris.HCl pH 7.0中和。

3.(可选地)将变性的PhiX Control v3(Illumina公司,加利福尼亚州圣地亚哥)添加至样品中,最多可达7.5μL重悬缓冲液(RSB)(Illumina公司,加利福尼亚州圣地亚哥)。

4.添加27.5uL 2x HT1(杂交缓冲液,Illumina公司,加利福尼亚州圣地亚哥)。

使用移液器或使用流动池加载夹具将所得样品(在55μL 1x HT1缓冲液中)直接加载到流动池上,例如2017年9月28日提交的美国临时专利申请号62/564,466中所描述的。结果显示在表6A中。使用与无PCR方法相同的条件运行对照(第1列),不同之处在于在捕获后进行PCR。第2列中显示了进行无PCR富集的最初尝试,并且显示太少的读数(read)导致不能达到对于外显子组可接受的覆盖水平。仅实现了约18x平均靶覆盖,而目标是超过约50x。对于第二次尝试(第3列),使用了直接流动池加载夹具,并且显示杂交中增加的DNA输入使无PCR富集方法的测序产量提高至约140x,远大于约40x目标。将无PCR数据下采样(downsampling)至7000万个读数(第4列),得出的指标与对照相似(或甚至更优)。

实例7B-使用基于珠的Nextera文库的无PCR杂交捕获提高来自短杂交时间的外显子组质量

使用与实例7A中相似的条件进行对照实验,但使用利用基于珠的标签片段化(tagmentation)文库制备方法产生的文库并且使用相应的封闭寡核苷酸。在该实验中,杂交持续时间和PCR扩增都是变量。将推荐的4小时杂交反应方案(进行PCR后捕获(总共约7.5小时,参见IDT xGen方案)以及使用NextSeq仪器进行测序而不进行直接流动池加载)作为对照(此工作流程的示意图如图9B所示),并且与仅使用30分钟杂交(进行和不进行PCR后捕获)和具有直接流动池加载的两种条件进行比较(图9C)。缩短杂交持续时间并去除PCR使得仅在约2小时内进行富集方案。图9D显示了具有缩短的杂交时间和没有PCR的该工作流程的示意图。

结果示于表6B中。将所有数据下采样至约2300万个簇。在第一列(对照)中,数据表示高质量的外显子组,但工作流程长约7.5小时。当杂交缩短到30分钟时,方案持续时间总共减少到约4小时(第2列);然而,与对照相比,PCR重复(PCR duplicates)数增加。增加的PCR重复也会降低文库的多样性并且相应的约20x的覆盖度。当从30分钟工作流程中去除PCR时(第3列),PCR重复数会大大减少,多样性增加到高于对照的水平,工作流程要短得多(2小时相比于7.5小时)。该实例强调了PCR的去除可以通过使PCR过程中模板的复制最小化来提高杂交捕获反应的质量。

实例8-封闭剂比较

在增强型杂交缓冲液中使用0.2mM封闭剂BN001和BN002;BX003和BX007;BN007和BN008;BN005和BN006;或BN023,BN024,BN025和BN026(如表2A中所述),如实例1中所描述的进行杂交和捕获。“未修饰的”封闭剂BN001和BN002在对应于衔接子的索引区的封闭剂的区域中包括胸腺嘧啶并且在对应于衔接子的非索引区的封闭剂的区域中包括与衔接子互补的碱基;封闭剂BN001和BN002不包含经修饰的碱基,并且包含3'-ddC末端基团。封闭剂BX003和BX007是BN001和BN002的修饰形式,其各自在对应于衔接子的非索引区的封闭剂的区域中具有两个AP-dC-CE亚磷酰胺(G-钳)取代。封闭剂BN007和BN008是BN001和BN002的修饰形式,其在对应于衔接子的索引区的封闭剂的区域中具有通用碱基(脱氧肌苷)并且在对应于衔接子的非索引区的封闭剂区域中具有BNA-修饰的碱基。封闭剂BN023和BN025是对应于衔接子的非索引区的BN001的区域的修饰形式并包括LNA修饰的碱基;封闭剂还包括3'-间隔物C3而不是3'-ddC。封闭剂BN024和BN026是对应于衔接子的非索引区的BN002的区域的修饰形式并包括LNA修饰的碱基;封闭剂还包括3'-间隔物C3而不是3'-ddC。

对所得捕获的DNA进行测序,并计算填充读数富集(捕获的中靶DNA的量的量度)。结果示于图10中,并表明“未修饰的”封闭剂的各种修饰提高了杂交测定中的填充读数富集。

实例9-分裂封闭剂比较

在增强型杂交缓冲液中使用0.2mM BN001和BN002;或BN023、BN024、BN025和BN026(如表2A中所述),如实例1中所描述的进行杂交和捕获。相应的衔接子包括8-核苷酸索引或10-核苷酸索引。对所得捕获的DNA进行测序,并计算填充读数富集。结果示于图11中,表明使用“分裂封闭剂”(即,不包括对应于衔接子的索引区的碱基的封闭剂)允许相同的封闭剂与具有各种索引序列和索引长度的衔接子一起使用。这些结果表明,在对于适应索引设计中的变更不利的情况下,可以使用分裂封闭剂。

所有专利、专利申请和出版物以及电子可用材料(包括例如GenBank和RefSeq中的核苷酸序列提交,和例如SwissProt、PIR、PRF、PDB中的氨基酸序列提交,以及来自GenBank和RefSeq中的注释编码区的翻译)的完整披露内容通过引用并入本文。在本申请的披露与通过引用并入本文的任何文件的披露之间存在任何不一致的情况下,以本申请的披露为准。前面的详细描述和实例仅为了清楚理解而给出。不应理解为不必要的限制。本发明不限于所示出和描述的确切细节,对于本领域技术人员显而易见的变化将包括在由权利要求限定的本发明内。

序列表

<110> ILLUMINA公司(ILLUMINA, INC.)

ILLUMINA剑桥有限公司(ILLUMINA CAMBRIDGE LIMITED)

SLATTER, Andrew F., 等人

<120> 用于改善文库富集的组合物和方法

<130> 01243-0009-00PCT

<150> US 62/764,753

<151> 2018-08-15

<160> 123

<170> PatentIn version 3.5

<210> 1

<211> 70

<212> DNA

<213> 人工序列

<220>

<223> 合成的: TN001, Nextera 8nt 衔接子 - i5

<220>

<221> misc_feature

<222> (30)..(37)

<223> n为 a, c, g, 或t

<400> 1

aatgatacgg cgaccaccga gatctacacn nnnnnnntcg tcggcagcgt cagatgtgta 60

taagagacag 70

<210> 2

<211> 66

<212> DNA

<213> 人工序列

<220>

<223> 合成的: TN002, Nextera 8nt 衔接子 - i7

<220>

<221> misc_feature

<222> (25)..(32)

<223> n 为 a, c, g, 或 t

<400> 2

caagcagaag acggcatacg agatnnnnnn nngtctcgtg ggctcggaga tgtgtataag 60

agacag 66

<210> 3

<211> 72

<212> DNA

<213> 人工序列

<220>

<223> 合成的: TN003, Nextera 10nt 衔接子 - i5

<220>

<221> misc_feature

<222> (30)..(39)

<223> n为a, c, g, 或 t

<400> 3

aatgatacgg cgaccaccga gatctacacn nnnnnnnnnt cgtcggcagc gtcagatgtg 60

tataagagac ag 72

<210> 4

<211> 68

<212> DNA

<213> 人工序列

<220>

<223> 合成的: TN004, Nextera 10nt 衔接子 - i7

<220>

<221> misc_feature

<222> (25)..(34)

<223> n 为 a, c, g, 或 t

<400> 4

caagcagaag acggcatacg agatnnnnnn nnnngtctcg tgggctcgga gatgtgtata 60

agagacag 68

<210> 5

<211> 34

<212> DNA

<213> 人工序列

<220>

<223> 合成的: TN005, Nextera 短衔接子 - i5

<400> 5

tcgtcggcag cgtcagatgt gtataagaga cagt 34

<210> 6

<211> 34

<212> DNA

<213> 人工序列

<220>

<223> 合成的: TN006, Nextera 短衔接子 - i7

<400> 6

ctgtctctta tacacatctc cgagcccacg agac 34

<210> 7

<211> 41

<212> DNA

<213> 人工序列

<220>

<223> 合成的: TN007, Nextera nrUMI 衔接子 - i5

<220>

<221> misc_feature

<222> (35)..(40)

<223> n为 a, c, g, 或t

<400> 7

tcgtcggcag cgtcagatgt gtataagaga cagtnnnnnn t 41

<210> 8

<211> 40

<212> DNA

<213> 人工序列

<220>

<223> 合成的: TN008, Nextera nrUMI 衔接子 - i7

<220>

<221> misc_feature

<222> (1)..(6)

<223> n为a, c, g, 或 t

<400> 8

nnnnnnctgt ctcttataca catctccgag cccacgagac 40

<210> 9

<211> 58

<212> DNA

<213> 人工序列

<220>

<223> 合成的: TL001, TruSeq 通用衔接子 - i5

<400> 9

aatgatacgg cgaccaccga gatctacact ctttccctac acgacgctct tccgatct 58

<210> 10

<211> 63

<212> DNA

<213> 人工序列

<220>

<223> 合成的: TL002, TruSeq 6nt 衔接子 - i7

<220>

<221> misc_feature

<222> (34)..(39)

<223> n为a, c, g, 或t

<400> 10

gatcggaaga gcacacgtct gaactccagt cacnnnnnna tctcgtatgc cgtcttctgc 60

ttg 63

<210> 11

<211> 70

<212> DNA

<213> 人工序列

<220>

<223> 合成的: TL003, TruSeq 8nt 衔接子 - i5

<220>

<221> misc_feature

<222> (30)..(37)

<223> n为a, c, g, 或t

<400> 11

aatgatacgg cgaccaccga gatctacacn nnnnnnnaca ctctttccct acacgacgct 60

cttccgatct 70

<210> 12

<211> 65

<212> DNA

<213> 人工序列

<220>

<223> 合成的: TL004, TruSeq 8nt 衔接子 - i7

<220>

<221> misc_feature

<222> (34)..(41)

<223> n为a, c, g, 或t

<400> 12

gatcggaaga gcacacgtct gaactccagt cacnnnnnnn natctcgtat gccgtcttct 60

gcttg 65

<210> 13

<211> 72

<212> DNA

<213> 人工序列

<220>

<223> 合成的: TL005, TruSeq 10nt 衔接子 - i5

<220>

<221> misc_feature

<222> (30)..(39)

<223> n为 a, c, g, 或t

<400> 13

aatgatacgg cgaccaccga gatctacacn nnnnnnnnna cactctttcc ctacacgacg 60

ctcttccgat ct 72

<210> 14

<211> 67

<212> DNA

<213> 人工序列

<220>

<223> 合成的: TL006, TruSeq 10nt 衔接子 - i7

<220>

<221> misc_feature

<222> (34)..(43)

<223> n为a, c, g, 或t

<400> 14

gatcggaaga gcacacgtct gaactccagt cacnnnnnnn nnnatctcgt atgccgtctt 60

ctgcttg 67

<210> 15

<211> 33

<212> DNA

<213> 人工序列

<220>

<223> 合成的: TL007, TruSeq 短衔接子 - i5

<400> 15

acactctttc cctacacgac gctcttccga tct 33

<210> 16

<211> 33

<212> DNA

<213> 人工序列

<220>

<223> 合成的: TL008, TruSeq 短衔接子 - i7

<400> 16

gatcggaaga gcacacgtct gaactccagt cac 33

<210> 17

<211> 40

<212> DNA

<213> 人工序列

<220>

<223> 合成的: TL009, TruSeq nrUMI 衔接子 - i5

<220>

<221> misc_feature

<222> (34)..(39)

<223> n为a, c, g, 或t

<400> 17

acactctttc cctacacgac gctcttccga tctnnnnnnt 40

<210> 18

<211> 40

<212> DNA

<213> 人工序列

<220>

<223> 合成的: TL010, TruSeq nrUMI 衔接子 -i5

<220>

<221> misc_feature

<222> (1)..(6)

<223> n为a, c, g, 或t

<400> 18

nnnnnnagat cggaagagca cacgtctgaa ctccagtcac 40

<210> 19

<211> 20

<212> DNA

<213> 人工序列

<220>

<223> 合成的: p5 序列

<400> 19

aatgatacgg cgaccaccga 20

<210> 20

<211> 21

<212> DNA

<213> 人工序列

<220>

<223> 合成的: p7序列

<400> 20

tcgtatgccg tcttctgctt g 21

<210> 21

<211> 21

<212> DNA

<213> 人工序列

<220>

<223> 合成的: P7 反向互补序列 (P7')

<400> 21

caagcagaag acggcatacg a 21

<210> 22

<211> 33

<212> DNA

<213> 人工序列

<220>

<223> 合成的: TruSeq i7 衔接子区域

<400> 22

gatcggaaga gcacacgtct gaactccagt cac 33

<210> 23

<211> 32

<212> DNA

<213> 人工序列

<220>

<223> 合成的: TruSeq i5 衔接子 区域

<400> 23

acactctttc cctacacgac gctcttccga tc 32

<210> 24

<211> 33

<212> DNA

<213> 人工序列

<220>

<223> 合成的: V2.A14.METS 序列

<400> 24

tcgtcggcag cgtcagatgt gtataagaga cag 33

<210> 25

<211> 34

<212> DNA

<213> 人工序列

<220>

<223> 合成的: V2.B15.METS 序列

<400> 25

gtctcgtggg ctcggagatg tgtataagag acag 34

<210> 26

<211> 6

<212> DNA

<213> 人工序列

<220>

<223> 合成的: N-mer 结构域 (例如, UMI)

<220>

<221> misc_feature

<222> (1)..(6)

<223> n为A,T,C或G各占25%的混合物

<400> 26

nnnnnn 6

<210> 27

<211> 70

<212> DNA

<213> 人工序列

<220>

<223> 合成的: BN001, Nextera 封闭剂1 i5

<400> 27

aatgatacgg cgaccaccga gatctacact ttttttttcg tcggcagcgt cagatgtgta 60

taagagacag 70

<210> 28

<211> 66

<212> DNA

<213> 人工序列

<220>

<223> 合成的: BN002, Nextera 封闭剂2 i7

<400> 28

caagcagaag acggcatacg agattttttt ttgtctcgtg ggctcggaga tgtgtataag 60

agacag 66

<210> 29

<211> 71

<212> DNA

<213> 人工序列

<220>

<223> 合成的: BN003, NRCBLK1PrimeRC

<400> 29

gctgtctctt atacacatct gacgctgccg acgatttttt ttgtgtagat ctcggtggtc 60

gccgtatcat t 71

<210> 30

<211> 67

<212> DNA

<213> 人工序列

<220>

<223> 合成的: BN004, NRCBLK2PrimeRC

<400> 30

gctgtctctt atacacatct ccgagcccac gagacttttt tttatctcgt atgccgtctt 60

ctgcttg 67

<210> 31

<211> 70

<212> DNA

<213> 人工序列

<220>

<223> 合成的: BN005, 具有碱基配对索引序列实例的TiS517

<400> 31

aatgatacgg cgaccaccga gatctacacg cgtaagatcg tcggcagcgt cagatgtgta 60

taagagacag 70

<210> 32

<211> 66

<212> DNA

<213> 人工序列

<220>

<223> 合成的: BN006, 具有碱基配对索引序列实例的TiS701

<400> 32

caagcagaag acggcatacg agattcgcct tagtctcgtg ggctcggaga tgtgtataag 60

agacag 66

<210> 33

<211> 62

<212> DNA

<213> 人工序列

<220>

<223> 合成的: BN007, TiBNA7

<400> 33

aatgatacgg cgaccaccga gatctacact cgtcggcagc gtcagatgtg tataagagac 60

ag 62

<210> 34

<211> 58

<212> DNA

<213> 人工序列

<220>

<223> 合成的: BN008, TiBNA8

<400> 34

caagcagaag acggcatacg agatgtctcg tgggctcgga gatgtgtata agagacag 58

<210> 35

<211> 62

<212> DNA

<213> 人工序列

<220>

<223> 合成的: BN009, TiLNA7

<400> 35

aatgatacgg cgaccaccga gatctacact cgtcggcagc gtcagatgtg tataagagac 60

ag 62

<210> 36

<211> 58

<212> DNA

<213> 人工序列

<220>

<223> 合成的: BN010, TiLNA8

<400> 36

caagcagaag acggcatacg agatgtctcg tgggctcgga gatgtgtata agagacag 58

<210> 37

<211> 62

<212> DNA

<213> 人工序列

<220>

<223> 合成的: BN011, TiBNA11

<400> 37

aatgatacgg cgaccaccga gatctacact cgtcggcagc gtcagatgtg tataagagac 60

ag 62

<210> 38

<211> 58

<212> DNA

<213> 人工序列

<220>

<223> 合成的: BN012, TiBNA12

<400> 38

caagcagaag acggcatacg agatgtctcg tgggctcgga gatgtgtata agagacag 58

<210> 39

<211> 63

<212> DNA

<213> 人工序列

<220>

<223> 合成的: BN013, TiBNA15G

<400> 39

aatgatacgg cgaccaccga gatctacacg tcgtcggcag cgtcagatgt gtataagaga 60

cag 63

<210> 40

<211> 59

<212> DNA

<213> 人工序列

<220>

<223> 合成的: BN014, TiBNA16G

<400> 40

caagcagaag acggcatacg agatggtctc gtgggctcgg agatgtgtat aagagacag 59

<210> 41

<211> 63

<212> DNA

<213> 人工序列

<220>

<223> 合成的: BN015, TiBNA15N

<220>

<221> misc_feature

<222> (30)..(30)

<223> n为a, c, g, 或 t

<400> 41

aatgatacgg cgaccaccga gatctacacn tcgtcggcag cgtcagatgt gtataagaga 60

cag 63

<210> 42

<211> 59

<212> DNA

<213> 人工序列

<220>

<223> 合成的: BN016, TiBNA16N

<220>

<221> misc_feature

<222> (25)..(25)

<223> n为a, c, g, 或t

<400> 42

caagcagaag acggcatacg agatngtctc gtgggctcgg agatgtgtat aagagacag 59

<210> 43

<211> 62

<212> DNA

<213> 人工序列

<220>

<223> 合成的: BN017, TiLNA11

<400> 43

aatgatacgg cgaccaccga gatctacact cgtcggcagc gtcagatgtg tataagagac 60

ag 62

<210> 44

<211> 58

<212> DNA

<213> 人工序列

<220>

<223> 合成的: BN018, TiLNA12

<400> 44

caagcagaag acggcatacg agatgtctcg tgggctcgga gatgtgtata agagacag 58

<210> 45

<211> 63

<212> DNA

<213> 人工序列

<220>

<223> 合成的: BN019, TiLNA15G

<400> 45

aatgatacgg cgaccaccga gatctacacg tcgtcggcag cgtcagatgt gtataagaga 60

cag 63

<210> 46

<211> 59

<212> DNA

<213> 人工序列

<220>

<223> 合成的: BN020, TiLNA16G

<400> 46

caagcagaag acggcatacg agatggtctc gtgggctcgg agatgtgtat aagagacag 59

<210> 47

<211> 63

<212> DNA

<213> 人工序列

<220>

<223> 合成的: BN021, TiLNA15N

<220>

<221> misc_feature

<222> (30)..(30)

<223> n为a, c, g, 或t

<400> 47

aatgatacgg cgaccaccga gatctacacn tcgtcggcag cgtcagatgt gtataagaga 60

cag 63

<210> 48

<211> 59

<212> DNA

<213> 人工序列

<220>

<223> 合成的: BN022, TiLNA16N

<220>

<221> misc_feature

<222> (25)..(25)

<223> n为a, c, g, 或t

<400> 48

caagcagaag acggcatacg agatngtctc gtgggctcgg agatgtgtat aagagacag 59

<210> 49

<211> 29

<212> DNA

<213> 人工序列

<220>

<223> 合成的: BN023, P5LNA

<400> 49

aatgatacgg cgaccaccga gatctacac 29

<210> 50

<211> 24

<212> DNA

<213> 人工序列

<220>

<223> 合成的: BN024, P7LNA

<400> 50

caagcagaag acggcatacg agat 24

<210> 51

<211> 33

<212> DNA

<213> 人工序列

<220>

<223> 合成的: BN025, TiLNAS1

<400> 51

tcgtcggcag cgtcagatgt gtataagaga cag 33

<210> 52

<211> 34

<212> DNA

<213> 人工序列

<220>

<223> 合成的: BN026, TiLNAS2

<400> 52

gtctcgtggg ctcggagatg tgtataagag acag 34

<210> 53

<211> 42

<212> DNA

<213> 人工序列

<220>

<223> 合成的: BN027, TiLNA17

<400> 53

ggcgaccacc gagatctaca ctcgtcggca gcgtcagatg tg 42

<210> 54

<211> 42

<212> DNA

<213> 人工序列

<220>

<223> 合成的: BN028, TiLNA18

<400> 54

ggcatacgag atgtctcgtg ggctcggaga tgtgtataag ag 42

<210> 55

<211> 29

<212> DNA

<213> 人工序列

<220>

<223> 合成的: BN029, P5BNA-全部

<400> 55

aatgatacgg cgaccaccga gatctacac 29

<210> 56

<211> 24

<212> DNA

<213> 人工序列

<220>

<223> 合成的: BN030, P7BNA-全部

<400> 56

caagcagaag acggcatacg agat 24

<210> 57

<211> 33

<212> DNA

<213> 人工序列

<220>

<223> 合成的: BN031, TiBNAS1-全部

<400> 57

tcgtcggcag cgtcagatgt gtataagaga cag 33

<210> 58

<211> 34

<212> DNA

<213> 人工序列

<220>

<223> 合成的: BN032, TiBNAS2-全部

<400> 58

gtctcgtggg ctcggagatg tgtataagag acag 34

<210> 59

<211> 29

<212> DNA

<213> 人工序列

<220>

<223> 合成的: BN033, P5BNA-一半

<400> 59

aatgatacgg cgaccaccga gatctacac 29

<210> 60

<211> 24

<212> DNA

<213> 人工序列

<220>

<223> 合成的: BN034, P7BNA-一半

<400> 60

caagcagaag acggcatacg agat 24

<210> 61

<211> 33

<212> DNA

<213> 人工序列

<220>

<223> 合成的: BN035, TiBNAS1-一半

<400> 61

tcgtcggcag cgtcagatgt gtataagaga cag 33

<210> 62

<211> 34

<212> DNA

<213> 人工序列

<220>

<223> 合成的: BN036, TiBNAS2-一半

<400> 62

gtctcgtggg ctcggagatg tgtataagag acag 34

<210> 63

<211> 29

<212> DNA

<213> 人工序列

<220>

<223> 合成的: BN037, P5BNA-Alt

<400> 63

aatgatacgg cgaccaccga gatctacac 29

<210> 64

<211> 24

<212> DNA

<213> 人工序列

<220>

<223> 合成的: BN038, P7BNA-Alt

<400> 64

caagcagaag acggcatacg agat 24

<210> 65

<211> 33

<212> DNA

<213> 人工序列

<220>

<223> 合成的: BN039, TiBNAS1-Alt

<400> 65

tcgtcggcag cgtcagatgt gtataagaga cag 33

<210> 66

<211> 34

<212> DNA

<213> 人工序列

<220>

<223> 合成的: BN040, TiBNAS2-Alt

<400> 66

gtctcgtggg ctcggagatg tgtataagag acag 34

<210> 67

<211> 70

<212> DNA

<213> 人工序列

<220>

<223> 合成的: BN041, TiBNA3

<400> 67

aatgatacgg cgaccaccga gatctacact ttttttttcg tcggcagcgt cagatgtgta 60

taagagacag 70

<210> 68

<211> 66

<212> DNA

<213> 人工序列

<220>

<223> 合成的: BN042, TiBNA4

<400> 68

caagcagaag acggcatacg agattttttt ttgtctcgtg ggctcggaga tgtgtataag 60

agacag 66

<210> 69

<211> 70

<212> DNA

<213> 人工序列

<220>

<223> 合成的: BN043, TiBNA1

<400> 69

aatgatacgg cgaccaccga gatctacact ttttttttcg tcggcagcgt cagatgtgta 60

taagagacag 70

<210> 70

<211> 66

<212> DNA

<213> 人工序列

<220>

<223> 合成的: BN044, TiBNA2

<400> 70

caagcagaag acggcatacg agattttttt ttgtctcgtg ggctcggaga tgtgtataag 60

agacag 66

<210> 71

<211> 63

<212> DNA

<213> 人工序列

<220>

<223> 合成的: BL001, CT3 封闭剂1 i7

<400> 71

caagcagaag acggcatacg agattttttt gtgactggag ttcagacgtg tgctcttccg 60

atc 63

<210> 72

<211> 57

<212> DNA

<213> 人工序列

<220>

<223> 合成的: BL002, CT3 封闭剂2 i5

<400> 72

aatgatacgg cgaccaccga gatctacact ctttccctac acgacgctct tccgatc 57

<210> 73

<211> 57

<212> DNA

<213> 人工序列

<220>

<223> 合成的: BL003, TSLTLNA13

<400> 73

aatgatacgg cgaccaccga gatctacact ctttccctac acgacgctct tccgatc 57

<210> 74

<211> 57

<212> DNA

<213> 人工序列

<220>

<223> 合成的: BL004, TSLTLNA14

<400> 74

caagcagaag acggcatacg agatgtgact ggagttcaga cgtgtgctct tccgatc 57

<210> 75

<211> 61

<212> DNA

<213> 人工序列

<220>

<223> 合成的: BL005, TSHTLNA13

<400> 75

aatgatacgg cgaccaccga gatctacaca cactctttcc ctacacgacg ctcttccgat 60

c 61

<210> 76

<211> 57

<212> DNA

<213> 人工序列

<220>

<223> 合成的: BL006, TSHTLNA14

<400> 76

caagcagaag acggcatacg agatgtgact ggagttcaga cgtgtgctct tccgatc 57

<210> 77

<211> 61

<212> DNA

<213> 人工序列

<220>

<223> 合成的: BL007, TSHTLNA15

<400> 77

aatgatacgg cgaccaccga gatctacaca cactctttcc ctacacgacg ctcttccgat 60

c 61

<210> 78

<211> 57

<212> DNA

<213> 人工序列

<220>

<223> 合成的: BL008, TSHTLNA16

<400> 78

caagcagaag acggcatacg agatgtgact ggagttcaga cgtgtgctct tccgatc 57

<210> 79

<211> 62

<212> DNA

<213> 人工序列

<220>

<223> 合成的: BL009, TSHTLNA15G

<400> 79

aatgatacgg cgaccaccga gatctacacg acactctttc cctacacgac gctcttccga 60

tc 62

<210> 80

<211> 58

<212> DNA

<213> 人工序列

<220>

<223> 合成的: BL010, TSHTLNA16G

<400> 80

caagcagaag acggcatacg agatggtgac tggagttcag acgtgtgctc ttccgatc 58

<210> 81

<211> 62

<212> DNA

<213> 人工序列

<220>

<223> 合成的: BL011, TSHTLNA15N

<220>

<221> misc_feature

<222> (30)..(30)

<223> n为 a, c, g, 或t

<400> 81

aatgatacgg cgaccaccga gatctacacn acactctttc cctacacgac gctcttccga 60

tc 62

<210> 82

<211> 58

<212> DNA

<213> 人工序列

<220>

<223> 合成的: BL012, TSHTLNA16N

<220>

<221> misc_feature

<222> (25)..(25)

<223> n为a, c, g, 或 t

<400> 82

caagcagaag acggcatacg agatngtgac tggagttcag acgtgtgctc ttccgatc 58

<210> 83

<211> 57

<212> DNA

<213> 人工序列

<220>

<223> 合成的: BL013, TSLTBNA13

<400> 83

aatgatacgg cgaccaccga gatctacact ctttccctac acgacgctct tccgatc 57

<210> 84

<211> 57

<212> DNA

<213> 人工序列

<220>

<223> 合成的: BL014, TSLTBNA14

<400> 84

caagcagaag acggcatacg agatgtgact ggagttcaga cgtgtgctct tccgatc 57

<210> 85

<211> 61

<212> DNA

<213> 人工序列

<220>

<223> 合成的: BL015, TSHTBNA13

<400> 85

aatgatacgg cgaccaccga gatctacaca cactctttcc ctacacgacg ctcttccgat 60

c 61

<210> 86

<211> 57

<212> DNA

<213> 人工序列

<220>

<223> 合成的: BL016, TSHTBNA14

<400> 86

caagcagaag acggcatacg agatgtgact ggagttcaga cgtgtgctct tccgatc 57

<210> 87

<211> 61

<212> DNA

<213> 人工序列

<220>

<223> 合成的: BL017, TSHTBNA15

<400> 87

aatgatacgg cgaccaccga gatctacaca cactctttcc ctacacgacg ctcttccgat 60

c 61

<210> 88

<211> 57

<212> DNA

<213> 人工序列

<220>

<223> 合成的: BL018, TSHTBNA16

<400> 88

caagcagaag acggcatacg agatgtgact ggagttcaga cgtgtgctct tccgatc 57

<210> 89

<211> 68

<212> DNA

<213> 人工序列

<220>

<223> 合成的: BX001, Nextera 封闭剂1_2X

<400> 89

aatgataggc gaccaccgag atctacactt tttttttcgt cggcagcgtc agatgtgtat 60

aagagaag 68

<210> 90

<211> 67

<212> DNA

<213> 人工序列

<220>

<223> 合成的: BX002, Nextera 封闭剂1_3X

<400> 90

aatgataggc gaccaccgag attacacttt ttttttcgtc ggcagcgtca gatgtgtata 60

agagaag 67

<210> 91

<211> 68

<212> DNA

<213> 人工序列

<220>

<223> 合成的: BX003, Nextera 封闭剂1_2Xalt

<400> 91

aatgatacgg cgaccaccga gattacactt tttttttcgt cggcagcgtc agatgtgtat 60

aagagaag 68

<210> 92

<211> 67

<212> DNA

<213> 人工序列

<220>

<223> 合成的: BX004, Nextera 封闭剂1_3Xalt

<400> 92

aatgatacgg cgaccaccga gattacactt tttttttgtc ggcagcgtca gatgtgtata 60

agagaag 67

<210> 93

<211> 64

<212> DNA

<213> 人工序列

<220>

<223> 合成的: BX005, Nextera 封闭剂2_2X

<400> 93

caagagaaga cggcatacga gatttttttt tgtctcgtgg gctcggagat gtgtataaga 60

gaag 64

<210> 94

<211> 63

<212> DNA

<213> 人工序列

<220>

<223> 合成的: BX006, Nextera 封闭剂2_3X

<400> 94

caagagaaga cggcatagag attttttttt gtctcgtggg ctcggagatg tgtataagag 60

aag 63

<210> 95

<211> 64

<212> DNA

<213> 人工序列

<220>

<223> 合成的: BX007, Nextera 封闭剂2_2Xalt

<400> 95

caagcagaag acggcatacg agattttttt ttgttcgtgg gctcggagat gtgtataaga 60

gaag 64

<210> 96

<211> 63

<212> DNA

<213> 人工序列

<220>

<223> 合成的: BX008, Nextera 封闭剂2_3Xalt

<400> 96

caagcagaag acggcatacg agattttttt ttgttcgtgg gctggagatg tgtataagag 60

aag 63

<210> 97

<211> 61

<212> DNA

<213> 人工序列

<220>

<223> 合成的: BX009, Nextera 封闭剂1_5X4Y

<400> 97

aatgataggc gacaccgaga ttacactttt tttttcgtcg gagcgtcaga ggaaagagaa 60

g 61

<210> 98

<211> 57

<212> DNA

<213> 人工序列

<220>

<223> 合成的: BX010, Nextera 封闭剂2_5X4Y

<400> 98

caagagaaga ggcatagaga tttttttttg tctcgtgggt cggagaggaa agagaag 57

<210> 99

<211> 26

<212> DNA

<213> 人工序列

<220>

<223> 合成的: BX011, Nextera 封闭剂1_5X4Y-外部

<400> 99

aatgataggc gacaccgaga ttacac 26

<210> 100

<211> 27

<212> DNA

<213> 人工序列

<220>

<223> 合成的: BX012, Nextera 封闭剂1_5X4Y-内部

<400> 100

tcgtcggagc gtcagaggaa agagaag 27

<210> 101

<211> 21

<212> DNA

<213> 人工序列

<220>

<223> 合成的: BX013, Nextera 封闭剂2_5X4Y-外部

<400> 101

caagagaaga ggcatagaga t 21

<210> 102

<211> 28

<212> DNA

<213> 人工序列

<220>

<223> 合成的: BX014, Nextera 封闭剂2_5X4Y-内部

<400> 102

gtctcgtggg tcggagagga aagagaag 28

<210> 103

<211> 8

<212> DNA

<213> 人工序列

<220>

<223> 合成的: 位于寡核苷酸的索引位置处的胸腺嘧啶碱基

<400> 103

tttttttt 8

<210> 104

<211> 70

<212> DNA

<213> 人工序列

<220>

<223> 合成的: Nextera 封闭剂1 (15016424) i5, Illumina Nextera i5

封闭剂

<400> 104

aatgatacgg cgaccaccga gatctacact ttttttttcg tcggcagcgt cagatgtgta 60

taagagacag 70

<210> 105

<211> 66

<212> DNA

<213> 人工序列

<220>

<223> 合成的: Nextera 封闭剂2 (15016425) i7, Illumina Nextera i7

封闭剂

<400> 105

caagcagaag acggcatacg agattttttt ttgtctcgtg ggctcggaga tgtgtataag 60

agacag 66

<210> 106

<211> 70

<212> DNA

<213> 人工序列

<220>

<223> 合成的: TiBNA1, Nextera 封闭剂1_3XCG

<400> 106

aatgatacgg cgaccaccga gatctacact ttttttttcg tcggcagcgt cagatgtgta 60

taagagacag 70

<210> 107

<211> 66

<212> DNA

<213> 人工序列

<220>

<223> 合成的: TiBNA2, Nextera 封闭剂2_3XCG

<400> 107

caagcagaag acggcatacg agattttttt ttgtctcgtg ggctcggaga tgtgtataag 60

agacag 66

<210> 108

<211> 70

<212> DNA

<213> 人工序列

<220>

<223> 合成的: TiBNA3, Nextera 封闭剂1_6XCG

<400> 108

aatgatacgg cgaccaccga gatctacact ttttttttcg tcggcagcgt cagatgtgta 60

taagagacag 70

<210> 109

<211> 66

<212> DNA

<213> 人工序列

<220>

<223> 合成的: TiBNA4, Nextera 封闭剂2_6XCG

<400> 109

caagcagaag acggcatacg agattttttt ttgtctcgtg ggctcggaga tgtgtataag 60

agacag 66

<210> 110

<211> 70

<212> DNA

<213> 人工序列

<220>

<223> 合成的: TiBNA5, Nextera 封闭剂1_10XCG

<400> 110

aatgatacgg cgaccaccga gatctacact ttttttttcg tcggcagcgt cagatgtgta 60

taagagacag 70

<210> 111

<211> 66

<212> DNA

<213> 人工序列

<220>

<223> 合成的: TiBNA6, Nextera 封闭剂2_10XCG

<400> 111

caagcagaag acggcatacg agattttttt ttgtctcgtg ggctcggaga tgtgtataag 60

agacag 66

<210> 112

<211> 70

<212> DNA

<213> 人工序列

<220>

<223> 合成的: TiS517, S特异性封闭剂517

<400> 112

aatgatacgg cgaccaccga gatctacacg cgtaagatcg tcggcagcgt cagatgtgta 60

taagagacag 70

<210> 113

<211> 66

<212> DNA

<213> 人工序列

<220>

<223> 合成的: TiS701, S特异性封闭剂701

<400> 113

caagcagaag acggcatacg agattcgcct tagtctcgtg ggctcggaga tgtgtataag 60

agacag 66

<210> 114

<211> 62

<212> DNA

<213> 人工序列

<220>

<223> 合成的: BL007, TSHTLNA15G

<400> 114

aatgatacgg cgaccaccga gatctacacg acactctttc cctacacgac gctcttccga 60

tc 62

<210> 115

<211> 58

<212> DNA

<213> 人工序列

<220>

<223> 合成的: BL008, TSHTLNA16G

<400> 115

caagcagaag acggcatacg agatggtgac tggagttcag acgtgtgctc ttccgatc 58

<210> 116

<211> 62

<212> DNA

<213> 人工序列

<220>

<223> 合成的: BL009, TSHTLNA15N

<220>

<221> misc_feature

<222> (30)..(30)

<223> n为 a, c, g, 或t

<400> 116

aatgatacgg cgaccaccga gatctacacn acactctttc cctacacgac gctcttccga 60

tc 62

<210> 117

<211> 58

<212> DNA

<213> 人工序列

<220>

<223> 合成的: BL010, TSHTLNA16N

<220>

<221> misc_feature

<222> (25)..(25)

<223> n为a, c, g, 或t

<400> 117

caagcagaag acggcatacg agatngtgac tggagttcag acgtgtgctc ttccgatc 58

<210> 118

<211> 29

<212> DNA

<213> 人工序列

<220>

<223> 合成的: BN023, P5LNA

<400> 118

aatgatacgg cgaccaccga gatctacac 29

<210> 119

<211> 24

<212> DNA

<213> 人工序列

<220>

<223> 合成的: BN024, P7LNA

<400> 119

caagcagaag acggcatacg agat 24

<210> 120

<211> 33

<212> DNA

<213> 人工序列

<220>

<223> 合成的: BN025, TiLNAS1

<400> 120

tcgtcggcag cgtcagatgt gtataagaga cag 33

<210> 121

<211> 34

<212> DNA

<213> 人工序列

<220>

<223> 合成的: BN026, TiLNAS2

<400> 121

gtctcgtggg ctcggagatg tgtataagag acag 34

<210> 122

<211> 42

<212> DNA

<213> 人工序列

<220>

<223> 合成的: BN027, TiLNA17

<400> 122

ggcgaccacc gagatctaca ctcgtcggca gcgtcagatg tg 42

<210> 123

<211> 42

<212> DNA

<213> 人工序列

<220>

<223> 合成的: BN028, TiLNA18

<400> 123

ggcatacgag atgtctcgtg ggctcggaga tgtgtataag ag 42

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号