首页> 中国专利> 用于单细胞中的基因组DNA和基因表达分析的组合物和方法

用于单细胞中的基因组DNA和基因表达分析的组合物和方法

摘要

本文提供了使用光活化的寡核苷酸评定固定细胞的基因组景观的组合物和方法,所述光活化的寡核苷酸可以指向固定细胞的细胞核、线粒体或细胞质,并且在被活化时,可以经延伸用于将核单链DNA(即,开放染色质)、开放线粒体DNA和/或细胞质RNA原位复制成条形码化的互补DNA。这些方法还提供用于基因特异性3D染色质结构生态位分析。

著录项

说明书

本申请要求2019年9月11日提交的美国临时申请号62/898,824和2019年1月7日提交的美国临时申请号62/789,073的优先权权益,这些美国临时申请各自的全部内容以引用方式并入本文。

这项发明是根据国立卫生研究院授予的批准号U01 MH098953、RM1 HG010023和R01 MH110185在政府支持下完成的。政府对本发明享有一定的权利。

本申请包含序列表,该序列表已经通过EFS-Web以ASCII格式提交,并且据此全部内容以引用方式并入。所述的ASCII副本创建于2020年1月2日,命名为AGLTP0014WO_ST25.txt,并且大小为5千字节。

1.技术领域

本公开整体上涉及用于检测单个细胞中的开放染色质和/或RNA的方法和组合物,以及用于检测靶向位置处的染色质的3D结构的方法和组合物。

2.背景技术

基因的空间排列、染色质的结构和调节DNA元件的可及性控制细胞的细胞核架构的表达(Sherwood等人,2014)。染色质结构继而由DNA的表观遗传甲基化、DNA结合蛋白的修饰、以及远端顺式和反式染色体区的动力学控制。基因组的组织是复杂和动态的。例如,通过染色质折叠的变化,远端增强子变得非常接近经调节的基因的启动子,各种团体估计基因组中存在数百万个这种潜在的增强子相互作用(Lai等人,2015)。已经对许多基因的这种染色质相互作用进行了作图,所述作图主要使用细胞群,在所述细胞群中分离的细胞核经化学交联以保持近端启动子相互作用。在交联后,往往使用针对转录因子或经修饰的蛋白(例如组蛋白)的抗体或简单地通过针对特定目的位点的PCR来鉴定目的位点(Simonis等人,2006)。随着染色质作图程序(染色体-构象-捕获)的发展,高级染色质结构的分析已经变得更加容易,所述染色质作图程序包括3C、4C、5C和HiC(de Wit和de Laat,2012;Dekker等人,2013)。这些程序使用交联染色质的限制性酶切、各种PCR扩增策略,并且将接头连接至DNA上,之后对产物进行测序。由于对DNA的大量操纵,这些过程中的每一过程都变得选择性更低。据估计,使用HiC细胞群只能捕获20%至70%的跨染色体接触。此外,虽然HiC对染色体拓扑分析而言更好,但它的灵敏性较低,这主要是因为连接过程的低效率。

最近一种鉴定单个细胞中的开放染色质的方法利用了用于转座酶可及染色质(ATACseq)的测定(Buenrostro等人,2013)。这种方法使用Tn5转座酶来标记基因组的可及区域。当用于单个细胞上时,单细胞ATACseq数据以来自多个细胞的合并数据的形式呈现,因为每个转座子插入仅提供用于对每个转座子的单个等位基因区的检测,从而除非通过多个细胞数据的合计,否则禁止第二次检测所述单个等位基因区。该程序允许对一些调节位点进行作图,但据报道在针对大量细胞时遗漏了许多先前通过3C/4C鉴定出的位点。事实上,只有9.4%的启动子在ATAC中被代表。进一步地,Tn5整合进基因组中并不是完全随机的,因此会遗漏一些序列。最后,ATAC允许在基因组范围的规模上进行分析,除非通过随机探索,否则几乎没有能力驱动基因特异性分析。为了在细胞水平上评定这种3D结构,需要评定单独细胞的基因组的开放构象状态的方法。

发明内容

本文提供的一些实施方式涉及使用光活化的寡核苷酸来评定固定细胞的多模式基因组学景观的方法,所述光活化的寡核苷酸可以被引导至固定细胞的细胞核或细胞质,并且在活化时可以原位延伸,从而将细胞核单链DNA(开放染色质)和/或细胞质RNA复制成互补DNA,例如条形码化的互补DNA。这些原位转录的cDNA的分离、扩增和测序可以提供关于以下的信息:如何在单独细胞与其微环境相互作用的情境下将RNA从开放基因组DNA的转录潜能加工成细胞质稳态RNA丰度。这些方法还提供了基因特异性3D染色质结构生态位分析,所述基因特异性3D染色质结构生态位分析可用于鉴定空间限定的、生物学相关的和功能性的基因特异性增强子。

在一个实施方式中,提供了寡核苷酸分子,所述寡核苷酸分子从5′至3′包含扩增区段、杂交区段和可逆终止核苷酸。在一些方面中,扩增区段是RNA聚合酶启动子。在一些方面中,扩增区段是引物结合位点。在一些方面中,扩增区段包含约7个至约50个核苷酸。在一些方面中,杂交区段包含随机核苷酸序列。在一些方面中,杂交区段包含已知核苷酸序列。在某些方面中,已知核苷酸序列与靶基因组或线粒体DNA序列互补。在某些方面中,已知核苷酸序列与靶RNA序列互补。在一些方面中,杂交区段包含聚T序列。在一些方面中,杂交区段包含约7个至约30个核苷酸。在一些方面中,杂交区段包含约15个核苷酸。在一些方面中,寡核苷酸还包含位于所述扩增区段与所述杂交区段之间的索引条形码区段。在某些方面中,寡核苷酸还包含位于所述扩增区段与所述索引条形码区段之间的间隔区段。在一些方面中,可逆终止核苷酸包含硝基苄基基团。在一些方面中,可逆终止核苷酸包含荧光标记。

在一些方面中,可光活化的终止核苷酸包括下式的结构:

其中:

R

R

R

R

氢、羟基、卤基、氨基、硝基、氰基、叠氮基或巯基;

烷基

R

氢、羟基、卤基、氨基、硝基、氰基、叠氮基或巯基;

烷基

一组下式:

其中

X是

-O-、-S-、或-NH-;或者

烷二基

Y是-O-、-NH-、烷二基

n是0-6的整数;并且

m是0-6的整数;或者

-接头-报告子;

或其互变异构体或旋光异构体。

在一些方面中,R

其中R

在一个实施方式中,本文提供了寡核苷酸分子群体,每个寡核苷酸分子从5′至3′包含扩增区段、杂交区段和可逆终止核苷酸。在一些方面中,扩增区段是RNA聚合酶启动子。在一些方面中,扩增区段是引物结合位点。在一些方面中,扩增区段包含约7个至约50个核苷酸。在一些方面中,杂交区段包含简并核苷酸序列。在一些方面中,所述群体中的每个核酸分子包含独特的杂交区段序列。在一些方面中,杂交区段包含一个或多个已知核苷酸序列。在某些方面中,每个已知核苷酸序列与靶基因组或线粒体DNA序列互补。在某些方面中,每个已知核苷酸序列与靶RNA序列互补。在一些方面中,杂交区段包含聚T序列。在一些方面中,杂交区段包含约7个至约30个核苷酸。在一些方面中,杂交区段包含约15个核苷酸。在一些方面中,所述群体的寡核苷酸还包含位于所述扩增区段与所述杂交区段之间的索引条形码区段。在一些方面中,所述群体的寡核苷酸还包含位于所述RNA聚合酶启动子区段与所述索引条形码区段之间的间隔区段。在一些方面中,可逆终止核苷酸包含硝基苄基基团。在一些方面中,可逆终止核苷酸包含荧光标记。

在一些方面中,可光活化的终止核苷酸包括下式的结构:

其中:

R

R

R

R

氢、羟基、卤基、氨基、硝基、氰基、叠氮基或巯基;

烷基

R

氢、羟基、卤基、氨基、硝基、氰基、叠氮基或巯基;

烷基

一组下式:

其中

X是

-O-、-S-、或-NH-;或者

烷二基

Y是-O-、-NH-、烷二基

n是0-6的整数;并且

m是0-6的整数;或者

-接头-报告子;

或其互变异构体或旋光异构体。

在一些方面中,R

其中R

在一个实施方式中,本文提供了用于鉴定细胞中开放DNA区域的方法,所述方法包括:(a)将寡核苷酸分子群体引入细胞中,其中每个分子从5′至3′包含扩增区段、索引条形码区段、杂交区段和可逆终止核苷酸;(b)在允许所述寡核苷酸分子群体的所述杂交区段与开放DNA区域退火的条件下孵育所述细胞;(c)活化所述退火的寡核苷酸分子的至少一部分以暴露可延伸的3'羟基基团;以及(d)通过将活化的寡核苷酸分子从其可延伸的3'羟基基团延伸来由所述开放DNA合成cDNA。

在一些方面中,扩增区段是RNA聚合酶启动子。在一些方面中,扩增区段是引物结合位点。在一些方面中,扩增区段包含约7个至约50个核苷酸。在一些方面中,寡核苷酸群体的杂交区段包含简并核苷酸序列。在一些方面中,所述群体中的每个核酸分子包含独特的杂交区段序列。在一些方面中,杂交区段包含一个或多个已知核苷酸序列。在某些方面中,每个已知核苷酸序列与靶基因组或线粒体DNA序列互补。在一些方面中,杂交区段包含约7个至约30个核苷酸。在一些方面中,杂交区段包含约15个核苷酸。在一些方面中,所述群体的寡核苷酸还包含位于扩增区段与索引条形码区段之间的间隔区段。在一些方面中,可光活化的终止核苷酸包括下式的结构:

其中:

R

R

R

R

氢、羟基、卤基、氨基、硝基、氰基、叠氮基或巯基;

烷基

R

氢、羟基、卤基、氨基、硝基、氰基、叠氮基或巯基;

烷基

一组下式:

其中

X是

-O-、-S-、或-NH-;或者

烷二基

Y是-O-、-NH-、烷二基

n是0-6的整数;并且

m是0-6的整数;或者

-接头-报告子;

或其互变异构体或旋光异构体。

在一些方面中,R

其中R

在一些方面中,在过程(a)中引入的寡核苷酸分子群体是根据本发明实施方式中的任一实施方式的寡核苷酸分子群体。

在一些方面中,细胞是固定的。在一些方面中,活化包括光活化。在一些方面中,开放DNA是开放染色质,并且活化包括将细胞核暴露于紫外光。在一些方面中,活化是在整个细胞核中执行的。在一些方面中,开放DNA是开放线粒体DNA,并且活化包括将细胞中的至少一个线粒体暴露于紫外光。在一些方面中,活化是对细胞中的多于一个线粒体执行的。在一些方面中,活化是在细胞核或线粒体内的特定位点处执行的。在某些方面中,特定位点是基于目的基因的定位而鉴定的。在某些方面中,特定位点是目的基因的转录起始位点。在某些方面中,使用原位杂交来定位特定位点。在某些方面中,特定位点处活化包括基于原位杂交信号将所述特定位点暴露于多光子激发。

在一些方面中,合成cDNA包括添加DNA依赖性DNA聚合酶。在一些方面中,所述方法还包括处理所述合成的cDNA以产生双链cDNA,所述双链cDNA包含所述寡核苷酸的所述索引条形码区段和所述扩增区段。在某些方面中,所述方法还包括扩增双链cDNA。在某些方面中,扩增包括PCR、滚环扩增、或RNA扩增。在某些方面中,所述方法还包括获得所述双链cDNA的至少一部分的序列。在某些方面中,所述方法还包括将所述序列与基因组或线粒体序列比对,从而鉴定开放DNA区域。

在一些方面中,所述方法是多重方法,其中对样本中的两个或更多个细胞顺序地执行所述方法。在一些方面中,所述方法是多重方法,其中对所述细胞中的两个或更多个特定位点顺序地执行所述方法。在某些方面中,在每轮复合扩增期间引入的所述寡核苷酸分子群体包含独特的索引条形码区段。

在一些方面中,所述方法是对细胞进行分类的方法。在一些方面中,所述方法是预测或确定细胞亚型的方法。

在一些方面中,所述方法进一步包括确定开放DNA区域是否具有转录活性,其中所述方法还包括在过程(d)之后:(e)在基本上只允许未延伸寡核苷酸从所述开放DNA变性的条件下孵育所述细胞;(f)灭活或去除所述变性的未延伸寡核苷酸;(g)将第二寡核苷酸分子群体引入所述细胞,其中每个分子从5′至3′包含扩增区段、不同于过程(a)中引入的所述寡核苷酸分子的所述索引条形码区段的索引条形码区段、杂交区段、和可逆终止核苷酸;(h)在允许所述寡核苷酸分子群体的所述杂交区段与表达的RNA退火的条件下孵育所述细胞;(i)活化所述退火的寡核苷酸分子的至少一部分以暴露可延伸的3′羟基基团;以及(j)通过将所述活化的寡核苷酸分子从其可延伸的3′羟基基团延伸来由所述表达的RNA合成cDNA。

在一些方面中,扩增区段是RNA聚合酶启动子。在一些方面中,扩增区段是引物结合位点。在一些方面中,扩增区段包含约7个至约50个核苷酸。在一些方面中,第二寡核苷酸分子群体的杂交区段包含聚T序列。在一些方面中,第二寡核苷酸分子群体的杂交区段包含一个或多个已知核苷酸序列。在某些方面中,每个已知核苷酸序列与靶RNA序列互补。

在一些方面中,第二寡核苷酸分子群体的杂交区段包含约7个至约30个核苷酸。在一些方面中,第二寡核苷酸分子群体的杂交区段包含约15个核苷酸。在一些方面中,所述群体的寡核苷酸还包含位于扩增区段与索引条形码区段之间的间隔区段。在一些方面中,可光活化的终止核苷酸包括下式的结构:

其中:

R

R

R

R

氢、羟基、卤基、氨基、硝基、氰基、叠氮基或巯基;

烷基

R

氢、羟基、卤基、氨基、硝基、氰基、叠氮基或巯基;

烷基

一组下式:

其中

X是

-O-、-S-、或-NH-;或者

烷二基

Y是-O-、-NH-、烷二基

n是0-6的整数;并且

m是0-6的整数;或者

-接头-报告子;

或其互变异构体或旋光异构体。

在一些方面中,R

其中R

在一些方面中,在过程(g)中引入的第二寡核苷酸分子群体是根据本发明实施方式中的任一实施方式的寡核苷酸分子群体。

在一些方面中,细胞是固定的。在一些方面中,活化包括光活化。在一些方面中,活化包括将细胞质暴露于紫外光。在一些方面中,活化是在整个细胞质中执行的。在一些方面中,活化是在细胞质内的特定位点处执行的。在某些方面中,特定位点是轴突或树突。在一些方面中,合成cDNA包括添加RNA依赖性DNA聚合酶。在一些方面中,所述方法还包括处理所述合成的cDNA以产生双链cDNA,所述双链cDNA包含所述寡核苷酸的所述索引条形码区段和所述启动子区域区段。在一些方面中,所述方法还包括扩增双链cDNA。在某些方面中,扩增包括PCR、滚环扩增、或RNA扩增。在某些方面中,所述方法还包括获得所述双链cDNA的至少一部分的序列,从而鉴定所述表达的RNA。

在一些方面中,所述方法是多重方法,其中对所述细胞中的两个或更多个特定位点顺序地执行所述方法。在一些方面中,所述方法是多重方法,其中对样本中的两个或更多个细胞顺序地执行所述方法。在某些方面中,在每轮复合扩增期间引入的所述寡核苷酸分子群体包含独特的索引条形码区段。

在一个实施方式中,本文提供了用于鉴定细胞中表达的RNA的方法,所述方法包括:(a)将寡核苷酸分子群体引入所述细胞中,其中每个分子从5′至3′包含扩增区段、索引条形码区段、杂交区段和可逆终止核苷酸;(b)在允许所述寡核苷酸分子群体的所述杂交区段与表达的RNA退火的条件下孵育所述细胞;(c)活化所述退火的寡核苷酸分子的至少一部分以暴露可延伸的3′羟基基团;以及(d)通过将所述活化的寡核苷酸分子从其可延伸的3'羟基基团延伸来由所述表达的RNA合成cDNA。

在一些方面中,扩增区段是RNA聚合酶启动子。在一些方面中,扩增区段是引物结合位点。在一些方面中,扩增区段包含约7个至约50个核苷酸。在一些方面中,杂交区段包含聚T序列。在一些方面中,杂交区段包含一个或多个已知核苷酸序列。在某些方面中,每个已知核苷酸序列与靶RNA序列互补。在一些方面中,杂交区段包含约7个至约30个核苷酸。在一些方面中,杂交区段包含约15个核苷酸。在一些方面中,所述群体的寡核苷酸还包含位于扩增区段与索引条形码区段之间的间隔区段。在一些方面中,可光活化的终止核苷酸包括下式的结构:

其中:

R

R

R

R

氢、羟基、卤基、氨基、硝基、氰基、叠氮基或巯基;

烷基

R

氢、羟基、卤基、氨基、硝基、氰基、叠氮基或巯基;

烷基

一组下式:

其中

X是

-O-、-S-、或-NH-;或者

烷二基

Y是-O-、-NH-、烷二基

n是0-6的整数;并且

m是0-6的整数;或者

-接头-报告子;

或其互变异构体或旋光异构体。

在一些方面中,R

其中R

在一些方面中,在过程(a)中引入的寡核苷酸分子群体是根据本发明实施方式中的任一实施方式的寡核苷酸分子群体。

在一些方面中,细胞是固定的。在一些方面中,活化包括光活化。在一些方面中,活化包括将细胞质暴露于紫外光。在一些方面中,活化是在整个细胞质中执行的。在一些方面中,活化是在细胞质内的特定位点处执行的。在某些方面中,特定位点是轴突或树突。

在一些方面中,合成cDNA包括添加RNA依赖性DNA聚合酶。在一些方面中,所述方法还包括处理所述合成的cDNA以产生双链cDNA,所述双链cDNA包含所述寡核苷酸的所述索引条形码区段和所述扩增区段。在某些方面中,所述方法还包括扩增双链cDNA。在某些方面中,扩增包括PCR、滚环扩增、或RNA扩增。在某些方面中,所述方法还包括获得所述双链cDNA的至少一部分的序列,从而鉴定所述表达的RNA。

在一些方面中,所述方法是多重方法,其中对所述细胞中的两个或更多个特定位点顺序地执行所述方法。在一些方面中,所述方法是多重方法,其中对样本中的两个或更多个细胞顺序地执行所述方法。在某些方面中,在每轮复合扩增期间引入的所述寡核苷酸分子群体包含独特的索引条形码区段。

在一个实施方式中,本文提供了试剂盒,所述试剂盒包含根据本发明实施方式中的任一实施方式的寡核苷酸群体,以及DNA聚合酶、RNA聚合酶、逆转录酶、脱氧核糖核苷酸和/或核糖核苷酸中的至少一者。

以下编号的段落描述了本发明的附加和/或替代方面:

1.一种寡核苷酸分子,所述寡核苷酸分子从5′至3′包含扩增区段、杂交区段和可逆终止核苷酸。

2.根据段落1所述的寡核苷酸分子,其中所述扩增区段是RNA聚合酶启动子。

3.根据段落1所述的寡核苷酸分子,其中所述扩增区段是引物结合位点。

4.根据段落1-3中任一项所述的寡核苷酸分子,其中所述扩增区段包含约7个至约50个核苷酸。

5.根据段落1-4中任一项所述的寡核苷酸分子,其中所述杂交区段包含随机核苷酸序列。

6.根据段落1-4中任一项所述的寡核苷酸分子,其中所述杂交区段包含已知核苷酸序列。

7.根据段落6所述的寡核苷酸分子,其中所述已知核苷酸序列与靶基因组或线粒体DNA序列互补。

8.根据段落6所述的寡核苷酸分子,其中所述已知核苷酸序列与靶RNA序列互补。

9.根据段落1-4中任一项所述的寡核苷酸分子,其中所述杂交区段包含聚T序列。

10.根据段落1-9中任一项所述的寡核苷酸分子,其中所述杂交区段包含约7个至约30个核苷酸。

11.根据段落1-10中任一项所述的寡核苷酸分子,其中所述杂交区段包含约15个核苷酸。

12.根据段落1-11中任一项所述的寡核苷酸分子,所述寡核苷酸分子还包含位于所述扩增区段与所述杂交区段之间的索引条形码区段。

13.根据段落12所述的寡核苷酸分子,所述寡核苷酸分子还包含位于所述扩增区段与所述索引条形码区段之间的间隔区段。

14.根据段落1-13中任一项所述的寡核苷酸分子,其中所述可逆终止核苷酸包含硝基苄基基团。

15.根据段落1-14中任一项所述的寡核苷酸分子,其中所述可逆终止核苷酸包含荧光标记。

16.根据段落1-15中任一项所述的寡核苷酸分子,其中所述可逆终止核苷酸是可光活化的终止核苷酸。

17.根据段落16所述的寡核苷酸分子,其中所述可光活化的终止核苷酸包括下式的结构:

其中:

R

R

R

R

氢、羟基、卤基、氨基、硝基、氰基、叠氮基或巯基;

烷基

R

氢、羟基、卤基、氨基、硝基、氰基、叠氮基或巯基;

烷基

一组下式:

其中

X是

-O-、-S-、或-NH-;或者

烷二基

Y是-O-、-NH-、烷二基

n是0-6的整数;并且

m是0-6的整数;或者

-接头-报告子;

或其互变异构体或旋光异构体。

18.根据段落17所述的寡核苷酸分子,其中R

19.根据段落18所述的寡核苷酸分子,其中所述可光活化的终止核苷酸包括下式的结构:

其中R

20.根据段落19所述的寡核苷酸分子,其中所述可光活化的终止核苷酸包括下式的结构:

21.一种寡核苷酸分子群体,每个寡核苷酸分子从5′至3′包含扩增区段、杂交区段和可逆终止核苷酸。

22.根据段落21所述的群体,其中所述扩增区段是RNA聚合酶启动子。

23.根据段落21所述的群体,其中所述扩增区段是引物结合位点。

24.根据段落21-23中任一项所述的群体,其中所述扩增区段包含约7个至约50个核苷酸。

25.根据段落21-24中任一项所述的群体,其中所述杂交区段包含简并核苷酸序列。

26.根据段落21-25中任一项所述的群体,其中所述群体中的每个核酸分子包含独特的杂交区段序列。

27.根据段落21-24中任一项所述的群体,其中所述杂交区段包含一个或多个已知核苷酸序列。

28.根据段落27所述的群体,其中每个已知核苷酸序列与靶基因组或线粒体DNA序列互补。

29.根据段落27所述的群体,其中每个已知核苷酸序列与靶RNA序列互补。

30.根据段落21-24中任一项所述的群体,其中所述杂交区段包含聚T序列。

31.根据段落21-30中任一项所述的群体,其中所述杂交区段包含约7个至约30个核苷酸。

32.根据段落21-31中任一项所述的群体,其中所述杂交区段包含约15个核苷酸。

33.根据段落21-32中任一项所述的群体,所述群体还包含位于所述扩增区段与所述杂交区段之间的索引条形码区段。

34.根据段落33所述的群体,所述群体还包含位于所述RNA聚合酶启动子区段与所述索引条形码区段之间的间隔区段。

35.根据段落21-34中任一项所述的群体,其中所述可逆终止核苷酸包含硝基苄基基团。

36.根据段落21-35中任一项所述的群体,其中所述可逆终止核苷酸包含荧光标记。

37.根据段落21-36中任一项所述的群体,其中所述可逆终止核苷酸是可光活化的终止核苷酸。

38.根据段落37所述的群体,其中所述可光活化的终止核苷酸包括下式的结构:

其中:

R

R

R

R

氢、羟基、卤基、氨基、硝基、氰基、叠氮基或巯基;

烷基

R

氢、羟基、卤基、氨基、硝基、氰基、叠氮基或巯基;

烷基

一组下式:

其中

X是

-O-、-S-、或-NH-;或者

烷二基

Y是-O-、-NH-、烷二基

n是0-6的整数;并且

m是0-6的整数;或者

-接头-报告子;

或其互变异构体或旋光异构体。

39.根据段落38所述的群体,其中R

40.根据段落39所述的群体,其中所述可光活化的终止核苷酸包括下式的结构:

其中R

41.根据段落40所述的群体,其中所述可光活化的终止核苷酸包括下式的结构:

42.一种用于鉴定细胞中的开放DNA区域的方法,所述方法包括:

(a)将寡核苷酸分子群体引入所述细胞中,其中每个分子从5′至3′包含扩增区段、索引条形码区段、杂交区段和可逆终止核苷酸;

(b)在允许所述寡核苷酸分子群体的所述杂交区段与开放DNA区域退火的条件下孵育所述细胞;

(c)活化所述退火的寡核苷酸分子的至少一部分以暴露可延伸的3′羟基基团;以及

(d)通过将活化的寡核苷酸分子从其可延伸的3'羟基基团延伸来由所述开放DNA合成cDNA。

43.根据段落42所述的方法,其中所述扩增区段是RNA聚合酶启动子。

44.根据段落42所述的方法,其中所述扩增区段是引物结合位点。

45.根据段落42-44中任一项所述的方法,其中所述扩增区段包含约7个至约50个核苷酸。

46.根据段落42-45中任一项所述的方法,其中所述寡核苷酸群体的所述杂交区段包含简并核苷酸序列。

47.根据段落42-46中任一项所述的方法,其中所述群体中的每个核酸分子包含独特的杂交区段序列。

48.根据段落42-45中任一项所述的方法,其中所述杂交区段包含一个或多个已知核苷酸序列。

49.根据段落48所述的方法,其中每个已知核苷酸序列与靶基因组或线粒体DNA序列互补。

50.根据段落42-49中任一项所述的方法,其中所述杂交区段包含约7个至约30个核苷酸。

51.根据段落42-50中任一项所述的方法,其中所述杂交区段包含约15个核苷酸。

52.根据段落42-51中任一项所述的方法,其中所述寡核苷酸分子群体还包含位于所述扩增区段与所述索引条形码区段之间的间隔区段。

53.根据段落42-52中任一项所述的方法,其中所述可逆终止核苷酸是可光活化的终止核苷酸。

54.根据段落53所述的方法,其中所述可光活化的终止核苷酸包括下式的结构:

其中:

R

R

R

R

氢、羟基、卤基、氨基、硝基、氰基、叠氮基或巯基;

烷基

R

氢、羟基、卤基、氨基、硝基、氰基、叠氮基或巯基;

烷基

一组下式:

其中

X是

-O-、-S-、或-NH-;或者

烷二基

Y是-O-、-NH-、烷二基

n是0-6的整数;并且

m是0-6的整数;或者

-接头-报告子;

或其互变异构体或旋光异构体。

55.根据段落54所述的方法,其中R

56.根据段落55所述的方法,其中所述可光活化的终止核苷酸包括下式的结构:

其中R

57.根据段落56所述的方法,其中所述可光活化的终止核苷酸包括下式的结构:

58.根据段落42-57中任一项所述的方法,其中在过程(a)中引入的所述寡核苷酸分子群体是根据段落21-28和31-41中任一项所述的寡核苷酸分子群体。

59.根据段落42-58中任一项所述的方法,其中所述细胞是固定的。

60.根据段落42-59中任一项所述的方法,其中所述开放DNA是开放染色质,其中活化包括将细胞核暴露于紫外光。

61.根据段落42-60中任一项所述的方法,其中活化在整个所述细胞核中执行。

62.根据段落42-59中任一项所述的方法,其中所述开放DNA是开放的线粒体DNA,其中活化包括将所述细胞中的至少一个线粒体暴露于紫外光。

63.根据段落42-59和62中任一项所述的方法,其中活化对所述细胞中的多于一个线粒体执行。

64.根据段落42-60或62中任一项所述的方法,其中在所述细胞核或线粒体内的特定位点执行活化。

65.根据段落64所述的方法,其中所述特定位点是基于目的基因的定位而鉴定的。

66.根据段落65所述的方法,其中所述特定位点是所述目的基因的转录起始位点。

67.根据段落65或66所述的方法,其中使用原位杂交来定位所述特定位点。

68.根据段落67所述的方法,其中在所述特定位点处的活化包括基于原位杂交信号将所述特定位点暴露于多光子激发。

69.根据段落42-68中任一项所述的方法,其中合成cDNA包括添加DNA依赖性DNA聚合酶。

70.根据段落42-69中任一项所述的方法,所述方法还包括处理所述合成的cDNA以产生双链cDNA,所述双链cDNA包含所述寡核苷酸的所述索引条形码区段和所述扩增区段。

71.根据段落70所述的方法,所述方法还包括扩增所述双链cDNA。

72.根据段落71所述的方法,其中扩增包括PCR、滚环扩增、或RNA扩增。

73.根据段落71或72所述的方法,所述方法还包括获得所述双链cDNA的至少一部分的序列。

74.根据段落73所述的方法,所述方法还包括将所述序列与基因组或线粒体序列比对,从而鉴定开放DNA区域。

75.根据段落42-74中任一项所述的方法,其中所述方法是多重方法,其中对样本中的两个或更多个细胞顺序地执行所述方法。

76.根据段落42-74中任一项所述的方法,其中所述方法是多重方法,其中对所述细胞中的两个或更多个特定位点顺序地执行所述方法。

77.根据段落75或76所述的方法,其中在每轮复合扩增期间引入的所述寡核苷酸分子群体包含独特的索引条形码区段。

78.根据段落42-77中任一项所述的方法,其中所述方法被进一步定义为对细胞进行分类的方法。

79.根据段落42-77中任一项所述的方法,其中所述方法被进一步定义为预测或确定细胞的亚型的方法。

80.根据段落42-79中任一项所述的方法,其中所述方法还包括确定开放DNA区域是否具有转录活性,其中所述方法还包括在过程(d)之后:

(e)在基本上只允许未延伸寡核苷酸从所述开放DNA变性的条件下孵育所述细胞;

(f)灭活或去除所述变性的未延伸寡核苷酸;

(g)将第二寡核苷酸分子群体引入所述细胞,其中每个分子从5′至3′包含扩增区段、不同于过程(a)中引入的所述寡核苷酸分子的所述索引条形码区段的索引条形码区段、杂交区段、和可逆终止核苷酸;

(h)在允许所述寡核苷酸分子群体的所述杂交区段与表达的RNA退火的条件下孵育所述细胞;

(i)活化所述退火的寡核苷酸分子的至少一部分以暴露可延伸的3′羟基基团;以及

(j)通过将所述活化的寡核苷酸分子从其可延伸的3′羟基基团延伸来由所述表达的RNA合成cDNA。

81.根据段落80所述的方法,其中所述扩增区段是RNA聚合酶启动子。

82.根据段落80所述的方法,其中所述扩增区段是引物结合位点。

83.根据段落80-82中任一项所述的方法,其中所述扩增区段包含约7个至约50个核苷酸。

84.根据段落80-83中任一项所述的方法,其中所述第二寡核苷酸分子群体的所述杂交区段包含聚T序列。

85.根据段落80-84中任一项所述的方法,其中所述第二寡核苷酸分子群体的所述杂交区段包含一个或多个已知核苷酸序列。

86.根据段落85所述的方法,其中每个已知核苷酸序列与靶RNA序列互补。

87.根据段落80-86中任一项所述的方法,其中所述第二寡核苷酸分子群体的所述杂交区段包含约7个至约30个核苷酸。

88.根据段落80-87中任一项所述的方法,其中所述第二寡核苷酸分子群体的所述杂交区段包含约15个核苷酸。

89.根据段落80-88中任一项所述的方法,其中所述寡核苷酸分子群体还包含位于所述扩增区段与所述索引条形码区段之间的间隔区段。

90.根据段落80-89中任一项所述的方法,其中所述可逆终止核苷酸是可光活化的终止核苷酸。

91.根据段落90所述的方法,其中所述可光活化的终止核苷酸包括下式的结构:

其中:

R

R

R

R

氢、羟基、卤基、氨基、硝基、氰基、叠氮基或巯基;

烷基

R

氢、羟基、卤基、氨基、硝基、氰基、叠氮基或巯基;

烷基

一组下式:

其中

X是

-O-、-S-、或-NH-;或者

烷二基

Y是-O-、-NH-、烷二基

n是0-6的整数;并且

m是0-6的整数;或者

-接头-报告子;

或其互变异构体或旋光异构体。

92.根据段落91所述的方法,其中R

93.根据段落92所述的方法,其中所述可光活化的终止核苷酸包括下式的结构:

其中R

94.根据段落93所述的方法,其中所述可光活化的终止核苷酸包括下式的结构:

95.根据段落80-94中任一项所述的方法,其中在过程(g)中引入的所述第二寡核苷酸分子群体是根据段落21-27和29-41中任一项所述的寡核苷酸分子群体。

96.根据段落80-95中任一项所述的方法,其中所述细胞是固定的。

97.根据段落80-96中任一项所述的方法,其中活化包括将细胞质暴露于紫外光。

98.根据段落80-97中任一项所述的方法,其中活化在整个所述细胞质中执行。

99.根据段落80-97中任一项所述的方法,其中活化在所述细胞质内的特定位点处执行。

100.根据段落99所述的方法,其中所述特定位点是轴突或树突。

101.根据段落80-100中任一项所述的方法,其中合成cDNA包括添加RNA依赖性DNA聚合酶。

102.根据段落80-101中任一项所述的方法,所述方法还包括处理所述合成的cDNA以产生双链cDNA,所述双链cDNA包含所述寡核苷酸的所述索引条形码区段和所述启动子区域区段。

103.根据段落102所述的方法,所述方法还包括扩增所述双链cDNA。

104.根据段落103所述的方法,其中扩增包括PCR、滚环扩增、或RNA扩增。

105.根据段落103或104所述的方法,所述方法还包括获得所述双链cDNA的至少一部分的序列,从而鉴定所述表达的RNA。

106.根据段落99-105中任一项所述的方法,其中所述方法是多重方法,其中对所述细胞中的两个或更多个特定位点顺序地执行所述方法。

107.根据段落83-106中任一项所述的方法,其中所述方法是多重方法,其中对样本中的两个或更多个细胞顺序地执行所述方法。

108.根据段落106或107所述的方法,其中在每轮复合扩增期间引入的所述寡核苷酸分子群体包含独特的索引条形码区段。

109.一种用于鉴定细胞中表达的RNA的方法,所述方法包括:

(a)将寡核苷酸分子群体引入所述细胞中,其中每个分子从5′至3′包含扩增区段、索引条形码区段、杂交区段和可逆终止核苷酸;

(b)在允许所述寡核苷酸分子群体的所述杂交区段与表达的RNA退火的条件下孵育所述细胞;

(c)活化所述退火的寡核苷酸分子的至少一部分以暴露可延伸的3′羟基基团;以及

(d)通过将所述活化的寡核苷酸分子从其可延伸的3′羟基基团延伸来由所述表达的RNA合成cDNA。

110.根据段落109所述的方法,其中所述扩增区段是RNA聚合酶启动子。

111.根据段落109所述的方法,其中所述扩增区段是引物结合位点。

112.根据段落109-111中任一项所述的方法,其中所述扩增区段包含约7个至约50个核苷酸。

113.根据段落109-112中任一项所述的方法,其中所述杂交区段包含聚T序列。

114.根据段落109-112中任一项所述的方法,其中所述杂交区段包含一个或多个已知核苷酸序列。

115.根据段落114所述的方法,其中每个已知核苷酸序列与靶RNA序列互补。

116.根据段落109-115中任一项所述的方法,其中所述杂交区段包含约7个至约30个核苷酸。

117.根据段落109-116中任一项所述的方法,其中所述杂交区段包含约15个核苷酸。

118.根据段落109-117中任一项所述的方法,其中所述寡核苷酸分子群体还包含位于所述扩增区段与所述索引条形码区段之间的间隔区段。

119.根据段落109-118中任一项所述的方法,其中所述可逆终止核苷酸是可光活化的终止核苷酸。

120.根据段落119所述的方法,其中所述可光活化的终止核苷酸包括下式的结构:

其中:

R

R

R

R

氢、羟基、卤基、氨基、硝基、氰基、叠氮基或巯基;

烷基

R

氢、羟基、卤基、氨基、硝基、氰基、叠氮基或巯基;

烷基

一组下式:

其中

X是

-O-、-S-、或-NH-;或者

烷二基

Y是-O-、-NH-、烷二基

n是0-6的整数;并且

m是0-6的整数;或者

-接头-报告子;

或其互变异构体或旋光异构体。

121.根据段落120所述的方法,其中R

122.根据段落121所述的方法,其中所述可光活化的终止核苷酸包括下式的结构:

其中R

123.根据段落122所述的方法,其中所述可光活化的终止核苷酸包括下式的结构:

124.根据段落109-123中任一项所述的方法,其中在过程(a)中引入的所述寡核苷酸分子群体是根据段落21-27和29-41中任一项所述的寡核苷酸分子群体。

125.根据段落109-124中任一项所述的方法,其中所述细胞是固定的。

126.根据段落109-125中任一项所述的方法,其中活化包括将所述细胞质暴露于紫外光。

127.根据段落109-126中任一项所述的方法,其中活化在整个所述细胞质中执行。

128.根据段落109-126中任一项所述的方法,其中活化在所述细胞质内的特定位点处执行。

129.根据段落128所述的方法,其中所述特定位点是轴突或树突。

130.根据段落109-129中任一项所述的方法,其中合成cDNA包括添加RNA依赖性DNA聚合酶。

131.根据段落105-130中任一项所述的方法,所述方法还包括处理所述合成的cDNA以产生双链cDNA,所述双链cDNA包含所述寡核苷酸的所述索引条形码区段和所述扩增区段。

132.根据段落131所述的方法,所述方法还包括扩增所述双链cDNA。

133.根据段落132所述的方法,其中扩增包括PCR、滚环扩增、或RNA扩增。

134.根据段落132或133所述的方法,所述方法还包括获得所述双链cDNA的至少一部分的序列,从而鉴定所述表达的RNA。

135.根据段落109-134中任一项所述的方法,其中所述方法是多重方法,其中对所述细胞中的两个或更多个特定位点顺序地执行所述方法。

136.根据段落109-135中任一项所述的方法,其中所述方法是多重方法,其中对样本中的两个或更多个细胞顺序地执行所述方法。

137.根据段落135或136所述的方法,其中在每轮复合扩增期间引入的所述寡核苷酸分子群体包含独特的索引条形码区段。

138.一种试剂盒,所述试剂盒包含根据段落21-41中任一项所述的寡核苷酸群体,以及DNA聚合酶、RNA聚合酶、逆转录酶、脱氧核糖核苷酸和核糖核苷酸中的至少一者。

根据下面的详细描述,本发明的其他目的、特征和优点将变得显而易见。然而,应当理解的是,详细说明和具体示例虽然指示了本发明的优选实施方案,但是仅以说明的方式给出,因为在本发明的精神和范围内的各种改变和修改将根据该详细描述而变得对于本领域的技术人员显而易见。

附图说明

以下附图形成了本说明书的一部分,并被包括以进一步说明本发明的某些方面。通过参考这些附图中的一个或多个附图并结合本文给出的具体实施方式的详细描述,可以更好地理解本发明。

图1.示例性CHeX-seq多功能寡核苷酸(SEQ ID NO:1)。在寡核苷酸的3'端存在含有Cy5荧光部分的可光活化的不可延伸的核苷酸。在光活化后,Cy5荧光消失,并且形成了游离的3′-羟基,使得寡核苷酸可以原位延伸,从而提供用于DNA合成。

图2.用于测定转录活性染色质的CHeX-seq方案的示意图。

图3A至图3B是两种示例性CHeX-seq寡核苷酸合成方法的示意图。图3A—完整的CHeX-seq探针(T7-BC1-N(15)-T-LTdU-Cy5)序列示出在顶部。合成含有T7启动子位点、Illumina 6bp条形码1(BC1,蓝色)和15bp简并序列的寡核苷酸T7BC1-15N-T及其反向互补寡核苷酸T7BC1-15N-T-RC,并将它们与彼此退火以产生双链寡核苷酸。将Cy5标记的发光终止子(Lightning Terminator)LTdU-Cy5结合到所述双链寡核苷酸的3'端。在双链探针变性和HPLC纯化后收获单链CHeX-seq探针。T7BC1-15-N-T是SEQ ID NO:2,并且T7BC1-15N-RC是SEQ ID NO:3。图3B—T7BC1是SEQ ID NO:4;T7BC1-RC是SEQ IDI NO:5;15N-T是SEQ ID NO:6;并且A-15N-RC是SEQ ID NO:7。连接对的序列由SEQ ID NO:2和SEQ ID NO:3提供。

图4.示例性CHeX-seq寡核苷酸合成方法的示意图。

图5.示例性荧光标记的可光活化的终止核苷酸化合物。

图6.细胞的细胞核中特定位点处的光活化。为了说明在细胞的细胞核中局部活化的能力,将细胞核用针对定位在细胞核中的转录因子的抗体染色。一个特定位点(虚线框)被405nm激光光活化,表明此类位点(类似于HCR原位杂交位点)可以被光寻址。

图7.用于光学清洗的基于免疫荧光图像的自动化细胞隔室分析。原始图像被分成选择性隔室的免疫荧光信号,其中Tau用于轴突,MAP2用于树突,并且DAPI用于细胞核。每个隔室图像被计算为二进制图像,以自动量化每个像素的平均强度和区域分布模式。基于DAPI/MAP2信号和细胞形态轮廓计算体细胞隔室。

图8.跨物种F统计的偏相关性,用于控制皮层(左)和海马(右)锥体神经元的基因表达水平。轴是变异的量度,用于控制基因表达水平。“ρ”表示部分相关系数。p值来自关联的双侧T检验。边缘直方图被示出为与正常曲线重叠。

图9.染色质变异的模型。信号由顶部小图中的神经元接收,所述神经元活化第二信使系统(绿点),所述第二信使系统活化细胞核。每个神经元在细胞核中有不同的染色体排列(中间小图),所述神经元当收到矢量信号时,会在不同程度上活化基因转录(下部小图)。

图10.CHeX-seq初步数据。读数是相对于阳性和对照样本的基因组特征起始和终止位置进行量化的:转录起始位点、基因编码区、3′UTR和基因间区域。单细胞样本示出为单独的迹线,并且也“合并”成单一迹线。汇集的样本示出为单独的迹线。

图11.固定的小鼠皮层脑切片中的CHeX-seq寡核苷酸退火和活化。将130微米厚的切片用4%多聚甲醛固定10分钟。将GFAP和Map2抗体应用过夜。在此之后加入荧光标记的物种特异性二抗。然后将切片与170nM CHeX-seq寡核苷酸一起孵育60分钟。洗涤后,用80%功率的405激光线照射带有GFAP或Map2染色的个体细胞。在此之后通过加入DNA聚合酶和合成缓冲液引发cDNA原位合成。鸡多克隆抗GFAP抗体(Abcam,编号ab4674)。兔单克隆抗Map2抗体是Craig Garner,Stanford赠予的礼物。比例尺=20微米,神经元图像是2倍放大的,并且胶质细胞是1倍放大的。示出了两个mag以突出显示CHeX-seq活化的特异性。

图12.特定基因周围的启用CHeX-seq的3D染色质生态位结构分析的示意图。图示的方法将允许鉴定调控特定基因表达的染色质调节位点。目的基因的基因组位置将通过使用HCR的原位杂交来鉴定。这将提供信标,在所述信标上聚焦CheX-seq寡核苷酸活化激光,使得只有靠近FISH探针信号位点的CheX-seq寡核苷酸才将被活化。

图13A至图13G.K562 CHeX-seq基准测试。图13A—CheX-seq测定原理的示意图。图13B—加载到K562细胞核中的CHeX-seq探针(DIC图像)和单个细胞核中的CHeX-seq探针活化之前和之后的荧光信号(红色箭头),比例尺=20μm。图13C—关于基因组特征的CHeX-seq引发位点的统计。图13D—K562样本的TSS近端(+/-5kb)覆盖率(合并所有阳性样本)。图13E—在单细胞水平上的TSS近端(上部)和CDS(下部)的z评分覆盖率。图13F—CheX-seq引发的基因(全基因主体>0)与RNA-seq表达的基因(外显子>中值)之间的重叠。图13G—CheX-RNA重叠基因的GO功能富集结果(前20名)(图13F,左侧)。

图14A至图14B.CHeX-seq与其他开放染色质测定的基因组比较。图14A—UCSCGenome Browser跟踪视图,比较了在OTUD5基因座处CHeX-seq(紫色)对比ATAC-seq(红色)、DNA酶-seq(蓝色)和FAIL-seq(绿色)的覆盖率。在这四种测定下方是来源于GeneHancer数据库(Fishilevich等人,2017)的调节相互作用轨迹(GeneCards基因TSS、增强子和启动子,以及GeneHancer近端-远端相互作用)。最后四个轨迹是转录组和三个组蛋白标记(H3K27ac、H3K4me1、H3K4me3s)。OTUD5的启动子与它的3′内含子中的一个3′内含子之间的调节相互作用被所有四种开放染色质测定(蓝色矩形)所共享。图14B—使用二值化覆盖率和Jaccard距离,以10kb箱(左)和50kb箱(右)分辨率对开放染色质测定、转录组和表观基因组进行分层聚类。

图15A至图15C.CHeX-seq读段距TSS的距离与基因RNA丰度的相关性。图15A—大量K562 RNA-seq。图15B—大量K562GRO-序列。图15C—K562 scRNA-seq,取平均的单细胞。y轴:基因表达;x轴:从CHeX引发位点到TSS的距离。

图16A至图16B.CHeX-seq链型:检测开放染色质的链型。图16A—示意图,示出了以下假设:CHeX-seq引发延伸产物应该具有与有义链mRNA转录物相反的链型。图16B—测试图16A中的假设。x轴:对CHeX-seq引发事件进行计数和二值化的各种基因组特征;y轴:反义链与有义链CHeX-seq产物的数量的比率。

图17A至图17F.对固定的小鼠组织切片和分散的细胞培养物中的单个神经元的CHeX-seq分析。图17A—多聚甲醛固定的组织切片的CHeX-seq分析的示意图。图17B—海马切片,示出了针对MAP2免疫标记的神经元(绿色)。红色荧光表示CHeX-seq探针的定位。最右边的小图显示被活化的单个神经元细胞核(白色箭头)中荧光信号减少;比例尺=20μm。图17C—通过DIC显微术示出的多聚甲醛固定的培养皮质神经元(左侧小图)和CHeX-seq引物的核荧光(中间小图)。在探针活化后,该信号减弱(右侧小图;在右侧小图的插图中量化);比例尺=20μm。图17D—CheX转录组比较。左侧,小鼠固定组织切片;右侧,老鼠分散神经元。行是外显子或内含子区域中的scRNA-seq平均表达,列是整个基因主体、外显子或内含子区域中的CHeX-seq二值化引发信号。图17E—海马切片中内含子区域中CHeX-seq引发频率与转录活性之间的相关性。图17F—小鼠切片组织中内含子区域中CHeX-seq引发频率与转录变异性之间的相关性。

图18.细胞类型间单链开放染色质的染色体景观。染色体的CHeX引发位点分布;颜色:每条染色体的引发频率分数。(左侧小图)小鼠星形胶质细胞培养,(中间小图)小鼠分散神经元细胞,(右侧小图)小鼠神经元切片。

图19.CHeX-seq aRNA扩增方案的示意图。在将CHeX-seq探针T7-BC1-N(15)-T-LTdU-Cy5应用于PFA固定的经Triton X-100通透化的细胞时,简并N(15)序列与开放染色质区域中发现的单链核小体缺失的基因组DNA杂交。在对CHeX寡核苷酸的终止基团进行光介导的光切割后,通过DNA聚合酶I引发第一链DNA合成。在第一链DNA的3′末端聚(G)加尾后,使用定制的App-RC-聚C引物(表1)引发并合成第二链DNA。最后,使用从T7 RNA聚合酶启动子结合到双链DNA中的线性体外转录来扩增RNA。第2轮第1链和第2链DNA随后被合成并通过PCR扩增。

图20A至图20B.原位杂交至1号染色体(hg38)的区域630737-633960。图20A—1号染色体的一部分的UCSC Genome Browser追踪视图。CheX-seq轨迹类似于ATAC-seq轨迹,表明该染色体区域是开放的。这与DNA酶-seq和FAIL-seq数据不同。图20B—左小图是K562细胞核的DAPI染色。右小图显示了使用8种荧光标记的寡核苷酸的荧光原位杂交信号。这些数据显示了K562细胞的细胞核中高度特异性的1号染色体的三体性。比例尺=20μm。

图21.神经元和星形胶质细胞中的CHeX-seq读段距TSS的距离与RNA丰度的相关性。

图22A至图22F.Chex-seq读段定位至K562细胞、人和小鼠分散神经元和星形胶质细胞以及小鼠脑切片定位的神经元的转录起始位点。图22A—K562。图22B—人星形胶质细胞。图22C—人神经元。图22D—小鼠星形胶质细胞。图22E—小鼠神经元。图22F—原位小鼠神经元。

图23A至图23B.应用于来自小鼠和人样本的原代星形胶质细胞培养物的CHeX-seq。图23A—顶部是人星形胶质细胞的图,底部是小鼠星形胶质细胞的图。CHeX-seq探针活化之前的DIC(左)和DAPI图像(分别为左侧和中间小图),以及活化后的DAPI图像(右侧小图;插图中是DAPI信号的量化)。比例尺=20μm。图23B—与星形胶质细胞(左)和神经元(右)中的基因组特征相关的CHeX-seq引发位点的定量。相对于基因结构的定位的CHeX-seq读段位点的关键。

具体实施方式

RNA转录的过程需要细胞的基因组DNA处于开放染色质构象,在所述开放染色质构象中存在较少的核小体包装,因此转录调节蛋白可以结合并发挥作用。同样,线粒体DNA必须处于开放构象才能发生转录。很明显,染色质结构是动态的并且受多种因素调节,所述因素包括发育、应激和药理学攻击(Fullard等人,2017;Kozlenkov等人,2014;Kozlenkov等人,2016)。大多数染色质建模研究依赖于使用多个细胞来产生基因组DNA/染色质以供进行分析。染色质分析程序包括DnA酶-seq、FAIL-seq和ChIP-seq以及其他方法。最近,这些方法已经扩展到单细胞(Cusanovich等人,2015;Buenrostro等人,2015;Rotem等人,2015;Clark等人,2018)。例如,定位单细胞中的染色质的最近ATAC-seq方法利用了用于检测转座酶可及染色质的测定(Buenrostro等人,2013)。这种方法使用Tn5转座酶来标记和纯化基因组中可及的无核小体双链DNA区域。这些程序中的每种程序都有特定的优点和缺点,其中最重要的是它们都评定从目的组织中分离的细胞核中的染色质,从而丢失空间位置信息和细胞微环境背景。为了克服这些问题,已经开发了CHeX-seq(

CHeX-seq与ATAC-seq互补,因为CHeX-seq查询单链DNA,而ATAC-seq评定双链DNA。开放染色质由双链DNA和单链DNA两者组成(Bjursell等人,1979;Scheer等人,1987;Kouzine等人,2017)。染色质的开放状态是许多细胞功能所必需的,所述许多细胞功能为例如复制、同源重组、DNA修复以及转录。虽然染色质的开放状态是转录发生所必需的,但是“开放”可能与转录没有直接关系,因为其他反式作用因子也是必需的(Yu等人,2017)。单链DNA是以单链“转录泡”形式进行转录所必需的,据报道单链“转录泡”为约200个碱基大(Barnes等人,2015;Bieberstein等人,2012)。此外,与转录泡一致,转录活性染色质包含长度大于1千碱基的长单链区域段(Kouzine等人,2017;Bieberstein等人,2012年;Zhou和Paull,2015)。根据细胞的生理状态,基因组中单链DNA的量估计从约0.2%至2.5%变化(Zhou和Paull,2015)。

为了以单细胞分辨率原位测定单链DNA,CHeX-seq利用光的分辨率将试剂作用和染色质分析限制在单独细胞的细胞核内。为完成此,寡核苷酸(图13A)已经被设计成可以随机与单链基因组DNA退火,并且在光活化之前保持无活性。光活化后,寡核苷酸作为引物用于DNA聚合酶介导的互补DNA合成(图13A)。这是DNA指导的原位转录(Eberwine等人,1992;Tecott等人,1988)。引物活化的分辨率由活化光的波长的衍射极限和透镜的数值孔径确定。为了便于分析,CHeX-seq寡核苷酸经工程化为包含样本特异性条形码:T7 RNA聚合酶启动子位点以及简并DNA序列,该简并DNA序列以荧光标记的光可逆封端的核苷酸终止(图3A和图13A)。在DNA合成后,将互补DNA用0.1N NaOH去除,复制成双链DNA,并使用T7 RNA聚合酶线性扩增(aRNA扩增)(Van Gelder等人,1990;Eberwine等人,1992)。随后用定制引物将aRNA逆转录为第一链和第二链DNA,转化为测序文库,并进行测序(图3A和图19)。

CHeX-seq已针对ENCODE分析的人K562细胞进行了基准测试,其证明了CHeX-seq在分散的小鼠和人原代脑细胞中的效用。这些数据强调了开放染色质状态与mRNA表达之间的显著相关性。这些数据显示了DNA链偏好,所述DNA链偏好表明了单链染色质中的蛋白质结合结构域。CHeX-seq还提供了对于表现出单链链型但不被转录的基因组DNA区域的证据,所述基因组DNA区域可能包括分裂细胞中的DNA修复区域和复制位点(Yu等人,2017;Vasquez等人,2001)。此外,普遍发现人神经元和星形胶质细胞比它们的小鼠对应物具有更多的开放染色质。此外,CHeX-seq可用于固定的脑组织切片中的单个免疫染色细胞。当CHeX-seq查询单链DNA时,能够检查单个细胞中线粒体的开放度,并且发现原位神经元中存在的线粒体中的DNA比分散细胞中的那些更开放,表明了代谢状态的差异。单链开放染色质的染色体景观可用于对细胞进行分类和预测细胞亚型。CHeX-seq使得能够分析固定的免疫染色单细胞中的染色质结构,从而为检查神经元回路在自然组织环境中调控个体细胞的染色质景观的作用开辟了新的途径。

本文提供的一些实施方式涉及允许在单细胞中同时研究染色质结构的动力学及其与细胞质RNA池的对应性的方法。还提供了评定解剖学上和空间上限定的单细胞中任何单个基因或多个基因周围的更高级染色质结构动力学的方法。染色质结构测定与相同细胞响应于外部(例如,药理学)刺激的细胞质转录组的整合将使得能够量化细胞转录反应的动力学。

I.定义

除非另有定义,否则本文使用的所有技术和科学术语具有与本发明所属领域的普通技术人员通常理解的含义相同的含义。虽然与本文所述的那些相似或等同的任何方法和材料均可用于实践或检验本发明,但是将描述优选的方法和材料。

如本文所用,就特定组分而言“基本上不含”在本文中用于表示没有特定组分被有意配制成组合物和/或仅作为杂质或以痕量存在。因此,由组合物的任何非预期杂质导致的指定组分的总量远低于0.05%,优选低于0.01%。最优选的是这样一种组合物,在所述组合物中,用标准分析方法无法检测到指定组分的量。

如本说明书中所使用的,“一个(种)(a/an)”可以指一个(种)或多个(种)。如在权利要求中所使用的,当与单词“包括”结合使用时,单词“一个(种)(a/an)”可以表示一个(种)或多于一个(种)。

权利要求中术语“或”的使用用于表示“和/或”,除非明确指出仅指替代方案或替代方案是相互排斥的,尽管本公开支持仅涉及替代方案的定义和“和/或”。如本文所用,“另一个(种)”可以指至少第二个(种)或更多个(种)。

如本文所用的“约”是指可测量的值,例如量、持续时间等,意味着涵盖与指定值相差±20%、±10%、±5%、±1%或±0.1%的变化,因为此类变化适合于执行所公开的方法。

“扩增”是指将多核苷酸序列复制并由此扩增成大量多核苷酸分子的任何手段,例如通过逆转录、T7 RNA扩增、聚合酶链式反应和连接酶链式反应等方法。

“有义”是指编码蛋白质的双链DNA分子的编码链的核酸序列,或与编码链基本上同源的序列。如本文所定义,有义序列与编码蛋白质的经表达的RNA分子的序列互补。有义序列不必只与经表达的RNA分子的编码部分互补。有义序列包括在编码蛋白质的DNA分子的编码链上指定的调节序列,该调节序列控制编码序列的表达。

“结合”在本文中用于表示第一部分与第二部分相互作用。

本文所用术语“生物样本”是指从单细胞或多细胞生物获得的样本,所述样本可用于评定核酸的表达水平、染色质状态、或两者。这种样本包括但不限于细胞、血液样本、组织样本、神经组织样本、脑样本和脑脊液样本。

如本文所用,“病理样本”是来自患有或疑似患有疾病、疾患或病症的受试者的生物样本。病理样本包括但不限于组织学组织切片和/或其他生物制品,例如组织培养细胞。病理样本常用于诊断病理学。

如本文所用,“固定样本”是指这样的样本,所述样本已经被处理以便将样本中细胞和组织的结构组织尽可能保持接近真实状态,以供用于后续检查,例如通过光学显微镜进行检查。固定通常抑制自溶和细菌分解,并且稳定化细胞和组织构成的结构组织,使它们经受组织处理的后续阶段。

如本文所用的“互补”是指两个核酸,例如两个DNA分子或一个DNA分子与一个RNA分子之间的亚基序列互补性的广义概念。当两个分子中的核苷酸位置被通常能够彼此碱基配对的核苷酸占据时,则认为所述核酸在该位置处彼此互补。因此,当核酸分子中的每个核酸分子中相当数量(至少50%)的对应位置被通常彼此碱基配对的核苷酸(例如,A:T和G:C核苷酸对)占据时,这两个核酸彼此互补。

基因的“编码区”包含所述基因的编码链的核苷酸残基和所述基因的非编码链的核苷酸,所述核苷酸残基和核苷酸分别与所述基因的转录产生的mRNA分子的编码区同源或互补。

mRNA分子的“编码区”还包括mRNA分子的核苷酸残基,所述核苷酸残基在翻译所述mRNA分子期间与转移RNA分子的反密码子区相匹配,或者编码终止密码子。因此,编码区可包含与由mRNA分子编码的成熟蛋白质中不存在的氨基酸残基(例如,蛋白质输出信号序列中的氨基酸残基)对应的核苷酸残基。

如本文所用,“简并序列”是指在多核苷酸中的核苷酸位置中的一个或多个核苷酸位置处存在两种或更多种类型的核苷酸的序列。在单个多核苷酸的环境中,“简并序列”可以是“随机的”或“未知的”序列。

“分离的细胞”是指已经从在组织或生物体中自然伴随分离的细胞的其他组分和/或细胞分离的细胞。

“分离的核酸”是指已经从在天然存在状态下位于其侧翼的序列分离的核酸(或其区段或片段),例如,已经从通常与RNA片段相邻的序列中取出的RNA片段。该术语也适用于已经从细胞中天然伴随核酸的其他成分(例如,RNA或DNA或蛋白质)中基本上纯化的核酸。

在本发明的上下文中,使用了以下常见核酸碱基的缩写。“A”是指腺苷,“C”是指胞苷,“G”是指鸟苷,“T”是指胞苷,“U”是指尿苷。

除非另有说明,否则“编码氨基酸序列的核苷酸序列”包括所有作为彼此的简并版本并且编码相同氨基酸序列的核苷酸序列。编码蛋白质和RNA的核苷酸序列可包含内含子。

“多核苷酸”是指核酸的单链或平行和反向平行链。因此,多核苷酸可以是单链或双链核酸。术语“核酸”通常指大的多核苷酸。术语“寡核苷酸”通常指短的多核苷酸,通常不大于约50个核苷酸。应当理解的是,当核苷酸序列由DNA序列(即,A、T、G、C)表示时,这也包括其中“U”取代“T”的RNA序列(即,A、U、G、C)。

“沃森/克里克碱基配对”和“沃森/克里克互补性”是指特异性核苷酸对及其类似物通过氢键结合在一起的模式,例如A与T或U配对,并且G与C配对。特异性碱基配对的动作是“杂交(hybridization/hybridizing)”。当两条或更多条互补的核酸链经历碱基配对时,就形成了杂交体。

本文使用常规符号来描述多核苷酸序列:单链多核苷酸序列的左手端是5′端;双链多核苷酸序列的左手方向被称为5′方向。

具有与mRNA相同的序列的DNA链被称为“编码链”;在所述DNA链上位于DNA上的参考点的5′的序列被称为“上游序列”;在所述DNA链上位于DNA上的参考点的3′的序列被称为“下游序列”

如本文所用,“透化剂”是使寡核苷酸或其他分子能够接近细胞的细胞内构成的化学物。

“可光切割部分”或“可光活化部分”是指在用光能照射该部分时被切割或活化的部分。可用于活化此类标签的光能包括但不限于可见光、紫外(UV)光、红外(IR)光等。当可光切割部分或可光活化部分与核酸附接、结合、整合或连接时,所述可光切割部分或可光活化部分被“结合”到所述核酸中。这包括将一部分偶联到核酸的末端,以及通过包含含有此类标记的核碱基将该部分掺入核酸中。

“引物”是指能够与多核苷酸模板特异性杂交并为互补多核苷酸的合成提供起始点的多核苷酸。当多核苷酸引物被置于诱导合成的条件下,即在核苷酸、互补多核苷酸模板和聚合剂(例如DNA聚合酶)的存在下时,这种合成发生。引物通常是单链的,但也可以是双链的。引物通常是脱氧核糖核酸,但是各种各样的合成和天然存在的引物也可用于许多应用。引物是与模板是互补的,所述引物被设计成与所述模板杂交以作为合成起始位点,但不需要反映所述模板的确切序列。在这种情况下,引物与模板的特异性杂交取决于杂交条件的严格性。引物可以用例如生色部分、放射性部分或荧光部分标记,并用作可检测部分。

“探针”是指能够与另一种多核苷酸的指定序列特异性杂交的多核苷酸。探针与靶互补多核苷酸特异性杂交,但不需要反映所述模板的确切互补序列。在这种情况下,探针与靶的特异性杂交取决于杂交条件的严格性。探针可以用例如生色部分、放射性部分或荧光部分标记,并用作可检测部分。

“基因组DNA”是具有的核苷酸序列与天然宿主中存在的基因同源的DNA链。举例来说,染色体或染色体片段是基因组DNA。另外,线粒体DNA是基因组DNA。

如本文所用的“同源”是指两个聚合分子之间,例如两个核酸分子(例如两个DNA分子或两个RNA分子)之间的亚基序列相似性。当两个分子中两者的亚基位置都被相同的单体亚基占据时,例如,如果两个DNA分子中的每一个DNA分子中的位置都被腺嘌呤占据,则所述两个DNA分子在该位置处完全或100%同源。两个序列之间的同源性百分比是匹配或同源位置的数量的直接函数,例如,如果两个化合物序列中的位置中的一半位置(例如,长度为十个亚基的聚合物中的五个位置)是同源的,则这两个序列是50%同一的,如果所述位置中的90%(例如,10个中的9个)是匹配或同源的,则这两个序列共享90%的同源性。举例来说,DNA序列5′ATTGCC3′和5′TATGGC3′共享50%的同源性。

范围:在整个本公开内容中,本发明的各个方面可以以范围格式呈现。应当理解的是,范围格式的描述仅仅是为了方便和简洁,并且不应当被解释为对本发明范围的不灵活限制。因此,范围的描述应该被认为已经具体公开了所有可能的子范围以及该范围内的单独数值。例如,例如从1到6的范围的描述应该被认为具有具体公开的子范围,例如从1到3、从1到4、从1到5、从2到4、从2到6、从3到6等,以及该范围内的单独数字,例如1、2、2.7、3、4、5、5.3和6。无论范围有多宽,这都适用。

当用于化学基团的情境中时,“氢”表示-H;“羟基”表示-OH;“氧代基”表示=O;“卤基”独立地表示-F、-Cl、-Br或-I;“氨基”表示-NH

在化学式的情境中,符号“-”表示单键,“=”表示双键,并且“≡”表示三键。符号

本申请中所示结构的原子上的任何未限定的化合价隐含地表示与该原子键合的氢原子。当基团“R”被描述为环系上的“浮动基团”时,例如,在下式中:

则R可以取代附接至环原子中的任何环原子的任何氢原子,包括所描绘的、暗示的或明确限定的氢,只要形成稳定的结构即可。当基团“R”被描述为稠环系上的“浮动基团”时,例如在下式中:

则除非另有说明,否则R可以取代附接至稠环中的任何一个稠环的环原子中的任何环原子的任何氢。可取代的氢包括所描绘的氢(例如,上式中附接至氮的氢)、隐含的氢(例如,上式的未示出但应理解为存在的氢)、明确限定的氢、和任选的氢,它们的存在取决于环原子的身份(例如,当X等于-CH-时,为附接至基团X的氢),只要形成稳定的结构即可。在描绘的示例中,R可以位于稠环系的5元环或6元环上。在上式中,紧跟在括号围住的基团“R”后面的下标字母“y”代表数字变量。除非另有说明,否则该变量可以是0、1、2、或任何大于2的整数,仅受环或环系中可取代的氢原子的最大数量的限制。

对于以下基团和类别,下面的括号下标进一步如下定义了基团/类别:“(Cn)”定义了基团/类别中碳原子的确切数目(n)。“(C≤n)”定义了可在基团/类别中的碳原子的最大数目(n),其中对于所讨论的基团,最小数目尽可能小,例如,应理解,基团“烯基

如本文所用的术语“饱和的”是指这样的化合物或基团,除非下面指出,否则所述化合物或基团被修饰为使得没有碳-碳双键和碳-碳三键。该术语不排除碳-杂原子多重键,例如碳氧双键或碳氮双键。此外,它不排除可能作为酮-烯醇互变异构或亚胺/烯胺互变异构的一部分出现的碳-碳双键。

术语“脂族的”在没有“取代的”修饰语的情况下使用时表示如此修饰的化合物/基团是无环的或环状的,但是为非芳族烃化合物或基团。在脂族化合物/基团中,碳原子可以在直链、支链或非芳族环(脂环)中连接在一起。脂族化合物/基团可以是饱和的,即通过单键(烷烃/烷基)连接,也可以是不饱和的,具有一个或多个双键(烯烃/烯基)或具有一个或多个三键(炔烃/炔基)。当术语“脂族”在没有“取代的”修饰语的情况下使用时,则仅存在碳和氢原子。当该术语与“取代的”修饰语一起使用时,一个或多个氢原子已经独立地被-OH、-F、-Cl、-Br、-I、-NH

术语“烷基”当在没有“取代的”修饰语的情况下使用时是指单价饱和脂族基团,所述单价饱和脂族基团具有碳原子作为附接点,是直链或支化的、环、环状或无环结构,并且没有除碳和氢之外的原子。因此,如本文所用,环烷基是烷基的子集。基团-CH

术语“烯基”当在没有“取代的”修饰语的情况下使用时是指单价不饱和脂族基团,所述单价不饱和脂族基团具有碳原子作为附接点,是直链或支化的、环、环状或无环结构,有至少一个非芳族碳-碳双键,没有碳-碳三键,并且没有除碳和氢之外的原子。烯基的非限制性示例包括:-CH=CH

术语“炔基”当在没有“取代的”修饰语的情况下使用时是指单价不饱和脂族基团,所述单价不饱和脂族基团具有碳原子作为附接点,是直链或支化的、环、环状或无环结构,有至少一个碳-碳三键,并且没有除碳和氢之外的其他原子。如本文所用,术语炔基不排除一个或多个非芳族碳-碳双键的存在。基团-C≡CH、-C≡CCH

术语“芳基”当在没有“取代的”修饰语的情况下使用时是指单价不饱和芳族基团,所述单价不饱和芳族基团具有芳族碳原子作为附接点,所述碳原子形成一个或多个六元芳族环结构的一部分,其中环原子都是碳,并且其中所述基团不由除碳和氢之外的其他原子组成。如果存在多于一个环,则这些环可以是稠合的或非稠合的。如本文所用,该术语不排除附接至第一芳环或存在的任何附加芳环的一个或多个烷基(碳数限制允许)的存在。芳基的非限制性示例包括苯基(Ph)、甲基苯基、(二甲基)苯基、-C

当这些术语语与“取代的”修饰语一起使用时,一个或多个氢原子已经独立地被-OH、-F、-Cl、-Br、-I、-NH

术语“芳烷基”当在没有“取代的”修饰语的情况下使用时是指单价基团-烷二基-芳基,其中术语烷二基和芳基各自以与上面提供的定义一致的方式使用。芳烷基的非限制性示例是:苯基甲基(苄基、Bn)和2-苯基-乙基。当该术语与“取代的”修饰语一起使用时,来自烷二基和/或芳基的一个或多个氢原子已经独立地被-OH、-F、-Cl、-Br、-I、-NH

术语“杂芳基”当在没有“取代的”修饰语的情况下使用时是指单价芳族基团,所述单价芳族基团具有芳族碳原子或氮原子作为附接点,所述碳原子或氮原子形成一个或多个芳族环结构的一部分,其中环原子中的至少一个环原子是氮、氧或硫,并且其中杂芳基基团不由除碳、氢、芳族氮、芳族氧和芳族硫之外的原子组成。如本文所用,该术语不排除附接至芳环或芳环系的一个或多个烷基、芳基和/或芳烷基(碳数限制允许)的存在。如果存在多于一个环,则这些环可以是稠合的或非稠合的。杂芳基的非限制性示例包括呋喃基、咪唑基、吲哚基、吲唑基(Im)、异噁唑基、甲基吡啶基、噁唑基、苯基吡啶基、吡啶基、吡咯基、嘧啶基、吡嗪基、喹啉基、喹唑啉基、喹喔啉基、三嗪基、四唑基、噻唑基、噻吩基和三唑基。术语“N-杂芳基”是指以氮原子作为附接点的杂芳基。术语“杂芳二基”当在没有“取代的”修饰语的情况下使用时是指二价芳族基团,所述二价芳族基团具有两个芳族碳原子、两个芳族氮原子或一个芳族碳原子和一个芳族氮原子作为两个附接点,所述原子形成一个或多个芳环结构的一部分,其中环原子中的至少一个环原子是氮、氧或硫,并且其中所述二价基团不由除碳、氢、芳族氮、芳族氧和芳族硫之外的原子组成。如本文所用,该术语不排除附接至芳环或芳环系的一个或多个烷基、芳基和/或芳烷基(碳数限制允许)的存在。如果存在多于一个环,则这些环可以是稠合的或非稠合的。杂芳二基的非限制性示例包括:

当这些术语语与“取代的”修饰语一起使用时,一个或多个氢原子已经独立地被-OH、-F、-Cl、-Br、-I、-NH

术语“杂环烷基”当在没有“取代的”修饰语的情况下使用时是指单价非芳族基团,所述单价非芳族基团具有碳原子或氮原子作为附接点,所述碳原子或氮原子形成一个或多个非芳族环结构的一部分,其中环原子中的至少一个环原子是氮、氧或硫,并且其中杂环烷基基团不由除碳、氢、氮、氧和硫之外的原子组成。如本文所用,该术语不排除附接至环或环系的一个或多个烷基(碳数限制允许)的存在。如本文所用,该术语不排除在环或环系中存在一个或多个双键,前提条件是所得基团保持非芳族。如果存在多于一个环,则这些环可以是稠合的或非稠合的。杂环烷基的非限制性示例包括吖丙啶基、吖丁啶基、吡咯烷基、哌啶基、哌嗪基、吗啉基、硫代吗啉基、四氢呋喃基、四氢硫代呋喃基、四氢吡喃基、吡喃基、环氧乙烷基和氧杂环丁烷基。术语“N-杂环烷基”是指以氮原子作为附接点的杂环烷基。当术语“杂环烷基”与“取代的”修饰语一起使用时,一个或多个氢原子已经独立地被-OH、-F、-Cl、-Br、-I、-NH

术语“酰基”当在没有“取代的”修饰语的情况下使用时是指基团-C(O)R,其中R是氢、烷基、芳基、芳烷基或杂芳基,如上面定义的那些术语。基团-CHO、-C(O)CH

术语“烷氧基”当在没有“取代的”修饰语的情况下使用时是指基团-OR,其中R是烷基,如在上面定义的该术语。烷氧基的非限制性示例包括:-OCH

术语“烷基氨基”当在没有“取代的”修饰语的情况下使用时是指基团-NHR,其中R是烷基,如在上面定义的该术语。烷基氨基的非限制性示例包括:-NHCH

术语“烷基磷酸根”当在没有“取代的”修饰语的情况下使用时是指基团-OP(O)(OH)(OR),其中R是烷基,如在上面定义的该术语。烷基磷酸根基团的非限制性示例包括:-OP(O)(OH)(OMe)和-OP(O)(OH)(OEt)。术语“二烷基磷酸根”当在没有“取代的”修饰语的情况下使用时是指基团-OP(O)(OR)(OR′),其中R和R′可以是相同或不同的烷基,或者R和R′可以一起代表烷二基。二烷基磷酸根基团的非限制性示例包括:-OP(O)(OMe)

术语“烷基磺酰基”和“烷基亚磺酰基”当在没有“取代的”修饰语的情况下使用时分别是指基团-S(O)

如本文所用,“手性助剂”是指能够影响反应的立体选择性的可去除的手性基团。本领域技术人员熟悉这种化合物,并且许多是商购可得的。

第一化合物的“异构体”是单独的化合物,其中每个分子含有与第一化合物相同的组成原子,但这些原子的三维构型不同。

术语“水合物”当用作化合物的修饰词时是指该化合物具有少于一个(例如,半水合物)、一个(例如,一水合物)或多于一个(例如,二水合物)水分子与每个化合物分子相缔合,例如以该化合物的固体形式。

“立体异构体”或“旋光异构体”是给定化合物的异构体,其中相同的原子与相同的其他原子键合,但这些原子的三维构型不同。“对映异构体”是给定化合物的立体异构体,所述立体异构体是彼此的镜像,如左手和右手。“非对映异构体”是给定化合物的立体异构体,所述立体异构体不是对映异构体。手性分子含有手性中心,也称为立体中心或立体异构中心,所述手性中心是带有基团的分子中的任何点,尽管不一定是原子,使得任何两个基团的互换都会产生立体异构体。在有机化合物中,手性中心通常是碳、磷或硫原子,尽管在有机和无机化合物中其他原子也可能是立体中心。分子可以有多个立体中心,从而使其有多种立体异构体。在立体异构是由于四面体立体中心(例如,四面体碳)导致的化合物中,假设可能的立体异构体的总数将不超过2n,其中n是四面体立体中心的数量。具有对称性的分子往往具有少于最大可能数量的立体异构体。对映异构体的50:50混合物被称为外消旋混合物。或者,可以对对映异构体混合物进行对映异构体富集,使得一种对映异构体以大于50%的量存在。通常,对映异构体和/或非对映异构体可以使用本领域中已知的技术来拆分或分离。设想对于尚未限定立体化学的任何立体中心或手性轴,该立体中心或手性轴可以以其R形式、S形式或作为R和S形式的混合物存在,包括外消旋和非外消旋混合物。如本文所用,短语“基本上不含其他立体异构体”是指该组合物含有≤15%,更优选≤10%,甚至更优选≤5%,或最优选≤1%的另外的立体异构体。

II.用于检测开放基因组DNA的组合物和方法(CHeX-seq)

染色质的可及性是细胞对其局部微环境和刺激做出转录反应的能力的基础。这对于正常的细胞功能以及功能的调控变化是重要的。了解这些转录调节的亚细胞位点是理解细胞对刺激做出反应的能力以及实际反应所必需的。

对单细胞的转录分析表明,细胞与细胞的异质性的显著程度受到细胞的微环境的影响。转录状态的这些变化部分取决于细胞核基因组DNA的开放染色质状态或线粒体基因组DNA的开放构象。虽然有用于分析染色质结构的单细胞方法,但它们需要从细胞中分离出染色质,此时最近的邻近染色体相互作用丢失。例如,ATACseq已被用于评定多个单细胞中的开放染色质(单细胞水平的群体研究,而不仅仅是单细胞),但它不是非常灵敏并且仅评定任何特定细胞中的约3%的开放染色质位点。此外,ATACseq要求从目的细胞中分离出染色质。

为了克服ATACseq和其他染色体构象捕获方法的这些问题,本文提供了反映细胞功能状态的高分辨率单细胞染色质分析方法。这些方法称为CHeX-seq(染色质暴露),不需要从细胞中分离出基因组DNA,并且可用于鉴定单个固定细胞中的开放基因组DNA区域。

高分辨率CHeX-seq使用光的分辨率将染色质分析限制在单独细胞的细胞核内。为了实现此,CHeX-seq寡核苷酸已经被工程化为包含索引条形码、扩增区段、和光活化的报告子标记的可逆终止核苷酸(图1)。这些寡核苷酸可以通过它们的杂交区段,以随机或靶向方式与单链基因组DNA退火,但在被触发之前保持无活性。通过激光在选定细胞中原位活化光活化的报告子标记的可逆终止核苷酸允许CHeX-seq寡核苷酸用作引物。该引物用于在这些特定细胞中原位引发单链DNA的DNA复制,所述DNA随后进行扩增和测序。

为了提供用于随机退火,寡核苷酸包含短简并序列,所述短简并序列可以在它们可与基因组DNA杂交的任何地方退火。这在简并混合物中提供了更多能够结合的寡核苷酸,从而在退火时间(例如,45秒)的过程中有效地增加了寡核苷酸浓度。在一些实施方式中,退火时间可以是约10秒、约15秒、约20秒、约25秒、约30秒、约35秒、约40秒、约45秒、约50秒、约55秒、约60秒、约65秒、约70秒、约75秒、约80秒、约85秒、约90秒、约2分钟、约3分钟、约4分钟、约5分钟、约6分钟、约7分钟、约8分钟、约9分钟、约10分钟、约15分钟、约20分钟、约25分钟、或约30分钟。退火的进程可以使用荧光显微镜来监测,以检测细胞核中荧光标记的荧光信号。

寡核苷酸中的简并序列与基因组DNA之间的杂交可能不严格。例如,寡核苷酸中的简并序列与同其杂交的基因组DNA区域之间可能存在一个或多个、两个或更多个、三个或更多个、四个或更多个、五个或更多个、六个或更多个、七个或更多个、八个或更多个、九个或更多个、或十个或更多个错配。在仍允许与任何给定的基因组DNA序列杂交的同时可容忍的错配数量取决于简并序列的长度、由简并序列的序列所指示的杂交热力学、以及退火温度。杂交事件的热力学可以使用SantaLucia和Hicks(2004)中描述的方法来估计。错配可以是一个或多个连续段,或者错配可以以任何构型在整个杂交区域中间隔开。例如,杂交区域可包括一行中具有两个、三个、四个、五个、六个、七个或八个错配的段,这些错配在杂交区域中产生泡。杂交区域可包括第一部分中的泡和第二部分中的单个错配两者。杂交区域可包括第一部分中的第一泡和第二部分中的第二泡两者。

简并序列的长度可以变化。例如,在任何给定的CHeX-seq寡核苷酸中的产生序列可以为至少7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个、21个、22个、23个、24个、25个、26个、27个、28个、29个、30个、31个、32个、33个、34个、35个、36个、37个、38个、39个、40个、41个、42个、43个、44个、45个、46个、47个、48个、49个、或50个核苷酸长。CHeX-seq寡核苷酸群体可以由均具有相同长度的简并序列的寡核苷酸组成。或者,CHeX-seq寡核苷酸群体可以包含具有不同长度的简并序列的寡核苷酸。

除了提供用于与基因组DNA杂交之外,简并序列将在随后扩增的多核苷酸池中保留,使用测序(例如下一代测序)对所述随后扩增的多核苷酸池进行分析。因此,与每个检测到的杂交事件相关联的简并序列可以用作分子条形码或唯一分子标识符(UMI),以允许分析是否基因的仅一个基因座处于开放染色质状态,或者是否该基因的两个基因座都处于开放染色质状态。

为了提供用于靶向退火,寡核苷酸包含短的已知序列来代替短的简并序列。短的已知序列可以设计成与基因组DNA中任何需要分析染色质是开放还是封闭状态的位置退火。例如,一组寡核苷酸可被设计成包含针对一个或多个特定基因限定的短的已知序列。例如,一组寡核苷酸可被设计成包含短的已知序列,所述短的已知序列可以与所有已知SNP附近的基因组区域或与同精神分裂症相关的开放基因组DNA区域杂交。这种寡核苷酸组可用于诊断方法中。在设计一组靶向寡核苷酸时,可能期望选择具有一定G/C含量和长度的短的已知序列,使得每个寡核苷酸将在相似的退火温度下杂交。

CHeX-seq寡核苷酸可以在其3′端具有报告子标记的可逆终止核苷酸。图3A、图3B和图4示出了酶促合成包含报告子标记的可逆终止核苷酸的寡核苷酸的方法的两个示例性实施方式。这些方法包括将寡核苷酸与其反向互补序列退火,其中所述反向互补序列在其5′端上包含聚A尾。一旦退火,就将双链体与荧光标记的可光活化的终止脱氧尿苷类似物一起孵育,所述荧光标记的可光活化的终止脱氧尿苷类似物通过DNA聚合酶结合到寡核苷酸中。然后可以将合成的寡核苷酸从其反向互补序列变性,并进行纯化。该方法可以用完整的寡核苷酸及其完整的反向互补序列来执行(图3A)。或者,该方法可以用包含简并序列的区段执行,之后用包含扩增区段、间隔区和条形码的区段连接双链简并序列(图3B)。该方法允许产生许多不同的群体,每个群体包含唯一条形码,而不必为每个群体合成双链简并序列。为此,只需要为每个群体产生包含扩增区段、间隔区和条形码的区段,然后可将每个唯一条形码连接至双链简并序列,从而产生每个唯一条形码化的简并群体。另一种替代方法使用具有6个碳接头的反向互补序列来代替简并序列(图4)。在这种方法中,寡核苷酸在其3′端中有TG夹,以促进与反向互补链的杂交,从而允许加入可光活化的终止核苷酸。

在一些实施方式中,报告子标记的可逆终止核苷酸化合物包含具有用报告基团标记的可光切割基团的核苷酸,所述报告基团为例如荧光染料基团、比色染料基团、放射性标记、或通过化学发光或生物发光手段影响信号的基团。如本文所用,术语“报告子”或“标记”是指能够直接或间接产生可检测信号的化学部分。终止核苷酸包含可移除的保护基团,所述可移除的保护基团被设计用于终止DNA合成。这种核苷酸化合物的示例包括在PCT公开案号WO 2003/006625、WO 2005/084367、WO 2008/070749、WO 2009/152353、WO 2013/040257中公开的那些,这些PCT公开案各自全文以引用方式并入本文。这种核苷酸化合物的具体示例包括图5所示的那些。间接可检测的报告子的示例包括小标签,例如生物素、半抗原(例如洋地黄毒苷)或磁性粒子,所述间接可检测的报告子可以通过以下方式检测:结合另一种蛋白质或抗体,使得报告子可以在显微镜下检测和可视化。直接可检测的报告子的示例包括荧光染料基团。荧光染料基团的示例包括呫吨衍生物染料(例如,荧光素及其衍生物、异硫氰酸荧光素[FITC]、羧基荧光素琥珀酰亚胺酯[CFSE]、羧基荧光素二乙酸琥珀酰亚胺酯[CFDA-SE]、伊红Y、伊红B、罗丹明B、罗丹明6G、罗丹明123、罗丹明红-X[RRX]、羧基四甲基罗丹明[TAMRA]、四甲基罗丹明[TMR]、罗丹明的异硫氰酸酯衍生物[TRITC]、磺酰罗丹明101、磺酰罗丹明101的磺酰氯衍生物[德克萨斯红]、俄勒冈绿)、BODIPY衍生物染料(例如,BODIPY FL、BODIPY R6G、BODIPY TMR、BODIPY 581/591、BODIPY TR、BODIPY 630/650、BODIPY 650/665)、香豆素衍生物染料(例如,氨基甲基香豆素[AMCA])、别藻蓝蛋白[APC]、芘衍生物染料(例如,级联蓝)、4′,6-二脒基-2-苯基吲哚[DAPI]、DyLight染料(例如,DyLight

执行CHeX-seq中的第一过程是获得和固定待测得的样本,该样本可以是细胞系、原代细胞培养物或组织切片。样本可以包含任何类型的细胞,例如真核细胞或原核细胞。当细胞是真核细胞时,细胞优选为哺乳动物细胞,包括但不限于人类、非人灵长类动物、小鼠、兔、大鼠、山羊、豚鼠、马细胞等。非哺乳动物真核细胞包括酵母细胞、植物细胞、昆虫细胞、原生动物细胞和真菌细胞,包括丝状和非丝状真菌。当细胞是原核细胞时,细胞是细菌细胞。细胞可以是分化细胞和/或非分裂细胞。细胞也可以是祖细胞或干细胞。优选地,细胞是组织特异性细胞,更优选地哺乳动物组织特异性细胞,并且还更优选地人组织特异性细胞。适合作为受体细胞的细胞的非限制性示例包括上皮细胞、神经元、成纤维细胞、胚胎成纤维细胞、角化细胞、成体干细胞、胚胎干细胞和心肌细胞。本文提供的方法可以在包含细胞突起的细胞上执行。这种细胞突起包括但不限于树突、轴突、微绒毛、纤毛、静纤毛、突起、星形细胞突起等。来自受试者的任何组织样本可用于本发明的方法中。可以使用的组织的示例包括但不限于乳房、前列腺、卵巢、结肠、肺、子宫内膜、胃、唾液腺和胰腺。组织样本可通过各种程序获得,所述各种程序包括但不限于外科切除、抽吸或活组织检查。组织可以包埋在石蜡中或冷冻。可以对组织样本进行染色以区分样本内的细胞类型,例如区分脑样本中的神经元和神经胶质。

在一些实施方式中,可将样本暴露于透化剂,以允许寡核苷酸进入细胞。示例性透化剂包括但不限于Triton X-100、Tween-20、皂苷、SDS、NP40、链球菌溶血素O、蛋白酶K、链霉蛋白酶和三乙醇胺,以及有机溶剂,例如甲醇和丙酮。

执行CHeX-seq中的一项技术考虑是让CHeX-seq寡核苷酸进入细胞核,并使它们与基因组DNA杂交。细胞核DNA的可及性部分地是由固定条件决定的。例如,使用低百分比的固定剂(例如,0.25%、0.5%、0.75%、1%、2%、3%、4%、5%、6%、7%、或8%)30秒、45秒、1分钟、1.5分钟、2分钟、2.5分钟、3分钟、3.5分钟、4分钟、4.5分钟、5分钟、5.5分钟、6分钟、6.5分钟、7分钟、7.5分钟、8分钟、8.5分钟、9分钟、9.5分钟或10分钟可以为表达的RNA中的约80%提供开放基因组DNA的检测,这比针对ATACseq覆盖率报道的好约8倍。固定剂可以是福尔马林、戊二醛、二甲苯、沉淀固定剂(例如甲醇或乙醇)、或化学和光可逆交联剂。

一旦细胞核内存在CHeX-seq寡核苷酸,就给予寡核苷酸时间以与开放基因组DNA的区域退火。在一些实施方式中,退火时间可以是约10秒、约15秒、约20秒、约25秒、约30秒、约35秒、约40秒、约45秒、约50秒、约55秒、约60秒、约65秒、约70秒、约75秒、约80秒、约85秒或约90秒。在一些实施方式中,退火温度可以是约25℃、26℃、27℃、28℃、29℃、30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃、40℃、41℃、42℃、43℃、44℃、或45℃。退火的进程可以使用荧光显微镜来监测,以检测细胞核中荧光标记的荧光信号。

然后使用它们的报告子标签对杂交的寡核苷酸成像。在一些实施方式中,报告子标记的可逆终止寡核苷酸由于存在可被光切割的位点而可逆地终止,从而产生可延伸的3'羟基。在一些实施方式中,可光切割部分可包括2-硝基苄基或取代的2-硝基苄基,所述可光切割部分可以例如用紫外光有效地光化学切割。参见美国专利申请公开案2010/0041041,该美国专利申请公开案的全文以引用方式并入本文。通常理解的是,使用>300nm的波长来最小化对DNA和蛋白质的损伤(Corrie,2005),其中除365nm之外的几个特定示例性波长是340nm和355nm(Seo,2005)。因此,如本文所用的术语“光切割(photocleaving/photocleave)”通常是指将样本暴露于波长>300nm(例如,365nm、370nm、375nm、380nm、385nm、390nm、395nm、400nm、405nm、410nm、或415nm)的光,以实现光可切割键的切割的动作。

在一些方面中,可光活化的终止核苷酸具有下式的结构:

其中:

R

R

R

R

氢、羟基、卤基、氨基、硝基、氰基、叠氮基或巯基;

烷基

R

氢、羟基、卤基、氨基、硝基、氰基、叠氮基或巯基;

烷基

一组下式:

其中

X是

-O-、-S-、或-NH-;或者

烷二基

Y是-O-、-NH-、烷二基

n是0-6的整数;并且

m是0-6的整数;或者

-接头-报告子;

或其盐、互变异构体或旋光异构体。

在一些实施方式中,可光活化的终止核苷酸进一步定义为式I、II、III、IV、V、VI或VII的化合物。在一些实施方式中,R

其中

X是

-O-、-S-、或-NH-;或者

烷二基

n是0-6之的整数。

在一些实施方式中,X是炔二基

其中

X是

-O-、-S-、或-NH-;或者

烷二基

Y是-O-、-NH-、烷二基

n是0-6的整数;并且

m是0-6的整数。

在一些实施方式中,X是炔二基

其中

X是

-O-、-S-、或-NH-;或者

烷二基

n是0-6之的整数。

在一些实施方式中,X是炔二基

其中

X是

-O-、-S-、或-NH-;或者

烷二基

Y是-O-、-NH-、烷二基

n是0-6的整数;并且

m是0-6的整数。

在一些实施方式中,X是炔二基

在一些实施方式中,R

在一些实施方式中,可光活化的终止核苷酸进一步定义为:

或者这些式中的任何式的盐和/或质子化形式。

在一些实施方式中,可光活化的终止核苷酸进一步定义为:

其中R是=O或=S,或这些式中的任何式的盐和/或质子化形式。

在一些实施方式中,可光活化的终止核苷酸进一步定义为:

其中R是=O或=S,或这些式中的任何式的盐和/或质子化形式。

在一些实施方式中,可光活化的终止核苷酸进一步定义为:

或者这些式中的任何式的盐和/或质子化形式。

在一些实施方式中,在成像后,用例如405nm的激光对特定区域或整个细胞核中的报告子标记的可光活化的终止寡核苷酸进行光活化。光活化(其为去除核苷酸化合物上的终止部分)的分辨率由活化光波长的衍射极限和透镜的数值孔径确定。例如,当使用多光子活化时,待光活化的区域可以是10nm的球体(参见图6)。与多光子活化的空间局限相反,单光子活化导致穿过照射的整个z轴的有效光子分布,因此可以仔细控制激光照射的功率和持续时间,以最小化所需活化区域外部的CHeX-seq寡核苷酸的非希望的活化。此外,固定细胞中的超高分辨率活化可以使用来自近场光纤光学的渐逝波来实现,从而提供10-50nm分辨率。

为了得到单细胞的完整染色质补体,激光光活化必须发生在整个细胞核的容积内,这可以通过将光活化激光移动到细胞核内的不同位置来实现。如果CHeX-seq寡核苷酸的活化发生在细胞核之外,应该基本上没有影响,因为CHeX-seq聚合酶是DNA聚合酶,如果DNA是模板,则它只会进行DNA复制。因此,在细胞核或细胞质中与RNA退火的CHeX-seq寡核苷酸将不会延伸以产生互补的DNA。

在一些实施方式中,报告子标记的可逆终止寡核苷酸由于存在可酶切的位点而可逆地终止,从而导致了不可延伸的3′端的去除和可延伸的3′羟基的创建。不可延伸的3'端可以是3'端磷酸根、2',3'-环状磷酸根、2'-邻甲基、碱基修饰、或骨架糖或磷酸根修饰。可切割位点可朝向寡核苷酸的3′端定位。可酶切的位点可以是已知为核酸内切酶的靶标的特定序列。与核酸内切酶一起孵育可导致退火的寡核苷酸在该位点被切割。该位点可以是特定核苷酸,例如可切割的碱基。如本文所用的“可切割碱基”是指通常在DNA序列中不存在的核苷酸。对于大多数DNA样本来说,脱氧尿苷是可切割碱基的示例。虽然脱氧尿苷的三磷酸酯形式dUTP作为代谢中间体存在于活生物体中,但它很少结合到DNA中。当脱氧尿苷被结合到DNA中时,所得脱氧尿苷通过正常过程在体内被迅速去除,所述正常过程为例如涉及尿嘧啶-DNA糖基化酶(UDG)的过程(美国专利号4,873,192;Duncan,1981;两个参考文献全文以引用方式并入本文)。因此,脱氧尿苷很少或从未出现在天然DNA中。其他可切割碱基的非限制性示例包括脱氧肌苷、溴脱氧尿苷、7-甲基鸟嘌呤、5,6-二氢-5,6二羟基脱氧胸苷、3-甲基脱氧腺苷等(参见Duncan,1981)。

术语“DNA糖基化酶”是指任何具有糖基化酶活性的酶,所述酶导致核苷酸的经修饰的含氮杂环组分被从多核苷酸分子中切除,从而产生无碱基位点。DNA N-糖基化酶包括下列酶及其在高等真核生物中的同源物,包括人类同源物:尿嘧啶-DNA糖基化酶(UDG)、3-甲基腺嘌呤DNA糖基化酶II(例如,AlkA)、TagI糖基化酶、和MUG糖基化酶。尿嘧啶-DNA糖基化酶识别单链或双链DNA中存在的尿嘧啶,并切割尿嘧啶碱基与DNA糖磷酸酯骨架的脱氧核糖之间的N-糖苷键,从而留下无碱基位点。参见例如美国专利号6,713,294。尿嘧啶的丢失在DNA中产生了无嘧啶位点。然而,这种酶不能切割DNA分子的磷酸二酯骨架。尿嘧啶-DNA糖基化酶,缩写为“UDG”或“UNG”,包括线粒体UNG1、细胞核UNG2、SMUG1(单链选择性尿嘧啶-DNA糖基化酶)、TDG(TU错配DNA糖基化酶)、MBD4(具有甲基结合结构域的尿嘧啶-DNA糖基化酶),以及其他真核和原核酶。具有这种活性的酶不作用于游离dUTP、游离脱氧尿苷、或RNA。用于产生一个或多个无碱基位点的UDG酶的另一个示例是来自闪烁古生球菌(Archaeoglobus fulgidus)的大肠杆菌(E.coli)的热稳定同源物。Afu UDG催化从含尿嘧啶的DNA中释放游离尿嘧啶。Afu UDG从单链或双链DNA中高效水解尿嘧啶。另一个示例包括南极不耐热UDG,它催化从含尿嘧啶的单链或双链DNA中释放游离尿嘧啶。南极不耐热UDG酶对热敏感,并且可在高于50℃的温度下迅速且完全失活。

附加可切割碱基及其相应的切口剂的非限制性示例如下:AlkA糖基化酶识别并切割脱氧肌苷残基;DNA-7-甲基鸟嘌呤糖基化酶识别并切割7-甲基鸟嘌呤残基;次黄嘌呤-NDA糖基化酶识别并切割次黄嘌呤残基;3-甲基腺嘌呤-DNA糖基化酶I(例如,TagI)和3-甲基腺嘌呤-DNA糖基化酶II(例如,AlkA)识别并切割3-甲基腺嘌呤残基;Fpg识别并切割8-氧代-鸟嘌呤残基;并且Mug识别并切割来自DNA的3,N(4)-乙烯基胞嘧啶和尿嘧啶残基。

如本文所用,术语“无碱基DNA”或“具有无碱基位点的DNA”是指单链或双链的DNA分子,所述单链或双链的DNA分子包含至少一个无碱基核苷酸,有时称为“无碱基位点”。“无碱基核苷酸”是指在脱氧核糖的1′位中缺少碱基的核苷酸。如本文所用,术语“AP核酸内切酶”或“AP裂解酶”是指能够断裂核酸的无碱基位点处的磷酸二酯骨架的酶。该术语包括能够断裂无碱基位点的5′和3′骨架的酶。

然后,可以切割在例如糖苷键的UDG切割之后保留的DNA糖-磷酸酯骨架,例如通过碱水解、高温、在碱性残基之间含有芳族残基的三肽(例如Lys-Trp-Lys和Lys-Tyr-Lys),以及AP核酸内切酶(例如核酸内切酶IV、核酸内切酶V、核酸内切酶III、核酸内切酶VI、核酸内切酶VII、人核酸内切酶II)等进行切割。因此,酶,例如APE I,可以与UDG结合使用,以从核酸分子中去除dU残基,然后在核酸分子上产生切口。用于在无碱基位点产生切口的酶的示例包括无嘌呤/无嘧啶(AP)核酸内切酶,例如APE 1(也称为HAP 1或Ref-1),所述酶与大肠杆菌核酸外切酶III蛋白共享同源性。APE 1通过水解机制切割紧接在AP位点的5′的磷酸二酯骨架,以产生单链DNA断裂,从而留下3′-羟基和5′-脱氧核糖磷酸根末端。

人工切口产生剂可以通过以下方式产生:组合DNA N-糖基化酶和AP核酸内切酶,例如通过将UDG糖基化酶与APE I核酸内切酶组合或将AlkA糖基化酶与EndoIV核酸内切酶组合,以实现可切割核苷酸处的单链切割。本文所述的能够切除经修饰的核苷酸的切口产生剂的示例包括:(i)用于切除脱氧尿苷—UDG糖基化酶与EndoIV核酸内切酶的混合物;UDG糖基化酶与FPG糖基化酶/AP裂解酶的混合物;UDG糖基化酶与EndoVIII糖基化酶/AP裂解酶的混合物;含有UDG糖基化酶、EndoIV核酸内切酶、和EndoVIII糖基化酶/AP裂解酶的混合物;(ii)用于切除8-氧代-鸟嘌呤和脱氧尿苷—含有UDG糖基化酶、FPG糖基化酶/AP裂解酶、和EndoIV核酸内切酶的混合物;UDG糖基化酶与FPG糖基化酶/AP裂解酶的混合物;和(iii)用于切除脱氧肌苷—AlkA糖基化酶与EndoVIII糖基化酶/AP裂解酶的混合物、或AlkA糖基化酶与FPG糖基化酶/AP裂解酶的混合物。

来自大肠杆菌的核酸内切酶VIII作为N-糖基化酶和AP裂解酶两者。N-糖基化酶活性从双链DNA中释放降解的嘧啶,从而产生无碱基位点。AP裂解酶活性将3'切割成无碱基位点,留下5'磷酸根和3'磷酸根。由核酸内切酶VIII识别并去除的降解的碱基包括尿素、5,6-二羟基胸腺嘧啶、胸腺嘧啶二醇、5-羟基-5-甲基乙内酰脲、尿嘧啶二醇、6-羟基-5,6-二氢胸腺嘧啶、和甲基丙醇二酰脲。虽然核酸内切酶VIII与核酸内切酶III相似,但是核酸内切酶VIII具有β和δ裂解酶活性,而核酸内切酶III具有β裂解酶活性。

Fpg(甲酰胺基嘧啶[fapy]-DNA糖基化酶)(也称为8-氧代鸟嘌呤DNA糖基化酶)作为N-糖基化酶和AP裂解酶两者。N-糖基化酶活性从双链DNA中释放降解的嘌呤,从而产生无嘌呤位点。AP裂解酶活性将3′和5′均切割成无嘌呤位点,从而去除无嘌呤位点并留下一个碱基空位。由Fpg识别和去除的降解的碱基中的一些降解的碱基包括7,8-二氢-8-氧代鸟嘌呤(8-氧代鸟嘌呤)、8-氧代腺嘌呤、fapy-鸟嘌呤、甲基-fapy-鸟嘌呤、fapy-腺嘌呤、黄曲霉毒素Bl-fapy-鸟嘌呤、5-羟基-胞嘧啶、和5-羟基-尿嘧啶。

还考虑了被称为USER

在光活化后,寡核苷酸的3′末端可以原位延伸,从而允许随后使用基因组DNA作为模板进行DNA聚合酶介导的互补DNA合成(图2)。为此,DNA聚合酶I可以使用每个退火的寡核苷酸的末端3′羟基从开放基因组DNA原位合成互补的DNA。在DNA合成后,将互补的DNA从基因组DNA去杂交(例如,通过加热样本),去除,复制成双链DNA,并扩增。扩增可包括PCR扩增、滚环扩增、或RNA扩增。在PCR扩增的情况下,CHeX-seq寡核苷酸可以在其扩增区段中包含第一引物结合位点,并且可以通过连接单链引物序列将第二引物结合位点添加到延伸的cDNA的3′端。在RNA扩增的情况下,CHeX-seq寡核苷酸可以包含例如Sp6、T3或T7启动子序列,并且分别使用Sp6、T3或T7 RNA聚合酶执行扩增。

然后可以将扩增的多核苷酸制成cDNA文库,所述cDNA文库可例如使用下一代测序进行测序。也有可能通过合成可反复扩散到固定细胞中的多重条形码化的寡核苷酸来对CHeX-seq寡核苷酸进行多重化。这将允许该测定适用于高通量分析。

III.用于检测细胞质RNA的组合物和方法(LT-TISA)

单独细胞的分子谱已经使用各种技术描述了细胞内和细胞间的内源性转录组可变性,所述各种技术包括靶向扩增(Cornelison和Wold,1997;Tay等人,2010;Miyashiro等人,1994)、荧光原位杂交(FISH)和全转录组测定。除了表达水平的可变性,来自单细胞的RNA测序还揭示了不同细胞在转录物形式方面的异质性,例如剪接产物和5′序列(Dueck等人,2015)。这种可变性表明,当使用细胞池测量时,即使细胞表型是同质的,控制单独细胞的命运的调节控制过程也可能是模糊的。这种单独细胞可变性可能是组织水平系统功能所必需的(例如,创建和维持神经元多样性)(Dueck等人,2016)。

在过去的七年里,研究人员已经工作以创建多功能工具包来对居住在自然微环境中的单个活细胞进行基因组学分析,这使得能够针对活组织可用的研究对活细胞进行RNA分析。然而,对于许多人类研究,活组织是不可用的,因此必须开发和优化用于固定细胞中的转录组的分析的方法。存在用于从使用原位转录方法学(Tecott等人,1988;Crino等人,1996年;Miayshiro等人,2003)以及更近的Mer-FISH(Mofitt和Zang,2016)、Seq-FISH(Shah等人,2017)和FISSEQ(Lee等人,2015)开始这样做的方案。简而言之,Mer-FISH允许寡核苷酸FISH探针的迭代杂交,所述探针允许将转录物定位到许多待鉴定的细胞。Seq-FISH与Mer-FISH相似,区别在于使用了迭代HCR(Choi等人,2016;Choi等人,2010)杂交探针方案,所述方案提供了强得多的信号。已发表的Mer-FISH方案允许鉴定细胞中的数百个RNA,而Seq-FISH已用于鉴定约100个RNA。作为基于杂交的检测方案,它们不能容易地报告剪接变体,或者不能容易随着每次退火时背景的增加而量化。FISSEQ是一种直接对固定组织切片中的RNA进行测序的方法,其中RNA已经被原位复制成cDNA(使用原位转录技术(Crino等人,1996))并使用滚环扩增进行线性扩增。由于滚环扩增问题,该方案限于约400个RNA。然而,FISSEQ中的第一无偏倚的过程是原位转录,所述原位转录需要寡核苷酸与RNA杂交来启动cDNA合成,所述cDNA然后可以从固定细胞中取出,扩增和测序。本文提供了修饰、优化和利用原位转录来评定固定细胞的RNA补体的方法。这可以在同一细胞中与CHeX-seq同时执行。

虽然TISA可以用任何具有游离3′-OH的寡核苷酸执行以实现特定的细胞或亚细胞活化,但优选的是仅在需要cDNA合成的亚细胞位点处活化寡核苷酸。这可以通过使用报告子标记的可逆终止核苷酸来实现,如上文在CHeX-seq寡核苷酸的情境中所讨论的。在这种称为LT-TISA的TISA版本中,可以合成寡核苷酸,所述寡核苷酸将与RNA的聚A尾结合。这样,寡核苷酸可以具有在5′端上的扩增区段(例如引物结合位点或RNA聚合酶启动子)、特异性条形码、以及在3′端上的具有可光活化的3′终止核苷酸的聚dT段(LT-TISA寡核苷酸)。在这种情况下,将寡核苷酸作为原位杂交寡核苷酸添加到固定细胞中,并与细胞中单链RNA的3′聚A尾退火(Tecott等人,1988;Crino等人,1996;Lee等人,2015;Miyashiro和Eberwine,2015)。或者,LT-TISA寡核苷酸可包含靶特异性杂交区段来代替聚dT段。因此,可以产生一组LT-TISA寡核苷酸,该一组LT-TISA寡核苷酸与任何期望的一批靶RNA特异性杂交。对于细胞质RNA表征,将LT-TISA寡核苷酸在固定细胞的细胞质中激光活化(从而消除基因组DNA污染),并加入逆转录酶,从而使活化的LT-TISA寡核苷酸使用退火的RNA为模板引发cDNA。

在一些实施方式中,TISA的这种迭代将被多重化,使得可以通过合成具有不同条形码(BC)的LT-TISA简并序列寡核苷酸来单独分析多个细胞(也用于对细胞进行多重化,参见下文)。例如,将具有BC1的LT-TISA寡核苷酸与固定细胞退火,并在单细胞(或细胞类型,例如抑制性神经元)的细胞质中活化,将未活化的LT-TISA寡核苷酸通过光学洗涤从其他细胞中去除(参见光学洗涤的讨论)。接下来,带有BC2的第二LT-TISA寡核苷酸与细胞退火,并且仅在第二细胞的细胞质中被活化。一旦已经对所需数量的细胞进行了迭代,就添加逆转录酶,并通过延伸3′羟基和使用退火的RNA作为模板来合成cDNA。在cDNA合成后,所有的cDNA都可以通过碱变性去除,同时扩增,并制成测序文库。每个细胞的转录组都是通过与特定亚细胞区域相关的读段上的BC的存在来唯一地鉴定的。

LT-TISA方法可以通过测试细胞固定条件(固定剂的类型、固定时间等)、光活化参数(最佳波长确定、能量需求)和分子生物学过程来优化以同时检测来自不同亚细胞区域的RNA的池,从而创建亚区域特异性TISA文库。

IV.用于检测单细胞中开放基因组DNA和细胞质RNA的方法

本发明提供了对固定细胞中的开放基因组DNA的景观及其细胞质定位的转录组进行同时量化的方法。用于研究细胞的开放基因组DNA的景观的先前方法需要细胞器分离,例如分离细胞核以进行Nuc-seq来评定细胞质RNA的细胞核RNA替代物或进行ATACseq来进行开放染色质分析,但是牺牲了细胞空间位置。现存的杂交技术,例如Mer-FISH或SeqFISH,保留了空间信息,但只允许对细胞质RNA的子集进行评定。此外,这些方法不允许在保持组织相关的空间分辨率的同时,对来自同一细胞的染色质和RNA进行表征。

为了理解细胞如何对其局部环境做出反应,不仅需要评定细胞质RNA丰度,还需要评定产生RNA的染色质的结构动力学。为了最终提供信息,这些测量必须发生在同一细胞中,使得可以评定影响信息从染色质到细胞质RNA的流动的动态过程,而没有其他无反应细胞或不同反应性细胞的稀释效应。对同一细胞中所有三者的定量评定可用于提供转录调节途径的详细视图,该转录调节途径可用于操纵该途径以增强细胞对各种局部刺激(包括导致疾病的刺激)的反应。

此外,虽然开放性对于转录发生是必要的,但重要的是要看到转录的产物,即细胞质RNA,以评定开放状态如何与细胞质RNA丰度相关。对同一细胞中的染色质动力学和细胞质RNA群体的同时测量将详细说明对跨共调节的基因的转录组调节途径的微调。

因此,提供了使LT-TISA程序与CHeX-seq程序相协调的方法,这两种程序都使用原位cDNA合成和aRNA扩增,使得染色质景观测定和细胞质RNA池表征可以在单个固定细胞中完成。

因为,在一些实施方式中,将首先用DNA聚合酶执行CHeX-seq,可以优选地在进行LT-TISA之前去除未活化的CHeX-seq寡核苷酸,使得LT-TISA寡核苷酸可以与RNA退火。任何未活化的CHeX-seq寡核苷酸将使用例如热变性去除,使得退火的16碱基短序列将被去杂交,而较长的双链CHeX-seq寡核苷酸引发的DNA将保持退火。这将使延伸的CHeX-seq寡核苷酸与染色质保持缔合,直到随后的LT-TISA反应之后。

在一些实施方式中,可以对免疫指定的细胞执行光学洗涤方案和CHeX-seq和LT-TISA分析的显微镜台上多重化。用于执行CHeX-seq和LT-TISA寡核苷酸添加和光学洗涤以将特异性条形码化的寡核苷酸置于多个单独细胞的细胞核和细胞质中的时间估计值是每个条形码化的寡核苷酸群体1分钟。这表明在细胞核(CHeX-seq)和细胞质(LT-TISA)中具有不同条形码的300个单独的免疫鉴定的细胞可以在10小时内完成。这可以通过例如使用具有六个桶的多桶移液管喷雾器(multi-barrel pipet spritzer)来加速,使得六种不同的寡核苷酸可以以空间受限的方式施加,从而在10小时内靶向1,800个细胞,其中每个细胞的细胞核和细胞质中均具有不同的条形码化的寡核苷酸。

V.用于分析选定的基因周围的开放基因组DNA的3D结构的方法

本文提供了用于特定基因周围的染色质生态位的结构分析的方法。该方法允许在体内鉴定启动子调节机制,包括在空间限定的单细胞中局部利用的增强子和调控选定的基因的其他基因组/染色质调节区,因为这种调节元件预计接近被调节的基因。由于染色体包装可以定位来自远染色体区域(包括目的基因附近的不同染色体)的基因,因此限定目的基因附近的染色体区域是重要的。用于表达的基因组的染色质景观和特定基因周围的3D“染色质生态位”可能因细胞而异,但在居住在类似微环境中的细胞中更相似。此外,随时间推移对染色质生态位动力学的监测可以用来详细说明这些重要的调节生态位如何随时间推移变化以及对外部刺激进行反应。

在CHeX-seq的这种基因特异性迭代中,固定的细胞/组织可用于荧光原位杂交以检测特定基因的位置。这种特定的基因FISH信号将被用于使用仅在FISH聚焦的基因处对CHeX-seq寡核苷酸进行多光子活化来靶向细胞核。例如,指向选定基因的转录起始位点(TSS)附近的开放基因组DNA区域的FISH探针可用于在基因的TSS处产生荧光信号,所述荧光信号可被成像。这些探针可为在方向上有意义的,使得与基因组DNA序列退火,而不与RNA退火。然后可以加入CHeX-seq寡核苷酸,所述CHeX-seq寡核苷酸将扩散到整个固定的细胞/组织中,并结合到细胞染色质的开放区域。为了具体评定选定的基因的TSS周围的染色质结构,FISH探针信号将用于指导多光子照射,以局部活化基因的TSS位点处的CHeX-seq寡核苷酸(图6)。在选定基因附近活化的CHeX-seq寡核苷酸可经延伸以进行基因的TSS附近的单链开放基因组DNA位点处的cDNA合成。这种基因生态位特异性CHeX-seq程序可以鉴定与FISH探针位点附近的染色质区域对应的序列,所述序列可以是选定基因的转录的基因组调控元件(包括增强子)。这些方法可用于研究任何指定的基因组DNA位点。此外,使用光学清洗可以使这些方法具有更高的产量。

VI.多重化

如本文所提供的,用于表征染色质和细胞质RNA的方法可以过渡到中等/高通量数据产生平台。为了使染色质和细胞质RNA的分析成为中等/高通量程序,提供了允许对特定寡核苷酸进行迭代寻址的方法。在Mer-FISH和Seq-FISH中,这是通过化学去杂交和更近的光漂白实现的。然而,这些方法不足以区别性地从细胞之间和细胞内取出未活化的寡核苷酸以进行亚细胞分析。

因此,本文提供了光学清洗的方法。这些方法使用红外(IR)激光来局部加热固定的组织切片上的溶液,以使不希望的寡核苷酸结合变性。这是有用的,因为用于CHeX-seq和LT-TISA的寡核苷酸是短的,并且它们的杂交可以容易地控制。为了在目的细胞中杂交,可以使用全自动微喷雾器和抽吸系统将具有选定条形码的寡核苷酸局部施加到固定细胞上或组织中的有限空间。当CHeX-seq和LT-TISA寡核苷酸杂交并通过添加荧光标记的可光活化的终止核苷酸(例如,发光终止子)而变得被荧光标记时,目的细胞可以通过免疫荧光来鉴定,并且可以通过增加的荧光信号来监测该细胞中的寡核苷酸杂交。取决于寡核苷酸的大小,可以优化温度操纵,并且可以通过傅里叶热传导定律(p=-Ak(dT/dL),p=热功率,A=加热面积,k=热导率,dT=温度梯度,并且dL=距离)来估计理论辐照和加热面积。例如,对于具有15个碱基的简并退火序列的CHeX-seq寡核苷酸,Tm范围将为35-42℃,并且对于LT-TISA(15个碱基的聚A)寡核苷酸,Tm为35℃。将退火的寡核苷酸周围的溶液加热至50℃将使>95%的未活化寡核苷酸去杂交。使用30mW的能量可以在聚焦的像素处瞬间达到50℃的温度。去杂交和寡核苷酸清除(例如,通过洗涤)的效率可以通过荧光信号降低来容易地监测。然而,这些方法也适用于没有微量注射仪的情况—可以执行对整个组织的寡核苷酸的浴应用(然而,寡核苷酸杂交将更慢),并且除了目的细胞之外的所有区域的变性可以通过基于免疫荧光图像掩蔽的光学洗涤来实现,该免疫荧光图像掩蔽保护区域免受加热,从而允许对未染色的细胞进行选择性加热(图7)。该过程可以并入定制成像软件中。

在这些实验范式中,未来有相当大的灵活性来靶向不同的细胞隔室,以实现多重性,例如以评定选定细胞中的初始快速细胞核转录反应以及稳态细胞质RNA丰度,所述选定细胞在其自然微环境(组织切片)中彼此突触连接(de la Torre-Ubieta和Bonni,2011;Spaethling等人,2017),并且以分析不同的RNA群体(例如,mRNA、非编码RNA、总RNA)。

VII.本发明方法—染色质重塑在神经发育和精神疾病中的示例性应用

当与染色质重塑在神经发育和与年龄相关的可塑性中的重要作用相比时,对染色质重塑的药理学的研究相对不足(Borrelli等人,2008;Ziller等人,2015)。在神经元中,这些生物学的重要可塑性调控剂是BDNF,其对神经元分化和局部蛋白质合成的影响已被很好地记录(Martinowich等人,2003;Berton等人,2006)。已经与染色质变化相关的其他可塑性现象包括强去极化刺激对树突形态的影响(Ellis等人,2016;de la Torre-Ubieta和Bonni,2011;Seifuddin等人,2013)。在自闭症谱系障碍(autism spectrum disorder,ASD)以及在慢性酒精成瘾中的全基因组关联研究(genome wide association studies,GWAS)中,染色质重塑和树突形态的变化已经与NMDA谷氨酸受体、电压敏感Ca++通道和GABAb受体的活化关联(Varodayan和Harrison,2013;Costa等人,2006;Guidotti等人,2011),所述活化在正常条件下介导超极化。这些关于染色质重塑的数据来源于对大量细胞的分析。

全基因组关联研究已经鉴定出了与精神分裂症和抑郁症相关联的多个基因座,但这些基因座中的许多基因座还没有得到对疾病因果关系的机构洞察(Maurano等人,2012)。因此,重要的是跳出遗传学的观念之外考虑,着眼于基因组是如何被调节的(Insel和Wang,2010)。越来越多的证据表明,细胞对例如抑郁症的疾病的易感性存在显著差异,因此治疗反应也会有差异。已经针对精神分裂症(Zhang等人,2015)和包括非编码RNA群体的抑郁症(Roussos等人,2014)中观察到了转录组变异性。RNA转录过程需要特定构象(即,开放)的DNA,其中存在较少的核小体包装,使得转录调节酶可以发挥作用。还已经注意到了神经元与其他细胞类型之间的染色质变异(Fullard等人,2017),具体包括神经元与星形胶质细胞之间的基因组DNA甲基化差异(Kozlenkov等人,2014;Kozlenkov等人,2016)。在其他细胞类型的细胞之间也观察到了这种表观遗传甲基化差异(Mo等人,2015)。已经有一些努力将转录组和染色质变异性联系起来,认为拥有这两组数据将使得能够更好地理解为这些疾病中细胞功能障碍的基础的调节机制(Xiao等人,2014)。染色质反应性的可塑性已经在发育变化(Zhu等人,2013)、可卡因药理操纵(Kumar等人,2005)和情绪状态变化(Renthal等人,2007)方面得到强调。这些研究显示了细胞类型与亚型之间的染色质变异,即使来自富集细胞的群体也如此。此类变异强调了在单细胞水平上评定这种变异的需要,在单细胞水平上更容易获得机制洞察。对染色质重组进行报道的文献几乎完全使用对培养细胞系的急性和稳健的药理学操纵—对切片制备中突触递质(其具有临床意义)或其药理学等同物(如受体或通道调控剂)的更微妙调控作用的探索有限。为了解决精神活性药物如何影响特定基因周围的染色质结构的问题,人们需要能够在这些亚基因组单基因位点处局部评定染色质结构(Kolovos等人,2014;Heller等人,2014)。

突触刺激对染色质重塑的分子作用遵循既定的受体和钙结合蛋白介导的途径(Frankle等人,2003)。在来自小鼠海马和大脑皮层的神经元中,染色质重塑已经与染色质重塑蛋白AXTR、HSF1和H3.3机制上相关(Varodayan和Harrison,2013)。这些蛋白质也受到5HT受体介导的刺激(参与情绪障碍)的影响。这通过染色质重塑机制将情绪障碍与其他精神疾患联系起来(Duman,2013;Sun等人,2015;McCarthy等人,2014)。情绪障碍在治疗上受到最流行的抗抑郁药SSRI的影响,并且类似地,通过最常用的抗精神病药D2拮抗剂也观察到了突触介导的微调(Vialou等人,2013年)。

转录组变异性的背景:最近的技术进步已经使得能够对单细胞中的基因表达进行不断增加的高分辨率测量,从而导致对细胞间表达变异性程度的日益重视。这种变异性已经被检查为:1)多细胞生物中细胞类型的巨大多样性的指标;2)调节网络中冗余的副产物;3)异步动态过程的时间快照;4)分子动力学的产物;或者5)作为RNA丰度可能与细胞表型无关的证据。另一种观点是考虑单细胞转录组、蛋白质组和其他分子变异性对细胞群体水平的功能是否是至关重要的。多细胞组织中的单独细胞类似于合作群落中的单独生物吗?其中每个细胞的行为都有助于产生更高级别的整体功能?

这种变异性反映了转录组状态与细胞表型之间的多对一关系(Kim和Eberwine,2010)。在这种关系中,RNA子集的分子比率是通过细胞系统的化学计量约束确定的,所述化学计量约束证据不足地说明了转录组状态。通过类比,转录组表型被定义为构成选定RNA系统的RNA子集,所述选定RNA系统与彼此相互平衡存在以产生相关联的细胞功能。有相当多的证据表明,组织中的单独细胞通过放松它们的生理动态或通过主动信号传导和维持聚集状态来采取异质状态。

此外,如果单独细胞间的基因表达变异对组织功能很重要,则变异程度本身可为跨物种保守的。作为原理的证明,计算了大鼠和小鼠中皮层和海马锥体神经元的F统计。针对每种细胞类型,计算跨物种的F统计的偏相关性,从而控制基因表达水平以确保相关性不仅仅是由于基因表达的共享水平。跨物种的偏相关系数对两种检查的细胞类型都是显著的(关联的双侧T检验p<10

本文提供了使得能够确定染色体相对于细胞信号传导输入的定位(部分是由于细胞的极性和定位)是否产生细胞转录组变异性并促进类似细胞生理状态的“多对一”详细阐述的方法(Kim和Eberwine,2010)。

神经元的形态几何对细胞核的影响:CNS神经元位于脑结构中,在所述脑结构中它们从许多突触前神经元接收突触输入。在神经元发育期间,神经元迁移到一个位置,在这个位置它们变得“硬连线”或与周围细胞突触地和空间上互连(图9,顶部)。这些神经元可以改变它们的突触连接性,但它们移动或重新定位自身的能力有限。神经元中的细胞核相对不动,其中神经元细胞骨架缔合将细胞核保持在适当的位置。由于这些神经元是有丝分裂后的,所以染色体几乎没有明显的运动,例如:一号染色体不能与五号染色体一起急剧改变位置(图9,中间)。然而,控制染色质开放性和表达的顺式和反式调节区确实会移动。任何两个相邻的细胞可能具有重叠的较高级染色质结构,从而产生共同的细胞特征以及可变的结构,所述可变的结构导致了细胞不同性。

用于创建转录组变异性的模型:这种形态学约束表明,当不同的神经元从突触前神经元接收输入时,从刺激部位以矢量方式发生活化。当信号级联到达细胞核时,最靠近刺激部位的开放染色质区域将接收最强和最快的刺激(图9,其中神经元A在细胞核最靠近刺激的一侧具有绿色和紫色的染色质;神经元B具有黑色和紫色的染色质;并且神经元C有蓝色和绿色的染色质)。考虑到染色体定位的预测差异,这进一步表明染色质相互作用也在很大程度上因选定细胞中的不同增强子和靶基因相互作用而不同。随后,矢量刺激附近的差异和染色体/染色质相互作用的差异将导致转录变异性(图9,底部小图)。

本文提供的方法可用于鉴定由临床相关操纵(例如抗抑郁药作用)导致的染色质状态和/或细胞质转录组的变化(Tsankova等人,2007;Sharma等人,2006;Ellis等人,2016)。临床抑郁症是一种精神疾病,对其进行治疗可能很困难,因为使药物有效需要长运载(onboard)时间并且需要调整剂量才能有效。这些问题的分子基础可能部分源于细胞间存在的基因组变异性以及改变成体神经元基因组的表观遗传状态的需要。为此,可以测试治疗抑郁症的药物在细胞间存在变异性的情境下调控染色质结构和细胞质RNA丰度的能力。因为染色体组织中的“细胞间”差异可能是对抗抑郁药的转录反应中的细胞间变异性的基础,所以对选定基因周围的开放染色质的3D结构的分析可以提供进一步的洞察。这些知识可能会促进操纵更高级染色质结构的新方法的发展,以增强这些药物的治疗功效。

为此,CHeX-seq方案可用于生成分散的小鼠和人皮质神经元的单神经元开放染色质数据集。此外,组合的CHeX-seq和LT-TISA方案可用于根据对分散的小鼠和人皮质神经元的细胞质RNA池的稳态水平的开放染色质分析,来产生定量单神经元转录生物学数据集。同时测量具有染色质结构的多个细胞质RNA池可以显示转录途径的哪些区域与抗抑郁药的药物反应性最密切相关。最后,围绕特定基因的染色质生态位重塑的时间过程将提供对与精神疾病相关联的基因的染色质重塑过程的保守性如何的第一洞察。这种信息将可用于评定生态位发展时间与表型结局之间的功能相互作用。

具体地,本发明方法可用于评定响应于抗抑郁药氟西汀的单细胞皮质神经元染色质重塑的“调节的转录组”效应。同时测量具有染色质结构的多个细胞质RNA池可用于揭示转录途径的哪些区域与抗抑郁药的药物反应性最密切相关(Tsankova等人,2007)。作为这些基因组水平反应的必然结果,可以检查特定基因周围的染色质生态位重塑的时间过程,以提供对与精神疾病相关联的基因的染色质重塑过程如何保守的第一洞察。这种信息将可用于评定生态位发展时间与表型结局之间的功能相互作用。单基因染色质生态位分析可以集中于编码染色质重塑蛋白(例如AXTR、HSF1和H3.3(它们在重塑期间必须是有活性的))的基因周围的染色质结构的药理学调控,以及药理学响应性靶基因,包括谷氨酸和GABAb受体和CREB第二信使活化系统的成员,它们参与GPCR介导的细胞事件(Ruzicka等人,2015;Huang和Akbarian,2007;陈等人,2014)。

一种经常用于评估定细胞生物学机制的实验系统是原代分散的CNS细胞培养物。长期(2-3个月)小鼠培养要求神经元来自胎儿/新生小鼠,因为成熟神经元通常不能在培养中长时间保持有活力。来自成体脑的短期小鼠原代细胞培养可以在长达3天的时间内迅速完成。以前,人们认为人神经元细胞也是如此,然而为了测试这一点,发明人已经收集了来自患者的活体人脑组织并对其进行了表征。脑组织获自经受神经外科手术(通常用于肿瘤去除)的同意患者。实验室工作人员在手术过程期间等待,并通常在切除术的20分钟内将合适的组织送到实验室。细胞已经从少量组织中酶促离解,并且分散的成体神经元原代细胞培养已经成功地进执行了3个月以及更长时间。原代细胞培养模型可用于预测和分离参与各种生理事件的因子,所述各种生理事件包括RBP与mRNA的相互作用,所述因子随后可在体内进行测试。这些长期人类细胞培养物的效用反映在特定类型的细胞倾向于只在基因子集内揭示它们的不同类别。例如,对约300个人脑源细胞进行RNAseq分析之后进行途径分析显示了在人脑细胞培养物中神经元、星形胶质细胞、内皮细胞、小胶质细胞和少突胶质细胞的存在。从单细胞样本中鉴定亚细胞类型需要仔细施加噪声控制、途径/基因选择、和机器学习方法。这些数据表明,人类原代细胞培养方法适用于各种转录上限定的细胞类型,包括将用于这些研究的神经元(Thurman等人,2012)。

VIII.试剂盒

根据本发明的试剂盒提供了至少一种可用于实践本发明方法的至少一个实施方式的组分。因此,试剂盒可以提供实践根据本发明的方法的至少一个实施方式所必需的一些或全部组分。试剂盒可包括至少一个装有本发明寡核苷酸的容器。试剂盒可包含执行根据本发明的方法的至少一个实施方式所需的所有寡核苷酸,例如一组用于分析选定基因的开放基因组DNA和/或表达的寡核苷酸,或一组用于开放基因组DNA的全基因组分析的简并寡核苷酸。

试剂盒通常被定义为包括一个或多个容器的包装件,该一个或多个容器包含一个或多个本发明的寡核苷酸或组合物。试剂盒本身可以由任何合适的材料制成,所述合适的材料包括但不限于纸板、金属、玻璃、塑料、或已知可用于包装和存储生物样本、研究试剂或物质的一些其他聚合材料。试剂盒可以设计成保持一个或多个容器,此类容器中的每个容器都被设计成保持一个或多个本发明的核酸、组合物或样本。容器可以由任何合适的材料制成,所述合适的材料包括但不限于玻璃、金属、塑料或一些其他合适的聚合材料。每个容器可以针对材料、形状和大小独立地进行选择。容器的非限制性示例包括管(例如,微量离心管)、小瓶、安瓿、瓶、罐、袋等。每个容器可以用永久密封件或可重新封闭的密封件(例如螺旋盖)密封。试剂盒中的容器中的一个或多个容器可以在包含在试剂盒中之前或之后进行灭菌。

本发明的试剂盒可包括一种或多种可用于实践本发明方法的其他组分或物质,例如无菌水或水溶液、用于执行本发明方法中涉及的各种反应的缓冲液、和/或用于检测扩增产物的试剂。因此,试剂盒可包含用于扩增cDNA或RNA分子的一种或多种聚合酶。试剂盒可包括用于从RNA模板合成cDNA的一种或多种逆转录酶。根据本发明的实施方式,它还可以包括用于执行逆转录和扩增的一些或全部组分、试剂和供应品。例如,在一些实施方式中,除了包含可光活化的终止子的一种或多种寡核苷酸之外,试剂盒还可包括用于逆转录和/或扩增的核苷酸,具有或不具有一种或多种聚合酶。在实施方式中,它包括文库制备和下一代测序分析所需的一些或全部试剂。

IX.实施例

包括以下实施例来说明本发明的优选实施方式。本领域技术人员应理解,以下实施例中公开的技术代表了发明人发现的在本发明的实践中发挥良好作用的技术,因此可以认为构成了本发明实践的优选模式。然而,本领域技术人员应当根据本公开内容理解,在不脱离本发明的精神和范围的情况下,可以对所公开的具体实施方式进行许多改变并仍然获得相同或相似的结果。

实施例1–CHeX-seq寡核苷酸终止子添加

HPLC纯化的寡核苷酸和它们的互补寡核苷酸购自Integrated DNA Technologies(IDT)。采用模板依赖性DNA聚合酶结合测定以将荧光标记的可光活化的终止核苷酸类似物结合到寡核苷酸的3′末端:(1)将5μM的寡核苷酸、25μM的互补寡核苷酸、50μM的荧光标记的可光活化的终止核苷酸类似物、4mM MgSO

实施例2-CheX-seq

使用在3%福尔马林中固定的细胞执行CHeX-seq达3分钟。对于这个实验,使用了靶向皮层神经元的单个细胞核的CHeX-seq寡核苷酸。图10示出了单独细胞的读段的比对汇总。这些比对被作图为与不同的基因组特征、转录起始位点(TSS)、编码序列(CDS)、3′UTR和基因间区域相关。读段结果显示在预期的接近TSS和跨编码序列的位置处有峰。有趣的是,在基因间区域的两端处也可以看到峰。

实施例3-实施例4-7的材料和方法

人脑组织.人脑组织是在宾夕法尼亚大学医院(Hospital of the University ofPennsylvania)(IRB编号816223)使用用于招募和使患者知情同意的标准操作程序收集的。简而言之,从皮质中获得整块大脑样本(通常为5×5×5mm),该皮质是作为对于治疗癫痫或脑肿瘤的神经外科手术的一部分被切除的。立即将该组织转移到装有冰冷氧化的CSF(单位为mM:KCl为3mM、NaH

细胞培养/制备和固定.K562细胞获自ATCC,并且在5%CO

小鼠脑组织切片制备.用氟烷麻醉3个月大的雄性小鼠,通过胸廓切开术进行安乐死,然后用5ml PBS、之后用20ml PBS/4%多聚甲醛进行心脏灌注。将大脑取出并且在4℃下固定16小时,然后以PBS冲洗,并在振动仪(Leica VT-1000s)上以100μm在冠状平面上切片。然后用鸡抗MAP2抗血清(1:1000;Ab 5392;Abcam)之后是Alexa 488缀合的山羊抗鸡二抗(1:400;ab150169;Abcam)对包含海马的切片进行免疫荧光标记。

CHeX-seq探针合成:HPLC纯化的探针寡核苷酸及其互补寡核苷酸购自IntegratedDNA Technologies(IDT)。采用模板依赖性DNA聚合酶结合测定将Cy5染料标记的发光终止子

CHeX-seq探针应用.在固定和透化后,将细胞和脑切片与CHeX-seq探针(170nM)一起在TES缓冲液(10mM Tris,1mM EDTA,150mM NaCl)中在室温下孵育1小时。然后用1×PBS(不含Ca

成像和光活化.在CHeX-seq探针退火和洗涤后,将样本转移到具有1×PBS(不含Ca

第一链DNA原位合成和单细胞收获.在每个单独细胞核中光活化后,向所述细胞中加入含有DNA聚合酶I和第一链DNA合成缓冲液的主混合物,并在室温下孵育1小时。随后,在Zeiss 710共聚焦显微镜(Carl Zeiss)下,使用玻璃微管收获含有合成互补DNA的单细胞,用于可视化。

染色质的无核小体区的线性扩增.(A)第一链DNA合成和3′端处的聚G加尾:收获单细胞后,通过加入新鲜制备的0.1N NaOH并在室温下孵育样本5分钟,然后用1M Tris(pH7.5)中和,来去除原位合成的cDNA。在乙醇沉淀后,将第一链DNA重悬于无核酸酶水中。随后,使用末端脱氧核苷酸转移酶(TdT)(Invitrogen)将聚(G)添加到3'端。(B)第二链DNA合成和第一轮线性RNA扩增:在用定制的App-RC-聚C引物(表1)引发后,使用DNA聚合酶I在16℃合成第二链DNA达2小时。用Ambion MEGA脚本T7体外转录(In Vitro Transcription,IVT)试剂盒从结合到双链DNA中的T7 RNA聚合酶启动子进行线性体外转录,以扩增RNA。(C)第2轮第一链和第二链DNA合成和PCR扩增:在清除IVT反应后,使用定制的App-RC引物(表1)从使用上标III的aRNA逆转录第一链DNA。使用DNA聚合酶1以及定制的18bpPBC1引物(表1)合成第二链DNA。随后,在以下聚合酶链反应条件下,使用定制引物18bpPBC1/App-RC(表1)扩增双链平末端DNA:98℃达30秒;在98℃热循环10秒,50℃达30秒,72℃达30秒,进行27次循环;在72℃下延伸2分钟,然后用于文库构建。用相同的程序处理用于对照实验的样本,区别为不应用CHeX-seq探针,并且用定制的引物18bpPBC14/App-RC(表1)执行第二轮第二链DNA PCR扩增。

表1.这些研究中使用的引物和寡核苷酸的序列的列表。

测序文库制备.将Illumina TruSeq纳米DNA文库制备试剂盒经改进后使用。所有第二轮PCR扩增的双链DNA都用作输入。用末端修复混合物将DNA片段转化为平末端后,加入碱基“A”;连接序列衔接子。用PCR扩增DNA插入物。

外部数据.GRO-seq:从SRA(登陆号GSE60454)(Core等人,2014)以FASTQ格式下载K562 GRO-seq;使用SCAP-T管线(可在万维网上的scap-t.org处得到)处理原始读段;通过HOMER(Heinz等人,2010)推断POL2接合的转录物;ATAC-seq:1.从SRA(登陆号GSE65360)(Buenrostro等人,2015)以原始FASTQ格式下载单细胞未经处理的K562 ATAC-seq数据。遵循Buenrostro等人(2015)中的比对和峰值调用方法;2.从ENCODE(Davis等人,2018)以BAM格式下载鼠脑ATAC-seq数据;使用MACS2(Feng等人,2012)调用窄峰和宽峰;DNA酶-seq:1.从ENCODE以bigBed格式下载K562 DNA酶-seq窄峰和宽峰;2.从ENCODE以BAM格式下载人脑DNA酶-seq数据;FAIRE-seq:从ENCODE(登陆号ENCFF000TLT)以BED格式下载K562 FAIRE-seq窄峰;通过CrossMap(Zhao等人,2014)将原始的hg19基因组构建提升到hg38;约化表示亚硫酸氢盐测序(Reduced representation bisulfite sequencing(RRBS)):从UCSCENCODE轨道以BEDMethyl格式下载K562 DNA甲基化RRBS数据;通过CrossMap将原始的hg19基因组构建提升到hg38。ChIP-seq:从基因组构建hg38中的ENCODE下载K562 ChIP-seq数据。它们进一步组织为以下三类:转录因子结合位点(TFBS)以及窄组蛋白修饰和宽组蛋白修饰(H3K27ac、H3K4me3、H3K9ac、H3K4me2、H2AFZ;H3K4me1、H3K27me3、H3K36me3、H3K9me3、H3K79me2、H3K9me1)。只有复制的峰才用于组蛋白修饰。Hi-C:从基因组构建hg19中的GSE63535(Rao等人,2014)下载K562 Hi-C数据。为了将其与hg38进行比较,与此同时最小化因提升Hi-C数据而导致的潜在伪影,使用CrossMap将来自hg38的CHeX-seq提升到hg19。增强子和超级增强子:从VISTA数据库(Visel等人,2007)下载实验验证的人和小鼠增强子;从dbSUPER(Khan等人,2016)下载超级增强子数据;DNA复制起点:使用由作者预调用的峰从GEO(登陆号GSE46189)以BED格式下载K562 DNA复制起点数据。原始的基因组构建是hg19,其通过CrossMap转化为hg38。增强子/启动子相互作用:在UCSC基因组浏览器中,仅使用高置信度(“双精英(double elite)”)数据从数据库GeneHancer v 4.11(Fisilevich等人,2017)加载增强子、启动子和调节相互作用。

实施例4—在人K562细胞中对CHeX-seq进行基准测试

选择HK562细胞对CHeX-seq程序进行基准测试,这是因为该细胞系通过ENCODE而被选择用于广泛分析(ENCODE Project Consortium,2012)。固定后,将K562细胞重力沉积在聚L-赖氨酸包被的盖玻片上,然后透化并以PBS洗涤。将CHeX-seq荧光标记的引物与化学固定的细胞退火显示探针集中在细胞的细胞核中(图13B)。通过以60%的功率和每像素30μs的405nm(紫外)激光照射来活化CHeX-seq引物,由此观察到荧光减少45-80%(图13B的插图)。这种减少是由于荧光部分的损失和释放3′-羟基来引发DNA合成。

首先通过定制的SCAP-T下一代测序管线(可在github.com/safisher/ngs处得到)对CHeX-seq读段进行预处理,然后映射回UCSC hg38(人类)或UCSC mm10(小鼠)基因组。最后,应用附加的QC程序来过滤高质量的读段。沿着基因及其侧翼区域的长度,从所有基因的5′启动子区域开始,穿过转录起始位点(TSS)、5′非翻译区(UTR)、外显子和内含子、3′UTR和3′近端区域,评定映射到基因模型的不同区域的CHeX-seq读段的百分比(图13C)。K562细胞在基因间区域中显示出最高比例的CHeX-seq读段(>50%),然后是内含子(约30%),然后是距转录起始位点(TSS)小于1kb的近端启动子(约6%)。基因的启动子近端区域(<1kb)的读段是远端区域(4-5kb)的3倍多,这与在TSS附近的染色质的开放一致。更具体地,在大多数单细胞样本中观察到TSS富集,在阴性对照中有微弱的富集或没有富集。将所有非对照样本的信号进行组合显示出以TSS为中心的明显峰(图13D),非常类似于在ATAC-seq或DNA酶-seq测定中观察到的TSS峰(Buenrostro等人,2013;Boyle等人,2008)。ATAC-seq数据显示了在TSS周围的测序读段的峰,而CHeX-seq数据具有类似的峰,其中在5′到3′方向上在峰之后有略微延伸的斜坡。图13E示出了来自单独细胞的细胞内CHeX-seq信号,所述信号被汇集用于注释特征。这些数据表明染色质倾向于在CDS(编码序列)起始处附近开放,其中在CDS起始处具有较高密度的CHeX读段,并且在CDS内具有较低密度的CheX读段。这可能是由于观察到CDS区域的高G-C含量,所述高G-C含量可在开放基因组区域内保持DNA的双链状态。它可能还反映了转录活动期间单链开放的动力学。

为了评定有多少K562 CHeX-seq位点对应于表达的mRNA,将CHeX-seq数据与公布的K562转录组数据集进行比较(图13F)。这些数据表明,约64%的转录组(15688个基因)具有与表达的转录组对应的CHeX-seq位点。即使有这种相对较大的重叠,在公共转录组数据中仍有7286个CHeX-seq基因区域(CHeX-seq基因的约32%)没有转录证据。在将CHeX-seq数据与GRO-seq转录物进行比较(实时转录runoff测定(Danko等人,2015;Lladser等人,2017))时,存在类似数量的重叠基因(约66%),与此同时显示出CHeX-seq独特基因的减少。由于GRO-seq数据不受RNA稳定性的显著影响,因此它更准确地反映了从开放染色质区域主动转录的基因。在评定富集CHeX-seq位点的K562细胞mRNA的基因本体(GO)时,鉴定出了细胞信号传导、细胞周期和GTP酶调节途径(图13G,示出了前20个)。这些数据与以下事实相一致:K562细胞是转化细胞系,其中这些途径是有功能的。

与其他开放染色质以及表观基因组测定相比,CHeX-seq数据的基因组覆盖率在UCSC基因组浏览器(Kent等人,2002)中呈现(图14A至图14B)。例如,OTUD5基因区域显示了CHeX-seq读段与三种开放染色质测定(ATAC-seq、DNA酶-seq、FAIL-seq)的映射,突出显示了每种测定都有重叠的开放染色质区域以及分析方法特有的区域两者(图14A)。针对CHeX-seq样本对32个细胞进行映射,相比之下对于其他测定的映射的细胞总数超过200个。在基因OTUD5的这个特殊视图中,注意到了OTUD5的启动子与其3′内含子中的一个3′内含子之间的调节相互作用,所述调节相互作用由所有四种开放染色质测定(紫色的矩形)共享。由于每种技术检测到的信号的生物学性质并且由于测定的不同化学性质,不同的表观基因组测定具有不同的基因组规模。为了评定不同表观基因组测定之间的关系,计算27种不同测定在两个不同窗口大小中的信号一致性,并将结果进行聚类(图14B)。在10kb窗口的大小标度内,开放染色质测定(FAIRE-seq、DNA酶-seq、和ATAC-seq)聚类在一起,而CHeX-seq在同一聚类中但处于更远的距离;该聚类还包括组蛋白甲基化测定和复制起点测定。在窗口大小为50kb时,CHeX-seq、ATAC-seq和DNA酶-seq测定形成了紧密的聚类,其中FAIL-seq在该聚类之外。由于人类基因的平均大小为约42kb并且功能性转录染色质单位是约50kb(Hegedus等人,2018),所以这些数据表明,使用这些程序中的每一种程序都鉴定出了相同的开放染色质相关基因,但是单链开放染色质CHeX-seq位置可能相对于其他程序中的位置位移。预计不会有直接的重叠,因为与CHeX-seq的单链DNA要求相比,其他程序对双链DNA具有靶标偏倚(ATAC-seq和FAIL-seq)或是不加选择的(DNA酶-seq)。由于分析的细胞数量有限,所以CHeX-seq信号可能更稀疏,但是这些数据突出显示了双链和单链DNA都存在于开放染色质区内,并在细胞的开放染色质景观中彼此互补。

为了证实CHeX-seq预测的基因座中的一些基因座的单链性质,对染色体1(630737-633960)上的CheX-seq预测的K562单链开放染色质位点执行单分子FISH(图20A)。除了CheX-seq鉴定该基因区域的开放染色质状态外,ATAC-seq还预测它是开放的,而相比之下,DNA酶显示有限的开放性并且FAIRE预测它不是开放的。将八个20聚体寡核苷酸探针合成到人类1号染色体的该靶区域。这些探针在5′端用ATT0 590荧光团标记。在执行FISH时,通常在单个细胞核中观察到3个强阳性斑点(图20B)。这种三体信号是由于复杂的K562细胞核型,其中一些细胞具有3个拷贝的1号染色体(Gribble等人,2000)。

接下来,将K562 CHeX-seq引发位点根据其与同源基因的TSS的距离分层,并将该距离与来自同一基因的RNA表达水平进行比较(图15)。使用三种不同的RNA来源—群体RNA(GSE32213)、GRO-seq RNA(GSE60454)和单细胞RNA(scRNA,GSE 90063)—可以看出,当CHeX-seq引发位点更靠近TSS时,对应的RNA通常以更高的丰度存在(Szlachta等人,2018)。这种模式在人和小鼠神经元和星形胶质细胞以及小鼠切片定位神经元中发现(图21)。这些数据表明了关于基因内的单链DNA的可塑性受到调节:即,随着转录沿所述基因的长度移动,5′-开放位点变得不可用于杂交,这可能是由于单链区域的重新退火。在这个模型中,可检测的CHeX-seq引发位点具有不同的半衰期,并且那些接近TSS的位点保持单链达更长的时间,并且对应于高水平的转录。因此,更靠近TSS的CHeX-seq引发将更能预测高度转录的基因。这些数据不仅仅是由于RNA稳定率的差异,还因为GRO-seq RNA是新合成的细胞核RNA。一个模型是TSS近端单链链型与基因表达有关,其可及性随着转录的进行而衰减,而更远端区域的单链可及性可能与DNA的其他构象调节有关。

由于RNA Pol2转录复合物与模板DNA结合并通过转录反义链而在5′至3′方向上合成RNA转录物,所以评定了CHeX-seq探针是否可能优先结合到潜在更可及的有义链,从而产生过量的“反义链”读段(参见图16A中的示意图)。图16B示出了基因模型的不同注释区域的反义与正义读段的比率。结果表明了与基因组的非转录区相比,转录区的读段比率更高的偏倚,其中从5′UTR朝向3′UTR的偏倚略有增加。有趣的是,启动子区域表现出朝向有义链CHeX-seq产物的相反偏倚(图16B)。这可能反映了反义链在复制反义模板时与包含Pol2的蛋白质结合,使得有义链更可用于CHeX-seq引物结合(Wang等人,2014;Louder等人,2016)。启动子的这种相反趋势可能与双向启动子活性有关(Wei等人,2011)。

实施例5-原位小鼠脑组织切片和分散单神经元分析

为了鉴定原位定位在成体小鼠脑组织中的单独神经元中的开放染色质位点,在神经元处于其自然环境中的情况下,将CheX-seq应用于固定的成体脑组织切片(100μm),所述切片用检测神经元微管相关蛋白2(MAP2)的抗体进行免疫荧光标记。然后将CHeX-seq探针与组织切片中的单链DNA退火(示意图参见图17A)。图17B示出了针对MAP2免疫荧光(绿色)和CHeX-seq探针(红色)标记的海马CA1区。将CHeX-seq探针在单独细胞核(图17B中带框区域中的箭头)中活化(通过荧光信号的丢失证实),在此之后执行来自单链基因组DNA的原位复制。将CHeX引发的DNA取出,扩增,并测序。在比较来自切片定位神经元的开放染色质CHeX-seq位点和来自单细胞的表达的转录组(图17D)时,CHeX-seq位点与表达的RNA有59%的重叠,而88%的转录组与CHeX-seq读段重叠。这使得41%的CHeX-seq位点在RNA中没有检测到,而只有13%的转录组没有显示CHeX-seq开放染色质位点。这些数据表明,在固定的组织切片中有大量的单链开放染色质,这些单链开放染色质在表达的转录组中没有表现出来,可能对应于准备好进行转录的基因、DNA复制位点或其他类型的DNA组织结构。组织切片中的CHeX-seq读段可以进一步细分,以显示外显子区与转录组的69%重叠和内含子区与转录组的65%重叠。这种重叠表明染色质景观和转录组在位于其自然微环境中的细胞中均密切相关。

为了评定分散的神经元细胞中单链开放染色质区域的模式,还检测了单个固定培养的小鼠神经元(图17C)。由于成体小鼠神经元无法培养并且海马细胞难以培养,因此在原代培养两周的小鼠新生皮层神经元中评定开放染色质位点,在该两周期间所述小鼠新生皮层神经元发育成树突。分散的小鼠皮层神经元具有与K562细胞(图13D)以及其他细胞类型(图22A至图22F)观察到的类似的TSS峰,表明它们显示出相同的TSS开放染色质构象。然而,与原位海马神经元(9,709)相比,在分散的皮层神经元(5,312)中发现了较少的映射到表达的转录组的总CHeX-seq读段(图17D)。发现对于原位神经元,转录组的88%被映射到CHeX-seq读段上,而对于分散的神经元转录组,转录组的仅48%被映射到CHeX-seq读段上。然而,分散细胞的对应于转录的RNA的CHeX-seq读段的百分比为68%,相比之下原位神经元的对应于转录的RNA的CHeX-seq读段的百分比为59%。一般地,与原位海马细胞相比,在分散皮层神经元中较高百分比的CHeX-seq阳性区域显示出转录迹象,而与切片相比,分散培养物中显著较低百分比的转录RNA显示出CHeX-seq迹象。虽然很难辨别细胞类型(尽管皮层和海马细胞转录组非常相似(Zeisel等人,2018))和细胞年龄对这些数据的相对贡献,但是一种潜在的解释是,大脑切片神经元中比分散神经元中存在更多的非转录相关开放染色质位点。

在比较小鼠分散皮层神经元CHeX-seq数据和单个皮层神经元的取平均转录组时,单链DNA位点与表达的RNA有很大的重叠(图17D,右小图,左上角)。在7,728个CHeX-seq阳性中,69%与转录组重叠,剩下31%的单链位点有基线转录RNA或没有可检测的转录RNA。伴随着在单细胞中鉴定出的11,071个不同转录物的这些数据,48%与单链开放染色质基因相关。为了评定这种比较的系统方面,在共有的基因中以及在分散神经元中对任一测定所独有的基因中评定Gene Ontology(GO)富集。在开放染色质分析与转录组之间共享有235个GO分子功能项,所述GO分子功能项在本杰明-霍赫伯格(Benjamini-Hochberg,BH)调整的p值<0.1时富集,而在相同的显著性下,在CHeX-seq独特基因中有40个GO分子功能项,并且在转录组独特基因中有107个GO分子功能项。共享途径中有用于染色质结合的途径(p值:2.0×10

有趣的是,在原位神经元中,在该基因内在RNA表达水平与CHeX-seq引发位点的数量之间存在显著的关系(图17E)。这些数据表明,基因中CHeX-seq引发位点的数量指示了从该基因转录的量,位点越多表明转录越多。这种关系有些令人惊讶,因为RNA的稳态水平除了取决于转录活性之外,还取决于其他因素,例如RNA稳定性。单个开放位点可以与高水平的表达相关(图17E,左小图,最左边),但是此类位点的数量要少得多。组织切片中细胞的高表达基因中的大量开放染色质单链位点可反映更高水平的活性,其中基因更频繁地爆发转录活性,并且开放染色质单链状态保持延长的时间段。这与显示当有更多的CHeX-seq引发位点时基因表达的变异性降低的数据一致(图17F)。这些数据表明,平均尺度的表达变异性可能与单链DNA区域的量化程度和碱基对跨度成负相关。因此,CHeX-seq引发量度可能与转录的时间恒定性以及总的生产水平相关,这将反映细胞的更高代谢需求和对恒定高水平表达的RNA的需求。

检查以延伸基因区为单位的引发率,所述延伸基因区被定义为上游和下游都有附加5kb的整个转录区(5′UTR、外显子、内含子、3'UTR)。对于每个延伸的基因区,将来自28个培养的神经元样本和15个原位海马神经元样本的引发事件汇集在一起,并针对不同比例进行费希尔精确检验(Fisher′s exact test),给出每次处理中的总读段。在多重测试校正(本杰明-霍赫伯格调整的p值<0.05)后在延伸的基因区中发现了总共86种显著不同的引发率(即,单链区);与原位海马神经元相比,分散皮层神经元有50个基因区域具有更大的CHeX-seq引发率,并且与分散培养物相比,有36个基因区域具有更大的原位引发率。

在分散培养物中皮层神经元的具有更大引发率的50个基因区域包括一组不同的基因功能。看起来在分散后生物学发生了偏移,其中分散细胞基因表现出更多针对与纤毛功能、膜功能和核苷酸结合相关联的GO注释基因的单链链型。由于这些功能类别中的许多基因参与酵母中的细胞形状(Hayles等人,2013),所以这些数据表明,在细胞分散时,形状改变基因可能被活化。当检查到这50个基因区域与来自分散细胞的单细胞转录组对应时,在分散细胞中显示较高读段回收的基因中的两个基因是ACOX3(酰基-辅酶A氧化酶3,这是一种在过氧化物酶体中起作用的酶(Vanhooren等人,1996))和SUDS 3(HDAC1依赖性SIN3A共阻遏物络合物的亚单位(Fleischer等人,2003))。SUDS3被认为通过调节染色质结构来增强HDAC1的活性,从而抑制转录。有可能SUDS3蛋白在分散的细胞中增加,并且将在分散时起作用以减少开放染色质位点的数量。对于切片海马神经元中鉴定出的大量非转录CHeX-seq可及的单链开放染色质位点来说,这可能尤其如此。

原位海马细胞中引发率较高的36个基因区域集中在线粒体编码基因上,其中37个线粒体编码基因中有27个线粒体基因显示出显著差异(表2A和表2B)。线粒体DNA已在其他开放染色质测定中被注意到,但通常已被取出用于细胞核DNA分析(Montefiori等人,2017)。线粒体DNA不像细胞核DNA那样组织成染色质,而是具有被动态调节和转录的类核结构(含有单链DNA区域)(Marom等人,2019;Kucej等人,2008;Tomaska等人,2001)。对于这些基因区域,来自固定切片的神经元显示每个细胞的每个基因平均有15.7个CHeX-seq引发事件,范围从6.8个事件/细胞到32.1个事件/细胞。与这些值相比,对于来自培养物的神经元,发现每个细胞的每个线粒体编码的基因平均只有0.016个引发事件。由于CHeX-seq引发受单链区域的间隔的限制,所以一般来说预期每个基因区域不会有非常大量的引发事件,并且这些事件被假设为代表在给定细胞中的多个线粒体中发现的单链DNA。这些结果表明,在培养物的神经元中,线粒体活性、线粒体复制和/或基因转录可能降低。在组织切片中有四个细胞(单细胞样本),在这27个线粒体基因区域中也几乎没有CHeX-seq引发,与此同时显示出来自其他基因区域的强信号,表明线粒体DNA活性状态在单独细胞之间是异质的。

实施例6-小鼠和人星形胶质细胞启动子开放性

对培养两周的新生小鼠和成体人星形胶质细胞进一步执行测定,以与相同物种和年龄的神经元进行比较(图23A)。将CHeX-seq读段映射到带注释的基因模型,与来自同一物种的神经元相比,星形胶质细胞在基因的启动子区中具有更高比例的CHeX-seq读段(图23B)。这些数据与早期的研究(Thurman等人,2012)一致,表明与终末分化的细胞(神经元)相比,分裂细胞(星形胶质细胞)的染色质景观在基因的启动子区周围具有更多的DNA酶I敏感性开放染色质。这是特别有趣的,因为所述细胞跨越了很长的年龄跨度,其中小鼠细胞是新生的,而人细胞来自50-70岁范围的受试者。如上所述,启动子近端的CHeX-seq引发更能指示基因转录。

实施例7-跨小鼠基因组的开放染色质景观

由于CHeX-seq提供了单链开放染色质的全基因组视图,因此测试了小鼠神经元与星形胶质细胞之间是否存在不同的染色体可及性。在图18中每个单独细胞(列)的所有染色体的CHeX-seq读段密度(行)被绘制为热图。在查看这些数据时,出现了以下两件事情:1)不同的细胞类型跨染色体显示出不同的单链开放染色质密度,并且2)在一种细胞类型中,存在可能对应于亲代细胞类型的亚型的细胞分组。原位定位的海马神经元(图18,最右边的小图)在1号、2号和9号染色体上具有比分散皮层神经元或星形胶质细胞更大的读段密度。此外,这些原位神经元有三个亚分组,其中一个组显示较低的9号染色体读段密度(绿色矩形突出显示树状图分组)。星形胶质细胞同样可以分成至少三组(图18,最左边的小图),其中鉴别因素中的一个鉴别因素是11号染色体上的开放染色质的密度。由于每个分组中都有来自多种动物的细胞,因此分组不是由于批次效应。这些数据突出显示了基于开放染色质状态来表征细胞类型的能力。为什么染色体开放染色质景观在细胞之间表现出差异尚不清楚,但这些数据反映了基因组的活力。未来的研究将引出单链开放染色质D N A动力学的更精细的详细图谱。

实施例8-固定组织切片中免疫鉴定的细胞中的CHeX-seq和LT-TISA

使用穿过小鼠脑的组织切片来对固定切片中的细胞执行CHeX-seq和LT-TISA程序。对三种细胞类型进行评定,包括神经元(所有神经元均具有MAP2(Izant和McIntosh,1980)染色、通过GAD(Xu等人,2010)染色鉴定出的抑制神经元,以及通过胆碱乙酰转移酶(choline acetyltransferase,ChAT)(Houser等人,1985)染色鉴定出的胆碱能神经元、通过GFAP(Eng等人,2000)染色鉴定出的神经胶质细胞,以及通过用内皮屏障抗原(endothelial barrier antigen,EBA)免疫染色(Ghabriel等人,2000)鉴定出的内皮细胞。针对这些抗原中的每种抗原的抗体都是易获得的,并已被证明可用于对其指定细胞类型的轮廓和细胞质进行染色。如图11所示,用针对两种或更多种抗原的抗体同时对11个切片进行染色,然后进行CHeX-seq和/或LT-TISA寡核苷酸杂交。如图11所示,使用三种荧光团(两种用于MAP2和GFAP抗体,并且一种用于CHeX-seq寡核苷酸),因此不同荧光团的荧光发射光谱是不同的,以便可以区分它们。将进行各种优化,包括不同的切片厚度、不同的固定剂和固定时间、各种化学检测器的孵育时间、CHeX-seq和LT-TISA cDNA合成方案的优化,以及光学洗涤的优化,以便可以分析多个细胞。

一些实施方式包括使用对照条件下的神经元和神经胶质之后是氟西汀处理的细胞中的CHeX-seq分析对染色质景观进行分析。首先评定特定细胞类型的汇集细胞,然后评定单细胞,以评定细胞间反应性的变化。这些相同的处理是通过以下方式来执行的:将细胞质RNA的LT-TISA与CHeX-seq多重化,使得染色质状态和细胞质RNA丰度都将被确定。为此,从用氟西汀处理14天的小鼠制备原代细胞培养物,14天是临床效果显现所需的时间。来自这些原代培养物的单个神经元都进行CHeX-seq。一旦生成了CHeX-seq基线数据,就将CHeX-seq与LT-TISA细胞质RNA检测组合,以评定RNA丰度与经处理的细胞的开放单链染色质状态之间的相关性。

实施例9-选定基因周围的3D染色质生态位表征

在一些实施方式中,可以评定与抑郁症相关联并且已知对氟西汀有反应的特定基因周围的3D染色质变化的时间过程(图12)。增强子元件和调控这些特定基因的其他基因组/染色质调节区将是可检测的,因为它们的效应被认为是借助于将调节元件定位在被调节的基因附近的基因组组织来发挥的。具体地,使用对14天氟西汀处理的染色质反应性的基础知识,选择特异反应基因以用于更详细地分析这些基因周围的3D染色质生态位修饰的时间过程。总CHeX-seq突出显示了染色质的所有开放区域,但是除了通过顺式基因定位之外,不可能定位出哪些开放区域彼此靠近。由于染色体包装可以定位来自远染色体区域(包括目的基因附近的不同染色体)的基因,因此限定目的基因附近的染色体区域是重要的。此外,监测在从氟西汀治疗开始到2周的时间内的染色质生态位动力学将详细说明这些重要的调节生态位是如何随时间推移变化的。在CHeX-seq的这种基因特异性迭代中,使用固定的细胞/组织进行荧光原位杂交以检测特定神经元基因的位置。这种特定基因FISH信号用于仅在FISH聚焦的基因处靶向CHeX-seq寡核苷酸的多光子活化。

在一组这样的实验中,使用指向靠近CREB基因的TSS的开放染色质区域的FISH探针,其他人已经表明该开放染色质区域受抗抑郁药活性的调节(Zhang等人,2015;Duman,2013)。这种探针将在CREB TSS处产生可以被成像的荧光信号。在CREB TSS FISH之后,添加的CHeX-seq寡核苷酸将扩散到整个组织中并与细胞染色质的开放区域结合。为了具体评定CREB基因TSS周围的染色质结构,对CREB FISH成像,随后使用双光子照射来在CREB TSSFISH荧光位点处局部活化CHeX-seq寡核苷酸(图6)。CREB基因附近活化的CHeX-seq寡核苷酸从其3'羟基延伸,从而允许在CREB TSS附近的单链开放染色质位点处进行DNA合成。这种基因生态位特异性CHeX-seq程序将鉴定出与CREB FISH位点附近的染色质区域对应的序列,所述序列将是CREB基因转录的基因组调控元件(包括增强子)的候选物。这种方法可推广到任何原位杂交指定的基因组DNA位点。此外,它可用于使用光学清洗进行更高通量的数据生成。这种测定也可开发用于其他与抗抑郁药效应相关联的其他遗传基因座。

***

根据本公开,本文公开和要求保护的所有方法都可以在没有过度实验的情况下进行和执行。虽然已经根据优选实施方式描述了本发明的组合物和方法,但是对于本领域技术人员来说将显而易见的是,在不脱离本发明的概念、精神和范围的情况下,可以对本文所述的方法和方法的步骤或步骤顺序进行变化。更具体地,将显而易见的是,某些化学上和生理上均相关的试剂可以替代本文所述的试剂,与此同时将获得相同或相似的结果。对本领域技术人员来说显而易见的所有此类类似的替代和修改被认为是在由所附权利要求限定的本发明的精神、范围和概念内。

参考文献

在本申请中引用的以下参考文献和任何其他参考文献,在它们提供了示例性程序或其它细节来补充本文所阐述的那些程序和细节的程度上以引用方式具体并入本文。

Barnes et al.,“Crystal Structure of a Transcribing RNA Polymerase IIComplex Reveals a Complete Transcription Bubble,”Mol.Cell,59:258-269,2015.

Berton et al.,“Essential role of BDNF in the mesolimbic dopaminepathway in social defeat stress,”Science,311:864-868,2006.

Bieberstein et al.,“First exon length controls active chromatinsignatures and transcription,”Cell Rep.,2:62-68,2012.

Bjursell et al.,“Long regions of single-stranded DNA in human cells,”Nature,280:420-423,1979.

Borrelli et al.,“Decoding the epigenetic language of neuronalplasticity,”Neuron,60:961-974,2008.

Boyle et al.,“High-resolution mapping and characterization of openchromatin across the genome,”Cell,132:311-322,2008.

Buchhalter&Dichter,“Electrophysiological comparison of pyramidal andstellate nonpyramidal neurons in dissociated cell culture of rathippocampus,”Brain Res.Bull.,26:333-338,1991.

Buenrostro et al.,“Transposition of native chromatin for fast andsensitive epigenomic profiling of open chromatin,DNA-binding proteins andnucleosome position,”Nat.Methods,10:1213-1218,2013.

Buenrostro et al.,“Single-cell chromatin accessibility revealsprinciples of regulatory variation,”Nature,523:486-490,2015.

Chen et al.,“Variant GADL1 and response to lithium therapy in bipolarI disorder,”N.Engl.J.Med.,370:119-128,2014.

Choi et al.,“Programmable in situ amplification for multiplexedimaging of mRNA expression,”Nat.Biotechnol.,28:1208-1212,2010.

Choi et al.,“Mapping a multiplexed zoo of mRNA expression,”Development,143:3632-3637,2016.

Clark et al.,“scNMT-seq enables joint profiling of chromatinaccessibility DNA methylation and transcription in single cells,”Nat.Commun.,9:781,2018.

Core et al.,“Analysis of nascent RNA identifies a unifiedarchitecture of initiation regions at mammalian promoters and enhancers,”Nat.Genet.,46:1311-1320,2014.

Cornelison&Wold,“Single-cell analysis of regulatory gene expressionin quiescent and activated mouse skeletal muscle satellite cells,”Developmental Biology,191:270-283,1997.

Costa et al.,“Epigenetic targets in GABAergic neurons to treatschizophrenia,”Adv.Pharmacol.,54:95-117,2006.

Crino et al.,“Embryonic neuronal markers in tuberous sclerosis:single-cell molecular pathology,”Proc.Natl.Acad.Sci.U.S.A.,93:14152-14157,1996.

Cusanovich et al.,“Multiplex single cell profiling of chromatinaccessibility by combinatorial cellular indexing,”Science,348:910-914,2015.

Danko et al.,“Identification of active transcriptional regulatoryelements from GRO-seq data,”Nat.Methods,12:433-438,2015.

Dekker et al.,“Exploring the three-dimensional organization ofgenomes:interpreting chromatin interaction data,”Nat.Rev.Genet.,14:390-403,2013.

de la Torre-Ubieta&Bonni,“Transcriptional regulation of neuronalpolarity and morphogenesis in the mammalian brain,”Neuron,72:22-40,2011.

de Wit&de Laat,“A decade of 3C technologies:insights into nuclearorganization,”Genes Dev.,26:11-24,2012.

Dueck et al.,“Deep sequencing reveals cell-type-specific patterns ofsingle-cell transcriptome variation,”Genome Biol.,16:122,2015.

Dueck et al.,“Variation is function:Are single cell differencesfunctionally important?:Testing the hypothesis that single cell variation isrequired for aggregate function,”Bioessays,38:172-180,2016.

Duman,“Remodeling chromatin and synapses in depression,”Nat.Med.,19:267,2013.

Eberwine et al.,“Complementary DNA synthesis in situ:methods andapplications,”Methods Enzymol.,216:80-100,1992.

Eberwine et al.,“Analysis of gene expression in single live neurons,”Proc.Natl.Acad.Sci.U.S.A.,89:3010-3014,1992.

Ellis et al.,“Transcriptome analysis of cortical tissue revealsshared sets of downregulated genes in autism and schizophrenia,”Transl.Psychiatry,6:e817,2016.

Eng et al.,“Glial fibrillary acidic protein:GFAP-thirty-one years(1969-2000),”Neurochem.Res.,25:1439-1451,2000.

Feng et al.,“Identifying ChIP-seq enrichment using MACS,”Nat.Protoc.,7:1728-1740,2012.

Fishilevich et al.,“GeneHancer:genome-wide integration of enhancersand target genes in GeneCards,”Database(Oxford),2017:bax028,2017.

Fleischer et al.,“Identification and characterization of three newcomponents of the mSin3A corepressor complex,”Mol.Cell Biol.,23:3456-3467,2003.

Frankle et al.,“The synaptic hypothesis of schizophrenia,”Neuron,39:205-216,2003.

Fullard et al.,“Open chromatin profiling of human postmortem braininfers functional roles for non-coding schizophrenia loci,”Hum.Mol.Genet.,26:1942-1951,2017.

Ghabriel et al.,“Immunological targeting of the endothelial barrierantigen(EBA)in vivo leads to opening of the blood-brain barrier,”Brain Res.,878:127-135,2000.

Gribble et al.,“Cytogenetics of the chronic myeloid leukemia-derivedcell line K562:karyotype clarification by multicolor fluorescence in situhybridization,comparative genomic hybridization,and locus-specificfluorescence in situ hybridization,”Cancer Genet.Cytogenet.,118:1-8,2000.

Guidotti et al.,“Epigenetic GABAergic targets in schizophrenia andbipolar disorder,”Neuropharmacology,60:1007-1016,2011.

Hashimshony et al.,“CEL-Seq:single-cell RNA-Seq by multiplexed linearamplification,”Cell Rep.,2:666-673,2012.

Hayles et al.,“A genome-wide resource of cell cycle and cell shapegenes of fission yeast,”Open Biol.,3:130053,2013.

Hegedus et al.,“Endogenous single-strand DNA breaks at RNA polymeraseII promoters in Saccharomyces cerevisiae,”Nucleic Acids Res.,46:10649-10668,2018.

Heinz et al.,“Simple combinations of lineage-determiningtranscription factors prime cis-regulatory elements required for macrophageand B cell identities,”Mol.Cell.,38:576-589,2010.

Heller et al.,“Locus-specific epigenetic remodeling controlsaddiction-and depression-related behaviors,”Nat.Neurosci.,17:1720-1727,2014.

Houser et al.,“Immunocytochemical localization of cholineacetyltransferase in rat cerebral cortex:a study of cholinergic neurons andsynapses,”J.Comp.Neurol.,234:17-34,1985.

Huang&Akbarian,“GAD1 mRNA expression and DNA methylation inprefrontal cortex of subjects with schizophrenia,”PLoS One,2:e809,2007.

Insel&Wang,“Rethinking mental illness,”JAMA,303:1970-1971,2010.

Islam et al.,“Characterization of the single-cell transcriptionallandscape by highly multiplex RNA-seq,”Genome Res.,21:1160-1167,2011.

Islam et al.,“Highly multiplexed and strand-specific single-cell RNA5′end sequencing,”Nat.Protoc.,7:813-828,2012.

Izant&McIntosh,“Microtubule-associated proteins:a monoclonal antibodyto MAP2 binds to differentiated neurons,”Proc.Natl.Acad.Sci.U.S.A.,77:4741-4745,1980.

Kent et al.,“The human genome browser at UCSC,”Genome Res.,12:996-1006,2002.

Khan&Zhang,“dbSUPER:a database of super-enhancers in mouse and humangenome,”Nucleic Acids Res.,44:D164-171,2016.

Kim&Eberwine,“RNA:state memory and mediator of cellular phenotype,”Trends Cell Biol.,20:311-318,2010.

Kolovos et al.,“Targeted Chromatin Capture(T2C):a novel highresolution high throughput method to detect genomic interactions andregulatory elements,”Epigenetics Chromatin,7:10,2014.

Kouzine et al.,“Permanganate/S1 Nuclease Footprinting Reveals Non-BDNA Structures with Regulatory Potential across a Mammalian Genome,”CellSyst.,4:344-356 e347,2017.

Kozlenkov et al.,“Differences in DNA methylation between humanneuronal and glial cells are concentrated in enhancers and non-CpG sites,”Nucleic Acids Res.,42:109-127,2014.

Kozlenkov et al.,“Substantial DNA methylation differences between twomajor neuronal subtypes in human brain,”Nucleic Acids Res.,44:2593-2612,2016.

Kucej et al.,“Mitochondrial nucleoids undergo remodeling in responseto metabolic cues,”J.Cell Sci.,121:1861-1868,2008.

Kumar et al.,“Chromatin remodeling is a key mechanism underlyingcocaine-induced plasticity in striatum,”Neuron,48:303-314,2005.

Lai et al.,“Integrator mediates the biogenesis of enhancer RNAs,”Nature,525:399-403,2015.

Lee et al.,“Fluorescent in situ sequencing(FISSEQ)of RNA for geneexpression profiling in intact cells and tissues,”Nat.Protoc.,10:442-458,2015.

Lladser et al.,“RNA Pol II transcription model and interpretation ofGRO-seq data,”J.Math Biol.,74:77-97,2017.

Louder et al.,“Structure of promoter-bound TFIID and model of humanpre-initiation complex assembly,”Nature,531:604-609,2016.

Marom et al.,“mtDNA Chromatin-like Organization Is GraduallyEstablished during Mammalian Embryogenesis,”iScience,12:141-151,2019.

Martinowich et al.,“DNA methylation-related chromatin remodeling inactivity-dependent BDNF gene regulation,”Science,302:890-893,2003.

Maurano et al.,“Systematic localization of common disease-associatedvariation in regulatory DNA,”Science,337:1190-1195,2012.

McCarthy et al.,“De novo mutations in schizophrenia implicatechromatin remodeling and support a genetic overlap with autism andintellectual disability,”Mol.Psychiatry,19:652-658,2014.

Miyashiro et al.,“On the nature and differential distribution ofmRNAs in hippocampal neurites:implications for neuronal functioning,”Proc.Natl.Acad.Sci.U.S.A.,91:10800-10804,1994.

Miyashiro et al.,“RNA cargoes associating with FMRP reveal deficitsin cellular functioning in Fmr1 null mice,”Neuron,37:417-431,2003.

Miyashiro&Eberwine,“Identification of RNA cargoes by antibody-positioned RNA amplification,”Cold Spring Harb.Protoc.,2015:434-441,2015.

Mo et al.,“Epigenomic Signatures of Neuronal Diversity in theMammalian Brain,”Neuron,86:1369-1384,2015.

Moffitt&Zhuang,“RNA Imaging with Multiplexed Error-RobustFluorescence In Situ Hybridization(MERFISH),”Methods Enzymol.,572:1-49,2016.

Montefiori et al.,“Reducing mitochondrial reads in ATAC-seq usingCRISPR/Cas9,”Sci.Rep.,7:2451,2017.

Rao et al.,“A 3D map of the human genome at kilobase resolutionreveals principles of chromatin looping,”Cell,159:1665-1680,2014.

Renthal et al.,“Histone deacetylase 5 epigenetically controlsbehavioral adaptations to chronic emotional stimuli,”Neuron,56:517-529,2007.

Rotem et al.,“Single-cell ChIP-seq reveals cell subpopulationsdefined by chromatin state,”Nat.Biotechnol.,33:1165-1172,2015.

Roussos et al.,“A role for noncoding variation in schizophrenia,”CellRep.,9:1417-1429,2014.

Ruzicka et al.,“Circuit-and Diagnosis-Specific DNA MethylationChanges at gamma-Aminobutyric Acid-Related Genes in Postmortem HumanHippocampus in Schizophrenia and Bipolar Disorder,”JAMA Psychiatry,72:541-551,2015.

SantaLucia&Hicks,“The thermodynamics of DNA structural motifs,”Annu.Rev.Biophys.Biomol.Struct.,33:415-440,2004.

Scheer et al.,“High sensitivity immunolocalization of double andsingle-stranded DNA by a monoclonal antibody,”Eur.J.Cell Biol.,43:358-371,1987.

Seifuddin et al.,“Systematic review of genome-wide gene expressionstudies of bipolar disorder,”BMC Psychiatry,13:213,2013.

Shah et al.,“seqFISH Accurately Detects Transcripts in Single Cellsand Reveals Robust Spatial Organization in the Hippocampus,”Neuron,94:752-758e1,2017.

Sharma et al.,“Valproic acid and chromatin remodeling inschizophrenia and bipolar disorder:preliminary results from a clinicalpopulation,”Schizophr.Res.,88:227-231,2006.

Sherwood et al.,“Discovery of directional and nondirectional pioneertranscription factors by modeling DNase profile magnitude and shape,”Nat.Biotechnol.,32:171-178,2014.

Simonis et al.,“Nuclear organization of active and inactive chromatindomains uncovered by chromosome conformation capture-on-chip(4C),”Nat.Genet.,38:1348-1354,2006.

Spaethling et al.,“Primary Cell Culture of Live NeurosurgicallyResected Aged Adult Human Brain Cells and Single Cell Transcriptomics,”CellRep.,18:791-803,2017.

Sun et al.,“ACF chromatin-remodeling complex mediates stress-induceddepressive-like behavior,”Nat.Med.,21:1146-1153,2015.

Szlachta et al.,“Alternative DNA secondary structure formationaffects RNA polymerase II promoter-proximal pausing in human,”Genome Biol.,19:89,2018.

Tay et al.,“Single-cell NF-kappaB dynamics reveal digital activationand analogue information processing,”Nature,466:267-271,2010.

Tecott et al.,“In situ transcription:specific synthesis ofcomplementary DNA in fixed tissue sections,”Science,240:1661-1664,1988.

Thurman et al.,“The accessible chromatin landscape of the humangenome,”Nature,489:75-82,2012.

Tomaska et al.,“Mitochondrial single-stranded DNA-binding proteins:insearch for new functions,”Biol.Chem.,382:179-186,2001.

Tsankova et al.,“Epigenetic regulation in psychiatric disorders,”Nat.Rev.Neurosci.,8:355-367,2007.

Van Gelder et al.,“Amplified RNA synthesized from limited quantitiesof heterogeneous cDNA,”Proc.Natl.Acad.Sci.U.S.A.,87:1663-1667,1990.

Vanhooren et al.,“Mammalian peroxisomal acyl-CoA oxidases.I.Molecularcharacterization of rat pristanoyl-CoA oxidase,”Ann.N.Y.Acad.Sci.,804:674-675,1996.

Varodayan&Harrison,“HSF1 transcriptional activity mediates alcoholinduction of Vamp2 expression and GABA release,”Front.Integr.Neurosci.,7:89,2013.

Vasquez et al.,“Manipulating the mammalian genome by homologousrecombination,”Proc.Natl.Acad.Sci.U.S.A.,98:8403-8410,2001.

Vialou et al.,“Epigenetic mechanisms of depression and antidepressantaction,”Annu.Rev.Pharmacol.Toxicol.,53:59-87,2013.

Visel et al.,“VISTA Enhancer Browser--a database of tissue-specifichuman enhancers,”Nucleic Acids Res.,35:D88-92,2007.

Wang et al.,“A source of the single-stranded DNA substrate foractivation-induced deaminase during somatic hypermutation,”Nat.Commun.,5:4137,2014.

Wei et al.,“Functional consequences of bidirectional promoters,”Trends Genet.,27:267-276,2011.

Wu et al.,“Quantitative assessment of single-cell RNA-sequencingmethods,”Nat.Methods,11:41-46,2014.

Xiao et al.,“The DNA methylome and transcriptome of different brainregions in schizophrenia and bipolar disorder,”PLoS One,9:e95875,2014.

Xu et al.,“Immunochemical characterization of inhibitory mousecortical neurons:three chemically distinct classes of inhibitory cells,”J.Comp.Neurol.,518:389-404,2010.

Yu et al.,“Chromatin dynamics during the differentiation of long-termhematopoietic stem cells to multipotent progenitors,”Blood Adv.,1:887-898,2017.

Zeisel et al.,“Molecular Architecture of the Mouse Nervous System,”Cell,174:999-1014 e1022,2018.

Zhang et al.,“Increased Variability of Genomic Transcription inSchizophrenia,”Sci.Rep.,5:17995,2015.

Zhao et al.,“CrossMap:a versatile tool for coordinate conversionbetween genome assemblies,”Bioinformatics,30:1006-1007,2014.

Zhou&Paull,“Direct measurement of single-stranded DNA intermediatesin mammalian cells by quantitative polymerase chain reaction,”Anal Biochem.,479:48-50,2015.

Zhu et al.,“Genome-wide chromatin state transitions associated withdevelopmental and environmental cues,”Cell,152:642-654,2013.

Ziller et al.,“Dissecting neural differentiation regulatory networksthrough epigenetic footprinting,”Nature,518:355-359,2015.

序列表

<110> 安捷伦科技有限公司(Agilent Technologies, Inc.)

宾西法尼亚大学理事会(The Trustees Of The University of Pennsylvania)

<120> 用于单细胞中染色质和基因表达分析的组合物和方法

<130> 20190021-04 (AGLT.P0014WO)

<140> 尚未分配

<141> 2020-01-07

<150> US 62/898,824

<151> 2019-09-11

<150> US 62/789,073

<151> 2019-01-07

<160> 19

<170> PatentIn第3.5版

<210> 1

<211> 63

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成寡核苷酸

<220>

<221> N_区域

<222> (45)..(59)

<223> n是任何核苷酸

<220>

<221> misc_特征

<222> (45)..(59)

<223> n是a、c、g、或t

<400> 1

ggagaattgt aatacgactc actataggga gacgcgtgat cacgnnnnnn nnnnnnnnnt 60

gtg 63

<210> 2

<211> 60

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成寡核苷酸

<220>

<221> N_区域

<222> (45)..(59)

<223> n是任何核苷酸

<220>

<221> misc_特征

<222> (45)..(59)

<223> n是a、c、g、或t

<400> 2

ggagaattgt aatacgactc actataggga gacgcgtgat cacgnnnnnn nnnnnnnnnt 60

<210> 3

<211> 62

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成寡核苷酸

<220>

<221> N_区域

<222> (4)..(18)

<223> n是任何核苷酸

<220>

<221> misc_特征

<222> (4)..(18)

<223> n是a、c、g、或t

<400> 3

aaannnnnnn nnnnnnnncg tgatcacgcg tctccctata gtgagtcgta ttacaattct 60

cc 62

<210> 4

<211> 47

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成寡核苷酸

<400> 4

ggagaattgt aatacgactc actataggga gacgcgtgat cacgaca 47

<210> 5

<211> 44

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成寡核苷酸

<400> 5

cgtgatcacg cgtctcccta tagtgagtcg tattacaatt ctcc 44

<210> 6

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成寡核苷酸

<220>

<221> N_区域

<222> (8)..(22)

<223> n是任何核苷酸

<220>

<221> misc_特征

<222> (8)..(22)

<223> n是a、c、g、或t

<400> 6

atgaggannn nnnnnnnnnn nnt 23

<210> 7

<211> 28

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成寡核苷酸

<220>

<221> N_区域

<222> (4)..(18)

<223> n是任何核苷酸

<220>

<221> misc_特征

<222> (4)..(18)

<223> n是a、c、g、或t

<400> 7

aaannnnnnn nnnnnnnntc ctcattgt 28

<210> 8

<211> 18

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成寡核苷酸

<400> 8

tagggagacg cgtgatca 18

<210> 9

<211> 18

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成寡核苷酸

<400> 9

tagggagacg cgtgagtt 18

<210> 10

<211> 34

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成寡核苷酸

<400> 10

gcgccattga ccaggatttt cccccccccc cccc 34

<210> 11

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成寡核苷酸

<400> 11

gcgccattga ccaggatttt c 21

<210> 12

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成寡核苷酸

<400> 12

tccttagctg ttgcagaaat 20

<210> 13

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成寡核苷酸

<400> 13

cgttcagttg atgcagagtg 20

<210> 14

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成寡核苷酸

<400> 14

agaagcagct tcaaacctgc 20

<210> 15

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成寡核苷酸

<400> 15

aagttagctt tacagtgggc 20

<210> 16

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成寡核苷酸

<400> 16

ggtgttggtt ctcttaatct 20

<210> 17

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成寡核苷酸

<400> 17

atttagttgg ggcatttcac 20

<210> 18

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成寡核苷酸

<400> 18

ttatggtggg tcatacggta 20

<210> 19

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成寡核苷酸

<400> 19

tagtgtaagg agtatggggg 20

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号