首页> 中国专利> 依靠人工反式激活物的选择

依靠人工反式激活物的选择

摘要

一种用于选择基因组编辑细胞和/或用于在细胞群体中富集基因组编辑细胞的方法,其包括:(a)将至少一个第一组分、至少一个第二组分和至少一个第三组分引入细胞或细胞群体中;和(b)选择瞬时表达或瞬时上调编码选择子的核苷酸序列的基因组编辑细胞。

著录项

说明书

发明领域

本发明涉及用于选择基因组编辑细胞和/或在细胞群体中富集基因组编辑细胞的方法。本发明还涉及通过该方法产生的基因组编辑细胞群体、包含该基因组编辑细胞群体的药物组合物、基因组编辑细胞群体疗法(如基因疗法、造血干细胞移植、癌症治疗和组织修复)的用途以及治疗或预防病症,如X连锁SCID和皮肤病或视网膜疾病的方法,包括施用基因组编辑细胞群体的步骤。

发明背景

造血干细胞(HSC)基因疗法为受几种血液病和非血液病影响的患者提供了实质性的治疗益处。然而,半随机整合载体的使用仍然造成插入诱变和非生理转基因表达的风险。因此,HSC遗传工程的范围已经从基因替换扩大到靶向基因组编辑,这依赖于使用人工核酸酶对内源基因进行精确修饰。多年来,原始造血干/祖细胞(HSPC)中的基因编辑一直难以捉摸。事实上,这些细胞中DNA双链断裂(DSB)的诱导可触发凋亡、分化或衰老,并且其修复可通过非同源末端连接(NHEJ)而不是同源性定向DNA修复(HDR)进行,所述同源性定向DNA修复需要上调相关蛋白质机器和靶定细胞在细胞周期中的进展。

离体HSC培养、核酸酶设计和基因转移技术的显著进步已经使这些障碍得以部分克服,并为能够在免疫缺陷NSG小鼠中进行长期多谱系重建的人类HSPC进行靶向基因组编辑提供了明确的证据(Genovese et al.,2014)。最近,基因编辑试剂和程序的进一步优化显著改善了原始HSPC的基因靶向效率,在长期移植HSPC中平均实现了10-20%的基因标记(De Ravin et al.,2017;Dever et al.,2016;Wang et al.,2015)。预测这些水平的基因校正对于治疗某些疾病是安全有效的,例如在X连锁严重联合免疫缺陷(SCID-X1)的情况下,其中经编辑的后代相对于将未编辑的对应物具有选择性优势(Schiroli et al.,2017)。

然而,HSC基因编辑在适合更广泛的临床应用之前面临着一些挑战。特别是,改善更原始HSPC中基因编辑的效率以及经编辑的HSC的产量是至关重要的。尽管基因编辑方案的进一步改善可能增强基因靶向效率,但在施用前体外选择经校正的HSPC可以是获得纯编辑细胞群体的宝贵策略。当基因校正水平不足以实现病理过程的逆转时,基因编辑细胞的选择是困难的。此外,可能难以直接选择意图的编辑,因为经校正的基因可能不提供生长优势(例如发生在慢性肉芽肿病、地中海贫血、RAG1缺乏症等中)。此外,基因编辑的细胞可能不适合选择,因为其相关蛋白质产物在细胞内定位,或者蛋白质甚至可能不在HSPC中表达。

为了克服这些障碍,基因编辑可与可选择标志物,例如适合于FACS分选的荧光蛋白或抗药性蛋白的组成性表达相结合,然后进行药物处理以介导选择。然而,报告物基因的组成性表达可能具有免疫原性或对长期细胞存活力有害,因此潜在导致修饰细胞的丢失。最后,这些系统将导致选择原位和异位靶向插入两者,从而危及治疗和安全结果。

工程化转录反式激活物(ETT)的突破为精确调节意图基因的表达开辟了新的可能性。特别是,TALE和CRISPR/Cas系统已经通过将DNA结合域(DBD)或无催化活性的Cas9(dCas9)分别与单个或多个转录激活物域(如VP64和VPR)融合而工程化改造(Chavez etal,2015)。

Guo等人(2017,Protein Cell 8(5):379-393)讨论了一种上调人类多能干细胞(HPSC)中内源基因的系统。Guo等人(2017)公开了将多西环素(Dox)诱导型dCas9-VP64-p65-Rta和Tet反式激活物表达盒插入到AAVS1基因座的两个等位基因中,并且可以通过添加和撤消Dox精确且可逆地控制dCas9-VPR的水平。

Dever等人(2016,Nature 539(7629):384-389)讨论了通过使用Cas9核糖核蛋白和重组AAV6同源重组供体递送的组合进行的人类干细胞(HSC)中HBB基因的同源重组。Dever等人(2016)公开了包含tNGFR的AAV载体质粒。Dever等人(2016)讨论了使用tNGFR作为标志物富集HBB靶向性HSPC和抗NGFR磁珠分离。

Bak等人(2018,Nat Protoc 13(2):358-376)讨论了使用CRISPR/Cas9技术和重组AAV6同源供体递送通过同源重组编辑人类造血干细胞。Bak等人(2018)公开了报告物基因,例如GFP或截短的生长因子受体(tNGFR)。Bak等人(2018)讨论了流式细胞术以富集具有靶向整合的细胞。

US2015/0191744讨论了使用编码核酸酶缺陷型Cas9效应物域融合蛋白的慢病毒载体和包含与基因组靶标互补的至少一个sgRNA基因的慢病毒载体来修饰干细胞或祖细胞的转录调控的方法。US2015/0191744公开了一种Cas9-荧光蛋白融合蛋白。

本发明人已经开发了一种平台以在体内施用前实现基因编辑和编辑细胞的富集,从而提高基因疗法的功效,并潜在将其应用扩展到广泛的遗传疾病,包括那些未对校正的细胞赋予增殖生长优势的疾病。

发明概述

本发明人已开发出选择编辑细胞的方法,该方法偶联特定供体DNA载体设计(第一组分)与结合了核酸酶系统(第三组分)的工程化转录反式激活物(ETT)(第二组分)的使用以驱动经编辑的细胞的选择。本发明人利用就位重组(on-site recombination)后中性基因的瞬时表达作为选择标志物,例如细胞表面表达的突变低亲和力神经生长因子受体(ΔLNGFR),和编辑细胞的特异性选择。

本发明提供了用于选择基因组编辑细胞和/或在细胞群体中富集基因组编辑细胞的方法,其包括:

(a)将至少一个第一组分、至少一个第二组分和至少一个第三组分引入细胞(即起始细胞)或细胞群体(即起始细胞群体)中;和

(b)选择瞬时表达或瞬时上调编码选择子(selector)的核苷酸序列的基因组编辑细胞;

其中所述第一组分是供体报告物盒,其包含所述编码选择子的核苷酸序列和感兴趣的核苷酸序列(NOI);

其中所述第二组分是工程化转录反式激活物(ETT)多肽或编码ETT多肽的核苷酸序列;其中所述ETT多肽包含DNA结合域(DBD)和至少一个转录激活物(TA)域;

其中所述第三组分是核酸酶系统,所述核酸酶系统包含基因组靶向核酸酶和任选地引导RNA(gRNA),所述引导RNA包含至少一个靶向基因组序列;

其中所述ETT多肽瞬时存在于所述细胞或细胞群体中,或者所述编码ETT多肽的核苷酸序列在所述细胞或细胞群体中瞬时表达;和

其中所述细胞或细胞群体中所述核酸酶系统的存在使得能够将所述编码选择子的核苷酸序列(和任选地最小启动子)和NOI插入靶基因座中,并且其中所述ETT多肽的瞬时存在或所述编码ETT多肽的核苷酸序列的瞬时表达使得能够瞬时表达或瞬时上调所述编码选择子的插入核苷酸序列。

编码选择子的核苷酸序列的瞬时表达或瞬时上调使得能够特异性选择已经将编码选择子的核苷酸序列和感兴趣的核苷酸序列(NOI)插入靶基因座的细胞与尚未将编码选择子的核苷酸序列和感兴趣的核苷酸序列(NOI)插入靶基因座的细胞。

本发明提供了一种用于选择基因组编辑细胞和/或在细胞群体中富集基因组编辑细胞的方法,其包括:

(a)将至少一个第一组分、至少一个第二组分和至少一个第三组分引入细胞或细胞群体中;和

(b)选择瞬时表达或瞬时上调编码选择子的核苷酸序列的基因组编辑细胞;

其中所述第一组分是供体报告物盒,其包含所述编码选择子的核苷酸序列和感兴趣的核苷酸序列(NOI),以及任选地与调节元件可操作连接的最小启动子;

其中所述第二组分是工程化转录反式激活物(ETT)多肽或编码ETT多肽的核苷酸序列;其中所述ETT多肽包含DNA结合域(DBD)和至少一个转录激活物(TA)域;

其中所述第三组分是核酸酶系统,所述核酸酶系统包含基因组靶向核酸酶和任选地引导RNA(gRNA),所述引导RNA包含至少一个靶向基因组序列;

其中所述ETT多肽瞬时存在于所述细胞或细胞群体中,或者所述编码ETT多肽的核苷酸序列在所述细胞或细胞群体中瞬时表达;和

其中所述细胞或细胞群体中所述核酸酶系统的存在使得能够将所述编码选择子的核苷酸序列和NOI以及任选地与所述调节元件可操作连接的所述最小启动子插入靶基因座中,并且其中所述ETT多肽的瞬时存在或所述编码ETT多肽的核苷酸序列的瞬时表达使得能够瞬时表达或瞬时上调所述编码选择子的插入核苷酸序列,任选地当调节物存在于所述细胞或细胞群体中时或任选地当调节物不存在于所述细胞或细胞群体中时。

本发明提供了一种用于选择基因组编辑细胞和/或在细胞群体中富集基因组编辑细胞的方法,其包括:

(a)将至少一个第一组分、至少一个第二组分和至少一个第三组分引入细胞或细胞群体中;和

(b)选择瞬时表达或瞬时上调编码选择子的核苷酸序列的基因组编辑细胞;

其中所述第一组分是供体报告物盒,其包含所述编码选择子的核苷酸序列和感兴趣的核苷酸序列(NOI),以及与调节元件可操作连接的最小启动子;

其中所述第二组分是工程化转录反式激活物(ETT)多肽或编码ETT多肽的核苷酸序列;其中所述ETT多肽包含DNA结合域(DBD)和至少一个转录激活物(TA)域;

其中所述第三组分是核酸酶系统,所述核酸酶系统包含基因组靶向核酸酶和任选地引导RNA(gRNA),所述引导RNA包含至少一个靶向基因组序列;

其中所述ETT多肽瞬时存在于所述细胞或细胞群体中,或者所述编码ETT多肽的核苷酸序列在所述细胞或细胞群体中瞬时表达;和

所述细胞或细胞群体中所述核酸酶系统的存在使得能够将所述编码选择子的核苷酸序列、NOI以及与所述调节元件可操作连接的所述最小启动子插入靶基因座中,并且其中所述ETT多肽的瞬时存在或所述编码ETT多肽的核苷酸序列的瞬时表达使得当调节物存在于所述细胞或细胞群体中时能够瞬时表达或瞬时上调所述编码选择子的插入核苷酸序列。

本发明提供了一种用于选择基因组编辑细胞和/或在细胞群体中富集基因组编辑细胞的方法,其包括:

(a)将至少一个第一组分、至少一个第二组分和至少一个第三组分引入细胞或细胞群体中;和

(b)选择瞬时表达或瞬时上调编码选择子的核苷酸序列的基因组编辑细胞;

其中所述第一组分是供体报告物盒,其包含所述编码选择子的核苷酸序列和感兴趣的核苷酸序列(NOI),以及与调节元件可操作连接的最小启动子;

其中所述第二组分是工程化转录反式激活物(ETT)多肽或编码ETT多肽的核苷酸序列;其中所述ETT多肽包含DNA结合域(DBD)和至少一个转录激活物(TA)域;

其中所述第三组分是核酸酶系统,所述核酸酶系统包含基因组靶向核酸酶和任选地引导RNA(gRNA),所述引导RNA包含至少一个靶向基因组序列;

其中所述ETT多肽瞬时存在于所述细胞或细胞群体中,或者所述编码ETT多肽的核苷酸序列在所述细胞或细胞群体中瞬时表达;和

所述细胞或细胞群体中所述核酸酶系统的存在使得能够将所述编码选择子的核苷酸序列、NOI以及与所述调节元件可操作连接的所述最小启动子插入靶基因座中,并且其中所述ETT多肽的瞬时存在或所述编码ETT多肽的核苷酸序列的瞬时表达使得当调节物不存在于所述细胞或细胞群体中时能够瞬时表达或瞬时上调所述编码选择子的插入核苷酸序列。

本发明提供了一种用于选择基因组编辑细胞和/或在细胞群体中富集基因组编辑细胞的方法,其包括:

(a)将至少一个第一组分、至少一个第二组分和至少一个第三组分引入细胞或细胞群体中;和

(b)选择瞬时表达或瞬时上调编码选择子的核苷酸序列的基因组编辑细胞;

其中所述第一组分是供体报告物盒,其包含所述编码选择子的核苷酸序列和感兴趣的核苷酸序列(NOI),以及与调节元件可操作连接的最小启动子;

其中所述第二组分是工程化转录反式激活物(ETT)多肽或编码ETT多肽的核苷酸序列;其中所述ETT多肽包含DNA结合域(DBD)和至少一个转录激活物(TA)域;

其中所述第三组分是核酸酶系统,所述核酸酶系统包含基因组靶向核酸酶和任选地引导RNA(gRNA),所述引导RNA包含至少一个靶向基因组序列;

其中所述细胞或细胞群体中所述核酸酶系统的存在使得能够将所述编码选择子的核苷酸序列、NOI以及与所述调节元件可操作连接的所述最小启动子插入靶基因座中,并且其中细胞或细胞群体中调节物的瞬时表达使得当调节物存在于所述细胞或细胞群体中时能够瞬时表达或瞬时上调所述编码选择子的插入核苷酸序列。

本发明提供了一种用于选择基因组编辑细胞和/或在细胞群体中富集基因组编辑细胞的方法,其包括:

(a)将至少一个第一组分、至少一个第二组分和至少一个第三组分引入细胞或细胞群体中;和

(b)选择瞬时表达或瞬时上调编码选择子的核苷酸序列的基因组编辑细胞;

其中所述第一组分是供体报告物盒,其包含所述编码选择子的核苷酸序列和感兴趣的核苷酸序列(NOI),以及与调节元件可操作连接的最小启动子;

其中所述第二组分是工程化转录反式激活物(ETT)多肽或编码ETT多肽的核苷酸序列;其中所述ETT多肽包含DNA结合域(DBD)和至少一个转录激活物(TA)域;

其中所述第三组分是核酸酶系统,所述核酸酶系统包含基因组靶向核酸酶和任选地引导RNA(gRNA),所述引导RNA包含至少一个靶向基因组序列;

其中所述细胞或细胞群体中所述核酸酶系统的存在使得能够将所述编码选择子的核苷酸序列、NOI以及与所述调节元件可操作连接的所述最小启动子插入靶基因座中,并且其中细胞或细胞群体中调节物的瞬时表达使得当调节物不存在于所述细胞或细胞群体中时能够瞬时表达或瞬时上调所述编码选择子的插入核苷酸序列。

不希望受理论束缚,在细胞或细胞群体中调节物的瞬时存在可通过将调节物加入培养基,随后清洗细胞或细胞群体而发生。

在一个实施方案中,(在此称为依靠人工反式激活物的选择[SMrT]),第一组分包含供体报告物盒,其中选择子(例如突变的低亲和力神经生长因子受体[ΔLNGFR])的表达由应推定限制选择子的基础表达的最小启动子(例如巨细胞病毒[CMV]或合成启动子[T6-SK](Loew,Heinz,Hampf,Bujard,&Gossen,2010))驱动。第一组分包含同源臂(HA),其包含与靶基因座同源的核苷酸序列,这些HA使供体报告物盒能够通过同源性驱动修复(HDR)插入靶基因座中。供体报告物盒进一步包含与启动子可操作连接的NOI。ETT结合位点位于同源臂之外和最小启动子的上游。绝缘子元件也可以存在于盒中以限制完全有效的启动子对最小启动子的可能的增强子活性。在这种情况下,绝缘子元件可以源自CTCF依赖性或不依赖于CTCF的结合位点(Phillips-Cremins&Corces,2013)(图1A)。这种选择策略可用于将转基因表达盒靶向整合到基因组的中性区域(例如腺相关病毒整合位点1[AAVS1]),在那里可以实现持续的治疗性转基因表达,而不干扰相邻基因调节和表观遗传景观(Lombardo etal.,2011)。基因组的其他可能的中性区域可以是慢病毒载体的共同整合位点(CIS)(例如Biffi et al.,2013鉴定的那些)或其他可能在未来定义为基因组的“安全港”或中性区域的区域。

在一个实施方案中,(在此称为依靠人工反式激活物的选择[SMrT]),第一组分包含供体报告物盒,其中选择子(例如突变的低亲和力神经生长因子受体[ΔLNGFR])的表达由应推定限制选择子的基础表达的最小启动子(例如巨细胞病毒[CMV]或合成启动子[T6-SK](Loew,Heinz,Hampf,Bujard,&Gossen,2010))驱动。第一组分包含同源臂(HA),其包含与靶基因座同源的核苷酸序列,这些HA使供体报告物盒能够通过同源性驱动修复(HDR)插入靶基因座中。供体报告物盒进一步包含与启动子可操作连接的NOI。(任选地,盒进一步包含剪接供体位点和/或编码自切割2A肽或备选内部核糖体进入位点(IRES)元件的核苷酸序列。)供体报告物盒对靶基因座的插入校正遗传缺陷和/或将新功能引入内源基因。ETT结合位点位于同源臂之外和最小启动子的下游。绝缘子元件也可以存在于构建体中以限制完全有效的启动子对最小启动子的可能的增强子活性。在这种情况下,绝缘子元件可以源自CTCF依赖性或不依赖于CTCF的结合位点(Phillips-Cremins&Corces,2013)(图1A)。这种选择策略可用于将转基因表达盒靶向整合到基因组的中性区域(例如腺相关病毒整合位点1[AAVS1]),在那里可以实现持续的治疗性转基因表达,而不干扰相邻基因调节和表观遗传景观(Lombardo et al.,2011)。基因组的其他可能的中性区域可以是慢病毒载体的共同整合位点(CIS)(例如Biffi et al.,2013鉴定的那些)或其他可能在未来定义为基因组的“安全港”或中性区域的区域。在基因校正中,使用完全或部分野生型序列校正遗传缺陷或将新功能引入内源基因中(Schiroli et al.,2017)。

在另一个实施方案中,(本文称为依靠内源性受体人工反式激活的选择[SMrTER]),供体报告物盒包含:(i)感兴趣的核苷酸序列;ii)任选地剪接受体位点和/或编码自切割2A肽或备选地内部核糖体进入位点(IRES)元件的核苷酸序列;iii)编码选择子蛋白的cDNA(例如ΔLNGFR),任选地,编码选择子的核苷酸序列与最小启动子可操作连接;和iv)意图靶位点的同源臂(HA)。ETT结合位点位于内源基因的启动子附近,以便在靶向整合时瞬时增强(即瞬时上调)选择子(和经编辑的基因)的表达(图5A)。此策略可应用于选择经过特定基因校正的细胞。在这种情况下,选择子蛋白的基础表达取决于编辑基因的转录调控。为了降低选择子组成性表达的风险,可以将选择子与去稳定剂域(DD)融合(框内),这能够在没有特定稳定剂配体的情况下诱导选择子的蛋白酶体降解(Rakhit,Navarro,&Wandless,2014)。具体而言,去稳定剂域可以基于FKBP域(Banaszynski et al.,2006)、细菌DHFR蛋白(Iwamoto,

在另一个实施方案中,(在此称为依靠多西环素调节的人工反式激活的选择[SMArT-D]),第一组分包含供体报告物盒,其中选择子(例如GFP)的表达由推定应当限制选择子的基础表达的最小启动子(例如合成启动子[T6-SK](Loew,Heinz,Hampf,Bujard,&Gossen,2010))驱动,其中最小启动子与调节元件(例如四环素操纵基因(TetO)序列)可操作连接。调节元件通常在最小启动子的上游。ETT结合位点在调节元件内。不希望受到理论束缚,在Tet-Off系统中,ETT结合调节元件并且当选择子插入靶基因座中时激活最小启动子;当供体报告物盒尚未插入靶基因座时,调节物(如四环素或强力霉素(deoxycycline))的结合阻止ETT与调节元件的结合。不希望受到理论束缚,在Tet-On系统中,ETT结合调节元件并且当选择子插入靶基因座中时且存在调节物(如四环素或强力霉素)时激活最小启动子;当供体报告物盒已插入靶基因座时,调节物(如四环素或强力霉素)的结合使ETT能够与调节元件结合。第一组分进一步包含同源臂(HA),其包含与靶基因座同源的核苷酸序列,这些HA使供体报告物盒能够通过同源性驱动修复(HDR)插入靶基因座。绝缘子元件也可以存在于盒中以限制完全有效启动子对最小启动子的可能的增强子活性。在这种情况下,绝缘子元件可以源自CTCF依赖性或不依赖于CTCF的结合位点(Phillips-Cremins&Corces,2013)(图1A)。这种选择策略可用于将转基因表达盒靶向整合到基因组的中性区域(例如腺相关病毒整合位点1[AAVS1]),在那里可以实现持续的治疗性转基因表达,而不干扰相邻基因的调控和表观遗传景观(Lombardo et al.,2011)。基因组的其他可能的中性区域可以是慢病毒载体的共同整合位点(CIS)(例如Biffi et al.,2013鉴定的那些)或其他可能在未来定义为基因组的“安全港”或中性区域的区域。

一方面,本发明提供了通过根据本发明的方法产生的基因组编辑细胞群体。

通过根据本发明的方法产生的基因组编辑细胞群体包含编码选择子的核苷酸序列。瞬时表达编码选择子的核苷酸序列,使得在选择细胞后不再表达编码选择子的核苷酸序列。

通过根据本发明的方法产生的基因组编辑细胞群体富含能够表达感兴趣核苷酸(NOI)的细胞。

在另一方面,本发明提供药物组合物,其包含根据本发明的基因组编辑细胞群体。

在广义的方面,本发明提供了根据本发明的基因组编辑细胞群体,用于疗法。

另一方面,本发明提供了根据本发明的基因组编辑细胞群体,用于基因疗法、造血干细胞移植、癌症治疗和/或组织修复。

在另一方面,本发明提供了根据本发明的基因组编辑细胞群体,用于治疗或预防X连锁严重联合免疫缺陷(SCID-X1)、皮肤病和/或视网膜疾病.

在另一方面,本发明提供了根据本发明的基因组编辑细胞群体,用于治疗或预防单基因病症,例如大疱性表皮松解和/或视网膜色素变性和/或高IgM(HIGM)综合征。

在另一方面,本发明提供了根据本发明的基因组编辑细胞群体,用于治疗或预防高IgM(HIGM)综合征。

在广义的方面,本发明提供了根据本发明的基因组编辑细胞群体用于疗法的用途。

本发明另一方面提供了根据本发明的基因组编辑细胞群体用于基因疗法、造血干细胞移植、癌症治疗和/或组织修复的用途。

在另一方面,本发明提供了根据本发明的基因组编辑细胞群体在制备用于治疗或预防X连锁SCID、皮肤病和/或视网膜疾病的药物中的用途。

在另一方面,本发明提供了根据本发明的基因组编辑细胞群体在制备用于治疗或预防单基因病症,如大疱性表皮松解和/或视网膜色素变性和/或高IgM(HIGM)综合征的药物中的用途。

在另一方面,本发明提供了根据本发明的基因组编辑细胞群体在制备用于治疗或预防高IgM(HIGM)综合征的药物中的用途。

在广义的方面,本发明提供了一种治疗方法,包括将根据本发明的基因组编辑细胞群体施用于受试者的步骤。

在另一方面,本发明提供了一种基因疗法、造血干细胞移植、癌症治疗和/或组织修复的方法,包括将根据本发明的基因组编辑细胞群体施用于受试者的步骤。

在另一方面,本发明提供了一种用于治疗或预防X连锁SCID、皮肤病和/或视网膜疾病的方法,其包括将根据本发明的基因组编辑细胞群体施用于受试者的步骤,其中受试者患有X连锁SCID、皮肤病和/或视网膜病。

在另一方面,本发明提供了一种用于治疗或预防单基因病症,如大疱性表皮松解和/或视网膜色素变性和/或高IgM(HIGM)综合征的的方法,包括将根据本发明的基因组编辑细胞群体施用于受试者的步骤,其中受试者具有单基因病症。

在另一方面,本发明提供了一种用于治疗或预防高IgM(HIGM)综合征的方法,包括将根据本发明的基因组编辑细胞群体施用于受试者的步骤,其中受试者具有高IgM(HIGM)综合征。

附图简述

图1.依靠工程化转录反式激活物对稳定整合于AAVS1基因座中的报告物基因进行瞬时激活。A)图1Ai:用于富集AAVS1编辑细胞的SMrT策略描述;图1Aii:IL2RG编辑细胞的SMarTER策略描述;图1Aiii:用于基因校正的SMrT策略的描述。B)在AAVS1基因座中含有最低表达ΔLNGFR盒的单细胞衍生克隆的分离和表征。(左上)克隆分离和表征的实验工作流程。(左下)分子分析筛选具有完整5’供体-基因组接合(junction)(5’-TI)的克隆。对5’-TI阳性的克隆连续筛选完整的3’供体-基因组接合和单等位基因整合(野生型等位基因的扩增)(中间)和ΔLNGFR的基础表达。选择克隆H1进行进一步实验。(右)所选克隆(克隆H1)的流式细胞术。C)跨越从最小启动子转录起始位点(TSS)起100-600bp的gRNA的NHEJ介导编辑的百分比。D)(顶部)针对在K562克隆H中报告物基因反式激活测试的一组sgRNA(单引导RNA)示意图。(底部)电穿孔后24小时反式激活克隆H细胞的代表性FACS图。E)表达dCas9-VP160或dCas9-VPR的质粒和来自A的选定gRNA电穿孔后1、2和14天,ΔLNGFR+细胞的未处理克隆H细胞(UT)(底部)的百分比(顶部)和相对荧光强度(RFI)。从进一步的反式激活实验中选择来自C的sgRNA#4、5、9、10、12、13、26、28。sgRNA从离TSS最近到最远排序。每组sgRNA的最后一次处理分别是第一个和第五个sgRNA的组合。F)(顶部)针对在K562克隆H中报告物基因反式激活测试的TALE-TA组的示意图。在电穿孔表达跨越距最小启动子TSS的324到940bp的不同TALE-VP160的质粒后2、4和12天,ΔLNGFR+细胞的百分比(左)和平均荧光强度(MFI)(右)。G)在电穿孔增加剂量的TALE#7-VP160 mRNA后16、24、48和72小时,ΔLNGFR+细胞的百分比(左上)和平均荧光强度(MFI)(左下)。(右)来自(左)的代表性FACS图。

图2.SMarT策略允许富集靶标AAVS1编辑的细胞。A)优化左同源臂(L-HA)长度以避免ETT介导的未整合供体的反式激活。(顶部)用于通过流式细胞术测量靶向整合效率的构建体。(底部)在有或没有AAVS1核酸酶的情况下对供体质粒进行电穿孔后15天测量的GFP+细胞百分比。图2A中的ZFN指锌指核酸酶。B)(底部)FACS图表示电穿孔后15天在具有不同最小启动子(最小CMV或T6-SK)或无启动子(promoter-less)的构建体的AAVS1基因座中靶向整合时的基础ΔLNGFR表达。(顶部)通过数字液滴PCR测量的AAVS1编辑等位基因的每个基因组的拷贝。C)在来自B的SK(图的第15页)或minCMV(图的第16页)整体编辑群体中,电穿孔表达dCas9-VP160或dCas9-VPR的质粒和选定的gRNA(来自图1C)后1、2和14天高度表达性ΔLNGFR+细胞的百分比(图的第10页)和MFI(图的第11页)。sgRNA从离TSS的最近到最远排序。每组sgRNA的最后一次处理是第一个和第五个sgRNA的组合。D)(顶部)SMArT概念验证实验研究的示意图。(底部)在TALE#7-VP160质粒电穿孔后48小时从高度表达性SK-NGFR细胞中分选的单细胞克隆的分子特征。

图3.人CB衍生的CD34+细胞中的SMArT策略。A)在人类CD34+细胞中SMrT策略应用的实验程序。B)(顶部)HSPC亚群中在基因靶向和反式激活程序后24小时,GFP+细胞的百分比(左)和仅编辑对照(D+R)上的相对荧光强度(RFI)(右)。(底部)代表性FACS图显示了存在或不存在TALE#7-VPR编码(T7VPR)mRNA(分别为右侧和左侧)的情况下整体CD34+HSPC和最原始的亚群(CD90+细胞)内的GFP+细胞。C)在整体CD34+培养物中和不同HSPC亚群之间,通过流式细胞术(FACS)测量的GFP+细胞百分比(左y轴,左手列(FACS))和通过ddPCR测量的每个细胞的编辑等位基因的拷贝数(右y轴,右手列(HDR))。D)(顶部)在人类CD34+细胞中SMrT策略应用的实验程序。(底部)在HSPC亚群中解冻后1周进行电穿孔后24小时,GFP+细胞的百分比(左)和仅编辑对照(D+R)上的相对荧光强度(RFI)(右)。(D=AAV6供体转导;R=AAVS1RNP;T7VPR=TALE#7VPR编码mRNA)。

图4.原代人类细胞中的SMArTER策略验证。A)用于富集IL2RG编辑细胞的SMarTER策略的描述。B)在用靶向基因启动子的不同TALE-VP160表达质粒电穿孔的K562细胞系中,IL2RG表达的倍数增加。IL2RG表达已通过使用HPRT管家基因进行标准化,并在模拟电穿孔对照上计算增加倍数。IL2RG基因在HEK293T细胞系和雄性B类淋巴母细胞细胞系(JY)中的稳态表达也报告为对照。细胞系HEK293T称为293T。C)HSPC亚群中基因靶向和反式激活程序后24小时,GFP+细胞的百分比(左)和仅编辑对照(GT)上的相对荧光强度(RFI)(右)。D)代表性的FACS图显示了存在或不存在TALE#3-VPR编码mRNA(分别为底部和顶部)的情况下整体CD34+HSPC和最原始的亚群(CD90+细胞)中的GFP+细胞。(GT=基因靶向程序;VP160=TALE#3-VP160编码mRNA;VPR=TALE#3-VPR编码mRNA)。

图5.SMarTER策略允许通过加强临床合规选择子的表达来富集IL2RG校正的HSPC。A)(左上)通过使用IL2RGrec2A.NGFR AAV6供体或使用IL2RGrecPGK-GFP作为参考的HDR编辑的雄性原代T细胞的百分比。IL2RGrec2A.NGFR AAV6转导的、AAVS1编辑的细胞或未处理的细胞也作为对照绘制。(右上)从左起的总细胞数。(右下)与WT/NHEJ编辑的对应物相比,HDR编辑的细胞的IL2RG表面表达百分比。B)代表性的FACS图显示了在存在或不存在TALE#3-VPR编码mRNA电穿孔(分别为底部和顶部)的情况下,整体CD34+HSPC中和最原始的亚群(CD90+细胞)中的ΔLNGFR+细胞。C)在HSPC亚群中进行基因靶向和反式激活程序后,分别在24和36小时的GFP+或ΔLNGFR+细胞的百分比(顶部)和仅编辑对照(D+R)上的相对荧光强度(RFI)(底部)。D)(左)靶向和反式激活程序后36小时未分类、分类的ΔLNGFR+和ΔLNGFR-HSPC的代表性FACS图。(右上)在人类CD34+细胞中SMarTER策略应用的实验程序。(右中)未分类的、分类的ΔLNGFR+和分类的ΔLNGFR-富集群体中HDR编辑的等位基因的百分比和HSPC培养组成。(右下)移植后6周通过FACS测量的NGFR+细胞百分比。

图2.1:依靠多西环素调节的人工反式激活物的选择(SMArT-D)。A)SMarT-D策略的描述。B)在电穿孔增加量的tTA(0.25μg、1μg、3μg)后24小时,用SMrT-D构建体靶向的K562细胞内GFP+细胞的百分比(左)和平均荧光强度(MFI)(右)。

图2.2:瞬时反式激活IL2RGHDR编辑的HSPC的方案开发。A)脐带血来源的CD34+细胞的实验工作流程:在三天的预刺激后,在有/没有IL2RGRNP+/-tTA、存在或不存在用于HDR的AAV模板的情况下且在添加或不添加多西环素(Doxy)的情况下对细胞进行电穿孔。B)在处理后24和48小时测量的未处理(UT)、RNP+AAV(标准编辑程序)、AAV+tTA、AAV+tTA+Doxy、RNP+AAV+tTA、RNP+AAV+tTA+多西环素中整体群体内GFP+细胞的百分比(左)和MFI(右)。指示了在处理后4天测量的HDR编辑细胞的百分比。C)用于测试不同剂量的多西环素(2μM和400nM)和多西环素撤出时机的实验设计(如图2.2A)。D)在指定条件下编辑后24小时、36小时和48小时测量的“12小时多西环素撤出”条件下GFP+细胞的百分比(左)和MFI(右)。指示了在处理后4天测量的HDR编辑细胞的百分比。E)在指定条件下编辑后36小时、48小时和60小时测量的“24小时多西环素撤出”条件下GFP+细胞的百分比(左)和MFI(右)。指示了在处理后4天测量的HDR编辑细胞的百分比。F)在指定条件下编辑后48小时、60小时和72小时测量的“36小时多西环素撤出”条件下GFP+细胞的百分比(左)和MFI(右)。指示了在处理后4天测量的HDR编辑细胞的百分比。

图2.3:SMART-D策略允许富集IL2RG编辑的HSPC。A)优化的实验工作流程,如图2.2C中对IL2RG SMrT-D描述的。B-C)3个独立实验的集合,显示在编辑后24小时进行多西环素撤出的指定条件下GFP+细胞的百分比(B)和MFI(C)。指示了在处理后4天测量的HDR编辑细胞的百分比。D)在多西环素存在下或多西环素冲洗后(n=3)未靶向(AAV)和靶向(RNP+AAV)细胞中整体群体和最原始HSPC区室(CD34+CD133+CD90+)内GFP+细胞的百分比。E)顶部:显示了存在多西环素的情况下的靶向整体CD34+CD133+CD90+群体的代表性FACS图以及多西环素冲洗后的相应图。底部:显示了在多西环素存在下的未靶向整体和CD34+CD133+CD90+群体的代表性的FACS图以及多西环素冲洗后的相应图。

图2.4:SMART-D策略允许富集AAVS1编辑的HSPC。A)左:AAVS1基因座的SMArT-D策略。右:实验工作流程,如图2.2C中所述。B-C)GFP+细胞的百分比(B)和MFI(C),如图2.3B-C中。D)整体和CD34+CD133+CD90+细胞中GFP+细胞的百分比,如图2.3D(n=2)中。E)在存在多西环素的情况下或冲洗后,整体和CD34+CD133+CD90+群体内靶向细胞的代表性FACS图。

图2.5:SMART-D策略允许富集CD40LG编辑的HSPC。A)左:CD40LG中的SMArT-D策略,用截短的NGFR作为选择子基因。右:实验工作流程,如图2.2C中。B-C)未处理(UT)、仅编辑(RNP+AAV)、AAV+tTA和RNP+AAV+tTA内NGFR+细胞的百分比(B)和MFI(C),它们各自在存在多西环素的情况下或冲洗后进行测试。指示了在处理后4天测量的HDR编辑细胞的百分比。D)代表性的FACS图显示在存在或不存在多西环素的情况下靶向和未靶向细胞中的反式激活。

图2.6:体内选择经编辑的HSPC的SMART-D策略。A)左:用CXCR4作为生物选择子的靶向IL2RG基因座的SMArT-D策略。右:图2.2C中描述的实验工作流程,使用两种不同的多西环素剂量进行。B)在基因编辑程序后24小时、48小时和8天测量,在RNP+AAV+tTA和AAV+tTA条件下在存在多西环素的情况下或冲洗后的CXCR4

图2.7:SMrT-D策略与Ad5-E4orf6/7和/或GSE56的组合仍然允许反式激活编辑的级份。A)在指定条件下在存在多西环素的情况下或冲洗后测量的CXCR4

图2.8:通过SMarT-D策略进行的体内选择。A)实验设计:在存在或不存在tTA的情况下,在预刺激三天后进行基因编辑。在编辑后24小时进行冲洗。12小时后(编辑程序后36小时)对NSG小鼠进行HSPC移植。在移植后6、12、18周进行放血(n=3、4、4、4、4、4)。B)在指定条件下移植小鼠外周血中第6、12和18周时的人类CD45+细胞百分比。C)图2.8B中小鼠中通过数字液滴PCR测量的HDR编辑细胞的百分比。

图2.9:CD40LG小鼠中选择策略的可行性。A)不同组的实验工作流程和示意图(n=5、5、4、5、5、5)。B)12周时移植小鼠外周血中野生型(WT)和敲除(KO)细胞的嵌合。C)移植后12周时外周血中B细胞、髓样细胞和T细胞的绝对计数。D)通过加强免疫前(接种疫苗后)和加强免疫后的ELISA测定法测量的TNP-KLH抗原的特异性IgG应答。

发明详述

如本文所用,术语“包含”与“包括”或“含有”同义,并且是包括性的或开放式的,并且不排除额外的、未列举的成员、元素或步骤。术语“包括”或“包含”还包括术语“由……组成”。

基因组编辑细胞

术语“基因组编辑细胞”是指在细胞的基因组中插入、删除、破坏或替换核苷酸序列的一类遗传工程。属于“基因组编辑细胞”、“编辑细胞”、“基因编辑细胞”、“靶向基因疗法”和“基因编辑”在本文中可以互换使用。基因编辑可以使用工程化核酸酶(在本文中可以称为第三组分)来实现,其可以靶向到多核苷酸中的期望位点。此类核酸酶可在期望位置处产生位点特异性双链断裂,然后可通过非同源末端连接(NHEJ)或同源重组(HR)进行修复,从而产生靶向突变。可以使用病毒载体将此类核酸酶递送至靶细胞。基因编辑利用细胞自身的修复途径来校正、破坏或添加靶基因座。例如,在基因编辑以校正序列时,提供了用于同源修复的模板序列,并且细胞自身的修复途径消除突变并用正确的序列替换它。例如,在添加序列的基因编辑中,提供了用于同源修复的模板序列,并且细胞自身的修复途径整合盒,允许以位点特异性方式表达NOI。例如,在破坏基因的基因编辑中,提供了用于同源修复的模板序列,并且细胞自身的修复途径发生突变、插入或基因删除以禁用基因的功能。

本领域已知的合适核酸酶的实例包括锌指核酸酶(ZFN)、转录激活物样效应物核酸酶(TALEN)、成簇规则间隔短回文重复(CRISPR)/Cas系统和CRISPR/Cpf系统(Gaj,T.etal.(2013)Trends Biotechnol.31:397-405;Sander,J.D.et al.(2014)Nat.Biotechnol.32:347-55)。

大范围核酸酶(Silve,G.et al.(2011)Cur.Gene Ther.11:11-27)也可以用作基因编辑的合适核酸酶。

CRISPR/Cas系统是RNA引导的DNA结合系统(van der Oost et al.(2014)Nat.Rev.Microbiol.12:479-92),其中可以选择引导RNA(gRNA)以启用Cas域(例如Cas9)或Cpf域(例如Cpf1)以靶向到特定序列。gRNA的设计方法是本领域已知的。此外,最近开发了完全正交的Cas9蛋白,以及Cas9/gRNA核糖核蛋白复合物和gRNA结构/组成的修饰以结合不同的蛋白质,从而同时和定向地将不同的效应物域靶向到细胞的期望基因组位点(Esveltet al.(2013)Nat.Methods 10:1116-21;Zetsche,B.et al.(2015)Cell pii:S0092-8674(15)01200-3;Dahlman,J.E.et al.(2015)Nat.Biotechnol.2015Oct 5.doi:10.1038/nbt.3390.[印刷前电子公开];Zalatan,J.G.et al.(2015)Cell 160:339-50;Paix,A.etal.(2015)Genetics 201:47-54),并且适用于本文。

对于基因组编辑细胞的细胞群体的“富集”应理解为在细胞群体内增加基因组编辑细胞的比例(或浓度)。其他类型细胞的浓度可伴随降低。

在一些实施方案中,细胞群体是分离的细胞群体。如本文所用,术语“分离的细胞群体”可指先前已从身体中取出的细胞群体。可以使用本领域已知的标准技术离体或体外培养和操作分离的细胞群体。分离的细胞群体随后可重新引入受试者。所述受试者可以是最初分离细胞的同一受试者或不同的受试者。

可以针对表现出特定表型或特征的细胞以及从不表现出该表型或特征或以较低程度表现出该表型或特征的其他细胞选择性地富集或纯化细胞群体。例如,可以从起始细胞群体中纯化表达特定选择子(例如ΔLNGFR,NGFR,截短NGFR,MGMT,CD19,EGFR,c-Kit,CXCR4,CXCR4 WHIM,CD47 and eGFP)的细胞群体。或者/另外,可纯化不表达另一个选择子的细胞群体。

富集或纯化可以导致细胞群体基本上不含其他类型的细胞。

富集或纯化表达特定选择子(例如ΔLNGFR,NGFR,截短NGFR,MGMT,CD19,EGFR,c-Kit,CXCR4,CXCR4 WHIM,CD47和eGFP)的细胞或细胞群体可以通过使用结合该标志物,优选基本上特异性结合该标志物的试剂来实现。例如,基因组编辑细胞群体可以通过对该标志物具有特异性并且直接或间接与荧光染料或顺磁珠缀合的抗体、蛋白质或适体进行标记。因此,标记细胞的选择可以通过荧光激活细胞分选、磁柱、亲和标签纯化或基于显微术的技术进行。

在一些实施方案中,核苷酸序列编码选自下组的选择子:ΔLNGFR,NGFR,MGMT,CD19,EGFR,c-Kit,CXCR4,CXCR4 WHIM,CD47和eGFP。

瞬时表达或瞬时上调

当第二组分是ETT多肽时,ETT多肽瞬时存在于细胞或细胞群体中。不希望受理论束缚,ETT多肽的瞬时存在由于该第二组分的细胞内降解而发生。

当第二组分是编码ETT多肽的核苷酸序列时,该核苷酸序列在细胞或细胞群体中瞬时表达。不希望受理论束缚,编码ETT多肽的核苷酸序列的瞬时表达由于该第二组分的细胞内降解而发生。此外,编码ETT多肽的核苷酸序列的瞬时表达导致ETT多肽的短期产生。继而,当ETT多肽经历细胞内降解时,ETT多肽仅瞬时存在于细胞或细胞群体中。

ETT多肽的结合位点(ETT结合位点)与细胞基因组中的靶基因座可操作连接。在一些实施方案中,至少一个ETT结合位点在靶基因座的上游。在其他实施方案中,至少一个ETT结合位点在靶基因座的下游。当ETT多肽存在于细胞中时,ETT结合位点的存在实现在靶基因座处插入的编码选择子的核苷酸序列的表达。不希望受理论的束缚,在基因组编辑细胞中,与ETT结合位点结合的ETT可作用于与靶基因座可操作连接的内源启动子或与插入靶基因座的编码选择子的核苷酸序列可操作连接的外源启动子(例如最小启动子)。编码选择子的核苷酸序列的表达可以以不依赖于基因组编辑细胞中NOI的表达的方式进行调节,除非编码选择子的核苷酸序列和NOI是相同的序列。

当编码选择子的核苷酸序列插入靶基因座(这可称为“就位”插入)时,ETT多肽在细胞或细胞群体中的瞬时存在使得编码选择子的插入核苷酸序列能够瞬时表达或瞬时上调。如果编码选择子的核苷酸序列插入到非靶基因座中(这可以称为“脱位”插入),则不表达编码选择子的核苷酸序列。

当编码选择子的核苷酸序列插入靶基因座(这可称为“就位”插入)时,编码ETT多肽的核苷酸序列的瞬时表达使得编码选择子的插入核苷酸序列能够瞬时表达或瞬时上调。如果编码选择子的核苷酸序列插入到非靶基因座中(这可以称为“脱位”插入),则不表达编码选择子的核苷酸序列。

在一些实施方案中,编码选择子的插入核苷酸序列的瞬时表达或瞬时上调需要细胞中调节物的存在。在其他实施方案中,编码选择子的插入核苷酸序列的瞬时表达或瞬时上调不需要细胞中调节物的存在。

如本文所用,术语“瞬时表达编码选择子的核苷酸序列”是指编码选择子的核苷酸序列的临时表达。选择子的瞬时表达使得能够在选择子表达的此时间段期间选择基因组编辑细胞。

如本文所用,术语“瞬时上调编码选择子的核苷酸序列”是指编码选择子的核苷酸序列的表达暂时增加。选择子的瞬时上调使得能够在选择子上调表达的此时间段期间选择基因组编辑细胞。

选择子的上调是指在其他方面相同的条件下与靶位点中不含NOI整合的细胞群体相比,含有NOI靶向整合的细胞群体中选择子的表达水平增加。

有利地,本发明的基因组编辑方法导致选择子在短时间内表达或上调。在此时间段期间,可以选择基因组编辑细胞。

例如,对于基因治疗,有利地,当将细胞引入或移植到受试者中时,基因组编辑细胞不表达选择子或不具有选择子的上调表达。

在一些实施方案中,ETT多肽或编码ETT多肽的核苷酸序列在细胞或细胞群体中瞬时存在约6小时至约7天、约6小时至约5天、约6小时至约4天、约6小时至约3天、约6小时至约48小时、约6小时至约36小时、约6小时至约24小时或约6小时至约12小时。

在一些实施方案中,ETT多肽或编码ETT多肽的核苷酸序列在细胞或细胞群体中瞬时表达约6小时至约7天、约6小时至约5天、约6小时至约4天、约6小时至约3天、约6小时至约48小时、约6小时至约36小时、约6小时至约24小时或约6小时至约12小时。

细胞的选择

根据本发明的方法包括选择瞬时表达或瞬时上调编码选择子的核苷酸序列的基因组编辑细胞。

许多用于选择表达选择子的细胞或细胞群体的技术是本领域已知的。这些包括基于磁珠的分离技术(例如基于闭路磁珠的分离)、流式细胞术、荧光激活细胞分选(FACS)、亲和标签纯化(例如使用亲和柱或珠,例如生物素柱来分离抗生物素蛋白标记的试剂)和基于显微术的技术。

还可以使用不同技术的组合来进行选择,例如基于磁珠的分离步骤,然后通过流式细胞术针对一种或多种额外(阳性或阴性)标志物对所得细胞群体进行分选。

例如,可以使用

在本发明中,不会选择不瞬时表达或瞬时上调编码选择子的核苷酸序列的细胞或细胞群体。

用于选择基因组编辑细胞的技术优选地是一种适合自动化和/或高通量筛选的技术。

在一些实施方案中,通过流式细胞术(例如荧光激活细胞分选)或磁珠分离来选择基因组编辑细胞。

在一些实施方案中,通过基于磁珠的分离技术选择基因组编辑细胞。

在一些实施方案中,通过基于闭路磁珠的分离来选择基因组编辑细胞。

表B详述了适用于通过例如流式细胞术选择基因组编辑细胞的抗体实例。

细胞类型

在一些实施方案中,细胞是哺乳动物细胞。优选地,细胞是人细胞。

在一些实施方案中,细胞群体是哺乳动物细胞。优选地,细胞群体是人细胞。

在一些实施方案中,细胞是基因组编辑细胞。

在一些实施方案中,细胞群体是起始细胞群体。起始细胞群体经历根据本发明的方法的基因组编辑。在其他实施方案中,细胞群体是基因组编辑细胞群体。

在一些实施方案中,细胞或细胞群体是造血干细胞(HSC)、造血祖细胞(HPC)、髓系/单核细胞定型祖细胞、巨噬细胞或单核细胞、T或B细胞淋巴细胞、胚胎干细胞(ESC)、诱导多能干细胞(iPSC)、表皮干细胞、角膜缘干细胞培养物、间充质基质细胞(MSC)、神经干细胞(NSC)或中间成血管细胞(mesoangioblast)。

在一些实施方案中,细胞群体是造血干细胞(HSC)、造血祖细胞(HPC)、骨髓/单核细胞定型祖细胞、巨噬细胞或单核细胞、T或B细胞淋巴细胞、胚胎干细胞(ESC)、诱导多能细胞干细胞(iPSC)、表皮干细胞、角膜缘干细胞培养物、间充质基质细胞(MSC)、神经干细胞(NSC)、中间成血管细胞或其混合物。

干细胞能够分化成多种细胞类型。能够分化成所有细胞类型的细胞称为全能的。在哺乳动物中,仅合子和早期胚胎细胞是全能的。干细胞存在于大多数(如果不是全部)多细胞生物体中。它们的特点是通过有丝分裂细胞分裂自我更新并分化为多种特化细胞类型的能力。哺乳动物干细胞的两大类是从囊胚的内细胞团中分离出来的胚胎干细胞,以及在成体组织中发现的成体干细胞。在发育中的胚胎中,干细胞可以分化成所有特化的胚胎组织。在成年生物体中,干细胞和祖细胞充当身体的修复系统,补充特化细胞,而且还维持再生器官(如血液、皮肤或肠道组织)的正常更新。

造血干细胞(HSC)是多能干细胞,其可以在例如外周血、骨髓和脐带血中找到。HSC能够自我更新并分化为任何血细胞谱系。它们能够重新定殖整个免疫系统,以及所有造血组织(如骨髓、脾脏和胸腺)中的红系和髓系谱系。它们提供所有造血细胞谱系的终生生产。

造血祖细胞具有分化成特定类型细胞的能力。然而,与干细胞形成对比,它们已经更加特定:它们被推动分化为它们的“靶”细胞。干细胞和祖细胞之间的区别在于干细胞可以无限复制,而祖细胞只能分裂有限的次数。造血祖细胞只能通过体内功能测定(即移植并且证明它们是否可以在延长的时间段内产生所有血液谱系)来与HSC严格区分。

造血干细胞和祖细胞(HSPC)来源

可以从组织样品中获得造血干细胞和/或祖细胞群体。

例如,造血干细胞和/或祖细胞群体可以从外周血(例如成人和胎儿外周血)、脐带血、骨髓、肝脏或脾脏获得。优选地,这些细胞从外周血或骨髓中获得。它们可以通过生长因子处理在体内动员细胞后获得。

可以使用例如G-CSF、plerixaphor或其组合进行动员。其他药剂,例如NSAID和二肽基肽酶抑制剂也可用作动员剂。

凭借干细胞生长因子GM-CSF和G-CSF的可用性,大多数造血干细胞移植程序现在使用从外周血而非骨髓中收集的干细胞进行。收集外周血干细胞提供更大的移植物,不需要对供体进行全身麻醉来收集移植物,导致移植前时间更短,并且可以提供较低的长期复发率。

可以通过标准抽吸方法(稳态或动员后)或使用下一代采集工具(例如MarrowMiner)收集骨髓。

此外,造血干细胞和祖细胞也可以来源于诱导多能干细胞。

HSC特性

通过流式细胞术程序,HSC通常具有低前向散射和侧向散射概况。有些是代谢静止的,如通过罗丹明标记证明,它允许测定线粒体活性。HSC可包含某些细胞表面标志物,例如CD34、CD45、CD133、CD90、CD201和CD49f。它们也可以定义为缺乏CD38和CD45RA细胞表面标志物表达的细胞。然而,这些中一些标志物的表达取决于HSC的发育阶段和组织特异性背景。一些被称为“侧群体细胞”的HSC排除如通过流式细胞术检测的Hoechst 33342染料。因此,HSC具有允许其鉴定和分离的描述性特征。

阴性标志物

CD38是人类HSC最为确立且最有用的单一阴性标志物。

人类HSC也可以对谱系标志物呈阴性,例如CD2、CD3、CD14、CD16、CD19、CD20、CD24、CD36、CD56、CD66b、CD271和CD45RA。然而,这些标志物可能需要结合使用以进行HSC富集。

“阴性标志物”应理解为人类HSC缺乏这些标志物的表达。

阳性标志物

CD34和CD133是HSC的最有用的阳性标志物。

一些HSC对谱系标志物,如CD90、CD49f和CD93也呈阳性。然而,这些标志物可能需要结合使用以进行HSC富集。

“阳性标志物”应理解为人HSC表达这些标志物。

在一些实施方案中,造血干细胞和祖细胞是CD34+CD38-细胞。

分化细胞

分化细胞是与干细胞或祖细胞相比变得更加特化的细胞。随着生物体从单个合子转变为组织和细胞类型的复杂系统,分化发生在多细胞生物体的发育过程中。分化也是成体中的一个常见过程:成体干细胞在组织修复和正常细胞周转过程中分裂并产生完全分化的子细胞。分化显著改变细胞的大小、形状、膜电位、代谢活性和对信号的响应性。这些变化主要是由于基因表达的高度受控修饰。换言之,分化的细胞是由于涉及特定基因的激活和失活的发育过程而具有特定结构并进行特定功能的细胞。这里,分化细胞包括造血谱系的分化细胞,例如单核细胞、巨噬细胞、嗜中性粒细胞、嗜碱性粒细胞、嗜酸性粒细胞、红细胞、巨核细胞/血小板、树突细胞、T细胞、B细胞和NK细胞。例如,可以通过检测在未分化细胞上不表达或表达程度较低的细胞表面分子,将造血谱系的分化细胞与干细胞和祖细胞区分开来。合适的人类谱系标记的例子包括CD33、CD13、CD14、CD15(髓样)、CD19、CD20、CD22、CD79a(B)、CD36、CD71、CD235a(红系)、CD2、CD3、CD4、CD8(T)和CD56(NK)。

用于本文的细胞或细胞群体可以在适合于维持和/或培养细胞的任何培养基中培养。

Provasi等人(Nat Med 2012 18(5)807-815;PMID:22466705)公开了适用于维持和/或培养T细胞的培养基。

在一些实施方案中,细胞或细胞群体是K562细胞。

在其他实施方案中,细胞或细胞群体是CD34+细胞。

在细胞中引入组分

根据本发明的方法包括将至少一个第一组分、至少一个第二组分和至少一个第三组分引入细胞或细胞群体中。第一组分、第二组分和第三组分是离散且不同的组分。因此,通过根据本发明的方法将至少3种组分引入细胞或细胞群体中。在一些实施方案中,本发明的方法中使用的组分不限于这三种组分;根据例如要靶向的一种或多种特定基因,可以在该方法中使用其他组分。

如本文所用,术语“引入”是指将组分(例如外源DNA或RNA或多肽)插入细胞中的方法。如本文所用,术语“引入”包括转导和转染方法。转染是通过非病毒方法将组分(例如核酸)引入细胞的过程。转导是通过病毒载体将外源DNA或RNA引入细胞的过程。

在一些实施方案中,通过电穿孔将第一组分和/或第二组分和/或第三组分和/或额外组分引入细胞。在一些实施方案中,通过基于化学的转染(例如磷酸钙、阳离子聚合物(PEI)和脂质体)将第一组分和/或第二组分和/或第三组分和/或额外组分引入细胞。在一些实施方案中,通过转导将第一组分和/或第二组分和/或第三组分和/或额外组分引入细胞。合适地,可以通过病毒载体的转导引入第一组分和/或第二组分和/或第三组分和/或额外组分。

可以同时或以任何顺序将本发明方法中使用的组分引入细胞或细胞群体。

在一些实施方案中,同时将第一组分和第二组分引入细胞或细胞群体中。

在一些实施方案中,同时将第一组分和第三组分引入细胞或细胞群体中。

在一些实施方案中,在将第一组分引入细胞或细胞群体后约1天至约14天将第二组分引入细胞或细胞群体。优选地,在将第一组分引入细胞或细胞群体后约2天至约4天将第二组分引入细胞或细胞群体。

第一组分

如本文所用,术语“第一组分”是指包含编码选择子的核苷酸序列和感兴趣的核苷酸序列(NOI)的供体报告物盒。

供体报告物盒

术语“供体报告物盒”可以与术语“供体载体”、“供体DNA载体”、“供体质粒”和“供体盒”互换使用。

在一些实施方案中,供体报告物盒序贯包含:

(i)包含与靶基因座同源的核苷酸序列的左同源臂(HA);

(ii)与最小启动子可操作连接的编码选择子的核苷酸序列;

(iii)与启动子可操作连接的NOI;和

(iv)包含与靶基因座同源的核苷酸序列的右同源臂(HA);

其中当编码选择子的核苷酸序列插入靶基因座时,第二组分的ETT多肽或由第二组分表达的ETT多肽激活最小启动子。该供体报告物盒适用于SMrT方法。该供体报告物盒适用于将NOI插入靶基因座和/或校正或破坏靶基因座处的NOI。

在其他实施方案中,供体报告物盒序贯包含:

(i)包含与靶基因座同源的核苷酸序列的左同源臂(HA);

(ii)任选地,剪接受体位点(SA);

(iii)NOI;

(iv)与最小启动子可操作连接的编码选择子的核苷酸序列;和

(v)包含与靶基因座同源的核苷酸序列的右同源臂(HA);

其中当编码选择子的核苷酸序列插入靶基因座时,第二组分的ETT多肽或由第二组分表达的ETT多肽激活最小启动子。该供体报告物盒适用于SMrT方法。该供体报告物盒适用于将NOI插入靶基因座和/或校正或破坏靶基因座处的NOI。

在其他实施方案中,供体报告物盒序贯包含:

(i)包含与靶基因座同源的核苷酸序列的左同源臂(HA);

(ii)任选地,剪接受体位点(SA);

(iii)NOI;

(iv)任选地,编码2A自切割肽(2A)或内部核糖体进入位点(IRES)元件的核苷酸序列;

(v)编码选择子的核苷酸序列,任选地,编码选择子的核苷酸序列与最小启动子可操作连接;和

(vi)包含与靶基因座同源的核苷酸序列的右同源臂(HA);

其中第二组分的ETT多肽或由第二组分表达的ETT多肽激活靶基因座中的内源启动子。该供体报告物盒适用于SMrTER方法。该供体报告物盒适用于将NOI插入靶基因座和/或校正或破坏靶基因座处的NOI。

可以通过使用翻译激活物和/或增强子的结合位点来增加选择子的表达。

在一些实施方案中,供体报告物盒进一步包含至少一个用于翻译激活物的结合位点,例如含有真核起始因子4G(eIF4G)适体的模块化RNA激活物。翻译激活物的至少一个结合位点可插入转录起始位点下游并靠近转录起始位点以加强mRNA翻译。

在一些实施方案中,供体报告物盒进一步包含增强子(例如EF1alpha启动子)。增强子可以靠近启动子插入。

在一些实施方案中,翻译激活物和/或增强剂在调节物存在下可以是可诱导的。在其他实施方式中,翻译激活物和/或增强剂在没有调节物的情况下可以是可诱导的。

在一些实施方案中,供体报告物盒进一步包含调节元件。

在一些实施方案中,供体报告物盒序贯包含:

(i)包含与靶基因座同源的核苷酸序列的左同源臂(HA);

(ii)NOI,任选地与启动子可操作连接;

(iii)编码选择子的核苷酸序列,其中编码选择子的核苷酸序列与最小启动子可操作连接,并且最小启动子与调节元件可操作连接;和

(iv)包含与靶基因座同源的核苷酸序列的右同源臂(HA);

其中当编码选择子的核苷酸序列插入靶基因座中并且当调节物存在于细胞或细胞群体中时,第二组分的ETT多肽或由第二组分表达的ETT多肽结合调节元件并激活最小启动子。该供体报告物盒适用于SMArT-D方法。该供体报告物盒适用于将NOI插入靶基因座和/或校正或破坏靶基因座处的NOI。

在其他实施方案中,供体报告物盒序贯包含:

(i)包含与靶基因座同源的核苷酸序列的左同源臂(HA);

(ii)NOI,任选地与启动子可操作连接;

(iii)编码选择子的核苷酸序列,其中编码选择子的核苷酸序列与最小启动子可操作连接,并且最小启动子与调节元件可操作连接;和

(iv)包含与靶基因座同源的核苷酸序列的右同源臂(HA);

其中当编码选择子的核苷酸序列插入靶基因座中并且当调节物不存在于细胞或细胞群体中时,第二组分的ETT多肽或由第二组分表达的ETT多肽结合调节元件并激活最小启动子。该供体报告物盒适用于SMArT-D方法。该供体报告物盒适用于将NOI插入靶基因座和/或校正或破坏靶基因座处的NOI。

在一些实施方案中,供体报告物盒进一步包含剪接受体(SA)。

在一些实施方案中,2A自切割肽(2A)具有如SEQ ID NO:55所示的序列或与SEQ IDNO:55具有至少75%、80%、85%、90%、95%、97%、98%或99%同一性。

在一些实施方案中,供体报告物盒进一步包括至少一个绝缘子元件。

如本文所用,术语“绝缘子元件”是指能够限制增强子对启动子的活性的核苷酸序列。

绝缘子元件可以例如源自或可源自CCCTC结合因子(CTCF)依赖性或不依赖于CCCTC结合因子的结合位点。

在一些实施方案中,供体报告物盒包含SV40polyA序列,其具有如SEQ ID NO:51所示的序列或与SEQ ID NO:51具有至少75%、80%、85%、90%、95%、97%、98%或99%同一性。

图1和2.1详述了用于本发明方法的供体盒的具体实例。

在一些实施方案中,供体报告物盒是质粒。

在一些实施方案中,载体包含供体报告物盒。

在一些实施方案中,载体是质粒。在其他实施方案中,载体是病毒载体。

在一些实施方案中,载体是表达载体。

同源臂(HA)

供体盒包括同源臂(HA)。通常,供体盒包括左同源臂(左HA)和右同源臂(右HA)。

每个同源臂(HA)包含与靶基因座的至少一部分同源的核苷酸序列。通常,左同源臂与靶基因座5’端的序列同源,并且右侧同源臂与靶基因座3’端的序列同源。

同源性定向修复(HDR)是使用DNA模板通过同源重组修复DNA双链断裂(DSB)(例如在靶基因座中)的过程。同源性驱动修复(HDR)会受到同源臂长度的影响。

在一些实施方案中,左同源臂的长度为约500至约1000个核苷酸。

在一些实施方案中,左同源臂具有如SEQ ID NO:50所示的序列或与SEQ ID NO:50具有至少75%、80%、85%、90%、95%、97%、98%或99%同一性。

在其他实施方案中,左同源臂的长度在约50至约500个核苷酸之间。

在其他实施方案中,左同源臂的长度在约50至约600个核苷酸之间。

在一些实施方案中,左同源臂的长度在约80至约200个核苷酸之间。优选地,左同源臂的长度在约130至约170个核苷酸之间。优选地,左同源臂的长度在约140至约160个核苷酸之间。更优选地,左同源臂的长度为约150个核苷酸。

在一些实施方案中,左HA具有如SEQ ID NO:52所示的序列或与SEQ ID NO:52具有至少75%、80%、85%、90%、95%、97%、98%或99%同一性。

在一些实施方案中,左同源臂的长度在约200至约350个核苷酸之间。优选地,左同源臂的长度在约250至约330个核苷酸之间。优选地,左同源臂的长度在约280至约310个核苷酸之间。更优选地,左同源臂的长度为约290个核苷酸。

在一些实施方案中,左HA具有如SEQ ID NO:53所示的序列或与SEQ ID NO:53具有至少75%、80%、85%、90%、95%、97%、98%或99%同一性。

在一些实施方案中,左侧HA具有如SEQ ID NO:61所示的序列或与SEQ ID NO:61具有至少75%、80%、85%、90%、95%、97%、98%或99%同一性。

在一些实施方案中,左侧HA具有如SEQ ID NO:63所示的序列或与SEQ ID NO:63具有至少75%、80%、85%、90%、95%、97%、98%或99%同一性。

在一些实施方案中,右同源臂的长度为约500至约1000个核苷酸。

在其他实施方案中,右侧同源臂的长度在约200至约300个核苷酸之间。优选地,右同源臂的长度在约250至约290个核苷酸之间。优选地,右侧同源臂的长度在约260至约280个核苷酸之间。更优选地,左侧同源臂的长度为约270个核苷酸。

在一些实施方案中,右HA具有如SEQ ID NO:56所示的序列或与SEQ ID NO:56具有至少75%、80%、85%、90%、95%、97%、98%或99%同一性。

在一些实施方案中,右HA具有如SEQ ID NO:62所示的序列或与SEQ ID NO:62具有至少75%、80%、85%、90%、95%、97%、98%或99%同一性。

在一些实施方案中,右HA具有如SEQ ID NO:64所示的序列或与SEQ ID NO:64具有至少75%、80%、85%、90%、95%、97%、98%或99%同一性。

通常,左同源臂和右同源臂之间的插入物片段的长度可为约1000至约2000个核苷酸。

靶基因座

如本文所用,术语“靶基因座”可与术语“靶基因”互换使用。靶基因座是基因组中用于插入(或整合)、校正、突变或删除的期望位点。

靶基因座可以是细胞基因组中的任何基因座。

在一些实施方案中,靶基因座是安全港。如本文所用,术语“安全港”是指基因组中核苷酸序列的整合不破坏任何调控或编码序列也不干扰最近的调节元件或邻近基因的转录概况的位置。术语“安全港”可以与术语“中性区”、“中性区域”和“中性基因”互换使用。

在一些实施方案中,靶基因座是腺相关病毒整合位点1(AAVS1)或慢病毒载体的共同整合位点(CIS)。

在其他实施方案中,靶基因座是IL2RG、gp91phox、HBB、RAG1、CD40LG、TRAC、TRBC、STAT或PRF1。

在其他实施方案中,靶基因座是编码在皮肤中表达的蛋白质的基因,例如胶原蛋白、角蛋白、层粘连蛋白、桥粒芯粘着蛋白(desmocolin)、桥粒斑蛋白(desmoplachine)、桥粒芯蛋白(desmoglein)、斑珠蛋白(placoglobin)、阔叶碱(placophylline)、整联蛋白或其他参与桥粒和半桥粒的蛋白质。

在一些实施方案中,靶基因座是腺相关病毒整合位点1(AAVS1)。

在其他实施方案中,靶基因座是IL2RG。

在其他实施方案中,靶基因座是CD40LG。

在一些实施方案中,细胞的基因组包含至少一个与靶基因座可操作连接的ETT结合位点。

在一些实施方案中,内源启动子与至少一个ETT结合位点可操作连接。在一些实施方案中,ETT结合位点位于内源启动子的下游。在其他实施方案中,ETT结合位点位于内源启动子的上游。不希望受理论束缚,ETT结合位点充当增强子。

在一些实施方案中,ETT结合位点包含核苷酸序列,该核苷酸序列具有如SEQ IDNO 32至40中任一项所示的序列或与它们具有至少75%、80%、85%、90%、95%、97%、98%或99%的同一性的序列。优选地,ETT结合位点包含具有如SEQ ID NO:32、SEQ ID NO:33、SEQ ID NO:34和SEQ ID NO:38所示序列的核苷酸序列。更优选地,ETT结合位点包含如SEQID NO:34或SEQ ID NO:38所示的核苷酸序列。

在一些实施方案中,ETT结合位点包含编码至少一个tetO序列的核苷酸序列。

在一些实施方案中,ETT结合位点包含核苷酸序列,其具有SEQ ID NO:65所示的序列或与其具有至少75%、80%、85%、90%、95%、97%、98%或99%同一性的序列。

选择子

术语“编码选择子的核苷酸序列”、“报告物”、“报告物基因”、“标记物”和“选择子”可以互换使用。如本文所用,术语“编码选择子的核苷酸序列”是指可用于从尚未插入核苷酸序列或者将序列插入错误位点中的细胞选择已经将核苷酸序列已插入基因组中靶基因座(期望整合位点)中的细胞的任何核苷酸序列。

在一些实施方案中,已将选择子插入错误站点的细胞将不表达选择子。在其他实施方案(例如SMArT-D)中,将选择子插入非靶位点中的细胞将表达选择子。

在一些实施方案中,编码选择子的核苷酸序列编码选自下组的选择子:突变的低亲和力神经生长因子受体(ΔLNGFR);截短的NGFR;药物抗性蛋白(例如具有新霉素或嘌呤霉素抗性的蛋白质,或突变的甲基鸟嘌呤DNA甲基转移酶(MGMT));截短的细胞表面蛋白(例如CD19和EGFR-PMID:21653320,Wang et al.Blood 118(5):1255-63);在基因组编辑细胞的体内移植后赋予选择性生长和/或植入优势的蛋白质(例如受体酪氨酸激酶(c-Kit)、C-X-C趋化因子受体4(CXCR4或CXCR4 WHIM)和CD47)和报告物蛋白(例如,荧光蛋白,如eGFP)。

在一些实施方案中,编码选择子的核苷酸序列编码神经生长因子受体,例如低亲和力神经生长因子受体或突变的低亲和力神经生长因子受体(ΔLNGFR)。编码神经生长因子受体的核苷酸序列的例子是SEQ ID NO:44和与其具有至少75%、80%、85%、90%、95%、97%、98%或99%同一性的序列。编码神经生长因子受体(NGFR)的核苷酸序列的其他实例是SEQ ID NO:67和与其具有至少75%、80%、85%、90%、95%、97%、98%或99%同一性的序列。

在其他实施方案中,编码选择子的核苷酸序列编码报告物蛋白例如eGFP。术语“eGFP”在本文中可与术语“GFP”互换使用。编码GFP的核苷酸序列的例子是SEQ ID NO:43和与其具有至少75%、80%、85%、90%、95%、97%、98%或99%同一性的序列。

在一些实施方案中,编码选择子的核苷酸序列选自SEQ ID NO:43、SEQ ID NO:44、SEQ ID NO:67和与它们具有至少75%、80%、85%、90%、95%、97%、98%或99%的同一性的序列。

在一些实施方案中,编码选择子的核苷酸序列与至少一种编码去稳定剂域的核苷酸序列融合。

如本文所用,术语“去稳定剂域”是指能够对多肽赋予不稳定性的多肽。例如,在没有特定稳定剂配体的情况下,去稳定剂域能够引入选择子的蛋白酶体降解。

在一些实施方案中,去稳定剂域是配体可调节的去稳定化域。配体可调节去稳定域的实例包括FKBP域、细菌DHFR和雌激素受体(例如人类雌激素受体)。

在一些实施方案中,编码选择子的核苷酸序列与启动子可操作连接。

在一些实施方案中,编码选择子的核苷酸序列与最小启动子可操作连接。

如本文所用,术语“最小启动子”是指启动子的最小元件,例如TATA框和转录起始位点,它们是无活性的,除非将增强启动子活性的调节元件置于上游外。

在一些实施方案中,最小启动子选自下组:合成启动子T6-SK和巨细胞病毒(CMV)。

在一些实施方案中,T6-SK启动子具有如SEQ ID NO:41所示的序列或与如SEQ IDNO:41所示的序列具有至少75%、80%、85%、90%、95%、97%、98%或99%同一性。

在一些实施方案中,CMV启动子具有如SEQ ID NO:42所示的序列或与SEQ ID NO:42具有至少75%、80%、85%、90%、95%、97%、98%或99%同一性。

在一些实施方案中,最小启动子与调节元件可操作连接。

在一些实施方案中,最小启动子SK与调节元件可操作连接。

在一些实施方案中,最小启动子SK与具有如SEQ ID NO:41所示序列或与SEQ IDNO:65所示的序列具有至少75%、80%、85%、90%、95%、97%、98%、99%的同一性的调节元件可操作连接。

在一些实施方案中,最小启动子SK与具有如SEQ ID NO:65所示序列的调节元件可操作连接。

术语“T6-SK”和“SK”在本文中可以互换使用。

调节元件

如本文所用,术语“调节元件”是指能够激活或增强启动子活性的核苷酸序列。

通常,至少一种调节元件位于启动子的上游。

在其他实施方案中,至少一种调节元件置于别处,例如启动子的下游。

调节元件的例子包括翻译激活物和增强子。

在一些实施方案中,调节元件激活或增强启动子的活性。

在一些实施方案中,调节元件是可诱导的。

在诱导型系统中,研究和测试最广泛的是TetO系统,它允许诱导下游基因的瞬时反式激活(Gossen&Bujard,1992)。Tet-OFF系统包括:i)源自大肠杆菌的Tet操纵子(TetO),位于最小启动子的上游,其也可以以多个拷贝存在;ii)四环素反式激活物(tTA)蛋白,由源自大肠杆菌Tet阻遏蛋白(TetR)和来自单纯疱疹病毒的激活物域VP16的多个重复的融合构成。在不存在四环素(或其衍生物如多西环素)的情况下,tTA结合TetO序列并在最小启动子的控制下诱导基因的反式激活。当四环素或其衍生物结合tTA时,可以关闭系统,从而防止tTA栓系在TetO上。在Tet-ON系统中,rtTA仅在四环素或衍生物存在的情况下才能结合TetO序列。

不希望受理论束缚,ETT多肽结合调节元件并且这种结合激活或增强启动子的活性。

在一些实施方案中,调节元件包含至少一个四环素操纵子(TetO)序列。

在一些实施方案中,调节元件包含至少2、3、4、5、6、7或8个TetO序列。在一些实施方案中,调节元件包含至少2个TetO序列。在其他实施方案中,调节元件包含至少7个TetO序列。

在一个实施方案中,调节元件包含2个TetO序列。这可以称为TetO2。

在另一个实施方案中,调节元件包含7个TetO序列。这可以称为TetO7。

不希望受理论束缚,几个tTA或rtTA与TetO序列重复的结合增强选择子的反式激活,这继而增强基因组编辑细胞的选择。

通常,TetO序列(TCCCTATCAGTGATAGAGA)由间隔物(例如:ACGATGTCGAGTTTAC)隔开。

在一些实施方案中,TetO序列具有序列TCCCTATCAGTGATAGAGA。

在一些实施方案中,TetO序列与序列TCCCTATCAGTGATAGAGA具有至少75%、80%、85%、90%、95%、97%、98%或99%的同一性。

在一些实施方案中,TetO序列具有如SEQ ID NO:65所示的序列或与如SEQ ID NO:65所示核苷酸序列具有至少75%、80%、85%、90%、95%、97%、98%或99%同一性。

在一些实施方案中,TetO7序列具有如SEQ ID NO:65所示的序列或与如SEQ IDNO:65所示的核苷酸序列具有至少75%、80%、85%、90%、95%、97%、98%或99%同一性。

在一些实施方案中,TetO序列具有序列CCCTATCAGTGATAGAGA。

在一些实施方案中,TetO序列与序列CCCTATCAGTGATAGAGA具有至少75%、80%、85%、90%、95%、97%、98%或99%同一性。

在一些实施方案中,TetO序列具有如SEQ ID NO:76所示的序列或与如SEQ ID NO:76所示核苷酸序列具有至少75%、80%、85%、90%、95%、97%、98%或99%同一性。

在一些实施方案中,TetO7序列具有如SEQ ID NO:76所示的序列或与如SEQ IDNO:76所示核苷酸序列具有至少75%、80%、85%、90%、95%、97%、98%或99%同一性。

在一些实施方案中,由第二组分表达的ETT多肽或与调节元件结合的第二组分的ETT多肽是四环素反式激活物(tTA)。

四环素反式激活物(tTA)能够与TetO序列结合。

如本文所用,四环素反式激活物(tTA)包含DNA结合域(DBD)TetR和转录激活物(TA)域VP16。

四环素反式激活物(tTA)的一个例子显示在SEQ ID NO:58中。

在一些实施方案中,编码四环素反式激活物(tTA)的核苷酸序列具有如SEQ IDNO:58所示的序列或与如SEQ ID NO:58所示的核苷酸序列具有至少75%、80%、85%、90%、95%、97%、98%或99%同一性。

在一些实施方案中,编码tetR的核苷酸序列具有如SEQ ID NO:74所示的序列或与SEQ ID NO:74所示的核苷酸序列具有至少75%、80%、85%、90%、95%、97%、98%或99%同一性。

在一些实施方案中,编码VP16的核苷酸序列具有如SEQ ID NO:75所示的序列或与如SEQ ID NO:75所示的核苷酸序列具有至少75%、80%、85%、90%、95%、97%、98%或99%同一性。

在其他实施方案中,由第二组分表达的ETT多肽或与调节元件结合的第二组分的ETT多肽是反向tTA(rtTA)。

在一些实施方案中,反向tTA(rtTA)具有以下序列:

在一些实施方案中,反向tTA(rtTA)与SEQ ID NO:70所示的核苷酸序列具有至少75%、80%、85%、90%、95%、97%、98%或99%的同一性。

在一些实施方案中,反向tTA(rtTA)具有以下序列:

在一些实施方案中,反向tTA(rtTA)与SEQ ID NO:76所示的核苷酸序列具有至少75%、80%、85%、90%、95%、97%、98%或99%的同一性。

当调节物(例如四环素(Tc)或四环素衍生物(例如强力霉素))与rtTA结合时,反向四环素反式激活物(rtTA)能够与TetO序列结合。

在SMArT-D策略中,反式激活物可以不仅仅从整合的供体报告物盒中,而且还从未整合的供体报告物供体(如果存在的话)激活选择子表达。然而,tTA活性可以由调节物(如四环素或多西环素处理)修饰,这可以使选择子从整合了供体报告物盒的细胞中上调或专有表达。

有利的是,SMrT-D策略可用于任何感兴趣的靶基因座,而无需设计和筛选基因特异性反式激活物。

在一些实施方案中,tTA或rtTA的结合发生在转录起始位点(TSS)附近。不希望受理论束缚,靠近转录起始位点(TSS)的tTA或rtTA的结合改善反式激活效率。

调节物

如本文所用,术语“调节物”是指能够结合ETT多肽,特别是DNA结合域(DBD)的任何组合物,其调节ETT多肽的活性,特别是DNA结合活性

四环素反式激活物(tTA)和反向四环素反式激活物(rtTA)的调节物的例子是四环素(Tc)和四环素衍生物如强力霉素(dox)。

在一个实施方案中,调节物选自四环素(Tc)、四环素衍生物如强力霉素(dox)及其组合。

在一个实施方案中,调节物是四环素衍生物。

在一个实施方案中,调节物是强力霉素。

不希望受理论束缚,调节物(例如四环素(Tc)或四环素衍生物(例如dox)的结合诱导DBD(例如TetR域)中的构象变化,其在供体报告物盒尚未插入基因组时阻止与调节元件的结合(例如与tetO序列结合);因此不表达选择子。相反,已插入供体盒的细胞仍然能够表达选择子。因此,可以选择已插入供体盒的细胞。

不希望受理论束缚,调节物(例如四环素(Tc)或四环素衍生物(例如dox)的结合诱导DBD(例如反向TetR域)的构象变化,其在将供体报告物盒插入基因组中时使DBD能够结合调节元件(例如tetO序列);因此表达选择子。相反,已插入供体盒的细胞确实表达选择子。因此可以选择已插入供体盒的细胞。

可以在将第一组分和/或第二组分和/或第三组分引入细胞或细胞群体之前、之后或同时将调节物加入细胞或细胞群体。

在一些实施方案中,在将第一组分和/或第二组分和//或第三组分引入细胞或细胞群体之后约6小时至约36小时、约6小时至约24小时或约6小时至约12小时后将调节物加入细胞或细胞群体中。

调节物的最佳剂量可取决于多种因素,例如供体报告物盒、靶基因座和细胞或细胞群体的性质。技术人员可以容易地确定适当剂量的调节物(例如dox)以施用给细胞或细胞群体。

在一些方面,将调节物(例如dox)施用于细胞或细胞群体,使得约10nM至约2mM、或约50nM至约1mM、或约80nM至约800μM、或约100nM至500μM的调节物存在于培养基中。

例如,将调节物(例如dox)施用于细胞或细胞群体,使得至少10nM、至少25nM、至少50nM、至少80nM、至少100nM、至少200nM、至少300nM、至少400nM、至少500nM、至少1μM或至少2μM的调节物存在于培养基中。

技术人员可以容易地确定何时清洗用调节物处理的细胞或细胞群体。此清洗可称为调节物(例如dox)撤出或清洗。

用调节物处理的细胞或细胞群体可以用缓冲溶液(例如PBS)或适合维持和/或培养细胞或细胞群体的培养基清洗至少一次、至少两次、至少三次.

在用调节物处理和/或将第一组分和/或第二组分和/或第三组分引入细胞或细胞群体后,可以清洗细胞或细胞群体至少6小时、至少12小时、至少18小时、至少21小时、至少24小时、至少30小时、至少36小时、至少48小时、至少60小时或至少72小时。

在将第一组分和/或第二组分和/或第三组分引入细胞或细胞群体的处理后可以将经编辑的细胞或经编辑的细胞群体暴露于调节物至少6小时、至少12小时、至少18小时、至少21小时、至少24小时、至少30小时、至少36小时、至少48小时、至少60小时或至少72小时。

NOI

术语“NOI”可以与术语“GOI”、“感兴趣的基因”或“校正cDNA”互换使用。

在一些实施方案中,NOI是IL2RG、gp91phox、HBB、RAG1、CD40LG、TRAC、TRBC、STAT或PRF1。

在其他实施方案中,NOI是编码在皮肤中表达的蛋白质的基因,例如胶原蛋白、角蛋白、层粘连蛋白、桥粒芯粘着蛋白、桥粒斑蛋白、桥粒芯蛋白、斑珠蛋白、阔叶碱、整联蛋白或其他参与桥粒和半桥粒的蛋白质。

在一些实施方案中,NOI是IR2RG。编码IR2LG的NOI的实例是SEQ ID NO:54和与其具有至少75%、80%、85%、90%、95%、97%、98%或99%同一性的序列。

在一些实施方案中,NOI选自SEQ ID NO:54和与其具有至少75%、80%、85%、90%、95%、97%、98%或99%同一性的序列。

在一些实施方案中,NOI与启动子可操作连接。

在一些实施方案中,编码选择子和NOI的核苷酸序列可以相同。

如本文所用,术语“转录起始位点(TSS)”是指RNA聚合酶开始合成RNA转录物的第一个核苷酸。

在一些实施方案中,NOI位于转录起始位点(TSS)下游约50至约400个核苷酸处。优选地,NOI在TSS下游约100至约250个核苷酸处。

第二组分

如本文所用,术语“第二组分”是指工程化转录反式激活物(ETT)多肽或编码ETT多肽的核苷酸序列。

如本文所用,术语“ETT多肽”是指包含DNA结合域(DBD)和至少一个转录激活物(TA)域的多肽。

第二组分的ETT多肽或由第二组分表达的ETT多肽与细胞基因组中的ETT结合位点结合。

在一个实施方案中,ETT结合位点是调节元件。

在一个实施方案中,ETT结合位点是一个或多个tetO序列。

在一些实施方案中,当编码选择子的核苷酸序列插入靶基因座时,第二组分的ETT多肽或由第二组分表达的ETT多肽激活最小启动子。通常这会导致选择子的表达。

在其他实施方案中,第二组分的ETT多肽或由第二组分表达的ETT多肽激活靶基因座中的内源启动子。通常,当编码选择子的核苷酸序列插入靶基因座时,选择子得到表达。

在一些实施方案中,编码ETT多肽的核苷酸序列是质粒。

在一些实施方案中,载体包含编码ETT多肽的核苷酸序列。

在一些实施方案中,载体是质粒。在其他实施方案中,载体是病毒载体。

在一些实施方案中,载体是表达载体。

DNA结合域(DBD)

DNA结合域(DBD)含至少一个识别双链或单链DNA的结构基序。

用于本发明的DBD的实例包括但不限于转录激活物样效应物(TALE)DBD(例如TALE7 DBD和TALE3 DBD)、锌指(ZNF)、无催化活性的Cpf1和无催化活性的Cas(dCas)(例如dCas9)。

用于本发明的DBD的其他例子包括TetR和反向TetR。

无催化活性的Cas变体(例如dCas9)已从各种细菌(例如金黄色葡萄球菌(S.aureus)、嗜热链球菌(S.thermophilus)和脑膜炎奈瑟球菌(N.Meningitidis))中分离出来——参见Ran et al.,Nature 2015(PMID:25830891),Lee et al.,Mol Ther 2016(PMID:26782639))。Zetsche et al.,(Cell 2015pii:S0092-8674(15)01200-3(PMID:26422227))公开了其他Cas蛋白(例如Cpf1)。

在一些实施方案中,DBD是TALE。

在一些实施方案中,DBD是无催化活性的Cas(dCas)。优选地,dCas是dCas9。

在一些实施方案中,DBD是tTA。

在其他实施方案中,DBD是rtTA。

在一些实施方案中,DBD由选自下组的核苷酸序列编码:SEQ ID NO:45、SEQ IDNO:48、SEQ ID NO:49和与它们具有至少75%、80%、85%、90%、95%、97%、98%或99%的同一性的序列。

在一些实施方案中,DBD能够结合选自下组的一种或多种核苷酸序列:SEQ ID NO32至40和与它们具有至少75%、80%、85%、90%、95%、97%、98%或99%的同一性的序列。在一些实施方案中,DBD能够结合选自下组的一种或多种核苷酸序列:SEQ ID NO:32、SEQID NO:33、SEQ ID NO:34和SEQ ID NO:38。优选地,DBD能够结合SEQ ID NO:34或SEQ IDNO:38。

转录激活物(TA)域

转录激活物(TA)域包含激活转录的多肽的结合位点。

用于本发明的TA域的例子包括但不限于VP16、VP64、VP128、VP160、VPR、p65、Rta、HSF1、协同激活介体(SAM)和SunTag。

在一些实施方案中,TA是VPR。在其他实施方案中,TA是VP160。在其他实施方案中,TA是VP16。

在一些实施方案中,TA域由选自下组的核苷酸序列编码:SEQ ID NO:46、SEQ IDNO:47和与它们具有至少75%、80%、85%、90%、95%97%、98%或99%的同一性的序列。

在一些实施方案中,第二组分是工程化转录反式激活物(ETT)多肽或编码ETT多肽的核苷酸序列;其中ETT多肽包含DNA结合域(DBD)和至少一个转录激活物(TA)域;

其中DBD选自下组:转录激活物样效应物(TALE)DBD、锌指、无催化活性的Cpfl或无催化活性的Cas(dCas),和

TA域选自下组:VP16、VP64、VP128、VP160、VPR、p65、Rta、HSF1、SAM和SunTag。

在其他实施方案中,第二组分是工程化转录反式激活物(ETT)多肽或编码ETT多肽的核苷酸序列;其中ETT多肽包含DNA结合域(DBD)和至少一个转录激活物(TA)域;

其中DBD选自下组:TetR或反向TetR(rTetR),和

TA域选自下组:VP16、VP64、VP128、VP160、VPR、p65、Rta、HSF1、SAM和SunTag。

在一些实施方案中,第二组分是工程化转录反式激活物(ETT)多肽或编码ETT多肽的核苷酸序列;其中ETT多肽包含TetR和至少一个VP16。

在一些实施方案中,第二组分是编码ETT多肽的核苷酸序列,其中核苷酸序列具有如SEQ ID NO:58所示的序列或与SEQ ID NO:58所示的核苷酸序列具有至少75%、80%、85%、90%、95%、97%、98%或99%的同一性。

在一些实施方案中,第二组分是工程化转录反式激活物(ETT)多肽或编码ETT多肽的核苷酸序列;其中ETT多肽包含反向TetR和至少一个VP16。

第三组分

如本文所用,术语“第三组分”是指包含基因组靶向核酸酶的核酸酶系统。核酸酶系统切割和/或修复基因组DNA。细胞或细胞群体中核酸酶系统的存在实现编码选择子的核苷酸序列(和任选的最小启动子)的插入以及靶基因座中NOI的校正或插入或缺失或突变。

基因组靶向核酸酶作为蛋白质、RNA、DNA或包含编码基因组靶向核酸酶的核酸序列的表达载体提供。

在一些实施方案中,表达载体是质粒。在其他实施方案中,表达载体是病毒载体。

在一些实施方案中,基因组靶向核酸酶是转录激活物样效应物核酸酶(TALEN)、锌指核酸酶(ZNF)、CRISPR-Cas(例如CRISPR-Cas9、或SpCas9或CRISPR-Cpf(例如CRISPR-Cpf1))或大范围核酸酶。

在一些实施方案中,第三组分另外包含含有至少一个靶向基因组序列的引导RNA。包含至少一种靶向基因组序列的引导RNA能够结合细胞基因组中的至少一种序列。通常,当基因组靶向核酸酶是CRISPR-Cas(例如CRISPR-Cas9或CRISPR-Cpf(例如CRISPR-Cpf1))时,第三组分另外包含引导RNA。通常,引导RNA与基因组靶向核酸酶同时递送。在一些实施方案中,引导RNA在基因组靶向核酸酶之前或之后递送。

引导RNA(gRNA)作为RNA分子、DNA分子或包含编码gRNA的核酸序列的表达载体提供。

在一些实施方案中,表达载体是质粒。在其他实施方案中,表达载体是病毒载体。

在一些实施方案中,gRNA能够结合靶基因座AAVS1。

在一些实施方案中,gRNA能够结合靶基因座IL2RG。

在一些实施方案中,gRNA能够结合靶基因座CD40LG。

通常,gRNA结合启动子的上游。

在一些实施方案中,gRNA能够结合核苷酸序列GTCACCAATCCTGTCCCTAGTGG。

在其他实施方案中,gRNA能够结合核苷酸序列ACTGGCCATTACAATCATGTGGG。

在其他实施方案中,gRNA能够结合核苷酸序列TGGATGATTGCACTTTATCAGGG。

在一些实施方案中,gRNA能够结合选自下组的一种或多种核苷酸序列:SEQ ID NO1至31和与它们具有至少75%、80%、85%、90%、95%、97%、98%或99%的同一性的序列。适当地,gRNA能够结合选自下组的一种或多种核苷酸序列:SEQ ID NO 1至18和21至31以及与它们具有至少75%、80%、85%、90%、95%、97%、98%或99%的同一性的序列。优选地,gRNA能够结合选自下组的一种或多种核苷酸序列:SEQ ID NO:4、SEQ ID NO:9、SEQ ID NO:10和SEQ ID NO:12。

在一些实施方案中,gRNA能够结合选自下组的一种或多种核苷酸序列:SEQ IDNO:70至72和与它们具有至少75%、80%、85%、90%、95%、97%、98%或99%的同一性的序列。

在一些实施方案中,引导RNA(gRNA)作为能够结合一个核苷酸序列的单一引导RNA提供。在其他实施方案中,引导RNA以两种类型的引导RNA的组合提供,每种类型的引导RNA能够结合不同的核苷酸序列。例如,引导RNA以两种类型的引导RNA的组合提供,其中一种能够结合SEQ ID NO:4,另一种能够结合SEQ ID NO:12。在其他实施方案中,引导RNA RNA以三种类型的引导RNA的组合形式提供,每种引导RNA能够结合不同的核苷酸序列。在其他实施方案中,引导RNA以四种类型的引导RNA的组合提供,每种类型的引导RNA能够结合不同的核苷酸序列。在其他实施方案中,引导RNA以至少五种类型的引导RNA的组合提供,每种类型的引导RNA能够结合不同的核苷酸序列。

在一些实施方案中,核酸酶系统为核糖核蛋白(RNP)的形式。

在一些实施方案中,核酸酶系统是包含CRISPR-Cas的RNP。例如,核酸酶系统是包含CRISPR-Cas和cr:tracrRNA(Integrated DNA technologies)的RNP。

优选地,第三组分是包含CRISPR-Cas和引导RNA的核酸酶系统。

优选地,第三组分是包含CRISPR-Cpf和引导RNA的核酸酶系统。

变体

除了本文提到的特定多肽和多核苷酸之外,本发明还包括变体的使用。

本文所述的SEQ ID NO的变体序列与参考序列SEQ ID NO可具有至少75%、80%、85%、90%、95%、97%、98%或99%的序列同一性。优选地,变体序列保留参考序列的一种或多种功能(即是功能性变体)。

变体序列可以包含替换、添加、缺失和/或插入。

变体序列可以包含一个或多个保守取代。可以基于残基的极性、电荷、溶解性、疏水性、亲水性和/或两亲性质的相似性进行保守氨基酸取代。例如,带负电荷的氨基酸包括天冬氨酸和谷氨酸;带正电荷的氨基酸包括赖氨酸和精氨酸;具有相似亲水性值的不带电荷的极性头基的氨基酸包括亮氨酸、异亮氨酸、缬氨酸、甘氨酸、丙氨酸、天冬酰胺、谷氨酰胺、丝氨酸、苏氨酸、苯丙氨酸和酪氨酸。

例如,可以根据下表进行保守取代。在第二列的同一块中,优选在第三列的同一行中的氨基酸可以相互替换:

本发明还涵盖同源取代(取代和替换在本文中均用于表示现有氨基酸残基与替代残基的互换)变体,即同类取代,例如碱性取代碱性、酸性取代酸性、极性取代极性等。

除非本文通过提及特定的单个氨基酸的方式另外明确说明,否则可以使用如下所述的保守取代来取代氨基酸。

脂肪族非极性氨基酸可以是甘氨酸、丙氨酸、脯氨酸、异亮氨酸、亮氨酸或缬氨酸残基。

脂肪族极性不带电荷的氨基可以是半胱氨酸、丝氨酸、苏氨酸、甲硫氨酸、天冬酰胺或谷氨酰胺残基。

脂肪族、极性带电氨基酸可以是天冬氨酸、谷氨酸、赖氨酸或精氨酸残基。

芳香族氨基酸可以是组氨酸、苯丙氨酸、色氨酸或酪氨酸残基。

适当地,可以在上表中同一行的氨基酸之间进行保守取代。

在一些实施方案中,序列是针对受试者进行密码子优化的。

载体

在一些实施方案中,载体包含第一组分(即载体包含供体盒)。

在一些实施方案中,载体包含编码ETT多肽的核苷酸序列。

在一些实施方案中,载体包含编码核酸酶的核苷酸序列。

载体是一种允许或促进实体从一个环境转移到另一个环境的工具。

载体可以是单链或双链的。

载体可以是缺乏整合酶的载体,例如缺乏整合酶的慢病毒载体(IDLV)。

在一些实施方案中,用于本发明的载体是质粒。在其他实施方案中,用于本发明的载体是病毒载体。

在一些实施方案中,病毒载体是病毒载体颗粒的形式。

在一些实施方案中,组分是不同类型载体的混合物。例如,第一组分为病毒载体形式,第二组分为质粒载体形式,并且第三组分为质粒载体形式

病毒载体可以是例如腺相关病毒(AAV)、腺病毒、逆转录病毒或慢病毒载体。优选地,病毒载体是AAV载体或逆转录病毒或慢病毒载体,更优选AAV载体。

对于“源自”某种类型病毒的“载体”,应理解为该载体包含可源自该类型病毒的至少一个组成部分。

腺相关病毒(AAV)载体

腺相关病毒(AAV)是用于本发明的有吸引力的载体系统,因为它具有高整合频率并且可以感染非分裂细胞。这使其可用于将基因递送到组织培养中的哺乳动物细胞中。

AAV具有广泛的感染宿主范围。美国专利No.5139941和美国专利No.4797368中描述了有关AAV载体的产生和使用的详细信息。

重组AAV载体已成功用于标志物基因和涉及人类疾病的基因的体外和体内转导。

优选的载体是能够在人原代细胞如HSPC细胞中实现高转导效率的那些。

在一些实施方案中,载体是AAV6载体或源自AAV6载体的载体。优选地,载体是AAV6载体。

腺病毒载体

腺病毒是一种不通过RNA中间体的双链线性DNA病毒。有超过50种不同的人类腺病毒血清型,根据遗传序列同源性分为6个亚组。腺病毒的自然靶标是呼吸道和胃肠道上皮,通常只引起轻微症状。血清型2和5(具有95%的序列同源性)最常用于腺病毒载体系统,并且通常与年轻人的上呼吸道感染有关。

腺病毒已被用作基因疗法和异源基因表达的载体。大的(36kb)基因组可容纳多达8kb的外源插入DNA,并且能够在互补细胞系中有效复制以产生高达10

来自腺病毒基因组的病毒或外源基因的表达不需要复制细胞。腺病毒载体通过受体介导的内吞作用进入细胞。一旦在细胞内,腺病毒载体很少整合到宿主染色体中。相反,它们作为宿主细胞核中的线性基因组以附加体形式(不依赖于宿主基因组)发挥功能。因此,重组腺病毒的使用减轻与随机整合到宿主基因组中相关的问题。

逆转录病毒和慢病毒载体

逆转录病毒载体可以源自或可源自任何合适的逆转录病毒。已经鉴定了大量不同的逆转录病毒。例子包括鼠白血病病毒(MLV)、人T细胞白血病病毒(HTLV)、小鼠乳腺肿瘤病毒(MMTV)、劳斯肉瘤病毒(RSV)、Fujinami肉瘤病毒(FuSV)、Moloney鼠白血病病毒(Mo-MLV)、FBR鼠骨肉瘤病毒(FBR MSV)、Moloney鼠肉瘤病毒(Mo-MSV)、Abelson鼠白血病病毒(A-MLV)、禽骨髓细胞瘤病毒-29(MC29)和禽成红细胞增多病病毒(AEV)。可在Coffin,J.M.et al.(1997)Retroviruses,Cold Spring Harbour Laboratory Press,758-63中找到逆转录病毒的详细列表。

逆转录病毒可以大致分为两类,“简单的”和“复杂的”。逆转录病毒甚至可以进一步分为七组。这些组的五组代表具有致癌潜力的逆转录病毒。剩余两组是慢病毒和泡沫病毒。Coffin,J.M.et al.(1997)Retroviruses,Cold Spring Harbour Laboratory Press,758-63中呈现这些逆转录病毒的综述。

逆转录病毒和慢病毒基因组的基本结构共享许多共同特征,例如5’LTR和3’LTR。位于在这些之间或之内的是使基因组能够被包装的包装信号,引物结合位点,实现整合到宿主细胞基因组中的整合位点,以及编码包装组分的gag、pol和env基因——这些是病毒颗粒的组装所需的多肽。慢病毒具有额外的特征,例如HIV中的rev和RRE序列,它们能够将整合的原病毒的RNA转录物从细胞核有效输出到受感染靶细胞的细胞质。

在原病毒中,这些基因在两侧侧翼有称为长末端重复(LTR)的区域。LTR负责原病毒整合和转录。LTR也充当增强子-启动子序列,并且可以控制病毒基因的表达。

LTR本身是相同的序列,其可分为三种元件:U3、R和U5。U3源自RNA 3’末端特有的序列。R源自在RNA两端重复的序列。U5源自RNA 5’末端特有的序列。三种元件的大小在不同的逆转录病毒中可以相当大地变化。

在有缺陷的逆转录病毒载体基因组中,gag、pol和env可以不存在或不起作用。

在典型的逆转录病毒载体中,可以从病毒中除去复制所必需的一个或多个蛋白质编码区的至少一部分。这使得病毒载体变得复制缺陷的。病毒基因组的部分也可以被编码候选调节部分的文库替换,所述候选调节部分与载体基因组中的调节控制区和报告部分可操作连接,以产生包含能够转导靶宿主细胞和/或将其基因组整合到宿主基因组中的候选调节部分的载体。

慢病毒载体是较大的逆转录病毒载体组的一部分。慢病毒的详细列表可在Coffin,J.M.et al.(1997)Retroviruses,Cold Spring Harbour Laboratory Press,758-63中找到。简而言之,慢病毒可分为灵长类组和非灵长类组。灵长类慢病毒的例子包括但不限于人类免疫缺陷病毒(HIV),人类获得性免疫缺陷综合征(AIDS)的病原体;和猿猴免疫缺陷病毒(SIV)。非灵长类慢病毒的例子包括原型“慢病毒”visna/maedi病毒(VMV),以及相关的山羊关节炎-脑炎病毒(CAEV)、马传染性贫血病毒(EIAV)和最近描述的猫免疫缺陷病毒病毒(FIV)和牛免疫缺陷病毒(BIV)。

慢病毒家族与逆转录病毒的不同之处在于慢病毒具有感染分裂细胞和非分裂细胞两者的能力(Lewis,P et al.(1992)EMBO J.11:3053-8;Lewis,P.F.et al.(1994)J.Virol.68:510-6)。相比之下,其他逆转录病毒,例如MLV,无法感染非分裂或缓慢分裂的细胞,例如构成例如肌肉、脑、肺和肝组织的细胞。

如本文所用,慢病毒载体是包含至少一个可衍生自慢病毒的组成部分的载体。优选地,该组成部分涉及载体感染细胞、表达基因或复制的生物学机制。

慢病毒载体可以是“灵长类”载体。慢病毒载体可以是“非灵长类”载体(即源自不主要感染灵长类动物,尤其是人类的病毒)。非灵长类慢病毒的例子可以是不自然感染灵长类的慢病毒科的任何成员。

作为基于慢病毒的载体的例子,下面描述了基于HIV-1和HIV-2的载体。

HIV-1载体包含在简单逆转录病毒中也发现的顺式作用元件。已经表明,延伸到gag开放阅读框的序列对于HIV-1的包装是重要的。因此,HIV-1载体通常包含gag的相关部分,其中翻译起始密码子已发生突变。此外,大多数HIV-1载体还包含env基因的部分,其包括RRE。Rev与RRE结合,这允许将全长或单剪接的mRNA从细胞核运输到细胞质。在没有Rev和/或RRE的情况下,全长HIV-1RNA在细胞核中积累。或者,来自某些简单逆转录病毒如Mason-Pfizer猴病毒的组成型转运元件可用于减轻对Rev和RRE的需求。从HIV-1LTR启动子的有效转录需要病毒蛋白Tat。

大多数基于HIV-2的载体在结构上与HIV-1载体非常相似。与基于HIV-1的载体类似,HIV-2载体也需要RRE来有效运输全长或单剪接病毒RNA。

在一个系统中,载体和辅助构建体来自两种不同的病毒,并且降低的核苷酸同源性可降低重组的可能性。除了基于灵长类慢病毒的载体外,还开发了基于FIV的载体,作为源自致病性HIV-1基因组的载体的替代。这些载体的结构也类似于基于HIV-1的载体。

优选地,用于本发明的病毒载体具有最小病毒基因组。

“最小病毒基因组”应理解为已对病毒载体进行操作以除去非必需元件并保留必需元件以提供感染、转导靶宿主细胞和递送感兴趣的核苷酸序列至靶宿主细胞所需的功能性。此策略的更多细节可以在WO 1998/017815中找到。

优选地,用于在宿主细胞/包装细胞内产生病毒基因组的质粒载体将具有足够的慢病毒遗传信息以允许在存在包装组分的情况下将RNA基因组包装成能够感染靶细胞,但不能独立复制以在最终靶细胞内产生感染性病毒颗粒的病毒颗粒。优选地,载体缺乏功能性gag-pol和/或env基因和/或复制所必需的其他基因。

然而,用于在宿主细胞/包装细胞内产生病毒基因组的质粒载体还将包括与慢病毒基因组可操作连接的转录调控序列,以指导宿主细胞/包装细胞中基因组的转录。这些调控序列可以是与转录病毒序列(即5’U3区)相关的天然序列,或者它们可以是异源启动子,例如另一个病毒启动子(例如CMV启动子)。

载体可以是自我灭活(SIN)载体,其中病毒增强子和启动子序列已被删除。可以生成SIN载体并在体内以与野生型载体的功效相似的功效转导非分裂细胞。SIN原病毒中长末端重复(LTR)的转录失活应阻止具有复制能力的病毒的动员。这也应能够使得通过消除LTR的任何顺式作用效应调节自内部启动子的基因表达。

载体可以是整合缺陷的。可以例如通过用无催化活性的整合酶(例如在催化位点带有D64V突变的HIV整合酶;Naldini,L.et al.(1996)Proc.Natl.Acad.Sci.USA 93:11382-8;Leavitt,A.D.et al.(1996)J.Virol.70:721-8)包装载体或通过修饰或删除载体LTR中的必需att序列(Nightingale,S.J.et al.(2006)Mol.Ther.13:1121-32),或通过以上的组合产生整合缺陷的慢病毒载体(IDLV)。

药物组合物

在一些实施方案中,根据本发明的方法产生或制备的基因组编辑细胞群体可以与药学上可接受的载体、稀释剂或赋形剂一起配制用于施用于受试者。合适的载体和稀释剂包括等渗盐水溶液,例如磷酸盐缓冲盐水,并且可能含有人血清白蛋白。

细胞治疗产品的处理优选按照细胞疗法的FACT-JACIE国际标准进行。

疗法和细胞移植

本发明提供了根据本发明的方法产生或制备的基因组编辑细胞群体,用于疗法。在一些实施方案中,基因组编辑细胞群体用于基因疗法。在一些实施方案中,基因组编辑细胞群体可用于造血干细胞移植。在一些实施方案中,基因组编辑细胞群体可用于癌症治疗(例如用于治疗骨髓瘤或白血病)。在一些实施方案中,基因组编辑细胞群体可用于组织修复,例如皮肤病(例如真皮病和大疱性表皮松解)或视网膜疾病(例如色素性视网膜炎和先天性利伯氏黑蒙)中的组织修复。

如本文所用,术语“基因疗法”是指对细胞基因组的修饰,其恢复有缺陷的必需基因的功能或消除疾病基因的功能。基因疗法可以是基于慢病毒或基于AAV的。

用途可以作为细胞移植程序的一部分,例如造血干细胞移植程序。

造血干细胞移植(HSCT)是移植源自骨髓(在这种情况下称为骨髓移植)或血液的血液干细胞。干细胞移植是血液学和肿瘤学领域的一种医疗程序,最常对患有血液或骨髓疾病或某些类型的癌症的人进行。

许多HSCT的接受者是多发性骨髓瘤或白血病患者,他们不会受益于长期化疗治疗,或者已经对化疗产生抗性。HSCT的候选者包括儿科病例,其中患者患有先天性缺陷,例如严重联合免疫缺陷(SCID)或先天性中性粒细胞减少症伴干细胞缺陷,以及患有再生障碍性贫血的儿童或成人,他们在出生后失去干细胞。用干细胞移植物治疗的其他病况包括镰状细胞病、脊髓发育不良综合征、神经母细胞瘤、淋巴瘤、尤文氏肉瘤、纤维组织增生性小圆细胞肿瘤和霍奇金病。最近,已经开发出非清髓性或所谓的“微型移植”程序,它们需要更小剂量的准备性化疗和放疗。这使得HSCT可在老年人和在其它情况下认为太虚弱而无法承受传统治疗方案的其他患者中进行。

在一些实施方案中,根据本发明的方法制备的基因组编辑细胞群体作为自体细胞移植程序的一部分施用。

在其他实施方案中,根据本发明的方法制备的基因组编辑细胞群体作为同种异体细胞移植程序的一部分施用。

如本文中使用,术语“自体干细胞移植程序”应当理解为起始细胞群体(它们然后根据本发明的方法进行基因组编辑)是从与接受基因组编辑细胞群体施用的受试者相同的受试者获得的。自体移植程序是有利的,因为它们避免了与免疫学不相容性相关的问题,并且无论遗传匹配供体的可用性如何,可用于受试者。

如本文中使用,术语“同种异体干细胞移植程序”应当理解为起始细胞群体(它们然后根据本发明的方法进行基因组编辑)是从与接受基因组编辑细胞群体施用的受试者不同的受试者获得的。优选地,将供体与接受细胞施用的受试者遗传匹配,以使免疫学不相容的风险最小化。

例如,基因组编辑细胞群体的合适剂量应当在治疗和/或预防上是有效的。待施用的剂量可以取决于受试者和待治疗的病况,并且可以由技术人员容易地确定。

造血祖细胞提供短期移植。因此,通过施用转导的造血祖细胞的基因疗法将在受试者中提供非永久性效应。例如,该效应可能限于在施用转导的造血祖细胞后1-6个月。

此类造血祖细胞基因疗法以适用于治疗获得性疾病,例如癌症,其中感兴趣的(潜在毒性)抗癌核苷酸的时间限制性表达可以足以根除疾病。

基因组编辑细胞群体可用于治疗WO 1998/005635中列出的疾病。为了便于参考,现在提供了所述列表的一部分:癌症、炎症或炎性疾病、皮肤病症、发热、心血管效应、出血、凝血和急性期反应、恶病质、食欲缺乏、急性感染、HIV感染、休克状态、移植物抗宿主反应、自身免疫性疾病、再灌注损伤、脑膜炎、偏头痛和阿司匹林依赖性抗血栓形成;肿瘤生长、侵入和扩散、血管生成、转移、恶性、腹水和恶性胸腔积液;脑缺血、缺血性心脏病、骨关节炎、类风湿关节炎、骨质疏松症、哮喘、多发性硬化、神经变性、阿尔茨海默(Alzheimer)氏病、动脉粥样硬化、中风、血管炎、克罗恩(Crohn)氏病和溃疡性结肠炎;牙周炎,牙龈炎;银屑病、特应性皮炎、慢性溃疡,大疱性表皮松解症;角膜溃疡,视网膜病变和手术伤口愈合;鼻炎、过敏性结膜炎、湿疹、过敏反应;再狭窄、充血性心力衰竭、子宫内膜异位症、动脉粥样硬化或内硬化(endosclerosis)。

另外/或者,基因组编辑细胞群体可用于治疗WO 1998/007859中列出的病症。为了便于参考,现在提供了该列表的一部分:细胞因子和细胞增殖/分化活性;免疫抑制或免疫刺激活性(例如用于治疗免疫缺陷,包括人免疫缺陷病毒感染;调节淋巴细胞生长;治疗癌症和许多自身免疫性疾病,以及预防移植排斥或诱导肿瘤免疫);调节血液生成,例如治疗髓样或淋巴样疾病;促进骨、软骨、肌腱、韧带和神经组织的生长,例如用于治疗伤口,治疗烧伤、溃疡和牙周病以及神经变性;抑制或激活促卵泡激素(调节生育力);趋化性/趋化因子活性(例如用于将特定细胞类型动员到损伤或感染部位);止血和溶栓活性(例如用于治疗血友病和中风);抗炎活性(用于治疗例如败血性休克或克罗恩氏病);作为抗微生物剂;例如新陈代谢或行为的调节剂;作为止痛药;治疗特定的缺陷性病症;在治疗例如银屑病中,在人或兽药物中。

另外/或者,基因组编辑细胞群体可用于治疗WO 1998/009985中列出的病症。为了便于参考,现在提供了该列表的一部分:巨噬细胞抑制和/或T细胞抑制活性和因此抗炎活性;抗免疫活性,即对细胞和/或体液免疫应答的抑制效应,包括与炎症无关的反应;抑制巨噬细胞和T细胞粘附于细胞外基质成分和纤连蛋白的能力,以及T细胞中上调的fas受体表达;抑制不想要的免疫反应和炎症,包括关节炎,包括类风湿性关节炎、与超敏反应相关的炎症、过敏反应、哮喘、系统性红斑狼疮、胶原病和其它自身免疫性疾病、与动脉粥样硬化有关的炎症、动脉粥样硬化、动脉粥样硬化性心脏病、再灌注损伤、心脏停搏、心肌梗死、血管炎症性疾病、呼吸窘迫综合征或其它心肺疾病、与消化性溃疡相关的炎症、溃疡性结肠炎等胃肠道疾病、肝纤维化、肝硬化或其它肝病、甲状腺炎或其它腺体疾病、肾小球肾炎或其它肾脏和泌尿疾病、耳炎或其它耳鼻喉科疾病、皮炎或其它皮肤疾病、牙周病或其它牙科疾病、睾丸炎或附睾炎(epididimo-orchitis)、不育、睾丸外伤(orchidal trauma)或其它免疫相关睾丸疾病、胎盘功能障碍、胎盘功能不全、习惯性流产、子痫、先兆子痫和其它免疫和/或炎性相关的妇科疾病、后葡萄膜炎、中间葡萄膜炎、前葡萄膜炎、结膜炎、脉络膜视网膜炎、葡萄膜视网膜炎(uveoretinitis)、视神经炎、眼内炎症,例如视网膜炎或囊样斑点水肿、交感性眼炎、巩膜炎、色素性视网膜炎、变性性眼底病(degenerative fondus disease)的免疫和炎性成分、眼外伤的炎性成分、感染引起的眼部炎症、增殖性玻璃体视网膜病变、急性缺血性视神经病变、过度瘢痕形成,例如在青光眼过滤手术之后,针对眼部植入物的免疫和/或炎症反应和其它免疫和炎性相关眼科疾病、与自身免疫性疾病或状况或病症有关的验证(其中都在中枢神经系统(CNS)或任何其它器官中,免疫和/或炎症抑制将是有益的)、帕金森氏病、来自治疗帕金森病的顺从性和/或副作用、AIDS相关性痴呆复合物HIV相关性脑病、德维克病(Devic’s disease)、西德纳姆舞蹈病(Sydenham chorea)、阿尔茨海默氏病和CNS的其它变性性疾病、状况或病症、中风的炎性成分、脊髓灰质炎后综合征、精神障碍的免疫和炎性成分、脊髓炎、脑炎、亚急性硬化性全脑炎、脑脊髓炎、急性神经病、亚急性神经病、慢性神经病、格-巴二氏综合征(Guillaim-Barre syndrome),西德纳姆舞蹈病(Sydenham chora)、重症肌无力、假性脑瘤(pseudo-tumour cerebri)、唐氏综合征(Down'sSyndrome)、亨廷顿氏病、肌萎缩侧索硬化、CNS压迫或CNS创伤或CNS感染的炎性成分,肌肉萎缩和营养不良的炎性成分,以及中枢和周围神经系统的免疫和炎症相关疾病、状况或病症、创伤后炎症、感染性休克、感染性疾病、炎症并发症或手术的副作用、骨髓移植或其它移植并发症和/或副作用、基因疗法的炎症和/或免疫并发症和副作用,例如由于感染病毒载体,或与AIDS相关的炎症,以足以或抑制体液和/或细胞免疫应答,以治疗或改善单核细胞或白细胞增殖性疾病,例如,白血病(通过减少单核细胞或淋巴细胞的量进行),以在移植天然或人工细胞、组织和器官如角膜、骨髓、器官、镜片、起搏器、天然或人工的皮肤组织的情况下预防和/或治疗的移植物排斥。

此外/或者,基因组编辑细胞群体可用于治疗β-地中海贫血、慢性肉芽肿病、异染性脑白质营养不良、粘多糖累积病和其他溶酶体贮积症。

在一些实施方案中,基因组编辑细胞群体可用于治疗严重联合免疫缺陷(SCID),例如X连锁SCID。

在一些实施方案中,基因组编辑细胞群体可用于治疗皮肤病,例如大疱性表皮松解。

在一些实施方案中,基因组编辑细胞群体可用于治疗单基因病症,例如大疱性表皮松解和/或色素性视网膜炎和/或高IgM(HIGM)综合征。

在一些实施方案中,基因组编辑细胞群体可用于治疗视网膜疾病,例如色素性视网膜炎和/或先天性利伯氏黑蒙。

在一些实施方案中,基因组编辑细胞群体可用于治疗大疱性表皮松解。

在一些实施方案中,基因组编辑细胞群体可用于治疗色素性视网膜炎。

在一些实施方案中,基因组编辑细胞群体可用于治疗先天性利伯氏黑蒙。

在一些实施方案中,基因组编辑细胞群体可用于治疗高IgM(HIGM)综合征。

试剂盒

在一个方面,提供了一种试剂盒,其包含如本文定义的第一组分、如本文定义的第二组分和如本文定义的第三组分以及任选的细胞群体。

可以在合适的容器中提供组分和任选的细胞群体。

试剂盒还可包括使用说明。

治疗方法

应当理解,本文对治疗的所有提及包括治愈性、姑息性和预防性治疗;尽管在本发明的上下文中,提及预防更常见地与预防性治疗相关。在一些实施方案中,优选治疗哺乳动物,特别是人类。人类和兽医治疗都在本发明的范围内。

本领域技术人员将理解,在不脱离所公开的本发明范围的情况下,他们可以组合本文公开的本发明的所有特征。

施用

尽管用于本发明的基因组编辑细胞群体可以单独施用,但它们通常与药物载体、赋形剂或稀释剂混合施用,特别是用于人类疗法。

剂量

技术人员可以容易地确定向受试者施用的基因组编辑细胞群体的合适剂量而无需过度实验。通常,内科医生会确定最适合个体患者的实际剂量,并且它取决于多种因素,包括所用特定药剂的活性、药剂的代谢稳定性和作用长度、年龄、体重、一般健康状况、性别、饮食、施用方式和时间、排泄率、药物组合、特定病况的严重程度以及经历治疗的个体。当然,在个别情况下,更高或更低的剂量范围是值得的,并且这在本发明的范围内。

受试者

“受试者”是指人类或非人类动物。

非人类动物的实例包括脊椎动物,例如哺乳动物,例如非人类灵长类动物(特别是高等灵长类动物)、狗、啮齿动物(例如小鼠、大鼠或豚鼠)、猪和猫。非人类动物可以是伴侣动物。

优选地,受试者是人。

现在将通过非限制性示例来描述本发明的优选特征和实施方案。

除非另有说明,本发明的实践将采用化学、生物化学、分子生物学、微生物学和免疫学的常规技术,这些技术在本领域普通技术人员的能力范围内。此类技术在文献中进行了解释。参见,例如Sambrook,J.,Fritsch,E.F.and Maniatis,T.(1989)MolecularCloning:A Laboratory Manual,第2版,Cold Spring Harbor Laboratory Press;Ausubel,F.M.et al.(1995和定期补充)Current Protocols in Molecular Biology,第9,13和16章,John Wiley&Sons;Roe,B.,Crabtree,J.and Kahn,A.(1996)DNA Isolation andSequencing:Essential Techniques,John Wiley&Sons;Polak,J.M.and McGee,J.O’D.(1990)In Situ Hybridization:Principles and Practice,Oxford University Press;Gait,M.J.(1984)Oligonucleotide Synthesis:A Practical Approach,IRL Press;和Lilley,D.M.and Dahlberg,J.E.(1992)Methods in Enzymology:DNA Structures PartA:Synthesis and Physical Analysis of DNA,Academic Press。这些通用教科书中的每篇都通过引用并入本文。

实施例

材料和方法

载体和核酸酶

用于HDR的AAV6供体模板从含有AAV2反向末端重复的构建体产生,通过三重转染方法产生,并通过在氯化铯梯度上超速离心进行纯化,如前所述(1)。先前报告(2)了具有AAVS1基因座同源性(编码minCMV.GFP或SK.GFP报告物盒)或靶向IL2RG的内含子1(编码IL2RG校正性cDNA,后面是PGK.GFP报告物盒或2A.NGFR选择子盒)的AAV-6供体模板的设计。使用在线CRISPR设计工具(4)设计用于基因靶向的gRNA序列,并根据预测的特异性评分和中靶活性进行选择。由gRNA识别的基因组序列如下所示。

表A:gRNA识别的基因组序列。

通过以1:1.5摩尔比s.p.Cas9蛋白(Aldevron)与合成cr:tracrRNA(IntegratedDNA Technologies)在25℃温育10分钟来组装核糖核蛋白(RNP)。根据制造商的说明,在电穿孔之前添加电穿孔增强剂(Integrated DN ATechnologies)。

在表1中报告了反式激活平台的gRNA序列。Sp-dCas9-VPR质粒购自Addgene(#63789),并且Sp-dCas9–VP160克隆自质粒#47107(Addgene)。已通过Golden Gate策略在pUC质粒中克隆TALE,并且在C端融合来自质粒#63789的VPR域。TALE结合位点列于表2中。对于mRNA体外转录,将TALE#7-或TALE#3-VPR或VP160构建体克隆到含有T7启动子、β-珠蛋白3’UTR和64bp-polyA的pVax质粒中。

表1

#1-31是SEQ ID No:1-31。

表2-TALE DBD

TALE#1-SEQ ID NO:32

TALE#2-SEQ ID NO:33

TALE#3-SEQ ID NO:34

TALE#4-SEQ ID NO:35

TALE#5-SEQ ID NO:36

TALE#6-SEQ ID NO:37

TALE#7-SEQ ID NO:38

TALE#8-SEQ ID NO:39

TALE#9-SEQ ID NO:40

K562细胞系中的基因编辑和靶基因反式激活

K562细胞系是一种人类永生化骨髓性白血病细胞系;K562细胞属于红白血病类型。

在补充有青霉素、链霉素、谷氨酰胺和10%FBS的IMDM培养基(GIBCO-BRL)中培养K562细胞系。对于基因靶向实验,使用50μg/ml编码供体DNA模板的质粒和2.5-1.25μM RNP对3x10

人类CD34+细胞中的基因编辑和靶基因反式激活

CD34+细胞在获得知情同意后并经Ospedale San Raffaele生物伦理委员会批准从人脐带血(CB)中新鲜纯化,或者从Lonza冷冻购买。CD34+细胞根据先前优化的方案(2)进行编辑。简而言之,在补充有青霉素、链霉素、谷氨酰胺、1μM SR-1(Biovision)、50μM UM171(STEMCell Technologies)、仅在培养开始添加的10μM PGE2(Cayman)和人早期作用细胞因子(SCF 100ng/ml、Flt3-L 100ng/ml、TPO 20ng/ml和IL-6 20ng/ml;均购自Peprotech)的无血清StemSpan培养基(StemCell Technologies)中刺激5x10

根据制造商的说明,使用MACSelect LNGFR MicroBead进行基于珠的LNGFR+细胞选择。

NSG小鼠中的CD34+HSPC异种移植研究

NOD-SCID-IL2Rg

将用于培养第5天进行编辑和反式激活而处理的6x10

分子分析

对于分子分析,根据可用细胞的数量,使用DNeasy Blood&Tissue试剂盒或QIAampDNA Micro试剂盒(QIAGEN)分离基因组DNA。核酸酶活性(IL2RG内含子1,AAVS1)通过错配敏感核酸内切酶测定法测量,通过基于PCR的靶向基因座扩增,然后根据制造商的说明用T7核酸内切酶I(NEB)消化进行。根据制造商的说明,在LabChip GX Touch HT(Perkin Elmer)上通过毛细管电泳对消化的DNA片段进行解析和定量。

对于数字液滴PCR分析,根据制造商的说明,使用QX200液滴数字PCR系统(Biorad)一式两份分析5-50ng基因组DNA。

对于HDR ddPCR,在载体序列和靶定基因座之间的接合以及用于标准化的对照序列(人TTC5基因)上设计引物和探针。针对每个特定应用如下调整退火和延伸的热条件:AAVS1/内含子1IL2RG HDR 3’整合接合ddPCR:55℃30秒,72℃2分钟。PCR和ddPCR扩增的引物和探针显示在下表C中。

表C.PCR和ddPCR扩增的引物和探针

对于基因表达分析,使用RNeasy Plus Micro Kit(QIAGEN)提取总RNA。使用SuperScript VILO IV cDNA Synthesis Kit(Invitrogen)合成cDNA,并使用定位到IL2RG和HPRT作为标准化器的TaqMan Gene Expression Assays(Applied Biosystems)在Viia7Real-time PCR热循环仪中用于Q-PCR。首先将每个基因的相对表达相对于HPRT表达标准化,然后表示为相对于模拟处理样品的倍数变化。

流式细胞术

对于免疫表型分析(在FACSCanto II上进行;BD Pharmingen),使用下表B中列出的抗体。单一染色和Fluorescence Minus One染色的细胞用作对照。LIVE/DEAD FixableDead Cell Stain试剂盒(Thermo Fisher)、7-氨基放线菌素(Sigma Aldrich)根据制造商的说明包含在用于流式细胞术的样品制备中,以从分析中排除死细胞。使用MoFlo XDP细胞分选仪(Beckman Coulter)或FACSAria Fusion(BD Biosciences)进行细胞分选。

表B:用于免疫表型分析的抗体。BD是指BD Biosciences。

+结果

腺相关病毒整合位点1(AAVS1)基因座是用于靶向整合表达感兴趣基因(GOI)的盒的最有效的基因组港湾之一(Lombardo et al.,2011)。因此,我们设想在AAVS1位点中应用本文公开的SMrT策略(图1A)。为此,我们在K562类成红血细胞(erythroblastoid)细胞系中在最小表达性CMV衍生(minCMV)启动子的控制下进行含有ΔLNGFR cDNA的供体DNA的靶向整合。通过从处理的细胞中进行单细胞克隆,我们鉴定出具有我们的构建体的靶向整合的克隆(即完整的5’和3’载体-基因组接合),其不表达ΔLNGFR(克隆H1)(图1B)。

为了建立我们的ETT平台,我们设计了29个靶向跨越minCMV启动子上游区域的不同序列的sgRNA(表1),并且我们通过在克隆H1中递送U6.sgRNA质粒来筛选它们在非饱和条件下的切割活性。我们观察到几乎所有sgRNA以高于60%的效率切割靶序列(图1C)。

用于靶基因激活的最广泛利用的反式激活域是多聚体VP16衍生蛋白(例如VP64、VP128、VP160)和三方反式激活物VPR(VP64-p65-Rta)(Chavez et al.,2015)。我们将无催化活性的S.p.Cas9蛋白(dCas9)(含有D10A和H840A突变)(Jinek et al.,Science 2012;377(6096):816-821;PMID:22745249)与VP160或VPR域融合,并且我们测试了ETT与一些先前筛选的sgRNA的组合。虽然单独的ETT未虚假地反式激活ΔLNGFR表达,但sgRNA与ETT表达质粒的共同递送导致了用8个测试引导物中的3个进行的有效且瞬时的反式激活。通过递送性能最佳的sgRNA,我们在电穿孔后48小时实现高达85%的ΔLNGFR+细胞和分别在dCas9-VP160或–VPR的情况下12倍和20倍的ΔLNGFR细胞表面表达(以相对于未处理的对照的相对荧光强度[RFI]测量)(图1D和1E)。值得注意的是,当我们递送等量的两种效力较低的sgRNA(靶向minCMV启动子上游的不同序列)时,我们观察到了强烈的协同效应。这些数据与以下发现一致,即VPR与VP16衍生的反式激活物相比更有效,并且多种引导物的组合来驱动相同ETT强烈增强靶基因激活(Chavez et al.,2016)。此外,我们的数据证实,当DNA靶序列靠近转录起始位点(TSS)时,尤其是在100到250bp之间时,基因反式激活更有效(Gilbert etal.,2014;Konermann et al.,2015)。

为了评估我们的平台是否也适用于其他技术,我们将转录激活物样效应物(TALE)DBD与VP160反式激活域融合,所述DBD识别minCMV启动子上游的9个不同靶序列(表2),并且我们在克隆H1中递送TALE-VP160表达质粒。我们发现9个ETT的3个有效反式激活ΔLNGFR表达,并且令人感兴趣的是,最有效的ETT(TALE#7)与性能最佳的sgRNA具有相同的结合特异性(图1F)。此外,当用编码TALE7 ETT的mRNA对克隆H1进行电穿孔时,实现了更有效的反式激活和降低的毒性,处理后12至48小时之间出现NGFR表达峰值(图1G)。

原则上,基因修饰细胞的富集可以通过将ETT与编辑机器共递送(“早期选择”)或通过在基因靶向程序后几天推迟ETT递送(“晚期选择”)来实现。在第一个选项中,ETT结合位点必须一定在HA外的基因组上定位,以避免附加体供体反式激活。因此,我们修改了我们的载体(包含选择子盒和GOI盒)的设计以缩短左HA,并且当使用一个AAVS1基因座中小于300bp的HA时,我们观察到对基因靶向效率的最小影响(图2A)。为了在有效的基因靶向和瞬时反式激活之间取得最佳折衷,我们使用了约150bp左HA的HDR供体构建体,从而避免了供体模板中TALE#7和sgRNA#10结合位点的存在。由于在K562细胞系中的AAVS1基因座中含有minCMV-ΔLNGFR靶向整合的相关分数细胞在细胞表面上呈现ΔLNGFR,即使在没有任何反式激活的情况下,我们通过用其改善的合成形式“T6-SK”(在图2B中称为SK)替换该启动子(minCMV)来改善HDR供体设计,据报道所述改善的合成形式“T6-SK”减少启动子泄漏而不影响Tet-ON系统配置中的诱导表达能力(Loew et al.,BMC Biotechnol.2010)。在靶向整合后,我们一致性观察到SK-ΔLNGFR盒的稳态表达比表达minCMV的盒少约2倍(但未消除),绝大多数细胞基本表达ΔLNGFR,如通过基因靶向效率的基于ddPCR的量化确认。相反,当对无启动子的ΔLNGFR构建体进行基因靶向时,仅小分数的细胞在其表面上呈现ΔLNGFR(图2B)。为了在“后期选择”设置中验证我们的SMarT策略,我们在基因靶向程序后两周对基于CRISPR/dCas9的ETT进行电穿孔,并获得了高效且瞬时的ΔLNGFR过表达(图2C)。类似地,为了在“早期选择”设置中验证SMrT策略,我们在K562中共同电穿孔基于CRISPR/dCas9的ETT以及用于AAVS1靶向的基因编辑试剂。通过在ETT递送后24小时对ΔLNGFR

造血干细胞(HSC)基因疗法最近显示出对受血液学或非血液学遗传病症影响的患者的明显益处。HSC中的靶向基因组编辑将允许通过避免插入诱变和提供校正转基因的生理调节来改善基因治疗方法的安全性。然而,基于基因靶向的方法的更广泛适用性受到HDR介导的靶向整合效率的限制,尤其是在长期再增殖祖细胞中。为了研究SMrT策略是否可以与造血干细胞和祖细胞(HSPC)中的基因编辑方案相结合,我们在脐带血(CB)衍生的CD34+细胞中进行了基因靶向实验,并通过单次电穿孔递送AAVS1特异性核酸酶(作为RNP)和TALE#7ETT(作为mRNA)两者(图3A)。如预期,与K562细胞系相比,我们观察到HSPC中minCMV和T6-SK启动子两者情况下更低的基础报告物基因(GFP)表达。我们在ETT存在下检测到两种构建体情况下的GFP表达的低但可察觉的反式激活,这在TALE#7-VPR的情况下更为明显,尽管在定型祖细胞中更有效(图3B)。我们观察到高分数的经编辑的HSPC在反式激活时过表达GFP(如通过HDR介导的整合的分子量化所表明的)(图3C)。为了验证我们的“后期选择”策略,我们在基因编辑程序后3-4天对TALE#7-VPR mRNA进行电穿孔。在这里,我们观察到与早期选择方案相比更有效的反式激活能力(就GFP+细胞的百分比和GFP MFI两者而言),尽管在更定型的祖细胞中仍然更有效(图3D)。这些结果提供了原理论证,即SMrT策略允许在选择子蛋白的瞬时反式激活后选择AAVS1编辑的HSPC。

为了进一步增加选择子基因的表达,可以在存在翻译激活物的情况下应用SMrT策略,例如包含真核起始因子4G(eIF4G)适体的模块化RNA激活物,其以不依赖于5’-UTR的方式激活靶mRNA翻译(Liu et al.,2018)。更详细地,RNA适体的一个或多个结合位点将插入到刚好在TSS下游的校正构建体中,以加强mRNA翻译。另一种增加选择子表达的可能方法是利用用于驱动感兴趣的治疗基因表达的启动子(例如EF1alpha启动子)的增强子活性。不希望受理论束缚,在最小启动子附近的强增强子/启动子区域的存在可通过就位募集更多转录核心因子来改善对选择子基因的反式激活效率。

平行地,我们开发了一种类似的策略,称为依靠内源性受体人工反式激活的选择(SMrTER),它基于内源性受体的瞬时反式激活,可以适用于富集经过基因的位点特异性校正的细胞,所述基因的产物不提供选择性生长优势或可以不适合选择(例如细胞内蛋白质,不适合抗体介导的识别等)。在这些设置中,选择子蛋白的表达取决于对校正基因的转录活性,该基因将依靠ETT瞬时反式激活,因此当校正基因在靶细胞中表达不足时,也允许选择编辑的细胞(图4A)。作为原理论证,我们在白细胞介素2受体共同γ-链(IL2RG)基因的基因校正背景中应用此策略,该基因在X连锁严重联合免疫缺陷(SCID-X1)中发生突变。通过在男性人类HSPC中此基因的内含子1中整合校正cDNA,我们最近证明IL2RG编辑的HSC能够在免疫缺陷NSG小鼠中长期持续存在并导致功能性多谱系重建(Schiroli et al.,2017)。在SCID-X1疾病中,即使是少数校正的祖细胞也可以挽救疾病表型。然而,由于竞争自BM衍生的CLP的胸腺再增殖的缺乏,功能祖细胞的输入与胸腺淋巴瘤的风险呈负相关(Ginn etal.,2017;Martins et al.,2014;Schiroli et al.,2017)。尽管人类HSPC中IL2RG基因座中的基因校正水平超过安全且有效治疗SCID-X1疾病的阈值,但在体内施用前富集IL2RG编辑的HSPC可以允许进一步降低任何理论的恶性风险,并最小化含有脱靶整合的HSPC的施用。此外,IL2RG编辑的HSPC的离体选择可以作为模型起作用,该模型可便于位点特异性校正其它基因,例如gp91phox、HBB、RAG1、CD40LG、TRAC、TRBC、STAT、PRF1或编码在皮肤中表达的蛋白质的基因,例如胶原蛋白、角蛋白、层粘连蛋白、桥粒芯粘着蛋白、桥粒斑蛋白、桥粒芯蛋白、斑珠蛋白、阔叶碱、整联蛋白或其他参与桥粒和半桥粒的蛋白质。

我们首先设计了三个TALE-VP160,它们结合IL2RG启动子中接近共有TATA盒的不同区域。为了测试这些基于TALE的ETT是否能够加强γ链表达,我们分别在K562细胞系中电穿孔表达TALE-VP160的质粒,所述K562细胞系基本上以可检测水平表达IL2RG mRNA(与HEK293T细胞系不同)。我们发现仅仅TALE#3-VP160(图中称为T3)能够诱导11倍的IL2RG过表达,从而达到与在雄性B类淋巴母细胞系(JY)中基本测量的水平相当的IL2RG mRNA水平(图4B)。因此,我们选择TALE#3作为IL2RG反式激活的候选物。

为了评估我们在人类HSPC中选择策略的可行性,我们生成了报告物,用于通过靶向基因内含子1中的剪接受体位点(SA).T2A.GFP盒来检查IL2RG启动子活性,并且我们共递送TALE#3-VP160或TALE#3-VPR mRNA。我们发现反式激活活性对基因靶向效率没有影响,但我们观察到在存在TALE#3-VP160,尤其是TALE#3-VPR的情况下,所有HSPC亚群中GFP MFI的显著改善(图4C和4D)。为了重建IL2RG基因表达并为此基因开发一种潜在临床适应的选择策略,我们用含有校正性密码子优化的IL2RG cDNA,接着是T2A.ΔLNGFR报告物基因的较大构建体替换T2A.GFP盒。为了在严格依赖于γ链表达进行增殖的人细胞类型上对IL2RGrec.2A.NGFR构建体进行功能验证,我们在原代雄性T淋巴细胞中将其与先前发表的用于IL2RG基因校正的优化供体DNA(IL2RGrec PGK-GFP)(Schiroli et al.,2017)进行了比较。尽管与未编辑的对应物相比经编辑的细胞膜表面上的IL2RG表达显示低约20%,但使用2A.NGFR构建体编辑的细胞亚组与对照编辑细胞相比在培养中类似生长。此外,在培养中随时间未反选择HDR修饰的细胞,从而表明2A.NGFR校正结构的功能性(图5A)。然后,我们通过使用IL2RGrec.2A.NGFR作为HDR的供体DNA和TALE#3-VPR进行瞬时IL2RG启动子反式激活在CB衍生的CD34+细胞中进行选择实验。与2A.GFP靶向整合不同,在没有任何反式激活的情况下,ΔLNGFR在经编辑的细胞表面上(尤其是在更原始的HSPC中)基本不表达,这可能是由于抗ΔLNGFR抗体的灵敏性低所致。因此,需要TALE#3VPR介导的反式激活来潜在地选择经编辑的细胞(图5B和C)。为了进一步评估在ΔLNGFR报告物基因的瞬时过表达时编辑的HSPC的富集是否可行,我们在电穿孔后36小时对报告物表达细胞进行FACS或磁珠选择。两种选择方法都在阳性选择的细胞亚组中产生约75%的ΔLNGFR+细胞,高达90%的HDR编辑通过ΔLNGFR+FACS分选分数中的分子分析测量。我们还测量ΔLNGFR-分数中一致的HDR水平,因此表明我们的选择过程具有约50%的产率。此外,我们仅观察到ΔLNGFR+分选和未分选HSPC之间的亚群组成的微小差异,显示我们的程序没有强烈偏向于富集更定型的祖细胞(图5C和D)。

SMrTER策略可以通过向选择子基因添加配体可调节脱稳定化域,诸如基于FKBP域的脱稳定化域(Banaszynski et al.,2006)或者来自人雌激素受体的脱稳定化域(Miyazaki et al.,2012)进一步改良,以避免在生理上表达编辑基因的分化细胞中选择子的表达。如果将SMarTER策略应用于校正产生受影响基因表达缺乏的遗传突变,并且如果受影响的基因是表面暴露的蛋白质,例如在SCID-X1中的IL2RG的情况下,则可以通过利用校正基因本身作为选择子标志物进一步优化SMarTER策略。在这种情况下,校正基因的内源启动子上的ETT结合将导致细胞表面蛋白的过表达,其可用作FACS或磁珠介导的校正细胞富集的表面标志物。

实施例2

方法

载体和核酸酶

用于HDR的AAV6供体模板从含有AAV2反向末端重复的构建体产生,通过三重转染方法产生,并通过在氯化铯梯度上超速离心纯化,如前所述(Wang et al.,2015)。AAV6供体模板的设计在补充材料部分中详细说明。

gRNA的序列使用在线CRISPR设计工具(Hsu et al.,2013)设计,并根据预测的特异性评分和中靶活性进行选择。gRNA识别的基因组序列如下所示。

表2.1

通过以1:1.5摩尔比SpCas9蛋白(Aldevron)与合成cr:tracrRNA(IntegratedDNATechnologies)在25℃温育10分钟来组装核糖核蛋白(RNP)。根据制造商的说明,在电穿孔之前添加电穿孔增强剂(Integrated DN ATechnologies)。

GSE56.WPRE、Ad5-E4orf6/7.WPRE和GSE56/Ad5-E4orf6/7.WPRE(它们在PCT/EP2019/066915中公开)通过针对智人的密码子优化(GeneArt

对于mRNA体外转录,pVax质粒用限制酶(Spe I)线性化并使用酚-氯仿纯化。使用商业5xMEGAscript T7试剂盒(Invitrogen)在体外转录5’加帽的mRNA。使用RNeasy PlusMini试剂盒(Qiagen)纯化合成RNA,然后进行HPLC柱纯化以去除污染物。然后使用AmiconUltra-15(30K)(Millipore)浓缩RNA。

K562细胞系的基因编辑

在Iscove改良的Dulbecco培养基(IMDM;Corning)中维持人K562细胞,所述培养基补充有10%胎牛血清(FBS;Euroclone)、青霉素(100IU/ml)、链霉素(100μg/ml)和2%谷氨酰胺。用2.5-1.25μM的RNP对K562细胞进行电穿孔。电穿孔后15分钟,以1x10

人类CD34+细胞的基因编辑

CD34+细胞从Lonza冷冻购买。CD34+细胞根据先前优化的方案(Schiroli et al.,2017)进行编辑。简而言之,在无血清StemSpan培养基(StemCell Technologies)中刺激5x10

NSG小鼠中的CD34+HSPC异种移植研究

NOD-SCID-IL2Rg

对于移植,将用于培养第4.5天进行编辑而处理的2x10

分子分析

对于分子分析,根据可用细胞的数量,使用DNeasy Blood&Tissue试剂盒或QIAampDNA Micro试剂盒(QIAGEN)分离基因组DNA。对于数字液滴PCR分析,根据制造商的说明,使用QX200液滴数字PCR系统(Biorad)分析5-50ng基因组DNA。对于HDR ddPCR,在载体序列和靶定基因座之间的接合以及用于标准化的对照序列(人TTC5基因)上设计引物和探针。退火和延伸的热条件调整如下:55℃30秒,72℃2分钟。PCR和ddPCR扩增的引物和探针如下所示。

表2.2

流式细胞术

对于免疫表型分析(在FACSCanto II上进行;BD Pharmingen),我们使用下面列出的抗体。使用单染色和Fluorescence Minus One染色的细胞用作对照。根据制造商的说明,将7-氨基放线菌素(Sigma Aldrich)包含在用于流式细胞术的样品制备中,以从分析中排除死细胞。使用MoFlo XDP细胞分选仪(Beckman Coulter)或FACSAria Fusion(BDBiosciences)进行细胞分选。

表2.3

将6至10周龄的C57BL/6-Ly5.1和Cd40lg

结果

为了评估tTA的瞬时递送是否可以激活选择子表达,我们在K562细胞系中的IL2RG基因的内含子1中进行了SMArT-D供体构建体的靶向整合。在靶向后14天,我们观察到模拟电穿孔细胞中检测不到的基础表达水平。相反,使用不同剂量(0.25μg、1μg或3μg)的tTAmRNA编辑后9天电穿孔的细胞显示出有效的反式激活(图2.1B)。

然后,我们通过与以mRNA表达的编辑机器tTA反式激活物共递送在脐带血(CB)衍生的CD34+细胞中测试了我们的平台(图2.2A)。编辑后24和48小时的FACS分析显示,编辑的CD34+细胞中低的但可检测的GFP表达水平。在存在或不存在IL2RG Cas9核糖核蛋白(RNP)(此处引导RNA用于IL2RG)的情况下用tTA mRNA电穿孔的腺相关病毒载体(AAV)转导的HSPC显示出高且可比的GFP表达,表明tTA在整合和非整合构建体两则中以相似的效率反式激活。令人感兴趣的是,与多西环素未处理的细胞相比,电穿孔后多西环素处理有效地控制选择子的表达。与RNP未处理的样品相比,RNP处理的样品显示GFP+细胞的百分比和MFI的显著增加,表明对整合构建体的优先tTA活性。然而,只有小分数的经HDR编辑的细胞表达选择子(图2.2B)。因此,我们假设在处理后几个小时撤出多西环素可以重新唤醒tTA活性并使瞬时选择子优先在靶定细胞中表达,而未整合的AAV拷贝将被降解和稀释。为此,我们在IL2RG编辑时调整多西环素剂量和清除时间,并且我们在用AAV+tTA电穿孔或未用靶向IL2RG基因座的RNP处理的细胞中随时间比较GFP表达(图2.2C)。编辑后12小时的多西环素撤出不允许在靶定(RNP+AAV)细胞中有效的选择子过表达,既不在GFP+细胞的百分比方面也不在GFP+细胞的MFI方面,这不依赖于多西环素剂量。重要的是,与RNP+AAV+tTA清洗的对照相比,与较低的多西环素剂量温育,然后清洗的AAV+tTA处理的细胞仍然显示出较低的选择子+细胞百分比和MFI(图2.2D),证实了甚至在减少的多西环素剂量下对整合的构建体的优先tTA活性。令人感兴趣的是,低剂量多西环素和编辑后24小时的延迟清除导致绝大多数HDR编辑细胞中有效的选择子过表达,撤出后检测不到未整合细胞中的反式激活(图2.2E)。在编辑撤出后36小时,使用较低的多西环素剂量获得类似的结果(图2.2F)。总体而言,这些结果允许定义方案,以便瞬时反式激活CD34+细胞中IL2RG基因座内整合的选择子基因:在预刺激3天后通过电穿孔与RNP一起递送tTA,在AAV6转导后以400nM或80nM添加多西环素,24小时后洗掉(图2.3A)。多项实验的Meta分析显示:

i)由于最小启动子的存在,经编辑的细胞显示选择子表达的最小但可检测的基础水平;

ii)多西环素在非整合构建体上比在整合构建体中更有效控制tTA活性;

iii)多西环素冲洗仅在靶定细胞内允许高反式激活(就阳性细胞百分比而言和就MFI而言)。

此外,几乎所有经编辑的细胞中存在反式激活(图2.3B和2.3C),并且不仅考虑整体细胞,而且还考虑到最原始的区室(CD34+CD133+CD90+)(图2.3D和2.3E)。

为了证明我们的选择平台便于CD34+细胞中的其他相关基因座,我们在腺相关病毒整合位点1(AAVS1)基因座(人基因组中众所周知的安全港)中测试SMrT-D,并且我们直接应用IL2RG中建立的方案(图2.4A)。与我们在先前基因座中观察到的情况相似,我们观察到自整合盒的选择子基因的基础表达的较低水平。当存在时,tTA能够在非整合和整合构建体中诱导高水平的选择子过表达,而多西环素(400nM)特别限制未接受RNP进行靶向整合的细胞中的反式激活。此外,编辑程序后24小时多西环素冲洗导致GFP表达水平增加,限于显示盒整合的细胞(图2.4B和2.4C)。在最原始的HSPC区室中也证实选择子过表达(图2.4D和2.4E)。

我们接下来在另一个临床相关基因座CD40LG(HIGM综合征的致病基因)中测试了SMArT-D策略。在这种情况下,GFP选择子被截短的NGFR替换,以证明我们的策略与临床适应选择子的相容性。我们利用了我们建立的方案(图2.5A),并且我们仍然观察到先前基因座的相同的趋势:来自不含tTA的整合盒的基础表达的最小水平,在多西环素存在的情况下反式激活非常有限(在整合构建体中比在非整合构建体中更明显),在多西环素撤出后仅在编辑的细胞中具有高选择子过表达。这些结果清楚地观察到NGFR阳性细胞的百分比(图2.5B)、MFI(图2.5C)和一些代表性的FACS图(图2.5D)。

为了改善临床适用性,我们决定测试用生物选择子替换标志物基因(GFP或截短的NGFR)的相同策略:以这种方式,我们可以用体内选择替换体外选择(编辑->瞬时反式激活->通过分选选择编辑细胞)。特别是,我们假设仅在通过SMrT-D策略得到的HDR编辑的HSPC中C-X-C趋化因子受体4型(CXCR4)的瞬时过表达会增强HDR编辑的HSPC的植入能力,从而赋予相对于NHEJ编辑或未编辑的对应物的体内瞬时选择优势。事实上,CXCR4是一种生物活性蛋白,其通过使HSPC对SDF1(CXCL12)梯度增敏而参与HSPC迁移和骨髓小生境中归巢(Ara etal.,2003)。此外,CXCR4过表达已显示改善HSPC的植入能力(Kahn et al.,2004)(专利申请PCT/EP2019/062666)。我们用CXCR4野生型(WT)和突变体(WHIM)形式在IL2RG基因座中测试了SMArT-D策略,后者以点突变为特征,所述点突变增加膜上的CXCR4稳定性,可能进一步延长CXCR4在细胞表面上的过表达(Hernandez et al.,2003)。对于这些实验,我们测试了两种不同剂量的多西环素(400nM和80nM)(图2.6A)。我们也观察到测试的较低剂量时的多西环素效应以及仅在编辑级份中多西环素清洗后的瞬时反式激活,几乎所有编辑的细胞被反式激活(图2.6B和2.6C)。此外,查看CD34+细胞亚群,我们在最原始的区室中以较低的多西环素剂量达到多达13%的CXCR4过表达细胞(图2.6D)。为了确认CXCR4过表达细胞显示盒的中靶整合,我们测量分选的CXCR4

此外,我们测试了SMrT-D策略原则上是否可以与改善基因编辑结果的其他策略相结合,例如基于使用腺病毒蛋白(Ad5)-E4orf6/7、p53抑制剂GSE56或它们的组合的策略(PCT/EP2019/066915)。我们的结果表明SMArT-D与所有这些平台相容,而不影响反式激活效率(图2.7A)。

为了评估SMarT-D操作的HSPC是否仍然保留其移植能力,以及CXCR4过表达的HDR编辑细胞是否在体内富集,我们在编辑程序后36小时将250,000个SMArT-D处理的CB衍生的CD34+细胞移植到NSG免疫缺陷小鼠中,由于在基因编辑后24小时清除多西环素的必要性,与标准程序相比延迟12小时。我们具有六组不同的小鼠:

(i)用CXCR4 WT构建体编辑并用tTA瞬时反式激活的细胞;

(ii)用CXCR4 WHIM构建体编辑并用tTA瞬时反式激活的细胞;

(iii)用CXCR4 WT构建体编辑并且未反式激活的细胞。

此外,为了可能地利用p53抑制和CXCR4过表达的协同效应,我们决定在GSE56存在下测试所有条件:

(i)用CXCR4 WT构建体编辑,用tTA瞬时反式激活且在GSE56存在下的细胞;

(ii)用CXCR4 WHIM构建体编辑,用tTA瞬时反式激活且在GSE56存在下的细胞;

(iii)用CXCR4 WT构建体编辑,未反式激活但在GSE56存在下的细胞。

通过对移植后6、9、12和18周收集的血液样品进行FACS分析和用于HDR效率的分子测定法来监测小鼠(图2.8A)。尽管进行了长时间和复杂的离体操作,但SMrT-D反式激活的HDR编辑细胞能够长期移植到免疫缺陷小鼠中。然而,我们不能观察到与未反式激活的细胞相比接受tTA反式激活细胞的小鼠中既无更高的植入也无更高的HDR效率,组间的主要差异主要与接受GSE56处理的细胞的小鼠中再增殖的人类细胞的百分比增强有关(图2.8B和2.8C)。

与整体处理细胞移植物相比,校正细胞的纯群体的富集需要移植少量干细胞。因此,我们推断哪些疾病环境可以受益于甚至有限输入的功能细胞的重建。我们在HIGM1疾病的小鼠模型中建模了“选择样”程序,所述HIGM1疾病是一种由于CD40LG基因失活突变引起并且以响应非自身抗原的缺陷IgG产生为特征的原发免疫缺陷。对经致命照射的Cd40lg敲除(KO)小鼠移植总量1,000,000个的细胞,其中:i)25%Cd40lg野生型(WT)和75%KO或ii)50%WT和50%KO。为了模拟“选择样”设置,我们移植了相同量的WT细胞,250,000或500,000,但没有KO细胞的竞争。作为对照,我们移植1,000,000个KO细胞或1,000,000个WT细胞。我们在移植后12周进行TNP/KLH疫苗接种,并在14周收集血清样品。小鼠在15周时用TNP/KLH抗原加强并收集血清样品(图2.9A和2.9B)。我们没有观察到条件之间外周血中细胞的绝对计数的显著差异(图2.9C)。我们观察到与50%-50%竞争性移植的背景下注射100%WT细胞的小鼠相当的TNP-KLH体液IgG响应的挽救,而25%-75%组仅显示部分挽救。重要的是,即使通过仅移植250,00个WT细胞,也在非竞争环境中实现完全挽救(图2.9D)。这些数据建立了在HIGM综合征的HSPC基因校正背景下选择策略的基本原理。

参考文献

Banaszynski,L.A.,Chen,L.C.,Maynard-Smith,L.A.,Ooi,A.G.,and Wandless,T.J.(2006).A rapid,reversible,and tunable method to regulate protein functionin living cells using synthetic small molecules.Cell 126,995-1004.

Chavez,A.,Scheiman,J.,Vora,S.,Pruitt,B.W.,Tuttle,M.,P R Iyer,E.,…Church,G.M.(2015).Highly efficient Cas9-mediated transcriptionalprogramming.Nature Methods.https://doi.org/10.1038/nmeth.3312

Chavez,A.,Tuttle,M.,Pruitt,B.W.,Ewen-Campen,B.,Chari,R.,Ter-Ovanesyan,D.,…Church,G.(2016).Comparison of Cas9 activators in multiplespecies.Nature Methods.https://doi.org/10.1038/nmeth.3871

De Ravin,S.S.,Li,L.,Wu,X.,Choi,U.,Allen,C.,Koontz,S.,…Malech,H.L.(2017).CRISPR-Cas9 gene repair of hematopoietic stem cells from patients withX-linked chronic granulomatous disease.Science TranslationalMedicine.https://doi.org/10.1126/scitranslmed.aah3480

Dever,D.P.,Bak,R.O.,Reinisch,A.,Camarena,J.,Washington,G.,Nicolas,C.E.,…Porteus,M.H.(2016).CRISPR/Cas9β-globin gene targeting in humanhaematopoietic stem cells.Nature.https://doi.org/10.1038/nature20134

Genovese,P.,Schiroli,G.,Escobar,G.,Di Tomaso,T.,Firrito,C.,Calabria,A.,…Naldini,L.(2014).Targeted genome editing in human repopulatinghaematopoietic stem cells.Nature.https://doi.org/10.1038/nature13420

Gilbert,L.A.,Horlbeck,M.A.,Adamson,B.,Villalta,J.E.,Chen,Y.,Whitehead,E.H.,…Weissman,J.S.(2014).Genome-Scale CRISPR-Mediated Control ofGene Repression and Activation.Cell.https://doi.org/10.1016/j.cell.2014.09.029Ginn,S.L.,Hallwirth,C.V.,Liao,S.H.Y.,Teber,E.T.,Arthur,J.W.,Wu,J.,…Alexander,I.E.(2017).Limiting Thymic Precursor Supply Increasesthe Risk of Lymphoid Malignancy in Murine X-Linked Severe CombinedImmunodeficiency.Molecular Therapy-Nucleic Acids.https://doi.org/10.1016/j.omtn.2016.11.011Iwamoto,M.,

Konermann,S.,Brigham,M.D.,Trevino,A.E.,Joung,J.,Abudayyeh,O.O.,Barcena,C.,…Zhang,F.(2015).Genome-scale transcriptional activation by anengineered CRISPR-Cas9 complex.Nature.https://doi.org/10.1038/nature14136Loew,R.,Heinz,N.,Hampf,M.,Bujard,H.,&Gossen,M.(2010).Improved Tet-responsive promoters with minimized background expression.BMCBiotechnology.https://doi.org/10.1186/1472-6750-10-81

Lombardo,A.,Cesana,D.,Genovese,P.,Di Stefano,B.,Provasi,E.,Colombo,D.F.,…Naldini,L.(2011).Site-specific integration and tailoring of cassettedesign for sustainable gene transfer.Nature Methods,8(10),861–869.https://doi.org/10.1038/nmeth.1674

Martins,V.C.,Busch,K.,Juraeva,D.,Blum,C.,Ludwig,C.,Rasche,V.,…Rodewald,H.R.(2014).Cell competition is a tumour suppressor mechanism in thethymus.Nature.https://doi.org/10.1038/nature13317

Phillips-Cremins,J.E.,&Corces,V.G.(2013).Chromatin Insulators:LinkingGenome Organization to Cellular Function.Molecular Cell.https://doi.org/10.1016/j.molcel.2013.04.018

Rakhit,R.,Navarro,R.,&Wandless,T.J.(2014).Chemical biology strategiesfor posttranslational control of protein function.Chemistry andBiology.https://doi.org/10.1016/j.chembiol.2014.08.011

Schiroli,G.,Ferrari,S.,Conway,A.,Jacob,A.,Capo,V.,Albano,L.,…Naldini,L.(2017).Preclinical modeling highlights the therapeutic potential ofhematopoietic stem cell gene editing for correction of SCID-X1.ScienceTranslational Medicine,9(411).https://doi.org/10.1126/scitranslmed.aan0820Wang,J.,Exline,C.M.,Declercq,J.J.,Llewellyn,G.N.,Hayward,S.B.,Li,P.W.L.,…Cannon,P.M.(2015).Homology-driven genome editing inhematopoietic stem and progenitor cells using ZFN mRNA and AAV6 donors.NatureBiotechnology.https://doi.org/10.1038/nbt.3408

Additional referencesAra,T.,Tokoyoda,K.,Sugiyama,T.,Egawa,T.,Kawabata,K.,&Nagasawa,T.(2003).Long-term hematopoietic stem cells requirestromal cell-derived factor-1for colonizing bone marrow duringontogeny.Immunity.

De Ravin,S.S.,Li,L.,Wu,X.,Choi,U.,Allen,C.,Koontz,S.,…Malech,H.L.(2017).CRISPR-Cas9 gene repair of hematopoietic stem cells from patients withX-linked chronic granulomatous disease.Science TranslationalMedicine.https://doi.org/10.1126/scitranslmed.aah3480

Dever,D.P.,Bak,R.O.,Reinisch,A.,Camarena,J.,Washington,G.,Nicolas,C.E.,…Porteus,M.H.(2016).CRISPR/Cas9β-globin gene targeting in humanhaematopoietic stem cells.Nature.https://doi.org/10.1038/nature20134

Genovese,P.,Schiroli,G.,Escobar,G.,Di Tomaso,T.,Firrito,C.,Calabria,A.,…Naldini,L.(2014).Targeted genome editing in human repopulatinghaematopoietic stem cells.Nature.https://doi.org/10.1038/nature13420

Gossen,M.,&Bujard,H.(1992).Tight control of gene expression inmammalian cells by tetracycline-responsive promoters.Proceedings of theNational Academy of Sciences of the United States of America.https://doi.org/10.1073/pnas.89.12.5547

Hernandez,P.A.,Gorlin,R.J.,Lukens,J.N.,Taniuchi,S.,Bohinjec,J.,Francois,F.,…Diaz,G.A.(2003).Mutations in the chemokine receptor gene CXCR4are associated with WHIM syndrome,a combined immunodeficiency disease.NatureGenetics.https://doi.org/10.1038/ng1149

Hsu,P.D.,Scott,D.A.,Weinstein,J.A.,Ran,F.A.,Konermann,S.,Agarwala,V.,…Zhang,F.(2013).DNAtargeting specificity of RNA-guidedCas9nucleases.Nature Biotechnology.https://doi.org/10.1038/nbt.2647

Kahn,J.,Byk,T.,Jansson-Sjostrand,L.,Petit,I.,Shivtiel,S.,Nagler,A.,…Lapidot,T.(2004).Overexpression of CXCR4 on human CD34+progenitors increasestheir proliferation,migration,and NOD/SCID repopulation.Blood.https://doi.org/10.1182/blood-2003-07-2607

Schiroli,G.,Conti,A.,Ferrari,S.,della Volpe,L.,Jacob,A.,Albano,L.,…Di Micco,R.(2019).Precise Gene Editing Preserves Hematopoietic Stem CellFunction following Transient p53-Mediated DNA Damage Response.Cell StemCell.https://doi.org/10.1016/j.stem.2019.02.019

Schiroli,G.,Ferrari,S.,Conway,A.,Jacob,A.,Capo,V.,Albano,L.,…Naldini,L.(2017).Preclinical modeling highlights the therapeutic potential ofhematopoietic stem cell gene editing for correction of SCID-X1.ScienceTranslational Medicine.https://doi.org/10.1126/scitranslmed.aan0820

Wang,J.,Exline,C.M.,Declercq,J.J.,Llewellyn,G.N.,Hayward,S.B.,Li,P.W.L.,…Cannon,P.M.(2015).Homology-driven genome editing in hematopoieticstem and progenitor cells using ZFN mRNAand AAV6 donors.NatureBiotechnology.https://doi.org/10.1038/nbt.3408

材料和方法中(实施例中)的参考文献

1.J.Wang,C.M.Exline,J.J.DeClercq,G.N.Llewellyn,S.B.Hayward,P.W.Li,D.A.Shivak,R.T.Surosky,P.D.Gregory,M.C.Holmes,P.M.Cannon,Homology-drivengenome editing in hematopoietic stem and progenitor cells using ZFN mRNA andAAV6 donors.Nat Biotechnol33,1256-1263(2015).

2.G.Schiroli,S.Ferrari,A.Conway,A.Jacob,V.Capo,L.Albano,T.Plati,M.C.Castiello,F.Sanvito,A.R.Gennery,C.Bovolenta,R.Palchaudhuri,D.T.Scadden,M.C.Holmes,A.Villa,G.Sitia,A.Lombardo,P.Genovese,L.Naldini,Preclinicalmodeling highlights the therapeutic potential of hematopoietic stem cell geneediting for correction of SCID-X1.Sci Transl Med9,(2017).

3.C.D.Richardson,G.J.Ray,M.A.DeWitt,G.L.Curie,J.E.Corn,Enhancinghomology-directed genome editing by catalytically active and inactive CRISPR-Cas9 using asymmetric donor DNA.Nat Biotechnol34,339-344(2016).

4.P.D.Hsu,D.A.Scott,J.A.Weinstein,F.A.Ran,S.Konermann,V.Agarwala,Y.Li,E.J.Fine,X.Wu,O.Shalem,T.J.Cradick,L.A.Marraffini,G.Bao,F.Zhang,DNAtargeting specificity of RNA-guided Cas9 nucleases.Nat Biotechnol31,827-832(2013)。

本说明书中引用的所有参考文献通过引用并入本说明书。

序列表

TCTAGAATTAGCTTTAGGCGTGTACGGTGGGCGCCTATAAAAGCAGAGCTCGTTTAGTGAACCGTCAGATCGCCTGGAGCAATTCCACAACACTTTTGTCTTATACCAACTTTCCGTACCACTTCCTACCCTCGTAAAGAATCCGCGG

GTACGGTGGGAGGCCTATATAAGCAGAGCTCGTTTAGTGAACCGTCAGATCGCCTGGAGACGCCATCCACGCTGTTTTGACCTCCATAGAAGACACCGGGACCGATCCA

ATGGTGAGCAAGGGCGAGGAGCTGTTCACCGGGGTGGTGCCCATCCTGGTCGAGCTGGACGGCGACGTAAACGGCCACAAGTTCAGCGTGTCCGGCGAGGGCGAGGGCGATGCCACCTACGGCAAGCTGACCCTGAAGTTCATCTGCACCACCGGCAAGCTGCCCGTGCCCTGGCCCACCCTCGTGACCACCCTGACCTACGGCGTGCAGTGCTTCAGCCGCTACCCCGACCACATGAAGCAGCACGACTTCTTCAAGTCCGCCATGCCCGAAGGCTACGTCCAGGAGCGCACCATCTTCTTCAAGGACGACGGCAACTACAAGACCCGCGCCGAGGTGAAGTTCGAGGGCGACACCCTGGTGAACCGCATCGAGCTGAAGGGCATCGACTTCAAGGAGGACGGCAACATCCTGGGGCACAAGCTGGAGTACAACTACAACAGCCACAACGTCTATATCATGGCCGACAAGCAGAAGAACGGCATCAAGGTGAACTTCAAGATCCGCCACAACATCGAGGACGGCAGCGTGCAGCTCGCCGACCACTACCAGCAGAACACCCCCATCGGCGACGGCCCCGTGCTGCTGCCCGACAACCACTACCTGAGCACCCAGTCCGCCCTGAGCAAAGACCCCAACGAGAAGCGCGATCACATGGTCCTGCTGGAGTTCGTGACCGCCGCCGGGATCACTCTCGGCATGGACGAGCTGTACAAGTAA

ATGGGGGCAGGTGCCACCGGCCGCGCCATGGACGGGCCGCGCCTGCTGCTGTTGCTGCTTCTGGGGGTGTCCCTTGGAGGTGCCAAGGAGGCATGCCCCACAGGCCTGTACACACACAGCGGTGAGTGCTGCAAAGCCTGCAACCTGGGCGAGGGTGTGGCCCAGCCTTGTGGAGCCAACCAGACCGTGTGTGAGCCCTGCCTGGACAGCGTGACGTTCTCCGACGTGGTGAGCGCGACCGAGCCGTGCAAGCCGTGCACCGAGTGCGTGGGGCTCCAGAGCATGTCGGCGCCGTGCGTGGAGGCCGACGACGCCGTGTGCCGCTGCGCCTACGGCTACTACCAGGATGAGACGACTGGGCGCTGCGAGGCGTGCCGCGTGTGCGAGGCGGGCTCGGGCCTCGTGTTCTCCTGCCAGGACAAGCAGAACACCGTGTGCGAGGAGTGCCCCGACGGCACGTATTCCGACGAGGCCAACCACGTGGACCCGTGCCTGCCCTGCACCGTGTGCGAGGACACCGAGCGCCAGCTCCGCGAGTGCACACGCTGGGCCGACGCCGAGTGCGAGGAGATCCCTGGCCGTTGGATTACACGGTCCACACCCCCAGAGGGCTCGGACAGCACAGCCCCCAGCACCCAGGAGCCTGAGGCACCTCCAGAACAAGACCTCATAGCCAGCACGGTGGCAGGTGTGGTGACCACAGTGATGGGCAGCTCCCAGCCCGTGGTGACCCGAGGCACCACCGACAACCTCATCCCTGTCTATTGCTCCATCCTGGCTGCTGTGGTTGTGGGCCTTGTGGCCTACATAGCCTTCAAGAGGTGGAACAGGGGGATCCTCTAG

ATGGGCGGTAGGCGTGTACGGTGGGAGGTCTATATAAGCAGAGCTCGTTTAGTGAACCGTCAGATCGCCTGGAGACGCCATCCACGCTGTTTTGACCTCCATAGAAGACACCGGGACCGATCCAGCCTCCGGACTCTAGAGGATCGAACCCTTGCCACCATGGACAAGAAGTACTCCATTGGGCTCGCTATCGGCACAAACAGCGTCGGCTGGGCCGTCATTACGGACGAGTACAAGGTGCCGAGCAAAAAATTCAAAGTTCTGGGCAATACCGATCGCCACAGCATAAAGAAGAACCTCATTGGCGCCCTCCTGTTCGACTCCGGGGAGACGGCCGAAGCCACGCGGCTCAAAAGAACAGCACGGCGCAGATATACCCGCAGAAAGAATCGGATCTGCTACCTGCAGGAGATCTTTAGTAATGAGATGGCTAAGGTGGATGACTCTTTCTTCCATAGGCTGGAGGAGTCCTTTTTGGTGGAGGAGGATAAAAAGCACGAGCGCCACCCAATCTTTGGCAATATCGTGGACGAGGTGGCGTACCATGAAAAGTACCCAACCATATATCATCTGAGGAAGAAGCTTGTAGACAGTACTGATAAGGCTGACTTGCGGTTGATCTATCTCGCGCTGGCGCATATGATCAAATTTCGGGGACACTTCCTCATCGAGGGGGACCTGAACCCAGACAACAGCGATGTCGACAAACTCTTTATCCAACTGGTTCAGACTTACAATCAGCTTTTCGAAGAGAACCCGATCAACGCATCCGGAGTTGACGCCAAAGCAATCCTGAGCGCTAGGCTGTCCAAATCCCGGCGGCTCGAAAACCTCATCGCACAGCTCCCTGGGGAGAAGAAGAACGGCCTGTTTGGTAATCTTATCGCCCTGTCACTCGGGCTGACCCCCAACTTTAAATCTAACTTCGACCTGGCCGAAGATGCCAAGCTTCAACTGAGCAAAGACACCTACGATGATGATCTCGACAATCTGCTGGCCCAGATCGGCGACCAGTACGCAGACCTTTTTTTGGCGGCAAAGAACCTGTCAGACGCCATTCTGCTGAGTGATATTCTGCGAGTGAACACGGAGATCACCAAAGCTCCGCTGAGCGCTAGTATGATCAAGCGCTATGATGAGCACCACCAAGACTTGACTTTGCTGAAGGCCCTTGTCAGACAGCAACTGCCTGAGAAGTACAAGGAAATTTTCTTCGATCAGTCTAAAAATGGCTACGCCGGATACATTGACGGCGGAGCAAGCCAGGAGGAATTTTACAAATTTATTAAGCCCATCTTGGAAAAAATGGACGGCACCGAGGAGCTGCTGGTAAAGCTTAACAGAGAAGATCTGTTGCGCAAACAGCGCACTTTCGACAATGGAAGCATCCCCCACCAGATTCACCTGGGCGAACTGCACGCTATCCTCAGGCGGCAAGAGGATTTCTACCCCTTTTTGAAAGATAACAGGGAAAAGATTGAGAAAATCCTCACATTTCGGATACCCTACTATGTAGGCCCCCTCGCCCGGGGAAATTCCAGATTCGCGTGGATGACTCGCAAATCAGAAGAGACCATCACTCCCTGGAACTTCGAGGAAGTCGTGGATAAGGGGGCCTCTGCCCAGTCCTTCATCGAAAGGATGACTAACTTTGATAAAAATCTGCCTAACGAAAAGGTGCTTCCTAAACACTCTCTGCTGTACGAGTACTTCACAGTTTATAACGAGCTCACCAAGGTCAAATACGTCACAGAAGGGATGAGAAAGCCAGCATTCCTGTCTGGAGAGCAGAAGAAAGCTATCGTGGACCTCCTCTTCAAGACGAACCGGAAAGTTACCGTGAAACAGCTCAAAGAAGACTATTTCAAAAAGATTGAATGTTTCGACTCTGTTGAAATCAGCGGAGTGGAGGATCGCTTCAACGCATCCCTGGGAACGTATCACGATCTCCTGAAAATCATTAAAGACAAGGACTTCCTGGACAATGAGGAGAACGAGGACATTCTTGAGGACATTGTCCTCACCCTTACGTTGTTTGAAGATAGGGAGATGATTGAAGAACGCTTGAAAACTTACGCTCATCTCTTCGACGACAAAGTCATGAAACAGCTCAAGAGGCGCCGATATACAGGATGGGGGCGGCTGTCAAGAAAACTGATCAATGGGATCCGAGACAAGCAGAGTGGAAAGACAATCCTGGATTTTCTTAAGTCCGATGGATTTGCCAACCGGAACTTCATGCAGTTGATCCATGATGACTCTCTCACCTTTAAGGAGGACATCCAGAAAGCACAAGTTTCTGGCCAGGGGGACAGTCTTCACGAGCACATCGCTAATCTTGCAGGTAGCCCAGCTATCAAAAAGGGAATACTGCAGACCGTTAAGGTCGTGGATGAACTCGTCAAAGTAATGGGAAGGCATAAGCCCGAGAATATCGTTATCGAGATGGCCCGAGAGAACCAAACTACCCAGAAGGGACAGAAGAACAGTAGGGAAAGGATGAAGAGGATTGAAGAGGGTATAAAAGAACTGGGGTCCCAAATCCTTAAGGAACACCCAGTTGAAAACACCCAGCTTCAGAATGAGAAGCTCTACCTGTACTACCTGCAGAACGGCAGGGACATGTACGTGGATCAGGAACTGGACATCAATCGGCTCTCCGACTACGACGTGGCTGCTATCGTGCCCCAGTCTTTTCTCAAAGATGATTCTATTGATAATAAAGTGTTGACAAGATCCGATAAAGCTAGAGGGAAGAGTGATAACGTCCCCTCAGAAGAAGTTGTCAAGAAAATGAAAAATTATTGGCGGCAGCTGCTGAACGCCAAACTGATCACACAACGGAAGTTCGATAATCTGACTAAGGCTGAACGAGGTGGCCTGTCTGAGTTGGATAAAGCCGGCTTCATCAAAAGGCAGCTTGTTGAGACACGCCAGATCACCAAGCACGTGGCCCAAATTCTCGATTCACGCATGAACACCAAGTACGATGAAAATGACAAACTGATTCGAGAGGTGAAAGTTATTACTCTGAAGTCTAAGCTGGTCTCAGATTTCAGAAAGGACTTTCAGTTTTATAAGGTGAGAGAGATCAACAATTACCACCATGCGCATGATGCCTACCTGAATGCAGTGGTAGGCACTGCACTTATCAAAAAATATCCCAAGCTTGAATCTGAATTTGTTTACGGAGACTATAAAGTGTACGATGTTAGGAAAATGATCGCAAAGTCTGAGCAGGAAATAGGCAAGGCCACCGCTAAGTACTTCTTTTACAGCAATATTATGAATTTTTTCAAGACCGAGATTACACTGGCCAATGGAGAGATTCGGAAGCGACCACTTATCGAAACAAACGGAGAAACAGGAGAAATCGTGTGGGACAAGGGTAGGGATTTCGCGACAGTCCGGAAGGTCCTGTCCATGCCGCAGGTGAACATCGTTAAAAAGACCGAAGTACAGACCGGAGGCTTCTCCAAGGAAAGTATCCTCCCGAAAAGGAACAGCGACAAGCTGATCGCACGCAAAAAAGATTGGGACCCCAAGAAATACGGCGGATTCGATTCTCCTACAGTCGCTTACAGTGTACTGGTTGTGGCCAAAGTGGAGAAAGGGAAGTCTAAAAAACTCAAAAGCGTCAAGGAACTGCTGGGCATCACAATCATGGAGCGATCAAGCTTCGAAAAAAACCCCATCGACTTTCTCGAGGCGAAAGGATATAAAGAGGTCAAAAAAGACCTCATCATTAAGCTTCCCAAGTACTCTCTCTTTGAGCTTGAAAACGGCCGGAAACGAATGCTCGCTAGTGCGGGCGAGCTGCAGAAAGGTAACGAGCTGGCACTGCCCTCTAAATACGTTAATTTCTTGTATCTGGCCAGCCACTATGAAAAGCTCAAAGGGTCTCCCGAAGATAATGAGCAGAAGCAGCTGTTCGTGGAACAACACAAACACTACCTTGATGAGATCATCGAGCAAATAAGCGAATTCTCCAAAAGAGTGATCCTCGCCGACGCTAACCTCGATAAGGTGCTTTCTGCTTACAATAAGCACAGGGATAAGCCCATCAGGGAGCAGGCAGAAAACATTATCCACTTGTTTACTCTGACCAACTTGGGCGCGCCTGCAGCCTTCAAGTACTTCGACACCACCATAGACAGAAAGCGGTACACCTCTACAAAGGAGGTCCTGGACGCCACACTGATTCATCAGTCAATTACGGGGCTCTATGAAACAAGAATCGACCTCTCTCAGCTCGGTGGAGACAGCAGGGCTGACCCCAAGTGA

GATCCGGAGGCGGGGCGGACGCGCTGGACGATTTCGATCTCGACATGCTGGGTTCTGATGCCCTCGATGACTTTGACCTGGATATGTTGGGAAGCGACGCATTGGATGACTTTGATCTGGACATGCTCGGCTCCGATGCTCTGGACGATTTCGATCTCGATATGTTAGGGTCAGACGCACTGGATGATTTCGACCTTGATATGTTGGGAAGCGATGCCCTTGATGATTTCGACCTGGACATGCTCGGCAGCGACGCCCTGGACGATTTCGATCTGGACATGCTGGGGTCCGATGCCTTGGATGATTTTGACTTGGATATGCTGGGGAGTGATGCCCTGGACGACTTTGACCTGGACATGCTGGGCTCCGATGCGCTCGATGACTTCGATTTGGATATGTTGTATTGAAAGCTTCTGA

AAGAAGAGGAAGGTGTCGCCAGGGATCCGTCGACTTGACGCGTTGATATCAACAAGTTTGTACAAAAAAGCAGGCTACAAAGAGGCCAGCGGTTCCGGACGGGCTGACGCATTGGACGATTTTGATCTGGATATGCTGGGAAGTGACGCCCTCGATGATTTTGACCTTGACATGCTTGGTTCGGATGCCCTTGATGACTTTGACCTCGACATGCTCGGCAGTGACGCCCTTGATGATTTCGACCTGGACATGCTGATTAACTCTAGAAGTTCCGGATCTCCGAAAAAGAAACGCAAAGTTGGTAGCCAGTACCTGCCCGACACCGACGACCGGCACCGGATCGAGGAAAAGCGGAAGCGGACCTACGAGACATTCAAGAGCATCATGAAGAAGTCCCCCTTCAGCGGCCCCACCGACCCTAGACCTCCACCTAGAAGAATCGCCGTGCCCAGCAGATCCAGCGCCAGCGTGCCAAAACCTGCCCCCCAGCCTTACCCCTTCACCAGCAGCCTGAGCACCATCAACTACGACGAGTTCCCTACCATGGTGTTCCCCAGCGGCCAGATCTCTCAGGCCTCTGCTCTGGCTCCAGCCCCTCCTCAGGTGCTGCCTCAGGCTCCTGCTCCTGCACCAGCTCCAGCCATGGTGTCTGCACTGGCTCAGGCACCAGCACCCGTGCCTGTGCTGGCTCCTGGACCTCCACAGGCTGTGGCTCCACCAGCCCCTAAACCTACACAGGCCGGCGAGGGCACACTGTCTGAAGCTCTGCTGCAGCTGCAGTTCGACGACGAGGATCTGGGAGCCCTGCTGGGAAACAGCACCGATCCTGCCGTGTTCACCGACCTGGCCAGCGTGGACAACAGCGAGTTCCAGCAGCTGCTGAACCAGGGCATCCCTGTGGCCCCTCACACCACCGAGCCCATGCTGATGGAATACCCCGAGGCCATCACCCGGCTCGTGACAGGCGCTCAGAGGCCTCCTGATCCAGCTCCTGCCCCTCTGGGAGCACCAGGCCTGCCTAATGGACTGCTGTCTGGCGACGAGGACTTCAGCTCTATCGCCGATATGGATTTCTCAGCCTTGCTGGGCTCTGGCAGCGGCAGCCGGGATTCCAGGGAAGGGATGTTTTTGCCGAAGCCTGAGGCCGGCTCCGCTATTAGTGACGTGTTTGAGGGCCGCGAGGTGTGCCAGCCAAAACGAATCCGGCCATTTCATCCTCCAGGAAGTCCATGGGCCAACCGCCCACTCCCCGCCAGCCTCGCACCAACACCAACCGGTCCAGTACATGAGCCAGTCGGGTCACTGACCCCGGCACCAGTCCCTCAGCCACTGGATCCAGCGCCCGCAGTGACTCCCGAGGCCAGTCACCTGTTGGAGGATCCCGATGAAGAGACGAGCCAGGCTGTCAAAGCCCTTCGGGAGATGGCCGATACTGTGATTCCCCAGAAGGAAGAGGCTGCAATCTGTGGCCAAATGGACCTTTCCCATCCGCCCCCAAGGGGCCATCTGGATGAGCTGACAACCACACTTGAGTCCATGACCGAGGATCTGAACCTGGACTCACCCCTGACCCCGGAATTGAACGAGATTCTGGATACCTTCCTGAACGACGAGTGCCTCTTGCATGCCATGCATATCAGCACAGGACTGTCCATCTTCGACACATCTCTGTTTTGA

AAACGGGCCCTCTAGACTCGAGCGGCCGCGCCACCATGGGAAAACCTATTCCTAATCCTCTGCTGGGCCTGGATTCTACCGGAGGCATGGCCCCTAAGAAAAAGCGGAAGGTGGACGGCGGAGTGGACCTGAGAACACTGGGATATTCTCAGCAGCAGCAGGAGAAGATCAAGCCCAAGGTGAGATCTACAGTGGCCCAGCACCACGAAGCCCTGGTGGGACACGGATTTACACACGCCCACATTGTGGCCCTGTCTCAGCACCCTGCCGCCCTGGGAACAGTGGCCGTGAAATATCAGGATATGATTGCCGCCCTGCCTGAGGCCACACACGAAGCCATTGTGGGAGTGGGAAAACAGTGGTCTGGAGCCAGAGCCCTGGAAGCCCTGCTGACAGTGGCCGGAGAACTGAGAGGACCTCCTCTGCAGCTGGATACAGGACAGCTGCTGAAGATTGCCAAAAGGGGCGGAGTGACCGCGGTGGAAGCCGTGCACGCCTGGAGAAATGCCCTGACGGGTGCCCCCCTGAACCTGACCCCGGACCAAGTGGTGGCTATCGCCAGCCACGATGGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACTCCGGACCAAGTGGTGGCTATCGCCAGCCACGATGGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACCCCGGACCAAGTGGTGGCTATCGCCAGCAACGGTGGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACTCCGGACCAAGTGGTGGCTATCGCCAGCCACGATGGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACCCCGGACCAAGTGGTGGCTATCGCCAGCAACGGTGGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACTCCGGACCAAGTGGTGGCTATCGCCAGCCACGATGGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACCCCGGACCAAGTGGTGGCTATCGCCAGCAACGGTGGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACCCCGGACCAAGTGGTGGCTATCGCCAGCAATCACGGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACCCCGGACCAAGTGGTGGCTATCGCCAGCAATCACGGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACTCCGGACCAAGTGGTGGCTATCGCCAGCCACGATGGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACCCCGGACCAAGTGGTGGCTATCGCCAGCAACGGTGGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACTCCGGACCAAGTGGTGGCTATCGCCAGCCACGATGGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACTCCGGACCAAGTGGTGGCTATCGCCAGCCACGATGGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACCCCGGACCAAGTGGTGGCTATCGCCAGCAACATTGGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACCCCGGACCAAGTGGTGGCTATCGCCAGCAACGGTGGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACTCCGGACCAAGTGGTGGCTATCGCCAGCCACGATGGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACCCCGGACCAAGTGGTGGCTATCGCCAGCAATCACGGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACCCCGGACCAAGTGGTGGCTATCGCCAGCAACGGTGGCGGCAAGCAAGCGCTCGAAAGCATTGTGGCCCAGCTGAGCCGGCCTGATCCGGCGTTGGCCGCGTTGACCAACGATCACCTGGTGGCCCTGGCCTGTCTGGGAGGCAGACCTGCCCTGGATGCCGTGAAAAAAGGACTGCCTCACGCCCCTGCCCTGATCAAGAGAACAAATAGAAGAATCCCCGAGCGGACCTCTCACAGAGTGGCCGGATCACA

GTGGACCTGAGAACACTGGGATATTCTCAGCAGCAGCAGGAGAAGATCAAGCCCAAGGTGAGATCTACAGTGGCCCAGCACCACGAAGCCCTGGTGGGACACGGATTTACACACGCCCACATTGTGGCCCTGTCTCAGCACCCTGCCGCCCTGGGAACAGTGGCCGTGAAATATCAGGATATGATTGCCGCCCTGCCTGAGGCCACACACGAAGCCATTGTGGGAGTGGGAAAACAGTGGTCTGGAGCCAGAGCCCTGGAAGCCCTGCTGACAGTGGCCGGAGAACTGAGAGGACCTCCTCTGCAGCTGGATACAGGACAGCTGCTGAAGATTGCCAAAAGGGGCGGAGTGACCGCGGTGGAAGCCGTGCACGCCTGGAGAAATGCCCTGACGGGTGCCCCCCTGAACCTGACCCCGGACCAAGTGGTGGCTATCGCCAGCAACAATGGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACCCCGGACCAAGTGGTGGCTATCGCCAGCAACGGTGGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACTCCGGACCAAGTGGTGGCTATCGCCAGCCACGATGGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACCCCGGACCAAGTGGTGGCTATCGCCAGCAACATTGGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACTCCGGACCAAGTGGTGGCTATCGCCAGCCACGATGGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACCCCGGACCAAGTGGTGGCTATCGCCAGCAACATTGGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACTCCGGACCAAGTGGTGGCTATCGCCAGCCACGATGGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACCCCGGACCAAGTGGTGGCTATCGCCAGCAACATTGGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACCCCGGACCAAGTGGTGGCTATCGCCAGCAATCACGGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACTCCGGACCAAGTGGTGGCTATCGCCAGCCACGATGGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACCCCGGACCAAGTGGTGGCTATCGCCAGCAACATTGGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACTCCGGACCAAGTGGTGGCTATCGCCAGCCACGATGGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACCCCGGACCAAGTGGTGGCTATCGCCAGCAACATTGGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACCCCGGACCAAGTGGTGGCTATCGCCAGCAACGGTGGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACCCCGGACCAAGTGGTGGCTATCGCCAGCAACATTGGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACCCCGGACCAAGTGGTGGCTATCGCCAGCAACGGTGGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACCCCGGACCAAGTGGTGGCTATCGCCAGCAACGGTGGCGGCAAGCAAGCGCTCGAAACGGTGCAGCGGCTGTTGCCGGTGCTGTGCCAGGACCATGGCCTGACCCCGGACCAAGTGGTGGCTATCGCCAGCAACGGTGGCGGCAAGCAAGCGCTCGAAAGCATTGTGGCCCAGCTGAGCCGGCCTGATCCGGCGTTGGCCGCGTTGACCAACGATCACCTGGTGGCCCTGGCCTGTCTGGGAGGCAGACCTGCCCTGGATGCCGTGAAAAAAGGACTGCCTCACGCCCCTGCCCTGATCAAGAGAACAAATAGAAGAATCCCCGAGCGGACCTCTCACAGAGTGGCC

CCACTGTGGGGTGGAGGGGACAGATAAAAGTACCCAGAACCAGAGCCACATTAACCGGCCCTGGGAATATAAGGTGGTCCCAGCTCGGGGACACAGGATCCCTGGAGGCAGCAAACATGCTGTCCTGAAGTGGACATAGGGGCCCGGGTTGGAGGAAGAAGACTAGCTGAGCTCTCGGACCCCTGGAAGATGCCATGACAGGGGGCTGGAAGAGCTAGCACAGACTAGAGAGGTAAGGGGGGTAGGGGAGCTGCCCAAATGAAAGGAGTGAGAGGTGACCCGAATCCACAGGAGAACGGGGTGTCCAGGCAAAGAAAGCAAGAGGATGGAGAGGTGGCTAAAGCCAGGGAGACGGGGTACTTTGGGGTTGTCCAGAAAAACGGTGATGATGCAGGCCTACAAGAAGGGGAGGCGGGACGCAAGGGAGACATCCGTCGGAGAAGGCCATCCTAAGAAACGAGAGATGGCACAGGCCCCAGAAGGAGAAGGAAAAGGGAACCCAGCGAGTGAAGACGGCATGGGGTTGGGTGAGGGAGGAGAGATGCCCGGAGAGGACCCAGACACGGGGAGGATCCGCTCAGAGGACATCACGTGGTGCAGCGCCGAGAAGGAAGTGCTCCGGAAAGAGCATCCTTGGGCAGCAACACAGCAGAGAGCAAGGGGAAGAGGGAGTGGAGGAAGACGGAACCTGAAGGAGGCGGCAGGGAAGGATCTGGGCCAGCCGTAGAGGTGACCCAGGCCACAAGCTGCAGACAGAAAGCGGCACAGGCCCAGGGGAGAGAATGCTGGTCAGAGAAAGCA

GAGATCCAGACATGATAAGATACATTGATGAGTTTGGACAAACCAAAACTAGAATGCAGTGAAAAAAATGCCTTATTTGTGAAATTTGTGATGCTATTGCCTTATTTGTAACCATTATAAGCTGCAATAAACAAGTTAACAACAACAATTGCATTCATTTTATGTTTCAGGTTCAGGGGGAGGTGTGGGAGGTTTTTTAAAGCAAGTAAAACCTCTACAAATGTGGTATGGCTGATTATGATCAGATCTCTCGAGG

GCAAGGAGAGAGATGGCTCCAGGAAATGGGGGTGTGTCACCAGATAAGGAATCTGCCTAACAGGAGGTGGGGGTTAGACCCAATATCAGGAGACTAGGAAGGAGGAGGCCTAAGGATGGGGCTTTTCTGTCACCAATCCTGTCCCTA

AGAGGAAACGTGTGGGTGGGGAGGGGTAGTGGGTGAGGGACCCAGGTTCCTGACACAGACAGACTACACCCAGGGAATGAAGAGCAAGCGCCATGTTGAAGCCATCATTACCATTCACATCCCTCTTATTCCTGCAGCTGCCCCTGCTGGGAGTGGGGCTGAACACGACAATTCTGACGCCCAATGGGAATGAAGACACCACAGCTGGTGGGAAATCTGGGACTGGAGGGGGCTGGTGAGAAGGGTGGCTGTGGGAAGGGGCCGTACAGAGATCTGGTGCCTGCCACTGG

ATTTCTTTCTGACCACCATGCCCACCGACAGCCTGAGCGTGAGCACCCTGCCCCTGCCCGAGGTGCAGTGCTTCGTGTTCAACGTGGAGTACATGAACTGCACCTGGAACAGCAGCAGCGAGCCCCAGCCCACCAATCTGACCCTGCACTACTGGTACAAGAACAGCGACAACGACAAGGTGCAGAAGTGCAGCCACTACCTGTTCAGCGAGGAAATCACCAGCGGCTGCCAGCTGCAGAAGAAAGAGATCCACCTGTACCAGACCTTCGTGGTGCAGCTGCAGGACCCCCGGGAGCCCCGCAGGCAGGCCACCCAGATGCTGAAGCTGCAGAACCTGGTGATCCCCTGGGCCCCTGAGAACCTGACACTGCACAAGCTGTCCGAGAGCCAGCTGGAACTGAACTGGAACAACCGCTTCCTGAACCACTGCCTGGAACACCTGGTGCAGTACCGGACCGACTGGGACCACAGCTGGACCGAGCAGAGCGTGGACTACCGGCACAAGTTCAGCCTGCCCAGCGTGGACGGCCAGAAGCGGTACACCTTCAGAGTGCGGAGCCGGTTCAACCCCCTGTGCGGCAGCGCCCAGCACTGGTCCGAGTGGAGCCACCCCATCCACTGGGGCAGCAACACCAGCAAAGAGAACCCCTTCCTGTTCGCCCTGGAAGCCGTGGTGATCAGCGTGGGCAGCATGGGCCTGATCATCTCCCTGCTGTGCGTGTACTTCTGGCTGGAACGGACCATGCCCAGAATCCCCACCCTGAAGAACCTGGAAGATCTGGTGACCGAGTACCACGGCAACTTCAGCGCCTGGTCCGGCGTGAGCAAGGGCCTGGCCGAGAGCCTGCAGCCCGACTACAGCGAGCGGCTGTGCCTGGTGTCCGAGATCCCCCCCAAAGGCGGAGCCCTGGGCGAAGGCCCTGGCGCCAGCCCCTGCAACCAGCACAGCCCCTACTGGGCCCCTCCTTGCTACACCCTGAAGCCCGAGACCCGGGCCAAGCGATCCGGATCCGGAGCCACCAACTTCAGCCTGCTGAAGCAGGCCGGCGACGTGGAGGAGAACCCCGGCCCCTGA

CGGGCCAAGCGATCCGGATCCGGAGCCACCAACTTCAGCCTGCTGAAGCAGGCCGGCGACGTGGAGGAGAACCCCGGCCCC

TACAATCATGTGGGCAGAATTGAAAAGTGGAGTGGGAAGGGCAAGGGGGAGGGTTCCCTGCCTCACGCTACTTCTTCTTTCTTTCTTGTTTGTTTGTTTCTTTCTTTCTTTTGAGGCAGGGTCTCACTATGTTGCCTAGGCTGGTCTCAAACTCCTGGCCTCTAGTGATCCTCCTGCCTCAGCCTTTCAAAGCACCAGGATTACAGACATGAGCCACCGTGCTTGGCCTCCTCCTTCTGACCATCATTTCTCTTTCCCTCCCTGCCT

CCACGGGGTTGGGGTTGCGCCTTTTCCAAGGCAGCCCTGGGTTTGCGCAGGGACGCGGCTGCTCTGGGCGTGGTTCCGGGAAACGCAGCGGCGCCGACCCTGGGTCTCGCACATTCTTCACGTCCGTTCGCAGCGTCACCCGGATCTTCGCCGCTACCCTTGTGGGCCCCCCGGCGACGCTTCCTGCTCCGCCCCTAAGTCGGGAAGGTTCCTTGCGGTTCGCGGCGTGCCGGACGTGACAAACGGAAGCCGCACGTCTCACTAGTACCCTCGCAGACGGACAGCGCCAGGGAGCAATGGCAGCGCGCCGACCGCGATGGGCTGTGGCCAATAGCGGCTGCTCAGCGGGGCGCGCCGAGAGCAGCGGCCGGGAAGGGGCGGTGCGGGAGGCGGGGTGTGGGGCGGTAGTGTGGGCCCTGTTCCTGCCCGCGCGGTGTTCCGCATTCTGCAAGCCTCCGGAGCGCACGTCGGCAGTCGGCTCCCTCGTTGACCGAATCACCGACCTCTCTCCCCAGG

SEQ ID NO:58中的UTR以灰色突出显示。

TetR具有核苷酸序列:

Atgtctagactggacaagagcaaagtcataaactctgctctggaattactcaatgaagtcggtatcgaaggcctgacgacaaggaaactcgctcaaaagctgggagttgagcagcctaccctgtactggcacgtgaagaacaagcgggccctgctcgatgccctggcaatcgagatgctggacaggcatcatacccacttctgccccctggaaggcgagtcatggcaagactttctgcggaacaacgccaagtcattccgctgtgctctcctctcacatcgcgacggggctaaagtgcatctcggcacccgcccaacagagaaacagtacgaaaccctggaaaatcagctcgcgttcctgtgtcagcaaggcttctccctggagaacgcactgtacgctctgtccgccgtgggccactttacactgggctgcgtattggaggatcaggagcatcaagtagcaaaagaggaaagagagacacctaccaccgattctatgcccccacttctgagacaagcaattgagctgttcgaccatcagggagccgaacctgccttccttttcggcctggaactaatcatatgtggcctggagaaacagctaaagtgcgaaagcggc(SEQ ID NO:74)

在SEQ ID NO:58中VP16的序列(gccgacgcccttgacgattttgacttagacatgctc-SEQID NO:75)重复3次。

左:(SEQ ID NO:53)AGAGGAAACGTGTGGGTGGGGAGGGGTAGTGGGTGAGGGACCCAGGTTCCTGACACAGACAGACTACACCCAGGGAATGAAGAGCAAGCGCCATGTTGAAGCCATCATTACCATTCACATCCCTCTTATTCCTGCAGCTGCCCCTGCTGGGAGTGGGGCTGAACACGACAATTCTGACGCCCAATGGGAATGAAGACACCACAGCTGGTGGGAAATCTGGGACTGGAGGGGGCTGGTGAGAAGGGTGGCTGTGGGAAGGGGCCGTACAGAGATCTGGTGCCTGCCACTGG

右:(SEQ ID NO:56)

TACAATCATGTGGGCAGAATTGAAAAGTGGAGTGGGAAGGGCAAGGGGGAGGGTTCCCTGCCTCACGCTACTTCTTCTTTCTTTCTTGTTTGTTTGTTTCTTTCTTTCTTTTGAGGCAGGGTCTCACTATGTTGCCTAGGCTGGTCTCAAACTCCTGGCCTCTAGTGATCCTCCTGCCTCAGCCTTTCAAAGCACCAGGATTACAGACATGAGCCACCGTGCTTGGCCTCCTCCTTCTGACCATCATTTCTCTTTCCCTCCCTGCCT

左:(SEQ ID NO:61)

TGCTTTCTCTGACCAGCATTCTCTCCCCTGGGCCTGTGCCGCTTTCTGTCTGCAGCTTGTGGCCTGGGTCACCTCTACGGCTGGCCCAGATCCTTCCCTGCCGCCTCCTTCAGGTTCCGTCTTCCTCCACTCCCTCTTCCCCTTGCTCTCTGCTGTGTTGCTGCCCAAGGATGCTCTTTCCGGAGCACTTCCTTCTCGGCGCTGCACCACGTGATGTCCTCTGAGCGGATCCTCCCCGTGTCTGGGTCCTCTCCGGGCATCTCTCCTCCCTCACCCAACCCCATGCCGTCTTCACTCGCTGGGTTCCCTTTTCCTTCTCCTTCTGGGGCCTGTGCCATCTCTCGTTTCTTAGGATGGCCTTCTCCGACGGATGTCTCCCTTGCGTCCCGCCTCCCCTTCTTGTAGGCCTGCATCATCACCGTTTTTCTGGACAACCCCAAAGTACCCCGTCTCCCTGGCTTTAGCCACCTCTCCATCCTCTTGCTTTCTTTGCCTGGACACCCCGTTCTCCTGTGGATTCGGGTCACCTCTCACTCCTTTCATTTGGGCAGCTCCCCTACCCCCCTTACCTCTCTAGTCTGTGCTAGCTCTTCCAGCCCCCTGTCATGGCATCTTCCAGGGGTCCGAGAGCTCAGCTAGTCTTCTTCCTCCAACCCGGGCCCCTATGTCCACTTCAGGACAGCATGTTTGCTGCCTCCAGGGATCCTGTGTCCCCGAGCTGGGACCACCTTATATTCCCAGGGCCGGTTAATGTGGCTCTGGTTCTGGGTACTTTTATCTGTCCCCTCCACCCCAC

右:(SEQ ID NO:62)TAGGGACAGGATTGGTGACAGAAAAGCCCCATCCTTAGGCCTCCTCCTTCCTAGTCTCCTGATATTGGGTCTAACCCCCACCTCCTGTTAGGCAGATTCCTTATCTGGTGACACACCCCCATTTCCTGGAGCCATCTCTCTCCTTGCCAGAACCTCTAAGGTTTGCTTACGATGGAGCCAGAGAGGATCCTGGGAGGGAGAGCTTGGCAGGGGGTGGGAGGGAAGGGGGGGATGCGTGACCTGCCCGGTTCTCAGTGG

左:(SEQ ID NO:63)TGCTTTAAAAGTAAGCTATTTTTTTATGGAGACAGCTTTTTTCTTTTAAATTTCCAGCTAGGCAAGAAGAGCGTCAATTTGATCTAAAATTTCATAATGCTTCAGATTAACATAGACATGGATAAGTCCCAGAATTTGCAGTCTTTTAGTAAAAGTAGCATTTTCTGTGTAATTCTTCACAAGCACTGATTGTAGTTGCAGGATGCTCAGTCTCCCTCTGAGATGTTTTACATTTTTAAATGGTTAGACTTGCAGGAACAAAAGAGCAGAGTAACTTAGTAGGCTGTTTTGCATTCTTAGGAAAAGAAAACCATCAGGACTTATTTTGTTTTCATGTATTTTTTCACTTCCACTGAGGAGTATAATTGGCTGGTGTTGACAAAATACCAATCATAGATGTAAAGGAGAAAGTTGATTAGTTTTCTGGCTGTTCCTAAAATTCTGGATGCAGGAACTGTGGCTAGAAAGCATCTGGATGATTGCACTTTACCTTAGG

右:(SEQ ID NO:64)

CAGGGATACTTGAGTGTCCTCTCTTAGGATCTGGACCTAGAATTAATGTCATGAGATTTTTCTAACAGGATAAGGTGAGGTAGTGAGGGCTGAAGTCATCCACTGGGTTATCCAAATATTAGGTTTCACTGCTGACAAAAGAGGGGGCTTCTGGTCTGGTTGGTTATTTGTGTTTGGCCTGATGTGCTCTGTCAATCAAATGTATGGACATAGGCCTAGCTTCTAAAGGGGCAATAGTGACCTCAGTGGACTGATATTTACCGTACTATTTACATGTGCTCTTAATTACAGCAGAAGCTGCCAGCTAACTGAATCTTGTTTTGAATCTAAAAAATCTACTCTTAAAGCAAGAAAATGGTATAAAATTAGTTGATAATGCAAGTGAATTCTGTACATTTAATTATTCTAAGACATTGGAAAATAAAATATCTTGTTACTTTGAGGATAAAAGATGATTTCTTTAAAAATGCAAATGTTTTCTACAAATACTAAAGTTAAA

CCCTATCAGTGATAGAGAACGTATGAAGAGTTTACTCCCTATCAGTGATAGAGAACGTATGCAGACTTTACTCCCTATCAGTGATAGAGAACGTATAAGGAGTTTACTCCCTATCAGTGATAGAGAACGTATGACCAGTTTACTCCCTATCAGTGATAGAGAACGTATCTACAGTTTACTCCCTATCAGTGATAGAGAACGTATATCCAGTTTACTCCCTATCAGTGATAGAGAACGTATAAGCTTTAGGCGTGTACGGTGGGCGCCTATAAAAGCAGAGCTCGTTTAGTGAACCGTCAGATCGCCTGGAGCAATTCCACAACACTTTTGTCTTATACCAACTTTCCGTACCACTTCCTACCCTCGTAAAG

SEQ ID NO:65中的TetO序列具有序列:

Ccctatcagtgatagaga(SEQ ID NO:76)

存在有SEQ ID NO:65中的7个TetO序列。

ATGGTGAGCAAGGGCGAGGAGCTGTTCACCGGGGTGGTGCCCATCCTGGTCGAGCTGGACGGCGACGTAAACGGCCACAAGTTCAGCGTGTCCGGCGAGGGCGAGGGCGATGCCACCTACGGCAAGCTGACCCTGAAGTTCATCTGCACCACCGGCAAGCTGCCCGTGCCCTGGCCCACCCTCGTGACCACCCTGACCTACGGCGTGCAGTGCTTCAGCCGCTACCCCGACCACATGAAGCAGCACGACTTCTTCAAGTCCGCCATGCCCGAAGGCTACGTCCAGGAGCGCACCATCTTCTTCAAGGACGACGGCAACTACAAGACCCGCGCCGAGGTGAAGTTCGAGGGCGACACCCTGGTGAACCGCATCGAGCTGAAGGGCATCGACTTCAAGGAGGACGGCAACATCCTGGGGCACAAGCTGGAGTACAACTACAACAGCCACAACGTCTATATCATGGCCGACAAGCAGAAGAACGGCATCAAGGTGAACTTCAAGATCCGCCACAACATCGAGGACGGCAGCGTGCAGCTCGCCGACCACTACCAGCAGAACACCCCCATCGGCGACGGCCCCGTGCTGCTGCCCGACAACCACTACCTGAGCACCCAGTCCGCCCTGAGCAAAGACCCCAACGAGAAGCGCGATCACATGGTCCTGCTGGAGTTCGTGACCGCCGCCGGGATCACTCTCGGCATGGACGAGCTGTACAAGTAA

SEQ ID NO:44是DLNGFR。此序列(SEQ ID NO:67)是针对人表达密码子优化的DLNGFR。

ATGGGAGCTGGTGCTACCGGCAGAGCTATGGATGGACCTAGACTGCTGCTCCTGCTGCTGCTCGGAGTTTCTCTTGGCGGAGCCAAAGAGGCCTGTCCTACCGGCCTGTATACACACTCTGGCGAGTGCTGCAAGGCCTGCAATCTTGGAGAAGGCGTGGCACAGCCTTGCGGCGCTAATCAGACAGTGTGCGAGCCTTGCCTGGACAGCGTGACCTTTAGCGACGTGGTGTCTGCCACCGAGCCATGCAAGCCTTGTACCGAGTGTGTGGGCCTGCAGAGCATGTCTGCCCCTTGTGTGGAAGCCGACGATGCCGTGTGTAGATGCGCCTACGGCTACTACCAGGACGAGACAACAGGCAGATGCGAGGCCTGTAGAGTGTGTGAAGCCGGCTCTGGACTGGTGTTCAGCTGCCAAGACAAGCAGAACACCGTGTGCGAGGAATGCCCCGATGGCACCTATAGCGACGAGGCCAACCATGTGGATCCCTGCCTGCCTTGTACTGTGTGCGAAGATACCGAGCGGCAGCTGCGCGAGTGTACAAGATGGGCTGATGCCGAGTGCGAAGAGATCCCCGGCAGATGGATCACCAGAAGCACACCTCCAGAGGGCAGCGATAGCACAGCCCCTTCTACACAAGAGCCCGAGGCTCCTCCTGAGCAGGATCTGATTGCCTCTACAGTGGCCGGCGTGGTCACAACAGTGATGGGATCTTCTCAGCCCGTGGTCACCAGAGGCACCACCGACAATCTGATCCCCGTGTACTGTAGCATCCTGGCCGCCGTGGTTGTGGGACTCGTGGCCTATATCGCCTTCAAGCGGTGGAACCGGGGCATCCTGTAA

GCCACCATGTCTATTCCTCTGCCCCTGCTGCAGATCTACACCAGCGACAACTACACCGAGGAAATGGGCAGCGGCGACTACGACAGCATGAAGGAACCCTGCTTCCGGGAAGAGAACGCCAACTTCAACAAGATCTTCCTGCCCACAATCTACAGCATCATCTTTCTGACCGGCATCGTGGGCAACGGACTCGTGATCCTCGTGATGGGCTACCAGAAAAAGCTGCGGAGCATGACCGACAAGTACCGGCTGCACCTGAGCGTGGCCGACCTGCTGTTCGTGATCACCCTGCCTTTCTGGGCCGTGGACGCCGTGGCCAATTGGTACTTCGGCAACTTCCTGTGCAAGGCCGTGCACGTGATCTACACAGTGAACCTGTACAGCAGCGTGCTGATCCTGGCCTTCATCAGCCTGGACAGATACCTGGCCATCGTGCACGCCACCAACAGCCAGCGGCCTAGAAAGCTGCTGGCCGAGAAGGTGGTGTACGTGGGCGTGTGGATTCCCGCCCTGCTGCTGACCATCCCCGACTTCATCTTCGCCAACGTGTCCGAGGCCGACGACCGGTACATCTGCGACCGGTTCTACCCCAACGACCTGTGGGTGGTGGTGTTCCAGTTCCAGCACATCATGGTGGGACTGATCCTGCCTGGCATCGTGATTCTGAGCTGCTACTGCATCATCATCAGCAAGCTGAGCCACAGCAAGGGCCACCAGAAGCGGAAGGCCCTGAAAACCACCGTGATCCTGATTCTGGCTTTCTTCGCCTGCTGGCTGCCCTACTACATCGGCATCAGCATCGACAGCTTCATCCTGCTGGAAATCATCAAGCAGGGCTGCGAGTTCGAGAACACCGTGCACAAGTGGATCAGCATTACCGAGGCCCTGGCCTTTTTCCACTGCTGCCTGAACCCTATCCTGTACGCCTTCCTGGGCGCCAAGTTCAAGACCTCTGCCCAGCACGCCCTGACCAGCGTGTCCAGAGGAAGCAGCCTGAAGATCCTGAGCAAGGGCAAG

CXCR4 WT和CXCR4 WHIM之间的单核苷酸差异以粗体和下划线显示。

CXCR4 WT和CXCR4 WHIM之间的单核苷酸差异以粗体和下划线显示。

条款概述

本发明在权利要求术和随附的描述中定义。为了方便起见,本发明的其他方面在此通过编号的条款来呈现。

1.用于选择基因组编辑细胞和/或在细胞群体中富集基因组编辑细胞的方法,其包括:

(a)将至少一个第一组分、至少一个第二组分和至少一个第三组分引入细胞或细胞群体中;和

(b)选择瞬时表达或瞬时上调编码选择子的核苷酸序列的基因组编辑细胞;

其中所述第一组分是供体报告物盒,其包含所述编码选择子的核苷酸序列和感兴趣的核苷酸序列(NOI);

其中所述第二组分是工程化转录反式激活物(ETT)多肽或编码ETT多肽的核苷酸序列;其中所述ETT多肽包含DNA结合域(DBD)和至少一个转录激活物(TA)域;

其中所述第三组分是核酸酶系统,所述核酸酶系统包含基因组靶向核酸酶和任选地引导RNA(gRNA),所述引导RNA包含至少一个靶向基因组序列;

其中所述ETT多肽瞬时存在于所述细胞或细胞群体中,或者所述编码ETT多肽的核苷酸序列在所述细胞或细胞群体中瞬时表达;和

其中所述细胞或细胞群体中所述核酸酶系统的存在使得能够将所述编码选择子的核苷酸序列和NOI插入靶基因座中,并且其中所述ETT多肽的瞬时存在或所述编码ETT多肽的核苷酸序列的瞬时表达使得能够瞬时表达或瞬时上调所述编码选择子的插入核苷酸序列。

2.根据条款1的方法,其中所述供体报告物盒序贯包含:

(i)包含与靶基因座同源的核苷酸序列的左同源臂(HA);

(ii)与最小启动子可操作连接的所述编码选择子的核苷酸序列;

(iii)与启动子可操作连接的所述NOI;和

(iv)包含与所述靶基因座同源的核苷酸序列的右同源臂(HA);

其中当将所述编码选择子的核苷酸序列插入所述靶基因座时,所述第二组分的ETT多肽或由所述第二组分表达的ETT多肽激活所述最小启动子。

3.根据条款1的方法,其中所述供体报告物盒序贯包含:

(i)包含与靶基因座同源的核苷酸序列的左同源臂(HA);

(ii)任选地,剪接受体位点(SA);

(iii)所述NOI;

(iv)与最小启动子可操作连接的所述编码选择子的核苷酸序列;和

(v)包含与所述靶基因座同源的核苷酸序列的右同源臂(HA);

其中当将所述编码选择子的核苷酸序列插入所述靶基因座时,所述第二组分的ETT多肽或由所述第二组分表达的ETT多肽激活所述最小启动子。

4.根据条款1的方法,其中所述供体报告物盒序贯包含:

(i)包含与靶基因座同源的核苷酸序列的左同源臂(HA);

(ii)任选地,剪接受体位点(SA);

(iii)所述NOI;

(iv)任选地,编码2A自切割肽(2A)或内部核糖体进入位点(IRES)元件的核苷酸序列;

(v)所述编码选择子的核苷酸序列,任选地,所述编码选择子的核苷酸序列与最小启动子可操作连接;和

(vi)包含与所述靶基因座同源的核苷酸序列的右同源臂(HA);

其中所述第二组分的ETT多肽或由所述第二组分表达的ETT多肽激活所述靶基因座中的内源启动子。

5.根据前述条款中任一项的方法,其中所述DBD是转录激活物样效应物(TALE)DBD、锌指、无催化活性的Cpf1或无催化活性的Cas(dCas),并且其中所述TA域选自下组:VP16、VP64、VP128、VP160、VPR、p65、Rta、HSF1、SAM和SunTag。

6.根据前述条款中任一项的方法,其中所述gRNA能够结合选自下组的核苷酸序列中的一种或多种:SEQ ID NO 1至31和与其具有至少75%同一性的序列。

7.根据前述条款中任一项的方法,其中所述靶基因座是安全港。

8.根据条款7的方法,其中所述靶基因座是腺相关病毒整合位点1(AAVS1)、慢病毒载体的共同整合位点(CIS)、IL2RG、gp91phox、HBB、RAG1、CD40LG、TRAC、TRBC、STAT、PRF1、编码皮肤中表达的蛋白质(如胶原蛋白、角蛋白、层粘连蛋白、桥粒芯粘着蛋白、桥粒斑蛋白、桥粒芯蛋白、斑珠蛋白、阔叶碱、整联蛋白或其他参与桥粒和半桥粒的蛋白质)的基因或另一个安全港基因组基因座。

9.试剂盒,其包括如前述条款任一项中所定义的第一组分、第二组分和第三组分,以及任选地细胞群体。

10.通过前述条款中任一项的方法产生的基因组编辑细胞群体。

11.药物组合物,其包含根据条款10的基因组编辑细胞群体。

12.根据条款10的基因组编辑细胞群体,用于基因疗法。

13.根据条款10的基因组编辑细胞群体,用于治疗或预防X连锁严重联合免疫缺陷(SCID-X1)。

14.根据条款10的基因组编辑细胞群体,用于造血干细胞移植(HSCT)。

15.根据条款10的基因组编辑细胞群体,用于组织修复。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号