首页> 中国专利> 用于增强基于供体寡核苷酸的基因编辑的组合物和方法

用于增强基于供体寡核苷酸的基因编辑的组合物和方法

摘要

用于增强基因编辑的组合物和其使用方法。该组合物含有细胞穿透抗体和供体寡核苷酸,该供体寡核苷酸含有可以校正细胞的基因组中的突变的序列。优选地,该组合物不含核酸酶、PNA或纳米颗粒。这些组合物用于通过使细胞与有效量的该组合物接触来修饰该细胞的基因组。与不存在该细胞穿透抗体相比,当细胞与该细胞穿透抗体和该供体寡核苷酸接触时,基因组修饰在离体和体内均以较高频率发生。

著录项

  • 公开/公告号CN112930399A

    专利类型发明专利

  • 公开/公告日2021-06-08

    原文格式PDF

  • 申请/专利权人 耶鲁大学;

    申请/专利号CN201980070980.3

  • 发明设计人 E·基哈诺;A·图奇克;P·格莱泽;

    申请日2019-08-30

  • 分类号C12N15/90(20060101);A61K48/00(20060101);

  • 代理机构31204 上海德昭知识产权代理有限公司;

  • 代理人郁旦蓉

  • 地址 美国康乃狄克州

  • 入库时间 2023-06-19 11:17:41

说明书

本申请要求于2018年8月31日提交的U.S.S.N.62/725,920的权益和优先权,该申请具体地以全文引用的方式并入本文中。

本发明是在美国国立卫生研究院授予的CA168733和CA197574下由政府支持完成的。政府拥有本发明的某些权利。

创建于2019年8月28日并且大小为61,341字节的以命名为“YU_7503_PCT”的文本文件提交的序列表根据37C.F.R.§1.52(e)(5)通过引用特此并入。

技术领域

本发明总体上涉及基因编辑技术领域,并且更具体地涉及增强剂(如细胞穿透抗DNA抗体)和供体寡核苷酸的组合物和用途,其用于离体和体内基因编辑方法中。

背景技术

基因编辑提供了用于治疗遗传性基因病症(如镰状细胞性贫血和β地中海贫血)的有吸引力的策略。可以通过若干种方法选择性地编辑基因,包含靶向核酸酶(如锌指核酸酶(ZFN)(Haendel等人,《基因疗法(Gene Ther.)》,11:28-37(2011))和CRISPR(Yin等人,《自然生物科技(Nat.Biotechnol.)》,32:551-553(2014)))、短片段同源重组(SFHR)(Goncz等人,《寡核苷酸(Oligonucleotides)》,16:213-224(2006))或形成三链体的寡核苷酸(TFO)(Vasquez等人,《科学(Science)》,290:530-533(2000))。通常认为,用供体DNA进行高效基因编辑需要靶基因中的DNA断裂。因此,由于其易用性和便捷的试剂设计(Doudna等人,《科学》,346:1258096(2014)),广泛关注靶向核酸酶,如CRISPR/Cas9技术。然而,与ZFN一样,CRISPR方法将活性核酸酶引入到细胞中,这可能导致基因组中的脱靶切割(Cradick等人,《核酸研究(Nucleic Acids Res.)》,41:9584-9592(2013)),这一问题至今尚未消除。

此外,基因修饰的效率可能较低,尤其是在原代干细胞中进行CRISPR/Cas介导的编辑的背景下。例如,为了校正囊性纤维化患者源性干细胞中的CFTR基因座,大约0.3%的经处理的类器官(3到6/1400)具有期望的修饰(Schwank等人,《细胞干细胞(Cell StemCell)》,13:653-658(2013))。

因此,仍然需要用于改善基因编辑的组合物和方法。

因此,本发明的目的是提供用于以减少的或低的脱靶修饰实现靶上修饰的组合物和方法。

本发明的另一个目的是提供用于实现增加的基因修饰频率的组合物和方法。

本发明的另外目的是提供用于基因修饰的组合物和方法,这些组合物和方法改善受试者的疾病或病症的一种或多种症状。

发明内容

已经发现,在不存在核酸酶或PNA的情况下,用细胞穿透抗DNA狼疮处理细胞增强了通过单独的供体DNA进行的靶向基因编辑。如实例中所描述的,已经发现eMab3E10利用含有单独的供体DNA的纳米颗粒加强基因编辑。还发现3E10通过培养物和小鼠中的细胞中的单独的裸供体DNA来促进体内基因编辑,而无需任何相关的核酸酶或PNA并且也无需包封在纳米颗粒中进行递送。

因此,公开了用于增强靶向基因编辑的组合物和其使用方法。在一些实施例中,该组合物含有增强剂(如细胞穿透抗体)和供体寡核苷酸,该供体寡核苷酸含有可以校正细胞的基因组中的突变的序列。优选地,该组合物不含核酸酶(例如,转录激活因子样效应子核酸酶(TALEN)、ZFN、Cas9)、肽核酸(PNA)或纳米颗粒。通常,该供体寡核苷酸不与该细胞穿透抗体共价连接。该寡核苷酸(例如,DNA)可以是单链或双链的。优选地,该寡核苷酸是单链DNA。

在一些实施例中,该寡核苷酸序列对应于作为疾病或病症(例如,血友病、肌营养不良、球蛋白病(globinopathies)、囊性纤维化、着色性干皮病、溶酶体贮积病、如X连锁严重联合免疫缺陷病和ADA缺乏症的免疫缺陷综合征、酪氨酸血症、范可尼贫血(Fanconianemia)、红细胞病症球形红细胞症、α1抗胰蛋白酶缺乏症、威尔逊氏病(Wilson'sdisease)、莱伯氏遗传性视神经病变(Leber's hereditary optic neuropathy)或慢性肉芽肿性病症)的原因的突变基因的野生型序列。示例性基因包含对凝血因子VIII、凝血因子IX、肌营养不良蛋白、β-珠蛋白、CFTR、XPC、XPD、DNA聚合酶η进行编码的基因、范可尼贫血基因A到L、SPTA1和其它血影蛋白基因、ANK1基因、SERPINA1基因、ATP7B基因、白介素2受体γ(IL2RG)基因、ADA基因、FAH基因以及与慢性肉芽肿性疾病相关的基因,包含CYBA、CYBB、NCF1、NCF2或NCF4基因等。

该增强剂通常增加由该供体寡核苷酸进行的基因编辑。在优选的实施例中,该增强剂是细胞穿透抗体。在一些实施例中,该增强剂是抗RAD51因子。该细胞穿透抗体可以是抗DNA抗体,该抗DNA抗体在不借助于载体或缀合物的情况下转运到该细胞的细胞质和/或细胞核中。

在一些实施例中,该细胞穿透抗DNA抗体分离自或源自患有系统性红斑狼疮的受试者或其动物模型(例如,小鼠或兔子)。在优选的实施例中,该细胞穿透抗DNA抗体是单克隆抗DNA抗体3E10或其结合与3E10相同的一个或多个表位的变体、片段或人源化形式。特别优选的变体是在重链中并入D31N取代的3E10变体。该细胞穿透抗DNA抗体可以具有与由ATCC登录号PTA 2439杂交瘤产生的单克隆抗体3E10相同或不同的表位特异性。

在一些实施例中,该抗体具有:

(i)SEQ ID NO:1-6、12或13中的任一个的CDR与SEQ ID NO:7-11或15中的任一个的CDR的组合;

(ii)选自SEQ ID NO:15-23的第一、第二和第三重链CDR与选自SEQ ID NO:24-30的第一、第二和第三轻链CDR的组合;

(iii)(i)或(ii)的人源化形式;

(iv)包括与SEQ ID NO:1或2中的任一个包含至少85%序列同一性的氨基酸序列的重链与包括与SEQ ID NO:7或8包含至少85%序列同一性的氨基酸序列的轻链的组合;

(v)人源化形式或(iv);或者

(vi)包括与SEQ ID NO:3-6中的任一个包含至少85%序列同一性的氨基酸序列的重链与包括与SEQ ID NO:9-11包含至少85%序列同一性的氨基酸序列的轻链的组合。

优选地,该抗体可以直接与RAD51结合。在一些实施例中,该抗DNA抗体具有单克隆抗体3E10的互补位。该抗DNA抗体可以是抗DNA抗体或其保守变体的单链可变片段。例如,该抗DNA抗体可以是3E10的单价、二价或多价单链可变片段(3E10 Fv)或其变体,例如保守变体。在一些实施例中,该抗DNA抗体是在重链中并入D31N取代的3E10的单价、二价或多价单链可变片段(3E10 Fv)。

还提供了一种药物组合物,该药物组合物含有在药学上可接受的赋形剂中的增强剂(如细胞穿透抗体)和供体寡核苷酸。这些组合物可以用于通过使细胞与有效量的该组合物接触来修饰该细胞的基因组。

还提供了一种通过使细胞与有效量的(i)增强剂(如细胞穿透抗体)以及(ii)含有可以校正细胞的基因组中的突变的序列的供体寡核苷酸接触来修饰该细胞的基因组的方法。与在不存在(i)的情况下与(ii)接触时相比,当细胞与(i)和(ii)两者接触时,基因组修饰可以以较高频率发生。优选地,该方法不涉及使该细胞与核酸酶(例如,ZFN、Cas9)或肽核酸(PNA)接触。

该一种或多种供体寡核苷酸可以单独地包封在纳米颗粒中。这些纳米颗粒可以由多羟基酸(例如,聚(乳酸-共-乙醇酸)(PLGA))形成。这些纳米颗粒可以通过双乳液制备。在一些实施例中,靶向部分、细胞穿透肽或其组合与该纳米颗粒缔合、连接、缀合或以其它方式直接或间接附接。

在一些实施例中,细胞(例如,造血干细胞)离体接触,并且这些细胞可以进一步施用于有需要的受试者。可以以有效量向该受试者施用这些细胞以治疗疾病或病症的一种或多种症状。在其它实施例中,在向受试者施用该细胞穿透抗体和供体寡核苷酸之后,使这些细胞在体内接触。

该受试者可能患有以下疾病或病症,如血友病、肌营养不良、球蛋白病、囊性纤维化、着色性干皮病、溶酶体贮积病、如X连锁严重联合免疫缺陷病和ADA缺乏症的免疫缺陷综合征、酪氨酸血症、范可尼贫血、红细胞病症球形红细胞症、α1抗胰蛋白酶缺乏症、威尔逊氏病、莱伯氏遗传性视神经病变或慢性肉芽肿性病症。在此类实施例中,基因修饰可以以有效量发生,以减轻该受试者的该疾病或病症的一种或多种症状。

附图说明

图1是示出用1)含有单独的供体DNA的NP、2)含有供体DNA和PNA的NP以及3)含有单独的供体DNA的NP和3E10处理的MEF中的β-珠蛋白/GFP融合基因内的IVS2-654(C->T)突变的基因校正的柱状图。通过流式细胞术评估的GFP

图2是示出在用eMab(3E10)和供体DNA离体处理来自汤斯(Townes)小鼠的骨髓细胞后,β珠蛋白基因中的基因编辑百分比的柱状图。基因编辑频率通过对基因组DNA的液滴数字PCR(ddPCR)的分析测定。

图3是示出在用eMab(3E10)和供体DNA体外处理来自汤斯小鼠的MEF后,β珠蛋白基因中的基因编辑百分比的柱状图。基因编辑频率通过对基因组DNA的液滴数字PCR(ddPCR)的分析测定。用3E10/供体DNA处理的MEF中的编辑显著高于用单独的供体DNA处理的MEF。

图4是示出在用通过腹膜内注射递送的3E10和供体DNA体内处理汤斯小鼠后,β珠蛋白基因中的基因编辑百分比的柱状图。注射后2个月,评估骨髓细胞中的基因编辑。与空白PLGA纳米颗粒相比,用3E10/供体DNA处理的小鼠表现出显著更高的基因编辑水平。

具体实施方式

I.定义

如本文所使用的,术语“单链Fv”或“scFv”是指单链可变片段,该单链可变片段包含由接头连接的单个多肽链中的轻链可变区(VL)和重链可变区(VH),该接头使scFv能够形成抗原结合的期望结构(即单个多肽链的VH和VL相互缔合以形成Fv)。VL区和VH区可以来源于亲本抗体或者可以化学地或重组地合成。

如本文所使用的,术语“可变区”旨在区分免疫球蛋白的这种结构域与抗体广泛共享的结构域(如抗体Fc结构域)。可变区包含“高变区”,该高变区的残基对抗原结合负责。高变区包含来自“互补决定区”或“CDR”的氨基酸残基(即,通常在大约轻链可变结构域中的残基24-34(L1)、50-56(L2)和89-97(L3)处以及在大约重链可变结构域中的残基27-35(H1)、50-65(H2)和95-102(H3)处;Kabat等人,《具有免疫学意义的蛋白质序列(Sequences ofProteins of Immunological Interest)》,第5版,公共卫生署(Public Health Service),国立卫生研究院(National Institutes of Health),贝塞斯达(Bethesda),马里兰州(MD.)(1991))和/或来自“高变环”的那些残基(即,轻链可变结构域中的残基26-32(L1)、50-52(L2)和91-96(L3)以及重链可变结构域中的26-32(H1)、53-55(H2)和96-101(H3);Chothia和Lesk,1987,《分子生物学杂志(J.Mol.Biol.)》196:901-917)。

如本文所使用的,如本文中定义的,术语“框架区”或“FR”残基是除了高变区残基以外的那些可变结构域残基。

如本文所使用的,术语“抗体”是指结合靶抗原的天然或合成抗体。该术语包含多克隆抗体和单克隆抗体。除了完整的免疫球蛋白分子之外,术语“抗体”中还包含那些免疫球蛋白分子的结合蛋白、片段和聚合物以及结合靶抗原的人或人源化免疫球蛋白分子版本。

如本文所使用的,术语“细胞穿透抗体”是指被转运到活的哺乳动物细胞的细胞质和/或细胞核中的免疫球蛋白、其片段、变体或基于其的融合蛋白。“细胞穿透抗DNA抗体”特异性结合DNA(例如,单链和/或双链DNA)。在一些实施例中,抗体在不借助于载体或缀合物的情况下被转运到细胞的细胞质中。在其它实施例中,抗体与细胞穿透部分(如细胞穿透肽)缀合。在一些实施例中,细胞穿透抗体在使用或不使用载体或缀合物的情况下转运在细胞核中。

除完整的免疫球蛋白分子外,术语“抗体”还包含免疫球蛋白分子的片段、结合蛋白和聚合物、含有来自多于一个物种、种类或亚类免疫球蛋白的序列的嵌合抗体(如人或人源化抗体)以及至少含有特异性结合DNA的免疫球蛋白的独特型的重组蛋白。可以使用本文所述的体外测定或通过类似方法来测试抗体的期望活性,之后根据已知的临床测试方法来测试其体内治疗活性。

如本文所使用的,术语“变体”是指不同于参考多肽或多核苷酸但保留了基本性质的多肽或多核苷酸。多肽的典型变体在氨基酸序列上不同于另一种参考多肽。通常,差异是有限的,使得参考多肽和变体的序列总体上非常类似并且在许多区完全相同。变体和参考多肽在氨基酸序列上的不同之处可以在于一个或多个修饰(例如,取代、添加和/或缺失)。经取代的或插入的氨基酸残基可以是或者可能不是由遗传密码编码的残基。多肽的变体可以是天然存在的,如等位基因变体,或者可以是已知并非天然地存在的变体。

可以对本公开的多肽结构进行修饰和改变,并且修饰和改变仍然获得了具有与多肽类似的特性的分子(例如,保守性氨基酸取代)。例如,某些氨基酸可以取代序列中的其它氨基酸,而没有明显的活性损失。因为多肽的相互作用能力和性质限定了多肽的生物功能活性,所以可以在多肽序列中进行某些氨基酸序列取代,但是这些氨基酸序列取代仍然获得了具有相似性质的多肽。

在进行此类改变时,可以考虑氨基酸的亲水指数。本领域中通常理解亲水氨基酸指数在向多肽赋予相互作用生物功能方面的重要性。已知某些氨基酸可以取代具有类似亲水指数或评分的其它氨基酸并且仍然产生具有类似生物活性的多肽。根据其疏水性和电荷特性,已经为每个氨基酸指定了亲水指数。这些指数为:异亮氨酸(+4.5);缬氨酸(+4.2);亮氨酸(+3.8);苯丙氨酸(+2.8);半胱氨酸/胱氨酸(+2.5);蛋氨酸(+1.9);丙氨酸(+1.8);甘氨酸(-0.4);苏氨酸(-0.7);丝氨酸(-0.8);色氨酸(-0.9);酪氨酸(-1.3);脯氨酸(-1.6);组氨酸(-3.2);谷氨酸盐(-3.5);谷氨酰胺(-3.5);天冬氨酸(-3.5);天冬酰胺(-3.5);赖氨酸(-3.9);以及精氨酸(-4.5)。

据信,氨基酸的相对亲水特性确定了所得多肽的二级结构,这进而限定了多肽与如酶、底物、受体、抗体、抗原和辅因子等其它分子的相互作用。本领域中已知的是,氨基酸可以被具有类似亲水指数的另一个氨基酸取代并且仍然获得功能上等同的多肽。在此类改变中,优选亲水指数在±2以内的氨基酸的取代,特别优选亲水指数在±1以内的氨基酸的取代,并且甚至更加特别优选亲水指数在±0.5以内的氨基酸的取代。

也可以在亲水性的基础上进行相似氨基酸的取代,特别是在由此产生的生物学功能等同多肽或肽旨在用于免疫学实施例的情况下。已对氨基酸残基指定了以下亲水性值:精氨酸(+3.0);赖氨酸(+3.0);天冬氨酸(+3.0±1);谷氨酸(+3.0±1);丝氨酸(+0.3);天冬酰胺(+0.2);谷氨酰胺(+0.2)甘氨酸(0);脯氨酸(-0.5±1);苏氨酸(-0.4);丙氨酸(-0.5);组氨酸(-0.5);半胱氨酸(-1.0);蛋氨酸(-1.3);缬氨酸(-1.5);亮氨酸(-1.8);异亮氨酸(-1.8);酪氨酸(-2.3);苯丙氨酸(-2.5);色氨酸(-3.4)。应当理解的是,氨基酸可以取代具有类似亲水性值的另一种氨基酸并且仍然获得生物学上等同的,特别是免疫学上等同的多肽。在这种改变时,优选亲水性值在±2以内的氨基酸的取代,特别优选亲水性值在±1以内的氨基酸的取代,更特别优选亲水性值在±0.5以内的氨基酸的取代。

如上文所概述的,氨基酸取代通常基于氨基酸侧链取代基的相对相似性,例如其疏水性、亲水性、电荷、大小等。考虑到各种前述特征的示例性取代是本领域技术人员熟知的并且包含(原始残基:示例性取代):(Ala:Gly,Ser)、(Arg:Lys)、(Asn:Gln,His)、(Asp:Glu,Cys,Ser)、(Gln:Asn)、(Glu:Asp)、(Gly:Ala)、(His:Asn,Gln)、(Ile:Leu,Val)、(Leu:Ile,Val)、(Lys:Arg)、(Met:Leu,Tyr)、(Ser:Thr)、(Thr:Ser)、(Tip:Tyr)、(Tyr:Trp,Phe)和(Val:Ile,Leu)。因此,本公开的实施例考虑了如上所述的多肽的功能或生物学等效物。具体地说,多肽的实施例可以包含与所关注多肽具有约50%、60%、70%、80%、90%、95%、96%、97%、98%、99%或更多序列同一性的变体。

如本文所使用的,术语“序列同一性百分比(%)”被定义为在必要时比对序列并引入空位以获得最大序列同一性百分比之后,候选序列中与参考核酸序列中的核苷酸或氨基酸相同的核苷酸或氨基酸的百分比。可以用本领域技术中的多种方式来实现出于测定序列同一性百分比的目的进行的比对,例如使用可公开获得的计算机软件,如BLAST、BLAST-2、ALIGN、ALIGN-2或Megalign(DNASTAR)软件。可以通过已知方法测定用于测量比对的适当参数,包含在被比较序列的全长范围内实现最大比对所需的任何算法。

出于本文的目的,给定核苷酸或氨基酸序列C相对于给定核酸序列D的序列同一性%(该序列同一性%可以可替代地表述为给定序列C与给定序列D具有或包含一定序列同一性%)计算如下:

100乘以分数W/Z,

其中W是由序列比对程序在该程序对C和D的比对中评分为相同匹配的核苷酸或氨基酸的数量,而其中Z是D中核苷酸或氨基酸的总数。应当理解,当序列C的长度不等于序列D的长度时,C到D的序列同一性%将不等于D到C的序列同一性%。

如本文所使用的,术语“特异性地结合”是指抗体与其同源抗原(例如,DNA)结合,而未与其它抗原显著结合。在此类条件下抗体与靶标的特异性结合需要针对其对靶标的特异性来选择抗体。可以使用多种免疫测定方式来选择与特定蛋白进行特异性免疫反应的抗体。例如,常规使用固相ELISA免疫测定来选择与蛋白质发生特异性免疫反应的单克隆抗体。参见例如Harlow和Lane(1988)《抗体实验室手册(Antibodies,A LaboratoryManual)》,冷泉港出版社(Cold Spring Harbor Publications),纽约,了解可以用于测定特异性免疫反应性的免疫测定格式和条件的描述。优选地,抗体与该第二分子以大于约10

如本文所使用的,术语“单克隆抗体”或“MAb”是指从基本上均质的抗体群获得的抗体,即,除了抗体分子的小子集中可能存在的可能天然存在的突变外,群中的各个抗体完全相同。

如本文所使用的,“基因编辑增强因子”或“基因编辑增强剂”或“增强因子”或“增强剂”是指相对于在不存在化合物的情况下使用供体寡核苷酸,由供体寡核苷酸增加对基因、基因组或其它核酸进行编辑(例如突变,包含插入、缺失、取代等)的功效的化合物。

如本文所使用的,术语“受试者”意指作为施用靶标的任何个体。受试者可以是脊椎动物,例如哺乳动物。因此,受试者可以是人。该术语不指示具体的年龄或性别。

如本文所使用的,术语“有效量”意指使用的组合物的量是足以改善疾病或病症的一种或多种原因或症状的量。此类改善仅需要减少或改变,并不需要消除。精确剂量将根据多种因素而变化,如受试者依赖性变量(例如,年龄、免疫系统健康状况等)、所治疗疾病或病症以及施用途径和所施用药剂的药代动力学。

如本文所使用的,术语“药学上可接受的”是指不是生物学上或在其它方面不期望的材料,即,该材料可以施用于受试者,而不会引起任何不期望的生物学效应或以任何有害的方式与含有该材料的药物组合物中的其它组分中的任何组分相互作用。

如本文所使用的,术语“载体”或“赋形剂”是指调配物中的有机或无机成分、天然或合成的非活性成分,其中一种或多种活性成分与其组合。如本领域技术人员所熟知的,载体或赋形剂将被自然地选择来最小化活性成分的任何降解并且最小化受试者中的任何不良副作用。

如本文所使用的,术语“治疗”是指患者的医疗管理,其中有意治愈、改善、稳定或预防疾病、病理学病状或病症。此术语包括积极治疗,即特异性针对疾病、病理学病状或病症的改善的治疗,并且还包含病因治疗,即针对相关疾病、病理学病状或病症的病因的去除的治疗。此外,此术语包含姑息治疗,即设计用于减轻症状而不是治愈疾病、病理学病状或病症的治疗;预防治疗,即针对使相关疾病、病理学病状或病症的发展最小化或部分或完全抑制其发展的治疗;以及支持性治疗,即用于补充针对相关疾病、病理学病状或病症的改善的另一种特定疗法的治疗。

如本文所使用的,“靶向部分”是可以将颗粒或分子引导到所选细胞或组织类型上的受体位点,可以用作附接分子或用来偶联或附接另一个分子的物质。如本文所使用的,“直接”是指使分子优先附接到所选细胞或组织类型。如下文所述,这可以用于引导细胞材料、分子或药物。

如本文所使用的,术语“抑制”或“降低”意指减小活性、应答、病状、疾病或其它生物参数。这可以包含但不限于活性、应答、病状或疾病的完全消融。这还可以包含例如与天然或对照水平相比,活性、应答、病状或疾病减少10%。因此,与天然或对照水平相比,减少量可以是10%、20%、30%、40%、50%、60%、70%、80%、90%、100%或其间的任何减少量。

如本文所使用的,“融合蛋白”是指通过将两个或更多个多肽通过在一个多肽的氨基端与另一个多肽的羧基端之间形成的肽键进行连接而形成的多肽。融合蛋白可以通过构成的多肽的化学偶联形成,或者可以从对单个连续融合蛋白进行编码的核酸序列表达为单个多肽。单链融合蛋白是具有单个连续多肽主链的融合蛋白。可以使用分子生物学中的常规技术来制备融合蛋白,以将使用相同读框的这两个基因连接成单个核酸序列,并且然后在产生融合蛋白的条件下在适合的宿主细胞中表达核酸。

除非本文中另外指明,否则对本文中值范围的叙述仅旨在用作单独地提及落入该范围的每个单独值的速记方法,并且每个单独值并入本说明书中,如同在本文中单独地叙述一样。

术语“约”的使用旨在描述在大约+/-10%的范围内高于或低于所述值的值;在其它实施例中,这些值的范围可以在大约+/-5%的范围内高于或低于所述值内;在其它实施例中,这些值的范围可以在大约+/-2%的范围内高于或低于所述值内;在其它实施例中,这些值的范围可以在大约+/-1%的范围内高于或低于所述值内。上述范围旨在根据上下文确定,并且未隐含进一步限制。

除非另外指明或明显与上下文相矛盾,否则本文所描述的所有方法均可以按任何适合的顺序执行。除非另外要求,否则本文中提供的任何和所有实例或示例性语言(例如,“如”)的使用仅旨在更好地阐明实施例,而不构成对实施例的范围的限制。说明书中的任何语言都不应被解释为指示任何未要求保护的要素为实践本发明所必需的。

II.组合物

公开了用于增强靶向基因编辑的组合物和其使用方法。所公开的方法通常包含使细胞与增强剂和供体寡核苷酸两者接触。提供了示例性增强剂和供体寡核苷酸。增强剂和供体寡核苷酸可以是相同或不同组合物的一部分。

在一些实施例中,增强剂可以接合一个或多个内源性高保真DNA修复途径或抑制/调节易错(即低保真)DNA修复途径。增强剂包含例如DNA损伤和/或DNA修复因子的调节剂、同源重组因子的调节剂、细胞粘附调节剂、细胞循环调节剂、细胞增殖调节剂和干细胞动员剂。增强因子可以调节(例如,改变、抑制、促进、竞争)一种或多种内源性高保真DNA修复途径或抑制/调节易错(即低保真)DNA修复途径。在优选的实施例中,增强因子可以是DNA损伤、DNA修复或同源重组因子的抑制剂。在更优选的实施例中,增强因子可以是RAD51的抑制剂。

例如,可以将DNA损伤和/或DNA修复因子的抑制剂用作增强剂。同源重组因子的抑制剂可以用作增强剂。

细胞修复DNA断裂主要是通过内源性非同源末端连接(NHEJ)DNA修复进行的,这是可以在DNA断裂区处引入或缺失核苷酸的主要但易错途径。因此,NHEJ适用于使靶基因永久沉默。可替代地,细胞也可以通过同源定向修复(HDR)(即涉及在存在模板DNA链的情况下进行同源重组的更精确的机制)修复双链断裂。通常,靶向基因组编辑涉及通过用由模板/供体DNA提供的校正序列替换突变序列来校正基因组中的突变序列。如此,在本领域中持续努力鉴定和利用有利于模板/供体DNA的同源重组以增强靶向基因组编辑效率的机制。调节DNA修复中涉及的因子的表达和/或活性是增强精密基因组工程的有前景的方法。

术语“DNA修复”是指细胞鉴定并校正对DNA分子的损伤的过程的集合。单链缺陷通过碱基切除修复(BER)、核苷酸切除修复(NER)或错配修复(MMR)进行修复。双链断裂通过非同源末端连接(NHEJ)、微同源介导的末端连接(MMEJ)或同源重组进行修复。DNA损伤后,细胞循环检查点被激活,这将暂停细胞循环以使细胞有时间修复损伤,然后继续分裂。检查点介体蛋白包含BRCA1、MDC1、53BP1、p53、ATM、ATR、CHK1、CHK2和p21。因此,可以将上述过程(包含BER、NER、MMR、NHEJ、MMEJ、同源重组或DNA合成)中的任何过程中涉及的因子描述为DNA损伤和/或DNA修复因子。

DNA损伤、DNA修复、DNA合成或同源重组因子的非限制性实例包含XRCC1、ADPRT(PARP-1)、ADPRTL2(PARP-2)、聚合酶β、CTPS、MLH1、MSH2、FANCD2、PMS2、p53、p21、PTEN、RPA、RPAl、RPA2、RPA3、XPD、ERCC1、XPF、MMS19、RAD51、RAD51B、RAD51C、RAD51D、DMC1、XRCCR、XRCC3、BRCA1、BRCA2,PALB2、RAD52、RAD54、RAD50、MREU、NB51、WRN、BLM、KU70、KU80、ATM、ATRCPIK1、CHK2、FANCA、FANCB、FANCC、FANCD1、FANCD2、FANCE、FANCF、FANCG、FANCC、FANCD1、FANCD2、FANCE、FANCF、FANCG、RAD1和RAD9。在优选的实施例中,DNA损伤因子或DNA修复因子是RAD51。

RAD51重组酶(即大肠杆菌(E.coli)RecA的直系同源物)是哺乳动物细胞中的同源重组的关键蛋白。RAD51促进双链断裂(最有害的DNA病变类型)的修复。双链断裂可以由各种化学剂和电离辐射诱导,并且也在链间交联的修复期间形成。一旦双链断裂形成,其首先被核酸外切酶加工以产生大量的3'单链DNA(ssDNA)尾部(Cejka等人,《自然(Nature)》,467(7311):112-16(2010);Mimitou和Symington,《DNA修复(DNA Repair.)》,8(9):983-95(2009)。ssDNA的这些踪迹迅速被单链DNA结合蛋白(即RPA)涂覆,该单链DNA结合蛋白最终被RAD51从ssDNA置换。RAD51具有ATP依赖性DNA结合活性,并且因此结合ssDNA尾部并且多聚化以形成螺旋核蛋白丝,这些螺旋核蛋白丝促进对同源dsDNA序列的搜索(Kowalczykowski,《自然》,453(7194):463-6(2008))。RAD51置换细胞中的ssDNA上的RPA的能力需要若干种介体蛋白,这些介体蛋白包含BRCA2、RAD52、RAD51旁系复合物和其它蛋白质(Thompson和Schild,《突变研究(Mutat Res.)》,477:131-53(2001))。一旦发现同源dsDNA序列,RAD51就会促进驻留于细丝内的ssDNA与同源dsDNA之间的DNA链交换,即ssDNA侵入同源DNA双链体中,从而导致相同ssDNA从双链体中置换出来并形成接合分子。接合分子(即DSB修复的关键中间体)为双链断裂修复所需的DNA修复合成提供模板和引物两者(Paques和Haber,《微生物学和分子生物学评论(Microbiol.Mol.Biol.Rev.)》,63(2):349-404(1999))。

通过促进DNA链交换,RAD51在同源重组中起关键作用。从噬菌体到哺乳动物,该蛋白质在进化上是保守的。在所有生物体中,RAD51直系同源物在DNA修复和同源重组中起重要作用(Krough和Symington,《遗传学年度评论(Annu.Rev.Genet.)》,38:233-71(2004);Helleday等人,《DNA修复》,6(7):923-35(2007);Huang等人,《美国国家科学院院刊(Proc.Natl.Acad.Sci.USA.)》,93(10):4827-32(1996))。

在优选的实施例中,增强剂是拮抗或降低RAD51、XRCC4或其组合的表达和/或活性的增强剂。例如,在一些实施例中,增强剂是RAD51和/或XRCC4抑制剂。增强剂的非限制性实例包含核酶、形成三链体的分子、siRNA、shRNA、miRNA、适体、反义寡核苷酸、小分子和抗体。

用于设计和产生前述因子中的任何因子的方法在本领域中是众所周知的并且可以使用。例如,预先设计的抗RAD51 siRNA可通过Dharmacon公司商购获得(如实例中所描述的),并且可以用作增强剂。同样,抗XRCC4 siRNA、shRNA和miRNA在本领域中是已知的并且可容易获得。进一步地,XRCC4和RAD51的小分子抑制剂是本领域已知的(例如,Jekimovs等人,《肿瘤学前沿(Front.Oncol.)》,4:86(2014))并且可以根据所公开的方法用作增强剂。

A.细胞穿透抗体

在一些实施例中,增强剂是细胞穿透抗体。尽管细胞穿透分子在本文中通常被称为“细胞穿透抗体”,但是应当理解,片段和结合蛋白(包含抗原结合片段、变体和融合蛋白,如scFv、二-scFv、tr-scFv和其它单链可变片段)以及本文所公开的其它细胞穿透分子也被明确提供用于本文所公开的组合物和方法的短语所涵盖。

用于组合物和方法中的细胞穿透抗体可以是抗DNA抗体。细胞穿透抗体可以结合单链DNA和/或双链DNA。细胞穿透抗体可以是抗RNA抗体(例如,抗体特异性结合RNA)。

在患有系统性红斑狼疮(SLE)的患者血清中经常鉴定出针对双链脱氧核糖核酸(dsDNA)的自身抗体,并且常常与疾病的发病机制有关。因此,在一些实施例中,细胞穿透抗体(例如,细胞穿透抗DNA抗体)可以源自患有SLE的患者或SLE的动物模型或从其中分离出来。

在优选的实施例中,抗DNA抗体是单克隆抗体或其抗原结合片段或变体。在一些实施例中,抗DNA抗体与细胞穿透部分(如细胞穿透肽)缀合,以促进进入细胞中并转运到细胞质和/或细胞核。细胞穿透肽的实例包含但不限于聚精氨酸(例如,R

在优选的实施例中,抗DNA抗体在不借助于载体或缀合物的情况下被转运到细胞的细胞质和/或细胞核中。例如,授予Richard Weisbart的美国专利第4,812,397号和第7,189,396号公开了在体内转运到哺乳动物细胞的细胞核而没有细胞毒性作用的单克隆抗体3E10和其活性片段。简而言之,可以通过根据已知技术将来自具有升高的抗DNA抗体的血清水平的宿主的脾细胞(例如,MRL/1pr小鼠)与骨髓瘤细胞融合或通过用适当的转化载体转化脾细胞来制备抗体以使细胞永生化。可以在选择性培养基中培养细胞并筛选以选择结合DNA的抗体。

在一些实施例中,细胞穿透抗体可以结合和/或抑制Rad51。参见例如在Turchick等人,《核酸研究》,45(20):11782-11799(2017)中描述的细胞穿透抗体。

组合物和方法中可以使用的抗体包含任何类别的整个免疫球蛋白(即完整抗体)、其片段以及至少含有抗体的抗原结合可变结构域的合成蛋白质。可变结构域在抗体之间在序列方面有所不同并且用于每个特定抗体针对其特定抗原的结合和特异性。然而,可变性通常不会均匀分布在抗体的可变结构域。其通常集中在轻链和重链可变结构域两者中的被称为互补性决定区(CDR)或高变区的三个区段中。可变结构域的更高保守性部分称为框架(FR)。天然重链和轻链的可变结构域各自包括:四个FR区,这四个FR区主要采用通过三个CDR连接的β-片层构型,这三个CDR形成连接β-片层结构的环并且在一些情况下形成β-片层结构的一部分。每条链中的CDR通过FR区紧密保持在一起并与来自另一条链的CDR一起促进抗体的抗原结合位点形成。因此,抗体通常至少含有维持DNA结合和/或干扰DNA修复所必需的CDR。

1. 3E10序列

在一些实施例中,该细胞穿透抗DNA抗体是单克隆抗DNA抗体3E10或其结合与3E10相同或不同的一个或多个表位的变体、衍生物、片段或人源化形式。因此,该细胞穿透抗DNA抗体可以具有与由ATCC登录号PTA 2439杂交瘤产生的单克隆抗体3E10相同或不同的表位特异性。抗DNA抗体可以具有单克隆抗体3E10的互补位。抗DNA抗体可以是抗DNA抗体或其保守变体的单链可变片段。例如,抗DNA抗体可以是3E10的单链可变片段(3E10 Fv)或其变体。

单克隆抗体3E10的氨基酸序列是本领域已知的。例如,下文提供了3E10重链和轻链的序列,其中单下划线表示根据Kabat系统鉴定的CDR区,而在SEQ ID NO:12-14中,斜体表示可变区并且双下划线表示信号肽。还提供了根据IMGT系统的CDR。

a.3E10重链

在一些实施例中,3E10的重链可变区为:

在一些实施例中,3E10重链表达为

将突变并入到野生型序列中的3E10抗体的变体在本领域中也是已知的,如例如在Zack等人,《免疫学杂志(J.Immunol.)》,157(5):2082-8(1996)中公开的。例如,已测定3E10的重链可变区的氨基酸位置31对抗体和其片段穿透细胞核并与DNA结合的能力有影响(在SEQ ID NO:1、2和13中以粗体表示)。CDR1中的D31N突变(在SEQ ID NO:2和13中以粗体表示)穿透细胞核并结合DNA,其效率比原始抗体高得多(Zack等人,《免疫学和细胞生物学》,72:513-520(1994),Weisbart等人,《自体免疫力杂志(J.Autoimmun.)》,11,539-546(1998);Weisbart,《国际肿瘤学杂志(Int.J.Oncol.)》,25,1867-1873(2004))。

在一些实施例中,3E10的重链可变区的优选变体的氨基酸序列是:

在一些实施例中,3E10重链表达为

在一些实施例中,在3E10重链可变区中,SEQ ID NO:1或2的C端丝氨酸不存在或被例如丙氨酸取代。

由Kabat鉴定的互补决定区(CDR)上方用下划线示出,并且包含CDR H1.1(原始序列):DYGMH(SEQ ID NO:15);CDR H1.2(具有D31N突变):NYGMH(SEQ ID NO:16);CDR H2.1:YISSGSSTIYYADTVKG(SEQ ID NO:17);CDR H3.1:RGLLLDY(SEQ ID NO:18)。

Kabat CDR H2.1的变体是YISSGSSTIYYADSVKG(SEQ ID NO:19)。

另外地或可替代地,可以根据IMGT系统定义重链互补决定区(CDR)。由IMGT系统鉴定的互补决定区(CDR)包含CDR H1.3(原始序列):GFTFSDYG(SEQ ID NO:20);CDR H1.4(具有D31N突变):GFTFSNYG(SEQ ID NO:21);CDR H2.2:ISSGSSTI(SEQ ID NO:22);CDR H3.2:ARRGLLLDY(SEQ ID NO:23)。

b.3E10轻链

在一些实施例中,3E10的轻链可变区为:

DIVLTQSPASLAVSLGQRATISC

3E10的轻链可变区的氨基酸序列也可以是:

DIVLTQSPASLAVSLGQRATISC

在一些实施例中,3E10轻链表达为

其它3E10轻链序列是本领域已知的。参见例如Zack等人,《免疫学杂志》,15;154(4):1987-94(1995);GenBank:L16981.1-小鼠Ig重排L链基因,部分cds;GenBank:AAA65681.1-免疫球蛋白轻链,部分[小家鼠])。

如由Kabat鉴定的互补决定区(CDR)用下划线示出,包含CDR L1.1:

Kabat CDR L1.1的变体是RASKSVSTSSYSYLA(SEQ ID NO:27)。

Kabat CDR L2.1的变体是YASYLQS(SEQ ID NO:28)。

另外地或可替代地,可以根据IMGT系统定义重链互补决定区(CDR)。如由IMGT系统鉴定的互补决定区(CDR)包含CDR L1.2 KSVSTSSYSY(SEQ ID NO:29);CDR L2.2:YAS(SEQID NO:30);CDR L3.2:QHSREFPWT(SEQ ID NO:26)。

在一些实施例中,SEQ ID NO:7或8的序列的C端进一步包含3E10轻链可变区中的精氨酸。

2.人源化3E10

在一些实施例中,抗体是人源化抗体。用于使非人抗体人源化的方法是本领域熟知的。通常,人源化抗体具有从非人的来源引入到其的一个或多个氨基酸残基。这些非人氨基酸残基通常被称为“输入(import)”残基,这些输入残基通常取自“输入”可变结构域。抗体人源化技术通常涉及使用重组DNA技术来操纵对抗体分子的一条或多条多肽链进行编码的DNA序列。

在WO 2015/106290和WO 2016/033324中讨论并在下文提供了示例性3E10人源化序列。

a.人源化3E10重链可变区

在一些实施例中,人源化3E10重链可变结构域包含

EVQLVQSGGGLIQPGGSLRLSCAASGFTFSNYGMHWVRQAPGKGLEWVSYISSGSSTIYYADSVKGRFTISRDNSKNTLYLQMNSLRAEDTAVYYCARRGLLLDYWGQGTTVTVSS(hVH1,SEQ ID NO:3),或者

EVQLVESGGGLIQPGGSLRLSCAASGFTFSNYGMHWVRQAPGKGLEWVSYISSGSSTIYYADSVKGRFTISRDNSKNTLYLQMTSLRAEDTAVYYCARRGLLLDYWGQGTTLTVSS(hVH2,SEQ ID NO:4),或者

EVQLQESGGGVVQPGGSLRLSCAASGFTFSNYGMHWIRQAPGKGLEWVSYISSGSSTIYYADSVKGRFTISRDNSKNTLYLQMNSLRSEDTAVYYCARRGLLLDYWGQGTLVTVSS(hVH3,SEQ ID NO:5)

EVQLVESGGGLVQPGGSLRLSCSASGFTFSNYGMHWVRQAPGKGLEYVSYISSGSSTIYYADTVKGRFTISRDNSKNTLYLQMSSLRAEDTAVYYCVKRGLLLDYWGQGTLVTVSS(hVH4,SEQ ID NO:6)

b.人源化3E10轻链可变区

在一些实施例中,人源化3E10轻链可变结构域包含

DIQMTQSPSSLSASVGDRVTITCRASKSVSTSSYSYLAWYQQKPEKAPKLLIKYASYLQSGVPSRFSGSGSGTDFTLTISSLQPEDFATYYCQHSREFPWTFGAGTKLELK(hVL1,SEQ ID NO:9),或者

DIQMTQSPSSLSASVGDRVTISCRASKSVSTSSYSYMHWYQQKPEKAPKLLIKYASYLQSGVPSRFSGSGSGTDFTLTISSLQPEDVATYYCQHSREFPWTFGAGTKLELK(hVL2,SEQ ID NO:10),或者

DIVLTQSPASLAVSPGQRATITCRASKSVSTSSYSYMHWYQQKPGQPPKLLIYYASYLESGVPARFSGSGSGTDFTLTINPVEANDTANYYCQHSREFPWTFGQGTKVEIK(hVL3,SEQ ID NO:11)

3.片段、变体和融合蛋白

抗DNA抗体可以由抗体片段或融合蛋白构成,该抗体片段或融合蛋白包含可变重链和/或可变轻链的氨基酸序列,该氨基酸序列与3E10或其人源化形式的重链和/或轻链(例如,SEQ ID NO:1-11中的任一个,或SEQ ID NO:12-14中的任一个的重链和/或轻链)的氨基酸序列至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少99%或100%相同。

抗DNA抗体可以由抗体片段或融合蛋白构成,该抗体片段或融合蛋白包含与3E10或其变体或人源化形式的一个或多个CDR(例如,SEQ ID NO:1-11、或SEQ ID NO:12-14或SEQ ID NO:15-30中的任一个的一个或多个CDR)的氨基酸序列至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%、至少99%或100%相同的一个或多个CDR。可以通过BLAST蛋白比较来测定两个氨基酸序列的同一性百分比。在一些实施例中,抗体包含上述优选的可变结构域的CDR中的一个、两个、三个、四个、五个或全部六个CDR。

优选地,抗体包含重链CDR1、CDR2和CDR3中的每一个中的一个与轻链CDR1、CDR2和CDR3中的每一个中的一个的组合。

上文提供了3E10的轻链可变序列的预测的互补决定区(CDR)。还参见GenBank:AAA65681.1-免疫球蛋白轻链,部分[小家鼠]以及GenBank:L34051.1-小鼠Ig重排κ链mRNAV区。上文提供了3E10的重链可变序列的预测的互补决定区(CDR)。参见例如Zack等人,《免疫学和细胞生物学》,72:513-520(1994),GenBank登录号AAA65679.1.Zach等人,《免疫学杂志》154(4),1987-1994(1995)以及GenBank:L16982.1-小鼠Ig重排H链基因,部分cds。

因此,在一些实施例中,细胞穿透抗体含有SEQ ID NO:1或2的CDR或整个重链和轻链可变区或SEQ ID NO:12或13的重链区;或与SEQ ID NO:7或8组合的其人源化形式或SEQID NO:14的轻链区;或其人源化形式。在一些实施例中,细胞穿透抗体含有与SEQ ID NO:9、10或11组合的SEQ ID NO:3、4、5或6的CDR或整个重链和轻链可变区。

还包含具有生物活性的抗体片段。无论是否与其它序列附接,片段都包含特定区或特异性氨基酸残基的插入、缺失、取代或其它选定的修饰,条件是片段的活性与未经过修饰的抗体或抗体片段相比未显著改变或受损。

还可以采用用于产生对本公开的抗原蛋白具有特异性的单链抗体的技术。用于产生单链抗体的方法是本领域技术人员熟知的。可以通过使用短肽接头将重链和轻链的可变结构域融合在一起来创建单链抗体,从而在单个分子上重构抗原结合位点。在未显著破坏抗原结合或结合特异性的情况下,已经开发出单链抗体可变片段(scFv),其中一个可变结构域的C端通过具有15到25个氨基酸的肽或接头与另一个可变结构域的N端栓连。选择接头以允许重链和轻链以其合适的构象朝向结合在一起。

可以修饰抗DNA抗体以改进其治疗潜力。例如,在一些实施例中,将细胞穿透抗DNA抗体与对靶细胞的细胞质和/或细胞核中的第二治疗性靶标具有特异性的另一种抗体缀合。例如,细胞穿透抗DNA抗体可以是含有3E10 Fv和特异性结合第二治疗性靶标的单克隆抗体的单链可变片段的融合蛋白。在其它实施例中,细胞穿透抗DNA抗体是双特异性抗体,该双特异性抗体具有来自3E10的第一重链和第一轻链以及来自特异性结合第二治疗性靶标的单克隆抗体的第二重链和第二轻链。

二价单链可变片段(二-scFv)可以通过连接两个scFv工程化。这可以通过产生具有两个VH区和两个VL区的单个肽链来完成,从而得到串联scFv。ScFv还可以设计为具有接头肽,这些接头肽对于这两个可变区来说短得无法折叠在一起(约五个氨基酸),从而迫使scFv二聚化。这种类型被称为双功能抗体。双功能抗体已被证明具有比相应scFv低高达40倍的解离常数,这意味着双功能抗体对其靶标具有更高的亲和力。仍更短的接头(一个或两个氨基酸)导致三聚体(三链抗体或三功能抗体)形成。四功能抗体也已经产生。其对靶标表现出的亲和力比双功能抗体高得多。在一些实施例中,抗DNA抗体可以含有3E10的两个或更多个连接的单链可变片段(例如,3E10二-scFv、3E10三-scFv)或其保守性变体。在一些实施例中,抗DNA抗体是双功能抗体或三功能抗体(例如,3E10双功能抗体、3E10三功能抗体)。在WO 2017/218825和WO 2016/033321中提供了3E10的单个和两个或更多个连接的单链可变片段的序列。

抗体的功能可以通过将抗体或其片段与治疗剂偶联来增强。抗体或片段与治疗剂的此类偶联可以通过制备免疫缀合物或通过制备融合蛋白或通过将抗体或片段与包括抗体或抗体片段和治疗剂的如DNA或RNA(例如,siRNA)等核酸连接来实现。

重组融合蛋白是通过融合基因的基因工程产生的蛋白。这通常涉及从编码第一蛋白的cDNA序列中去除终止密码子,然后通过连接或重叠延伸PCR使用相同读框附加第二蛋白的cDNA序列。然后DNA序列将被细胞表达为单个蛋白质。可以对蛋白质进行工程化,以使其包含两个原始蛋白质的完整序列或其中任一个的仅一部分。如果两个实体是蛋白质,则通常还会添加接头(或“间隔子”)肽,这使蛋白质更有可能独立折叠并如预期表现。

在一些实施例中,对细胞穿透抗体进行修饰以改变其半衰期。在一些实施例中,期望增加抗体的半衰期,使得抗体在循环中或治疗位点处存在更长时间段。例如,可以期望在循环中或待治疗位置处维持抗体的滴度延长的时间段。在其它实施例中,减小抗DNA抗体的半衰期以减少潜在的副作用。抗体片段(如3E10Fv)的半衰期可能比全尺寸抗体的半衰期短。改变半衰期的其它方法是已知的,并且可以在所描述的方法中使用。例如,抗体可以被工程化为具有延长半衰期的Fc变体,例如使用Xtend

a.接头

如本文所使用的,术语“接头”包含但不限于肽接头。肽接头可以是任何大小,只要其不干扰通过可变区与表位的结合即可。在一些实施例中,接头包含一个或多个甘氨酸和/或丝氨酸氨基酸残基。单价单链抗体可变片段(scFv),其中一个可变结构域的C端通常通过15到25个氨基酸肽或接头与另一个可变结构域的N端栓连。选择接头以允许重链和轻链以其合适的构象朝向结合在一起。如上所述,双功能抗体、三功能抗体等中的接头通常包含比单价scFv的接头短的接头。二价、三价和其它多价scFv通常包含三个或更多个接头。接头的长度和/或氨基酸组成可以相同或不同。因此,如本领域中已知的,可以基于scFv的期望化合价来测定接头的数量、一个或多个接头的组成和一个或多个接头的长度。一个或多个接头可以允许或驱动二价、三价和其它多价scFv的形成。

例如,接头可以包含4-8个氨基酸。在特定实施例中,接头包含氨基酸序列GQSSRSS(SEQ ID NO:31)。在另一个实施例中,接头包含15-20个氨基酸,例如18个氨基酸。在特定实施例中,接头包含氨基酸序列GQSSRSSSGGGSSGGGGS(SEQ ID NO:32)。其它柔性接头包含但不限于氨基酸序列Gly-Ser、Gly-Ser-Gly-Ser(SEQ ID NO:33)、Ala-Ser、Gly-Gly-Gly-Ser(SEQ ID NO:34)、(Gly

b.示例性抗DNA scFv序列

在WO 2016/033321和WO 2017/218825中公开并在下文提供了示例性鼠类3E10scFv序列,包含单-、二-和三-scFv。用于所公开的组合物和方法中的细胞穿透抗体包含示例性scFv和其片段和变体。

scFv 3E10(D31N)的氨基酸序列为:

AGIHDIVLTQSPASLAVSLGQRATISCRASKSVSTSSYSYMHWYQQKPGQPPKLLIKYASYLESGVPARFSGSGSGTDFTLNIHPVEEEDAATYYCQHSREFPWTFGGGTKLEIKRADAAPGGGGSGGGGSGGGGSEVQLVESGGGLVKPGGSRKLSCAASGFTFSNYGMHWVRQAPEKGLEWVAYISSGSSTIYYADTVKGRFTISRDNAKNTLFLQMTSLRSEDTAMYYCARRGLLLDYWGQGTTLTVSSLEQKLISEEDLNSAVDHHHHHH

(SEQ ID NO:38)。

·AGIH序列增加溶解度(SEQ ID NO:38的氨基酸1-4)

·Vk可变区(SEQ ID NO:38的氨基酸5-115)

·轻链CH1(SEQ ID NO:38的氨基酸116-121)的初始(6aa)

·(GGGGS)

·VH可变区(SEQ ID NO:38的氨基酸137-252)

·Myc标签(氨基酸253-268SEQ ID NO:38)

·His 6标签(SEQ ID NO:38的氨基酸269-274)

二-scFv 3E10(D31N)是双单链可变片段,该双单链可变片段包含3E10的2X重链和轻链可变区,并且其中重链的位置31处的天冬氨酸突变为天冬酰胺。二-scFv 3E10(D31N)的氨基酸序列为:

AGIHDIVLTQSPASLAVSLGQRATISCRASKSVSTSSYSYMHWYQQKPGQPPKLLIKYASYLESGVPARFSGSGSGTDFTLNIHPVEEEDAATYYCQHSREFPWTFGGGTKLEIKRADAAPGGGGSGGGGSGGGGSEVQLVESGGGLVKPGGSRKLSCAASGFTFSNYGMHWVRQAPEKGLEWVAYISSGSSTIYYADTVKGRFTISRDNAKNTLFLQMTSLRSEDTAMYYCARRGLLLDYWGQGTTLTVSSASTKGPSVFPLAPLESSGSDIVLTQSPASLAVSLGQRATISCRASKSVSTSSYSYMHWYQQKPGQPPKLLIKYASYLESGVPARFSGSGSGTDFTLNIHPVEEEDAATYYCQHSREFPWTFGGGTKLEIKRADAAPGGGGSGGGGSGGGGSEVQLVESGGGLVKPGGSRKLSCAASGFTFSNYGMHWVRQAPEKGLEWVAYISSGSSTIYYADTVKGRFTISRDNAKNTLFLQMTSLRSEDTAMYYCARRGLLLDYWGQGTTLTVSSLEQKLISEEDLNSAVDHHHHHH

(SEQ ID NO:39)。

·AGIH序列增加溶解度(SEQ ID NO:39的氨基酸1-4)

·Vk可变区(SEQ ID NO:39的氨基酸5-115)

·轻链CH1(SEQ ID NO:39的氨基酸116-121)的初始(6aa)

·(GGGGS)

·VH可变区(SEQ ID NO:39的氨基酸137-252)

·由人IgG CH1初始13个氨基酸组成的Fv片段之间的接头(SEQ ID NO:39的氨基酸253-265)

·旋转序列(SEQ ID NO:39的氨基酸266-271)

·Vk可变区(SEQ ID NO:39的氨基酸272-382)

·轻链CH1(SEQ ID NO:39的氨基酸383-388)的初始(6aa)

·(GGGGS)

·VH可变区(SEQ ID NO:39的氨基酸404-519)

·Myc标签(SEQ ID NO:39的氨基酸520-535)

·His 6标签(SEQ ID NO:39的氨基酸536-541)

三-scFv 3E10(D31N)是三单链可变片段,该三单链可变片段包含310E的3X重链和轻链可变区,并且其中重链的位置31处的天冬氨酸突变为天冬酰胺。三-scFv 3E10(D31N)的氨基酸序列为:

AGIHDIVLTQSPASLAVSLGQRATISCRASKSVSTSSYSYMHWYQQKPGQPPKLLIKYASYLESGVPARFSGSGSGTDFTLNIHPVEEEDAATYYCQHSREFPWTFGGGTKLEIKRADAAPGGGGSGGGGSGGGGSEVQLVESGGGLVKPGGSRKLSCAASGFTFSNYGMHWVRQAPEKGLEWVAYISSGSSTIYYADTVKGRFTISRDNAKNTLFLQMTSLRSEDTAMYYCARRGLLLDYWGQGTTLTVSSASTKGPSVFPLAPLESSGSDIVLTQSPASLAVSLGQRATISCRASKSVSTSSYSYMHWYQQKPGQPPKLLIKYASYLESGVPARFSGSGSGTDFTLNIHPVEEEDAATYYCQHSREFPWTFGGGTKLEIKRADAAPGGGGSGGGGSGGGGSEVQLVESGGGLVKPGGSRKLSCAASGFTFSNYGMHWVRQAPEKGLEWVAYISSGSSTIYYADTVKGRFTISRDNAKNTLFLQMTSLRSEDTAMYYCARRGLLLDYWGQGTTLTVSSASTKGPSVFPLAPLESSGSDIVLTQSPASLAVSLGQRATISCRASKSVSTSSYSYMHWYQQKPGQPPKLLIKYASYLESGVPARFSGSGSGTDFTLNIHPVEEEDAATYYCQHSREFPWTFGGGTKLEIKRADAAPGGGGSGGGGSGGGGSEVQLVESGGGLVKPGGSRKLSCAASGFTFSNYGMHWVRQAPEKGLEWVAYISSGSSTIYYADTVKGRFTISRDNAKNTLFLQMTSLRSEDTAMYYCARRGLLLDYWGQGTTLTVSSLEQKLISEEDLNSAVDHHHHHH

(SEQ ID NO:40)。

·AGIH序列增加溶解度(SEQ ID NO:40的氨基酸1-4)

·Vk可变区(SEQ ID NO:40的氨基酸5-115)

·轻链CH1(SEQ ID NO:40的氨基酸116-121)的初始(6aa)

·(GGGGS)

·VH可变区(SEQ ID NO:40的氨基酸137-252)

·由人IgG CH1初始13个氨基酸组成的Fv片段之间的接头(SEQ ID NO:40的氨基酸253-265)

·旋转序列(SEQ ID NO:40的氨基酸266-271)

·Vk可变区(SEQ ID NO:40的氨基酸272-382)

·轻链CH1(SEQ ID NO:40的氨基酸383-388)的初始(6aa)

·(GGGGS)

·VH可变区(SEQ ID NO:40的氨基酸404-519)

·由人IgG C

·旋转序列(SEQ ID NO:40的氨基酸533-538)

·Vk可变区(SEQ ID NO:40的氨基酸539-649)

·轻链CH1(SEQ ID NO:40的氨基酸650-655)的初始(6aa)

·(GGGGS)

·VH可变区(SEQ ID NO:40的氨基酸671-786)

·Myc标签(SEQ ID NO:40的氨基酸787-802)

·His 6标签(SEQ ID NO:40的氨基酸803-808)

WO 2016/033321和Noble等人,《癌症研究(Cancer Research)》,75(11):2285-2291(2015)示出与其单价对应物相比,二-scFv和三-scFv具有一些改善的和另外的活性。上文还提供了与示例性融合蛋白中的每个示例性融合蛋白的不同结构域相对应的子序列。本领域技术人员应当理解,示例性融合蛋白或其结构域可以用于构建上文更详细讨论的融合蛋白。例如,在一些实施例中,二-scFv包含第一scFv,该第一scFv包含Vk可变区(例如,SEQ ID NO:39的氨基酸5-115或其功能变体或片段),该Vk可变区与VH可变结构域(例如,SEQ ID NO:39的氨基酸137-252或其功能变体或片段)连接、与包含Vk可变区(例如,SEQ IDNO:39的氨基酸272-382或其功能变体或片段)的第二scFv连接、与VH可变结构域(例如,SEQID NO:39的氨基酸404-519或其功能变体或片段)连接。在一些实施例中,三-scFv包含与第三scFv结构域连接的二-scFv,该第三scFv结构域包含与VH可变结构域(例如,SEQ ID NO:40的氨基酸671-786或其功能变体或片段)连接的Vk可变区(例如,SEQ ID NO:40的氨基酸539-649或其功能变体或片段)。

Vk可变区可以单独地或与轻链CH1(SEQ ID NO:39的氨基酸116-121)的(6aa)组合通过例如接头(例如,(GGGGS)

因此,二-scFv可以包含SEQ ID NO:39的氨基酸5-519。三-scFv可以包含SEQ IDNO:40的氨基酸5-786。在一些实施例中,融合蛋白包含另外的结构域。例如,在一些实施例中,融合蛋白包含增强溶解度的序列(例如,SEQ ID NO:39的氨基酸1-4)。因此,在一些实施例中,二-scFv可以包含SEQ ID NO:39的氨基酸1-519。三-scFv可以包含SEQ ID NO:40的氨基酸1-786。在一些实施例中,融合蛋白包含增强融合蛋白的纯化、分离、捕获、鉴定、分离等的一个或多个结构域。示例性结构域包含例如Myc标签(例如,SEQ ID NO:39的氨基酸520-535)和/或His标签(SEQ ID NO:39的氨基酸536-541)。因此,在一些实施例中,二-scFv可以包含SEQ ID NO:39的氨基酸序列。三-scFv可以包含SEQ ID NO:40的氨基酸序列。上文更详细地讨论了其它可取代的结构域和另外的结构域。

在WO 2016/033324中讨论了示例性3E10人源化Fv序列:

DIVLTQSPASLAVSPGQRATITCRASKSVSTSSYSYMHWYQQKPGQPPKLLIYYASYLESGVPARFSGSGSGTDFTLTINPVEANDTANYYCQHSREFPWTFGQGTKVEIKGGGGSGGGGSGGGGSEVQLVESGGGLVQPGGSLRLSCSASGFTFSNYGMHWVRQAPGKGLEYVSYISSGSSTIYYADTVKGRFTISRDNSKNTLYLQMSSLRAEDTAVYYCVKRGLLLDYWGQGTLVTVSS(SEQ ID NO:41)。

B.供体寡核苷酸

提供了用于组合物和方法中的供体寡核苷酸。在一些实施例中,组合物包含供体寡核苷酸或与供体寡核苷酸组合施用。供体寡核苷酸可以或可以不与增强剂共价连接。例如,供体寡核苷酸可以与细胞穿透抗体形成非共价复合物。

供体寡核苷酸策略包含但不限于小片段同源替换(例如,多核苷酸小DNA片段(SDF))和单链寡脱氧核苷酸介导的基因修饰(例如,ssODN/SSO)。

通常,在基因疗法的情况下,供体寡核苷酸包含可以校正宿主基因组中的一种或多种突变的序列,即使在一些实施例中,供体引入了可以例如降低促进HIV感染的癌基因或受体的表达的突变。除了含有被设计成引入所期望的校正或突变的序列之外,供体寡核苷酸还可以含有同义(沉默)突变(例如,7到10)。另外的沉默突变可以促进使用从经处理的细胞分离的基因组DNA的等位基因特异性PCR检测所校正的靶序列。

供体寡核苷酸可以以单链(ss)或双链(ds)形式存在(例如,ssDNA、dsDNA)。因此,寡核苷酸(例如,DNA或RNA或其组合)可以是单链或双链的。优选地,该寡核苷酸是单链DNA。

供体寡核苷酸可以具有任何长度。例如,供体寡核苷酸的大小可以介于1个到800个核苷酸之间。在一个实施例中,供体寡核苷酸介于25个与200个核苷酸之间。在一些实施例中,供体寡核苷酸介于100个与150个核苷酸之间。在另外的实施例中,供体核苷酸的长度为约40个到80个核苷酸。供体寡核苷酸的长度可以为约60个核苷酸。长度为25-200的ssDNA是活性的。大多数研究涉及长度为60-70的ssDNA。长度为70-150的更长的供体寡核苷酸也可以起作用。优选的长度为60。

与靶向重组的区的序列相比,供体序列可以含有一种或多种核酸序列改变,例如一种或多种核苷酸的取代、缺失或插入。供体序列的成功重组导致靶区的序列发生变化。供体寡核苷酸在本文中也被称为供体片段、供体核酸、供体DNA或供体DNA片段。应当理解,在本领域中,在供体片段内的更多数量的同源位置将增加供体片段将重组到靶序列、靶区或靶位点中的概率。

供体寡核苷酸可以含有相对于靶DNA序列的至少一个突变的、插入的或缺失的核苷酸。靶序列可以处于基因的编码DNA序列内或内含子内。靶序列也可以处于调节靶基因表达的DNA序列(包含启动子或增强子序列或调节RNA剪接的序列)内。

供体寡核苷酸可以含有相对于靶序列的各种突变。代表性突变类型包含但不限于点突变、缺失和插入。缺失和插入可能导致移码突变或缺失。点突变可能引起错义或无义突变。这些突变可能破坏、降低、停止、增加、改善或以其它方式改变靶基因的表达。

供体寡核苷酸可以对应于基因(或其一部分)的野生型序列,例如涉及疾病或病症(例如,血友病、肌营养不良、球蛋白病、囊性纤维化、着色性干皮病、溶酶体贮积病)的突变基因。示例性基因包含对凝血因子VIII、凝血因子IX、肌营养不良蛋白、β-珠蛋白、CFTR、XPC、XPD和DNA聚合酶η进行编码的基因。

组合物可以包含一种或多种(例如,1、2、3、4、5、6、7、8、9、10或更多种)不同的供体寡核苷酸序列。多于一种供体寡核苷酸的用途可以是可用的,例如用于产生杂合靶基因,其中两种等位基因含有不同的修饰。

供体寡核苷酸优选地是DNA寡核苷酸,这些DNA寡核苷酸由作为杂环基的主要天然存在的核苷酸(尿嘧啶、胸腺嘧啶、胞嘧啶、腺嘌呤和鸟嘌呤)、作为糖部分的脱氧核糖和磷酸酯键构成。供体寡核苷酸可以包含对核碱基、糖部分或主链/键的修饰,这取决于重组位点处的替换序列的期望的结构,或通过核酸酶提供一些对降解的抗性。例如,ssDNA寡核苷酸(5'和3'末端两者)的每个末端处的端三个核苷间键可以用硫代磷酸酯键替换代替通常磷酸二酯键,由此提供对核酸外切酶的增加的抗性。对供体寡核苷酸的修饰不应阻止供体寡核苷酸在重组靶序列上成功重组。

1.供体寡核苷酸设计

将包含要插入的供体序列的多核苷酸提供给要编辑的细胞。“供体序列”、“供体多核苷酸”或“供体寡核苷酸”意指要插入靶位点处的核酸序列。供体多核苷酸通常含有与靶位点处的基因组序列的足够同源性,例如与靶位点处的核苷酸序列具有70%、80%、85%、90%、95%或100%同源性,以支持其与和其具有同源性的基因组序列之间的同源性定向修复。

供体序列可以或可以不与其替换的基因组序列相同。供体序列可以对应于靶序列(例如,基因)的野生型序列(或其一部分)。供体序列可以含有相对于基因组序列的至少一个或多个单碱基改变、插入、缺失、倒置或重排,只要存在足够的同源性以支持同源性定向修复即可。在一些实施例中,供体序列包含由两个同源区侧接的非同源序列,使得靶DNA区与两个侧接序列之间的同源定向修复导致非同源序列在靶区处的插入。

供体寡核苷酸被认为仅与其具有同源性的染色体中的位点进行重组。不使用外源性核酸酶,因此据信涉及内源性DNA修复和/或复制因子以支持将供体DNA同源定向重组到其靶位点中。据信3E10通过将DNA修复和重组途径的平衡从RAD51介导的一种转变为RAD52介导的一种来促进重组。

当基因组编辑组合物包含供体多核苷酸序列时,该供体多核苷酸序列至少包含与靶DNA序列具有同源性的区段,这些方法可以用于将核酸材料特异性地定位添加(即插入或替换)到靶DNA序列(例如,以“敲入”允许蛋白质、siRNA、miRNA等的表达的核酸),添加标签(例如,6xHis、荧光蛋白(例如,绿色荧光蛋白;黄色荧光蛋白等)、血凝素(HA)、FLAG等),将调节序列添加到基因(例如,启动子、聚腺苷酸化信号、内部核糖体进入序列(IRES)、2A肽、起始密码子、终止密码子、剪接信号、定位信号等)或修饰核酸序列(例如,引入突变)。

2.寡核苷酸组合物

供体寡核苷酸或其它核酸中的任何一种可以包含对核碱基或键的一种或多种修饰或取代。修饰不应阻止并且优选地增强基因编辑的活性、持久性或功能。例如,对寡核苷酸的修饰不应阻止并且优选地增强双链体侵入和/或链置换。经修饰的碱基和碱基类似物、经修饰的糖和糖类似物和/或本领域已知的各种合适的键也适用于本文中的分子中。

a.杂环碱基

天然存在的主要核苷酸包含作为杂环碱基的尿嘧啶、胸腺嘧啶、胞嘧啶、腺嘌呤和鸟嘌呤。基因编辑分子可以包含对其核苷酸成分的化学修饰。例如,具有相邻胞嘧啶的靶序列可能是有问题的。核苷酸的化学修饰可以用于增加生理条件下的结合亲和力和/或稳定性。

杂环碱基或杂环碱基类似物的化学修饰可以有效地增加核苷酸的结合亲和力或其在复合物(例如,双链体或三链体)中的稳定性。化学修饰的杂环碱基包含但不限于肌苷、5-(1-丙炔基)尿嘧啶(pU)、5-(1-丙炔基)胞嘧啶(pC)、5-甲基胞嘧啶、8-氧代-腺嘌呤、假胞嘧啶、假异胞嘧啶、5和2-氨基-5-(2'-脱氧-β-D-呋喃核糖基)吡啶(2-氨基吡啶)以及各种吡咯并-和吡唑并嘧啶衍生物。

b.主链

寡核苷酸的核苷酸亚基可以含有某些修饰。例如,寡核苷酸的磷酸主链可以通过重复N-(2-氨基乙基)-甘氨酸单元而被整体替换,和/或磷酸二酯键可以被肽键或硫代磷酸酯键部分或完全替换。杂环碱基可以通过亚甲基羰基键与主链连接,这允许其通过沃森-克里克碱基配对(Watson-Crick base pairing)以高亲和力和序列特异性与DNA形成双链体。

其它主链修饰包含肽和氨基酸变型和修饰。供体寡核苷酸的主链成分可以是肽键,或者可替代地其可以是非肽键。实例包含乙酰基帽、如8-氨基-3,6-二氧杂辛酸等氨基间隔区(在本文中被称为O-接头),如果正电荷是寡核苷酸等中所期望,则如赖氨酸等氨基酸是特别有用的。

寡核苷酸的主链修饰不应阻止分子以高特异性与DNA靶位点结合并介导信息转移。

c.经修饰的核酸

寡核苷酸由彼此连接的核苷酸链构成。典型的核苷酸通常包含杂环碱基(核酸碱基)、与杂环碱基连接的糖部分和使糖部分的羟基官能团酯化的磷酸部分。主要的天然存在的主要核苷酸包含作为杂环碱基的尿嘧啶、胸腺嘧啶、胞嘧啶、腺嘌呤和鸟嘌呤以及由磷酸二酯键连接的核酸糖或脱氧核糖。如本文所使用的,“经修饰的核苷酸”或“经化学修饰的核苷酸”限定了化学修饰杂环碱基、糖部分或磷酸部分成分中的一个或多个的核苷酸。与相同核碱基序列的DNA或RNA寡核苷酸相比,经修饰的核苷酸的电荷可能降低。寡核苷酸可以具有低的负电荷、无电荷或正电荷,使得与具有对应核碱基序列的DNA或RNA寡核苷酸相比,在靶位点处具有核苷酸双链体的静电排斥减少。

具有降低的电荷的经修饰的核苷酸的实例包含经修饰的核苷酸间键,如具有非手性和不带电荷的亚基间键的磷酸类似物(例如,Sterchak,E.P.等人,《有机化学(OrganicChem.)》,52:4202,(1987)),以及具有非手性亚基间键的不带电荷的基于吗啉代的聚合物(参见例如美国专利第5,034,506号)。一些核苷酸间键联类似物包含吗啉代、乙缩醛和聚酰胺键联的杂环。锁核酸(LNA)是经修饰的RNA核苷酸(参见例如,Braasch等人,《化学与生物学(Chem.Biol.)》,8(1):1-7(2001))。LNA与DNA形成杂交体,这些杂交体比DNA/DNA杂交体更稳定。因此,LNA可以使用。在一些实施例中,可以通过向其添加正电荷来提高LNA结合效率。商业核酸合成仪和标准亚磷酰胺化学反应可以用于制备LNA。

分子还可以包含具有经修饰的杂环碱基、糖部分或糖部分类似物的核苷酸。经修饰的核苷酸可以包含如上所述的经修饰的杂环碱基或碱基类似物。糖部分修饰包含但不限于2'-O-氨基乙氧基、2'-O-氨基乙基(2'-OAE)、2'-O-甲氧基、2'-O-甲基、2-胍基乙基(2'-OGE)、2'-O、4'-C-亚甲基(LNA)、2'-O-(甲氧基乙基)(2'-OME)和2'-O-(N-(甲基)乙酰胺基)(2'-OMA)。

在一些实施例中,供体寡核苷酸包含1个、2个、3个、4个、5个、6个或更多个任选的硫代磷酸酯核苷间键。在一些实施例中,供体包含供体寡核苷酸中的前2个、3个、4个或5个核苷酸和/或后2个、3个、4个或5个核苷酸之间的硫代磷酸酯核苷间键。

C.药物组合物

细胞穿透抗DNA抗体和供体寡核苷酸组合物可以与药学上可接受的载体组合治疗性地使用。

组合物优选地与合适的药物载体组合用于治疗性用途。此类组合物包含有效量的组合物以及药学上可接受的载体或赋形剂。

本领域普通技术人员应当理解,体内施用的核苷酸被摄取并分布到细胞和组织中(Huang等人,《FEBS快报(FEBS Lett.)》,558(1-3):69-73(2004))。例如,Nyce等人已示出,吸入时反义寡脱氧核苷酸(ODN)与内源性表面活性剂(由肺细胞产生的脂质)结合,并且被肺细胞摄取,而无需另外的载体脂质(Nyce等人,《自然》,385:721-725(1997))。小核酸很容易被摄取到T24膀胱癌组织培养细胞中(Ma等人,《反义核酸药物开发(Antisense NucleicAcid Drug Dev.)》,8:415-426(1998))。

包含增强剂(如细胞穿透抗体)和供体寡核苷酸的组合物可以在调配物中用于在合适的药物载体中局部、局部性地或全身地施用。E.W.Martin的《雷明顿药物科学(Remington's Pharmaceutical Sciences)》,第15版(马克出版公司(Mark PublishingCompany),1975)公开了典型的载体和制备方法。化合物也可以被包封在由可生物降解或不可生物降解的聚合物或蛋白质或脂质体形成的合适的生物相容性颗粒中,以靶向细胞。此类系统对于本领域技术人员是众所周知的,并且可以被优化以与适当的核酸一起使用。在一些实施例中,供体寡核苷酸被包封在纳米颗粒中。

在例如Sambrook等人,《分子克隆:实验室手册(Molecular Cloning:ALaboratory Manual)》,冷泉港实验室(Cold Spring Harbor Laboratory),纽约(1989);以及Ausubel等人,《当代分子生物学实验指南(Current Protocols in MolecularBiology)》,约翰·威利父子出版公司(Wiley&Sons),纽约(1994)中描述了用于核酸递送的各种方法。此类核酸递送系统通过实例的方式并且不是通过限制的方式包含以“裸”形式作为“裸”核酸、或在适合于递送的媒剂中调配(如与阳离子分子或脂质体形成脂质复合)、或作为载体的组分或药物组合物的组分的期望的核酸。核酸递送系统可以直接提供给细胞(如通过使其与细胞接触)或间接提供给细胞(如通过任何生物过程的作用)。可以通过内吞作用、受体靶向、与天然或合成细胞膜片段偶联、物理手段(如电穿孔)、将核酸递送系统与聚合物载体(如控释膜或纳米颗粒或微颗粒)进行组合、使用载体、将核酸递送系统注射到细胞周围的组织或流体中、核酸递送系统跨细胞膜的简单扩散或通过任何主动或被动转运机制跨细胞膜的扩散来将核酸递送系统提供给细胞。另外地,可以使用如抗体相关靶向和抗体介导的病毒载体固定等技术将核酸递送系统提供给细胞。

注射用调配物可以以单位剂型存在,例如在安瓿或在多剂量容器中,任选地添加有防腐剂。组合物可以采取如无菌水溶液或非水溶液、悬浮液和乳液等形式,在某些实施例中,这些组合物可以与受试者的血液等渗。非水溶剂的实例是聚丙二醇;聚乙二醇;植物油,如橄榄油、芝麻油、椰子油、花生油、落花生油、矿物油;可注射的有机酯,如油酸乙酯;或固定油,包含合成的甘油单酯或甘油二酯。水性载体包含水、醇溶液/水溶液、乳液或悬浮液,包含盐水和缓冲介质。肠胃外媒剂包含氯化钠溶液、1,3-丁二醇、林格氏右旋糖(Ringer'sdextrose)、右旋糖和氯化钠、乳酸林格氏油或固定油。静脉内媒剂包含流体和营养补充剂以及电解质补充剂,如基于林格氏右旋糖的那些。这些材料可以在溶液、乳液或悬浮液中(例如,并入颗粒、脂质体或细胞中)。通常,在调配物中使用适当量的药学上可接受的盐以使调配物是等渗的。通常1-5%的量的海藻糖可以被添加到药物组合物中。溶液的pH优选地为约5到约8,并且更优选地约7到约7.5。

药物组合物可以包含载体、增稠剂、稀释剂、缓冲剂、防腐剂和表面活性剂。可以在《雷明顿药物科学》,麦克出版公司,宾夕法尼亚州伊斯顿中找到载体调配物。本领域技术人员可以容易地测定用于制备和调配组合物的各种参数,而无需过度实验。

单独地或与其它合适的组分组合的组合物(细胞穿透抗体和供体寡核苷酸)也可以制成气溶胶调配物(即,这些组合物可以被“雾化”)以通过吸入施用。气溶胶调配物可以放置到加压的可接受的推进剂(如二氯二氟甲烷、丙烷、氮气和空气)中。为了通过吸入进行施用,使用合适的推进剂,从加压包或喷雾器以气溶胶喷雾呈现的形式递送化合物。

在一些实施例中,组合物(细胞穿透抗体和供体寡核苷酸)包含具有调配物成分(如盐、载体、缓冲剂、乳化剂、稀释剂、赋形剂、螯合剂、防腐剂、增溶剂或稳定剂)的药学上可接受的载体。供体寡核苷酸可以与具有C32官能度的亲脂性基团(如胆固醇以及月桂酸和石胆酸衍生物)缀合,以改善细胞摄取。例如,已证明胆固醇可在体内(Lorenz等人,《生物有机化学与医药化学快报(Bioorg.Med.Chem.Lett.)》,14(19):4975-4977(2004))和体外(Soutschek等人,《自然》,432(7014):173-178(2004))增强siRNA的摄取和血清稳定性。另外,已经示出类固醇缀合的寡核苷酸与血流中的不同脂蛋白(如LDL)的结合保护完整性并促进生物分布(Rump等人,《生物化学药理学(Biochem.Pharmacol.)》,59(11):1407-1416(2000))。可以与上述化合物连接或缀合以增加细胞摄取的其它基团包含:吖啶衍生物;交联剂,如补骨脂素衍生物、叠氮苯甲酰甲基、原黄素和叠氮基原黄素;人工核酸内切酶;金属络合物,如EDTA-Fe(II)和卟啉-Fe(II);烷基化部分;核酸酶,如碱性磷酸酶;末端转移酶;抗体酶;胆甾醇基部分;亲脂性载体;肽缀合物;长链醇;磷酸酯;放射性标志物;非放射性标志物;碳水化合物;以及聚赖氨酸或其它多胺。授予Levy等人的美国专利第6,919,208号还描述了用于增强型递送的方法。这些药物调配物可以以本身已知的方式进行制备,例如借助于常规混合、溶解、制粒、研磨、乳化、包封、包埋或冻干方法。

另外的载体包含持续释放制剂,如含有抗体的固体疏水性聚合物的半透性基质,这些基质呈成形颗粒形式,例如膜、脂质体或微颗粒。植入包含插入可植入的药物递送系统,例如微球体、水凝胶、聚合物储库、胆固醇基质、聚合物系统,例如基质侵蚀和/或扩散系统和非聚合物系统。吸入包含在吸入器中单独地或与可以吸收的载体附接的气溶胶一起施用组合物(细胞穿透抗体和供体寡核苷酸)。对于全身施用,可以优选的是将组合物包封在脂质体中。

可以使用侵入性装置(如血管或导尿管)并且使用介入装置(如具有药物传递能力并被配置为扩张装置或支架移植物的支架)以实现组织特异性摄取药剂和/或核苷酸递送系统的方式递送组合物。

可以使用可生物蚀解的植入物通过扩散或通过聚合物基质的降解来递送调配物(含有细胞穿透抗体和供体寡核苷酸)。在某些实施例中,调配物的施用可以被设计成在某个时间段(例如,数小时、数天、数周、数月或数年)内连续暴露组合物。这可以通过例如重复施用调配物或通过持续或控制释放递送系统来完成,在该系统中,在不重复施用的情况下在延长的时间段内递送组合物。

其它合适的递送系统包含时间释放、延迟释放、持续释放或控释递送系统。在许多情况下,此类系统可以避免重复施用,从而增加对受试者和医生的便利性。许多类型的释放递送系统对本领域普通技术人员来说是可用且已知的。这些系统包含例如基于聚合物的系统,如聚乳酸和/或聚乙醇酸、聚酸酐、聚己内酯、共聚草酸、聚酯酰胺、聚原酸酯、聚羟基丁酸和/或这些的组合。例如美国专利第5,075,109号中描述了前述含有核酸的聚合物的微胶囊。其它实例包含:基于脂质的非聚合物系统,该脂质包含固醇(如胆固醇、胆固醇酯和脂肪酸)或中性脂肪(如甘油单酯、甘油二酯和甘油三酯);水凝胶释放系统;基于脂质体的系统;基于磷脂的系统;硅橡胶系统;基于肽的系统;蜡涂层;使用常规粘合剂和赋形剂的压制片剂;或部分融合的植入物。调配物可以是例如微球体、水凝胶、聚合物储库、胆固醇基质或聚合物系统。在一些实施例中,系统可以例如通过控制含有细胞穿透抗体和/或供体寡核苷酸的调配物的扩散或侵蚀/降解速率来允许组合物持续或受控释放。

可以调配一种或多种活性剂(细胞穿透抗体和供体寡核苷酸)和其组合物以供肺或粘膜施用。施用可以包含将组合物递送到肺、鼻、口腔(舌下、颊)、阴道或直肠粘膜。如本文所使用的,术语“气溶胶”是指颗粒细水雾的任何制剂,该制剂可以呈溶液或悬浮液,不论其是否使用推进剂来生产。可以使用标准技术(如超声处理或高压处理)生产气溶胶。

为了通过上呼吸道施用,可以将调配物调配成溶液(例如,水或等渗盐水)、缓冲的或非缓冲的或作为悬浮液,以便以滴剂或喷雾剂的形式鼻内施用。优选地,此类溶液或悬浮液相对于鼻分泌物是等渗的并且具有约相同的pH,例如在约pH 4.0到约pH 7.4或pH 6.0到pH 7.0的范围内。缓冲液应该是生理相容的,并且仅通过实例的方式包含磷酸盐缓冲液。

可以使用纳米颗粒递送媒剂将如细胞穿透抗体等增强剂和供体寡核苷酸递送到靶细胞。在一些实施例中,组合物中的一些组合物包装在纳米颗粒中,而另一些则没有。例如,在一些实施例中,将供体寡核苷酸并入到纳米颗粒中,而没有将细胞穿透抗体并入到纳米颗粒中。纳米颗粒通常是指在介于500nm到小于0.5nm之间的范围内,优选地直径介于50与500nm之间,更优选地直径介于50与300nm之间的颗粒。聚合物颗粒的细胞内化高度取决于其大小,其中纳米微粒聚合物颗粒被细胞内化的效率比微微粒聚合物颗粒高得多。例如,Desai等人已证明,与直径为1μM的微颗粒相比,被培养的Caco-2细胞摄取的直径为100nm的纳米颗粒约多于2.5倍(Desai等人,《药学研究(Pharm.Res.)》,14:1568-73(1997))。纳米颗粒还具有在体内更深地扩散到组织中的更大能力。

优选的可生物降解的聚合物的实例包含通过水解降解的合成聚合物(如多(羟基酸),如乳酸和乙醇酸的聚合物和共聚物)、其它可降解的聚酯、聚酸酐、聚(原)酯、聚酯、聚氨酯、聚(丁酸)、聚(戊酸)、聚(己内酯)、聚(羟基链烷酸酯)、聚(丙交酯-共-己内酯)和聚(胺-共-酯)聚合物,如Zhou等人,《自然材料(Nature Materials)》,11:82-90(2012)和WO2013/082529、美国公开申请第2014/0342003号以及PCT/US2015/061375中描述的那些。

核酸可以与聚阳离子复合以增加核酸到纳米颗粒中的包封效率。术语“聚阳离子”是指在所选pH,优选地生理pH下具有正电荷,优选地至少2个正电荷的化合物。在所选pH值下,聚阳离子部分具有约2个到约15个正电荷,优选地约2个到约12个正电荷,并且更优选地约2个到约8个正电荷。

许多聚阳离子是本领域已知的。聚阳离子的合适成分包含碱性氨基酸和其衍生物,如精氨酸、天冬酰胺、谷氨酰胺、赖氨酸和组氨酸;阳离子树状物;以及氨基多糖。合适的聚阳离子可以是直链的,如在结构上是支链的或树枝状的直链四赖氨酸。

示例性聚阳离子包含但不限于基于以下的合成聚阳离子:丙烯酰胺和2-丙烯酰胺基-2-甲基丙烷三甲胺、聚(N-乙基-4-乙烯基吡啶)或类似的季铵化聚吡啶、二乙基氨基乙基聚合物和右旋糖酐缀合物、硫酸多粘菌素B、脂多胺、聚(烯丙胺),如强聚阳离子聚(二甲基二烯丙基氯化铵)、聚乙烯亚胺、聚乙烯和多肽,如鱼精蛋白、组蛋白多肽、聚赖氨酸、聚精氨酸和聚鸟氨酸。合适的天然存在的多胺包含但不限于精胺、亚精胺、尸胺和腐胺。在一些实施例中,颗粒本身是聚阳离子(例如,PLGA和聚(β氨基酯)的共混物)。

功能性分子可以与用于递送的载体缔合、连接、缀合或以其它方式直接或间接地附接。靶向部分可以与供体寡核苷酸或其纳米颗粒或其它递送媒剂缔合、连接、缀合或以其它方式直接或间接地附接。靶向分子可以是与靶向细胞的表面上的受体或其它分子结合的蛋白质、肽、核酸分子、糖或多糖。可以通过选择靶向分子来调节与移植物结合的特异性程度和亲合力。

部分的实例包含例如靶向部分,这些靶向部分提供分子到特异性细胞的递送,例如针对造血干细胞、CD34

附接到聚合物微颗粒和纳米颗粒的其它有用的配体包含病原体相关分子模式(PAMP)。PAMP靶向细胞或组织的表面上的Toll样受体(TLR),或在内部向细胞或组织发出信号,由此潜在地增加摄取。与颗粒表面缀合或共包封的PAMP可以包含:未甲基化的CpG DNA(细菌)、双链RNA(病毒)、脂多糖(细菌)、肽聚糖(细菌)、脂阿拉伯甘露聚糖(细菌)、酵母聚糖(酵母)、支原体脂蛋白如MALP-2(细菌)、鞭毛蛋白(细菌)、聚(肌苷-胞苷)酸(细菌)、脂磷壁酸(细菌)或咪唑并喹啉(合成的)。

在另一个实施例中,颗粒的外表面可以使用甘露糖胺处理,由此使颗粒的外表面甘露糖基化。此处理可能使颗粒在抗原呈递细胞表面上的甘露糖受体处与靶细胞或组织结合。可替代地,与含有Fc部分(靶向Fc受体)、热休克蛋白部分(HSP受体)、磷脂酰丝氨酸(清除剂受体)和脂多糖(LPS)的免疫球蛋白分子的表面缀合是细胞或组织上的另外的受体靶标。

凝集素可以共价附接到微颗粒和纳米颗粒以使其对粘蛋白和粘膜细胞层具有靶特异性。

靶向部分的选择将取决于纳米颗粒组合物和要靶向的细胞或组织的施用方法。靶向分子通常可以增加颗粒对细胞或组织的结合亲和力,或者可以将纳米颗粒靶向到器官中的特定组织或组织中的特定细胞类型。粘蛋白的天然组分中的任何天然组分以纯或部分纯化的形式共价附接到颗粒将降低珠-肠界面的表面张力,并且增加珠在粘蛋白层中的溶解度。含有额外的侧羧酸侧基的聚氨基酸(例如,聚天冬氨酸和聚谷氨酸)的附接增加了生物粘附性。使用分子量范围为15,000到50,000kDa的聚氨基酸产生附接到颗粒表面的120到425个氨基酸残基的链。聚氨基链通过粘蛋白链中的链缠结以及增加的羧基电荷来提高生物粘附力。

III.方法

修饰细胞的基因组的方法包含使该细胞与有效量的(i)细胞穿透抗体以及(ii)含有可以校正细胞的基因组中的突变的序列的供体寡核苷酸接触。与在不存在(i)的情况下与(ii)接触时相比,当细胞与(i)和(ii)两者接触时,基因组修饰可以以较高频率发生。优选地,该方法不涉及使该细胞与核酸酶(例如,ZFN、Cas9)或肽核酸(PNA)接触。这些方法可以用于进行体外、离体或体内基因编辑。

增强剂和供体寡核苷酸可以以相同或不同的混合物一起与细胞接触,或者增强剂和供体寡核苷酸可以单独地与细胞接触。例如,细胞可以首先与增强剂接触,然后与供体寡核苷酸接触。可替代地,细胞可以首先与供体寡核苷酸接触,然后与增强剂接触。在一些实施例中,供体寡核苷酸和增强剂在溶液中混合并且同时与细胞接触。在优选的实施例中,将供体DNA与增强剂在溶液中混合,并且将该组合添加到培养的细胞中或注射到要治疗的动物中。

增强剂和/或供体寡核苷酸的有效量或治疗有效量可以是足以治疗、抑制或减轻疾病或病症的一种或多种症状或以其它方式提供期望的药理学和/或生理学效应,例如,降低、抑制或逆转作为疾病或病症的原因的病理生理学机制中的一种或多种病理生理学机制的剂量。

有效量也可以是相对于在不存在增强剂的情况下施用供体片段而言有效增加供体片段的重组速率的量。对增强剂和/或供体寡核苷酸进行调配以适应施用模式。药学上可接受的载体部分地由所施用的特定组合物以及通过用于施用组合物的特定方法来测定。因此,存在多种含有增强剂和/或供体寡核苷酸的药物组合物的合适调配物。精确剂量将根据各种因素而变化,如受试者依赖性变量(例如,年龄、免疫系统健康状况、临床症状等)。

可以每天一次、两次或三次;每周一次、两次、三次、四次、五次、六次、七次;每月一次、两次、三次、四次、五次、六次、七次或八次施用增强剂和供体寡核苷酸或以其它方式使其与靶细胞接触。例如,在一些实施例中,每两天或三天或每周平均约2到约4次施用增强剂和供体寡核苷酸。

增强剂和供体寡核苷酸可以或可以不同时施用。在一些实施例中,在供体寡核苷酸之前使增强剂与细胞接触。在将供体寡核苷酸施用于受试者之前例如1小时、2小时、3小时、4小时、5小时、6小时、8小时、10小时、12小时、18小时或24小时或1天、2天、3天、4天、5天、6天或7天或其任何组合,可以将增强剂施用于受试者。

在优选的实施例中,以有效诱导至少一个靶等位基因在至少0.01、0.02、0.03、0.04、0.05、0.06、0.07、0.08、0.09、0.1、0.2、0.3、0.4、0.5、0.6、0.7、0.8、0.9、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24或25%的靶细胞的频率下发生基因修饰的量施用增强剂和供体寡核苷酸。在一些实施例中,特别是离体应用,基因修饰在至少一个靶等位基因中在约0.1-25%、或0.5-25%、或1-25%、2-25%、或3-25%、或4-25%、或5-25%、或6-25%、或7-25%、或8-25%、或9-25%、或10-25%、11-25%、或12-25%、或13%-25%、或14%-25%、或15-25%、或2-20%、或3-20%、或4-20%、或5-20%、或6-20%、或7-20%、或8-20%、或9-20%、或10-20%、11-20%、或12-20%、或13%-20%、或14%-20%、或15-20%、2-15%、或3-15%、或4-15%、或5-15%、或6-15%、或7-15%、或8-15%、或9-15%、或10-15%、11-15%、或12-15%、或13%-15%或14%-15%的频率下发生。

在一些实施例中,特别是体内应用,基因修饰在至少一个靶等位基因中在约0.1%到约15%、或约0.2%到约15%、或约0.3%到约15%、或约0.4%到约15%、或约0.5%到约15%、或约0.6%到约15%、或约0.7%到约15%、或约0.8%到约15%、或约0.9%到约15%、或约1.0%到约15%、或约1.1%到约15%、或约1.1%到约15%、1.2%到约15%、或约1.3%到约15%、或约1.4%到约15%、或约1.5%到约15%、或约1.6%到约15%、或约1.7%到约15%、或约1.8%到约15%、或约1.9%到约15%、或约2.0%到约15%、或约2.5%到约15%、或约3.0%到约15%、或约3.5%到约15%、或约4.0%到约15%、或约4.5%到约15%、或约5.0%到约15%、或约1%到约15%、或约1.5%到约15%、约2.0%到约15%、或约2.5%到约15%、或约3.0%到约15%、或约3.5%到约15%、或约4.0%到约15%、或约4.5%到约15%的频率下发生。

在一些实施例中,基因修饰以低脱靶效应发生。在一些实施例中,使用常规分析(如但不限于实例中所述的那些)无法检测到脱靶修饰。在一些实施例中,脱靶事件在0-1%、或0-0.1%、或0-0.01%、或0-0.001%、或0-0.0001%、或0-0000.1%或0-0.000001%频率下发生。在一些实施例中,脱靶修饰发生的频率比在靶位点处发生的频率低约10

A.离体基因疗法

在一些实施例中,细胞的离体基因疗法用于治疗受试者的基因病症。对于离体基因疗法,从受试者中分离细胞,并使细胞与组合物(增强剂和供体寡核苷酸)离体接触,以产生含有基因中的改变的序列或邻近基因的改变的序列的细胞。在优选的实施例中,从要治疗的受试者或同基因宿主中分离细胞。在与增强剂和供体寡核苷酸接触之前,从受试者中去除靶细胞。细胞可以是造血祖细胞或干细胞。在优选的实施例中,靶细胞是CD34

可以由本领域技术人员分离和富集干细胞。用于CD34

在人类中,在通过以足以使造血干细胞从骨髓空间移动到周围循环中的量向供体皮下或静脉内注射造血生长因子(如粒细胞集落刺激因子(G-CSF)、粒细胞-单核细胞集落刺激因子(GM-CSF)、干细胞因子(SCF))引起的细胞因子动员后,从脐带血、骨髓或血液中回收CD34

可以通过正负选择技术来选择细胞。使用本领域技术人员已知的方法,可以使用与造血祖细胞或干细胞表面抗原(例如,CD34)结合的可商购获得的抗体来选择细胞。例如,可以将抗体与磁珠缀合,并利用免疫原性程序来回收期望的细胞类型。其它技术涉及使用荧光激活细胞分选(FACS)。在非白血病个体的造血系统内的祖细胞中发现的CD34抗原在单克隆抗体My-10识别的细胞群体上表达(即,表达CD34抗原),并且可以用于分离用于骨髓移植的干细胞。存入美国典型培养物保藏中心(马里兰州罗克维尔)作为HB-8483的My-10可作为抗HPCA 1商购获得。另外地,可以利用来自人骨髓的分化的且“专用的”细胞的阴性选择来针对基本上任何期望的细胞标志物进行选择。例如,祖细胞或干细胞,最优选地CD34

一旦分离出祖细胞或干细胞,就可以通过在任何合适的培养基中生长来繁殖这些细胞。例如,祖细胞或干细胞可以在来自基质细胞(如可以从与因子分泌相关的骨髓或肝脏中获得的那些基质细胞)的条件培养基中生长或在包含支持干细胞增殖的细胞表面因子的培养基中生长。可以采用适当的单克隆抗体去除不期望的细胞来使基质细胞脱离造血细胞。

使分离的细胞与增强剂(如细胞穿透抗体或抗RAD51因子)和供体寡核苷酸的组合进行离体接触,其量足以在需要修复或改变的基因(例如,人β-球蛋白或α-L-艾杜糖醛酸酶基因)中或附近引起期望的改变。这些细胞在本文中被称为经修饰的细胞。可以仅将细胞穿透抗体和供体寡核苷酸的溶液添加到培养的细胞中。可替代地,可以使用转染技术。用于用寡核苷酸转染细胞的方法是本领域众所周知的(Koppelhus等人,《先进药物递送评论(Adv.Drug Deliv.Rev.)》,55(2):267-280(2003))。可能期望使细胞在S期同步,以进一步增加基因校正的频率。用于例如通过双胸苷阻断使培养的细胞同步的方法是本领域已知的(Zielke等人,《细胞生物学方法(Methods Cell Biol.)》,8:107-121(1974))。

经修饰的细胞可以在施用于受试者之前在培养物中维持或扩增。取决于细胞类型,培养条件是本领域通常已知的。具体地,已经很好地研究了用于维持CD34

在另一个实施例中,在使用本领域众所周知的方法施用于受试者之前,使用白介素和生长因子的特异性组合将经修饰的造血干细胞离体分化成CD4

在另一个实施例中,用于离体基因疗法的细胞可以是去分化的体细胞。体细胞可以被重新编程成为可以被诱导成为造血祖细胞的多能干细胞样细胞。然后,可以用增强剂(如细胞穿透抗体)和如上关于CD34

为了由诱导型干细胞样细胞产生造血祖细胞,从宿主中采集体细胞。在优选的实施例中,体细胞是自体成纤维细胞。用对Oct4、Sox2、Klf4和c-Myc转录因子进行编码的载体培养和转导细胞。培养经转导的细胞并筛选胚胎干细胞(ES)形态和ES细胞标志物,包含但不限于AP、SSEA1和Nanog。培养并诱导经转导的ES细胞以产生诱导型干细胞样细胞。然后筛选细胞的CD41和c-kit标志物(早期造血祖细胞标志物)以及用于骨髓和红系分化的标志物。

然后将经修饰的造血干细胞或经修饰的诱导型造血祖细胞引入到受试者中。可以使用各种方法来影响细胞的递送,并且最优选地包含通过输注以及直接储库注射到骨膜、骨髓和/或皮下位点中的静脉内施用。

可以对接受经修饰的细胞的受试者进行骨髓调节治疗以增强细胞的移植。在施用细胞之前,可以使用放射或化学疗法治疗来治疗受体以增强移植。施用后,细胞通常将需要一段时间移植。实现造血干细胞或祖细胞的显著移植通常花费数周到数月。

设想的是,高百分比的经修饰的造血干细胞移植对于实现显著的预防或治疗效果不是必需的。据信,移植后经移植的细胞将随时间推移而扩增,以增加经修饰细胞的百分比。例如,在一些实施例中,经修饰的细胞具有校正的α-L-艾杜糖醛酸酶基因。因此,在患有贺勒氏综合征(Hurler syndrome)的受试者中,经修饰的细胞可以改善或治愈该病状。据信,仅需要移植少量或小百分比的经修饰的造血干细胞来提供预防或治疗作用。

在优选的实施例中,要施用于受试者的细胞将是自体的(例如源自受试者)或同基因的。

在一些实施例中,组合物和方法可以用于体外编辑胚胎基因组。这些方法通常包含使胚胎与有效量的增强剂和供体寡核苷酸在体外接触,以诱导胚胎的基因组中的至少一种改变。最优选地,胚胎是单细胞受精卵,然而还提供了在受精之前和受精期间对雄配子和雌配子的处理以及具有2个、4个、8个或16个细胞并且不仅包含受精卵而且还包含桑椹胚和胚细胞的胚胎。通常,在体外受精期间或之后,在培养第0到6天使胚胎与组合物接触。

接触可以将组合物添加到沐浴胚胎的液体培养基中。例如,可以将组合物直接移液到胚胎培养基中,然后被胚胎摄取。

B.体内基因疗法

在一些实施例中,细胞的体内基因疗法用于治疗受试者的基因病症。可以将组合物(细胞穿透抗体和供体寡核苷酸)直接施用于受试者以进行体内基因疗法。

通常,施用包含抗体、寡核苷酸和相关分子的化合物的方法是本领域众所周知的。具体地,已经用于核酸治疗的施用途径以及当前使用的调配物提供了上述供体寡核苷酸的优选的施用途径和调配物。优选地,将组合物(增强剂和供体寡核苷酸)注射或输注到经历基因操纵的生物体中,如需要基因疗法的动物。

组合物(例如,增强剂(如细胞穿透抗体)和供体寡核苷酸)可以通过多种途径施用,包含但不限于静脉内、腹膜内、羊膜内、肌内、皮下或局部(舌下、直肠、鼻内、肺、直肠粘膜和阴道)和口腔(舌下、口腔)。

在一些实施例中,将化合物调配成用于肺部递送,如鼻内施用或口服吸入。调配物的施用可以通过任何允许增强剂和供体寡核苷酸达到其靶标的可接受方法来完成。取决于所治疗的病状,施用可以是局部的(即,到特定区、生理系统、组织、器官或细胞类型)或全身的。在WO 2017/143042中还讨论了用于体内递送的组合物和方法。

这些方法还可以包含向胚胎或胎儿或其怀孕母亲施用有效量的增强剂和供体寡核苷酸。in vivo.在一些方法中,通过将组合物注射和/或输注到静脉或动脉(如卵黄静脉或脐静脉)中或注射和/或输注到胚胎或胎儿的羊膜囊中在子宫内递送组合物。参见例如Ricciardi等人,《自然通讯(Nat Commun.)》2018年6月26日;9(1):2481.doi:10.1038/s41467-018-04894-2和WO 2018/187493。

C.要治疗的疾病

当在人类基因疾病(例如,囊性纤维化、血友病、球蛋白病(如镰状细胞性贫血和β-地中海贫血)、色素性干皮病和溶酶体贮积病)的背景下进行研究时,基因疗法是显而易见的,尽管策略在基于离体的细胞修饰以及还有体内细胞修饰的背景下也可用于治疗非基因疾病,如HIV。使用增强剂(如细胞穿透抗体)和供体寡核苷酸的方法尤其可用于治疗由单个基因突变引起的基因缺陷、病症和疾病,例如以校正由点突变引起的基因缺陷、病症和疾病。如果靶基因含有导致基因病症的突变,则可以使用这些方法进行诱变修复,该诱变修复可以将靶基因的DNA序列恢复到常态。靶序列可以在基因的编码DNA序列内或内含子内。靶序列也可以在调节靶基因表达的DNA序列(包含启动子或增强子序列)内。

在本文中的方法中,已经与增强剂和供体寡核苷酸接触的细胞可以施用于受试者。受试者可能患有疾病或病症,如血友病、肌营养不良、球蛋白病、囊性纤维化、色素干性皮肤病或溶酶体贮积病。在此类实施例中,基因修饰可以以有效量发生,以减轻该受试者的该疾病或病症的一种或多种症状。设计用于校正球蛋白病、囊性纤维化、HIV和溶酶体贮积病中的突变的供体寡核苷酸的示例性序列是本领域已知的,并且例如在公开的国际申请WO2017/143042、WO 2017/143061、WO 2018/187493以及公开的美国申请第2017/0283830号中公开,这些申请中的每个申请以全文引用的方式具体并入本文中。

供体寡核苷酸可以是单链或双链的,并且可以在靶基因座处靶向基因组序列的一条或两条链。在下文提供了示例性供体寡核苷酸。供体通常以靶向靶基因组基因座的一条链的单链DNA序列呈现。然而,即使在下文没有明确提供的情况下,也基于提供的序列公开了每个供体的反向互补序列和双链DNA序列。在一些实施例中,供体寡核苷酸是所公开序列或其反向互补序列或双链DNA的功能片段。

1.球蛋白病

在世界范围内,球蛋白病是造成显著的发病率和死亡率的原因。超过1,200种不同的已知基因突变会影响人α样(HBZ、HBA2、HBA1和HBQ1)和β样(HBE1、HBG1、HBD和HBB)球蛋白基因的DNA序列。更普遍且研究充分的球蛋白病中的两种是镰状细胞性贫血和β-地中海贫血。在患有镰状细胞性贫血的患者中,缬氨酸被β-球蛋白链的位置6处的谷氨酸取代容易引起血红蛋白聚合,从而导致镰状细胞僵化和血管闭塞,造成组织和器官损伤。在患有β地中海贫血患者中,多种突变机制引起β球蛋白合成减少,从而导致未配对的不溶性α链聚集体积聚,这造成无效的红细胞生成、加速的红细胞破坏和严重的贫血。

总之,球蛋白病代表人类最常见的单基因病症。本文中的供体寡核苷酸在动物中离体和体内两者中都有效地与体外和活细胞两者中的人β-球蛋白结合。实验结果还证明,在带有具有IVS2-654地中海贫血突变的人β球蛋白基因(代替内源性小鼠β球蛋白)的转基因小鼠中,在体内校正地中海贫血相关突变。

β地中海贫血是引起RBC内的α-血红蛋白沉淀从而导致严重的溶血性贫血的不稳定的血红蛋白病。患者经历黄疸和脾肿大,其中血液中血红蛋白浓度基本上降低,需要重复输血,通常随时间推移而导致严重的铁过载。到第三十年末,由于心肌铁尘肺导致的心力衰竭是β地中海贫血死亡的主要原因。因此,减少这些患者的重复输血对于改善患者预后至关重要。

示例性β-球蛋白基因突变

下文呈现了从碱基60001到碱基66060的11号染色体人天然血红蛋白基因簇的GenBank序列的一部分(GenBank:U01317.1-11号染色体上的人β球蛋白区-LOCUS HUMHBB,73308bp ds-DNA)。波浪下划线表示在位置62187-62189处的基因编码序列的开始。GenBank序列的此部分含有天然β球蛋白基因序列。在镰状细胞血红蛋白中,位置62206处的腺嘌呤碱基突变为胸腺嘧啶。其它共有点突变发生在内含子2(IVS2)中,在下文的序列中以斜体字突出显示该内含子。突变包含IVS2-1、IVS2-566、IVS2-654、IVS2-705和IVS2-745,这些突变也以粗体和大量下划线示出;相对于内含子2的开始进行编号。

可以基于本文提供的指导和本领域其它已知的方法设计基因编辑分子。示例性供体寡核苷酸序列在例如WO 1996/040271、WO/2010/123983和美国专利第8,658,608号中提供,并且可以进行改变以包含本文中的修饰中的一种或多种修饰。可以基于基因组DNA的编码链或其互补的非编码序列(例如,沃森(Watson)或克里克(Crick)链)来参考靶区。供体寡核苷酸靶向的示例性位点可以是涵盖β球蛋白基因中的任何疾病相关突变(如下所示)的任何区。

(SEQ ID NO:42)。

示例性β-球蛋白供体

在一些实施例中,将增强剂(如细胞穿透抗体)与供体寡核苷酸组合使用以校正包含以下序列的IVS2-654突变:

5'AAAGAATAACAGTGATAATTTCTGGGTTAAGG

其它示例性供体序列包含但不限于供体GFP-IVS2-1(正义)

5'GTTCAGCGTGTCCGGCGAGGGCGAGGTGAGTCTATGGGACCCTTGATGTTT 3'(SEQ ID NO:44),

供体GFP-IVS2-1(反义)

5'AAACATCAAGGGTCCCATAGACTCACCTCGCCCTCGCCGGACACGCTGAAC 3'(SEQ ID NO:45)以及或其合适并且足以校正突变的功能片段。

在一些实施例中,可以使用具有以下序列的供体来校正镰状细胞病突变:

2.囊性纤维化

组合物和方法可以用于治疗囊性纤维化。囊性纤维化(CF)是由囊性纤维化跨膜电导调节剂(CFTR)(介导Cl转运的离子通道)中的缺陷引起的致命的常染色体隐性疾病。CFTR功能的缺乏会导致慢性阻塞性肺病,并且由于呼吸衰竭、肠梗阻综合征、外分泌和内分泌胰腺功能障碍以及不孕症而过早死亡(Davis等人,《儿科评论(Pediatr Rev.)》,22(8):257-64(2001))。CF中最常见的突变是三碱基对缺失(F508del),从而导致苯丙氨酸残基丢失,导致CFTR蛋白在细胞内降解并且缺乏细胞表面表达(Davis等人,《美国呼吸与重症医学杂志(Am J Respir Crit Care Med.)》,173(5):475-82(2006))。除此常见突变外,还有许多其它突变会发生并导致疾病,包含由于终止密码子过早造成的一类突变、无义突变。实际上,无义突变占引起疾病的突变的大约10%。在无义突变中,G542X和W1282X最常见,其中频率分别为2.6%和1.6%。

尽管CF是最严格表征的基因疾病之一,但当前对患有CF的患者的治疗侧重于症状管理,而不是基因缺陷的初步校正。由于体内向肺和其它器官系统的递送面临挑战,因此基因疗法仍是CF中难以捉摸的靶标(Armstrong等人,《儿童时期的疾病档案(Archives ofdisease in childhood)》(2014)doi:10.1136/archdischild-2012-302158.PubMed PMID:24464978)。近年来,基因疗法在治疗涉及血淋巴系统的疾病方面取得了许多进展,其中可能采集和离体操纵用于自体移植的细胞:一些实例包含使用靶向CCR5的锌指核酸酶通过慢病毒载体产生HIV-1抗性细胞(Holt等人,《自然生物科技(Nature biotechnology)》,28(8):839-47(2010))对ABCD1基因的校正,以治疗肾上腺白细胞营养不良(Cartier等人,《科学》,326(5954):818-23(2009))并使用逆转录病毒基因转移(Aiuti等人,《新英格兰医学杂志(The New England Journal Of Medicine)》,360(5):447-58(2009))校正由于ADA缺乏症引起的SCID。

不幸的是,由于涉及肺和其它内部器官,在CF中不能选择采集和自体移植。作为一种方法,英国囊性纤维化基因疗法联合会已对脂质体进行测试,以将含有对CFTR进行编码的cDNA的质粒递送到肺(Alton等人,《胸腔(Thorax)》,68(11):1075-7(2013)),Alton等人,《柳叶刀呼吸内科(The Lancet Respiratory Medicine)》,(2015).doi:10.1016/S2213-2600(15)00245-3.PubMed PMID:26149841)。其它临床试验已使用病毒载体递送CFTR基因或CFTR表达质粒,这些质粒被经聚乙二醇取代的赖氨酸30聚体肽压实,其中成功率有限(Konstan等人,《人类基因疗法(Human Gene Therapy)》,15(12):1255-69(2004))。在没有靶向插入的情况下递送质粒DNA进行基因添加不会引起内源性基因的校正,并且不经受正常CFTR基因调节,并且CFTR cDNA的病毒介导整合可能会引入非特异性整合到重要基因组位点中的风险。

增强剂(如细胞穿透抗体)和供体DNA寡核苷酸可以用于校正导致囊性纤维化的突变。在优选的实施例中,组合物通过鼻内或肺部递送来施用。在一些实施例中,由于需要校正多个组织(例如肠道)中的突变,因此利用全身施用(如IV注射或输注)来治疗CF。可以以有效减轻囊性纤维化的一种或多种症状的量施用有效量的组合物,以诱导或增强基因校正。例如,在一些实施例中,基因校正发生的量有效地改善对循环AMP刺激的减弱的应答,改善对佛司可林的应答的超极化、大管腔负鼻电位的减少、支气管肺泡灌洗(BAL)中的炎性细胞的减少,改善肺部组织学或其组合。在一些实施例中,靶细胞是构成皮肤中的汗腺的细胞,特别是上皮细胞,这些细胞在肺、肝、胰腺或消化系统或生殖系统内部成行通路。在特定实施例中,靶细胞是支气管上皮细胞。尽管与基于质粒的方法相比,使用本文中的基因编辑方法进行的永久性基因组变化不那么短暂并且这些变化将传递给子细胞,但在呼吸上皮的正常更新的情况下,一些经修饰的细胞可能随着时间推移而丢失。在一些实施例中,靶细胞是肺上皮祖细胞。肺上皮祖细胞的修饰可以诱导更多的长期表型校正。

人囊性纤维化跨膜电导调节剂(CFTR)的序列是本领域已知的,参见例如GenBank登录号:AH006034.1,并且CFTR的靶向校正的组合物和方法在McNeer等人,《自然通讯》,6:6952,(DOI 10.1038/ncomms7952),第11页中进行描述。

示例性CFTR供体

在一些实施例中,可以用于CFTR基因校正的供体包含序列

5'TTCTGTATCTATATTCATCATAGGAAACACCAAAGATAATGTTCTCCTTAATGGTGCCAGG3'(SEQID NO:49)或其功能片段,该功能片段合适并且足以校正囊性纤维化跨膜电导调节剂(CFTR)基因中的F508del突变。在此位置与CFTR基因的另一个链匹配的互补序列或其功能片段也是合适的。

在一些实施例中,可以用于CFTR基因校正的供体包含序列

在一些实施例中,可以用于CFTR基因校正的供体包含序列

在一些实施例中,除了含有设计用于校正CFTR基因中的突变的序列外,供体寡核苷酸还可以含有另外的同义(沉默)突变。另外的沉默突变可以促进使用从经处理的细胞分离的基因组DNA的等位基因特异性PCR检测所校正的靶序列。

3.溶酶体贮积病

所公开的组合物和方法也可以用于治疗溶酶体贮积病。溶酶体贮积病(LSD)是由溶酶体功能缺陷导致的一组多于50种临床公认的罕见遗传性代谢病症(Walkley,《遗传性代谢病杂志(J.Inherit.Metab.Dis.)》,32(2):181-9(2009))。溶酶体贮积症是由细胞溶酶体细胞器的功能障碍引起的,该溶酶体细胞器是较大的内体/溶酶体系统的一部分。与泛素-蛋白酶体和自噬体系统一起,溶酶体对于底物降解和再循环、稳态控制以及细胞内信号传导至关重要。溶酶体功能障碍通常是代谢易于分解或循环利用的脂质、糖蛋白(含糖蛋白)或粘多糖(由重复二糖单元组成的长直链多糖;也被称为糖胺聚糖或GAG)所必需的单一酶缺乏的结果。酶缺乏会减少或防止不需要的脂质、糖蛋白和GAG的分解或循环利用,并且导致这些物质在细胞内累积或“储存”。大多数溶酶体疾病示出了广泛的组织和器官受累,其中脑、内脏、骨骼和结缔组织经常受到影响。超过三分之二的溶酶体疾病会影响脑。神经元似乎特别容易受到溶酶体功能障碍的影响,表现出一系列缺陷,从具体的轴突和树突异常到神经元死亡。

单独地,发生LSD的发生率低于1:100,000,然而,作为一组,LSD的发生率高达1,500到7,000个活产中的1个(Staretz-Chacham等人,《儿科学(Pediatrics)》,123(4):1191-207(2009))。LSD通常是先天遗传误差的结果。这些病症中的大多数是常染色体隐性遗传的,然而有些是X连锁隐性遗传的,如法布里病(Fabry disease)和亨特氏综合征(Huntersyndrome)(MPS II)。受影响的个体通常在出生时看起来正常,但是疾病是进行性的。临床疾病的发展可能要等到数年或数十年后才会发生,但通常是致命的。溶酶体贮积病主要影响儿童,并且这些儿童通常死于年轻且难以预测的年龄,许多死于出生后的几个月或几年。许多其它儿童在经历多年特定病症的各种症状后死于这种疾病。临床疾病可能表现为智力低下和/或痴呆、感觉丧失(包含失明或耳聋)、运动系统功能障碍、癫痫发作、睡眠和行为障碍等。一些患有溶酶体贮积病的人患有肝脏肿大(肝肿大)和脾脏肿大(脾肿大)、肺部和心脏问题以及骨骼异常生长。

许多LSD的治疗是酶替代疗法(ERT)和/或底物减少疗法(SRT)以及症状的治疗或管理。在美国,ERT的平均年成本在$90,000到$565,000的范围内。尽管ERT对多种LSD具有显著的全身临床疗效,但由于重组蛋白无法穿透血脑屏障,因此对中枢神经系统(CNS)疾病症状影响很小或没有影响。同种异体造血干细胞移植(HSCT)代表了针对所选LSD的高效治疗。目前,这是防止相关神经后遗症进展的唯一手段。然而,HSCT价格昂贵,需要HLA匹配的供体,并且与显著的发病率和死亡率相关。最近的基因疗法研究表明,LSD是此类型的治疗的良好靶标。

WO 2011/133802提供了可以用于组合物和方法中的供体寡核苷酸的实例。

例如,可以采用组合物和方法来治疗高雪氏病(Gaucher's disease,GD)。高雪氏病,又被称高雪氏综合症,是最常见的溶酶体贮积病。高雪氏病是一种遗传性基因疾病,由于溶酶体中的酶葡糖脑苷脂酶(也被称为酸性β-葡糖苷酶)不足,脂质在细胞和某些器官中积聚。葡糖脑苷脂酶通过将b-糖苷裂解为b-葡萄糖和神经酰胺亚基来促进脂肪物质葡糖脑苷脂(也被称为葡糖基神经酰胺)降解(Scriver CR、Beaudet AL、Valle D、Sly WS.

存在主要两种形式:非神经性(1型,成人中最常观察到的类型)和神经性(2型和3型)。GBA(GBA葡糖苷酶、β、酸),负责葡糖苷酶介导的GD的唯一已知的人类基因,位于1号染色体、位置1q21上。已在此单个基因的已知基因组序列内定义了多于200种突变(NCBI参考序列:NG_009783.1)。最常观察到的突变是N370S、L444P、RecNciI、84GG、R463C和recTL。84GG是无效突变,其中没有合成酶的能力。然而,N370S突变几乎总是与1型疾病和轻度疾病形式有关。极少见地,鞘脂活化蛋白(高雪氏因子、SAP-2、鞘脂激活蛋白C)缺乏可能导致GD。在一些实施例中,设计供体寡核苷酸并且将其用于校正GBA中的突变。

在另一个实施例中,使用组合物和方法来治疗由酶α半乳糖苷酶A(a-GAL A,由GLA编码)缺乏引起的法布里病(也被称为法布里氏病、安德森-法布里病(Anderson-Fabrydisease)、弥漫性血管性角膜血管炎和α-半乳糖苷酶A缺乏症)、罕见的X连锁隐性失调。对GLA进行编码的人类基因具有已知的基因组序列(NCBI参考序列:NG_007119.1),并且位于X染色体的Xp22处。GLA中的突变会导致血管、其它组织和器官内的糖脂球果糖基神经酰胺(缩写为Gb3、GL-3或神经酰胺三己糖苷)积聚,从而导致其正常功能损害(Karen等人,《在线皮肤病学杂志(Dermatol.Online J.)》,11(4):8(2005))。病状影响半合子雄性(即所有雄性)以及纯合子和潜在杂合子(载体)雌性。雄性通常经历严重症状,而雌性则可能在从无症状到患有严重症状的范围内。这种变化被认为是由于雌性胚胎发育期间的X灭活模式所致。在一些实施例中,设计供体寡核苷酸并且将其用于校正GLA中的突变。

组合物和方法可以用于治疗贺勒氏综合征(HS)。贺勒氏综合征(也被称为I型粘多糖贮积病(MPS I)、α-L-艾杜糖醛酸酶缺乏症和赫尔勒氏症)是由于缺乏α-L艾杜糖醛酸酶(负责降解溶酶体中的粘多糖的酶)而导致粘多糖累积的基因病症(Dib和Pastories,《基因与分子研究(Genet.Mol.Res.)》,6(3):667-74(2007))。基于症状的严重程度,MPS I分为三种亚型。所有三种类型都是由于缺乏或水平不足的α-L-艾杜糖醛酸酶导致的。MPS I H或贺勒氏综合征是MPS I亚型中最严重的。其它两种类型是MPS I S或施艾氏综合征(Scheiesyndrome)和MPS I H-S或贺勒氏-施艾氏综合征。在没有α-L-艾杜糖醛酸酶的情况下,硫酸乙酰肝素和硫酸皮肤素(即结缔组织的主要组分)会在体内累积。过量的糖胺聚糖(GAG)进入血液循环中并且被储存在体内,其中一些会从尿液中排出。症状出现在儿童时期,并且可能包含发育迟缓,最早出现在一岁。患者通常在两到四岁达到其发展的平稳期,随后是进行性智力下降和身体技能丧失(Scott等人,《人类突变(Hum.Mutat.)》6:288-302(1995))。语言可能会因听力损失和舌头增大而受到限制,并且最终角膜混浊和视网膜变性可能会导致位点受损。腕管综合症(或身体其它地方类似的神经压迫)和关节移动受限也很常见。

示例性供体

在一些实施例中,具有以下序列

5'AGGACGGTCCCGGCCTGCGACACTTCCGCCCATAATTGTTCTTCATCTGCGGGGCGGGGGGGGG3'(SEQ ID NO:52)或合适并且足以校正W402X突变(其是与严重贺勒氏综合征相关的I型粘多糖贮积病的常见突变)的功能片段的供体寡核苷酸与增强剂(如细胞穿透抗体)一起施用以校正细胞中的W402X突变。

示例性供体寡核苷酸可以具有以下序列

5'GGGACGGCGCCCACATAGGCCAAATTCAATTGCTGATCCCAGCTTAAGACGTACTGGTCAGCCTGGC3'(SEQ ID NO:53)或适用于校正与贺勒氏综合征相关的α-L-艾杜糖醛酸酶基因中的Q70X突变的其功能片段,该示例性供体寡核苷酸与增强剂(如细胞穿透抗体)一起施用以校正细胞中的Q70X突变。

在一些实施例中,除了含有设计用于校正Q70X或W402X突变处的点突变外,供体寡核苷酸还可以含有7到10种另外的同义(沉默)突变。另外的沉默突变可以促进使用从经处理的细胞分离的基因组DNA的等位基因特异性PCR检测所校正的靶序列。

D.组合疗法

用于基因编辑的不同组分中的每种组分可以单独地或以任何组合施用,并且进一步可以与一种或多种另外的活性剂组合施用。在所有情况下,药剂的组合可以是同一混合物的一部分,或者可以作为单独的组合物施用。在一些实施例中,单独的组合物通过相同的施用途径施用。在其它实施例中,单独的组合物通过不同的施用途径施用。

优选的另外的活性剂的实例包含本领域已知的用于治疗期望的疾病或病状的其它常规疗法。例如,在镰状细胞疾病的治疗中,另外的疗法可以是羟基脲。

在囊性纤维化的治疗中,另外的疗法可以包含粘液溶解剂、抗生素、营养剂等。具体药物在囊性纤维化基金会药物流水线中概述,并且包含但不限于:CFTR调节剂,如

在HIV的治疗中,另外的疗法可以是抗逆转录病毒药物,包含但不限于非核苷逆转录酶抑制剂(NNRTI)、核苷逆转录酶抑制剂(NRTI)、蛋白酶抑制剂(PI)、融合抑制剂、CCR5拮抗剂(CCR5)(也被称为进入抑制剂)、整合酶链转移抑制剂(INSTI)或其组合。

在溶酶体贮积病的治疗中,另外的疗法可以包含例如酶替代疗法、骨髓移植或其组合。

E.测定基因修饰

测序和等位基因特异性PCR是用于测定是否发生基因修饰的优选方法。PCR引物被设计成在原始等位基因与重组后的新的预测序列之间进行区分。测定重组事件是否已经发生的其它方法在本领域中是已知的,并且可以基于进行的修饰的类型来选择。方法包含但不限于:对基因组DNA的分析,例如通过测序、等位基因特异性PCR、液滴数字PCR或限制性核酸内切酶选择性PCR(REMS-PCR);对从靶基因转录的mRNA的分析,例如通过Northern印迹、原位杂交、实时或定量逆转录酶(RT)PCT;以及对由靶基因编码的多肽的分析,例如通过免疫染色、ELISA或FACS。在一些情况下,将经修饰的细胞与亲本对照进行比较。其它方法可以包含测试由靶基因转录的RNA的功能或由靶基因编码的多肽的功能的变化。例如,如果靶基因对酶进行编码,则可以使用设计成测试酶功能的测定。

通过参考以下非限制性实例,将进一步理解本发明。

实例

实例1:3E10通过仅含有供体DNA的NP增强基因编辑。

供体DNA和纳米颗粒合成

通过标准DNA合成制备单链供体DNA寡聚物,并且通过在每个末端处包含三个硫代磷酸酯核苷间键来保护5'和3'末端。供体DNA的序列与β-球蛋白内含子2中的位置624到684相匹配并且如下所示,其中校正的IVS2-654核苷酸带有下划线:

如前所述,通过双乳液溶剂蒸发方案合成了含有供体DNA或供体DNA和PNA的纳米颗粒(Bahal等人,《自然通讯》,7:13304(2016))。简而言之,将聚(乳酸-共-乙醇酸)(PLGA)在40mg/ml的浓度下溶解在二氯甲烷中。在包封之前,将PNA和供体DNA以2:1的摩尔比混合,并且在涡旋下逐滴添加到PLGA溶液中。对于含有单独的供体DNA的NP,以2纳摩尔/毫克的聚合物的摩尔比逐滴添加DNA。使用38%的振幅对所得混合物进行超声处理三次,持续10秒。随后将油包水乳液逐滴添加到含有聚乙烯醇(5%w/v)的表面活性剂溶液中。在第二乳液之后,如所描述的重复超声处理步骤。将所得纳米颗粒溶液添加到25ml的0.3%PVA溶液中,并且允许在室温下搅拌3小时。在搅拌并使颗粒“硬化”后,将纳米颗粒通过离心(16,100g,15分钟,4℃)洗涤3次,然后将其快速冷冻并且在冷冻保护剂(海藻糖,mg:mg)中冻干。将干燥的纳米颗粒储存在-20℃下,直到稍后使用。

细胞分离、培养和处理

从携带β-球蛋白/GFP融合转基因的转基因小鼠模型中分离小鼠胚胎成纤维细胞(MEF),该β-球蛋白/GFP融合转基因由具有在GFP编码序列内插入的地中海贫血相关IVS2-654(C→T)突变的人β-球蛋白内含子2组成(Sazani等人,《自然生物技术》,20:1228-1233(2002);Bahal等人,《自然通讯》,7:13304(2016))。这引起β-球蛋白/GFP mRNA的错误剪接和缺乏GFP表达。

通过简单地添加到细胞培养物中,在含10%FBS的DMEM培养基中在5,000个细胞/孔的接种密度下用2mg含有单独的供体DNA或PNA与供体DNA的组合的纳米颗粒处理MEF。

在一些样品中,在用含供体DNA的纳米颗粒处理之前,在7.5μM的最终浓度下用3E10 WT(含有野生型3E10重链和轻链序列)处理MEF。通过基于可公开获得的序列从293个细胞中的重组表达构建体进行表达来制备3E10 WT作为全长重组抗体,并且通过标准技术对其进行纯化。72小时后通过流式细胞术通过荧光分析细胞的基因编辑。

如图1所示,用单独的供体DNA NP进行处理会导致略高于背景(未经处理的对照)的一些可检测的编辑。3E10的添加显著增加了此编辑(图1)。与用含有供体DNA/PNA的NP(先前已建立用于基因编辑的方法(Bahal等人,《自然通讯》,7:13304(2016)))处理的细胞相比,用供体DNA NP+3E10进行的处理获得了更高的编辑百分比。

实例2:3E10增强骨髓细胞中的裸供体DNA对β球蛋白基因的离体编辑。

供体DNA

通过标准DNA合成制备单链供体DNA寡聚物,并且通过在每个末端处包含三个硫代磷酸酯核苷间键来保护5'和3'末端。供体DNA序列是与野生型人β球蛋白序列匹配的60个核苷酸单链DNA,该野生型人β球蛋白序列位于第6个密码子中心(镰状细胞突变的位置)。供体DNA的序列如下:

5'TTGCCCCACAGGGCAGTAACGGCAGACTTCTCCTCAGGAGTCAGGTGCACCATGGTGTCTGTTTG3'(SEQ ID NO:48)。

镰状细胞病的小鼠模型

在镰状细胞病(SCD)中,第6个密码子处的突变(GAG->GTG)使谷氨酸变为缬氨酸。为了校正(编辑)此SCD突变位点,在汤斯小鼠模型中进行了研究。

汤斯小鼠模型由Ryan TM、Ciavatta DJ、Townes TM.开发,“镰状细胞病的敲除转基因小鼠模型(Knockout-transgenic mouse model of sickle cell disease.)”《科学》1997年10月31日;278(5339):873-6.PMID:9346487.

汤斯小鼠仅表达人镰状血红蛋白(HbS)。这些汤斯小鼠是通过产生表达人α-、γ-和β

细胞分离、培养和处理

为了进一步评估3E10对供体DNA定向基因编辑的影响,如上所述,使用了利用人血红蛋白α(hα)和人镰状血红蛋白β(β

在处理之前,将3E10 D31N(含有3E10 D31N重链和野生型轻链序列)与裸供体DNA在室温下于乙酸钠缓冲液中共温育5分钟(以允许形成非共价抗体-DNA复合物)。然后,在7.5μM 3E10和0.5μg/μl的供体DNA的最终浓度下用抗体-DNA混合物处理骨髓细胞。

72小时后,将细胞洗涤3次,然后分离基因组DNA(gDNA)(SV向导(SV Wizard),普洛麦格公司(Promega))。通过液滴数字PCR(ddPCR)分析新鲜分离的gDNA,以定量测定基因编辑频率。

实验被设计成测定3E10与DNA结合并穿透细胞的能力是否可以消除对纳米颗粒递送的需求(Weisbart等人,《科技报告(Sci.Rep.)》,5:12022(2015))。因此,不是将供体DNA包封到纳米颗粒中(如实例1中所述),而是评估3E10与裸供体DNA的组合在来自镰状细胞病转基因模型的骨髓细胞中介导基因编辑的能力。

如图2所示,当用3E10和供体DNA的预温育混合物处理细胞时,观察到大量基因编辑频率在8%的范围内。为了确保编辑不是伪影,将由单独的供体和掺入到来自未经处理细胞的基因组DNA中的供体组成的ddPCR对照作为样品包含在内。在对照中未检测到背景信号,从而排除了伪影(图2)。

实例3:3E10增强MEF中的裸供体DNA对β球蛋白基因的编辑。

从汤斯小鼠胚胎(实例2中使用的相同的镰状细胞转基因小鼠模型)中分离出小鼠胚胎成纤维细胞(MEF)。随后在含有20%FBS和1%pen-strep的DMEM培养基中在200,000个细胞每孔的接种密度下将MEF接种在12孔板中。

处理之前,将3E10 D31N(含有3E10 D31N重链和野生型轻链序列)和供体DNA温育5分钟。随后,在7.5μM 3E10和0.5μg/μl的供体DNA的最终浓度下对MEF进行处理。

72小时后,在gDNA分离之前,将细胞洗涤3次(SV向导,普洛麦格公司)。通过数字液滴PCR(ddPCR)分析新鲜分离的基因组DNA的编辑频率。

为了将在经处理的骨髓细胞中的3E10加供体DNA的发现(上文在实例2中描述的)扩展到另一种细胞类型,评估了通过3E10与裸供体DNA的组合在MEF中进行基因编辑的效率。与在用单独的供体DNA处理的MEF中观察到的非常低的基因编辑水平相比,3E10和供体DNA的组合实现了在13%的范围内的高水平的基因编辑(图3)。

实例4:单独的3E10和供体DNA在汤斯小鼠中实现体内编辑。

为了测试3E10是否可以在活动物体内促进供体DNA定向基因编辑,使用了汤斯模型(实例2和3中使用的相同的镰状细胞转基因小鼠模型)。在处理小鼠之前,将1mg的3E10D31N(含有3E10 D31N重链和野生型轻链序列)与330μg供体DNA在室温下在乙酸钠缓冲液中混合5分钟。随后向每种实验条件下的两只小鼠腹膜内(i.p.)注射总共4剂量的3E10/供体DNA,以2天时间间隔注射。每个剂量由1mg 3E10和330μg供体DNA组成。2个月后,采集骨髓细胞并且通过数字液滴PCR(ddPCR)分析镰状细胞突变时β球蛋白基因中的基因编辑。

与用空白PLGA纳米颗粒处理的对照小鼠相比,用3E10加供体DNA处理的小鼠表现出显著更高水平的基因编辑,其中频率为1.5%(图4)。

除非另外定义,否则本文所使用的所有技术和科学术语具有与本发明所属领域的技术人员通常所理解的相同的含义。本文所引用的出版物以及其所引用的材料通过引用具体并入。

仅使用常规实验,所属领域的技术人员将认识到或者能够确定本文描述的本发明的具体实施例的许多等效物。此类等效物旨在被以下权利要求涵盖。

序列表

<110> 耶鲁大学(YALE UNIVERSITY)

QUIJANO, ELIAS

TURCHICK, AUDREY

GLAZER, PETER

<120> 用于增强基于供体寡核苷酸的基因编辑的组合物和方法

<130> YU7503PCT

<150> 62/725,920

<151> 2018-08-31

<160> 53

<170> PatentIn版本3.5

<210> 1

<211> 116

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 1

Glu Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Lys Pro Gly Gly

1 5 10 15

Ser Arg Lys Leu Ser Cys Ala Ala Ser Gly Phe Thr Phe Ser Asp Tyr

20 25 30

Gly Met His Trp Val Arg Gln Ala Pro Glu Lys Gly Leu Glu Trp Val

35 40 45

Ala Tyr Ile Ser Ser Gly Ser Ser Thr Ile Tyr Tyr Ala Asp Thr Val

50 55 60

Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Leu Phe

65 70 75 80

Leu Gln Met Thr Ser Leu Arg Ser Glu Asp Thr Ala Met Tyr Tyr Cys

85 90 95

Ala Arg Arg Gly Leu Leu Leu Asp Tyr Trp Gly Gln Gly Thr Thr Leu

100 105 110

Thr Val Ser Ser

115

<210> 2

<211> 116

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 2

Glu Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Lys Pro Gly Gly

1 5 10 15

Ser Arg Lys Leu Ser Cys Ala Ala Ser Gly Phe Thr Phe Ser Asn Tyr

20 25 30

Gly Met His Trp Val Arg Gln Ala Pro Glu Lys Gly Leu Glu Trp Val

35 40 45

Ala Tyr Ile Ser Ser Gly Ser Ser Thr Ile Tyr Tyr Ala Asp Thr Val

50 55 60

Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Leu Phe

65 70 75 80

Leu Gln Met Thr Ser Leu Arg Ser Glu Asp Thr Ala Met Tyr Tyr Cys

85 90 95

Ala Arg Arg Gly Leu Leu Leu Asp Tyr Trp Gly Gln Gly Thr Thr Leu

100 105 110

Thr Val Ser Ser

115

<210> 3

<211> 116

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 3

Glu Val Gln Leu Val Gln Ser Gly Gly Gly Leu Ile Gln Pro Gly Gly

1 5 10 15

Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Thr Phe Ser Asn Tyr

20 25 30

Gly Met His Trp Val Arg Gln Ala Pro Gly Lys Gly Leu Glu Trp Val

35 40 45

Ser Tyr Ile Ser Ser Gly Ser Ser Thr Ile Tyr Tyr Ala Asp Ser Val

50 55 60

Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ser Lys Asn Thr Leu Tyr

65 70 75 80

Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Val Tyr Tyr Cys

85 90 95

Ala Arg Arg Gly Leu Leu Leu Asp Tyr Trp Gly Gln Gly Thr Thr Val

100 105 110

Thr Val Ser Ser

115

<210> 4

<211> 116

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 4

Glu Val Gln Leu Val Glu Ser Gly Gly Gly Leu Ile Gln Pro Gly Gly

1 5 10 15

Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Thr Phe Ser Asn Tyr

20 25 30

Gly Met His Trp Val Arg Gln Ala Pro Gly Lys Gly Leu Glu Trp Val

35 40 45

Ser Tyr Ile Ser Ser Gly Ser Ser Thr Ile Tyr Tyr Ala Asp Ser Val

50 55 60

Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ser Lys Asn Thr Leu Tyr

65 70 75 80

Leu Gln Met Thr Ser Leu Arg Ala Glu Asp Thr Ala Val Tyr Tyr Cys

85 90 95

Ala Arg Arg Gly Leu Leu Leu Asp Tyr Trp Gly Gln Gly Thr Thr Leu

100 105 110

Thr Val Ser Ser

115

<210> 5

<211> 116

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 5

Glu Val Gln Leu Gln Glu Ser Gly Gly Gly Val Val Gln Pro Gly Gly

1 5 10 15

Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Thr Phe Ser Asn Tyr

20 25 30

Gly Met His Trp Ile Arg Gln Ala Pro Gly Lys Gly Leu Glu Trp Val

35 40 45

Ser Tyr Ile Ser Ser Gly Ser Ser Thr Ile Tyr Tyr Ala Asp Ser Val

50 55 60

Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ser Lys Asn Thr Leu Tyr

65 70 75 80

Leu Gln Met Asn Ser Leu Arg Ser Glu Asp Thr Ala Val Tyr Tyr Cys

85 90 95

Ala Arg Arg Gly Leu Leu Leu Asp Tyr Trp Gly Gln Gly Thr Leu Val

100 105 110

Thr Val Ser Ser

115

<210> 6

<211> 116

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 6

Glu Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Pro Gly Gly

1 5 10 15

Ser Leu Arg Leu Ser Cys Ser Ala Ser Gly Phe Thr Phe Ser Asn Tyr

20 25 30

Gly Met His Trp Val Arg Gln Ala Pro Gly Lys Gly Leu Glu Tyr Val

35 40 45

Ser Tyr Ile Ser Ser Gly Ser Ser Thr Ile Tyr Tyr Ala Asp Thr Val

50 55 60

Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ser Lys Asn Thr Leu Tyr

65 70 75 80

Leu Gln Met Ser Ser Leu Arg Ala Glu Asp Thr Ala Val Tyr Tyr Cys

85 90 95

Val Lys Arg Gly Leu Leu Leu Asp Tyr Trp Gly Gln Gly Thr Leu Val

100 105 110

Thr Val Ser Ser

115

<210> 7

<211> 111

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 7

Asp Ile Val Leu Thr Gln Ser Pro Ala Ser Leu Ala Val Ser Leu Gly

1 5 10 15

Gln Arg Ala Thr Ile Ser Cys Arg Ala Ser Lys Ser Val Ser Thr Ser

20 25 30

Ser Tyr Ser Tyr Met His Trp Tyr Gln Gln Lys Pro Gly Gln Pro Pro

35 40 45

Lys Leu Leu Ile Lys Tyr Ala Ser Tyr Leu Glu Ser Gly Val Pro Ala

50 55 60

Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Asn Ile His

65 70 75 80

Pro Val Glu Glu Glu Asp Ala Ala Thr Tyr Tyr Cys Gln His Ser Arg

85 90 95

Glu Phe Pro Trp Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile Lys

100 105 110

<210> 8

<211> 111

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 8

Asp Ile Val Leu Thr Gln Ser Pro Ala Ser Leu Ala Val Ser Leu Gly

1 5 10 15

Gln Arg Ala Thr Ile Ser Cys Arg Ala Ser Lys Ser Val Ser Thr Ser

20 25 30

Ser Tyr Ser Tyr Met His Trp Tyr Gln Gln Lys Pro Gly Gln Pro Pro

35 40 45

Lys Leu Leu Ile Lys Tyr Ala Ser Tyr Leu Glu Ser Gly Val Pro Ala

50 55 60

Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Phe His Leu Asn Ile His

65 70 75 80

Pro Val Glu Glu Glu Asp Ala Ala Thr Tyr Tyr Cys Gln His Ser Arg

85 90 95

Glu Phe Pro Trp Thr Phe Gly Gly Gly Thr Lys Leu Glu Leu Lys

100 105 110

<210> 9

<211> 111

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 9

Asp Ile Gln Met Thr Gln Ser Pro Ser Ser Leu Ser Ala Ser Val Gly

1 5 10 15

Asp Arg Val Thr Ile Thr Cys Arg Ala Ser Lys Ser Val Ser Thr Ser

20 25 30

Ser Tyr Ser Tyr Leu Ala Trp Tyr Gln Gln Lys Pro Glu Lys Ala Pro

35 40 45

Lys Leu Leu Ile Lys Tyr Ala Ser Tyr Leu Gln Ser Gly Val Pro Ser

50 55 60

Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser

65 70 75 80

Ser Leu Gln Pro Glu Asp Phe Ala Thr Tyr Tyr Cys Gln His Ser Arg

85 90 95

Glu Phe Pro Trp Thr Phe Gly Ala Gly Thr Lys Leu Glu Leu Lys

100 105 110

<210> 10

<211> 111

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 10

Asp Ile Gln Met Thr Gln Ser Pro Ser Ser Leu Ser Ala Ser Val Gly

1 5 10 15

Asp Arg Val Thr Ile Ser Cys Arg Ala Ser Lys Ser Val Ser Thr Ser

20 25 30

Ser Tyr Ser Tyr Met His Trp Tyr Gln Gln Lys Pro Glu Lys Ala Pro

35 40 45

Lys Leu Leu Ile Lys Tyr Ala Ser Tyr Leu Gln Ser Gly Val Pro Ser

50 55 60

Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser

65 70 75 80

Ser Leu Gln Pro Glu Asp Val Ala Thr Tyr Tyr Cys Gln His Ser Arg

85 90 95

Glu Phe Pro Trp Thr Phe Gly Ala Gly Thr Lys Leu Glu Leu Lys

100 105 110

<210> 11

<211> 111

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 11

Asp Ile Val Leu Thr Gln Ser Pro Ala Ser Leu Ala Val Ser Pro Gly

1 5 10 15

Gln Arg Ala Thr Ile Thr Cys Arg Ala Ser Lys Ser Val Ser Thr Ser

20 25 30

Ser Tyr Ser Tyr Met His Trp Tyr Gln Gln Lys Pro Gly Gln Pro Pro

35 40 45

Lys Leu Leu Ile Tyr Tyr Ala Ser Tyr Leu Glu Ser Gly Val Pro Ala

50 55 60

Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Asn

65 70 75 80

Pro Val Glu Ala Asn Asp Thr Ala Asn Tyr Tyr Cys Gln His Ser Arg

85 90 95

Glu Phe Pro Trp Thr Phe Gly Gln Gly Thr Lys Val Glu Ile Lys

100 105 110

<210> 12

<211> 465

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 12

Met Gly Trp Ser Cys Ile Ile Leu Phe Leu Val Ala Thr Ala Thr Gly

1 5 10 15

Val His Ser Glu Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Lys

20 25 30

Pro Gly Gly Ser Arg Lys Leu Ser Cys Ala Ala Ser Gly Phe Thr Phe

35 40 45

Ser Asp Tyr Gly Met His Trp Val Arg Gln Ala Pro Glu Lys Gly Leu

50 55 60

Glu Trp Val Ala Tyr Ile Ser Ser Gly Ser Ser Thr Ile Tyr Tyr Ala

65 70 75 80

Asp Thr Val Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn

85 90 95

Thr Leu Phe Leu Gln Met Thr Ser Leu Arg Ser Glu Asp Thr Ala Met

100 105 110

Tyr Tyr Cys Ala Arg Arg Gly Leu Leu Leu Asp Tyr Trp Gly Gln Gly

115 120 125

Thr Thr Leu Thr Val Ser Ala Ala Ser Thr Lys Gly Pro Ser Val Phe

130 135 140

Pro Leu Ala Pro Ser Ser Lys Ser Thr Ser Gly Gly Thr Ala Ala Leu

145 150 155 160

Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro Val Thr Val Ser Trp

165 170 175

Asn Ser Gly Ala Leu Thr Ser Gly Val His Thr Phe Pro Ala Val Leu

180 185 190

Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val Val Thr Val Pro Ser

195 200 205

Ser Ser Leu Gly Thr Gln Thr Tyr Ile Cys Asn Val Asn His Lys Pro

210 215 220

Ser Asn Thr Lys Val Asp Lys Lys Val Glu Pro Lys Ser Cys Asp Lys

225 230 235 240

Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro

245 250 255

Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser

260 265 270

Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp

275 280 285

Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn

290 295 300

Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val

305 310 315 320

Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu

325 330 335

Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys

340 345 350

Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr

355 360 365

Leu Pro Pro Ser Arg Asp Glu Leu Thr Lys Asn Gln Val Ser Leu Thr

370 375 380

Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu

385 390 395 400

Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu

405 410 415

Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys

420 425 430

Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu

435 440 445

Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly

450 455 460

Lys

465

<210> 13

<211> 465

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 13

Met Gly Trp Ser Cys Ile Ile Leu Phe Leu Val Ala Thr Ala Thr Gly

1 5 10 15

Val His Ser Glu Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Lys

20 25 30

Pro Gly Gly Ser Arg Lys Leu Ser Cys Ala Ala Ser Gly Phe Thr Phe

35 40 45

Ser Asn Tyr Gly Met His Trp Val Arg Gln Ala Pro Glu Lys Gly Leu

50 55 60

Glu Trp Val Ala Tyr Ile Ser Ser Gly Ser Ser Thr Ile Tyr Tyr Ala

65 70 75 80

Asp Thr Val Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn

85 90 95

Thr Leu Phe Leu Gln Met Thr Ser Leu Arg Ser Glu Asp Thr Ala Met

100 105 110

Tyr Tyr Cys Ala Arg Arg Gly Leu Leu Leu Asp Tyr Trp Gly Gln Gly

115 120 125

Thr Thr Leu Thr Val Ser Ala Ala Ser Thr Lys Gly Pro Ser Val Phe

130 135 140

Pro Leu Ala Pro Ser Ser Lys Ser Thr Ser Gly Gly Thr Ala Ala Leu

145 150 155 160

Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro Val Thr Val Ser Trp

165 170 175

Asn Ser Gly Ala Leu Thr Ser Gly Val His Thr Phe Pro Ala Val Leu

180 185 190

Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val Val Thr Val Pro Ser

195 200 205

Ser Ser Leu Gly Thr Gln Thr Tyr Ile Cys Asn Val Asn His Lys Pro

210 215 220

Ser Asn Thr Lys Val Asp Lys Lys Val Glu Pro Lys Ser Cys Asp Lys

225 230 235 240

Thr His Thr Cys Pro Pro Cys Pro Ala Pro Glu Leu Leu Gly Gly Pro

245 250 255

Ser Val Phe Leu Phe Pro Pro Lys Pro Lys Asp Thr Leu Met Ile Ser

260 265 270

Arg Thr Pro Glu Val Thr Cys Val Val Val Asp Val Ser His Glu Asp

275 280 285

Pro Glu Val Lys Phe Asn Trp Tyr Val Asp Gly Val Glu Val His Asn

290 295 300

Ala Lys Thr Lys Pro Arg Glu Glu Gln Tyr Asn Ser Thr Tyr Arg Val

305 310 315 320

Val Ser Val Leu Thr Val Leu His Gln Asp Trp Leu Asn Gly Lys Glu

325 330 335

Tyr Lys Cys Lys Val Ser Asn Lys Ala Leu Pro Ala Pro Ile Glu Lys

340 345 350

Thr Ile Ser Lys Ala Lys Gly Gln Pro Arg Glu Pro Gln Val Tyr Thr

355 360 365

Leu Pro Pro Ser Arg Asp Glu Leu Thr Lys Asn Gln Val Ser Leu Thr

370 375 380

Cys Leu Val Lys Gly Phe Tyr Pro Ser Asp Ile Ala Val Glu Trp Glu

385 390 395 400

Ser Asn Gly Gln Pro Glu Asn Asn Tyr Lys Thr Thr Pro Pro Val Leu

405 410 415

Asp Ser Asp Gly Ser Phe Phe Leu Tyr Ser Lys Leu Thr Val Asp Lys

420 425 430

Ser Arg Trp Gln Gln Gly Asn Val Phe Ser Cys Ser Val Met His Glu

435 440 445

Ala Leu His Asn His Tyr Thr Gln Lys Ser Leu Ser Leu Ser Pro Gly

450 455 460

Lys

465

<210> 14

<211> 237

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 14

Met Gly Trp Ser Cys Ile Ile Leu Phe Leu Val Ala Thr Ala Thr Gly

1 5 10 15

Val His Ser Asp Ile Val Leu Thr Gln Ser Pro Ala Ser Leu Ala Val

20 25 30

Ser Leu Gly Gln Arg Ala Thr Ile Ser Cys Arg Ala Ser Lys Ser Val

35 40 45

Ser Thr Ser Ser Tyr Ser Tyr Met His Trp Tyr Gln Gln Lys Pro Gly

50 55 60

Gln Pro Pro Lys Leu Leu Ile Lys Tyr Ala Ser Tyr Leu Glu Ser Gly

65 70 75 80

Val Pro Ala Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu

85 90 95

Asn Ile His Pro Val Glu Glu Glu Asp Ala Ala Thr Tyr Tyr Cys Gln

100 105 110

His Ser Arg Glu Phe Pro Trp Thr Phe Gly Gly Gly Thr Lys Leu Glu

115 120 125

Ile Lys Arg Thr Val Ala Ala Pro Ser Val Phe Ile Phe Pro Pro Ser

130 135 140

Asp Glu Gln Leu Lys Ser Gly Thr Ala Ser Val Val Cys Leu Leu Asn

145 150 155 160

Asn Phe Tyr Pro Arg Glu Ala Lys Val Gln Trp Lys Val Asp Asn Ala

165 170 175

Leu Gln Ser Gly Asn Ser Gln Glu Ser Val Thr Glu Gln Asp Ser Lys

180 185 190

Asp Ser Thr Tyr Ser Leu Ser Ser Thr Leu Thr Leu Ser Lys Ala Asp

195 200 205

Tyr Glu Lys His Lys Val Tyr Ala Cys Glu Val Thr His Gln Gly Leu

210 215 220

Ser Ser Pro Val Thr Lys Ser Phe Asn Arg Gly Glu Cys

225 230 235

<210> 15

<211> 5

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 15

Asp Tyr Gly Met His

1 5

<210> 16

<211> 5

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 16

Asn Tyr Gly Met His

1 5

<210> 17

<211> 17

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 17

Tyr Ile Ser Ser Gly Ser Ser Thr Ile Tyr Tyr Ala Asp Thr Val Lys

1 5 10 15

Gly

<210> 18

<211> 7

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 18

Arg Gly Leu Leu Leu Asp Tyr

1 5

<210> 19

<211> 17

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 19

Tyr Ile Ser Ser Gly Ser Ser Thr Ile Tyr Tyr Ala Asp Ser Val Lys

1 5 10 15

Gly

<210> 20

<211> 8

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 20

Gly Phe Thr Phe Ser Asp Tyr Gly

1 5

<210> 21

<211> 8

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 21

Gly Phe Thr Phe Ser Asn Tyr Gly

1 5

<210> 22

<211> 8

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 22

Ile Ser Ser Gly Ser Ser Thr Ile

1 5

<210> 23

<211> 9

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 23

Ala Arg Arg Gly Leu Leu Leu Asp Tyr

1 5

<210> 24

<211> 15

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 24

Arg Ala Ser Lys Ser Val Ser Thr Ser Ser Tyr Ser Tyr Met His

1 5 10 15

<210> 25

<211> 7

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 25

Tyr Ala Ser Tyr Leu Glu Ser

1 5

<210> 26

<211> 9

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 26

Gln His Ser Arg Glu Phe Pro Trp Thr

1 5

<210> 27

<211> 15

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 27

Arg Ala Ser Lys Ser Val Ser Thr Ser Ser Tyr Ser Tyr Leu Ala

1 5 10 15

<210> 28

<211> 7

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 28

Tyr Ala Ser Tyr Leu Gln Ser

1 5

<210> 29

<211> 10

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 29

Lys Ser Val Ser Thr Ser Ser Tyr Ser Tyr

1 5 10

<210> 30

<211> 3

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 30

Tyr Ala Ser

1

<210> 31

<211> 7

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 31

Gly Gln Ser Ser Arg Ser Ser

1 5

<210> 32

<211> 18

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 32

Gly Gln Ser Ser Arg Ser Ser Ser Gly Gly Gly Ser Ser Gly Gly Gly

1 5 10 15

Gly Ser

<210> 33

<211> 4

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 33

Gly Ser Gly Ser

1

<210> 34

<211> 4

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 34

Gly Gly Gly Ser

1

<210> 35

<211> 10

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 35

Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser

1 5 10

<210> 36

<211> 20

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 36

Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly

1 5 10 15

Gly Gly Gly Ser

20

<210> 37

<211> 15

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 37

Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser

1 5 10 15

<210> 38

<211> 274

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 38

Ala Gly Ile His Asp Ile Val Leu Thr Gln Ser Pro Ala Ser Leu Ala

1 5 10 15

Val Ser Leu Gly Gln Arg Ala Thr Ile Ser Cys Arg Ala Ser Lys Ser

20 25 30

Val Ser Thr Ser Ser Tyr Ser Tyr Met His Trp Tyr Gln Gln Lys Pro

35 40 45

Gly Gln Pro Pro Lys Leu Leu Ile Lys Tyr Ala Ser Tyr Leu Glu Ser

50 55 60

Gly Val Pro Ala Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Phe Thr

65 70 75 80

Leu Asn Ile His Pro Val Glu Glu Glu Asp Ala Ala Thr Tyr Tyr Cys

85 90 95

Gln His Ser Arg Glu Phe Pro Trp Thr Phe Gly Gly Gly Thr Lys Leu

100 105 110

Glu Ile Lys Arg Ala Asp Ala Ala Pro Gly Gly Gly Gly Ser Gly Gly

115 120 125

Gly Gly Ser Gly Gly Gly Gly Ser Glu Val Gln Leu Val Glu Ser Gly

130 135 140

Gly Gly Leu Val Lys Pro Gly Gly Ser Arg Lys Leu Ser Cys Ala Ala

145 150 155 160

Ser Gly Phe Thr Phe Ser Asn Tyr Gly Met His Trp Val Arg Gln Ala

165 170 175

Pro Glu Lys Gly Leu Glu Trp Val Ala Tyr Ile Ser Ser Gly Ser Ser

180 185 190

Thr Ile Tyr Tyr Ala Asp Thr Val Lys Gly Arg Phe Thr Ile Ser Arg

195 200 205

Asp Asn Ala Lys Asn Thr Leu Phe Leu Gln Met Thr Ser Leu Arg Ser

210 215 220

Glu Asp Thr Ala Met Tyr Tyr Cys Ala Arg Arg Gly Leu Leu Leu Asp

225 230 235 240

Tyr Trp Gly Gln Gly Thr Thr Leu Thr Val Ser Ser Leu Glu Gln Lys

245 250 255

Leu Ile Ser Glu Glu Asp Leu Asn Ser Ala Val Asp His His His His

260 265 270

His His

<210> 39

<211> 541

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 39

Ala Gly Ile His Asp Ile Val Leu Thr Gln Ser Pro Ala Ser Leu Ala

1 5 10 15

Val Ser Leu Gly Gln Arg Ala Thr Ile Ser Cys Arg Ala Ser Lys Ser

20 25 30

Val Ser Thr Ser Ser Tyr Ser Tyr Met His Trp Tyr Gln Gln Lys Pro

35 40 45

Gly Gln Pro Pro Lys Leu Leu Ile Lys Tyr Ala Ser Tyr Leu Glu Ser

50 55 60

Gly Val Pro Ala Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Phe Thr

65 70 75 80

Leu Asn Ile His Pro Val Glu Glu Glu Asp Ala Ala Thr Tyr Tyr Cys

85 90 95

Gln His Ser Arg Glu Phe Pro Trp Thr Phe Gly Gly Gly Thr Lys Leu

100 105 110

Glu Ile Lys Arg Ala Asp Ala Ala Pro Gly Gly Gly Gly Ser Gly Gly

115 120 125

Gly Gly Ser Gly Gly Gly Gly Ser Glu Val Gln Leu Val Glu Ser Gly

130 135 140

Gly Gly Leu Val Lys Pro Gly Gly Ser Arg Lys Leu Ser Cys Ala Ala

145 150 155 160

Ser Gly Phe Thr Phe Ser Asn Tyr Gly Met His Trp Val Arg Gln Ala

165 170 175

Pro Glu Lys Gly Leu Glu Trp Val Ala Tyr Ile Ser Ser Gly Ser Ser

180 185 190

Thr Ile Tyr Tyr Ala Asp Thr Val Lys Gly Arg Phe Thr Ile Ser Arg

195 200 205

Asp Asn Ala Lys Asn Thr Leu Phe Leu Gln Met Thr Ser Leu Arg Ser

210 215 220

Glu Asp Thr Ala Met Tyr Tyr Cys Ala Arg Arg Gly Leu Leu Leu Asp

225 230 235 240

Tyr Trp Gly Gln Gly Thr Thr Leu Thr Val Ser Ser Ala Ser Thr Lys

245 250 255

Gly Pro Ser Val Phe Pro Leu Ala Pro Leu Glu Ser Ser Gly Ser Asp

260 265 270

Ile Val Leu Thr Gln Ser Pro Ala Ser Leu Ala Val Ser Leu Gly Gln

275 280 285

Arg Ala Thr Ile Ser Cys Arg Ala Ser Lys Ser Val Ser Thr Ser Ser

290 295 300

Tyr Ser Tyr Met His Trp Tyr Gln Gln Lys Pro Gly Gln Pro Pro Lys

305 310 315 320

Leu Leu Ile Lys Tyr Ala Ser Tyr Leu Glu Ser Gly Val Pro Ala Arg

325 330 335

Phe Ser Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Asn Ile His Pro

340 345 350

Val Glu Glu Glu Asp Ala Ala Thr Tyr Tyr Cys Gln His Ser Arg Glu

355 360 365

Phe Pro Trp Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile Lys Arg Ala

370 375 380

Asp Ala Ala Pro Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly

385 390 395 400

Gly Gly Ser Glu Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Lys

405 410 415

Pro Gly Gly Ser Arg Lys Leu Ser Cys Ala Ala Ser Gly Phe Thr Phe

420 425 430

Ser Asn Tyr Gly Met His Trp Val Arg Gln Ala Pro Glu Lys Gly Leu

435 440 445

Glu Trp Val Ala Tyr Ile Ser Ser Gly Ser Ser Thr Ile Tyr Tyr Ala

450 455 460

Asp Thr Val Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn

465 470 475 480

Thr Leu Phe Leu Gln Met Thr Ser Leu Arg Ser Glu Asp Thr Ala Met

485 490 495

Tyr Tyr Cys Ala Arg Arg Gly Leu Leu Leu Asp Tyr Trp Gly Gln Gly

500 505 510

Thr Thr Leu Thr Val Ser Ser Leu Glu Gln Lys Leu Ile Ser Glu Glu

515 520 525

Asp Leu Asn Ser Ala Val Asp His His His His His His

530 535 540

<210> 40

<211> 808

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 40

Ala Gly Ile His Asp Ile Val Leu Thr Gln Ser Pro Ala Ser Leu Ala

1 5 10 15

Val Ser Leu Gly Gln Arg Ala Thr Ile Ser Cys Arg Ala Ser Lys Ser

20 25 30

Val Ser Thr Ser Ser Tyr Ser Tyr Met His Trp Tyr Gln Gln Lys Pro

35 40 45

Gly Gln Pro Pro Lys Leu Leu Ile Lys Tyr Ala Ser Tyr Leu Glu Ser

50 55 60

Gly Val Pro Ala Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Phe Thr

65 70 75 80

Leu Asn Ile His Pro Val Glu Glu Glu Asp Ala Ala Thr Tyr Tyr Cys

85 90 95

Gln His Ser Arg Glu Phe Pro Trp Thr Phe Gly Gly Gly Thr Lys Leu

100 105 110

Glu Ile Lys Arg Ala Asp Ala Ala Pro Gly Gly Gly Gly Ser Gly Gly

115 120 125

Gly Gly Ser Gly Gly Gly Gly Ser Glu Val Gln Leu Val Glu Ser Gly

130 135 140

Gly Gly Leu Val Lys Pro Gly Gly Ser Arg Lys Leu Ser Cys Ala Ala

145 150 155 160

Ser Gly Phe Thr Phe Ser Asn Tyr Gly Met His Trp Val Arg Gln Ala

165 170 175

Pro Glu Lys Gly Leu Glu Trp Val Ala Tyr Ile Ser Ser Gly Ser Ser

180 185 190

Thr Ile Tyr Tyr Ala Asp Thr Val Lys Gly Arg Phe Thr Ile Ser Arg

195 200 205

Asp Asn Ala Lys Asn Thr Leu Phe Leu Gln Met Thr Ser Leu Arg Ser

210 215 220

Glu Asp Thr Ala Met Tyr Tyr Cys Ala Arg Arg Gly Leu Leu Leu Asp

225 230 235 240

Tyr Trp Gly Gln Gly Thr Thr Leu Thr Val Ser Ser Ala Ser Thr Lys

245 250 255

Gly Pro Ser Val Phe Pro Leu Ala Pro Leu Glu Ser Ser Gly Ser Asp

260 265 270

Ile Val Leu Thr Gln Ser Pro Ala Ser Leu Ala Val Ser Leu Gly Gln

275 280 285

Arg Ala Thr Ile Ser Cys Arg Ala Ser Lys Ser Val Ser Thr Ser Ser

290 295 300

Tyr Ser Tyr Met His Trp Tyr Gln Gln Lys Pro Gly Gln Pro Pro Lys

305 310 315 320

Leu Leu Ile Lys Tyr Ala Ser Tyr Leu Glu Ser Gly Val Pro Ala Arg

325 330 335

Phe Ser Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Asn Ile His Pro

340 345 350

Val Glu Glu Glu Asp Ala Ala Thr Tyr Tyr Cys Gln His Ser Arg Glu

355 360 365

Phe Pro Trp Thr Phe Gly Gly Gly Thr Lys Leu Glu Ile Lys Arg Ala

370 375 380

Asp Ala Ala Pro Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly

385 390 395 400

Gly Gly Ser Glu Val Gln Leu Val Glu Ser Gly Gly Gly Leu Val Lys

405 410 415

Pro Gly Gly Ser Arg Lys Leu Ser Cys Ala Ala Ser Gly Phe Thr Phe

420 425 430

Ser Asn Tyr Gly Met His Trp Val Arg Gln Ala Pro Glu Lys Gly Leu

435 440 445

Glu Trp Val Ala Tyr Ile Ser Ser Gly Ser Ser Thr Ile Tyr Tyr Ala

450 455 460

Asp Thr Val Lys Gly Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn

465 470 475 480

Thr Leu Phe Leu Gln Met Thr Ser Leu Arg Ser Glu Asp Thr Ala Met

485 490 495

Tyr Tyr Cys Ala Arg Arg Gly Leu Leu Leu Asp Tyr Trp Gly Gln Gly

500 505 510

Thr Thr Leu Thr Val Ser Ser Ala Ser Thr Lys Gly Pro Ser Val Phe

515 520 525

Pro Leu Ala Pro Leu Glu Ser Ser Gly Ser Asp Ile Val Leu Thr Gln

530 535 540

Ser Pro Ala Ser Leu Ala Val Ser Leu Gly Gln Arg Ala Thr Ile Ser

545 550 555 560

Cys Arg Ala Ser Lys Ser Val Ser Thr Ser Ser Tyr Ser Tyr Met His

565 570 575

Trp Tyr Gln Gln Lys Pro Gly Gln Pro Pro Lys Leu Leu Ile Lys Tyr

580 585 590

Ala Ser Tyr Leu Glu Ser Gly Val Pro Ala Arg Phe Ser Gly Ser Gly

595 600 605

Ser Gly Thr Asp Phe Thr Leu Asn Ile His Pro Val Glu Glu Glu Asp

610 615 620

Ala Ala Thr Tyr Tyr Cys Gln His Ser Arg Glu Phe Pro Trp Thr Phe

625 630 635 640

Gly Gly Gly Thr Lys Leu Glu Ile Lys Arg Ala Asp Ala Ala Pro Gly

645 650 655

Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Glu Val

660 665 670

Gln Leu Val Glu Ser Gly Gly Gly Leu Val Lys Pro Gly Gly Ser Arg

675 680 685

Lys Leu Ser Cys Ala Ala Ser Gly Phe Thr Phe Ser Asn Tyr Gly Met

690 695 700

His Trp Val Arg Gln Ala Pro Glu Lys Gly Leu Glu Trp Val Ala Tyr

705 710 715 720

Ile Ser Ser Gly Ser Ser Thr Ile Tyr Tyr Ala Asp Thr Val Lys Gly

725 730 735

Arg Phe Thr Ile Ser Arg Asp Asn Ala Lys Asn Thr Leu Phe Leu Gln

740 745 750

Met Thr Ser Leu Arg Ser Glu Asp Thr Ala Met Tyr Tyr Cys Ala Arg

755 760 765

Arg Gly Leu Leu Leu Asp Tyr Trp Gly Gln Gly Thr Thr Leu Thr Val

770 775 780

Ser Ser Leu Glu Gln Lys Leu Ile Ser Glu Glu Asp Leu Asn Ser Ala

785 790 795 800

Val Asp His His His His His His

805

<210> 41

<211> 242

<212> PRT

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多肽

<400> 41

Asp Ile Val Leu Thr Gln Ser Pro Ala Ser Leu Ala Val Ser Pro Gly

1 5 10 15

Gln Arg Ala Thr Ile Thr Cys Arg Ala Ser Lys Ser Val Ser Thr Ser

20 25 30

Ser Tyr Ser Tyr Met His Trp Tyr Gln Gln Lys Pro Gly Gln Pro Pro

35 40 45

Lys Leu Leu Ile Tyr Tyr Ala Ser Tyr Leu Glu Ser Gly Val Pro Ala

50 55 60

Arg Phe Ser Gly Ser Gly Ser Gly Thr Asp Phe Thr Leu Thr Ile Asn

65 70 75 80

Pro Val Glu Ala Asn Asp Thr Ala Asn Tyr Tyr Cys Gln His Ser Arg

85 90 95

Glu Phe Pro Trp Thr Phe Gly Gln Gly Thr Lys Val Glu Ile Lys Gly

100 105 110

Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Glu Val

115 120 125

Gln Leu Val Glu Ser Gly Gly Gly Leu Val Gln Pro Gly Gly Ser Leu

130 135 140

Arg Leu Ser Cys Ser Ala Ser Gly Phe Thr Phe Ser Asn Tyr Gly Met

145 150 155 160

His Trp Val Arg Gln Ala Pro Gly Lys Gly Leu Glu Tyr Val Ser Tyr

165 170 175

Ile Ser Ser Gly Ser Ser Thr Ile Tyr Tyr Ala Asp Thr Val Lys Gly

180 185 190

Arg Phe Thr Ile Ser Arg Asp Asn Ser Lys Asn Thr Leu Tyr Leu Gln

195 200 205

Met Ser Ser Leu Arg Ala Glu Asp Thr Ala Val Tyr Tyr Cys Val Lys

210 215 220

Arg Gly Leu Leu Leu Asp Tyr Trp Gly Gln Gly Thr Leu Val Thr Val

225 230 235 240

Ser Ser

<210> 42

<211> 6060

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多核苷酸

<400> 42

aaagctcttg ctttgacaat tttggtcttt cagaatacta taaatataac ctatattata 60

atttcataaa gtctgtgcat tttctttgac ccaggatatt tgcaaaagac atattcaaac 120

ttccgcagaa cactttattt cacatataca tgcctcttat atcagggatg tgaaacaggg 180

tcttgaaaac tgtctaaatc taaaacaatg ctaatgcagg tttaaattta ataaaataaa 240

atccaaaatc taacagccaa gtcaaatctg tatgttttaa catttaaaat attttaaaga 300

cgtcttttcc caggattcaa catgtgaaat cttttctcag ggatacacgt gtgcctagat 360

cctcattgct ttagtttttt acagaggaat gaatataaaa agaaaatact taaattttat 420

ccctcttacc tctataatca tacataggca taatttttta acctaggctc cagatagcca 480

tagaagaacc aaacactttc tgcgtgtgtg agaataatca gagtgagatt ttttcacaag 540

tacctgatga gggttgagac aggtagaaaa agtgagagat ctctatttat ttagcaataa 600

tagagaaagc atttaagaga ataaagcaat ggaaataaga aatttgtaaa tttccttctg 660

ataactagaa atagaggatc cagtttcttt tggttaacct aaattttatt tcattttatt 720

gttttatttt attttatttt attttatttt gtgtaatcgt agtttcagag tgttagagct 780

gaaaggaaga agtaggagaa acatgcaaag taaaagtata acactttcct tactaaaccg 840

actgggtttc caggtagggg caggattcag gatgactgac agggccctta gggaacactg 900

agaccctacg ctgacctcat aaatgcttgc tacctttgct gttttaatta catcttttaa 960

tagcaggaag cagaactctg cacttcaaaa gtttttcctc acctgaggag ttaatttagt 1020

acaaggggaa aaagtacagg gggatgggag aaaggcgatc acgttgggaa gctatagaga 1080

aagaagagta aattttagta aaggaggttt aaacaaacaa aatataaaga gaaataggaa 1140

cttgaatcaa ggaaatgatt ttaaaacgca gtattcttag tggactagag gaaaaaaata 1200

atctgagcca agtagaagac cttttcccct cctaccccta ctttctaagt cacagaggct 1260

ttttgttccc ccagacactc ttgcagatta gtccaggcag aaacagttag atgtccccag 1320

ttaacctcct atttgacacc actgattacc ccattgatag tcacactttg ggttgtaagt 1380

gactttttat ttatttgtat ttttgactgc attaagaggt ctctagtttt ttatctcttg 1440

tttcccaaaa cctaataagt aactaatgca cagagcacat tgatttgtat ttattctatt 1500

tttagacata atttattagc atgcatgagc aaattaagaa aaacaacaac aaatgaatgc 1560

atatatatgt atatgtatgt gtgtatatat acacatatat atatatattt tttttctttt 1620

cttaccagaa ggttttaatc caaataagga gaagatatgc ttagaactga ggtagagttt 1680

tcatccattc tgtcctgtaa gtattttgca tattctggag acgcaggaag agatccatct 1740

acatatccca aagctgaatt atggtagaca aagctcttcc acttttagtg catcaatttc 1800

ttatttgtgt aataagaaaa ttgggaaaac gatcttcaat atgcttacca agctgtgatt 1860

ccaaatatta cgtaaataca cttgcaaagg aggatgtttt tagtagcaat ttgtactgat 1920

ggtatggggc caagagatat atcttagagg gagggctgag ggtttgaagt ccaactccta 1980

agccagtgcc agaagagcca aggacaggta cggctgtcat cacttagacc tcaccctgtg 2040

gagccacacc ctagggttgg ccaatctact cccaggagca gggagggcag gagccagggc 2100

tgggcataaa agtcagggca gagccatcta ttgcttacat ttgcttctga cacaactgtg 2160

ttcactagca acctcaaaca gacaccatgg tgcacctgac tcctgaggag aagtctgccg 2220

ttactgccct gtggggcaag gtgaacgtgg atgaagttgg tggtgaggcc ctgggcaggt 2280

tggtatcaag gttacaagac aggtttaagg agaccaatag aaactgggca tgtggagaca 2340

gagaagactc ttgggtttct gataggcact gactctctct gcctattggt ctattttccc 2400

acccttaggc tgctggtggt ctacccttgg acccagaggt tctttgagtc ctttggggat 2460

ctgtccactc ctgatgctgt tatgggcaac cctaaggtga aggctcatgg caagaaagtg 2520

ctcggtgcct ttagtgatgg cctggctcac ctggacaacc tcaagggcac ctttgccaca 2580

ctgagtgagc tgcactgtga caagctgcac gtggatcctg agaacttcag ggtgagtcta 2640

tgggaccctt gatgttttct ttccccttct tttctatggt taagttcatg tcataggaag 2700

gggagaagta acagggtaca gtttagaatg ggaaacagac gaatgattgc atcagtgtgg 2760

aagtctcagg atcgttttag tttcttttat ttgctgttca taacaattgt tttcttttgt 2820

ttaattcttg ctttcttttt ttttcttctc cgcaattttt actattatac ttaatgcctt 2880

aacattgtgt ataacaaaag gaaatatctc tgagatacat taagtaactt aaaaaaaaac 2940

tttacacagt ctgcctagta cattactatt tggaatatat gtgtgcttat ttgcatattc 3000

ataatctccc tactttattt tcttttattt ttaattgata cataatcatt atacatattt 3060

atgggttaaa gtgtaatgtt ttaatatgtg tacacatatt gaccaaatca gggtaatttt 3120

gcatttgtaa ttttaaaaaa tgctttcttc ttttaatata cttttttgtt tatcttattt 3180

ctaatacttt ccctaatctc tttctttcag ggcaataatg atacaatgta tcatgcctct 3240

ttgcaccatt ctaaagaata acagtgataa tttctgggtt aaggcaatag caatatttct 3300

gcatataaat atttctgcat ataaattgta actgatgtaa gaggtttcat attgctaata 3360

gcagctacaa tccagctacc attctgcttt tattttatgg ttgggataag gctggattat 3420

tctgagtcca agctaggccc ttttgctaat catgttcata cctcttatct tcctcccaca 3480

gctcctgggc aacgtgctgg tctgtgtgct ggcccatcac tttggcaaag aattcacccc 3540

accagtgcag gctgcctatc agaaagtggt ggctggtgtg gctaatgccc tggcccacaa 3600

gtatcactaa gctcgctttc ttgctgtcca atttctatta aaggttcctt tgttccctaa 3660

gtccaactac taaactgggg gatattatga agggccttga gcatctggat tctgcctaat 3720

aaaaaacatt tattttcatt gcaatgatgt atttaaatta tttctgaata ttttactaaa 3780

aagggaatgt gggaggtcag tgcatttaaa acataaagaa atgaagagct agttcaaacc 3840

ttgggaaaat acactatatc ttaaactcca tgaaagaagg tgaggctgca aacagctaat 3900

gcacattggc aacagccctg atgcctatgc cttattcatc cctcagaaaa ggattcaagt 3960

agaggcttga tttggaggtt aaagttttgc tatgctgtat tttacattac ttattgtttt 4020

agctgtcctc atgaatgtct tttcactacc catttgctta tcctgcatct ctcagccttg 4080

actccactca gttctcttgc ttagagatac cacctttccc ctgaagtgtt ccttccatgt 4140

tttacggcga gatggtttct cctcgcctgg ccactcagcc ttagttgtct ctgttgtctt 4200

atagaggtct acttgaagaa ggaaaaacag ggggcatggt ttgactgtcc tgtgagccct 4260

tcttccctgc ctcccccact cacagtgacc cggaatctgc agtgctagtc tcccggaact 4320

atcactcttt cacagtctgc tttggaagga ctgggcttag tatgaaaagt taggactgag 4380

aagaatttga aagggggctt tttgtagctt gatattcact actgtcttat taccctatca 4440

taggcccacc ccaaatggaa gtcccattct tcctcaggat gtttaagatt agcattcagg 4500

aagagatcag aggtctgctg gctcccttat catgtccctt atggtgcttc tggctctgca 4560

gttattagca tagtgttacc atcaaccacc ttaacttcat ttttcttatt caatacctag 4620

gtaggtagat gctagattct ggaaataaaa tatgagtctc aagtggtcct tgtcctctct 4680

cccagtcaaa ttctgaatct agttggcaag attctgaaat caaggcatat aatcagtaat 4740

aagtgatgat agaagggtat atagaagaat tttattatat gagagggtga aacctaaaat 4800

gaaatgaaat cagacccttg tcttacacca taaacaaaaa taaatttgaa tgggttaaag 4860

aattaaacta agacctaaaa ccataaaaat ttttaaagaa atcaaaagaa gaaaattcta 4920

atattcatgt tgcagccgtt ttttgaattt gatatgagaa gcaaaggcaa caaaaggaaa 4980

aataaagaag tgaggctaca tcaaactaaa aaatttccac acaaaaaaga aaacaatgaa 5040

caaatgaaag gtgaaccatg aaatggcata tttgcaaacc aaatatttct taaatatttt 5100

ggttaatatc caaaatatat aagaaacaca gatgattcaa taacaaacaa aaaattaaaa 5160

ataggaaaat aaaaaaatta aaaagaagaa aatcctgcca tttatgcgag aattgatgaa 5220

cctggaggat gtaaaactaa gaaaaataag cctgacacaa aaagacaaat actacacaac 5280

cttgctcata tgtgaaacat aaaaaagtca ctctcatgga aacagacagt agaggtatgg 5340

tttccagggg ttgggggtgg gagaatcagg aaactattac tcaaagggta taaaatttca 5400

gttatgtggg atgaataaat tctagatatc taatgtacag catcgtgact gtagttaatt 5460

gtactgtaag tatatttaaa atttgcaaag agagtagatt tttttgtttt tttagatgga 5520

gttttgctct tgttgtccag gctggagtgc aatggcaaga tcttggctca ctgcaacctc 5580

cgcctcctgg gttcaagcaa atctcctgcc tcagcctccc gagtagctgg gattacaggc 5640

atgcgacacc atgcccagct aattttgtat ttttagtaga gacggggttt ctccatgttg 5700

gtcaggctga tccgcctcct cggccaccaa agggctggga ttacaggcgt gaccaccggg 5760

cctggccgag agtagatctt aaaagcattt accacaagaa aaaggtaact atgtgagata 5820

atgggtatgt taattagctt gattgtggta atcatttcac aaggtataca tatattaaaa 5880

catcatgttg tacaccttaa atatatacaa tttttatttg tgaatgatac ctcaataaag 5940

ttgaagaata ataaaaaaga atagacatca catgaattaa aaaactaaaa aataaaaaaa 6000

tgcatcttga tgattagaat tgcattcttg atttttcaga tacaaatatc catttgactg 6060

<210> 43

<211> 60

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多核苷酸

<220>

<221> misc_feature

<222> (1)..(2)

<223> 任选的硫代磷酸酯核苷间键

<220>

<221> misc_feature

<222> (2)..(3)

<223> 任选的硫代磷酸酯核苷间键

<220>

<221> misc_feature

<222> (3)..(4)

<223> 任选的硫代磷酸酯核苷间键

<220>

<221> misc_feature

<222> (57)..(58)

<223> 任选的硫代磷酸酯核苷间键

<220>

<221> misc_feature

<222> (58)..(59)

<223> 任选的硫代磷酸酯核苷间键

<220>

<221> misc_feature

<222> (59)..(60)

<223> 任选的硫代磷酸酯核苷间键

<400> 43

aaagaataac agtgataatt tctgggttaa ggcaatagca atatctctgc atataaatat 60

<210> 44

<211> 51

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多核苷酸

<220>

<221> misc_feature

<222> (1)..(2)

<223> 任选的硫代磷酸酯核苷间键

<220>

<221> misc_feature

<222> (2)..(3)

<223> 任选的硫代磷酸酯核苷间键

<220>

<221> misc_feature

<222> (3)..(4)

<223> 任选的硫代磷酸酯核苷间键

<220>

<221> misc_feature

<222> (48)..(49)

<223> 任选的硫代磷酸酯核苷间键

<220>

<221> misc_feature

<222> (49)..(50)

<223> 任选的硫代磷酸酯核苷间键

<220>

<221> misc_feature

<222> (50)..(51)

<223> 任选的硫代磷酸酯核苷间键

<400> 44

gttcagcgtg tccggcgagg gcgaggtgag tctatgggac ccttgatgtt t 51

<210> 45

<211> 51

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多核苷酸

<220>

<221> misc_feature

<222> (1)..(2)

<223> 任选的硫代磷酸酯核苷间键

<220>

<221> misc_feature

<222> (2)..(3)

<223> 任选的硫代磷酸酯核苷间键

<220>

<221> misc_feature

<222> (3)..(4)

<223> 任选的硫代磷酸酯核苷间键

<220>

<221> misc_feature

<222> (48)..(49)

<223> 任选的硫代磷酸酯核苷间键

<220>

<221> misc_feature

<222> (49)..(50)

<223> 任选的硫代磷酸酯核苷间键

<220>

<221> misc_feature

<222> (50)..(51)

<223> 任选的硫代磷酸酯核苷间键

<400> 45

aaacatcaag ggtcccatag actcacctcg ccctcgccgg acacgctgaa c 51

<210> 46

<211> 70

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多核苷酸

<220>

<221> misc_feature

<222> (1)..(2)

<223> 任选的硫代磷酸酯核苷间键

<220>

<221> misc_feature

<222> (2)..(3)

<223> 任选的硫代磷酸酯核苷间键

<220>

<221> misc_feature

<222> (3)..(4)

<223> 任选的硫代磷酸酯核苷间键

<220>

<221> misc_feature

<222> (67)..(68)

<223> 任选的硫代磷酸酯核苷间键

<220>

<221> misc_feature

<222> (68)..(69)

<223> 任选的硫代磷酸酯核苷间键

<220>

<221> misc_feature

<222> (69)..(70)

<223> 任选的硫代磷酸酯核苷间键

<400> 46

cttgccccac agggcagtaa cggcagattt ttcttccggc gttaaatgca ccatggtgtc 60

tgtttgaggt 70

<210> 47

<211> 51

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多核苷酸

<220>

<221> misc_feature

<222> (1)..(2)

<223> 任选的硫代磷酸酯核苷间键

<220>

<221> misc_feature

<222> (2)..(3)

<223> 任选的硫代磷酸酯核苷间键

<220>

<221> misc_feature

<222> (3)..(4)

<223> 任选的硫代磷酸酯核苷间键

<220>

<221> misc_feature

<222> (48)..(49)

<223> 任选的硫代磷酸酯核苷间键

<220>

<221> misc_feature

<222> (49)..(50)

<223> 任选的硫代磷酸酯核苷间键

<220>

<221> misc_feature

<222> (50)..(51)

<223> 任选的硫代磷酸酯核苷间键

<400> 47

acagacacca tggtgcacct gactcctgag gagaagtctg ccgttactgc c 51

<210> 48

<211> 65

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多核苷酸

<220>

<221> misc_feature

<222> (1)..(2)

<223> 任选的硫代磷酸酯核苷间键

<220>

<221> misc_feature

<222> (2)..(3)

<223> 任选的硫代磷酸酯核苷间键

<220>

<221> misc_feature

<222> (3)..(4)

<223> 任选的硫代磷酸酯核苷间键

<220>

<221> misc_feature

<222> (62)..(63)

<223> 任选的硫代磷酸酯核苷间键

<220>

<221> misc_feature

<222> (63)..(64)

<223> 任选的硫代磷酸酯核苷间键

<220>

<221> misc_feature

<222> (64)..(65)

<223> 任选的硫代磷酸酯核苷间键

<400> 48

ttgccccaca gggcagtaac ggcagacttc tcctcaggag tcaggtgcac catggtgtct 60

gtttg 65

<210> 49

<211> 61

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多核苷酸

<220>

<221> misc_feature

<222> (1)..(2)

<223> 任选的硫代磷酸酯核苷间键

<220>

<221> misc_feature

<222> (2)..(3)

<223> 任选的硫代磷酸酯核苷间键

<220>

<221> misc_feature

<222> (3)..(4)

<223> 任选的硫代磷酸酯核苷间键

<220>

<221> misc_feature

<222> (58)..(59)

<223> 任选的硫代磷酸酯核苷间键

<220>

<221> misc_feature

<222> (59)..(60)

<223> 任选的硫代磷酸酯核苷间键

<220>

<221> misc_feature

<222> (60)..(61)

<223> 任选的硫代磷酸酯核苷间键

<400> 49

ttctgtatct atattcatca taggaaacac caaagataat gttctcctta atggtgccag 60

g 61

<210> 50

<211> 61

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多核苷酸

<220>

<221> misc_feature

<222> (1)..(2)

<223> 任选的硫代磷酸酯核苷间键

<220>

<221> misc_feature

<222> (2)..(3)

<223> 任选的硫代磷酸酯核苷间键

<220>

<221> misc_feature

<222> (3)..(4)

<223> 任选的硫代磷酸酯核苷间键

<220>

<221> misc_feature

<222> (58)..(59)

<223> 任选的硫代磷酸酯核苷间键

<220>

<221> misc_feature

<222> (59)..(60)

<223> 任选的硫代磷酸酯核苷间键

<220>

<221> misc_feature

<222> (60)..(61)

<223> 任选的硫代磷酸酯核苷间键

<400> 50

tcttgggatt caataacctt gcagacagtg gaggaaggcc tttggcgtga taccacaggt 60

g 61

<210> 51

<211> 63

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多核苷酸

<220>

<221> misc_feature

<222> (1)..(2)

<223> 任选的硫代磷酸酯核苷间键

<220>

<221> misc_feature

<222> (2)..(3)

<223> 任选的硫代磷酸酯核苷间键

<220>

<221> misc_feature

<222> (3)..(4)

<223> 任选的硫代磷酸酯核苷间键

<220>

<221> misc_feature

<222> (60)..(61)

<223> 任选的硫代磷酸酯核苷间键

<220>

<221> misc_feature

<222> (61)..(62)

<223> 任选的硫代磷酸酯核苷间键

<220>

<221> misc_feature

<222> (62)..(63)

<223> 任选的硫代磷酸酯核苷间键

<400> 51

tccaagtttg cagagaaaga taatatagtc cttggagaag gaggaatcac cctgagtgga 60

ggt 63

<210> 52

<211> 64

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多核苷酸

<220>

<221> misc_feature

<222> (1)..(2)

<223> 任选的硫代磷酸酯核苷间键

<220>

<221> misc_feature

<222> (2)..(3)

<223> 任选的硫代磷酸酯核苷间键

<220>

<221> misc_feature

<222> (3)..(4)

<223> 任选的硫代磷酸酯核苷间键

<220>

<221> misc_feature

<222> (61)..(62)

<223> 任选的硫代磷酸酯核苷间键

<220>

<221> misc_feature

<222> (62)..(63)

<223> 任选的硫代磷酸酯核苷间键

<220>

<221> misc_feature

<222> (63)..(64)

<223> 任选的硫代磷酸酯核苷间键

<400> 52

aggacggtcc cggcctgcga cacttccgcc cataattgtt cttcatctgc ggggcggggg 60

gggg 64

<210> 53

<211> 67

<212> DNA

<213> 人工序列(Artificial Sequence)

<220>

<223> 合成多核苷酸

<220>

<221> misc_feature

<222> (1)..(2)

<223> 任选的硫代磷酸酯核苷间键

<220>

<221> misc_feature

<222> (2)..(3)

<223> 任选的硫代磷酸酯核苷间键

<220>

<221> misc_feature

<222> (3)..(4)

<223> 任选的硫代磷酸酯核苷间键

<220>

<221> misc_feature

<222> (64)..(65)

<223> 任选的硫代磷酸酯核苷间键

<220>

<221> misc_feature

<222> (65)..(66)

<223> 任选的硫代磷酸酯核苷间键

<220>

<221> misc_feature

<222> (66)..(67)

<223> 任选的硫代磷酸酯核苷间键

<400> 53

gggacggcgc ccacataggc caaattcaat tgctgatccc agcttaagac gtactggtca 60

gcctggc 67

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号