首页> 中国专利> 生物合成产生的吡咯啉-羧基-赖氨酸以及通过吡咯啉-羧基-赖氨酸和吡咯赖氨酸残基化学衍生化的位点特异性蛋白修饰

生物合成产生的吡咯啉-羧基-赖氨酸以及通过吡咯啉-羧基-赖氨酸和吡咯赖氨酸残基化学衍生化的位点特异性蛋白修饰

摘要

本文公开了吡咯赖氨酸类似物吡咯啉-羧基-赖氨酸(PCL),以及生物合成产生PCL的方法,其中PCL是天然的、生物合成产生的氨基酸。本文还公开了具有掺入其中的PCL的蛋白质、多肽和肽,以及将PCL掺入蛋白质、多肽和肽中的方法。本文还公开了位点特异性衍生化具有掺入其中的PCL或吡咯赖氨酸的蛋白质、多肽和肽的方法。本文还公开了具有掺入其中的PCL或吡咯赖氨酸的蛋白质、多肽和肽的交联。

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2018-10-16

    未缴年费专利权终止 IPC(主分类):C07D207/20 授权公告日:20150909 终止日期:20171023 申请日:20091023

    专利权的终止

  • 2016-01-20

    专利权的转移 IPC(主分类):C07D207/20 登记生效日:20160104 变更前: 变更后: 申请日:20091023

    专利申请权、专利权的转移

  • 2015-09-09

    授权

    授权

  • 2012-01-11

    实质审查的生效 IPC(主分类):C07D207/20 申请日:20091023

    实质审查的生效

  • 2011-11-30

    公开

    公开

说明书

与相关申请的交叉引用

本申请根据35U.S.C.§119(e)要求2008年10月24日提交的美国临时 专利申请61/108,434的优先权权益。将该在先申请的公开内容以其全文在 此引入作为参考并用于所有目。

发明领域

本发明涉及将遗传编码的氨基酸选择性地引入蛋白质。本发明还涉及 此类氨基酸的化学衍生化。

发明背景

甲烷八叠球菌科(Methanosarcina)的产甲烷古细菌的甲胺甲基转移酶 天然含有吡咯赖氨酸(PYL)。吡咯赖氨酸是共翻译地掺入各mRNA中阅读 框内UAG密码子的赖氨酸类似物,并且其被认为是第22种天然氨基酸。

附图说明

图1.吡咯赖氨酸(PYL)和吡咯赖氨酸类似物吡咯啉-羧基-赖氨酸 (PCL:PCL-A或PCL-B)的结构。

图2.吡咯赖氨酸(A)和PCL(B)的可能的生物合成途径的比较。

图3.用吡咯赖氨酸(A)和PCL(B)对pylTtRNA的氨酰化。

图4A.携带有用于在哺乳动物细胞中掺入生物合成衍生的PCL或吡 咯赖氨酸的pylT、pylS、pylB、pylC和pylD的质粒,以及携带有模式蛋白 hRBP4的单位点TAG突变基因构建物的质粒。

图4B.hRBP4、mEPO、hEPO和mIgG1的单位点TAG突变基因构 建物。通过箭头指出了所述单位点。

图5.携带有用于在大肠杆菌(Escherichia coli)细胞中掺入生物合成衍 生的PCL或吡咯赖氨酸的pylT、pylS、pylB、pylC和pylD的质粒。

图6A.在HEK293F细胞中表达hRBP4。hRBP4的TAG突变构建物 (#1-9)。SDS-PAGE之后用抗His抗体进行蛋白质印迹。26kDa处的箭头 指示全长hRBP4。

图6B和6C.在D-鸟氨酸的存在下在HEK293F细胞中产生的纯化的 hRBP4Phe62PCL的SDS-PAGE(A)和质谱(B)。

图7.hRBP4Phe122PCL的胰蛋白酶消化的质谱分析表明在靶 Phe122TAG位点掺入了PCL。YWGVASF*LQK(F*=PCL)(SEQ ID NO:17)的指定MS/MS谱。

图8.hRBP4Phe122PCL的胰蛋白酶消化的质谱光谱测定分析 (YWGVASF*LQK的2+离子的TIC和EIC)(SEQ ID NO:17)表明在靶 Phe122TAG位点掺入了PCL。

图9.hRBP4Phe122PCL的胰蛋白酶消化的质谱分析。该质谱显示了 YWGVASF*LQK(SEQ ID NO:17)的3+和2+前体,表明在靶Phe122TAG 位点掺入了PCL。

图10.在HEK293F细胞的裂解产物中检测从D-鸟氨酸生物合成的 PCL。

图11.在HEK293F细胞中,N-ε-环戊基氧基羰基-L-赖氨酸(CYC) 掺入各种hRBP4TAG突变蛋白质中。图11A显示了CYC在hRBP4中不 同位点的掺入,如通过SDS-PAGE和用抗-Hig-标签及抗-RBP4抗体的蛋 白质印迹法所检测的那样。图11B显示了纯化的hRBP4Phe62CYC(突变 体#2)的SDS-PAGE结果。图11C显示了hRBP4Phe62CYC的质谱。

图12.在hRBP4突变体Phe62CYC的TAG位点掺入CYC的质谱验 证。

图13.作为各种前体的函数的PCL掺入,以及应用HEK293F细胞将 各种吡咯赖氨酸类似物(包括CYC)直接掺入hRBP4TAG突变蛋白中(图 13A和图13B),以及应用生物合成基因pylB、pylC和pylD的不同组合的 PCL掺入(图13C)。图13A是使用了抗-His-标签抗体的未纯化样品的蛋白 质印迹,且图13B是Ni-NTA纯化的蛋白质的SDS-PAGE凝胶。

图14.PCL生物合成的可能前体(A),以及各种吡咯赖氨酸类似物(B)。

图15.用于在HK100细胞中将PCL掺入FASTE的各种前体和基因 组合的评估。

图16.PCL(PCL-A)形成的可能生物合成流程。

图17A.生物合成产生的PCL在小鼠IgG1Fc结构域中单TAG编码 位点(4个位点)的位点特异性掺入。

图17B.生物合成产生的PCL在促红细胞生成素(EPO)中单TAG编码 位点(11个位点)的位点特异性掺入,通过SDS-PAGE所检测。

图18.生物合成产生的PCL在人脂肪酸合成酶(FAS-TE)硫酯酶结构 域中单TAG编码位点(2个位点)的位点特异性掺入。图18显示了 SDS-PAGE(A)和PCL掺入的质谱(B)。

图19.生物合成产生的PCL在FKBP-12中的单TAG编码位点(1个 位点)的位点特异性掺入。图19显示了SDS-PAGE(A)和PCL掺入的质谱 (B),以及FKBP12-I90PCL的晶体(C)。

图20.生物合成产生的PCL在成纤维细胞生长因子21(FGF21)中的单 TAG编码位点(20个位点)的位点特异性掺入。SDS-PAGE显示了PCL在 多个位点掺入FGF21中。

图21.图21A显示了在pylB存在或不存在下,PYL或PCL掺入谷氨 酰胺Gln21(CAA)突变为TAG终止密码子的mTNF-α的SDS-PAGE分析。 图21B是评估蛋白质纯度的SDS-PAGE。图21C是在大肠杆菌中表达的 mEGF Tyr10TAG的完整质谱,提示了具有掺入的PYL和PCL(图21C, 底部)并且主要是PCL(图21C,顶部)的蛋白质的混合物。

图22.用2-氨基-苯甲醛对PCL化学衍生的可能反应流程。

图23.用2-氨基苯甲醛、2-氨基苯乙酮和2-氨基-5-硝基-二苯甲酮衍生 化PCL后的假设的蛋白质缀合物及质量改变。

图24.2-氨基-苯甲醛(2-ABA)衍生的hRBP4Phe122PCL的质谱分析。

图25.2-ABA-衍生的hRBP4Phe122PCL蛋白质的胰蛋白酶消化的质 谱分析证实了在TAG位点掺入PCL残基的衍生化。YWGVASF*LQK肽 (SEQ ID NO:17)。

图26.用2-ABA衍生化hRBP4Phe122PCL的pH依赖性的评估。

图27.评估作为反应物与蛋白质浓度比的函数的反应效率、以及与 2-ABA、2-ANBP和2-AAP反应性。

图28.以大于4700的摩尔比(A:2-ABA超过蛋白质4700倍)以及掺入 有OMePhe的hRBP4(B:超过15400倍)的衍生化。

图29.用2-氨基-苯乙酮(2-AAP)对FAS-TE Tyr2454PCL的衍生化。 未处理的样品(A和C)以及在pH 5.0(B)和pH 7.4(D)用2-AAP衍生的样 品的质谱。

图30.通过用2-氨基-苯甲醛或2-氨基-苯甲醛类似物化学衍生化吡咯 赖氨酸和/或PCL,从而位点特异性修饰蛋白质的一般反应流程。

图31.通过掺入蛋白质的PCL残基将功能化PEG聚合物2-氨基-苯乙 酮-PEG8(2-AAP-PEG8;TU3205-044)偶联至蛋白质的实施方案的图示说 明。

图32.用2-AAP-PEG8衍生化hRBP4Phe122PCL。在pH 7.5(A)和 pH 5.0(B)用2-AAP-PEG8衍生化后,122位掺入了PCL的hRBP4的质谱, 与未反应的hRBP4Phe122PCL蛋白质(C)以及添加了2-AAP-PEG8的野生 型hRBP4(D和E)和未添加2-AAP-PEG8的野生型hRBP4相比较。

图33.用2-AAP-PEG8对FAS-TE Tyr2454PCL的衍生化。未反应的 蛋白(A)以及与2-AAP-PEG8(TU3205-044)反应的FAS-TE Tyr2454PCL蛋 白(B)的质谱。图33C和33D显示了2.4kDa 2-AAP-PEG(TU3205-048)对 FAS-TE Tyr2454PCL的衍生化。(图33C在室温下衍生化,而图33D在4 ℃衍生化)。

图34.用0.5kDa 2-AAP-PEG(2-AAP-PEG8)、2.4kDa 2-AAP-PEG和 23kDa 2-AAP-PEG以所示摩尔比对FAS-TE Tyr2454PCL的聚乙二醇化。

图35.用2-AAP-PEG8对FGF21Lys81PCL的衍生化。未反应的 FGF21Lys84PCL(A)和在用2-AAP-PEG8衍生化后的FGF21 Lys84PCL(B)的质谱。

图36.FGF21蛋白质的聚乙二醇化。在用23kDa 2-AAP-PEG对7种 FGF21PCL突变体衍生化后获得的SDS-PAGE结果显示了部分纯化之前 (A)和之后(B)的PEG-FGF21、全长(FL)FGF21-PCL和截短的(TR) FGF21-PCL。

图37.EPO蛋白的聚乙二醇化。用23kDa 2-AAP-PEG对小鼠EPO PCL突变体衍生化后的SDS-PAGE。

图38.用氨基糖对PCL的衍生化。其中将D-甘露糖胺与其中掺入了 PCL的蛋白质(图示为R1)偶联的一般反应流程。

图39.用D-甘露糖胺对hRBP4Phe122PCL的衍生化。在与甘露糖胺 反应后,在122位掺入了PCL的hRBP4的质谱。

图40.用D-甘露糖胺对FAS-TE Leu2222PCL的衍生化。在2222位 置掺入了PCL的未反应的人脂肪酸合成酶(FAS-TE)(FAS-TE  Leu2222PCL/Leu2223Ile)(A),以及与甘露糖胺反应的蛋白质(B)的质谱。

图41.通过使与寡糖连接的2-ABA部分与掺入蛋白质的PCL反应, 从而将寡糖位点特异性地与蛋白质连接的实施方案的图示说明。

图42.通过交联具有掺入其中的PCL的蛋白质从而形成的蛋白质-蛋 白质缀合物(异源二聚体、异源三聚体、同源三聚体)的某些实施方案的图 示说明。

图43.使用PCL特异性、双官能交联剂的同源二聚体形成,如对 FGF21Lys84PCL蛋白所描述的那样。用于形成同源二聚体的双官能交联 剂的非限制性实例显示于A中,以及应用该双官能交联剂交联的FGF-21 Lys84PCL的反应混合物的质谱显示于B中。

图44.使用双官能交联剂形成FGF-21PCL突变体蛋白的同源二聚 体。图44A显示了交联的FGF-21的质谱,其中该反应条件与在图43中使 用的那些有所改变。

图45.用于形成三聚体的交联剂的实施方案。

图46.位点特异性标签和应用本文提供的方法标记的各实施方案的图 示说明。

图47.图47A显示了与生物素缀合的mEGF-Y10PCL的ESI质谱分 析。图47B显示了应用辣根过氧化物酶(HRP)缀合的山羊抗生物素抗体对 mEGF-Y10PCL-ABA-生物素缀合物进行蛋白质印迹分析。图47C显示了 与荧光素缀合的mEGF-Y10PCL的ESI质谱分析。图47D显示了与二糖 缀合的mEGF-Y10PCL的ESI质谱分析。

图48.图48A显示了与单-硝基苯基半抗原缀合的mTNF-Q21PCL的 ESI质谱分析。图48B显示了与单-硝基苯基半抗原缀合的mEGF-Y10PCL 的ESI质谱分析。图48C显示了与二-硝基苯基半抗原缀合的 mTNF-Q21PCL的ESI质谱分析。图48D显示了与二-硝基苯基半抗原缀 合的mEGF-Y10PCL的ESI质谱分析。

图49.图49A显示了与TLR7激动剂缀合的mEGF-Y10PCL的ESI 质谱分析,图49B显示了与磷脂缀合的mEGF-Y10PCL的ESI质谱分析。

图50.图50A和图50B显示了在两种不同的pH值(图50A:pH 5.0; 图50B:pH 7.5)与PX2-PADRE缀合的mTNF-Q21PCL的MALDI-TOF 质谱分析。图50C显示了与BHA-exPADRE缀合的mTNF-Q21PCL的ESI 质谱分析。

图51.图51是显示了BHA-exPADRE与mEGF-Y10PCL偶联的ESI 质谱。

图52.图52A是BHA-BG1(7.4kDa)和BHA-BG2(7.4kDa)偶联至 mTNF-Q21PCL(19.3kDa)的凝胶移动测试。图52B是BHA-BG2(7.4kDa) 偶联至mEGF-Y10PCL(7.2kDa)的凝胶移动测试。

图53.图53图示了此类位点特异性定向连接的实施方案。

图54.图54A显示了与2-ABA偶联并随后用20mM NaCNBH3还原 1小时的hFGF21-K150PCL的ESI质谱分析。图54B显示了透析至10mM 磷酸盐缓冲液(pH 7.5)中并在50℃温育一天后的还原hFGF21-K150PCL 2-ABA缀合物的ESI质谱分析。

图55.图55说明了应用NaCNBH3还原或不用其还原的聚乙二醇化 FGF21的PCL连接的稳定性。还原样品和未还原样品的SDS-PAGE凝胶 显示于图55A。此外,图55B显示了在4℃、室温、37℃、50℃以及95℃ 温育60小时的未还原样品的SDS-PAGE凝胶。

图56.PCL-A与2-ABA反应的NMR分析。

图57.图57A是PCL-A与2-ABA反应得到的产物的推定结构。图57B 显示了PCL-A与2-ABA反应得到的产物的推定平衡结构。图57C是还原 产物的推定结构。

图58.PCL-B与2-ABA反应的NMR分析。

图59.掺入mEGF中的吡咯赖氨酸(Pyl)和PCL的衍生化。

发明概述

本文提供了具有一个或多个掺入其中的PCL的蛋白质和/或多肽,其 中所述PCL是生物合成产生的并且掺入该蛋白质和/或多肽中。本文还提 供了具有一个或多个掺入其中的吡咯赖氨酸(PYL)的蛋白质和/或多肽,其 中所述PYL是生物合成产生的并且掺入该蛋白质和/或多肽中。本文还提 供了具有一个或多个掺入其中的PCL以及一个或多个掺入其中的PYL的 蛋白质和/或多肽,其中所述PCL和PYL是生物合成产生的并且掺入蛋白 质和/或多肽中。

本文还提供了具有一个或多个PCL部分的蛋白质和/或多肽,其中所 述PCL是生物合成产生的并且掺入蛋白质和/或多肽中,并且一个或多个 PCL部分被衍生化,由此使选自以下的基团偶联至该蛋白质和/或多肽:标 记物、染料、聚合物、水溶性聚合物、聚烷基二醇、聚乙二醇、聚乙二醇 衍生物、糖、脂类、光交联剂、细胞毒性化合物、药物、亲和标记物、光 亲和标记物、反应性化合物;树脂、肽、另一种蛋白质或多肽或多肽类似 物、抗体或抗体片段、金属螯合剂、辅因子、脂肪酸、碳水化合物、多核 苷酸、DNA、RNA、PCR探针、反义多核苷酸、核糖寡核苷酸、脱氧核 糖寡核苷酸、硫代磷酸酯(phosphorothioate)-修饰的DNA、修饰的DNA和 RNA、肽核酸、糖类、二糖、寡糖、多糖、水溶性树枝状聚合物(dendrimer)、 环糊精、生物材料、纳米颗粒、自旋标记物、荧光团、含金属的部分(moiety)、 放射性部分、新官能团、与其他分子共价或非共价相互作用的基团、光笼 获(photocaged)部分、可光化辐射激发的部分、配体、可光异构化的部分、 生物素、生物素类似物、掺有重原子的部分、化学可裂解基团、光可裂解 基团、长侧链、碳连接的糖、氧化还原活化剂、氨基硫代酸、毒性部分、 同位素标记的部分、生物物理探针、磷光基团、发色团、化学发光基团、 荧光部分、电子致密基团、磁性基团、嵌入(intercalating)基团、螯合基团、 生色团、能量转移剂、生物活性剂、可检测标记物、小分子、抑制性核糖 核酸、siRNA、放射性核苷酸、中子俘获剂、生物素衍生物、量子点、纳 米递质、放射性递质、抗体酶、酶、活化的复合活化剂(complex activator)、 病毒、毒素、佐剂、TLR2激动剂、TLR4激动剂、TLR7激动剂、TLR9 激动剂、TLR8激动剂、T-细胞表位、磷脂、LPS-样分子、钥孔血蓝蛋白 (KLH)、免疫原性半抗原、aglycan、变应原、制管张素(angiostatin)、抗激 素药、抗氧化剂、适体、指导RNA、皂角苷、穿梭载体、大分子、模拟表 位、受体、反胶束、洗涤剂、免疫反应增效剂、荧光染料、FRET试剂、 放射成像探针、其他的光谱学探针、药物前体、用于免疫治疗的毒素、固 体支持物、-CH2CH2-(OCH2CH2O)p-OX2、以及-O-(CH2CH2O)pCH2CH2-X2(其中p是1至10,000,且X2是H、C1-8烷基、保护基团或末端官能团)。

在某些实施方案中,此类蛋白质和/或多肽具有一个或多个掺入其中的 PYL部分,其中所述PYL是生物合成产生的并且掺入所述蛋白质和/或多 肽中,该吡咯赖氨酸被衍生化,从而使上文为具有一个或多个掺入其中的 PCL1部分的蛋白质和/或多肽给出的上述基团之一偶联至该蛋白质和/或 多肽。

在某些实施方案中,此类蛋白质和/或多肽具有掺入其中的一个或多个 PCL和一个或多个PYL部分,其中所述PCL和PYL是生物合成产生的 并且掺入所述蛋白质和/或多肽中,该PCL和吡咯赖氨酸被衍生化,从而 使上文为具有一个或多个掺入其中的PCL1部分的蛋白质和/或多肽给出的 上述基团之一偶联至该蛋白质和/或多肽。

在某些实施方案中,上述生物合成发生在真核细胞、哺乳动物细胞、 酵母细胞或昆虫细胞中。在某些实施方案中,所述细胞是大肠杆菌细胞, 而在其他实施方案中,酵母细胞是酿酒酵母(Saccharomyces cerevisiae)或 Pichia pastoralis细胞。在某些实施方案中,所述细胞是CHO细胞、HeLa 细胞、HEK293F细胞或sf9细胞。

本文提供的一个方面是具有式(I)或式(II)结构的化合物:

R1-(AA)n-R2   R1-(BB)n-R2

(I)              (II)

其中,

R1是H或氨基末端修饰基团;

R2是OH或羧基末端修饰基团;

n是1至5000的整数;

每一个AA独立地选自氨基酸残基、具有式(A-2)结构的吡咯赖氨酸类 似物氨基酸残基以及具有式(B-2)结构的吡咯赖氨酸类似物氨基酸残基;

每一个BB独立地选自氨基酸残基、具有式(A-2)结构的吡咯赖氨酸类 似物、具有式(B-2)结构的吡咯赖氨酸类似物氨基酸残基、具有式(C-1)结构 的吡咯赖氨酸类似物氨基酸残基、具有式(D-1)结构的吡咯赖氨酸类似物氨 基酸残基、具有式(E-1)结构的吡咯赖氨酸类似物氨基酸残基、具有式(F-1) 结构的吡咯赖氨酸类似物氨基酸残基、具有式(G-1)结构的吡咯赖氨酸类似 物氨基酸残基、具有式(H-1)结构的吡咯赖氨酸类似物氨基酸残基、具有式 (I-1)结构的吡咯赖氨酸类似物氨基酸残基、具有式(J-1)结构的吡咯赖氨酸 类似物氨基酸残基、具有式(K-1)结构的吡咯赖氨酸类似物氨基酸残基以及 具有式(L-1)结构的吡咯赖氨酸类似物氨基酸残基;

其中:

R3、R5和每一个R4独立地选自H、-OH、-NO2、卤代、C1-8烷基、 卤素取代的-C1-8烷基、羟基取代的-C1-8烷基、芳基、杂芳基、杂环烷基或 环烷基和-LX1

R6是H或C1烷基;

A是C3-C8环烷基、C3-C8杂环烷基、5-6元单环芳基、5-6元单环杂 芳基、9-10元稠合二环或13-14元稠合三环,其中A任选地被1至5个独 立地选自-OH、-NO2、卤代、C1-8烷基、卤素取代的-C1-8烷基、羟基取代 的-C1-8烷基、芳基、杂芳基、杂环烷基或环烷基以及-LX1的取代基取代;

L选自键(bond)、C1-8亚烷基、卤素取代的-C1-8亚烷基、羟基取代的-C1-8亚烷基、C2-8亚烯基、卤素取代的-C2-8亚烯基、羟基取代的-C2-8亚烯基、 聚烷基二醇、聚乙二醇、-O(CR11R12)k-、-S(CR11R12)k-、-S(O)k(CR11R12)k-、 -O(CR11R12)k-NR11C(O)-、-O(CR11R12)kC(O)NR11-、-C(O)-、 -C(O)(CR11R12)k-、-C(S)-、-C(S)(CR11R12)k-、-C(O)NR11-、-NR11C(O)-、 -NR11(CR11R12)k-、-CONR11(CR11R12)k-、-N(R11)CO(CR11R12)k-、 -C(O)NR11(CR11R12)k-、-NR11C(O)(CR11R12)k-,其中每一个R11和R12独立 地是H、C1-8烷基、卤素取代的-C1-8烷基或羟基取代的-C1-8烷基,并且k 是1至12的整数;且

X1选自标记物、染料、聚合物、水溶性聚合物、聚烷基二醇、聚乙二 醇、聚乙二醇衍生物、糖、脂类、光交联剂、细胞毒性化合物、药物、亲 和标记物、光亲和标记物、反应性化合物;树脂、肽、另一种蛋白质或多 肽或多肽类似物、抗体或抗体片段、金属螯合剂、辅因子、脂肪酸、碳水 化合物、多核苷酸、DNA、RNA、PCR探针、反义多核苷酸、核糖寡核 苷酸、脱氧核糖寡核苷酸、硫代磷酸酯-修饰的DNA、修饰的DNA和RNA、 肽核酸、糖类、二糖、寡糖、多糖、水溶性树枝状聚合物、环糊精、生物 材料、纳米颗粒、自旋标记物、荧光团、含金属的部分、放射性部分、新 官能团、与其他分子共价或非共价相互作用的基团、光笼获部分、可光化 辐射激发的部分、配体、可光异构化的部分、生物素、生物素类似物、掺 有重原子的部分、化学可裂解基团、光可裂解基团、长侧链、碳连接的糖、 氧化还原活化剂、氨基硫代酸、毒性部分、同位素标记的部分、生物物理 探针、磷光基团、发色团、化学发光基团、荧光部分、电子致密基团、磁 性基团、嵌入基团、螯合基团、生色团、能量转移剂、生物活性剂、可检 测标记物、小分子、抑制性核糖核酸、siRNA、放射性核苷酸、中子俘获 剂、生物素衍生物、量子点、纳米递质、放射性递质、抗体酶、酶、活化 的复合活化剂、病毒、毒素、佐剂、TLR2激动剂、TLR4激动剂、TLR7 激动剂、TLR9激动剂、TLR8激动剂、T-细胞表位、磷脂、LPS-样分子、 钥孔血蓝蛋白(KLH)、免疫原性半抗原、aglycan、变应原、制管张素、抗 激素药、抗氧化剂、适体、指导RNA、皂角苷、穿梭载体、大分子、模拟 表位、受体、反胶束、洗涤剂、免疫反应增效剂、荧光染料、FRET试剂、 放射成像探针、其他的光谱学探针、药物前体、用于免疫治疗的毒素、固 体支持物、-CH2CH2-(OCH2CH2O)p-OX2、-O-(CH2CH2O)pCH2CH2-X2, 及其任意组合,其中p是1至10,000,且X2是H、C1-8烷基、保护基团或 末端官能团;且

其中至少一个AA是具有式(A-2)或式(B-2)结构的吡咯赖氨酸类似物氨 基酸残基;或至少一个BB是具有式(C-1)或式(D-1)或式(E-1)或式(F-1)或式 (G-1)或式(H-1)或式(I-1)或式(J-1)或式(K-1)或式(L-1)结构的吡咯赖氨酸类 似物氨基酸残基。

在此类化合物的某些实施方案中,环A选自:呋喃、噻吩、吡咯、吡 咯啉、吡咯烷、二氧戊环、唑、噻唑、咪唑、咪唑啉、咪唑烷、吡唑、 吡唑啉、吡唑烷、异唑、异噻唑、二唑、三唑、噻二唑、吡喃、吡啶、 哌啶、二烷、吗啉、二噻烷、硫吗啉、哒嗪、嘧啶、吡嗪、哌嗪、三嗪、 三噻烷、吲嗪、吲哚、异吲哚、吲哚啉、苯并呋喃、苯并噻吩、吲唑、苯 并咪唑、苯并噻唑、嘌呤、喹嗪、喹啉、异喹啉、噌啉、酞嗪、喹唑啉、 喹喔啉、萘啶、蝶啶、奎宁环、咔唑、吖啶、吩嗪、吩噻嗪、吩嗪、苯 基、茚、萘、甘菊环、芴、蒽、菲(phenanthracene)、降冰片烷(norborane) 和金刚烷(adamantine)。

在此类化合物的其它实施方案中,环A选自苯基、呋喃、噻吩、吡咯、 吡咯啉、吡咯烷、二氧戊环、唑、噻唑、咪唑、咪唑啉、咪唑烷、吡唑、 吡唑啉、吡唑烷、异唑、异噻唑、二唑、三唑、噻二唑、吡喃、吡啶、 哌啶、二烷、吗啉、二噻烷、硫吗啉、哒嗪、嘧啶、吡嗪、哌嗪、三嗪 和三噻烷。

在此类化合物的其它实施方案中,环A选自吲嗪、吲哚、异吲哚、吲 哚啉、苯并呋喃、苯并噻吩、吲唑、苯并咪唑、苯并噻唑、嘌呤、喹嗪、 喹啉、异喹啉、噌啉、酞嗪、喹唑啉、喹喔啉、萘啶、蝶啶、奎宁环、咔 唑、吖啶、吩嗪、吩噻嗪、吩嗪、茚、萘、甘菊环、芴、蒽、菲、降冰 片烷和金刚烷。

在此类化合物的其它实施方案中,环A选自苯基、萘和吡啶。

在此类化合物的某些实施方案中,每一个BB独立地选自氨基酸残基、 具有式(A-2)结构的吡咯赖氨酸类似物、具有式(B-2)结构的吡咯赖氨酸类似 物氨基酸残基、具有式(C-1)结构的吡咯赖氨酸类似物氨基酸残基、具有式 (D-2)结构的吡咯赖氨酸类似物氨基酸残基、具有式(E-1)结构的吡咯赖氨酸 类似物氨基酸残基、具有式(F-2)结构的吡咯赖氨酸类似物氨基酸残基、具 有式(G-1)结构的吡咯赖氨酸类似物氨基酸残基、具有式(H-2)结构的吡咯赖 氨酸类似物氨基酸残基、具有式(I-1)结构的吡咯赖氨酸类似物氨基酸残基、 具有式(J-2)结构的吡咯赖氨酸类似物氨基酸残基、具有式(K-1)结构的吡咯 赖氨酸类似物氨基酸残基以及具有式(L-2)结构的吡咯赖氨酸类似物氨基 酸残基;

其中,

R3、R5和每一个R4独立地选自H、-OH、-NO2、卤代、C1-8烷基、 卤素取代的-C1-8烷基、羟基取代的-C1-8烷基、芳基、杂芳基、杂环烷基或 环烷基和-LX1

R6是H或C1烷基;

当存在时,每一个R7独立地选自-OH、-NO2、卤代、C1-8烷基、卤素 取代的-C1-8烷基、羟基取代的-C1-8烷基、芳基、杂芳基、杂环烷基或环烷 基和-LX1

L选自键、C1-8亚烷基、卤素取代的-C1-8亚烷基、羟基取代的-C1-8亚 烷基、C2-8亚烯基、卤素取代的-C2-8亚烯基、羟基取代的-C2-8亚烯基、聚 烷基二醇、聚乙二醇、-O(CR11R12)k-、-S(CR11R12)k-、-S(O)k(CR11R12)k-、 -O(CR11R12)k-NR11C(O)-、-O(CR11R12)kC(O)NR11-、-C(O)-、 -C(O)(CR11R12)k-、-C(S)-、-C(S)(CR11R12)k-、-C(O)NR11-、-NR11C(O)-、 -NR11(CR11R12)k-、-CONR11(CR11R12)k-、-N(R11)CO(CR11R12)k-、 -C(O)NR11(CR11R12)k-、-NR11C(O)(CR11R12)k-,其中每一个R11和R12独立 地是H、C1-8烷基、卤素取代的-C1-8烷基或羟基取代的-C1-8烷基,并且k 是1至12的整数;且

X1选自标记物、染料、聚合物、水溶性聚合物、聚烷基二醇、聚乙二 醇、聚乙二醇衍生物、糖、脂类、光交联剂、细胞毒性化合物、药物、亲 和标记物、光亲和标记物、反应性化合物;树脂、肽、另一种蛋白质或多 肽或多肽类似物、抗体或抗体片段、金属螯合剂、辅因子、脂肪酸、碳水 化合物、多核苷酸、DNA、RNA、PCR探针、反义多核苷酸、核糖寡核 苷酸、脱氧核糖寡核苷酸、硫代磷酸酯-修饰的DNA、修饰的DNA和RNA、 肽核酸、糖类、二糖、寡糖、多糖、水溶性树枝状聚合物、环糊精、生物 材料、纳米颗粒、自旋标记物、荧光团、含金属的部分、放射性部分、新 官能团、与其他分子共价或非共价相互作用的基团、光笼获部分、可光化 辐射激发的部分、配体、可光异构化的部分、生物素、生物素类似物、掺 有重原子的部分、化学可裂解基团、光可裂解基团、长侧链、碳连接的糖、 氧化还原活化剂、氨基硫代酸、毒性部分、同位素标记的部分、生物物理 探针、磷光基团、发色团、化学发光基团、荧光部分、电子致密基团、磁 性基团、嵌入基团、螯合基团、生色团、能量转移剂、生物活性剂、可检 测标记物、小分子、抑制性核糖核酸、siRNA、放射性核苷酸、中子俘获 剂、生物素衍生物、量子点、纳米递质、放射性递质、抗体酶、酶、活化 的复合活化剂、病毒、毒素、佐剂、TLR2激动剂、TLR4激动剂、TLR7 激动剂、TLR9激动剂、TLR8激动剂、T-细胞表位、磷脂、LPS-样分子、 钥孔血蓝蛋白(KLH)、免疫原性半抗原、aglycan、变应原、制管张素、抗 激素药、抗氧化剂、适体、指导RNA、皂角苷、穿梭载体、大分子、模拟 表位、受体、反胶束、洗涤剂、免疫反应增效剂、荧光染料、FRET试剂、 放射成像探针、其他的光谱学探针、药物前体、用于免疫治疗的毒素、固 体支持物、-CH2CH2-(OCH2CH2O)p-OX2、-O-(CH2CH2O)pCH2CH2-X2, 及其任意组合,其中p是1至10,000,且X2是H、C1-8烷基、保护基团或 末端官能团。

在此类化合物的某些实施方案中,R6是H,而在此类化合物的其它实 施方案中,R6是C1烷基。

在此类化合物的某些实施方案中,R5-LX1。在此类化合物的某些实 施方案中,R7是-LX1。在此类化合物的某些实施方案中,X1是糖、聚乙 二醇、荧光部分、免疫调节剂、核糖核酸、脱氧核糖核酸、蛋白质、肽、 生物素、磷脂、TLR7激动剂、免疫原性半抗原或固体支持物。在此类化 合物的某些实施方案中,L是聚(烷基二醇)、聚(乙二醇)、C1-8亚烷基、卤 素取代的-C1-8亚烷基或羟基取代的-C1-8亚烷基。

本文另一方面提供了用于衍生化蛋白质的方法,其中该蛋白质具有根 据式(I)的结构,所述方法包括使蛋白质与式(III)或式(IV)的试剂接触;其 中式(I)相应于:

R1-(AA)n-R2

(I)

其中,

R1是H或氨基末端修饰基团

R2是OH或羧基末端修饰基团;

n是1至5000的整数;

每一个AA独立地选自氨基酸残基、吡咯赖氨酸氨基酸残基、具有式 (A-1)结构的吡咯赖氨酸类似物氨基酸残基和具有式(B-1)结构的吡咯赖氨 酸类似物氨基酸残基;

R6是H或C1烷基;且

至少一个AA是吡咯赖氨酸氨基酸残基、具有式(A-1)或式(B-1)结构的 吡咯赖氨酸类似物氨基酸残基;

并且其中式(II)和式(III)相应于:

其中:

R3、R5和每一个R4独立地选自H、-OH、-NO2、卤代、C1-8烷基、 卤素取代的-C1-8烷基、羟基取代的-C1-8烷基、芳基、杂芳基、杂环烷基或 环烷基和-LX1

A是C3-C8环烷基、C3-C8杂环烷基、5-6元单环芳基、5-6元单环杂 芳基、9-10元稠合二环或13-14元稠合三环,其中A任选地被1至5个独 立地选自-OH、-NO2、卤代、C1-8烷基、卤素取代的-C1-8烷基、羟基取代 的-C1-8烷基、芳基、杂芳基、杂环烷基或环烷基和-LX1的取代基取代;

L选自键、C1-8亚烷基、卤素取代的-C1-8亚烷基、羟基取代的-C1-8亚 烷基、C2-8亚烯基、卤素取代的-C2-8亚烯基、羟基取代的-C2-8亚烯基、聚 烷基二醇、聚(乙二醇)、-O(CR11R12)k-、-S(CR11R12)k-、-S(O)k(CR11R12)k-、 -O(CR11R12)k-NR11C(O)-、-O(CR11R12)kC(O)NR11-、-C(O)-、 -C(O)(CR11R12)k-、-C(S)-、-C(S)(CR11R12)k-、-C(O)NR11-、-NR11C(O)-、 -NR11(CR11R12)k-、-CONR11(CR11R12)k-、-N(R11)CO(CR11R12)k-、 -C(O)NR11(CR11R12)k-、-NR11C(O)(CR11R12)k-,其中每一个R11和R12独立 地是H、C1-8烷基、卤素取代的-C1-8烷基或羟基取代的-C1-8烷基,并且k 是1至12的整数;且

X1选自标记物、染料、聚合物、水溶性聚合物、聚烷基二醇、聚(乙二 醇)、聚(乙二醇)的衍生物、糖、脂类、光交联剂、细胞毒性化合物、药物、 亲和标记物、光亲和标记物、反应性化合物;树脂、肽、另一种蛋白质或 多肽或多肽类似物、抗体或抗体片段、金属螯合剂、辅因子、脂肪酸、碳 水化合物、多核苷酸、DNA、RNA、PCR探针、反义多核苷酸、核糖寡 核苷酸、脱氧核糖寡核苷酸、硫代磷酸酯-修饰的DNA、修饰的DNA和 RNA、肽核酸、糖类、二糖、寡糖、多糖、水溶性树枝状聚合物、环糊精、 生物材料、纳米颗粒、自旋标记物、荧光团、含金属的部分、放射性部分、 新官能团、与其他分子共价或非共价相互作用的基团、光笼获部分、可光 化辐射激发的部分、配体、可光异构化的部分、生物素、生物素类似物、 掺有重原子的部分、化学可裂解基团、光可裂解基团、长侧链、碳连接的 糖、氧化还原活化剂、氨基硫代酸、毒性部分、同位素标记的部分、生物 物理探针、磷光基团、发色团、化学发光基团、荧光部分、电子致密基团、 磁性基团、嵌入基团、螯合基团、生色团、能量转移剂、生物活性剂、可 检测标记物、小分子、抑制性核糖核酸、siRNA、放射性核苷酸、中子俘 获剂、生物素衍生物、量子点、纳米递质、放射性递质、抗体酶、酶、活 化的复合活化剂、病毒、毒素、佐剂、TLR2激动剂、TLR4激动剂、TLR7 激动剂、TLR9激动剂、TLR8激动剂、T-细胞表位、磷脂、LPS-样分子、 钥孔血蓝蛋白(KLH)、免疫原性半抗原、aglycan、变应原、制管张素、抗 激素药、抗氧化剂、适体、指导RNA、皂角苷、穿梭载体、大分子、模拟 表位、受体、反胶束、洗涤剂、免疫反应增效剂、荧光染料、FRET试剂、 放射成像探针、其他的光谱学探针、药物前体、用于免疫治疗的毒素、固 体支持物、-CH2CH2-(OCH2CH2O)p-OX2、-O-(CH2CH2O)pCH2CH2-X2, 及其任意组合,其中p是1至10,000,且X2是H、C1-8烷基、保护基团或 末端官能团。

在前述方法的某些实施方案中,式(A-1)的氨基酸残基是具有式(A-2) 或式(A-3)结构的氨基酸残基:

在前述方法的某些实施方案中,式(B-1)的氨基酸残基是具有式(B-2) 或式(B-3)结构的氨基酸残基:

在前述方法的某些实施方案中,式(A-1)的氨基酸残基是式(V)的氨基 酸的残基,且式(B-1)的氨基酸残基是式(VI)的氨基酸的残基:

其中R6是H或C1烷基。

在某些实施方案中,式(V)或式(VI)的氨基酸是在包含pylB基因、pylC 基因和pylD基因的细胞内生物合成产生的,并且该细胞与包含前体的生长 培养基接触。在其它实施方案中,式(V)或式(VI)的氨基酸是在包含pylC基 因和pylD基因的细胞内生物合成产生的,并且该细胞与包含前体的生长培 养基接触。

在某些实施方案中,式(V)的氨基酸是具有式(VII)结构的氨基酸

并且前体是鸟氨酸、精氨酸、D-鸟氨酸、D-精氨酸、(2S)-2-氨基-6-(2,5-二 氨基戊酰氨基)己酸或(2S)-2-氨基-6-((R)-2,5-二氨基戊酰氨基)己酸。

在某些实施方案中,式(VI)的氨基酸是具有式(VIII)结构的氨基酸,并 且前体是鸟氨酸或精氨酸

并且前体是鸟氨酸、精氨酸、D-鸟氨酸、D-精氨酸、(2S)-2-氨基-6-(2,5-二 氨基戊酰氨基)己酸或(2S)-2-氨基-6-((R)-2,5-二氨基戊酰氨基)己酸。

在某些实施方案中,式(V)的氨基酸是具有式(VII)结构的氨基酸,并且 前体是D-鸟氨酸或D-精氨酸。在某些实施方案中,式(VI)的氨基酸是具有 式(VIII)结构的氨基酸,并且前体是D-鸟氨酸或D-精氨酸。在某些实施方 案中,式(V)的氨基酸是具有式(VII)结构的氨基酸,并且前体是(2S)-2-氨基 -6-(2,5-二氨基戊酰氨基)己酸。在某些实施方案中,式(V)的氨基酸是具有 式(VII)结构的氨基酸,并且前体是(2S)-2-氨基-6-((R)-2,5-二氨基戊酰氨基) 己酸。在某些实施方案中,式(VI)的氨基酸是具有式(VIII)结构的氨基酸, 并且前体是(2S)-2-氨基-6-(2,5-二氨基戊酰氨基)己酸。在某些实施方案中, 式(VI)的氨基酸是具有式(VIII)结构的氨基酸,并且前体是(2S)-2-氨基 -6-((R)-2,5-二氨基戊酰氨基)己酸。

在某些实施方案中,式(V)的氨基酸是具有式(IX)结构的氨基酸,并且 前体是鸟氨酸、精氨酸、D-鸟氨酸、D-精氨酸或2,5-二氨基-3-甲基戊酸:

在某些实施方案中,式(V)的氨基酸是具有式(X)结构的氨基酸,并且 前体是鸟氨酸、精氨酸、D-鸟氨酸、D-精氨酸或2,5-二氨基-3-甲基戊酸:

在某些实施方案中,式(V)的氨基酸是具有式(IX)结构的氨基酸,并且 前体是D-2,5-二氨基-3-甲基戊酸。在某些实施方案中,式(V)的氨基酸是具 有式(X)结构的氨基酸,并且前体是D-2,5-二氨基-3-甲基戊酸。

在某些实施方案中,式(V)的氨基酸是具有式(IX)结构的氨基酸,并且 前体是(2R,3S)-2,5-二氨基-3-甲基戊酸。在某些实施方案中,式(V)的氨基 酸是具有式(X)结构的氨基酸,并且前体是(2R,3S)-2,5-二氨基-3-甲基戊酸。

在某些实施方案中,式(V)的氨基酸是具有式(IX)结构的氨基酸,并且 前体是(2R,3R)-2,5-二氨基-3-甲基戊酸。在某些实施方案中,式(V)的氨基 酸是具有式(X)结构的氨基酸,并且前体是(2R,3R)-2,5-二氨基-3-甲基戊酸。 在某些实施方案中,式(V)的氨基酸是具有式(IX)结构的氨基酸,并且前体 是D-鸟氨酸或D-精氨酸或(2S)-2-氨基-6-((R)-2,5-二氨基戊酰氨基)己酸。 在某些实施方案中,式(V)的氨基酸是具有式(X)结构的氨基酸,并且前体 是D-鸟氨酸或D-精氨酸或(2S)-2-氨基-6-((R)-2,5-二氨基戊酰氨基)己酸。

在前述方法的某些实施方案中,式(V)、式(VI)、式(VII)、式(VII)、式 (IX)或式(X)的氨基酸在细胞内通过正交tRNA(O-tRNA)和正交氨酰基 -tRNA合成酶(O-RS)掺入蛋白质中,其中O-RS用式(V)或式(VI)的氨基酸 氨酰化O-tRNA,并且O-tRNA识别细胞内mRNA的至少一个选择密码子。

在前述方法的某些实施方案中,细胞还包含pylS基因和pylT基因, 并且通过氨酰基-tRNA合成酶和在细胞内识别mRNA中至少一个选择密 码子的tRNA在细胞内将式(V)、式(VI)、式(VII)、式(VII)、式(IX)或式(X) 的氨基酸掺入蛋白质中,其中所述氨酰基-tRNA合成酶是pylS基因的基因 产物并且所述tRNA是pylT基因的基因产物。

在前述方法的某些实施方案中,所述选择密码子是琥珀密码子(TAG)。

在前述方法的某些实施方案中,细胞是原核细胞,而在其它实施方案 中,细胞是真核细胞。在某些实施方案中,细胞是大肠杆菌细胞,而在其 它实施方案中,细胞是哺乳动物细胞、酵母细胞或昆虫细胞。在某些实施 方案中,酵母细胞是酿酒酵母或Pichia pastoralis细胞。在某些实施方案中, 哺乳动物细胞是CHO细胞、HeLa细胞或HEK293F细胞。在某些实施方 案中,昆虫细胞是sf9细胞。

另一方面,本文还提供了应用前述方法获得的衍生化蛋白质,其中所 述衍生化蛋白质具有根据式(II)的结构:

R1-(BB)n-R2

(II)

其中

R1是H或氨基末端修饰基团;

R2是OH或羧基末端修饰基团;

n是1至5000的整数;

每一个BB独立地选自氨基酸残基、具有式(A-1)结构的吡咯赖氨酸类 似物氨基酸残基、具有式(B-1)结构的吡咯赖氨酸类似物氨基酸残基、具有 式(C-1)结构的吡咯赖氨酸类似物氨基酸残基、具有式(D-1)结构的吡咯赖氨 酸类似物氨基酸残基、具有式(E-1)结构的吡咯赖氨酸类似物氨基酸残基、 具有式(F-1)结构的吡咯赖氨酸类似物氨基酸残基、具有式(G-1)结构的吡咯 赖氨酸类似物氨基酸残基、具有式(H-1)结构的吡咯赖氨酸类似物氨基酸残 基、具有式(I-1)结构的吡咯赖氨酸类似物氨基酸残基、具有式(J-1)结构的 吡咯赖氨酸类似物氨基酸残基、具有式(K-1)结构的吡咯赖氨酸类似物氨基 酸残基以及具有式(L-1)结构的吡咯赖氨酸类似物氨基酸残基;

其中至少一个BB是具有式(C-1)或式(D-1)或式(E-1)或式(F-1)或式 (G-1)或式(H-1)或式(I-1)或式(J-1)或式(K-1)或式(L-1)结构的吡咯赖氨酸类 似物氨基酸残基。

在前述方法和此类衍生化蛋白质的某些实施方案中,环A选自呋喃、 噻吩、吡咯、吡咯啉、吡咯烷、二氧戊环、唑、噻唑、咪唑、咪唑啉、 咪唑烷、吡唑、吡唑啉、吡唑烷、异唑、异噻唑、二唑、三唑、噻二 唑、吡喃、吡啶、哌啶、二烷、吗啉、二噻烷、硫吗啉、哒嗪、嘧啶、 吡嗪、哌嗪、三嗪、三噻烷、吲嗪、吲哚、异吲哚、吲哚啉、苯并呋喃、 苯并噻吩、吲唑、苯并咪唑、苯并噻唑、嘌呤、喹嗪、喹啉、异喹啉、噌 啉、酞嗪、喹唑啉、喹喔啉、萘啶、蝶啶、奎宁环、咔唑、吖啶、吩嗪、 吩噻嗪、吩嗪、苯基、茚、萘、甘菊环、芴、蒽、菲、降冰片烷和金刚 烷。

在前述方法和此类衍生化蛋白质的某些实施方案中,环A选自苯基、 呋喃、噻吩、吡咯、吡咯啉、吡咯烷、二氧戊环、唑、噻唑、咪唑、咪 唑啉、咪唑烷、吡唑、吡唑啉、吡唑烷、异唑、异噻唑、二唑、三唑、 噻二唑、吡喃、吡啶、哌啶、二烷、吗啉、二噻烷、硫吗啉、哒嗪、嘧 啶、吡嗪、哌嗪、三嗪和三噻烷。

在前述方法和此类衍生化蛋白质的某些实施方案中,环A选自吲嗪、 吲哚、异吲哚、吲哚啉、苯并呋喃、苯并噻吩、吲唑、苯并咪唑、苯并噻 唑、嘌呤、喹嗪、喹啉、异喹啉、噌啉、酞嗪、喹唑啉、喹喔啉、萘啶、 蝶啶、奎宁环、咔唑、吖啶、吩嗪、吩噻嗪、吩嗪、茚、萘、甘菊环、 芴、蒽、菲、降冰片烷和金刚烷。

在前述方法和此类衍生化蛋白质的某些实施方案中,环A选自苯基、 萘基和吡啶基。

在前述方法的某些实施方案中,每一个BB独立地选自氨基酸残基、 具有式(A-2)结构的吡咯赖氨酸类似物氨基酸残基、具有式(B-2)结构的吡咯 赖氨酸类似物氨基酸残基、具有式(C-1)结构的吡咯赖氨酸类似物氨基酸残 基、具有式(D-2)结构的吡咯赖氨酸类似物氨基酸残基、具有式(E-1)结构的 吡咯赖氨酸类似物氨基酸残基、具有式(F-2)结构的吡咯赖氨酸类似物氨基 酸残基、具有式(G-1)结构的吡咯赖氨酸类似物氨基酸残基、具有式(H-2) 结构的吡咯赖氨酸类似物氨基酸残基、具有式(I-1)结构的吡咯赖氨酸类似 物氨基酸残基、具有式(J-2)结构的吡咯赖氨酸类似物氨基酸残基、具有式 (K-1)结构的吡咯赖氨酸类似物氨基酸残基以及具有式(L-2)结构的吡咯赖 氨酸类似物氨基酸残基;

其中,

R3、R5和每一个R4独立地选自H、-OH、-NO2、卤代、C1-8烷基、 卤素取代的-C1-8烷基、羟基取代的-C1-8烷基、芳基、杂芳基、杂环烷基或 环烷基和-LX1

R6是H或C1烷基;

当存在时,每一个R7独立地选自-OH、-NO2、卤代、C1-8烷基、卤素 取代的-C1-8烷基、羟基取代的-C1-8烷基、芳基、杂芳基、杂环烷基或环烷 基和-LX1

L选自键、C1-8亚烷基、卤素取代的-C1-8亚烷基、羟基取代的-C1-8亚 烷基、C2-8亚烯基、卤素取代的-C2-8亚烯基、羟基取代的-C2-8亚烯基、聚 烷基二醇、聚(乙二醇)、-O(CR11R12)k-、-S(CR11R12)k-、-S(O)k(CR11R12)k-、 -O(CR11R12)k-NR11C(O)-、-O(CR11R12)kC(O)NR11-、-C(O)-、 -C(O)(CR11R12)k-、-C(S)-、-C(S)(CR11R12)k-、-C(O)NR11-、-NR11C(O)-、 -NR11(CR11R12)k-、-CONR11(CR11R12)k-、-N(R11)CO(CR11R12)k-、 -C(O)NR11(CR11R12)k-、-NR11C(O)(CR11R12)k-,其中每一个R11和R12独立 地是H、C1-8烷基、卤素取代的-C1-8烷基或羟基取代的-C1-8烷基,并且k 是1至12的整数;且

X1选自标记物、染料、聚合物、水溶性聚合物、聚烷基二醇、聚(乙二 醇)、聚(乙二醇)衍生物、糖、脂类、光交联剂、细胞毒性化合物、药物、 亲和标记物、光亲和标记物、反应性化合物;树脂、肽、另一种蛋白质或 多肽或多肽类似物、抗体或抗体片段、金属螯合剂、辅因子、脂肪酸、碳 水化合物、多核苷酸、DNA、RNA、PCR探针、反义多核苷酸、核糖寡 核苷酸、脱氧核糖寡核苷酸、硫代磷酸酯-修饰的DNA、修饰的DNA和 RNA、肽核酸、糖类、二糖、寡糖、多糖、水溶性树枝状聚合物、环糊精、 生物材料、纳米颗粒、自旋标记物、荧光团、含金属的部分、放射性部分、 新官能团、与其它分子共价或非共价相互作用的基团、光笼获部分、可光 化辐射激发的部分、配体、可光异构化的部分、生物素、生物素类似物、 掺有重原子的部分、化学可裂解基团、光可裂解基团、长侧链、碳连接的 糖、氧化还原活化剂、氨基硫代酸、毒性部分、同位素标记的部分、生物 物理探针、磷光基团、发色团、化学发光基团、荧光部分、电子致密基团、 磁性基团、嵌入基团、螯合基团、生色团、能量转移剂、生物活性剂、可 检测标记物、小分子、抑制性核糖核酸、siRNA、放射性核苷酸、中子俘 获剂、生物素衍生物、量子点、纳米递质、放射性递质、抗体酶、酶、活 化的复合活化剂、病毒、毒素、佐剂、TLR2激动剂、TLR4激动剂、TLR7 激动剂、TLR9激动剂、TLR8激动剂、T-细胞表位、磷脂、LPS-样分子、 钥孔血蓝蛋白(KLH)、免疫原性半抗原、aglycan、变应原、制管张素、抗 激素药、抗氧化剂、适体、指导RNA、皂角苷、穿梭载体、大分子、模拟 表位、受体、反胶束、洗涤剂、免疫反应增效剂、荧光染料、FRET试剂、 放射成像探针、其它的光谱学探针、药物前体、用于免疫治疗的毒素、固 体支持物、-CH2CH2-(OCH2CH2O)p-OX2、-O-(CH2CH2O)pCH2CH2-X2, 及其任意组合,其中p是1至10,000,且X2是H、C1-8烷基、保护基团或 末端官能团。

在前述方法和此类衍生化蛋白质的某些实施方案中,R6是H,而在其 它实施方案中,R6是C1烷基。

在前述方法和此类衍生化蛋白质的某些实施方案中,R5是-LX1。在前 述方法和此类衍生化蛋白质的某些实施方案中,X1是糖、聚乙二醇、荧光 部分、免疫调节剂、核糖核酸、脱氧核糖核酸、蛋白质、肽、生物素、磷 脂、TLR7激动剂、免疫原性半抗原或固体支持物。在某些实施方案中,L 是聚(烷基二醇)、聚(乙二醇)、C1-8亚烷基、卤素取代的-C1-8亚烷基或羟基 取代的-C1-8亚烷基。

在前述方法的某些实施方案中,式(IV)的试剂是

其 中L和X1如文中所述。

在此类试剂的一些实施方案中,L是键且X1是聚乙二醇。

在某些实施方案中,式(IV)的试剂是

其中具有一个或多个聚乙二醇(PEG)部分的化合物具有1000Da至50kDa 的平均分子量,且n是20至1200,并且其中exPADRE是 AlaGlySerArgSerGly(DAla)LysChaValAlaAlaTrpThrLeuLysAla(D- Ala)Gly-OH,PADRE是Gly(DAla)LysChaValAlaAlaTrpThrLeu LysAla(D-Ala)Gly-OH,BG1是 5’*T*C*C*A*T*G*A*C*G*T*T*C*C*T*G*A*C*G*T*T-3’且BG2是 5’*T*C*G*T*C*G*T*T*T*T*C*G*G*C*G*C*G*C*G*C*C*G-3’,并且 其中*表示硫代磷酸酯连接。

在某些实施方案中,式(IV)的试剂是具有以下结构的化合物: 其中所述化合物具有1000Da至30kDa的平 均分子量,并且n是20至679。在其它实施方案中,式(IV)的试剂是具有 以下结构的化合物:

其中所述化合物具有1000Da至45kDa 的平均分子量,并且n是20至1018。

另一方面本文提供了具有式(VII)或式(VIII)结构的化合物:

其中式(VII)或式(VIII)化合物在包含pylC基因和pylD基因的细胞内生物合 成产生,并且所述细胞与包含前体的生长培养基接触。

在此类化合物的某些实施方案中,所述细胞包含pylB基因、pylC基因 和pylD基因。

在此类化合物的某些实施方案中,所述前体是鸟氨酸或精氨酸,而在 其它实施方案中,所述前体是D-鸟氨酸或D-精氨酸或(2S)-2-氨基 -6-((R)-2,5-二氨基戊酰氨基)己酸。

在此类化合物的某些实施方案中,式(VII)或式(VIII)的化合物在细胞 内通过正交tRNA(O-tRNA)和正交氨酰基tRNA合成酶(O-RS)掺入蛋白质 中,其中O-RS用式(V)或式(VI)的化合物氨酰化O-tRNA,并且O-tRNA 识别细胞内mRNA的至少一个选择密码子。

在此类化合物的某些实施方案中,所述细胞还包含pylS基因和pylT 基因,并且式(V)或式(VI)的化合物在细胞内通过氨酰基tRNA合成酶和在 细胞内识别mRNA中至少一个选择密码子的tRNA掺入蛋白质中,其中所 述氨酰基tRNA合成酶是pylS基因的基因产物并且所述tRNA是pylT基 因的基因产物。

在某些实施方案中,所述选择密码子是琥珀密码子(TAG)。在某些实 施方案中,细胞是原核细胞,而在其它实施方案中,细胞是真核细胞。在 某些实施方案中,细胞是大肠杆菌细胞,而在其它实施方案中,细胞是哺 乳动物细胞、酵母细胞或昆虫细胞。在某些实施方案中,酵母细胞是酿酒 酵母或Pichia pastoralis细胞。在某些实施方案中,哺乳动物细胞是CHO 细胞、HeLa细胞或HEK293F细胞。在某些实施方案中,昆虫细胞是sf9 细胞。

本文另一方面提供了具有式(V)或式(VI)结构的化合物:

其中式(VII)或式(VIII)化合物是生物合成产生的,并且由与包含前体的生 长培养基接触的第一种细胞、以及第二种细胞分泌,并且其中所述第一种 细胞是包含pylC基因和pylD基因的饲养细胞。

在此类化合物的某些实施方案中,所述第一种细胞包含pylB基因、pylC 基因和pylD基因。

在此类化合物的某些实施方案中,前体是鸟氨酸或精氨酸。在此类化 合物的其它实施方案中,前体是D-鸟氨酸或D-精氨酸。在此类化合物的 其它实施方案中,前体是(2S)-2-氨基-6-(2,5-二氨基戊酰氨基)己酸。在此类 化合物的其它实施方案中,前体是(2S)-2-氨基-6-((R)-2,5-二氨基戊酰氨基) 己酸。

在此类化合物的某些实施方案中,式(VII)或式(VIII)的化合物在第二 种细胞内通过正交tRNA(O-tRNA)和正交氨酰基tRNA合成酶(O-RS)掺入 蛋白质中,其中O-RS用式(VII)或式(VIII)的化合物氨酰化O-tRNA,并且 O-tRNA识别第二种细胞内mRNA的至少一个选择密码子。

在此类化合物的某些实施方案中,所述第二种细胞包含pylS基因和 pylT基因,并且式(VII)或式(VIII)的化合物在第二种细胞内掺入蛋白质中。

在此类化合物的某些实施方案中,式(VII)或式(VIII)的化合物在第二 种细胞内通过氨酰基tRNA合成酶和在细胞内识别mRNA中至少一个选择 密码子的tRNA掺入蛋白质中,其中所述氨酰基tRNA合成酶是pylS基因 的基因产物并且所述tRNA是pylT基因的基因产物。

在此类化合物的某些实施方案中,所述选择密码子是琥珀密码子 (TAG)。

在此类化合物的某些实施方案中,第一种细胞或第二种细胞是原核细 胞。在此类化合物的某些实施方案中,第一种细胞和第二种细胞是原核细 胞。在此类化合物的某些实施方案中,第一种细胞或第二种细胞是真核细 胞。在此类化合物的某些实施方案中,第一种细胞和第二种细胞是真核细 胞。

在某些实施方案中,原核细胞是大肠杆菌细胞。在某些实施方案中, 真核细胞是哺乳动物细胞、酵母细胞或昆虫细胞。在某些实施方案中,酵 母细胞是酿酒酵母或Pichia pastoralis细胞。在某些实施方案中,哺乳动 物细胞是CHO细胞、HeLa细胞或HEK293F细胞。在某些实施方案中, 昆虫细胞是sf9细胞。

本文另一方面提供了具有式(IX)结构的化合物:

其中式(IX)化合物是在包含pylC基因和pylD基因的细胞内生物合成产生 的,并且所述细胞与包含2,5-二氨基-3-甲基戊酸或D-2,5-二氨基-3-甲基戊 酸的生长培养基接触。

在此化合物的某些实施方案中,2,5-二氨基-3-甲基戊酸是(2R,3S)-2,5- 二氨基-3-甲基戊酸。

在此化合物的某些实施方案中,2,5-二氨基-3-甲基戊酸是(2R,3R)-2,5- 二氨基-3-甲基戊酸。

在此化合物的某些实施方案中,所述细胞包含pylB基因、pylC基因和 pylD基因,并且所述细胞与包含鸟氨酸、精氨酸、D-鸟氨酸、D-精氨酸、 (2S)-2-氨基-6-(2,5-二氨基戊酰氨基)己酸、2,5-二氨基-3-甲基戊酸或D-2,5- 二氨基-3-甲基戊酸的生长培养基接触。

在此化合物的某些实施方案中,式(IX)化合物在细胞内通过正交 tRNA(O-tRNA)和正交氨酰基tRNA合成酶(O-RS)掺入蛋白质中,其中 O-RS用式(IX)的化合物氨酰化O-tRNA,并且O-tRNA识别细胞内mRNA 的至少一个选择密码子。

在此化合物的某些实施方案中,所述细胞还包含pylS基因和pylT基 因,并且式(IX)化合物在细胞内通过氨酰基tRNA合成酶和在细胞内识别 mRNA中至少一个选择密码子的tRNA掺入蛋白质中,其中所述氨酰基 tRNA合成酶是pylS基因的基因产物并且所述tRNA是pylT基因的基因产 物。

在某些实施方案中,所述选择密码子是琥珀密码子(TAG)。在某些实 施方案中,细胞是原核细胞,而在其它实施方案中,细胞是真核细胞。在 某些实施方案中,原核细胞是大肠杆菌细胞。在某些实施方案中,真核细 胞是哺乳动物细胞、酵母细胞或昆虫细胞。在某些实施方案中,酵母细胞 是酿酒酵母或Pichia pastoralis细胞。在某些实施方案中,哺乳动物细胞是 CHO细胞、HeLa细胞或HEK293F细胞。在某些实施方案中,昆虫细胞 是sf9细胞。

本发明另一方面提供了具有式(IX)结构的化合物:

其中式(IX)化合物是生物合成产生的,并且由与包含2,5-二氨基-3-甲基戊 酸或D-2,5-二氨基-3-甲基戊酸的生长培养基接触的第一种细胞、以及第二 种细胞分泌,并且其中所述第一种细胞是包含pylC基因和pylD基因的饲 养细胞。

在此化合物的某些实施方案中,2,5-二氨基-3-甲基戊酸是(2R,3S)-2,5- 二氨基-3-甲基戊酸。

在此化合物的某些实施方案中,2,5-二氨基-3-甲基戊酸是(2R,3R)-2,5- 二氨基-3-甲基戊酸。

在此化合物的某些实施方案中,所述细胞包含pylB基因、pylC基因和 pylD基因,并且所述细胞与包含鸟氨酸、精氨酸、D-鸟氨酸、D-精氨酸、 (2S)-2-氨基-6-(2,5-二氨基戊酰氨基)己酸、2,5-二氨基-3-甲基戊酸或D-2,5- 二氨基-3-甲基戊酸的生长培养基接触。

在此化合物的某些实施方案中,式(IX)化合物在第二种细胞内通过正 交tRNA(O-tRNA)和正交氨酰基tRNA合成酶(O-RS)掺入蛋白质中,其中 O-RS用式(IX)化合物氨酰化O-tRNA,并且O-tRNA识别第二种细胞内 mRNA的至少一个选择密码子。

在此化合物的某些实施方案中,所述第二种细胞包含pylS基因和pylT 基因,并且式(IX)化合物在第二种细胞内掺入蛋白质中。

在此化合物的某些实施方案中,式(IX)化合物在第二种细胞内通过氨 酰基tRNA合成酶和在细胞内识别mRNA中至少一个选择密码子的tRNA 掺入蛋白质中,并且其中所述氨酰基tRNA合成酶是pylS基因的基因产物 并且所述tRNA是pylT基因的基因产物。

在某些实施方案中,所述选择密码子是琥珀密码子(TAG)。

在某些实施方案中,第一种细胞或第二种细胞是原核细胞。在某些实 施方案中,第一种细胞和第二种细胞是原核细胞。在某些实施方案中,第 一种细胞或第二种细胞是真核细胞。在某些实施方案中,第一种细胞和第 二种细胞是真核细胞。在某些实施方案中,原核细胞是大肠杆菌细胞。在 某些实施方案中,真核细胞是哺乳动物细胞、酵母细胞或昆虫细胞。在某 些实施方案中,酵母细胞是酿酒酵母或Pichia pastoralis细胞。在某些实施 方案中,哺乳动物细胞是CHO细胞、HeLa细胞或HEK293F细胞。在某 些实施方案中,昆虫细胞是sf9细胞。

本发明另一方面提供了以下的式(IV)化合物:

其中具有一个或多个聚乙二醇(PEG)部分的化合物具有1000Da至50Da 的平均分子量,且n是20至1200,且其中exPADRE是 AlaGlySerArgSerGly(DAla)LysChaValAlaAlaTrpThrLeuLysAla(D- Ala)Gly-OH,PADRE是 Gly(DAla)LysChaValAlaAlaTrpThrLeuLysAla(D-Ala)Gly-OH,BG1是 5’*T*C*C*A*T*G*A*C*G*T*T*C*C*T*G*A*C*G*T*T-3’且BG2是 5’*T*C*G*T*C*G*T*T*T*T*C*G*G*C*G*C*G*C*G*C*C*G-3’,并且 其中*表示硫代磷酸酯连接。

发明详述

本文提供了用于位点特异性修饰蛋白质、多肽和/或肽的方法和组合 物,其中此类方法包括遗传编码的吡咯赖氨酸或吡咯啉-羧基-赖氨酸(PCL) 残基的位点特异性修饰,其中所述的吡咯赖氨酸和PCL氨基酸已被生物合 成地产生。本文提供了位点特异性地与蛋白质、多肽和/或肽偶联的各类分 子,所述蛋白质、多肽和/或肽具有一个或多个生物合成地掺入其中的PCL 部分或吡咯赖氨酸。在某些实施方案中,此类位点特异性修饰用于位点特 异性标记蛋白质、多肽和/或肽。在某些实施方案中,标记物是荧光部分、 磷光部分、化学发光部分、螯合部分、嵌入部分、放射性部分、发色团部 分、放射部分、自旋标记部分、NMR-活性部分、PET或MRI成像试剂。 在某些实施方案中,此类位点特异性修饰用于将免疫调节剂与蛋白质、多 肽和/或肽连接。在其它实施方案中,此类位点特异性修饰用于将聚乙二醇 (PEG)与蛋白质、多肽和/或肽连接。在其它实施方案中,此类位点特异性 修饰用于将糖与蛋白质、多肽和/或肽连接(糖基化)。

在其它实施方案中,此类位点特异性修饰用于位点特异性地交联蛋白 质、多肽和/或肽,由此形成异源寡聚物,包括但不限于异源二聚体和异源 三聚体。在某些实施方案中,此类位点特异性修饰用于使抗体与蛋白质、 多肽和/或肽位点特异性地交联。在其它实施方案中,此类位点特异性修饰 用于位点特异性地交联蛋白质、多肽和/或肽,由此形成蛋白-蛋白缀合物、 蛋白-多肽缀合物、蛋白-肽缀合物、多肽-多肽缀合物、多肽-肽缀合物或肽 -肽缀合物。

在其它实施方案中,此类位点特异性修饰用于使抗体与蛋白质位点特 异性地交联,其中所述蛋白质是本文提供的毒性蛋白,从而形成抗体-药物 缀合物。在其它实施方案中,此类位点特异性修饰用于使抗体与蛋白质位 点特异性地交联,其中所述抗体与低分子量药物偶联,从而形成抗体-药物 缀合物。

在其它实施方案中,此类位点特异性修饰用于位点特异性地使受体- 配体与蛋白质连接,其中所述蛋白质是本文提供的毒蛋白,从而形成受体- 配体-药物缀合物。在其它实施方案中,此类位点特异性修饰用于位点特异 性地使受体-配体与蛋白质连接,其中所述受体-配体与低分子量药物偶联, 从而形成受体-配体-药物缀合物。

本文提供了具有应用本发明提供的方法掺入其中的吡咯赖氨酸和/或 PCL的蛋白质、多肽和/或肽。此类蛋白质包括但不限于:促红细胞生成素 (EPO)、成纤维细胞生长因子21(FGF21)、干扰素α(INF-α)、白介素2 (IL-2)、白介素4(IL-4)、白介素6(IL-6)、白介素10(IL-10)、白介素 17(IL-17)、胰岛素样生长因子1(IGF-1)以及干扰素β(INF-β)。

本文提供了具有应用本文提供的方法掺入其中的吡咯赖氨酸和/或 PCL,并且应用本文提供的方法进一步衍生化的蛋白质、多肽和/或肽。此 类衍生化包括但不限于聚乙二醇化。此类蛋白质包括但不限于:促红细胞 生成素(EPO)、成纤维细胞生长因子21(FGF21)、干扰素α(INF-α)、白介 素2(IL-2)、白介素4(IL-4)、白介素6(IL-6)、白介素10(IL-10)、白 介素17(IL-17)、胰岛素样生长因子1(IGF-1)以及干扰素β(INF-β)。

本文还提供了具有掺入其中的吡咯赖氨酸和/或PCL的蛋白质、多肽 和/或肽,其中此类蛋白质、多肽和/或肽被采用本文提供的方法交联。此类 蛋白质包括但不限于:促红细胞生成素(EPO)、成纤维细胞生长因子21 (FGF21)、干扰素α(INF-α)和干扰素β(INF-β)。

在其它实施方案中,此类位点特异性修饰用于产生蛋白质、多肽和/ 或肽,其中位点特异性地掺入吡咯赖氨酸或PCL的位置允许此类蛋白质、 多肽和/或肽受控定向且连接至固体支持物的表面。在某些实施方案中,此 类固体支持物是塑料微孔滴定板、载玻片、二氧化硅表面、聚合物珠、金 粒或者包被或未包被的纳米颗粒。在某些实施方案中,此类受控定向和连 接用于通过ELISA或其它抗体测试法的蛋白质、多肽和肽分析。在某些实 施方案中,此类受控定向和连接用于纯化和/或鉴定固定化的蛋白、多肽和 /或肽的配体。在某些实施方案中,此类受控定向和连接用于通过衰逝波分 析(包括但不限于应用表面等离子共振分析的无标记分析)来分析蛋白质、 多肽和肽以及它们的相互作用。在某些实施方案中,此类受控定向和连接 至表面用于应用微量天平(电子、光学和/或机械的)、红外光谱法、拉曼光 谱法(包括表面增强拉曼光谱法)、衰逝性共振(evanescence resonance)、荧 光、干涉测量法、质谱法和其它光谱方法来分析蛋白质、多肽和肽以及它 们的相互作用。此类分析用于研究固定化的蛋白质、多肽和/或肽与其它蛋 白质、多肽、肽、核酸、DNA、RNA、小分子、药物、代谢物、糖、碳水 化合物、寡糖、多糖和/或其它分子的相互作用,包括此类相互作用诱导的 构象改变。此类分析方法还用于研究固定化的蛋白质、多肽和/或肽与多亚 单位蛋白质复合物的相互作用,研究天然、重组、合成或标记的重组分子, 发现在体液、细胞培养上清液或粗提取物中的新相互作用搭档,研究小分 子(诸如药物候选物)与它们的靶的相互作用,应用天然膜、人工膜或囊泡 (vesicles)研究膜生物化学或膜-结合受体相互作用,研究复制、转录和翻译, 确定蛋白质复合物形成期间的分子关系以及它们与DNA的相互作用,研 究DNA和RNA的杂交,研究涉及全细胞或病毒的相互作用,研究糖基化 对分子相互作用的影响,以及确定细胞表面碳水化合物的特异识别性质。

在其它实施方案中,此类位点特异性修饰用于使核酸位点特异性地与 蛋白质连接。在某些实施方案中,此类位点特异性修饰用于使核酸位点特 异性地与抗体或抗体片段连接。在某些实施方案中,与蛋白质或抗体连接 的核酸用于通过杂交将蛋白质或抗体以确定的位置固定在DNA阵列上。 在某些实施方案中,与蛋白质或抗体连接的核酸用于通过PCR、链置换扩 增技术(SDA)、连接酶链反应(LCR)、邻近连接免疫-PCR、滚环扩增、转 录介导的扩增、NEN酪胺信号放大或其它信号放大方法来检测蛋白质或抗 体结合。在某些实施方案中,PCR探针与抗体的此类位点特异性连接用于 产生免疫-PCR反应的试剂(参见,M.Adler,R.Wacker,Ch.M.Niemeyer, Sensitivity by combination:Immuno-PCR and related technologies, Analyst,2008,133,702-718)。在某些实施方案中,与蛋白质或抗体连接的 核酸使得能够平行地进行许多分析物的免疫-PCR或其它免疫测试法(多重 免疫-PCR或多重免疫测试法)。

在某些实施方案中,与蛋白质或抗体连接的核酸介导同源或异源二聚 体的形成。

定义

本文所使用的术语“烷基”是指饱和的支链或直链烃。如本文所使用 的术语“C1-C3烷基”、“C1-C4烷基”、“C1-C5烷基”、“C1-C6烷基”、 “C1-C7烷基”和“C1-C8烷基”指含有至少1个、且分别至多为3、4、5、 6、7或8个碳原子的烷基。本文所用的烷基的非限制性实例包括甲基、乙 基、正丙基、异丙基、正丁基、异丁基、仲丁基、叔丁基、正戊基、异戊 基、己基、庚基、辛基、壬基、癸基等。

本文所使用的术语“亚烷基”是指饱和的支链或直链二价烃基,其中 所述基团从两个碳原子的每一个移除一个氢原子而衍生得到。本文所使用 的术语“C1-C3亚烷基”、“C1-C4亚烷基”、“C1-C5亚烷基”和“C1-C6亚烷基”是指含有至少一个,且分别至多3、4、5或6个碳原子的亚烷基。 本文所使用的亚烷基的非限制性实例包括亚甲基、亚乙基、正亚丙基、异 亚丙基、正亚丁基、异亚丁基、仲亚丁基、叔亚丁基、正亚戊基、异亚戊 基、亚己基等。

本文所使用的术语“烷氧基”是指基团-ORa,其中-ORa是如本文所 定义的烷基。本文所使用的术语“C1-C3烷氧基”、“C1-C4烷氧基”、“C1-C5烷氧基”、“C1-C6烷氧基”、“C1-C7烷氧基”和“C1-C8烷氧基”是指 其中烷基部分含有至少1个且至多3、4、5、6、7或8个碳原子的烷氧基。 本文所使用的烷氧基的非限制性实例包括甲氧基、乙氧基、正丙氧基、异 丙氧基、正丁氧基、叔丁氧基、戊氧基、己氧基、庚氧基等。

本文所使用的术语“氨基末端修饰基团”是指与末端胺基团形成连接 的任何分子。作为实例,此类末端胺基团包括但不限于:胺保护基团、聚 合分子末端,其中此类聚合分子包括但不限于多肽、多核苷酸和多糖。氨 基末端修饰基团还包括但不限于各种水溶性聚合物、肽或蛋白质。仅作为 实例,末端修饰基团包括聚乙二醇或血清白蛋白。某些氨基末端修饰基团 用于修饰蛋白质的治疗特性,包括但不限于增加血清半衰期。

本文所使用的术语“芳基”是指具有总共5至14个环成员的单环、二 环和三环系统,其中在所述系统中的至少一个环是芳族的,并且其中所述 系统中的每一个环含有3至7个环成员。芳基是“任选取代的”,其中此 类芳基含有一个或多个取代基。除非本文中另外指出,否则合适的取代基 通常选自:卤素、-R、-OR、-SR、-NO2、-CN、-N(R)2、-NRC(O)R、-NRC(S)R、 -NRC(O)N(R)2、-N  RC(S)N(R)2、-NRCO2R、-NRNRC(O)R、 -NRNRC(O)N(R)2、-NRNRCO2R、-C(O)C(O)R、-C(O)CH2C(O)R、-CO2R、 -C(O)R、-C(S)R、-C(O)N(R)2、-C(S)N(R)2、-OC(O)N(R)2、-OC(O)R、 -C(O)N(OR)R、-C(NOR)R、-S(O)2R、-S(O)3R、-SO2N(R)2、-S(O)R、 -NRSO2N(R)2、-NRSO2R、-N(OR)R、-C(=NH)-N(R)2、-P(O)2R、-PO(R)2、 -OPO(R)2、-(CH2)0-2NHC(O)R、任选地被R取代的苯基(Ph)、任选地被R 取代的-O(Ph)、任选地被R取代的-(CH2)1-2(Ph)、或任选地被R取代的 -CH=CH(Ph)、其中每一个独立出现的R选自氢、任选地取代的C1-C6烷 基、任选地取代的C1-C6烷氧基、未取代的5-6元杂芳基、苯基、-O(Ph) 或-CH2(Ph),或在相同取代基或不同取代基上的两个独立出现的R与每一 R连接的原子一起形成任选地取代的3-12元饱和、部分不饱和、或完全不 饱和的含有0-4个独立地选自氮、氧或硫的杂原子的单环或二环。本文所 使用的芳基的非限制实例包括苯基、萘基、芴基、茚基、甘菊环基、蒽基、 菲基等。

本文使用的术语“亚芳基”是指衍生自芳基的二价基团。

本文使用的“双官能连接体”也称为“双官能聚合物”,是指包含两 个官能团的连接体,所述官能团能够与其它部分特异性地反应从而形成共 价或非共价连接。所述部分包括但不限于,氨基酸侧链基团。仅用于举例, 双官能连接体具有与第一个肽上的基团反应的官能团,以及与第二个肽上 的基团反应的另一官能团,从而形成包括第一个肽、双官能连接体和第二 个肽的缀合物。双官能连接体具有任何期望的长度或分子量,并且对其进 行选择以提供特定的期望间隔或构象。

本文使用的“多官能连接体”也称为“多官能聚合物”,是指包含两 个或多个官能团的连接体,所述官能团能够与其它部分反应从而形成共价 或非共价连接。所述部分包括但不限于,氨基酸侧链基团。多官能连接体 具有任何期望的长度或分子量,并且对其进行选择以提供特定的期望间隔 或构象。

本文使用的术语“氰基”是指-CN基团。

本文使用的术语“环烷基”是指饱和或部分不饱和的单环、稠合二环、 稠合三环或桥联多环集合。本文所使用的术语“C3-C5环烷基”、“C3-C6环烷基”、“C3-C7环烷基”、“C3-C8环烷基”、“C3-C9环烷基”和“C3-C10环烷基”是指其中饱和或部分不饱和的单环、稠合二环或桥联多环集合含 有至少3个且至多5、6、7、8、9或10个碳原子的环烷基。本文所使用的 环烷基的非限制性实例包括环丙基、环丁基、环戊基、环己基、环庚基、 环辛基、环壬基、环癸基、环戊烯基、环己烯基、十氢萘基、2,3,4,5,6,7- 六氢-1H-茚基等。

本文所使用的“环糊精”是指由至少六至八个成环的葡萄糖分子组成 的环状碳水化合物。所述环的外部含有水溶性基团;在所述环的中心是相 对非极性的腔,其能够容纳小分子。

本文所使用的术语“卤素”是指氟(F)、氯(Cl)、溴(Br)或碘(I)。

本文所使用的术语“卤代”是指卤素基团:氟(-F)、氯(-Cl)、溴(-Br) 和碘(-I)。

本文所用的“卤酰基”是指含有卤素部分的酰基,包括但不限于 -C(O)CH3、-C(O)CF3、-C(O)CH2OCH3等。

本文所使用的“卤代烷基”或“卤素取代的烷基”是指用至少一个卤 代基团或其组合取代的如本文所定义的烷基。本文使用的此类支链或直链 卤代烷基的非限制性实例包括用一个或多个卤代基团或其组合取代的甲 基、乙基、丙基、异丙基和正丁基,包括但不限于:三氟甲基、五氟乙基 等。

本文所使用的术语“卤代烷氧基”是指用一个或多个卤代基团或其组 合取代的上文定义的烷氧基。本文所使用的此类支链或直链卤代烷氧基的 非限制性实例包括被一个或多个基团或其组合取代的甲氧基、乙氧基、正 丙氧基、异丙氧基、正丁氧基、叔丁氧基、戊氧基、己氧基、庚氧基。

本文所使用的术语“杂烷基”是指本文所定义的烷基,其中一个或多 个碳原子独立地被一个或多个氧、硫、氮或其组合替换。

本文所使用的术语“杂亚烷基”是指衍生自杂烷基的二价基团。

本文所使用的术语“杂芳基”是指具有总共5至14个环成员的单环、 二环和三环系统,其中在所述系统中的至少一个环是芳族的,所述系统中 至少一个环含有一个或多个选自氮、氧和硫的杂原子,并且其中所述系统 中的每一个环含有3至7个环成员。除非上文和本文中另外指出,否则在 杂芳基的不饱和碳原子上的合适取代基通常选自:卤素、-R、-OR、-SR、 -NO2、-CN、-N(R)2、-NRC(O)R、-NRC(S)R、-NRC(O)N(R)2、-N RC(S)N(R)2、-NRCO2R、-NRNRC(O)R、-NRNRC(O)N(R)2、-NRNRCO2R、 -C(O)C(O)R、-C(O)CH2C(O)R、-CO2R、-C(O)R、-C(S)R、-C(O)N(R)2、 -C(S)N(R)2、-OC(O)N(R)2、-OC(O)R、-C(O)N(OR)R、-C(NOR)R、-S(O)2R、 -S(O)3R、-SO2N(R)2、-S(O)R、-NRSO2N(R)2、-NRSO2R、-N(OR)R、 -C(=NH)-N(R)2、-P(O)2R、-PO(R)2、-OPO(R)2、-(CH2)0-2NHC(O)R、任 选地被R取代的苯基(Ph)、任选地被R取代的-O(Ph)、任选地被R取代 的-(CH2)1-2(Ph)、或任选地被R取代的-CH=CH(Ph),其中每一个独立出 现的R选自氢、任选取代的C1-C6烷基、任选取代的C1-C6烷氧基、未取 代的5-6元杂芳基、苯基、-O(Ph)或-CH2(Ph),或在相同取代基或不同取 代基上的两个独立出现的R与每一R连接的原子一起形成任选取代的3-12 元饱和、部分不饱和、或完全不饱和的具有0-4个独立地选自氮、氧或硫 的杂原子的单环或二环。本文所使用的杂芳基的非限制性实例包括苯并呋 喃基、苯并呋咱基、苯并唑基、苯并吡喃基、苯并噻唑基、苯并噻吩基、 苯并氮杂基、苯并咪唑基、苯并噻喃基、苯并[1,3]间二氧杂环戊烯、苯 并[b]呋喃基、苯并[b]噻吩基、噌啉基、呋咱基、呋喃基、呋喃并吡啶基、 咪唑基、吲哚基、吲嗪基、吲哚啉-2-酮、吲唑基、异吲哚基、异喹啉基、 异唑基、异噻唑基、1,8-萘啶基、唑基、羟吲哚基(oxaindolyl)、 二唑基、吡唑基、吡咯基、酞嗪基、蝶啶基、嘌呤基、吡啶基、哒嗪基、吡 嗪基、嘧啶基(pyrimidyl)、嘧啶基(pyrimidinyl)、喹喔啉基、喹啉基、喹 唑啉基、4H-喹嗪基、噻唑基、噻二唑基、噻吩基、三嗪基、三唑基和四 唑基。

本文使用的术语“杂环烷基”是指如本文所定义的环烷基,其中一个 或多个环碳被选自-O-、-N=、-NR-、-C(O)-、-S-、-S(O)-或-S(O)2-的部分 替换,其中R是氢、C1-C4烷基或氮保护基团,前提是所述基团的环不含 有两个相邻的O或S原子。本文所用的杂环烷基的非限制性实例包括吗啉 代、吡咯烷基、吡咯烷基-2-酮、哌嗪基、哌啶基、哌啶酮基、1,4-二氧杂-8- 氮杂-螺[4.5]癸-8-基、2H-吡咯基、2-吡咯啉基、3-吡咯啉基、1,3-二氧戊环 基、2-咪唑啉基、咪唑烷基、2-吡唑啉基、吡唑烷基、1,4-二烷基、1,4- 二噻烷基、硫吗啉基、氮杂环庚烷基、六氢-1,4-二氮杂基、四氢呋喃基、 二氢呋喃基、四氢噻吩基、四氢吡喃基、二氢吡喃基、四氢噻喃基、噻烷基、氮杂环丁烷基、氧杂环丁烷基、硫杂环丁烷基(thietanyl)、氧杂环庚 烷基、硫杂环庚烷基、1,2,3,6-四氢吡啶基、2H-吡喃基、4H-吡喃基、二烷基、1,3-二氧戊环基、二噻烷基、二硫戊环基、二氢吡喃基、二氢噻吩基、 二氢呋喃基、咪唑啉基、咪唑烷基、3-氮杂二环[3.1.0]己基以及3-氮杂二环 [4.1.0]庚基。

本文使用的术语“杂原子”是指氧、硫、氮、磷或硅中的一个或多个。

本文所使用的术语“羟基”是指基团-OH。

本文所使用的术语“羟烷基”是指如被至少一个羟基取代的本文所定 义的烷基,羟基如本文所定义。本文所使用的支链或直链“C1-C6羟烷基” 的非限制性实例包括被一个或多个羟基独立地取代的甲基、乙基、丙基、 异丙基、异丁基和正丁基。

本文所使用的术语“任选取代”是指所涉及的基团可以被或可以不被 一个多个其它基团取代,其中所述其它基团单个地且独立地选自烷基、烯 基、炔基、环烷基、芳基、杂芳基、杂环烷基、羟基、烷氧基、巯基、氰 基、卤素、羰基、硫代羰基、异氰酸基、硫氰基、异硫氰基、硝基、全卤 代烷基、全氟烷基以及氨基,包括单和二取代的氨基及其被保护的衍生物。 任选的取代基的非限制性实例包括卤代、-CN、-OR、-C(O)R、-OC(O)R、 -C(O)OR、-OC(O)NHR、-C(O)N(R)2、-SR-、-S(=O)R、-S(=O)2R、-NHR、 -N(R)2、-NHC(O)-、NHC(O)O-、-C(O)NH-、S(=O)2NHR、-S(O)2N(R)2、 -NHS(=O)2、-NHS(O)2R、C1-C6烷基、C1-C6烷氧基、芳基、杂芳基、环 烷基、杂环烷基、卤素取代的C1-C6烷基、卤素取代的C1-C6烷氧基,其 中每一个R独立地选自H、卤代、C1-C6烷基、C1-C6烷氧基、芳基、杂 芳基、环烷基、杂环烷基、卤素取代的C1-C6烷基、卤素取代的C1-C6烷 氧基。

本文所使用的术语“亲和标记物”是指与另一分子可逆或不可逆结合 的标记。

本文所使用的术语“琥珀密码子”是指吡咯赖氨酸、PCL和其它吡咯 赖氨酸类似物的掺入位置,并且相应于信使RNA中核苷酸三联体UAG。 核苷酸序列TAG在DNA中编码,并且转录为RNA中的UAG,其然后翻 译到蛋白质中。在本文中TAG和UAG密码子可互换使用,意指吡咯赖氨 酸、PCL和其它吡咯赖氨酸类似物的掺入位置。

本文所使用的术语“氨基酸”是指天然存在的氨基酸、非天然氨基酸、 氨基酸类似物以及以类似于天然存在的氨基酸的方式发挥功能的氨基酸模 拟物,都以它们的D和L立体异构体形式存在,若它们的结构允许形成此 类立体异构形式的话。在本文中,通过它们的名字、它们公知的三字母符 号或通过IUPAC-IUB生物化学命名委员会推荐的单字母符号来指示氨基 酸。天然存在的氨基酸是由遗传密码编码的那些氨基酸,以及后期修饰了 的那些编码的氨基酸。天然存在的氨基酸包括但不限于丙氨酸(Ala)、精氨 酸(Arg)、天冬酰胺(Asn)、天冬氨酸(Asp)、半胱氨酸(Cys)、谷氨酰胺(Gln)、 谷氨酸(Glu)、甘氨酸(Gly)、组氨酸(His)、异亮氨酸(Ile)、亮氨酸(Leu)、 赖氨酸(Lys)、甲硫氨酸(Met)、苯丙氨酸(Phe)、脯氨酸(Pro)、丝氨酸(Ser)、 苏氨酸(Thr)、色氨酸(Trp)、酪氨酸(Tyr)、缬氨酸(Val)、吡咯赖氨酸(Pyl)、 硒半胱氨酸(selenocycteine)(Sec)和吡咯啉-羧基-赖氨酸(PCL)。修饰的编码 氨基酸包括但不限于:羟脯氨酸、γ-羧基谷氨酸、O-磷酸丝氨酸、吖丁啶 羧酸、2-氨基己二酸、3-氨基己二酸、β-丙氨酸、氨基丙酸、2-氨基丁酸、 4-氨基丁酸、6-氨基己酸、2-氨基庚酸、2-氨基异丁酸、3-氨基异丁酸、2- 氨基庚二酸、叔丁基甘氨酸、2,4-二氨基异丁酸、锁链素、2,2’-二氨基庚二 酸、2,3-二氨基丙酸、N-乙基甘氨酸、N-甲基甘氨酸、N-乙基天冬酰胺、 高脯氨酸、羟基赖氨酸、别羟基赖氨酸、3-羟脯氨酸、4-羟脯氨酸、异锁 链素、别异亮氨酸、N-甲基丙氨酸、N-甲基甘氨酸、N-甲基异亮氨酸、N- 甲基戊基甘氨酸、N-甲基缬氨酸、萘丙氨酸(naphthalanine)、正缬氨酸、 正亮氨酸、鸟氨酸、戊基甘氨酸、2-哌啶酸和硫代脯氨酸。术语氨基酸还 包括为某些有机体的代谢产物但不被用于掺入蛋白质的遗传密码编码的天 然存在的氨基酸。此类氨基酸包括但不限于鸟氨酸、D-鸟氨酸和D-精氨酸。

本文所使用的术语“氨基酸类似物”是指具有与天然存在的氨基酸相 同的基本化学结构的化合物,仅用于举例,与氢、羧基基团、氨基基团以 及R基团连接的α-碳。氨基酸类似物包括可逆或不可逆地化学阻断的天然 和非天然氨基酸,或它们的C端羧基、它们的N端氨基和/或它们的侧链 官能团被化学修饰的天然和非天然氨基酸。此类类似物包括但不限于甲硫 氨酸亚砜、甲硫氨酸砜、S-(羧基甲基)-半胱氨酸、S-(羧基甲基)-半胱氨酸 亚砜、S-(羧基甲基)-半胱氨酸砜、天冬氨酸-(β-甲基酯)、N-乙基甘氨酸、 丙氨酸甲酰胺、高丝氨酸、正亮氨酸以及甲硫氨酸甲基锍。某些阻断剂包 括但不限于叔丁氧羰基(Boc)和9-芴基甲氧羰基(Fmoc)。

本文所使用的术语“氨基酸模拟物”是指具有与通常的氨基酸化学结 构不同的结构,但是以类似于天然存在的氨基酸的方式起作用的化合物。

本文所使用的术语“非天然氨基酸”意图表示在任何生物中应用未修 饰或修饰的来自任何生物(相同或不同)的基因均不能生物合成产生的氨基 酸结构。此外,还应当理解,对于掺入蛋白质而言,此类“非天然氨基酸” 需要修饰的tRNA和修饰的tRNA合成酶(RS)。这些“选择的”正交 tRNA/RS对是对所述非天然氨基酸特异的,并且通过如由Schultz等开发 的选择方法或类似方法产生。作为实例,吡咯啉-羧基-赖氨酸是“天然氨 基酸”,因为其通过从一种生物转移到宿主细胞的基因生物合成产生,并 且因为其通过应用天然tRNA和tRNA合成酶基因掺入到蛋白质中;而对- 氨基苯丙氨酸(参见,Generation of a bacterium with a 21amino acid  genetic code,Mehl RA,Anderson JC,Santoro SW,Wang L,Martin AB, King DS,Horn DM,Schultz PG.J Am Chem Soc.2003年1月29 日;125(4):935-9)是“非天然氨基酸”,因为尽管其是生物合成产生的,但 是其通过“选择的”正交tRNA/tRNA合成酶对掺入蛋白质中。 本文所使用的术语“氨基酸残基”是指具有结构的部分, 其中所述部分衍生自氨基酸,并且R基团是本文所述任何氨基酸的侧链。 此类氨基酸残基包括但不限于:丙氨酰、精氨酰、天冬酰胺酰、天冬氨酰、 半胱氨酰、谷氨酰胺酰、谷氨酰、甘氨酰、组氨酰、异亮氨酰、亮氨酰、 赖氨酰、甲硫氨酰、苯丙氨酰、脯氨酰、丝氨酰、苏氨酰、色氨酰、酪氨 酰、缬氨酰、焦谷氨酸、甲酰甲硫氨酸、吡咯甘氨酰和硒半胱氨酰。

术语“氨基末端修饰基团”是指可与末端氨基连接的任何分子。此类 氨基末端修饰基团包括但不限于:胺保护基团、聚合分子末端,其中此类 聚合分子包括但不限于多肽、多核苷酸和多糖。末端修饰基团还包括但不 限于各种水溶性聚合物、肽或蛋白质。仅作为实例,氨基末端修饰基团包 括聚乙二醇或血清白蛋白。某些氨基末端修饰基团用于修饰蛋白质、多肽 或肽的治疗特性,包括但不限于增加此类蛋白质、多肽或肽的血清半衰期。

本文所使用的术语“抗体片段”是指除全长形式之外的任何形式的抗 体。本文的抗体片段包括为存在于全长抗体中的较小构件的抗体,以及被 工程化的抗体。抗体片段包括但不限于Fv、Fc、Fab和(Fab′)2、单链Fv (scFv)、双体、三体、四体、双功能杂合抗体、CDR1、CDR2、CDR3、 CDR组合、可变区、框架区、恒定区、重链、轻链、以及可变区、备选构 架非抗体分子、双特异性抗体等。另一功能亚结构是单链Fv(scFv),其包 含被肽连接体共价连接的免疫球蛋白重链和轻链的可变区。这些小(MW< 25,000Da)蛋白质通常在单个多肽中保留了对抗原的特异性和亲和力,并且 能为更大的抗原特异性分子提供适当的构建组件。除非另外明确指出,否 则使用术语“抗体”的陈述和权利要求还包括“抗体片段”。

本文所使用的术语“生物利用度”是指物质或其活性部分从药物剂型 递送并在作用部位或在体循环中变得可利用的速度和程度。生物利用度增 加是指物质或其活性部分从药物剂型递送并在作用部位或在体循环中变得 可利用的速度和程度升高。作为实例,当与其它物质或活性部分相比时血 液中的物质或其活性部分的浓度升高,可指示生物利用度的增加。

本文所使用的术语“生物活性分子”、“生物活性部分”、或“生物 活性剂”是指可影响与生物相关的生物系统、通路、分子或相互作用的任 何物理或生物化学性质的任何物质,所述生物包括但不限于病毒、细菌、 噬菌体、转座子、朊病毒、昆虫、真菌、植物、动物和人。具体地,本文 所使用的生物活性分子包括但不限于意欲用于诊断、治愈、缓解、治疗或 预防人或其它动物的疾病,或以其它方式改善人或动物的身体或精神健康 的任何物质。生物活性分子的实例包括但不限于肽、蛋白质、酶、DNA、 RNA、小分子药物、硬药、软药、多糖、寡糖、二糖、碳水化合物、无机 原子或分子、染料、脂类、核苷、放射性核素(radionuclides)、寡核苷酸、 毒素、细胞、病毒、脂质体、微粒和胶束。适于在本文描述的方法和组合 物中使用的生物活性剂的类型包括但不限于:药物、药物前体、放射性核 素、成像剂、聚合物、抗生素、杀真菌剂、抗病毒剂、抗炎剂、抗肿瘤剂、 心血管药物、抗焦虑剂、激素、生长因子、甾体药物、微生物衍生的毒素 等。

本文使用的术语“调节生物活性”是指升高或降低蛋白质、多肽、肽、 DNA、RNA、糖类、糖、代谢物、前体、辅因子或其它生物活性化学物质 或实体的浓度或反应性,改变蛋白质、多肽、肽、DNA、RNA、糖类、糖、 代谢物、前体、辅因子或其它生物活性化学物质或实体的选择性,或增强 或减少蛋白质、多肽、肽、DNA、RNA、糖类、糖、代谢物、前体、辅因 子或其它生物活性化学物质或实体的底物选择性。

本文所使用的术语“生物材料”是指生物学衍生的材料,包括但不限 于从生物反应器和/或从重组方法和技术获得的材料。

本文所使用的术语“生物物理探针”是指使得能够通过物理检测方法 检测或监测分子结构改变的探针。此类分子包括但不限于:蛋白质、多肽、 肽、DNA或RNA。此类“生物物理探针”还用于检测或监测蛋白质、多 肽、肽、DNA或RNA与其它分子(包括但不限于大分子)的相互作用。生 物物理探针的实例包括但不限于:分子质量、核自旋、UV吸附、荧光、 圆二色性、热容量、熔化温度或其它内在的分子性质。生物物理探针的实 例还包括添加至所述分子的标记。此类探针包括但不限于自旋标记物、荧 光团、同位素标记物和可光活化的基团。

本文所使用的术语“生物合成产生”涉及利用细胞或酶产生氨基酸的 任何方法。此类方法包括至少一种以下成分的利用:前体和酶。在某些实 施方案中,此类氨基酸随后被掺入蛋白质中。在某些实施方案中,氨基酸 的生物合成和掺入发生在同一细胞当中,而在其它实施方案中,在独立的 细胞(“饲养细胞”)或在独立的细胞培养物中生物合成产生氨基酸,并在 另一细胞中将所述氨基酸掺入蛋白质中。在后一情况中,任选地从所述独 立的细胞培养物中纯化氨基酸,然后将纯化的氨基酸添加到将所述氨基酸 掺入蛋白质中的细胞培养物的培养基中。

本文所使用的术语“生物素类似物”也称为“生物素模拟物”,其是 除生物素之外的以高亲和力与抗生物素蛋白和/或抗生蛋白链菌素结合的 任何分子。

术语“羧基末端修饰基团”是指可与末端羧基连接的任何分子。此类 羧基末端基团包括但不限于:羧酸酯保护基团、聚合分子末端,其中此类 聚合分子包括但不限于多肽、多核苷酸和多糖。末端修饰基团还包括但不 限于各种水溶性聚合物、肽或蛋白质。仅作为实例,末端修饰基团包括聚 乙二醇或血清白蛋白。某些羧基末端修饰基团用于修饰蛋白质、多肽或肽 的治疗特性,包括但不限于增加血清半衰期。

本文所使用的术语“化学可裂解基团”也称为“化学不稳定的”是指 在暴露于酸、碱、氧化剂、还原剂、化学引发剂或自由基引发剂时分解或 裂解的基团。

本文所使用的术语“化学发光基团”是指在不加热的情况下,作为化 学反应的结果发射光的基团。仅作为实例,鲁米诺(5-氨基-2,3-二氢-1,4-酞 嗪二酮)在碱和金属催化剂的存在下与例如过氧化氢(H2O2)的氧化剂反应, 产生激发态产物(3-氨基酞酸酯,3-APA),随后释放可检测的光。

本文所使用的术语“发色团”是指吸收可见波长、UV波长或IR波长 的光的分子。

本文所使用的术语“辅因子”是指对大分子的作用而言很重要的原子 或分子。辅因子包括但不限于无机离子、辅酶、蛋白质、或酶活性所必需 的一些其它因子。

本文所使用的术语“共折叠”是指利用至少两个彼此相互作用的分子 的重折叠过程、反应或方法,并导致未折叠或未适当折叠的分子向适当折 叠的分子转化。仅作为实例,“共折叠”利用至少两个彼此相互作用的多 肽,并导致未折叠或未适当折叠的多肽向天然的、适当折叠的多肽转化。

本文所使用的术语“细胞毒性(的)”涉及对细胞有害的化合物。

本文所使用的术语“变性试剂”或“变性剂”是指将引起蛋白质的可 逆解折叠的任何化合物或材料。变性试剂或变性剂的强度由具体变性试剂 或变性剂的性质和浓度两者确定。例如,变性试剂或变性剂包括但不限于 离液剂(chaotropes)、洗涤剂、有机的水混溶溶剂、磷脂或其组合。离液剂 的非限制性实例包括但不限于尿素、胍和硫氰酸钠。洗涤剂的非限制性实 例包括但不限于强洗涤剂诸如十二烷基硫酸钠、或聚氧乙烯醚(例如Tween 或Triton洗涤剂)、N-十二烷基肌氨酸钠(Sarkosyl);温和非离子型洗涤剂 (例如,毛地黄皂苷),温和阳离子洗涤剂诸如N-2,3-(二油酰氧基)-丙基 -N,N,N-三甲铵,温和离子型去垢剂(例如胆酸钠或去氧胆酸钠)或两性离子 洗涤剂包括但不限于:磺酸甜菜碱(Zwiftergent)、3-(3-胆酰氨基丙基)二甲 基铵基-1-丙烷硫酸盐(CHAPS)以及3-(3-胆酰氨基丙基)二甲基铵基-2-羟基 -1-丙烷磺酸盐(CHAPSO)。有机的水可混溶溶剂的非限制性实例包括但不 限于乙腈、低级烷醇(尤其是C2-C4烷醇,诸如乙醇或异丙醇)、或低级烷二 醇(C2-C4烷二醇,诸如乙二醇),可用作变性剂。磷脂的非限制性实例包括 但不限于天然存在的磷脂,诸如磷脂酰乙醇胺、磷脂酰胆碱、磷脂酰丝氨 酸和磷脂酰肌醇,或合成的磷脂衍生物或变体,诸如二己酰磷脂酰胆碱或 二庚酰磷脂酰胆碱。

本文所使用的术语“可检测标记物”是指应用分析技术包括但不限于 荧光、化学发光、电子自旋共振、紫外/可见光吸收光谱、红外光谱、质谱、 核磁共振、磁共振、放射测量和电化学方法可观察的标记物。

本文所使用的术语“药物”是指在疾病或病症的预防、诊断、缓解、 治疗或治愈中使用的任何物质。

本文所使用的术语“染料”是指可溶的着色物质,其含有发色团。

本文所使用的术语“电子致密基团”是指当用电子束辐射时散射电子 的基团。此类基团包括但不限于钼酸铵、次硝酸铋碘化镉、99%、碳酰肼、 六水合氯化铁、六亚甲基四胺、98.5%、无水三氯化铟、硝酸镧、三水合 乙酸铅、三水合柠檬酸铅、硝酸铅、高碘酸、磷钼酸、磷钨酸、铁氰化钾、 亚铁氰化钾、钌红、硝酸银、蛋白银(Ag检定:8.0-8.5%)“强”、四苯基 卟吩银(S-TPPS)、氯金酸钠、钨酸钠、硝酸铊、氨基硫脲(TSC)、乙酸双 氧铀、硝酸双氧铀以及硫酸氧钒。

如本文中所使用,术语“能量转移剂”是指可贡献或接受来自另一分 子的能量的分子。仅举例而言,荧光共振能量转移(FRET)为偶极-偶极偶 合过程,通过这个过程荧光供体分子的激发态能量非辐射性地转移到未激 发的受体分子上,其随后以较长波长荧光发射赠予的能量。

术语“增强”的意思是增加或延长所需作用的效力或持续时间。举例 而言,“增强”治疗剂的作用涉及在治疗疾病、病症或病患期间就效力或 持续时间方面增加或延长治疗剂的作用的能力。本文中所使用的“增强有 效量”是指在治疗疾病、病症或病患期间足以增强治疗剂的作用的量。当 用于患者时,对于此用途有效的量将取决于疾病、病症或病患的严重性和 病程、先前的治疗、患者的健康状态和对药物的反应以及主治医师的判断。

术语“真核的”涉及来自属于种系发生学上真核生物界(phylogenetic  domain)的生物体的材料,该生物体包括但不限于动物(包括但不限哺乳动 物、昆虫、爬行动物和鸟类)、纤毛虫、植物(包括但不限于单子叶植物、 双子叶植物以及藻类)、真菌、酵母、鞭毛虫、微孢子虫以及原生生物。

本文中所使用的术语“脂肪酸”是指具有约C6或更长烃侧链的羧酸。

本文中所使用的术语“荧光团”是指经激发后发射光子且进而发荧光 的分子。

术语“官能团”、“活性部分”、“活化基团”、“离去基团”、“反 应性位点”、“化学反应性基团”以及“化学反应性部分”与化学领域中 的含义有些相同且在本文中用于表示实现一些功能或活性且与其它分子反 应的分子的部分。

本文中所使用的术语“同一的”意指相同的两个或更多个序列或子序 列。另外,本文中所使用的术语“基本上同一的”是指当经比较窗口比对 最大对应性,或如使用比较算法或由手工比对和视觉检查测量的所指定区 域时,具有一定百分比的相同连续单元的两个或更多个序列。仅举例而言, 如果在指定区域上连续单元为约60%同一、约65%同一、约70%同一、 约75%同一、约80%同一、约85%同一、约90%同一或约95%同一的, 那么两个或更多个序列可为“基本上同一的”。此类百分比描述两个或更 多个序列的“百分比同一性”。序列的同一性可存在于长度为至少约75-100 个连续单元的区域中、长度为约50个连续单元的区域中,或(若未指定时) 整个序列。该定义也涉及测试序列的互补序列。仅举例而言,当氨基酸残 基相同时,两个或更多个多肽序列为同一的,而如果氨基酸残基在指定区 域上为约60%同一、约65%同一、约70%同一、约75%同一、约80%同 一、约85%同一、约90%同一或约95%同一的,那么两个或更多个多肽 序列为“基本上同一的”。同一性可存在于长度为至少约75-100个氨基酸 的区域中、长度为约50个氨基酸的区域中,或(若未指定时)多肽序列的整 个序列中。另外,仅举例来说,当核酸残基相同时,两个或更多个多核苷 酸序列为同一的,而如果核酸残基在指定区域上为约60%同一、约65%同 一、约70%同一、约75%同一、约80%同一、约85%同一、约90%同一 或约95%同一的,那么两个或更多个多核苷酸序列为“基本上同一的”。 同一性可存在于长度为至少约75-100个核酸的区域中、长度为约50个核 酸的区域中,或(若未指定时)多核苷酸序列的整个序列中。

本文中所使用的术语“免疫原性”涉及对施用治疗药物的抗体反应。 针对本文提供的治疗性蛋白质、多肽和肽的免疫原性可使用用于检测生物 流体中抗所述治疗性蛋白质、多肽和肽的抗体的定量和定性测定法来获得。 此类测试法包括但不限于放射免疫测定(RIA)、酶联免疫吸附测定 (ELISA)、发光免疫测定(LIA)以及荧光免疫测定(FIA)。此类免疫原性的分 析包括将施用本文提供的治疗性蛋白质、多肽和肽后的抗体反应与施用对 照治疗性蛋白质、多肽或肽或施用递送溶媒或递送缓冲液后的抗体反应进 行比较。

本文中所使用的术语“嵌入剂”也称作“嵌入基团”,其是指插入另 一分子的分子内空间或分子之间的分子间空间中的分子或基团。仅举例而 言,嵌入剂或嵌入基团可以是插入DNA双螺旋的堆积碱基中的分子。

本文中所使用的术语“标记物”是指掺入化合物中且易于被检测,从 而可检测和/或监测其物理分布的物质。

如本文中所使用,术语“连接(linkage)”指的是由第一分子的官能团 与第二分子的官能团之间的化学反应形成的键或化学部分。此类键包括但 不限于共价键和非共价键,而此类化学部分包括但不限于酯、碳酸酯、亚 胺磷酸酯、腙、缩醛、原酸酯、肽键、寡核苷酸键和在本文表1中给出那 些。“水解稳定的连接”意指所述连接在水中基本上稳定且在有用pH值 下(其包括但不限于在生理条件下)长期不与水反应。“水解不稳定或可降 解的连接”意指所述连接可在水或水溶液(包括例如血液)中降解。“酶不 稳定或可降解的连接”意指所述连接可由一种或多种酶降解。仅举例而言, 某些PEG和相关聚合物包含在聚合物骨架之中或在PEG聚合物骨架与本 文提供的蛋白质、多肽或肽的一个或多个末端官能团之间的连接体基团之 中的可降解连接。这些可降解连接包括但不限于由PEG羧酸或活化的PEG 羧酸与生物活性剂上的醇基反应而形成的酯键,其中此类酯基通常在生理 条件下水解以释放生物活性剂。其它水解可降解连接包括但不限于碳酸酯 键;由胺与醛反应形成的亚胺键;由醇与磷酸酯基反应形成的磷酸酯键; 作为酰肼与醛的反应产物的腙键;作为醛与醇的反应产物的缩醛键;作为 甲酸盐与醇的反应产物的原酸酯键;由氨基(包括但不限于在诸如PEG的 聚合物的末端上)与肽的羧基形成的肽键;以及由亚磷酰氨基(包括但不限 于在聚合物的末端上)与寡核苷酸的5’羟基形成的寡核苷酸键。

本文中所使用的术语“培养基”是指用于培养和收集细胞和/或由这些 细胞表达和/或分泌的产物的任何培养基。这些“培养基”包括但不限于可 支持或含有任何宿主细胞以及细胞内含物的溶液、固体、半固体或刚性支 持物,所述宿主细胞例如包括细菌宿主细胞、酵母宿主细胞、昆虫宿主细 胞、植物宿主细胞、真核宿主细胞、哺乳动物宿主细胞、CHO细胞、原核 宿主细胞、大肠杆菌或假单胞菌(Pseudomonas)宿主细胞。这些“培养基” 包括但不限于其中宿主细胞已生长、多肽已分泌于其中的培养基,其包括 在增殖步骤之前或之后的培养基。这些“培养基”还包括但不限于含有宿 主细胞溶解产物例如细胞内产生的多肽的缓冲液或试剂,且宿主细胞被溶 解或裂解以释放多肽。

如本文中所使用的术语“金属螯合剂”指的是与金属离子形成络合物 的分子。举例而言,这些分子与中心金属离子形成两个或更多个配位键且 任选地形成环结构。

本文中所使用的术语“含金属的部分”是指含有金属离子、金属原子 或金属颗粒的基团。此类部分包括但不限于顺铂、螯合金属离子(诸如镍、 铁和铂),以及金属纳米颗粒(诸如镍、铁和铂)。

本文中所使用的术语“掺有重原子的部分”指的是掺入有通常比碳更 重的原子的离子的基团。此类离子或原子包括但不限于硅、钨、金、铅和 铀。

本文中所使用的术语“修饰的”指的是存在对氨基酸或氨基酸残基的 改变,其中这些改变或修饰通过化学或生物化学方法获得。

本文中所使用的术语“调节的血清半衰期”是指修饰的生物活性分子 相对于其非未经修饰形式的循环半衰期的正向或负向变化。举例而言,修 饰的生物活性分子包括但不限于本文提供的化合物。举例而言,血清半衰 期是通过在施用生物活性分子或修饰的生物活性分子后的不同时间点取血 液样品,并测定每一样品中所述分子的浓度而测量的。血清浓度与时间的 相互关系使得可以计算血清半衰期。举例而言,调节的血清半衰期可以是 血清半衰期增加,其可使得能够得到改良的给药方案或避免毒性作用。所 述血清中的增加可为至少约两倍、至少约三倍、至少约五倍,或至少约十 倍。

本文中所使用的术语“纳米颗粒”指的是具有约500nm至约1nm之 间的粒度的粒子。

本文中所使用的术语“接近化学计量的”是指参与化学反应的化合物 的摩尔比为约0.75至约1.5。

本文中所使用的术语“非真核生物”指的是非真核生物体。举例而言, 非真核生物体属于真细菌种系领域(Eubacteria phylogenetic domain),其包 括但不限于大肠杆菌(Escherichia coli)、嗜热栖热菌(Thermus thermophilus) 或嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)、荧光假单胞菌 (Pseudomonas fluorescens)、铜绿假单胞菌(Pseudomonas aeruginosa)、恶臭 假单胞菌(Pseudomonas putida);或古细菌(Archaea)种系领域,其包括但不 限于詹氏甲烷球菌(Methanococcus jannaschii)、热自养甲烷杆菌 (Methanobacterium thermoautotrophicum)、闪烁古球菌(Archaeoglobus  fulgidus)、强烈炽热球菌(Pyrococcus furiosus)、掘越氏热球菌(Pyrococcus  horikoshii)、敏捷气热菌(Aeuropyrum pernix),或嗜盐杆菌(Halobacterium), 诸如沃氏嗜盐富饶菌(Haloferax volcanii)和嗜盐杆菌菌种NRC-1。

本文中所使用的术语“核酸”指的是脱氧核糖核苷酸、脱氧核糖核苷、 核糖核苷或核糖核苷酸以及其单链或双链形式的聚合物。仅举例而言,这 些核酸和核酸聚合物包括但不限于(i)天然核苷酸的类似物,其具有与参考 核酸类似的性质;(ii)寡核苷酸类似物,其包括但不限于PNA(肽核酸)、反 义技术中使用的DNA的类似物(硫代磷酸酯、氨基磷酸酯 (phosphoroamidates)等);(iii)其经保守性修饰的变体(包括但不限于简并密 码子取代)以及互补序列和明确指出的序列。举例而言,简并密码子取代可 通过产生其中一个或多个所选(或全部)密码子的第三位置被混合碱基和/或 脱氧肌苷残基取代的序列来实现。

本文中所使用的术语“氧化剂”指的是能够从被氧化的化合物移除电 子的化合物或物质。举例而言,氧化剂包括但不限于氧化型谷胱甘肽、胱 氨酸、胱胺、氧化型二硫苏糖醇、氧化型赤藓醇(oxidized erythreitol),以 及氧。多种氧化剂适用于本文中描述的方法和组合物中。

本文中所使用的术语“光亲和性标记物”是指具有在曝露于光中之后 与该标记对其具有亲和性的分子形成连接的基团的标记物。仅举例而言, 所述连接可以是共价或非共价连接。

本文中所使用的术语“光笼获部分”指的是在某些波长下照射后共价 或非共价地结合离子或其它分子的基团。

本文中所使用的术语“光可裂解基团”指的是在曝露于光中之后断裂 的基团。

本文中所使用的术语“光交联剂”是指包括两个或更多个在曝露于光 中之后可与两个或更多个单体或聚合分子反应且形成共价或非共价连接的 官能团的化合物。

本文中所使用的术语“可光异构化的部分”是指其中经光照射后从一 种异构形式变为另一种异构形式的基团。

本文中所使用的术语“聚烷基二醇”指的是直链或支链聚合聚醚多元 醇。此类聚烷基二醇包括但不限于聚乙二醇、聚丙二醇、聚丁二醇以及其 衍生物。

本文中所使用的术语“聚合物”是指由重复亚单元组成的分子。这些 分子包括但不限于蛋白质、多肽、肽、多核苷酸或多糖或聚烷基二醇。

术语“多肽”、“肽”和“蛋白质”在本文中可互换使用,其是指氨 基酸残基的聚合物。即,针对于多肽的描述同样适用于对肽的描述以及对 蛋白质的描述,且反之亦然。氨基酸残基包括产生自天然和非天然氨基酸 的残基。所述术语适用于天然存在的氨基酸聚合物以及其中一个或多个氨 基酸残基为本文提供的化合物的氨基酸聚合物。另外,这些“多肽”、“肽” 和“蛋白质”包括任何长度的氨基酸链,包括全长蛋白质,其中氨基酸残 基通过共价肽键或其它键连接。

术语“翻译后修饰”是指在氨基酸已经被翻译掺入多肽链中之后发生 的氨基酸的任何修饰。这些修饰包括但不限于翻译后体内修饰以及翻译后 体外修饰。

本文中所使用的术语“保护的”指的是存在阻止化学反应性官能团在 某些反应条件下反应的“保护基”或部分。保护基会根据所保护的化学反 应性基团的类型而不同。仅举例而言,(i)如果化学反应性基团为胺或酰肼, 那么保护基可选自叔丁氧羰基(t-Boc)和9-芴基甲氧基羰基(Fmoc);(ii)如果 化学反应性基团为硫醇,那么保护基可为邻吡啶基二硫化物;且(iii)如果化 学反应性基团为羧酸(诸如丁酸或丙酸)或羟基,那么保护基可为苄基或烷 基,诸如甲基、乙基或叔丁基。仅举例而言,阻断基团/保护基也可选自: 乙酰胺、烯丙氧基羰基、烯丙醚、苄基、苄胺、亚苄基胺、苄基氨基甲酸 酯、苄酯、甲酯、叔丁酯、S-叔丁酯、2-烷基-1,3-唑啉、二甲基缩醛、 1,3-二烷、1,3-二噻烷、N.N-二甲基腙、邻苯二甲酰亚胺(phtalimide)、 三苯甲基、对甲氧苄基醚、苄氧羰基、对甲苯磺酰胺、三氟乙酰胺、三苯 基甲胺、叔丁基醚、苄基醚、叔丁基二甲基甲硅烷基醚、叔丁基二苯基甲 硅烷基醚、2-(三甲基甲硅烷基)乙氧基羰基、乙酸酯、特戊酸酯、苯甲酸酯、 丙酮化合物、苯亚甲基缩醛,以及光不稳定的基团诸如Nvoc和MeNvoc。

本文所使用的术语“放射性部分”是指其核自发发出核辐射(诸如α粒 子、β粒子或γ射线)的基团。

本文所使用的术语“反应性化合物”指的是在适当条件下对另一原子、 分子或化合物具有反应活性的化合物。

术语“重组宿主细胞”也被称作“宿主细胞”,指的是包含外源多核 苷酸的细胞,其中用于将外源多核苷酸插入细胞中的方法包括但不限于直 接摄入、转导、f-配对或产生重组宿主细胞所属领域中已知的其它方法。 仅举例而言,所述外源多核苷酸可为非整合载体(包括但不限于质粒),或 可以被整合入宿主基因组中。

本文中所使用的术语“氧化还原活性剂”是指氧化或还原另一分子, 从而该氧化还原活性剂变得被还原或氧化的分子。氧化还原活性剂的实例 包括但不限于二茂铁、醌、Ru2+/3+络合物、Co2+/3+络合物以及Os2+/3+络合 物。

本文中所使用的术语“还原剂”指的是能够向所被还原的化合物添加 电子的化合物或物质。举例而言,还原剂包括但不限于二硫苏糖醇(DTT)、 2-巯基乙醇、二硫赤藓醇、半胱氨酸、半胱胺(2-氨基乙硫醇),以及还原型 谷胱甘肽。仅举例而言,这些还原剂可用于将巯基保持在还原状态且还原 分子内或分子间二硫键。

本文中所使用的术语“重折叠”描述将不当折叠或未折叠状态转化为 天然或适当折叠构象的任何过程、反应或方法。仅举例而言,重折叠将含 有二硫键的蛋白质或多肽由不当折叠或未折叠状态转化为就二硫键而言的 天然或适当折叠构象。这些含有二硫键的蛋白质或多肽包括具有掺入其中 的本文提供的化合物的蛋白质或多肽。重折叠通常通过移除之前加入到蛋 白质溶液中以溶解或解折叠所述蛋白质的离液剂(诸如尿素或盐酸胍)而开 始。

本文中所使用的术语“树脂”指的是高分子量不溶性聚合物珠粒。仅 举例而言,这些珠粒可用作用于固相肽合成的支持物,或用作纯化之前附 着分子的位点。

本文中所使用的术语“糖类(saccharide)”是指一系列碳水化合物,其 包括但不限于糖(sugars)、单糖、寡糖以及多糖。

本文中所使用的术语“自旋标记物”是指可通过电子自旋共振波谱检 测且可与另一分子连接的含有展现未成对电子自旋的原子或原子团(即稳 定顺磁基团)的分子。这些自旋标记分子包括但不限于硝酰基以及氮氧化 物,且可为单一自旋标记物或双自旋标记物。

本文中所使用的术语“化学计量”是指参与化学反应的化合物的摩尔 比为约0.9至约1.1。

本文中所使用的术语“基本上纯化的”指的是可实质上或基本上不含 在纯化之前通常伴随目标成分或与目标成分相互作用的其它成分的目标成 分。仅举例而言,当目标成分的制品含有小于约30%、小于约25%、小于 约20%、小于约15%、小于约10%、小于约5%、小于约4%、小于约3%、 小于约2%或小于约1%(以干重计)的污染成分时,目标成分可为“基本上 纯化的”。因此,“基本上纯化的”目标成分可具有约70%、约75%、约 80%、约85%、约90%、约95%、约96%、约97%、约98%、约99% 或更高的纯度水平。仅举例而言,含有本文提供的化合物的蛋白质、多肽 或肽从天然细胞或宿主细胞中纯化。仅举例而言,当制品含有小于约30%、 小于约25%、小于约20%、小于约15%、小于约10%、小于约5%、小 于约4%、小于约3%、小于约2%或小于约1%(以干重计)的污染物质时, 含有本文提供的化合物的蛋白质、多肽或肽的制品为“基本上纯化的”。 仅举例而言,当含有本文提供的化合物的蛋白质、多肽或肽由宿主细胞重 组产生时,所述含有本文提供的化合物的蛋白质、多肽或肽可以以细胞干 重的约30%、约25%、约20%、约15%、约10%、约5%、约4%、约 3%、约2%或约1%或更少的量存在。仅举例而言,当含有本文提供的化 合物的蛋白质、多肽或肽由宿主细胞重组产生时,所述含有本文提供的化 合物的蛋白质、多肽或肽可以以约5g/L、约4g/L、约3g/L、约2g/L、约 1g/L、约750mg/L、约500mg/L、约250mg/L、约100mg/L、约50mg/L、 约10mg/L或约1mg/L或更少的量存在于培养基中。仅举例而言,“基本 上纯化的”含有本文提供的化合物的蛋白质、多肽或肽具有如由适当方法 (包括但不限于SDS/PAGE分析、RP-HPLC、SEC以及毛细管电泳)测定 的约30%、约35%、约40%、约45%、约50%、约55%、约60%、约 65%、约70%、约75%、约80%、约85%、约90%、约95%、约99% 或更高的纯度水平。

本文中所使用的术语“毒性部分”指的是可造成伤害或死亡的化合物。

本文中所使用的术语“治疗”包括缓解、缓和或改善疾病或病患症状, 预防其它症状,改善或预防症状的根本代谢病因,抑制疾病或病患,例如, 阻止疾病或病患的发展,减轻疾病或病患,使得疾病或病患消退,减轻由 疾病或病患造成的情况,或终止疾病或病患的症状。术语“治疗”包括但 不限于预防性和/或治疗性治疗。

本文中所使用的术语“水溶性聚合物”是指可溶于水性溶剂中的任何 聚合物。这些水溶性聚合物包括但不限于聚乙二醇、聚乙二醇丙醛、其单 C1-C10烷氧基或芳氧基衍生物单甲氧基-聚乙二醇、聚乙烯吡咯烷酮、聚 乙烯醇、聚氨基酸、二乙烯基醚马来酸酐、N-(2-羟丙基)-甲基丙烯酰胺、 葡聚糖、葡聚糖衍生物(包括硫酸葡聚糖)、聚丙二醇、聚氧化丙烯/氧化乙 烯共聚物、聚氧乙烯化多元醇、肝素、肝素片段、多糖、寡糖、aglycan、 纤维素以及纤维素衍生物(包括但不限于甲基纤维素和羧甲基纤维素)、血 清白蛋白质、淀粉以及淀粉衍生物、多肽、聚亚烷基二醇及其衍生物、聚 亚烷基二醇和其衍生物的共聚物、聚乙烯基乙基醚、以及α-β-聚[(2-羟乙 基)-DL-天冬酰胺等或其混合物。仅举例而言,这些水溶性聚合物与含有本 文提供的化合物的蛋白质、多肽或肽的偶联致使产生变化,包括但不限于 水溶性增加、血清半衰期增加或受到调节、相对于未修饰的形式治疗半衰 期增加或受到调节、生物利用度提高、生物活性受到调节、循环时间延长、 免疫原性受到调节、身体结合特性受到调节,包括但不限于聚集以及多聚 体形成、受体结合改变、与一种或多种结合搭档的结合改变,以及受体二 聚化或多聚化作用改变。

根据以下发明详述,本文描述的方法、组合物和组合的其它目的、特 征和优势将变得显而易见。然而,应当理解,发明详述和具体实施例尽管 指出了具体的实施方案,但仅用于举例说明。

位点特异性地掺入生物合成产生的吡咯赖氨酸和PCL

吡咯赖氨酸(PYL)是第22种遗传编码的氨基酸,其发现于甲烷八叠球 菌科(Methanosarcinaceae)的某些产甲烷古细菌中和两个不相关细菌菌种 中。具体而言,吡咯赖氨酸发现于MtmB1中,MtmB1为单甲胺(MMA) 甲基转移酶,其在此类古细菌中启动甲烷形成(参见Srinivasan,G.,James, C.M.,和Krzycki,J.A.(2002),“古细菌中UAG编码的吡咯赖氨酸:UAG- 解码专门化tRNA的负载(Pyrrolysine encoded by UAG in Archaea: charging of a UAG-decoding specialized tRNA),”Science,296,1459-62; Soares,J.A.,Zhang,L.,Pitsch,R.L.,Kleinholz,N.M.,Jones,R.B.,Wolff, J.J.,Amster,J.,Green-Church,K.B.,和Krzycki,J.A.(2005),“在三种不 同甲胺甲基转移酶中的L-吡咯赖氨酸的残基质量(The residue mass of  L-pyrrolysine in three distinct methylamine methyltransferases),”Journal  of Biological Chemistry,280,36962-9;Hao,B.,Gong,W.,Ferguson,T.K., James,C.M.,Krzycki,J.A.,和Chan,M.K.,(2002),“产甲烷菌甲基转移酶 的结构中的新UAG编码残基(A new UAG-encoded residue in the structure  of a methanogen methyltransferase)”,Science,296,1462-6;Krzycki,J.A., (2005),“吡咯赖氨酸的直接遗传编码(The direct genetic encoding of  pyrrolysine),”Current Opinion in Microbiology,8,706-12;Krzycki,J.A., (2004),“遗传编码的吡咯赖氨酸在类咕啉依赖的甲胺甲基转移酶中的功能 (Function of genetically encoded pyrrolysine in corrinoid-dependent  methylamine methyltransferases),”Current Opinion in Chemical Biology,8, 484-91,以及Ambrogelly,A.,Palioura,S.,和Soll,D.,(2007),“遗传密码的 天然扩展(Natural expansion of the genetic code),”Nature Chemical  Biology 3,29-35)。吡咯赖氨酸被认为是二肽,其中赖氨酸的ε-胺与4-甲基 -吡咯啉-5-甲酸酯的D-异构体通过酰胺键连接(参见,Polycarpo,C.R., Herring,S.,Berube,A.,Wood,J.L.,Soll,D.,和Ambrogelly,A.,(2006),“作 为吡咯赖氨酰-tRNA合成酶的底物的吡咯赖氨酸类似物(Pyrrolysine  analogues as substrates for pyrrolysyl-tRNA synthetase),”FEBS Letters, 580,6695-700)。吡咯赖氨酸的结构(图1)从MtmB1的晶体结构以及从残基 质量推测得到(参见,J.Biol.Chem.2005,44,36962-36969;PNAS,2007, 104,1021-1026)。

编码MtmB1的mtmB1基因拥有阅读框内琥珀(TAG)密码子,其通常 是典型的终止密码子。然而,在mtmB1 mRNA中,UAG密码子(在DNA 水平上编码为TAG)在产生MtmB1蛋白期间不终止翻译,而是UAG密码 子编码被掺入到所述蛋白质中的吡咯赖氨酸。吡咯赖氨酸是内源合成的并 且然后作为游离氨基酸在阅读框内UAG密码子处被共翻译地掺入。

吡咯赖氨酸的生物合成和掺入由天然基因pylT、pylS、pylB、pylC和 pylD协助。pylT编码吡咯赖氨酰-tRNA,pylS编码吡咯赖氨酰-tRNA合成 酶,而pylB、pylC和pylD编码吡咯赖氨酸生物合成所需的蛋白质。这些 基因已从马氏甲烷八叠球菌(Methanosarcina mazei)中衍生得到(参见, Longstaff,D.G.,Larue,R.C.,Faust,J.E.,Mahapatra,A.,Zhang,L., Green-Church,K.B.,和Krzycki,J.A.,(2007),“天然遗传密码扩展盒导致 吡咯赖氨酸的可传递性生物合成和遗传编码(A natural genetic code  expansion cassette enables transmissible biosynthesis and genetic encoding  of pyrrolysine),”Proceedings of the National Academy of Sciences of the  United States of America,104,1021-6,以及Namy,O.,Zhou,Y., Gundllapalli,S.,Polycarpo,C.R.,Denise,A.,Rousset,J.P.,Soll,D.,和 Ambrogelly,A.,(2007),“将吡咯赖氨酸加至大肠杆菌遗传密码(Adding  pyrrolysine to the Escherichia coli genetic code),”FEBS Letters,581, 5282-8)。pylT和pylS基因与pylB、pylC和pylD一起形成pylTSBCD基因 簇,其是天然遗传编码扩展盒,它的转化使得UAG密码子被翻译为吡咯 赖氨酸,该吡咯赖氨酸为在UAG位置掺入蛋白质的内源合成的游离氨基 酸。

已表明吡咯赖氨酸的生物合成由天然基因pylB、pylC和pylD的基因 产物协助,推测D-鸟氨酸为前体(参见,Namy,O.,Zhou,Y.,Gundllapalli, S.,Polycarpo,C.R.,Denise,A.,Rousset,J.P.,Soll,D.,和Ambrogelly,A., (2007),“将吡咯赖氨酸加至大肠杆菌遗传密码”FEBS Letters,581, 5282-8)。尽管已提出了吡咯赖氨酸的各种前体,诸如D-谷氨酸盐、D-异亮 氨酸、D-脯氨酸和D-鸟氨酸,但已指出D-鸟氨酸是在用携带有天然基因 pylT、pylS、pylB、pylC和pylD的质粒转化的大肠杆菌中生物合成吡咯赖 氨酸的最有效前体。这一研究使用了TAG掺入或截断信号处的通读,即, 产生全长蛋白质,作为吡咯赖氨酸在用携带有天然基因pylT、pylS、pylB、 pylC和pylD的质粒转化的大肠杆菌中生物合成并掺入所产生的蛋白质中, 以及应用D-鸟氨酸作为前体的证据。吡咯赖氨酸的掺入没有由质谱直接证 实,但是之前的质谱数据支持所述结论,即在没有添加D-鸟氨酸时,吡咯 赖氨酸在用携带有天然基因pylT、pylS、pylB、pylC和pylD的质粒转化的 大肠杆菌中生物合成并掺入(尽管以低水平)产生的蛋白质中(参见, Longstaff,D.G.,Larue,R.C.,Faust,J.E.,Mahapatra,A.,Zhang,L., Green-Church,K.B.,和Krzycki,J.A.,(2007),“天然遗传密码扩展盒导致 吡咯赖氨酸的可传递性生物合成和遗传编码”Proceedings of the National  Academy of Sciences of the United States of America,104,1021-6)。

然而,如本文所提供的那样,发现将pylT、pylS、pylB、pylC和pylD 基因引入大肠杆菌或哺乳动物细胞中,并向培养基中添加D-鸟氨酸,导致 了“脱甲基吡咯赖氨酸”(图1,PCL-A和PCL-B)的生物合成和掺入,如应 用质谱所鉴定的那样。这一观察结果是出人意料的,并基于Longstaff等 提供的结果是预料不到的。因此,本文提供了应用天然基因pylT、pylS、 pylB、pylC和pylD以及应用D-鸟氨酸作为前体,天然编码、生物合成产 生并掺入蛋白质中的吡咯赖氨酸类似物,即吡咯啉-羧基-赖氨酸(PCL)。在 其它实施方案中,由于D-精氨酸是D-鸟氨酸的前体,因此本文还提供了 应用天然基因pylT、pylS、pylB、pylC和pylD以及应用D-精氨酸作为前 体,天然编码、生物合成产生并掺入蛋白质中的吡咯赖氨酸类似物。

起初认为从D-鸟氨酸形成吡咯赖氨酸的吡咯啉环与从L-鸟氨酸形成 脯氨酸类似(参见,Longstaff,D.G.,Larue,R.C.,Faust,J.E.,Mahapatra, A.,Zhang,L.,Green-Church,K.B.,和Krzycki,J.A.,(2007),“天然遗传密 码扩展盒导致吡咯赖氨酸的可传递性生物合成和遗传编码”Proceedings of  the National Academy of Sciences of the United States of America,104, 1021-6)。许多细菌使L-鸟氨酸通过1-吡咯啉-5-甲酸盐中间体转化为L-脯 氨酸。从鸟氨酸形成1-吡咯啉-5-甲酸盐是L-脯氨酸生物合成的两步过程中 的第一步。从L-鸟氨酸形成1-吡咯啉-5-甲酸盐可通过两个途径发生;第一 个是其中由L-鸟氨酸的环化脱氨产生1-吡咯啉-5-甲酸盐,以及第二个是通 过L-鸟氨酸氨基转移酶而形成L-谷氨酸半醛。谷氨酸半醛然后形成1-吡咯 啉-5-甲酸盐。通过吡咯啉-5-甲酸盐还原酶还原1-吡咯啉-5-甲酸盐形成L- 脯氨酸。

目前,没有在产甲烷古细菌的吡咯赖氨酸的形成中鉴定出L-鸟氨酸氨 基转移酶的同源物。然而,预计涉及类似的酶。认为吡咯赖氨酸的生物合 成是应用细胞内前体以及pylB、pylC和pylD基因的产物的协同作用的协 同过程,其中推测的从D-脯氨酸经1-吡咯啉-5-甲酸盐形成吡咯赖氨酸的生 物合成流程显示于图2A中(参见,Longstaff,D.G.,Larue,R.C.,Faust,J. E.,Mahapatra,A.,Zhang,L.,Green-Church,K.B.,和Krzycki,J.A., (2007),“天然遗传密码扩展盒导致吡咯赖氨酸的可传递性生物合成和遗传 编码”Proceedings of the National Academy of Sciences of the United States  of America,104,1021-6)。pylB、pylD和pylD基因产物是多个蛋白家族的 成员。PylB拥有Fe-S基SAM酶家族的特征残基,已知所述Fe-S基SAM 酶家族介导基(radical)催化反应。此外,PylB还与生物素合酶有一些序列 同源性,因此,提示PylB参与吡咯赖氨酸吡咯啉环的形成或甲基化。pylD 基因产物PylD拥有多个脱氢酶家族的NADH-结合结构域,其提示PylD 参与1-吡咯啉亚胺键的形成。PylC与氨甲酰磷酸合成酶以及D-丙氨酰-D- 丙氨酸连接酶类似,其提示在赖氨酸与4-甲基-1-吡咯啉-5-甲酸盐的D-异 构体之间的吡咯赖氨酸酰胺键形成中起作用。因此,推定的pylB、pylC和 pylD基因产物分别与基SAM蛋白质、形成酰胺的蛋白质以及氨基酸脱氢 酶具有相似性,并且从而认为它们参与吡咯赖氨酸生物合成的类似途径。

然而,如本文所提供,在大肠杆菌和HEK293F细胞中应用D-鸟氨酸 作为前体生物合成吡咯赖氨酸的尝试没有导致吡咯赖氨酸的形成,而是形 成了在本文中称为吡咯啉-羧基-赖氨酸(PCL)(PCL-A或PCL-B:参见图1) 的“脱甲基吡咯赖氨酸”。如本文所示,PCL-A或PCL-B的生物合成不 需要存在pylB基因,因此生物合成PCL-A或PCL-B的一个可能流程显示 于图2B中。不受任何特定理论限制,这一可能的路径包括通过内源D-氨 基酸氧化酶(E.C.1.4.3.3)将D-鸟氨酸转化为5-氨基-2-氧代戊酸,以及5-氨 基-2-氧代戊酸自发环化为1-吡咯啉-2-甲酸盐和水。这一在多数生物中均能 得到的前体可通过双键重排转化为D-1-吡咯啉-5-甲酸盐,这可能由酶PylD 辅助。D-1-吡咯啉-5-甲酸盐通过PylC和ATP与L-赖氨酸的ε胺连接,导 致产生吡咯啉-羧基-赖氨酸(PCL:PCL-A)。或者,1-吡咯啉-2-甲酸盐的连 接能致使产生与PCL-A分子量相等的PCL-B。PylD和PylC均是PCL掺 入所需的,以及PylS不能接受在相当于PCL的1-吡咯啉环的C-5位的位 置上有sp2碳的吡咯赖氨酸类似物(如本文所示)作为底物的观察结果,初 步提示了PCL可能主要以PCL-A的形式掺入蛋白质中。不受任何特定理 论的束缚,认为脱甲基的PCL-A或PCL-B是在添加的D-鸟氨酸的存在下, 作为PylB的失活、甲基供体PylB底物的缺失、所需的辅因子的缺失或其 组合的结果而获得的。然而,这并不排除备选机制的存在。实际上,应用 多种中间体(如本文所示)的掺入测试提示了与图2B所提议的不同的 PCL-A或PCL-B生物合成路径。这一备选的路径提供在本文中。

已显示天然基因pylT和pylS促进吡咯赖氨酸掺入对UAG密码子响应 的蛋白质中,其中UAG翻译为吡咯赖氨酸需要由吡咯赖氨酰-tRNA合成 酶(PylS)用吡咯赖氨酸氨酰化琥珀解码的tRNApyl(图3A)。pylT基因编码专 用天然抑制子tRNApyl(PylT),其CUA反密码子与相应于吡咯赖氨酸的 UAG有义密码子互补。pylS基因编码吡咯赖氨酰-tRNA合成酶(PylS),其 为特殊的II类tRNA合成酶,其用吡咯赖氨酸(化学合成或生物合成的)装 载tRNApyl,并还进行吡咯赖氨酸-依赖性ATP:焦磷酸酯交换反应。类似 地,认为响应UAG密码子而将吡咯赖氨酸类似物PCL-A或PCL-B掺入 蛋白质被天然基因pylT和pylS促进(图3B)。

吡咯赖氨酸和PCL的生物合成以及位点特异性地掺入由原核和真核 细胞表达的蛋白质中

本文提供了位点特异性地掺入生物合成产生的吡咯赖氨酸和/或吡咯 啉-羧基-赖氨酸((S)-2-氨基-6-(3,4-二氢-2H-吡咯-2-甲酰氨基)己酸(PCL-A) 或(S)-2-氨基-6-(3,4-二氢-2H-吡咯-5-甲酰氨基)己酸(PCL-B))的方法。吡咯 赖氨酸类似物PCL-A和PCL-B在本文中合称为PCL,其缺少吡咯赖氨酸 (PYL)的甲基(图1)。在此方法的某些实施方案中,真核细胞是哺乳动物细 胞、酵母细胞、昆虫细胞、真菌细胞或植物细胞。在其它实施方案中,用 于本文提供的方法中的哺乳动物细胞包括但不限于人胚肾(HEK293F)细 胞、人上皮癌(HeLa和GH3)细胞、猴肾(COS)细胞、大鼠C6胶质瘤细胞、 幼仓鼠肾(BHK-21)细胞和中国仓鼠卵巢(CHO)细胞。在某些实施方案中, 本文提供的方法中使用的酵母细胞包括但不限于酿酒酵母和Pichia  pastoris细胞。在其它实施方案中,在本文提供的方法中使用的昆虫细胞包 括但不限于草地贪夜蛾(Spodoptera frugiperda)(sf9和sf21)细胞,粉纹夜蛾 (Trichoplusia ni)(BTI TN-5B1-4或High-FiveTM)细胞和Mammestra  brassicae细胞。在某些实施方案中,原核细胞是细菌,而在其它实施方案 中,在本文提供的方法中使用的细菌包括但不限于大肠杆菌、耻垢分支杆 菌(Mycobacterium smegmatis)、乳酸乳球菌(Lactococcus lactis)和枯草杆菌 (Bacillus subtilis)。

在某些实施方案中,此类位点特异性地掺入生物合成产生的吡咯赖氨 酸和PCL的方法包括将基因pylT、pylS、pylB、pylC和pylD,以及所需蛋 白质的基因引入原核细胞和/或真核细胞中,并任选地将吡咯赖氨酸或PCL 的前体添加至转染的细胞的生长培养基中。在某些实施方案中,前体是D- 鸟氨酸,而在其它实施方案中,前体是L-鸟氨酸。在某些实施方案中,前 体是D,L-鸟氨酸。在某些实施方案中,前体是D-精氨酸,而在其它实施方 案中,前体是L-精氨酸。在某些实施方案中,前体是D,L-精氨酸。在某些 实施方案中,前体是(2S)-2-氨基-6-(2,5-二氨 基戊酰氨基)己酸。在其它实施方案中,前体是(2S)-2-氨基-6-((R)-2,5-二氨基戊酰氨基)己酸。在某些实施方案中,前体是 2,5-二氨基-3-甲基戊酸。在某些实施方案中,前体是 (2R,3R)-2,5-二氨基-3-甲基戊酸。在某些实施方案中,真核细胞是哺乳动物 细胞、酵母细胞、昆虫细胞、真菌细胞或植物细胞。在其它实施方案中, 用于本文提供的方法中的哺乳动物细胞包括但不限于人胚肾HEK293F细 胞、人上皮癌HeLa和GH3细胞、猴肾COS细胞、大鼠C6胶质瘤细胞、 幼仓鼠肾BHK-21细胞和中国仓鼠卵巢CHO细胞。在某些实施方案中, 本文提供的方法中使用的酵母细胞包括但不限于酿酒酵母和Pichia  pastoris细胞。在其它实施方案中,在本文提供的方法中使用的昆虫细胞包 括但不限于草地贪夜蛾(Spodoptera frugiperda)sf9和sf21细胞,粉纹夜蛾 (Trichoplusia ni)(BTI TN-5B1-4或High-FiveTM)细胞和Mammestra  brassicae细胞。在某些实施方案中,原核细胞是细菌,而在其它实施方案 中,在本文提供的方法中使用的细菌包括但不限于大肠杆菌、耻垢分支杆 菌、乳酸乳球菌和枯草杆菌。

在某些实施方案中,此类位点特异性地掺入生物合成产生的吡咯赖氨 酸和PCL的方法包括将基因pylT、pylS、pylB、pylC和pylD,以及所需蛋 白质的基因引入原核细胞和/或真核细胞中,并将吡咯赖氨酸或PCL的前 体添加至转染的细胞的生长培养基中。在某些实施方案中,前体是D-鸟氨 酸,而在其它实施方案中,前体是L-鸟氨酸。在某些实施方案中,前体是 D,L-鸟氨酸。在某些实施方案中,前体是D-精氨酸,而在其它实施方案中, 前体是L-精氨酸。在某些实施方案中,前体是D,L-精氨酸。在某些实施方 案中,前体是(2S)-2-氨基-6-(2,5-二氨基戊酰氨基)己酸。在某些实施方案中, 前体是(2S)-2-氨基-6-((R)-2,5-二氨基戊酰氨基)己酸。在某些实施方案中, 前体是2,5-二氨基-3-甲基戊酸。在某些实施方案中,前体是(2R,3R)-2,5- 二氨基-3-甲基戊酸。在某些实施方案中,真核细胞是哺乳动物细胞、酵母 细胞、昆虫细胞、真菌细胞或植物细胞。在其它实施方案中,用于本文提 供的方法中的哺乳动物细胞包括但不限于人胚肾HEK293F细胞、人上皮 癌HeLa和GH3细胞、猴肾COS细胞、大鼠C6胶质瘤细胞、幼仓鼠肾 BHK-21细胞和中国仓鼠卵巢CHO细胞。在某些实施方案中,本文提供的 方法中使用的酵母细胞包括但不限于酿酒酵母和Pichia pastoris细胞。在 其它实施方案中,在本文提供的方法中使用的昆虫细胞包括但不限于草地 贪夜蛾sf9和sf21细胞,粉纹夜蛾(BTI TN-5B1-4或High-FiveTM)细胞和 Mammestra brassicae细胞。在某些实施方案中,原核细胞是细菌,而在其 它实施方案中,在本文提供的方法中使用的细菌包括但不限于大肠杆菌、 耻垢分支杆菌、乳酸乳球菌和枯草杆菌。

在某些实施方案中,此类位点特异性地掺入生物合成产生的PCL的方 法包括将基因pylT、pylS、pylC和pylD,以及所需蛋白质的基因引入原核 细胞和/或真核细胞中,并将D-鸟氨酸添加至培养基中作为PCL前体。在 某些实施方案中,真核细胞是哺乳动物细胞、酵母细胞、昆虫细胞、真菌 细胞或植物细胞。在其它实施方案中,用于本文提供的方法中的哺乳动物 细胞包括但不限于人胚肾HEK293F细胞、人上皮癌HeLa和GH3细胞、 猴肾COS细胞、大鼠C6胶质瘤细胞、幼仓鼠肾BHK-21细胞和中国仓鼠 卵巢CHO细胞。在某些实施方案中,本文提供的方法中使用的酵母细胞 包括但不限于酿酒酵母和Pichia pastoris细胞。在其它实施方案中,在本 文提供的方法中使用的昆虫细胞包括但不限于草地贪夜蛾sf9和sf21细胞, 粉纹夜蛾(BTI TN-5B1-4或High-FiveTM)细胞和Mammestra brassicae细 胞。在某些实施方案中,原核细胞是细菌,而在其它实施方案中,在本文 提供的方法中使用的细菌包括但不限于大肠杆菌、耻垢分支杆菌、乳酸乳 球菌和枯草杆菌。在其中使用了天然基因pylT、pylS、pylC和pylD的此类 实施方案中,不是生物合成产生并掺入吡咯赖氨酸,而是生物合成产生并 掺入脱甲基的吡咯赖氨酸类似物PCL。

在某些实施方案中,此类位点特异性地掺入生物合成产生的吡咯赖氨 酸和PCL的方法包括将基因pylT、pylS、pylC和pylD,以及所需蛋白质 的基因引入原核细胞和/或真核细胞中,并将D-鸟氨酸、L-鸟氨酸、D,L- 鸟氨酸、D-精氨酸、L-精氨酸、D,L-精氨酸、(2S)-2-氨基-6-(2,5-二氨基戊 酰氨基)己酸、(2S)-2-氨基-6-((R)-2,5-二氨基戊酰氨基)己酸或2,5-二氨基-3- 甲基戊酸或(2R,3R)-2,5-二氨基-3-甲基戊酸添加至生长培养基中作为吡咯 赖氨酸和/或PCL的前体。在某些实施方案中,真核细胞是哺乳动物细胞、 酵母细胞、昆虫细胞、真菌细胞或植物细胞。在其它实施方案中,用于本 文提供的方法中的哺乳动物细胞包括但不限于人胚肾HEK293F细胞、人 上皮癌HeLa和GH3细胞、猴肾COS细胞、大鼠C6胶质瘤细胞、幼仓 鼠肾BHK-21细胞和中国仓鼠卵巢CHO细胞。在某些实施方案中,本文 提供的方法中使用的酵母细胞包括但不限于酿酒酵母和Pichia pastoris细 胞。在其它实施方案中,在本文提供的方法中使用的昆虫细胞包括但不限 于草地贪夜蛾sf9和sf21细胞,粉纹夜蛾(BTI TN-5B1-4或High-FiveTM) 细胞和Mammestra brassicae细胞。在某些实施方案中,原核细胞是细菌, 而在其它实施方案中,在本文提供的方法中使用的细菌包括但不限于大肠 杆菌、耻垢分支杆菌、乳酸乳球菌和枯草杆菌。在其中使用了天然基因pylT、 pylS、pylC和pylD的此类实施方案中,不是生物合成产生并掺入吡咯赖 氨酸,而是生物合成产生并掺入脱甲基的吡咯赖氨酸类似物PCL。

在某些实施方案中,此类位点特异性地掺入生物合成产生的吡咯赖氨 酸的方法包括将基因pylT、pylS、pylC和pylD,以及所需蛋白质的基因引 入原核细胞和/或真核细胞中,并将2,5-二氨基-3-甲基戊酸或(2R,3R)-2,5- 二氨基-3-甲基戊酸添加至生长培养基中作为吡咯赖氨酸的前体。在某些实 施方案中,真核细胞是哺乳动物细胞、酵母细胞、昆虫细胞、真菌细胞或 植物细胞。在其它实施方案中,用于本文提供的方法中的哺乳动物细胞包 括但不限于人胚肾HEK293F细胞、人上皮癌HeLa和GH3细胞、猴肾 COS细胞、大鼠C6胶质瘤细胞、幼仓鼠肾BHK-21细胞和中国仓鼠卵巢 CHO细胞。在某些实施方案中,本文提供的方法中使用的酵母细胞包括但 不限于酿酒酵母和Pichia pastoris细胞。在其它实施方案中,在本文提供 的方法中使用的昆虫细胞包括但不限于草地贪夜蛾sf9和sf21细胞,粉纹 夜蛾(BTI TN-5B1-4或High-FiveTM)细胞和Mammestra brassicae细胞。 在某些实施方案中,原核细胞是细菌,而在其它实施方案中,在本文提供 的方法中使用的细菌包括但不限于大肠杆菌、耻垢分支杆菌、乳酸乳球菌 和枯草杆菌。

应用天然基因pylT、pylS、pylB、pylC和pylD以及添加至生长培养基 中作为前体的D-鸟氨酸,已在哺乳动物细胞中将生物合成产生的PCL位 点特异性地掺入模式蛋白(hRBP4)的TAG编码位点(参见实施例2)。在一 个实施方案中,通过用编码UAG-识别的tRNA PylT、其特异性氨酰基 -tRNA合成酶PylS的DNA,生物合成基因pylB、pylC和pylD以及编码 具有由TAG编码的掺入位点的靶蛋白的DNA共转染HEK293F细胞,从 而实现将PCL位点特异性地掺入模式蛋白hRBP4中。用于此类在哺乳动 物细胞中体内生物合成并在TAG密码子限定的单一位点掺入模式蛋白 hRBP4的基因构建物显示于图4A。用于在哺乳动物中表达hRBP4、mEPO、 hEPO和mIgG1的Fc结构域的各种单位点TAG突变体的其它基因构建物 显示于图4B中。用于在大肠杆菌细胞中掺入生物合成衍生的PCL或吡咯 赖氨酸的携带有pylT、pylS、pylB、pylC和pylD的质粒显示于图5中。

当将吡咯赖氨酸的假定生物合成前体D-鸟氨酸添加至转染有pylT、 pylS、pylB、pylC和pylD以及编码靶蛋白的DNA的HEK293F细胞的培 养基时,PCL而不是吡咯赖氨酸在TAG密码子位点处掺入hRBP4(参见 实施例2,图6A)。如图6A所示,不同掺入位点的掺入效率不同。

应用天然基因pylT、pylS、pylC和pylD以及添加至生长培养基中作 为前体的D-鸟氨酸,已在哺乳动物细胞中将生物合成产生的PCL位点特 异性地掺入模式蛋白(hRBP4)的TAG编码位点(参见实施例2)。在一个实 施方案中,通过用编码UAG-识别的tRNA PylT、其特异性氨酰基-tRNA 合成酶PylS的DNA,生物合成基因pylC和pylD以及编码具有由TAG编 码的掺入位点的靶蛋白的DNA共转染HEK293F细胞,从而实现将PCL 位点特异性地掺入模式蛋白hRBP4中。当将吡咯赖氨酸的假定生物合成前 体D-鸟氨酸添加至转染的HEK293F细胞的生长培养基时,PCL在TAG 密码子位点处掺入hRBP4,而不是吡咯赖氨酸。图6B显示了不存在(B, 带1)或存在(B,带2)D-鸟氨酸的情况下在HEK293F中产生的纯化的 hRBP4Phe62PCL(突变体#2)的SDS-PAGE,且图6C显示了其质谱。箭 头指示全长hRBP4,且获得的质量为23166.0Da,与预期的质量23168Da 接近。显示于图7-9的质谱数据进一步说明了PCL而不是吡咯赖氨酸掺入 了TAG位点处,hRBP4的62位处(参见实施例2)。

图1显示了吡咯赖氨酸(PYL)和脱甲基吡咯赖氨酸类似物吡咯啉-羧 基-赖氨酸(PCL)(结构PCL-A或另一结构PCL-B)的结构。采用掺入位点 的肽片段的高精度质谱分析将PCL-A的结构(或另一结构PCL-B)与吡咯赖 氨酸区分(图7-9)。此外,还通过质谱作为在细胞裂解物中的游离氨基酸检 测PCL从而区分PCL和吡咯赖氨酸的结构(图10,参加实施例3)。此外, 细胞裂解物中观察到PCL证实PCL是作为游离氨基酸生物合成产生的, 而不是由翻译后修饰形成的。图10A和10C显示了在HEK293F细胞裂解 物中检测从D-鸟氨酸生物合成的PCL。图10A是用生物合成基因pylB、 pylC和pylD转染、并在存在D-鸟氨酸(底部的示踪图)和不存在D-鸟氨酸(顶 部的示踪图)的情况下培养的细胞的裂解物的HPLC示踪(trace)。从在存在 D-鸟氨酸的情况下培养的细胞中获得的裂解物色谱图具有在4.13分钟洗脱 时间处的峰(星号标记),其在不存在D-鸟氨酸的情况下培养的相同细胞的 裂解物中不存在。图10C是4.13分钟处的HPLC峰的全扫描质谱,其中 获得的质量(m+1)与PCL的理论质量相符。图10B是显示赖氨酸在两个样 品中丰度相等的HPLC色谱图,且在1.44分钟处的赖氨酸HPLC全扫描 质量(m+1)谱(图10D)说明了所述方法的精确性。

图11显示了在HEK293F细胞中N-ε-环戊基氧羰基-L-赖氨酸(CYC) 掺入各种hRBP4TAG突变体蛋白中。图12显示了CYC掺入hRBP4突 变体Phe62TAG的TAG位点处的质谱证实。图13A和图13B(参见实施例 4)显示了作为在表中列出且显示于图14A的各种前体的函数的PCL掺入。 图13A和图13B还显示了应用HEK293F细胞将各种吡咯赖氨酸类似物(包 括CYC)直接掺入hRBP4TAG突变体蛋白中。为证实D-鸟氨酸是PCL生 物合成的前体,将可能的PCL前体(图14A)添加至用吡咯赖氨酸生物合成 pylB、pylC和pylD基因、pylT/pylS tRNA/吡咯赖氨酰-tRNA合成酶对和 hRBP4TAG突变体DNA转染的HEK293F细胞的生长培养基中。此外, 添加至仅转染有pylT/pylS tRNA/aa-tRNA合成酶对和hRBP4TAG突变体 DNA的HEK293F细胞的生长培养基中的各种吡咯赖氨酸类似物显示于图 14B。图13A是利用抗His-标签抗体的全长hRBP4蛋白质的蛋白质印迹, 而图13B是相同样品Ni-NTA纯化后的SDS-PAGE。如所示的那样,D- 鸟氨酸(条带2)是PCL生物合成的较佳前体,尽管可代谢为D-鸟氨酸的 D-精氨酸(条带4)给出了比背景更高的蛋白产量。在吡咯赖氨酸类似物中, 只有CYC致使得到了与D-鸟氨酸类似水平的蛋白质产量,而3-氧代丁酸 类似物TU3000-016显示了可测量但低得多的掺入。各种类似物的合成的 描述在实施例33中给出。所有条带均显示出低水平的全长蛋白质产量,可 能是因为低内源水平的D-鸟氨酸和代谢物或者可接受作为PylS底物的培 养基成分。

应用生物合成基因pylB、pylC和pylD的不同组合评价PCL的掺入(图 13C)。数据显示仅有基因pylC和pylD是PCL生物合成和随后的蛋白质掺 入所必需的。最显著的是D-脯氨酸,因为其它D-脯氨酸类似物和D-谷氨 酸(图13和14)没有产生高于背景的全长蛋白质产量。这提示PCL-A和 PCL-B的生物合成没有按照图2A提出的途径。然而,使用3,4-二氢-2H- 吡咯-5-甲酸盐(P2C)和1-吡咯啉-5-甲酸盐(P5C)的掺入测试没有在大肠杆 菌中产生全长蛋白,但是合成的PCL-A和PCL-B均被高效地掺入(图15A, 实施例15)。因此,图2B中提出的生物合成途径也很可能不是主要的途径。

前体(2S)-2-氨基-6-((R)-2,5-二氨基戊酰氨基)己酸(也称为 Lys-Nε-D-orn)的掺入产生显著量的全长蛋白质(图15A,实施例15)。此外, 发现(2S)-2-氨基-6-((R)-2,5-二氨基戊酰氨基)己酸的掺入仅需要存在pylS、 pylT和PylD基因(图15B,实施例15)。总之,这些观察提示了图16A和 16B显示的替代途径。这些途径基于这样的观点,即D-鸟氨酸在PylC(假 定的D-丙氨酰-D-丙氨酸连接酶)的帮助下,首先与L-赖氨酸的ε氨基基团 偶联,形成(2S)-2-氨基-6-((R)-2,5-二氨基戊酰氨基)己酸。在图16A中,通 过D-鸟氨酸:氧氧化还原酶(EC 1.4.3.3)或D-氨基-转氨酶(EC 2.6.1.21)活 化(2S)-2-氨基-6-((R)-2,5-二氨基戊酰氨基)己酸中间体,导致自环化,从而 形成PCL-B。或者,在图16B中,通过D-鸟氨酸:2-氧代戊二酸5-转氨酶 (EC 2.6.1.13)活化(2S)-2-氨基-6-((R)-2,5-二氨基戊酰氨基)己酸中间体,导致 自环化,从而形成PCL-A。两个环化反应均类似于D-谷氨酸盐5-半醛的 环化。环化之前的两个活化步骤中的任一个均可推测为由PylD催化,所 述PylD是PCL生物合成所需的第二种酶。如图16所示,推测通过PylB 甲基化PCL-A完成PYL的生物合成。注意到在图16A路径的情况下,这 似乎需要存在另一仍待发现的Pyl酶,其从PCL-B形成PCL-A。然而, 这一额外的酶在图16B所示的备选途径中是不需要的。在由PylD活化及 自发环化后形成的PCL-A可被PylB甲基化从而直接形成吡咯赖氨酸。或 者,中间体中的任一个或D-鸟氨酸可能是PylB甲基化的底物,如果随后 的酶能忍受底物的此类修饰的话。

已显示吡咯赖氨酰-tRNA合成酶PylS接受多种吡咯赖氨酸类似物用 于装载至tRNAPyl。然而,此类研究还显示了吡咯赖氨酸环C-5立体中心 对于合成酶PylS的识别的重要性,其中D构型是需要的(参见,Polycarpo, C.R.,Herring,S.,Berube,A.,Wood,J.L.,Soll,D.,和Ambrogelly,A., (2006),“Pyrrolysine analogues as substrates for pyrrolysyl-tRNA  synthetase,”FEBS Letters,580,6695-700)。如本文所提供的那样,以及与 这一解释相一致,掺入包括芳香五或六元环吡咯赖氨酸类似物在内的各种 吡咯赖氨酸类似物(图13)的努力证实了此类五或六元环类似物不是PylS的 可接受底物(图14)。这可能是因为缺乏C-5手性中心,或在某些情况下是 因为类似物较大的体积。如所示的那样,应用PylT/PylS tRNA/吡咯赖氨酰 -tRNA合成酶对,将已知的PylS底物N-ε-环戊基氧羰基-L-赖氨酸(CYC), 以及3-氧代丁酸类似物TU3000-016掺入(图14)。然而,所评估的在大小 和松散性上与N-ε-环戊基氧羰基-L-赖氨酸(CYC)相似的类似物没有被掺 入,可能是因为它们缺乏C-5立体中心。因此,PylS似乎在吡咯啉环的连 接点上对手性有选择性。然而,合成的PCL-B也高效地被掺入,提示sp2 即C-5位上的非手性碳不是在所有情况下均不利于掺入。当前,与合成的 PCL-A相比,合成的PCL-B与2-ABA的低反应性(实施例44,图56和58), 以及在图16A中不存在已知的将PCL-B转化为PCL-A的酶,有利于将掺 入的吡咯赖氨酸类似物指认为PCL-A。

如本文所提供的那样,在某些实施方案中,发现当将D-鸟氨酸添加至 生长培养基中作为前体时,在哺乳动物细胞(实施例2)和细菌细胞(实施例 8、9和10)中应用吡咯赖氨酸生物合成的天然基因pylB、pylC和pylD导 致产生PCL而非吡咯赖氨酸。此外,应用天然基因pylB和pylC、天然基 因pylB和pylD、或天然基因pylC和pylD评估PCL的生物合成,仅当存 在pylC和pylD基因产物时导致PCL的产生。这提示当将D-鸟氨酸添加 至生长培养基中作为前体时,pylB的基因产物在PCL的生物合成中不是 必需的(图13C,参见实施例4)。这得到了在没有共转染基因pylB至哺乳 动物细胞的情况下,实现了PCL掺入到三种模式蛋白质即hRBP4(图6, 参见实施例2)、mIgG1Fc结构域(图17A,参见实施例5)和mEPO(图17B, 参见实施例6)的证实。在大肠杆菌中,FAS-TE、FGF21和FKBP是实例, 其中应用天然基因pylB、pylC和pylD,导致了唯一的PCL的产生(图18B、 19和20,实施例8、9和10)。

PCL的生物合成对宿主细胞而言需要存在生物合成基因pylC和pylD, 但是不需要pylB。在甲烷八叠球菌属中的吡咯赖氨酸的生物合成中,已提 示PylD含有脱氢酶的NADH-结合结构域,并从而从D-脯氨酸产生D-1- 吡咯啉-5-甲酸盐。然而,往生长培养基中添加D-脯氨酸不会导致显著的 PCL掺入(图13)。往生长培养基中添加3,4-二氢-2H-吡咯-5-甲酸盐(本文中 也称为1-吡咯啉-2-甲酸盐;P2C)和D-1-吡咯啉-5-甲酸盐(P5C)也没有产生 全长蛋白质,而(2S)-2-氨基-6-((R)-2,5-二氨基戊酰氨基)己酸产生含PCL的 蛋白质。PylC具有与D-丙氨酰-D-丙氨酸连接酶同源的序列,并且在PCL 或吡咯赖氨酸的生物合成中,能够催化D-鸟氨酸与赖氨酸的ε-氨基基团连 接,得到(2S)-2-氨基-6-((R)-2,5-二氨基戊酰氨基)己酸。因此,本文假定并 不受任何理论束缚,在哺乳动物或大肠杆菌细胞中从D-鸟氨酸生物合成 PCL可能包括通过PylC将D-鸟氨酸转化为(2S)-2-氨基-6-((R)-2,5-二氨 基戊酰氨基)己酸(图16B)。PylD可能参与(2S)-2-氨基-6-((R)-2,5-二氨基戊 酰氨基)己酸向半醛((S)-2-氨基-6-((R)-2-氨基-5-氧代戊酰氨基)己酸)的活 化,后者自发地环化为PCL-A,如图16B所示。或者,如果PylD具有 D-氨基酸转氨酶或D-鸟氨酸:氧氧化还原酶样活性的话,则PCL-B将自 发地形成(图16A)。

在其它实施方案中,在大肠杆菌中表达小鼠EGF和小鼠TNF-α(图21 和实施例13和14)导致产生了在TAG位点掺入PCL或吡咯赖氨酸的蛋白 质混合物。吡咯赖氨酸的掺入依赖于pylB基因的存在,而在不存在pylB 的情况下观察到含PCL的蛋白质的同源制备物(图21和实施例11和12)。 因此实验证实了在吡咯赖氨酸的生物合成中PylB作为甲基转移酶。即使在 pylB基因的存在下,含有PCL和吡咯赖氨酸的蛋白质的相对量也在各发 酵间不同,其中PCL蛋白一般是更主要的。这些观察提示甲基转移酶活性 或甲基供体底物或所需辅因子是大肠杆菌和哺乳动物中有效吡咯赖氨酸生 物合成的限制。

此外,pylB基因产物可能未被有效表达。因此,在某些实施方案中, 将修饰的pylB基因用于吡咯赖氨酸或其它吡咯赖氨酸类似物的生物合成 中。因此,本文提供了在大肠杆菌、哺乳动物和其它宿主细胞中生物合成 吡咯赖氨酸、PCL及其它吡咯赖氨酸类似物的方法,其中pylB、pylC和 pylD基因中的一种或多种是被修饰的。此类修饰可能包括应用来自其它生 物(包括但不限于Methanosarcinae的其它物种)的同源基因,或突变的基 因。在某些实施方案中,使用了定点诱变,而在其它实施方案中,使用了 与选择相结合的随机诱变。此类方法还包括添加所需蛋白质的DNA,以及 引入pylT和pylS基因,以将吡咯赖氨酸、PCL或吡咯赖氨酸类似物掺入 蛋白质中。在某些实施方案中,应用修饰的pylB基因、天然pylC、pylD、 pylT和pylS基因以生物合成产生和掺入吡咯赖氨酸。在其它实施方案中, 应用修饰的pylB和pylC基因、天然pylD、pylT和pylS基因以生物合成产 生和掺入PCL之外的吡咯赖氨酸类似物。在其它实施方案中,应用修饰的 pylB和pylD基因、天然pylC、pylT和pylS基因以生物合成产生和掺入PCL 之外的吡咯赖氨酸类似物。在其它实施方案中,任选地修饰pylT、pylS、 pylB、pylC和pylD基因,以改善吡咯赖氨酸、PCL或其它吡咯赖氨酸类 似物向蛋白质的掺入。

此外,对于某些实施方案,在从D-鸟氨酸生物合成吡咯赖氨酸、PCL 和/或其它吡咯赖氨酸类似物中的中间产物形成,或吡咯赖氨酸的生物合成 可能受到宿主酶和蛋白质的功能的限制。在某些实施方案中,一种或多种 宿主酶的低活性或浓度可能限制吡咯赖氨酸、PCL或其它吡咯赖氨酸类似 物生物合成所需中间体的形成。在某些实施方案中,宿主酶的活性可能使 中间体从产生吡咯赖氨酸、PCL或其它吡咯赖氨酸类似物的途径转向其它 代谢途径,或可能抑制此类中间体的形成。因此,本文提供了在大肠杆菌、 哺乳动物或其它宿主细胞中生物合成吡咯赖氨酸、PCL和其它吡咯赖氨酸 类似物的方法,其中一种或多种宿主酶被修饰。此类方法包括但不限于, 通过遗传或化学方法过表达、活化、压抑或抑制此类宿主酶;添加编码此 类宿主酶的DNA;添加沉默RNA(siRNA)以抑制mRNA翻译;以及添加 从D-鸟氨酸形成所述中间体所需的辅因子。

在小鼠IgG1Fc结构域的4个位点(参见实施例5和图17A)以及促红 细胞生成素(EPO)的11个位点(参见实施例6和图17B)实现了将生物合成 产生的PCL位点特异性地掺入TAG编码位点。在转染有天然基因pylT、 pylS、pylC和pylD的HEK293F哺乳动物细胞中,以及应用添加至培养基 作为前体的D-鸟氨酸,实现了在两组蛋白质中的PCL掺入。图17A是显 示了4个全长(FL)mFc蛋白质的SDS-PAGE,其中应用共转染有mFc各 TAG突变体构建物、pCMVpylT、pCMVpylS、pCMVpylC和pCMVpylD (图4A)的HEK293F细胞,并将所述细胞在D-鸟氨酸的存在下培养,从而 将PCL掺入了小鼠IgG1Fc结构域中的4个位点。图17B是显示了11个 全长(FL)mEPO蛋白质的SDS-PAGE,其中应用共转染有mEPO的TAG 突变体构建物、pCMVpylT、pCMVpylS、pCMVpylC和pCMVpylD的 HEK293F细胞,并将所述细胞在D-鸟氨酸的存在下培养,从而将PCL掺 入了小鼠EPO中的11个位点。

已应用大肠杆菌细胞实现了生物合成产生的PCL在TAG编码位点的 位点特异性掺入(参见实施例7)。构建了编码pylB、pylC、pylD、pylS和 pylT的质粒pARA-pylSTBCD(图6A)。通过用pARA-pylSTBCD和具有目 标蛋白质基因的第二表达质粒转化大肠杆菌细胞,并在蛋白质表达期间添 加D-鸟氨酸至生长培养基中,从而实现了PCL-A(或PCL-B)在人脂肪酸 合成酶的硫酯酶结构域(FAS-TE)的2个位点(参见实施例8和图18)、 FKBP-12的1个位点(参见实施例9和图19)和成纤维细胞生长因子 21(FGF21)的20个位点(参见实施例10和图20)的掺入。

图18显示了在人脂肪酸合成酶的硫酯酶(FAS-TE)中两个位点掺入 PCL的SDS-PAGE和质谱。表达了FAS-TE Tyr2454PCL,并且通过 Ni-NTA纯化了可溶和不可溶的蛋白质级份。在两份培养物中在含D-鸟氨 酸和不含D-鸟氨酸的情况下表达FAS-TE Leu2222PCL/Leu2223Ile。 Ni-NTA洗脱物显示于凝胶上。对每一个获得的质量与预期的相符。图19 显示了在FKBP-12的一个位点掺入PCL的SDS-PAGE和质谱。对PCL 的单一位点掺入而言,所获得的质量(12085.6Da)与预期的(12084Da)一致。 此外,图19还显示了FKBP12-Ile90PCL的晶体。图20显示了SDS-PAGE, 其显示PCL在多个位点掺入FGF21。

发现吡咯赖氨酸(Pyl)和PCL的掺入依赖于表达系统中pylB基因的存 在。图21A显示了Pyl或PCL掺入到具有Gln21密码子(CAA)突变为TAG 终止密码子的mTNF-α中的SDS-PAGE分析(实施例13)。条带2和4分 别显示了当存在D-鸟氨酸时,存在和不存在pylB的情况下,蛋白质的表 达水平类似。条带3(存在pylB)和5(不存在pylB)显示了在不存在D-鸟氨酸 时没有蛋白质表达。

此外,应用D-鸟氨酸作为前体,在大肠杆菌中在pylB、pylC、pylD、 pylT和pylS基因的存在下表达了mEGF Tyr10TAG(实施例14)。完整MS 谱(图21C,底部)提示了具有掺入的PYL和PCL的蛋白质的混合物。在 7309Da处的含Pyl的mEGF的MS峰的大小为在7295Da处的含PCL的 mEGF的约6倍。通过mEGF Tyr10TAG突变蛋白N端肽 MNSYPGCPSS(PCL)DGYCLNGGVCM(SEQ ID NO:32)和 MNSYPGCPSS(Pyl)DGYCLNGGVCM(SEQ ID NO:33)的串联MS谱证 实了PYL和PCL在TAG位置的掺入。不同肽的相对前体质量丰度的定 量揭示了PYL比PCL的丰度高5至10倍,这与完整质量测定基本一致(图 21C,底部)。当在pylB的存在下表达mEGF Tyr10TAG时,完整MS谱(图 21C,顶部)提示了仅有PCL掺入。

类似地,当应用D-鸟氨酸,在大肠杆菌中在pylB、pylC、pylD、pylT 和pylS基因的存在下表达mTNF-αGln21TAG时,串联MS证实了PYL 和PCL在mTNF Gln21PCL的肽NH(Pyl)VEEQLEWLSQR(SEQ ID  NO:34)和NH(PCL)VEEQLEWLSQR(SEQ ID NO:35)中的掺入。与 mEGF Tyr10TAG相反,用串联MS鉴定的不同肽的相对前体质量丰度的 定量揭示,在mTNF-αGln21TAG蛋白中,PCL的丰度比PYL高7倍。 在不存在pylB基因的情况下表达mTNF-αGln21TAG,在串联MS测定中 的不同肽的相对前体质量丰度的定量显示,仅有PCL蛋白质在实验的动态 范围之内。这些实验清楚地表明PYL掺入严格依赖于pylB的存在,所述 的pylB是Pyl生物合成中假定的甲基化转移酶。然而,在pylB基因的存 在下,掺入蛋白质的PCL和PYL的相对比例似乎在不同的蛋白质之间、 以及在不同的发酵实验中不同,并且因此可能取决于表达载体的类型、生 长条件和/或宿主细胞培养物的其它性质。

本文提供了具有式(V)和式(VI)结构的氨基酸:

其中所述式(V)或式(VI)化合物在包含pylB基因、pylC基因和pylD基因的 细胞中生物合成地产生,并且所述细胞与包含前体的生长培养基接触。而 在其它实施方案中,所述式(V)或式(VI)化合物在包含pylC基因和pylD基 因的细胞中生物合成地产生,并且所述细胞与包含前体的生长培养基接触。 在此类生物合成的某些实施方案中,前体是鸟氨酸或精氨酸。在此类生物 合成的某些实施方案中,前体是D-鸟氨酸或D-精氨酸。在此类生物合成 的某些实施方案中,前体是(2S)-2-氨基-6-((R)-2,5-二氨基戊酰氨基)己酸。 在此类生物合成的某些实施方案中,前体是(2S)-2-氨基-6-(2,5-二氨基戊酰 氨基)己酸。

本文还提供了在其中生物合成式(V)和式(VI)化合物的细胞,其还包含 pylS基因和pylT基因,并且式(V)或式(VI)化合物在所述细胞内由氨酰基 tRNA合成酶和在细胞内识别mRNA中至少一个选择密码子的tRNA掺入 蛋白质中。所述氨酰基tRNA合成酶是pylS基因的基因产物,且所述tRNA 是pylT基因的基因产物。在某些实施方案中,所述式(V)或式(VI)化合物在 细胞内由正交tRNA(O-tRNA)和正交氨酰基tRNA合成酶(O-RS)掺入蛋白 质中,其中所述O-RS用式(V)或式(VI)化合物氨酰化O-tRNA,并且所述 O-tRNA识别细胞内mRNA中的至少一个选择密码子。

用于掺入吡咯赖氨酸、PCL和/或其它吡咯赖氨酸类似物(包括式(V)和 式(VI)化合物)的选择密码子是琥珀密码子(TAG)。

用于生物合成和/或掺入吡咯赖氨酸、PCL和/或其它吡咯赖氨酸类似 物(包括式(V)和式(VI)化合物)的细胞是原核细胞或真核细胞。在某些实施 方案中,原核细胞包括但不限于大肠杆菌、耻垢分支杆菌、乳酸乳球菌和 枯草杆菌细胞。在其它实施方案中,真核细胞包括但不限于哺乳动物细胞、 酵母细胞、真菌细胞、植物细胞或昆虫细胞。所述哺乳动物细胞包括但不 限于人胚肾(HEK293F)细胞、人上皮癌(HeLa和GH3)细胞、猴肾(COS) 细胞、大鼠C6胶质瘤细胞、幼仓鼠肾(BHK-21)细胞和中国仓鼠卵巢(CHO) 细胞。在某些实施方案中,酵母细胞包括但不限于酿酒酵母和Pichia  pastoris细胞。在某些实施方案中,昆虫细胞包括但不限于草地贪夜蛾sf9 和sf21细胞、粉纹夜蛾(BTI TN-5B1-4或High-FiveTM)细胞和Mammestra  brassicae细胞。

在本文提供的另一方面,吡咯赖氨酸、PCL和/或其它吡咯赖氨酸类似 物(包括式(V)和式(VI)化合物)在与包含前体的生长培养基接触的饲养细胞 中生物合成,并且所述饲养细胞含有pylB基因、pylC基因和pylD基因。 在其它实施方案中,吡咯赖氨酸、PCL和/或吡咯赖氨酸类似物(包括式(V) 和式(VI)化合物)在与包含前体的生长培养基接触的饲养细胞中生物合成, 并且所述饲养细胞含有pylC基因和pylD基因。此类生物合成的吡咯赖氨 酸、PCL和/或其它吡咯赖氨酸类似物(包括式(V)和式(VI)化合物)从饲养细 胞分泌至生长培养基中,它们从而被第二种细胞摄取,并随后掺入在所述 第二种细胞中合成的蛋白质中。所述第二种细胞含有pylS基因和pylT基 因。吡咯赖氨酸、PCL和/或其它吡咯赖氨酸类似物(包括式(V)和式(VI)化 合物)在所述第二种细胞内由氨酰基tRNA合成酶和在所述第二种细胞内识 别mRNA中至少一个选择密码子的tRNA掺入蛋白质中。所述氨酰基 tRNA合成酶是pylS基因的基因产物,且所述tRNA是pylT基因的基因产 物。在某些实施方案中,所述式(V)或式(VI)化合物在所述第二种细胞内由 正交tRNA(O-tRNA)和正交氨酰基tRNA合成酶(O-RS)掺入蛋白质中,其 中所述O-RS用式(V)或式(VI)化合物氨酰化O-tRNA,并且所述O-tRNA 在所述第二种细胞内识别mRNA中的至少一个选择密码子。

在此类应用饲养细胞的生物合成的某些实施方案中,前体是鸟氨酸或 精氨酸。在此类生物合成的某些实施方案中,前体是D-鸟氨酸或D-精氨 酸。在某些实施方案中,前体是(2S)-2-氨基-6-(2,5-二氨基戊酰氨基)己酸。 在某些实施方案中,前体是(2S)-2-氨基-6-((R)-2,5-二氨基戊酰氨基)己酸。

用于掺入应用饲养细胞生物合成的吡咯赖氨酸、PCL和/或其它吡咯赖 氨酸类似物(包括式(V)和式(VI)化合物)的选择密码子是琥珀密码子 (TAG)。

在某些实施方案中,第二种细胞是与饲养细胞相同类型的细胞,而在 其它实施方案中,第二种细胞是与饲养细胞不同的细胞类型。用于此类生 物合成和/或掺入吡咯赖氨酸、PCL和/或其它吡咯赖氨酸类似物(包括式(V) 和式(VI)化合物)的细胞是原核细胞或真核细胞。在某些实施方案中,原核 细胞包括但不限于大肠杆菌、耻垢分支杆菌、乳酸乳球菌和枯草杆菌细胞。 在其它实施方案中,真核细胞包括但不限于哺乳动物细胞、酵母细胞、真 菌细胞、植物细胞或昆虫细胞。所述哺乳动物细胞包括但不限于人胚肾 (HEK293F)细胞、人上皮癌(HeLa和GH3)细胞、猴肾(COS)细胞、大鼠 C6胶质瘤细胞、幼仓鼠肾(BHK-21)细胞和中国仓鼠卵巢(CHO)细胞。在 某些实施方案中,酵母细胞包括但不限于酿酒酵母和Pichia pastoris细胞。 在其它实施方案中,昆虫细胞包括但不限于草地贪夜蛾sf9和sf21细胞、 粉纹夜蛾(BTI TN-5B1-4或High-FiveTM)细胞和Mammestra brassicae细 胞。

在本文提供的另一方面,吡咯赖氨酸、PCL和/或其它吡咯赖氨酸类似 物(包括式(V)和式(VI)化合物)在饲养细胞中生物合成,并且然后从饲养细 胞培养物中纯化所述生物合成的吡咯赖氨酸和/或PCL(包括式(V)和式(VI) 化合物),并将其添加至含有第二种细胞的第二种培养物的生长培养基中。 所述纯化的吡咯赖氨酸、PCL和/或其它吡咯赖氨酸类似物然后在第二种细 胞内掺入合成的蛋白质中。在某些实施方案中,吡咯赖氨酸、PCL和/或其 它吡咯赖氨酸类似物(包括式(V)和式(VI)化合物)在与包含前体的生长培养 基接触的饲养细胞中生物合成,并且所述饲养细胞含有pylB基因、pylC基 因和pylD基因。在其它实施方案中,吡咯赖氨酸、PCL和/或其它吡咯赖 氨酸类似物(包括式(V)和式(VI)化合物)在与包含前体的生长培养基接触的 饲养细胞中生物合成,并且所述饲养细胞含有pylC基因和pylD基因。用 于该方面的第二种细胞含有pylS基因和pylT基因。吡咯赖氨酸、PCL和/ 或其它吡咯赖氨酸类似物(包括式(V)和式(VI)化合物)在所述第二种细胞内 由氨酰基tRNA合成酶和在所述第二种细胞内识别mRNA中至少一个选择 密码子的tRNA掺入蛋白质中。所述氨酰基tRNA合成酶是pylS基因的基 因产物,且所述tRNA是pylT基因的基因产物。在某些实施方案中,所述 式(V)或式(VI)化合物在所述第二种细胞内由正交tRNA(O-tRNA)和正交氨 酰基tRNA合成酶(O-RS)掺入蛋白质中,其中所述O-RS用式(V)或式(VI) 化合物氨酰化O-tRNA,并且所述O-tRNA在所述第二种细胞内识别 mRNA中的至少一个选择密码子。

在此类应用饲养细胞的生物合成的某些实施方案中,前体是鸟氨酸或 精氨酸。在此类生物合成的某些实施方案中,前体是D-鸟氨酸或D-精氨 酸。在某些实施方案中,前体是(2S)-2-氨基-6-(2,5-二氨基戊酰氨基)己酸。 在某些实施方案中,前体是(2S)-2-氨基-6-((R)-2,5-二氨基戊酰氨基)己酸。

用于掺入应用饲养细胞生物合成的吡咯赖氨酸、PCL和/或其它吡咯赖 氨酸类似物(包括式(V)和式(VI)化合物)的选择密码子是琥珀密码子 (TAG)。

在某些实施方案中,第二种细胞是与饲养细胞相同类型的细胞,而在 其它实施方案中,第二种细胞是与饲养细胞不同的细胞类型。用于所述生 物合成和/或掺入吡咯赖氨酸、PCL和/或其它吡咯赖氨酸类似物(包括式(V) 和式(VI)化合物)的细胞是原核细胞或真核细胞。在某些实施方案中,原核 细胞包括但不限于大肠杆菌、耻垢分支杆菌、乳酸乳球菌和枯草杆菌细胞。 在其它实施方案中,真核细胞包括但不限于哺乳动物细胞、酵母细胞、真 菌细胞、植物细胞或昆虫细胞。所述哺乳动物细胞包括但不限于人胚肾 (HEK293F)细胞、人上皮癌(HeLa和GH3)细胞、猴肾(COS)细胞、大鼠 C6胶质瘤细胞、幼仓鼠肾(BHK-21)细胞和中国仓鼠卵巢(CHO)细胞。在 某些实施方案中,酵母细胞包括但不限于酿酒酵母和Pichia pastoris细胞。 在某些实施方案中,昆虫细胞包括但不限于草地贪夜蛾sf9和sf21细胞、 粉纹夜蛾(BTI TN-5B1-4或High-FiveTM)细胞和Mammestra brassicae细 胞。

本文提供了具有式(VII)结构的氨基酸

其中式(VII)化合物或其异构体或互变异构体在包含pylB基因、pylC基因 和pylD基因的细胞中生物合成地产生,并且所述细胞与含有D-鸟氨酸或 D-精氨酸或(2S)-2-氨基-6-((R)-2,5-二氨基戊酰氨基)己酸或2,5-二氨基-3-甲 基戊酸或(2S)-2-氨基-6-(2,5-二氨基戊酰氨基)己酸的生长培养基接触。而在 其它实施方案中,所述式(VII)化合物在包含pylC基因和pylD基因的细胞 中生物合成地产生,并且所述细胞与含有2,5-二氨基-3-甲基戊酸的生长培 养基接触。在某些实施方案中,细胞与包含D-2,5-二氨基-3-甲基戊酸的生 长培养基接触。在某些实施方案中,2,5-二氨基-3-甲基戊酸是(2R,3S)-2,5- 二氨基-3-甲基戊酸。在某些实施方案中,2,5-二氨基-3-甲基戊酸是 (2R,3R)-2,5-二氨基-3-甲基戊酸。

其中生物合成式(VII)化合物的细胞,还包含pylS基因和pylT基因, 并且式(VII)化合物在所述细胞内由氨酰基tRNA合成酶和在细胞内识别 mRNA中至少一个选择密码子的tRNA掺入蛋白质中。所述氨酰基tRNA 合成酶是pylS基因的基因产物,且所述tRNA是pylT基因的基因产物。 在某些实施方案中,所述式(VII)化合物在细胞内由正交tRNA(O-tRNA)和 正交氨酰基tRNA合成酶(O-RS)掺入蛋白质中,其中所述O-RS用式(VII) 化合物氨酰化O-tRNA,并且所述O-tRNA识别细胞内mRNA中的至少一 个选择密码子。

用于掺入式(VII)化合物的选择密码子是琥珀密码子(TAG)。

用于生物合成和/或掺入式(VII)化合物的细胞是原核细胞或真核细胞。 在某些实施方案中,原核细胞包括但不限于大肠杆菌、耻垢分支杆菌、乳 酸乳球菌和枯草杆菌细胞。在其它实施方案中,真核细胞包括但不限于哺 乳动物细胞、酵母细胞、真菌细胞、植物细胞或昆虫细胞。所述哺乳动物 细胞包括但不限于人胚肾(HEK293F)细胞、人上皮癌(HeLa和GH3)细胞、 猴肾(COS)细胞、大鼠C6胶质瘤细胞、幼仓鼠肾(BHK-21)细胞和中国仓 鼠卵巢(CHO)细胞。在某些实施方案中,酵母细胞包括但不限于酿酒酵母 和Pichia pastoris细胞。在某些实施方案中,昆虫细胞包括但不限于草地 贪夜蛾sf9和sf21细胞、粉纹夜蛾(BTI TN-5B1-4或High-FiveTM)细胞和 Mammestra brassicae细胞

在某些实施方案中,应用本文提供的方法将一种或多种吡咯赖氨酸、 PCL和/或其它吡咯赖氨酸掺入蛋白质、多肽和/或肽中,并且应用本文提 供的方法对此类吡咯赖氨酸和/或PCL进行衍生化。

PCL和吡咯赖氨酸的衍生化

本文提供了具有式(I)结构的蛋白质、多肽或肽:

R1-(AA)n-R2

(I)

其中:

R1是H或氨基末端修饰基团;

R2是OH或羧基末端修饰基团;

n是1至5000的整数;

每一个AA独立地选自氨基酸残基、具有式(A-1)结构的部分以及具有 式(B-1)结构的部分;

其中R6是H或C1烷基,并且至少一个AA是吡咯赖氨酸或具有式(A-1) 或式(B-1)结构的吡咯赖氨酸类似物,或其异构体。

在所述式(I)化合物的某些实施方案中,R6是H,且具有式(A-1)结构的 部分和具有式(B-1)结构的部分分别具有式(A-2)和式(B-2)的结构,或其异构 体:

因此,本文还提供了具有根据式(I)结构的蛋白质、多肽或肽:

R1-(AA)n-R2

(I)

其中:

R1是H或氨基末端修饰基团;

R2是OH或羧基末端修饰基团;

n是1至5000的整数;

每一个AA独立地选自氨基酸残基、具有式(A-2)结构的部分和具有式 (B-2)结构的部分;

并且至少一个AA是吡咯赖氨酸或具有式(A-2)或式(B-2)结构的吡咯赖 氨酸类似物,或其异构体。

在某些实施方案中,n是1至4000的整数。在某些实施方案中,n是 1至3000的整数。在某些实施方案中,n是1至2000的整数。在某些实施 方案中,n是1至1000的整数。在某些实施方案中,n是1至700的整数。 在某些实施方案中,n是1至800的整数。在某些实施方案中,n是1至 600的整数。在某些实施方案中,n是1至500的整数。在某些实施方案中, n是1至400的整数。在某些实施方案中,n是1至300的整数。在某些 实施方案中,n是1至200的整数。在某些实施方案中,n是1至100的 整数。在某些实施方案中,n是1至90的整数。在某些实施方案中,n是 1至80的整数。在某些实施方案中,n是1至70的整数。在某些实施方案 中,n是1至60的整数。在某些实施方案中,n是1至50的整数。在某 些实施方案中,n是1至40的整数。在某些实施方案中,n是1至30的 整数。在某些实施方案中,n是1至20的整数。在某些实施方案中,n是 1至10的整数。在某些实施方案中,n是1至5的整数。

此外,本文提供了位点特异性标记式(I)的蛋白质、多肽和/或肽的方法, 其中所述方法包括将所述含有一个或多个吡咯赖氨酸和/或PCL残基的蛋 白质、多肽和/或肽与具有式(III)结构的试剂混合:

其中:

R3、R5和每一个R4独立地选自H、-OH、-NO2、卤代、C1-8烷基、 卤素取代的-C1-8烷基、羟基取代的-C1-8烷基、芳基、杂芳基、杂环烷基或 环烷基和-LX1

L选自键、C1-8亚烷基、卤素取代的-C1-8亚烷基、羟基取代的-C1-8亚 烷基、C2-8亚烯基、卤素取代的-C2-8亚烯基、羟基取代的-C2-8亚烯基、聚 烷基二醇、聚乙二醇、-O(CR11R11)k-、-S(CR11R12)k-、-S(O)k(CR11R12)k-、 -O(CR11R12)k-NR11C(O)-、-O(CR11R12)kC(O)NR11-、-C(O)-、 -C(O)(CR11R12)k-、-C(S)-、-C(S)(CR11R12)k-、-C(O)NR11-、-NR11C(O)-、 -NR11(CR11R12)k-、-CONR11(CR11R12)k-、-N(R11)CO(CR11R12)k-、 -C(O)NR11(CR11R12)k-、-NR11C(O)(CR11R12)k-,其中每一个R11和R12独立 地是H、C1-8烷基、卤素取代的-C1-8烷基或羟基取代的-C1-8烷基,并且k 是1至12的整数;

X1选自标记物、染料、聚合物、水溶性聚合物、聚烷基二醇、聚乙二 醇、聚乙二醇衍生物、糖、脂类、光交联剂、细胞毒性化合物、药物、亲 和标记物、光亲和标记物、反应性化合物;树脂、肽、另一种蛋白质或多 肽或多肽类似物、抗体或抗体片段、金属螯合剂、辅因子、脂肪酸、碳水 化合物、多核苷酸、DNA、RNA、PCR探针、反义多核苷酸、核糖寡核 苷酸、脱氧核糖寡核苷酸、硫代磷酸酯-修饰的DNA、修饰的DNA和RNA、 肽核酸、糖类、二糖、寡糖、多糖、水溶性树枝状聚合物、环糊精、生物 材料、纳米颗粒、自旋标记物、荧光团、含金属的部分、放射性部分、新 官能团、与其它分子共价或非共价相互作用的基团、光笼获部分、可光化 辐射激发的部分、配体、可光异构化的部分、生物素、生物素类似物、掺 有重原子的部分、化学可裂解基团、光可裂解基团、长侧链、碳连接的糖、 氧化还原活化剂、氨基硫代酸、毒性部分、同位素标记的部分、生物物理 探针、磷光基团、发色团、化学发光基团、荧光部分、电子致密基团、磁 性基团、嵌入基团、螯合基团、生色团、能量转移剂、生物活性剂、可检 测标记物、小分子、抑制性核糖核酸、siRNA、放射性核苷酸、中子俘获 剂、生物素衍生物、量子点、纳米递质、放射性递质、抗体酶、酶、活化 的复合活化剂、病毒、毒素、佐剂、TLR2激动剂、TLR4激动剂、TLR7 激动剂、TLR9激动剂、TLR8激动剂、T-细胞表位、磷脂、LPS-样分子、 钥孔血蓝蛋白(KLH)、免疫原性半抗原、aglycan、变应原、制管张素、抗 激素药、抗氧化剂、适体、指导RNA、皂角苷、穿梭载体、大分子、模拟 表位、受体、反胶束、洗涤剂、免疫反应增效剂、荧光染料、FRET试剂、 放射成像探针、其它的光谱学探针、药物前体、用于免疫治疗的毒素、固 体支持物、-CH2CH2-(OCH2CH2O)p-OX2、-O-(CH2CH2O)pCH2CH2-X2, 及其任意组合,其中p是1至10,000,且X2是H、C1-8烷基、保护基团或 末端官能团。

本文提供了位点特异性标记式(I)的蛋白质、多肽和/或肽的方法,其中 所述方法包括在合适的条件下将所述含有一个或多个吡咯赖氨酸和/或 PCL残基的蛋白质、多肽和/或肽与具有式(IV)结构的试剂混合并反应:

其中:

R5选自-OH、-NO2、卤代、C1-8烷基、卤素取代的-C1-8烷基、羟基 取代的-C1-8烷基、芳基、杂芳基、杂环烷基或环烷基和-LX1

A是C3-C8环烷基、C3-C8杂环烷基、5-6元单环芳基、5-6元单环杂 芳基、9-10元稠合二环或13-14元稠合三环,其中A任选地被1至5个 独立选自-OH、-NO2、卤代、C1-8烷基、卤素取代的-C1-8烷基、羟基取代 的-C1-8烷基、芳基、杂芳基、杂环烷基或环烷基和-LX1的取代基取代;

L选自键、C1-8亚烷基、卤素取代的-C1-8亚烷基、羟基取代的-C1-8亚 烷基、C2-8亚烯基、卤素取代的-C2-8亚烯基、羟基取代的-C2-8亚烯基、聚 烷基二醇、聚乙二醇、-O(CR11R12)k-、-S(CR11R12)k-、-S(O)k(CR11R12)k-、 -O(CR11R12)k-NR11C(O)-、-O(CR11R12)kC(O)NR11-、-C(O)-、 -C(O)(CR11R12)k-、-C(S)-、-C(S)(CR11R12)k-、-C(O)NR11-、-NR11C(O)-、 -NR11(CR11R12)k-、-CONR11(CR11R12)k-、-N(R11)CO(CR11R12)k-、 -C(O)NR11(CR11R12)k-、-NR11C(O)(CR11R12)k-,其中每一个R11和R12独立 地是H、C1-8烷基、卤素取代的-C1-8烷基或羟基取代的-C1-8烷基,并且k 是1至12的整数;

X1选自标记物、染料、聚合物、水溶性聚合物、聚烷基二醇、聚乙二 醇、聚乙二醇衍生物、糖、脂类、光交联剂、细胞毒性化合物、药物、亲 和标记物、光亲和标记物、反应性化合物;树脂、肽、另一种蛋白质或多 肽或多肽类似物、抗体或抗体片段、金属螯合剂、辅因子、脂肪酸、碳水 化合物、多核苷酸、DNA、RNA、PCR探针、反义多核苷酸、核糖寡核 苷酸、脱氧核糖寡核苷酸、硫代磷酸酯-修饰的DNA、修饰的DNA和RNA、 肽核酸、糖类、二糖、寡糖、多糖、水溶性树枝状聚合物、环糊精、生物 材料、纳米颗粒、自旋标记物、荧光团、含金属的部分、放射性部分、新 官能团、与其它分子共价或非共价相互作用的基团、光笼获部分、可光化 辐射激发的部分、配体、可光异构化的部分、生物素、生物素类似物、掺 有重原子的部分、化学可裂解基团、光可裂解基团、长侧链、碳连接的糖、 氧化还原活化剂、氨基硫代酸、毒性部分、同位素标记的部分、生物物理 探针、磷光基团、发色团、化学发光基团、荧光部分、电子致密基团、磁 性基团、嵌入基团、螯合基团、生色团、能量转移剂、生物活性剂、可检 测标记物、小分子、抑制性核糖核酸、siRNA、放射性核苷酸、中子俘获 剂、生物素衍生物、量子点、纳米递质、放射性递质、抗体酶、酶、活化 的复合活化剂、病毒、毒素、佐剂、TLR2激动剂、TLR4激动剂、TLR7 激动剂、TLR9激动剂、TLR8激动剂、T-细胞表位、磷脂、LPS-样分子、 钥孔血蓝蛋白(KLH)、免疫原性半抗原、aglycan、变应原、制管张素、抗 激素药、抗氧化剂、适体、指导RNA、皂角苷、穿梭载体、大分子、模拟 表位、受体、反胶束、洗涤剂、免疫反应增效剂、荧光染料、FRET试剂、 放射成像探针、其它的光谱学探针、药物前体、用于免疫治疗的毒素、固 体支持物、-CH2CH2-(OCH2CH2O)p-OX2、-O-(CH2CH2O)pCH2CH2-X2, 及其任意组合,其中p是1至10,000,且X2是H、C1-8烷基、保护基团或 末端官能团。

在某些实施方案中,k是1至11的整数。在某些实施方案中,k是1 至10的整数。在某些实施方案中,k是1至9的整数。在某些实施方案中, k是1至8的整数。在某些实施方案中,k是1至7的整数。在某些实施 方案中,k是1至6的整数。在某些实施方案中,k是1至5的整数。在 某些实施方案中,k是1至4的整数。在某些实施方案中,k是1至3的 整数。在某些实施方案中,k是1至2的整数。

在某些实施方案中,p是1至8000的整数。在某些实施方案中,p是 1至7000的整数。在某些实施方案中,p是1至6000的整数。在某些实施 方案中,p是1至5000的整数。在某些实施方案中,p是1至4000的整 数。在某些实施方案中,p是1至3000的整数。在某些实施方案中,p是 1至2000的整数。在某些实施方案中,p是1至1000的整数。在某些实施 方案中,p是1至500的整数。在某些实施方案中,p是1至400的整数。 在某些实施方案中,p是1至300的整数。在某些实施方案中,p是1至 200的整数。在某些实施方案中,p是1至100的整数。在某些实施方案中, p是1至90的整数。在某些实施方案中,p是1至80的整数。在某些实 施方案中,p是1至70的整数。在某些实施方案中,p是1至60的整数。 在某些实施方案中,p是1至50的整数。在某些实施方案中,p是1至40 的整数。在某些实施方案中,p是1至30的整数。在某些实施方案中,p 是1至20的整数。在某些实施方案中,p是1至10的整数。在某些实施 方案中,p是1至5的整数。

式(IV)化合物的非限制性实例包括:

其中具有一个或多个聚乙二醇(PEG)部分的化合物具有1000Da至50kDa 的平均分子量,n是20至1200,并且其中exPADRE是 AlaGlySerArgSerGly(DAla)LysChaValAlaAlaTrpThrLeuLysAla(D- Ala)Gly-OH,PADRE是 Gly(DAla)LysChaValAlaAlaTrpThrLeuLysAla(D-Ala)Gly-OH,BG1是 5’*T*C*C*A*T*G*A*C*G*T*T*C*C*T*G*A*C*G*T*T-3’且BG2是 5’*T*C*G*T*C*G*T*T*T*T*C*G*G*C*G*C*G*C*G*C*C*G-3’,以及 其中*表示硫代磷酸酯连接。

在某些实施方案中,含有一个或多个应用本文提供的方法衍生化的吡 咯赖氨酸和/或PCL的蛋白质、多肽和/或肽具有式(II)的结构:

R1-(BB)n-R2

(II)

其中:

R1是H或氨基末端修饰基团;

R2是OH或羧基末端修饰基团;

n是1至5000的整数;

每一个BB独立地选自氨基酸残基、具有式(A-2)结构的吡咯赖氨酸类 似物氨基酸残基、具有式(B-2)结构的吡咯赖氨酸类似物氨基酸残基、具有 式(C-1)结构的吡咯赖氨酸类似物氨基酸残基、具有式(D-1)结构的吡咯赖氨 酸类似物氨基酸残基、具有式(E-1)结构的吡咯赖氨酸类似物氨基酸残基、 具有式(F-1)结构的吡咯赖氨酸类似物氨基酸残基、具有式(G-1)结构的吡咯 赖氨酸类似物氨基酸残基、具有式(H-1)结构的吡咯赖氨酸类似物氨基酸残 基、具有式(I-1)结构的吡咯赖氨酸类似物氨基酸残基、具有式(J-1)结构的 吡咯赖氨酸类似物氨基酸残基、具有式(K-1)结构的吡咯赖氨酸类似物氨基 酸残基、具有式(L-1)结构的吡咯赖氨酸类似物氨基酸残基、或其异构体;

其中,

R3、R5和每一个R4独立地选自H、-OH、-NO2、卤代、C1-8烷基、 卤素取代的-C1-8烷基、羟基取代的-C1-8烷基、芳基、杂芳基、杂环烷基或 环烷基和-LX1

R6是H或C1烷基;

A是C3-C8环烷基、C3-C8杂环烷基、5-6元单环芳基、5-6元单环杂 芳基、9-10元稠合二环或13-14元稠合三环,其中A任选地被1至5个 独立选自-OH、-NO2、卤代、C1-8烷基、卤素取代的-C1-8烷基、羟基取代 的-C1-8烷基、芳基、杂芳基、杂环烷基或环烷基和-LX1的取代基取代;

L选自键、C1-8亚烷基、卤素取代的-C1-8亚烷基、羟基取代的-C1-8亚 烷基、C2-8亚烯基、卤素取代的-C2-8亚烯基、羟基取代的-C2-8亚烯基、聚 烷基二醇、聚乙二醇、-O(CR11R12)k-、-S(CR11R12)k-、-S(O)k(CR11R12)k-、 -O(CR11R12)k-NR11C(O)-、-O(CR11R12)kC(O)NR11-、-C(O)-、 -C(O)(CR11R12)k-、-C(S)-、-C(S)(CR11R12)k-、-C(O)NR11-、-NR11C(O)-、 -NR11(CR11R12)k-、-CONR11(CR11R12)k-、-N(R11)CO(CR11R12)k-、 -C(O)NR11(CR11R12)k-、-NR11C(O)(CR11R12)k-,其中每一个R11和R12独立 地是H、C1-8烷基、卤素取代的-C1-8烷基或羟基取代的-C1-8烷基,并且k 是1至12的整数;且

X1选自标记物、染料、聚合物、水溶性聚合物、聚烷基二醇、聚乙二 醇、聚乙二醇衍生物、糖、脂类、光交联剂、细胞毒性化合物、药物、亲 和标记物、光亲和标记物、反应性化合物;树脂、肽、另一种蛋白质或多 肽或多肽类似物、抗体或抗体片段、金属螯合剂、辅因子、脂肪酸、碳水 化合物、多核苷酸、DNA、RNA、PCR探针、反义多核苷酸、核糖寡核 苷酸、脱氧核糖寡核苷酸、硫代磷酸酯-修饰的DNA、修饰的DNA和RNA、 肽核酸、糖类、二糖、寡糖、多糖、水溶性树枝状聚合物、环糊精、生物 材料、纳米颗粒、自旋标记物、荧光团、含金属的部分、放射性部分、新 官能团、与其它分子共价或非共价相互作用的基团、光笼获部分、可光化 辐射激发的部分、配体、可光异构化的部分、生物素、生物素类似物、掺 有重原子的部分、化学可裂解基团、光可裂解基团、长侧链、碳连接的糖、 氧化还原活化剂、氨基硫代酸、毒性部分、同位素标记的部分、生物物理 探针、磷光基团、发色团、化学发光基团、荧光部分、电子致密基团、磁 性基团、嵌入基团、螯合基团、生色团、能量转移剂、生物活性剂、可检 测标记物、小分子、抑制性核糖核酸、siRNA、放射性核苷酸、中子俘获 剂、生物素衍生物、量子点、纳米递质、放射性递质、抗体酶、酶、活化 的复合活化剂、病毒、毒素、佐剂、TLR2激动剂、TLR4激动剂、TLR7 激动剂、TLR9激动剂、TLR8激动剂、T-细胞表位、磷脂、LPS-样分子、 钥孔血蓝蛋白(KLH)、免疫原性半抗原、aglycan、变应原、制管张素、抗 激素药、抗氧化剂、适体、指导RNA、皂角苷、穿梭载体、大分子、模拟 表位、受体、反胶束、洗涤剂、免疫反应增效剂、荧光染料、FRET试剂、 放射成像探针、其它的光谱学探针、药物前体、用于免疫治疗的毒素、固 体支持物、-CH2CH2-(OCH2CH2O)p-OX2、-O-(CH2CH2O)pCH2CH2-X2, 及其任意组合,其中p是1至10,000,且X2是H、C1-8烷基、保护基团或 末端官能团;

其中至少一个AA是具有式(A-2)或式(B-2)结构的吡咯赖氨酸类似物氨 基酸残基,或至少一个BB是具有式(C-1)或式(D-1)或式(E-1)或式(F-1)或式 (G-1)或式(H-1)或式(I-1)或式(J-1)或式(K-1)或式(L-1)结构的吡咯赖氨酸类 似物氨基酸残基,或其异构体。

在某些实施方案中,k是1至11的整数。在某些实施方案中,k是1 至10的整数。在某些实施方案中,k是1至9的整数。在某些实施方案中, k是1至8的整数。在某些实施方案中,k是1至7的整数。在某些实施 方案中,k是1至6的整数。在某些实施方案中,k是1至5的整数。在 某些实施方案中,k是1至4的整数。在某些实施方案中,k是1至3的 整数。在某些实施方案中,k是1至2的整数。

在某些实施方案中,p是1至8000的整数。在某些实施方案中,p是 1至7000的整数。在某些实施方案中,p是1至6000的整数。在某些实施 方案中,p是1至5000的整数。在某些实施方案中,p是1至4000的整 数。在某些实施方案中,p是1至3000的整数。在某些实施方案中,p是 1至2000的整数。在某些实施方案中,p是1至1000的整数。在某些实施 方案中,p是1至500的整数。在某些实施方案中,p是1至400的整数。 在某些实施方案中,p是1至300的整数。在某些实施方案中,p是1至 200的整数。在某些实施方案中,p是1至100的整数。在某些实施方案中, p是1至90的整数。在某些实施方案中,p是1至80的整数。在某些实 施方案中,p是1至70的整数。在某些实施方案中,p是1至60的整数。 在某些实施方案中,p是1至50的整数。在某些实施方案中,p是1至40 的整数。在某些实施方案中,p是1至30的整数。在某些实施方案中,p 是1至20的整数。在某些实施方案中,p是1至10的整数。在某些实施 方案中,p是1至5的整数。

在某些实施方案中,n是1至4000的整数。在某些实施方案中,n是 1至3000的整数。在某些实施方案中,n是1至2000的整数。在某些实施 方案中,n是1至1000的整数。在某些实施方案中,n是1至700的整数。 在某些实施方案中,n是1至800的整数。在某些实施方案中,n是1至 600的整数。在某些实施方案中,n是1至500的整数。在某些实施方案中, n是1至400的整数。在某些实施方案中,n是1至300的整数。在某些 实施方案中,n是1至200的整数。在某些实施方案中,n是1至100的 整数。在某些实施方案中,n是1至90的整数。在某些实施方案中,n是 1至80的整数。在某些实施方案中,n是1至70的整数。在某些实施方案 中,n是1至60的整数。在某些实施方案中,n是1至50的整数。在某 些实施方案中,n是1至40的整数。在某些实施方案中,n是1至30的 整数。在某些实施方案中,n是1至20的整数。在某些实施方案中,n是 1至10的整数。在某些实施方案中,n是1至5的整数。

在某些实施方案中,在本文提供的衍生化方法中使用的式(III)化合物 包括但不限于氨基糖。在某些实施方案中,所述氨基糖包括但不限于D- 甘露糖胺和D-半乳糖胺。

在某些实施方案中,在本文提供的衍生化方法中使用的式(IV)化合物 包括但不限于2-氨基-苯甲醛(2-ABA)、2-氨基-苯甲醛(2-ABA)的衍生物、 本文提供的2-氨基-苯甲醛(2-ABA)的衍生物、2-氨基-苯乙酮(2-AAP)、2- 氨基-苯乙酮(2-AAP)的衍生物、本文提供的2-氨基-苯乙酮(2-AAP)的衍生 物、2-氨基-5-硝基-二苯甲酮(2-ANBP)、2-氨基-5-硝基-二苯甲酮(2-ANBP) 的衍生物和本文提供的2-氨基-5-硝基-二苯甲酮(2-ANBP)的衍生物。

图22显示了用2-氨基-苯甲醛(2-ABA)化学衍生化PCL-A的反应流 程,其中一个或多个PCL-A已经被位点特异性地掺入蛋白质中。该半醛与 2-ABA的环化反应是Friedlaender型反应,其导致喹唑啉型部分的形成(图 22-A或22-B),其可用合适的还原剂进一步还原形成四氢喹唑啉型部分 (22-D)或取代的苯胺类(22-E)。或者,喹唑啉型部分22-B的进一步反应导 致了稠合环部分(22-C)的形成。还原喹唑啉型部分的合适还原剂包括但不 限于氰基硼氢化钠和硼氢化钠。

此外,图23显示了在PCL-A与2-ABA、2-AAP或2-ANBP反应后形 成的各种蛋白质缀合物的结构。还显示了由于连接所述基团导致的预期质 量增加。应用NMR波谱表征应用所述基团获得的结构(参见实施例45)。 此外,发现NaCNBH3还原稳定了基于PCL的蛋白质缀合物,并阻止甚至 高温下PCL-ABA和PCL-AAP连接的解离(参见实施例44)。

已将2-ABA与Δ1-吡咯啉-5-甲酸(L-1-吡咯啉-5-甲酸)(参见Strecker, H.J.,(1971),Methods in Enzymology 27B,254-257;Vogel,H.J.,和Davis,B. D.(1953),“Glutamic gamma-semialdehyde and  delta1-pyrroline-5-carboxylic acid,intermediates in the biosynthesis of  proline,”J.Am.Chem.Soc.74,109-112;以及Schoepf,C.,和Oechler,F., (1936),Ann.Chem.523,1)、以及其它吡咯啉类(参见Schoepf,C.,和 Oechler,F.,(1936),Ann.Chem.523,1;以及Schoepf,C.,和Steuer,H., (1947),Ann.Chem.558,124)的反应用作比色测定,用于研究Δ1-吡咯啉-5- 甲酸在脯氨酸代谢和生物合成中的作用(参见Vogel,H.J.,和Davis,B.D. (1953),“Glutamic gamma-semialdehyde and Δ1-pyrroline-5-carboxylic  acid,intermediates in the biosynthesis of proline,”J.Am.Chem.Soc.74, 109-112;Strecker,H.J.,(1960),“The interconversion of glutamic acid and  proline,”J.Biol.Chem.235,2045-2050;Mezl,V.A.,和Knox,W.E.,(1976), “Properties and analysis of a stable derivative of pyrroline-5-carboxylic  acid for use in metabolic studies,”Analytical Biochemistry 74,430-40;Wu, G.Y.,和Seifter,S.,(1975),“A new method for the preparation of delta  1-pyrroline 5-carboxylic acid and proline,”Analytical Biochemistry 67, 413-21;Williams,I.,和Frank,L.,(1975),“Improved chemical synthesis  and enzymatic assay of Δ1-pyrroline-5-carboxylic acid,”Anal.Biochem.64, 85-97;以及Strecker,H.J.,(1957),“The interconversion of glutamic acid  and proline,”J.Biol.Chem.225,825)。尽管反应流程显示了形成谷氨酸-γ- 半醛中间体,但是所述反应可能直接从吡咯啉-羧基-赖氨酸开始,而没有 形成所述中间体。

模式蛋白hRBP4的高分辨质谱研究证实了用2-ABA对PCL残基的化 学衍生化,其中所述PCL位点特异性地掺入蛋白hRBP4中(图25-26,参 见实施例11)。图24显示了用2-ABA衍生的hRBP4Phe122PCL的质谱分 析,其中用2-ABA衍生化的蛋白质产生了在23269.2Da的主峰,以及在 23166.8Da检测到最小量的未修饰蛋白质。衍生化的蛋白质102.4Da的质 量增加与连接图23所示的2-ABA部分预期增加103Da相符。因此证实了 具有位点特异性掺入PCL的蛋白质在PCL位点处被位点特异性地修饰。 2-ABA-衍生的hRBP4Phe122PCL蛋白质的胰蛋白酶消化物的LC-MS分 析之后获得的MS/MS分析(图25)鉴定了预期的YWGVASF*LQK肽,其 中F*具有与2-ABA-修饰的PCL相一致的质量。图25A是 YWGVASF*LQK肽的碎裂图,其中F*具有与2-ABA-修饰的PCL相一致 的质量。图25B是YWGVASF*LQK(F*=PCL和PCL-2-ABA加合物) 的2+离子的TIC(总离子色谱)和EIC(提取离子色谱),其中比较衍生化和 未衍生化(不能检测)物质的EIC表明反应的完全。图25C是用2-ABA衍 生化的hRBP4Phe122PCL的质谱分析,其显示了分别在m/z 459.92(3+) 和689.37(2+)处的YWGVASF*LQK的3+和2+前体(F*=PCL-2-ABA加 合物),从而证实了所观察到的与2-ABA的反应是位点特异性地与在残基 122的期望TAG位点处掺入的PCL残基发生的。

图26显示了衍生化的pH依赖性评估。图26A显示了具有在122位掺 入的PCL的hRBP4(hRBP4Phe122PCL)的质谱,其中hRBP4Phe122PCL 未与2-ABA反应,而图26B和图26C是分别在醋酸盐缓冲液(pH 5.0)与10 mM 2-ABA、以及在磷酸盐缓冲液(pH 7.4)中与10mM 2-ABA反应后的 hRBP4Phe122PCL的质谱。hRBP4蛋白的PCL残基与2-ABA的反应在 调节至pH 5的水性缓冲液中在室温下快速进行达95%完成度,而在pH 7.4 则为稍低程度,至约87%。如图27D-F所示,与2-ABA的反应对PCL残 基有选择性,其中对于在62位用惰性非天然氨基酸O-甲基-苯基丙氨酸 (OMePhe)标记且在122位具有野生型苯基丙氨酸(Phe)残基的hRBP4没有 观察到与2-ABA的反应。

图27显示了作为反应物与蛋白浓度之比的函数的反应效率,以及与 2-ABA样反应物的反应性。图27A显示了在122位掺入了PCL的hRBP4 (hRBP4Phe122PCL)在与0.1mM 2-氨基-苯甲醛(2-ABA)反应后的质谱, 而图27B和27C分别显示了hRBP4Phe122PCL与0.1mM 2-氨基-苯乙酮 (2-AAP)及0.1mM 2-氨基-5-硝基-二苯甲酮(2-ANBP)反应后的质谱。所有 反应均在200mM醋酸钠(pH 5.0)中进行。在正确的质量处检测到蛋白质缀 合物,并且具有如图23给出的预期质量增加。此外,对于2-ABA和2-AAP 而言达到了超过88%转化的产率,尽管由于低溶解度,2-ANBP获得约5% 的产率。然而,这证实了2-ABA类似物在6比1的反应物对蛋白质浓度比 之下,在PCL掺入位点有效地反应。反应的程度仅比在600比1的反应物 对蛋白质比之下的那些略低(图26)。

当以0.1至10mM范围的终浓度添加衍生化试剂(相当于比蛋白质过 量6至600倍摩尔浓度)时,衍生化程度没有显著改善。此外,在超过4700 的摩尔比,其它的蛋白质残基(推测是赖氨酸)被2-ABA衍生化(图28)。在 图28中,在10x PBS中2-ABA比蛋白质的大量过量,导致在掺入了PCL 的hRBP4(A,~17μM,2-ABA比蛋白质过量4700倍)以及掺入了OMePhe 的hRBP4(B,~6.5μM,15400倍过量)中其它位置处发生缀合,说明在这些 额外位点处的缀合被PCL之外的残基介导。

为进一步说明本文提供的方法的实用性,图29显示了在pH 5.0和pH 7.4用2-氨基-苯乙酮(2-AAP)衍生化掺入FAS-TE中的PCL之前和之后的 质谱(参见,实施例12)。图29A显示了未反应的FAS-TE Tyr2454PCL的 质谱,而图29B显示了在pH 5.0的反应混合物的质谱。在这里,可观测的 峰强度100%发生在33318.8Da处,其比未反应的材料大116.8Da,正如 预期2-AAP修饰的FAS-TE Tyr2454PCL的预期117Da的质量增加。类 似地,在pH 7.4下,反应进行95%完全(图29C(未反应)和图29D(反应的))。

图30是通过用2-氨基-苯甲醛或2-氨基-苯甲醛类似物化学衍生化吡咯 赖氨酸和/或PCL从而位点特异性修饰蛋白质的一般反应流程。本文提供 了此类衍生物的某些实施方案。吡咯赖氨酸及PCL的吡咯啉环与2-ABA 的反应与Δ1-吡咯啉-5-甲酸与2-ABA的反应类似。类似地,吡咯赖氨酸及 PCL与2-AAP及2-ANBP的反应产生了用图23中各取代的部分修饰的蛋 白质。

在某些实施方案中,应用2-ABA的功能性将各种基团位点特异性地连 接至具有掺入其中的吡咯赖氨酸或PCL的蛋白质、多肽和/或肽中。所述 基团包括但不限于标记物、染料、聚合物、水溶性聚合物、聚烷基二醇、 聚乙二醇、聚乙二醇衍生物、糖、脂类、光交联剂、细胞毒性化合物、药 物、亲和标记物、光亲和标记物、反应性化合物;树脂、肽、另一种蛋白 质或多肽或多肽类似物、抗体或抗体片段、金属螯合剂、辅因子、脂肪酸、 碳水化合物、多核苷酸、DNA、RNA、PCR探针、反义多核苷酸、核糖 寡核苷酸、脱氧核糖寡核苷酸、硫代磷酸酯-修饰的DNA、修饰的DNA和 RNA、肽核酸、糖类、二糖、寡糖、多糖、水溶性树枝状聚合物、环糊精、 生物材料、纳米颗粒、自旋标记物、荧光团、含金属的部分、放射性部分、 新官能团、与其它分子共价或非共价相互作用的基团、光笼获部分、可光 化辐射激发的部分、配体、可光异构化的部分、生物素、生物素类似物、 掺有重原子的部分、化学可裂解基团、光可裂解基团、长侧链、碳连接的 糖、氧化还原活化剂、氨基硫代酸、毒性部分、同位素标记的部分、生物 物理探针、磷光基团、发色团、化学发光基团、荧光部分、电子致密基团、 磁性基团、嵌入基团、螯合基团、生色团、能量转移剂、生物活性剂、可 检测标记物、小分子、抑制性核糖核酸、siRNA、放射性核苷酸、中子俘 获剂、生物素衍生物、量子点、纳米递质、放射性递质、抗体酶、酶、活 化的复合活化剂、病毒、毒素、佐剂、TLR2激动剂、TLR4激动剂、TLR7 激动剂、TLR9激动剂、TLR8激动剂、T-细胞表位、磷脂、LPS-样分子、 钥孔血蓝蛋白(KLH)、免疫原性半抗原、aglycan、变应原、制管张素、抗 激素药、抗氧化剂、适体、指导RNA、皂角苷、穿梭载体、大分子、模拟 表位、受体、反胶束、洗涤剂、免疫反应增效剂、荧光染料、FRET试剂、 放射成像探针、其它的光谱学探针、药物前体、用于免疫治疗的毒素、固 体支持物、-CH2CH2-(OCH2CH2O)p-OX2、-O-(CH2CH2O)pCH2CH2-X2, 及其任意组合,其中p是1至10,000,且X2是H、C1-8烷基、保护基团或 末端官能团。

在某些实施方案中,应用2-AAP的功能性将各种基团位点特异性地连 接至具有掺入其中的吡咯赖氨酸或PCL的蛋白质、多肽和/或肽中。所述 基团包括但不限于标记物、染料、聚合物、水溶性聚合物、聚烷基二醇、 聚乙二醇、聚乙二醇衍生物、糖、脂类、光交联剂、细胞毒性化合物、药 物、亲和标记物、光亲和标记物、反应性化合物;树脂、肽、另一种蛋白 质或多肽或多肽类似物、抗体或抗体片段、金属螯合剂、辅因子、脂肪酸、 碳水化合物、多核苷酸、DNA、RNA、PCR探针、反义多核苷酸、核糖 寡核苷酸、脱氧核糖寡核苷酸、硫代磷酸酯-修饰的DNA、修饰的DNA和 RNA、肽核酸、糖类、二糖、寡糖、多糖、水溶性树枝状聚合物、环糊精、 生物材料、纳米颗粒、自旋标记物、荧光团、含金属的部分、放射性部分、 新官能团、与其它分子共价或非共价相互作用的基团、光笼获部分、可光 化辐射激发的部分、配体、可光异构化的部分、生物素、生物素类似物、 掺有重原子的部分、化学可裂解基团、光可裂解基团、长侧链、碳连接的 糖、氧化还原活化剂、氨基硫代酸、毒性部分、同位素标记的部分、生物 物理探针、磷光基团、发色团、化学发光基团、荧光部分、电子致密基团、 磁性基团、嵌入基团、螯合基团、生色团、能量转移剂、生物活性剂、可 检测标记物、小分子、抑制性核糖核酸、siRNA、放射性核苷酸、中子俘 获剂、生物素衍生物、量子点、纳米递质、放射性递质、抗体酶、酶、活 化的复合活化剂、病毒、毒素、佐剂、TLR2激动剂、TLR4激动剂、TLR7 激动剂、TLR9激动剂、TLR8激动剂、T-细胞表位、磷脂、LPS-样分子、 钥孔血蓝蛋白(KLH)、免疫原性半抗原、aglycan、变应原、制管张素、抗 激素药、抗氧化剂、适体、指导RNA、皂角苷、穿梭载体、大分子、模拟 表位、受体、反胶束、洗涤剂、免疫反应增效剂、荧光染料、FRET试剂、 放射成像探针、其它的光谱学探针、药物前体、用于免疫治疗的毒素、固 体支持物、-CH2CH2-(OCH2CH2O)p-OX2、-O-(CH2CH2O)pCH2CH2-X2, 及其任意组合,其中p是1至10,000,且X2是H、C1-8烷基、保护基团或 末端官能团。

在某些实施方案中,应用2-ANPA的功能性将各种基团位点特异性地 连接至具有掺入其中的吡咯赖氨酸或PCL的蛋白质、多肽和/或肽中。所 述基团包括但不限于标记物、染料、聚合物、水溶性聚合物、聚烷基二醇、 聚乙二醇、聚乙二醇衍生物、糖、脂类、光交联剂、细胞毒性化合物、药 物、亲和标记物、光亲和标记物、反应性化合物;树脂、肽、另一种蛋白 质或多肽或多肽类似物、抗体或抗体片段、金属螯合剂、辅因子、脂肪酸、 碳水化合物、多核苷酸、DNA、RNA、PCR探针、反义多核苷酸、核糖 寡核苷酸、脱氧核糖寡核苷酸、硫代磷酸酯-修饰的DNA、修饰的DNA和 RNA、肽核酸、糖类、二糖、寡糖、多糖、水溶性树枝状聚合物、环糊精、 生物材料、纳米颗粒、自旋标记物、荧光团、含金属的部分、放射性部分、 新官能团、与其它分子共价或非共价相互作用的基团、光笼获部分、可光 化辐射激发的部分、配体、可光异构化的部分、生物素、生物素类似物、 掺有重原子的部分、化学可裂解基团、光可裂解基团、长侧链、碳连接的 糖、氧化还原活化剂、氨基硫代酸、毒性部分、同位素标记的部分、生物 物理探针、磷光基团、发色团、化学发光基团、荧光部分、电子致密基团、 磁性基团、嵌入基团、螯合基团、生色团、能量转移剂、生物活性剂、可 检测标记物、小分子、抑制性核糖核酸、siRNA、放射性核苷酸、中子俘 获剂、生物素衍生物、量子点、纳米递质、放射性递质、抗体酶、酶、活 化的复合活化剂、病毒、毒素、佐剂、TLR2激动剂、TLR4激动剂、TLR7 激动剂、TLR9激动剂、TLR8激动剂、T-细胞表位、磷脂、LPS-样分子、 钥孔血蓝蛋白(KLH)、免疫原性半抗原、aglycan、变应原、制管张素、抗 激素药、抗氧化剂、适体、指导RNA、皂角苷、穿梭载体、大分子、模拟 表位、受体、反胶束、洗涤剂、免疫反应增效剂、荧光染料、FRET试剂、 放射成像探针、其它的光谱学探针、药物前体、用于免疫治疗的毒素、固 体支持物、-CH2CH2-(OCH2CH2O)p-OX2、-O-(CH2CH2O)pCH2CH2-X2, 及其任意组合,其中p是1至10,000,且X2是H、C1-8烷基、保护基团或 末端官能团。

图30所示的连接位点R7至R11中的任一个被用于连接这些前述基团 中的任一个至2-ABA、2-AAP和2-ANPA。在其它实施方案中,苯环被本 文提供的任何其它环结构包括但不限于萘所替换。在其它实施方案中,苯 环被糖替换。

在本文提供的方法中用于衍生化掺入蛋白质、多肽和/或肽中的吡咯赖 氨酸和PCL的衍生试剂的浓度是约0.005mM至约50mM。在某些实施 方案中,在本文提供的方法中用于衍生化吡咯赖氨酸或PCL的衍生试剂的 浓度是约0.005mM至约25mM。在某些实施方案中,在本文提供的方法 中用于衍生化吡咯赖氨酸或PCL的衍生试剂的浓度是约0.005mM至约 10mM。在某些实施方案中,在本文提供的方法中用于衍生化吡咯赖氨酸 或PCL的衍生试剂的浓度是约0.005mM至约5mM。在某些实施方案中, 在本文提供的方法中用于衍生化吡咯赖氨酸或PCL的衍生试剂的浓度是 约0.005mM至约2mM。在某些实施方案中,在本文提供的方法中用于 衍生化吡咯赖氨酸或PCL的衍生试剂的浓度是约0.005mM至约1mM。

在本文提供的衍生化方法中,衍生试剂与具有一个或多个掺入其中的 吡咯赖氨酸或PCL的蛋白质、多肽或肽的摩尔比是约0.05至约10000。在 某些实施方案中,衍生试剂与所述蛋白质、多肽或肽的摩尔比是约0.05至 约8000。在某些实施方案中,衍生试剂与所述蛋白质、多肽或肽的摩尔比 是约0.05至约6000。在某些实施方案中,衍生试剂与所述蛋白质、多肽或 肽的摩尔比是约0.05至约4000。在某些实施方案中,衍生试剂与所述蛋白 质、多肽或肽的摩尔比是约0.05至约2000。在某些实施方案中,衍生试剂 与所述蛋白质、多肽或肽的摩尔比是约0.05至约1000。在某些实施方案中, 衍生试剂与所述蛋白质、多肽或肽的摩尔比是约0.05至约800。在某些实 施方案中,衍生试剂与所述蛋白质、多肽或肽的摩尔比是约0.05至约600。 在某些实施方案中,衍生试剂与所述蛋白质、多肽或肽的摩尔比是约0.05 至约400。在某些实施方案中,衍生试剂与所述蛋白质、多肽或肽的摩尔 比是约0.05至约200。在某些实施方案中,衍生试剂与所述蛋白质、多肽 或肽的摩尔比是约0.05至约100。在某些实施方案中,衍生试剂与所述蛋 白质、多肽或肽的摩尔比是约0.05至约50。在某些实施方案中,衍生试剂 与所述蛋白质、多肽或肽的摩尔比是约0.05至约25。在某些实施方案中, 衍生试剂与所述蛋白质、多肽或肽的摩尔比是约0.05至约10。在某些实施 方案中,衍生试剂与所述蛋白质、多肽或肽的摩尔比是约0.05至约1。

在其它实施方案中,衍生试剂与所述蛋白质、多肽或肽的摩尔比是约 1.5至约10000。在某些实施方案中,衍生试剂与所述蛋白质、多肽或肽的 摩尔比是约1.5至约8000。在某些实施方案中,衍生试剂与所述蛋白质、 多肽或肽的摩尔比是约1.5至约6000。在某些实施方案中,衍生试剂与所 述蛋白质、多肽或肽的摩尔比是约1.5至约4000。在某些实施方案中,衍 生试剂与所述蛋白质、多肽或肽的摩尔比是约1.5至约2000。在某些实施 方案中,衍生试剂与所述蛋白质、多肽或肽的摩尔比是约1.5至约1000。 在某些实施方案中,衍生试剂与所述蛋白质、多肽或肽的摩尔比是约1.5 至约800。在某些实施方案中,衍生试剂与所述蛋白质、多肽或肽的摩尔 比是约1.5至约600。在某些实施方案中,衍生试剂与所述蛋白质、多肽或 肽的摩尔比是约1.5至约400。在某些实施方案中,衍生试剂与所述蛋白质、 多肽或肽的摩尔比是约1.5至约200。在某些实施方案中,衍生试剂与所述 蛋白质、多肽或肽的摩尔比是约1.5至约100。在某些实施方案中,衍生试 剂与所述蛋白质、多肽或肽的摩尔比是约1.5至约50。在某些实施方案中, 衍生试剂与所述蛋白质、多肽或肽的摩尔比是约1.5至约25。在某些实施 方案中,衍生试剂与所述蛋白质、多肽或肽的摩尔比是约1.5至约10。在 某些实施方案中,衍生试剂与所述蛋白质、多肽或肽的摩尔比是约6至约 600。

在应用本文提供的方法和组合物衍生化蛋白质、多肽和/或肽当中使用 的缓冲溶液的pH为约pH 2至约pH 10。在某些实施方案中,所述pH为 约pH 4至约pH 8。在某些实施方案中,所述pH为约pH 4至约pH 7.5。 在某些实施方案中,所述pH为约pH 4至约pH 7。在某些实施方案中, 所述pH为约pH 4至约pH 6.5。在某些实施方案中,所述pH为约pH 4 至约pH 6。在某些实施方案中,所述pH为约pH 4至约pH 5.5。在某些 实施方案中,所述pH为约pH 4至约pH 5。在某些实施方案中,所述pH 为约pH 4至约pH 4.5。在某些实施方案中,所述pH为约pH 6至约pH 8。 在某些实施方案中,所述pH为约pH 6至约pH 7.5。在某些实施方案中, 所述pH为约pH 6至约pH 7。在某些实施方案中,所述pH为约pH 6至 约pH 6.5。在某些实施方案中,所述pH为约pH 7至约pH 8。在某些实 施方案中,所述pH为约pH 7至约pH 7.5。

本文提供的衍生化方法可用于衍生化位点特异性地掺入蛋白质中的吡 咯赖氨酸或PCL。在某些实施方案中,所述衍生化方法用于衍生化在单个 位点掺入蛋白质、多肽和/或肽中的PCL残基。在某些实施方案中,所述 衍生化方法用于衍生化在多个位点掺入蛋白质、多肽和/或肽中的PCL残 基。在某些实施方案中,应用本文提供的方法和组合物衍生化的蛋白质、 多肽或肽含有1、2、3、4、5、6、7、6、9、10、11、12、13、14、15或 更多个吡咯赖氨酸或吡咯赖氨酸类似物。

在本文提供的另一方面,通过至少一种共翻译修饰或翻译后修饰衍生 化具有掺入其中的一个或多个吡咯赖氨酸或PCL的蛋白质、多肽和肽。所 述共翻译修饰或翻译后修饰的非限制性实例包括但不限于糖基化、乙酰化、 酰化、甲基化、硝化、硫酸化、脂质修饰、棕榈酰化、棕榈酸盐加成、磷 酸化、糖脂键修饰等。这一方面还包括产生、纯化、表征和应用此类含有 至少一个所述共翻译或翻译后修饰的蛋白质、多肽和肽的方法。

应用位点特异性修饰的生物治疗

与掺入蛋白质、多肽和/或肽中的PCL或吡咯赖氨酸偶联的大分子聚合物

在某些实施方案中,本文描述的组合物、方法、技术和策略用于将大 分子聚合物添加至掺入蛋白质、多肽和/或肽中的吡咯赖氨酸或PCL残基。 众多的大分子聚合物可与本文描述的掺入蛋白质、多肽和/或肽中的吡咯赖 氨酸及PCL残基偶联。此类修饰用于调节所述蛋白质、多肽和/或肽的生 物学性质,和/或给所述蛋白质、多肽和/或肽提供新的生物学性质。在某些 实施方案中,大分子聚合物通过直接偶联至掺入蛋白质、多肽和/或肽中的 吡咯赖氨酸或PCL残基,从而与本文提供的蛋白质、多肽和/或肽偶联。 在其它实施方案中,大分子聚合物通过与吡咯赖氨酸或PCL残基偶联的双 官能、三官能、四官能和多官能连接体,与本文提供的蛋白质、多肽和/ 或肽偶联。在其它实施方案中,大分子聚合物通过与吡咯赖氨酸或PCL残 基偶联的双官能连接体,与本文提供的蛋白质、多肽和/或肽偶联。在某些 实施方案中,所述双官能、三官能、四官能和多官能连接体是单功能性连 接体,其中所有末端均为对与吡咯赖氨酸或PCL残基的反应特异性的取代 基。在某些实施方案中,所述双官能、三官能、四官能和多官能连接体是 杂双功能性连接体,其中一个或多个末端是对与吡咯赖氨酸或PCL残基的 反应特异性的取代基,而其它末端是不与吡咯赖氨酸或PCL残基反应的另 一功能性取代基。本文提供了为吡咯赖氨酸或PCL特异性反应基团的某些 取代基,并且在所述双官能、三官能、四官能和多官能连接体中使用的其 它功能取代基和产生的连接包括但不限于表1中所列出的那些。

表1

大分子聚合物与生物活性分子(诸如本文提供的蛋白质、多肽和/或肽) 的共价连接代表一种增加所述生物活性分子的水溶性(诸如在生理环境 中)、生物利用度、增加血清半衰期、增加治疗半衰期、调节免疫原性、调 节生物活性或延长循环时间的方法。这些大分子聚合物的重要特征包括生 物相容性、无毒性以及无免疫原性,以及对于通过吡咯赖氨酸或PCL残基 与大分子聚合物偶联的本文提供的蛋白质、多肽和/或肽的治疗用途而言, 所述大分子聚合物是可药用的。

某些与掺入本文描述的蛋白质、多肽和/或肽中的吡咯赖氨酸或PCL 残基偶联的大分子聚合物是水溶性聚合物。在某些实施方案中,所述水溶 性聚合物通过掺入本文提供的蛋白质、多肽和/或肽中的吡咯赖氨酸或PCL 残基偶联,而在其它实施方案中,所述水溶性聚合物通过与掺入所述蛋白 质、多肽和/或肽中的吡咯赖氨酸或PCL残基偶联的任何官能团或取代基 偶联至本文提供的蛋白质、多肽和/或肽。在一些实施方案中,本文提供的 蛋白质、多肽和/或肽包含一个或多个与水溶性聚合物偶联的PCL残基, 以及一个或多个与水溶性聚合物连接的天然存在的氨基酸。

与掺入蛋白质、多肽和/或肽中的吡咯赖氨酸或PCL残基偶联的大分 子聚合物的结构形式包括但不限于线性、叉状或支链聚合物。在一些实施 方案中,所述支链或叉状水溶性聚合物的骨架具有2至约300个末端。在 某些实施方案中,所述多官能聚合物衍生物包括但不限于具有两个末端的 线性聚合物,其每一末端包含官能团。在某些实施方案中,所述官能团是 相同的,而在其它实施方案中,所述官能团是不同的。所述末端官能团的 非限制性实例包括但不限于N-琥珀酰亚氨基碳酸酯、胺、酰肼、琥珀酰亚 氨基丙酸酯以及琥珀酰亚氨基丁酸酯、琥珀酰亚氨基琥珀酸酯、琥珀酰亚 氨基酯、苯并三唑碳酸酯、缩水甘油醚、氧羰基咪唑、对硝基苯基碳酸酯、 醛、马来酰亚胺、邻吡啶基二硫化物、丙烯醇和乙烯基砜。在其它实施方 案中,官能团包括表1中列出的那些。

水溶性聚合物(在本文中也称为亲水聚合物)与生物活性分子(诸如本文 提供的蛋白质、多肽和/或肽)的共价连接代表增加所述生物活性分子的水 溶性(诸如在生理环境中)、生物利用度、增加血清半衰期、增加治疗半衰 期、调节免疫原性、调节生物活性或延长循环时间的方法。这些水溶性聚 合物的重要特征包括生物相容性、无毒性以及无免疫原性,以及对于通过 吡咯赖氨酸或PCL残基与水溶性聚合物偶联的本文提供的蛋白质、多肽和 /或肽的治疗用途而言,所述大分子聚合物是可药用的。

通过吡咯赖氨酸或PCL残基与蛋白质、多肽和/或肽偶联的亲水聚合 物包括但不限于:聚烷基醚以及其烷氧基封端类似物、聚乙烯吡咯烷酮、 聚乙烯基烷基醚、聚唑啉、聚烷基唑啉、聚羟烷基唑啉、聚丙烯酰 胺、聚烷基丙烯酰胺、聚羟烷基丙烯酰胺、聚羟烷基丙烯酸酯、聚唾液酸 及其类似物、亲水性肽序列、多糖及其衍生物、纤维素以及其衍生物、壳 多糖以及其衍生物、透明质酸以及其衍生物、淀粉、藻酸盐、硫酸软骨素、 白蛋白、支链淀粉、羧甲基支链淀粉、聚氨基酸以及其衍生物、马来酸酐 共聚物、聚乙烯醇及其共聚物、聚乙烯醇及其三元共聚物;及其组合。

所述聚烷基醚及其烷氧基封端类似物包括但不限于聚氧乙烯二醇(也 称作聚乙二醇或PEG)、聚氧乙烯/丙二醇(polyoxyethylene/propylene  glycol),及其甲氧基或乙氧基封端类似物。所述聚羟烷基丙烯酰胺包括但 不限于聚羟基丙基甲基丙烯酰胺以及其衍生物。所述多糖以及其衍生物包 括但不限于葡聚糖和葡聚糖衍生物(诸如,仅以例举的方式,羧甲基葡聚糖、 硫酸葡聚糖和氨基葡聚糖)。所述纤维素以及其衍生物包括但不限于羧甲基 纤维素和羟烷基纤维素。所述壳多糖以及其衍生物包括但不限于壳聚糖、 琥珀酰基壳聚糖、羧甲基壳多糖、羧甲基壳聚糖。所述聚氨基酸及其衍生 物包括但不限于聚谷氨酸、聚赖氨酸、聚天冬氨酸、聚天冬酰胺。所述马 来酸酐共聚物包括但不限于苯乙烯马来酸酐共聚物和二乙烯基乙基醚马来 酸酐共聚物。

在某些实施方案中,通过掺入所述蛋白质、多肽和/或肽中的吡咯赖氨 酸或PCL残基与本文提供的蛋白质、多肽和/或肽直接或间接偶联的水溶 性聚合物是聚乙二醇(PEG)。聚乙二醇被认为是生物相容的,其中PEG能 与活组织或生物体共存而不会引起伤害。PEG还基本上为非免疫原性的, 因此在体内不趋向于产生免疫反应。PEG为亲水性聚合物,其已广泛用于 药物、人造植入物中,以及其中生物相容性、无毒性和无免疫原性具有重 要性的其它应用中。PEG缀合物趋向于不产生明显的免疫反应或造成凝结 或其它不需要的效应。因此,当连接至在体内具有一些需要的功能的分子 (诸如生物活性剂)时,PEG趋向于掩蔽该物质且可减少或消除任何免疫反 应以便生物体可耐受所述物质的存在。

在一些实施方案中,通过掺入蛋白质、多肽和/或肽中的吡咯赖氨酸或 PCL残基与本文提供的蛋白质、多肽和/或肽直接或间接偶联的聚乙二醇是 直链聚合物,而在其它实施方案中,所述PEG聚合物是支链聚合物。所述 直链或支链PEG聚合物的分子量或分子量分布为约100Da至约100,000 Da或更高。在一些实施方案中,所述PEG聚合物的分子量或分子量分布 为约100Da至约50,000Da。在一些实施方案中,所述PEG聚合物的分子 量或分子量分布为约100Da至约40,000Da。在一些实施方案中,所述PEG 聚合物的分子量或分子量分布为约1,000Da至约40,000Da。在一些实施 方案中,所述PEG聚合物的分子量或分子量分布为约5,000Da至约40,000 Da。在一些实施方案中,所述PEG聚合物的分子量或分子量分布为约 10,000Da至约40,000Da。在一些实施方案中,所述PEG聚合物的分子量 为100,000Da、95,000Da、90,000Da、85,000Da、80,000Da、75,000Da、 70,000Da、65,000Da、60,000Da、55,000Da、50,000Da、45,000Da、40,000 Da、35,000Da、30,000Da、25,000Da、20,000Da、15,000Da、10,000Da、 9,000Da、8,000Da、7,000Da、6,000Da、5,000Da、4,000Da、3,000Da、 2,000Da、1,000Da、900Da、800Da、700Da、600Da、500Da、400Da、 300Da、200Da或100Da。

与掺入蛋白质、多肽和/或肽中的吡咯赖氨酸或PCL残基偶联的PEG 聚合物的结构形式包括但不限于线性、叉状或支链。在某些实施方案中, 所述支链或叉状PEG聚合物的骨架具有2至约300个末端。在某些实施方 案中,所述多官能聚合物衍生物包括但不限于具有两个末端的线性聚合物 的每一末端包含官能团。在某些实施方案中,所述官能团是相同的,而在 其它实施方案中,至少一个所述官能团是不同的。在其它实施方案中,所 述官能团是不同的。

在某些实施方案中,在与蛋白质、多肽和/或肽偶联之前,PEG聚合物 的一个或多个末端包含官能团。在某些实施方案中,PEG是在一个末端具 有官能团的线性聚合物;其中在其它实施方案中,PEG是在每一个末端具 有官能团的线性聚合物,从而形成双官能PEG聚合物。在某些实施方案中, PEG是在一个末端具有官能团的叉状聚合物;其中在其它实施方案中, PEG是在两个或多个末端具有官能团的叉状聚合物。在其它实施方案中, PEG是在每一个末端具有官能团的叉状聚合物,从而形成多官能PEG聚 合物。在某些实施方案中,PEG是在一个末端具有官能团的支链聚合物; 其中在其它实施方案中,PEG是在两个或多个末端具有官能团的支链聚合 物。在其它实施方案中,PEG是在每一个末端具有官能团的支链聚合物, 从而形成多官能PEG聚合物。在前述PEG聚合物的某些实施方案中,官 能团是相同的,而在所述官能团的其它实施方案中,至少一个官能团是不 同的。在前述PEG聚合物的其它实施方案中,官能团是不同的。然而, PEG聚合物的至少一个末端可与至少一个掺入蛋白质、多肽和/或肽的吡咯 赖氨酸或PCL残基反应。

末端官能团的非限制性实例包括但不限于N-琥珀酰亚氨基碳酸酯、 胺、酰肼、琥珀酰亚氨基丙酸酯、琥珀酰亚氨基丁酸酯、琥珀酰亚氨基琥 珀酸酯、琥珀酰亚氨基酯、苯并三唑碳酸酯、缩水甘油醚、氧羰基咪唑、 对硝基苯基碳酸酯、醛、马来酰亚胺、邻吡啶基二硫化物、丙烯醇和乙烯 基砜、活化碳酸酯(包括但不限于对硝基苯基酯)、活化酯(包括但不限于, N-羟基琥珀酰亚氨基、对硝基苯基酯)、肟、羰基、二羰基、羟胺类、羟基、 甲氧基、苯甲醛类、苯乙酮类、2-氨基-苯甲醛类、2-氨基-苯乙酮类以及2- 氨基-5-硝基-二苯甲酮类。

图31描述了通过至少一个掺入所述蛋白质中的PCL残基与蛋白质偶 联的功能化PEG聚合物即2-氨基-苯乙酮-PEG8(2-AAP-PEG8; TU3205-044)的一个实施方案。如所示的那样,2-AAP-PEG8的2-氨基-苯 乙酮部分形成了喹唑啉型部分,其作为PEG8和蛋白质之间的间隔子。这 一喹唑啉型部分可进一步反应以形成稠合环结构。在偶联2-AAP-PEG8的 情况下,此衍生化给蛋白质增加了556Da的质量。在本文提供的方法中使 用的其它功能化PEG包括但不限于实施例20中给出的那些。

图32是在pH 7.5(图32A)和pH 5.0(图32B)用2-AAP-PEG8衍生化 之前和之后在122位掺入了PCL的hRBP4(hRBP4Phe122PCL)的质谱。 这些偶联反应在pH 7.5和pH 5之下进行,其中发生了89-100%的转化, 导致相对于未反应的蛋白的556Da的预期质量增加(图32C)。野生型 hRBP4不与450或2300倍过量的2-AAP-PEG8反应(图32D-F)。这进一 步说明了PCL和2AAP-PEG8之间的偶联反应的特异性,因为当不存在 PCL时没有观察到偶联。

为进一步说明这一标记方法的实用性,用2-AAP-PEG8衍生化在大肠 杆菌中产生的具有在2454位掺入PCL的人脂肪酸合成酶硫酯酶结构域 (FAS-TE)(FAS-TE Tyr2454PCL)(图33,参见实施例14)。图33A显示了 未反应的蛋白质的质谱(质量33202Da),而图33B显示了与2-AAP-PEG8 (TU3205-044)反应至完成的FAS-TE Tyr2454PCL的质谱,给出了33756 Da的预期质量。进一步的说明在图33C和33D中提供,其显示了在室温 下(图33C)和在4℃(图33D)用2.4kDa 2-AAP-PEG(TU3205-048)衍生化在 大肠杆菌中产生的具有在2454位掺入PCL的FAS-TE(FAS-TE Tyr2454PCL)的质谱。在所使用的条件下,仅发生了约25%的转化,获得 具有35585Da预期质量的蛋白质。

此外,图34还显示了用2.4kDa 2-AAP-PEG和23kDa 2-AAP-PEG 以所示摩尔比对FAS-TE Tyr2454PCL的聚乙二醇化。应用SDS-PAGE不 能析分0.5kDa 2-AAP-PEG(2-AAP-PEG8)聚乙二醇化的产物,然而其得 到了质谱的证实。

本发明提供的方法已被用于将PCL掺入到成纤维细胞生长因子 21(FGF-21)的20个位置中,并且随后用于聚乙二醇化相应的PCL残基(参 见,实施例15)。图35显示了用2-AAP-PEG8衍生化FGF21Lys84PCL 之前和之后获得的质谱。图35A是未反应的FGF21Lys84PCL(21235.6Da) 的质谱,而图35B是与2-AAP-PEG8反应的FGF21Lys84PCL的质谱。 聚乙二醇化进行完全,并且产生21792.4Da的蛋白质。556.8Da的增加与 衍生化预期的556Da增加相符。图36显示了用23kDa 2-AAP-PEG衍生 化7个FGF21PCL突变体之后获得的SDS-PAGE结果。图36A是与23kDa 2-AAP-PEG反应的FGF21PCL突变体(0.1至0.4mM)的反应混合物(pH 7.4,4℃,60小时)的SDS凝胶,并且显示了PEG-FGF21、全长(FL) FGF21-PCL和截短的(TR)FGF21-PCL。图36B显示了部分纯化 PEG-FGF21、全长(FL)和截短的(TR)FGF21之后,8个FGF21PCL突变 体的SDS-PAGE结果。

已应用本发明提供的方法将PCL掺入到小鼠促红细胞生成素(EPO)的 11个位置当中,并且随后用于聚乙二醇化三个EPO PCL突变体的相应的 PCL残基(参见,实施例6)。图37是聚乙二醇化小鼠EPO PCL突变体之 后获得的SDS凝胶。使在HEK293F细胞中在三个不同位置掺入PCL的 小鼠EPO与2-AAP-mPEG23k(TU3205-052)反应。用箭头指示了聚乙二醇 化的EPO和未聚乙二醇化的EPO。

在某些实施方案中,应用在未反应末端上的剩余官能团进一步衍生化 或取代通过PCL残基与蛋白质、多肽和/或肽连接的双官能或多官能PEG 聚合物。在某些实施方案中,应用在未反应末端上的剩余官能团进一步衍 生化或取代通过苯甲醛、二苯甲酮或苯乙酮部分与PCL残基反应从而与蛋 白质、多肽和/或肽连接的双官能或多官能PEG聚合物。

本文描述的方法和组合物提供了用PEG衍生物选择性修饰蛋白质、多 肽和肽的高效方法,其包括对选择密码子作出反应使氨基酸PCL或吡咯赖 氨酸选择性地掺入蛋白质中,以及随后用合适的功能化的PEG衍生物修饰 相应的氨基酸残基。因此,本文提供了具有掺入其中的PCL或吡咯赖氨酸 残基的蛋白质、多肽和/或肽,以及本文还提供了通过所述PCL或吡咯赖 氨酸残基与水溶性聚合物(诸如聚乙二醇(PEG))连接的所述蛋白质、多肽和 /或肽。

对本文描述的蛋白质、多肽和/或肽的聚乙二醇化程度(即,与蛋白质、 多肽和/或肽连接的PEG聚合物的数量)是可调节的,以提供可变的药理学、 药代动力学或药效学特性。在某些实施方案中,所述改变升高所述特性, 而在其它实施方案中,所述改变降低所述特性。在某些实施方案中,所述 特性是体内半衰期。在一些实施方案中,应用本文提供的方法和组合物聚 乙二醇化的蛋白质、多肽和/或肽的半衰期比未修饰的蛋白质、多肽和/或肽 增加至少约10%、20%、30%、40%、50%、60%、70%、80%、90%、 2倍、5倍、10倍、50倍、100倍或至少约200倍。

在某些实施方案中,应用以下的方法纯化应用本文提供的方法和组合 物聚乙二醇化的蛋白质、多肽和/或肽,所述方法包括但不限于:疏水色谱、 亲和色谱、阴离子交换色谱、阳离子交换色谱、Q季铵树脂、DEAE SEPHAROSE、硅胶色谱、反相HPLC、凝胶过滤(包括但不限于使用 SEPHADEX G-75,Sephacryl S-100,SUPERDEX 75、100和200)、疏水 相互作用色谱、尺寸排阻色谱、金属螯合色谱;超滤/渗滤、乙醇沉淀、色 谱聚焦、置换色谱、电泳方法(包括但不限于制备型等电聚焦)、差示溶解 性(包括但不限于硫酸铵沉淀)以及萃取。

在其它方面,在本文提供的方法中使用的PEG聚合物在骨架中具有弱 的或可降解的键。仅作为实例,所述PEG聚合物在聚合物骨架中具有易于 水解的酯键,并且所述水解导致所述键断裂,从而释放PEG连接的蛋白质、 多肽或肽。

在其它方面,本文描述的方法和组合物用于制备基本上均质的聚合物- 蛋白质缀合物制品。本文中所使用的“基本上均质的”意指观察到聚合物: 蛋白质缀合物分子超过总蛋白质的一半。聚合物:蛋白质缀合物具有生物活 性且本文中提供的本发明的“基本上均质的”聚乙二醇化多肽制品为足够 均质从而显示均质制品的优点(例如,仅用于举例,就批次之间药代动力学 的预测而言易于临床应用)的那些制品。

在其它方面,本文描述的方法和组合物用于制备基本上均质的聚合物- 蛋白质缀合物制品。本文中所使用的“基本上均质的”意指观察到聚合物: 蛋白质缀合物分子超过总蛋白质的一半。聚合物:蛋白质缀合物具有生物活 性且本文中提供的本发明的“基本上均质的”聚乙二醇化多肽制品为足够 均质从而显示均质制品的优点(例如,仅用于举例,就批次之间药代动力学 的预测而言易于临床应用)的那些制品。

在另一方面,本文描述的方法和组合物用于制备聚合物-蛋白质缀合物 分子的混合物,且本文提供的优点在于可选择包含在混合物中的单聚合物: 蛋白质缀合物的比例。因此,在某些实施方案中,制备了具有各种数目所 连接的聚合物部分(即,二、三、四等)的各种蛋白质的混合物,且将这些 缀合物任选与使用本文中描述的方法制备的单聚合物-蛋白质缀合物组合, 从而得到具有预定比例的单聚合物:蛋白质缀合物的混合物。

聚乙二醇分子与蛋白质分子的比例会随着其在反应混合物中的浓度而 改变。在某些实施方案中,最佳比率(就反应效率来说在于存在最小过量的 未反应的蛋白质或聚合物)可由所选聚乙二醇的分子量以及可用反应性基 团的数目来确定。聚合物的分子量越高,连接到蛋白质上的聚合物分子的 数目越少。类似地,在其它实施方案中,当优化这些参数时,应考虑到聚 合物的分枝。在这种情况下,分子量越高(或分枝越多),聚合物:蛋白质比 率越高。

氨基糖与掺入蛋白质、多肽和/或肽中的吡咯赖氨酸和/或PCL的直接偶联

在本文提供的另一方面,应用氨基糖衍生化具有一个或多个掺入其中 的吡咯赖氨酸和/或PCL残基的蛋白质、多肽和/或肽。图38显示了一般反 应流程,其中D-甘露糖胺与具有掺入其中的PCL的蛋白质(标记为R1)偶 联。在所述实施方案中,D-甘露糖胺的氨基醛部分与PCL残基反应,从而 使蛋白质的质量增加161Da。在所述实施方案中使用的其它氨基糖包括但 不限于甘露糖胺、半乳糖胺以及葡糖胺。图39显示了具有在122位掺入的 PCL的hRBP4(hRBP4Phe122PCL)在与甘露糖胺反应后的质谱,而图40 显示了具有在2222位掺入的PCL的人脂肪酸合成酶(FAS-TE)(FAS-TE Leu2222PCL/Leu2223Ile)在与甘露糖胺反应之前(图40A)和之后(图40B) 的质谱。

通过与掺入所述蛋白质、多肽和/或肽中的吡咯赖氨酸和PCL偶联对蛋白质、多肽和/或肽糖基化

本文描述的方法和组合物用于获得具有一个或多个带有糖残基的吡咯 赖氨酸和/或PCL残基的蛋白质、多肽和肽。糖残基可为天然(包括但不限 于N-乙酰基葡糖胺和D-甘露糖胺)或非天然的(包括但不限于3-氟半乳糖)。 在某些实施方案中,糖通过非天然连接(linkage)(包括但不限于通过形成喹 唑啉型部分)与吡咯赖氨酸和/或PCL残基相连。在某些实施方案中,糖通 过非天然连接(包括但不限于通过形成喹唑啉型部分,其已经被还原剂进一 步还原)与吡咯赖氨酸和/或PCL残基相连。在某些实施方案中,糖通过非 天然连接与吡咯赖氨酸和/或PCL残基相连,包括但不限于通过形成喹唑 啉型部分,其已经进一步反应从而形成如本文所提供的稠合环系统(参见图 22、23和30)。在某些实施方案中,添加至具有一个或多个掺入其中的吡 咯赖氨酸和/或PCL的蛋白质、多肽和肽的糖类(包括但不限于糖基部分) 的添加发生在体内。在其它实施方案中,添加至具有一个或多个掺入其中 的吡咯赖氨酸和/或PCL的蛋白质、多肽和肽的糖类(包括但不限于糖基部 分)的添加发生在体外。在其它实施方案中,一旦连接到吡咯赖氨酸和/或 PCL残基上,所述糖类可通过糖基转移酶和/或其它酶处理来进一步修饰, 从而产生与具有一个或多个掺入其中的吡咯赖氨酸吡咯赖氨酸和/或PCL 的蛋白质、多肽或肽结合的寡糖。

图41说明了这样的实施方案,其中共翻译或翻译后修饰包括通过形成 喹唑啉型部分而使寡糖与蛋白质、多肽或肽连接。在某些实施方案中,糖 通过非天然连接与吡咯赖氨酸和/或PCL残基相连,包括但不限于通过形 成喹唑啉型部分(其已经被还原剂进一步还原)来相连。在某些实施方案中, 糖通过非天然连接与吡咯赖氨酸和/或PCL残基相连,包括但不限于通过 形成喹唑啉型部分(其进一步反应从而形成如本文所提供的稠合环系统)来 相连(参见图22、23和30)。在此类实施方案中,仅作为实例,将包含与 2-氨基-苯乙酮(2-AAP)连接的(GlcNAc-Man)2-Man-GlcNAc-GlcNAc核的 寡糖与掺入蛋白质、多肽或肽的吡咯赖氨酸和/或PCL残基缀合。在其它 实施方案中,寡糖包含与2-氨基-苯甲醛(2-ABA)连接的 (GlcNAc-Man)2-Man-GlcNAc-GlcNAc核,并且通过2-ABA与掺入蛋白质、 多肽或肽的吡咯赖氨酸和/或PCL残基的反应形成蛋白质缀合物。在其它 实施方案中,寡糖包含与2-氨基-二苯甲酮(2-ABP)连接的 (GlcNAc-Man)2-Man-GlcNAc-GlcNAc核,并且通过2-ABP与掺入蛋白质、 多肽或肽的吡咯赖氨酸和/或PCL残基的反应形成蛋白质缀合物。其它用 于此类实施方案中的寡糖具有2-ABA、2-AAP或2-ANBP部分。

异源二聚体、异源三聚体、异源多聚体、同源二聚体、同源三聚体、同源多聚体、不对称同源二聚体、不对称同源三聚体和不对称同源多聚体中蛋白质的定向共价连接

在应用本文提供的方法的另一方面,一个或多个吡咯赖氨酸和/或PCL 在蛋白质、多肽和/或肽中的位点特异性掺入用于形成蛋白质-蛋白质缀合 物,包括但不限于异源二聚体、异源三聚体、异源多聚体、同源二聚体、 同源三聚体、同源多聚体、不对称同源二聚体、不对称同源三聚体和不对 称同源多聚体。所述蛋白质-蛋白质缀合物的形成通过应用具有掺入其中的 吡咯赖氨酸和PCL残基的蛋白质之间的位点特异性交联而完成。图42描 述了此类蛋白质-蛋白质缀合物形成的某些实施方案(异源二聚体、异源三 聚体、同源三聚体),其中具有掺入其中的PCL残基的蛋白质被交联。在 图42中,通过此类交联形成的蛋白质缀合物连接是将蛋白质连接在一起的 喹唑啉型部分,然而在其它实施方案中,所述连接是喹唑啉型部分的还原 形式(图22、23和30)。在其它实施方案中,所述连接是稠合环部分(图22、 23和30)。

所述蛋白质-蛋白质缀合物的非限制性实例包括但不限于下列的蛋白 质-蛋白质缀合物细胞因子、生长因子、生长因子受体、干扰素、白介素、 炎性分子、原癌基因产物、肽激素、信号转导分子、类固醇激素受体、转 录活化剂、转录抑制剂、促红细胞生成素(EPO)、成纤维细胞生长因子、 成纤维细胞生长因子21(FGF211)、瘦素、胰岛素、人生长激素、上皮嗜中 性粒细胞活化肽-78、GROα/MGSA、GROβ、GROγ、MIP-1α、MIP-16、 MCP-1、肝细胞生长因子、胰岛素样生长因子、白血病抑制因子、制瘤素 M、PD-ECSF、PDGF、多效营养因子(pleiotropin)、SCF、c-kit配体、VEGF、 G-CSF、IL-1、IL-2、IL-8、IGF-I、IGF-II、FGF(成纤维细胞生长因子)、 PDGF、TNF、TGF-α、TGF-β、EGF(上皮生长因子)、KGF(角质化细胞 生长因子)、CD40L/CD40、VLA-4/VCAM-1、ICAM-1/LFA-1、 hyalurin/CD44、Mos、Ras、Raf、Met;p53、Tat、Fos、Myc、Jun、Myb、 Rel、雌激素受体、孕酮受体、睾酮受体、醛固酮受体、LDL受体和/或皮 质酮。在另一组实施方案中,蛋白质与治疗或其它蛋白质同源,诸如:α-1 抗胰蛋白酶、制管张素、抗溶血因子、抗体、载脂蛋白、脱辅基蛋白、心 房利钠因子、心房利钠多肽、心房肽、C-X-C趋化因子、T39765、NAP-2、 ENA-78、Gro-a、Gro-b、Gro-c、IP-10、GCP-2、NAP-4、SDF-1、PF4、 MIG、降钙素、c-kit配体、细胞因子、CC趋化因子、单核细胞趋化蛋白 -1、单核细胞趋化蛋白-2、单核细胞趋化蛋白-3、单核细胞炎性蛋白-1α、 单核细胞炎性蛋白-1β、RANTES、1309、R83915、R91733、HCC1、T58847、 D31065、T64262、CD40、CD40配体、C-kit配体、胶原、集落刺激因子 (CSF)、补体因子5a、补体抑制剂、补体受体1、细胞因子、上皮嗜中性粒 细胞活化肽-78、GROα/MGSA、GROβ、GROγ、MIP-1α、MIP-16、MCP-1、 表皮生长因子(EGF)、上皮嗜中性粒细胞活化肽、表皮剥脱毒素、因子IX、 因子VII、因子VIII、因子X、成纤维细胞生长因子(FGF)、纤维蛋白原、 纤维连接蛋白、G-CSF、GM-CSF、葡糖脑苷脂酶、促性腺激素、生长因 子、生长因子受体、Hedgehog蛋白、血红蛋白、肝细胞生长因子(HGF)、 水蛭素、人血清白蛋白、ICAM-1、ICAM-1受体、LFA-1、LFA-1受体、 胰岛素、胰岛素样生长因子(IGF)、IGF-I、IGF-II、干扰素、IFN-α、IFN-β、 IFN-γ、白介素、IL-1、IL-2、IL-3、IL-4、IL-5、IL-6、IL-7、IL-8、IL-9、 IL-10、IL-11、IL-12、角质细胞生长因子(KGF)、乳铁传递蛋白、白血病 抑制因子、荧光素酶、神经素(Neurturin)、嗜中性粒细胞抑制因子(NIF)、 制瘤素M、成骨蛋白、原癌基因产物、甲状旁腺激素、PD-ECSF、PDGF、 肽激素、人生长激素、多效营养因子、蛋白A、蛋白G、致热外毒素A、 致热外毒素B、致热外毒素C、松弛素、肾素、SCF、可溶性补体受体I、 可溶性I-CAM 1、可溶性白介素受体、可溶性TNF受体、生长调节素、 生长激素抑制素、促生长素、链激酶、超抗原、葡萄球菌肠毒素、SEA、 SEB、SEC1、SEC2、SEC3、SED、SEE、类固醇激素受体、超氧化物歧 化酶、中毒性休克综合症毒素、胸腺素α1、组织型纤溶酶原活化因子、肿 瘤生长因子(TGF)、TGF-α、TGF-β、肿瘤坏死因子、肿瘤坏死因子α、肿 瘤坏死因子β、肿瘤坏死因子受体(TNFR)、VLA-4蛋白、VCAM-1蛋白、 血管内皮生长因子(VEGF)、尿激酶、Mos、Ras、Raf、Met、p53、Tat、 Fos、Myc、Jun、Myb、Rel、雌激素受体、孕酮受体、睾酮受体、醛固酮 受体、LDL受体和/或皮质酮。

用于形成蛋白质-蛋白质缀合物(包括但不限于异源二聚体、异源三聚 体、异源多聚体、同源二聚体、同源三聚体、同源多聚体、不对称同源二 聚体、不对称同源三聚体和不对称同源多聚体)的交联剂在它们各自末端具 有苯甲醛、苯乙酮和/或二苯甲酮部分。所述部分与应用本文提供的方法掺 入蛋白质中的吡咯赖氨酸和/或PCL残基反应,并且所述蛋白质包括本文 提供的那些。用于形成同源二聚体的双官能交联剂的非限制性实例如图43 所示。这一双官能连接体用于交联具有在84位掺入的PCL残基的成纤维 细胞生长因子21(FGF-21)(FGF21Lys84PCL)。图43B是反应混合物的质 谱,其中在43037.2Da预期质量处的共价FGF21Lys48PCL二聚体的峰是 主要的物质种类。未反应的FGF21Lys84PCL在21235.2Da处检测得到, 而一些被所连接的交联剂的一个末端修饰的单体FGF21在21820.0Da处 检测得到。反应条件的改变使得FGF21Lys84PCL反应完全。在图43中, 由此类交联形成的蛋白质缀合物连接是喹唑啉型部分,而在其它实施方案 中,该连接是喹唑啉型部分的还原形式(图22、23和30)。在其它实施方案 中,该连接是稠合环部分(图22、23和30)。

图44A显示反应混合物的质谱,其中在43034Da预期质量处的共价 FGF21二聚体的峰是主要的种类。未反应的FGF21Lys84PCL未在21234 Da处检测到,而被所连接的交联剂的一个末端修饰的一些单体FGF21在 21818Da处检测到。图43B是pH 5.0和pH 7.5的反应物的SDS-PAGE, 表明在pH 5.0更好地转化。已应用PCL特异性交联制备FGF21二聚体。 然而,所述方法可用于上面列出的任何蛋白质,并且可用于形成二聚体、 三聚体和多聚体。所述交联用于增强生物活性蛋白的活性。此外,这一方 法用于稳定复合物用于结构研究,和/或稳定受体诱饵。图45显示了用于 形成三聚体的交联剂的实施方案。

位点特异性标记

在应用本文提供的方法的另一方面,一个或多个吡咯赖氨酸和/或PCL 在蛋白质、多肽和/或肽中的位点特异性掺入用于位点特异性标记所述蛋白 质、多肽和/或肽。所述标记由吡咯赖氨酸和/或PCL残基与标记物反应进 行,其中所述标记物已用选择性地与吡咯赖氨酸和/或PCL残基反应的官 能团衍生化。所使用的标记物包括但不限于染料、抗体或抗体片段、金属 螯合剂、自旋标记物、荧光团、含金属的部分、放射性部分、可光化辐射 激发的部分、配体、生物素、生物素类似物、氧化还原活性剂、同位素标 记的部分、生物物理探针、磷光基团、化学发光基团、电子致密基团、磁 性基团、嵌入基团、发色团;能量转移剂、量子点、荧光染料、FRET试 剂及其任意组合。标记物还可以是本文定义的任何X1

在所述位点特异性标记所述含有一个或多个吡咯赖氨酸和/或PCL残 基的蛋白质、多肽和/或肽的实施方案中,吡咯赖氨酸和/或PCL残基与用 苯甲醛、苯乙酮或二苯甲酮部分衍生化的标记物反应。所使用的标记物包 括但不限于染料、抗体或抗体片段、金属螯合剂、自旋标记物、荧光团、 含金属的部分、放射性部分、可光化辐射激发的部分、配体、生物素、生 物素类似物、氧化还原活性剂、同位素标记的部分、生物物理探针、磷光 基团、化学发光基团、电子致密基团、磁性基团、嵌入基团、发色团;能 量转移剂、量子点、荧光染料、FRET试剂及其任意组合。标记物还是本 文定义的任何X1

在本文提供的所述位点特异性标记的其它方面,吡咯赖氨酸和/或PCL 残基与用选择性地与吡咯赖氨酸和/或PCL残基反应的部分衍生化的标记 物的反应使得能够增加检测灵敏性。具体地,所述反应形成可检测的部分, 其具有与反应之前存在的反应物不同的光谱特性,从而通过最小化与可检 测部分信号相关的背景信号来增强信噪比。在本文提供的所述位点特异性 标记的某些实施方案中,吡咯赖氨酸或PCL残基与用苯甲醛、苯乙酮或二 苯甲酮部分衍生化的标记物的反应形成喹唑啉型部分(图22、23和30),其 具有与苯甲醛、苯乙酮或二苯甲酮部分不同的光谱特征。在本文提供的所 述位点特异性标记的某些实施方案中,吡咯赖氨酸或PCL残基与用苯甲 醛、苯乙酮或二苯甲酮部分衍生化的标记物的反应形成还原的喹唑啉型部 分(图22、23和30),其具有与苯甲醛、苯乙酮或二苯甲酮部分不同的光谱 特征。在本文提供的所述位点特异性标记的某些实施方案中,吡咯赖氨酸 或PCL残基与用苯甲醛、苯乙酮或二苯甲酮部分衍生化的标记物的反应形 成稠合环部分(图22、23和30),其具有与苯甲醛、苯乙酮或二苯甲酮部分 不同的光谱特征。

在某些实施方案中,所述标记的蛋白质、多肽和/或肽用于诊断和成像, 而在其它实施方案中,所述标记的蛋白质、多肽和/或肽用于高通量筛选。 在其它实施方案中,所述标记的蛋白质、多肽和/或肽用于评估转运特性, 而在其它实施方案中,所述标记的蛋白质、多肽和/或肽用于定位研究。

图46描述了所述位点特异性标记的某些实施方案。图46A说明了用 荧光部分标记。图46B描述了PCL残基与非荧光部分的反应,所述非荧 光部分反应后变得发荧光。图46C描述了蛋白质的生物素化。图46D描述 了用放射性部分标记。图46E描述了用1-(2-氨基-5-碘代苯基)乙酮的标记, 以及图46F描述了用1-(2-氨基-5-溴苯基)乙酮标记,这两者均可用于获得 用于确定蛋白质X射线晶体结构方法中的定相信息。1-(2-氨基-5-碘代苯基) 乙酮还可用于用放射性部分标记蛋白质。在图46中,由此类标记形成的蛋 白质缀合物连接是喹唑啉型部分,而在其它实施方案中,所述连接是喹唑 啉型部分的还原形式(图22、23和30)。在其它实施方案中,所述连接是稠 合环部分(图22、23和30)。

在所述含有一个或多个吡咯赖氨酸和/或PCL残基的蛋白质、多肽和/ 或肽的位点特异性标记的某些实施方案中,吡咯赖氨酸或PCL残基本身可 通过应用经标记的前体而被标记。图46G和图46H仅作为实例说明了从不 同标记的前体用放射性或稳定的同位素的标记。

本发明的另一方面提供了与任何可获得的蛋白质同源、但包含一个或 多个吡咯赖氨酸和/或PCL残基的蛋白质的生产。例如,在某些实施方案 中,制备包含一个或多个吡咯赖氨酸或PCL且与一个或多个治疗蛋白质同 源的治疗蛋白质。例如,在一个方面,所述蛋白质与诸如以下的治疗或其 它蛋白质同源:细胞因子、生长因子、生长因子受体、干扰素、白介素、 炎性分子、原癌基因产物、肽激素、信号转导分子、类固醇激素受体、转 录活化剂、转录抑制剂、促红细胞生成素(EPO)、成纤维细胞生长因子、 成纤维细胞生长因子21(FGF211)、瘦素、胰岛素、人生长激素、上皮嗜中 性粒细胞活化肽-78、GROα/MGSA、GROβ、GROγ、MIP-1α、MIP-16、 MCP-1、肝细胞生长因子、胰岛素样生长因子、白血病抑制因子、制瘤素 M、PD-ECSF、PDGF、多效营养因子、SCF、c-kit配体、VEGF、G-CSF、 IL-1、IL-2、IL-8、IGF-I、IGF-II、FGF(成纤维细胞生长因子)、PDGF、 TNF、TGF-α、TGF-β、EGF(上皮生长因子)、KGF(角质化细胞生长因子)、 CD40L/CD40、VLA-4/VCAM-1、ICAM-1/LFA-1、hyalurin/CD44、Mos、 Ras、Raf、Met;p53、Tat、Fos、Myc、Jun、Myb、Rel、雌激素受体、 孕酮受体、睾酮受体、醛固酮受体、LDL受体和/或皮质酮。在另一组实施 方案中,所述蛋白质与诸如以下的治疗或其它蛋白质同源:α-1抗胰蛋白 酶、制管张素、抗溶血因子、抗体、载脂蛋白、脱辅基蛋白、心房利钠因 子、心房利钠多肽、心房肽、C-X-C趋化因子、T39765、NAP-2、ENA-78、 Gro-α、Gro-β、Gro-γ、IP-10、GCP-2、NAP-4、SDF-1、PF4、MIG、降 钙素、c-kit配体、细胞因子、CC趋化因子、单核细胞趋化蛋白-1、单核 细胞趋化蛋白-2、单核细胞趋化蛋白-3、单核细胞炎性蛋白-1α、单核细胞 炎性蛋白-1β、RANTES、1309、R83915、R91733、HCC1、T58847、D31065、 T64262、CD40、CD40配体、c-kit配体、胶原、集落刺激因子(CSF)、补 体因子5a、补体抑制剂、补体受体1、细胞因子、上皮嗜中性粒细胞活化 肽-78、GROα/MGSA、GROβ、GROγ、MIP-1α、MIP-16、MCP-1、表 皮生长因子(EGF)、上皮嗜中性粒细胞活化肽、干扰素α(INF-α)或干扰素 β(INF-β)、表皮剥脱毒素、因子IX、因子VII、因子VIII、因子X、成纤 维细胞生长因子(FGF)、纤维蛋白原、纤维连接蛋白、G-CSF、GM-CSF、 葡糖脑苷脂酶、促性腺激素、生长因子、生长因子受体、Hedgehog蛋白、 血红蛋白、肝细胞生长因子(hGF)、水蛭素、人血清白蛋白、ICAM-1、 ICAM-1受体、LFA-1、LFA-1受体、胰岛素、胰岛素样生长因子(IGF)、 IGF-I、IGF-II、干扰素、IFN-α、IFN-β、IFN-γ、白介素、IL-1、IL-2、 IL-3、IL-4、IL-5、IL-6、IL-7、IL-8、IL-9、IL-10、IL-11、IL-12、角质 细胞生长因子(KGF)、乳铁传递蛋白、白血病抑制因子、荧光素酶、神经 素、嗜中性粒细胞抑制因子(NIF)、制瘤素M、成骨蛋白质、原癌基因产物、 甲状旁腺激素、PD-ECSF、PDGF、肽激素、人生长激素、多效营养因子、 蛋白A、蛋白G、致热外毒素A、致热外毒素B、致热外毒素C、松弛素、 肾素、SCF、可溶性补体受体I、可溶性I-CAM 1、可溶性白介素受体、 可溶性TNF受体、生长调节素、生长激素抑制素、促生长素、链激酶、超 抗原、葡萄球菌肠毒素、SEA、SEB、SEC1、SEC2、SEC3、SED、SEE、 类固醇激素受体、超氧化物歧化酶、中毒性休克综合症毒素、胸腺素α1、 组织型纤溶酶原活化因子、肿瘤生长因子(TGF)、TGF-α、TGF-β、肿瘤坏 死因子、肿瘤坏死因子α、肿瘤坏死因子β、肿瘤坏死因子受体(TNFR)、 VLA-4蛋白、VCAM-1蛋白、血管内皮生长因子(VEGF)、尿激酶、Mos、 Ras、Raf、Met、p53、Tat、Fos、Myc、Jun、Myb、Rel、雌激素受体、 孕酮受体、睾酮受体、醛固酮受体、LDL受体和/或皮质酮。

在一个方面,本文组合物包含含有一个或多个吡咯赖氨酸或PCL残基 的蛋白质(包括上述任意的蛋白质)和可药用赋形剂。

在某些实施方案中,蛋白质是治疗蛋白质,而在其它实施方案中,治 疗蛋白质是促红细胞生成素(EPO)、成纤维细胞生长因子21(FGF21)、干 扰素α(IFN-α)或干扰素β(IFN-β)。在某些方案中,治疗蛋白是抗体或抗体 片段,包括但不限于Fab′s。在某些实施方案中,治疗蛋白作为融合蛋白产 生,其中所述融合搭档已被修饰。在某些实施方案中,治疗蛋白与Fc结构 域融合。

可通过进行序列比对推断与蛋白质或多肽的同源性,例如应用 BLASTN或BLASTP,例如设置为缺省参数。例如,在一个实施方案中, 蛋白质与已知的治疗蛋白质(例如,存在于Genebank或其它可利用的数据 库中的蛋白质)是至少约50%、至少约75%、至少约80%、至少约90%或 至少约95%同一的。

为证实位点特异性标记,应用本文提供的方法将PCL掺入mEGF中 (参见实施例12),并通过用ABA部分官能化的聚醚将所述PCL部分与生 物素偶联(参见X3626-140,实施例40)。图47A显示了与生物素缀合的 mEGF-Tyr10PCL的ESI质谱分析(参见实施例24)。图47B显示了 mEGF-Tyr10PCL-ABA-生物素缀合物的蛋白质印迹法,其应用了辣根过 氧化物酶(HRP)缀合的山羊抗生物素抗体。未偶联的mEGF-Tyr10PCL和 荧光素缀合的mEGF-Tyr10PCL作为阴性对照。

为进一步证实位点特异性标记,应用本文提供的方法将PCL掺入 mEGF中(参见实施例12),并通过用ABA部分官能化的聚醚将所述PCL 部分与荧光素偶联(参见X3757-48,实施例41)。图47C显示了与荧光素缀 合的mEGF-Tyr10PCL的ESI质谱分析(参见实施例25)。此外,应用本文 提供的方法(参见实施例12)将PCL掺入mEGF中,并所述PCL部分与用 ABA部分官能化的二糖偶联(参见3793-050,实施例42)。图47D显示了与 二糖缀合的mEGF-Tyr10PCL的ESI质谱分析(参见实施例26)。应当理解, 用于连接二糖的偶联化学可容易地适用于偶联其它糖及复杂的寡糖和多 糖。

将免疫调节剂与掺入蛋白质、多肽和/或肽的吡咯赖氨酸和/或吡咯赖氨酸类似物偶联,并通过所述偶联增强免疫原性

在本文提供的另一方面,用一种或多种免疫调节剂衍生化具有一个或 多个掺入其中的吡咯赖氨酸和/或PCL的蛋白质、多肽和/或肽。应用本文 提供的方法,可容易地将免疫刺激部分通过吡咯赖氨酸和/或PCL残基与 蛋白质、多肽和/或肽偶联。所述免疫刺激部分包括但不限于:一个或多个 硝基、脂类、磷脂、LPS样分子、佐剂、佐剂样分子、TLR2激动剂、TLR4 激动剂、TLR7激动剂、TLR9激动剂、TLR8激动剂、T-细胞表位、钥孔 虫戚血兰素(KLH)、免疫原性半抗原、卤素、芳基、杂芳基、环烷基或杂 环烷基。在某些实施方案中,与吡咯赖氨酸和/或PCL连接的免疫调节剂 用于以类似于掺入蛋白质中的对硝基苯丙氨酸的方式刺激针对自身抗原的 免疫反应(Grünewald J,Tsao ML,Perera R,Dong L,Niessen F,Wen BG, Kubitz DM,Smider VV,Ruf W,Nasoff M,Lerner RA,Schultz PG, Immunochemical termination of self-tolerance,Proc Natl Acad Sci U S A. 2008年8月12日;105(32):11276-80)。在某些实施方案中,具有与吡咯赖 氨酸和/或PCL连接的免疫调节剂的自身抗原用作癌疫苗。在其它实施方 案中,具有与吡咯赖氨酸和/或PCL连接的免疫调节剂的抗原用作用于感 染疾病的疫苗。在其它实施方案中,具有与吡咯赖氨酸和/或PCL连接的 免疫调节剂的抗原用作用于涉及淀粉样蛋白形成的疾病的疫苗,所述疾病 包括但不限于阿尔滋海默氏病。

在一个实施方案中,通过产生2-氨基苯甲醛化合物的文库,将所述文 库与掺入目标抗原中的吡咯赖氨酸或PCL偶联,并且然后针对抗修饰和未 修饰抗原的高效价抗体的产生来筛选偶联的产物,从而产生免疫刺激部分 的文库。在所述实施方案中,2-氨基苯甲醛部分被各种取代基取代,所述 取代基包括但不限于:一个或多个硝基、脂类、磷脂、LPS样分子、佐剂、 佐剂样分子、TLR2激动剂、TLR4激动剂、TLR7激动剂、TLR9激动剂、 TLR8激动剂、T-细胞表位、钥孔虫戚血兰素(KLH)、免疫原性半抗原、 卤素、芳基、杂芳基、环烷基或杂环烷基。

在另一实施方案中,通过产生2-氨基-苯乙酮化合物的文库,将所述文 库与掺入目标抗原中的吡咯赖氨酸或PCL偶联,并且然后针对抗修饰和未 修饰抗原的高效价抗体的产生来筛选偶联的产物,从而产生免疫刺激部分 的文库。在所述实施方案中,2-氨基-苯乙酮部分被各种取代基取代,所述 取代基包括但不限于:一个或多个硝基、脂类、磷脂、LPS样分子、佐剂、 佐剂样分子、TLR2激动剂、TLR4激动剂、TLR7激动剂、TLR9激动剂、 TLR8激动剂、T-细胞表位、钥孔虫戚血兰素(KLH)、免疫原性半抗原、 卤素、芳基、杂芳基、环烷基或杂环烷基。

在另一实施方案中,通过产生2-氨基-5-硝基-二苯甲酮化合物的文库, 将所述文库与掺入目标抗原中的吡咯赖氨酸或PCL偶联,并且然后针对抗 修饰和未修饰抗原的高效价抗体的产生来筛选偶联的产物,从而产生免疫 刺激部分的文库。在所述实施方案中,2-氨基-5-硝基-二苯甲酮部分被各种 取代基取代,所述取代基包括但不限于:一个或多个硝基、脂类、磷脂、 LPS样分子、佐剂、佐剂样分子、TLR2激动剂、TLR4激动剂、TLR7 激动剂、TLR9激动剂、TLR8激动剂、T-细胞表位、钥孔虫戚血兰素(KLH)、 免疫原性半抗原、卤素、芳基、杂芳基、环烷基或杂环烷基。

为证实这一方面,应用本文提供的方法将PCL掺入mTNF-α和mEGF 中(参见实施例11和12),并使PCL部分与含有一个或多个硝基苯基的半 抗原偶联(参见实施例27和28)。图48A和图48B证实了单-硝基苯基半抗 原(参见3793-001,实施例38-8)在mTNF-Gln21PCL(图48A)和 mEGF-Tyr10PCL(图48B)的掺入PCL的位点处连接。图48C和图48D 显示了二-硝基苯基半抗原(TU3627-088,实施例38-7)在mTNF-α(图48C) 和mEGF(图48D)的掺入PCL的位点处连接。

图49A证实了TLR7激动剂(参见X3678-114;实施例38-3)在 mEGF-Tyr10PCL的掺入PCL的位点处连接(参见实施例29)。图49B证 实了磷脂(参见TU3627-092;实施例43-1)在mEGF-Tyr10PCL的掺入PCL 的位点处连接(参见实施例31)。

图50-51证实了PADRE肽:PX2-PADRE(MW=1585)(参见 3465-143;实施例38-11)和BHA-exPADRE(MW=2060)(参见3647-104; 实施例38-10)与mTNF-Gln21PCL或mEGF-Tyr10PCL的缀合。图50A 和图50B显示了在两种不同的pH值之下,mTNF-Gln21PCL与 PX2-PADRE的缀合反应的MALDI-TOF质谱分析(参见实施例30),而图 50C显示了mTNF-Gln21PCL与BHA-exPADRE的缀合反应的ESI质谱 分析(参见实施例30)。图51显示了BHA-exPADRE与mEGF-Tyr10PCL 的偶联(参见实施例30)。PADRE肽(SEQ ID NO:28)的序列是 Gly(DAla)LysXValAlaAlaTrpThrLeuLysAla(D-Ala)Gly-OH,其中X是环 己基-丙氨酸。exPADRE  肽(SEQ  ID  NO:29)的序列是 AlaGlySerArgSerGly(DAla)LysXValAlaAlaTrpThrLeuLysAla(D-Ala)Gly- OH,其中X是环己基-丙氨酸。在某些实施方案中,将已知免疫原性肽表 位与抗原偶联,从而增强所述抗原的免疫原性。在某些实施方案中,将衍 生自抗原的肽与免疫原性载体蛋白偶联。在某些实施方案中,免疫原性载 体蛋白是KLH。应当理解,用于连接PADRE肽的偶联化学可容易地适用 于将其它肽偶联至PCL和吡咯赖氨酸。

免疫-PCR:DNA和其它寡核苷酸与掺入蛋白质、多肽和/或肽中的吡咯赖氨酸和/或吡咯赖氨酸类似物的偶联

在本文提供的另一方面,应用本文提供的方法,用DNA衍生化具有 一个或多个掺入其中的吡咯赖氨酸和/或PCL的蛋白质、多肽和/或肽。所 述DNA被修饰从而具有与掺入蛋白质、多肽和/或肽中的吡咯赖氨酸和/或 PCL反应的末端2-氨基-苯甲醛、2-氨基-苯乙酮或2-氨基-5-硝基-二苯甲酮 部分,从而所述DNA通过喹唑啉型连接、还原的喹唑啉型连接或稠合环 连接(参见图22、23和30)与蛋白质、多肽和/或肽偶联。

为证实DNA与PCL连接,应用本文提供的方法将PCL掺入mTNF-α 和mEGF中(参见实施例11和12),并将所述PCL部分与同样为免疫刺激 部分的CpG寡核苷酸偶联(参见实施例32)。BHA-BG1(参见3647-057;实 施例38-12)和BHA-BG2(参见3597-167;实施例38-14)是用于将CpG在 PCL掺入位点与mTNF-Gln21PCL和mEGF-Tyr10PCL连接的CpG试剂。 通过凝胶位移测试法确认BHA-BG1(7.4kDa)及BHA-BG2(7.4kDa)与 mTNF-Gln21PCL(19.3kDa)的偶联(图52A),正如BHA-BG2(7.4kDa)与 mEGF-Tyr10PCL(7.2kDa)的偶联(图52B)。BG1(SEQ ID NO:30)的序列 是5’*T*C*C*A*T*G*A*C*G*T*T*C*C*T*G*A*C*G*T*T-3’,其中*表 示硫代磷酸酯连接。BG2(SEQ ID NO:31)的序列是 5’*T*C*G*T*C*G*T*T*T*T*C*G*G*C*G*C*G*C*G*C*C*G-3’,其中 *表示硫代磷酸酯连接。在某些实施方案中,被偶联的寡核苷酸是脱氧核糖 核酸、核糖核酸、肽核酸或其它修饰的寡核苷酸。最初作为单链寡核苷酸 与吡咯赖氨酸或PCL偶联,可通过与互补链的杂交容易地制备双链DNA、 RNA、PNA或杂合聚合物。应当理解,用于连接CpG寡核苷酸的偶联化 学可容易地适用于偶联其它寡核苷酸。

在某些实施方案中,蛋白质、多肽和/或肽是抗体,并且具有连接的 DNA的所述抗体用于进行免疫PCR分析。通过应用本文描述的方法将 DNA连接至抗体,并且然后将所述DNA连接的抗体与靶抗原结合,从而 进行免疫PCR。结合后,应用DNA扩增技术扩增DNA,并应用电泳技术、 微板方法或实时PCR分析得到的扩增产物。

位点特异性和定向连接

在本文提供的另一方面,一个或多个吡咯赖氨酸和/或PCL向蛋白质、 多肽和/或肽的位点特异性掺入用于控制所述蛋白质、多肽和/或肽连接至支 持物表面后的方向。所述连接产生自吡咯赖氨酸或PCL残基与用苯甲醛部 分、苯乙酮部分、二苯甲酮部分或其组合衍生化的表面之间的反应,从而 形成将蛋白质连接并定向至所述表面的喹唑啉部分。通过在蛋白质中的特 定位置掺入吡咯赖氨酸和/或PCL,控制了蛋白质在表面上的方向。所述蛋 白质连接的方向的控制用作蛋白质工程工具盒的组件,用于评估蛋白质性 质。图53说明了所述位点特异性定向连接的实施方案,其中用20氨基- 苯乙酮部分衍生化表面,所述氨基-苯乙酮部分与掺入蛋白质中的PCL残 基反应,从而通过喹唑啉型连接将所述蛋白质连接至所述表面。在图53 中,所形成的蛋白质缀合物连接是喹唑啉型部分,而在其它实施方案中, 所述连接是喹唑啉型部分的还原形式(参见图22、23和30)。在其它实施方 案中,所述连接是稠合环部分(参见图22、23和30)。

支持物的非限制性实例包括但不限于:固体和半固体基质,诸如气凝 胶和水凝胶、树脂、珠子、生物芯片(包括薄膜涂层芯片)、微流体芯片、 硅芯片、多孔板(也称为微孔滴定板或微量板)、膜、细胞、导电或不导电

实施例9:应用大肠杆菌细胞将生物合成产生的PCL位点特异性掺入 FKBP12中

这一实施例描述了PCL在FKBP12的TAG编码位点处的掺入,所述 FKBP12从共转化至相同大肠杆菌细胞内的第二种质粒表达得到。

从具有N端标签(MGSSHHHHHHLEVLFQGP)(SEQ ID NO:23)的 pET载体(Novagen)表达FKBP12。应用PIPE克隆(参见Klock,HE, Koesema EJ,Knuth MW,Lesley,SA,“Combining the polymerase  incomplete primer extension method for cloning and mntagenesis with  microscreening to accelerate structural genomics efforts”,Proteins.2008年 5月1日;71(2):982-94)在Ile90处引入TAG密码子。用pET-FKBP12和 pAra-pylSTBCD共转化BL21(DE3)细胞(Invitrogen),并在LB+Kan+Cm 板上选择。在补充有5mM D-鸟氨酸的TB+Kan+Cm中在37℃培养液体 培养物。OD595=0.4时,将细胞移至30℃并在30分钟后用1mM IPTG诱 导。收集细胞前,再培养20小时。如对于FAS-TE那样裂解细胞并纯化。 然后将纯化的蛋白透析至TBS中,并在4℃用HRV-3C蛋白酶(每1mg FKBP12为2U)切割48小时,以移除His标签。使经切割的材料流过Ni-NTA 柱,收集、浓缩,并在S75尺寸排阻柱(GE Healthcare)上运行,用于进一 步纯化。将最终的蛋白质进一步浓缩至15-20mg/ml,然后结晶。FKBP Ile90PCL的产量为120mg/L粗产物。结晶的FKBP Ile90PCL用于获得含 PCL蛋白质的X射线结构。图19A-C显示了生物合成掺入至FKBP12的 PCL的SDS-PAGE和质谱数据以及结晶结果。获得的质量是12085.6Da, 其与单位点掺入PCL的预期值12084Da相一致。

具有PCL掺入位点(粗体和下划线)的FKBP12(SEQ ID NO:24)的序列 在以下给出:

MGSSHHHHHHLEVLFQGPGVQVETISPGDGRTFPKRGQTCVVHYTGMLEDGKKF DSSRDRNKPFKFMLGKQEVIRGWEEGVAQMSVGQRAKLTISPDYAYGATGHPGI PPHATLVFDVELLKLE

实施例10:应用大肠杆菌细胞将生物合成产生的PCL位点特异性掺 金属、玻璃(包括显微镜载玻片)、以及磁性支持物。在本文描述的方法和 组合物中使用的固体支持物的其它非限制性包括:硅胶、高分子膜、粒子、 衍生化的塑料薄膜、衍生化的玻璃、衍生化的硅石、玻璃珠、棉花、塑料 珠、氧化铝凝胶、多糖诸如琼脂糖凝胶、聚丙烯酸酯、聚苯乙烯、聚丙烯 酰胺、多元醇、琼脂糖、琼脂、纤维素、葡聚糖、淀粉、FICOLL、肝素、 糖原、支链淀粉、甘露聚糖、菊粉、硝化纤维素、重氮基纤维素、聚氯乙 烯、聚丙烯、聚乙烯(包括聚乙二醇)、尼龙、乳胶珠、磁性珠、顺磁性珠、 超顺磁性珠、淀粉等。在某些实施方案中,在本文描述的方法和组合物中 使用的支持物是用于表面分析的支持物,诸如用于表面声波装置或应用衰 逝波分析(诸如表面等离子共振分析)的装置。

用于连接具有掺入其中的吡咯赖氨酸和/或吡咯赖氨酸类似物的蛋白 质、多肽和/或肽的固体支持物表面具有反应性官能团,包括但不限于羟基、 羧基、氨基、硫醇、醛、卤素、硝基、氰基、酰氨基、脲、碳酸酯、氨基 甲酸酯、异氰酸酯、砜、磺酸酯、磺酰胺和亚砜。所述官能团用于共价连 接与吡咯赖氨酸或吡咯赖氨酸类似物反应从而形成喹唑啉部分的2-氨基- 苯甲醛部分、2-氨基-苯乙酮部分和/或2-氨基-5-硝基-二苯甲酮部分。在某 些实施方案中,所述2-氨基-苯甲醛部分、2-氨基-苯乙酮部分和2-氨基-5- 硝基-二苯甲酮部分通过与固体支持物反应性官能团反应而成为偶联至固 体支持物的聚合连接体的一部分,所述固体支持物反应性官能团诸如但不 限于:羟基、羧基、氨基、硫醇、醛、卤素、硝基、氰基、酰氨基、脲、 碳酸酯、氨基甲酸酯、异氰酸酯、砜、磺酸酯、磺酰胺和亚砜。

在其它实施方案中,固体支持物的表面具有连接其上的抗生蛋白链菌 素或抗生物素蛋白,并用于连接具有掺入其中的吡咯赖氨酸和/或吡咯赖氨 酸类似物的蛋白质、多肽和/或肽,其中所述吡咯赖氨酸和/或吡咯赖氨酸类 似物用于将生物素位点特异性地连接至所述蛋白质、多肽和/或肽。

在本文描述的方法和组合物中使用的其它支持物包括在肽合成中使用 的树脂,诸如,仅以例举的方式,聚苯乙烯、PAM-树脂、POLYHIPETM树脂、聚酰胺树脂、用聚乙二醇接枝的聚苯乙烯树脂、聚二甲基-丙烯酰胺 树脂和PEGA珠。

在某些实施方案中,将具有掺入其中的吡咯赖氨酸和/或PCL的蛋白 质、多肽和/或肽放置于阵列形式的固体支持物上。在某些实施方案中,所 述放置通过支持物表面和递送装置(诸如针头或毛细管)之间的直接表面接 触完成,或通过利用了压电和其它推进形式从而将液体从微型喷口转移至 固相表面的喷墨式技术来完成。在接触印刷的情况下,自动控制的系统和 多倍打印头使得能够自动化的微阵列制造。对于通过压电推进技术的无接 触放置,自动系统也可应用持续或按需喷射装置而允许自动的微阵列制造。

实施例

应当理解,本文描述的实施方案和以下实施例仅用于说明的目的,并 且根据其的各种修饰和改变对于本领域技术人员是显而易见的,并且包括 在本申请的精神及范围以及所附权利要求的范围之内。本文引用的所有出 版物、专利和专利申请均以所指出的目的引入本文作为参考。

实施例1:应用哺乳动物细胞将生物合成产生的PCL位点特异性地掺 入蛋白质中

这一实施例提供给了基因构建物的描述,当转染至哺乳动物细胞时, 所述构建物能够将PCL掺入到靶蛋白中的TAG编码位点。尽管在多个位 点同时掺入是可能的,但在本文所有的实例中,仅举例说明了在每个蛋白 分子的单一位点掺入PCL。这一实施例还描述了应用哺乳动物细胞将PCL 掺入蛋白质中的一般方法。

构建物

应用基于来自马氏甲烷八叠球菌(Methanosarcina mazei)Go1 (NC_003901,见下文)的pylS、pylT、pylB、pylC和pylD的核苷酸序列设 计的引物,通过PCR从马氏甲烷八叠球菌Go1的基因组DNA扩增全长 pylT和pylS、pylT、pylB、pylC和pylD的编码区。将所述基因的起始密码 子变为ATG。将pylT克隆至pCMV载体的CMV启动子上游。在U6启 动子控制之下转录,从而形成载体pCMVU6。同样地将pylS、pylB、pylC 和pylD克隆至pCMVU6。pylS、pylB、pylC和pylD的转录在CMV启动 子的控制之下(图4A)。

将靶基因人视黄醇结合蛋白(hRBP4)、人和小鼠促红细胞生成素 (EPO)、以及mIgG1Fc(mFc)的编码区克隆至pRS载体,在CMV启动子 的控制之下,并在C端具有His标签(图4B)。基于在已有结构模型中它们 的溶剂暴露,选择突变为TAG密码子的残基,如表2所示。通过PCR方 法将TAG密码子引入靶基因。

表2

在HEK293F中表达的蛋白质中引入的单位点TAG突变

图4B显示了hRBP4、mEPO、hEPO和mIgG1的TAG突变体构建 物。突变位点在表2中列出,并在图4B中通过箭头指出。对于每一构建 物,将His标签连接至C-端,作为纯化和检测工具。仅有全长蛋白质可具 有His标签。在CMV的控制之下将pylT、pylS、pylB、pylC和pylD克隆 至pCMVU6(图4A)。它们用于共转染研究。

细胞培养和转染

在37℃、5%CO2中在293Freestyle表达培养基中悬浮培养HEK293F 细胞。转染前一天,将细胞分为0.7x106细胞/ml。应用Qiagen Maxi质粒 制备试剂盒制备质粒DNA。通过PEI方法进行转染。在Opti-MEM以2 比1的比例混合PEI和质粒DNA,并以1μg质粒DNA/ml细胞培养物的 量将DNA复合物添加至HEK293F细胞,并在5mM Cyc或D-鸟氨酸的 存在下培养细胞4天。当用多个质粒共转染细胞时,PEI与质粒DNA总量 的比值总是2比1。

细胞纯化和分析

转染4天后,以2000g离心细胞培养物20分钟,并收集培养基用于纯 化His标记的蛋白质。将培养基上样至之前用20mM TrisHCl(7.5)、含有 10mM咪唑的150mM NaCl平衡过的Ni-NTA柱。用相同的缓冲液洗涤 柱子,并用洗脱缓冲液(20mM TrisHCl 7.5、150mM NaCl、300mM咪唑) 洗脱。通过Bradford方法和SDS-PAGE分析洗脱的蛋白质。在一些情况 下,应用抗His标签或抗蛋白质的抗体,通过蛋白质印迹法分析培养基和 纯化的蛋白质。

以下给出了从来自马氏甲烷八叠球菌的基因组DNA克隆得到的pyl 基因的序列:

pylS的序列:(SEQ ID NO:1)

atggataaaaaaccactaaacactctgatatctgcaaccgggctctggatgtccaggaccggaacaattcataaaataaaacaccac gaagtctctcgaagcaaaatctatattgaaatggcatgcggagaccaccttgttgtaaacaactccaggagcagcaggactgcaag agcgctcaggcaccacaaatacaggaagacctgcaaacgctgcagggtttcggatgaggatctcaataagttcctcacaaaggca aacgaagaccagacaagcgtaaaagtcaaggtcgtttctgcccctaccagaacgaaaaaggcaatgccaaaatccgttgcgaga gccccgaaacctcttgagaatacagaagcggcacaggctcaaccttctggatctaaattttcacctgcgataccggtttccacccaa gagtcagtttctgtcccggcatctgtttcaacatcaatatcaagcatttctacaggagcaactgcatccgcactggtaaaagggaatac gaaccccattacatccatgtctgcccctgttcaggcaagtgcccccgcacttacgaagagccagactgacaggcttgaagtcctgtt aaacccaaaagatgagatttccctgaattccggcaagcctttcagggagcttgagtccgaattgctctctcgcagaaaaaaagacct gcagcagatctacgcggaagaaagggagaattatctggggaaactcgagcgtgaaattaccaggttctttgtggacaggggttttct ggaaataaaatccccgatcctgatccctcttgagtatatcgaaaggatgggcattgataatgataccgaactttcaaaacagatcttca gggttgacaagaacttctgcctgagacccatgcttgctccaaacctttacaactacctgcgcaagcttgacagggccctgcctgatc caataaaaatttttgaaataggcccatgctacagaaaagagtccgacggcaaagaacacctcgaagagtttaccatgctgaacttct gccagatgggatcgggatgcacacgggaaaatcttgaaagcataattacggacttcctgaaccacctgggaattgatttcaagatc gtaggcgattcctgcatggtctatggggatacccttgatgtaatgcacggagacctggaactttcctctgcagtagtcggacccatac cgcttgaccgggaatggggtattgataaaccctggataggggcaggtttcgggctcgaacgccttctaaaggttaaacacgacttta aaaatatcaagagagctgcaaggtccgagtcttactataacgggatttctaccaacctgtaa

pylB的序列:(SEQ ID NO:2)

atgatccagaaaatggcaaccgaagaacttgacaggttcggggagaaaattattgaaggttttaaattgtctgatgatgacctcagg gctcttctttctcttgaattcgaagaagagctggaaaagctttactatgtagctagaaaggtcagaaactattatttcggcaacagggtg tttcttaactgttttatttatttctcaacttattgtaaaaaccagtgctctttttgctactataactgtaaaaacgaaattaaccgctaccgcct gaccggtgaagaggttaaagagatgtgcaaagccctgaaaggtgcaggctttcacatgatcgacctgacaatgggagaggatcc ctattactatgatgaccctgaccgcttcgttgaacttgtcaggacagtaaaagaagaactcgggcttccaataatgatttctccgggag ttatggatgacagcaccctcctgaaagccagggaagaaggagcaaatttctttgccctttatcaggagacttatgaccgcgaacttta tggaaagctaagggtaggtcagtccttcgaaggaaggtttaatgcccgcaggtttgcaaaagaacaggggtactgtatagaagac ggcattcttaccggcgtaggaaatgatatcgaatcaactcttatatccctgaaggggatgaaagcaaacaatcctgatatggtaagg gtaatgacttttctgcctcaggaaggaactccgcttgaaggtttcagcgatagttcaaagctttcggagctgaaaatcatagcgattct caggctcatgtttcctgaatgcctgataccggcttctcttgaccttgaaggcatagacggcatggtgcaccgtttaaatgccggagca aatattgtaacctccatcctcccagattcacgcctggaaggggttgccaattacgaccgcggcatggaagagagggacagggacg ttacaagcgttgtcaaaaggctgaaggttatgggaatggaacctgcgccgcaggctgagtttgagagagtcctggggtgctaa

pylC的序列:(SEQ ID NO:3)

atgagagagtcctggggtgctagcctgaaaacaatatgccttataggcgggaagctgcagggcttcgaggctgcatacctatctaa gaaagccggaatgaaagtgcttgtaatagacaaaaacccgcaggcgcttataaggaattatgcggatgagttccagtgttttaacat aacggaagagccggaaaaactcgtcgcgatatcaaaaaatgttgatgccatactgccggtaaatgaaaaccttgaatgtatagaatt tctgaattctataaaagaaaaattctcctgcccggtacttttcgattttgaagcttacaggatcagcagggataagagaaaatcaaaag aatacttcgcatccataggaaccccgacccctcaggacaaaccgtcggaaccaccttattttgtaaagcctccctgcgaaagcagc agtgtgggagcgagaataatccatgacaggaaagagcttaaagagcttgagcccgggatgctcatagaagaatacgttgaaggg gaagtggtctcacttgaggtcataggggatggaaataattttgctgtggtaaaggaaacccttgtacatatcgatgacacctatgactg ccatatggtgacccctctccctctagacccttccttcagggaactatcctactcccttgcagcaaacctgcccttaaaaggaattatgg acgtggaagcgatttccggccccctggggttaaaagttattgagatagatgcccgtttcccgagccagactccgactgcggtctatt attcttccgggatcaacctcatagaactcctgttccgggcttttaatggaggcatagaagagatcaaaactctccctgaagacaggta ctgcatttacgaacatctcatgcttgcagaaaatggagtacttatccctgtgggagaacaggtcctgtccatgggaaatgattacggc aattattatgaagaacctggaatagagattttcctgtgcaaaggagagaaccctgtattcaccctggttttctggggcagagacaggg aagaagctgaagctagaaaaaacaaagggctttcgattctaaaaagccgtttcggagctgctgcataa

pylD的序列:(SEQ ID NO:4)

atggcacttttaaccccagaagacctggaaaatattaacaaacagcttcaagaagctgattctactgtccgcagagttacagggcttg atataaaaggtatctgtaaagatttctacggcacaactccatgctgtgaaaaagtaggtatcgtgcctgtgacctcagggaacgggat catagggagcttttccgaatccctgaatgcaattgccgggtatttcgggtttgacagttttattactgatatgcctgacgtcagcggatat tatgaggcagtaaagaacggagcccggatcatacttatggcagatgataataccttccttgcccacaacctgaaaaatggaaaaatc gccaataaccagccgtgtacaggcataatttatgctgaaatagcttcaagatacctgaaagccgattccaaagaagtgcttgccgtg ggtcttgggaaggttggatttccgggagcagcccatctcgtacagaaaggcttcaaggtttacggatatgatgctgacagaaccctt ctagaaaaaagcgtttccagcctcggaattatacctttcaatcccgtcagccccgaaggcgacaggcaaaggaagttttccattatttt cgaagcaaccccctgtgcagacacgattccggaatccgtaatttcggaaaactgtgtgatttctacccctgggataccctgtgcaatc tcaaaggagctgcaaaaaaagtgtggagttgaacttgtaatggaaccactggggataggtacagcatcaatgctgtattctgtactct aa

pylT的序列:(SEQ ID NO:5)

GGAAACCTGATCATGTAGATCGAATGGACTCTAAATCCGTTCAGCCGGGTTAG ATTCCCGGGGTTTCCGCCA

实施例2:应用哺乳动物细胞将生物合成产生的PCL位点特异性地掺 入hRBP4中

这一实施例例证了在模式蛋白人PBP4(人视黄醇结合蛋白4)的TAG 编码位点处位点特异性地掺入PCL。hRBP4是分泌蛋白质,并且其结构已 经被表征,并且hRBP4中的溶剂暴露残基也是明确确定的。

将hRBP4克隆至pRS载体中,在其C端具有Flag-His标签(图4A)。 应用瞬时转染将hRBP4良好地表达在HEK293F细胞中。将TAG密码子 引入独立的hRBP4构建物中的9个位置中,如表2和以下序列所示。注意 到在下划线氨基酸残基的密码子处引入个别TAG密码子。

(A).hRBP4氨基酸序列:(SEQ ID NO:6)

MKTFILLLWVLLLWVIFLLPGATAQPERDCRVSSFRVKENFDKARFSGTWY51A MAKKDPEGLF62LQDNIVAEFSVDETGQMSATAKGRVRLLNNW93DVCADMV GTFTDTEDPAKFKMKY116W117GVASF122LQKGNDDHWIVDTDYDTY140AV QYSCRLLNLDGTCADSYSFVFSRDPNGLPPEAQKIVRQRQEELCLARQY191RLI VHNGY199CDGRSERNLLDYKDDDDKHHHHHH

(B).hRBP4和TAG突变体的核苷酸序列

野生型hRBP4:(SEQ ID NO:7)

ATGAAAACATTCATACTCCTGCTcTGGGTACTGCTGCTCTGGGTTatcttcctgcttc ccggtgccactgctcagcctgagcgcgactgccgagtgagcagcttccgagtcaaggagaacttcgacaaggctcgcttct ctgggacctggTACgccatggccaagaaggaccccgagggcctcTTTctgcaggacaacatcgtcgcggagttctcc gtggacgagaccggccagatgagcgccacagccaagggccgagtccgtcttttgaataacTGGgacgtgtgcgcagac atggtgggcaccttcacagacaccgaggaccctgccaagttcaagatgaagTACTGGggcgtagcctccTTTctcc agaaaggaaatgatgaccactggatcgtcgacacagactacgacacgTATgccgtgcagtactcctgccgcctcctgaac ctcgatggcacctgtgctgacagctactccttcgtgttttcccgggaccccaacggcctgcccccagaagcgcagaagattgt aaggcagcggcaggaggagctgtgcctggccaggcagTACaggctgatcgtccacaacggtTACtgcgatggcaga tcagaaagaaaccttttggactataaagacgatgacgataagcatcaccatcaccatcacTAA

hRBP4突变体1:(SEQ ID NO:8)

ATGAAAACATTCATACTCCTGCTcTGGGTACTGCTGCTCTGGGTTatcttcctgcttc ccggtgccactgctcagcctgagcgcgactgccgagtgagcagcttccgagtcaaggagaacttcgacaaggctcgcttct ctgggacctggTAGgccatggccaagaaggaccccgagggcctcTTTctgcaggacaacatcgtcgcggagttctcc gtggacgagaccggccagatgagcgccacagccaagggccgagtccgtcttttgaataacTGGgacgtgtgcgcagac atggtgggcaccttcacagacaccgaggaccctgccaagttcaagatgaagTACTGGggcgtagcctccTTTctcc agaaaggaaatgatgaccactggatcgtcgacacagactacgacacgTATgccgtgcagtactcctgccgcctcctgaac ctcgatggcacctgtgctgacagctactccttcgtgttttcccgggaccccaacggcctgcccccagaagcgcagaagattgt aaggcagcggcaggaggagctgtgcctggccaggcagTACaggctgatcgtccacaacggtTACtgcgatggcaga tcagaaagaaaccttttggactataaagacgatgacgataagcatcaccatcaccatcacTAA

hRBP4突变体2:(SEQ ID NO:9)

ATGAAAACATTCATACTCCTGCTcTGGGTACTGCTGCTCTGGGTTatcttcctgcttc ccggtgccactgctcagcctgagcgcgactgccgagtgagcagcttccgagtcaaggagaacttcgacaaggctcgcttct ctgggacctggTACgccatggccaagaaggaccccgagggcctcTAGctgcaggacaacatcgtcgcggagttctcc gtggacgagaccggccagatgagcgccacagccaagggccgagtccgtcttttgaataacTGGgacgtgtgcgcagac atggtgggcaccttcacagacaccgaggaccctgccaagttcaagatgaagTACTGGggcgtagcctccTTTctcc agaaaggaaatgatgaccactggatcgtcgacacagactacgacacgTATgccgtgcagtactcctgccgcctcctgaac ctcgatggcacctgtgctgacagctactccttcgtgttttcccgggaccccaacggcctgcccccagaagcgcagaagattgt aaggcagcggcaggaggagctgtgcctggccaggcagTACaggctgatcgtccacaacggtTACtgcgatggcaga tcagaaagaaaccttttggactataaagacgatgacgataagcatcaccatcaccatcacTAA

hRBP4突变体3:(SEQ ID NO:10)

ATGAAAACATTCATACTCCTGCTcTGGGTACTGCTGCTCTGGGTTatcttcctgcttc ccggtgccactgctcagcctgagcgcgactgccgagtgagcagcttccgagtcaaggagaacttcgacaaggctcgcttct ctgggacctggTACgccatggccaagaaggaccccgagggcctcTTTctgcaggacaacatcgtcgcggagttctcc gtggacgagaccggccagatgagcgccacagccaagggccgagtccgtcttttgaataacTAGgacgtgtgcgcagac atggtgggcaccttcacagacaccgaggaccctgccaagttcaagatgaagTACTGGggcgtagcctccTTTctcc agaaaggaaatgatgaccactggatcgtcgacacagactacgacacgTATgccgtgcagtactcctgccgcctcctgaac ctcgatggcacctgtgctgacagctactccttcgtgttttcccgggaccccaacggcctgcccccagaagcgcagaagattgt aaggcagcggcaggaggagctgtgcctggccaggcagTACaggctgatcgtccacaacggtTACtgcgatggcaga tcagaaagaaaccttttggactataaagacgatgacgataagcatcaccatcaccatcacTAA

hRBP4突变体4:(SEQ ID NO:11)

ATGAAAACATTCATACTCCTGCTcTGGGTACTGCTGCTCTGGGTTatcttcctgcttc ccggtgccactgctcagcctgagcgcgactgccgagtgagcagcttccgagtcaaggagaacttcgacaaggctcgcttct ctgggacctggTACgccatggccaagaaggaccccgagggcctcTTTctgcaggacaacatcgtcgcggagttctcc gtggacgagaccggccagatgagcgccacagccaagggccgagtccgtcttttgaataacTGGgacgtgtgcgcagac atggtgggcaccttcacagacaccgaggaccctgccaagttcaagatgaagTAGTGGggcgtagcctccTTTctcc agaaaggaaatgatgaccactggatcgtcgacacagactacgacacgTATgccgtgcagtactcctgccgcctcctgaac ctcgatggcacctgtgctgacagctactccttcgtgttttcccgggaccccaacggcctgcccccagaagcgcagaagattgt aaggcagcggcaggaggagctgtgcctggccaggcagTACaggctgatcgtccacaacggtTACtgcgatggcaga tcagaaagaaaccttttggactataaagacgatgacgataagcatcaccatcaccatcacTAA

hRBP4突变体5:(SEQ ID NO:12)

ATGAAAACATTCATACTCCTGCTcTGGGTACTGCTGCTCTGGGTTatcttcctgcttc ccggtgccactgctcagcctgagcgcgactgccgagtgagcagcttccgagtcaaggagaacttcgacaaggctcgcttct ctgggacctggTACgccatggccaagaaggaccccgagggcctcTTTctgcaggacaacatcgtcgcggagttctcc gtggacgagaccggccagatgagcgccacagccaagggccgagtccgtcttttgaataacTGGgacgtgtgcgcagac atggtgggcaccttcacagacaccgaggaccctgccaagttcaagatgaagTACTAGggcgtagcctccTTTctcc agaaaggaaatgatgaccactggatcgtcgacacagactacgacacgTATgccgtgcagtactcctgccgcctcctgaac ctcgatggcacctgtgctgacagctactccttcgtgttttcccgggaccccaacggcctgcccccagaagcgcagaagattgt aaggcagcggcaggaggagctgtgcctggccaggcagTACaggctgatcgtccacaacggtTACtgcgatggcaga tcagaaagaaaccttttggactataaagacgatgacgataagcatcaccatcaccatcacTAA

hRBP4突变体6:(SEQ ID NO:13)

ATGAAAACATTCATACTCCTGCTcTGGGTACTGCTGCTCTGGGTTatcttcctgcttc ccggtgccactgctcagcctgagcgcgactgccgagtgagcagcttccgagtcaaggagaacttcgacaaggctcgcttct ctgggacctggTACgccatggccaagaaggaccccgagggcctcTTTctgcaggacaacatcgtcgcggagttctcc gtggacgagaccggccagatgagcgccacagccaagggccgagtccgtcttttgaataacTGGgacgtgtgcgcagac atggtgggcaccttcacagacaccgaggaccctgccaagttcaagatgaagTACTGGggcgtagcctccTAGctcc agaaaggaaatgatgaccactggatcgtcgacacagactacgacacgTATgccgtgcagtactcctgccgcctcctgaac ctcgatggcacctgtgctgacagctactccttcgtgttttcccgggaccccaacggcctgcccccagaagcgcagaagattgt aaggcagcggcaggaggagctgtgcctggccaggcagTACaggctgatcgtccacaacggtTACtgcgatggcaga tcagaaagaaaccttttggactataaagacgatgacgataagcatcaccatcaccatcacTAA

hRBP4突变体7:(SEQ ID NO:14)

ATGAAAACATTCATACTCCTGCTcTGGGTACTGCTGCTCTGGGTTatcttcctgcttc ccggtgccactgctcagcctgagcgcgactgccgagtgagcagcttccgagtcaaggagaacttcgacaaggctcgcttct ctgggacctggTACgccatggccaagaaggaccccgagggcctcTTTctgcaggacaacatcgtcgcggagttctcc gtggacgagaccggccagatgagcgccacagccaagggccgagtccgtcttttgaataacTGGgacgtgtgcgcagac atggtgggcaccttcacagacaccgaggaccctgccaagttcaagatgaagTACTGGggcgtagcctccTTTctcc agaaaggaaatgatgaccactggatcgtcgacacagactacgacacgTAGgccgtgcagtactcctgccgcctcctgaa cctcgatggcacctgtgctgacagctactccttcgtgttttcccgggaccccaacggcctgcccccagaagcgcagaagattg taaggcagcggcaggaggagctgtgcctggccaggcagTACaggctgatcgtccacaacggtTACtgcgatggcag atcagaaagaaaccttttggactataaagacgatgacgataagcatcaccatcaccatcacTAA

hRBP4突变体8:(SEQ ID NO:15)

ATGAAAACATTCATACTCCTGCTcTGGGTACTGCTGCTCTGGGTTatcttcctgcttc ccggtgccactgctcagcctgagcgcgactgccgagtgagcagcttccgagtcaaggagaacttcgacaaggctcgcttct ctgggacctggTACgccatggccaagaaggaccccgagggcctcTTTctgcaggacaacatcgtcgcggagttctcc gtggacgagaccggccagatgagcgccacagccaagggccgagtccgtcttttgaataacTGGgacgtgtgcgcagac atggtgggcaccttcacagacaccgaggaccctgccaagttcaagatgaagTACTGGggcgtagcctccTTTctcc agaaaggaaatgatgaccactggatcgtcgacacagactacgacacgTATgccgtgcagtactcctgccgcctcctgaac ctcgatggcacctgtgctgacagctactccttcgtgttttcccgggaccccaacggcctgcccccagaagcgcagaagattgt aaggcagcggcaggaggagctgtgcctggccaggcagTAGaggctgatcgtccacaacggtTACtgcgatggcaga tcagaaagaaaccttttggactataaagacgatgacgataagcatcaccatcaccatcacTAA

hRBP4突变体9:(SEQ ID NO:16)

ATGAAAACATTCATACTCCTGCTcTGGGTACTGCTGCTCTGGGTTatcttcctgcttc ccggtgccactgctcagcctgagcgcgactgccgagtgagcagcttccgagtcaaggagaacttcgacaaggctcgcttct ctgggacctggTACgccatggccaagaaggaccccgagggcctcTTTctgcaggacaacatcgtcgcggagttctcc gtggacgagaccggccagatgagcgccacagccaagggccgagtccgtcttttgaataacTGGgacgtgtgcgcagac atggtgggcaccttcacagacaccgaggaccctgccaagttcaagatgaagTACTGGggcgtagcctccTTTctcc agaaaggaaatgatgaccactggatcgtcgacacagactacgacacgTATgccgtgcagtactcctgccgcctcctgaac ctcgatggcacctgtgctgacagctactccttcgtgttttcccgggaccccaacggcctgcccccagaagcgcagaagattgt aaggcagcggcaggaggagctgtgcctggccaggcagTACaggctgatcgtccacaacggtTAGtgcgatggcaga tcagaaagaaaccttttggactataaagacgatgacgataagcatcaccatcaccatcacTAA

Tyr108和Phe54在hRBP4的视黄醇结合位点衬里,而所有其它TAG 突变在溶剂暴露蛋白质残基处。当在哺乳动物细胞中表达时,在这些TAG 位点处的翻译终止将导致产生缺乏C-端His标签的截短蛋白。结果,截短 的蛋白质不能被抗His抗体识别。通读翻译将产生具有His标签的全长产 物。因此,用抗His抗体的检测作为通读活性的指示。

hRBP4的表达

将pRSRBP与pCMVpyS、pCMVpyB、pCMVpyC和pCMVpyD共 转染进HEK293F细胞,并如实施例1所述在5mM D-鸟氨酸的存在下培 养细胞。然后应用蛋白质印迹法和抗His抗体分析His标记的hRBP4,由 于截短的hRBP4不含有His标签,通过蛋白质印迹法仅检测在TAG密码 子处掺入有PCL的全长hRBP4。因此,全长hRBP4的存在表明PCL掺 入。如图6A所示,抗His抗体检测到26kDa处的条带,即全长hRBP4 的预期大小,表明在突变的TAG密码子处掺入了PCL。PCL以不同的比 率在9个hRBP4构建物(表2)中掺入,其中#2、#6和#9突变体构建物以较 高比率,而#7和#8突变体构建物以较低的比率。#2、#6和#9的蛋白质产 量为4至8mg/ml,约为野生型hRBP4产量的20%。纯化这些蛋白质,并 进行质谱(MS)分析。获得的蛋白质质量与掺入PCL所预期的相一致,并 且串联MS分析证实了PCL在预期位置的掺入(图6A至11)。

图6B显示了其中PCL掺入hRBP4中的在HEK293F细胞中产生的 hRBP4的SDS-PAGE,以及图6C显示了其质谱。从不存在(A,条带1) 或存在(A,条带2)D-鸟氨酸的共转染HEK293F细胞的培养基中纯化 hRBP4,并在SDS-PAGE上分析。箭头指出全长hRBP4。通过质谱(B)分 析纯化的蛋白质:观察到的质量是23166.0Da,与预期的23168Da的质量 接近。

位点特异性掺入hRBP4的PCL的质谱检测

将500ml用pylS、pylT、pylC和pylD基因及hRBP4突变体#6(表2: hRBP4Phe122PCL)DNA转染的HEK293F细胞的培养物在补充有5mM D-鸟氨酸的培养基中培养。使培养基在两个Ni-NTA柱上运行,以捕获所 有全长hRBP4蛋白质。当汇集时,洗脱级份含有4.3mg总蛋白质。蛋白 质的观察质量为23166.8Da(预期为23168Da),与单PCL残基的掺入相 一致(数据未显示)。将等分样品进行胰蛋白酶消化以及LC-MS分析。图7 的MS/MS谱可指定为肽YWGVASF*LQK(SEQ ID NO:17),其中残基F* 具有与PCL相一致的质量,证实了PCL在预期的残基122位的TAG位 点处位点特异性地掺入。肽YWGVASF*LQK的指认在以下给出:

YWGVASF*LQK在m/z 647.86的指认(F*=PCL)

中性肽的单一同位素质量Mr(calc):1273.6819

变化修正:

F7:在F(F)的PCL

离子得分:60预期:0.0013

匹配(粗体):应用32个最强峰的22/74片段离子

图8显示了人RBP4Phe122PCL的胰蛋白酶消化的质谱分析 (YWGVASF*LQK的2+离子的TIC和EIC),并且表明了PCL在靶 Phe122TAG位点处的掺入。图9显示了人RBP4Phe122PCL的胰蛋白酶 消化的质谱分析。质谱显示了YWGVASF*LQK分别在m/z 425.57(3+)和 637.85(2+)处的3+和2+前体(F*=PCL),进一步表明了PCL在靶 Phe122TAG处的掺入。

实施例3:在哺乳动物细胞裂解物中检测生物合成的PCL

这一实施例证实了PCL在哺乳动物细胞中生物合成地产生,并且在所 述细胞的裂解物中可作为游离氰基酸检测。因此这一实施例提示PCL如同 吡咯赖氨酸和其它20种天然存在的氨基酸那样掺入,并且PCL的掺入不 是翻译后蛋白质修饰的结果。

在细胞裂解物中检测PCL

将60ml具有pylT、pylS、pylB、pylC和pylD基因的HEK293F细胞 培养物在有5mM D-鸟氨酸或没有D-鸟氨酸的情况下培养。收集细胞,并 在250μl双去离子H2O中通过声处理裂解。通过离心沉淀细胞碎片。通 过添加冷甲醇至80%的终浓度沉淀蛋白质,并通过离心移除。然后通过真 空离心蒸发浓缩器(speedvac)浓缩可溶裂解物,通过高压液相色谱与质谱联 用进行分析,显示PCL的存在。

首先在100μl 98/2流动相A/流动相B(流动相A:含有0.1%甲酸的水; 流动相B:含有0.1%甲酸的乙腈)重构干燥样品。然后将样品稀释20倍, 并将2μl注射至HPLC。在Agilent zorbax 300SB_C18反相HPLC柱上完 成分析物分离,使用了以下溶液梯度:0分钟2%B;5分钟2%B;60分钟 100%B;流速:0.25ml/分钟。HPLC示踪的比较(图10A)显示了在4.13分 钟处的峰(星号显示),其在来自用生物合成基因pylB、pylC和pylD转染、 并在D-鸟氨酸的存在下培养的细胞的裂解物中存在(底部EIC(提取离子色 谱)示踪),但不存于无D-鸟氨酸的情况下培养的细胞裂解物中(顶部EIC示 踪)。4.13分钟HPLC峰的全扫描质谱(图10C)显示了242.14943Da的质量, 与PCL(即脱甲基化的PYL)的理论质量(242.14992Da)相一致。赖氨酸(在 1.44分钟的HPLC峰)在两个样品中丰度相等(图10B),并且赖氨酸的全质 谱(图10D)作为内校准,表明了这一方法的准确性。这一分析表明PCL从 D-鸟氨酸产生,为在细胞裂解物中可检测的游离氨基酸。

实施例4:应用假定的PCL和吡咯赖氨酸前体、应用合成的吡咯赖氨 酸类似物、以及应用不同的生物合成基因组合的掺入测试

这一实施例证实了D-鸟氨酸是PCL生物合成的优选前体,如通过其 位点特异性地掺入人RBP4所测量的那样。这一实施例还证明了应用哺乳 动物细胞,某些吡咯赖氨酸类似物(包括CYC)位点特异性地掺入模式蛋白 人视黄醇结合蛋白4即人RBP4中的TAG编码位点。这一实施例还提供 了pylS tRNA合成酶的底物特异性研究。

N-ε-环戊基氧羰基-L-赖氨酸(CYC)掺入

如实施例2所述,分别用9种hRBP4TAG突变体的DNA构建物(表 3)与pylT/pylS DNA一起共转染进HEK293F细胞,并在存在或不存在4 mM吡咯赖氨酸类似物N-ε-环戊基氧羰基-L-赖氨酸(CYC)的情况下培养。 收集培养基,并应用抗His抗体和抗hRBP4抗体通过蛋白质印迹进行分析 (图11A)。应用抗His抗体的蛋白质印迹揭示了9种hRBP4TAG突变体构 建物中的6种的24kDa蛋白质。蛋白质的大小与野生型hRBP4的大小等 价,表明通过通读翻译产生了全长蛋白。hRBP4突变体构建物(表3)之间 的通读活性不同,并取决于CYC和pylS。特别是,在突变体#1、5和7中 不能检测到全长hRBP4蛋白。在突变体#2、6和9观察到高产量的全长蛋 白,与PCL掺入所见结果类似(实施例2,图6A)。

表3

hRBP4突变体和CYC掺入的定性结果

通过Ni-NTA色谱从培养基纯化所表达的含有CYC的蛋白,并通过 SDS-PAGE及随后的考马斯蓝(Coomassie blue)染色进行分析。图11B显 示了纯化的hRBP4TAG突变体#2的SDS-PAGE分析。纯化的制备物显 示出大小为24kDa的单蛋白质条带。纯化蛋白的质谱与CYC的单位点掺 入相一致(图11C)。单位点CYC掺入代替Phe62的预期分子量为(23114.6 Da(野生型)-165.2Da(Phe)+258.3Da(CYC))23208.7Da,并且观察到 23182.0Da。观察到的质量提示N端Q残基环化为吡咯烷酮羧酸,导致减 去18Da,以及存在3个完整的二硫键,导致减去6Da(23208.7Da-6Da- 18Da=23184.7Da)。纯化蛋白质的串联MS分析证实了CYC在hRBP4 构建物中指定的TAG位点处掺入(图12)。产自瞬时转染的蛋白质产量估计 为约5mg/L。KDPEGLFLQDNIVAEFSVDETGQMSATAK(SEQ ID NO:18)的MS/MS片段为:

中性肽的单同位素质量Mr(calc):3248.5646变化修正:

F7:在F(F)的Cyc

Q9:去酰氨基(NQ)

N11:去酰氨基(NQ)

M24:氧化(M),中性损耗0.0000

(表格中显示),63.9983

离子得分:113预期:4.6e-009

匹配(粗体):应用156个最强峰的110/498片段离子

应用假定的PCL和吡咯赖氨酸前体的掺入测试

在假定的PCL前体D-鸟氨酸、D-脯氨酸、D-精氨酸、D-谷氨酸、4- 羟基-D-脯氨酸和2-吡咯烷酮-5-甲酸(图13A和B、图14A)的存在下测量 全长hRBP4Phe122PCL蛋白(突变体#6)的产生。如实施例2所述,将 pRSRBP与pCMVpyS、pCMVpyB、pCMVpyC及pCMVpyD共转染进 HEK293F细胞,并在5mM假定前体(图14A)的存在下培养细胞。然后应 用蛋白质印迹和抗His抗体以及SDS-PAGE分析His标记的,并因此分析 具有掺入的PCL的全长hRBP4。如图13B所示,在Ni-NTA纯化的样品 的SDS-PAGE上,仅D-鸟氨酸产生了可测量的蛋白质条带。通过未纯化 样品的蛋白质印迹检测(图13A),表明在所有其它前体的存在下,仅形成 了低水平的全长hRBP4蛋白,清楚地表明D-鸟氨酸是PCL生物合成及掺 入的最有效前体。从蛋白质印迹和SDS-PAGE分析,似乎从5mM D-鸟氨 酸生物合成产生PCL(条带2)并且随后的掺入蛋白质的效率比以5mM的 浓度加入到用pCMVpyS转染的细胞的培养基中的已知PylS底物CYC(条 带9)的掺入效率更高。这一实施例证实了D-鸟氨酸是PCL生物合成的优 选前体。

应用合成的吡咯赖氨酸类似物的掺入测试

与上述实验平行,还在一系列合成的吡咯赖氨酸类似物的存在下测量 全长hRBP4Phe122PCL蛋白(突变体#6)的产生,所述吡咯赖氨酸类似物被 设计有用于在蛋白质掺入后化学衍生化的乙酰基部分(图14B)。如实施例 19所述制备合成的类似物。将pRSRBP和pCMVpyS共转染进HEK293F 细胞,所述pCMVpyS提供一个基因拷贝的pylT tRNA和pylS tRNA合成 酶。取决于溶解度,以2或5mM终浓度将合成的类似物添加至培养基。 然后应用蛋白质印迹和抗His抗体以及SDS-PAGE分析His标记的、并因 此具有掺入的PCL的全长hRBP4的检测。如图13B所示,在Ni-NTA纯 化的样品的分析中,仅CYC(条带9)产生可测量的蛋白质条带。未纯化样 品的蛋白质印迹(图13A)提示TU3000-016(条带15)也是pylS tRNA合成 酶的可利用底物。然而,掺入效率很低,并且该化合物不稳定,因为通过 核磁共振波谱法测量发现不同的批次(TU2982-150)已降解,导致了更低的 向hRBP4的掺入(条带10)。这一实施例与公开的报道相一致,证实了特征 为在类似物环部分的连接位点处具有sp2碳的吡咯赖氨酸类似物不被容许 作为pylS tRNA合成酶的底物。

应用不同的生物合成基因组合的掺入测试

还用具有5mM D-鸟氨酸以及用生物合成基因pylB、pylC和pylD的 不同组合共转染的细胞培养物测试了全长hRBP4Phe122PCL的产生(图 13C)。所有培养物均用pCMVpyS共转染,其提供一个基因拷贝的pylT tRNA和pylS tRNA合成酶。仅当共转染pylC和pylD时,通过应用抗-His- 标签抗体的蛋白质印迹才检测到全长hRBP4蛋白。pylB尽管似乎是PYL 生物合成所需的,但对于PCL生物合成及随后的掺入是不需要的。这一观 察得到了mIgG1Fc结构域蛋白质(实施例5)和小鼠及人EPO(实施例6)的 全长PCL突变体的产生的进一步证实。所有三个实施例均表明仅基因pylC 和pylD是PCL生物合成及蛋白质掺入所必不可少的。

实施例5:应用哺乳动物细胞将生物合成产生的PCL位点特异性地掺 入小鼠IgG1的Fc结构域

这一实施例证实了应用本文提供的方法在哺乳动物细胞中位点特异性 掺入生物合成产生的PCL是通用的方法并且不限于蛋白质hRBP4。

mIgG1Fc的表达

在小鼠IgG1的Fc结构域的K333(突变体#1)、K336(突变体#2)、T394 (突变体#3)和L426(突变体#4)处产生四个TAG突变体(表2和图17A)。将 pRSFc#1-4(表2)与CMVpyT、pCMVpyS、pCMVpyC和pCMVpyD共转 染进HEK293F细胞,并在5mM D-鸟氨酸的存在下培养细胞(未添加 pCMVpyB)。通过Ni-NTA色谱从培养基纯化His标记的Fc结构域蛋白, 并在SDS-PAGE上分析。对于每一构建物,凝胶上的蛋白质条带大小与它 们的全长蛋白质预期大小相一致(图17A)。表达构建特征在于在C端具有 用于纯化的His6标签,并且因此仅回收了全长蛋白。如图17A所示,突 变体#1的表达取决于添加D-鸟氨酸至生长培养基。所有四个突变体的表达 水平类似。没有进行质谱分析,因为当在HEK293F细胞中产生时,Fc结 构域被糖基化。

实施例6:应用哺乳动物细胞将生物合成产生的PCL位点特异性地掺 入促红细胞生成素(EPO)中

在这一实施例中,PCL位点特异性地掺入促红细胞生成素中,进一步 证实了本文提供的方法是在哺乳动物细胞中位点特异性地将生物合成产生 的PCL掺入蛋白质的通用方法。

小鼠促红细胞生成素(EPO)的表达

PCL掺入EPO突变体蛋白在HEK293F细胞中完成。在朝向远离EPO 受体结合界面的11个表面暴露Lys或Arg残基处引入TAG突变。掺入的 位点如下所示,并且在表2中列出。如实施例1所述那样表达小鼠EPO蛋 白质,但是没有添加pylB基因:将pRSEPO#1-11(表2)与pCMVpyT、 pCMVpyS、pCMVpyC及pCMVpyD共转染进HEK293F细胞,并在5mM D-鸟氨酸的存在下培养细胞。通过Ni-NTA色谱从培养基纯化His标记的 EPO,并在SDS-PAGE上分析。EPO构建物含有C-端His-标签。因此, 仅有成功地掺入了PCL的蛋白质将产生全长蛋白质,将能通过Ni-NTA层 析纯化,并因此在SDS-PAGE上产生可检测的条带。全长小鼠EPO的 SDS-PAGE表明所有11个突变体均成功地掺入了PCL(图17B)。对于每一 构建物,凝胶上的蛋白质条带大小与它们的全长蛋白质预期大小相一致。 对于突变体#1,说明全长蛋白质的形成依赖于D-鸟氨酸。所有11个突变 体蛋白质的表达水平相似,并且为以~40mg/L表达的野生型蛋白质的 10-20%(图17B)。由于EPO在HEK293F细胞中的糖基化,没有进行质谱 分析。以下给出了成熟人类(SEQ ID NO:19)和小鼠(SEQ ID NO:20)EPO 蛋白质的序列,PCL掺入位点为粗体,糖基化位点有下划线。突变编码从 N端开始(也参见表2)。

EPO

 人APPLICDSRVLERYLLEAKEAENITTGCAECSLENITVPDTKVNFYAWRMEVGQQAVEVW GLALLS

小鼠APPLICDSRVLERYILEAKEAE NVTMGCEGPLSENITVPDTKVNFYAWRMEVEEQAIEVWGLSLLS

EAVLGQALLVNSSQPEPLQLHVDKAVSGLRSLTTLLRALGAQEAISPPDASAAPLTITADTFRKLF

EAILAQALLANSSQPETLQLHIDKAISGLRSLTSLLRVLGAQELMSPPDTPPAPLTLTVDTFCKLF

RVYSNFLRGKLKLYTGEA CRTGDR

RVYANF LRGKLKLYTGEVCRRGD R

实施例7:应用大肠杆菌细胞将生物合成产生的PCL掺入蛋白质中的 质粒

这一实施例提供对质粒的描述,当转化至大肠杆菌细胞中时,所述质 粒使得PCL能在靶蛋白的TAG编码位点处掺入,其中所述靶蛋白从共转 化至相同大肠杆菌细胞中的第二种质粒表达得到。

pAra-pylSTBCD构建物

用于在大肠杆菌细胞中掺入PCL的质粒显示于图5,并如下构建:通 过应用重叠引物扩增启动子、tRNA和来自pSUP的3’序列,合成在proK 启动子的控制之下编码pylT的盒。然后将上述三个片段与编码ApaLI及 XhoI限制位点的末端引物混合,从而合成完整插入物。用ApaLI和XhoI 消化后,将所述盒连接至已用相同的酶制备的pSUP骨架中,从而制得 pSUP-pylT。从之前制备的适当的pCMVU6质粒(实施例1)扩增来自M. mazei的pylS、pylB、pylC和pylD的编码序列,并插入没有标签的pMH4 中(参见,Lesley SA,Kuhn P,Godzik A,Deacon AM,Mathews I,Kreusch  A,Spraggon G,Klock HE,McMullan D,Shin T,Vincent J,Robb A, Brinen LS,Miller MD,McPhillips TM,Miller MA,Scheibe D,Canaves JM, Guda C,Jaroszewski L,Selby TL,Elsliger MA,Wooley J,Taylor SS, Hodgson KO,Wilson IA,Schultz PG,和Stevens RC,“Structural genomics  of the Thermotoga maritima proteome implemented in a high-throughput  structure determination pipeline”,Proc Natl Acad Sci USA 2002;99: 11664-11669)。然后应用具有不同限制位点的引物(KpnI-pylS-SbfI、 NdeI-pylD-BglII、BglII-pylB-XhoI、XhoI-pylC-KpnI)扩增每一个的整个启 动子-CDS-终止子。应用KpnI和SbfI消化pylS PCR产物,并连接至 pSUP-pylT的KpnI和SbfI位点之间,得到pAra-pylST。用相应的酶切割 pylB、pylC和pylD产物,并连接至用NdeI和KpnI制备的质粒骨架中。 在通过测序和诊断PCR证实这一四通连接的质粒产物后,应用引物扩增完 整的盒,以将KpnI位点添加至pylD-pylB-pylC盒的两端。用KpnI对其进 行消化,并连接至pAra-pylST的KpnI位点,得到最终的 pAra-pylSTBCD(图5)。最终的质粒含有pylD、pylB、pylC和pylS,每一 个在独立的阿拉伯糖可诱导及T7杂合启动子控制之下,并且在每一个的 下游具有rrnB终止子(与pMH4情况相同),以及pylT在proK启动子的 控制之下(与具有单tRNA拷贝的pSUP/pSUPAR情况类似)(Cellitti等人, “In vivo incorporation of unnatural amino acids to probe structure, dynamics,and ligand binding in a large protein by nuclear magnetic  resonance spectroscopy”,J Am Chem Soc.2008年7月23日; 130(29):9268-81)。

实施例8:应用大肠杆菌细胞将生物合成产生的PCL位点特异性地掺 入FAS-TE中

这一实施例提供了将PCL掺入人脂肪酸合成酶(FAS-TE)的TAG编码 位点处的描述,所述人脂肪酸合成酶从共转化至相同大肠杆菌细胞内的第 二种质粒表达得到。

从具有N-端标记(MGDSKIHHHHHHENLYFQG)(SEQ ID NO:21)的 pMH4载体表达编码人脂肪酸合成酶的残基2221至2502的硫酯酶结构域 (FAS-TE)(参见,Lesley SA,Kuhn P,Godzik A,Deacon AM,Mathews I, Kreusch A,Spraggon G,Klock HE,McMullan D,Shin T,Vincent J,Robb  A,Brinen LS,Miller MD,McPhillips TM,Miller MA,Scheibe D,Canaves  JM,Guda C,Jaroszewski L,Selby TL,Elsliger MA,Wooley J,Taylor SS, Hodgson KO,Wilson IA,Schultz PG,和Stevens RC,“Structural genomics  of the Thermotoga maritima proteome implemented in a high-throughput  structure determination pipeline”,Proc Natl Acad Sci USA 2002;99: 11664-11669)。如Cellitti等(“In vivo incorporation of unnatural amino  acids to probe structure,dynamics,and ligand binding in a large protein  by nuclear magnetic resonance spectroscopy”,J Am Chem Soc.2008年7 月23日;130(29):9268-81)所详细描述的那样,应用PIPE克隆(参见,Klock, HE,Koesema EJ,Knuth MW,和Lesley,SA,“Combining the polymerase  incomplete primer extension method for cloning and mutagenesis with  microscreening to accelerate structural genomics efforts”,Proteins.2008年 5月1日;71(2):982-94)突变TAG密码子。测试PCL掺入的突变体是 Leu2222TAG/Leu2223Ile和Y2454TAG(图18A)。用pMH4-FAS-TE质粒 和pAra-pylSTBCD共转化HK100细胞,并在LB+Kan+Cm板上选择。 诱导之前,在补充有5mM D-鸟氨酸(Sigma或Nova Biochem)的TB (Sigma)+Kan+Cm中在37℃培养液体培养物。OD595=0.8时,将细胞移至 30℃并在15-30分钟后用0.2%阿拉伯糖诱导。诱导后培养细胞约20小时, 然后通过离心收集。在TBS+5%甘油pH 8中通过声处理裂解细胞。根据 生产商的说明应用Ni-NTA(Qiagen)色谱纯化可溶蛋白级份(fraction)。 FAS-TE Leu2222PCL/Leu2223Ile的产量是46-80mg/L,以及FAS-TE Tyr2454PCL的为155-186mg/L,相当于野生型蛋白质产量的50-80%。在 SDS-PAGE上的分子大小,以及通过质谱确定的蛋白质分子量与PCL在 预期位置的单位点掺入相符(图18B)。

具有两个PCL掺入位点(粗体和下划线)的FAS-TE的序列(SEQ ID NO:22)在以下给出(对于Leu2222PCL,残基Leu2223突变为Ile2223):

MGSDKIHHHHHHENLYFQGSLVNPEGPTLMRLNSVQSSERPLFLVHPIEGSTTVF HSLASRLSIPTYGLQCTRAAPLDSIHSLAAYYIDCIRQVQPEGPYRVAGYSYGACVA FEMCSQLQAQQSPAPTHNSLFLFDGSPTYVLAYTQSYRAKLTPGSEAEAETEAICFF VQQFTDMEHNRVLEALLPLKGLEERVAAAVDLIIKSHQGLDRQELSFAARSFYYK LRAAEQYTPKAKYHGNVMLLRAKTGGAGEDLGADYNLSQVCDGKVSVHVIEG DHRTLLEGSGLESIISIIHSSLA

入成纤维细胞生长因子21(FGF21)中

这一实施例提供了PCL在人成纤维细胞生长因子FGF21的20个独立 的TAG编码位点处的掺入,所述FGF21从共转化至相同大肠杆菌细胞内 的第二种质粒表达得到。

从具有N-端标签(MGDSKIHHHHHHENLYFQG)(SEQ ID NO:21)并 编码翻译的人蛋白质残基33-209的pSpeedET载体(参见,Klock,HE, Koesema EJ,Knuth MW,Lesley,SA,“Combining the polymerase  incomplete primer extension method for cloning and mutagenesis with  microscreening to accelerate structural genomics efforts”,Proteins.2008年 5月1日;71(2):982-94)表达人成纤维细胞生长因子21,即FGF21。在以下 20个单个位置将用于PYL类似物掺入及随后的PEG连接的TAG密码子 引入FGF21(SEQ ID NO:25)aa33-209构建物:Ser35、Gln39、Arg47、 Gln56、Arg64、Asp74、Lys84、Lys87、Lys97、Arg100、Arg105、His115、 Arg124、Glu129、Lys150、Arg154、Leu167、Leu170、Leu181和Gln184。 以下给出了FGF21(33-209aa)构建物的序列,用粗体和下划线突出显示在 20个独立的构建物中的掺入位点。

MGSSHHHHHHS SGENLYFOGD SPLLFGGVRQYLYTDD AQTEAHLEI EDGTVGGAAQSPESLLQLALPGVIQILGVTSFLC QPDGALYGS LFDPEACSFELLLDGYN VYQSEAHGLP LHLPGNSPHDPAPRGPAR FLPPGPPA LPEPPGIAPPPDVGSSDP LSMVGPSQGR SPSYAS

用pSpeedet-FGF21质粒和pAra-pylSTBCD共转化HK100或 BL21(DE3)细胞,并在LB+Kan+Cm上选择。如实施例8那样培养液体培 养物,其中在诱导之前添加5mM D-鸟氨酸。在0.2至1.0之间测试转移至 30℃的OD595,随后在15-30分钟后及在OD595=0.4-2.0用0.2%阿拉伯 糖或1mM IPTG诱导。诱导后培养细胞约20小时,然后收集。在含有5% 甘油、1%Triton X-114或2.5%脱氧胆酸盐的TBS中裂解细胞。然后将不 溶的沉淀重悬于TBS+6M胍-HCl pH 8中。在Ni-NTA树脂上纯化蛋白质, 并在柱上或从柱上洗脱后重折叠。然后用TEV蛋白酶移除标签,并通过 Ni-NTA、离子交换以及尺寸排阻色谱纯化产物。

显示了PCL掺入到FGF21的代表性数据如图20所示。表4记录了初 步的表达产量。由于所述构建物具有N-端His标签,因此全长和截短的 FGF21蛋白均得以纯化。TAG密码子用作终止密码子(产生截短的蛋白质) 和用于掺入PCL(产生全长蛋白质)的程度取决于不同的掺入位点(图20)。 对于3个突变体(表4),没有可检测的FGF21蛋白质;以及对于剩余的17 个突变体,获得的蛋白质总产量在5.7至143mg/L间变化,其中估计想要 的全长蛋白质产量为4至56mg/L。对于所有突变体,通过质谱证实了PCL 的掺入。

表4

实施例11:PCL掺入mTNF-α中

为表达mTNF-αGln21PCL突变体,用pAra-pylSTBCD和在pET22b 质粒载体中相应的突变mTNF-α基因共转化大肠杆菌BL21(DE3)细胞。在 37℃,在TB培养基中在5mM D-鸟氨酸的存在下培养经转化的细胞,并 当OD600达到0.5时用1mM IPTG和0.2%(w/v)阿拉伯糖诱导。然后在30 ℃持续摇晃细胞12-16小时,并收集。将细胞沉淀储存于-20℃,直到使用。 mTNF-α的X射线晶体结构显示了在重组mTNF-α蛋白质序列中如下所示 的PCL掺入位点Lys11和Gln21,其中所述重组mTNF-α蛋白质含有N- 端His6标签,所述标签之后为因子Xa切割位点(GIEGR)(SEQ ID NO:26):

实施例12:PCL掺入mEGF中

为表达mEGF-Tyr10PCL突变体,用pAra-pylSTBCD和在pET22b 质粒载体中相应的突变mEGF基因共转化大肠杆菌BL21(DE3)细胞。在 37℃,在TB培养基中在5mM D-鸟氨酸的存在下培养经转化的细胞,并 当OD600达到0.5时用1mM IPTG和0.2%(w/v)阿拉伯糖诱导。然后在30 ℃持续摇晃细胞12-16小时,并收集。将细胞沉淀储存于-20℃,直到使用。 mEGF的X射线晶体结构显示了重组mEGF蛋白质序列中如下所示的 PCL掺入位点Tyr10和Tyr29,其中所述重组mEGF含有给出的C-端His6标签(SEQ ID NO:27):

实施例13:吡咯赖氨酸(Pyl)或PCL掺入mTNF-α中

为将PYL插入mTNF-α中,用在pET22b质粒载体上的突变体 mTNF-α基因与含有M.mazei pylS、pylT、pylB、pylC和pylD基因的 pAra-pylSTBCD共转化大肠杆菌BL21(DE3)细胞,其中所述的突变体 mTNF-α基因具有突变为终止密码子(TAG)的Gln21(CAA)密码子。为仅将 PCL掺入突变体mTNF-α中,用缺乏假定的甲基转移酶PylB的基因的 pAra-pylSTCD替代pAra-pylSTBCD。在37℃,在TB培养基中在5mM D-鸟氨酸的存在下培养经转化的细胞,并当OD600达到0.5时用1mM IPTG和0.2%(w/v)阿拉伯糖诱导。然后在30℃持续摇晃细胞12-16小时, 并收集。将细胞沉淀储存于-20℃。在冰上解冻细胞沉淀15分钟后,以每 克湿重3ml的量将细胞重悬于裂解缓冲液(20mM Tris/HCl,50mM NaCl, pH 8.0)中。添加溶菌酶至1mg/ml,并在冰上超声处理细胞2分钟。在4 ℃以30,000x g离心裂解物20分钟,以沉淀细胞碎片。将1ml 50%Ni-NTA 浆体(Qiagen)添加至澄清的裂解物中,并通过在4℃振荡60分钟从而温柔 地混合。将裂解物Ni-NTA混合物上样至柱上,并收集流出物。在用20ml 在PBS(pH 8.0)中的25mM咪唑洗涤树脂后,用2.5ml在PBS(pH 8.0)中 的250mM咪唑洗脱蛋白质,并通过应用PD-10柱(GE Healthcare)将其 缓冲液交换至PBS(pH 7.4)中。通过SDS-聚丙烯酰胺凝胶电泳(SDS-PAGE) 分析在存在或不存在pylB以及存在或不存在D-鸟氨酸的情况下mTNF-α Gln21TAG的表达(图21A)。在图21A中,条带1是分子量标准物SeeBlue  Plus2Pre-Stained Standard;条带2是存在pylB和D-鸟氨酸的情况下的表 达;条带3,存在pylB、未添加D-鸟氨酸的表达;条带4,不存在pylB、 添加5mM D-鸟氨酸的表达;以及条带5,不存在pylB和D-鸟氨酸的情况 下的表达。所述数据说明全长mTNF-α的表达依赖于D-鸟氨酸的存在,并 且在不存在或存在pylB基因的情况下是类似的。

实施例14:将吡咯赖氨酸(Pyl)或PCL掺入mEGF中

用pAra-pylSTBCD和在pET22b质粒载体上的相应突变体mEGF Tyr10TAG和Tyr29TAG基因共转化大肠杆菌BL21(DE3)细胞。在37℃, 在TB培养基中在5mM D-鸟氨酸的存在下,当OD600达到0.5时添加1mM IPTG和0.2%(w/v)阿拉伯糖,表达两种构建物。然后将温度降至30℃, 并在诱导后16小时收集细胞。将细胞沉淀重悬于20mL 20mM Tris/HCl (pH 8.5)中,并超声处理5分钟。以30,000x g离心20分钟后,弃去上清 液。通过超声处理将沉淀重悬于20mL含有2%(v/v)Triton-X100的20 mM Tris/HCl(pH 8.5)中。在再一次以30,000x g离心20分钟后,通过超 声处理将沉淀溶解于10mL 8M尿素、20mM Tris/HCl、10mM β-巯基 乙醇,pH 8.5中。通过离心(30,000x g,20分钟)移除不溶的细胞碎片,并 用重折叠缓冲液(100mM Tris/HCl、4mM还原型谷胱甘肽、0.4mM氧化 型谷胱甘肽、20%(v/v)乙醇,pH 8.5)2倍稀释上清液。然后通过应用 slide-a-lyzer透析盒(3500Da截断分子量,Pierce)将稀释样品在4℃针对重 折叠缓冲液透析过夜。通过30,000x g离心20分钟移除不溶蛋白质,并往 上清液补充β-巯基乙醇至2mM的终浓度。往重折叠蛋白中加入1ml 50% Ni-NTA浆体(Qiagen),并通过在4℃振荡60分钟温柔地混合。将蛋白质 -Ni-NTA混合物上样至柱上,并收集流出物。在用20ml在PBS(pH 8.0) 中的25mM咪唑洗涤树脂后,用2.5ml在PBS(pH 8.0)中的250mM咪 唑洗脱蛋白质。最后,通过应用PD-10柱(GE Healthcare)将蛋白质交换 缓冲液至PBS(pH 7.4)中。通过SDS-PAGE研究蛋白质制备物的纯度(图 21B)。在图21B中,带1是分子量标准物SeeBlue Plus2Pre-Stained  Standard;以及条带2是Ni-NTA纯化后的mEGF Tyr10TAG突变体蛋白。

此外,mEGF Tyr10TAG、ESI-MS谱获自在存在或不存在PylB表达 的情况下获得的蛋白质,如应用上述针对mTNFα的方法所获得的那样(图 21C)。图21C的下面的质谱说明PYL掺入主要发生在存在pylB基因的情 况下(mEGF Tyr10Pyl的预期质量=7310Da);而在图21C上面的质谱说明 了在不存在pylB的情况下仅发生PCL掺入(mEGF Tyr10Pyl的预期质量= 7296Da)。因此,在图21B条带2中观察到的蛋白质是具有PYL掺入的 mEGF,如通过LC-MS/MS分析进一步证实的那样。类似地,在图21A 条带2中观察到的蛋白质可能是具有PYL掺入的mTNFα,而条带4可能 是具有PCL掺入的mTNFα。

此外,来自表达所有基因(M.mazei pylS、pylT、pylB、pylC和pylD) 的mEGF Tyr10TAG样品中的PCL和PYL掺入的LC-MS/MS提取离子 色谱质量分析的PCL/PYL比值的量化显示PYL的丰度比PCL高5至10 倍,而来自表达所有基因(M.mazei pylS、pylT、pylB、pylC和pylD)的mTNF Gln21TAG样品中的PCL和PYL掺入的LC-MS/MS提取离子色谱质量分 析的PCL/PYL比值的量化显示PCL的丰度比Pyl高约7倍。不存在PylB 基因时的量化显示仅有PCL蛋白质,说明PYL的掺入严格依赖于pylB, 这进一步提示PylB确实是Pyl生物合成所需的甲基转移酶。

实施例15:其它类似物和前体的掺入

用pAra-pylSTBCD、pAra-pylSTCD、pAra-pylSTC、pAra-pylSTD 或pSUPAR-pylST以及pMH4-FASTE-L2222TAG-L2223I共转化HK100 细胞(衍生自Genehogs;Invitrogen)。在37℃在25ml Terrific Broth(TB) (Sigma)培养基中培养细胞至OD595~0.6。将细胞移至30℃,并且将类似物 或前体化合物以图15所示浓度添加至每一个单个的培养物中。被评估的化 合物是N-ε-环戊基氧羰基-L-赖氨酸(CYC;Sigma)、D-鸟氨酸 (Chem-Impex)、PCL-A(参见实施例36-1,化合物3647-125)、PCL-B(参 见实施例36-2,化合物3793-011)、P2C(参见实施例36-2,化合物 3647-164)、P5C(参见实施例35-1,化合物3793-007)和Lys-Nε-D-鸟氨酸 (参见实施例35-2,化合物3793-031)。然后在20分钟后用0.2%阿拉伯糖 诱导细胞。18-20小时后,通过离心收集细胞。通过超声处理裂解细胞,在 自然条件下用Ni-NTA(Qiagen)纯化,并通过SDS-PAGE凝胶及随后的考 马斯蓝染色评估(0.25ml Ni-NTA,0.75ml洗脱液,20μl至凝胶上)。图15A 显示了从在所示pyl基因(pylS/pylT或pylB/pylC/pylD/pylS/pylT)存在下培养 及供给所示化合物的细胞中纯化的蛋白质(FAS-TE)。应用Cyc和D-鸟氨 酸(D-Orn)作为阳性对照。此外,将不加入化合物作为阴性对照。在条带 1-11和12-18中的凝胶样品体积每一个是内在一致的。

条带2和3显示了从仅具有pylS和pylT基因,且分别用PCL-B (Lys-P2C)或PCL-A(Lys-P5C)培养的细胞中获得的蛋白质。两种化合物均 掺入蛋白质中,从而证实了PylS利用所述两种化合物的能力。条带5至 11显示了在前体Lys-Nε-D-Orn(条带10)或仅具有吡咯啉环的前体即P2C (条带6)和P5C(条带8)的存在下,在具有全组pyl生物合成基因 (pylB/pylC/pylD/pylS/pylT)的细胞中的蛋白质合成的评估。仅具有吡咯啉环 的前体:P2C(条带6)和P5C(条带8)不足以支持PCL生物合成,提示这 些不是途径中的中间体。然而,Lys-Nε-D-Orn(条带10)导致了在琥珀密码 子处掺入PCL的蛋白质的表达,证实了这是PCL生物合成途径中的中间 体。表5给出了获得的蛋白质的量(Bradford)、观察到的质量和获得的 PCL∶PYL∶CYC比。

表5

为确定Lys-Nε-D-Orn是否是所需基因(pylC和pylD)中任一个的生物 合成途径上游的中间体,用pSUPAR-pylST、 pMH4-FASTE-L2222TAG-L2223I与pAra-pylSTB、pAra-pylSTC、 pAra-pylSTD、pAra-pylSTCD或pAra-pylSTBCD共转化HK100细胞(衍 生自Genehogs;Invitrogen)。图15B显示仅有pylD(条带15)是从 Lys-Nε-D-Orn形成PCL所需的,提示其为生物合成途径中pylC上游的中 间体。此外,NMR评估也证实了Lys-Nε-D-Orn是PylD的底物。

实施例16用2-氨基苯甲醛、2-氨基-苯乙酮和2-氨基-5-硝基-二苯甲酮衍生化掺入hRBP4的PCL

这一实施例提供了用2-氨基-苯甲醛(2-ABA)、2-氨基-苯乙酮和2-氨 基-5-硝基-二苯甲酮标记PCL。认为所述反应按照图22所示的一般流程进 行的。应用质谱和NMR评估形成的结构。图23显示了从三种不同的2- 氨基-苯甲醛部分形成的蛋白质缀合物,并显示了预期的和观察到的质量变 化。

hRBP4中通过2-ABA位点特异性修饰的PCL的质谱检测

如实施例2所描述的那样在HEK293F细胞中表达视黄醇结合蛋白 (hRBP4)。掺入PCL以代替Phe122(hRBP4突变体#6),如通过质谱所证 实的那样(图6A-11)。将10μl hRBP4Phe122PCL储存液与89μl 200mM 醋酸钠缓冲液(pH 5.0)及1μl1M 2-ABA溶液混合,并在室温下温育16小 时。在反应混合物中的终浓度是17μM hRBP4Phe122PCL蛋白质和10 mM 2-氨基-苯甲醛(2-ABA)。衍生化的hRBP4的质谱显示于图24,其中 所获得的质量与PCL的2-ABA加合物(23269.2Da)一致。未修饰的hRBP4 具有23166.8Da的质量,并且因此观察到的102.4Da的质量增加(预期+103 Da)证实了hRBP4已被2-ABA修饰。质谱中至少96%的峰强度是由于PCL 的2-ABA加成物,其表明所述反应接近完全。

对2-ABA-衍生化的hRBP4Phe122PCL蛋白质的胰蛋白酶消化物进行 了LC-MS分析,以及MS/MS分析(图25A)鉴定了预期的YWGVASF*LQK 肽(SEQ ID NO:17),其中F*具有与图23所示的2-ABA-修饰的PCL相一 致的质量。所述反应是完全的,因为没检测到未衍生化的PCL残基。 YWGVASF*LQK(F*=PCL-2-ABA加合物)的指认MS/MS谱在以下给 出:

中性肽的单同位素质量Mr(calc):1376.7241

变化修正:

F7 :在F(F)处的PCL-2-ABA加合物

离子得分:44预期:0.059

匹配(粗体):应用28最强峰的13/74片段离子

图25B是YWGVASF*LQK(F*=PCL和PCL-2-ABA加合物)的2+ 离子的TIC和EIC,其中衍生化和未衍生化(未检测到)种类的EIC(提取离 析色谱)的比较表明反应完全。图25C是用2-ABA衍生化的hRBP4 Phel22PCL的质谱分析,其显示了分别在m/z 459.92(3+)和689.37(2+)的 YWGVASF*LQK的3+前体和2+前体。(F*=PCL-2-ABA加合物)。这一 实施例证实了所观察到的与2-ABA的反应与在残基122处的预期TAG位 点处掺入的PCL残基位点特异性地发生。

作为pH函数的反应效率

通过使17μM hRBP4 PCL突变体蛋白在200mM醋酸钠缓冲液(pH 5.0)中与或不与10mM 2-氨基-苯甲醛(2-ABA),或与10mM 2-氨基-苯甲 醛(2-ABA)10x PBS(pH 7.4)在室温下反应12小时,从而评估作为pH函 数的反应效率(图26)。反应混合物的质谱显示至少87%的总峰强度与用一 个2-ABA部分修饰的蛋白质相一致(如预期+102Da)(图26A、B和C)。pH 7.4的反应混合物含有约13%的未反应蛋白质(图26C),而在pH 5.0的反 应中仅检测到4.2%的未反应蛋白质(图26B),提示PCL在pH 5.0的反应 性比在pH 7.4的略高。所述反应对PCL的存在是特异性的,因为掺入 OMePhe以代替Phe62的hRBP4未通过10mM 2-ABA的存在而得以修饰 (图26D、E和F)。

作为反应物比蛋白质浓度的函数以及与其它2-ABA样部分的反应效率

通过使17μM hRBP4PCL突变体蛋白与0.1mM 2-氨基-苯甲醛 (2-ABA)、0.1mM 2-氨基-苯乙酮(2-AAP)或0.1mM 2-氨基-5-硝基-二苯甲 酮(2-ANBP)在200mM醋酸钠缓冲液中于pH 5.0反应,从而评估作为反 应物与蛋白质浓度比函数的反应效率,以及与2-ABA样反应物的反应性。 在室温下12小时后,反应混合物的质谱显示了缀合蛋白质的预期质量(图 27)。对于2-ABA,正确缀合的峰的相对强度是总强度的88%;仅有4.2% 的蛋白质保持未反应(图27A)。对于2-AAP,93%显示已反应;4.5%未反 应(图27B)。对于2-ANBP,仅有5.4%反应(图27C),推测是因为反应试剂 的低溶解性,因为在加至含有hRBP4PCL突变体蛋白的溶液中后, 2-ANBP迅速沉淀。

这一实施例证实了PCL修饰的蛋白质与不同的2-氨基-苯甲醛类似物 反应,并且在掺入PCL的位点处被衍生化。在所有情况下,测量得到的修 饰蛋白的质量与图23所绘结构的预期质量相一致。所述数据还证实以仅为 6比1的低的反应物对蛋白质比,缀合反应即高效进行并接近完全。所述 数据还证实每一蛋白质样品仅被衍生化一次。然而,也观察到以非常高的 反应物对蛋白质比(4700倍)以及在pH 7.5,获得了多个反应物分子的连接 (图28A)。在pH 5.0的相同样品的沉淀也提示多重反应。类似地,当与15400 倍摩尔过量的2-ABA在pH 7.5反应时,用OMePhe代替Phe62修饰的 hRBP4(6.5μM)显示出与图28A观察到的相类似的缀合物模式(图28B)。这 证实了在这些条件下(比蛋白质大量摩尔过量的反应物),连接不依赖于 PCL侧链的存在,而可能涉及赖氨酸侧链。然而,所述示例性反应说明, 通过与以小摩尔过量添加的含2-氨基-苯甲醛的分子反应,可特异性地且近 似定量地衍生化掺入蛋白质中的PCL残基。

实施例17:用2-氨基-苯乙酮衍生化掺入FAS-TE的PCL

使16μM如实施例8那样在大肠杆菌中产生的FAS-TE Tyr2454PCL 与1mM 2-AAP在200mM醋酸钠缓冲液中在pH 5.0下,在室温下反应 16小时,以及在4℃反应24小时。图29A显示了未反应FAS-TE Tyr2454PCL的质谱,而图29B显示了反应混合物的质谱:能观察到的峰 强度100%发生在33318.8Da处,这比未反应材料大116.8Da,并且这在 2-AAP修饰的FAS-TE Tyr2454PCL的116Da预期质量增加的误差之内。 类似地,在pH 7.4,反应进行至95%完全(图29C(未反应的)和图29D(已 反应的))。

实施例18:用2-氨基-苯乙酮-PEG8衍生化掺入hRBP4的PCL

这一实施例证实掺入hRBP4中的PCL可应用2-氨基-苯乙酮的聚乙二 醇(PEG)衍生物在单位点衍生化至完全。在这一实施例中,所述PEG含有 8个乙二醇单位,并且其结构显示于图31。所述实施例还证实了在试剂对 蛋白比高达2300的情况下,野生型hRBP4在pH 5.0和pH 7.5不会与 2-AAP-PEG8反应。

如实施例2那样制备hRBP4突变体#6。如实施例20所述那样制备2- 氨基-苯乙酮PEG8(TU3205-044)。使反应在室温下进行14小时,以及在 4℃进行72小时,然后获得所述反应混合物的质谱。

对于在pH 7.5进行的反应,用10μl 10x PBS稀释10μL hRBP4 Phe122PCL(0.22mg/mL,在PBS中,pH 7.5)。添加0.2μl或2μl 100mM 2-AAP-PEG8储备液(在水中),分别至1和9.1mM的终浓度。蛋白质浓度 分别是4.7μM和4.3μM,得到反应物比蛋白质的210或2100倍摩尔过量。 图32A显示了210比1比例下的反应混合物的质谱,表明约95%的反应完 成度,并且观察到的556Da的质量增加与预期值一致(图31)。在2100倍 摩尔过量时获得100%的反应完成度(数据未显示)。

类似地,在pH 5.0进行反应。在这种情况下,用90μl 200mM的醋 酸钠缓冲液(pH 5.0)稀释10μL hRBP4Phe122PCL(0.22mg/mL,在PBS中, pH 7.5)。添加1μl或10μl 100mM 2-AAP-PEG8储备液(在水中),分别至 1和9.1mM的终浓度。蛋白质浓度分别是0.94μM和0.86μM,得到反应 物比蛋白质的1050或10500倍摩尔过量。图32B显示了1050比1比例下 的反应混合物的质谱。两个反应均获得100%的完成度,并且观察到的556 Da的质量增加与预期值一致(图31)。

为测试2-AAP-PEG8与野生型hRBP4蛋白质的反应性,如上面那些 类似地设置测试反应。对于pH 7.5的反应,野生型蛋白质的终浓度是20 μM,并且2-AAP-PEG8浓度是1或9.1mM,得到46比1和460比1的 摩尔比。以4μM蛋白质浓度以及1和9.1mM的2-AAP-PEG浓度(230 比1和2300比1的试剂对蛋白质比)进行pH5的反应。对于所有4个反应, 在预期的质量处仅观察到未修饰的野生型hRBP4蛋白质(图32D-F)。这一 实施例证实2-AAP-PEG的偶联反应是对靶蛋白中PCL残基的存在高度特 异性的。

实施例19:用不同分子量的2-氨基-苯乙酮-PEG衍生化掺入FAS-TE 的PCL

这一实施例证实了PCL侧链与2-氨基-苯乙酮PEG的反应的一般性。 这一实施例还证实了其长度足以用于对生物治疗蛋白质修饰的 2-AAP-PEG可与PCL修饰的蛋白质缀合。

使16μM如实施例8那样在大肠杆菌中产生的FAS-TE Tyr2454PCL 与1mM TU3205-044(2-AAP-PEG8)在200mM醋酸钠缓冲液中在pH 5.0 下在室温反应16小时。图33A显示了未反应FAS-TE Tyr2454PCL的质 谱,而图33B显示了反应混合物的质谱:在图33B中,能观察到的峰强度 100%发生在33758.4Da处,这比未反应材料大556Da。这一质量差异是 2-AAP-PEG8修饰FAS-TE Tyr2454PCL所预期的(图31)。

在另一实施例中,用MW为0.5kDa、2.4kDa和23kDa的三种不同 2-AAP-PEG衍生化在Tyr2454处掺入FAS-TE的PCL。如实施例8所述, 以约160mg/L的产量(相当于野生型产量的~80%)在大肠杆菌中产生 FAS-TE单位点PCL突变体。使FAS-TE Tyr2454PCL(0.16mM在PBS 中,pH 7.5)的等分试样与TU3205-044(0.5kDa 2-AAP-PEG)、TU3205-048 (2.4kDa 2-AAP-PEG)和TU3205-052(23kDa 2-AAP-PEG)以10∶1或100∶1 摩尔比的在4℃或室温下反应6天。实施例37描述了PEG的结构和它们 的合成。

在SDS-PAGE分析(图34)之前,通过将His标记的FAS-TE蛋白质与 Ni-NTA珠结合,并用PBS缓冲液重复洗涤珠子,从而移除过量的PEG试 剂。为凝胶和质谱分析,从Ni-NTA珠子移除过量的缓冲液,并用咪唑缓 冲液洗脱蛋白质。具体地,将50μL Ni-NTA珠添加至50μL反应混合物 中,温育2小时,并通过离心分离反应混合物和缓冲液。然后用1mL PBS 洗涤珠子3次;将70μL 250mM咪唑缓冲液,20mM TRIS,pH 8添加 至珠子中,以洗脱蛋白质用于凝胶和质谱分析。使用0.5kDa 2-AAP-PEG 的聚乙二醇化不能通过SDS-PAGE分辨,但通过质谱得以证实。反应程度 对于100∶1室温反应为约57%,并且对于100∶1 4℃反应为约43%(数据未 显示)。对于更大的2-AAP-PEG,可通过SDS-PAGE分辨聚乙二醇化产物 (图34)。对于2.4kDa和23kDa 2-AAP-PEG,所有的反应均是不完全的, 并且进行至约25-30%。对于2.4kDa 2-AAP-PEG,通过质谱证实了在PCL 位点处的单位点缀合以及反应程度(图33)。由于PEG的不均一性,不能获 得23kDa 2-AAP-PEG衍生化的蛋白质的质谱数据。

所报告的反应产量是较低的估计,因为Ni-NTA珠提取的严格度可能 偏好提取未反应的FAS-TE,因为聚乙二醇化可能具有更低的His标签亲 和性(如在FAS-TE Leu2222PCL的聚乙二醇情况下那样,数据未显示)。 然而,在提取后聚乙二醇化的材料的检测证实了PCL-2-AAP-PEG连接的 稳定性。

实施例20:用不同分子量的2-氨基-苯乙酮-PEG衍生化掺入FGF21 中的PCL

所述实施例表明可用2-AAP-PEG试剂聚乙二醇化在不同位置掺入 PCL的FGF21。所述实施例还显示可通过离子交换和尺寸排阻色谱联用而 将聚乙二醇化的FGF21突变体与未反应的全长FGF21及截短的FGF21 分离开来。

如实施例10所述那样在大肠杆菌中表达在赖氨酸84位掺入PCL的 FGF21,并重折叠及纯化,但所述蛋白质没有进行TEV蛋白酶切割。蛋白 储备液为在PBS中的约6.6mg/mL,并含有约20%的在残基84处截短的 FGF21蛋白质。将5μl FGF21储备液与45μl 200mM醋酸钠缓冲液(pH 5.0) 及0.5μl 100mM TU3205-044(2-AAP-PEG8,参见实施例20)储备液混合。 最终摩尔比是1mM 2-AAP-PEG8比约30μM FGF21。使所述反应在室温 下进行16小时,并达到完全。

图35A显示了未反应的FGF21的质谱,而图35B显示了反应混合物 的质谱:聚乙二醇化反应进行至完全并产生了21792.4Da的蛋白质,这比 未反应材料大556Da。这一质量差异是2-AAP-PEG8修饰FGF21所预期 的。

用23kDa 2-AAP-PEG(TU3205-052,参加实施例37-3)聚乙二醇化各 种FGF21PCL突变体(如实施例10那样表达和纯化)。一般地,蛋白质浓 度是100至400μM,而添加23kDa 2-AAP-PEG至在PBS缓冲液(pH 7.4) 中为1mM的终浓度。在4℃温育所述反应物3天。与7个代表性FGF21 PCL突变体聚乙二醇化反应的SDS-PAGE显示于图36A,而从全长(FL) 未反应FGF21和截短(TR)FGF21中分离的8个纯化聚乙二醇化FGF21蛋 白质显示于图36B。

实施例21:用2-氨基-苯乙酮-PEG衍生化掺入EPO中的PCL

如实施例6所述,在小鼠EPO的不同位置掺入PCL。Ni-NTA纯化后, 通过在PBS中的S-300凝胶过滤柱进一步纯化mEPO构建物(#6、#9和#10 突变体构建物)。将纯化的mEPO蛋白质浓缩至约1mg/ml。将活化的23kDa 2-AAP-PEG(TU3205-052,参见实施例37-3)以1mM添加至纯化的蛋白质 中,并在表6所示的条件下温育。

表6

  #   构建物   pH   温度   1   EPO6   pH7.5   4C   2   EPO6   pH5.5   4C   3   EPO6   pH8.5   4C   4   EPO9   pH7.5   4C   5   EPO9   pH5.5   4C   6   EPO9   pH8.5   4C   7   EPO10   pH7.5   4C   8   EPO10   pH5.5   4C   9   EPO10   pH8.5   4C   10   EPO6   pH7.5   4C   11   EPO6   pH7.5   22C   12   EPO6   pH7.5   30C   13   EPO6   pH7.5   37C

所有的mEPO构建物在柱中均作为单体运行。当将23kDa 2-AAP-PEG 与纯化的蛋白质温育时,mEPO在单位点被聚乙二醇化,因为它们在 SDS-PAGE中作为65kDa条带迁移(图37)。取决于条件,反应效率从10% 至15%变化,其中相对于pH 7和pH 8.5,pH 5.5导致更高程度的聚乙二 醇化。此外,超过4℃的温育没有显著地升高聚乙二醇化程度。

实施例22:用D-甘露糖胺衍生化掺入hRBP和FAS-TE的PCL

这一实施例证实了氨基糖D-甘露糖胺与掺入两种靶蛋白中的PCL的 直接偶联。这一实施例提示了糖基化含PCL的蛋白质的一般反应流程(图 38)。

如实施例2那样在HEK293F细胞中制备人RBP4Phe122PCL(突变体 #6)。将10μL 170μM蛋白质储备液添加至89μL 10x PBS缓冲液(pH 7.5) 中,并与1μl 1M D-甘露糖胺混合。将hRBP4 Phe122PCL蛋白质(17μM) 与10mM D-甘露糖胺在室温下温育14小时(没有观察到反应),随后在37 ℃温育48小时。图39显示了在37℃温育期之后的反应混合物的质谱。除 了预期的在23165.6Da(预期为23166Da)处的未反应hRBP4峰之外,在 23300.0Da处观察到推定为D-甘露糖胺加合物的峰。164.4Da的质量增加 与图38所绘推定反应产物所预测的161.1Da的增加接近,但不相同。此 外,部分蛋白质降解为在21007.8Da处检测到的种类。

在另一个实施例中,如实施例8那样在大肠杆菌中表达在2222位用 PCL修饰的FAS-TE(11μM),并纯化,将其与10mM D-甘露糖胺在室温 下温育72小时。未反应样品的质谱显示于图40A,并含有相应于未反应蛋 白质的在33250.4Da处的预期信号,以及归属于样品中污染蛋白质的 33360.4Da处的峰。反应混合物的质谱显示了相应于未反应蛋白质的在 33250.4Da处的预期信号(图40B)。在33408.8Da处可看到额外的峰,这 比原材料大158.4Da,推定为图37所示的反应产物的峰。比较这两个样品, 提示在这些条件下,FAS-TE Leu2222PCL以约50%的产率转化为D-甘露 糖胺加合物。

实施例23:PCL介导的FGF21共价交联

这一实施例证实了蛋白质可通过双官能PCL特异性交联剂而共价地 二聚化。如实施例10所述在大肠杆菌中表达在赖氨酸84位掺入PCL的 FGF21,并重折叠及纯化,但所述蛋白质没有进行TEV蛋白酶切割。用交 联剂TU633-010(图43A;合成参见实施例37-4)衍生化FGF21Lys84PCL。 蛋白储备液为在PBS中约6.6mg/mL,并含有约20%的在残基84处截短 的FGF21蛋白质。将5μl FGF21储备液与45μl 200mM醋酸钠缓冲液(pH 5.0)混合。添加0.1μl 5mM交联剂TU633-010储备液(在DMSO中)至10 μM交联剂及约30μM FGF21的终浓度。类似地,使50μl在PBS(pH 7.4) 中的FGF21储备液与1μl 5mM TU633-010在100μM交联剂及约300μM FGF21的浓度下反应。制备稀释至200mM醋酸钠缓冲液中的FGF21样 品作为对照,并同样地处理。室温下16小时后,不经纯化通过质谱和 SDS-PAGE分析对反应和对照样品的等分试样进行分析。对pH 5.0样品获 得的质谱(图43B)清楚地显示了在共价二聚体预期质量处(43037.2Da;相 对强度为所有FGF21峰的53%)、具有一个连接的交联剂末端的FGF21 的预期质量处(21820.0Da;33%)、以及未反应FGF21处(21235.2Da;14%) 的峰。对于pH 7.4样品,没有检测到共价二聚体;28%的FGF21与交联 剂单个地反应,而多数蛋白质未反应(数据未显示)。

调节反应物对蛋白浓度的比例进一步增加了共价二聚体的产量。具体 地,将10μl FGF21储备液与90μl 200mM醋酸钠缓冲液(pH 5.0)混合。 添加0.3μl 5mM交联剂TU633-010储备液(在DMSO中)至15μM交联 剂及约30μM FGF21的终浓度。一个样品在室温下温育4天,而第二个样 品在4℃温育4天。还制备了在10x PBS,pH 7.5中的样品,并同样地温育。 对于在室温下温育的pH 5.0样品,在43034.4Da的预期质量处的共价 FGF21二聚体峰是主要的种类,而未在21233.6Da处检测到未反应的 FGF21。在21818.4Da检测到一些由一个连接的交联剂末端修饰的 FGF21(图44A)。在pH 5.0和4℃反应没有进行至相同的程度,因为约19% 的FGF21保持未反应;40%被一个连接的交联剂末端修饰,而约41%的 质谱峰强度是共价二聚体。在pH 7.5的反应没有产生任何共价二聚体,如 SDS-PAGE所示(图44B)。

用其它不同的分子位点特异性地修饰含有吡咯啉-羧基-赖氨酸(PCL)的蛋白质

在其它实施方案中,在10x磷酸盐缓冲盐水(PBS)(pH 7.0)和25℃进 行本文提供的2-氨基苯甲醛(ABA)缀合物及2-氨基苯乙酮(AAP)缀合物与 含PCL的蛋白质的偶联。通过添加10μM含PCL的蛋白质100μM ABA/AAP缀合物而开始缀合反应。通过电喷雾电离质谱法(ESI-MS)或基 质辅助的激光解吸/电离(MALDI)证实蛋白质缀合物的完全形成。通过应用 NuPAGE 4-12%Bis-Tris凝胶(Invitrogen,Carlsbad,CA)的凝胶位移测试 来分析ABA/AAP DNA缀合物的偶联。在定量偶联后,将蛋白质缀合物透 析至10mM磷酸钠缓冲液(pH 7.5)中,并应用具有10kDa截断值的 Amicon Ultra-4离心过滤单元(Millipore Corporation,Bedford,MA)浓缩 至100μM。然后添加新鲜制备的200mM NaCNBH3溶液(溶解于10mM 磷酸盐缓冲液中,pH 7.5),至终浓度为20mM。使还原反应在25℃进行 2-4小时后,通过添加6倍体积的10mM磷酸钠缓冲液(pH 7.5)淬灭反应。 应用NAP-5珠或PD 10柱(GE Healthcare,Piscataway,NJ),最终将经还原 的蛋白质缀合物缓冲交换至预期的缓冲液中。以下给出了使此类2-氨基苯 甲醛(ABA)缀合物和2-氨基苯乙酮(AAP)缀合物与各种蛋白质偶联的非 限制性实例。

实施例24:偶联生物素试剂

为证实可将生物素偶联至具有一个或多个掺入其中的PCL部分的蛋 白质,应用ABA-生物素试剂(X3626-140,实施例40)使 mEGF-Tyr10PCL(参见实施例12)与生物素缀合。如下进行生物素的偶联: 将500μM ABA-生物素添加至在磷酸盐缓冲盐水(PBS,pH 7.0)和0.5% (v/v)DMSO中的10μM mEGF-Tyr10PCL中,并在25℃反应16小时。通 过ESI-MS证实生物素缀合物的完全形成(图47A;未偶联蛋白质的预期质 量=7296;偶联蛋白质的预期质量=7902)。

在定量偶联后,添加新鲜制备的200mM NaCNBH3溶液(溶解于PBS 中,pH 7.0),至终浓度为20mM。使还原反应在25℃进行3小时后,通 过添加6倍体积的PBS(pH 7.0)淬灭反应。通过应用Slide-A-Lyzer透析盒 (3,500Da截断分子量,Pierce)在4℃针对于PBS(pH 7.0)透析,从而移除过 量的NaCNBH3。应用具有3.5kDa截断值的Amicon Ultra-4离心过滤单 元(Millipore Corporation)浓缩被还原的生物素缀合物。通过NuPAGE 4-12%Bis-Tris凝胶(Invitrogen)电泳后,应用iBlot凝胶转移系统 (Invitrogen)将生物素化的蛋白质转移至聚偏二氟乙烯(PVDF)膜上。然后应 用辣根过氧化物酶(HRP)缀合的山羊抗生物素抗体(1∶100稀释,Cell  Signaling Technologies)检测生物素缀合物,并应用Hyperfilm ECL(GE Healthcare)显影(图47B)。未偶联的mEGF-Tyr10PCL和荧光素缀合的 mEGF-Tyr10PCL作为阴性对照。条带1,20pmol mEGF-Tyr10PCL-ABA- 生物素缀合物;条带2,8pmol mEGF-Tyr10PCL-ABA-生物素缀合物;条 带3,2nmol mEGF-Y10PCL;条带4,20pmol mEGF-Tyr10PCL-ABA- 荧光素缀合物。

实施例25:偶联荧光分子

为证实可将荧光分子偶联至具有一个或多个掺入其中的PCL部分的 蛋白质,应用ABA-荧光素试剂(参见3793-050,实施例42)使 mEGF-Tyr10PCL(参见实施例12)与荧光素缀合。如下进行荧光素偶联: 将1mM ABA-荧光素添加至在磷酸盐缓冲盐水(PBS,pH 7.0)和0.5%(v/v) DMSO中的10μM mEGF-Tyr10PCL中,并在25℃反应16小时。通过 ESI-MS证实荧光素缀合物的形成(图47C;未偶联蛋白质的预期质量= 7296;偶联蛋白质的预期质量=8062)。

用20mM NaCNBH3在25℃将所述荧光素缀合物还原3小时。在用6 倍体积的PBS(pH 7.0)淬灭还原反应后,通过应用Slide-A-Lyzer透析盒 (3,500Da截断分子量)在4℃针对于PBS(pH 7.0)透析,从而移除残留的 NaCNBH3。然后应用具有3.5kDa截断值的Amicon Ultra-4离心过滤单元 将缀合物浓缩至1μM。应用SpectraMax Plus(Molecular Devices)获得1 μM mEGF-Tyr10PCL-ABA-荧光素和10μM ABA-荧光素在350-700nm 范围内的吸收光谱。两者均在500nm给出最大吸收。

然后在SpectraMax GEMINI荧光计(Molecular Devices)上记录荧光 光谱。通过将激发波长维持在490nm,同时应用2nm的步长扫描510nm 至750nm的发射波长,从而获得1μM mEGF-Tyr10PCL-ABA-荧光素和 10μM ABA-荧光素的发射光谱。两者均在522nm给出最大发射。此外, 还通过将发射波长维持在522nm,同时应用2nm的步长扫描300nm至 510nm的激发波长,从而获得1μM mEGF-Tyr10PCL-ABA-荧光素和10 μM ABA-荧光素的激发光谱。

实施例26:偶联多糖

为证实可将多糖偶联至具有一个或多个掺入其中的PCL部分的蛋白 质,应用ABA-二糖(3793-050;实施例42,MW 546.52)使mEGF-Tyr10PCL (参见实施例12)与二糖缀合。通过将1mM ABA-二糖添加至pH 7.0的在 PBS和1%(v/v)DMSO中的10μM mEGF-Tyr10PCL突变体蛋白中,从 而进行所述偶联反应。使反应在室温下进行16小时,并通过ESI-MS分析 (图47D)。质谱显示了在缀合蛋白的预期质量处(7825Da)的主要峰。未偶 联蛋白质的质量是7296Da。

实施例27:偶联免疫调节剂:单-硝基苯基半抗原缀合物

为证实可将免疫调节剂偶联至具有一个或多个掺入其中的PCL部分 的蛋白质,应用ABA-单-硝基苯基半抗原试剂(3793-001,实施例38-8)使 mTNF-Gln21PCL和mEGF-Tyr10PCL(参见实施例11和12)与单-硝基苯 基半抗原缀合。如上所述进行单-硝基苯基半抗原缀合物的偶联。图48A是 与mTNF-Gln21PCL缀合的3793-001的ESI质谱(未偶联蛋白的预期质量 =19275;偶联蛋白的预期质量=19614);以及图48B是与mEGF-Tyr10PCL 缀合的3793-001的ESI质谱(未偶联蛋白的预期质量=7296;偶联蛋白的预 期质量=7635)。

实施例28:偶联免疫调节剂:二-硝基苯基半抗原缀合物

为证实可将免疫调节剂偶联至具有一个或多个掺入其中的PCL部分 的蛋白质,应用二-硝基苯基半抗原(TU3627-088,实施例38-7)使 mTNF-Gln21PCL和mEGF-Tyr10PCL(参见实施例11和12)与二-硝基苯 基半抗原缀合。如上所述进行二-硝基苯基半抗原缀合物的偶联。图48C是 与mTNF-Gln21PCL缀合的TU3627-088的ESI质谱(未偶联蛋白的预期质 量=19275;偶联蛋白的预期质量=19688);以及图48D是与 mEGF-Tyr10PCL缀合的TU3627-088的ESI质谱(未偶联蛋白的预期质量 =7296;偶联蛋白的预期质量=7709)。

实施例29:偶联免疫调节剂:TLR7激动剂

为证实可将免疫调节剂偶联至具有一个或多个掺入其中的PCL部分 的蛋白质,应用ABATLR7激动剂试剂(参见X3678-114,实施例38-3)使 mEGF-Y10PCL(参见实施例12)与TLR7激动剂缀合。通过将100μM ABA-TLR7激动剂添加至pH 4.5的在200mM醋酸钠缓冲液和1%(v/v) DMSO中的10μM mEGF-Y10PCL突变体蛋白中,从而进行所述偶联反 应。使反应在室温下进行16小时,并通过ESI-MS分析(图49A)。质谱显 示了在缀合蛋白的预期质量处(8763Da)的主要峰,其中未偶联蛋白质的质 量是7296Da。

实施例30:偶联免疫调节剂:PADRE肽

为证实可将免疫调节剂和所述肽偶联至具有一个或多个掺入其中的 PCL部分的蛋白质,使mTNF-Gln21PCL和mEGF-Tyr10PCL(参见实施 例11和12)与PADRE肽缀合。如紧接小标题“用其它不同的分子位点特 异性地修饰含有吡咯啉-羧基-赖氨酸(PCL)的蛋白质”之后的段落中所描 述的那样进行PADRE肽的偶联。图50A是在pH 5.0与PX2-PADRE(参 见3465-143;实施例38-11)缀合的mTNF-Gln21PCL的MALDI-TOF质谱 分析;而图50B是在pH 7.5与PX2-PADRE缀合的mTNF-Q21PCL的 MALDI-TOF质谱分析。未偶联蛋白的预期质量是19275Da,而偶联蛋白 的预期质量是20842Da。图50C是与BHA-exPADRE(参见3647-104;实 施例38-10)缀合的mTNF-Gln21PCL的ESI质谱分析。此处,未偶联蛋白 的预期质量是19275Da,而偶联蛋白的预期质量是21317Da。此外,图 51是显示了BHA-exPADRE与mEGF-Tyr10PCL偶联的ESI质谱(未偶联 蛋白的预期质量是7296Da;偶联蛋白的预期质量是9338Da)。

实施例31:偶联免疫调节剂:磷脂

为证实可将免疫调节剂和磷脂与具有一个或多个掺入其中的PCL部 分的蛋白质偶联,应用ABA磷脂试剂(TU3627-092;实施例43-1)使 mEGF-Tyr10PCL(参见实施例12)与磷脂(DOPE)缀合。在20mM HEPES (pH 7.0)和1%(v/v)DMSO中在25℃使ABA-DOPE与mEGF-Tyr10PCL (MW=7296Da)的偶联进行16小时。通过添加10μM mEGF-Tyr10PCL 和100μM ABA-DOPE开始缀合反应。通过DOPE与mEGF-Y10PCL的 缀合的电喷雾电离质谱法(ESI-MS)分析证实蛋白质缀合物的形成(图49B, 未偶联蛋白的预期质量是7296;缀合的蛋白的预期质量是8227Da)。

实施例32:偶联寡核苷酸至蛋白质:CpG肽

为证实可将寡核苷酸和CpG免疫调节剂偶联至具有一个或多个掺入 其中的PCL部分的蛋白质,应用CpG试剂BHA-BG1(参见3647-057;实 施例38-12)或CpG试剂BHA-BG2(参加3597-167;实施例38-14)使 mTNF-Gln21PCL和mEGF-Tyr10PCL(参见实施例11和12)与CpG寡核 苷酸缀合。如紧接小标题“用其它不同的分子位点特异性地修饰含有吡咯 啉-羧基-赖氨酸(PCL)的蛋白质”之后的段落中所描述的那样进行CpG寡 核苷酸的偶联。通过凝胶位移测试证实了BHA-BG1(7.4kDa)和BHA-BG2 (7.4kDa)与mTNF-Gln21PCL(19.3kDa)的偶联(图52A);并且通过凝胶位 移测试也证实了BHA-BG2(7.4kDa)与mEGF-Tyr10PCL(7.2kDa)的偶 联。

实施例33:反应性吡咯赖氨酸类似物的合成

实施例33-1:(S)2-氨基-6-(3-氧代丁酰氨基)己酸盐酸盐(TU3000-016) 的合成

除了在HCl的存在下进行Cbz基团的脱除从而提供HCl盐之外,根 据Bing Hao等,ChemBio 2004,11,1317-24及其补充材料中所述的方法 制备(S)-6-氨基-2-(2,2,2-三氟乙酰氨基)己酸甲酯盐酸盐(TU2982-126)。

在N2气氛下向在40mL玻璃瓶中的(S)-6-氨基-2-(2,2,2-三氟乙酰氨基) 己酸甲酯盐酸盐(0.943g,3.22mmol)、N,N-二异丙基乙胺(DIEA,1.39mL) 和二氯甲烷(DCM,10mL)中加入双烯酮(0.37mL),并在环境温度下搅拌所 述反应16小时。所述反应混合物用乙酸乙酯(EtOA)稀释,连续用H2O、1 N HCl、H2O、饱和Na2CO3水溶液和饱和NaCl水溶液洗涤,用Na2SO4干燥,过滤并在减压下浓缩。用SiO2快速色谱纯化残留物,获得黄色油状 物的(S)-6-(3-氧代丁酰氨基)-2-(2,2,2-三氟乙酰氨基)己酸甲酯 (TU3000-012)。MS(ESI+):计算值:341.12,实测值:341.10(MH+)。 H-NMR(400MHz,CDCl3):1.33(2H,m),1.55(2H,m),1.89(2H,m), 2.259(3H,s),3.31(2H,m),3.410(2H,s),3.783(3H,s),4.543(1H,dt,J=4.4, 8.0Hz),7.091(1H,br.s),7.279(1H,br.d,J=7.6Hz).F-NMR(376MHz, CDCl3):-75.609。

在环境温度下用1N NaOH水溶液(6.5mL)和10mL H2O处理 (S)-6-(3-氧代丁酰氨基)-2-(2,2,2-三氟乙酰氨基)己酸甲酯(0.736g,2.16 mmol)18小时。使用LC-MS分析指示反应完成。在减压下浓缩反应混合 物。残留物用过量的1N HCl水溶液处理,并在减压下浓缩至干,获得(S)-2- 氨基-6-(3-氧代丁酰氨基)己酸盐酸盐(TU3000-016)。MS(ESI+):计算值: 231.13,实测值:231.10(MH+)。

实施例33-2:(S)-5-(4-乙酰基苯甲酰氨基)-1-羧基戊-1-铵氯化物 (TU3000-004)的合成

将(S)-6-氨基-2-(2,2,2-三氟乙酰氨基)己酸甲酯盐酸盐(TU2982-126) (303mg,1.03mmol)、4-乙酰基苯甲酸(190mg)、HATU(418mg)、DIEA (523μL)和DMF(8mL)混合在一起,并在环境温度下搅拌18小时。反应 混合物用EtOA稀释,连续用H2O、1N HCl、H2O、饱和Na2CO3水溶液 和饱和NaCl水溶液洗涤,用Na2SO4干燥,过滤并在减压下浓缩。通过 SiO2快速色谱纯化残留物,获得(S)-6-氨基-2-(2,2,2-三氟乙酰氨基)己酸甲 酯盐酸盐(TU2982-136)。MS(ESI+):计算值:403.14,实测值:403.20 (MH+)。H-NMR(400MHz,CDCl3):1.44(2H,m),1.68(2H,m),1.90(1H, m),2.00(1H,)2.64(3H,s),3.31(2H,m),3.50(2H,m),3.80(3H,s),4.60 (1H,dt,J=4.8,7.6Hz)。6.35(1H,br.s),7.21(2H,br.d,J=7.64Hz),7.86 (21H,d,J=8.4Hz),8.01(2H,d,J=8.8Hz)。F-NMR(376MHz,CDCl3): -75.625。

在环境温度下用在10mL MeOH中的1N NaOH水溶液(2.36mL)处理 (S)-6-(4-乙酰基苯甲酰氨基)-2-(2,2,2-三氟乙酰氨基)己酸甲酯(TU2982-136) (0.473g)18小时。使用LC-MS分析来指示在保持三氟酰胺部分完整的同 时,甲酯的完全水解。在60℃加热所述反应物5小时,如通过LC-MS分 析所指示的那样,此时酰胺水解几乎完全。将反应混合物冷却并在减压下 浓缩。残留物用过量的1N HCl水溶液处理,并在减压下浓缩至干,获得 为淡黄色固体的((S)-5-(4-乙酰基苯甲酰氨基)-1-羧基戊-1-铵氯化物 (TU3000-004)。MS(ESI+):计算值:293.14,实测值:293.20(MH+)。

实施例33-3:((S)-5-(5-乙酰基噻吩-2-甲酰氨基)-1-羧基戊-1-铵氯化物 (TU3000-006)、(S)-5(3-乙酰基苯甲酰氨基)-1-羧基戊-1-铵氯化物 (TU3000-008)、和(S)-5-(4-乙酰基-1-甲基-1H-吡咯-2-甲酰氨基)-1-羧基戊-1- 铵氯化物(TU3000-010)的合成

除了使用相应的酸代替4-乙酰基苯甲酸,用在TU3000-004中使用的 相同方法制备(S)-5-(5-乙酰基噻吩-2-甲酰氨基)-1-羧基戊-1-铵氯化物 (TU3000-006)、(S)-5-(3-乙酰基苯甲酰氨基)-1-羧基戊-1-铵氯化物 (TU3000-008)、和(S)-5-(4-乙酰基-1-甲基-1H-吡咯-2-甲酰氨基)-1-羧基戊-1- 铵氯化物(TU3000-010)。对于TU3000-006、TU3000-008和TU3000-010, 所使用的酸分别是4-乙酰基-1-甲基-1H-吡咯-2-甲酸、5-乙酰基噻吩-2-甲酸 和3-乙酰基苯甲酸。TU3000-006:MS(ESI+):m/z 293.20(MH+); TU3000-008:MS(ESI+):m/z 299.10(MH+);以及TU3000-010:MS(ESI+): m/z 296.20(MH+)。

实施例33-4:(S)-2-氨基-6-(3-氧代环丁烷甲酰氨基)己酸(TU3205-030)的合 成。

将碘甲烷(2.0mL)、K2CO3(5.60g)、(S)-6-(苄基氧羰基氨基)-2-(叔丁氧 羰基氨基)己酸(1)(NovaBiochem,A29340)和无水DMF(20mL)混合,并在 环境温度下搅拌2小时。使反应混合物经历含水后处理,获得为澄清油状 物的(S)-6-(苄基氧羰基氨基)-2-(叔丁氧羰基氨基)己酸甲酯(TU3000-090)。 MS(ESI+):计算值:417.20,实测值:417.20(MNa+),计算值:295.16, 实测值:295.209((M-Boc)H+)。H-NMR(400MHz,CDCl3):1.372(2H,m), 1.425(9H,s),1.515(2H,m),1.623(1H,m),1.785(1H,br.s),3.175(2H,m), 3.723(3H,s),4.284(1H,m),4.848(1H,br.s),5.084(3H,重叠的br.s和s), 7.344(5H,m)。C-NMR(100MHz,CDCl3):22.340,28.268,29.307,32.313, 40.569,52.272,53.099,66.597,79.897,128.061,128.100,128.471,136.519, 155.435,156.426,173.230。

在环境温度和1个大气压氢气下,通过在活性碳上的5%钯(1.08g), 使(S)-6-(苄基氧羰基氨基)-2-(叔丁氧羰基氨基)己酸甲酯(8.60g)在150mL MeOH中氢化3小时。通过已用MeOH洗过的硅藻土垫层进行真空过滤, 除去用过的催化剂。在减压下浓缩合并的滤液和洗涤液,从而获得为澄清 粘稠油状物的(S)-6-氨基-2-(叔丁氧羰基氨基)己酸甲酯(TU3000-128)。MS (ESI+):计算值:261.17,实测值:261.20(MH+)。H-NMR(600MHz, CDCl3):1.328(2H,m),1.375(9H,s),1.390(2H,m),1.55(1H,m),1.74(1H, m),2.623(2H,d,J=6.9Hz),3.671(3H,s),4.237(1H,m),5.007(1H,m)。

制备并使用在20mL DMF中的(S)-6-氨基-2-(叔丁氧羰基氨基)己酸甲 酯的1M储备溶液。在40mL玻璃瓶中混合(S)-6-氨基-2-(叔丁氧羰基氨基) 己酸甲酯储备溶液的2mL等分试样、3-氧代环丁烷甲酸(2)(Parkway *BX-102,283mg)、HATU(800mg)、DIEA(1.0mL)和8mL DMF,并在环 境温度下搅拌过夜。LC-MS分析显示完全反应。反应混合物用EtOAc稀 释,连续用水、饱和NaCl水溶液洗涤,用MgSO4干燥,过滤并在减压下 浓缩。通过硅胶快速色谱(己烷/EtOAc)纯化粗产物,从而获得为澄清粘稠 油状物的(S)-2-(叔丁氧羰基氨基)-6-(3-氧代环丁烷甲酰氨基)己酸甲酯 (TU3000-140)。MS(ESI+):计算值:379.18,实测值:379.20(MNa+),计 算值:257.15,实测值:257.20((M-Boc)H+)。H-NMR(400MHz, DMSO-d6):1.245(4H,m),1.371(9H,s),1.579(2H,m),3.065(3H,m),3.135 (4H,m),3.608(3H,s),3.895(1H,m),7.209(1h,d,J=8.0Hz),8.123(1H,t, J=5.4Hz).C-NMR(100MHz,DMSO-d6):22.850,27.185,28.111,28.551, 30.209,38.276,50.859,51.639,53.412,53.529,78.137,155.507,172.992, 173.167,205.576。

在环境温度下用20mL在1,4-二烷中的4M HCl处理(S)-2-(叔丁氧 羰基氨基)-6-(3-氧代环丁烷甲酰氨基)己酸甲酯(0.501g)20分钟,然后在减 压下除去溶剂。将得到的粘稠油状物置于10mL CH3CN中,并用以较小规 模制备的少量标题化合物晶体进行播种。得到的晶体通过真空过滤收集, 用CH3CN洗涤,并在减压下干燥,获得为无色固体的(S)-2-氨基-6-(3-氧代 环丁烷甲酰氨基)己酸甲酯(TU3205-016)。MS(ESI+):计算值:257.15,实 测值:257.20(MH+)。H-NMR(400MHz,DMSO-d6):1.267(1H,m),1.419 (3H,m),1.753(2H,m),3.114(7H,m),3.752(3H,m),4.023(1H,t,J= 6.4Hz),8.169(1H,t,J=5.5Hz),8.365(3H,br.s).C-NMR(100MHz, DMSO-d6):21.499,27.160,28.390,29.548,38.067,50.858,51.721,52.727, 169.949,173.034,205.586。

将(S)-2-氨基-6-(3-氧代环丁烷甲酰氨基)己酸甲酯(0.297g)和18mL H2O置于40mL玻璃瓶中。向得到的澄清溶液中加入2.2mL 1N NH4OH, 然后将所述反应物在环境温度下摇晃22小时,此时LCMS分析揭示完全 反应。将反应混合物冷冻并冻干,获得为无色晶体的(S)-2-氨基-6-(3-氧代 环丁烷甲酰氨基)己酸(TU3205-030)。MS(ESI+):m/z 243.20(MH+)。

实施例34:反应性吡咯赖氨酸中间体的合成

实施例34-1:2-(4-乙酰基-3-氨基苯氧基)乙酸锂(TU3205-042)的合成

在20mL玻璃瓶中混合1-(4-羟基-2-硝基苯基)乙酮(Carbocore,181mg, 1.00mmol)、2-溴代乙酸乙酯(183mg,1.10mmol)、碳酸钾(138mg.1.00 mmol)和DMF(5mL),并在60℃搅拌2小时,此时LC-MS分析显示出干 净完全的反应。所述反应混合物用水稀释并用EtOAc萃取,用饱和NaCl 水溶液洗涤。使用1-(4-羟基-2-硝基苯基)乙酮(0.802g,4.43mmol)、2-溴代 乙酸乙酯(0.813g,4.87mmol)、碳酸钾(0.612g.4.43mmol)和DMF(25 mL)重复所述反应,并用相同的方法进行后处理。将合并的EtOAc萃取物 用无水MgSO4干燥,过滤并在减压下浓缩,获得为暗黄色油状物的2-(4- 乙酰基-3-硝基苯氧基)乙酸乙酯(TU3205-034)。MS(ESI+):计算值: 268.07,实测值:268.10(MH+)。H-NMR(400MHz,CDCl3):1.317(3H, t,J=7.2Hz),2.512(3H,s),4.294(2H,q,J=7.2Hz),4.722(2H,s),7.192(1H, dd,J=8.4Hz,2.4Hz),7.455(1H,d,J=8.4Hz),7.462(1H,d,J=2.8Hz)。 C-NMR(100MHz,CDCl3):14.133,29.695,61.922,65.499,110.105, 119.735,129.461,130.154,147.793,159.356,167.474,198.352。

在环境温度和大气压的H2下,使用在炭上的10%钯(11mg)氢化在 MeOH(5mL)中的2-(4-乙酰基-3-硝基苯氧基)乙酸乙酯(TU3205-034) (111mg)。30分钟后,LC-MS分析揭示干净完全的反应。使用TU3205-034 (1.45g)、在炭上的10%钯(140mg)和MeOH(80mL)重复所述反应。合并 两份反应混合物,并通过硅藻土垫层过滤除去用过的催化剂。在减压下浓 缩滤液,获得为暗黄色油状物的2-(4-乙酰基-3-氨基苯氧基)乙酸乙酯 (TU3205-036)。MS(ESI+):计算值:238.10,实测值:238.10(MH+)。 H-NMR(400MHz,CDCl3):1.295(3H,t,J=7.0Hz),2.507(3H,s),4.269 (2H,q,J=7.2Hz),4.603(2H,s),6.047(1H,d,J=2.8Hz),6.236(1H,dd, J=8.8Hz,2.8Hz),6.396(2H,br.s),7.647(1H,d,J=9.2Hz).C-NMR(100 MHz,CDCl3):14.135,27.658,61.532,64.939,100.237,104.030,113.586, 134.286,152.468,162.294,168.310,199.055。

将2-(4-乙酰基-3-氨基苯氧基)乙酸乙酯(TU3205-036)(1.02g)溶解于 THF(17mL)中,并用LiOH水溶液(1M,4.3mL)在环境温度下处理1小 时。LC-MS分析显示出干净完全的反应。将反应混合物在减压下浓缩,获 得为淡黄色固体的2-(4-乙酰基-3-氨基苯氧基)乙酸锂(TU3205-042)。MS (ESI+):对游离酸的计算值:210.10,实测值:210.10(MH+)。

实施例34-2:2-(3-氨基-4-甲酰基苯氧基)乙酸锂(TU3627-018)的合成。

在冰浴冷却下,向在500mL圆底烧瓶中的4-甲氧基-2-硝基苯甲醛 (CarboCore,CO-0119,5.5g)和200mL DCM中逐滴加入三溴化硼(24g)。 在相同的温度下搅拌所述反应物30分钟,然后在环境温度下搅拌3小时。 将反应混合物小心地倾入冰水中,并使其处于环境温度中3天。将所述含 水混合物用EtOAc萃取,用饱和NaCl水溶液洗涤,用Na2SO4干燥,过 滤并在减压下浓缩。通过SiO2胶快速色谱(使用在己烷中的20-60%EtOAc 的线性梯度)纯化粗产品(Rf.0.32,在己烷中的50%EtOAc),获得为橘黄 色晶体的TU3627-002。MS(ESI+):计算值:168.02,实测值:168.10 (MH+)。H-NMR(400MHz,DMSO-d6):7.211(1H,dd,J=2.4,8.4Hz), 7.362(1H,d,J=2.4Hz),7.866(1H,d,8.8Hz),9.998(1H,s),11.466(1H,s). C-NMR(100MHz,DMSO-d6):δ110.726,119.683,120.770,132.616, 151.225,162.650,187.885。

将TU3627-002(1.87g)、溴代乙酸乙酯(Aldrich,1.5mL)、碳酸钾 (2.32g)和DMF混合,并在环境温度下搅拌18小时。使反应混合物在EtOAc 和水之间分配。分离有机层,用饱和NaCl水溶液洗涤,用MgSO4干燥, 过滤并在减压下浓缩。通过SiO2快速色谱纯化粗产品,使用在己烷中的 5-35%EtOAc的线性梯度(Rf.0.32,在己烷中的35%EtOAc),获得为暗黄 色油状物的TU3627-008。MS(ESI+):计算值:254.1,实测值:254.1 (MH+)。H-NMR(400MHz,CDCl3):1.304(3H,t,J=7.0Hz),4.285(2H,q, J=7.2Hz),4.767(2H,s),7.233(1H,dd,2.0,8.4Hz),7.522(1H,d,J=2.4Hz), 7.967(1H,8.4Hz),10.286(1H,s).C-NMR(100MHz,CDCl3):14.082, 61.971,65.482,69.302,110.427,119.520,124.321,131.525,151.286,161.66, 167.172,186.841。

用Merlic(C.A.Merlic等,J.Org.Chem.,1995,60,3365-69)所述的方法 还原TU3627-008。具体地,将TU3627-008(1.717g)、铁粉(3.79g)、EtOH (45mL)、H2O(11mL)和浓HCl(180μL)混合,并回流加热2小时。过滤所 述反应混合物,并浓缩滤液。通过硅胶快速色谱,使用5-60%溶剂B在溶 剂A中的线性梯度(溶剂A:5%NEt3在己烷中;溶剂B:5%NEt3在EtOAc 中)纯化残留物(Rf.0.34,在己烷中的35%EtOAc),获得为淡黄色晶体的 TU3627-014。MS(ESI+):计算值:224.10,实测值:224.10(MH+)。 H-NMR(400MHz,DMSO-d6):δ1.216(3h,t,J=7.2Hz),4.173(2H,q, 7.2Hz),4.777(2H,s),6.168(1H,d,J=2.4Hz),6.248(1H,dd,J=2.4,8.8Hz), 7.183(2H,br.s),7.441(1H,d,J=8.4hz)、9.646(1H,s)。C-NMR(100MHz, DMSO-d6):δ13.976,60.711,64.354,98.521,103.988,113.256,137.699, 152.665,162.849,168.176,191.670。

在环境温度下用1M LiOH水溶液的2.72mL等分试样处理在5mL THF中的TU3627-014(0.608g)。20分钟后,LC-MS分析揭示完全反应。 在减压下将反应混合物至浓缩干,获得为黄色固体的2-(3-氨基-4-甲酰基苯 氧基)乙酸锂(TU3627-018)。MS(ESI+):m/z 196.1(MH+)。H-NMR (400MHz,DMSO-d6):4.132(2H,s),6.110(1H,d,J=2.0Hz),6.145(1H,dd, J=2.0,8.8Hz),7.155(2H,br.s),7.33(1H,d,J=8.8hz),9.576(1H,s)。 C-NMR(100MHz,DMSO-d6):67.675,98.354,105.031,112.386,137.042, 152.914,164.589,169.349,191.056。

实施例34-3:4-(3-乙酰基-4-氨基苯氧基)丁酸锂(TU3627-064)的合成。

在微波辐射下,将4’-氯-2’-硝基苯乙酮(Bionet cat#3W0333,1.00g)、 乙酸钾(4.91g)和DMSO的混合物在170℃下加热20分钟。使反应混合物 在EtOAc和水之间分配。分离有机层,用饱和NaCl水溶液洗涤,用Na2SO4干燥,过滤并在减压下浓缩。以相同的方式实施另一反应,并合并来自两 个反应的粗产品以通过硅胶快速色谱(EtOAc)进行纯化。获得为橘黄色固 体的标题化合物。MS(ESI+):计算值:182.15,实测值:182.10(MH+)。 H-NMR(400MHz,DMSO-d6):δ2.474(3H,s),6.837(1H,d,J=2.4Hz), 6.973(1H,dd,J=2.4,8.8Hz),8.078(1H,d,J=8.8Hz),11.307(1H,s)。 C-NMR(100MHz,DMSO-d6):δ30.155,113.264,116.446,127.386,136.211, 140.986,163.417,200.099。

将4’-羟基-2’-硝基苯乙酮(1.12g)、4-溴代丁酸乙酯(1.33g)、碳酸钾 (0.94g)和4.mL DMF的混合物在60℃搅拌6.5小时。使所述反应混合物在 EtOAc和水之间分配。分离有机层,用饱和NaCl水溶液洗涤,用Na2SO4干燥,过滤并在减压下浓缩。通过硅胶快速色谱(己烷/EtOAc)纯化粗产物, 获得为黄色晶体的1标题化合物。MS(ESI+):计算值:296.11,实测值: 296.20(MH+)。H-NMR(400MHz,CDCl3:δ1.255(3H,t,J=7.2Hz), 2.141(2H,五重峰,J=6.6Hz),2.506(2H,t,J=7.2Hz),2.512(3H,s),4.116 (2H,t,J=6.0Hz),4.143(2H,q,J=7.2Hz),6.757(1H,d,J=2.8Hz),6.973(1H, dd,J=2.8,9.2Hz),8.125(1H,d,J=8.8Hz).C-NMR(100MHz,CDCl3):δ 14.182,24.136,30.282,30.360,60.616,67.907,112.305,115.150,127.023, 138.036,141.205,163.580,172.730,200.054。

如本文中所述,通过Merlic(C.A.Merlic等,J.Org.Chem.,1995,60, 3365-69)描述的方法还原TU633-148(1.48g)。使用5-60%溶剂B在溶剂A 中的线性梯度(溶剂A:在己烷中的5%NEt3;溶剂B:在EtOAc中的5% NEt3),通过硅胶快速色谱得到淡黄色油状物的TU3627-056。MS(ESI+): 计算值:266.13,实测值:266.20(MH+)。H-NMR(400MHz,CDCl3): δ1.258(3H,t,J=7.2Hz),2.085(2H,五重峰,J=6.8Hz),2.512(2H,t,J= 7.2Hz),2.556(3H,s),3.955(2H,t,J=6.0Hz),4.146(2H,q,J=7.2Hz0,6.066 (2H,br.s),6.63291H,d,J=8.8Hz),6.954(1H,dd,J=2.8,8.8Hz),7.186(1H, d,J=2.8Hz)。C-NMR(400MHz,CDCl3):δ14.218,24.688,27.990,30.729, 60.434,67.790,115.933,118299,118.621,123.550,144.593,149.271,173.213, 200.283。

在环境温度下用1M LiOH水溶液的1.9mL等分试样处理在3mLTHF 中的TU3627-056(0.50g)18小时。LC-MS分析揭示了干净完全的反应。在 减压下将反应混合物浓缩至干,获得为黄色固体的4-(3-乙酰基-4-氨基苯氧 基)丁酸锂(TU3627-064)。MS(ESI+):m/z 238.10(MH+)。H-NMR (400MHz,DMSO-d6):1.823(2H,五重峰,J=6.8Hz),2.008(2H,t,J= 6.8Hz),2.489(3H,s),3.871,(2H,t,J=6.8Hz),6.694(1H,d,9.2Hz),6.808 (2H,s),6.962(1H,dd,J=2.8,8.8Hz),7.177(1h,d,J=2.8Hz)。C-NMR (100MHz,DMSO-d6):26.079,28.014,34.164,68.394,114.896,116.388, 118.059,123.861,145.529,147.995,176.119,199.756。

实施例34-4:4-(3-氨基-4-甲酰基苯氧基)丁酸锂(TU3627-074)的合成。

在环境温度下将2-硝基-4-羟基苯甲醛(2.85g)、4-溴代丁酸乙酯(3.66g)、 碳酸钾(2.84g)和DMF(20mL)的混合物搅拌50小时。使所述反应混合物 在H2O和EtOAc之间分配。分离有机层,并用饱和NaHCO3水溶液洗涤。 将合并的水层用EtOAc萃取。合并的有机层用稀柠檬酸、饱和NaCl水溶 液洗涤,用MgSO4干燥,过滤并浓缩。通过硅胶快速色谱,使用在己烷中 的20-40%EtOAc的线性梯度纯化所述残留物(Rf:0.35,在己烷中的35% EtOAc),获得为黄色油状物的标题化合物。MS(ESI+):计算值:282.09, 实测值:282.10(MH+)。H-NMR(400MHz,CDCl3):δ1.261(3H,t,J= 7.2Hz),2.170(2H,五重峰,J=6.8Hz),2.528(2H,t,J=7.2Hz),4.153(2H,d, J=7.2Hz),4.167(2H,t,6.4Hz),7.217(1H,dd,J=2.4,8.4Hz),7.498(1h,d, J=2.4Hz),7.964(1H,d,J=8.8Hz),10.277(1H,s)。C-NMR(100MHz, CDCl3):δ14.190,24.112,27.712,30.291,32.443,32.771,60.648,68.075, 110.024,119.397,123.405,131.455,151.572,162.916,172.710,186.943。

如本文中所述,通过Merlic(C.A.Merlic等,J.Org.em.,1995,60, 3365-69)描述的方法还原TU3627-062(3.89g)。使用在溶剂A中的20-60% 溶剂B(溶剂A:在己烷中的5%NEt3;溶剂B:在EtOAc中的5%NEt3)的 线性梯度,通过硅胶快速色谱纯化后得到为黄色固体的TU3627-066(Rf: 0.51,在己烷中的50%EtOAc)。MS(ESI+):计算值:252.12,实测值: 252.20(MH+)。H-NMR(400MHz,DMSO-d6):δ1.177(3H,t,J=7.2Hz), 1.962(2H,五重峰,J=6.8hz),2.441(2H,t,J=7.2Hz),3.979(2h,t,J= 6.4Hz),4.064(2H,q,J=7.2Hz),6.206(1H,s),6.219(1H,d,J=8.8Hz),7.411 (1H,d,J=8.8Hz),9.623(1H,s)。C-NMR(100MHz,DMSO-d6):δ14.041, 24.028,30.002,59.837,66.459,98.075,104.394,112.822,137.558,152.871, 163.809,172.404,191.535。

在环境温度下用3.98mL的1M LiOH水溶液将在6mL THF中的 TU3627-066(1.00g)处理4小时。在减压下除去大部分溶剂,将得到的混 浊混合物用双去离子水稀释,冷冻并冻干,获得为暗黄色固体的4-(3-氨基 -4-甲酰基苯氧基)丁酸锂(TU3627-074)。MS(ESI+):m/z 224.20(MH+)。 H-NMR(400MHz,DMSO-d6):1.852(2H,五重峰,J=6.8Hz),2.040(2H,t, 6.8Hz),3.949(2H,t,J=6.8Hz),6.191(1H,dd,2.4,8.8Hz),6.239(1H,d,J= 2.4Hz),7.208(2H,br.s),7.367(1H,d,J=8.8Hz),9.597(1H,s)。C-NMR (100MHz,DMSO-d6):25.624,33.706,67.799,97.997,104.677,112.589, 137.427,153.003,164.195,176.575,191.394。

实施例34-5:3-(3-乙酰基-4-氨基苯基)丙酸锂(X3547-1)的合成。

向在压力管中的在无水DMF(10mL)中的1-(2-氨基-5-溴苯基)乙酮 (642mg)、Pd(OAc)2(33.7mg)、和P(邻甲苯基)3(137mg)的混合物中加入丙 烯酸甲酯(351μL)和TEA(1.4mL)。用N2吹洗所述混合物3分钟,然后密 封并在110℃加热4小时。将所述反应混合物冷却至环境温度,然后在乙 酸乙酯和水之间分配。用乙酸乙酯萃取水层一次,并且用盐水洗涤合并的 有机层,干燥(Na2SO4),过滤,在真空中除去溶剂。通过硅胶快速色谱 (EtOAc/己烷)纯化粗残留物,获得产物。1H NMR(400MHz,MeOD):δ 7.96(d,J=2.0Hz,1H),7.63(d,J=16.0Hz,1H),6.67(dd,J=8.8Hz,J’ =2.0Hz,1H),6.77(d,J=8.8Hz,1H),6.29(d,J=16.0Hz,1H),3.76(s, 3H),2.59(s,3H);MS-ESI+220.24(MH+)。

在室温下用氢气球和在MeOH中的5%Pd/C(21.9mg)还原(E)-3-(3- 乙酰基-4-氨基苯基)丙烯酸甲酯(219mg),过滤和浓缩后获得产物(定量的)。 将所述产物用于下一步骤而无需进一步纯化。1H NMR(400MHz,MeOD): δ7.59(d,J=2.0Hz,1H),7.13(dd,J=8.4Hz,J’=2.0Hz,1H),6.67(d,J =8.4Hz,1H),3.64(s,3H),2.81(dd,J=7.6Hz,J’=7.6Hz,2H),2.60(dd,J =7.6Hz,J’=7.6Hz,2H),2.54(s,3H);MS-ESI+222.25(MH+)。

将3-(3-乙酰基-4-氨基苯基)丙酸甲酯(221mg)和4M LiOH(0.275mL) 加入3mL THF/水(v/v=3/1)中。反应完成后在减压下除去溶剂,获得3-(3- 乙酰基-4-氨基苯基)丙酸锂(X3547-1)。1H NMR(400MHz,MeOD):δ7.62 (d,J=2.0Hz,1H),7.17(dd,J=8.4Hz,J’=2.0Hz,1H),6.67(d,J=8.4 Hz,1H),2.80(dd,J=7.6Hz,J’=9.0Hz,2H),2.55(s,3H),2.41(dd,J=7.6 Hz,J’=9.0Hz,2H);MS-ESI+207.22(MH+)。

实施例34-6:3-(4-乙酰基-3-氨基苯基)丙酸锂(X3547-8)的合成。

在搅拌下向含4-溴-3-硝基苯甲醛(1.150g)的CH3CN溶液(10mL)中加 入溶解于CH3CN(15mL)中的三苯基正膦基乙酸乙酯(ethyl  triphenylphosphoranylidine acetate)(1.742g)的溶液。使反应混合物回流过 夜。混合物冷却之后,在减压下除去溶剂,获得粗固体。通过硅胶快速柱 色谱(己烷/EtOAc,9∶1)后获得为白色固体的纯产物X3471-146。

在N2下在Schlenk管中,将来自上述步骤的产物X3471-146(632mg) 和PdCl2(PPh3)2(148mg)溶于DMF(5.0mL)中。在搅拌下加入三丁基(1-乙 氧基乙烯基)锡烷(711μL),在100℃下加热所述混合物过夜。所述混合 物冷却后,在减压下除去溶剂,用DCM稀释,用水和盐水洗涤。除去DCM 后,通过硅胶快速柱色谱(15%-25%EtOAc在己烷中)纯化残留物以获得 化合物X3471-154。

在室温下用20mL 1N HCl处理化合物X3471-154A 4小时。除去溶剂 后获得(E)-3-(4-乙酰基-3-硝基苯基)丙烯酸乙酯X3471-154B。1H NMR (400MHz,MeOD):δ8.31(d,J=1.6Hz,1H),8.04(dd,J’=1.6Hz,J”=8.0 Hz,1H),7.76(d,J=16.0Hz,1H),7.67(d,J=8.0Hz,1H),6.74(d,J=16.0 Hz,1H),4.27(q,J=7.2Hz,2H),2.57(s,3H),1.34(t,J=7.2Hz,3H); ESI-MS(m/z)264.07(MH+)。

在1个大气压的氢气下,用在5.0mL MeOH中的5%Pd/C(26mg) 将化合物X3471-154B(263mg)还原为3-(4-乙酰基-3-氨基苯基)丙酸乙酯 X3547-2。ESI-MS(m/z)236.30(MH+)。

在室温下用4M LiOH(0.248mL)、THF(3.0mL)和水(1.0mL)的混合 物处理化合物X3547-2。反应完成后,冻干反应混合物,获得3-(4-乙酰基 -3-氨基苯基)丙酸锂(X3547-8)。MS(ESI+):m/z 208.10(MH+)。

实施例34-7:5-(3-氨基-4-甲酰苯基)戊酸锂(X3547-30)的合成。

在室温下搅拌在TEA(5.0mL)中的4-溴-2-硝基苯甲醛(460mg)、 Pd(PPh3)2Cl2(70mg)和CuI(38mg)、戊-4-炔酸甲酯(269mg)的混合物,直 至反应完成。通过硅胶快速色谱(15%EtOAc在己烷中)纯化粗残留物,获 得5-(4-甲酰基-3-硝基苯基)戊-4-炔酸甲酯。ESI-MS m/z 262.23(MH+)。

在室温下,通过在MeOH中的5%Pd/C(53mg)和氢气球还原5-(4-甲 酰基-3-硝基苯基)戊-4-炔酸甲酯(522mg)。过滤后减压下浓缩,获得5-(3- 氨基-4-甲酰基苯基)戊酸甲酯。MS-ESI m/z 236.28(MH+)。

用在8.0mL THF/水(v/v=3/1)中的LiOH(88mg)处理5-(3-氨基-4-甲酰 基苯基)戊酸甲酯(447mg)。反应完成后除去溶剂,获得5-(3-氨基-4-甲酰基 苯基)戊酸锂(X3547-30)。MS(ESI+):222.10(MH+)。H NMR(400MHz, MeOD):δ9.72(s,1H),7.37(d,J=8.0Hz,1H),6.57(s,1H),6.55(d,J= 8.0Hz,1H),2.56(m,2H),2.19(m,2H),1.64(m,4H)。

实施例34-8:3-(4-乙酰基-3-氨基苯基)-2-氨基丙酸(X3179-96)的合成。

用己烷洗涤氢化钠(60%在矿物油中,1.74g),并将其混悬在DMF(12 ml)中。连续加入在DMF(30ml)中的乙酰氨基丙二酸二乙酯(10.4g)和在 DMF(10ml)中的4-(溴甲基)-1-氟-2-硝基苯(10.2g),并在室温下搅拌所述 反应混合物4小时,随后在减压下除去溶剂。通过硅胶快速色谱(在DCM 中的10-20%EtOAc)纯化残留物,获得2-乙酰氨基-2-(4-氟-3-硝基苄基)丙 二酸二乙酯。1H NMR(400MHz,MeOD):δ7.77(d,J=8.4Hz,1H),7.42(s, 1H),6.54(d,J=8.4Hz,1H),4.25(q,J=7.2Hz,4H)、3.65(s,2H),2.03(s, 3H),1.28(t,J=7.2Hz,6H);13C NMR:δ172.95,168.23,157.33,154.72, 138.68,134.19,128.45,119.31,68.64,63.88,38.04,22.31,14.38;ESI-MS (m/z)371.33(MH+)。

向在EtOAc中的2-乙酰氨基-2-(4-氟-3-硝基苄基)丙二酸二乙酯(7.41 g)和硝基乙烷(6.0mL)中加入DBU(9.0mL),并在室温下搅拌所述混合物 16小时。浓缩所述反应混合物并将残留物溶解于甲醇(35mL)中。加入H2O2水溶液(30%,10.2mL)和10%NaHCO3水溶液(10.2mL),并在室温下搅拌 所述混合物16小时。减压下浓缩所述反应混合物。将残留物溶解在EtOAc 中,用1N HCl、盐水洗涤,用MgSO4干燥,过滤并在减压下浓缩。通过 硅胶快速色谱(在DCM中的10-20%EtOAc)纯化残留物,获得2-乙酰氨基 -2-(4-乙酰基-3-硝基苄基)丙二酸二乙酯。1H NMR(400MHz,MeOD):δ 7.73(s,1H),7.55(d,J=8.0Hz,1H),7.47(d,J=8.0Hz,1H),4.25(q,J=7.2 Hz,4H),3.72(s,2H),2.53(s,3H),2.03(s,3H),1.28(t,J=7.2Hz,6H);13C NMR:δ172.99,168.22,153.68,147.48,140.96,137.31,136.82,128.99, 126.79,68.62,63.95,54.01,38.58,22.32,14.36;ESI-MS  (m/z) 395.38(MH+)。

将2-乙酰氨基-2-(4-乙酰基-3-硝基苄基)丙二酸二乙酯(2.0g)溶解于10 mL 37%HCl中,在100℃加热过夜,并冷却。通过过滤收集得到的固体, 获得3-(4-乙酰基-3-硝基苯基)-2-氨基丙酸。1H NMR(400MHz,D2O):δ 8.01(s,1H),7.53(d,J=7.6Hz,1H),7.50(d,J=7.6Hz,1H),4.07(m,1H), 3.20-3.34(m,2H),2.52(s,3H);13C NMR:δ201.39,170.78,174.89, 140.02,137.84,136.28,129.59,126.46,54.46,36.56,30.01;ESI-MS(m/z) 253.22(MH+)。

在1个大气压的H2下,在MeOH中,用5%Pd炭还原3-(4-乙酰基-3- 硝基苯基)-2-氨基丙酸。过滤后在减压下浓缩,获得3-(4-乙酰基-3-氨基苯 基)-2-氨基丙酸(X3179-96)。MS(ESI+):m/z 223.22(MH+)。1H NMR (400MHz,MeOD):δ7.78(d,J=8.4Hz,1H),6.66(s,1H),6.54(d,J= 8.4Hz,1H),4.25(dd,J’=8.4Hz,J”=5.2Hz,1H),3.23(dd,J’=14.4Hz, J”=5.2Hz,1H),3.02(dd,J’=14.4Hz,J”=8.4Hz,1H),2.54(s,3H);13C NMR:δ202.14,171.20,152.93,142.51,134.40,118.78,118.23,116.91, 54.63,37.42,27.90。

实施例34-9:1-(2-氨基-5-溴苯基)乙酮(X1436-132)的合成。

将装有1-(2-氨基苯基)乙酮(135mg)和DCM(2.5mL)的烧瓶冷却至 -10℃,并在30分钟内分成若干份加入NBS(178mg)。用10mL DCM稀 释反应混合物,用饱和NaHCO3水溶液洗涤,Na2SO4干燥,过滤并在减 压下浓缩,获得标题化合物。MS(ESI+):m/z 215.06(MH+)。1H NMR (400MHz,CDCl3):δ7.79(s,1H),7.31(d,J=8.8Hz,1H),6.54(d,J=8.8 Hz,1H),6.30(br,2H),2.55(s,3H)。

实施例34-10:1-(2-氨基-5-碘苯基)乙酮(X1436-134)的合成。

将装有1-(2-氨基苯基)乙酮(405mg)和DCM(20mL)的烧瓶在冰/水浴 中冷却,并将NIS(675mg)分成三份加入。在0℃下搅拌所述反应。用30mL DCM稀释反应混合物,用饱和NaHCO3水溶液洗涤,Na2SO4干燥,过滤 并在减压下浓缩。通过制备RP-HPLC纯化粗产物,获得标题化合物。MS (ESI+):m/z 262.06(MH+)。1H NMR(400MHz,CDCl3):δ7.94(s,1H), 7.44(d,J=8.8Hz,1H),6.43(d,J=8.8Hz,1H),6.32(br,2H),2.53(s, 3H)。

实施例34-11:2-氨基-4-溴苯甲醛(X3547-158)的合成。

将铁粉(1.20g)、水(2.0mL)和HCl(12N,40μL)连续加入到2-硝基苯 甲醛(230mg)的乙醇(8.0mL)溶液中。在95℃搅拌90分钟后,趁热过滤 反应混合物。用乙醇洗涤后,合并滤液,并在真空中除去溶剂。通过硅胶 快速色谱(40∶55∶5己烷/乙酸乙酯/三乙胺)纯化粗产物,获得为黄色晶体的 2-氨基-4-溴苯甲醛。MS(ESI+):m/z 199.96(MH+)。1H NMR(400MHz, MeOD):δ9.77(s,1H),7.40(d,J=8.4Hz,1H),6.95(d,J=1.6Hz,1H), 6.78(dd,J=8.4Hz,J’=1.6Hz,1H)。

实施例35:PCL和吡咯赖氨酸生物合成前体的合成

实施例35-1:DL-1-吡咯啉-5-甲酸铵(3793-007)的合成。

将H-DL-δ-DL-羟基Lys-OH的HCl盐(118mg,0.5mmol)施加至阳离子 交换SPE柱,并用氢氧化铵洗脱氨基酸。将NaIO4(107mg)加入铵洗脱物中, 并在室温下将所述反应混合物搅拌30分钟。冻干反应混合物,用HCl将粗 产物酸化至pH 2.6,并用阳离子交换SPE纯化。弃去最初的10mL H2O洗脱 液,收集接下来的30ml H2O洗脱液,并立即用1N NH4OH(水溶液)(0.5mL)中 和。冻干之后,获得为淡黄色粉末的所需产物。对于C5H7NO2,ESI-MS 计算值[MH]+:114.1;观察到的值:114.1。

实施例35-2:H-L-Lys-Nε-(D-Orn)-OH(3793-031)的合成。

用在DMF(5mL)中的HATU(1.255g)和DIEA(1.53mL)将 Boc-D-Orn(Boc)-OH(1.097g)处理1小时。然后向所述反应混合物中加入 Boc-Lys-OMe(乙酸盐,1.057g)和DIEA(627μL)的DMF溶液(5mL),并在 室温下搅拌所述反应2小时。将所述反应混合物在10%NaCl(水溶液)(30mL) 和EtOAc(60mL)之间分配。用5%柠檬酸(30mL)、10%NaHCO3(水溶液)(30 mL)和盐水(30mL)洗涤EtOAc层。将EtOAc层用Na2SO4(s)干燥,过滤并在 减压下浓缩。通过硅胶快速柱色谱用80g硅胶柱和0-15%MeOH/DCM的梯 度洗脱纯化残留物,获得为无色油状物的Boc-Lys(Boc-D-Orn(Boc))-OMe (3793-026)。1H NMR(400MHz,CDCl3):6.54(br s,1H),5.17(br,2H),4.76 (br s,1H),4.24(四重峰,J=6.7Hz,2H),3.72(s,3H),3.34-3.02(m,4H), 1.83-1.30(m,37H)。13C NMR(100MHz,CDCl3):173.2,172.3,156.6,155.8, 155.5,79.8,79.2,53.3,53.0,52.3,39.2,38.8,32.0,30.4,29.1,28.4,28.3,26.4, 22.5.对于C27H50N4O9,ESI-MS[MH]+计算值:575.4;观察值:575.4。

向Boc-Lys(Boc-D-Orn(Boc))-OMe(214mg)的65%乙腈水溶液(5mL) 中加入浓HCl(1mL),并剧烈搅拌所述反应混合物2小时。将所述反应混 合物冻干,并使用SCX SPE柱,用在20%MeCN(水溶液)中的1N NH4OH, 通过阳离子交换色谱纯化。使甲酯在NH4OH洗脱物中水解过夜。冻干之 后,获得为白色粉末的H-L-Lys-Nε-(D-Orn)-OH(3793-031)。1H NMR(400 MHz,D2O):3.33-3.30(m,2H),3.29-3.22(m,1H),3.20-3.12(m,1H),2.86(t, J=7.0Hz,2H),1.65-1.48(m,8H)、1.36-1.25(m,2H)。13C NMR(100MHz, D2O):181.5,176.9,55.5,54.3,39.4,38.9,33.2,31.4,28.1,24.5,22.1. ESI-MS:C11H24N4O3[MH]+计算值:261.2;观察值:261.2。

实施例35-3:N-((6-氯吡啶-3-基)甲基)-1-吡咯啉-5甲酰胺(3647-061)的合 成。

向在1N NaOH(水溶液)(50mL)中的DL-δ-DL-羟基Lys(1.99g)中逐滴加 入在二烷(10mL)中的焦碳酸叔丁酯(6.55g),并且所述反应物在室温下 搅拌过夜。将所述反应混合物用1N HCl(水溶液)酸化至pH 3.0,并用EtOAc (200mL)萃取两次。合并EtOAc层,用Na2SO4(s)干燥,过滤并在减压下浓 缩,获得粗产物。以0-10%MeOH/DCM的梯度洗脱通过硅胶快速柱色谱 纯化所述粗产物,获得为白色固体的Boc-DL-δ-DL-羟基Lys(Boc) (3597-109)。C16H30N2O7[MNa]+的ESI-MS计算值:385.2;观察值:385.2。

用在3.5mL DMF中的HATU(456mg)和DIEA(523μL)将 Boc-DL-δ-DL-羟基Lys(Boc)(435mg)处理1小时。在室温下将得到的溶液 加入到6-氯吡啶-3-基甲基胺(143mg)的1.5mL DMF溶液中,将所述反应 物搅拌2天。用10%NaCl(水溶液)(15mL)和EtOAc(30mL)萃取所述反应混 合物。用5%柠檬酸(15mL)、10%NaHCO3(15mL)和盐水(15mL)洗涤 EtOAc层。然后,将EtOAc层用Na2SO4(s)干燥,过滤并在减压下浓缩, 得到粗产物。用0-15%MeOH/DCM的梯度洗脱,通过硅胶快速柱色谱纯 化粗产物,获得为白色固体的所需产物(3647-016)。C22H35N4O6Cl[MH]+的 ESI-MS计算值:487.2;观察值:487.3。

将来自以上步骤的产物(3647-016)(263mg)在Et2O(7mL)和1N HCl(水溶液)(7mL)的溶液中搅拌过夜。蒸发并冻干所述反应混合物,通过阳离子交 换SPE柱纯化残留物,获得为白色固体的所需产物(3647-037)。 C12H19N4O2Cl[MH]+的ESI-MS计算值:287.1;观察值:287.2。

将来自上面的产物(3647-037)(69.6mg)溶于2mL H2O(2mL)中,并用 1N NaOH(水溶液)调节pH至12。加入PL-IO4树脂(Varian,381mg,0.48mmol) 并在室温下将反应物搅拌2小时。通过过滤除去树脂,一半滤液用制备 HPLC纯化,获得为白色固体的所需产物(3647-061)。C11H12N3OCl[MH]+的ESI-MS计算值:238.1;观察值:238.1。

实施例36:PCL模式化合物的合成

实施例36-1:H-L-Lys-Nε-(DL-1-吡咯啉-5-羰基)-OH(3647-125)的合成。

在DIEA(1068μL)的存在下,用在3.0mL DMF中的HATU(932mg), 将Boc-DL-δ-DL-羟基Lys(Boc)(3597-109)(886mg)活化1小时,并加入到 在3.0mL DMF(3.0mL)中的Boc-Lys-OMe(549mg)中。在室温下将反应物 搅拌36小时。在10%NaCl(水溶液)(30mL)和EtOAc(60mL)之间分配所述 反应混合物。将EtOAc层用5%柠檬酸(15mL)、10%NaHCO3(15mL) 和盐水(15mL)洗涤。用Na2SO4(s)干燥EtOAc层,过滤并在减压下浓缩, 获得粗产物。用0-15%MeOH/DCM通过硅胶快速柱色谱,接着用采用25% 和65%MeCN(水溶液)洗脱的RP-C18SPE纯化所述粗产物,获得为白色固体 的所需产物(3647-099)。对C28H52N4O10的ESI-MS[MH]+计算值:605.4; 观察值:605.4。

向在1mL Et2O中的Boc-Lys(Boc-DL-δ-DL-羟基Lys(Boc))-OMe (3647-099)(84.1mg)中加入4N HCl(水溶液)(3mL),并在室温下将反应物搅拌 3小时。除去溶剂后,获得61.1mg为白色固体的粗产物(3647-120)。 C13H28N4O4的ESI-MS[MH]+计算值:305.2;观察值:305.2。

将来自上面的粗产物(3647-120)(61.1mg)溶解在1mL H2O中,并用 1N NaOH(水溶液)将pH调节至12。在室温下将所述混合物搅拌1小时,导致 甲酯水解。然后向反应混合物中加入NaIO4(29.9mg),并在室温下将反应 物搅拌额外的15分钟。所述反应混合物用1N HCl(水溶液)中和,并上载至阳 离子交换SPE中进行纯化,从而获得H-L-Lys-Nε-(DL-1-吡咯啉-5-羰 基)-OH(3647-125)。C11H19N3O3的ESI-MS[MH]+计算值:242.2;观察值: 242.2。

实施例36-2:H-L-Lys-Nε-(DL-1-吡咯啉-2-羰基)-OH(3793-011)的合成。

根据等(Chirality,2001,13(10),619-624)所述的方法 制备1-吡咯啉-2-甲酸钠(3647-164)。

将三乙胺(8.4mL)加入在醚(27mL)中的H-Pro-OMe HCl(7.512g)中, 并将反应物搅拌2小时。过滤所述反应混合物,并通过蒸发除去Et2O。通 过真空蒸馏纯化残留物,获得4.119g为无色油状物的H-Pro-OMe。将 t-BuOCl(3.59mL)逐滴加入到H-Pro-OMe(4.089g)的Et2O(100mL)溶液 中,并在-50℃将反应物搅拌1小时。使所述反应混合物升温至室温,并将 三乙胺(4.64mL)加入所述反应混合物中,随后搅拌3天。过滤所述反应混 合物,并在减压下浓缩。通过真空蒸馏纯化所述残留物以获得为无色油状 物的吡咯啉-2-甲酸甲酯(3647-154)。对C6H9NO2的ESI-MS[MH]+计算 值:128.1;观察值:128.2。1H NMR(400MHz,CDCl3):4.09(tt,J=7.6Hz, 2.5Hz,2H),3.85(s,3H),2.81(tt,J=8.2Hz,2.8Hz,2H),1.97(五重峰,J=8.0 Hz,2H)。13C NMR(100MHz,CDCl3):168.2,163.1,62.5,52.5,35.2,22.1. C5H7NO2的ESI-MS[MH]+计算值:114.1;观察值:114.2。1H NMR(400 MHz,D2O):3.84(tt,J=7.4Hz,2.5Hz,2H),2.73(tt,J=8.2Hz,2.6Hz,2H), 1.92(五重峰,J=7.8Hz,2H)。13C NMR(100MHz,D2O):175.5,171.8,60.1, 35.6,21.8。C5H7NO2ESI-MS计算值[MH]+:114.1;观察值:114.2。1H NMR (400MHz,D2O):3.84(tt,J=7.4Hz,2.5Hz,2H),2.73(tt,J=8.2Hz,2.6Hz, 2H),1.92(五重峰,J=7.8Hz,2H)。13C NMR(100MHz,D2O):175.5,171.8, 60.1,35.6,21.8。

将吡咯啉-2-甲酸甲酯(2.265g)溶解在1N NaOH(水溶液)(17.8mL)中,并 在室温下搅拌1小时。冻干所述反应混合物以获得为白色粉末的粗吡咯啉 -2-甲酸钠(3647-164)。C5H7NO2的ESI-MS[MH]+计算值:114.1;观察值: 114.2。

向在20mL DMF中的Boc-Lys-OMe(乙酸盐,897mg)和DIEA(1184μL) 中加入1-吡咯啉-2-甲酸钠(459mgl)和DPPA(886μL),在室温下和N2气氛中 将反应物搅拌24小时。在10%NaCl(水溶液)(50mL)和EtOAc(100mL)之间分 配所述反应混合物。将EtOAc层用Na2SO4(s)干燥,过滤并在减压下浓缩, 获得为淡橘黄色油状物的粗产物。通过硅胶快速柱色谱用0-15% MeOH/DCM的梯度洗脱,随后用RP-C18SPE纯化所述粗产物,获得为无 色油状物的所需产物(3647-167)。C17H29N3O5[MH]+的ESI-MS计算值: 356.2;观察值:356.0。1H NMR(400MHz,CDCl3):7.14(s,1H),5.08(d,d=4 Hz),4.27(四重峰,J=5.2Hz,1H),3.99(td,J=7.2Hz,1.6Hz,2H),3.72(d, J=1.6Hz,3H),3.31(四重峰,J=6.9Hz,2H),2.83(td,J=8.3Hz,1.3Hz,2H), 1.97(五重峰,J=8.2Hz,2H),1.88-1.72(m,2H),1.69-1.51(m,2H),1.48-1.33 (m,11H)。13C NMR(100MHz,CDCl3):171.6,162.4,155.4,129.7,79.8, 61.7,53.2,52.3,38.7,34.0,32.2,29.0,28.3,22.6,22.5。

将HCl(浓缩的,1mL)加入到来自上面的产物(3647-167)(49.3mg)的 50%MeCN(水溶液)溶液(5mL)中,并在室温下将反应物搅拌2小时。冻干之 后,通过阳离子交换SPE柱纯化残留物。在洗脱液中用NH4OH(水溶液)水解 甲酯过夜。冻干之后,获得为淡黄色粉末的所需产物(3793-011)。 C11H19N3O3[MH]+的ESI-MS计算值:242.2;观察值:242.2。1H NMR(400 MHz,D2O):3.94(tt,J=7.6Hz,2.5Hz,2H),3.65(t,J=6.2Hz,1H),3.30(t, J=6.8Hz,2H),2.78(tt,J=8.4Hz,2.6Hz,2H),1.97(五重峰,J=7.9Hz,2H), 1.87-1.77(m,2H),1.59(五重峰,J=7.2Hz,2H),1.46-1.34(m,2H)。13C NMR(100MHz,D2O):175.7,172.2,165.1,60.9,54.7,38.9,34.3,30.5,27.9, 21.8,21.7。

实施例37:2-AAP-PEG试剂的合成

下面将描述本文中提供的实施例中使用的不同2-AAP-PEG衍生物的 合成。通过如下方法合成具有约500、2400、23000Da以及5000和10000 Da分子量的PEG的2-氨基-苯乙酮衍生物:

实施例37-1:TU3205-044(0.5kDa 2-AAP-mPEG)的合成

将2-(4-乙酰基-3-氨基苯氧基)乙酸锂(TU3205-042)(55.9mg)装入10 mL圆底烧瓶,并加入DMF(3mL)和HATU(98.9mg)。在环境温度下将 得到的浆状物搅拌40分钟。在此期间,反应物变为黄色溶液。然后向所述 反应中加入在2mL DMF中的mPEG-胺(Quanta Biodesign,MW 383.5, 100mg)。5分钟后,LC-MS分析显示完全反应。将反应混合物额外搅拌 40分钟,并在减压下浓缩。通过SiO2快速色谱(3%MeOH在DCM中)纯 化残留物,获得为黄色粘稠油状物的TU3205-044(0.5kDa 2-AAP-mPEG)。 MS(ESI+):计算值:575.31,实测值:575.30(MH+)。H-NMR(400MHz, CDCl3):2.210(3H,s),3.370(3H,s),3.544(4H,m),3.650(28H,m),4.499 (2H,s),6.172(1H,d,J=2.4Hz),6.243(1H,dd,J=8.8Hz,2.8Hz),6.540(2H, br.s).7.034(1H,br.s),7.649(1H,d,J=8.8Hz)。

实施例37-2:TU3205-048(2.4kDa2-AAP-PEG)的合成

将2-(4-乙酰基-3-氨基苯氧基)乙酸锂(TU3205-042)(12.2mg)装入10 mL圆底烧瓶中,加入DMF(1mL)和HATU(21.5mg)。在环境温度下将得 到的浆状物搅拌35分钟。在此期间,反应变为黄色溶液。然后向所述反应 中加入在2mL DMF中的mPEG-胺(Quanta Biodesign,MW 2209,100 mg)。将反应混合物搅拌18小时,并在减压下浓缩。用SiO2快速色谱(MeOH 在DCM中)纯化残留物,获得为黄色粘稠状油状物的TU3205-048(2.4kDa 2-AAP-mPEG)。MS(ESI+):计算值:800.8,实测值:800.5(M+3H+/3), 计算值:600.9,实测值:600.7(M+4H+/4)。

实施例37-3:TU3205-052(23kDa 2-AAP-PEG)的合成

将2-(4-乙酰基-3-氨基苯氧基)乙酸锂(TU3205-042)(21.5mg)和HATU (38.0mg)装入10mL圆底烧瓶中,并加入DMF(0.5mL)。在环境温度下 将得到的浆状物搅拌50分钟。将得到的黄色溶液加入到在20mL玻璃瓶 中的5mL DMF中的mPEG-NH2(Laysan Bio,平均MW 23k,平均n= 520,0.50g)中。在环境温度下摇晃所述反应2.5小时。然后用10mL水稀 释反应混合物,并将所述溶液的每份2.5mL的等分试样施加至PD-10柱 (GE Healthtech),然后按照供应商的说明用水洗脱所需产物。合并收集的 水溶液,冷冻,并冻干,获得为白色固体的TU3205-052(23kDa 2-AAP-mPEG)。(注:仅在高MW PEG试剂与含PCL的蛋白缀合后才能 获得它们的特性)

使用相应的10,000(平均n=225)和5,000(平均n=111)MW mPEG-NH2,用类似于制备TU3205-052的方法制备(TU633-006)(10kDa 2-AAP-mPEG)和(5kDa 2-AAP-mPEG)。(注:仅在高MW PEG试剂与含PCL的蛋白缀合 后才获得的它们的特性)

实施例37-4:TU633-010:双官能连接体的合成

将2-(4-乙酰基-3-氨基苯氧基)乙酸锂(TU3205-042)(94.6mg)和 HATU(167mg)装入10mL圆底烧瓶中,并加入DMF(2mL)。在环境温度 下将得到的浆状物搅拌45分钟。向所述得到的黄色溶液中加入在1mL DMF中的4,7,10-三氧杂-1,13-十三烷二胺(Fluka,44mg)。在环境温度下 将反应混合物搅拌18小时,并在减压下浓缩。所述残留物通过SiO2快速 色谱(MeOH在DCM中)纯化,接着通过制备反相LC纯化。将经LC纯化 的物质溶于EtOAc中,并用饱和NaHCO3水溶液处理以除去三氟乙酸。 蒸发除去溶剂从而获得为澄清油状物的双官能团连接体TU633-010。MS (ESI+)计算值:603.3,实测值:603.3(MH+)。

实施例37-5:m-PEG-AAP 29k(TU633-084)的合成。

将2-(4-乙酰基-3-氨基苯氧基)乙酸锂(187mg)和HBTU(330mg)置于 20mL玻璃瓶中,并加入10mL干燥的DMF。在环境温度下将得到的浆状 物搅拌。在20分钟内,反应物变为黄色溶液,并在80分钟后将反应混合 物的9.5mL等分试样加入到在100mL圆底烧瓶中且溶解在40mL干燥 DMF中的mPEG-NH2(Laysan Bio,MW28,700)中。在环境温度下摇晃所 述反应物19小时。然后将反应混合物施加至24片PD-10柱(GE Helthtech) 上,并按照供应商的说明用水洗脱所需产物。将合并的洗脱液冷冻并冻干, 获得白色固体。将所述固体溶解于双去离子水中,并使用MWCO 3500透 析膜针对双去离子水进行彻底透析。冷冻并冻干透析的溶液,获得为松散 固体的TU633-084。(注:仅在高MW PEG试剂与含PCL的蛋白缀合后才 能获得它们的特性。)

实施例37-6:mPEG-AAP-30k(TU633-120)的合成

MW:30k

将3-(3-乙酰基-4-氨基苯基)丙酸锂(139mg)和HBTU(247mg)置于 20mL玻璃瓶中,并加入13mL干燥DMF。在环境温度下将得到的浆状物 搅拌30分钟,并且得到的溶液用于TU633-120、TU633-122、TU633-124 和TU633-126的制备。在45mL玻璃瓶中装入mPEG胺(NOF Corp., SUNBRIGHT MEPA-30T MW 30,298,3.0g),并加入20mL干燥DMF, 接着温和加热以溶解在DMF中的mPEG胺。向此得到的mPEG胺溶液中 加入活性酯溶液的2.2mL等分试样,并在环境温度下摇晃所述玻璃瓶18 小时,然后在37℃下摇晃24小时。将反应混合物转移至透析膜管(Fisher  Scientific,cat#21-152-9,MWCO 3500)中,并针对双去离子水彻底透析超 过两天。冷冻并冻干透析的溶液,获得为白色棉花状固体的TU633-120。 (注:仅在高MW PEG试剂与含PCL的蛋白缀合后才能获得它们的特性。)

除了分别使用来自NOF Corp.的SUNBRIGHTMEPA-40T(MW 42036)、SUNBRIGHT GL2-400PA(MW 42348)、SUNBRIGHT GL4-400PA的相应活性PEG代替SUNBRIGHT MEPA-30T之外,用类似的 方法制备MW:42k(TU633-122)、 MW:42k(TU633-124)和 MW:40k(TU633-126)。(注:仅在高MW PEG试剂与含PCL的蛋白缀合后才能获得它们的特性。)

实施例37-7:mPEG-ABA-30kD(TU3627-024)的合成。

MW:30k

除了使用2-(3-氨基-4-甲酰基苯氧基)乙酸锂代替3-(3-乙酰基-4-氨基 苯基)丙酸锂外,通过与制备TU633-120相同的方法制备标题化合物。(注: 仅在高MW PEG试剂与含PCL的蛋白缀合后才能获得它们的特性。)

实施例37-8:mPEG-ABA-30k(TU3627-084)的合成。

MW:30k

除了使用4-(3-氨基-4-甲酰基苯氧基)丁酸锂代替3-(3-乙酰基-4-氨基 苯基)丙酸锂外,通过与制备TU633-120相同的方法制备标题化合物。H NMR分析显示产品中没有未修饰的起始PEG。H-NMR分析显示末端活 性>95%。

实施例37-9:mPEG-ABA-40k(TU3627-086)的合成。

MW:40k

除了使用SUNBRIGHTMEPA-40T代替SUNBRIGHTMEPA-30T 外,通过与制备TU3627-084相同的方法制备标题化合物。H NMR分析显 示产品中没有未修饰的起始PEG。H-NMR分析显示末端活性>95%。

实施例37-10:N1-(18-(3-氨基-4-甲酰基苯氧基)-15-氧代-4,7,10-三氧杂-14- 氨杂十八烷基)-N19-(18-(3-氨基-4-甲酰基苯氧基)-15-氧代 -4,7,10-三氧杂-9,14-二氮杂十八烷基)-4,7,10,13,16-五氧杂十九 烷-1,19-二酰胺(X3678-40)的合成

用在4mL DMF中的HBTU(151.7mg)活化4-(3-氨基-4-甲酰基苯氧 基)丁酸锂(94.5mg)。向所述反应混合物中加入二酰氨基-dPEGTM11-二胺 (QuantaBiodesign,Cat#10361,74.3mg),并在室温下搅拌过夜。加入DIEA (17.5μL,0.1mmol),然后在40℃加热所述混合物数小时。通过制备 RP-HPLC分离标题化合物,并通过PL-HCO3MP SPE柱(Varian Inc.)除 去TFA。MS(ESI+)m/z 1153.60(MH+)。

实施例38:用于将免疫调节剂偶联至蛋白的试剂的合成

实施例38-1:N-(1-(3-氨基-4-甲酰基苯氧基)-2-氧代-7,10,13-三氧杂-3- 氮杂十六烷-16-基)-4-((4-(2-(5-氨基-8-甲基苯并[f][1,7]萘啶-2-基) 乙基)-3-甲基苯氧基)甲基)苯甲酰胺(TU3627-042)的合成

在冰浴中冷却的条件下,向在10mL DCM中的3-(2-(2-(3-氨基丙氧 基)乙氧基)乙氧基)丙基氨基甲酸叔丁酯(QuantaBiodesign,cat#10225, 500mg)和DIEA(348μL)中加入在2mL DCM中的4-氯甲基苯甲酰氯。在 相同的温度下将反应物搅拌1小时。所述反应混合物用EtOAc稀释,连续 用H2O、稀柠檬酸水溶液、NaHCO3水溶液和饱和NaCl水溶液洗涤,用 Na2SO4干燥,过滤并在减压下浓缩,获得为澄清粘稠油状物的产物(A)。 MS (ESI+):计算值:473.2,实测值:473.3(MH+)。H-NMR(400MHz, CDCl3):1.405(9H,s),1.685(2H,m),1.879(2H,m),3.173(2H,m),3.438 (4H,m),3.567(4H,m),3.633(6H,m),4.584(2H,s),4.933(1H,br.s),7.246 (1H,br.s),7.411(2H,d,J=8.4Hz),7.789(2H,d,J=8.4Hz)。C-NMR (100MHz,CDCl3):28.385,28.673,29.553,38.430,39.087,45.447,69.474, 70.042,70.216,70.379,70.516,70.798,78.882,127.430,128.496,134.745, 140.341,155.966,166.550。

混合来自上面的产物A(303mg)、化合物B(200mg)、碳酸铯(208mg) 和无水DMSO,并在环境温度下将反应物搅拌。18小时后,向所述反应中 加入额外的溶解在8mL DMSO中的60mg化合物A和额外的30mg碳酸 铯,并在环境温度下将反应物搅拌40小时,此时LCMS分析显示,仅剩 下痕量的化合物B。所述反应混合物用EtOAc稀释,相继地用H2O、饱和 NaCl水溶液洗涤,用Na2SO4干燥,过滤并在减压下浓缩。使用在A中的 1-5%溶剂B的线性梯度(A:DMC;B:在MeOH中的2%NH3),通过硅 胶快速色谱纯化残留物,获得部分纯化的所需化合物。从MTBE中重结晶 之后,获得为浅黄色晶体的产物。MS(ESI+):计算值:780.43,实测值: 780.50(MH+)。H-NMR(400MHz,DMSO-d6):1.357(9H,s),1.578 (2H,五重峰,J=6.8Hz),1.751(2H,五重峰,J=6.8Hz),2.264(3H,s),2.439 (3H,s),2.94(4H,m),3.08(2H,m),3.34(4H,m),3.45(4H,m),3.50(6H,m), 5.105(2H,s),6.757(1H,dd,J=2.4,8.4Hz),6.77(1H,br.s),6.836(1H,d,J= 2.8Hz),7.060(2H,br.s),7.091(1H,d,J=8.4Hz),7.138(1H,dd,J=2.4, 8.4Hz),7.349(1H,s),7.495(2H,d,J=8.4Hz),7.837(2H,d,J=8.4Hz),8.330 (1H,d,J=8.4Hz),8.439(1H,t,J=5.6Hz),8.701(1H,d,J=2.0Hz),8.827(1H, d,J=1.6Hz)。C-NMR(100MHz,DMSO-d6):19.153,21.206,28.178, 29.297,29.638,33.166,33.336,36.584,37.085,67.989,68.200,68.455,69.495, 69.678,69.703,77.307,111.863,116.456,117.005,122.743,123.321,125.292, 127.047,127.178,127.764,129.725,129.823,131.414,132.600,133.883, 137.040,138.775,139.426,140.303,144.984,149.405,155.471,155.663, 156.341,165.783。

在环境温度下通过用3M HCl甲醇溶液处理,从而除去化合物C的 Boc基团。在减压下浓缩反应混合物,获得作为二盐酸盐的化合物D。MS (ESI+):计算值680.4,实测值680.4(MH+).H-NMR(400MHz, DMSO-d6):1.77(4H,m),2.289(3H,s),2.504(与DMSO-d6信号重叠), 2.85(2H,m),2.98(2H,m),3.14(2H,m),3.31(2H,m),3.5(12H,m),5.109 (2H,s),6.768(1H,dd,J=2.4,8.4Hz),6.852(1H,d,J=2.4Hz),7.107(1H,d, J=2.4Hz),7.427(1H,d,J=8.4Hz0,7.496(2H,d,8.4Hz),7.532(1H,s),7.858 (2H,d,J=8.0Hz),7.89(3H,br.s),8.53(2H,m),8.872(1H,s),9.01(1H,br.s), 9.03(1H,s),9.731(1H,s)。C-NMR(100MHz,DMSO-d6):19.183,21.127, 27.076,29.325,32.793,33.290,36.601,67.251,68.198,68.423,69.389,69.480, 69.587,69.693,111.903,115.654,116.491,117.597,124.065,126.488, 127.058,127.227,129.646,129.818,130.877,131.129,131.841,132.733, 133.850,137.112,140.296,141.702,143.879,151.265,153.598,156.424, 165.789。

将2-(3-氨基-4-甲酰基苯氧基)乙酸锂(20mg)和HBTU(38mg)装入20mL 玻璃瓶中,并加入2mL干燥的DMF。在环境温度下将得到的浆状物搅拌30 分钟,然后加入化合物D(38mg)和DIEA(52μL)。在环境温度下将反应物搅 拌17小时。LCMS分析显示,没有起始原料剩下,但是双酰化的副产物与 所需产物一起形成。反应混合物用EtOAc稀释,连续用H2O和饱和NaCl水 溶液洗涤,用Na2SO4干燥,过滤并在减压下浓缩。将残留物溶取至5mL THF 中,并用1M LiOH水溶液的1mL等分试样在环境温度下处理2小时,此时 LC-MS分析显示,双酰化产物水解为所需产物。将所述反应混合物在 EtOAc和水之间分配,分离有机层,用饱和NaCl水溶液洗涤,用Na2SO4干燥,过滤并在减压下浓缩。将粗产物施加至制备RP-HPLC进行纯化。用 EtOA稀释含有所需产物的HPLC洗脱液,并用饱和NaHCO3水溶液和饱和 NaCl水溶液洗涤以除去三氟乙酸,用Na2SO4干燥,过滤并在减压下浓缩, 获得标题化合物N-(1-(3-氨基-4-甲酰基苯氧基)-2-氧代-7,10,13-三氧杂-3-氮 杂十六烷-16-基)-4-((4-(2-(5-氨基-8-甲基苯并[f][1,7]萘啶-2-基)乙基)-3-甲基 苯氧基)甲基)苯甲酰胺(TU3627-042)。MS(ESI+):m/z 857.40(MH+)。 H-NMR(400MHz,DMSO-d6):1.651(2H,五重峰,J=6.6Hz),1.747(2H, 五重峰,J=6.6Hz),2.264(3H,s),2.443(3H,s),2.96(2H,m),3.08(2H,m), 3.16(3H,m)3.27-3.29(m与H2O信号重叠),3.45(4H,m),3.50(7H,m), 4.451(2H,s),5.102(2H,s),6.198(1H,d,J=2.0Hz),6.268(1H,dd,J=2.0, 8.8Hz),6.755(1H,2.4,8.4Hz),6.836(1H,d,J-2.4Hz),7.095(1H,d,J= 8.4Hz),7.158(1H,d,J=8.0Hz),7.208(2H,br.s),7.362(1H,s),7.43591H,d, J=8.8Hz),7.493(2H,d,J=8.4Hz),7.834(2H,d,J=8.0Hz)8.070(1H,t,J= 5.6Hz),8.349(1H,d,J=8.4Hz),8.440(t,J=5.6Hz),8.711(1H,d,J=1.6Hz), 8.840(1H,d,J=1.6Hz),9.636(1H,s)。

4-(2-(5-氨基-8-甲基苯并[f][1,7]萘啶-2-基)乙基)-3-甲基苯酚(化合物B)的合成

向用隔板盖住的圆底烧瓶中加入1-乙炔基-4-甲氧基-2-甲基苯(可商购) (1.1eq)、3,5-二氯皮考啉腈(1eq.)、三乙胺(5eq.)和无水DMF(0.2M)。 抽真空并用氮气吹洗,进行三次。加入CuI(0.05eq.)和双(三苯基膦)二氯- 钯(II)(0.05eq)。用回流冷凝器替换隔板,并在60℃和氮气气氛下将所述 烧瓶加热过夜。通过TLC监测反应完成后,将烧瓶的内容物加载在用己烷 预处理过的大硅胶柱上。通过快速色谱(硅胶,己烷∶EtOAc(1∶4%))获得 产物3-氯-5-((4-甲氧基-2-甲基苯基)乙炔基)皮考啉腈。

向具有回流冷凝器的圆底烧瓶中加入3-氯-5-((4-甲氧基-2-甲基苯基) 乙炔基)皮考啉腈(来自上一步骤)(1eq.)、2-(4,4,5,5-四甲基-1,3,2-二氧硼杂 环戊-2-基)苯基氨基甲酸叔丁酯(1.25eq.)、K3PO4(2eq.)、三(二亚苄基丙酮) 二钯(0)(0.05eq.)和2-二环己基膦基-2′,6′-二甲氧基联苯(0.1eq.)。加入正 丁醇和水(5∶2,0.2M),然后使内容物脱气(真空之后氮气吹洗)三次。将所 述反应混合物在氮气和在油浴中100℃下剧烈搅拌过夜。冷却所述内容物 并将其溶取入200mL水中,接着用二氯甲烷萃取。干燥(Na2SO4)并浓缩合 并的有机层。快速色谱(硅胶,0-50%EtOAc在CH2Cl2中)获得产物2-((4- 甲氧基-2-甲基苯基)乙炔基)-8-甲基苯并[f][1,7]萘啶-5-胺。

向圆底烧瓶中加入2-((4-甲氧基-2-甲基苯基)乙炔基)-8-甲基苯并[f][1,7] 萘啶-5-胺(来自上一步骤)(1eq.)和搅拌棒。加入乙醇和二氯甲烷(1∶2,0.2 M),随后加入钯炭的(活化的粉末,湿的,10%在炭上,0.1eq.)。对内容 物抽真空随后用氢气吹洗(三次)。在室温和氢气球下将反应混合物剧烈搅 拌过夜。然后通过硅藻土垫层过滤所述反应混合物,并连续用二氯甲烷和 EtOAc洗涤所述硅藻土垫层直至滤液不再具有UV吸收。浓缩合并的有机洗 涤液。快速色谱(硅胶,0-50%EtOAc在CH2Cl2中)获得产物2-(4-甲氧基-2- 甲基苯乙基)-8-甲基苯并[f][1,7]萘啶-5-胺,hyl苯乙基)-8-甲基苯并[f][1,7] 萘啶-5-胺。1H NMR(CDCl3):δ8.53(d,1H),8.29(d,1H),8.01(d,1H), 7.44(s,1H),7.12(dd,1H),6.93(d,1H),6.67(d,1H),6.60(dd,1H),5.93(bs, 2H),3.70(s,3H),3.05-3.00(dd,2H),2.93-2.88(dd,2H),2.44(s,3H), 2.19(s,3H)。LRMS[M+H]=358.2。

以逐滴滴加的方式向在冰-水浴中的搅拌的2-(4-甲氧基-2-甲基苯乙基)-8- 甲基苯并[f][1,7]萘啶-5-胺的二氯甲烷溶液(0.2M)中加入1N BBr3(2eq)的 CH2Cl2溶液。在30分钟内用甲醇淬灭所述反应,并在真空下浓缩以获得粗 残留物。使用在二氯甲烷中的0-20%甲醇,通过在系统 (ISCO)上的快速色谱纯化所述粗产物以获得为白色固体的4-(2-(5-氨基-8- 甲基苯并[f][1,7]萘啶-2-基)乙基)-3-甲基苯酚。1H NMR(DMSO-d6):δ8.99 (s,1H),8.75(d,1H),8.60(d,1H),8.27(d,1H),7.28(s,1H),7.09(dd,1H), 6.99(bs,2H),6.88(d,1H),6.49(d,1H),6.42(dd,1H),3.02-2.96(dd,2H), 2.86-2.81(dd,2H),2.38(s,3H),2.13(s,3H)。LRMS[M+H]=344.2。

实施例38-2:4-((4-(2-(5-氨基-8-甲基苯并[f][1,7]萘啶-2-基)乙基)-3-甲基苯 氧基)甲基)-N-(1-(氨基氧基)-2-氧代-7,10,13-三氧杂-3-氮杂十六烷-16-基)苯 甲酰胺盐酸盐(TU3627-044)的合成。

在20mL玻璃瓶中混合HBTU(38mg)、2-(叔丁氧羰基氨基氧基)乙酸 (Fluka,25mg)、DIEA(44μL)和5mL DMF。在环境温度下将反应物搅拌30 分钟,然后加入化合物D(38mg)。在环境温度下将反应物搅拌17小时。 LC-MS分析显示没有起始原料剩下但是几种过酰化副产物和所需产物一 起形成。将反应混合物用EtOAc稀释,连续用H2O和饱和NaCl水溶液洗涤, 用Na2SO4干燥,过滤并在减压下浓缩。将残留物置于5mL THF中,并在环 境温度下用1M LiOH水溶液的1mL等分试样处理2小时,此时LC-MS分析 显示过酰化的产物水解为所需产物。将反应混合物在EtOAc和水之间分配, 并分离有机层,用饱和NaCl水溶液洗涤,用Na2SO4干燥,过滤并在减压下 浓缩。使用在A中的5%溶剂B(A:DMC;B:在MeOH中的2%NH3),通过 硅胶快速色谱纯化粗产物,获得所需化合物E。MS(ESI+):计算值:853.44, 实测值:853.50(MH+)。H-NMR(400MHz,DMSO-d6):1.401(9H,s), 1.643(2H,五重峰J=6.8Hz),1.750(2H,五重峰J=6.8Hz),2.269(3H,s), 2.453(3H,s),2.96(2H,m),3.09(2H,m),3.162(2H,q,J=6.0Hz),3.298(与 H2O信号重叠),3.393(2H,t,J=5.6Hz),3.45(4H,m),3.51(6H,m),4.219 (2H,s),5.106(2H,s),6.758(1H,dd,J=2.4,8.4Hz),6.840(1H,d,J=2.8Hz), 7.094(1H,d,J=8.4Hz),7.102(1H,br.d,J=8.0Hz),7.394(1H,s),7.495(2H, d,J=8.4Hz),7.837(2H,d,J=8.4Hz),7.99491H,br.t,5.2Hz),8.379(1H,d, 8.4Hz),8.441(1H,t,5.4Hz),8.737(1H,s),8.869(1H,s),10.307(1H,br.s)。

在环境温度下用3M HCl甲醇溶液将化合物E(28mg)处理30分钟,并 在减压下浓缩。重复所述操作。获得为黄色固体的标题化合物4-((4-(2-(5- 氨基-8-甲基苯并[f][1,7]萘啶-2-基)乙基)-3-甲基苯氧基)甲基)-N-(1-(氨基氧 基)-2-氧代-7,10,13-三氧杂-3-氮杂十六烷-16-基)苯甲酰胺盐酸盐 (TU3627-044)。MS(ESI+):m/z  753.40(MH+).H-NMR(400MHz, DMSO-d6):1.651(2H,五重峰,J=6.6Hz),1.752(2H,五重峰,J=6.6Hz), 2.290(3H,s),2.5(与DMSO信号重叠的一个甲基峰),2.98(2H,m),3.15 (4H,m),3.155(2H,q,J=7.2Hz),3.47(12H,m),4.463(2H,s),5.109(2H,s), 6.767(1H,dd,J=2.8,8.4Hz),6.854(1H,d,J=2.8Hz),7.108(1H,d,8.4Hz), 7.431(1H,d,J=8.4Hz),7.498(2H,d,J=8.4Hz),7.545(1H,s),7.848(2H,d, J=8.4Hz),8.240(1H,t,5.6Hz),8.467(1H,t,J=5.6Hz),8.542(1H,d,J= 8.4Hz0,8.875(1H,2d,J=2.0Hz),8.993(1H,br.s),9.027(1H,d,J=2.0Hz), 9.729(1H,br.s)。C-NMR(100MHz,DMSO-d6):19.177,21.141,29.034, 29.322,32.851,33.345,35.615,36.581,67.843,68.199,68.426,69.470,69.503, 69.685,69.713,71.237,111.909,115.691,116.495,117.691,124.022,126.495, 127.069,127.212,129.652,129.824,130.850,131.127,131.872,132.820, 133.883,137.116,140.285,141.689,143.895,151.303,153.491,156.438, 165.784,166.659。

实施例38-3:N-(58-(3-氨基-4-甲酰基苯氧基)-15,55-二氧代 -4,7,10,18,21,24,27,30,33,36,39,42,45,48,51-十五氧杂-14,54-二氮杂五十八烷 基)-4-((4-(2-(5-氨基-8-甲基苯并[f][1,7]萘啶-2-基)乙基)-3-甲基苯氧基)甲基) 苯甲酰胺(X3678-114)的合成。

在室温下将在2.0mL DMF中的dPEG-酸F(100mg)、HATU(52.8 mg)和DIEA(97μL)的混合物搅拌30分钟。加入胺D(由109mg化合物C制 备),然后在室温下将反应物搅拌,直至HPLC监测反应完成。通过制备 RP-HPLC分离产物。通过用3N HCl的甲醇溶液进行处理,脱去从前面步 骤中获得的产物G(138mg)的Boc基团,随后浓缩至干。在室温下将在2.0mL DMF中的4-(3-氨基-4-甲酰基苯氧基)丁酸锂(25.2mg)、HATU(38.0mg) 和DIEA(69.7μL)的混合物搅拌30分钟。加入胺H并在室温下将反应物搅拌 直至HPLC监测到反应完全。通过制备HPLC分离产物(X3678-114)。MS (ESI+):m/z 743.00(MH22+/2)。

实施例38-4:2-(4-乙酰基-3-氨基苯氧基)-N-(3-硝基苄基)乙酰胺(TU633-068) 的合成。

在20mL玻璃瓶中混合2-(4-乙酰基-3-氨基苯氧基)乙酸锂(215mg)、 HBTU(379mg)和10mL DMF,并在环境温度下将得到的浆状物搅拌1小 时,此时反应混合物变得几乎均一。然后,向所述瓶中加入3’-硝基苄胺HCl (192mg)和DIEA(191μL),并在环境温度下将反应物搅拌30分钟。用EtOAc 稀释反应混合物,连续用水、饱和NaCl水溶液洗涤,用Na2SO4干燥,过滤 并在减压下浓缩。通过硅胶快速色谱(己烷/EtOAc)纯化粗产物,获得为黄 色固体的标题化合物。MS(ESI+):m/z 344.10(MH+)。H-NMR(400MHz, CDCl3):2.526(3H,3)、4.587(2H,s),4.641(2H,d,J=6.4Hz),6.091(1H,d, J=2.8Hz),6.239(1H,dd,J=2.8Hz,8.8Hz),6.969(1H,br.s),7.511(1H,t, J=7.6Hz),7.624(1H,d,J=7.6Hz),7.678(1H,d,J=8.8Hz),7.849(1H,m), 8.131(1H,s),8.141(1H,d,J=7.6hz)。

实施例38-5:2-(3-氨基-4-甲酰基苯氧基)-N-(4-硝基苄基)乙酰胺 (TU3627-020)的合成。

将2-(3-氨基-4-甲酰基苯氧基)乙酸锂(44.2mg)和HBTU(79.6mg)置于20 mL玻璃瓶中,并加入干燥的DMF(5mL)。在环境温度下将得到的浆状物 搅拌,所述浆状物在10分钟内变成均匀的。15分钟后,向反应混合物中加 入DIEA(50μL)和4’-硝基苄胺HCl(37.7mg),然后在环境温度下将反应物 搅拌。30分钟后,LC-MS分析显示反应完全。将反应混合物在EtOAc和水 之间分配。分离有机层,连续用稀柠檬酸水溶液、饱和NaHCO3水溶液和 饱和NaCl水溶液洗涤,用Na2SO4干燥,过滤并在减压下浓缩,获得为黄褐 色固体的标题化合物。MS(ESI+):m/z 330.10(MH+)。H-NMR(400MHz, DMSO-d6):4.463(2H,d,J=6.0Hz),4.597(2H,s),6.246(1H,d,J=2.4hz), 6.308(1H,dd,J=2.4Hz,8.8Hz),7.235(1H,br.s),7.465(1H,d,8.8Hz),7.518 (2H,d,J=8.8Hz),8.173(2H,d,J=8.8Hz),8.821(1H,t,J=6.2Hz),9.657 (1H,s)。C-NMR(400MHz,DMSO-d6):41.415,66.627,98.724,104.297, 113.217,123.267,128.056,137.581,146.303,147.287,152.698,162.872, 167.526,191.685。

实施例38-6:2-(3-氨基-4-甲酰基苯氧基)-N-(2-(2,4-二硝基苯基氨基)乙基) 乙酰胺(TU3627-022)的合成。

除了在没有DIEA的情况下用N1-(2,4-二硝基苯基)乙烷-1,2-二胺 (Oakwood,cat#015083,45.2mg)代替4’-硝基苄胺HCl外,用与制备 TU3627-020相同的方法制备标题化合物。获得为黄色固体的TU3627-022。 Rf.0.15(SiO2,在DCM中的5%MeOH)。MS(ESI+):m/z 404.10(MH+)。 H-NMR(400MHz,DMSO-d6):3.420(2H,m),3.593(2H,m),4.467(2H,s), 6.181(1H,d,2.0Hz),9.248(1H,dd,J=2.4,8.8Hz),7.173(2H,br.s),7.302 (1H,d,J=9.6Hz),7.406(1H,d,J=8.4hz),8.230(1H,dd,J=2.4,9.6Hz), 8.370(1H,t,J=6.0Hz),8.841(1H,d,J=2.8Hz),8.924(1H,t,J=5.6Hz), 9.618(1H,s)。

实施例38-7:4-(3-氨基-4-甲酰基苯氧基)-N-(2-(2,4-二硝基苯基氨基)乙基) 丁酰胺(TU3627-088)的合成。

在20mL玻璃瓶中混合4-(3-氨基-4-甲酰基苯氧基)丁酸锂(50mg)、 HBTU(80mg)和DMF(2mL),并在环境温度下搅拌。30分钟后,一次性加 入N1-(2,4-二硝基苯基)乙烷-1,2-二胺(Oakwood,45mg),并在环境温度下将 反应物搅拌过夜。将反应混合物用EtOA稀释,连续用稀柠檬酸水溶液、水、 饱和NaHCO3水溶液、水和饱和NaCl水溶液洗涤,用Na2SO4干燥,过滤并 在减压下浓缩,获得为黄色固体的标题化合物。Rf:0.18(SiO2,EtOAc)。 MS(ESI+):m/z 432.20(MH+)。H-NMR(400MHz,DMSO-d6):1.914(2H, 五重峰,J=7.0Hz),2.224(2H,t,J=7.0Hz),3.349(2H,q,J=6.0Hz),3.538 (2H,q,J=6.0Hz),3.928(2H,t,J=6.4Hz),6.165(1H,s),6.176(1H,dd,J= 2.4,10.0Hz),7.133(1H,br.s),7.268(1H,d,J=10.0Hz),7.371(1H,d,J= 8.4Hz),8.167(1H,t,J=5.8Hz),8.250(1H,dd,J=2.8,8.8Hz),8.835(1H,d, J=2.8Hz),8.913(1H,t,J=5.6Hz),9.599(1H,s)。C-NMR(100MHz, DMSO-d6):24.489,31.436,37.331,42.745,66.782,98.040,104.339,112.751, 115.130,123.472,123.564,129.725,134.731,137.484,148.305,152.824, 163.873,172.251,191.400。

实施例38-8:4-(3-氨基-4-甲酰基苯氧基)-N-(4-硝基苄基)丁酰胺 (3793-001)的合成。

将HATU(114.1mg)加入到4-(3-氨基-4-甲酰基苯氧基)-丁酸锂(68.7 mg)的1mL DMF溶液中,并在室温下将反应物搅拌1小时。然后将得到的 溶液加入到4-硝基苄胺HCl盐(56.6mg)和三乙胺(84μL)的1mL DMF溶液 中,用另外的1mL DMF帮助转移。在室温下将反应物搅拌2小时。完成后, 将反应混合物在4mL的10%NaCl(水溶液)和8mL的EtOAc之间分配。分离各 相,并用8mL EtOAc再次萃取水层。用Na2SO4干燥合并的有机层,过滤 并在减压下浓缩,获得橘黄色粗油状物。用0-10%MeOH/DCM的梯度洗 脱,通过硅胶快速柱色谱纯化所述粗油状物,得到所需产物,为淡黄色固 体。MS(ESI+):m/z 358.2.1H NMR(400MHz,CDCl3):9.70(s,1H),8.14(d, J=8.8Hz,2H),7.40(d,J=8.8Hz,2H),7.35(d,J=8.4Hz,1H),6.26(dd, J=2.2Hz,8.8Hz,1H),6.20(br,2H),6.03(d+br,J=2.0Hz,2H),4.54(d, J=6.0Hz,2H),4.02(t,J=5.8Hz,2H),2.47(t,J=7.0Hz,2H),2.17(五重峰, J=6.5Hz,2H)。13C NMR(100MHz,CDCl3):192.0,172.2,164.4,152.2, 147.2,145.8,137.8,128.2,123.9,113.9,105.3,98.9,66.7,42.8,32.5,24.8。

实施例38-9:3-(4-乙酰基-3-氨基苯基)-2-(4-硝基苯甲酰氨基)丙酸 (X3471-116)的合成。

向4-硝基苯甲酸(50.1mg)、HATU(114mg)和DIEA(105μL)中加入1 mL DMF,并搅拌所述混合物30分钟。然后将得到的溶液加入到在1.0mL DMF中的3-(4-乙酰基-3-氨基苯基)-2-氨基丙酸(66.7mg,1.0当量)中,并在 室温下将反应物搅拌,通过LC-MS监测。然后通过制备HPLC分离标题产 物。1H NMR(400MHz,MeOD):δ8.28(d,J=8.8Hz,2H),7.93(d,J=8.8 Hz,2H),7.72(d,J=8.4Hz,1H),6.69(d,J=1.6Hz,1H),6.61(dd,J’=8.4 Hz,J”=1.6Hz,1H),3.28(dd,J’=13.8Hz,J”=10.0Hz,1H),3.02(dd,J’= 13.8Hz,J”=10.0Hz,1H),2.51(s,3H);ESI-MS(m/z)372.34(MH+)。

实施例38-10:4-(3-氨基-4-甲酰基苯氧基)丁酰基 -AlaGlySerArgSerGly(D-Ala)LysChaValAlaAlaTrpThrLeuLysAla(D-Ala)Gly -OH(3647-104)的合成。

用20%哌啶/DMF(8mL×3)脱除Fmoc-exPADRE CLEAR树脂 (549.3mg,0.1mmol,购自Peptide International Inc.)的Fmoc基团。用 DMF(1.5mL x 5)洗涤所述树脂。然后在室温下用4-(3-氨基-4-甲酰基苯氧 基)-丁酸锂(34.4mg)、HBTU(45.5mg)、HOBt(16.2mg)和DIEA(52μL)的 3mL DMF溶液将所述树脂处理6小时。用DMF洗涤树脂,并在室温下使用 H2O/Me2S/TFA(10/10/80v/v%,10mL)从树脂上裂解多肽,持续2小时,通 过玻璃绒过滤裂解的浆状物,通过蒸发从滤液中除去大部分的TFA。用1N NaOH(水溶液)中和残留物并用乙腈稀释,接着使用SpectraProTM 7透析膜 (MWCO 1000)在50%MeCN(水溶液)(4L x10)中进行透析。将在透析膜中剩下 的溶液冻干,获得为白色固体的所需产物。C94H150N26O26的ESI-MS计算值 [M+2H]2+/2:1030.6,[M+3H]3+/3:687.4;观察值:1030.7,687.6。

实施例38-11:3-(4-乙酰基-3-氨基苯基)丙酰基-Gly(D-Ala)LysChaValAlaAla TrpThrLeuLysAla(D-Ala)Gly-OH(3465-143)的合成。

用20%哌啶/DMF(8mL×3)脱除Fmoc-PADRE CLEAR树脂(105.3 mg,0.02mmol,购自Peptide International Inc.)的Fmoc基团。用DMF(1.5 mL x 5)洗涤所述树脂。然后在室温下用3-(4-乙酰基-3-氨基苯基)丙酸锂 (5.1mg)、HBTU(9.1mg)和HOBt(3.3mgl)的0.5mL DMF溶液偶联所述树 脂,持续7小时。用DMF洗涤树脂,并用TIPS/H2O/TFA(5/55/90v/v%,3mL) 从树脂上裂解多肽,进行2小时,通过玻璃绒过滤裂解的浆状物,通过蒸发 从滤液中除去大部分的TFA。残留物用己烷(3mLx3)洗涤,并溶解于50% MeCN(水溶液)中。冻干之后获得粗产物,然后所述粗产物通过制备HPLC纯化, 获得为淡黄色粉末的所需产物。C77H120N18O18的ESI-MS计算值 [M+2H]2+/2:793.5,[M+3H]3+/3:529.3;观察值:793.6,529.4。

实施例38-12:6-(4-(3-氨基-4-甲酰基苯氧基)丁酰氨基)己基 -5’-*T*C*C*A*T*G*A*C*G*T*T*C*C*T*G*A*C*G*T*T-3’(*:硫代磷酸 酯)(3647-057)的合成。

将HBTU(6.1mg)、HOBt(2.2mg)和三乙胺(7μL)加入到4-(3-氨基-4- 甲酰基苯氧基)-丁酸锂(4.6mg)的1mL DMSO溶液中,并在室温下振摇所述 反应1小时。然后将所得溶液的276μL等分试样加入到氨基-修饰的BG1寡 聚物(12.1mg,1.8μmol,购自Integrated DNA Technologies,Inc.)和三乙 胺(15μL)的1.2mL DMSO溶液中,并在室温下将反应物振摇2天。用水稀 释反应混合物,并使用Slide-A-LyzerTM(MWCO  3500)针对水(4L x10) 进行透析。冻干透析的溶液,获得为白色固体的所需产物。 C211H273N69O108P20S20的ESI-Q-TOF计算值:6759.7;观察值:6759.1。

实施例38-13:6-(3-(4-乙酰基-3-氨基苯基)丙酰氨基)己基 -5’-*T*C*G*T*C*G*T*T*T*T*C*G*G*C*G*C*G*C*G*C*C*G-3’(*:硫代 磷酸酯)(3597-033)的合成。

将HBTU(5.9mg)和HOBt(2.1mg)加入到3-(4-乙酰基-3-氨基苯基)丙 酸锂(3.3mg)的1mL DMSO溶液中,并在室温下振摇所述反应物1小时。然 后将所得溶液的20μL等分试样加入到氨基-修饰的BG2寡聚物(1.88mg, 0.26μmol,购自Integrated DNA Technologies,Inc.)和三乙胺(2μL)的 0.2mL DMSO溶液中,并在室温下将反应物振摇20小时。将反应混合物施 加至用H2O平衡过的NAP-25TM柱并用H2O洗脱。通过LC-MS监测每1mL 流分,合并含有所需产物的流分并冻干,获得为白色固体的所需产物。MS (ESI+):m/z 1858.8([M+4H]4+/4)。

实施例38-14:6-(4-(3-氨基-4-甲酰基苯氧基)丁酰氨基)己基 -5’-*T*C*G*T*C*G*T*T*T*T*C*G*G*C*G*C*G*C*G*C*C*G-3’(*:硫代 磷酸酯)(3597-167)的合成。

将HATU(7.4mg)加入4-(3-氨基-4-甲酰基苯氧基)-丁酸锂(5.5mg)的 1mL DMSO溶液中,并在室温下振摇所述反应1小时。然后将所得溶液的 60μL等分试样加入到氨基-修饰的BG2寡聚物(6.9mg,1.0μmol)和三乙胺 (7.5μL)的0.6mL DMSO溶液中,并在室温下将反应物振摇20小时。除使用 HBTU代替HATU外,用相同方法新鲜制备另外的活性酯溶液,将所述活 性酯溶液的60μL的等分试样加入到反应混合物中,并将反应物再振摇2天。 将反应混合物分为3部分。将每部分施加至用H2O平衡过的NAP-25TM柱并 用H2O洗脱。通过LC-MS监测每1mL的流分,合并含有所需产物的流分并 冻干,获得为白色固体的所需产物。C229H296N78O120P22S22的ESI-Q-TOF计 算值:7442.8;观察值:7442.7。

实施例39:自旋标记-ABA试剂的合成

实施例39-1:N-(3-氨基-4-甲酰基苯基)-1-羟基-2,2,5,5-四基-3-吡咯啉-1- 氧基-3-甲酰胺(X3626-112b)的合成。

向2,2,5,5-四甲基-3-吡咯啉-1-氧基-3-甲酸(55.3mg)、HBTU(102mg)和 DIEA(105μL)中加入2.0mL DMF。在室温下搅拌30分钟后,加入2,4-二 氨基苯甲醛(40.8mg)。在室温下搅拌所述混合物直至通过HPLC监测到反 应完全。通过制备HPLC分离得到标题产物。MS(ESI+):m/z 303.15 (MH+)。

实施例40:生物素-ABA试剂的合成

实施例40-1:N-(3-氨基-4-甲酰基苯基)-1-(生物素酰氨基)-3,6,9,12-四氧杂十 五熔-15-酰胺(X3626-140)的合成。

向2,4-二氨基苯甲醛(11.5mg)、NHS-dPEGTM4生物素 (QuantaBiodesign,cat#10200,50mg)和DMAP(10.4mg)中加入1.0mL DMF。在室温下搅拌反应混合物直至HPLC监测到反应完成。通过硅胶快 速色谱分离产物。MS(ESI+):610.28(MH+)。

实施例40-2:N-(1-(3-氨基-4-甲酰基苯氧基)-2-氧代-7,10,13-三氧杂-3-氮杂 十六熔-16-基)-生物素酰胺(X3626-142)的合成。

向2-(3-氨基-4-甲酰基苯氧基)乙酸锂(45.3mg)、HBTU(77.8mg)和 DIEA(31μL)中加入1mL DMF,并搅拌所述混合物30分钟。将得到的溶 液加入到在1.0mL DMF中的生物素-dPEGTM3-NH3+TFA (QuantaBiodesign,cat#10193,100mg)、DIEA(47μL)中,并在室温下将反 应物搅拌,通过LCMS监测。通过制备HPLC分离产物。MS(ESI+):624.30 (MH+)。

实施例41:荧光-PEG-ABA试剂的合成

实施例41-1:荧光素-PEG-ABA(X3757-48)的合成。

将DMF(2.0mL)加入到NHS-荧光素A(23.6mg)、胺B(17.6mg)和 DIEA(8.7μL)中。在室温下搅拌所述混合物直至通过HPLC监测到A被耗 尽。通过制备HPLC分离产物C。ESI-MS(m/z)679.72(MH+)。然后将所 述产物(C,7.4mg)溶解于3M HCl(1.0mL)中,并在室温下搅拌5分钟后通 过蒸发除去甲醇。重复所述操作,导致Boc基团脱除,得到胺D。在室温下 向胺D中加入4-(3-氨基-4-甲酰基苯氧基)丁酸锂(2.3mg)、HBTU(3.8mg)、 DIEA(7.0μL)和DMF(2mL)。然后通过制备HPLC分离标题产物。MS (ESI+):784.30(MH+)。

实施例42:寡聚糖-ABA试剂的合成

实施例42-1:3-氨基-4-甲酰基苯氧基丁酸的Gal-Glu-1-酰胺(3793-050)的 合成。

在pH 7,将NaBH3CN(94.3mg)加入到NH4OAc(771mg)和乳糖 (180mg)的H2O(10mL)溶液中,将所述反应在35℃搅拌7天。冻干所述反应 混合物,并将残留物溶解在H2O中,接着使其通过Dowex 1X8-400阴离子交 换树脂(OH-形式,45g)从而除去过量的BH3CN-、其副产物和乙酸盐。将洗 脱液冻干,获得粗产物,使用Dowex 50WX8-400树脂(H+形式,30g),通过 阳离子交换色谱纯化所述粗产物,获得为淡黄色粉末的所需产物 (3793-048)。C12H25NO10的ESI-MS[MH]+计算值:344.1;观察值:344.2。

用在无水DMSO(200μL)中的HBTU(9.9mg)和DIEA(7.7μL)处理3-氨 基-4-甲酰基苯氧基丁酸锂(6.0mg)1小时。然后在室温下向所述反应混合物 中加入来自上面的Gal-Glu-1-胺(3793-048)(7.7mg)的DMSO(250μL)溶液, 接着搅拌1天。冻干所述反应混合物并通过制备HPLC-MS采用NH4OAc洗 脱纯化,获得为黄色粉末的所需产物(3793-050)。C23H36N2O13的ESI-MS [MH]+计算值:549.2;观察值:549.3。

实施例43:磷脂-ABA试剂的合成

实施例43-1:DOPE-ABA(TU3627-092)的合成。

将4-(3-氨基-4-甲酰基苯氧基)丁酸锂(34mg)和HBTU(57mg)置于 20mL玻璃瓶中,并加入2mL DMF。在环境温度下将反应物搅拌30分钟以 活化。在另外的20mL瓶中放入DOPE(76mg,1,2,-二油酰基-sn-甘油基-磷酸 乙醇胺,NOF Corp.),随后加入DIEA(35μL)和3mL DCM。将在第一个瓶 中的活化酯的黄色溶液转移至第二个瓶中,并在环境温度下搅拌反应物。 24小时后,将所有反应混合物施加至用溶剂A(溶剂A:在DMC中的5% NEt3,溶剂B:在MeOH中的5%NEt3)平衡的12g预装SiO2柱,在15分钟内用 在A中的0-15%B线性梯度洗脱所述柱,获得部分纯化的产物,所述产物为 非常粘稠的淡黄色油状物。使用12g SiO2柱(溶剂A:在DMC中的5%NEt3, 溶剂B:在MeOH中的5%NEt3),并在15分钟内用在A中的2-10%B的线性梯 度洗脱,通过快速色谱再次纯化所述产物。在减压下浓缩含有纯产物的流 分,获得标题化合物的三乙铵盐。Rf:0.43(SiO2,10%MeOH在DCM中)。 MS(ESI+):m/z 949.60(MH+)。H-NMR(400MHz,CDCl3):0.875(6H,t, J=6.8Hz),1.28(40H,宽多重峰),1.318(9H,t,J=7.4Hz),1.582(4H,m), 2.00(m,8H),2.124(2H,五重峰,J=6.8Hz),2.28(4H,m),2.373(2H,t,J= 7.0Hz),3.042(6H,q,J=7.2Hz),3.476(2H,m),4.00(6H,m),4.154(1H,dd, J=6.8,12.0Hz),4.373(1H,dd,J=3.2,12.0Hz),5.233(1H,m),5.337(4H,m), 6.217(1H,d,J=2.0Hz),6.255(1H,dd,J=2.0,8.4Hz),6.56(2H,非常宽的 峰),7.313(1H,d,J=8.8Hz),7.432(1H,br.t,J=8.4Hz),9.674(1H,s),11.97 (1H,br.s)。

实施例44:PCL偶联连接的还原

发现PCL偶联连接的还原阻止基于PCL的蛋白缀合物的解离。图54A 显示了与2-ABA偶联后用20mM NaCNBH3还原1小时的 hFGF21-Lys150PCL的ESI质谱分析。图54B显示了透析至10mM磷酸盐缓 冲液(pH 7.5)中并在50℃温育1天后,经还原的hFGF21-Lys150PCL 2-ABA 缀合物的ESI质谱分析。

图55显示了使用NaCNBH3还原或没有还原时,聚乙二醇化FGF21中 PCL连接的稳定性。使FGF21突变体Arg154PCL与30.3kDa-2-ABA-PEG (参见TU3627-024,实施例37-7)反应,并纯化。用20mM NaBH3CN将纯化 的FGF21Arg154PCL-30.3kDa-2-ABA-PEG还原16小时(室温,pH 7.5,100 mM蛋白)。样品在4℃、室温、37℃和50℃温育16小时,以及在95℃温育5 分钟。图55A中显示了还原样品和未还原样品的SDS-PAGE凝胶。此外, 图55B显示了在4℃、室温、37℃和50℃以及95℃温育60小时的未还原样品 的SDS-PAGE凝胶。

实施例45:用2-ABA共价修饰的PCL-A(Lys-P5C)和PCL-B(Lys-P2C)的 NMR研究

通过标准1D和2D核磁共振(NMR)波谱研究PCL-A(参见3647-125,实 施例36-1)和PCL-B(参见3793-011,实施例36-2)与2-氨基苯甲醛(2-ABA) 的反应以及得到的PCL-ABA加合物的结构。

对于PCL-A和PCL-B与2-ABA的反应以及随后的产物鉴定,在300K 下,在装备有1H/13C/19F/31P-QNP-冷冻探头的Bruker Avance 400MHz NMR设备(Bruker Biospin,Billerica,MA)上获得NMR数据。通常,以16次 扫描、5秒的弛豫延迟、具有12ppm的扫描宽度的16384复合数据点来记录 1H 1D光谱。通常,以4次扫描、256次t1试验来记录1H-1H COSY谱,以及 用8次扫描、512次t1试验来记录1H-1H ROESY谱。通常,以32次扫描、256 次t1试验来记录1H-13C HMBC谱,并且通过以4次扫描、在质子维度内使用 12ppm或7.5ppm的波谱宽度和在碳维度内使用222ppm的波谱宽度进行 128次t1试验来记录1H-13C HMQC谱。

对于还原的加合物的鉴定,在300K下,在装有1H/13C/15N-TXI-冷冻探 头的Bruker Avance 600MHz设备上记录所有波谱。一般,在用激发塑型 (excitation sculpting)压制水峰的同时,以64次扫描、2秒的弛豫延迟、具有 14ppm的扫描宽度的16384复合数据点来记录1H谱。一般以16次扫描、使 用10ppm的波谱宽度的1024次t1试验来记录1H-1H COSY谱。一般以8次扫 描、使用碳维度内160ppm和质子维度内10ppm的波谱宽度进行256次t1试 验来记录1H-13C HMQC谱。典型地以88次扫描、使用碳维度内180ppm和 质子维度内10ppm的波谱宽度在300K进行256次t1试验来记录1H-13C HMBC谱。

PCL-A与2-ABA的反应如下监测:将在如实施例36-1中所述合成的1.0 mg PCL-A溶解在0.5mL在D2O中的1X PBS中。按加入在D2O中的10μL 10mM 3-(三甲基甲硅烷基)丙酸(TSP)作为内标并通过NMR进行浓度测 定。将3.7mg 2-氨基苯甲醛(2-ABA;购自Sigma)溶解在0.5mL在D2O中 的1X PBS和10μL 10mM TSP中。通过NMR测定两种样品的浓度。使用包 括1H 1D、1H-1H COSY、1H-1H ROESY、1H-13C HMBC和1H-13C HMQC 试验的标准NMR方法归属起始原料的NMR信号(表7)。

表7:未反应的PCL-A和2-ABA的NMR信号归属

  原子编号   位移(pp2m)   H’s   类型   J(Hz)   19   1.31   2   m   -   18   1.47   2   quin   7.34   4   1.68   1   m   -   20   1.74   1   m   -   4   2.16   1   m   -   3   2.57   1   m   -   17   3.14   1   t   6.97   21   3.59   1   t   6.24   5   4.51   1   m   -   12,10   6.76   1   m   -   11   7.34   1   ddd   8.50,7.03,1.59   13   7.53   1   dd   8.19,1.59   2   7.76   1   m   -   7   9.68   1   s   -

为了引发所述反应,将325μL PCL-A溶液与175μL 2-ABA溶液混合。 将得到的反应混合物转移至NMR管并且包含的PCL-A和2-ABA的摩尔比 约为1∶1。使反应在室温下开始,并在指示的时间(图56)定期获得NMR波 谱。在反应期间,起始的PCL-A物质(圆点)和2-ABA反应物(星形)的反应信 号快速消失,所述反应继续进行至完全,所有PCL-A被转化(样品中有稍微 过量的2-ABA)。在混合后0.5小时第一采集时间点,检测到比例约为2∶1 的两个新种类(species)(通过箭头标出了代表性的共振)。所述少量的种类在 数天的过程中完全转化为主要的种类。

使用在D2O和d6-DMSO中制备的样品,通过标准1D1H和13C、2D 1H-1H COSY、1H-1H ROESY、1H-13C HMBC以及1H-13C HMQC NMR波 谱表征PCL-A与2-ABA的的最终反应产物。通过HPLC纯化在d6-DMSO中 的样品。表8中概括了在d6-DMSO中质子和碳共振的信号归属以及在 1H-13C HMBC谱中观察到的相关。

表8对PCL-A/2-ABA加合物的主要形式所观察到的1H-13C HMBC 相关(在d6-DMSO中)

图57A中显示了通过HMBC中的键关联所选择的原子的编号。与在 PCL-A起始物质中的观察不同,在两个不同的化学位移值处观察到碳17上 的两个亚甲基质子。这些质子还显示了在HMBC波谱中的与碳7的异核经 键相关,这提示氮16和碳7之间形成了共价健。碳7上的质子在5.6ppm处共 振(质子7是在图201中突出显示的PCL-A/2-ABA加合物的信号),并且显示 出与碳2、8、9、5和13的相关。类似地,在碳2上的质子显示出与碳9HMBC 相关。这些观察以及在D2O和D6-DMSO中表征的两种样品的所有其它 NMR观察与在图57中所画的PCL-A/2-ABA加合物的主要产物的结构是一 致的。因此,总的说来,NMR证据指向PCL-A和2-ABA之间的反应的产物 为以下结构:

还尝试了对在反应混合物中所观察到的少量形式(图56)的结构进行鉴 定。由于所述较少形式的低浓度,进行分析是复杂的,并且事实上所述少 量形式缓慢转化为主要形式。所述分析是非决定性的。少量和主要形式在 碳7上都具有1个质子,二者的化学位移非常相似(图56中在5.6ppm处的箭 头)。两种形式通过空间ROESY接触也都是相似的。对于PCL-A/2-ABA加 合物的少量形式和未反应的PCL-A,碳17上的两个亚甲基质子退化,说明 它们呈现出相同的化学位移。然而,这些质子在主要形式中具有不同的化 学位移。在少量和主要形式中,这些质子还显示出对碳7的HMBC相关, 这提示碳7和氮16之间具有共价健。观察到在少量形式中碳17上的亚甲基质 子的化学位移退化,这可能暗示着碳7和氮16之间的共价健可能是半稳定 的,并且对少量形式的NMR观察是两个或多个种类之间化学交换的结果。 可以想象,少量形式是主要形式在与PCL-A/2-ABA加合物的质子化形式化 学交换中的可选的半稳定立体异构体(图57B)。

此外,如上述那样混合合成的PCL-A和2-ABA在D2O中的溶液,并通 过NMR监测使所述反应继续进行至完全。向所述NMR管中加入在D2O中 的氰基硼氢化钠(NaCNBH3)溶液的等分试样,使PCL-A/2-ABA加合物还原 为新的种类。加入另外的NaCNBH3等分试样,直至为PCL-A/2-ABA加合 物的特征的在5.6ppm处的共振(图56,箭头)完全消失。然后将完全还原 的PCL-A/2-ABA加合物的NMR样品重复地冻干并再溶解在干燥的D2O中, 以便再浓缩样品并除去水。在0.5mL干燥的D2O中再次重构所述最终样品。 通过标准2D 1H-1H COSY、1H-13C HMBC和1H-13C HMQC NMR波谱表征 所述还原形式。表9中概括了质子和碳共振的信号归属以及来自1H-13C HMBC波谱的异核经键相关。

表9:对PCL-A/2-ABA加合物的还原形式观察到的1H-13C HMBC相关(在 D2O中)

图57C中显示了原子的编号。与在PCL-A/2-ABA加合物的主要形式中观 察到的相关的关键不同是碳17上的亚甲基质子和碳7之间缺少通过键相关 的异核,并且在碳2上的质子和碳9之间没有通过键的相关。这些和所有其 它的NMR观察与还原的PCL-A/2-ABA加合物的以下结构(还在图57C中)一 致:

还在与PCL-A和2-ABA反应的相同条件下研究了PCL-B和2-ABA的反 应。将如实施例36-2中所述合成的PCL-B溶于D2O中(如上),并将摩尔比约 为1∶1的PCL-B和2-ABA的反应混合物转移入NMR管。表10中列出了起始 物质的信号归属。

表10:未反应的PCL-B和2-ABA的信号归属

使所述反应在室温下进行并在指示的时间(图58)定期地获得NMR谱。 与PCL-A样品不同,PCL-B与2-ABA并末立即反应。甚至17天后大部分起 始物质(星形为2-ABA;圆点为PCL-B)还存在,虽然其少量已转化为新种 类(箭头)。所述种类不能被进一步表征。然而,这两个反应的NMR分析清 楚地指出PCL-A与2-ABA的反应活性要比PCL-B的高出很多。

实施例46:掺入mEGF中的吡咯赖氨酸(Pyl)和PCL的衍生化

除用pAra-pylSTBCD和在pET22b载体上的突变体mEGF Tyr10TAG 基因共转化大肠杆菌BL21(DE3)细胞之外,如实施例14所述的那样完成吡 咯赖氨酸(Pyl)和PCL向mEGF中的掺入。在后文中将得到的mEGF突变体 称为mEGF-Tyr10PCL/Pyl。ESI-MS分析揭示了PCL和PYL两者均在 mEGF的位置10掺入(图59A;mEGF Tyr10PCL的预期质量=7296Da; mEGF Tyr10Pyl的预期质量=7310Da)。因此,获得了具有掺入的PCL或 PYL的mEGF蛋白质的混合物。在这一特殊样品中,主要的种类是具有掺 入其中的PCL的mEGF。

为证实这一混合物的衍生化,以及证实PYL被本文提供的方法修饰, 在10x PBS(pH 7.0)和1%(v/v)DMSO中在25℃将ABA试剂TU3627-014 (参见实施例34-2)与mEGF Tyr10PCL/PYL偶联16小时。通过添加10μM mEGF Tyr10PCL/PYL和1mM TU3627-014开始缀合反应。通过电喷雾离 子化质谱(ESI-MS)证实蛋白质缀合物的形成(图59B)。PCL加合物和PYL 加合物的比例与未反应蛋白质中的PCL和PYL的比例类似(图58A),从而表 明PCL和Pyl具有类似的反应性。

应当理解,本文描述的实施例和实施方案仅用于说明的目的,并且根 据其的各种修饰和改变对于本领域技术人员都是显而易见的,并且包括在 本申请的精神和范围以及所附权利要求的范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号