首页> 中国专利> 具有卓越的伴侣和折叠活性的嵌合融合蛋白

具有卓越的伴侣和折叠活性的嵌合融合蛋白

摘要

本发明公开了与野生型蛋白伴侣相比具有卓越的伴侣和折叠活性的嵌合融合蛋白的克隆、表达和用途。本发明涉及由含有编码非-人伴侣蛋白多肽结合区段的核苷酸序列和编码FK506结合蛋白(FKBP)或FK506-结合-蛋白-样结构域(FKBP-样结构域)的核苷酸序列的重组DNA分子编码的嵌合融合蛋白。具体地,本发明涉及由含有编码非-人伴侣蛋白多肽结合区段的核苷酸序列和编码人FKBP型肽基脯氨酸顺反异构酶(PPIase)的核苷酸序列的重组DNA分子编码的嵌合融合蛋白,生产这些嵌合融合蛋白的方法以及它们在其它蛋白质的生产以及在疫苗或药物的生产方法中作为折叠辅助物,以及作为进行免疫测定的折叠辅助物的用途。

著录项

  • 公开/公告号CN101351550A

    专利类型发明专利

  • 公开/公告日2009-01-21

    原文格式PDF

  • 申请/专利权人 霍夫曼-拉罗奇有限公司;

    申请/专利号CN200680050180.8

  • 申请日2006-12-29

  • 分类号C12N9/90(20060101);C12N15/62(20060101);C12N15/61(20060101);C07K19/00(20060101);C07K14/16(20060101);A61K38/00(20060101);G01N33/53(20060101);

  • 代理机构72001 中国专利代理(香港)有限公司;

  • 代理人权陆军;付磊

  • 地址 瑞士巴塞尔

  • 入库时间 2023-12-17 21:19:23

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2012-10-10

    授权

    授权

  • 2009-03-11

    实质审查的生效

    实质审查的生效

  • 2009-01-21

    公开

    公开

说明书

本发明涉及一种与天然存在的对应物相比具有卓越的伴侣和折叠 活性的嵌合融合蛋白的克隆、表达和用途。本发明涉及由含有编码非- 人伴侣蛋白多肽结合区段的核苷酸序列和编码FK506结合蛋白(FKBP) 或FK506-结合-蛋白-样结构域(FKBP-样结构域)的核苷酸序列的重组 DNA分子编码的嵌合融合蛋白。具体地,本发明涉及由含有编码非-人 伴侣蛋白多肽结合区段的核苷酸序列和编码人FKBP型肽基脯氨酸顺反 异构酶(PPIase)的核苷酸序列的重组DNA分子编码的嵌合融合蛋白, 生产这些嵌合融合蛋白的方法以及它们在其它蛋白质的生产和在免疫 实验室动物以及在疫苗或药物的生产方法中作为折叠辅助物(helper) 的用途,它们在重组蛋白技术中作为融合模块以及为进行免疫测定作为 折叠辅助物的用途。

背景

如今分子伴侣在广泛的生物技术应用中起着重要的作用(Mogk等 人,2002 Chembiochem 3,807-)。存在许多具有伴侣以及酶特性的折 叠辅助物。为此它们可用于蛋白质折叠领域的许多实际应用中。

蛋白伴侣,其已知为经典的“折叠辅助物”,是辅助其它蛋白质的折 叠并维持其结构完整性的多肽。它们在体内和体外均具备促进多肽折叠 的能力。通常,折叠辅助物被细分为折叠催化剂和蛋白伴侣。折叠催化 剂由于其催化功能而加速蛋白质折叠中的限速步骤。催化剂的例子在下 文进一步描述。伴侣蛋白已知与多肽的变性的、部分变性的或疏水表面 结合并由此帮助蛋白质复性或使它们保持在溶液中。因此,不同于折叠 催化剂,蛋白伴侣只发挥结合功能(Buchner,J.,Faseb J 10(1996)10-19)。 蛋白伴侣是与蛋白质成熟、折叠、转运和降解有关的普遍存在的应激- 诱导的蛋白(Gething,M.J.和Sambrook,J.,Nature 355(1992)33-45)。 尽管它们在正常的生长条件下也存在,但它们在应激条件下被大量诱 导。这进一步支持了这一观点:它们的生理功能是应对应激条件。

迄今为止,已知几个不同的蛋白伴侣家族。所有这些蛋白伴侣的特 征都在于它们结合未折叠或部分未折叠蛋白的能力,且具有与蛋白质的 正确折叠或与变性或聚集蛋白的去除相关联的生理功能。

如Buchner,J.,Faseb J 10(1996)10-19和Beissinger,M.和 Buchner,J.,Biol.Chem.379(1998)245-59所述,充分表征的蛋白伴 侣的例子是所谓的热激蛋白家族的成员,它们根据其相对分子量被命 名,例如,hsp100、hsp90、hsp70和hsp60,以及所谓的shsps(小热激 蛋白)。

不同于蛋白伴侣,折叠催化剂通过加速特定的限速步骤、由此降低 有聚集倾向的折叠中间体的浓度来辅助折叠。一类催化剂,蛋白质二硫 键异构酶(或称作巯基二硫键氧化还原酶 (thiol-disulfide-oxido-reductases)),催化分泌蛋白中二硫键的形成或 重排。在革兰氏阴性细菌中,分泌蛋白在周质中的氧化折叠受称作 DsbA、DsbB、DsbC和DsbD的蛋白质二硫键异构酶级联的调节 (Bardwell,J.C.,Mol Microbiol 14(1994)199-205和Missiakas,D., 等人,Embo J 14(1995)3415-24)。

另一类重要的称作肽基脯氨酸顺反异构酶(PPIs)的折叠催化剂包 括比如CypA、PpiD(Dartigalongue,C.和Raina,S.,Embo J 17(1998) 3968-80、FkpA(Danese,P.N.,等人,Genes Dev 9(1995)387-98)、 引发因子(Crooke,E.和Wickner,W.,Proc Natl Acad Sci USA 84 (1987)5216-20和Stoller,G.,等人,Embo J 14(1995)4939-48) 和SlyD(Hottenrott,S.,等人,J Biol Chem 272(1997)15697-701)这 样的不同的成员。

由于序列相似性和蛋白拓扑学,脯氨酰异构酶被分作三个截然不同 的家族:亲环蛋白、FK506结合蛋白(FKBP)和细小蛋白。亲环蛋白结 合免疫抑制剂环孢菌素A并受其抑制。细小蛋白是一个脯氨酰异构酶家 族,其既不受环孢菌素A的抑制也不受FK506的抑制。FKBP与FK506 和纳巴霉素结合并受其抑制(首字母缩写FKBP表示“FK506-结合蛋白”; FK506是一种用作免疫抑制剂药物的大环内酯)。FKBP在高分辨率下 被确定的第一个X射线结构是人FKBP12的。它是一个以右手扭转环绕 包裹短α-螺旋的五链反平行β-折叠。该五链β-折叠构架包括残基2至8、 21至30、35至38和46至49、71至76和97至106(van Duyne等人, Science(1991)252,839-842)。之后的研究已经显示,FKBP以及亲 环蛋白和细小蛋白,形成高度保守的发现于广泛原核和真核生物中的酶 家族(综述参见John E.Kay,Biochem.J.(1996)314,361-385)。例 如,迄今为止已经在大肠杆菌(E.coli)中鉴定了10种脯氨酰异构酶(2 种细小蛋白、3种亲环蛋白和5种FKBP)。

通常,FKBP根据结合标准来定义,也即,它们识别并以纳摩尔范 围的高亲和力结合FK506。然而,存在FKBP-样结构域,它们并不会更 易于共有显著的序列相似性,但是一些介导FK506结合的氨基酸残基发 生了突变,且亲和力转变为微摩尔范围。例如,SlyD和引发因子(来自 大肠杆菌胞质的两种胞质PPIase),可被视为FKBP-样蛋白质。这两种 脯氨酰异构酶均包含与FKBP12共有显著序列同源性的结构域,但是它 们与FK506的结合亲和力却相当弱,且处于微摩尔范围(Scholz等人, Biochemistry(2006)45,20-33)。然而,在序列相似性和蛋白质拓扑 学方面,SlyD和引发因子都毫无疑问是FKBP家族的成员(Wülfing等 人,J.Biol.Chem(1994)269(4)2895-2901;Callebaut & Mornon,FEBS Lett.(1995)374(2)211-215)。

FKBP结构域和FKBP-样结构域可以形成具有复杂拓扑学的更大的 分子的部分。在哺乳动物细胞中,FKBP12、FKBP12A和FKBP13仅包 含基本FKBP结构域,而FKBP25和FKBP52具有一个或更多个作为更 大分子之部分的FKBP结构域(综述参见John E.Kay,Biochem.J.(1996) 314,361-385)。

在原核细胞中也发现了模块构建的FKBP:例如,前述引发因子由 三个具有不同功能的充分分离的结构域组成。N-结构域介导与大肠杆菌 核糖体50S亚单位的结合(Hesterkamp等人,J Biol Chem.(1997)Aug 29;272(35):21865-71)。M(中间-)结构域包含脯氨酰异构酶活 性位点(Stoller等人,FEBS Lett。1996 Apr 15;384(2):117-22), 以及C-结构域包括介导伸展的(extended)多肽底物的结合的多肽结合 位点(Merz等人,J Biol Chem.2006 Oct 20;281(42)31963-31971)。 模块构建的肽基脯氨酰异构酶的另一个例子是周质FkpA,其由N-末端 蛋白伴侣和二聚化结构域以及C-末端FKBP-结构域组成(Saul等人,J. Mol.Biol(2004)335,595-608)。

一些折叠辅助物同时包含催化活性结构域以及蛋白伴侣(或多肽结 合)结构域。例如,脯氨酰异构酶引发因子(Scholz等人,1997,Embo J.16,54-58;Zarnt等人,1997,JMB 271,827-837)、FkpA(Saul等 人,2004,JMB 335,595-608)和SlyD属于这些折叠辅助物。近来可 显示,FkpA和SlyD非常适于作为重组蛋白生产的融合模块。这两种蛋 白伴侣都提高它们的客户蛋白质的表达率,支持正确重折叠和提高易于 聚集的(aggregation-prone)蛋白如逆转录病毒表面蛋白质的溶解度 (Scholz等人,2005,JMB 345,1229-1241和WO 03/000877)。

FkpA、SlyD和SlpA是属于FK506结合蛋白(FKBP)家族的细菌 蛋白伴侣。如上述提及的,FK506是用作免疫抑制剂药物的大环内酯。 FK506的细胞受体仍然处于全世界研究组的焦点。在20世纪九十年代 开始时,人FKBP,也即FKBP12的三维结构可被分辨(van Duyne等人, 1991,Science 252,839-842)。与FkpA、SlyD和SlpA形成对照,人 FKPB12不具有任何伴侣活性且其仅具有中度的脯氨酰异构酶活性。

在许多诊断应用中都使用了重组产生的蛋白质,例如抗原。这些抗 原可作为融合蛋白产生,其中含有一个构成抗原性部分或靶多肽的部 分,所述抗原性部分或靶多肽必须被存在于样品或测定混合物中的特异 性结合配偶体识别。重组产生的融合蛋白中的其它部分是与抗原性部分 融合以促进特定抗原的克隆、表达、折叠、增溶或纯化的多肽部分。重 组产生的融合蛋白的合成在现有技术中已有充分描述。利用蛋白伴侣作 为融合蛋白中作为靶多肽的表达、折叠、纯化和增溶的辅助分子起作用 的部分是很常见的。例如,美国专利号6,207,420公开了一种用于表达 异源蛋白质,也即起源于不同的生物的靶多肽部分和融合肽部分的氨基 酸序列,的融合蛋白表达系统。WO 03/000878描述了FKBP蛋白伴侣作 为逆转录病毒表面糖蛋白的表达工具的用途。

尽管通常用于融合蛋白的表达、纯化、折叠和增溶的方法看起来运 行可靠,尤其是那些在其中使用了折叠辅助物的方法,但仍然存在一些 需要解决的问题。例如,只要在人诊断测试中使用含有非-人氨基酸序列 的融合蛋白作为结合配偶体,都会由于所使用的这些非-人蛋白质而存在 干扰问题。经常出现的是,大量存在于人血液样品中的抗体与存在于测 定试剂中的细菌蛋白反应。这样的干扰可能导致高背景噪音或者甚至可 能导致错误的测试结果。另一个常见问题在于改变或最优化融合配偶体 与各自的客户蛋白质的亲和力。任何融合模块对靶部分的亲和力必须得 到很好的平衡。如果亲和力过高,则融合蛋白会溶解得非常好,但融合 模块与客户蛋白间的复合物将维持一种封闭的构象且由此将在免疫测 定中失活。如果亲和力过低,则客户蛋白将在免疫测定中容易接近并且 具有活性,但它将不足以保护免于聚集。

因此,本发明的目的是提供一种适于生产蛋白伴侣-样蛋白质的表达 系统,所述蛋白伴侣-样蛋白质可用于广泛的生物技术和尤其是诊断和药 学应用中,其不与存在于分离的人样品中的分子和物质产生或仅产生很 少的干扰。现有技术未公开主要由人氨基酸序列组成的有效的折叠辅助 物,也即发挥高催化和伴侣活性这两种活性的辅助物。

尽管存在几种人和细菌蛋白伴侣的蛋白质序列比对(Wülfing等人, 1994,JBC 269,2895-2901;Hottenrott等人,1997,JBC 272,15697-15701; Suzuki等人,2003,JMB 328,1149-1160),也仍然未显示可以如何产 生有效的具有双重功能,即催化和伴侣-样功能的人源化折叠辅助物。

发明概述

令人惊奇地,我们已经能够显示,通过将非-人伴侣蛋白的多肽结合 区段与源自FK506结合蛋白(FKBP)或FKBP-样结构域(FK506-结合- 蛋白-样结构域)的序列融合,可以产生具有卓越折叠辅助物活性的分子。

具体地,通过将非-人伴侣蛋白的多肽结合区段与源自FKBP型人肽 基脯氨酸顺反异构酶(PPIase)的序列融合,我们能够产生具有优于野 生型折叠辅助物的折叠辅助物活性的人源化PPIase蛋白伴侣分子。这些 嵌合人源化折叠辅助物代表了用于广泛的生物技术应用中产生天然-样 折叠蛋白质试剂的极有前景的工具,因为它们在被用于诊断测试和药学 应用中时不会导致或仅导致很少的干扰,以及由于它们的伴侣特性可以 对于各蛋白质进行适应。

还公开了设计编码这样的嵌合融合蛋白的重组DNA分子的优选方 式以及它们用作表达载体的部分、含有这样的表达载体的宿主细胞以及 在生产嵌合融合蛋白中的用途。

表现惊人且优良的特性,尤其是就其催化效率而言,的重组产生的 嵌合融合蛋白本身也是本发明的部分。

在进一步的实施方案中,公开了重组产生的融合蛋白作为靶蛋白的 折叠辅助物、作为生产靶蛋白的方法中的折叠辅助物、作为免疫测定混 合物中的添加物、在疫苗生产方法中、用于免疫实验室动物以及在生产 药物的方法中的用途。

此外还公开了含有重组产生的嵌合融合蛋白及药学可接受赋形剂 的组合物。

附图简述

图1:经SDS-PAGE证明的FKBP12-IF1(具有SlyD插入片段)的 纯化。泳道1,蛋白质标准Mark 12未染色,来自Invitrogen;泳道3, 超量产生的大肠杆菌菌株BL21/DE 3的离液粗裂解物;泳道5,IMAC 流通物(flowthrough);泳道7至11,咪唑洗脱级分。在如实施例部分 所述的简单的一步规程中可以以高得率纯化和重折叠FKBP12-IF1。

图2:根据本发明的野生型hFKBP12(灰线)和hFKBP12-IF1(黑 线)的近紫外圆二色性谱。缓冲液为50mM磷酸钠(pH7.5)、100mM NaCl、1mM EDTA,蛋白质浓度为100μM。250和310nm间的CD信 号报告芳族氨基酸残基的不对称环境。插入SlyD IF环后hFKBP12的平 均残基重量椭圆度(ellipticity)降低。然而,减小的椭圆度仍然针对 FKBP12-IF1嵌合体的紧凑的天然-样构象(黑线)。

图3:在flap结构域中带和不带插入片段的SlyD(1-165,SlyD*) 的近紫外圆二色性谱。缓冲液为50mM磷酸钠(pH7.5)、100mM NaCl、 1mM EDTA,蛋白质浓度为200μM SlyD*和250μM SlyD*(ΔIF环)。 SlyD*的四个酪氨酸残基导致278nm下的平均残基重量椭圆度为~40 deg cm2 dmol-1(灰线)。当flap结构域中的插入片段被除去时,近紫 外CD信号的形状基本保持,但其强度提高(黑线)。这突出显示,在 缺失IF环结构域后,SlyD*的结构完整性大大保持。换言之,它强调了 IF环的结构域特性。

图4:15℃下,在存在浓度渐增的大肠杆菌SlyD*(1-165)的情况 下,RCM-T1的重折叠动力学。(A)根据320nm处的荧光变化,显示 了在0、3、5、8、10、15和20nM大肠杆菌SlyD*存在下100nM RCM-T1 的重折叠动力学。(B)缓慢折叠速率对SlyD*浓度的依赖性。在SlyD*存在和不存在情况下,所观察到的速率常数kapp和k0的比率示为SlyD*浓度的函数。从(B)中线的斜率获得了kcat/KM的值0.68×106M-1s-1。 通过在相同的缓冲液中稀释至2.0M NaCl起始RCM-T1在0.1M Tris-HCl(pH8.0)中的重折叠。

图5:15℃下,在浓度渐增的SlyD缺失变体SlyD(ΔIF环)存在 下,RCM-T1的重折叠动力学。(A)根据320nm处的荧光变化,显示 了在0、1.0、2.0和5.0μM SlyD(ΔIF环)存在下100nM RCM-T1的 重折叠动力学。(B)缓慢折叠速率对SlyD(ΔIF环)浓度的依赖性。 在SlyD(ΔIF环)存在和不存在情况下,所观察到的速率常数kapp和k0的比率示为SlyD(ΔIF环)浓度的函数。从(B)中线的斜率获得了值 ~500M-1s-1。通过在相同的缓冲液中稀释至2.0M NaCl起始RCM-T1 在0.1M Tris-HCl(pH8.0)中的重折叠。

图6:15℃下,在浓度渐增的人脯氨酰异构酶FKBP12存在下, RCM-T1的重折叠动力学。(A)根据320nm处的荧光变化,显示了在 0、0.5、0.8、1.0、1.5和2.0μM hFKBP12存在下100nM RCM-T1的重 折叠动力学。(B)缓慢折叠速率对hFKBP12浓度的依赖性。在hFKBP12 存在和不存在情况下,所观察到的速率常数kapp和k0的比率示为 hFKBP12浓度的函数。从(B)中线的斜率获得了kcat/KM的值0.014×106M-1s-1。通过在相同的缓冲液中稀释至2.0M NaCl起始RCM-T1在0.1M Tris-HCl(pH8.0)中的重折叠。

图7:15℃下,在浓度渐增的根据本发明的嵌合蛋白hFKBP12-IF1 存在下,RCM-T1的重折叠动力学。(A)根据320nm处的荧光变化, 显示了在0、3、5、8、10和20nM hFKBP12-IF1存在下100nM RCM-T1 的重折叠动力学。(B)缓慢折叠速率对hFKBP12-IF1浓度的依赖性。 在hFKBP12-IF1存在和不存在情况下,所观察到的速率常数kapp和k0的 比率示为hFKBP12-IF1浓度的函数。从(B)中线的斜率获得了kcat/KM的值2.5×106M-1s-1。通过在相同的缓冲液中稀释至2.0M NaCl起始 RCM-T1在0.1M Tris-HCl(pH8.0)中的重折叠。

图8:融合蛋白SlyD*-SlyD*-gp41和 hFKBP12-IF1-hFKBP12-IF1-gp41的示意图。融合模块和gp41均以框示 突出显示。蛋白伴侣模块SlyD*和hFKBP12-IF1通过富甘氨酸和丝氨酸 残基的23氨基酸柔性接头与各自的靶分子相连。六组氨酸标记通过间 隔区区段与靶分子的C-末端融合,其提高可接近性并促进纯化和重折 叠。接头由五个重复GGGS元件(G:甘氨酸,S:丝氨酸)组成,间隔 区含有天然存在于SlyD未结构化的C-末端尾部的四个HD重复(H:组 氨酸,D:天冬氨酸)。

图9:根据本发明的嵌合融合蛋白hFKBP12-IF1-gp41的UV光谱。 在基质偶联的重折叠和咪唑洗脱之后,蛋白质在水性缓冲液中是可溶 的。为保持在Lambert-Beer线性范围内的吸收,将蛋白质贮存液在室温 稀释20-倍至50mM磷酸钠(pH7.5)、100mM NaCl、1.5mM EDTA 中的5μM。蛋白质聚集体和高分子结合物是轻的杂散颗粒,它们会导 致310和350nm之间的波长区域内的倾斜基线。光谱形状证明了不存 在任何聚集物并突出显示了hFKBP12-IF1-gp41的溶解度。

图10:15℃下,在浓度渐增的根据本发明的嵌合蛋白hFKBP12-IF4 (带有SlpA插入片段)存在下,RCM-T1的重折叠动力学。(A)根据 320nm处的荧光变化,显示了在0、3、6、10、15和20nM hFKBP12-IF4 存在下100nM RCM-T1的重折叠动力学。(B)缓慢折叠速率对 hFKBP12-IF4浓度的依赖性。在hFKBP12-IF4存在和不存在情况下,所 观察到的速率常数kapp和k0的比率示为hFKBP12-IF4浓度的函数。从(B) 中线的斜率获得了kcat/Km的值850000M-1s-1。通过在相同的缓冲液中稀 释至2.0M NaCl起始RCM-T1在0.1M Tris-HCl(pH8.0)中的重折叠。

图11:15℃下,在浓度渐增的根据本发明的嵌合蛋白hFKBP12-IF5 (带有热球菌属(Thermococcus)FKBP18插入片段)存在下,RCM-T1 的重折叠动力学。(A)根据320nm处的荧光变化,显示了在0、10、 25、30、35和40nM hFKBP12-IF5存在下100nM RCM-T1的重折叠动 力学。(B)缓慢折叠速率对hFKBP12-IF5浓度的依赖性。在hFKBP12-IF5 存在和不存在情况下,所观察到的速率常数kapp和k0的比率示为 hFKBP12-IF5浓度的函数。从(B)中线的斜率获得了kcat/KM的值660000 M-1s-1。通过在相同的缓冲液中稀释至2.0M NaCl起始RCM-T1在0.1M Tris-HCl(pH8.0)中的重折叠。

序列表简述

所附序列表包括以下SEQ ID NO:

SEQ ID NO.1代表根据Suzuki等人,2003,JMB 328,1149-1160 的大肠杆菌SlyD氨基酸序列,其也可从SwissProt数据库通过ID P0A9K9得到。

MKVAKDLVVS LAYQVRTEDG VLVDESPVSA PLDYLHGHGS LISGLETALE GHEVGDKFDV

AVGANDAYGQ YDENLVQRVP KDVFMGVDEL QVGMRFLAET DQGPVPVEIT AVEDDHVVVD

GNHMLAGQNL KFNVEVVAIR EATEEELAHG HVHGAHDHHH DHDHDGCCGG HGHDHGHEHG

GEGCCGGKGN GGCGCH

SEQ ID NO.2显示人FKBP12氨基酸序列(Suzuki等人,前述), 其也可从SwissProt数据库通过ID P62942得到。

GVQVETISPG DGRTFPKRGQ TCVVHYTGML EDGKKFDSSR DRNKPFKFML GKQEVIRGWE

EGVAQMSVGQ RAKLTISPDY AYGATGHPGI IPPHATLVFD VELLKLE

SEQ ID NO.3显示在第22位带有突变的如SEQ ID NO.2所示的人 FKBP12氨基酸序列。为实现更好的溶解性,已将半胱氨酸22改变成丙 氨酸(C22A)。此外,已添加了C-末端六组氨酸标记。

GVQVETISPG DGRTFPKRGQ TAVVHYTGML EDGKKFDSSR DRNKPFKFML GKQEVIRGWE

EGVAQMSVGQ RAKLTISPDY AYGATGHPGI IPPHATLVFD VELLKLEHHH HHH

SEQ ID NO.4显示根据本发明的优选嵌合折叠辅助物蛋白 FKBP12-IF1的氨基酸序列。SlyD插入片段用下划线标示。

FKBP12 G1-G83/SlyD Q70-N129/FKBP12 L97-E107

GVQVETISPG DGRTFPKRGQ TCVVHYTGML EDGKKFDSSR DRNKPFKFML GKQEVIRGWE

EGVAQMSVGQ RAKLTISPDY AYGQYDENLV QRVPKDVFMG VDELQVGMRF LAETDQGPVP

VEITAVEDDH VVVDGNHMLA GQNLVFDVEL LKLE

SEQ ID NO.5显示根据本发明的优选嵌合折叠辅助物蛋白 FKBP12-IF1的氨基酸序列。SlyD插入片段用下划线标示。该序列对应 于SEQ ID NO.4,但半胱氨酸22已被置换成丙氨酸。

FKBP12 G1-G83/SlyD Q70-N129/FKBP12 L97-E107

GVQVETISPG DGRTFPKRGQ TAVVHYTGML EDGKKFDSSR DRNKPFKFML GKQEVIRGWE

EGVAQMSVGQ RAKLTISPDY AYGQYDENLV QRVPKDVFMG VDELQVGMRF LAETDQGPVP

VEITAVEDDH VVVDGNHMLA GQNLVFDVEL LKLE

SEQ ID NO.6显示融合蛋白SlyD*-SlyD*-gp41的氨基酸序列,其以 HIV-1 gp41多肽为靶多肽与两个SlyD*单位融合(与现有技术状态相 比)。载体-载体-靶类型的融合蛋白的示意图示于图8;亦参见实施例1。

EcSlyD-[GGGS]5GGG-EcSlyD-[GGGS]5GGG-gp41(536-681;L555E,L566E,I573T, I580E)-HGHDHDHD-His6,pET24a

MKVAKDLVVS LAYQVRTEDG VLVDESPVSA PLDYLHGHGS LISGLETALE

GHEVGDKFDV AVGANDAYGQ YDENLVQRVP KDVFMGVDEL QVGMRFLAET

DQGPVPVEIT AVEDDHVVVD GNHMLAGQNL KFNVEVVAIR EATEEELAHG

HVHGAHDHHH DHDHDGGGSG GGSGGGSGGG SGGGSGGGKV AKDLVVSLAY

QVRTEDGVLV DESPVSAPLD YLHGHGSLIS GLETALEGHE VGDKFDVAVG

ANDAYGQYDE NLVQRVPKDV FMGVDELQVG MRFLAETDQG PVPVEITAVE

DDHVVVDGNH MLAGQNLKFN VEVVAIREAT EEELAHGHVH GAHDHHHDHD

HDGGGSGGGS GGGSGGGSGG GSGGGTLTVQ ARQLLSGIVQ QQNNELRAIE

AQQHLEQLTV WGTKQLQARE LAVERYLKDQ QLLGIWGCSG KLICTTAVPW

NASWSNKSLE QIWNNMTWME WDREINNYTS LIHSLIEESQ NQQEKNEQEL

LELDKWASLW NWFNITNWLW YHGHDHDHDH HHHHH

SEQ ID NO.7显示嵌合融合蛋白hFKBP12-IF1-hFKBP12-IF1-gp41 的氨基酸序列,其以HIV-1 gp41多肽作为靶多肽与根据本发明的 hFKBP12-IF1融合(串联融合蛋白)。该蛋白质的示意图示于图8;亦 参见实施例1。

MGVQVETISP GDGRTFPKRG QTAVVHYTGM LEDGKKFDSS RDRNKPFKFM

LGKQEVIRGW EEGVAQMSVG QRAKLTISPD YAYGQYDENL VQRVPKDVFM

GVDELQVGMR FLAETDQGPV PVEITAVEDD HVVVDGNHML AGQNLVFDVE

LLKLEGGGSG GGSGGGSGGG SGGGSGGGGV QVETISPGDG RTFPKRGQTA

VVHYTGMLED GKKFDSSRDR NKPFKFMLGK QEVIRGWEEG VAQMSVGQRA

KLTISPDYAY GQYDENLVQR VPKDVFMGVD ELQVGMRFLA ETDQGPVPVE

ITAVEDDHVV VDGNHMLAGQ NLVFDVELLK LEGGGSGGGS GGGSGGGSGG

GSGGGTLTVQ ARQLLSGIVQ QQNNELRAIE AQQHLEQLTV WGTKQLQARE

LAVERYLKDQ QLLGIWGCSG KLICTTAVPW NASWSNKSLE QIWNNMTWME

WDREINNYTS LIHSLIEESQ NQQEKNEQEL LELDKWASLW NWFNITNWLW

YLEHHHHHH

SEQ ID NO.8显示SlyD*(SlyD 1-165)的氨基酸序列——对应于 SEQ ID NO.1,但在C-末端残基no.D165(天冬氨酸)后截短。此外, SEQ ID NO.8在其C-末端携带六组氨酸标记。

MKVAKDLVVS LAYQVRTEDG VLVDESPVSA PLDYLHGHGS LISGLETALE GHEVGDKFDV

AVGANDAYGQ YDENLVQRVP KDVFMGVDEL QVGMRFLAET DQGPVPVEIT AVEDDHVVVD

GNHMLAGQNL KFNVEVVAIR EATEEELAHG HVHGAHDHHH DHDHDHHHHH H

SEQ ID NO.9显示不带IF-环的如SEQ ID NO.8所示的SlyD*(1-165)的氨基酸序列。该变体也称作SlyD*ΔIF-环。为进行重折叠和 纯化,其在其C-末端携带六组氨酸标记。

MKVAKDLVVS LAYQVRTEDG VLVDESPVSA PLDYLHGHGS LISGLETALE GHEVGDKFDV

AVGANDAYGA TGHPGIIPPH ATLKFNVEVV AIREATEEEL AHGHVHGAHD HHHDHDHDHH HHHH

SEQ ID NO.10显示编码为促进纯化而带有C-末端六组氨酸标记的 蛋白质FKBP12-IF1的合成基因的氨基酸序列。翻译后由细菌N-甲硫氨 酰-氨肽酶将N-末端甲硫氨酸切除,由此成熟多肽实际上从甘氨酸1起 始。当半胱氨酸22被丙氨酸取代时,所得FKBP12-IF1氨基酸序列对应 于SEQ ID NO.5。

MGVQVETISP GDGRTFPKRG QTCVVHYTGM LEDGKKFDSS RDRNKPFKFM

LGKQEVIRGW EEGVAQMSVG QRAKLTISPD YAYGQYDENL VQRVPKDVFM

GVDELQVGMR FLAETDQGPV PVEITAVEDD HVVVDGNHML AGQNLVFDVE

LLKLEHHHHH H

SEQ ID NO.11显示FKBP12-IF1(C22A)-gp41融合构建体(亦参 见实施例1)。

MGVQVETISP GDGRTFPKRG QTAVVHYTGM LEDGKKFDSS RDRNKPFKFM

LGKQEVIRGW EEGVAQMSVG QRAKLTISPD YAYGQYDENL VQRVPKDVFM

GVDELQVGMR FLAETDQGPV PVEITAVEDD HVVVDGNHML AGQNLVFDVE

LLKLEGGGSG GGSGGGSGGG SGGGSGGGTL TVQARQLLSG IVQQQNNELR

AIEAQQHLEQ LTVWGTKQLQ ARELAVERYL KDQQLLGIWG CSGKLICTTA

VPWNASWSNK SLEQIWNNMT WMEWDREINN YTSLIHSLIE ESQNQQEKNE

QELLELDKWA SLWNWFNITN WLWYLEHHHH HH

SEQ ID NO.12显示根据Suzuki等人,2003,JMB 328,1149-1160 的大肠杆菌SlpA氨基酸序列,其也可通过SwissProt数据库的ID P0AEM0获得。存在于未加工蛋白中的N-末端Met残基(SEQ ID NO.12 中未示出)在翻译后被除去。迄今为止,SlpA的信息非常少。除了作为 具有对于肽底物的相当低活性的脯氨酰异构酶的初步特征外,事实上至 今对于SlpA一无所知。

SESVQSNSAV LVHFTLKLDD GTTAESTRNN GKPALFRLGD ASLSEGLEQH LLGLKVGDKT

TFSLEPDAAF GVPSPDLIQY FSRREFMDAG EPEIGAIMLF TAMDGSEMPG VIREINGDSI

TVDFNHPLAG QTVHFDIEVL EIDPALEA

SEQ ID NO.13显示根据本发明又一优选嵌合折叠辅助物蛋白 FKBP12-IF4的氨基酸序列。SlpA插入片段用下划线标示。此外还添加 了C-末端六组氨酸标记。

FKBP12 G1-G83/SlpA V72-T132/FKBP12 L97-E107

GVQVETISPG DGRTFPKRGQ TAVVHYTGML EDGKKFDSSR DRNKPFKFML GKQEVIRGWE

EGVAQMSVGQ RAKLTISPDY AYGVPSPDLI QYFSRREFMD AGEPEIGAIM LFTAMDGSEM

PGVIREINGD SITVDFNHPL AGQTLVFDVE LLKLEHHHHH H

SEQ ID NO.14显示热球菌属FKBP18氨基酸序列,其也可通过 SwissProt数据库的ID O93778获得。

MKVEAGDYVL FHYVGRFEDG EVFDTSYEEI ARENGILVEE REYGPMWVRI GVGEIIPGLD

EAIIGMEAGE KKTVTVPPEK AYGMPNPELV ISVPREEFTK AGLEPQEGLY VMTDSGIAKI

VSVGESEVSL DFNHPLAGKT LVFEVEVIEV KKAEEDSEA

SEQ ID NO.15显示根据本发明又一优选嵌合折叠辅助物蛋白 FKBP12-IF5的氨基酸序列。热球菌属FKBP18插入片段用下划线表示。 此外还添加了C-末端六组氨酸标记。

FKBP12 G1-G83/TcFKBP18 M84-T140/FKBP12 L97-E107

GVQVETISPG DGRTFPKRGQ TCVVHYTGML EDGKKFDSSR DRNKPFKFML GKQEVIRGWE

EGVAQMSVGQ RAKLTISPDY AYGMPNPELV ISVPREEFTK AGLEPQEGLY VMTDSGIAKI

VSVGESEVSL DFNHPLAGKT LVFDVELLKL EHHHHHH

SEQ ID NO.16显示大肠杆菌引发因子氨基酸序列,其也可通过 SwissProt数据库的ID P0A850获得。

MQVSVETTQG LGRRVTITIA ADSIETAVKS ELVNVAKKVR IDGFRKGKVP MNIVAQRYGA

SVRQDVLGDL MSRNFIDAII KEKINPAGAP TYVPGEYKLG EDFTYSVEFE VYPEVELQGL

EAIEVEKPIV EVTDADVDGM LDTLRKQQAT WKEKDGAVEA EDRVTIDFTG SVDGEEFEGG

KASDFVLAMG QGRMIPGFED GIKGHKAGEE FTIDVTFPEE YHAENLKGKA AKFAINLKKV

EERELPELTA EFIKRFGVED GSVEGLRAEV RKNMERELKS AIRNRVKSQA IEGLVKANDI

DVPAALIDSE IDVLRRQAAQ RFGGNEKQAL ELPRELFEEQ AKRRVVVGLL LGEVIRTNEL

KADEERVKGL IEEMASAYED PKEVIEFYSK NKELMDNMRN VALEEQAVEA VLAKAKVTEK

ETTFNELMNQ QA

SEQ ID NO.17显示根据SEQ ID NO.16的大肠杆菌引发因子的 FKBP结构域。甲硫氨酸140至谷氨酸251的氨基酸属于引发因子的 FKBP结构域。

MLDTLRKQQA TWKEKDGAVE AEDRVTIDFT GSVDGEEFEG GKASDFVLAM GQGRMIPGFE

DGIKGHKAGE EFTIDVTFPE EYHAENLKGK AAKFAINLKK VEERELPELT AE

SEQ ID NO.18显示本发明又一实施方案的氨基酸序列。在该嵌合 折叠辅助物蛋白(引发因子-IF/SlyD)中,源自SlyD的IF结构域插入到 大肠杆菌引发因子的FKBP结构域中。该SlyD插入片段用下划线标示。

大肠杆菌引发因子/FKBP-+IF

TF M140-H222/SlyD Q70-N129/TF A231-E251

MLDTLRKQQA TWKEKDGAVE AEDRVTIDFT GSVDGEEFEG GKASDFVLAM GQGRMIPGFE

DGIKGHKAGE EFTIDVTFPE EYHQYDENLV QRVPKDVFMG VDELQVGMRF LAETDQGPVP

VEITAVEDDH VVVDGNHMLA GQNAKFAINL KKVEERELPE LTAE

SEQ ID NO.19显示来自大肠杆菌的未加工前体FkpA的氨基酸序 列。新翻译的FkpA携带用于输出到周质的N-末端信号序列(Met 1-Ala 25)。通过内膜后,信号肽酶特异性除去该信号序列,由此该序列在加 工的功能蛋白中缺失。FkpA含有N-末端伴侣和二聚化结构域以及C-末 端异构酶结构域(Gly 147-K249)。在RNA酶T1测试中,FkpA显示 约250,000M-1s-1的催化效率。该FkpA序列也可通过SwissProt ID: P45523得到。

MKSLFKVTLL ATTMAVALHA PITFAAEAAK PATAADSKAA FKNDDQKSAY ALGASLGRYM

ENSLKEQEKL GIKLDKDQLI AGVQDAFADK SKLSDQEIEQ TLQAFEARVK SSAQAKMEKD

AADNEAKGKE YREKFAKEKG VKTSSTGLVY QVVEAGKGEA PKDSDTVVVN YKGTLIDGKE

FDNSYTRGEP LSFRLDGVIP GWTEGLKNIK KGGKIKLVIP PELAYGKAGV PGIPPNSTLV

FDVELLDVKP APKADAKPEA DAKAADSAKK

SEQ ID NO.20显示如SEQ ID NO.19中所示FkpA的FKBP结构域 的氨基酸序列(G147-K249)。C-末端序列LE因克隆策略被包含在其中。 已添加了C-末端六组氨酸标记以促进纯化。据假定,该FKBP结构域在 RNA酶T1折叠试验中具有弱活性,该活性介于SlyD*ΔIF环和人 FKBP12之间(参见表1)。

GLVYQVVEAG KGEAPKDSDT VVVNYKGTLI DGKEFDNSYT RGEPLSFRLD GVIPGWTEGL

KNIKKGGKIK LVIPPELAYG KAGVPGIPPN STLVFDVELL DVKPAPLEHH HHHH

SEQ ID NO.21显示根据本发明又一实施方案的氨基酸序列。在该 嵌合折叠辅助物蛋白质FKpA-IF/SlyD中,源自SlyD的IF结构域被插入 到FkpA的FKBP结构域(如SEQ ID NO.20中所示)中。已添加了C- 末端六组氨酸标记以促进纯化。预期该嵌合折叠辅助物蛋白在RNA酶 T1折叠试验中显示高活性。

FkpA G147-G226/SlyD Q70-N129/FkpA L239-P252

GLVYQVVEAG KGEAPKDSDT VVVNYKGTLI DGKEFDNSYT RGEPLSFRLD GVIPGWTEGL

KNIKKGGKIK LVIPPELAYG QYDENLVQRV PKDVFMGVDE LQVGMRFLAE TDQGPVPVEI

TAVEDDHVVV DGNHMLAGQN LVFDVELLDV KPAPLEHHHH HH

详述

本发明涉及编码嵌合融合蛋白的重组DNA分子,其包含:

a)至少一个编码非-人伴侣蛋白多肽结合区段的核苷酸序列

b)其上游至少一个编码FK506结合蛋白(FKBP)或FK506-结合- 蛋白-样结构域(FKBP-样结构域)的核苷酸序列和

c)其下游至少一个编码FK506结合蛋白(FKBP)或FK506-结合- 蛋白-样结构域(FKBP-样结构域)的核苷酸序列。一方面a)的核苷酸 序列,和另一方面b)和c)的核苷酸序列可源自相同的生物,但是它 们必须编码不同的亲本FKBP分子。更确切的说,a)编码一个FKBP分 子的伴侣结构域(例如SlyD或SlpA),且b)和c)编码另一个分子的 FKBP结构域或FKBP-样结构域(例如人FKBP12)。编码FK506结合 蛋白(FKBP)或FK506-结合-蛋白-样结构域(FKBP-样结构域)的核苷 酸序列,也即部分b)和部分c)的那些可源自相同的生物,但是它们 也可以源自不同的生物。优选b)和c)下所给出的序列源自相同的生 物。更优选地,它们源自相同的亲本FKBP分子,例如,人FKBP12。

具体地,本发明涉及编码嵌合融合蛋白的重组DNA分子,其包含:

a)至少一个编码非-人伴侣蛋白多肽结合区段的核苷酸序列

b)其上游至少一个编码FKBP型人肽基脯氨酸顺反异构酶(PPIase) 的核苷酸序列和

c)其下游至少一个编码FKBP型人肽基脯氨酸顺反异构酶(PPIase) 的核苷酸序列。

术语“重组DNA分子”指,通过基因工程技术或化学合成,通过人 工操作分离的多核苷酸区段来完成的将序列的两个否则分开的区段组 合在一起而得到的DNA分子。在这样做的时候,人们可以将具有所需 功能的多核苷酸区段连接到一起从而产生所需功能的组合。

术语“嵌合融合蛋白”意指,多肽结合结构域和FKBP(或FKBP-样) 结构域源自不同的亲本分子。我们将FKBP或FKBP-样结构域视作可以 将伴侣结构域嫁接于其上从而产生具有优越折叠辅助物活性的优越蛋 白伴侣的折叠支架。在本发明中,非-人多肽与人多肽序列融合。嵌合蛋 白还可称作“镶嵌蛋白”。由于本发明的一个目的是将折叠辅助物蛋白人 源化由此所得蛋白在诊断应用中更可耐受,因此非-人氨基酸序列的百分 比与完整嵌合融合蛋白的长度相比优选不超过百分之五十的部分。

优选根据a)、b)和c)的核苷酸序列不被额外的接头序列分隔开, 而是直接彼此相邻。

“上游”方向意指,核苷酸位于多核苷酸的5’方向,也即朝向第一个 核苷酸。在氨基酸序列方面术语“上游”意指,氨基酸位于N-末端方向, 也即朝向多肽的起始处。

“下游”方向意指,核苷酸位于多核苷酸的3’方向,也即朝向最后一 个核苷酸。在氨基酸序列方面术语“下游”意指,氨基酸位于C-末端方向, 也即朝向多肽的末端处。

如果多核苷酸在其天然状态或当用本领域已知的方法进行操作时, 可被转录和/或被翻译以产生多肽或其片段,则说该多核苷酸“编码”多 肽。

蛋白伴侣的“多肽结合区段”被视为在蛋白质的三维折叠过程中蛋 白伴侣中结合和保持多肽链的部分。大肠杆菌蛋白伴侣SlyD的“多肽结 合区段”,即其伴侣特性,在本申请中已被定位于所谓的IF结构域(insert in flap结构域,氨基酸~76-122)。作为自主折叠单位,蛋白质结构域 在水溶液中能够采取天然-样的稳定折叠。术语“多肽结合区段”、“IF-环”、 IF-结构域或伴侣结构域可同义使用。

优选的非-人蛋白伴侣是大肠杆菌SlyD和SlpA以及如由Suzuki等 人,2003,JMB 328,1149-1160列出的比如来自热自养甲烷球菌 (Methanococcus thermolithotrophicus)的FKBP17、来自詹氏甲烷球菌 (Methanococcus jannaschii)的FKBP18、来自热球菌属物种 (Thermococcus sp.)KS1的FKBP18、来自堀越氏火球菌(Pyrococcus horikoshii)的FKBP29、来自詹氏甲烷球菌的FKBP26和来自敏捷气热 菌(Aeropyrum pernix)的FKBP30这样的古细菌的FKBP蛋白伴侣。

在优选的实施方案中,至少一个编码非-人伴侣蛋白多肽结合区段的 核苷酸序列包含编码非-人FK506结合蛋白(FKBP)的序列。更优选的 是大肠杆菌、热自养甲烷球菌、詹氏甲烷球菌、热球菌属物种KS1、堀 越氏火球菌或敏捷气热菌的FKBP序列,大肠杆菌SlyD和SlpA序列是 最优选的。

在特别优选的实施方案中,大肠杆菌SlyD序列包含编码N-末端起 始于位于SEQ ID NO.1第56至75位氨基酸之间任一氨基酸和C-末端 终止于位于SEQ ID NO.1第122至136位氨基酸之间任一氨基酸的多肽 的核苷酸序列。最优选为编码N-末端起始于SEQ ID NO.1第70位氨基 酸和C-末端终止于SEQ ID NO.1第129位氨基酸的多肽的序列。

在进一步优选的实施方案中,大肠杆菌SlyA序列包含编码N-末端 起始于位于SEQ ID NO.12第56至75位氨基酸之间任一氨基酸和C-末 端终止于位于SEQ ID NO.12第122至136位氨基酸之间任一氨基酸的 多肽的核苷酸序列。最优选为编码N-末端起始于SEQ ID NO.12第72 位氨基酸和C-末端终止于SEQ ID NO.12第132位氨基酸的多肽的序列。

至于相邻于编码非-人伴侣蛋白多肽结合区段的核苷酸序列的上游 和下游序列,这些上游和下游序列起源于FK506结合蛋白或FK506-结 合-蛋白-样结构域(也称作FKBP-样结构域)。

根据本发明,FK506结合蛋白(FKBP)是能够识别和以纳摩尔范围 的高亲和力结合免疫抑制剂FK506的蛋白。FKBP-样结构域(“FK506- 结合-蛋白-样结构域”)或FKBP-样蛋白是不再容易受或几乎不受由 FK506导致的脯氨酰异构酶抑制影响的蛋白或蛋白部分。这些FKBP-样 结构域与象FKBP12一样的FK506结合蛋白共有相当大的序列和结构相 似性,但是一些介导FK506结合的氨基酸残基被突变,且亲和力转变为 微摩尔范围。例如,SlyD和引发因子,来自大肠杆菌胞质的两种PPIase, 被视为FKBP-样蛋白质(Callebaut & Mornon,FEBS Lett.(1995)374 (2)211-215;Wülfing等人,J.Biol.Chem.(1994)269(4),2895-2901))。

就相邻于编码象大肠杆菌SlyD或SlpA一样的非-人伴侣蛋白多肽 结合区段的核苷酸序列的上游和下游序列来说,优选编码FKBP型人肽 基脯氨酸顺反异构酶的上游和/或下游核苷酸序列包含编码FK506结合 蛋白(FKBP)或FKBP-样结构域的核苷酸序列,编码人FKBP12的序列 尤其优选。

进一步在优选的实施方案中,编码FKBP12的上游核苷酸序列包含 编码N-末端起始于位于SEQ ID NO.3第1至20位氨基酸之间任一氨基 酸和C-末端终止于位于SEQ ID NO.3第70至89位氨基酸之间任一氨 基酸的多肽的序列。

同样优选的是其中编码FKBP12的下游核苷酸序列包含编码N-末端 起始于位于SEQ ID NO.3第90至97位氨基酸之间任一氨基酸和C-末 端终止于位于SEQ ID NO.3第103至107位氨基酸之间任一氨基酸的多 肽的序列的实施方案。

最优选的是包含编码根据SEQ ID NO.4的多肽的核苷酸序列的重 组DNA分子。SEQ ID NO.4显示N-末端起始于SEQ ID NO.3的氨基酸 位置甘氨酸/G 1至甘氨酸/G 83(FKBP12),继以SEQ ID NO.1的氨基 酸位置谷胺酰胺/Q 70至天冬酰胺/N 129(SlyD),并以SEQ ID NO.3 的亮氨酸/L 97至谷氨酸/E 107(FKBP12)结束的氨基酸序列。对应于 SEQ ID NO.4所示氨基酸序列的多肽也称作FKBP12-IF1。

在本发明的又一种优选实施方案中,重组DNA分子包含编码根据 SEQ ID NO.13的多肽的核苷酸序列。SEQ ID NO.13显示N-末端起始 于SEQ ID NO.3的氨基酸位置甘氨酸/G 1至甘氨酸/G 83(FKBP12), 继以SEQ ID NO.12的氨基酸位置缬氨酸/V72至苏氨酸/T 132(SlyA), 并以SEQ ID NO.3的亮氨酸/L 97至谷氨酸/E 107(FKBP12)结束的氨 基酸序列。对应于SEQ ID NO.13所示氨基酸序列的多肽也称作FKBP12 -IF4。

在本发明的又一种优选实施方案中,重组DNA分子包含编码根据 SEQ ID NO.15的多肽的核苷酸序列。

SEQ ID NO.15显示N-末端起始于SEQ ID NO.3的氨基酸位置甘氨 酸/G 1至甘氨酸/G 83(FKBP12),继以SEQ ID NO.14的氨基酸位置 甲硫氨酸/M84至苏氨酸/T140(热球菌属FKBP18),并以SEQ ID NO.3 的亮氨酸/L 97至谷氨酸/E 107(FKBP12)结束的氨基酸序列。对应于 SEQ ID NO.15所示氨基酸序列的多肽也称作FKBP12-IF5。

以这样的方式选择插入到编码非-人伴侣蛋白多肽结合区段的序列 上游和下游的DNA序列是有利的:二维结构元件比如β-折叠不被异源 序列元件打断而保持其完整。通常已知的序列比对辅助选择适宜的上游 和下游序列,如同例如,Suzuki等人,2003,JMB 328,1149-1160。

根据本发明,编码非-人伴侣蛋白多肽结合区段的核苷酸序列和上游 和下游核苷酸序列,也即编码FK506结合蛋白(FKBP)或FK506-结合- 蛋白-样结构域(FKBP-样结构域),和优选编码FKBP型人肽基脯氨酸 顺反异构酶(PPIase)的核苷酸序列,的选择和安排以这样的方式完成: 所得嵌合融合蛋白的总体结构顺序对应于天然存在的蛋白伴侣的结构。 换言之,总体结构优选维持如同现有技术状态中所述的象α-螺旋和β- 折叠一样的二级结构元件的安排(例如Suzuki等人,2003,JMB 328, 1149-1160)。

本发明具体涉及由这样的重组DNA分子表达产生的嵌合融合蛋 白。

通过上述鉴定的重组DNA分子的表达,我们已经能够提供细菌 PPIase蛋白伴侣SlyD、FkpA、引发因子和SlpA的对应物,及甚至细菌 PPIase蛋白伴侣SlyD、引发因子和SlpA的人源化对应物。这些人源化 的肽基脯氨酸顺反异构酶蛋白伴侣可作为生物技术应用中的有益工具 以及诊断测试中的添加物起作用。如在本申请实验部分可以看到的,我 们已经能够获得比野生型折叠辅助物具有更高催化效率的人源化蛋白 伴侣,所述野生型折叠辅助物的氨基酸序列被包含在本发明的人源化蛋 白伴侣中。基于在显示蛋白的折叠和重折叠能力的RNA酶T1重折叠测 试系统中的观察,我们已经能够显示分离的人FKBP12仅具有约14,000 M-1s-1的小催化效率。分离的未修饰大肠杆菌SlyD的催化效率达到 680,000M-1s-1。在RNA酶T1折叠测定中,SlyD的缺乏IF环结构域的 缺失变体显示~500M-1s-1的可忽略的催化效率。令人惊奇的是,嵌合分 子FKBP12-IF1(氨基酸序列示于SEQ ID NO.4)的催化效率大大超过 了该值。FKBP12-IF1显示约2,500,000M-1s-1(亦参见实施例部分表1) 的杰出的催化效率,其超过迄今为止已知的最有效的脯氨酰异构酶的 值。该值甚至超过了引发因子的催化效率,后者等于1.2×106M-1s-1(Stoller等人(1995)EMBO J.14,4939-4984;Zarnt等人(1997)J.Mol. Biol.271,827-837;Scholz等人(1997)EMBO J.16,54-58)。

通过将人FK506结合蛋白的脯氨酰异构酶中心的活性位点与非-人 伴侣蛋白的多肽结合结构域(即所谓的IF环)组合,我们已经产生了具 有卓越的伴侣和酶特性的折叠辅助物。我们已经能够提供比分离的野生 型蛋白质具有更高催化效率的折叠辅助物。因此根据本发明的折叠辅助 物关于其卓越的催化效率也可称作超蛋白伴侣(super chaperone)。

因此部分本发明是重组产生的融合蛋白,其含有a)包含非-人伴侣 蛋白的多肽结合区段的多肽序列,b)与非-人伴侣多肽序列N-末端融合 的FK506结合蛋白(FKBP)或FK506-结合-蛋白-样结构域(FKBP-样结 构域)的多肽序列,和c)与非-人伴侣多肽序列C-末端融合的FK506 结合蛋白(FKBP)或FK506-结合-蛋白-样结构域(FKBP-样结构域)的 多肽序列。

由此一种优选实施方案是重组产生的融合物,其含有:a)包含非- 人伴侣蛋白的多肽结合区段的多肽序列,b)与非-人伴侣多肽序列N- 末端融合的人FKBP型肽基脯氨酸顺反异构酶多肽序列,c)与非-人伴 侣多肽序列C-末端融合的人FKBP型肽基脯氨酸顺反异构酶多肽序列。 优选实施方案是包含大肠杆菌SlyD蛋白伴侣序列多肽结合区段和N-及 C-末端与SlyD序列融合的人FKBP12多肽序列的嵌合融合蛋白。本发明 优选实施方案中的一种是包含根据SEQ ID NO.4的氨基酸序列的嵌合 融合蛋白。

还优选的是包含大肠杆菌SlpA蛋白伴侣序列多肽结合区段和N-及 C-末端与SlpA序列融合的人FKBP12多肽序列的嵌合融合蛋白。在实 施例部分和表1中给出了包含大肠杆菌SlpA蛋白伴侣序列多肽结合区 段的嵌合融合蛋白的更多细节。

一种本发明的优选实施方案是包含根据SEQ ID NO.13的氨基酸序 列的嵌合融合蛋白。该蛋白称作FKPB12-IF4。

还优选的是包含热球菌属FKBP18蛋白伴侣序列多肽结合区段和N- 及C-末端与热球菌属FKBP18序列融合的人FKBP12多肽序列的融合蛋 白。热球菌属FKBP18是SlyD的热稳定同源物,其在脯氨酰异构酶活性 位点附近的flap区域带有IF结构域。热球菌属FKBP18的氨基酸序列示于 SEQ ID NO.14。所得嵌合融合蛋白的氨基酸序列示于SEQ ID NO.15,其 中推定的热球菌属FKBP18的IF环结构域嫁接于hFKBP12的折叠支架上。 实施例部分和表1中给出了有关该嵌合融合蛋白的更多细节。

在本发明的另一实施方案中,起源于SlyD的IF结构域被插入到大 肠杆菌引发因子的FKBP结构域中。SEQ ID NO.18显示该嵌合折叠辅 助物蛋白质(引发因子-IF/SlyD)的氨基酸序列。起源于SlyD的IF结构 域被插入到大肠杆菌引发因子的FKBP结构域。SlyD插入片段用下划线 标示。

在又一种实施方案中,起源于SlyD的IF结构域被插入到FkpA的 FKBP结构域中(如SEQ ID NO.20所示)。所得嵌合折叠辅助物蛋白 称作FkpA-IF/SlyD。预期该嵌合折叠辅助物蛋白在RNA酶T1折叠试验 中显示高活性。SEQ ID NO.21显示根据本发明的嵌合折叠辅助物蛋白 的氨基酸序列。

从我们的实验,我们推断SlyD、SlpA和TcFKBP18的伴侣功能被 限制于所谓的IF(insert in flap)结构域。我们得出结论认为,不同FKBP- 蛋白伴侣的IF结构域在结构上相关且功能等同。因此,来自于不同 FKBP-蛋白伴侣的IF结构域应当能够互换。我们假定SlyD内的IF结构 域可被例如SlpA或TcFKBP18中的推定IF结构域取代,而不危及SlyD 的真实折叠辅助物特性。这一伴侣结构域的互换应当可能是相互的,也 即推定的IF结构域可以被嫁接到SlpA或TcFKBP18的FKBP-样结构域 上以产生功能性蛋白伴侣模块。伴侣结构域的互换可以为具有适合于各 自靶蛋白的底物亲和力的定制折叠辅助物铺平道路。

在FKBP-X融合蛋白中,FKBP作为载体模块起作用,且X意指客 或靶蛋白,载体模块和客蛋白以封闭和开放形式的动态平衡存在。在封 闭形式中,疏水区域被遮蔽,且由此融合蛋白保持可溶而不聚集。在开 放形式,抗原位点被暴露,这使得客蛋白例如在免疫测定中成为有功能 的。因此亲和力必须在融合蛋白中得到很好地平衡,而且它可以通过来 自不同FKBP-蛋白伴侣的IF-结构域的互换根据靶模块的需要进行适应。

任选地所有嵌合融合蛋白可进一步与靶多肽序列融合。根据本发明 的靶多肽可以是从较大量需要的任何多肽,且因此难于从其它非重组来 源分离或纯化。

优选通过本发明方法产生的靶蛋白的例子包括哺乳动物基因产物, 比如酶、细胞因子、生长因子、激素、疫苗、抗体等。更具体地,本发 明的优选的超表达基因产物包括比如促红细胞生成素、胰岛素、生长激 素、生长激素释放因子、血小板衍生生长因子、表皮生长因子、转化生 长因子α、转化生长因子、表皮生长因子、成纤维细胞生长因子、神经 生长因子、胰岛素-样生长因子I、胰岛素-样生长因子II、凝血因子VIII、 超氧化物歧化酶、干扰素、y-干扰素、白细胞介素-1、白细胞介素-2、 白细胞介素-3、白细胞介素-4、白细胞介素-5、白细胞介素-6、粒细胞集 落刺激因子、多谱系集落刺激因子、粒细胞-巨噬细胞刺激因子、巨噬细 胞集落刺激因子、T细胞生长因子、淋巴毒素等这样的基因产物。优选 的超表达基因产物是人基因产物。

此外,本方法可容易地适应以增强可用作疫苗的任何超表达基因产 物的分泌。可用作疫苗的超表达基因产物包括哺乳动物病原体的任何结 构的、膜相关、膜结合或分泌的基因产物。哺乳动物病原体包括可影响 或攻击哺乳动物的病毒、细菌、单细胞或多细胞寄生物。例如,病毒疫 苗可包括对抗比如人免疫缺陷病毒(HIV)、痘苗、脊髓灰质炎病毒、 腺病毒、流感、甲型肝炎、乙型肝炎、登革病毒、日本B脑炎、水痘带 状疱疹、巨细胞病毒、甲型肝炎、轮状病毒的病毒的疫苗,以及对抗比 如麻疹、黄热、腮腺炎、狂犬病、疱疹、流感、副流感等这样的病毒病 的疫苗。细菌疫苗可包括对抗比如霍乱弧菌(Vibrio cholerae)、伤寒沙 门氏菌(Salmonella typhi)、百日咳博德特氏菌(Bordetella pertussis)、 肺炎链球菌(Streptococcus pneumoniae)、流感嗜血菌(Haemophilus influenzae)、破伤风梭菌(Clostridium tetani)、白喉棒杆菌 (Corynebacterium diphtheriae)、麻风分枝杆菌(Mycobacterium leprae)、 立氏立克次氏体(R.rickettsii)、志贺氏菌属(Shigella)、淋病奈瑟氏 球菌(Neisseria gonorrhoeae)、脑膜炎奈瑟氏球菌(Neisseria meningitidis)、粗球孢菌(Coccidioides immitis)、布氏疏螺旋体(Borrelia burgdorferi)等这样的细菌的疫苗。优选地,靶蛋白是由比如来自HIV-1 的gp41和p17、来自HIV-2的gp36和p16、来自HTLV-I/II的gp21这 样的逆转录病毒蛋白组成的组,由比如来自风疹病毒的E1和E2这样的 病毒包膜蛋白组成的组,或由比如β-AP42(Alzheimer肽)这样的促淀 粉样变蛋白组成的组的成员或朊病毒蛋白。

根据本发明的靶多肽还可含有被构建为作为单个重组多肽表达的 来自几种不同蛋白质的序列,例如诊断相关表位。

编码嵌合融合蛋白的重组DNA分子,其含有a)至少一个编码非- 人伴侣蛋白多肽结合区段的核苷酸序列,b)其上游至少一个编码FK506 结合蛋白或FK506-结合-蛋白-样结构域(FKBP-样结构域)的核苷酸序 列和c)其下游至少一个编码FK506-结合-蛋白-样结构域(FKBP-样结构 域)的核苷酸序列和d)至少一个编码靶多肽的核苷酸序列,也是本发 明的目的。

优选地,编码嵌合融合蛋白的重组DNA分子,其含有a)至少一个 编码非-人伴侣蛋白多肽结合区段的核苷酸序列,b)其上游至少一个编 码FKBP型人肽基脯氨酸顺反异构酶(PPIase)的核苷酸序列和,c)其 下游至少一个编码FKBP型人肽基脯氨酸顺反异构酶(PPIase)的核苷 酸序列和d)至少一个编码靶多肽的核苷酸序列,也是本发明的目的。

编码靶多肽的核苷酸序列以这样的方式插入是重要的:根据步骤 a)、b)和c)编码嵌合超蛋白伴侣的序列保持完整以便使其维持其催 化和伴侣功能。这意味着编码靶多肽的核苷酸序列被符合读框地插入到 编码嵌合融合蛋白的序列的上游或下游。它可以被插入到上游和下游, 且也可以插入多于一个的拷贝。

根据本发明的编码嵌合融合蛋白和靶多肽的重组DNA还可含有在 完整蛋白表达后导致产生接头多肽的接头序列。如同本领域技术人员将 理解的,这样的接头多肽被设计为最适于预期的应用,尤其在长度、柔 性、电荷和溶解度方面。

带有一个或几个氨基酸取代或缺失的嵌合融合蛋白的变体也可用 于获得本发明的重组DNA或嵌合融合蛋白。本领域技术人员可以容易 地断言通过实施例部分所描述的程序这样的变体是否适于本发明的方 法。

通过在适宜的宿主细胞中复制,可以产生大量的多核苷酸。编码蛋 白质或其片段的天然或合成DNA片段将被整合进能够导入原核或真核 细胞并在其中复制的重组多核苷酸构建体,通常为DNA构建体中。

多核苷酸也可以通过化学合成产生,包括但不限于Beaucage,S.L. 和Caruthers,M.H.,Tetrahedron Letters 22(1981)1859-1862中所述的 亚磷酰胺法以及根据Matteucci,M.D和Caruthers,M.H.,J.Am.Chem. Soc.103(1981)3185-3191的三酯法。通过合成互补链并在适宜条件下 使链一起退火或者通过用DNA聚合酶和适宜的引物序列添加互补链, 可以从化学合成的单链产物获得双链片段。

当多核苷酸序列被置于与另一多核苷酸序列具有功能上的关系时, 核苷酸序列是可操作地连接的。例如,启动子与编码序列可操作地连接, 如果该启动子影响编码序列的转录或表达的话。通常,可操作连接的意 指连接的序列是连续的,且在必须连接两个蛋白编码区时,不仅连续而 且符合读框。然而,人们熟知的是,比如增强子这样的某些遗传元件可 以以一定的距离可操作地连接,即使是不连续的。

为导入宿主制备的DNA构建体通常含有被宿主识别的复制系统, 包括预期的编码所需嵌合融合肽的DNA片段和任选地附加靶多肽,且 还优选将包括与多肽编码区段可操作相连的转录和翻译起始调节序列。 表达系统(表达载体)可包括,例如,复制起点或自主复制序列(ARS) 和表达控制序列、启动子、增强子和必需的加工信息位点,比如核糖体 结合位点、RNA剪接位点、聚腺苷酸化位点、转录终止序列和mRNA 稳定序列。

选择适宜的启动子和其它必需的载体序列以使得在宿主中有功能。 能够工作的细胞系与表达载体组合的例子包括但不限于Sambrook,J. 等人在“Molecular Cloning:A Laboratory Manual”(1989)-,Eds.J. Sambrook,E.F.Fritsch和T.Maniatis,Cold Spring Harbour Laboratory Press,Cold Spring Harbour中,或Ausubel,F.等人在“Current protocols in molecular biology”(1987和定期更新),Eds.F.Ausubel,R.Brent和 K.R.E.,Wiley & Sons Verlag,纽约;和Metzger,D.,等人,Nature 334 (1988)31-6中描述的那些。许多在细菌、酵母、哺乳动物、昆虫、植 物或其它细胞中有用的表达载体是本领域已知的,且可获自包括但不限 于Stratagene、New England Biolabs、Promega Biotech等供应商。此外, 构建体可以与可扩增基因(例如,DHFE)连接从而可获得基因的多拷 贝。

表达和克隆载体将可能包含选择标记,编码用该载体转化的宿主细 胞存活或生长所必需的蛋白的基因,尽管这样的标记基因可携带在共导 入该宿主细胞的另一多核苷酸序列中。只有那些表达标记基因的宿主细 胞将在选择条件下存活和/或生长。一般的选择基因包括但不限于编码蛋 白的那些,所述蛋白(a)赋予对抗生素或其它毒性物质,例如氨苄青 霉素。四环素等,的抗性;(b)补偿营养缺陷;或(c)供应不能从复 合培养基中获得的关键营养物。正确的选择标记的选择将依赖于宿主细 胞,且不同宿主的适宜的标记是本领域已知的。

根据本发明,已证明含有可操作连接的根据本发明的重组DNA分 子的表达载体是非常有利的,即包含a)至少一个编码非-人伴侣蛋白多 肽结合区段的核苷酸序列,b)其上游至少一个编码FK506结合蛋白或 FK506-结合-蛋白-样结构域(FKBP-样结构域)的核苷酸序列和c)其下 游至少一个编码FK506-结合-蛋白-样结构域(FKBP-样结构域)的核苷 酸序列和任选地d)至少一个编码靶多肽的核苷酸序列。

含有可操作连接的根据本发明的重组DNA分子的表达载体,即含 有a)至少一个编码非-人伴侣蛋白多肽结合区段的核苷酸序列b)其上 游至少一个编码人FKBP型肽基脯氨酸顺反异构酶(PPIase)的核苷酸 序列和,c)其下游至少一个编码人FKBP型肽基脯氨酸顺反异构酶 (PPIase)的核苷酸序列,和任选地d)至少一个编码靶多肽的核苷酸 序列,也是本发明的部分。

可通过本领域已知的任何方法将包含目的多核苷酸的载体导入宿 主细胞。这些方法可依赖于细胞宿主的类型变化,包括但不限于用氯化 钙、氯化铷、磷酸钙、DEAE-葡聚糖、其它物质转染和用病毒感染。可 通过在相容的宿主细胞中表达载体或其它表达媒介物中的本发明多核 苷酸制备大量本发明的多核苷酸和多肽。最常用的原核宿主是大肠杆菌 菌株,尽管其它原核生物,比如枯草芽孢杆菌(Bacillus subtilis)也可 以使用。大肠杆菌的表达代表实施本发明的优选模式。

根据本发明的载体的构建使用了常规的连接技术。分离的质粒或 DNA片段被切割、裁剪和再连接成产生所需质粒所需的形式。如果需要 的话,以已知的方式进行证实所构建质粒中的正确序列的分析。构建表 达载体、制备体外转录物、将DNA导入宿主细胞以及进行评估表达和 功能的分析的适宜方法是本领域技术人员已知的。可利用可基于本文所 提供的序列的适宜标记的探针,通过,例如常规DNA印迹、定量mRNA 转录的RNA印迹、斑点印迹(DNA或RNA分析)或原位杂交在样品 中直接测量基因存在、扩增和/或表达。本领域技术人员将易于想象如果 需要的话可以如何修改这些方法。

含有根据本发明的重组DNA的表达载体可用于在无细胞翻译系统 中表达融合蛋白或可用于转化宿主细胞。在优选实施方案中,本发明涉 及用根据本发明的表达载体转化的宿主细胞。

在进一步优选实施方案中,本发明涉及产生嵌合融合蛋白的方法。 所述方法包括培养用根据本发明的表达载体转化的宿主细胞,在各自的 宿主细胞中表达该嵌合融合蛋白并纯化所述嵌合融合蛋白的步骤。

根据本发明的嵌合融合蛋白显示高溶解性。当在胞质中超表达时, 它们主要积累在可溶级分中。在更低程度上,它们还表达在内含体中。 通常在象例如在离液物质中这样的适宜缓冲条件下细胞被裂解。当嵌合 融合蛋白被标记有六组氨酸部分时,未折叠蛋白质可结合于含镍柱 (Ni-NTA),在此它们在适宜的缓冲条件下也重折叠。如实施例部分更 详细显示的这样的纯化和重折叠规程是本领域技术人员熟知的。由于其 卓越的折叠辅助物特性,根据本发明的嵌合融合蛋白可用作任何否则不 能采取其正确三维结构,也即其天然样构象的靶蛋白的折叠辅助物。根 据本发明,嵌合融合蛋白还可用作靶蛋白生产方法中的折叠辅助物。例 如,在超量生产的宿主细胞的初次溶解之后,由于离液物质或由于去污 剂的存在或其它缓冲条件——它们威胁靶蛋白的天然构象状态,超表达 的靶蛋白通常不采取其天然结构。之后在靶蛋白的纯化和溶解过程中, 可加入嵌合融合蛋白,且它们可在重折叠和复性过程中有所帮助。

就在偶联的转录/翻译系统中的应用来说,可以将含有超表达的嵌合 折叠辅助物的细胞裂解物加入到小瓶中,在其中实施体外翻译,从而促 进所翻译蛋白的正确构象折叠。

根据本发明的嵌合融合蛋白可应用于免疫测定中以在抗原和抗体 与其结合配偶体的免疫结合过程中有所帮助而不干扰免疫测定及其结 果。有利的是根据本发明的嵌合融合蛋白是人源化的,也即它们主要包 含人氨基酸序列,从而由于人样品中天然存在的对抗非-人蛋白序列的抗 体而产生干扰的可能性被最小化。优选源自人序列的氨基酸的百分比与 嵌合融合蛋白完整氨基酸序列相比为至少60%。

免疫测定是本领域技术人员熟知的。实施这样的测定的方法以及实 际应用和程序在相关教科书中总结。相关教科书的例子有Tijssen,P., Preparation of enzyme-antibody or other enzyme-macromolecule conjugates in“Practice and theory of enzyme immunoassays”(1990)221-278,Eds.R. H.Burdon和v.P.H.Knippenberg,Elsevier,Amsterdam)和Tijssen, “Methods in Enzymology”(1980),Eds.S.P.Colowick,N.O.Caplan 和S.P.,Academic Press)中的各卷,其涉及免疫检测方法,尤其是第 70、73、74、84、92和121卷。

在本发明的又一实施方案中,嵌合融合蛋白可分别用作靶蛋白生产 方法中、疫苗生产中或生产药物方法中的融合配偶体。

对于预期该新嵌合融合蛋白用于治疗应用的情况,优选配制含有根 据本发明的重组产生的嵌合融合蛋白和药学可接受赋形剂的组合物。

提供以下实施例、参考文献、序列表和附图以帮助理解本发明,所 附权利要求书中列出了其真实范围。可以理解,可以在不背离本发明的 精神的情况下对所述程序做出修改。

实施例

材料和试剂

氯化胍(GdmCl,A级)购自NIGU(Waldkraiburg,德国)。Complete无EDTA-蛋白酶抑制剂片剂、咪唑和EDTA获自Roche Diagnostics GmbH(Mannheim,德国),所有其它化学药品均为获自Merck (Darmstadt,德国)的分析纯级。(S54G,P55N)-RNA酶T1根据Mücke, M.和Schmid,F.X.(1994)J.Mol.Biol.239,713-725所述进行纯化、 还原和羧甲基化。超滤膜(YM10,YM30)购自Amicon(Danvers,MA, USA),微量透析膜(VS/0.025μm)和超滤单元(biomax ultrafree filter devices)获自Millipore(Bedford,MA,USA)。用于过滤粗酶解物的 硝酸纤维素和乙酸纤维素膜(1.2μm/0.45μm/0.2μm)获自Sartorius (,德国)。

实施例1

生产包含大肠杆菌SlyD和人FKBP12序列的嵌合融合蛋白 hFKBP12-IF1

表达盒的克隆

从SwissProt数据库检索hFKBP12和SlyD序列。从Medigenomix (Martinsried,德国)购得编码hFKBP12及其插入变体的合成基因并将 其克隆进pET24表达载体(Novagen,Madison,Wisconsin,USA)。 对于在大肠杆菌宿主细胞中的表达作了密码子选择的最优化。从大肠杆 菌菌株BL21(DE3)中PCR扩增SlyD基因,限制酶切并连接入pET24a 表达载体。按照如同Scholz等人(2005)in J.Mol.Biol.345,1229-1241 所描述的对大肠杆菌SlyD*融合模块所述的设计融合蛋白的表达盒。

编码蛋白质FKBP12-IF1(亦示于带有六个组氨酸标记的SEQ ID NO. 10)

MGVQVETISP GDGRTFPKRG QTCVVHYTGM LEDGKKFDSS RDRNKPFKFM

LGKQEVIRGW EEGVAQMSVG QRAKLTISPD YAYGQYDENL VQRVPKDVFM

GVDELQVGMR FLAETDQGPV PVEITAVEDD HVVVDGNHML AGQNLVFDVE

LLKLE 的合成基因购自Medigenomix(Martinsried,德国)并被克隆进pET24a 表达载体(Novagen,Madison,WI)。对于在大肠杆菌宿主细胞中的表 达作了密码子选择的最优化。利用QuikChange(Stratagene,La Jolla, CA)产生无半胱氨酸变体(C22A)。翻译后用细菌N-甲硫氨酰-氨肽酶 切除了N-末端甲硫氨酸,由此成熟多肽实际上起始于甘氨酸1。

为获得FKBP12-IF1(C22A)-gp41融合构建体(亦示于SEQ ID NO. 11),

MGVQVETISP GDGRTFPKRG QTAVVHYTGM LEDGKKFDSS RDRNKPFKFM

LGKQEVIRGW EEGVAQMSVG QRAKLTISPD YAYGQYDENL VQRVPKDVFM

GVDELQVGMR FLAETDQGPV PVEITAVEDD HVVVDGNHML AGQNLVFDVE

LLKLEGGGSG GGSGGGSGGG SGGGSGGGTL TVQARQLLSG IVQQQNNELR

AIEAQQHLEQ LTVWGTKQLQ ARELAVERYL KDQQLLGIWG CSGKLICTTA

VPWNASWSNK SLEQIWNNMT WMEWDREINN YTSLIHSLIE ESQNQQEKNE

QELLELDKWA SLWNWFNITN WLWYLEHHHH HH

通过PCR扩增编码NdeI/BamHI-侧接的FKBP12-IF1-(GGGS)2GG 和BamHI/XhoI-侧接的(GGGS)2GG-gp41(残基536至681)的DNA 片段并用NdeI和XhoI插入到pET24a中。编码FKBP12-IF1(C22A)的 合成基因或纯化的HIV-1分离物RNA用作PCR-(RT-PCR)-模板。用 QuikChange向gp41盒中导入点突变L555E、L566E、I573T和I580E。

通过用BamHI切割FKBP12-IF1(C22A)-gp41并插入从编码 FKBP12-IF1(C22A)的合成基因PCR-扩增得到的编码BamHI/BamHI- 侧接的(GGGS)2GGG-F12IF1-(GGGS)2GG的DNA片段,产生了串 联FKBP12-IF1(C22A)-FKBP12-IF1(C22A)-gp41融合构建体(SEQ ID NO.7)。

MGVQVETISP GDGRTFPKRG QTAVVHYTGM LEDGKKFDSS RDRNKPFKFM

LGKQEVIRGW EEGVAQMSVG QRAKLTISPD YAYGQYDENL VQRVPKDVFM

GVDELQVGMR FLAETDQGPV PVEITAVEDD HVVVDGNHML AGQNLVFDVE

LLKLEGGGSG GGSGGGSGGG SGGGSGGGGV QVETISPGDG RTFPKRGQTA

VVHYTGMLED GKKFDSSRDR NKPFKFMLGK QEVIRGWEEG VAQMSVGQRA

KLTISPDYAY GQYDENLVQR VPKDVFMGVD ELQVGMRFLA ETDQGPVPVE

ITAVEDDHVV VDGNHMLAGQ NLVFDVELLK LEGGGSGGGS GGGSGGGSGG

GSGGGTLTVQ ARQLLSGIVQ QQNNELRAIE AQQHLEQLTV WGTKQLQARE

LAVERYLKDQ QLLGIWGCSG KLICTTAVPW NASWSNKSLE QIWNNMTWME

WDREINNYTS LIHSLIEESQ NQQEKNEQEL LELDKWASLW NWFNITNWLW

YLEHHHHHH

EcSlyD-[GGGS]5GGG-EcSlyD-[GGGS]5GGG-gp41(536-681;L555E,L566E,I573T, I580E)-HGHDHDHD-His6,pET24a

MKVAKDLVVS LAYQVRTEDG VLVDESPVSA PLDYLHGHGS LISGLETALE

GHEVGDKFDV AVGANDAYGQ YDENLVQRVP KDVFMGVDEL QVGMRFLAET

DQGPVPVEIT AVEDDHVVVD GNHMLAGQNL KFNVEVVAIR EATEEELAHG

HVHGAHDHHH DHDHDGGGSG GGSGGGSGGG SGGGSGGGKV AKDLVVSLAY

QVRTEDGVLV DESPVSAPLD YLHGHGSLIS GLETALEGHE VGDKFDVAVG

ANDAYGQYDE NLVQRVPKDV FMGVDELQVG MRFLAETDQG PVPVEITAVE

DDHVVVDGNH MLAGQNLKFN VEVVAIREAT EEELAHGHVH GAHDHHHDHD

HDGGGSGGGS GGGSGGGSGG GSGGGTLTVQ ARQLLSGIVQ QQNNELRAIE

AQQHLEQLTV WGTKQLQARE LAVERYLKDQ QLLGIWGCSG KLICTTAVPW

NASWSNKSLE QIWNNMTWME WDREINNYTS LIHSLIEESQ NQQEKNEQEL

LELDKWASLW NWFNITNWLW YHGHDHDHDH HHHHH

利用QuikChange(Stratagene,La Jolla,USA)和标准PCR技术产 生点突变、缺失和插入变体或限制位点。所有重组hFKBP12变体均包 含C-末端六组氨酸标记以促进Ni-NTA-辅助的纯化和重折叠。

hFKBP12变体的表达、纯化和重折叠

用基本上相同的规程纯化所有hFKBP12、SlyD和SlpA变体以及融 合蛋白。含有特定pET24a表达质粒的大肠杆菌BL21(DE3)细胞于37℃ 在添加了卡那霉素(30μg/ml)的LB培养基上生长至OD600 1.5,并通 过加入1mM异丙基-β-D-硫代半乳糖苷诱导胞质的超表达。诱导后三小 时,通过离心收获细胞(5000g下20分钟),冷冻且保存于-20℃。为 进行细胞裂解,将冷冻沉淀重悬于冷的50mM磷酸钠(pH8.0)、7.0M GdmCl、5mM咪唑中,并在冰上搅拌悬浮液2小时直至完全细胞裂解。 离心和过滤(硝酸纤维素膜,0.45μm/0.2μm)后,将裂解物加入到用 含有5.0mM TCEP的裂解缓冲液平衡过的Ni-NTA柱上。随后的洗涤步 骤对于各靶蛋白进行调整,且范围为溶于50mM磷酸钠(pH8.0)、7.0 M GdmCl、5.0mM TCEP中的5-15mM咪唑。使用至少10-15体积的洗 涤缓冲液。然后,用50mM磷酸钠(pH7.8)、100mM NaCl、10mM 咪唑、5.0mM TCEP替换GdmCl溶液以诱导基质结合的蛋白的构象重 折叠。为避免共纯化的蛋白酶再活化,重折叠缓冲液中包括了蛋白酶抑 制剂混合物(Complete无EDTA,Roche)。过夜反应中应用总量为15-20 柱体积的重折叠缓冲液。然后,通过用3-5柱体积的50mM磷酸钠(pH 7.8)、100mM NaCl、10mM咪唑洗涤除去TCEP和Complete无EDTA 抑制剂混合物。之后用相同缓冲液中的250mM咪唑洗脱天然蛋白。通 过N-[2-羟-1,1-二羟甲基乙基]甘氨酸(Tricine)-SDS-PAGE估计含蛋白 质的级分的纯度并汇集。最后,将蛋白质作大小排阻层析(Superdex HiLoad,Amersham Pharmacia),并汇集含蛋白质的级分并在Amicon 室(YM10)中浓缩。

偶联的纯化和重折叠规程后,可以从1g大肠杆菌湿细胞中得到大 于20mg的靶蛋白。我们还通过将半胱氨酸22变为丙氨酸提高各种 hFKBP12变体的总体溶解度。这一单个半胱氨酸的取代取消了hFKBP12 形成共价二硫键加合物的倾向。这既不影响蛋白质的折叠也不影响其脯 氨酰异构酶活性。半胱氨酸22取代丙氨酸对于嵌合蛋白质FKBP12-IF1 来说也显示是有益的。经SDS-PAGE证明的hFKBP12-IF1(C22A)的纯 化示于图1。

实施例2

光谱测量

用Uvikon XL双光束分光光度计进行蛋白质浓度测量。用Pace (1995),Protein Sci.4,2411-2423所述的程序测定摩尔消光系数(ε280)。

用带有恒温的细胞固定器(cell holder)的Jasco-720旋光分光计记 录近紫外圆二色性谱并转变成平均残基椭圆度(mean residue ellipticity)。缓冲液为50mM磷酸钠(pH7.5)、100mM NaCl、1mM EDTA。光程长度为0.5cm或1.0cm,蛋白质浓度为20-500μM。带宽 为1nm,扫描速度为20nm/分钟,分辨率为0.5nm,且应答为2秒。为 提高信噪比,测量光谱九次并取平均值。

通过近紫外CD评估天然-样折叠

为检查本发明的嵌合融合蛋白在偶联的纯化和重折叠规程后是否 采取折叠构象,我们测量了近紫外区域的圆二色性谱。近紫外CD报告 蛋白质中芳族残基的不对称环境,并因此是有序三级结构的灵敏测试。 将比如SlyD IF环这样的结构域嫁接到hFKBP12 flap区段中可能严重危 及hFKBP12支架蛋白的总体结构。天然人FKBP12在近紫外区具有典型 的CD特征(图2)。因此,由于IF-环-插入导致的结构变形或碰撞在近 紫外圆二色性谱中应当是可见的。图2分别显示hFKBP12和 hFKBP12-IF1的光谱覆盖图。令人惊奇的是,IF结构域在hFKBP12的flap 区域中的插入,使支架蛋白总体结构基本保持完整。光谱特征是相似的, 即使由于环插入,转变的椭圆度事实上显著降低。由于总体解折叠将取 消任何近紫外CD信号,所述结果强烈表明,基本保持了嵌合构建体 hFKBP12-IF1的天然-样折叠。

类似的,我们记录了SlyD*(SlyD 1-165)及其缺失变体SlyD*ΔIF- 环(SlyD*缺乏氨基酸残基70-129)的近紫外圆二色性谱。这些结果示 于图3。如同根据近紫外圆二色性谱判断的,当除去大的“insert in flap” (IF)结构域时,SlyD*的总体结构保持完整。在除去IF环后,平均残 基转变的椭圆度甚至稍有上升。因此,存在有力的证据证明缺乏其IF 结构域的SlyD仍然是天然-样折叠的蛋白质。

实施例3

折叠实验

为进行折叠研究,使用了还原和羧甲基化的RNA酶T1(RCM-T1)。 通过15℃下在0.1M Tris-HCl pH8.0中温育蛋白至少1小时使RCM-T1 解折叠。15℃下,通过40-倍稀释解折叠的蛋白至终条件为相同缓冲液 中2.0M NaCl和所需浓度的SlyD、FKBP12变体和RCM-T1起始重折叠。 折叠反应后,在268nm(1.5nm带宽)激发后提高320nm处(10nm带 宽)的蛋白荧光(即色氨酸荧光)。2.0M NaCl处,RCM-T1的缓慢折 叠是单指数过程,且其速率常数是用程序GraFit 3.0(Erithacus Software, Staines,UK)确定的。

嵌合融合蛋白的折叠活性

我们调查了根据本发明的嵌合融合蛋白在催化脯氨酸-限制的蛋白 折叠反应中的效率。使用了还原和羧甲基化的RNA酶T1(RCM-T1) 作为模型底物。其重折叠反应伴随有色氨酸荧光的强烈上升,且可根据 Schmid,F.X.(1991)Curr.Opin.Struct.Biol.1,36-41,Mayr等人(1996) Biochemistry 35,5550-5561和Mücke,M.和Schmid,F.X.(1994) Biochemistry 33,14608-14619所述通过提高NaCl的浓度来诱导。

来自大肠杆菌的SlyD*(1-165)非常好地催化RCM-T1的重折叠。 在低至2nM的SlyD*存在下,RCM-T1的重折叠已经加速了两倍(图 4A)。表观一级折叠速率常数kapp随SlyD*浓度线性提高(图4B)。从 该图的斜率,确定了特异性常数kcat/KM为0.68×106M-1s-1。这是格外高 的值,它几乎达到了迄今为止已知最有效的折叠复制物引发因子的催化 效率(参见Stoller等人(1995)EMBO J.14,4939-4948,Scholz等人 (1997)EMBO J.16,54-58和Scholz等人(1998)J.Mol.Biol.277, 723-732)。

相反,缺乏IF结构域的SlyD突变体是非常弱的RCM-T1重折叠催 化剂。SlyDΔIF代表SlyD的FKBP-结构域。其特异性常数范围在0.0005 ×106M-1s-1左右且由此等于SlyD*的仅0.07%(图5A/B)。这强烈指示, “insert in flap”结构域对于结合未折叠蛋白底物的重要作用。由于近紫外 圆二色性谱指向缺失变体的天然-样总体折叠(图3),insert in flap结 构域可能代表多肽-结合结构域,也即SlyD的伴侣结构域。

删除推定的IF结构域事实上取消SlyD*的折叠活性。缺乏IF结构 域的SlyD突变体代表SlyD的FKBP或FKBP-样结构域。相反,通过将 恰好该IF元件插入到flap区域中是如何影响hFKBP12的折叠活性的 呢?与已经公开的数据一致(Scholz等人(1997)EMBO J.16,54-58), hFKBP12对RCM-T1重折叠的催化相当温和(图6A)。对表观一级重 折叠速率常数的分析得到了0.014×106M-1s-1的特异性常数(图6B)。 相反根据本发明的IF-环插入变体FKBP12-IF1极好地催化RCM-T1重折 叠(图7A)。低于1nM的FKBP12-IF1足以使RCM-T1的折叠速率加 倍。该特异性常数高于2.5×106M-1s-1(图7B和表1)。这一突出的值 甚至超过了引发因子的催化效率,后者等于1.2×106M-1s-1(Stoller等 人(1995)EMBO J.14,4939-4984;Zarnt等人(1997)J.Mol.Biol.271, 827-837;Scholz等人(1997)EMBO J.16,54-58)。因此,通过构建 本发明的嵌合融合蛋白,我们将温和的非-人脯氨酰异构酶和弱的人蛋白 伴侣转变成具有异常的良好脯氨酰异构酶和伴侣特性的出众的折叠辅 助物。

根据本发明,将非-人蛋白伴侣的多肽结合结构域与人PPIase结构 域组合的原理可延伸至其它例子。与FKBP12-IF1的构建模式类似,我 们将推定的SlpA IF环结构域嫁接到hFKBP12折叠支架上。SlpA(首字 母缩写代表SlyD-样蛋白A)与SlyD密切相关。有关SlpA的信息很少, 但是由于它与SlyD的同源性,推测它在大肠杆菌胞质中作为PPIase蛋 白伴侣的作用。我们从大肠杆菌纯化并表征了六组氨酸标记的SlpA变 体。然而,该推定的PPIase在RCM-T1重折叠测定中表现非常弱的活性 (表1)。将包含来自hFKBP12和SlpA的元件的嵌合体称作 hFKBP12-IF4。它含有来自hFKBP12的模块G1-G83、来自SlpA的 V72-T132和来自hFKBP12的L97-E107(序列信息参见SEQ ID NO.13)。 基本按照对FKBP12-IF1所述的,完成对六组氨酸标记的蛋白的表达、 纯化至同质以及重折叠。通过近紫外CD评估得到清楚指向所设计蛋白 质的紧凑折叠的光谱(光谱未示出)。

在RCM-T1重折叠测定中进行评估时,hFKBP12-IF4表现惊人高的 折叠活性(图10A)。其特异性常数(kcat/KM)是800,000M-1s-1(参见 表1)且事实上等于SlyD的催化效率,后者是非常有效的折叠辅助物 (Scholz等人,Biochemistry 2006,45,20-33)。再次,推定的多肽结 合结构域(来自SlpA)与行动迟缓的脯氨酰异构酶(hFKBP12)组合产 生具备高酶和伴侣活性的出众的折叠辅助物。我们可以得出结论,通过 将hFKBP12与来自不同SlyD同源物的IP环结构域组合可以得到具有异 常的折叠活性的人源化折叠辅助物。

组合非-人蛋白伴侣的多肽结合结构域与人PPIase结构域的原理的 另一个例子是称作hFKBP12-IF5的嵌合融合蛋白。根据FKBP12-IF1和 FKBP12-IF4的构建模式,我们将热球菌属FKBP18的推定的IF环结构 域嫁接到hFKBP12的折叠支架上。热球菌属FKBP18是SlyD的热稳定 同源物,其在flap区中脯氨酰异构酶活性位点附近带有推定的IF结构 域。

所得嵌合体称作hFKBP12-IF5。它含有来自hFKBP12的模块 G1-G83、来自热球菌属FKBP18的M84-T140和来自hFKBP12的 L97-E107(热球菌属FKBP18的序列信息参见SEQ ID NO.14,且 hFKBP12-IF5的序列信息参见SEQ ID NO.15)。基本按照对FKBP12-IF1 所述的,完成对六组氨酸标记的蛋白的表达、纯化至同质以及重折叠。

在RCM-T1重折叠测定中进行评估时,hFKBP12-IF5表现惊人高的 折叠活性(图11)。其特异性常数(kcat/KM)是660,000M-1s-1且事实上 等于SlyD的催化效率,根据近来的文献数据后者是一种非常有效的折 叠辅助物(Scholz等人,Biochemistry 2006,45,20-33)。再次,推定 的多肽结合结构域(来自热稳定的TcFKBP18)与行动迟缓的脯氨酰异 构酶(hFKBP12)组合产生具备高酶和伴侣活性的出众的折叠辅助物。 我们的研究清楚的显示,hFKBP12与来自不同SlyD同源物的IP环结构 域的组合产生具有异常的折叠活性的人源化折叠辅助物。

正是该相同的原理也适用于存在于许多原核和真核脯氨酰异构酶 中的FKBP-样结构域。例如,FkpA和引发因子是两种含有FKBP-样结 构域的大肠杆菌蛋白质。以前已经显示,这些FKBP-样结构域,当与剩 余的分子分离时,表现非常温和的折叠活性(Scholz等人,EMBO J. (1997)16(1)54-58;Saul等人,J.Mol.Biol(2004)335,595-608)。 这与人FKBP12达成完美的一致,后者是缺乏任何伴侣活性的温和的脯 氨酰异构酶。通过将任何SlyD IF结构域(也称作多肽结合区段)嫁接 到作为折叠支架的FKBP-样结构域上可以得到卓越的折叠辅助物。这些 嵌合体可在重组蛋白生物技术中用作折叠辅助物,例如作为融合蛋白、 重折叠缓冲液中的添加物等。

结构域嫁接原理也适用于SlyD本身。缺乏IF结构域的SlyD缺失变 体(SlyDΔIF)代表真正的FKBP结构域,它可与来自其它的FKBP蛋 白伴侣的IF结构域组合以产生具有杰出催化效率的折叠辅助物。本发明 因此包括SlyD,尤其是缺乏IF结构域的SlyD变体,用于生产具有超过 用于制备所得嵌合折叠辅助物的天然存在的野生型分子的催化效率的 折叠辅助物的用途。

表1概括了在RCM-T1测定中所测量的所有蛋白质得到的结果。

表1

  PPIase变体   特异性常数kcat/KM  (M-1s-1)   hFKBP12   14,000   hFKBP12(C22A)   14,000   SlyD(SlyD 1-165)   680,000   SlyDΔIF环   500   hFKBP12-IF1(C22A)/发明   2,500,000   SlpA   <1000   hFKBP12-IF4/发明   850,000   TcFKBP18   600,000   hFKBP12-IF5/发明   660,000

实施例4

FKBP12-IF1/HIVgp41融合蛋白的免疫反应性

这个实施例显示,向本发明的嵌合融合蛋白FKBP12-IF1添加HIV 蛋白,也即包膜蛋白gp41作为靶蛋白。如对SlyD和FKBP12蛋白变体 所述,纯化和重折叠串联FKBP12-IF1-gp41融合模块。用其探测大量存 在于HIV-1阳性血清中的抗-gp41抗体。利用双抗原夹心形式在自动 Elecsys2010分析仪(Roche Diagnostics GmbH,德国)中质询免疫反 应性。

在Elecsys免疫测定中的信号检测基于电化学发光。将生物素缀合 物(即捕获抗原)固定到链霉抗生物素蛋白包被的磁珠上,而信号传导 抗原带有络合钌阳离子作为发光部分。在抗-gp41抗体存在下,产色钌 络合物架桥到固相并在用铂电极激发后发射出620nm的光。信号输出 是任意光单位。

对于它们作为Elecsys抗原的用途,浓缩正在研究的可溶gp41融合 蛋白并如Scholz等人(2005)J.Mol.Biol.345,1229-1241所述用N-羟 基-琥珀酰亚胺活化的生物素和钌部分修饰。gp41变体在免疫测定测量 中的浓度约为500ng/ml。使用至少五个阴性血清作为对照。为了进一步 将假阳性结果减至最少,向样品中加入了聚合的未标记大肠杆菌SlyD*作为抗干扰物质。

结果显示,根据本发明的嵌合融合FKBP12-IF1非常适于作为具有 聚集倾向的蛋白质的融合配偶体。当野生型hFKBP12与gp41胞外结构 域片段融合时,所得融合蛋白在基质偶联的重折叠和咪唑洗脱之后定量 聚集。显然,hFKBP12不能赋予比如gp41胞外结构域片段这样的极端 疏水的靶以溶解性。相反,我们发现根据本发明的含有FKBP12-IF1和 HIV-1 gp41胞外结构域片段536-681的嵌合融合蛋白(示意图8)极可 溶,且如根据UV光谱学所判断的不倾向于聚集(图9)。当在自动 Elecsys分析仪中评估时,结果证明它们很适用于在HIV-1血清学中的 诊断应用(数据未显示)。这进一步突出显示了根据本发明的嵌合融合 蛋白的杰出特性。

参考文献列表

-Ausubel,F.,et al.,in″Current protocols in molecular biology″(1987 and periodic updates),Eds.F.Ausubel,R.Brent and K.R.E.,Wiley & Sons Verlag, New York

-Bardwell,J.C.,Mol Microbiol 14(1994)199-205

-Beaucage,S.L.and Caruthers,M.H.,Tetrahedron Letters 22(1981)1859-1862

-Beissinger,M.and Buchner,J.Biol.Chem.(1998)379,245-59

-Buchner,J.,Faseb J10(1996)10-19

-Callebaut & Mornon,FEBS Lett.(1995)374(2),211-215

-Crooke,E.and Wickner,W.,Proc Natl Acad Sci USA 84(1987)5216-20

-Danese,P.N.,et al.Genes Dev 9(1995)387-98

-Dartigalongue,C.and Raina,S.,EMBO J 17(1998)3968-80

-Gething,M.J.and Sambrook,J.,Nature 355(1992)33-45

-Hesterkamp et al.,J Biol Chem.(1997)Aug 29;272(35):21865-71

-Hottenrott,S.,et al.,J Biol Chem 272(1997)15697-701

-Kay,Biochem.J.(1996)314,361-385

-Matteucci,M.D.and Caruthers,M.H.,J.Am.Chem.Soc.103(1981)3185- 3191

-Mayr et al.,Biochemistry 35(1996)5550-5561

-Merz et al.,J Biol Chem.2006 Oct 20;281(42)31963-31971

-Metzger,D.,et al.,Nature 334(1988)31-6

-Missiakas,D.,et al.,EMBO J 14(1995)3415-24

-Mogk et al.,Chembiochem 3(2002)807

-Mücke,M.,and Schmid,F.X.Biochemistry 33(1994)14608-14619

-Pace,Protein Sci.4(1995),2411-2423

-Sambrook,J.,et al.in″Molecular Cloning:A Laboratory Manual″(1989)-,Eds. J.Sambrook,E.F.Fritsch and T.Maniatis,Cold Spring Harbour Laboratory Press,Cold Spring Harbour

-Saul et al.,J.Mol.Biol.335(2004)595-608

-Schmid,F.X.,Curr.Opin.Struct.Biol.1(1991)36-41

-Scholz et al.EMBO J.16(1997)54-58

-Scholz et al.,J.Mol.Biol.277(1998)723-732

-Scholz et al.,J.Mol.Biol.345(2005)1229-1241

-Scholz et al.,Biochemistry 45(2006)20-33

-Stoller,G.,et al.,EMBO J 14(1995)4939-48

-Suzuki et al.,J.Mol.Biol.328(2003)1149-1160

-Tijssen,in″Methods in Enzymology″(1980),Eds.S.P.Colowick,N.O.Caplan and S.P.,Academic Press),dealing with immunological detection methods, especially volumes 70,73,74,84,92 and 121.

-Tijssen,P.,Preparation of enzym-antibody or other enzyme-macromolecule conjugates in″Practice and theory of enzyme immunoassays″(1990)221-278, Eds.R.H.Burdon and v.P.H.Knippenberg,Elsevier,Amsterdam

-van Duyne et al.1991,Science 252,839-842

-Wülfing et al 1994,J Biol Chem 269,2895-2901

-Zarnt et al.(1997)J.Mol.Biol.271,827-837

-WO 03/000877

-WO 03/000878

-US patent no.6,207,420

序列表

<110>Roche-Diagnostics GmbH;F.Hoffmann-La Roche AG

<120>具有卓越的伴侣和折叠活性的嵌合融合蛋白

<130>23529 WO-IR

<160>21

<170>PatentIn version 3.2

<210>1

<211>196

<212>PRT

<213>大肠杆菌(Escherichia coli)

<400>1

Met Lys Val Ala Lys Asp Leu Val Val Ser Leu Ala Tyr Gln Val Arg

1               5                   10                  15

Thr Glu Asp Gly Val Leu Val Asp Glu Ser Pro Val Ser Ala Pro Leu

            20                  25                  30

Asp Tyr Leu His Gly His Gly Ser Leu Ile Ser Gly Leu Glu Thr Ala

        35                  40                  45

Leu Glu Gly His Glu Val Gly Asp Lys Phe Asp Val Ala Val Gly Ala

    50                  55                  60

Asn Asp Ala Tyr Gly Gln Tyr Asp Glu Asn Leu Val Gln Arg Val Pro

65                  70                  75                  80

Lys Asp Val Phe Met Gly Val Asp Glu Leu Gln Val Gly Met Arg Phe

                85                  90                  95

Leu Ala Glu Thr Asp Gln Gly Pro Val Pro Val Glu Ile Thr Ala Val

            100                 105                 110

Glu Asp Asp His Val Val Val Asp Gly Asn His Met Leu Ala Gly Gln

        115                 120                 125

Asn Leu Lys Phe Asn Val Glu Val Val Ala Ile Arg Glu Ala Thr Glu

    130                 135                 140

Glu Glu Leu Ala His Gly His Val His Gly Ala His Asp His His His

145                 150                 155                 160

Asp His Asp His Asp Gly Cys Cys Gly Gly His Gly His Asp His Gly

                165                 170                 175

His Glu His Gly Gly Glu Gly Cys Cys Gly Gly Lys Gly Asn Gly Gly

            180                 185                 190

Cys Gly Cys His

        195

<210>2

<211>107

<212>PRT

<213>智人(Homo sapiens)

<400>2

Gly Val Gln Val Glu Thr Ile Ser Pro Gly Asp Gly Arg Thr Phe Pro

1               5                   10                  15

Lys Arg Gly Gln Thr Cys Val Val His Tyr Thr Gly Met Leu Glu Asp

            20                  25                  30

Gly Lys Lys Phe Asp Ser Ser Arg Asp Arg Asn Lys Pro Phe Lys Phe

        35                  40                  45

Met Leu Gly Lys Gln Glu Val Ile Arg Gly Trp Glu Glu Gly Val Ala

    50                  55                  60

Gln Met Ser Val Gly Gln Arg Ala Lys Leu Thr Ile Ser Pro Asp Tyr

65                  70                  75                  80

Ala Tyr Gly Ala Thr Gly His Pro Gly Ile Ile Pro Pro His Ala Thr

                85                  90                  95

Leu Val Phe Asp Val Glu Leu Leu Lys Leu Glu

            100                 105

<210>3

<211>113

<212>PRT

<213>人工的

<220>

<223>具有突变Cys22至Ala22和C-末端His-标记的人FKBP12

<400>3

Gly Val Gln Val Glu Thr Ile Ser Pro Gly Asp Gly Arg Thr Phe Pro

1               5                   10                  15

Lys Arg Gly Gln Thr Ala Val Val His Tyr Thr Gly Met Leu Glu Asp

            20                  25                  30

Gly Lys Lys Phe Asp Ser Ser Arg Asp Arg Asn Lys Pro Phe Lys Phe

        35                  40                  45

Met Leu Gly Lys Gln Glu Val Ile Arg Gly Trp Glu Glu Gly Val Ala

    50                  55                  60

Gln Met Ser Val Gly Gln Arg Ala Lys Leu Thr Ile Ser Pro Asp Tyr

65                  70                  75                  80

Ala Tyr Gly Ala Thr Gly His Pro Gly Ile Ile Pro Pro His Ala Thr

                85                  90                  95

Leu Val Phe Asp Val Glu Leu Leu Lys Leu Glu His His His His His

            100                 105                 110

His

<210>4

<211>154

<212>PRT

<213>人工的;具有SlyD插入片段的hFKPB12-IF1

<400>4

Gly Val Gln Val Glu Thr Ile Ser Pro Gly Asp Gly Arg Thr Phe Pro

1               5                   10                  15

Lys Arg Gly Gln Thr Cys Val Val His Tyr Thr Gly Met Leu Glu Asp

            20                  25                  30

Gly Lys Lys Phe Asp Ser Ser Arg Asp Arg Asn Lys Pro Phe Lys Phe

        35                  40                  45

Met Leu Gly Lys Gln Glu Val Ile Arg Gly Trp Glu Glu Gly Val Ala

    50                  55                  60

Gln Met Ser Val Gly Gln Arg Ala Lys Leu Thr Ile Ser Pro Asp Tyr

65                  70                  75                  80

Ala Tyr Gly Gln Tyr Asp Glu Asn Leu Val Gln Arg Val Pro Lys Asp

                85                  90                  95

Val Phe Met Gly Val Asp Glu Leu Gln Val Gly Met Arg Phe Leu Ala

            100                 105                 110

Glu Thr Asp Gln Gly Pro Val Pro Val Glu Ile Thr Ala Val Glu Asp

        115                 120                 125

Asp His Val Val Val Asp Gly Asn His Met Leu Ala Gly Gln Asn Leu

    130                 135                 140

Val Phe Asp Val Glu Leu Leu Lys Leu Glu

145                 150

<210>5

<211>154

<212>PRT

<213>人工的;具有SlyD C22A突变的hFKBP12-IF1

<400>5

Gly Val Gln Val Glu Thr Ile Ser Pro Gly Asp Gly Arg Thr Phe Pro

1               5                   10                  15

Lys Arg Gly Gln Thr Ala Val Val His Tyr Thr Gly Met Leu Glu Asp

            20                  25                  30

Gly Lys Lys Phe Asp Ser Ser Arg Asp Arg Asn Lys Pro Phe Lys Phe

        35                  40                  45

Met Leu Gly Lys Gln Glu Val Ile Arg Gly Trp Glu Glu Gly Val Ala

    50                  55                  60

Gln Met Ser Val Gly Gln Arg Ala Lys Leu Thr Ile Ser Pro Asp Tyr

65                  70                  75                  80

Ala Tyr Gly Gln Tyr Asp Glu Asn Leu Val Gln Arg Val Pro Lys Asp

                85                  90                  95

Val Phe Met Gly Val Asp Glu Leu Gln Val Gly Met Arg Phe Leu Ala

            100                 105                 110

Glu Thr Asp Gln Gly Pro Val Pro Val Glu Ile Thr Ala Val Glu Asp

        115                 120                 125

Asp His Val Val Val Asp Gly Asn His Met Leu Ala Gly Gln Asn Leu

    130                 135                 140

Val Phe Asp Val Glu Leu Leu Lys Leu Glu

145                 150

<210>6

<211>535

<212>PRT

<213>人工的;SlyD*-SlyD*-HIV gp41融合蛋白

<400>6

Met Lys Val Ala Lys Asp Leu Val Val Ser Leu Ala Tyr Gln Val Arg

1               5                   10                  15

Thr Glu Asp Gly Val Leu Val Asp Glu Ser Pro Val Ser Ala Pro Leu

            20                  25                  30

Asp Tyr Leu His Gly His Gly Ser Leu Ile Ser Gly Leu Glu Thr Ala

        35                  40                  45

Leu Glu Gly His Glu Val Gly Asp Lys Phe Asp Val Ala Val Gly Ala

    50                  55                  60

Asn Asp Ala Tyr Gly Gln Tyr Asp Glu Asn Leu Val Gln Arg Val Pro

65                  70                  75                  80

Lys Asp Val Phe Met Gly Val Asp Glu Leu Gln Val Gly Met Arg Phe

                85                  90                  95

Leu Ala Glu Thr Asp Gln Gly Pro Val Pro Val Glu Ile Thr Ala Val

            100                 105                 110

Glu Asp Asp His Val Val Val Asp Gly Asn His Met Leu Ala Gly Gln

        115                 120                 125

Asn Leu Lys Phe Asn Val Glu Val Val Ala Ile Arg Glu Ala Thr Glu

    130                 135                 140

Glu Glu Leu Ala His Gly His Val His Gly Ala His Asp His His His

145                 150                 155                 160

Asp His Asp His Asp Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly

                165                 170                 175

Ser Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Lys Val Ala Lys

            180                 185                 190

Asp Leu Val Val Ser Leu Ala Tyr Gln Val Arg Thr Glu Asp Gly Val

        195                 200                 205

Leu Val Asp Glu Ser Pro Val Ser Ala Pro Leu Asp Tyr Leu His Gly

    210                 215                 220

His Gly Ser Leu Ile Ser Gly Leu Glu Thr Ala Leu Glu Gly His Glu

225                 230                 235                 240

Val Gly Asp Lys Phe Asp Val Ala Val Gly Ala Asn Asp Ala Tyr Gly

                245                 250                 255

Gln Tyr Asp Glu Asn Leu Val Gln Arg Val Pro Lys Asp Val Phe Met

            260                 265                 270

Gly Val Asp Glu Leu Gln Val Gly Met Arg Phe Leu Ala Glu Thr Asp

        275                 280                 285

Gln Gly Pro Val Pro Val Glu Ile Thr Ala Val Glu Asp Asp His Val

    290                 295                 300

Val Val Asp Gly Asn His Met Leu Ala Gly Gln Asn Leu Lys Phe Asn

305                 310                 315                 320

Val Glu Val Val Ala Ile Arg Glu Ala Thr Glu Glu Glu Leu Ala His

                325                 330                 335

Gly His Val His Gly Ala His Asp His His His Asp His Asp His Asp

            340                 345                 350

Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser

        355                 360                 365

Gly Gly Gly Ser Gly Gly Gly Thr Leu Thr Val Gln Ala Arg Gln Leu

    370                 375                 380

Leu Ser Gly Ile Val Gln Gln Gln Asn Asn Glu Leu Arg Ala Ile Glu

385                 390                 395                 400

Ala Gln Gln His Leu Glu Gln Leu Thr Val Trp Gly Thr Lys Gln Leu

                405                 410                 415

Gln Ala Arg Glu Leu Ala Val Glu Arg Tyr Leu Lys Asp Gln Gln Leu

            420                 425                 430

Leu Gly Ile Trp Gly Cys Ser Gly Lys Leu Ile Cys Thr Thr Ala Val

        435                 440                 445

Pro Trp Asn Ala Ser Trp Ser Asn Lys Ser Leu Glu Gln Ile Trp Asn

    450                 455                 460

Asn Met Thr Trp Met Glu Trp Asp Arg Glu Ile Asn Asn Tyr Thr Ser

465                 470                 475                 480

Leu Ile His Ser Leu Ile Glu Glu Ser Gln Asn Gln Gln Glu Lys Asn

                485                 490                 495

Glu Gln Glu Leu Leu Glu Leu Asp Lys Trp Ala Ser Leu Trp Asn Trp

            500                 505                 510

Phe Asn Ile Thr Asn Trp Leu Trp Tyr His Gly His Asp His Asp His

        515                 520                 525

Asp His His His His His His

    530                 535

<210>7

<211>509

<212>PRT

<213>人工的;hFKBP12-IF1-hFKBP12-IF1-gp41融合蛋白

<400>7

Met Gly Val Gln Val Glu Thr Ile Ser Pro Gly Asp Gly Arg Thr Phe

1               5                   10                  15

Pro Lys Arg Gly Gln Thr Ala Val Val His Tyr Thr Gly Met Leu Glu

            20                  25                  30

Asp Gly Lys Lys Phe Asp Ser Ser Arg Asp Arg Asn Lys Pro Phe Lys

        35                  40                  45

Phe Met Leu Gly Lys Gln Glu Val Ile Arg Gly Trp Glu Glu Gly Val

    50                  55                  60

Ala Gln Met Ser Val Gly Gln Arg Ala Lys Leu Thr Ile Ser Pro Asp

65                  70                  75                  80

Tyr Ala Tyr Gly Gln Tyr Asp Glu Asn Leu Val Gln Arg Val Pro Lys

                85                  90                  95

Asp Val Phe Met Gly Val Asp Glu Leu Gln Val Gly Met Arg Phe Leu

            100                 105                 110

Ala Glu Thr Asp Gln Gly Pro Val Pro Val Glu Ile Thr Ala Val Glu

        115                 120                 125

Asp Asp His Val Val Val Asp Gly Asn His Met Leu Ala Gly Gln Asn

    130                 135                 140

Leu Val Phe Asp Val Glu Leu Leu Lys Leu Glu Gly Gly Gly Ser Gly

145                 150                 155                 160

Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser Gly

                165                 170                 175

Gly Gly Gly Val Gln Val Glu Thr Ile Ser Pro Gly Asp Gly Arg Thr

            180                 185                 190

Phe Pro Lys Arg Gly Gln Thr Ala Val Val His Tyr Thr Gly Met Leu

        195                 200                 205

Glu Asp Gly Lys Lys Phe Asp Ser Ser Arg Asp Arg Asn Lys Pro Phe

    210                 215                 220

Lys Phe Met Leu Gly Lys Gln Glu Val Ile Arg Gly Trp Glu Glu Gly

225                 230                 235                 240

Val Ala Gln Met Ser Val Gly Gln Arg Ala Lys Leu Thr Ile Ser Pro

                245                 250                 255

Asp Tyr Ala Tyr Gly Gln Tyr Asp Glu Asn Leu Val Gln Arg Val Pro

            260                 265                 270

Lys Asp Val Phe Met Gly Val Asp Glu Leu Gln Val Gly Met Arg Phe

        275                 280                 285

Leu Ala Glu Thr Asp Gln Gly Pro Val Pro Val Glu Ile Thr Ala Val

    290                 295                 300

Glu Asp Asp His Val Val Val Asp Gly Asn His Met Leu Ala Gly Gln

305                 310                 315                 320

Asn Leu Val Phe Asp Val Glu Leu Leu Lys Leu Glu Gly Gly Gly Ser

                325                 330                 335

Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser

            340                 345                 350

Gly Gly Gly Thr Leu Thr Val Gln Ala Arg Gln Leu Leu Ser Gly Ile

        355                 360                 365

Val Gln Gln Gln Asn Asn Glu Leu Arg Ala Ile Glu Ala Gln Gln His

    370                 375                 380

Leu Glu Gln Leu Thr Val Trp Gly Thr Lys Gln Leu Gln Ala Arg Glu

385                 390                 395                 400

Leu Ala Val Glu Arg Tyr Leu Lys Asp Gln Gln Leu Leu Gly Ile Trp

                405                 410                 415

Gly Cys Ser Gly Lys Leu Ile Cys Thr Thr Ala Val Pro Trp Asn Ala

            420                 425                 430

Ser Trp Ser Asn Lys Ser Leu Glu Gln Ile Trp Asn Asn Met Thr Trp

        435                 440                 445

Met Glu Trp Asp Arg Glu Ile Asn Asn Tyr Thr Ser Leu Ile His Ser

    450                 455                 460

Leu Ile Glu Glu Ser Gln Asn Gln Gln Glu Lys Asn Glu Gln Glu Leu

465                 470                 475                 480

Leu Glu Leu Asp Lys Trp Ala Ser Leu Trp Asn Trp Phe Asn Ile Thr

                485                 490                 495

Asn Trp Leu Trp Tyr Leu Glu His His His His His His

            500                 505

<210>8

<211>171

<212>PRT

<213>人工的;具有六-His标记的SlyD*(SlyD 1-165)

<400>8

Met Lys Val Ala Lys Asp Leu Val Val Ser Leu Ala Tyr Gln Val Arg

1               5                   10                  15

Thr Glu Asp Gly Val Leu Val Asp Glu Ser Pro Val Ser Ala Pro Leu

            20                  25                  30

Asp Tyr Leu His Gly His Gly Ser Leu Ile Ser Gly Leu Glu Thr Ala

        35                  40                  45

Leu Glu Gly His Glu Val Gly Asp Lys Phe Asp Val Ala Val Gly Ala

    50                  55                  60

Asn Asp Ala Tyr Gly Gln Tyr Asp Glu Asn Leu Val Gln Arg Val Pro

65                  70                  75                  80

Lys Asp Val Phe Met Gly Val Asp Glu Leu Gln Val Gly Met Arg Phe

                85                  90                  95

Leu Ala Glu Thr Asp Gln Gly Pro Val Pro Val Glu Ile Thr Ala Val

            100                 105                 110

Glu Asp Asp His Val Val Val Asp Gly Asn His Met Leu Ala Gly Gln

        115                 120                 125

Asn Leu Lys Phe Asn Val Glu Val Val Ala Ile Arg Glu Ala Thr Glu

    130                 135                 140

Glu Glu Leu Ala His Gly His Val His Gly Ala His Asp His His His

145                 150                 155                 160

Asp His Asp His Asp His His His His His His

                165                 170

<210>9

<211>124

<212>PRT

<213>人工的;无IF-环的SlyD*(SlyD 1-165)

<400>9

Met Lys Val Ala Lys Asp Leu Val Val Ser Leu Ala Tyr Gln Val Arg

1               5                   10                  15

Thr Glu Asp Gly Val Leu Val Asp Glu Ser Pro Val Ser Ala Pro Leu

            20                  25                  30

Asp Tyr Leu His Gly His Gly Ser Leu Ile Ser Gly Leu Glu Thr Ala

        35                  40                  45

Leu Glu Gly His Glu Val Gly Asp Lys Phe Asp Val Ala Val Gly Ala

    50                  55                  60

Asn Asp Ala Tyr Gly Ala Thr Gly His Pro Gly Ile Ile Pro Pro His

65                  70                  75                  80

Ala Thr Leu Lys Phe Asn Val Glu Val Val Ala Ile Arg Glu Ala Thr

                85                  90                  95

Glu Glu Glu Leu Ala His Gly His Val His Gly Ala His Asp His His

            100                 105                 110

His Asp His Asp His Asp His His His His His His

        115                 120

<210>10

<211>161

<212>PRT

<213>人工的;具有六-His标记的hFKBP12-IF1

<400>10

Met Gly Val Gln Val Glu Thr Ile Ser Pro Gly Asp Gly Arg Thr Phe

1               5               10                  15

Pro Lys Arg Gly Gln Thr Cys Val Val His Tyr Thr Gly Met Leu Glu

            20                  25                  30

Asp Gly Lys Lys Phe Asp Ser Ser Arg Asp Arg Asn Lys Pro Phe Lys

        35                  40                  45

Phe Met Leu Gly Lys Gln Glu Val Ile Arg Gly Trp Glu Glu Gly Val

    50                  55                  60

Ala Gln Met Ser Val Gly Gln Arg Ala Lys Leu Thr Ile Ser Pro Asp

65                  70                  75                  80

Tyr Ala Tyr Gly Gln Tyr Asp Glu Asn Leu Val Gln Arg Val Pro Lys

                85                  90                  95

Asp Val Phe Met Gly Val Asp Glu Leu Gln Val Gly Met Arg Phe Leu

            100                 105                 110

Ala Glu Thr Asp Gln Gly Pro Val Pro Val Glu Ile Thr Ala Val Glu

        115                 120                 125

Asp Asp His Val Val Val Asp Gly Asn His Met Leu Ala Gly Gln Asn

    130                 135                 140

Leu Val Phe Asp Val Glu Leu Leu Lys Leu Glu His His His His His

145                 150                 155                 160

His

<210>11

<211>332

<212>PRT

<213>人工的;hFKBP12-IF1(C22A)-gp41融合蛋白

<400>11

Met Gly Val Gln Val Glu Thr Ile Ser Pro Gly Asp Gly Arg Thr Phe

1               5                   10                  15

Pro Lys Arg Gly Gln Thr Ala Val Val His Tyr Thr Gly Met Leu Glu

            20                  25                  30

Asp Gly Lys Lys Phe Asp Ser Ser Arg Asp Arg Asn Lys Pro Phe Lys

        35                  40                  45

Phe Met Leu Gly Lys Gln Glu Val Ile Arg Gly Trp Glu Glu Gly Val

    50                  55                  60

Ala Gln Met Ser Val Gly Gln Arg Ala Lys Leu Thr Ile Ser Pro Asp

65                  70                  75                  80

Tyr Ala Tyr Gly Gln Tyr Asp Glu Asn Leu Val Gln Arg Val Pro Lys

                85                  90                  95

Asp Val Phe Met Gly Val Asp Glu Leu Gln Val Gly Met Arg Phe Leu

            100                 105                 110

Ala Glu Thr Asp Gln Gly Pro Val Pro Val Glu Ile Thr Ala Val Glu

        115                 120                 125

Asp Asp His Val Val Val Asp Gly Asn His Met Leu Ala Gly Gln Asn

    130                 135                 140

Leu Val Phe Asp Val Glu Leu Leu Lys Leu Glu Gly Gly Gly Ser Gly

145                 150                 155                 160

Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser Gly

                165                 170                 175

Gly Gly Thr Leu Thr Val Gln Ala Arg Gln Leu Leu Ser Gly Ile Val

            180                 185                 190

Gln Gln Gln Asn Asn Glu Leu Arg Ala Ile Glu Ala Gln Gln His Leu

        195                 200                 205

Glu Gln Leu Thr Val Trp Gly Thr Lys Gln Leu Gln Ala Arg Glu Leu

    210                 215                 220

Ala Val Glu Arg Tyr Leu Lys Asp Gln Gln Leu Leu Gly Ile Trp Gly

225                 230                 235                 240

Cys Ser Gly Lys Leu Ile Cys Thr Thr Ala Val Pro Trp Asn Ala Ser

                245                 250                 255

Trp Ser Asn Lys Ser Leu Glu Gln Ile Trp Asn Asn Met Thr Trp Met

            260                 265                 270

Glu Trp Asp Arg Glu Ile Asn Asn Tyr Thr Ser Leu Ile His Ser Leu

        275                 280                 285

Ile Glu Glu Ser Gln Asn Gln Gln Glu Lys Asn Glu Gln Glu Leu Leu

    290                 295                 300

Glu Leu Asp Lys Trp Ala Ser Leu Trp Asn Trp Phe Asn Ile Thr Asn

305                 310                 315                 320

Trp Leu Trp Tyr Leu Glu His His His His His His

                325                 330

<210>12

<211>148

<212>PRT

<213>大肠杆菌(Escherichia coli)

<400>12

Ser Glu Ser Val Gln Ser Asn Ser Ala Val Leu Val His Phe Thr Leu

1               5                   10                  15

Lys Leu Asp Asp Gly Thr Thr Ala Glu Ser Thr Arg Asn Asn Gly Lys

            20                  25                  30

Pro Ala Leu Phe Arg Leu Gly Asp Ala Ser Leu Ser Glu Gly Leu Glu

        35                  40                  45

Gln His Leu Leu Gly Leu Lys Val Gly Asp Lys Thr Thr Phe Ser Leu

    50                  55                  60

Glu Pro Asp Ala Ala Phe Gly Val Pro Ser Pro Asp Leu Ile Gln Tyr

65                  70                  75                  80

Phe Ser Arg Arg Glu Phe Met Asp Ala Gly Glu Pro Glu Ile Gly Ala

                85                  90                  95

Ile Met Leu Phe Thr Ala Met Asp Gly Ser Glu Met Pro Gly Val Ile

            100                 105                 110

Arg Glu Ile Asn Gly Asp Ser Ile Thr Val Asp Phe Asn His Pro Leu

        115                 120                 125

Ala Gly Gln Thr Val His Phe Asp Ile Glu Val Leu Glu Ile Asp Pro

    130                 135                 140

Ala Leu Glu Ala

145

<210>13

<211>161

<212>PRT

<213>人工的;具有六-His标记的hFKBP12-IF4(SlpA插入片段)

<400>13

Gly Val Gln Val Glu Thr Ile Ser Pro Gly Asp Gly Arg Thr Phe Pro

1               5                   10                  15

Lys Arg Gly Gln Thr Ala Val Val His Tyr Thr Gly Met Leu Glu Asp

            20                  25                  30

Gly Lys Lys Phe Asp Ser Ser Arg Asp Arg Asn Lys Pro Phe Lys Phe

        35                  40                  45

Met Leu Gly Lys Gln Glu Val Ile Arg Gly Trp Glu Glu Gly Val Ala

    50                  55                  60

Gln Met Ser Val Gly Gln Arg Ala Lys Leu Thr Ile Ser Pro Asp Tyr

65                  70                  75                  80

Ala Tyr Gly Val Pro Ser Pro Asp Leu Ile Gln Tyr Phe Ser Arg Arg

                85                  90                  95

Glu Phe Met Asp Ala Gly Glu Pro Glu Ile Gly Ala Ile Met Leu Phe

            100                 105                 110

Thr Ala Met Asp Gly Ser Glu Met Pro Gly Val Ile Arg Glu Ile Asn

        115                 120                 125

Gly Asp Ser Ile Thr Val Asp Phe Asn His Pro Leu Ala Gly Gln Thr

    130                 135                 140

Leu Val Phe Asp Val Glu Leu Leu Lys Leu Glu His His His His His

145                 150                 155                 160

His

<210>14

<211>159

<212>PRT

<213>热球菌属物种(Thermococcus sp.)

<400>14

Met Lys Val Glu Ala Gly Asp Tyr Val Leu Phe His Tyr Val Gly Arg

1               5                   10                  15

Phe Glu Asp Gly Glu Val Phe Asp Thr Ser Tyr Glu Glu Ile Ala Arg

            20                  25                  30

Glu Asn Gly Ile Leu Val Glu Glu Arg Glu Tyr Gly Pro Met Trp Val

        35                  40                  45

Arg Ile Gly Val Gly Glu Ile Ile Pro Gly Leu Asp Glu Ala Ile Ile

    50                  55                  60

Gly Met Glu Ala Gly Glu Lys Lys Thr Val Thr Val Pro Pro Glu Lys

65                  70                  75                  80

Ala Tyr Gly Met Pro Asn Pro Glu Leu Val Ile Ser Val Pro Arg Glu

                85                  90                  95

Glu Phe Thr Lys Ala Gly Leu Glu Pro Gln Glu Gly Leu Tyr Val Met

            100                 105                 110

Thr Asp Ser Gly Ile Ala Lys Ile Val Ser Val Gly Glu Ser Glu Val

        115                 120                 125

Ser Leu Asp Phe Asn His Pro Leu Ala Gly Lys Thr Leu Val Phe Glu

    130                 135                 140

Val Glu Val Ile Glu Val Lys Lys Ala Glu Glu Asp Ser Glu Ala

145                 150                 155

<210>15

<211>157

<212>PRT

<213>人工的;hFKBP12-IF5热球菌属插入片段

<400>15

Gly Val Gln Val Glu Thr Ile Ser Pro Gly Asp Gly Arg Thr Phe Pro

1               5                   10                  15

Lys Arg Gly Gln Thr Cys Val Val His Tyr Thr Gly Met Leu Glu Asp

            20                  25                  30

Gly Lys Lys Phe Asp Ser Ser Arg Asp Arg Asn Lys Pro Phe Lys Phe

        35                  40                  45

Met Leu Gly Lys Gln Glu Val Ile Arg Gly Trp Glu Glu Gly Val Ala

    50                  55                  60

Gln Met Ser Val Gly Gln Arg Ala Lys Leu Thr Ile Ser Pro Asp Tyr

65                  70                  75                  80

Ala Tyr Gly Met Pro Asn Pro Glu Leu Val Ile Ser Val Pro Arg Glu

                85                  90                  95

Glu Phe Thr Lys Ala Gly Leu Glu Pro Gln Glu Gly Leu Tyr Val Met

            100                 105                 110

Thr Asp Ser Gly Ile Ala Lys Ile Val Ser Val Gly Glu Ser Glu Val

        115                 120                 125

Ser Leu Asp Phe Asn His Pro Leu Ala Gly Lys Thr Leu Val Phe Asp

    130                 135                 140

Val Glu Leu Leu Lys Leu Glu His His His His His His

145                 150                 155

<210>16

<211>432

<212>PRT

<213>大肠杆菌(Escherichia coli)

<400>16

Met Gln Val Ser Val Glu Thr Thr Gln Gly Leu Gly Arg Arg Val Thr

1               5                   10                  15

Ile Thr Ile Ala Ala Asp Ser Ile Glu Thr Ala Val Lys Ser Glu Leu

            20                  25                  30

Val Asn Val Ala Lys Lys Val Arg Ile Asp Gly Phe Arg Lys Gly Lys

        35                  40                  45

Val Pro Met Asn Ile Val Ala Gln Arg Tyr Gly Ala Ser Val Arg Gln

    50                  55                  60

Asp Val Leu Gly Asp Leu Met Ser Arg Asn Phe Ile Asp Ala Ile Ile

65                  70                  75                  80

Lys Glu Lys Ile Asn Pro Ala Gly Ala Pro Thr Tyr Val Pro Gly Glu

                85                  90                  95

Tyr Lys Leu Gly Glu Asp Phe Thr Tyr Ser Val Glu Phe Glu Val Tyr

            100                 105                 110

Pro Glu Val Glu Leu Gln Gly Leu Glu Ala Ile Glu Val Glu Lys Pro

        115                 120                 125

Ile Val Glu Val Thr Asp Ala Asp Val Asp Gly Met Leu Asp Thr Leu

    130                 135                 140

Arg Lys Gln Gln Ala Thr Trp Lys Glu Lys Asp Gly Ala Val Glu Ala

145                 150                 155                 160

Glu Asp Arg Val Thr Ile Asp Phe Thr Gly Ser Val Asp Gly Glu Glu

                165                 170                 175

Phe Glu Gly Gly Lys Ala Ser Asp Phe Val Leu Ala Met Gly Gln Gly

            180                 185                 190

Arg Met Ile Pro Gly Phe Glu Asp Gly Ile Lys Gly His Lys Ala Gly

        195                 200                 205

Glu Glu Phe Thr Ile Asp Val Thr Phe Pro Glu Glu Tyr His Ala Glu

    210                 215                 220

Asn Leu Lys Gly Lys Ala Ala Lys Phe Ala Ile Asn Leu Lys Lys Val

225                 230                 235                 240

Glu Glu Arg Glu Leu Pro Glu Leu Thr Ala Glu Phe Ile Lys Arg Phe

                245                 250                 255

Gly Val Glu Asp Gly Ser Val Glu Gly Leu Arg Ala Glu Val Arg Lys

            260                 265                 270

Asn Met Glu Arg Glu Leu Lys Ser Ala Ile Arg Asn Arg Val Lys Ser

        275                 280                 285

Gln Ala Ile Glu Gly Leu Val Lys Ala Asn Asp Ile Asp Val Pro Ala

    290                 295                 300

Ala Leu Ile Asp Ser Glu Ile Asp Val Leu Arg Arg Gln Ala Ala Gln

305                 310                 315                 320

Arg Phe Gly Gly Asn Glu Lys Gln Ala Leu Glu Leu Pro Arg Glu Leu

                325                 330                 335

Phe Glu Glu Gln Ala Lys Arg Arg Val Val Val Gly Leu Leu Leu Gly

            340                 345                 350

Glu Val Ile Arg Thr Asn Glu Leu Lys Ala Asp Glu Glu Arg Val Lys

        355                 360                 365

Gly Leu Ile Glu Glu Met Ala Ser Ala Tyr Glu Asp Pro Lys Glu Val

    370                 375                 380

Ile Glu Phe Tyr Ser Lys Asn Lys Glu Leu Met Asp Asn Met Arg Asn

385                 390                 395                 400

Val Ala Leu Glu Glu Gln Ala Val Glu Ala Val Leu Ala Lys Ala Lys

                405                 410                 415

Val Thr Glu Lys Glu Thr Thr Phe Asn Glu Leu Met Asn Gln Gln Ala

            420                 425                 430

<210>17

<211>112

<212>PRT

<213>大肠杆菌(Escherichia coli)

<400>17

Met Leu Asp Thr Leu Arg Lys Gln Gln Ala Thr Trp Lys Glu Lys Asp

1               5                   10                  15

Gly Ala Val Glu Ala Glu Asp Arg Val Thr Ile Asp Phe Thr Gly Ser

            20                  25                  30

Val Asp Gly Glu Glu Phe Glu Gly Gly Lys Ala Ser Asp Phe Val Leu

        35                  40                  45

Ala Met Gly Gln Gly Arg Met Ile Pro Gly Phe Glu Asp Gly Ile Lys

    50                  55                  60

Gly His Lys Ala Gly Glu Glu Phe Thr Ile Asp Val Thr Phe Pro Glu

65                  70                  75                  80

Glu Tyr His Ala Glu Asn Leu Lys Gly Lys Ala Ala Lys Phe Ala Ile

                85                  90                  95

Asn Leu Lys Lys Val Glu Glu Arg Glu Leu Pro Glu Leu Thr Ala Glu

            100                 105                 110

<210>18

<211>164

<212>PRT

<213>人工的;具有SlyD的IF插入片段的引发因子

<400>18

Met Leu Asp Thr Leu Arg Lys Gln Gln Ala Thr Trp Lys Glu Lys Asp

1               5                   10                  15

Gly Ala Val Glu Ala Glu Asp Arg Val Thr Ile Asp Phe Thr Gly Ser

            20                  25                  30

Val Asp Gly Glu Glu Phe Glu Gly Gly Lys Ala Ser Asp Phe Val Leu

        35                  40                  45

Ala Met Gly Gln Gly Arg Met Ile Pro Gly Phe Glu Asp Gly Ile Lys

    50                  55                  60

Gly His Lys Ala Gly Glu Glu Phe Thr Ile Asp Val Thr Phe Pro Glu

65                  70                  75                  80

Glu Tyr His Gln Tyr Asp Glu Asn Leu Val Gln Arg Val Pro Lys Asp

                85                  90                  95

Val Phe Met Gly Val Asp Glu Leu Gln Val Gly Met Arg Phe Leu Ala

            100                 105                 110

Glu Thr Asp Gln Gly Pro Val Pro Val Glu Ile Thr Ala Val Glu Asp

        115                 120                 125

Asp His Val Val Val Asp Gly Asn His Met Leu Ala Gly Gln Asn Ala

    130                 135                 140

Lys Phe Ala Ile Asn Leu Lys Lys Val Glu Glu Arg Glu Leu Pro Glu

145                 150                 155                 160

Leu Thr Ala Glu

<210>19

<211>270

<212>PRT

<213>大肠杆菌(Escherichia coli)

<400>19

Met Lys Ser Leu Phe Lys Val Thr Leu Leu Ala Thr Thr Met Ala Val

1               5                   10                  15

Ala Leu His Ala Pro Ile Thr Phe Ala Ala Glu Ala Ala Lys Pro Ala

            20                  25                  30

Thr Ala Ala Asp Ser Lys Ala Ala Phe Lys Asn Asp Asp Gln Lys Ser

        35                  40                  45

Ala Tyr Ala Leu Gly Ala Ser Leu Gly Arg Tyr Met Glu Asn Ser Leu

    50                  55                  60

Lys Glu Gln Glu Lys Leu Gly Ile Lys Leu Asp Lys Asp Gln Leu Ile

65                  70                  75                  80

Ala Gly Val Gln Asp Ala Phe Ala Asp Lys Ser Lys Leu Ser Asp Gln

                85                  90                  95

Glu Ile Glu Gln Thr Leu Gln Ala Phe Glu Ala Arg Val Lys Ser Ser

            100                 105                 110

Ala Gln Ala Lys Met Glu Lys Asp Ala Ala Asp Asn Glu Ala Lys Gly

        115                 120                 125

Lys Glu Tyr Arg Glu Lys Phe Ala Lys Glu Lys Gly Val Lys Thr Ser

    130                 135                 140

Ser Thr Gly Leu Val Tyr Gln Val Val Glu Ala Gly Lys Gly Glu Ala

145                 150                 155                 160

Pro Lys Asp Ser Asp Thr Val Val Val Asn Tyr Lys Gly Thr Leu Ile

                165                 170                 175

Asp Gly Lys Glu Phe Asp Asn Ser Tyr Thr Arg Gly Glu Pro Leu Ser

            180                 185                 190

Phe Arg Leu Asp Gly Val Ile Pro Gly Trp Thr Glu Gly Leu Lys Asn

        195                 200                 205

Ile Lys Lys Gly Gly Lys Ile Lys Leu Val Ile Pro Pro Glu Leu Ala

    210                 215                 220

Tyr Gly Lys Ala Gly Val Pro Gly Ile Pro Pro Asn Ser Thr Leu Val

225                 230                 235                 240

Phe Asp Val Glu Leu Leu Asp Val Lys Pro Ala Pro Lys Ala Asp Ala

                245                 250                 255

Lys Pro Glu Ala Asp Ala Lys Ala Ala Asp Ser Ala Lys Lys

            260                 265                 270

<210>20

<211>114

<212>PRT

<213>大肠杆菌(Escherichia coli)

<400>20

Gly Leu Val Tyr Gln Val Val Glu Ala Gly Lys Gly Glu Ala Pro Lys

1               5                   10                  15

Asp Ser Asp Thr Val Val Val Asn Tyr Lys Gly Thr Leu Ile Asp Gly

            20                  25                  30

Lys Glu Phe Asp Asn Ser Tyr Thr Arg Gly Glu Pro Leu Ser Phe Arg

        35                  40                  45

Leu Asp Gly Val Ile Pro Gly Trp Thr Glu Gly Leu Lys Asn Ile Lys

    50                  55                  60

Lys Gly Gly Lys Ile Lys Leu Val Ile Pro Pro Glu Leu Ala Tyr Gly

65                  70                  75                  80

Lys Ala Gly Val Pro Gly Ile Pro Pro Asn Ser Thr Leu Val Phe Asp

                85                  90                  95

Val Glu Leu Leu Asp Val Lys Pro Ala Pro Leu Glu His His His His

            100                 105                 110

His His

<210>21

<211>162

<212>PRT

<213>人工的;具有SlyD的IF-插入片段的FkpA

<400>21

Gly Leu Val Tyr Gln Val Val Glu Ala Gly Lys Gly Glu Ala Pro Lys

1               5                   10                  15

Asp Ser Asp Thr Val Val Val Asn Tyr Lys Gly Thr Leu Ile Asp Gly

            20                  25                  30

Lys Glu Phe Asp Asn Ser Tyr Thr Arg Gly Glu Pro Leu Ser Phe Arg

        35                  40                  45

Leu Asp Gly Val Ile Pro Gly Trp Thr Glu Gly Leu Lys Asn Ile Lys

    50                  55                  60

Lys Gly Gly Lys Ile Lys Leu Val Ile Pro Pro Glu Leu Ala Tyr Gly

65                  70                  75                  80

Gln Tyr Asp Glu Asn Leu Val Gln Arg Val Pro Lys Asp Val Phe Met

                85                  90                  95

Gly Val Asp Glu Leu Gln Val Gly Met Arg Phe Leu Ala Glu Thr Asp

            100                 105                 110

Gln Gly Pro Val Pro Val Glu Ile Thr Ala Val Glu Asp Asp His Val

        115                 120                 125

Val Val Asp Gly Asn His Met Leu Ala Gly Gln Asn Leu Val Phe Asp

    130                 135                 140

Val Glu Leu Leu Asp Val Lys Pro Ala Pro Leu Glu His His His His

145                 150                 155                 160

His His

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号