首页> 中国专利> 具有改善的酶学特性的胰蛋白酶变体

具有改善的酶学特性的胰蛋白酶变体

摘要

本发明涉及具有改善的酶学特性的胰蛋白酶变体,尤其涉及突变的胰蛋白酶,其包含导致对亲核底物的亲和力增加的至少在两个氨基酸位置处的氨基酸取代和/或导致水解活性降低的至少在两个氨基酸位置处的氨基酸取代。

著录项

说明书

技术领域

本发明涉及具有改善的酶学特性的胰蛋白酶变体。

背景技术

迫切需要提供具有共价修饰的多肽和将特异性共价修饰引入多肽的方法。

除了各种纯化学方法(其通常是非区域特异性的或导致多肽的整体修饰)外,还有分子生物学和酶学方法,或化学和酶学方法的组合用于多肽的位点特异性修饰。

在不事先在遗传水平上操纵多肽时,相应多肽的位点特异性修饰只有在特殊情况下才会发生。例如,用于随后的酶催化修饰的识别序列在遗传水平上整合到多肽序列中,所述多肽序列可用于位置特异性修饰(引入的标记的位置由识别序列的位置确定)。

除了以位点特异性的方式对多肽进行单一修饰外,利用仅一种来源的酶对多肽进行正交双重修饰代表了使用当前技术无法实现的新颖性。在正交双重修饰的上下文中,术语“正交”是指使用相同来源的两种不同生物催化剂在两个不同的识别序列上对多肽的修饰,而没有明显的交叉反应性。修饰多肽的酶学方法利用酶的固有特性,例如通过定点诱变引入相应的识别序列后识别某些氨基酸序列或官能性。区域特异性是由对应酶的高底物特异性产生的。以这种方式修饰的每个多肽具有仅一个识别序列的事实使所述方法具有区域选择性和化学选择性特征,因为通常在共有序列内仅一个氨基酸被修饰。

蛋白酶可以是用于修饰多肽的有用的酶。胰蛋白酶是丝氨酸蛋白酶,其特异性切割碱性氨基酸残基的羧基末端。活性位点由Ser195、Asp102和His57(催化三联体)组成。Ser195与要切割的底物形成酰基酶中间体,因此显著参与蛋白酶反应性。该酰基酶中间体可以受到可变亲核体(例如水(肽水解)、胺(肽氨解)、醇和硫醇(肽(硫)酯化))的攻击。通过形成共价酰基酶中间体,丝氨酸蛋白酶胰蛋白酶因此满足了动力学控制的酰基转移的所有要求。

与肽切割相反,肽键连接是两个底物的反应。酰基供体在酶的S-结合位点结合,而酰基受体与S'结合区相互作用。

通过稳定的酰胺键对多肽的C末端修饰是基于转酰胺基作用。待标记多肽的C末端区域与胰蛋白酶变体形成酰基酶中间体,其然后可以被标记的酰基受体亲核攻击。

在WO 2006/015879 A1中,描述了胰蛋白酶变体K60E/D189K/N143H/E151H(Trypsiligase I),其识别在肽的P

在EP 18 205 212中,描述了胰蛋白酶变体,其在位置K60和D189两者处包含氨基酸取代,并且在位置Y39或Y59处包含至少再一个氨基酸取代。所描述的优选胰蛋白酶变体是Y39H/Y59H/K60E/D189K(Trypsiligase II)。EP 18 205 212进一步涉及包含靶多肽的多肽和包含识别位点Tyr-Arg-Xaa-His的限制性位点肽的用途,其中Xaa是任何氨基酸,其中所述限制性位点肽通过作为突变胰蛋白酶的底物的所述靶多肽的C末端的氨基酸Tyr与靶多肽重叠,如EP 18 205 212所述。还提供了制备C末端转酰胺基靶多肽的方法和制备N末端转酰基靶多肽的方法。

考虑到这些胰蛋白酶变体,需要提供具有改善的合成特性的变体,其在转酰胺基反应的脱酰基步骤中相较于水解更有利于肽氨解,并且独立于金属离子。

发明内容

本发明的发明人发现了胰蛋白酶变体,其包含导致对亲核底物的亲和力增加的至少在两个氨基酸位置处的氨基酸取代和/或导致水解活性降低的至少在两个氨基酸位置处的氨基酸取代。

在优选的实施方式中,胰蛋白酶变体包含至少在选自组1的两个氨基酸位置处的氨基酸取代,优选还包含至少在组2的一个氨基酸位置处的氨基酸取代,所述组1包含H40、A55、S214、G219、A221,所述组2包含R96、K97、L99、N143、E151、S190、Q192;或至少在选自组1的一个氨基酸位置处的氨基酸取代,和至少在组2的一个氨基酸位置处的氨基酸取代,所述组1包含H40、A55、S214、G219、A221,所述组2包含R96、K97、L99、N143、E151、S190、Q192;或者

至少在选自组1的一个氨基酸位置处的氨基酸取代,和至少在组2的两个氨基酸位置处的氨基酸取代,所述组1包含H40、A55、S214、G219、A221,所述组2包含R96、K97、L99、N143、E151、S190、Q192;或者

至少在选自组1的两个氨基酸位置处的氨基酸取代,和至少在组2的两个氨基酸位置处的氨基酸取代,所述组1包含H40、A55、S214、G219、A221,所述组2包含R96、K97、L99、N143、E151、S190、Q192;或者

至少在选自组1的三个氨基酸位置处的氨基酸取代,和至少在组2的一个氨基酸位置处的氨基酸取代,所述组1包含H40、A55、S214、G219、A221,所述组2包含R96、K97、L99、N143、E151、S190、Q192;或者

至少在选自组1的三个氨基酸位置处的氨基酸取代,和至少在组2的两个氨基酸位置处的氨基酸取代,所述组1包含H40、A55、S214、G219、A221,所述组2包含R96、K97、L99、N143、E151、S190、Q192;或者

至少在选自组1的三个氨基酸位置处的氨基酸取代,和至少在组2的三个氨基酸位置处的氨基酸取代,所述组1包含H40、A55、S214、G219、A221,所述组2包含R96、K97、L99、N143、E151、S190、Q192。

本发明还涉及两种不同的胰蛋白酶用于对两种不同的识别序列进行正交双重修饰的用途,以及使用两种不同胰蛋白酶变体对底物进行正交双重修饰的方法。

在优选的实施方式中,两种不同的胰蛋白酶用于对两种不同的识别序列进行正交双重修饰的用途使用作为第一酶胰蛋白酶变体的A2C8和作为第二酶胰蛋白酶变体的K7F11,或第一酶是胰蛋白酶变体A2C8,第二酶是胰蛋白酶变体K7F11_H39Y/H59Y/K189D,或第一酶是Trypsiligase II,第二酶是胰蛋白酶变体A2C8,或第一酶是Trypsiligase II,第二酶是胰蛋白酶变体K7F11,或第一酶是胰蛋白酶变体K7F11_H39Y/H59Y/K189D,第二酶是胰蛋白酶变体A2C8,或第一酶是胰蛋白酶变体K7F11_H39Y/H59Y/K189D,第二酶是胰蛋白酶变体K7F11。

在优选的实施方式中,用于底物的正交双重修饰的方法包括以下步骤:a)提供正交双重修饰的底物,b)使用识别第一识别序列的第一胰蛋白酶变体修饰所述底物,c)使用识别第二识别序列的第二胰蛋白酶变体修饰所述底物。优选地,第一胰蛋白酶变体或第二胰蛋白酶变体选自包含Trypsiligase II、胰蛋白酶变体A2C8、胰蛋白酶变体K7F11、胰蛋白酶变体K7F11_H39Y/H59Y/K189D的组。

具体实施方式

为了便于理解本发明,将提供结合本发明使用的术语学的简要讨论。本公开使用Schechter,J.,和Berger,A.,Biochem.Biophys.Res.Commun.[生物化学与生物物理学研究通讯]27(1967)157-162的术语,以描述肽底物上各种氨基酸残基的位置和相应蛋白水解酶的活性位点内的单个结合位点。

根据上述Schechter,J.和Berger,A.提出的术语学,肽底物的氨基酸残基用字母“P”表示。将底物的要切割的肽键(“切割位点”或“识别位点”)的N末端侧上的氨基酸命名为P

内肽酶(例如胰蛋白酶)的底物的氨基酸通式如下:

P

内肽酶的底物结合位点的命名类似于肽底物的氨基酸残基的命名。但是,内肽酶的结合亚位点用字母“S”表示,并且可以包括一个以上的氨基酸残基。切割位点的N末端位点上氨基酸的底物结合位点标记为S

描述内肽酶的底物结合位点的通式为:

S

S

术语“变体”是指具有与天然多肽序列在某种程度上不同的氨基酸序列的多肽。通常,变体氨基酸序列将与相应的亲本胰蛋白酶序列具有至少约80%的同源性,并且优选地,它将与此类相应的亲本胰蛋白酶序列具有至少约90%,更优选地至少约95%的同源性。氨基酸序列变体在天然氨基酸序列的氨基酸序列内的某些位置处具有取代、缺失和/或插入。优选地,序列同源性是至少96%或97%。

“同源性”定义为在比对序列和引入缺口(如果需要的话,以达到最大的同源性百分比)后氨基酸序列变体中相同的残基的百分比。用于比对的方法和计算机程序在本领域中是众所周知的。一种这样的计算机程序是基因技术公司(Genentech,Inc.)编写的“Align2”,它于1991年12月10日与用户文档在华盛顿特区20559的美国版权局备案。

本发明的第一方面提供了突变的胰蛋白酶,其至少在一个氨基酸位置处包含氨基酸取代,所述氨基酸位置选自包含以下的组:根据胰凝乳蛋白酶命名法,分别对应于如SEQID NO:1所示的胰蛋白酶序列的位置23、38、78、79、81、123、131、172、174、192、196和198的H40、A55、R96、K97、L99、N143、E151、S190、Q192、S214、G219、A221。

本领域技术人员熟悉所谓的胰凝乳蛋白酶命名法,如Hartley,B.S.,和Shotton,D.M.,The Enzymes[酶],P.D.Boyer(编辑),第3卷,(1971),第323-373页中描述的,并且在将变体胰蛋白酶的位置(根据胰凝乳蛋白酶命名法给出的位置)与SEQ ID No:1的胰蛋白酶序列的相应位置进行比对方面没有问题。

在优选的实施方式中,突变的胰蛋白酶在位置K60和D189两者处包含另外的氨基酸取代,并且在位置Y39或Y59处包含至少再一个氨基酸取代。

根据胰凝乳蛋白酶命名法的位置39对应于如SEQ ID NO:1所示的来自褐家鼠(Rattus norvegicus)的成熟阴离子大鼠胰蛋白酶II的序列的位置22。

根据胰凝乳蛋白酶命名法的位置59对应于如SEQ ID NO:1所示的来自褐家鼠的成熟阴离子大鼠胰蛋白酶II的序列的位置42。

根据胰凝乳蛋白酶命名法的位置60对应于如SEQ ID NO:1所示的来自褐家鼠的成熟阴离子大鼠胰蛋白酶II的序列的位置43。

根据胰凝乳蛋白酶命名法的位置189对应于如SEQ ID NO:1所示的来自褐家鼠的成熟阴离子大鼠胰蛋白酶II的序列的位置171。

由于本领域技术人员习惯于参照胰凝乳蛋白酶命名法来表示位置,因此,在下文中,对特定序列位置(例如位置K60或简单的位置60)的提及仅基于根据胰凝乳蛋白酶命名法的位置。

在另一个优选的实施方式中,突变的胰蛋白酶包括在位置K60和D189两者处的另外的氨基酸取代,以及在位置N143或位置E151处至少再一个氨基酸被组氨酸取代,所述位置是根据胰凝乳蛋白酶命名法的位置,其分别对应于如SEQ ID NO:1所示的序列的位置43、171、123和131。

根据胰凝乳蛋白酶命名法的位置60对应于如SEQ ID NO:1所示的来自褐家鼠的成熟阴离子大鼠胰蛋白酶II的序列的位置43。

根据胰凝乳蛋白酶命名法的位置143对应于如SEQ ID NO:1所示的来自褐家鼠的成熟阴离子大鼠胰蛋白酶II的序列的位置123。

根据胰凝乳蛋白酶命名法的位置151对应于如SEQ ID NO:1所示的来自褐家鼠的成熟阴离子大鼠胰蛋白酶II的序列的位置131。

根据胰凝乳蛋白酶命名法的位置189对应于如SEQ ID NO:1所示的来自褐家鼠的成熟阴离子大鼠胰蛋白酶II的序列的位置171。

为了鉴定胰蛋白酶中的相关突变位点并提供具有改善的特性的变体,本发明人从基于胰蛋白酶变体K60E/N143H/E151H/D189K(Trypsiligase I)的两个独立的酶文库开始。

为了生成文库A,将氨基酸位置H40、A55、K97、L99、S190和Q192随机化,为了生成文库B,将位置D95、R96、L99、S214、G219和A221随机化。通过噬菌体展示的选择以及随后的基于ELISA的筛选产生了Trypsiligase I变体2G10(对于文库A)和变体1C11(对于文库B)作为就合成潜力而言最佳的变体。

对这两个变体的酶动力学分析(参见表1和图1)显示,合成潜力的优化有不同的原因。变体2G10(Trypsiligase I+H40P、A55S、K97D、L99F、S190S、Q192E)显示与初始酶Trypsiligase I相比,对亲核RH底物的亲和力强烈增强,由此它优先作为亲核体整合与水竞争,从而导致氨解(=期望的产物形成)而不是不期望的水解。

与之相对的是变体1C11(Trypsiligase I+R96V、L99F、S214G、G219S、A221G),其表现出的水解活性相较于Trypsiligase I的水解活性降低到1/20,由此氨解和水解之间的关系强烈地向氨解侧移动。该变体未能显示出对亲核体的改善的亲和力。

图1:由Trypsiligase I以及改善的变体2G10、1C11和杂合变体催化的转酰胺基反应的产物形成的时间进程。反应条件:15μM Bz-AAYRHAAG-OH(酰基供体),30μM H-RHAK-OH(酰基受体),0.5-2.1μM胰蛋白酶变体,100mM HEPES/NaOH pH 7.8,0.1mM ZnCl2、100mMNaCl,10mM CaCl2,T=30℃。UPLC分析:Waters Acquity Ultra Performance LC,C18柱,梯度5-40%乙腈,4分钟,在254nm处检测。

图2:在Trypsiligase II-文库的噬菌体展示选择和筛选过程中鉴定出的所选变体的底物特异性数据。100μM酰基供体(Bz-PGGXaaXaaXaaXaaAG-OH);200μM酰基受体(H-XaaXaaXaaAK(DNP)-OH);1-5μM酶变体;100mM HEPES pH7.8,100mM NaCl,10mM CaCl

图3:由变体A2C8、A2C8_H39Y、A2C8_H59Y和A2C8_H39Y/H59Y催化的转酰胺基反应的产物形成的时间进程。反应条件:100μM Bz PGGYRKKAG-OH(酰基供体),200μM H-RKKAK-OH(酰基受体),1μM胰蛋白酶变体,100mM HEPES/NaOH pH 7.8,100mM NaCl,10mM CaCl

图4:在Trypsiligase II-文库的噬菌体展示选择和筛选过程中鉴定出的所选变体的底物特异性数据。100μM酰基供体(Bz-PGGXaaXaaXaaXaaAG-OH);200μM酰基受体(H-XaaXaaXaaAK(DNP)-OH);1-5μM酶变体;100mM HEPES pH7.8,100mM NaCl,10mM CaCl

图5:由变体A2C8_H39Y/H59Y/E60K/K189D和野生型胰蛋白酶催化的与各种肽底物相关的转酰胺基反应的产物形成的时间进程。反应条件:100μM酰基供体(BzPGGXaaXaaXaaHAG-OH),200μM酰基受体(H-XaaXaaXaaAK(DNP)-OH),10μM胰蛋白酶变体A2C8_H39Y/H59Y/E60K/K189D或2.5nM阴离子大鼠胰蛋白酶II,100mM HEPES/NaOH pH 7.8,0.1mM ZnCl

图6:通过利用两种Trypsiligase II变体的底物特异性的变化来对Fab片段进行双重修饰。使用曲妥珠单抗(Trastuzumab)的HER2特异性Fab片段(抗-Her2-Fab-LC_RRKH/HC_YRAH,重链(SEQ ID NO:2)和抗-Her2-Fab-LC_RRKH/HC_YRAH,轻链(SEQ ID NO:3)),并在遗传上引入各个识别序列。A)第一步中使用识别序列RRKH的Trypsiligase II变体K7F11_H39Y/H59Y/K189D来连接带有羧基荧光素(CF)的亲核体。B)在第二步中,将识别序列YRAH的Trypsiligase II变体A2C8用于用共价结合于美登素(DM1)的亲核体进行修饰。LC-MS分析。用于第一和第二修饰步骤的经修饰和未修饰的Fab片段种类的量分别显示在M谱A和B中。MS谱A)峰1:抗-Her2-Fab-LC_R-OH/HC_YRAH(M

使用配备RP-C18柱(ACQUITY UPLC BEH 130,C18,1.7μm,2.1×100mm)的WatersACQUITY UPLC系统以0.5ml/min的流速进行肽和反应分析。所使用的流动相分别是含0.05%TFA的水(A)和含0.05%TFA的乙腈(B)。为了进行分析,使用了两种方法:

方法I:线性梯度为5分钟内5%-40%B,在254nm处检测。

方法II:线性梯度为5分钟内5%-60%B,在360nm处检测。

从积分峰面积计算出产物和离析物的量。

质谱(MS)分析是通过LC-MS进行的,其中使用连接到Waters

为了重组产生所有描述的胰蛋白酶变体,使用Agel/XhoI限制性酶切位点将相应的基因亚克隆到pPICZαA表达载体中。用基因编码载体转化大肠杆菌DH5α,然后将细胞铺板在含有25μg/ml Zeocin的LB低盐(5g/l酵母提取物;10g/l胰蛋白胨;5g/l NaCl)琼脂板上。在37℃孵育过夜后,挑选单个菌落并将其转移到含有25μg/ml Zeocin的LB低盐液体培养基中。将细胞在连续振荡下于37℃孵育过夜。通过以5000xg离心5分钟收集细胞,然后根据标准实验流程分离质粒。将分离的质粒通过Sacl消化线性化。接着通过电穿孔法用线性化质粒转化巴斯德毕赤酵母(P.pastoris)X-33细胞,并铺板在含100μg/ml Zeocin的YPDS(10g/l酵母提取物;20g/l蛋白胨;20g/l右旋糖;1M山梨糖醇)琼脂平板上。将这些板在30℃下孵育三天。为了表达胰蛋白酶变体,挑选单个菌落并将其转移到含有2%右旋糖的缓冲基本培养基(100mM磷酸钾pH 6.0;1.34%酵母氮基)中。在30℃和连续振荡下孵育48小时后,以4000xg持续5分钟来收获细胞。之后,将细胞沉淀重悬于缓冲基本培养基中,并通过添加1%(v/v)甲醇诱导蛋白质产生,而胰蛋白酶变体则分泌到上清液中。通过每天添加1%(v/v)甲醇,在连续振荡下于30℃孵育5天来进行蛋白质生产。五天后,通过以5000xg离心20分钟将细胞与上清液分离。为了分离分泌的胰蛋白酶变体,进行了由以下组成的两步纯化:阳离子交换色谱,然后进行尺寸排阻色谱。使用AKTA FPLC,将20ml HiPrep

为了重组产生Her2特异性Fab片段抗-Her2-Fab-LC_RRKH/HC_YRAH,通过标准方法将相应的基因序列(Seq.ID No.64)亚克隆到pASK-IBA7Plus表达载体中。用表达质粒转化大肠杆菌BL21(DE3)并铺板在含有100μg/ml氨苄青霉素的LB(5g/l酵母提取物;10g/l胰蛋白胨;10g/l NaCl)琼脂板上。在37℃孵育过夜后,挑选单个菌落并将其转移到含有100μg/ml氨苄青霉素的LB液体培养基中。为了表达Fab片段,将该预培养物在37℃下在连续振荡下孵育过夜,然后用于含有100μg/ml氨苄青霉素的LB培养基(起始OD

所有用于肽合成的试剂和洗涤剂都是在Sigma

如Merrifield所述,使用Fmoc/保护基策略通过标准程序合成肽。根据最终的肽序列,第一个氨基酸与氯三苯甲基树脂偶联。接下来,通过使用在DMF中的20%哌啶进行Fmoc切割。为了进一步偶联,使用((1-[双(二甲基氨基)亚甲基]-1H-1,2,3-三唑并[4,5-b]吡啶鎓3-氧化六氟磷酸盐)(HATU)激活氨基酸。通过使用95%TFA、2.5%三异丙基硅烷和2.5%水,最终从树脂中释放出来并且使侧链保护基脱保护。蒸发溶剂后,将油性剩余物溶于水/ACN中,并通过制备型HPLC(默克/日立(Merck/Hitachi)-HPLC,Vydac-C18,5-80%ACN,30/60min)纯化。冷冻干燥后,获得了包含肽级分的产物,呈结晶粉末。通过HPLC(Waters,ACQUITY UPLC,BEH130)和LC-MS(Waters,X-Bridge BEH300)证明了产物的身份和纯度。所有肽的纯度均高于98%。

为了合成美登素(mertansine,DM1)官能化的肽H-RKKAK(MCC-DM1)-OH,使用了结构单元Fmoc-Lys(ivDde)。合成RKKAK(ivDde)肽后,通过使用DMF中的2%肼从完全保护的肽中除去赖氨酸的保护基。之后,将赖氨酸侧链用在DMF中的1.1当量琥珀酰亚胺4-(N-马来酰亚胺基甲基)环己烷-1-甲酸酯官能化。在最后一步中,使用缓冲磷酸盐缓冲液/ACN系统(pH7.4)使RKKAK(MCC)通过迈克尔加成反应与美登素偶联。

如前所述,完成了从树脂的最终释放和侧链保护基的脱保护以及H-RKKAK(MCC-DM1)-H的纯化。获得的产物为两种物质的异构体混合物。产物身份和纯度已通过UPLC和LC-MS验证。H-RKKAK(MCC-DM1)-OH的纯度高于99%。

在30℃下,在含有15至250μM酰基供体、2当量的相应的酰基受体、变化浓度的胰蛋白酶变体,100mM HEPES/NaOH pH 7.8、±0.1mM ZnCl

在30℃下在含有变化浓度的酰基供体Bz-PGGYRAHAG-OH(对于Trypsiligase II,0-5000μM;对于A2C8变体,0-1500μM)、2μM胰蛋白酶变体、100mM HEPES/NaOH pH 7.8、100mMNaCl、10mM CaCl

对于Trypsiligase II,由于其对锌离子的强烈依赖性,亲核肽(酰基受体)的K

在30℃下,在含有250μM酰基供体Bz-PGGYRAHAG-OH、变化浓度的酰基受体H-RAHAK(DNP)-OH(在不存在锌离子情况下对于Trypsiligase II是0-5000μM,在存在锌离子情况下对于Trypsiligase II是0-1500μM,对于A2C8变体是0-1000μM)、0.2-1.5μM胰蛋白酶变体、100mM HEPES/NaOH pH 7.8、±0.1mM ZnCl

为了对Her2特异性Fab片段进行双重修饰,将两个正交识别序列分别连接到重链和轻链的相应C末端。这样做是为了实现酶介导的两种不同官能团的偶联。如Seq.ID No.2中所示,轻链在C末端被短肽间隔子(LSPGG)延长,随后是氨基酸序列RRKHAG,其包含变体K7F11_H39Y/H59Y/K189D的识别序列(RRKH)。重链的C末端被短肽间隔子(ADKPGG)延长,随后是氨基酸序列YRAHAG,其包含变体A2C8的识别序列(YRAH)和cMyc-tag(EQKLISEEDL)用于任选的纯化或检测目的。包含两个正交识别序列(aHer2-Fab-LC_RRKH-HC_YRAH)的Her2特异性Fab片段的双重修饰是通过两步修饰反应进行的,在第一步中将荧光染料(5(6)-羧基荧光素)连接到轻链,在第二步中将细胞毒性化合物美登素(DM1)连接到重链(图6)。

在包含100μM aHer2-Fab-LC_RRKH/HC_YRAH、2000μM H-RKHAK(CF)-OH、5μMK7F11_H39Y/H59Y/K189D、100mM HEPES/NaOH pH 7.8、100mM NaCl的溶液中进行用于修饰轻链的转酰胺基反应。通过添加酶来起始反应,并在30℃下孵育180分钟。随后,通过蛋白G亲和色谱去除酶以及剩余的带有羧基荧光素的亲核体(H-RKHAK(CF)-OH)。使用AKTA FPLC,将1ml HiTrap

重链的第二修饰反应是在含有50μM单一修饰的aHer2-Fab-LC_RRKHAK(CF)/HC_YRAH、1000μM H-RKKAK(MCC-DM1)-OH、5μM A2C8、100mM HEPES/NaOH pH 7.8、100mM NaCl的溶液中进行的。通过添加酶来起始反应,并在30℃下孵育40分钟。随后,如上所述,通过蛋白G亲和色谱除去酶以及剩余的带有DM1的亲核体(H-RKHAK(MCC-DMI)-OH)。通过LC-MS分析第一修饰步骤和第二修饰步骤的经修饰的和未修饰的Fab片段种类的比例(参见实施例1)。在第一修饰步骤之后,多达90%的Fab片段在轻链上被羧基荧光素专有修饰(抗-Her2-Fab-LC_RRKHAK(CF)/HC_YRAH,图6谱A峰3,M

在第二修饰步骤之后,多达75%的Fab片段被双重修饰,即在轻链上被羧基荧光素修饰,在重链上被DM1修饰(抗-Her2-Fab-LC_RRKHAK(CF)/HC_YRKKAK(MCC-DM1),图6谱B峰4,M

实施例1

通过模型转酰胺基反应并在以下条件下进行产物收率以及氨解的表观周转率

表1:Trypsiligase I以及改善的变体2G10和1C11的酶学参数总结。

与天然Trypsiligase(222μM)相比,2G10显示出对酰基受体的亲和力增加(23μM),并且1C11对酰基受体的亲和力降低(>5000μM)。两种改善的变体均具有显著增加的氨解与水解活性的比率(对于2G10和1C11而言,因子为6和13)。这与增加的产物收率反映出的改善的合成效率有关。对于2G10,改善的氨解与水解的比率是对肽亲核体具有更好亲和力的结果。这伴随着水分子与肽之间直接竞争在转酰胺基反应的脱酰基步骤中对酰基-酶-中间体的亲核攻击。对于1C11,改善的氨解与水解的比率是水解活性显著降低(因子为37)的结果,而氨解活性则降低到1/3。将2G10和1C11突变组合在一个变体(杂合体)中,以检验由于改善方式不同而对合成效率是否有协同作用。

实施例2

基于这些酶动力学观察,在这两个变体2G10和1C11中鉴定的位置已组合到杂合变体中。如表2和图1所示,由变体2G10和1C11中鉴定的位置的组合得到的杂合变体受益于两种积极作用。

通过模型转酰胺基反应并在以下条件下进行产物收率以及氨解的表观周转率

表2:Trypsiligase I、2G10、1C11和杂合变体的酶学参数总结。

杂合变体显示出合成效率的进一步提高,这反映在产物收率的提高,这是由于氨解与水解的比率显著改善,特别是在低底物浓度(15μM)下。这得出结论,存在协同作用,从而产生这样的胰蛋白酶变体,所述变体显示出比天然Trypsiligase I以及改善的变体2G10和1C11更好的合成特性。为了生成具有改变的识别序列的新的胰蛋白酶变体,以Trypsiligase II为基础,设计了新的胰蛋白酶文库,其中包含显示改善Trypsiligase的I合成效率的氨基酸位置。该文库通过噬菌体展示进行选择,以使用具有识别序列YRAH和YRKH的两种不同底物富集潜在改善的转酰胺基酶。

实施例3

在这些研究的基础上,已将这两个变体2G10和1C11的突变位置组合在基于胰蛋白酶变体Y39H/Y59H/K60E/D189K(Trypsiligase II)的新的酶文库中,从而使由该文库得到的变体受益于两种积极作用,因此得到进一步优化。因此,在该Trypsiligase II文库中,位置40、55、96、97、143、151、190、192、214、219和221被随机化,而突变L99F是固定的,因为它同时存在于Trypsiligase I文库A和B中。Trypsiligase I中的位置143和151负责锌络合,因此传达了对识别序列YRH的组氨酸特异性。在Trypsiligase II中,该组氨酸特异性被位置39和59移位,产生了识别序列YRAH。因此,潜在地负责P

表3:在用含YR

表4:在用含YR

为了鉴定改善的生物催化剂,对通过噬菌体展示进行的第4轮选择的两个变体池进行了基于ELISA的高通量筛选。总共能够鉴定出26种胰蛋白酶变体,这些变体在YRAH底物或YRKH底物情况下显示出提高的合成效率。未鉴定出清楚地在两个识别序列之间区分的变体。

实施例4

对通过噬菌体展示选择鉴定出的最有前途的变体进一步进行关于底物特异性的表征,如图2所示。

变体A2C8和K7F11显示出最高的对YRKK底物序列活性。在所有变体中,均观察到了对P

对于最有前途的变体A2C8(Trypsiligase II+H40F、A55A、R96E、K97D、L99F、N143E、E151Y、S190V、Q192A、S214G、G219Q、A221T)和K7F11(Trypsiligase II+H40Y、A55A、R96E、K97E、L99F、N143V、E151 E、S190A、Q192V、S214G、G219P、A221Q),进行了关于金属离子依赖性和合成效率的进一步研究。

表5显示了关于由Trypsiligase II、A2C8和K7F11催化的转酰胺基反应对锌依赖性的结果。表6显示了对Trypsiligase II以及变体A2C8和K7F11进行动力学测量的结果。

表5:由Trypsiligase II、A2C8和K7F11催化的转酰胺基反应的锌依赖性的研究。在锌离子存在或不存在的情况下,通过模型转酰胺基反应进行产物收率以及氨解的表观周转率

天然Trypsiligase II显示出对锌离子的强依赖性。在不存在锌离子的情况下,氨解反应的表观周转率降低至1/12,这导致产物收率从18%降至4%。原因在于,由于Trypsiligase II(H39和H59)的人工组氨酸与肽定位组氨酸之间缺少以锌离子为中心原子的络合而导致对亲核体的亲和力降低。使用具有YRAH和YRKH序列的两种底物时,A2C8未显示出对锌离子的依赖性,而氨解反应的表观周转率受益于不存在锌离子。这允许P

表6:Trypsiligase II、A2C8和K7F11的酶学参数总结。通过模型转酰胺基反应,在高底物浓度和低底物浓度下,使用两当量的相应亲核体,进行产物收率以及氨解的表观周转率

与天然Trypsiligase II相比,进一步研究了变体A2C8和K7F11作为转酰胺基酶的适用性。因此,使用具有优选的识别基序的肽底物,通过模型转酰胺基反应来确定用于催化的转酰胺基反应的酶学参数。此外,还分别在高(250μM)和低(15μM)底物浓度下进行了模型转酰胺基反应,以检验新的生物催化剂在低底物浓度下是否也能有效地催化所期望的反应,这是治疗性蛋白修饰的关键要求。在高底物浓度下,天然Trypsiligase II仅显示0.9的差的氨解与水解比率,导致17%的中等产物收率。将底物浓度降低至15μM导致氨解反应的表观周转率显著降低,而脱酰基步骤主要是水解反应,其周转率高十倍,从而导致3%的差的产品收率。改善的生物催化剂显示出显着提高的合成效率,尤其是变体A2C8。在250μM的底物浓度下,A2C8具有70的出色的氨解与水解的比率,最终产物收率为64.9%,几乎与理论上可达到的67%的收率相符,该收率在给定的反应条件(两倍过量的亲核体)下受热力学限制。即使在低底物浓度下,氨解反应在脱酰基步骤中仍明显占优势,显示的表观周转率比水解反应高七倍。产物收率达到46%,A2C8显示出的产物收率比天然Trypsiligase II高14倍。推定通过引入突变实现了改善的转酰胺基活性,所述突变改善生物催化剂对亲核肽的亲和力并/或降低其水解活性。因此,确定了描述天然Trypsiligase II和变体A2C8两者参数的相应实验数据。这些数据的总结在表7中列出,并且包括酶对亲核肽的K

在对由Trypsiligase II催化的转酰胺基反应的锌依赖性的研究中观察到第一迹象,即对亲核肽的亲和力提高的推定已经适用于天然Trypsiligase II。已显示,Trypsiligase II对锌离子有强烈的依赖性,因为缺少锌离子会导致氨解反应的表观周转率显著降低,并且更为重要的是会导致产物收率显著地降低了因子4。如上所述,对亲核肽的酶亲和力降低的原因是Trypsiligase II的人工组氨酸(H39和H59)与P

通过测量在存在或不存在锌离子的情况下亲核肽的K

与天然Trypsiligase II相比,A2C8的转酰胺基反应增强的另一个关键要素依赖于其固有的水解活性降低。在不存在亲核肽的情况下,A2C8的水解反应周转率为86.6mkat/mol,而Trypsiligase II的周转率确定为602.1mkat/mol。酶的水解活性降低了因子7是一个重要参数,因为在脱酰基步骤中水解与氨解竞争,从而决定了合成反应的产物收率。综上所述,我们证明了,A2C8的转酰胺基性能增强是对亲核肽的酶亲和力改善和固有水解活性降低的原因。

A2C8的这两个特征与我们的进化方法中引入Trypsiligase II中的新突变直接相关。表7:Trypsiligase II和改善的变体A2C8的酶学参数总结。用Bz-PGGYRAHAG-OH作为酰基供体,进行水解反应的周转率(k

实施例5

为了证明通过进化选择引入的A2C8和K7F11的突变的激活作用,在下一步中,将衍生自Trypsiligase II的突变Y39H、Y59H、K60E和D189K逐渐突变回野生型胰蛋白酶中存在的氨基酸残基,并分析合成潜力。这些数据表明,即使没有来源于Trypsiligase II(Y39H/Y59H/K60E/D189K)或Trypsiligase I(K60E/N143H/E151H/D189K)的突变,本专利要保护的位置也足以诱导野生型胰蛋白酶的转酰胺基活性。

作为第一步,通过模型转酰胺基反应研究了A2C8中位置39和59处的人工组氨酸向酪氨酸(野生型胰蛋白酶在这些位置处可以找到酪氨酸)的回复突变的影响。已经研究了在位置39或59具有单个回复突变的变体(A2C8_H39Y和A2C8_H59Y),以及在位置39和59两者均具有突变的变体(A2C8_H39Y/H59Y)(图3)。

在位置39或59具有单个回复突变的变体(A2C8_H39Y和A2C8_H59Y)以及在位置39和59均具有突变的变体(A2C8_H39Y/H59Y)显示出与变体A2C8相当的合成性能(如图3所示)。这得出结论,位置39和59处的野生型突变对A2C8的合成效率没有影响,表明A2C8的有利合成特性是通过在随机位置上新引入的突变而获得的。

为了进一步研究所鉴定的突变是否足以将野生型蛋白酶胰蛋白酶转变为转酰胺基酶,另外将位置189和60处的两个另外的Trypsiligase II相关突变突变回野生型氨基酸。将位置189和60的回复突变作为单个回复突变(A2C8_H39Y/H59Y/E60K和A2C8H39Y/H59Y/K189D)以及双突变(A2C8_H39Y/H59Y/E60K/K189D)引入变体A2C8_H39Y/H59Y。在第一步中,研究所有变体的底物特异性,因为已知位置189影响胰蛋白酶的S

变体A2C8_H39Y/H59Y/E60K中位置60处的回复突变引起底物的P

然后将对于氨解反应具有最高表观周转率的三种底物用于研究变体A2C8_H39Y/H59Y/E60K/K189D的合成性能。在图5中,示出了使用各种肽底物时由变体A2C8_H39Y/H59Y/E60K/K189D催化的转酰胺基反应的产物形成的时间进程。

如图5所示,在使用带有识别序列YRRH、YMKH和RMKH的底物的情况下,变体A2C8_H39Y/H59Y/E60K/K189D能够有效催化转酰胺基产物的形成。对于具有识别序列YRRH的底物,能够观察到最高的产物收率,为38%。在相当的条件下,A2C8的产物收率达到59%。对于野生型胰蛋白酶,几乎没有观察到产物形成。这证实了先前的推定,即新引入的突变足以将野生型蛋白酶胰蛋白酶转变为转酰胺基酶。

由于这些突变与对亲核肽的酶亲和力改善以及固有水解活性降低有关,因此能够得出结论,通过引入影响对亲核肽的酶亲和力的改善和/或降低内在水解活性的氨基酸交换,所有胰蛋白酶种类总体都能转化为转酰胺基酶。

实施例6

随后,通过利用两种Trypsiligase II变体的底物特异性的变化,研究了Fab片段的双重修饰。

有趣的是,在变体K7F11内的位置39、59和189处的Trypsiligase II相关突变的回复突变(导致变体K7F11_H39Y/H59Y/K189D)导致转酰胺基酶在P

K7F11_H39Y/H59Y/K189D对识别序列RRKH具有高的比活性,而芳香族或脂肪族取代(至少被A2C8和K7F11接受)导致氨解反应的表观周转率显著降低。

这意味着,即使在存在A2C8相关识别序列(如YRAH)的情况下,变体K7F11_H39Y/H59Y/K189D也能够有效地区分识别序列RRKH。

为了证明对蛋白质在两个不同的修饰位点上进行正交双重修饰的可行性,Her2特异性Fab片段在轻链的C末端带有RRKH基序,在重链的C末端处带有YRAH基序(见图6)。

之后执行顺序双重修饰:

在第一步中,用带有羧基荧光素的亲核体修饰轻链,这是用变体K7F11_H39Y/H59Y/K189D催化的。质谱分析显示了在轻链C末端的几乎专有的修饰。通过蛋白G亲和色谱去除了酶以及剩余的亲核体(RKHAK(CF)-OH)。

在第二步中,用带有DM1的亲核体修饰重链,这是用变体A2C8催化的。重链C末端的专有修饰可通过质谱法确认。如通过质谱法估计的,双重标记的Fab片段的收率为约75%。

在正交双重修饰的情况下,术语“正交”指的是使用同一来源的两种不同生物催化剂在两个不同识别序列上修饰多肽,而没有显著的交叉反应性,遵循包括识别序列的N末端和C末端定位的修饰策略能够是可行的(见表8)。

表8:蛋白质的双重和正交修饰的范围内可行的酶和识别序列对的总结。

下表9总结了相关Trypsiligase变体或文库的最重要的关键数据:

表9:本文描述的Trypsiligase变体或文库的数据总结。

大鼠阴离子胰蛋白酶II(SEQ ID NO:1):

抗-Her2-Fab-LC_RRKH/HC_YRAH,重链(SEQ ID NO:2):

抗-Her2-Fab-LC_RRKH/HC_YRAH,轻链(SEQ ID NO:3):

进一步公开了以下多肽:

DNP-2,4-二硝基苯基

CF-5(6)-羧基荧光素

HexMal-6-马来酰亚胺基己酸

PEG20.000-聚乙二醇,平均质量为20000g/mol

MCC-4-(N-马来酰亚胺基甲基)环己烷-1-甲酸酯

Ac-乙酸酯接头

抗-Her2-Fab-LC_RRKH/HC_YRAH的基因序列(SEQ ID NO:64):

序列表

<110> 生物制药翻译学院德绍研究有限公司

<120> 具有改善的酶学特性的胰蛋白酶变体

<130> F-CF210272

<150> EP18214031.9

<151> 2018-12-19

<160> 64

<170> SIPOSequenceListing 1.0

<210> 1

<211> 223

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 1

Ile Val Gly Gly Tyr Thr Cys Gln Glu Asn Ser Val Pro Tyr Gln Val

1 5 10 15

Ser Leu Asn Ser Gly Tyr His Phe Cys Gly Gly Ser Leu Ile Asn Asp

20 25 30

Gln Trp Val Val Ser Ala Ala His Cys Tyr Lys Ser Arg Ile Gln Val

35 40 45

Arg Leu Gly Glu His Asn Ile Asn Val Leu Glu Gly Asn Glu Gln Phe

50 55 60

Val Asn Ala Ala Lys Ile Ile Lys His Pro Asn Phe Asp Arg Lys Thr

65 70 75 80

Leu Asn Asn Asp Ile Met Leu Ile Lys Leu Ser Ser Pro Val Lys Leu

85 90 95

Asn Ala Arg Val Ala Thr Val Ala Leu Pro Ser Ser Cys Ala Pro Ala

100 105 110

Gly Thr Gln Cys Leu Ile Ser Gly Trp Gly Asn Thr Leu Ser Ser Gly

115 120 125

Val Asn Glu Pro Asp Leu Leu Gln Cys Leu Asp Ala Pro Leu Leu Pro

130 135 140

Gln Ala Asp Cys Glu Ala Ser Tyr Pro Gly Lys Ile Thr Asp Asn Met

145 150 155 160

Val Cys Val Gly Phe Leu Glu Gly Gly Lys Asp Ser Cys Gln Gly Asp

165 170 175

Ser Gly Gly Pro Val Val Cys Asn Gly Glu Leu Gln Gly Ile Val Ser

180 185 190

Trp Gly Tyr Gly Cys Ala Leu Pro Asp Asn Pro Gly Val Tyr Thr Lys

195 200 205

Val Cys Asn Tyr Val Asp Trp Ile Gln Asp Thr Ile Ala Ala Asn

210 215 220

<210> 2

<211> 245

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 2

Glu Val Lys Leu Gln Glu Ser Gly Gly Gly Leu Val Gln Pro Gly Gly

1 5 10 15

Ser Leu Arg Leu Ser Cys Ala Ala Ser Gly Phe Asn Ile Lys Asp Thr

20 25 30

Tyr Ile His Trp Val Arg Gln Ala Pro Gly Lys Gly Leu Glu Trp Val

35 40 45

Ala Arg Ile Tyr Pro Thr Asn Gly Tyr Thr Arg Tyr Ala Asp Ser Val

50 55 60

Lys Gly Arg Phe Thr Ile Ser Ala Asp Thr Ser Lys Asn Thr Ala Tyr

65 70 75 80

Leu Gln Met Asn Ser Leu Arg Ala Glu Asp Thr Ala Val Tyr Tyr Cys

85 90 95

Ser Arg Trp Gly Gly Asp Gly Phe Tyr Ala Met Asp Tyr Trp Gly Gln

100 105 110

Gly Thr Leu Val Thr Val Ser Ser Ala Ser Thr Lys Gly Pro Ser Val

115 120 125

Phe Pro Leu Ala Pro Ser Ser Lys Ser Thr Ser Gly Gly Thr Ala Ala

130 135 140

Leu Gly Cys Leu Val Lys Asp Tyr Phe Pro Glu Pro Val Thr Val Ser

145 150 155 160

Trp Asn Ser Gly Ala Leu Thr Ser Gly Val His Thr Phe Pro Ala Val

165 170 175

Leu Gln Ser Ser Gly Leu Tyr Ser Leu Ser Ser Val Val Thr Val Pro

180 185 190

Ser Ser Ser Leu Gly Thr Gln Thr Tyr Ile Cys Asn Val Asn His Lys

195 200 205

Pro Ser Asn Thr Lys Val Asp Lys Lys Val Glu Pro Lys Ser Cys Ala

210 215 220

Asp Lys Pro Gly Gly Tyr Arg Ala His Ala Gly Glu Gln Lys Leu Ile

225 230 235 240

Ser Glu Glu Asp Leu

245

<210> 3

<211> 225

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 3

Asp Ile Glu Leu Thr Gln Ser Pro Ser Ser Leu Ser Ala Ser Val Gly

1 5 10 15

Asp Arg Val Thr Ile Thr Cys Arg Ala Ser Gln Asp Val Asn Thr Ala

20 25 30

Val Ala Trp Tyr Gln Gln Lys Pro Gly Lys Ala Pro Lys Leu Leu Ile

35 40 45

Tyr Ser Ala Ser Phe Leu Tyr Ser Gly Val Pro Ser Arg Phe Ser Gly

50 55 60

Ser Arg Ser Gly Thr Asp Phe Thr Leu Thr Ile Ser Ser Leu Gln Pro

65 70 75 80

Glu Asp Phe Ala Thr Tyr Tyr Cys Gln Gln His Tyr Thr Thr Pro Pro

85 90 95

Thr Phe Gly Gln Gly Thr Lys Leu Glu Ile Lys Arg Thr Val Ala Ala

100 105 110

Pro Ser Val Phe Ile Phe Pro Pro Ser Asp Glu Gln Leu Lys Ser Gly

115 120 125

Thr Ala Ser Val Val Cys Leu Leu Asn Asn Phe Tyr Pro Arg Glu Ala

130 135 140

Lys Val Gln Trp Lys Val Asp Asn Ala Leu Gln Ser Gly Asn Ser Gln

145 150 155 160

Glu Ser Val Thr Glu Gln Asp Ser Lys Asp Ser Thr Tyr Ser Leu Ser

165 170 175

Ser Thr Leu Thr Leu Ser Lys Ala Asp Tyr Glu Lys His Lys Val Tyr

180 185 190

Ala Cys Glu Val Thr His Gln Gly Leu Ser Ser Pro Val Thr Lys Ser

195 200 205

Phe Asn Arg Gly Glu Cys Leu Ser Pro Gly Gly Arg Arg Lys His Ala

210 215 220

Gly

225

<210> 4

<211> 9

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 4

Pro Gly Gly Tyr Arg Ala His Ala Gly

1 5

<210> 5

<211> 9

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 5

Pro Gly Gly Phe Arg Ala His Ala Gly

1 5

<210> 6

<211> 9

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 6

Pro Gly Gly Trp Arg Ala His Ala Gly

1 5

<210> 7

<211> 9

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 7

Pro Gly Gly Leu Arg Ala His Ala Gly

1 5

<210> 8

<211> 9

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 8

Pro Gly Gly Asp Arg Ala His Ala Gly

1 5

<210> 9

<211> 9

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 9

Pro Gly Gly Arg Arg Ala His Ala Gly

1 5

<210> 10

<211> 9

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 10

Pro Gly Gly Ala Arg Ala His Ala Gly

1 5

<210> 11

<211> 9

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 11

Pro Gly Gly Tyr Ala Ala His Ala Gly

1 5

<210> 12

<211> 9

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 12

Pro Gly Gly Tyr Asp Ala His Ala Gly

1 5

<210> 13

<211> 9

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 13

Pro Gly Gly Tyr Glu Ala His Ala Gly

1 5

<210> 14

<211> 9

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 14

Pro Gly Gly Tyr Lys Ala His Ala Gly

1 5

<210> 15

<211> 9

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 15

Pro Gly Gly Tyr Arg Ala Ala Ala Gly

1 5

<210> 16

<211> 9

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 16

Pro Gly Gly Tyr Arg Ala Asn Ala Gly

1 5

<210> 17

<211> 9

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 17

Pro Gly Gly Tyr Arg Ala Lys Ala Gly

1 5

<210> 18

<211> 9

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 18

Pro Gly Gly Tyr Arg Ala Asp Ala Gly

1 5

<210> 19

<211> 9

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 19

Pro Gly Gly Tyr Arg Lys His Ala Gly

1 5

<210> 20

<211> 9

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 20

Pro Gly Gly Phe Arg Lys His Ala Gly

1 5

<210> 21

<211> 9

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 21

Pro Gly Gly Trp Arg Lys His Ala Gly

1 5

<210> 22

<211> 9

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 22

Pro Gly Gly Leu Arg Lys His Ala Gly

1 5

<210> 23

<211> 9

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 23

Pro Gly Gly Asp Arg Lys His Ala Gly

1 5

<210> 24

<211> 9

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 24

Pro Gly Gly Arg Arg Lys His Ala Gly

1 5

<210> 25

<211> 9

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 25

Pro Gly Gly Ala Arg Lys His Ala Gly

1 5

<210> 26

<211> 9

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 26

Pro Gly Gly Tyr Ala Lys His Ala Gly

1 5

<210> 27

<211> 9

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 27

Pro Gly Gly Tyr Asp Lys His Ala Gly

1 5

<210> 28

<211> 9

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 28

Pro Gly Gly Tyr Met Lys His Ala Gly

1 5

<210> 29

<211> 9

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 29

Pro Gly Gly Tyr Arg Arg His Ala Gly

1 5

<210> 30

<211> 9

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 30

Pro Gly Gly Tyr Arg Lys Ala Ala Gly

1 5

<210> 31

<211> 9

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 31

Pro Gly Gly Tyr Arg Lys Asn Ala Gly

1 5

<210> 32

<211> 9

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 32

Pro Gly Gly Tyr Arg Lys Lys Ala Gly

1 5

<210> 33

<211> 9

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 33

Pro Gly Gly Tyr Arg Lys Asp Ala Gly

1 5

<210> 34

<211> 9

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 34

Pro Gly Gly Tyr Lys Arg Lys Ala Gly

1 5

<210> 35

<211> 9

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 35

Pro Gly Gly Arg Met Lys His Ala Gly

1 5

<210> 36

<211> 5

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 36

Arg Ala His Ala Lys

1 5

<210> 37

<211> 5

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 37

Ala Ala His Ala Lys

1 5

<210> 38

<211> 5

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 38

Asp Ala His Ala Lys

1 5

<210> 39

<211> 5

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 39

Glu Ala His Ala Lys

1 5

<210> 40

<211> 5

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 40

Lys Ala His Ala Lys

1 5

<210> 41

<211> 5

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 41

Arg Ala Ala Ala Lys

1 5

<210> 42

<211> 5

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 42

Arg Ala Asn Ala Lys

1 5

<210> 43

<211> 5

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 43

Arg Ala Lys Ala Lys

1 5

<210> 44

<211> 5

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 44

Arg Ala Asp Ala Lys

1 5

<210> 45

<211> 5

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 45

Arg Lys His Ala Lys

1 5

<210> 46

<211> 5

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 46

Ala Lys His Ala Lys

1 5

<210> 47

<211> 5

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 47

Asp Lys His Ala Lys

1 5

<210> 48

<211> 5

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 48

Met Lys His Ala Lys

1 5

<210> 49

<211> 5

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 49

Arg Arg His Ala Lys

1 5

<210> 50

<211> 5

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 50

Arg Lys Ala Ala Lys

1 5

<210> 51

<211> 5

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 51

Arg Lys Asn Ala Lys

1 5

<210> 52

<211> 5

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 52

Arg Lys Lys Ala Lys

1 5

<210> 53

<211> 5

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 53

Arg Lys Asp Ala Lys

1 5

<210> 54

<211> 5

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 54

Lys Arg Lys Ala Lys

1 5

<210> 55

<211> 5

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 55

Arg Ala His Ala Lys

1 5

<210> 56

<211> 5

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 56

Arg Lys His Ala Lys

1 5

<210> 57

<211> 5

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 57

Arg Lys Lys Ala Lys

1 5

<210> 58

<211> 5

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 58

Arg Lys Ala Ala Lys

1 5

<210> 59

<211> 5

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 59

Lys Arg Lys Ala Lys

1 5

<210> 60

<211> 5

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 60

Arg Lys His Ala Lys

1 5

<210> 61

<211> 8

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 61

Arg Lys Lys Ala Lys Ala Ala Lys

1 5

<210> 62

<211> 5

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 62

Arg Lys Lys Ala Lys

1 5

<210> 63

<211> 5

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 63

Arg Lys Lys Ala Lys

1 5

<210> 64

<211> 1552

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 64

atgaagaaaa ccgcgattgc gattgcggtg gcgctggcgg gctttgcgac cgtggcgcag 60

gcggatattg aactgaccca gagcccgagc agcctgagcg cgagcgtggg cgatcgcgtg 120

accattacct gccgcgcgag ccaggatgtg aacaccgcgg tggcgtggta tcagcagaaa 180

ccgggcaaag cgccgaaact gctgatttat agcgcgagct ttctgtatag cggcgtgccg 240

agccgcttta gcggcagccg cagcggcacc gattttaccc tgaccattag cagcctgcag 300

ccggaagatt ttgcgaccta ttattgccag cagcattata ccaccccgcc gacctttggc 360

cagggcacca aactggaaat taaacgcacc gtggcggcgc cgagcgtgtt tatttttccg 420

ccgagcgatg aacagctgaa aagcggcacc gcgagcgtgg tgtgcctgct gaacaacttt 480

tatccgcgcg aagcgaaagt gcagtggaaa gtggataacg cgctgcagag cggcaacagc 540

caggaaagcg tgaccgaaca ggatagcaaa gatagcacct atagcctgag cagcaccctg 600

accctgagca aagcggatta tgaaaaacat aaagtgtatg cgtgcgaagt gacccatcag 660

ggcctgagca gcccggtgac caaatctttt aaccgcggcg aatgcctgag ccccggagga 720

cgccgcaaac atgcgggctg aggaggaaaa aaaaatgaaa aagacagcta tcgcaattgc 780

agtggcgcta gctggtttcg ccaccgtggc gcaagctgaa gtgaaactgc aggaaagcgg 840

tggtggtctg gtgcagccgg gtggtagcct gcgcctgagc tgcgcggcga gcggctttaa 900

cattaaagat acctatattc attgggtgcg ccaggcgccg ggcaaaggcc tggaatgggt 960

ggcgcgcatt tatccgacca acggctatac ccgctatgcg gatagcgtga aaggccgctt 1020

taccattagc gcggatacca gcaaaaacac cgcgtatctg cagatgaaca gcctgcgcgc 1080

ggaagatacc gcggtgtatt attgcagccg ctggggcggc gatggctttt atgcgatgga 1140

ttattggggc cagggcaccc tggtgaccgt gagcagcgcg agcaccaaag gcccgagcgt 1200

gtttccgctg gcgccgagca gcaaaagcac cagcggcggc accgcggcgc tgggctgcct 1260

ggtgaaagat tattttccgg aaccggtgac cgtgagctgg aacagcggcg cgctgaccag 1320

cggcgtgcat acctttccgg cggtgctgca gagcagcggc ctgtatagcc tgagcagcgt 1380

ggtgaccgtg ccgagcagca gcctgggcac ccagacctat atttgcaacg tgaaccataa 1440

accgagcaac accaaagtgg ataaaaaagt ggaaccgaaa agctgcgcgg ataaacccgg 1500

aggatatcgc gcgcatgcgg gcgaacagaa actgattagc gaagaagatc tg 1552

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号