首页> 中国专利> 2,5-DKG通透酶

2,5-DKG通透酶

摘要

本发明提供了编码具有2,5-DKG通透酶活性的多肽的分离的核酸分子,及由此核酸分子得到的寡核苷酸。此分离的核酸分子可在适当的细菌细胞中表达以提高2-KLG的产量,而2-KLG随后可转化为抗坏血酸。本发明进一步提供了具有2,5-DKG通透酶活性的分离的多肽、由此多肽得到的免疫原性肽、及其特异性抗体。本发明也提供了鉴定新颖的2,5-DKG通透酶的方法。

著录项

  • 公开/公告号CN1458976A

    专利类型发明专利

  • 公开/公告日2003-11-26

    原文格式PDF

  • 申请/专利权人 微基因组公司;金克克国际有限公司;

    申请/专利号CN01815727.0

  • 申请日2001-08-03

  • 分类号C12N15/31;C07K14/24;C07K14/26;C12P7/60;

  • 代理机构中国国际贸易促进委员会专利商标事务所;

  • 代理人刘晓东

  • 地址 美国加利福尼亚州

  • 入库时间 2023-12-17 15:01:15

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2016-09-28

    未缴年费专利权终止 IPC(主分类):C12N15/31 授权公告日:20091007 终止日期:20150803 申请日:20010803

    专利权的终止

  • 2009-10-07

    授权

    授权

  • 2004-02-04

    实质审查的生效

    实质审查的生效

  • 2003-11-26

    公开

    公开

说明书

本发明的一部分是在合作协议70NANB5H1138下由美国政府支持及与ATP NIST计划合作完成的。识别号码为1995-05-0007E。美国政府在本发明中享有一定的权利。

                       发明背景

                       发明领域

本发明基本上涉及微生物转运蛋白,更特别的涉及新颖的2,5-二酮-D-葡糖酸(2,5-DKG)通透酶。

                      背景信息

摄取足够的抗坏血酸或维生素C是维持身体健康的一个重要因素。为了保证摄取足够的抗坏血酸,人们现在在多种食品、饮料和化妆品中添加化学制品,并且有的也以直接的维生素补充剂在市场上进行销售。为了满足商业上对抗坏血酸的需要,我们需要开发一种更有效的抗坏血酸生产方法。

虽然有多种抗坏血酸生产的替代方法,最便宜且也最利于生态的方法是生物发酵。现在,已经对细菌菌株进行了操作以表达将便宜的糖源,如D-葡萄糖逐步转化为抗坏血酸的稳定的前体2-酮-L-古洛糖酸(2-KLG)时所需要的所有酶(见美国专利NO.5,032,514及其参考文献)。通过化学法或酶法可很容易的将2-KLG转化为抗坏血酸。

图2图示了将D-葡萄糖生物转化为2-KLG中的酶反应。如图2中所示,从D-葡萄糖到D-葡糖酸、到2-酮-D-葡糖酸(2-KDG)、到2,5-二酮-D-葡糖酸(2,5-DKG)的酶反应是发生在细菌细胞的表面的。随后,2,5-DKG必须进入细胞中以进行酶转化为2-KLG。

在提高2-KLG生产中涉及的酶反应效率方面已进行了很多努力。例如美国专利号5,032,514描述了通过降低2,5-DKG向除2-KLG外的产生的代谢性转化而提高2-KLG产量的方法。

利用适于2-KLG生物发酵的细菌菌株来增加摄取2,5-DKG对提高2-KLG产量来说是有益的。表达内源2,5-DKG通透酶的额外拷贝或表达具有优良特性的外源2,5-DKG通透酶可提高细胞对2,5-DKG的摄取。然而,到目前为止,没有对可用于这种方法的2,5-DKG通透酶进行鉴定和定性。

因此,需要对编码2,5-DKG通透酶的核酸分子进行鉴定和定性,这样,具有有益特性的通透酶可用于抗坏血酸的商业生产以及其他重要应用。本发明满足了这样的需求,并且也提供了相关的优势。

                      发明简述

本发明提供了可编码具有2,5-DKG通透酶活性的多肽的分离的核酸分子。在一个实施方案中,此分离的核酸分子含有一核苷酸序列,此核苷酸序列与选自由SEQ ID NO:1、3、5、7、9和11组成的组中的核苷酸序列至少有40%的同一性。在另一个实施方案中,此分离的核酸分子含有一核苷酸序列,此核苷酸序列编码与选自由SEQID NO:2、4、6、8、10和12组成的组中的氨基酸序列至少有40%同一性的多肽。

本发明也提供了含有此分离的核酸分子的载体及细胞,此分离的核酸分子可编码具有2,5-DKG通透酶活性的多肽。在一个实施方案中,此细胞是选自由泛菌属(Pantoea)和克雷伯氏菌属(Klebsiella)细菌组成的组中。

本发明也提供了核酸分子的鉴定和分离方法,此核酸分子编码具有2,5-DKG通透酶活性的多肽。本发明也提供了通过在适当的细菌细胞中表达本发明中的核酸分子来提高2-KLG产量的方法。

本发明进一步提供了具有2,5-DKG通透酶活性的分离的多肽及其免疫原性肽。本发明也提供了特异于这些多肽和肽的抗体。

                      图表简述

图1A和1B展示了命名为YiaX2(SEQ ID NO:12)、PE1(SEQID NO:2)、PE6(SEQ ID NO:4)、prmA(SEQ ID NO:8)、prmB(SEQ ID NO:10)和PK1(SEQ ID NO:6)的2,5-DKG通透酶的氨基酸序列的线性排列。

图2展示了适于生物发酵的细菌菌株中从葡萄糖到2,5-KLG的生物合成路径。

图3展示了用于鉴定新颖的2,5-DKG通透酶的代谢选择策略。

                      发明详述

本发明提供了编码具有2,5-DKG通透酶活性的多肽的新颖的核酸分子、以及相关的产品和方法。本发明中的分子可用于有利的提高2-KLG的生物法生产效率,从而降低商业上抗坏血酸生产的成本。

天然2,5-DKG通透酶是定位于微生物细胞质膜上的多肽,利用市场销售的拓扑学预测程序可预测其含有约10-12个跨膜结构域。每个跨膜片段长约20个氨基酸,其细胞内和细胞外环长约2-83个氨基酸。一般来讲,第五和第六个跨膜结构域片段之间的环较其他环大。

天然的2,5-DKG通透酶通常长度约为350-550个氨基酸,例如长约400-450个氨基酸,尤其是长约425-440个氨基酸。

编码6个典型的2,5-DKG通透酶的核苷酸序列如下所示,其中在括弧中给出了其命名和生物来源:SEQ ID NO:1(PE1,环境来源)、SEQ ID NO:3(PE6,环境来源)、SEQ ID NO:5(PK1,源自产酸克雷伯氏菌((Klebsiella oxytoca))、SEQ ID NO:7(prmA,源自柠檬泛菌(Pantoea citrea))、SEQ ID NO:9(prmB,源自柠檬泛菌)、SEQ ID NO:11(YiaX2,源自产酸克雷伯氏菌)。它们所编码的相应的2,5-DKG通透酶氨基酸序列为SEQ IDNO:2(PE1)、SEQ ID NO:4(PE6)、SEQ ID NO:6(PK1)、SEQID NO:8(prmA)、SEQ ID NO:10(prmB)、SEQ ID NO:12(YiaX2)。

正如图1中通过六方序列比对所证明的,源自不同微生物体的2,5-DKG通透酶在其整个序列长度上展示出广泛的氨基酸序列相关性。图1中展示的6种通透酶的整体同一性约为17%,而整体的相似性,如果将保守替代考虑在内,约为43%。

在对它们进行预测后得到的拓扑学相似性以及序列相似性的基础上,此处公开的2,5-DKG通透酶可进一步细分为两个结构族。命名为YiaX2、PE6和PrmA的三种2,5-DKG通透酶是其中一个通透酶族的代表,它们在三方氨基酸序列比对中具有约50%的整体同一性。命名为PK1、PE1和PrmB的另三种2,5-DKG通透酶是第二个通透酶族的代表,它们在三方氨基酸序列比对中具有约60%的整体同一性。

天然的2,5-DKG通透酶也展示出2,5-DKG通透酶活性。此处的术语“2,5-DKG通透酶活性”指相对于一不相关的对照多肽,当目的多肽在细胞膜上以天然方位进行表达时,其运送2,5-DKG通过细胞质膜的能力。此种运送是单向的或是双向的。

可通过多种方法来确定2,5-DKG通透酶的活性。例如,如下文实施例中所进一步描述的,可利用新陈代谢选择检验来确定2,5-DKG通透酶的活性。简单来说,鉴定或制备在2,5-DKG通透酶活性方面具有天然缺陷或在2,5-DKG通透酶活性方面具有人造缺陷的细菌细胞。如在实施例中所描述的,按照本领域中已知的方法,利用聚合酶链式反应来制备一或多个内源2,5-DKG通透酶基因缺失突变株,从而使细菌细胞在内源2,5-DKG通透酶活性方面造成缺陷。如通过生长检验或通过2,5-DKG摄取检验所进行的评估,当用于2,5-DKG通透酶活性方面缺陷的细胞时,术语“缺陷”用来指代一种内源2,5-DKG通透酶活性,此2,5-DKG通透酶活性是与yiaX2基因缺失的产酸克雷伯氏菌菌株,如产酸克雷伯氏菌ΔyiaX2菌株[tkr idnO]的内源通透酶活性相当或更低的。

可用于新陈代谢选择测定中测定表达多肽的2,5-DKG通透酶活性的细胞还可以天然的能够将细胞内2,5-DKG转化为碳和能量,或者可通过重组表达适当的新陈代谢酶类来制成能进行这样的转化。如实施例中所描述的,可在细胞中表达源自任何种类细菌的、编码2-酮-还原酶(tkr)和5-酮-还原酶(idnO)的核酸分子的组合,而此组合可共同为细胞提供催化2,5-DKG还原为葡糖酸的能力。随后,细胞可将葡糖酸用做碳源和能源来支持细胞的生长。

适合于确定2,5-DKG通透酶活性的新陈代谢检验的典型细菌细胞为图3展示的产酸克雷伯氏菌ΔyiaX2菌株[tkr idnO],在下文的实施例中有描述。此菌株含有缺失的yiaX2 2,5-DKG通透酶基因,并通过高拷贝质粒也重组表达SEQ ID NO:13表示的tkr/idnD/idnO操纵子。在SEQ ID NO:13中,292-1236位核苷酸编码2-酮-还原酶(tkr)(SEQ ID NO:14),1252-2280位核苷酸编码艾杜糖酸脱氢酶(idnD)(SEQ ID NO:15),而2293-3045位核苷酸编码5-酮-还原酶(idnO)(SEQ ID NO:16)。或者,编码下述多肽的核酸分子可用于新陈代谢检验中,所述多肽含有对命名为SEQ ID NO:14或16的氨基酸序列进行的修饰,但它们分别保留有2-酮-还原酶活性或5-酮-还原酶活性。典型的氨基酸序列分别与SEQ ID NO:14或16具有至少60%,例如至少70%,优选80%、90%、95%或更高的同一性。

在表达了侯选2,5-DKG通透酶后,这样的细胞在含有以2,5-DKG做唯一碳源的培养基中生长的能力是测定表达后的酶将2,5-DKG转运到细胞中的能力的一个方法,从而是其2,5-DKG通透酶活性的一个测量方法。正如表达每种通透酶的菌株产酸克雷伯氏菌ΔyiaX2[tkr idnO]在以2,5-DKG做唯一碳源的培养基上生长的能力所证明的,SEQ ID NO:2、4、6、8、10和12都表现出2,5-DKG通透酶活性。

同样的,可通过测定细胞对标记的或未标记的2,5-DKG的摄入来确定2,5-DKG通透酶的活性。例如,可利用如荧光或放射性标记来对2,5-DKG进行可检测的标记。当提供有可检测性标记的2,5-DKG时,表达2,5-DKG通透酶的细胞或膜囊泡摄取可检测标记的能力可通过特异于特定标记的检测方法来确定,而这些检测方法在本领域中是众所周知的。同样的,可通过HPLC或本领域中熟知的其他灵敏的检测方法来确定未标记的2,5-DKG的摄取。因此,测定2,5-DKG的摄取是通透酶活性的一个测定方法。正如利用表达重组体通透酶的细菌细胞对放射标记的2,5-DKG的摄取进行检测所确定的,SEQID NO:2、4、6、8、10和12都表现出2,5-DKG通透酶活性。

此外,通过在细胞外2,5-DKG存在的情况下测定产物的产量,可在能将2,5-9KG转化为一种产物的任何细胞中测定2,5-DKG通透酶活性。例如,在一个天然表达或重组表达2,5-DKG还原酶的细胞中,细胞内2,5-DKG可转化为2-KLG。2,5-DKG通透酶表达后,当提供有细胞外2,5-DKG时,细菌细胞产生2-KLG的能力是所表达通透酶向细胞内转运2,5-DKG的能力的一种度量,从而是其2,5-DKG通透酶活性的一种度量。可利用如HPLC或本领域中已知的其他检测方法来检测细胞内2-KLG。也可利用类似的方法来检测2,5-DKG的其他新陈代谢产物。

应当理解,有多种替代检测法可用于确定2,5-DKG通透酶活性。例如,可检测作为一种酸的2,5-DKG进行跨膜转移时的细胞或囊泡膜的pH变化。类似的,也可检测细胞外2,5-DKG随时间推移的减少。

因此,利用此处描述的任一种活性检测法,本领域中的那些熟练技术人员就可区分具有2,5-DKG通透酶活性的多肽和不具有2,5-DKG通透酶活性的多肽。

本发明中的2,5-DKG通透酶可选择性的转运2,5-DKG。当在此处用于转运活性时,术语“选择性的”指优先将2,5-DKG而不是2-KLG转运到细胞内或细胞外。可选择性转运2,5-DKG的通透酶可以至少2倍于,例如至少5倍于,包括大于10倍于转运2-KLG的高效来转运2,5-DKG。可选择性转运2,5-DKG的通透酶在需要增加2-KLG胞内生产的应用中是尤其有益的,例如在抗坏血酸的商业生产上。特别的,利用选择性转运2,5-DKG的通透酶可防止细胞内2-KLG与细胞外2,5-DKG竞争通透酶介导的跨膜转运并且提高细胞内2-KLG生产的整体效率。

另人高兴的是可对上述用于确定2,5-DKG通透酶活性的检测法进行变更来同时或分别确定2-KLG通透酶活性。例如,设计一个新陈代谢检验法,其中的细菌细胞可将细胞内2,5-DKG或2-KLG转化为碳和能量。在这样的细胞中,相对于其在以2-KLG作唯一碳源的培养基上的生长能力,其在以2,5-DKG作唯一碳源的培养基上生长的相对能力是所表达通透酶选择性转运2,5-DKG的能力的一个测量指标。利用这样的检测方法,我们确定了命名为YiaX2、PE1、PE6、prmA和prmB的2,5-DKG通透酶对2,5-DKG来说是非选择性的,因为它们也有效的催化2-KLG的转运,正如表达这些通透酶的产酸克雷伯氏菌ΔyiaX2[tkr idnO]细胞在2,5-DKG或2-KLG上能很好的生长所显示的。相反,PK1可选择性的转运2,5-DKG,并且表达PK1(SEQ ID NO:6)的产酸克雷伯氏菌ΔyiaX2[tkr idnO]细胞可在以2,5-DKG作唯一碳源的培养基上生长,而在以2-KLG作唯一碳源的培养基上却不能生长。

本发明提供了编码具有2,5-DKG通透酶活性的多肽的分离的核酸分子。本发明中的核酸分子适于多种商业和研究用途。例如,本发明中的一或多个核酸分子可在细菌细胞中表达以提高细胞摄取2,5-DKG的速率。提高细胞对2,5-DKG的摄取速率具有多种用途,例如商业生产2,5-DKG本身或商业生产2,5-DKG的任何新陈代谢产物。例如,2,5-DKG摄取在生物合成2-KLG中是一个限速步骤,而2-KLG是合成抗坏血酸过程中的一个稳定的中间物。因此,可从表达2,5一DKG通透酶的细胞中获得2-KLG,并将其转化为抗坏血酸。

另外,利用本领域中已知的方法和下文进一步描述的方法,可将本发明中的核酸分子作为探针或引物来从另外的种类中鉴定和分离2,5-DKG通透酶同系物,或作为模板来生产突变体通透酶。相对于此处公开的2,5-DKG通透酶如SEQ ID NO:2、4、6、8、10和12,这样的通透酶具有有益的特性,如更高的酶活性或更高的2,5-DKG选择性。

在一个实施方案中,本发明中的分离的核酸分子并非完全包含在WO 00/22170中的命名为SEQ ID NO:19的核苷酸序列中,而SEQID NO:19是产酸克雷伯氏菌yia操纵子。在另一个实施方案中,本发明中的分离的核酸分子并非完全包含在此处命名为SEQ ID NO:11的核苷酸序列中。在另一个实施方案中,编码的多肽并非完全包含在此处命名为SEQ ID NO:12的氨基酸序列中。

此处所用的术语“分离的”用来表示对天然环境中发现的分子进行了人工修饰。例如,分离的核酸分子可以是与外源核酸序列可操作的分子。分离的核酸分子也可以是除去了其几个或所有正常侧翼核酸序列的分子,例如从正常发现该核酸分子的操纵子中除去了一或多个其它基因。

特别的,对于含有命名为SEQ ID NO:11的核苷酸序列或编码命名为SEQ ID NO:12的、yiaX2多肽的分离的核酸分子来讲,术语“分离的”用来表示此核酸分子不合有产酸克雷伯氏菌yia操纵子中的任何开放阅读框架(orf),例如WO00/22170中描述的、命名为1yxK和orfl的orf。

分离的分子可以是或额外的作为“基本上纯的”分子,其中这些分子至少有60%、70%、80%、90%或95%不含有与其天然相关的细胞组分。分离的核酸分子可以任何形式,如以缓冲溶液、悬浮液、异源细胞、冷冻粉末或附到固体支持物上的形式存在。

此处所用的术语“核酸分子”指天然的或合成的多核苷酸。核酸分子可以是单链或双链基因组DNA、cDNA或RNA,可代表有义链或反义链或二者兼具。从而,核酸分子可与列举的序列、与其互补物或与此两者皆相对应。

术语“核酸分子”指包括含有一或多个非天然核苷酸,如含有对碱基、糖、或磷酸酯部分进行的修饰的核苷酸的核酸分子,或含有一或多个非天然连键,如硫代磷酸酯键的核酸分子。这样的修饰在提高核酸分子的稳定性方面是有益的,尤其是当其用于杂交应用时。

此外,术语“核酸分子”指包括修饰后含有可检测部分,如放射性标记、荧光色素、铁磁性物质、发光标记或可检测的结合剂如生物素的核酸分子。可将含有这些部分的核酸分子用做探针来检测2,5-DKG通透酶核酸分子的存在或表达。

在一个实施方案中,编码具有2,5-DKG通透酶活性的多肽的分离的核酸分子含有一核苷酸序列,该核苷酸序列包括SEQ ID NO:1、3、5、7、9或11的1-20、1-100、101-120、101-200、201-220、201-300、301-320、301-400、401-420、401-500、501-520、501-600、601-620、601-700、701-720、701-800、801-820、801-900、901-920、901-1000、1001-1020、1001-1100、1101-1120、1100-1200、1201-1220、1201-1300、1301-1320、1301-1400、1401-1420或1401-1500位核苷酸。

在另一个实施方案中,编码具有2,5-DKG通透酶活性的多肽的分离的核酸分子编码下述氨基酸序列,该氨基酸序列包括SEQ IDNO:2、4、6、8、10或12的1-10、1-50、51-60、51-100、101-110、101-150、151-160、151-200、201-210、201-250、251-260、251-300、301-310、301-350、351-361、351-400、401-410或401-439位氨基酸。

在一个实施方案中,编码具有2,5-DKG通透酶活性的多肽的分离的核酸分子含有一核酸序列,该核酸序列与命名为SEQ ID NO:1、3、5、7、9或11的任一2,5-DKG通透酶核酸分子具有至少35%的同一性。优选的,此核酸分子与上述列举的任一SEQ ID NO至少具有40%的同一性,例如,至少45%、50%、60%、70%或80%的同一性,包括与SEQ ID NO:1、3、5、7、9或11具有至少90%、95%、98%、99%或更高的同一性。

在另一实施方案中,编码具有2,5-DKG通透酶活性的多肽的分离的核酸分子含有一核酸序列,该核酸序列编码与命名为SEQ IDNO:2、4、6、8、10或12的2,5-DKG通透酶多肽至少具有35%同一性的多肽。优选的,编码的多肽与上述列举的任一SEQ ID NO至少具有40%的同一性,例如,至少45%、50%、60%、70%或80%的同一性,包括与SEQ ID NO:2、4、6、8、10或12具有至少90%、95%、98%、99%或更高的同一性。

对于本发明中的核酸分子或多肽来说,术语“同一性百分比”用来指两序列的比对部分中完全相同的核苷酸或氨基酸残基的数目,以比对残基总数的百分比来表示,其可通过CLUSTAL V计算机排序和缺省参数对比整个序列来确定。CLUSTAL V排序在Higgens,MethodsMol.Biol.25:307-318(1994)中有描述,并且在图1中给出了2,5-DKG通透酶氨基酸序列的典型CLUSTAL V排序。

由于遗传密码的简并性,可对天然核酸分子的核苷酸序列进行修饰,并且仍编码一完全相同或基本相似的多肽。因此,SEQ ID NO:1、3、5、7、9或11的简并变体是本发明中编码具有2,5-DKG通透酶活性的多肽的代表性核酸分子。

此外,编码其他种类微生物的2,5-DKG通透酶的核酸分子也是本发明中的代表性核酸分子。命名为YiaX2、PE1、PE6、prmA、prmB和PK1的六种通透酶是从至少三种,有可能是4种不同的微生物种中分离到的,它们具有基本的核苷酸序列同一性。例如,最相似的两个公开的2,5-DKG通透酶核苷酸序列SEQ ID NO:5(PK1)和SEQ IDNO:1(PE1),它们在全长的核苷酸序列上具有86%的同一性。最不相似的两个公开的2,5-DKG通透酶核苷酸序列SEQ ID NO:7(prmA)和SEQ ID NO:9(prmB),它们在全长的核苷酸序列上具有51%的同一性。相反,对GenBank的搜索结果显示没有其他的核苷酸序列,包括编码转运蛋白和其他跨膜蛋白的序列在内,在完全序列长度上显示出与任一公开的2,5-DKG通透酶核苷酸序列具有显著的同一性或相似性。

如前所述,此处公开的6种通透酶在其全长上也具有基本的氨基酸序列同一性。例如,源自产酸克雷伯氏菌的PK1(SEQ ID NO:6)与源自环境资源的PE1(SEQ ID NO:2)在氨基酸水平上具有93%的同一性。在GenBank数据库中与2,5-DKG通透酶最相关的氨基酸序列与SEQ ID NO:12(YiaX2)具有33%的同一性,并且与其他公开的2,5-DKG通透酶具有更低的同一性,而此氨基酸序列源自Agrobacterium Vitis(GenBank Accession U32375或U25634),是公认的酒石酸转运蛋白。在GenBank数据库中,其他与公开的2,5-DKG通透酶具有一定程度同一性的序列包括源自多种物种的膜转运蛋白,包括源自B.cepacia(AF152094)和P.putida(D13229)的邻苯二甲酸转运蛋白、源自S.dublin(AF144422)和大肠杆菌(Z37980)的羟基苯乙酸盐转运蛋白、以及源自S.coelicolor(AL136503和AL132991)的可能的转移蛋白,上述每种转运蛋白与上述所列举的SEQ ID NO在氨基酸水平上具有约27%或更少的同一性。

鉴于在单一种内和不同微生物种间,不同的2,5-DKG通透酶核酸分子及编码的多肽间存在高度的同一性,可很容易的对另外的源自其他种的2,5-DKG通透酶进行鉴定和检验。因此,本发明中的核酸分子包括源自任何微生物物种的编码具有2,5-DKG通透酶活性的多肽的核酸分子。含有2,5-DKG通透酶的微生物体可通过其主动运输2,5-DKG的能力识别出来,这样它们能够在以2,5-DKG为唯一碳源的培养基上生长,或者能在摄取检验中摄取2,5-DKG。这样的微生物包括,如包括古细菌、革兰氏阳性和革兰氏阴性细菌在内的细菌、酵母菌和真菌。

如实施例中所描述的,含有2,5-DKG通透酶的典型细菌包括Proteobacteria,更特别的是肠杆菌(Enterobacteria)和假单胞菌属(Pseudomonas)(如铜绿假单胞菌)。典型的肠杆菌包括克雷伯氏菌属的多个种(如产酸克雷伯氏菌,SEQ ID NO:5和SEQ IDNO:11源自此细菌)及泛菌属(如柠檬泛菌,SEQ ID NO:7和SEQID NO:9源自此细菌,以及P.agglomerans)。这些微生物的来源包括公共陈列室,如American Type Culture Collection(ATCC),以及商业渠道。应当理解,细菌属的分类法和命名法使得相同或相似的菌株有时在文献中以不同的名字来进行报道。例如,产酸克雷伯氏菌(如ATCC 13182)可替代描述为产气气杆菌(Aerobacter aerogenes)、产生克雷伯氏菌(Klebsiellaaerogenes)及肺炎克雷伯氏菌(Klebsiella pneumoniae)。同样的,成团泛菌(Pantoea agglomerans)(如ATCC21998)可替代描述为草生欧文菌(Erwinia herbicola)和Acetomonasalbosesamae。此处所用的术语“克雷伯氏菌属”和“泛菌属”用来分别指代保藏号为ATCCl3182和21998的菌株的属。

另外,可从其中获得2,5-DKG通透酶核酸分子的微生物是存在于环境样品中的微生物。例如,命名为SEQ ID NO:1和SEQ IDNO:3的2,5-DKG通透酶核酸分子是得自环境样品。正如此处所用的,术语“环境样品”指从一般含有微生物混合物的天然环境或人造环境中获得的样品。

典型的环境样品是土样、沙样、淡水或淡水沉积物样品、海水或海水沉积物样品、工业废水样品、温泉样品、热气样品等。在环境样品中,很可能存在没有进行过鉴定的微生物,也可能存在不能进行培养的微生物。从环境样品中存在的微生物中分离本发明中的2,5-DKG通透酶分子时不需要对微生物进行鉴定和培养。

此外,本发明中的核酸分子包括编码特定氨基酸序列的核酸分子,所述氨基酸序列相对于SEQ ID NO:2、4、6、8、10或12的天然序列进行了一或多个氨基酸的添加、缺失或替代修饰后得到的。这样的修饰是有益的,例如在提高稳定性、表达水平、酶活性或通透酶的2,5-DKG选择性上是有益的。如果需要,可随机的进行这样的修饰,例如通过化学诱变来进行,或定向的进行这样的修饰,如利用本领域中众所周知的方法,通过对天然通透酶序列进行定点突变来获得这样的修饰。

从对天然通透酶氨基酸序列进行修饰得到的氨基酸序列可包括一或多个保守氨基酸替代,如利用另一个非极性氨基酸来替代一个非极性氨基酸(如利用异亮氨酸、缬氨酸、丙氨酸、脯氨酸、色氨酸、苯丙氨酸或蛋氨酸替代亮氨酸)、利用一个类似的带电氨基酸替代一个带电氨基酸(例如利用天冬氨酸替代谷氨酸,或利用赖氨酸或组氨酸替代精氨酸)、或利用另一不带电的极性氨基酸替代一不带电的极性氨基酸(如利用甘氨酸、苏氨酸、酪氨酸、半胱氨酸、天冬酰胺或谷氨酰胺替代丝氨酸)。修饰后的氨基酸序列也可包含一或多个非保守替代,而不会对所需的生物活性产生负面影响。

在不破坏2,5-DKG通透酶活性的情况下确定可以对哪些氨基酸进行替代时,本领域中已知的计算机程序可提供一些指导(见,如Eroshkin et a1.,Comput.Appl.Biosci.9:491-497(1993))。

此外,在保留或增强功能活性的同时而进行的氨基酸序列修饰方面的指导可通过对源自多种物种的同源2,5-DKG通透酶进行序列排序来提供(见图1)。在本领域中众所周知的,进化上保守的氨基酸残基和结构域可能较保守程度小的氨基酸残基和结构域在维持生物活性方面更重要。因此,我们预期,利用一非保守残基替代图1展示的6种2,5-DKG通透酶(或命名为SEQ ID NO:2、6和10及SEQ IDNO:4、8和12的通透酶的两个结构族中的成员)的高度保守残基是有害的,然而,对在不同通透酶中变化很大的残基处进行相同的替代不可能对生物活性产生显著影响。

对在转运2,5-DKG和2-KLG的PE1(SEQ ID NO:2)的氨基酸序列与选择性转运2,5-DKG的PK1(SEQ ID NO:6)的氨基酸序列间进行的对比表明,对2,5-DKG的选择性负责的区域肯定是位于这两个序列间存在差别的7%的氨基酸内。因此,将2,5-DKG通透酶中的所有或几个这样的差别残基修饰为PK1中的那些序列预期会提高通透酶的2,5-DKG选择性。

此处描述的6种2,5-DKG通透酶的排序对于揭示可能耐受添加或缺失的区域也可提供指导。例如,如序列排序中的缺口所证明的,N和C末端、以及225-250位氨基酸的周围区域(在SEQ ID NO:12(yiaX2)的编号基础上)是相对能够耐受氨基酸插入和缺失的区域。因此,修饰后的2,5-DKG通透酶可在这样的位点包含标记”序列,如抗原决定簇标记、组氨酸标记、谷胱甘肽-S-转移酶(GST)等或分类序列。这些附加序列可用于,如促进对重组体2,5-DKG通透酶的纯化或定性。

应当理解,可利用本文所描述的一或多种功能检验法,通过确定编码的多肽的2,5-DKG通透酶活性,证明特定的核酸分子是本发明中的核酸分子。

本发明进一步提供了编码具有2,5-DKG通透酶活性的多肽的、分离的核酸分子,其中所述核酸分子可操作连接到基因表达启动子上。此处所用的术语“可操作连接”指核酸分子相对于内源启动子或异源启动子所处的位置能使得该启动子以核酸分子为模板指导RNA转录。

将核酸分子可操作连接到所需的启动子上的方法在本领域中是众所周知的,包括,如将核酸分子克隆到含有所需启动子的载体中、或利用PCR将启动子附加到核酸序列上。与RNA转录启动子可操作连接的核酸分子可用于在所需宿主细胞内或体外转录-翻译体系中表达2,5-DKG转录物和多肽。

对可操作连接到本发明中的核酸分子上的启动子的选择依赖于所计划实施的应用,并且可由本领域中的熟练技术人员来确定。例如,如果特定基因产物可能对特定宿主细胞是有害的,我们就要将本发明中的核酸分子连接到受调节的启动子上,这样就可启动或关闭基因表达。本领域中已知的、典型的、可诱导的启动子是lacPO启动子/操纵子,特定宿主细胞提供的lacIq基因产物可对其进行抑制,而此启动子可由0.01-1mM IPTG进行诱导(见下文实施例)。对其它应用来讲,优选的是弱或强组成性启动子。

本发明进一步提供了含有分离的核酸分子的载体,所述核酸分子编码具有2,5-DKG通透酶活性的多肽。本发明中的载体一般含有如细菌复制起点、一或多个可选择的标记及一或多个多克隆位点等元件。对包含在载体之中的特定元件进行的选择依赖于多种因素,如计划选用的宿主细胞、插入序列的表达是否是需要的、所需的载体拷贝数目、所需的选择体系等。在不同应用中为保证宿主和载体间的相容性而涉及的因素在本领域中是众所周知的。

在利用载体重组表达所编码多肽的应用中,如上文所述,一般将分离的核酸分子可操作连接到基因表达启动子上,所述启动子可存在于载体中或插入的核酸分子中。然而,在克隆和亚克隆应用中,没有必要一定有启动子元件存在。

适于克隆应用和在不同细菌中表达2,5-DKG通透酶的典型的载体是在Lerner et al.,Nucleic Acids Res.18:4621(1994)中所描述的、低拷贝数目的质粒pCL1920,其含有壮观霉素抗性基因(见下文实施例)。

本发明也提供了含有编码多肽的、分离的核酸分子的细胞,所述多肽具有2,5-DKG通透酶活性。该分离的核酸分子一般包含在与特定宿主细胞中的复制相容的载体中。然而,对于某些应用来讲,优选的是将核酸分子掺入到细菌基因组中。

本发明中的细胞可以是表达2,5-DKG通透酶并将其折叠为活性构象的任何细胞。通过对可表达其他功能性10-12跨膜转运蛋白的细胞类型进行鉴定,可为选择适当的宿主细胞提供指导。例如,在多种细菌和酵母(如S.pombe)、拟南芥属(Arabidopsis)及果蝇属中发现了10-12跨膜转运蛋白。因此,根据宿主细胞的具体应用,本发明的宿主细胞可以是细菌细胞、酵母、拟南芥或果蝇细胞。

在一优选实施方案中,细胞是细菌细胞。对细菌细胞的选择依赖于要计划进行的应用。例如,对常规的亚克隆应用来说,选用的细胞可以是任何合适的细菌实验室菌株,例如大肠杆菌,其可利用本领域中众所周知的方法、通过本发明中的分离的核酸分子和载体来转化。

对于评估所编码2,5-DKG通透酶的酶活性来讲,选用的细胞可以是适于新陈代谢检验的细菌菌株,例如可内源表达或进行工程操作后表达酶类的菌株,所述酶类可催化将2,5-DKG转变为基本产物。适于新陈代谢检验的典型菌株是命名为MGK002[pDF33]的产酸克雷伯氏菌ΔyiaX2[tkr idnO]菌株,下文实施例中对其有进一步的描述,此菌株可提供细胞内2,5-DKG向葡糖酸的转化,而葡糖酸可用作碳源和能源。

对于商业上2,5-DKG代谢物的生物生产来讲,选用的细胞可以是能内源表达、或工程操作后能表达2,5-DKG还原酶的细菌菌株。正如美国专利NO.5,032,514中所描述的,在包括短杆菌属(Brevibacterium)、节杆菌属(Arthrobacter)、微球菌属(Micrococcus)、葡萄球菌属(Staphylococcus)、假单胞菌属(Pseudomonas)、芽孢杆菌属(Bacillus)、柠檬酸杆菌属(Citrobacter)和棒状杆菌属(Corynebacterium)在内的属中的细胞中发现了2,5-DKG还原酶。因此,本发明中的细胞可以是这些属中的任何细胞,或经工程操作后可表达这些属的2,5-DKG还原酶的细菌细胞。

能够产生2,5-DKG代谢物的细胞也优选的能够催化从廉价的碳源,如葡萄糖到2,5-DKG的细胞外生产。如图2所示,从D-葡萄糖到2,5-DKG的一个典型途径涉及从D-葡萄糖到D-葡糖酸(由D-葡萄糖脱氢酶催化)、从D-葡糖酸到2-酮-D-葡糖酸(由D-葡糖酸脱氢酶催化)、从2-酮-D-葡糖酸到2,5-DKG(由2-酮-D-葡糖酸脱氢酶催化)的酶转化。这些步骤可在包括Gluconobacter、醋酸杆菌属和欧文菌属(也称作泛菌属)在内的多个属中的生物体中进行。

有益于从-葡萄糖生产2-KLG的细菌细胞是美国专利NO.5,032,514中所描述的、命名为ATCC 21998 ptrp 1-35 tkrAΔ3的泛菌属aggolmerans(也称为草生欧文菌或Acetomonas albosesamae)菌株或其具有改进的特性的衍生菌株。可通过对菌株实施基因工程进行的对该菌株的预期改善,包括缺失那些使葡萄糖转化为除2-KLG外的代谢物的酶,从而提高2-KLG的产量。对菌株进行的其他改进包括可提供改进的2-KLG回收和纯化的突变。

美国专利NO.5,032,514中所描述的泛菌属菌株能重组表达源自棒杆菌的2,5-DKG还原酶(在美国专利NO.4,757,012中有描述)。此菌株进一步含有可造成非功能性tkrA基因的突变,从而在2-酮-还原酶活性上造成缺陷。TkrA基因突变在降低从2-KLG到L-艾杜糖酸的代谢转向及2,5-DKG从2-KLG到5-酮-D-葡糖酸盐的代谢转向上是有益的。

本发明中的一或多种2,5-DKG通透酶在这些细胞中的表达显著提高了从D-葡萄糖生成2-KLG的总体产量,降低了商业生产抗坏血酸的成本。

本发明中的细胞可含有本发明中的1个、2个或多个分离的核酸分子,所述核酸分子编码具有2,5-DKG通透酶活性的多肽。例如,细胞可含有一种分离的核酸分子,该分离的核酸分子编码至少一种与SEQ ID NO:2、4、6、8、10或12中任一种至少具有80%同一性的多肽,并且任选地含有两或多种以任何形式组合的这样的核酸分子。优选的,至少一种这样的编码多肽选择性的转运2,5-DKG。

在一优选实施方案中,本发明中适于生物生产2-KLG的细菌细胞中含有可编码多肽的分离的核酸分子,该多肽与命名为SEQ ID NO:8(prmA)的2,5-DKG选择性通透酶至少具有95%的同一性;并且此细胞任选地进一步含有至少一种可编码多肽的分离的核酸分子,该多肽与选自由SEQ ID NO:4(PE6)、SEQ ID NO:10(prmB)和SEQID NO:6(PK1)组成的组中的2,5-DKG通透酶至少具有95%的同一性。

本发明也提供了提高2-KLG产量的方法。此方法包括在可表达所编码的2,5-DKG通透酶并可将细胞内2,5-DKG转化为2-KLG的条件下培养细菌细胞,其中所述细菌细胞含有可编码具有2,5-DKG通透酶活性的多肽的分离的核酸分子。适于此种目的的细胞,如美国专利NO.5,032,514中所描述的泛菌属菌株,在上文中有描述。任选地,可按照本领域中已知的方法,利用化学法或酶法将如此产生的2-KLG转化为所需的产物,如抗坏血酸。

本发明进一步提供了分离的寡核苷酸分子,该寡核苷酸分子至少含有所提到的SEQ ID NO:1、3、5、7、9或11的任一核酸序列的至少17个相邻核苷酸。正如此处所用的,术语“寡核苷酸”指含有参考序列中至少17个相邻核苷酸并可以、但并非必需编码功能性蛋白的核酸分子。因此,本发明中的寡核苷酸可含有参考核苷酸序列的至少18、19、20、22或25个相邻的核苷酸,例如至少30、40、50、60、70、80、90、100、125、150、175、200、250、300、400、500、750、1000或更多个相邻核苷酸,直至参考序列全长。因此,本发明中的寡核苷酸具有足够的长度以作为序列分析引物、PCR引物、杂交探针或反义试剂,并且也可编码具有2,5-DKG通透酶活性的多肽或其免疫原性肽。本领域中的那些熟练的技术人员可确定本发明中的寡核苷酸的适当序列和长度以用于特别应用。

对某些应用,如在细胞或文库中检测2,5-DKG通透酶的表达来讲,选用本发明中可与编码2,5-DKG通透酶的核酸分子进行特异性杂交的分离寡核苷酸分子比较理想。术语“特异性杂交”指在下文所述的严格的杂交条件下,核酸分子与编码2,5-DKG通透酶的核酸分子杂交的能力,而在相同的条件下,这些核酸分子基本上不与不能编码2,5-DKG通透酶的核酸分子,如偶然含有与通透酶序列相同的短区域的不相关的分子,进行杂交。因此,可特异性杂交”的核酸分子具有足够的长度并含有足够的、来自2,5-DKG通透酶、其特征性的区别序列。在严格条件下,这样的分子一般可在利用单一种类mRNA进行的Northern印记或Southern印记上以单一条带进行杂交。

正如此处所用的,术语“严格的条件”指相当于将与滤膜相结合的核酸分子与核酸在42℃的、含有50%甲酰胺、5X Denhart’s溶液、5X SSPE、0.2%SDS的溶液中进行杂交,随后在65℃、在0.1X SSPE和0.1%SDS中冲洗滤膜2次30分钟。与上文提及的严格条件相等同的条件在本领域中是众所周知的,并在如Sambrook et al.,Molecular Coloning:A Laboratory Manual,Cold Spring HarborLaboratory,New York(1992)中有描述。

利用CLUSTAL V排序程序进行序列排序就可很容易的确定SEQID NO:1、3、5、7或9的特征序列或SEQ ID NO:1、3、5、7、9或11中的两个、三个或多个序列的共同序列。含有两或多个不同的2,5-DKG通透酶核酸分子共有的区域的寡核苷酸用作PCR引物或杂交探针来从其他物种中分离或检测编码2,5-DKG通透酶的核酸分子是有益的。

本发明中的寡核苷酸可,但并非必需,编码具有2,5-DKG通透酶活性的多肽。因此,本发明中的寡核苷酸可含有命名为SEQ IDNO:1、3、5、7、9或11的核苷酸序列5′或3′端非翻译区域序列,或二者皆包含,或包含有编码序列,或包含有非翻译区域和编码序列二者。正如上文对术语“核酸分子”的描述,本发明中的寡核苷酸可由所列的SEQ ID NO的有义链或反义链得到。

本发明中的寡核苷酸也可有利的用于指导重组2,5-DKG通透酶中氨基酸的添加、缺失或替代。在这样的应用中,可理解为,只要本发明中的寡核苷酸含有参考序列中的至少17个相邻残基,它们就可含有对SEQ ID NO:1、3、5、7、9或11进行的核苷酸修饰,使得寡核苷酸编码对SEQ ID NO:2、4、6、8、10或12进行的所需的氨基酸修饰。

本发明中典型的寡核苷酸是含有选自SEQ ID NO:1、3、5、7、9或11任一中的1-20、1-100、101-120、101-200、201-220、201-300、301-320、301-400、401-420、401-500、501-520、501-600、601-620、601-700、701-720、701-800、801-820、801-900、901-920、901-1000、1001-1020、1001-1100、1101-1120、1101-1200、1201-1220、1201-1300、1301-1320、1301-1400、1401-1420或1401-1500位核苷酸的序列的寡核苷酸。

本发明进一步提供了试剂盒,其中含有以单个容器或分开的容器包装在一起的一对2,5-DKG通透酶寡核苷酸。此寡核苷酸对优选的应用于检测或扩增编码2,5-DKG通透酶的核酸分子的PCR。此试剂盒可进一步包含有在PCR应用中有关引物对的书面使用说明或适于此应用的溶液和缓冲液。

本发明进一步提供了含有编码肽的核苷酸序列的分离的寡核苷酸,所述肽含有选自由SEQ ID NO:2、4、6、8、10或12组成的组中的氨基酸的至少10个相邻氨基酸。这样的寡核苷酸可编码SEQ IDNO:2、4、6、8、10或12中的至少10、12、15、20、25或更多个相邻氨基酸,例如可编码参考序列中的至少30、40、50、75、100、200、300、400或更多个相邻的氨基酸。可利用常规方法,由这样的寡核苷酸来表达编码的多肽,并且如下文所进一步所讨论的,利用这些肽来生产、纯化2,5-DKG抗体,或对此抗体进行定性。这样的寡核苷酸编码的肽可以,但并非必需的额外具有2,5-DKG通透酶的酶活性。

在一个实施方案中,分离的寡核苷酸编码选自SEQ ID NO:2、4、6、8、10或12的1-10、1-50、51-60、51-100、101-110、101-150、151-160、151-200、201-210、201-250、251-260、251-300、301-310、301-350、351-361、351-400、401-410或401-439位氨基酸的氨基酸序列。

这样就可将编码具有2,5-DKG通透酶活性的多肽的分离的核酸分子,以及上文描述的分离的寡核苷酸分子称为“2,5-DKG通透酶核酸分子”。

可利用本领域中已知的方法来制备本发明中的分离的2,5-DKG通透酶核酸分子。方法选择依赖于多种因素,例如计划分离的核酸分子的类型和大小、其是否编码生物活性多肽(例如,具有通透酶活性或免疫原性的多肽)、以及核酸分子的来源。本领域中的那些熟练技术人员可从感兴趣的任何微生物体中以基因组DNA或其所需的片段、以全长cDNA或其所需片段、或以全长mRNA或其所需片段的形式来分离或制备2,5-DKG通透酶核酸分子。

2,5-DKG通透酶核酸分子的一个典型制备方法是分离编码并表达具有2,5-DKG通透酶活性的多肽的重组构件物。正如在实施例中所描述的,一个有用的方法是提供其中细菌细胞的生长依赖于2,5-DKG通透酶的表达的一个新陈代谢选择体系,向检测细胞中导入可表达的DNA,如cDNA或基因组文库,在选择性条件下筛选存活的细胞并分离导入的DNA。另外,可设计一个筛选方法,使得只有在表达功能性2,5-DKG通透酶时细胞才展示可检测到的信号。典型的可检测信号是在2,5-DKG上细胞内掺入可检测的标记。适于鉴定编码新陈代谢酶的核酸分子的另外的筛选和选择策略在如PCT公布的WO00/22170和美国专利NO.5,958,672和5,783,431中有描述。

此外,分离的2,5-DKG通透酶核酸分子的制备方法包括利用2,5-DKG通透酶特异性引物和聚合酶链式反应(PCR)来对核酸分子进行扩增。利用PCR,可从具有2,5-DKG通透酶基因的任何细胞中、从少至单基因或单mRNA拷贝开始对具有所需边界的2,5-DKG通透酶核酸分子进行指数扩增。

假使在公开的6种2,5-DKG通透酶中存在高度的同一性,本领域中的那些熟练的技术人员可设计适于分离另外的2,5-DKG通透酶核酸分子的引物。优选的,这些引物为编码此处公开的两或多种2,5-DKG通透酶中存在的短共有氨基酸序列的简并寡核苷酸,或与之互补的简并寡核苷酸,例如编码SEQ ID NO:2、6、10中至少两种序列上存在的10或多个相邻氨基酸的寡核苷酸,或编码SEQ ID NO:4、8、12中至少两种序列上存在的10或多个相邻氨基酸的寡核苷酸。这些序列可通过图1所示的氨基酸序列排序来确定。SEQ ID NO:2、6、10中至少两种序列上存在的典型氨基酸序列为SEQ ID NO:2的19-31、115-124、146-156及339-348位氨基酸。SEQ ID NO:4、8、12中至少两种序列上存在的典型氨基酸序列是SEQ ID NO:8的55-64、60-69、252-261及370-379位氨基酸。

当利用简并引物分离所需核酸分子时,确定或更改PCR反应条件的方法在本领域中是众所周知的。随后利用本领域中众所周知的方法和在如Ausubel et al.,Current Protocols in MolecularBiology,John Wiley&Sons,New York(2000)中描述的方法对扩增产物进行测序,将其用作杂交探针或用于5′或3′RACE来对侧翼序列进行分离。

在公开的6种2,5-DKG通透酶间存在高度的序列同一性和结构相关性的情况下,通过杂交或抗体筛选可很容易的鉴定源自其他种的同系物。例如,利用可检测核酸分子或抗体,通过筛选文库,例如基因组文库、cDNA文库或表达文库,就可鉴定到分离的2,5-DKG通透酶核酸分子。源自多种微生物的这样的文库可通过商业购买得到,或可利用在如PCT公布的WO 00/22170中描述的方法,从可用的微生物中或感兴趣的环境样品中进行制备。可分离经鉴定含有2,5-DKG通透酶核酸分子的文库克隆,利用常规方法进行亚克隆和测序。

此外,可通过直接合成的方法来制备2,5-DKG通透酶核酸分子。例如,利用本领域中已知的自动化合成方法可化学合成单链核酸分子的一或多个片段。利用同样的方法可合成互补链的一或多个片段,通过对互补链进行退火就可制得双链分子。对于制备相对短的分子,如寡核苷酸探针和引物来讲,直接合成是尤其有益的,对制备含有进行过修饰的核苷酸或键的核酸分子来说,直接合成也是尤其有益的。

本发明也提供了具有2,5-DKG通透酶活性的分离的多肽。当这些分离的多肽以正常构象在细胞膜上进行表达时,它们对于需要提高2,5-DKG摄取的应用是有用的,例如在生物生产2-KLG中。也可将本发明中的分离的多肽添加到培养基中,优选的是以膜囊泡形式添加,以同与膜结合的通透酶竞争2,5-DKG,从而停止2,5-DKG的摄取。因此,具有2,5-DKG通透酶活性的分离的多肽可用于调节2,5-DKG代谢物的生产。

在一个实施方案中,本发明中的分离的多肽不是由完全包含在WO00/22170中、命名为SEQ ID NO:19的核苷酸序列中的核苷酸序列编码的,该核苷酸序列是产酸克雷伯氏菌yia操纵子。在另一个实施方案中,本发明中的分离的多肽不是完全包含在此处命名为SEQID NO:12的氨基酸序列中。

本发明中的“分离的”多肽可通过对其从天然环境中发现时的形式进行人工修饰后得到。例如,分离的2,5-DKG通透酶可以是重组表达得到的分子,这样在其天然宿主中以更高水平存在,或在不同宿主中水平存在。或者,本发明中的“分离的”2,5-DKG通透酶是基本纯化了的分子。基本纯化的2,5-DKG通透酶可利用本领域中已知的方法来制备。具体地说,关于编码yiaX2多肽(命名为SEQ IDNO:12)的多肽而言,术语“分离的”指此多肽不与产酸克雷伯氏菌yia操纵子中的其他基因,例如WO 00/22170中描述的、命名为1yxK和orf1的基因所表达的多肽相关联而存在。

在一个实施方案中,具有2,5-DKG通透酶活性的分离的多肽含有与选自由SEQ ID NO:2、4、6、8、10或12组中的氨基酸序列至少具有40%同一性的氨基酸序列。优选的,编码的多肽与所列举的任一SEQ ID NO至少具有45%的同一性,例如,至少50%、60%、70%、80%的同一性,包括至少90%、95%、98%、99%或更高的同一性。

在另一实施方案中,具有2,5-DKG通透酶活性的分离的多肽含有SEQ ID NO:2、4、6、8、10或12中任一序列的至少10个相邻氨基酸。本发明中的典型多肽含有SEQ ID NO:2、4、6、8、10或12中任一序列的1-10、1-50、51-60、51-100、101-110、101-150、151-160、151-200、201-210、201-250、251-260、251-300、301-310、301-350、351-361、351-400、401-410或401-439位氨基酸的氨基酸序列。

本发明也提供了具有得自2,5-DKG通透酶的氨基酸序列的、分离的免疫原性肽。这样的分离的免疫原性肽在如制备和纯化2,5-DKG抗体中是有用的。此处所用的术语“免疫原性的”指能诱导2,5-DKG通透酶特异性抗体、或能与2,5-DKG通透酶特异性抗体竞争结合2,5-DKG通透酶的肽。利用本领域中已知的方法和规则及在如Irnaten et al.,Protein Eng.11:949-955(1998)和Savoie etal.,Pac.Symp.Biocomput.1999:182-189(1999)中所描述的方法和规则可对可能具有免疫原性的肽进行预测。本发明中的肽的免疫原性可通过本领域中已知的方法来确定,例如利用对2,5-DKG通透酶敏化的动物进行迟发型超敏反应检验,或通过直接的或竞争性ELISA检验来确定。

本发明中的分离的免疫原性肽可含有选自由SEQ ID NO:2、4、6、8、10或12组成的组中的多肽的至少10个相邻氨基酸,例如SEQID NO:2、4、6、8、10或12中任一序列的1-10、1-50、51-60、51-100、101-110、101-150、151-160、151-200、201-210、201-250、251-260、251-300、301-310、301-350、351-361、351-400、401-410或401-439位氨基酸。这样的肽可含有参考序列的至少12、15、20、25或更多个相邻的氨基酸,包括参考序列的至少30、40、50、75、100、200、300、400或更多个相邻氨基酸,直至参考序列全长。

对于制备可识别以其天然构象存在的2,5-DKG通透酶的抗体来讲,这样的肽优选的至少含有通透酶的细胞外或细胞内结构域的一部分。细胞外或细胞内结构域一般特征在于含有至少一个极性或带正电或带负电的残基,而跨膜结构域一般特征在于约20个相邻疏水残基的不间断延伸。能够通过商业渠道购买的计算机拓扑学程序可用于确定哪种肽可能与细胞外或细胞内结构域或跨膜区域相对应。本发明中得自跨膜区域的免疫原性肽在制备抗体,以应用于如免疫印记中是有益的,其中待识别的2,5-DKG多肽不必要以其天然构象存在。

在编码核酸分子方面,上文已经对本发明的2,5-DKG通透酶多肽的结构和功能特征及应用进行了描述,对于本发明中的分离的多肽来讲,此描述也是适用的。这样,具有2,5-DKG通透酶活性的分离的多肽和本发明中的分离的免疫原性肽均可称作为“2,5-DKG通透酶”。

针对本发明的核酸分子、载体和细胞,上文已经对重组生产2,5-DKG通透酶的方法进行了描述。或者,通过从天然表达或重组表达2,5-DKG通透酶的细菌中分离细胞膜,可利用生物化学方法制备2,5-DKG通透酶。可按照大小对细胞膜进行进一步的分级,或通过亲合层析、电泳或免疫亲合方法来获得所需的纯度。可利用多种方法对纯化进行监测,例如通过利用2,5-DKG通透酶抗体进行免疫反应性监测或通过功能性检测来进行监测。

可从纯化的或部分纯化的2,5-DKG通透酶多肽来制备免疫肽,例如,对全长多肽进行酶法或化学切割。酶法和化学切割法以及对产生的肽片段进行纯化的方法在本领域中是众所周知的(见如Deutscher,Methods in Enzymology,Vol.182,“Guide toprotein Purification,”San Diego:Academic Press,Inc.(1990))。

另外,可通过化学合成来制备2,5-DKG通透酶。如果需要,如需对它们的功能活性、稳定性或生物利用度进行优化,这样的化学合成分子就可包括D-立体异构体、非天然氨基酸、氨基酸模拟物和类似物在内。Sawyer,Peptide Based drug Design,ACS,Washington(1995)and Gross and Meienhofer,The peptides:Analysis,Synthesis,Biology,Academic Press,Inc.,NewYork(1983).对于某些应用,例如对多肽进行检测来讲,向化学合成的通透酶中引入一或多个可检测的标记氨基酸也是有益的,例如向其中引入放射标记的或荧光标记的氨基酸。

本发明中的分离的2,5-DKG通透酶可进一步缀合到载体分子,如匙孔血蓝蛋白上,这样可增强免疫系统对分离的2,5-DKG通透酶的识别以进行抗体制备。对于某些应用,如提高分子的稳定性或生物活性、或促进其鉴定来讲,可利用化学法或酶法,如酰化作用、磷酸化作用或糖基化作用来使2,5-DKG通透酶衍生化。

本发明也提供了特异于具有2,5-DKG通透酶活性的多肽的抗体,例如特异于具有SEQ ID NO:2、4、6、8、10或12中任一氨基酸序列的多肽的抗体。本发明也提供了特异于分离的肽的抗体,该肽含有SEQ ID NO:2、4、6、8、10或12中任一序列的至少10个相邻氨基酸,并且是具有免疫原性的。本发明中的抗体可用于,如从表达文库或细胞中检测或分离2,5-DKG通透酶。

此处所用的术语“抗体”包括对2,5-DKG通透酶具有特异结合活性的分子,其结合活性至少约1×105M-1,优选的是至少1×107M-1,更优选的是1×109M-1。术语“抗体”包括多克隆抗体和单克隆抗体,以及这些抗体的抗原结合片段(如Fab、F(ab′)2、Fd和Fv片段等)。此外,术语“抗体”包括非天然抗体,如单链抗体、嵌合抗体、双功能抗体、CDR-接枝抗体和人源化抗体,及其抗原结合片段。

对本领域中的熟练技术人员来讲,利用肽和多肽免疫原制备和分离包括多克隆抗体和单克隆抗体在内的抗体的方法是众所周知的,并且在如Harlow and Lane,Antibodies:A Laboratory Manual,Cold Spring Harbor Laboratory press(1988)中由描述。可利用固相肽合成来构建非天然抗体,也可通过重组来制备,或通过如筛选含有可变重链和可变轻链的组合文库来获得非天然抗体。这些方法在如Huse et al.  Science 246:1275-1281(1989)、winter andHarris,Immunol.Today 14:243-246(1993)、Ward et al.,Nature 341:544-546(1989)、Hilyard et al.,proteinEngineering:A practical approach(IRL Press 1992)及Borrabeck,Antibody Engineering,2d ed.(Oxford Universitypress 1995)中有描述。

下列实施例用来例证本发明,但并没有限制本发明。

                        实施例

实施例展示了对编码具有2,5-DKG通透酶活性的6种新颖多肽的核酸分子进行的分离和定性。

鉴定yiaX2为2,5-DKG通透酶

WO 002170描述了对得自产酸克雷伯氏菌的、命名为yia操纵子的操纵子进行的鉴定和序列分析,该操纵子含有8个推定的开放阅读框架。因为此操纵子断裂使产酸克雷伯氏菌丧失了利用抗坏血酸作为唯一碳源进行生长的能力,所以预测此yia操纵子与抗坏血酸的新陈代谢有关。在WO 002170中没有对yia操纵子中单个开放阅读框架编码的多肽的功能进行描述。

经确定,产酸克雷伯氏菌能够以2,5-DKG作为唯一碳源来生长,因此,可以得出结论,产酸克雷伯氏菌表达了2,5-DKG通透酶。我们预测这样的通透酶与已知的细菌转运蛋白,如多跨膜片段,共享某些结构特性。在yia操纵子中,命名为yiaX2的一个未定性的开放阅读框架编码与已知的酒石酸盐转运蛋白约具有33%同一性的跨膜多肽,从而认为其是侯选的2,5-DKG通透酶。

为了确定yiaX2是否编码2,5-DKG通透酶,将此基因从命名为M5al的产酸克雷伯氏菌菌株的染色体中缺失。在关于如肺炎克雷伯氏菌的文献中对M5al已经有描述(见,如Streicher et al.,Proc.Natl.Acad,Sci.68:1174-1177(1971))。在三方连接反应中,通过将紧邻yiaX2基因的上游和下游区域序列与pMAK705整合载体连接,构建了yiaX2缺失突变体(在Hamilton et al.,J.Bacteriol.171:4617-4622(1989)中有描述)。利用寡核苷酸5′-ACCCAAGCTTCACCAAAAGAGTGAAGAGGAAG-3′(SEQ ID NO:17)和5′-CGTATCTAGAAAAATATTCTGGTGATGAAGGTGA-3′(SEQ ID NO:18)来扩增orfl基因中约1kb的片段并用HindIII和Xba I进行消化。利用寡核苷酸5′-AGACTCTAGATCCACATAAACGCACTGCGTAAAC-3′(SEQ IDNO:19)和5′-GAGGGGATCCTGGCTTCGTGAACGATATACTGG-3′(SEQ IDNO:20)来扩增1yxK基因中类似大小的片段并用Xba I和BamH I进行消化。将生成的两个片段在载体pMAK705的HindIII和BamH I位点间连接在一起。将生成的质粒转化到产酸克雷伯氏菌菌株M5al中,如Hamilton et al.,上文(1989)中所描述的,得到了通过双交换而整合有缺失构建物的侯选菌株。产生的产酸克雷伯氏菌ΔyiaX2菌株命名为MGK002。通过PCR分析检验了yiaX2缺陷型菌株的表现型。

如下文所描述的,确定了产酸克雷伯氏菌ΔyiaX2[tkr idnO]菌株在以2,5-DKG为唯一碳源的培养基上的生长效率非常低,并且不在2-KLG上生长。通过对添加回缺失基因恢复了产酸克雷伯氏菌ΔyiaX2[tkr idnO]菌株在2,5-DKG或2-KLG上生长的能力进行确定,证实了yiaX2编码具有2,5-DKG和2-KLG通透酶活性的多肽(见下文)。

构建产酸克雷伯氏菌ΔyiaX2[tkr idnO]

为了鉴定另外的2,5-DKG通透酶,优选对2,5-DKG具有选择性的通透酶,选用了一个新陈代谢选择体系。如WO 00/22170中所描述的,新陈代谢选择对于在没有任何先前的序列信息的情况下,从未定性的和甚至不能培养的微生物中对功能基因进行迅速鉴定是有益的。

通过对产酸克雷伯氏菌ΔyiaX2进行基因工程操作使其表达2,5-DKG代谢为葡糖酸(其可转化为碳和能量)所涉及的酶,制备了用于对编码2,5-DKG通透酶的核酸分子进行代谢选择的试验菌株。能够催化2,5-DKG转化为葡糖酸的酶是由命名为SEQ ID NO:13的tkr idnD idn0操纵子的tkr和idnO基因编码的。

将tkr idnD idn0操纵子(SEQ ID NO:13)亚克隆到高拷贝数载体pUC19中,并将产生的命名为pDF33的克隆转化到产酸克雷伯氏菌ΔyiaX2中。从而,产生的试验菌株(命名为MGK002[pDF33]或产酸克雷伯氏菌ΔyiaX2[tkr idnO])可表达利用2,5-DKG为唯一碳源生长所需的所有多肽,但该菌株在将细胞外2,5-DKG转运进细胞的2,5-DKG通透酶活性方面有缺陷。因此,编码2,5-DKG通透酶的核酸分子在试验菌株中表达后会立即赋予试验菌株在2,5-DKG上生长的能力。图3中有新陈代谢选择策略的图示。

为了验证我们提出的新陈代谢选择策略,将yiaX2基因作为正对照重新导入试验菌株中以证实其赋予试验菌株在2,5-DKG和2-KLG上生长的能力。利用寡核苷酸5′-AATAGGATCCTTCATCACCAGAATATTTTTA-3′(SEQ ID NO:21)和5′-CATAGGTACCGGCTTTCAGATAGGTGCC-3′(SEQ ID NO:22)对yiaX2开放阅读框架(WO 00/22170中SEQ ID NO:19的3777-5278位核苷酸)进行PCR扩增,经BamH1和Kpn1消化后将其连接到利用相同的限制性酶消化后的pCL1920(Lerner et al.,Nucl.Acids.Res.18:4631(1990);见下文的描述)上。利用生成的构建物进行转化后,产酸克雷伯氏菌ΔyiaX2[tkr idnO]就能够在30℃、在添加有2-KLG或2,5-DKG(0.25%)及0.1mM IPTG的M9基本琼脂培养基上培养过夜。因此,证明了产酸克雷伯氏菌ΔyiaX2[tkr idnO]是在鉴定另外的2,5-DKG通透酶并确定它们的选择性方面合适的试验菌株。

构建细菌基因组文库

用于构建上述正对照和制备细菌基因组文库的克隆载体是质粒pCL1920(Lerner et al.,上文,1990),其为携带有壮观霉素/链霉素抗性决定簇的低拷贝数目表达载体。此表达是由lacPO启动子/操纵基因区域驱动,当宿主细胞提供lacIq基因产物时,此区域就受到lacIq基因产物的抑制,而在0.01-0mM IPTG存在下被诱导。

按照下文描述的方法来制备源自下列物种和分离物的基因组DNΔ,这些细菌为柠檬泛菌  (ATCC 39140)、产酸克雷伯氏菌MGK002(ΔyiaX2)、铜绿假单胞菌和25种环境分离物的混合物,它们得自18种不同土样和水样、且能以2,5-DKG为唯一碳源生长。产酸克雷伯氏菌MGK002(ΔyiaX2)包含在所选的细菌中,这是因为其在以2,5-DKG为唯一碳源生长的试验菌株中有微量的背景生长,并且在摄取检验中展示了一些2,5-DKG通透酶活性。然而,试验菌株不能在2-KLG上生长并且没有展示可检测到的2-KLG摄取,这暗示在产酸克雷伯氏菌中存在另一种对2,5-DKG具有选择性的2,5-DKG通透酶。

在6,000rpm下将5ml过夜的LB培养物(30℃)离心5min。利用1.5ml Tris 10mM、EDTA 1mM pH8.0(TE)冲洗沉淀,再次离心,重新悬浮在0.4ml TE中。向其中添加溶菌酶(5mg/ml)和RNase(100pg/ml)并将细胞在37℃下培育10分钟。添加十二烷基硫酸钠(SDS)至其浓度为1%,将试管轻轻振动直至其完全溶解。向裂解物溶液中添加100微升5N NaClO4贮存液。利用1体积的苯酚:氯仿(1∶1)对混合物进行一次抽提,并利用1体积氯仿抽提一次。添加2ml冷(-20℃)乙醇以使染色体DNA沉淀,并轻轻的沿弯曲的巴斯德吸管将沉淀物绕成圈。室温下将DNA干燥30min,重新悬浮在50-100ul Tris 10mM、EDTA 1mM、NaCl 50mM pH8.0中以获得浓度为0.5-1ug/ul的DNA。将从每个环境分离物中得到的基因组DNA制备品等比混合以制备单混合文库。

对于每个制备品来讲,为了获得大小为3-20kb的片段,所以利用Sau3A对10-15ml等份的基因组DNA进行控制消化。利用低拷贝数目的表达载体pCL1920将得到的片段的一半进行连接,而此表达载体在此连接之前是经过BamH1的消化和脱磷酸化的。将得到的基因组文库转化到大肠杆菌DH10B电感受态细胞(GTBCO-BRL)中,并在30℃下、在补充有100ug/ml壮观霉素的LB琼脂上简单的扩增过夜。对于每个文库来讲,铺板30,000-120,000个克隆,并利用标准方法来大量提取质粒DNA。对插入的片段的大小进行随机检查,在-20℃下以质粒DNA的形式保存扩增后的文库以在试验菌株中的进一步应用。

通透酶基因的选择、鉴定和序列测定

通过电穿孔将每个基因组文库的一等份导入产酸克雷伯氏菌ΔyiaX2[tkr idnO](MGK002[pDF33])菌株中。对转化过程中使用的DNA的量进行调整以使每个文库在选择培养基上铺板5×105-1×106个克隆。在含有100ug/ml壮观霉素的LB琼脂平皿上覆盖有选择圈,随后将其复制物在含有2.5%2,5-DKG和0.1mM IPTG并调节pH为4.5的M9琼脂平皿上覆盖生长。将在2,5-DKG上生长的克隆转移到缺乏质粒pDF33的产酸克雷伯氏菌ΔyiaX2(MGK002)中,以便验证tkr idnDO途径在那些利用2,5-DKG生长的克隆中确实是必需的。进行简单的遗传定性来排除完全相同的克隆。按照初步的2,5-DKG/2-KLG摄取检验结果,保留5个克隆以进行进一步的分析:2个克隆得自柠檬泛菌文库,1个克隆得自产酸克雷伯氏菌,2个克隆得自混合的环境文库。

在所有情况下,对载体插入片段进行的DNA序列分析表明其中存在编码多肽(SEQ ID NO:2、4、6、8、10)的核苷酸序列(SEQ IDNO:1、3、5、7、9),它们显示出与公开的转移蛋白和yiaX2(SEQID NO:11,其编码的多肽SEQ ID NO:12)具有同源性。在这些插入序列中也存在其他的orf,并且在绝大多数情况下还存在内源启动子。

含有prmA和prmB orf(SEQ ID NO:7和9)的插入序列长约9kb,并且其也含有1个与细菌idnO同源的orf、2个编码转录抑制子的orf、一个具有未知功能的orf、3个编码在硝酸盐利用中所涉及的大肠杆菌多肽的同系物的orf。

含有PE1 orf(SEQ ID NO:1)的插入序列长约3kb,并且其也含有推定的、与枯草芽孢杆菌kdgK基因和大肠杆菌ydcG基因的同系物紧密相关的脱氢-脱氧葡糖酸激酶基因。

含有PE6 orf(SEQ ID NO:3)的插入序列长约6.7kb。因为一个yiaL同系物在SEQ ID NO:4之前,且在该插入序列中也含有yiaK同系物,所以PE6的基因组环境与大肠杆菌和产酸克雷伯氏菌的yia操纵子的基因组环境相似。

含有PK1 orr(SEQ ID NO:5)的插入序列长约5.5kb。与其他的插入序列大不相同,此插入序列似乎不含有内源启动子,这表明PK1 orf显然是从载体的启动子转录而来。PK1 orf之后紧跟tkr同系物。

将编码每个2,5-DKG通透酶的核酸分子重新导入产酸克雷伯氏菌ΔyiaX2[tkr idnO]中,检测生成的菌株能否在2,5-DKG和2-KLG上生长,并且也对标记的2,5-DKG和2-KLG的摄取进行检验。

将放射性2-KLG或2,5-DKG与IPTG-诱导的细胞混合,每隔一定时间取出等量的混合物,测定上清液中的放射性随时间的减少并测定细胞中随时间变化而出现的放射性,从而进行摄取检验。下表1展示了生长检验和2,5-DKG摄取检验的结果。

表1

 重组表达的2,5-DKG通透酶在2,5-DKG上的细胞生长在2-KLG上的生长  2,5-DKG摄取(g/l/h) YiaX2    +    ++    3.7 PE1    ++    ++    4.2 PE6    ++    ++    5.0 prmA    ++    ++    5.5 prmB    +/-    ND    O.9 prmA和prmB    ++    ND    9.9 PK1    ++    -    4.2 Control(产酸克雷伯氏菌ΔyiaX2/tkr/idn0)    bkgd    -    1.0

将编码不同通透酶的核酸分子也亚克隆到包括高拷贝数载体pSE380(其含有tac启动子)、中等拷贝数载体pACYC184(不含启动子)或低拷贝数载体pCL1920在内的多种载体中,并将其导入适于利用葡萄糖生物生产2-KLG的泛菌属菌株中(见美国专利NO.5,032,514)。在生物发酵条件下对产生的菌株进行评估,以此来确定核酸分子、启动子和载体的哪种组合对提高2-KLG产量来说是最理想的。

在括弧或其他中的、上文提供的所有在刊物上发表的文章、参考文献和引用的专利,不管以前提及与否,都在此处全文引用作为参考。

虽然已经通过上述的实施例对本发明进行了描述,但我们应该明白,在不偏离本发明的思想的前提下可对其进行多种变更。

                                     序列表

                                  序列表<110> Dartois,Vetonique A.

  Hoch,James A.

  Valle,Fernando

  Kumar,Manoj

  Microgenomics,Inc.

  Genencor International,Inc.<120> 2,5-DKG渗透酶<130> FP-SR 4773<150> US 09/633,294<151> 2000-08-04<150> US 09/677,032<151> 2000-09-29<160> 22<170> FastSEQ for Windows Version 4.0<210> 1<211> 1500<212> DNA<213> 未知<220><223> 环境来源<221> CDS<222> (94)…(1374)<400> 1ggcgaatagc ccggccggcg tcataataac ggccttctct gtaccctaca tacggcggcg  60gcgtcatgaa cctcaacttt agtaggcaag cct atg aac agc tct acc aat gca   114

                                 Met Asn Ser Ser Thr Asn Ala

                                  1               5acg aaa cgc tgg tgg tac atc atg cct atc gtg ttt atc acg tat agc    162Thr Lys Arg Trp Trp Tyr Ile Met Pro Ile Val Phe Ile Thr Tyr Ser

     10                  15                  20ctg gcg tat ctc gac cgc gca aac ttc agc ttt gct tcg gca gcg ggc    210Leu Ala Tyr Leu Asp Arg Ala Asn Phe Ser Phe Ala Ser Ala Ala Gly

 25                  30                  35att acg gaa gat tta ggc att acc aaa ggc atc tcg tcg ctt ctt ggc    258Ile Thr Glu Asp Leu Gly Ile Thr Lys Gly Ile Ser Ser Leu Leu Gly40                  45                  50                  55gca ctt ttc ttc ctc ggc tat ttc ttc ttc cag atc ccg ggg gcg att    306Ala Leu Phe Phe Leu Gly Tyr Phe Phe Phe Gln Ile Pro Gly Ala Ile

 60                      65                          70tac gcg gaa cgc cgt agc gta cgg aag ctg att ttc atc tgt ctg atc    354Tyr Ala Glu Arg Arg Ser Val Arg Lys Leu Ile Phe Ile Cys Leu Ile

         75                  80                  85ctg tgg ggc gcc tgc gcc tcg ctt gac cgg gat ggt gca caa tat tcc    402Leu Trp Gly Ata Cys Ala Ser Leu Asp Arg Asp Gly Ala Gln Tyr Ser

     90                  95                 100agc gct ggc tgg cga tcc gtt tta ttc tcg gct gtc gtg gaa gcg gcg    450Ser Ala Gly Trp Arg Ser Val Leu phe Ser Ala Val Val Glu Ala Ala

105                 110                 115gtc atg ccg gcg atg ctg att tac atc agt aac tgg ttt acc aaa tca    498Val Met Pro Ala Met Leu Ile Tyr Ile Ser ASn Trp Phe Thr Lys Ser120                 125                  130                135gaa cgt tca cgc gcc aac acc ttc tta atc ctc ggc aac ccg gtc acg    546Glu Arg Ser Arg Ala Asn Thr Phe Leu Ile Leu Gly Asn Pro Val Thr

            140                 145                 150gta ctg tgg atg tcg gtg gtc tcc ggc tac ctg att cag tcc ttc ggc    594Val Leu Trp Met Ser Val Val Ser Gly Tyr Leu Ile Gln Ser Phe Gly

        155                 160                 165tgg cgt gaa atg ttt att att gaa ggc gtt ccg gcc gtc ctc tgg gcc    642Trp Arg Glu Met Phe Ile Ile Glu Gly Val Pro Ala Val Leu Trp Ala

    170                 175                 180ttc tgc tgg tgg gtg ctg gtc aaa gtt aaa ccg tcg cag gtg aac tgg    690Phe Cys Trp Trp Val Leu Val Lys Val Lys Pro Ser Gln Val Asn Trp

185                 190                 195ttg tcg gaa aac gag aaa gcc gcg ctg cag gcg cag ctg gag agc gag    738Leu Ser Glu Asn Glu Lys Ala Ala Leu Gln Ala Gln Leu Glu Ser Glu200                 205                 210                 215cag cag ggt att aaa gcc gtg cgt aac tac ggc gaa gcc ttc cgc tca    786Gln Gln Gly Ile Lys Ala Val Arg Asn Tyr Gly Glu Ala Phe Arg Ser

            220                 225                 230cgc aac gtc att cta ctg tgc atg cag tat ttt gcc tgg agt atc ggc    834Arg Asn Val Ile Leu Leu Cys Met Gln Tyr Phe Ala Trp Ser Ile Gly

        235                 240                 245gtg tac ggt ttt gtg ctg tgg ttg ccg tca att att cgc agc ggc ggc    882Val Tyr Gly Phe Val Leu Trp Leu Pro Ser Ile Ile Arg Ser Gly Gly

    250                 255                 260gtc aat atg ggg atg gtg gaa gtc ggc tgg ctc tct tcg gtg cct tat    930Val Asn Met Gly Met Val Glu Val Gly Trp Leu Ser Ser Val Pro Tyr

265                 270                 275ctg gcc gcg act att gcg atg atc gtc gtc tcc tgg gct tcc gat aaa    978Leu Ala Ala Thr Ile Ala Met Ile Val Val Ser Trp Ala Ser Asp Lys280                 285                 290                 295atg cag aac cgt aaa ctg ttc gtc tgg ccg ctg ctg ctg att ggc gga    1026Met Gln Asn Arg Lys Leu Phe Val Trp Pro Leu Leu Leu Ile Gly Gly

            300                 305                 310ctg gct ttt att ggc tca tgg gcc gtc ggc gct aac cat ttc tgg gcc    1074Leu Ala Phe Ile Gly Ser Trp Ala Val Gly Ala Asn His Phe Trp Ala

        315                 320                 325tct tat acc ctg ctg gtg att gcc aat gcg gca atg tac gcc cct tac    1122Ser Tyr Thr Leu Leu Val Ile Ala Asn Ala Ala Met Tyr Ala Pro Tyr

    330                 335                 340ggt ccg ttt ttc gcc atc att ccg gaa atg ctg ccg cgt aac gtc gcc    1170Gly Pro Phe Phe Ala Ile Ile Pro Glu Met Leu Pro Arg Asn Val Ala

345                 350                 355ggt ggc gca atg gcg ctc atc aac agc atg ggg gcc tta ggt tca ttc    1218Gly Gly Ala Met Ala Leu Ile Asn Ser Met Gly Ala Leu Gly Ser Phe360                 365                 370                 375ttt ggt tcg tgg ttc gtg ggc tac ctg aac ggc acc acc ggc agt cca    1266Phe Gly Ser Trp Phe Val Gly Tyr Leu Asn Gly Thr Thr Gly Ser Pro

            380                 385                 390tca gcc tca tac att ttc atg gga gtg gcg ctt ttc gcc tcg gta tgg    1314Ser Ala Ser Tyr Ile Phe Met Gly Val Ala Leu Phe Ala Ser Val Trp

        395                 400                 405ctt act tta att gtt aag cct gct aac aat caa aag ctc ccc atc ggc    1362Leu Thr Leu Ile Val Lys Pro Ala Asn Asn Gln Lys Leu Pro Ile Gly

    410                 415                 420gct cgt cac gcc tgacctttac tacttacgga gatcacgcct tgggtacgtt        1414Ala Arg His Ala

425gcaggacaaa ccgataggca ccgcaaaggc tggggccatc gagcagcgcg taaacagtca  1474gctggttgct gtcgctgtgc ggcgtc                                       1500<210> 2<211> 427<212> PRT<213> 未知<220><223> 环境来源<400> 2Met Asn Ser Ser Thr Asn Ala Thr Lys Arg Trp Trp Tyr Ile Met Pro1               5                  10                  15Ile Val Phe Ile Thr Tyr Ser Leu Ala Tyr Leu Asp Arg Ala Asn Phe

        20                  25                  30Ser Phe Ala Ser Ala Ala Gly Ile Thr Glu Asp Leu Gly Ile Thr Lys

    35                  40                  45Gly Ile Ser Ser Leu Leu Gly Ala Leu Phe Phe Leu Gly Tyr Phe Phe

50                  55                  60Phe Gln Ile Pro Gly Ala Ile Tyr Ala Glu Arg Arg Ser Val Arg Lys65                  70                  75                  80Leu Ile Phe Ile Cys Leu Ile Leu Trp Gly Ala Cys Ala Ser Leu Asp

            85                  90                  95Arg Asp Gly Ala Gln Tyr Ser Ser Ala Gly Trp Arg Ser Val Leu Phe

        100                 105                 110Ser Ala Val Val Glu Ala Ala Val Met Pro Ala Met Leu Ile Tyr Ile

    115                 120                 125Ser Asn Trp Phe Thr Lys Ser Glu Arg Ser Arg Ala Asn Thr Phe Leu

130                 135                 140Ile Leu Gly Asn Pro Val Thr Val Leu Trp Met Ser Val Val Ser Gly145                 150                 155                 160Tyr Leu Ile Gln Ser Phe Gly Trp Arg Glu Met Phe Ile Ile Glu Gly

            165                 170                 175Val Pro Ala Val Leu Trp Ala Phe Cys Trp Trp Val Leu Val Lys Val

        180                 185                 190Lys Pro Ser Gln Val Asn Trp Leu Ser Glu Asn Glu Lys Ala Ala Leu

    195                 200                 205Gln Ala Gln Leu Glu Ser Glu Gln Gln Gly Ile Lys Ala Val Arg Asn

210                 215                 220Tyr Gly Glu Ala Phe Arg Ser Arg Asn Val Ile Leu Leu Cys Met Gln225                 230                 235                 240Tyr Phe Ala Trp Ser Ile Gly Val Tyr Gly Phe Val Leu Trp Leu Pro

            245                 250                 255Ser Ile Ile Arg Ser Gly Gly Val Asn Met Gly Met Val Glu Val Gly

        260                 265                 270Trp Leu Ser Ser Val Pro Tyr Leu Ala Ala Thr Ile Ala Met Ile Val

    275                 280                 285Val Ser Trp Ala Ser Asp Lys Met Gln Asn Arg Lys Leu Phe Val Trp

290                 295                 300Pro Leu Leu Leu Ile Gly Gly Leu Ala Phe Ile Gly Ser Trp Ala Val305                 310                 315                 320Gly Ala Asn His Phe Trp Ala Ser Tyr Thr Leu Leu Val Ile Ala Asn

            325                 330                 335Ala Ala Met Tyr Ala Pro Tyr Gly Pro phe Phe Ala Ile Ile Pro Glu

        340                 345                 350Met Leu Pro Arg Asn Val Ala Gly Gly Ala Met Ala Leu Ile Asn Ser

    355                 360                 365Met Gly Ala Leu Gly Ser Phe Phe Gly Ser Trp Phe Val Gly Tyr Leu

370                 375                 380Asn Gly Thr Thr Gly Ser Pro Ser Ala Ser Tyr Ile Phe Met Gly Val385                 390                 395                 400Ala Leu Phe Ala Ser Val Trp Leu Thr Leu Ile Val Lys Pro Ala Asn

            405                 410                     415Asn Gln Lys Leu Pro Ile Gly Ala Arg His Ala

        420                 425<210> 3<211> 1775<212> DNA<213> 未知<220><223> 环境来源<221> CDS<222> (214)...(1491)<400> 3ggcaatttgc ggtgtttttt ccgcaggacg ttcatcgtcc ggcctgtatt catcaacgge    60cctgcgctat tcgcaaagtg gtggtgaaaa taccgctgcg ttatttaacg cccaataagc    120aacaccgagt ttataaccct gaacgacacg gctgcgggcc tgtgtagacg cccctacgcc    180ttaacaccac taaatgactc tacaggtgta tat atg aat aca gcc tct gtt tct     234

                                 Met Asn Thr Ala Ser Val Ser

                                  1               5gtc acc caa agc cag gcg atc ccc aaa tta cgc tgg ttg aga ata gtg      282Val Thr Gln Ser Gln Ala Ile Pro Lys Leu Arg Trp Leu Arg Ile Val

     10                  15                  20ccg cct att ctt att acc tgc att att tcc tat atg gac cgg gtg aac      330Pro Pro Ile Leu Ile Thr Cys Ile Ile Ser Tyr Met Asp Arg Val Asn

 25                  30                  35atc gcc ttc gcc atg ccc ggc ggc atg gac gat gaa ctg ggc atc acc      378Ile Ala Phe Ala Met Pro Gly Gly Met Asp Asp Glu Leu Gly Ile Thr40                  45                  50                  55gcc tcg atg gcc ggg ttg gcc ggc ggt att ttc ttt atc ggt tat ctg      426Ala Ser Met Ala Gly Leu Ala Gly Gly Ile Phe Phe Ile Gly Tyr Leu

             60                  65                  70ttc ttg cag gta ccc ggc ggc aag ctg gcg gtg tac ggc aac ggc aag      474Phe Leu Gln Val Pro Gly Gly Lys Leu Ala Val Tyr Gly Asn Gly Lys

         75                  80                  85aaa ttc atc ggt tgg tcg ttg ttg gcc tgg gcg gtg att tcc gtg ctg      522Lys Phe Ile Gly Trp Ser Leu Leu Ala Trp Ala Val Ile Ser Val Leu

     90                  95                 100acc ggg ctg gtc acg aat cag tat caa ttg ctg ttc ctg cgc ttc gcc      570Thr Gly Leu Val Thr Asn Gln Tyr Gln Leu Leu Phe Leu Arg Phe Ala

105                 110                 115ctc ggc cgt ttc cga agc ggc atg ctg cgg tgg gtg ctg acc atg atc      618Leu Gly Arg Phe Arg Ser Gly Met Leu Arg Trp Val Leu Thr Met Ile120                 125                 130                 135agc aac tgg ttc ccg gac aag gaa cgc ggg cgc gcc aac gcc atc gtc      666Ser Asn Trp Phe Pro Asp Lys Glu Arg Gly Arg Ala Asn Ala Ile Val

            140                 145                 150atc atg ttc gtg ccg atc gcc ggc atc ctt acc gca ccg ctg tcc ggc      714Ile Met Phe Val Pro Ile Ala Gly Ile Leu Thr Ala Pro Leu Ser Gly

        155                 160                 165tgg atc atc acc gcc tgg gac tgg cgc atg ctg ttc ctg gtc gag ggc    762Trp Ile Ile Thr Ala Trp Asp Trp Arg Met Leu Phe Leu Val Glu Gly

    170                 175                 180gcg ctg tcg ctg gtc gtg atg gtg ctg tgg tat ttc acc atc agc aac    810Ala Leu Ser Leu Val Val Met Val Leu Trp Tyr Phe Thr Ile Ser Asn

185                 190                 195cgt cca caa gag gcc aaa agg att tcg cag gcg gaa aaa gat tat ctg    858Arg Pro Gln Glu Ala Lys Arg Ile Ser Gln Ala Glu Lys Asp Tyr Leu200                 205                 210                 215atc aaa acg ctg cac gac gaa cag ttg ctg atc aaa ggc aaa acg gtg    906Ile Lys Thr Leu His Asp Glu Gln Leu Leu Ile Lys Gly Lys Thr Val

            220                 225                 230cgc aac gcc tcg ctg cgt cgg gtg ctg ggc gac aaa atc atg tgg aag    954Arg Asn Ala Ser Leu Arg Arg Val Leu Gly Asp Lys Ile Met Trp Lys

        235                 240                 245ttc ttc tac cag acc ggg ata tac ggc tac acc ctg tgg ctg ccg acc    1002Phe Phe Tyr Gln Thr Gly Ile Tyr Gly Tyr Thr Leu Trp Leu Pro Thr

    250                 255                 260att ctc aag ggg ctc acc aac ggc aat atg gag cag gtc ggg atg ctg    1050Ile Leu Lys Gly Leu Thr Asn Gly Asn Met Glu Gln Val Gly Met Leu

265                 270                 275gct atc ctg ccc tat atc ggc gcc atc ttc ggc atg ctg atc att tcc    1098Ala Ile Leu Pro Tyr Ile Gly Ala Ile Phe Gly Met Leu Ile Ile Ser280                 285                 290                 295acc ctc tcc gat cgc acc ggc aag cgc aaa gtg ttc gtc gca ctg ccg    1146Thr Leu Ser Asp Arg Thr Gly Lys Arg Lys Val Phe Val Ala Leu Pro

            300                 305                 310ctg gcc tgc ttt gcc atc tgc atg gcg ctg tcg gtg ctg ctg aag gat    1194Leu Ala Cys Phe Ala Ile Cys Met Ala Leu Ser Val Leu Leu Lys Asp

        315                 320                 325cac atc tgg tgg tcg tac gcg gcg ctg gtg ggc tgt ggc gtc ttt acc    1242His Ile Trp Trp Ser Tyr Ala Ala Leu Val Gly Cys Gly Val Phe Thr

    330                 335                 340cag gcc gcc gcc ggg gtg ttc tgg acc att ccg ccc aag ctg ttt aac    1290Gln Ala Ala Ala Gly Val Phe Trp Thr Ile Pro Pro Lys Leu Phe Asn

345                 350                 355gcc gaa atg gcc ggc ggc gcg cgc ggc gtg atc aat gca ctg ggc aac    1338Ala Glu Met Ala Gly Gly Ala Arg Gly Val Ile Asn Ala Leu Gly Asn360                 365                 370                 375ctc ggc ggt ttc tgc ggc ccc tat atg gtc ggc gtg ttg atc acc ttg    1386Leu Gly Gly Phe Cys Gly Pro Tyr Met Val Gly Val Leu Ile Thr Leu

            380                 385                 390ttc agc aaa gac gtc ggc gtt tac agc ctc gcg gtg tcg ctg gcc tcc    1434Phe Ser Lys Asp Val Gly Val Tyr Ser Leu Ala Val Ser Leu Ala Ser

        395                 400                 405gcc tcg gtg ctg gcg ttg atg ctg ccg aac aga tgc gac caa aaa gcg    1482Ala Ser Val Leu Ala Leu Met Leu Pro Asn Arg Cys Asp Gln Lys Ala

    410                 415                 420ggg gcc gaa taatggacta ttggctgggg ctggactgcg gcggcacctt            1531Gly Ala Glu

425tatcaaagcc ggcctgtatg accggaatgg cgcagaactg ggcatagccc gccgtacgct  1591ggacattgtc gcgccgcaac ccggctgggc ggaacgtgac atgcccgcgc tgtggcagac  1651cgccgccgag gtgatccgcg aattgctggc ccgcaacgac attgccgacg ctgatattca  1711ggccatcggc atctcggcgc agggtaaagg cgcgtttttg ttagacgagc aaggccaacc  1771gttg                                                               1775<210> 4<211> 426<212> PRT<213> 未知<220><223> 环境来源<400> 4Met Asn Thr Ala Ser Val Ser Val Thr Gln Ser Gln Ala Ile Pro Lys1               5                  10                  15Leu Arg Trp Leu Arg Ile Val Pro Pro Ile Leu Ile Thr Cys Ile Ile

        20                  25                  30Ser Tyr Met Asp Arg Val Asn Ile Ala Phe Ala Met Pro Gly Gly Met

    35                  40                  45Asp Asp Glu Leu Gly Ile Thr Ala Ser Met Ala Gly Leu Ala Gly Gly

50                  55                  60Ile Phe Phe Ile Gly Tyr Leu Phe Leu Gln Val Pro Gly Gly Lys Leu65                  70                  75                  80Ala Val Tyr Gly Asn Gly Lys Lys Phe Ile Gly Trp Ser Leu Leu Ala

            85                  90                  95Trp Ala Val Ile Ser Val Leu Thr Gly Leu Val Thr Asn Gln Tyr Gln

        100                 105                 110Leu Leu Phe Leu Arg Phe Ala Leu Gly Arg Phe Arg Ser Gly Met Leu

    115                 120                 125Arg Trp Val Leu Thr Met Ile Ser Asn Trp Phe Pro Asp Lys Glu Arg

130                 135                 140Gly Arg Ala Asn Ala Ile Val Ile Met Phe Val Pro Ile Ala Gly Ile145                 150                 155                 160Leu Thr Ala Pro Leu Ser Gly Trp Ile Ile Thr Ala Trp Asp Trp Arg

            165                 170                 175Met Leu phe Leu Val Glu Gly Ala Leu Ser Leu Val Val Met Val Leu

        180                 185                 190Trp Tyr Phe Thr Ile Ser Asn Arg Pro Gln Glu Ala Lys Arg Ile Ser

    195                 200                 205Gln Ala Glu Lys Asp Tyr Leu Ile Lys Thr Leu His Asp Glu Gln Leu

210                 215                 220Leu Ile Lys Gly Lys Thr Val Arg Asn Ala Ser Leu Arg Arg Val Leu225                 230                 235                 240Gly Asp Lys Ile Met Trp Lys Phe Phe Tyr Gln Thr Gly Ile Tyr Gly

            245                 250                 255Tyr Thr Leu Trp Leu Pro Thr Ile Leu Lys Gly Leu Thr Asn Gly Asn

        260                 265                 270Met Glu Gln Val Gly Met Leu Ala Ile Leu Pro Tyr Ile Gly Ala Ile

    275                 280                 285Phe Gly Met Leu Ile Ile Ser Thr Leu Ser Asp Arg Thr Gly Lys Arg

290                 295                 300Lys Val Phe Val Ala Leu Pro Leu Ala Cys Phe Ala Ile Cys Met Ala305                 310                 315                 320Leu Ser Val Leu Leu Lys Asp His Ile Trp Trp Ser Tyr Ala Ala Leu

            325                 330                 335Val Gly Cys Gly Val Phe Thr Gln Ala Ala Ala Gly Val Phe Trp Thr

        340                 345                 350Ile Pro Pro Lys Leu Phe Asn Ala Glu Met Ala Gly Gly Ala Arg Gly

    355                 360                   365Val Ile Asn Ala Leu Gly Asn Leu Gly Gly Phe Cys Gly Pro Tyr Met

370                 375                 380Val Gly Val Leu Ile Thr Leu Phe Ser Lys Asp Val Gly Val Tyr Ser385                 390                 395                 400Leu Ala Val Ser Leu Ala Ser Ala Ser Val Leu Ala Leu Met Leu Pro

            405                 410                 415Asn Arg Cys Asp Gln Lys Ala Gly Ala Glu

        420                 425<210> 5<211> 1478<212> DNA<213> Klebsiella oxytoca<220><221> CDS<222> (73)…(1353)<400> 5ttgcccgccg ccgctgctca gaccatcgat cttttctatg atgagcgtca cctcactcac    60agaggcaaac ct atg aat agt tca acg aat gca aca aaa cgc tgg tgg tac   111

          Met Asn Ser Ser Thr Asn Ala Thr Lys Arg Trp Trp Tyr

           1               5                   10atc atg cct atc gtg ttt atc acg tat agc ctg gcg tac ctc gac cgc     159Ile Met Pro Ile Val Phe Ile Thr Tyr Ser Leu Ala Tyr Leu Asp Arg

 15                  20                  25gct aac ttc agc ttc gct tcg gcg gcc gga att act gaa gac ctg ggg     207Ala Asn Phe Ser Phe Ala Ser Ala Ala Gly Ile Thr Glu Asp Leu Gly30                  35                  40                  45atc acc aaa ggt atc tcc tcc ctt ctg ggg gcg ctg ttc ttc ctc ggc     255Ile Thr Lys Gly Ile Ser Ser Leu Leu Gly Ala Leu Phe Phe Leu Gly

             50                  55                  60tac ttc ttc ttt cag atc ccc ggc gcg att tat gcc gaa cgc cgc agc    303Tyr Phe Phe Phe Gln Ile Pro Gly Ala Ile Tyr Ala Glu Arg Arg Ser

         65                  70                  75gta cgt aaa gtc att ttc atc tgc ctg atc ctg tgg ggt gcc tgc gcc    351Val Arg Lys Leu Ile Phe Ile Cys Leu Ile Leu Trp Gly Ala Cys Ala

     80                  85                  90tca ctc gac cgg gat ggt gca caa tat tcc cgc gct ggg cgg gcg atc    399Ser Leu Asp Arg Asp Gly Ala Gln Tyr Ser Arg Ala Gly Arg Ala Ile

 95                 100                 105cgc ttt atc ctt ggc gtg gtc gag gcc gca gtc atg ccg gcg atg ctg    447Arg Phe Ile Leu Gly Val Val Gln Ala Ala Val Met Pro Ala Met Leu110                 115                 120                 125ata tac atc agc aac tgg ttt acc aaa tcc gaa cgc tcg cgc gcc aat    495Ile Tyr Ile Ser Asn Trp Phe Thr Lys Ser Gln Arg Ser Arg Ala Asn

            130                 135                 140acc ttc ctg atc ctc ggc aac ccg gtg acg gtg ctg tgg atg tcg gtg    543Thr Phe Leu Ile Leu Gly Asn Pro Val Thr Val Leu Trp Met Ser Val

        145                 150                 155gtc tcc ggc tac ctg att cag gct ttc ggc tgg cgg gag atg ttt att    591Val Ser Gly Tyr Leu Ile Glu Ala Phe Gly Trp Arg Glu Met Phe Ile

    160                 165                 170att gaa ggc gtt ccg gcg gtg att tgg gce ttc tgc tgg tgg gtg ctg    639Ile Glu Gly Val Pro Ala Val Ile Trp Ala Phe Cys Trp Trp Val Leu

175                 180                 185gta aaa gat aaa ccg tct cag gtc aac tgg ctg gcg gaa agc gaa aag    687Val Lys Asp Lys Pro Ser Gln Val Asn Trp Leu Ala Glu Ser Glu Lys190                 195                 200                 205gcc gca ttg cag gag cag ctg gag cgc gaa cag cag ggt atc aaa ccg    735Ala Ala Leu Gln Glu Gln Leu Glu Arg Glu Gln Gln Gly Ile Lys Pro

            210                 215                 220gtg cgc aac tac ggt gag gcc ttc cgc tcg cgt aac gtg gtc ctg ctg    783Val Arg Asn Tyr Gly Glu Ala Phe Arg Ser Arg Asn Val Val Leu Leu

        225                 230                 235tgc atg caa tat ttc gcc tgg agc atc ggg gtl tac ggt ttc gtg ctg    831Cys Met Gln Tyr Phe Ala Trp Ser Ile Gly Val Tyr Gly Phe Val Leu

     240                245                 250tgg ctg ccg tca att atc cgc agc ggc ggc gag aat atg ggc atg gtc    879Trp Leu Pro Ser Ile Ile Arg Ser Gly Gly Gln Asn Met Gly Met Val

255                 260                 265gag gtc ggc tgg ctc tca tcc gtc ccc tac ctg gcg gca acc atc gcc    927Glu Val Gly Trp Leu Ser Ser Val Pro Tyr Leu Ala Ala Thr Ile Ala270                 275                 280                 285atg atc gtg gtc tcc tgg gcc tcc gat aaa atg cag aac cgc aag cta    975Met Ile Val Val Ser Trp Ala Ser Asp Lys Met Gln Asn Arg Lys Leu

            290                 295                 300ttc gtc tgg ccg ctg ctg ctg att gcc gcc ttc gcg ttt att ggc tcc    1023Phe Val Trp Pro Leu Leu Leu Ile Ala Ala Phe Ala Phe Ile Gly Ser

        305                 310                 315tgg gcc gtc ggc gct aac cat ttc tgg gtc tct tat acc ctg ctg gtc    1071Trp Ala Val Gly Ala Asn His Phe Trp Val Ser Tyr Thr Leu Leu Val

    320                 325                 330att gcc ggc gcg gcg atg tac gcc ccc tac ggg ccg ttc ttc gcc atc    1119Ile Ala Gly Ala Ala Met Tyr Ala Pro Tyr Gly Pro Phe Phe Ala Ile

335                 340                 345att ccc gag atg ctg ccg cgt aac gtc gcc ggg ggc gcc atg gcg ctg    1167Ile Pro Glu Met Leu Pro Arg Asn Val Ala Gly Gly Ala Met Ala Leu350                 355                 360                 365att aac agc atg ggc gcg ctg ggt tca ttc ttt ggc tca tgg ttt gtc    1215Ile Asn Ser Met Gly Ala Leu Gly Ser Phe Phe Gly Ser Trp Phe Val

            370                 375                 380ggc tac ctg aac ggc acc acc ggc agc ccg tca gcc tcg tac att ttt    1263Gly Tyr Leu Asn Gly Thr Thr Gly Ser Pro Ser Ala Ser Tyr Ile Phe

        385                 390                 395atg gga gtg gcg ctt ttc gtc tcg gta tgg ctt act ttg att gtt aag    1311Met Gly Val Ala Leu Phe Val Ser Val Trp Leu Thr Leu Ile Val Lys

    400                 405                 410cct gct aat aat caa aaa ctt ccg ctc ggc gca cgt cac gcc            1353Pro Ala Asn Asn Gln Lys Leu Pro Leu Gly Ala Arg His Ala

415                 420                 425tgaaacatta acgcaacgga gaaccgcatg aagccgtcag tcattctcta caaaacgctt  1413cccgacgacc tgcaacaagc gtctggaaca acactttacc gtcacgcagg tgaaaaacct  1473gcgtt                                                              1478<210> 6<211> 427<212> PRT<213> Klebsiella oxytoca<400> 6Met Asn Ser Ser Thr Asn Ala Thr Lys Arg Trp Trp Tyr Ile Met Pro1                5                 10                  15Ile Val Phe Ile Thr Tyr Ser Leu Ala Tyr Leu Asp Arg Ala Asn Phe

        20                  25                  30Ser Phe Ala Ser Ala Ala Gly Ile Thr Glu Asp Leu Gly Ile Thr Lys

    35                  40                  45Gly Ile Ser Ser Leu Leu Gly Ala Leu Phe Phe Leu Gly Tyr Phe Phe

50                  55                  60Phe Gln Ile pro Gly Ala Ile Tyr Ala Glu Arg Arg Ser Val Arg Lys65                  70                  75                  80Leu Ile Phe Ile Cys Leu Ile Leu Trp Gly Ala Cys Ala Ser Leu Asp

            85                  90                  95Arg Asp Gly Ala Gln Tyr Ser Arg Ala Gly Arg Ala Ile Arg Phe Ile

        100                 105                 110Leu Gly Val Val Glu Ala Ala Val Met Pro Ala Met Leu Ile Tyr Ile

    115                 120                 125Ser Asn Trp Phe Thr Lys Ser Glu Arg Ser Arg Ala Asn Thr Phe Leu

130                 135                 140Ile Leu Gly Asn Pro Val Thr Val Leu Trp Met Ser Val Val Ser Gly145                 150                 155                 160Tyr Leu Ile Gln Ala Phe Gly Trp Arg Glu Met Phe Ile Ile Glu Gly

            165                 170                 175Val Pro Ala Val Ile Trp Ala Phe Cys Trp Trp Val Leu Val Lys Asp

        180                 185                 190Lys Pro Ser Gln Val Asn Trp Leu Ala Glu Ser Glu Lys Ala Ala Leu

    195                 200                 205Gln Glu Gln Leu Glu Arg Glu Gln Gln Gly Ile Lys Pro Val Arg Asn

210                 215                 220Tyr Gly Glu Ala Phe Arg Ser Arg Asn Val Val Leu Leu Cys Met Gln225                 230                 235                 240Tyr Phe Ala Trp Ser Ile Gly Val Tyr Gly Phe Val Leu Trp Leu Pro

            245                 250                 255Ser Ile Ile Arg Ser Gly Gly Glu Asn Met Gly Met Val Glu Val Gly

        260                 265                 270Trp Leu Ser Ser Val Pro Tyr Leu Ala Ala Thr Ile Ala Met Ile Val

    275                 280                 285Val Ser Trp Ala Ser Asp Lys Met Gln Asn Arg Lys Leu Phe Val Trp

290                 295                 300Pro Leu Leu Leu Ile Ala Ala Phe Ala Phe Ile Gly Ser Trp Ala Val305                 310                 315                 320Gly Ala Asn His Phe Trp Val Ser Tyr Thr Leu Leu Val Ile Ala Gly

            325                 330                 335Ala Ala Met Tyr Ala Pro Tyr Gly Pro Phe Phe Ala Ile Ile Pro Glu

        340                 345                 350Met Leu Pro Arg Asn Val Ala Gly Gly Ala Met Ala Leu Ile Asn Ser

    355                 360                 365Met Gly Ala Leu Gly Ser Phe Phe Gly Ser Trp Phe Val Gly Tyr Leu

370                 375                 380Asn Gly Thr Thr Gly Ser Pro Ser Ala Ser Tyr Ile Phe Met Gly Val385                 390                 395                 400Ala Leu Phe Val Ser Val Trp Leu Thr Leu Ile Val Lys Pro Ala Asn

            405                 410                 415Asn Gln Lys Leu Pro Leu Gly Ala Arg His Ala

        420                 425<210> 7<211> 1600<212> DNA<213> Pantoea citrea<220><221> CDS<222> (214)...(1521)<400> 7tctgagcttt tcccgacctt atccctgtca gatccctgcc tggttcacga accttgtaac    60acactttctt aacatgccct tacgtgabcc tgatcccaca ctgtcagtgc aaaaacacgt    120tttatagctc ctgataagca cagttcgcag cgcgtaactg cacccgcagg gttctgcttt    180gcgtcaactg acaaaacaga aaggggatat atc atg caa aaa tca cag ccg gga     234

                                 Met Gln Lys Ser Gln pro Gly

                                  1               5acc cgc tgg ttt cgg att att gtg ccg atc ctg ata gcc tgc atc atg      282Thr Arg Trp Phe Arg Ile Ile Val Pro Ile Leu Ile Ala Cys Ile Met

     10                  15                  20tcg ttt atg gat cgg gta aat atc agt ttc gcattg ccg ggc ggt atg       330Ser Phe Met Asp Arg Val Asn Ile Ser Phe Ala Leu Pro Gly Gly Met

 25                  30                  35gag cag gat ctg ctg atg tcc agc cag atg gcc ggg gta gtt agc ggt      378Glu Gln Asp Leu Leu Met Ser Ser Gln Met Ala Gly Val Val Ser Gly40                  45                  50                  55att ttc ttt att ggt tat ctg ttt ttg cag gtt cct ggt ggg cat atc      426Ile Phe Phe Ile Gly Tyr Leu Phe Leu Gln Val Pro Gly Gly His Ile

             60                  65                  70gca gta cgt ggc agt ggt aaa cgt ttt att gcc tgg tcg ctt gtt gcc      474Ala Val Arg Gly Ser Gly Lys Arg Phe Ile Ala Trp Ser Leu Val Ala

         75                  80                  85tgg gcc gtt gtt tct gtc gct acc ggg ttt gtg act cat cag tac cag      522Trp Ala Val Val Ser Val Ala Thr Gly Phe Val Thr His Gln Tyr Gln

     90                  95                 100ctg ttg att tta cgt ttt gca ctg ggg gtc tct gaa ggt ggg atg ttg      570Leu Leu Ile Leu Arg Phe Ala Leu Gly Val Ser Glu Gly Gly Met Leu

105                 110                 115ccg gta gtt ctg aca atg gtc agc aac tgg ttt cct gaa aaa gag ctg      618Pro Val Val Leu Thr Met Val Ser Asn Trp Phe Pro Glu Lys Glu Leu120                 125                 130                 135ggg cgt gct aat gca ttt gtc atg atg ttc gcc ccg ctt ggc gga atg      666Gly Arg Ala Asn Ala Phe Val Met Met Phe Ala Pro Leu Gly Gly Met

            140                 145                 150att acc gcc cct gtc tcc gga tgg att att gca ctg cta gac tgg cgc      714Ile Thr Ala Pro Val Ser Gly Trp Ile Ile Ala Leu Leu Asp Trp Arg

        155                 160                 165tgg tta ttt att atc gaa gga tta ctg tcg gta gtg gtt ctg gca gtc      762Trp Leu Phe Ile Ile Glu Gly Leu Leu Ser Val Val Val Leu Ala Val

    170                 175                 180tgg tgg ctg atg gtc agt gac cgc cct gaa gat gcc cgt tgg ctg ccg    810Trp Trp Leu Met Val Ser Asp Arg Pro Glu Asp Ala Arg Trp Leu Pro

185                 190                 195gca gca gaa cgg gaa tat ctg ctg cgc gaa atg gcc cgt gac aag gcc    858Ala Ala Glu Arg Glu Tyr Leu Leu Arg Glu Met Ala Arg Asp Lys Ala200                 205                 210                 215gag cgg agc aaa ctc cct ccg atc agt cat gct ccc ctg caa gag gtt    906Glu Arg Ser Lys Leu Pro Pro Ile Ser His Ala Pro Leu Gln Glu Val

            220                 225                 230ttc cat aac ccg ggc ctg atg aag tta gtg att ctg aac ttt ttc tat    954Phe His Asn Pro Gly Leu Met Lys Leu Val Ile Leu Asn Phe Phe Tyr

        235                 240                 245cag aca ggt gat tac gga tac act ctg tgg ctg ccg act att atc aaa    1002Gln Thr Gly Asp Tyr Gly Tyr Thr Leu Trp Leu Pro Thr Ile Ile Lys

    250                 255                 260aac ctg acc gga gct agt att ggt aac gtc ggt ttg ctg aca gtg cta    1050Asn Leu Thr Gly Ala Ser Ile Gly Asn Val Gly Leu Leu Thr Val Leu

265                 270                 275cct ttt atc gcg acg tta tca ggg att tat gtc gtc tct tac ctg agc    1098Pro Phe Ile Ala Thr Leu Ser Gly Ile Tyr Val Val Ser Tyr Leu Ser280                 285                 290                 295gat aaa acc ggc aaa cgt cgg caa tgg gtg atg att tct ctg ttc tgt    1146Asp Lys Thr Gly Lys Arg Arg Gln Trp Val Met Ile Ser Leu Phe Cys

            300                 305                 310ttt gcg gcc tgc ctg ttg gcc tca gtc ctg tta cgt gaa ttt gtg ctg    1194Phe Ala Ala Cys Leu Leu Ala Ser Val Leu Leu Arg Glu Phe Val Leu

        315                 320                 325gct gct tat ctg gct ctg gtg gct tgc ggc ttt ttc ctg aaa gca gcc    1242Ala Ala Tyr Leu Ala Leu Val Ala Cys Gly Phe Phe Leu Lys Ala Ala

    330                 335                 340acc agc ccg ttc tgg agt att ccg gga cgt att gca ccg ccg gaa gca    1290Thr Ser Pro phe Trp Ser Ile Pro Gly Arg Ile Ala Pro Pro Glu Ala

345                 350                 355gcc ggt agt gcc cgt ggt gta att aac gga ctg ggg aat ctg ggc ggt    1338Ala Gly Ser Ala Arg Gly Val Ile Asn Gly Leu Gly Asn Leu Gly Gly360                 365                 370                 375ttc tgc ggc ccc tgg ctg gtc gga tta atg atc tac ctg tac gga cag    1386Phe Cys Gly Pro Trp Leu Val Gly Leu Met Ile Tyr Leu Tyr Gly Gln

            380                 385                 390aat gca gcc gtt gtt act ctg gca ggc tct ctg atc att gcc ggg att    1434Asn Ala Ala Val Val Thr Leu Ala Gly Ser Leu Ile Ile Ala Gly Ile

        395                 400                 405att gcg gca tta ctg cca acg cag tgt gat ctg cgc ccg gca gag gca    1482Ile Ala Ala Leu Leu Pro Thr Gln Cys Asp Leu Arg Pro Ala Glu Ala

    410                 415                 420cgg cag cag aat ttc acc cca cgt att cat gat gcc aaa taatactgtc     1531Arg Gln Gln Asn Phe Thr Pro Arg Ile His Asp Ala Lys

425                 430                 435acccggtaac gctgttgccg ggtgcagcct tcacctttca gggcgtattt ttctgataac  1591cccgtgtaa                                                          1600<210> 8<211> 436<212> PRT<213> Pantoea citrea<400> 8Met Gln Lys Ser Gln Pro Gly Thr Arg Trp Phe Arg Ile Ile Val Pro1               5                  10                15Ile Leu Ile Ala Cys Ile Met Ser Phe Met Asp Arg Val Asn Ile Ser

        20                  25                  30Phe Ala Leu pro Gly Gly Met Glu Gln Asp Leu Leu Met Ser Ser Gln

    35                  40                  45Met Ala Gly Val Val Ser Gly Ile Phe Phe Ile Gly Tyr Leu Phe Leu

50                  55                  60Gln Val Pro Gly Gly His Ile Ala Val Arg Gly Ser Gly Lys Arg Phe65                  70                  75                  80Ile Ala Trp Ser Leu Val Ala Trp Ala Val Val Ser Val Ala Thr Gly

            85                  90                  95Phe Val Thr His Gln Tyr Gln Leu Leu Ile Leu Arg Phe Ala Leu Gly

        100                 105                 110Val Ser Glu Gly Gly Met Leu Pro Val Val Leu Thr Met Val Ser Asn

    115                 120                 125Trp Phe Pro Glu Lys Glu Leu Gly Arg Ala Asn Ala Phe Val Met Met

130                 135                 140Phe Ala Pro Leu Gly Gly Met Ile Thr Ala Pro Val Ser Gly Trp Ile145                 150                 155                 160Ile Ala Leu Leu Asp Trp Arg Trp Leu Phe Ile Ile Glu Gly Leu Leu

            165                 170                 175Ser Val Val Val Leu Ala Val Trp Trp Leu Met Val Ser Asp Arg Pro

        180                 185                 190Glu Asp Ala Arg Trp Leu Pro Ala Ala Glu Arg Glu Tyr Leu Leu Arg

    195                 200                 205Glu Met Ala Arg Asp Lys Ala Glu Arg Ser Lys Leu Pro Pro Ile Ser

210                 215                 220His Ala Pro Leu Gln Glu Val phe His Asn Pro Gly Leu Met Lys Leu225                 230                 235                 240Val Ile Leu Asn Phe Phe Tyr Gln Thr Gly Asp Tyr Gly Tyr Thr Leu

            245                 250                 255Trp Leu Pro Thr Ile Ile Lys Asn Leu Thr Gly Ala Ser Ile Gly Asn

260                 265                 270Val Gly Leu Leu Thr Val Leu Pro Phe Ile Ala Thr Leu Ser Gly Ile

    275                 280                 285Tyr Val Val Ser Tyr Leu Ser Asp Lys Thr Gly Lys Arg Arg Gln Trp

290                 295                 300Val Met Ile Ser Leu Phe Cys Phe Ala Ala Cys Leu Leu Ala Ser Val305                 310                 315                 320Leu Leu Arg Glu Phe Val Leu Ala Ala Tyr Leu Ala Leu Val Ala Cys

            325                 330                 335Gly Phe Phe Leu Lys Ala Ala Thr Ser Pro Phe Trp Ser Ile Pro Gly

        340                 345                 350Arg Ile Ala Pro Pro Glu Ala Ala Gly Ser Ala Arg Gly Val Ile Asn

    355                 360                 365Gly Leu Gly Asn Leu Gly Gly Phe Cys Gly Pro Trp Leu Val Gly Leu

370                 375                 380Met Ile Tyr Leu Tyr Gly Gln Asn Ala Ala Val Val Thr Leu Ala Gly385                 390                 395                 400Ser Leu Ile Ile Ala Gly Ile Ile Ala Ala Leu Leu Pro Thr Gln Cys

405                     410                 415Asp Leu Arg Pro Ala Glu Ala Arg Gln Gln Asn Phe Thr Pro Arg Ile

420                 425                 430His Asp Ala Lys

    435<210> 9<211> 1500<212> DNA<213> Pantoea citrea<220><221> CDS<222> (154)...(1440)<400> 9tcagctcagg cctcggattt cgttaacggt catgtcttat ttgtcgacgg cggaatgctg     60gcctcagtataaaatacagg ggcagaccgga atcagagttt gccctgaaga tatcttactg    120gttgcccctt cggcacacac aggatgttcc ccc atg aat aca agc aga aaa ctg     174

                                 Met Asn Thr Ser Arg Lys Leu

                                  1               5ccg gtg aaa cgc tgg tgg tat tta atg ccg gtg att ttt att act tac      222Pro Val Lys Arg Trp Trp Tyr Leu Met Pro Val Ile Phe Ile Thr Tyr

     10                  15                  20agc ctg gca tat ctg gat cgg gcc aac tac ggc ttt gct gct gcc tct      270Ser Leu Ala Tyr Leu Asp Arg Ala Asn Tyr Gly Phe Ala Ala Ala Ser

 25                  30                  35ggg att gaa gca gat ctt gga att agc cgt ggc acc tcc tct ctg att      318Gly Ile Glu Ala Asp Leu Gly Ile Ser Arg Gly Thr Ser Ser Leu Ile40                  45                  50                  55gga gca ctg ttc ttt ctc ggc tac ttc att ttt cag gtg ccc ggg gca      366Gly Ala Leu Phe Phe Leu Gly Tyr Phe Ile Phe Gln Val Pro Gly Ala

             60                  65                  70att tat gca gtg aaa cgc agt gtc cgt aaa ctg gtg ttt acc agc ctg    4l4Ile Tyr Ala Val Lys Arg Ser Val Arg Lys Leu Val Phe Thr Ser Leu

         75                  80                  85ctg ttg tgg gga ttt tgt gcc gct gcg acc gga ctt atc agc aat att    462Leu Leu Trp Gly Phe Cys Ala Ala Ala Thr Gly Leu Ile Ser Asn Ile

     90                  95                 100ccg gct ctg atg gtg atc cgc ttt gtt ctg ggt gtt gtt gaa gcc gca    510Pro Ala Leu Met Val Ile Arg Phe Val Leu Gly Val Val Glu Ala Ala

105                 110                 115gtg atg cca gcg atg ctg att tac atc agc aac tgg ttc acc cgt cag    558Val Met Pro Ala Met Leu Ile Tyr Ile Ser Asn Trp Phe Thr Arg Gln120                 125                 130                 135gaa cgt tca cgg gct aat acc ttt ctg gta tta ggt aac ccg gtc acg    606Glu Arg Ser Arg Ala Asn Thr Phe Leu Val Leu Gly Asn Pro Val Thr

            140                 145                 150gtg tta tgg atg tct att gtt tcc gga tat ctg atc aat gct ttt ggc    654Val Leu Trp Met Ser Ile Val Ser Gly Tyr Leu Ile Asn Ala Phe Gly

        155                 160                 165tgg cgg gaa atg ttt att ttc gag ggt gtg cct gcc tta atc tgg gcc    702Tro Arg Glu Met Phe Ile Phe Glu Gly Val Pro Ala Leu Ile Trp Ala

    170                 175                 180atc ttc tgg tgg ttt att gtc cgg gac aaa ccg gag cag gtg agc tgg    750Ile Phe Trp Trp Phe Ile Val Arg Asp Lys Pro Glu Gln Val Ser Trp

185                 190                 195ctg aca gaa aca gaa aag cag caa ctg gcc agt gca atg gct gaa gag    798Leu Thr Glu Thr Glu Lys Gln Gln Leu Ala Ser Ala Met Ala Glu Glu200                 205                 210                 215cag cag gca ata cca ccg atg cgc aat gtg ccg cag gcc ctg cgt tcc    846Gln Gln Ala Ile Pro Pro Met Arg Asn Val Pro Gln Ala Leu Arg Ser

            220                 225                 230cgc aat gtg gtg gta ctg tgc ctg tta cac gct ctg tgg agc atc gga    894Arg Asn Val Val Val Leu Cys Leu Leu His Ala Leu Trp Ser Ile Gly

        235                 240                 245gtg tat ggt ttt atg atg tgg atg cca tcg ata ctg cgt agc gct gca    942Val Tyr Gly Phe Met Met Trp Met Pro Ser Ile Leu Arg Ser Ala Ala

    250                 255                 260tca atg gac att gtc cgg gta ggc tgg ctg gcc gca gtt ccg tat ctg    990Ser Met Asp Ile Val Arg Val Gly Trp Leu Ala Ala Val Pro Tyr Leu

265                 270                 275gcc gcg att att act atg ctg gtg att tca tgg ctg tca gat aaa acc    1038Ala Ala Ile Ile Thr Met Leu Val Ile Ser Trp Leu Ser Asp Lys Thr280                 285                 290                 295ggg ctg cgt cgg ctt ttt atc tgg cca tta ttg ctg att gcg tca gtt    1086Gly Lau Arg Arg Leu Phe Ile Trp Pro Leu Leu Leu Ile Ala Ser Val

            300                 305                 310act ttt ttt ggg tcc tgg tta ctt ggg agc tac tca ttc tgg ttt tcc    1134Thr Phe Phe Gly Ser Trp Leu Let Gly Ser Tyr Ser Phe Trp Phe Ser

        315                 320                 325tat ggc ttg ctg gta ctg gct gct gct tgt atg tat gcc ccg tat gga    1182Tyr Gly Leu Leu Val Leu Ala Ala Ala Cys Met Tyr Ala Pro Tyr Gly

    330                 335                 340ccg ttt ttt gcg ttg att cct gaa ttg ctg cca aaa aat gtg gcg ggg    1230Pro Phe phe Ala Leu Ile Pro Glu Leu Leu Pro Lys Asn Val Ala Gly

345                 350                 355att tct atc ggg tta att aac tgt tgc ggg gcg ctg gga gct ttt gcc    1278Ile Ser Ile Gly Leu Ile Asn Cys Cys Gly Ala Leu Gly Ala Phe Ala360                 365                 370                 375gga gcc tgg ctg gtg ggc tat ctt aat ggt ctg acc ggt ggt ccg ggg    1326Gly Ala Trp Leu Val Gly Tyr Leu Asn Gly Leu Thr Gly Gly Pro Gly

            380                 385                 390gct tct tac act ttt atg gcc att gca ttg ctg gtt tct gta ggg ttg    1374Ala Ser Tyr Thr Phe Met Ala Ile Ala Leu Leu Val Ser Val Gly Leu

        395                 400                 405gtg ttt ttc ctg aaa gtc cct tca ggg aat ttg gtc act cgt cgg ttg    1422Val Phe Phe Leu Lys Val Pro Ser Gly Asn Leu Val Thr Arg Arg Leu

    410                 415                 420ctg aaa ggt gat gca aag taaaaggaat agcgatgaaa cggaacagga           1470Leu Lys Gly Asp Ala Lys

425tgtctttgca ggatattgcg gacctcgccg                                   1500<210> 10<211> 429<212> PRT<213> Pantoea citrea<400> 10Met Asn Thr Ser Arg Lys Leu Pro Val Lys Arg Trp Trp Tyr Leu Met1               5                  10                  15Pro Val Ile Phe Ile Thr Tyr Ser Leu Ala Tyr Leu Asp Arg Ala Asn

        20                  25                  30Tyr Gly Phe Ala Ala Ala Ser Gly Ile Glu Ala Asp Leu Gly Ile Ser

    35                  40                  45Arg Gly Thr Ser Ser Leu Ile Gly Ala Leu Phe Phe Leu Gly Tyr Phe

50                  55                  60Ile Phe Gln Val Pro Gly Ala Ile Tyr Ala Val Lys Arg Ser Val Arg65                  70                  75                  80Lys Leu Val Phe Thr Ser Leu Leu Leu Trp Gly Phe Cys Ala Ala Ala

            85                  90                  95Thr Gly Leu Ile Ser Asn Ile Pro Ala Leu Met Val Ile Arg Phe Val

        100                 105                 110Leu Gly Val Val Glu Ala Ala Val Met Pro Ala Met Leu Ile Tvr Ile

    115                 120                 125Ser Asn Trp Phe Thr Arg Gln Glu Arg Ser Arg Ala Asn Thr Phe Leu

130                 135                 140Val Leu Gly Asn Pro Val Thr Val Leu Trp Met Ser Ile Val Ser Gly145                 150                 155                 160Tyr Leu Ile Asn Ala phe Gly Trp Arg Glu Met Phe Ile Phe Glu Gly

            165                 170                 175Val Pro Ala Leu Ile Trp Ala Ile Phe Trp Trp Phe Ile Val Arg Asp

        180                 185                 190Lys Pro Glu Gln Val Ser Trp Leu Thr Glu Thr Glu Lys Gln Gln Leu

    195                 200                 205Ala Ser Ala Met Ala Glu Glu Gln Gln Ala Ile Pro Pro Met Arg Asn

210                 215                 220Val Pro Gln Ala Leu Arg Ser Arg Asn Val Val Val Leu Cys Leu Leu225                 230                 235                 240His Ala Leu Trp Ser Ile Gly Val Tyr Gly phe Met Met Trp Met Pro

            245                 250                 255Ser Ile Leu Arg Ser Ala Ala Ser Met Asp Ile Val Arg Val Gly Trp

        260                 265                 270Leu Ala Ala Val Pro Tyr Leu Ala Ala Ile Ile Thr Met Leu Val Ile

    275                 280                 285Ser Trp Leu Ser Asp Lys Thr Gly Leu Arg Arg Leu Phe Ile Trp Pro

290                 295                 300Leu Leu Leu Ile Ala Ser Val Thr Phe Phe Gly Ser Trp Leu Leu Gly305                 310                 315                 320Ser Tyr Ser Phe Trp phe Ser Tyr Gly Leu Leu Val Leu Ala Ala Ala

            325                 330                 335Cys Met Tyr Ala Pro Tyr Gly Pro Phe Phe Ala Leu Ile Pro Glu Leu

        340                 345                 350Leu Pro Lys Asn Val Ala Gly Ile Ser Ile Gly Leu Ile Asn Cys Cys

    355                 360                 365Gly Ala Leu Gly Ala Phe Ala Gly Ala Trp Leu Val Gly Tyr Leu Asn

370                 375                 380Gly Leu Thr Gly Gly Pro Gly Ala Ser Tyr Thr Phe Met Ala Ile Ala385                 390                 395                 400Leu Leu Val Ser Val Gly Leu Val Phe Phe Leu Lys Val Pro Ser Gly

            405                 410                 415Asn Leu Val Thr Arg Arg Leu Leu Lys Gly Asp Ala Lys

        420                 425<210> 11<211> 1500<212> DNA<213> Klebsiella oxytoca<220><221> CDS<222> (70)...(1386)<400> 11ctaaaacaag cacaataata ataatcacct tcatcaccag aatattttta atattacgag     60actataaag atg aat ata acc tct aac tct aca acc aaa gat ata ccg cgc    111

      Met Asn Ile Thr Ser Asn Ser Thr Thr Lys Asp Ile Pro Arg

       1               5                   10cag cgc tgg tta aga atc att ccg cct ata ctg atc act tgt att att      159Gln Arg Trp Leu Arg Ile Ile Pro Pro Ile Leu Ile Thr Cys Ile Ile15                  20                  25                  30tct tat atg gac cgg gtc aat att gcc ttt gcg atg ccc gga ggt atg      207Ser Tyr Met Asp Arg Val Asn Ile Ala Phe Ala Met Pro Gly Gly Met

             35                  40                  45gat gcc gac tta ggt att tcc gcc acc atg gcg ggg ctg gcg ggc ggt      255Asp Ala Asp Leu Gly Ile Ser Ala Thr Met Ala Gly Leu Ala Gly Gly

         50                  55                  60att ttc ttt atc ggt tat cta ttt tta cag gtt ccc ggc ggg aaa att      303Ile Phe Phe Ile Gly Tyr Leu Phe Leu Gln Val Pro Gly Gly Lys Ile

     65                  70                  75gcc gtt cac ggt agc ggt aag aaa ttt atc ggc tgg tcg ctg gtc gcc      351Ala Val His Gly Ser Gly Lys Lys Phe Ile Gly Trp Ser Leu Val Ala

 80                  85                  90tgg gcg gtc atc tcc gtg ctg acg ggg tta att acc aat cag tac cag      399Trp Ala Val Ile Ser Val Leu Thr Gly Leu Ile Thr Asn Gln Tyr Gln95                 100                 105                 110ctg ctg gcc ctg cgc ttc tta ctg ggc gtg gcg gaa ggc ggt atg ctg      447Leu Leu Ala Lau Arg Phe Leu Leu Gly Val Ala Glu Gly Gly Met Leu

            115                 120                 125ccg gtc gtt ctc acg atg atc agt aac tgg ttc ccc gac gct gaa cgc      495Pro Val Val Leu Thr Met Ile Ser Asn Trp Phe Pro Asp Ala Glu Arg

        130                 135                 140ggt cgc gcc aac gcg att gtc att atg ttt gtg ccg att gcc ggg att      543Gly Arg Ala Asn Ala Ile Val Ile Met Phe Val Pro Ile Ala Gly Ile

    145                 150                 155atc acc gcc cca ctc tca ggc tgg att atc acg gtt ctc gac tgg cgc      591Ile Thr Ala Pro Leu Ser Gly Trp Ile Ile Thr Val Leu Asp Trp Arg

160                 165                 170tgg ctg ttt att atc gaa ggt ttg ctc tcg ctg gtt gtt ctg gtt ctg      639Trp Leu Phe Ile Ile Glu Gly Leu Leu Ser Leu Val Val Leu Val Leu175                 180                 185                 190tgg gca tac acc atc tat gac cgt ccg cag gaa gcg cgc tgg att tcc      687Trp Ala Tyr Thr Ile Tyr Asp Arg Pro Gln Glu Ala Arg Trp Ile Ser

            195                 200                 205gaa gca gag aag cgc tat ctg gtc gag acg ctg gcc gcg gag caa aaa      735Glu Ala Glu Lys Arg Tyr Leu Val Glu Thr Leu Ala Ala Glu Gln Lys

        210                 215                 220gcc att gcc ggc acc gag gtg aaa aac gcc tct ctg agc gcc gtt ctc    783Ala Ile Ala Gly Thr Glu Val Lys Asn Ala Ser Leu Ser Ala Val Leu

    225                 230                 235tcc gac aaa acc atg tgg cag ctt atc gcc ctg aac ttc ttc tac cag    831Ser Asp Lys Thr Met Trp Gln Leu Ile Ala Leu Asn Phe Phe Tyr Gln

240                 245                 250acc ggc att tac ggc tac acc ctg tgg cta ccc acc att ctg aaa gaa    879Thr Gly Ile Tyr Gly Tyr Thr Leu Trp Leu Pro Thr Ile Leu Lys Glu255                 260                 265                 270ttg acc cat agc agc atg ggg cag gtc ggc atg ctt gcc att ctg ccg    927Leu Thr His Ser Ser Met Gly Gln Val Gly Met Leu Ala Ile Leu Pro

            275                 280                 285tac gtc ggc gcc att gct ggg atg ttc ctg ttt tcc tcc ctt tca gac    975Tyr Val Gly Ala Ile Ala Gly Met Phe Leu Phe Ser Ser Leu Ser Asp

        290                 295                 300cga acc ggt aaa cgc aag ctg ttc gtc tgc ctg ccg ctg att ggc ttc    1023Arg Thr Gly Lys Arg Lys Leu Phe Val Cys Leu Pro Leu Ile Gly Phe

    305                 310                 315gct ctg tgc atg ttc ctg tcg gtg gcg ctg aaa aac caa att tgg ctc    1071Ala Leu Cys Met Phe Leu Ser Val Ala Leu Lys Asn Gln Ile Trp Leu

320                 325                 330tcc tat gcc gcg ctg gtc ggc tgc gga ttc ttc ctg caa tcg gcg gct    1119Ser Tyr Ala Ala Leu Val Gly Cys Gly Phe Phe Leu Gln Ser Ala Ala335                 340                 345                 350ggc gtg ttc tgg acc atc ccg gca cgt ctg ttc agc gcg gaa atg gcg    1167Gly Val Phe Trp Thr Ile Pro Ala Arg Leu Phe Ser Ala Glu Met Ala

            355                 360                 365ggc ggc gcg cgc ggg gtt atc aac gcg ctt ggc aac ctc ggc gga ttt    1215Gly Gly Ala Arg Gly Val Ile Asn Ala Leu Gly Asn Leu Gly Gly Phe

        370                 375                 380tgt ggc cct tat gcg gtc ggg gtg ctg atc acg ttg tac agc aaa gac    1263Cys Gly Pro Tyr Ala Val Gly Val Leu Ile Thr Leu Tyr Ser Lys Asp

    385                 390                 395gct ggc gtc tat tgc ctg gcg atc tcc ctg gcg ctg gcc gcg ctg atg    1311Ala Gly Val Tyr Cys Leu Ala Ile Ser Leu Ala Leu Ala Ala Leu Met

400                 405                 410gcg ctg ctg ctg ccg gcg aaa tgc gatgcc ggt gct gcg ccg gta aag     1359Ala Leu Leu Leu Pro Ala Lys Cys Asp Ala Gly Ala Ala Pro Val Lys415                 420                 425                 430acg ata aat cca cat aaa cgc act gcg taaactcgag cccggcggcg            1406Thr Ile Asn Pro His Lys Arg Thr Ala

            435ctgcgcctgc cgggcctgcg aaatatgccg ggttcacccg gtaacaatga gatgcgaaag    1466atgagcaaga aacaggcctt ctggctgggt attg                                1500<210> 12<211> 439<212> PRT<213> Klebsiella oxytoca<400> 12Met Asn Ile Thr Ser Asn Ser Thr Thr Lys Asp Ile Pro Arg Gln Arg1               5                  10                  15Trp Leu Arg Ile Ile Pro Pro Ile Leu Ile Thr Cys Ile Ile Ser Tyr

        20                  25                  30Met Asp Arg Val Asn Ile Ala Phe Ala Met Pro Gly Gly Met Asp Ala

    35                  40                  45Asp Leu Gly Ile Ser Ala Thr Met Ala Gly Leu Ala Gly Gly Ile Phe

50                  55                  60Phe Ile Gly Tyr Leu Phe Leu Gln Val Pro Gly Gly Lys Ile Ala Val65                  70                  75                  80His Gly Ser Gly Lys Lys Phe Ile Gly Trp Ser Leu Val Ala Trp Ala

            85                  90                  95Val Ile Ser Val Leu Thr Gly Leu Ile Thr Asn Gln Tyr Gln Leu Leu

        100                 105                 110Ala Leu Arg Phe Leu Leu Gly Val Ala Glu Gly Gly Met Leu Pro Val

    115                 120                 125Val Leu Thr Met Ile Ser Asn Trp Phe Pro Asp Ala Glu Arg Gly Arg

130                 135                 140Ala Asn Ala Ile Val Ile Met Phe Val Pro Ile Ala Gly Ile Ile Thr145                 150                 155                 160Ala Pro Leu Ser Gly Trp Ile Ile Thr Val Leu Asp Trp Arg Trp Leu

            165                 170                 175Phe Ile Ile Glu Gly Leu Leu Ser Leu Val Val Leu Val Leu Trp Ala

        180                 185                 190Tyr Thr Ile Tyr Asp Arg Pro Gln Glu Ala Arg Trp Ile Ser Glu Ala

    195                 200                 205Glu Lys Arg Tyr Leu Val Glu Thr Leu Ala Ala Glu Gln Lys Ala Ile

210                 215                 220Ala Gly Thr Glu Val Lys Asn Ala Ser Leu Ser Ala Val Leu Ser Asp225                 230                 235                 240Lys Thr Met Trp Gln Leu Ile Ala Leu Asn Phe Phe Tyr Gln Thr Gly

            245                 250                 255Ile Tyr Gly Tyr Thr Leu Trp Leu Pro Thr Ile Leu Lys Glu Leu Thr

        260                 265                 270His Ser Ser Met Gly Gln Val Gly Met Leu Ala Ile Leu Pro Tyr Val

    275                 280                 285Gly Ala Ile Ala Gly Met Phe Leu Phe Ser Ser Leu Ser Asp Arg Thr

290                 295                 300Gly Lys Arg Lys Leu Phe Val Cys Leu Pro Leu Ile Gly Phe Ala Leu305                 310                 315                 320Cys Met Phe Leu Ser Val Ala Leu Lys Asn Gln Ile Trp Leu Ser Tyr

            325                 330                 335Ala Ala Leu Val Gly Cys Gly Phe Phe Let Gln Ser Ala Ala Gly Val

        340                 345                 350Phe Trp Thr Ile Pro Ala Arg Leu Phe Ser Ala Glu Met Ala Gly Gly

    355                 360                 365Ala Arg Gly Val Ile Asn Ala Leu Gly Asn Leu Gly Gly Phe Cys Gly

370                 375                 380Pro Tyr Ala Val Gly Val Leu Ile Thr Leu Tyr Ser Lys Asp Ala Gly385                 390                 395                 400Val Tyr Cys Leu Ala Ile Ser Leu Ala Leu Ala Ala Leu Met Ala Leu

            405                 410                 415Leu Leu pro Ala Lys Cys Asp Ala Gly Ala Ala Pro Val Lys Thr Ile

        420                 425                 430Asn Pro His Lys Arg Thr Ala

    435<210> 13<211> 3153<212> DNA<213> 未知<220><223> 环境来源<221> CDS<222> (292)...(1236)<221> CDS<222> (1252)...(2280)<221> CDS<222> (2293)...(3045)<400> 13catgcctgca ggtcgactct agaggatctc gccgcgcctc aggtcgaggg atacactcgt     60cagcgctttc gtgccgccga actccttcga aacggcacga aactccagaa gtttgtccgt    120atccaccccg ctcctcccaa agctttatga ggctatagga tattgatatg gtatcgataa    180cactcctgtc aagaggcggt tttcacgcca ggcgggaggg caaaatagga ctggacaatt    240ccttcaagcg ggatatgtta tcgataacaa atcatcttcc ggaggagagc c atg agc     297

                                                     Met Ser

                                                      1aag atc gat gtg ttg cag gtc ggt ccc tac cct gca tgg gac gag gag      345Lys Ile Asp Val Leu Gln Val Gly Pro Tyr Pro Ala Trp Asp Glu Glu

      5                  10                  15cgc ctg aac gcg acc ttc acg atg cac cgc tat ttc gag gcg gcc gac      393Arg Leu Asn Ala Thr Phe Thr Met His Arg Tyr Phe Glu Ala Ala Asp

 20                  25                  30aag gcg gcg ttt ctg gcc gag cac ggc ggc acg atc cgc ggc atc gcc      441Lys Ala Ala Phe Leu Ala Glu His Gly Gly Thr Ile Arg Gly Ile Ala35                  40                  45                  50acg cgc ggc gag ctt ggt gcc aac cgg gcg atg atc gag gcg ctg ccg      489Thr Arg Gly Glu Leu Gly Ala Asn Arg Ala Met Ile Glu Ala Leu Pro

             55                  60                  65aag ctg gaa gtg atc tcg gtc tac ggc gtc ggc ttc gat gcg gtg gac    537Lys Leu Glu Val Ile Ser Val Tyr Gly Val Gly Phe Asp Ala Val Asp

         70                  75                  80ctt tcg gcg gcc cgc gag cgc ggc atc cgc gtc acc aac acg ccc gac    585Leu Ser Ala Ala Arg Glu Arg Gly Ile Arg Val Thr Asn Thr Pro Asp

     85                  90                  95gtg ctc acc aag gac gtg gcc gat ctc ggc atc gcc atg atg ctg gcg    633Val Leu Thr Lys Asp Val Ala Asp Leu Gly Ile Ala Met Met Leu Ala

100                 105                 110cag gcg cgc ggc gtc atc ggc gga gag gcc tgg gtg aag agc ggc gat    681Gln Ala Arg Gly Val Ile Gly Gly Glu Ala Trp Val Lys Ser Gly Asp115                 120                 125                 130tgg gca agc aag ggt ctc tat ccg ctg aag cgc cgc gta cat ggc atg    729Trp Ala Ser Lys Gly Leu Tyr Pro Leu Lys Arg Arg Val His Gly Met

            135                 140                 145cgc gcc ggg gtg ctc ggc ctc ggc cgc atc ggc tac gag gtg gcc aag    777Arg Ala Gly Val Leu Gly Leu Gly Arg Ile Gly Tyr Glu Val Ala Lys

        150                 155                 160cgc ctt gcc ggc ttc gac atg gac atc gcc tac agc gac acc ggc ccg    825Arg Leu Ala Gly Phe Asp Met Asp Ile Ala Tyr Ser Asp Thr Gly Pro

    165                 170                 175aag gat ttc gcc agg gac tgg acc ttc gtc gcc gat ccg gcg gag ctg    873Lys Asp Phe Ala Arg Asp Trp Thr Phe Val Ala Asp Pro Ala Glu Leu

180                 185                 190gcc gcc cgc tcc gac ttc ctc ttc gtc acg ctc gcc gcc tcc gcc gag    921Ala Ala Arg Ser Asp Phe Leu Phe Val Thr Lau Ala Ala Ser Ala Glu195                 200                 205                 210acg cgc cac atc gtc ggc cgc aag gtc atc gag gcg ctc ggc cct gag    969Thr Arg His Ile Val Gly Arg Lys Val Ile Glu Ala Leu Gly Pro Glu

            215                 220                 225ggc atg ctg atc aac atc tcg cgc gct tcc aac atc gat gas agc gcc    1017Gly Met Leu Ile Asn Ile Ser Arg Ala Ser Asn Ile Asp Glu Ser Ala

        230                 235                 240ctt ctc gac gcg ctg gag acg asg gcg ctc ggc tcg gcc gcg ctc gac    1065Leu Leu Asp Ala Leu Glu Thr Lys Ala Leu Gly Ser Ala Ala Leu Asp

    245                 250                 255gtc ttc gag ggc gag ccg aac ctc aat ccg cgt ttc ctt gcc ctc gac    1113Val Phe Glu Gly Glu Pro Asn Leu Asn Pro Arg Phe Leu Ala Leu Asp

260                 265                 270aac gtc ctc ttg cag ccg cac atg gcc tcc ggc acg atc gag acc cgc    1161Asn Val Leu Leu Gln Pro His Met Ala Ser Gly Thr Ile Glu Thr Arg275                 280                 285                 290aag gcc atg ggc cag ctc gtc ttc gac aac ctg tcg gcc cat ttc gac    1209Lys Ala Met Gly Gln Leu Val Phe Asp Asn Leu Ser Ala His Phe Asp

            295                 300                 305ggc cgg ccg ctg ccg acc ccg gtt ctg taaggagaga ggtcc atg aag gcg   1260Gly Arg Pro Leu Pro Thr Pro Val Leu                  Met Lys Ala

        310                 315atc gtc atc cat cag gcc aag gac ctg cgc gtc gag gac agc gcc gtc    1308Ile Val Ile His Gln Ala Lys Asp Leu Arg Val Glu Asp Ser Ala Val

320                 325                 330gag gcg ccc ggc ccc ggc gag gtg gag atc cgc ctt gcc gcc ggc ggc    1356Glu Ala Pro Gly Pro Gly Glu Val Glu Ile Arg Leu Ala Ala Gly Gly335                 340                 345                 350atc tgc ggc tcg gac ctg cac tac tac aac cac ggc ggc ttc ggc acg    1404Ile Cys Gly Ser Asp Leu His Tyr Tyr Asn His Gly Gly Phe Gly Thr

            355                 360                 365gtg cgc ctc aag gag ccg atg atc ctc ggc cat gag gtt tcc ggc cac    1452Val Arg Leu Lys Glu Pro Met Ile Leu Gly His Glu Val Ser Gly His

        370                 375                 380gtc gcg gcg ctc ggc gaa ggc gtc tcc ggc ctt gcc atc ggc gac ctc    1500Val Ala Ala Leu Gly Glu Gly Val Ser Gly Leu Ala Ile Gly Asp Leu

    385                 390                 395gtc gcc gtc tpg ccc tcg cgg ccc tgc ggg gcg tgc gac tat tgc ctc    1548Val Ala Val Ser Pro Ser Arg Pro Cys Gly Ala Cys Asp Tyr Cys Leu

400                 405                 410aag ggc ttg gcg aac cat tgc ttc aac atg cgc ttc tac ggc tcg gcc    1596Lys Gly Leu Ala Asn His Cys Phe Asn Met Arg Phe Tyr Gly Ser Ala415                 420                 425                 430atg ccc ttc ccg cac atc cag ggc gcg ttc cgc gag cgg ctg gtc gcc    1644Met Pro Phe Pro His Ile Gln Gly Ala Phe Arg Glu Arg Leu Val Ala

            435                 440                 445aRg gcc agc cag tgc gtg aag gct gag ggc ctt tcg gca ggt gaa gcc    1692Lys Ala Ser Gln Cys Val Lys Ala Glu Gly Leu Ser Ala Gly Glu Ala

        450                 455                 460gcg atg gcc gag ccg ctc tcc gtc acg ctt cac gcc acg cgc cgg gcc    1740Ala Met Ala Glu Pro Leu Ser Val Thr Leu His Ala Thr Arg Arg Ala

    465                 470                 475ggc gaa atg ctg ggc aag cgc gtg ctc gtc acc ggc tgc ggg ccg atc    1788Gly Glu Met Leu Gly Lys Arg Val Leu Val Thr Gly Cys Gly Pro Ile

480                 485                 490ggc acc ctg tcg atc ctc gcc gcc cgg cgc gcc ggc gcg gcg gag atc    1836Gly Thr Leu Ser Ile Leu Ala Ala Arg Arg Ala Gly Ala Ala Glu Ile495                 500                 505                 510gtc gcc gct gac ctt tcc gag cgt gca ctc ggc ttt gcc cgc gcc gtc    1884Val Ala Ala Asp Leu Ser Glu Arg Ala Leu Gly Phe Ala Arg Ala Val

            515                 520                 525ggc gcg gac cgc acg gtc aac ctg tcg gaa gac cgc gac ggc ctc gtt    1932Gly Ala Asp Arg Thr Val Asn Leu Ser Glu Asp Arg Asp Gly Leu Val

        530                 535                 540ccg ttc agc gag aac aag gga tat ttc gat gtc ctc tac gaa tgc tcg    1980Pro Phe Ser Glu Asn Lys Gly Tyr Phe Asp Val Leu Tyr Glu Cys Ser

    545                 550                 555ggc gcc cag ccg gcg ctg gtt gcc ggc atc cag gcc ttg cgc ccg cgc    2028Gly Ala Gln Pro Ala Leu Val Ala Gly Ile Gln Ala Leu Arg Pro Arg

560                 565                 570ggc gtc atc gtc cag ctc ggc ctc ggc ggc gag atg agc ctt ccc atg    2076Gly Val Ile Val Gln Leu Gly Leu Gly Gly Glu Met Ser Leu Pro Met575                 580                 585                 590atg gcg atc acc gcc aag gaa ctg gac ctg cgc ggc tcc ttc cgc ttc    2124Met Ala Ile Thr Ala Lys Glu Leu Asp Leu Arg Gly Ser Phe Arg Phe

            595                 600                 605cat gag gaa ttc gcc gtc gcc gtg aag ctg atg cag ggc ggc ctc atc    2172His Glu Glu phe Ala Val Ala Val Lys Leu Met Gln Gly Gly Leu Ile

        610                 615                 620gac gtg aag ccg ctg atc acc cat act ttg ccg ctt gcc gat gcg ctt    2220Asp Val Lys Pro Leu Ile Thr His Thr Leu Pro Leu Ala Asp Ala Leu

    625                 630                 635cag gcc ttc gag atc gcc tcg gac aag ggg caa tcg atg aag act cag    2268Gln Ala Phe Glu Ile Ala Ser Asp Lys Gly Gln Ser Met Lys Thr Gln

640                 645                 650atc gca ttc agt taaggaagag cc atg agc atc cag ctt ttc gac ctc acg  2319Ile Ala Phe Ser               Met Ser Ile Gln Leu Phe Asp Leu Thr655                               660                 665ggc aag cgc gcc ctc gtc acc ggc tcc tcg cag ggt atc ggc tat gcg    2367Gly Lys Arg Ala Leu Val Thr Gly Ser Ser Gln Gly Ile Gly Tyr Ala

    670                 675                 680ctc gcc aag ggc ctt gcc gcc gcc ggc gcg gac atc gtc ctc aac ggc    2415Leu Ala Lys Gly Leu Ala Ala Ala Gly Ala Asp Ile Val Leu Asn Gly

685                 690                 695cgc gac gcg gcc aag ctg gcg gcc gcg gcg cag gaa ctc ggc gca aag    2463Arg Asp Ala Ala Lys Leu Ala Ala Ala Ala Gln Glu Leu Gly Ala Lys700                705                 710                 715cac acg ctc gcc ttc gac gcc acc gac cat gcc gcc gtg cgc gcg gcc    2511His Thr Leu Ala Phe Asp Ala Thr Asp His Ala Ala Val Arg Ala Ala

            720                 725                 730atc gac gcc ttc gag gcg gag gtc ggc ccc atc gac atc ctc gtc aac    2559Ile Asp Ala Phe Glu Ala Glu Val Gly Pro Ile Asp Ile Leu Val Asn

        735                 740                 745aat gcc ggc atg cag cac cgc acg ccg ctg gag gat ttc ccc gcc gat    2607Asn Ala Gly Met Gln His Arg Thr Pro Leu Glu Asp Phe Pro Ala Asp

    750                 755                 760gcc ttc gag cgc atc ctg aag acc aac atc tcg acg gtc ttc aat gtc    2655Ala Phe Glu Arg Ile Leu Lys Thr Asn Ile Ser Thr Val Phe Asn Val

765                 770                 775ggc cag gcc gtc gcg cgc cac atg atc gcg cgc ggc gcg ggc aag atc    2703Gly Gln Ala Val Ala Arg His Met Ile Ala Arg Gly Ala Gly Lys Ile780                 785                 790                 795atc aac atc gcc agc gtg cag acc gcg ctc gcc cgc ccc ggc atc gcg    2751Ile Asn Ile Ala Ser Val Gln Thr Ala Leu Ala Arg Pro Gly Ile Ala

            800                 805                 810ccc tat acc gcc acc aag ggc gcc gtc ggc aac ctc acc aag ggc atg    2799Pro Tyr Thr Ala Thr Lys Gly Ala Val Gly Asn Leu Thr Lys Gly Met

        815                 820                 825gcg acc gac tgg gcg aaa tac ggc ctg caa tgc aac gcc atc gcg ccg    2847Ala Thr Asp Trp Ala Lys Tyr Gly Leu Gln Cys Asn Ala Ile Ala Pro

    830                 835                 840ggc tat ttc gac acg ccg ctc aat gcc gcg ctg gtc gcc gat ccg gcc    2895Gly Tyr Phe Asp Thr Pro Leu Asn Ala Ala Leu Val Ala Asp Pro Ala

845                 850                 855ttt tcc gcc tgg ctg gaa aag cgc acg ccg gcc ggc cgc tgg ggc aag    2943Phe Ser Ala Trp Leu Glu Lys Arg Thr Pro Ala Gly Arg Trp Gly Lys860                 865                 870                 875gtg gag gag ctg atc ggc gcc tgc atc ttt ctt tcc tcc gac gct tcc    2991Val Glu Glu Leu Ile Gly Ala Cys Ile Phe Leu Ser Ser Asp Ala Ser

            880                 885                 890tcc ttc gtg aac gga cac acg ctc tat gtc gac ggc ggc atc acg gcc    3039Ser Phe Val Asn Gly His Thr Leu Tyr Val Asp Gly Gly Ile Thr Ala

        895                 900                 905tcg ctc tgaggacaac aggcgcatcg tcctgatggg cgtcgccggc tgcggcaagt     3095Ser Leuccgccgtcgg cgcggcgctc gccgcgcggc tcggtgcgat ccccgggtac cgagctcg    3153<210> 14<211> 315<212> PRT<213> 未知<220><223> 环境来源<400> 14Met Ser Lys Ile Asp Val Leu Gln Val Gly Pro Tyr Pro Ala Trp Asp1               5                  10                  15Glu Glu Arg Leu Asn Ala Thr Phe Thr Met His Arg Tyr Phe Glu Ala

        20                  25                  30Ala Asp Lys Ala Ala Phe Leu Ala Glu His Gly Gly Thr Ile Arg Gly

    35                  40                  45Ile Ala Thr Arg Gly Glu Leu Gly Ala Asn Arg Ala Met Ile Glu Ala

50                  55                  60Leu Pro Lys Leu Glu Val Ile Ser Val Tyr Gly Val Gly Phe Asp Ala65                  70                  75                  80Val Asp Leu Ser Ala Ala Arg Glu Arg Gly Ile Arg Val Thr Asn Thr

            85                  90                  95Pro Asp Val Leu Thr Lys Asp Val Ala Asp Leu Gly Ile Ala Met Met

        100                 105                 110Leu Ala Gln Ala Arg Gly Val Ile Gly Gly Glu Ala Trp Val Lys Ser

    115                 120                 125Gly Asp Trp Ala Ser Lys Gly Leu Tyr Pro Leu Lys Arg Arg Val His

130                 135                 140Gly Met Arg Ala Gly Val Leu Gly Leu Gly Arg Ile Gly Tyr Glu Val145                 150                 155                 160Ala Lys Arg Leu Ala Gly Phe Asp Met Asp Ile Ala Tyr Ser Asp Thr

            165                 170                 175Gly Pro Lys Asp Phe Ala Arg Asp Trp Thr Phe Val Ala Asp Pro Ala

        180                 185                 190Glu Leu Ala Ala Arg Ser Asp Phe Leu Phe Val Thr Leu Ala Ala Ser

    195                 200                 205Ala Glu Thr Arg His Ile Val Gly Arg Lys Val Ile Glu Ala Leu Gly

210                 215                 220Pro Glu Gly Met Leu Ile Asn Ile Ser Arg Ala Ser Asn Ile Asp Glu225                 230                 235                 240Ser Ala Leu Leu Asp Ala Leu Glu Thr Lys Ala Leu Gly Ser Ala Ala

            245                 250                 255Leu Asp Val Phe Glu Gly Glu Pro Asn Leu Asn Pro Arg Phe Leu Ala

        260                 265                 270Leu Asp Asn Val Leu Leu Gln Pro His Met Ala Ser Gly Thr Ile Glu

    275                 280                 285Thr Arg Lys Ala Met Gly Gln Leu Val Phe Asp Asn Leu Ser Ala His

290                 295                 300Phe Asp Gly Arg Pro Leu Pro Thr Pro Val Leu305                 310                 315<210> 15<211> 343<212> PRT<213> 未知<220><223> 环境来源<400> 15Met Lys Ala Ile Val Ile His Gln Ala Lys Asp Leu Arg Val Glu Asp1               5                  10                  15Ser Ala Val Glu Ala Pro Gly Pro Gly Glu Val Glu Ile Arg Leu Ala

        20                  25                  30Ala Gly Gly Ile Cys Gly Ser Asp Leu His Tyr Tyr Asn His Gly Gly

    35                  40                  45Phe Gly Thr Val Arg Leu Lys Glu Pro Met Ile Leu Gly His Glu Val

50                  55                  60Ser Gly His Val Ala Ala Leu Gly Glu Gly Val Ser Gly Leu Ala Ile65                  70                  75                  80Gly Asp Leu Val Ala Val Ser Pro Ser Arg Pro Cys Gly Ala Cys Asp

            85                  90                  95Tyr Cys Leu Lys Gly Leu Ala Asn His Cys Phe Asn Met Arg Phe Tyr

        100                 105                 110Gly Ser Ala Met Pro Phe Pro His Ile Gln Gly Ala Phe Arg Glu Arg

    115                 120                 125Leu Val Ala Lys Ala Ser Gln Cys Val Lys Ala Glu Gly Leu Ser Ala

130                 135                 140GlV Glu Ala Ala Met Ala Glu Pro Leu Ser Val Thr Leu His Ala Thr145                 150                 155                 160Arg Arg Ala Gly Glu Met Leu Gly Lys Arg Val Leu Val Thr Gly Cys

            165                 170                 175Gly Pro Ile Gly Thr Leu Ser Ile Leu Ala Ala Arg Arg Ala Gly Ala

        180                 185                 190Ala Glu Ile Val Ala Ala Asp Leu Ser Glu Arg Ala Leu Gly Phe Ala

    195                 200                 205Arg Ala Val Gly Ala Asp Arg Thr Val Asn Leu Ser Glu Asp Arg Asp

210                 215                 220Gly Leu Val Pro Phe Ser Glu Asn Lys Gly Tyr Phe Asp Val Leu Tyr225                 230                 235                 240Glu Cys Ser Gly Ala Gln Pro Ala Leu Val Ala Gly Ile Gln Ala Leu

            245                 250                 255Arg Pro Arg Gly Val Ile Val Gln Leu Gly Leu Gly Gly Glu Met Ser

        260                 265                 270Leu Pro Met Met Ala Ile Thr Ala Lys Glu Leu Asp Leu Arg Gly Ser

    275                 280                 285Phe Arg Phe His Glu Glu Phe Ala Val Ala Val Lys Leu Met Gln Gly

290                 295                 300Gly Leu Ile Asp Val Lys Pro Leu Ile Thr His Thr Leu Pro Leu Ala305                 310                 315                 320Asp Ala Leu Gln Ala Phe Glu Ile Ala Ser Asp Lys Gly Gln Ser Met

            325                 330                 335Lys Thr Gln Ile Ala Phe Ser

        340<210> 16<211> 251<212> PRT<213> 未知<220><223> 环境来源<400> 16Met Ser Ile Gln Leu Phe Asp Leu Thr Gly Lys Arg Ala Leu Val Thr1               5                  10                  15Gly Ser Ser Gln Gly Ile Gly Tyr Ala Leu Ala Lys Gly Leu Ala Ala

        20                  25                  30Ala Gly Ala Asp Ile Val Leu Asn Gly Arg Asp Ala Ala Lys Leu Ala

    35                  40                  45Ala Ala Ala Gln Glu Leu Gly Ala Lys His Thr Leu Ala Phe Asp Ala

50                  55                  60Thr Asp His Ala Ala Val Arg Ala Ala Ile Asp Ala Phe Glu Ala Glu65                   70                  75                  80Val Gly Pro Ile Asp Ile Leu Val Asn Asn Ala Gly Met Gln His Arg

            85                  90                  95Thr Pro Leu Glu Asp Phe Pro Ala Asp Ala Phe Glu Arg Ile Leu Lys

        100                 105                 110Thr Asn Ile Ser Thr Val Phe Asn Val Gly Gln Ala Val Ala Arg His

    115                 120                 125Met Ile Ala Arg Gly Ala Gly Lys Ile Ile Asn Ile Ala Ser Val Gln

130                 135                 140Thr Ala Leu Ala Arg Pro Gly Ile Ala Pro Tyr Thr Ala Thr Lys Gly145                 150                 155                 160Ala Val Gly Asn Leu Thr Lys Gly Met Ala Thr Asp Trp Ala Lys Tyr

            165                 170                 175Gly Leu Gln Cys Asn Ala Ile Ala Pro Gly Tyr Phe Asp Thr Pro Leu

        180                 185                 190Asn Ala Ala Leu Val Ala Asp Pro Ala Phe Ser Ala Trp Leu Glu Lys

    195                 200                 205Arg Thr Pro Ala Gly Arg Trp Gly Lys Val Glu Glu Leu Ile Gly Ala

210                 215                 220Cys Ile Phe Leu Ser Ser Asp Ala Ser Ser Phe Val Asn Gly His Thr225                 230                 235                 240Leu Tyr Val Asp Gly Gly Ile Thr Ala Ser Leu

            245                 250<210> 17<211> 32<212> DNA<213> 人工序列<220><223> 合成的构建物<400> 17acccaagctt caccaaaaga gtgaagagga ag<210> 18<211> 34<212> DNA<213> 人工序列<220><223> 合成的构建物<400> 18cgtatctaga aaaatattct ggtgatgaag gtga                                  34<210> 19<211> 34<212> DNA<213> 人工序列<220><223> 合成的构建物<400> 19agactctaga tccacataaa cgcactgcgt aaac                                  34<210> 20<211> 33<212> DNA<213> 人工序列<220><223> 合成的构建物<400> 20gaggggatcc tggcttcgtg aacgatatac tgg                                   33<210> 21<211> 31<212> DNA<213> 人工序列<220><223> 合成的构建物<400> 21aataggatcc ttcatcacca gaatattttt a                                     31<210> 22<211> 28<212> DNA<213> 人工序列<220><223> 合成的构建物<400> 22cataggtacc ggctttcaga taggtgcc                                         28

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号