首页> 中国专利> 细菌光控基因表达系统及其调控基因表达的方法

细菌光控基因表达系统及其调控基因表达的方法

摘要

本发明提供一种细菌光控基因表达系统,包括:a)重组光敏转录因子编码基因,所述重组光敏转录因子包括作为DNA结合结构域的第一多肽和作为光敏结构域的第二多肽;b)靶转录单元,包括被所述第一多肽识别/结合的至少一个反应元件的启动子或启动子‑反应元件或反应元件‑启动子和待转录核酸序列。本发明还提供包含这种光控基因表达系统的细菌表达载体,和用这种光控基因表达系统在细菌中调控基因表达的方法,以及装有所述光控基因表达系统各组分的试剂盒。本发明的细菌光控基因表达系统诱导快速、高效且强,比其他诱导剂安全,毒性小或无毒性;它可在时间和空间上控制基因的表达;可用于调节细菌的生命活动。

著录项

  • 公开/公告号CN113136396A

    专利类型发明专利

  • 公开/公告日2021-07-20

    原文格式PDF

  • 申请/专利权人 华东理工大学;

    申请/专利号CN202010062612.9

  • 发明设计人 杨弋;李写;陈显军;

    申请日2020-01-20

  • 分类号C12N15/70(20060101);C12N15/62(20060101);C12N1/21(20060101);C12R1/19(20060101);

  • 代理机构31218 上海翼胜专利商标事务所(普通合伙);

  • 代理人翟羽

  • 地址 200237 上海市徐汇区梅陇路130号

  • 入库时间 2023-06-19 11:55:48

说明书

技术领域

本发明涉及生物技术中的遗传工程或合成生物学领域,具体地涉及基因表达调控领域更具体地涉及细菌细胞中基于光敏蛋白的光控基因表达系统,及采用该表达系统调控细菌细胞中基因表达的方法。

背景技术

在遗传工程领域,准确控制基因的表达对于研究基因的功能以及生命体的生命活动均具有非常重要的意义。相对于真核细胞复杂的基因表达系统,细菌的基因表达系统则简单很多。以细菌中被使用最广泛的大肠杆菌为例,基因表达的第一步是由RNA聚合酶完成的DNA转录为RNA。大肠杆菌的RNA聚合酶有五个亚基组成,其分子量为约为480Kd,含有α,β,β’,σ等4种不同的多肽,其中α为两个分子,所以全酶(holoenzyme)的组成是α

细菌的基因表达系统主要分为两种,一种是组成型表达,即在不需要诱导的条件下,使目的蛋白自主连续性的表达。另一种是诱导表达系统,在诱导表达系统中,根据诱导物的不同又可分成化学小分子诱导表达系统和物理方法诱导表达系统两种。化学小分子诱导表达系统中,IPTG是最常用的一种诱导剂。IPTG作为乳糖的类似物,是一种极强的诱导剂,它不被细菌代谢且十分稳定。目前最常用的一些表达载体中,多数含T7启动子、Lac启动子、Tac启动子、grac启动子的,其诱导剂均是IPTG。阿拉伯糖和色氨酸诱导表达系统现在也越来越被更多的采用,小分子阿拉伯糖和色氨酸具有对细胞没有毒性且能达到紧密调控等优点。Mn

以上所述细菌诱导表达系统虽已获得较广泛应用,但是仍存在一些缺点:(1)诱导剂本身对细胞有较大的毒性、且价格偏贵(如IPTG),在制备医疗目的的重组蛋白时并不合适;(2)金属离子诱导表达系统中,金属离子感受蛋白识别金属离子的特异性不强,同一家族或同一周期的不同金属离子可被同一感受蛋白结合而激活转录,因此细菌细胞内部坏境中存在的多种金属离子会对转录产生一定的干扰,而且细菌细胞本身的氧化环境会对低价金属离子产生氧化作用,从而干扰对氧化环境要求较高的金属离子的激活转录;(3)温度诱导表达系统中,外界温度的升高会导致大肠杆菌的热休克蛋白激活,一些蛋白酶会影响产物的稳定,很多目的蛋白质在高温下也难以正确折叠,因而UV诱导的囚笼技术可能造成对细胞的不可逆性损伤;(4)最重要的是,化学诱导物只能在时间上调节基因的表达,不能在空间上特异性调控某些细胞及组织的基因表达。

然而,光是一种易于时间和空间操作的诱导物,一般对细胞无上述毒性,且易获取。近些年来,人们也发现了一些生物体内调节生物钟系统中存在光可调节蛋白(也称为光敏蛋白),光照对其功能存在重要的影响。我们设想通过分子设计的方法,改造天然存在的转录因子去合成具有光反应性的人工转录因子,进而在细菌细胞中构建光调控基因表达系统。Anselm Levskaya等在2005年报道了一个基于光敏色素Cph1和大肠杆菌自身EnvZ/OmpR双组分信号通路的光调控蛋白质表达系统[Levskaya,A.等,Nature,2005.438(7067):p.441-2.][2]。在黑暗条件下,光敏转录因子发生自磷酸化后结合到OmpR依赖的ompC启动子上,从而启动目的基因的转录与表达。在红光的照射下,光敏转录因子的自磷酸化作用被抑制,不能结合到ompC启动子,因而不能激活目的基因的转录与表达。随后的几年里,同一研究小组对这种光激活表达系统进行了一些改变,得到可用多种颜色的光共同调节目的蛋白表达的系统[Tabor,J.J.等,J Mol Biol,2011.405(2):p.315-24,Tabor,J.J.等,Cell,2009.137(7):p.1272-81.][3,4]。Keith Moffat课题组开发了另一个新的重组光敏转录因子YF1,它是基于来自枯草芽孢杆菌(Bacillus subtilis)的YtvA蓝光光敏蛋白和来自慢生根瘤菌(Bradyrhizobium japonicum)的FixL蛋白构建而成[Moglich,A.等,J Mol Biol,2009.385(5):p.1433-44,Ohlendorf,R.等,J Mol Biol,2012.416,534-542.][5,6]。基于YF1的光激活基因表达系统在蓝光存在的情况下目的蛋白的表达受到抑制,没有蓝光存在时目的基因则高水平表达。Christopher A Voigt课题组在2017年结合以上的进展设计了一种基因编码系统,使大肠杆菌能够区分红色、绿色和蓝色(RGB)并通过改变基因表达做出响应[Fernandez-Rodriguez J等,Nat Chem Biol,2017.13(7):p.706-708][7]。然而,这些原核基因表达系统都有较大的局限性。基于光敏色素Cph1的系统非常复杂,除了需要光敏转录因子和报告系统外,还需要引入ho1和pcyA两个基因才能将血红素(haem)转化成系统正常工作所必需的藻蓝素(phycocyanobilin),大大增加了构建系统时的工作量。基于光敏转录因子YF1的系统在蓝光照射下依旧有较多的泄漏表达,诱导倍数仅有几十倍,这样就不能对目的基因的表达量进行非常精确的调控。以上所述缺点限制了这两个光激活表达系统在细菌中的使用。

2016年,Jayaraman等人开发了基于EL222的细菌光激活和光抑制基因表达系统,该系统只含EL222单个光控转录因子,当其与启动子-35区上游结合后会通过招募RNA聚合酶其他组分来激活目的基因的转录与表达,激活倍数约为5倍;当转录因子与EL222与启动子的-35和-10区之间的区域结合,目的基因的表达受到抑制,抑制倍数不足3倍。该系统的基因表达系统倍数明显偏低,并没有实际的使用价值。同年,杨弋课题组陈显军等人开发了基于单组份光敏转录因子的大肠杆菌光控基因表达系统LightOff,该系统的诱导倍数可达近10000倍,极低的本底泄漏表达和与T7启动子类似的激活表达水平。该系统具有快速诱导动力学及良好的可逆性,并且对基因表达调控存在光强依赖性。同时还可通过更换VVD突变体来调节系统的可逆性和光灵敏性。为避免细菌内野生型LexA蛋白干扰,将LexA蛋白的DNA结合结构域及其识别的SOS框突变成LexA

综上所述,从2005年至今科学家开发出多个大肠杆菌光控基因表达系统,而这些系统存在着组份复杂、依赖外源辅因子、诱导倍数低、光抑制基因表达等缺点。根据人们的操作习惯,更希望给光之后开启目的基因表达,而不是光抑制基因表达,此外,光激活基因表达系统允许我们能够随时观察研究对象的状态,避免使用光抑制基因表达系统时避光操作的不便,从而广泛用于研究细菌的各种生命活动以及绿色生物制造中。

到目前为止,除了上述系统使用的Cph1和YtvA光敏蛋白外,已知的其它光敏蛋白还有:以黄素类物质为生色团的光敏蛋白(亦称为黄素蛋白家族蓝光受体),分为三类:一是含光-氧-电压(light-oxygen-voltage,LOV)结构域的光受体蛋白,如光敏色素;二是类似光裂解酶的隐花色素(photolyase-like cryptochromes);第三类是近些年来才发现的利用FAD的蓝光蛋白(blue light using FAD,BLUF)。

光敏色素是含LOV结构域的光受体蛋白质最多的一类,研究较多的有phot1、WC-1、WC-2、PYP(光敏黄色蛋白,photoactive yellow protein)、Phy3、VIVID、RsLOV、DsLOV、EL222等。光敏色素通常是膜偶联激酶蛋白,在蓝光照射下发生自磷酸化改变激酶活性而调控相关的生理过程。大多数光敏色素的C端为丝氨酸/苏氨酸激酶结构域N端为结合黄素分子的两个LOV结构域,蓝光照射时LOV结构域与黄素分子共价结合生成黄色-半胱酰胺加成产物引起黄素结合口袋空间构象变化,导致C端激酶结构域改变其激酶活性,但此过程完全可逆。迄今,在真核生物细胞中已建立的最成功的光激活表达系统正是基于VIVID光敏蛋白。Yang课题组[Wang,X.等,Nat Methods,2012.p.266-269.][8]利用粗糙链孢霉菌的VIVID蓝光光敏蛋白经蓝光照射后会形成同源二聚体的原理构建了一个真核光调控基因表达系统。在这个系统中,光敏转录因子由三个或者四个多肽组成,蓝光照射后重组光敏转录因子的二聚化能力发生变化,二聚化的转录因子可结合于靶转录单元核苷酸序列中的反应元件,并通过该融合蛋白的第三多肽的转录激活/阻遏结构域和募集的宿主细胞本身的其它转录辅因子,一起协同作用于该靶转录单元中的启动子,从而调节(启动或阻遏)目的基因的转录和表达。该系统组分简单且具有诱导迅速、诱导倍数高、可逆性好、时间和空间特异性高等优点而被认为是迄今最优秀的真核生物细胞基因表达系统。但遗憾的是,由于细菌和真核生物细胞的转录翻译机理的不同,因此该系统不能应用于细菌中。此外,MasayukiYazawa等[Yazawa,M.等,Nat Biotechnol,2009.27(10):p.941-5.][9]利用拟南芥的FKF1(flavin-binding,kelch repeat,f box 1)与GI(GIGANTEA)蛋白二者经蓝光激发后可发生相互作用的原理也构建了一个真核光调控基因表达系统,但其低诱导倍数和稍显复杂的系统组分大大限制了它的应用。Laura B Motta-Mena等利用含LOV结构域的DNA结合蛋白EL222构建了具有快速激活(<10s)和失活(<50s)动力学特性的光激活基因表达系统

来自拟南芥(Arabidopsis thaliana)的隐花色素是第一个被分离得到的植物蓝光光敏蛋白,研究比较多的有隐花色素1(Cryptochromes 1,CRY1)、隐花色素2(Cryptochromes2,CRY2)、光敏色素A(phytochrome A,phyA)和光敏色素B(phytochrome B,phyB)等,主要功能是接受昼夜节律光调节高等植物的生长和运动。隐花色素的氨基酸序列和生色团组成与光裂解蛋白很相似,多数隐花色素的大小为70kD-80kD,包含相对保守的N端PHR(光裂酶相关)结构域和长度差异较大的C端未知结构域,其PHR结构域可非共价结合黄素。有研究利用拟南芥CRY2(隐花色素2)与CIB1(隐花色素2相互作用的螺旋环螺旋)蛋白二者经蓝光激发后可发生相互作用,构建了一个真核生物细胞内的光激活表达系统[Kennedy,M.J.等,Nat Methods,2010.7(12):p.973-5.][10]。

包含BLUF结构域的蓝光受体蛋白和包含LOV结构域的光受体蛋白与隐花色素不同的是,前者光照激活后不会与黄素生色团反应生成共价产物,而是导致生色团构象变化引起黄色吸收光发生10nm红移。包含BLUF结构域的光受体蛋白研究最多的是AppA,它是球状红杆菌(Rhodobacter sphaeroides)的一种转录抗阻遏蛋白,黑暗时AppA与细胞中的一种PpsR转录因子结合形成AppA-PpsR

Haifeng Ye等人[Ye,H.等,Science,2011.332(6037):p.1565-8.][12]利用黑视素(melanopsin)及细胞内信号通路构建得到一个蓝光激发的真核生物细胞光激活表达系统。黑视素是一种在某些视网膜细胞表面的感光色素。在蓝光存在下,黑视素会触发钙离子快速地涌入细胞内,经过细胞内一系列信号级联反应后,钙调蛋白(calmodulin)激活具有丝氨酸/苏氨酸磷酸酶活性的钙调神经磷酸酶(calcineurin),后者将转录因子NFAT去磷酸化,去磷酸化的NFAT转录因子进入细胞核内与NFAT特异性的启动子结合后启动目的基因的转录与表达。该系统最大的缺点是系统复杂且参与了细胞内的信号通路,因而系统本身稳定性差,并且有可能通过影响细胞的信号通路而影响细胞的正常生命活动。

相对于真核生物细胞,细菌具有增殖快、培养成本低、能够高效表达外源蛋白(甚至可以达到细菌总蛋白量的90%以上)等多种优点,这些优点使得细菌更适合作为大量表达目的蛋白的宿主细胞。然而如上所述,目前已有的广泛用于细菌的基因表达系统大多数采用化学诱导剂调控,虽然其诱导效果较好,背景低、表达强度高,但许多系统具有多效性因而副作用广泛并有潜在的细胞毒性。更为重要的是,化学诱导剂不能在空间上精确调控基因的表达;而物理方法(如温度)调节基因表达的系统目前很少,且温度的升高带来的副作用很多。少数几种基于光敏蛋白的基因表达系统,由于系统本身的复杂性或者诱导倍数低等原因限制了其应用。

综上所述,我们认为有可能综合这些系统的优点在细菌中创造出一种新的更优秀的光控基因表达系统,以克服前人研究的缺陷而广泛用于生物医药研究中。经过潜心研究,发明了一种新型的细菌光控基因表达系统,它具有良好的基因表达调控能力,可以在时间和空间上共同调控基因的表达。

因此,本发明的第一个目的是提供一种新型细菌光控基因表达系统。

本发明的第二个目的是提供用所述光控基因表达系统调节细菌细胞中基因表达的方法。

本发明的第三个目的是提供含有所述光控基因表达系统的细菌表达载体。

本发明的第四个目的是提供所述光控基因表达系统在调节细菌的生命活动(如细菌的移动、分裂等)上的用途。

本发明的第五个目的是提供装有所述细菌光控基因表达系统的表达载体或基因组上整合了所述表达系统中光敏转录因子表达框的细菌菌株的试剂盒。

发明概述

本发明涉及提供一种细菌光控基因表达系统,包括:a)重组光敏转录因子编码基因,所述重组光敏转录因子包括作为DNA结合结构域的第一多肽和作为光敏结构域的第二多肽,其中所述第二多肽选自球形红假单胞菌的LOV结构域RsLOV和海洋玫瑰杆菌的LOV结构域DsLOV及其截短体或氨基酸序列15%-99%相同或氨基酸序列36%-99%相似的突变体;b)靶转录单元,包括被第一多肽识别/结合的包含至少一个反应元件的启动子或启动子-反应元件或反应元件-启动子和待转录核酸序列。

本发明的细菌光控基因表达系统中,重组光敏转录因子是一种重组光敏DNA结合蛋白,在光照前后这种光敏DNA结合蛋白与相应反应元件的结合能力发生显著变化,从而直接启动或者抑制目的基因的转录与翻译。

重组光敏转录因子的第一多肽为DNA结合结构域,它能够特异性地识别反应元件,单独不能够结合到反应元件上或者是结合能力很弱,需要第二多肽来辅助其结合到反应元件。第一多肽与第二多肽之间可操作性连接。

第一多肽可选自螺旋-转角-螺旋DNA结合结构域、锌指基序或锌簇DNA结合结构域、亮氨酸拉链DNA结合结构域、翼状螺旋DNA结合结构域、翼状螺旋-转角-螺旋DNA结合结构域、螺旋-环-螺旋DNA结合结构域、高迁移率族DNA结合结构域、B3 DNA结合结构域。第二多肽为光敏结构域,通常来自以黄素类为生色团的光敏蛋白。第一多肽和第二多肽之间可以直接连接,也可操作性地通过接头肽连接。接头肽的氨基酸个数是可变的(如0-10个或更多)。

第一多肽可进一步选自大肠杆菌LexA

第二多肽选自含黄素类生色团的光敏蛋白的光敏结构域和含LOV结构域的光敏蛋白的光敏结构域。进一步可选自球形红假单胞菌的RsLOV和志贺氏杆菌的DsLOV结构域及其截短体或氨基酸序列15%-99%相同或氨基酸序列36%-99%相似的突变体。

本发明的细菌光控基因表达系统中,靶转录单元中的启动子-待转录核酸序列之间,或者启动子-反应元件-待转录核酸序列之间,或者反应元件-启动子与待转录核酸序列之间均可直接或操作性连接。

所述反应元件为可被第一多肽特异性识别和结合的DNA基序。反应元件选自LexA

所述启动子选自大肠杆菌的colE

按照本发明的细菌光控基因表达系统,重组光敏转录因子还可进一步包含附加的多肽,如可以招募RNA聚合酶其他组分的第三多肽。第三多肽与第一、第二多肽可直接连接或通过接头肽连接。第三肽可选自大肠杆菌的ω因子、α因子或氨基酸序列36%-99%相似的突变体。

本发明还涉及含有本发明的光控基因表达系统的细菌表达载体。所述表达载体可以是单独含有重组光敏转录因子编码基因的细菌表达载体,也可以是单独含有靶转录单元的细菌表达载体,所述靶转录单元中含有启动子但待转录核酸序列空缺或启动子-反应元件但待转录核酸序列空缺或反应元件-启动子但待转录核酸序列空缺。或者,也可以是同时含有重组光敏转录因子编码基因和靶转录单元的细菌表达载体。

所述表达载体中的所述重组光敏转录因子编码基因选自序列22,23,24,25,26,27,28,29,30,31,32,33,34,35,36,37,38,39,40,41,42,43,44,45,46。

本发明还涉及基因组上整合了本发明的光控基因表达系统中光敏转录因子表达框的细菌菌株。

本发明也涉及用本发明的光控基因表达系统在细菌细胞中调控基因表达的方法,包括以下步骤:

a)将所述细菌光控基因表达系统构建在细菌表达载体中;

b)引入含被调控基因的细菌细胞;和

c)光照诱导所述细菌细胞,使细菌细胞中的被调控的核苷酸进行表达。

本发明的在细菌中调控基因表达的方法,涉及光源的选择和照射方法的选择。光源非限制地包括LED灯、白炽灯、荧光灯、激光;照射方法包括光照量、光照时间、光照强度及光照频率的选定。用扫描、投影、光模具等方法在空间上控制目的基因的表达也包含在本发明范围中。

本发明还涉及用本发明的光控基因表达系统来调控细菌生命活动的方法,如移动、分裂等。

本发明还涉及一种试剂盒,该试剂盒装有含本发明光控基因表达系统的细菌(如大肠杆菌)表达载体或基因组上整合了本发明光控基因表达系统中光敏转录因子表达框的细菌菌株,及相应的说明书。本发明试剂盒中的细菌表达载体所包含的靶转录单元中待转录核酸序列可以是空缺的。

发明详述

本发明提供一种基于光敏多肽的、光控的细菌基因表达系统,用于在时间和空间上调节目的基因在细菌细胞中基因的表达。本发明的光控基因表达系统涉及至少两个部分:第一部分是能够在细菌细胞中表达的重组光敏转录因子融合蛋白的编码核苷酸序列,该融合蛋白由两个多肽组成,其中第一多肽是其DNA识别/结合域,第二多肽为光敏多肽;第二部分是由含启动子-待转录核苷酸序列或者启动子-反应元件-待转录核苷酸序列或者反应元件-启动子-待转录核苷酸序列组成的靶转录单元核苷酸序列,其中反应元件是与上述重组光敏转录因子融合蛋白第一多肽所识别/结合的DNA核苷酸序列。第一部分的两个多肽优选采用有关蛋白的截短的功能活性片段(即结构域)。可通过基因工程技术将本发明的光控基因表达系统的第一部分和第二部分构建在一个细菌表达载体中或分别构建在二个细菌表达载体中。在具体使用过程中,利用常规转化的方法将上述的两个组分转化到细菌细胞中去,或者将第一部分利用常规的基因敲除的方法整合到细菌细胞的基因组上去,使之表达本发明的重组光敏转录因子融合蛋白,用适当波长的光照射可导致其第二光敏多肽二聚化能力改变,二聚化的光敏多肽可以结合到本发明第二部分靶转录单元核苷酸序列中的反应元件上去,通过阻碍RNA聚合酶与启动子区域的结合来直接抑制下游目的基因的转录和表达,或者通过招募RNA聚合酶的其他组分到启动子区域来启动下游基因的转录与表达。

本发明提供的这种细菌光控基因表达系统,可利用不会损伤细胞的光照射,在时间上和空间上调节目的蛋白基因在细菌细胞中的表达。

本发明的这种细菌光控基因表达系统,可利用不同的光照强度等光照条件的差异来调节目的蛋白基因在细菌细胞中的表达。

本发明的这种细菌光控基因表达系统,可通过光来诱导一些蛋白的表达来控制细菌的生命活动,如运动、分裂等。所用的光廉价、易于获得、对细胞没有毒性。

“宿主细胞”在本专利中特指细菌细胞,可以是原始的未经改造的细菌细胞,也可以是基因组经过改造的商业化细菌菌株,如实验室常用的TOP10、BL21(DE3)、JM109(DE3)、Mach1等,也可以是在这些商业化菌株的基础上再进行基因组改造的得到的细菌菌株,如本发明中敲除了基因组中ftsz基因得到的TOP10(ftsz

“目的蛋白”也可称为“感兴趣蛋白”,指任何有用的蛋白,例如可用于预防或治疗目的或其他用途的、需要在大肠杆菌细胞中表达的有用生物蛋白质,包括天然的或人工修饰或突变的有用蛋白质。

“报告蛋白”为目的蛋白的一种,指其表达容易被检测的有用蛋白质。为便于检测本发明基于光敏多肽的、光可诱导的目的蛋白基因表达系统的效果,可以选择以下已知的广泛应用的报告蛋白:红色荧光蛋白(mCherry)等。但本发明的光可诱导目的蛋白基因表达系统不限于表达报告蛋白,而可用于表达任何有用的目的蛋白。

“基因”、蛋白质的“编码核苷酸序列”、“待转录核苷酸序列”在本文中含义相同可互换使用,指天然或重组的携带蛋白质氨基酸序列信息密码子的DNA序列。

“目的蛋白基因”、“目的蛋白的编码核苷酸序列”或简称为“目的基因”在本文中含义相同,可互换使用,指编码目的蛋白的基因,通常为脱氧核糖核酸DNA双链序列。这种基因可包含在宿主细胞的基因组DNA序列中或包含在人工构建的表达载体中,如本发明的靶转录单元序列中。同样,“报告基因”指编码报告蛋白的基因。

“转录”在本文中专指细菌细胞中通过RNA聚合酶将目的基因转录产生携带该基因信息的RNA。

“表达”、“目的蛋白基因表达”、“基因表达”在本文中含义相同可互换使用,指目的基因的DNA序列转录产生携带该基因信息的RNA(mRNA或反义RNA)和该RNA携带的信息在核糖体中被翻译产生目的蛋白二者,即转录产生信息RNA和翻译产生目的蛋白都叫做表达。本文包括这二种含义,主要指产生目的蛋白。

“转录调节”本文专门指细菌细胞中基因转录的调节。

“转录因子”或“转录因子融合蛋白”在本文中含义相同可互换使用,指细菌的转录因子,一般情况下是一个蛋白质,可以是天然的或人工改造的或人为融合的,包括能识别/结合靶转录单元核苷酸序列中的反应元件的多肽,通过与靶转录单元中反应元件的结合和相互作用,本身就能或者募集RNA聚合酶其他组分一起调节目的蛋白基因的转录。转录因子视其组成的不同可分为“转录激活因子”或“转录抑制因子”,二者简称“转录因子”。

“靶转录单元”指人造的由含反应元件的启动子和目的基因组成的DNA序列(不是蛋白质),其中反应元件位于启动子序列内部或者位于启动子的-35区的上游或者位于启动子-10区的下游,目的基因位于启动子下游,彼此可直接相连或操作性(即可隔开若干个核苷酸)相连。

“反应元件”指转录因子特异性识别/结合的一个或多个顺式DNA基序,不同的转录因子有与其相对应的不同的反应元件,转录因子包含能与这种DNA基序结合的结合结构域。当转录因子与其相对应的反应元件特异性结合后,该反应元件即向启动子传达反应性,转录因子本身就可以或者通过招募RNA聚合酶的其他组分一起抑制或者激活启动子活性,阻碍或激活下游目的基因转录产生相应的RNA。在本发明中,反应元件指能够与重组光敏转录因子的第一多肽特异性识别/结合的DNA基序,例如LexA

“启动子”指启动和指导其下游目的基因转录产生RNA的DNA序列,它是基因表达不可缺少的重要调控序列。启动子可以是天然基因的启动子或人工修饰的启动子。细菌的启动子是由两段彼此分开且又高度保守的核苷酸序列组成,对mRNA的合成极为重要。在转录起始点上游5~10bp处,有一段由6~8个碱基组成,富含A和T的区域,称为Pribnow盒,又名TATA盒或-10区。来源不同的启动子,Pribnow盒的碱基顺序稍有变化。在距转录起始位点上游35bp处,有一段由10bp组成的区域,称为-35区。转录时大肠杆菌RNA聚合酶识别并结合启动子。-35区与RNA聚合酶σ亚基结合,-10区与RNA聚合酶的核心酶结合,在转录起始位点附近DNA被解旋形成单链,RNA聚合酶使第一和第二核苷酸形成磷酸二酯键,以后在RNA聚合酶作用下向前推进,形成新生的RNA链。

“载体”、“表达载体”、“基因表达载体”、“重组基因表达载体”或“质粒”在本文中含义相同可互换使用,指能在细菌细胞中表达重组目的蛋白的载体。

“转化”指利用化学方法或者物理方法使外源质粒DNA分子进入细菌细胞中。具体的方法可参见Sambrooka等人(分子克隆实验手册,第二版,冷泉港出版社(1989)),和其它有关教材。

本发明的光控细菌基因表达系统中,第一部分的重组光敏转录因子是由两种或三种功能性多肽片段直接通过肽键串联连接或通过短肽接头串联连接形成的融合蛋白。在黑暗条件下,该融合蛋白形成同源二聚体结合于本发明第二部分靶转录单元核苷酸序列的反应元件,并通过其自身或者募集宿主细胞中RNA聚合酶其他组分,一起协同作用于启动子区域,从而阻遏靶转录单元中目的蛋白基因的转录与表达。在适当波长的光照射下,该融合蛋白由二聚体解聚成单体,进而从本发明第二部分靶转录单元核苷酸序列的反应元件上解离下来,从而启动靶转录单元中目的蛋白基因的转录与表达。并通过其自身或者募集宿主细胞中RNA聚合酶其他组分,一起协同作用于启动子区域,从而阻遏或启动靶转录单元中目的蛋白基因的转录与表达。

本文中,“重组光敏转录因子融合蛋白”与“重组光敏转录因子”含义相同,可互换使用。

本发明的重组光敏转录因子含有第一多肽,该多肽虽能特异性识别所述靶转录单元核苷酸序列中的反应元件但不能与其结合或结合能力弱,只有在第二多肽的协助下同源二聚化后方能结合反应元件;该多肽可衍生自任何已知的蛋白质DNA识别/结合结构域,优选氨基酸序列更短的DNA识别/结合结构域,包括天然的和合成的这种DNA识别/结合域或其类似物(如保留了甚至增强了结合能力的结合域突变体或截短体)。可用作本发明的第一多肽选自螺旋-转角-螺旋DNA结合结构域、锌指基序或锌簇DNA结合结构域、亮氨酸拉链DNA结合结构域、翼状螺旋DNA结合结构域、翼状螺旋-转角-螺旋DNA结合结构域、螺旋-环-螺旋DNA结合结构域、高迁移率族DNA结合结构域、B3 DNA结合结构域。第一多肽优选包括但不限于:LexA

LexA蛋白是存在于大肠杆菌细胞内的一种转录抑制因子,能调控细胞内20多种基因的转录,同源二聚化后的LexA二聚体能够识别/结合启动子中的反应元件16个碱基的CTGT(N)

cI蛋白是λ噬菌体cI基因编码的一种转录抑制因子,它可以阻止λ左、λ右两个早期起动子的转录导致不能产生复制及细胞裂解的蛋白。cI蛋白含有236个氨基酸,其N端为DNA识别/结合域(1-102位氨基酸)和C端为二聚化域(132-236位氨基酸)。cI蛋白同源二聚体识别/结合P

Gal4是酿酒酵母(Saccharomyces cerevisiae)菌的转录激活蛋白(其编码基因写成GAL4),能识别/结合基因启动子的上游反应元件-激活基序UAS

448-50.,Marmorstein,R.等,Nature,1992.356(6368):p.408-14.][17,18]。基于GAL4/UAS的双杂交系统是用于研究基因表达的一种有效工具。例如,普洛麦格公司(Promega)公司生产的哺乳动物双杂交系统(CheckMate

TetR阻遏蛋白是存在于很多革兰阴性菌中的一种转录因子,通过结合特定DNA基序抑制相关基因的转录。TetR蛋白的N端为DNA识别/结合域和C端为二聚化域。单体TetR蛋白可形成同质二聚体而识别/结合含有特定DNA序列的操纵子上,单体TetR几乎无结合能力[Wissmann,A.等.,EMBO J 10(13),4145-4152(1991),Ramos,J.L.等.,Microbiol MolBiol Rev 69(2),326-356(2005)][19,20]。

在本发明一优选实施方式中,第一多肽为LexA

本发明的光控基因表达系统中,重组光敏转录因子中的第二多肽是光敏多肽,选自球形红假单胞菌的RsLOV(其氨基酸序列为序列11)和志贺氏杆菌的DsLOV(其氨基酸序列为序列12)结构域。经适当波长光照射后,第二多肽的二聚化能力发生改变,使转录因子的二聚化能力发生变化,二聚化的转录因子结合于相对应的反应元件,从而直接调节目的基因的表达水平。

球形红杆菌的RsLOV蛋白N端和C端的螺旋延伸在其二聚界面处形成一些不寻常的螺旋束,与感觉视紫红质Ⅱ的螺旋转换器有些相似。蓝光激活的RsLOV构象变化,从光明和黑暗晶体结构的比较中揭示了LOV域蛋白的共同信号机制即光激活黄素-半胱氨酰光加合物的形成。加合物的形成破坏了RsLOV活性位点的氢键并促进了LOV结构域核心向N端和C端延伸传播的结构变化。在RsLOV蛋白的活性位点和二聚界面进行单点突变会改变光化产物的寿命并诱导结构的改变从而扰动寡聚物的状态。尺寸排阻色谱法,多角度光散射,小角度X射线散射和交联研究表明RsLOV在黑暗中二聚化,但在光激发下,解离成单体。RsLOV以独特的组合提供作为光控开关用于控制细胞过程的新功能[Conrad,K.S.,等.Biochemistry,2013.52(2):p.378-91][21]。

来自于光和异养的海洋α-变形细菌Dinoroseobacter shibae的DsLOV蛋白表现出平均加合物在20℃时的寿命为9.6s,是目前为止报道的LOV域蛋白恢复时间最快的。对DsLOV的突变分析揭示了在没有蓝光照射下的DsLOV在控制感光色素形成中的独特作用。在1.5埃分辨率下测定的黑暗状态下DsLOV的晶体结构揭示了保守性核心域和一个延伸的N端帽子。晶体结构的二聚体界面形成了一个独特的氢键网,涉及N端残基和β支架的核心区域。光激活的DsLOV结构表明N-帽区域的灵活性增加以及LOV核心结构域的N端和C端末端的β链的Cα主链发生显着变化。DsLOV以独特的光物理特性和调控功能,使其一种新的有前景的模型系统[Endres,S.,等,BMC Microbiol,2015.15:p.30.][22]。

以上所述第二多肽中,RsLOV和DsLOV用适当波长光照射可使由其构成的重组光敏转录因子二聚化减弱,导致其脱离反应元件上,从而开启下游基因的转录;而黑暗时二聚化而结合反应元件,从而抑制下游基因的转录。

本发明的光控基因表达系统中,重组光敏转录因子还可包括第三多肽,该多肽可以招募RNA聚合酶其他组分。可用作本发明的第三多肽包括但不限于:来自大肠杆菌的ω因子结构域和α因子结构域,这两种结构域在先前的大肠杆菌单杂交系统中已广泛被人们采用[Dove,S.L.等,1998.12(5):p.745-54,Dove,S.L.等,Nature,1997.386(6625):p.627-30.][23,24]。第三多肽可与第一、第二多肽直接或通过接头肽相连。

如上所述,重组光敏转录因子所含的两种或三种多肽之间可以有多种选择,将两种或者三种多肽连接成融合蛋白又可以有多种组合选择,本发明优选具有良好活性的两种或者三种多肽的功能结构域片段制备尽可能短的重组转录因子融合蛋白,通过在细菌细胞中选择对目的基因的表达调控效果好的,即光照和黑暗时导致目的基因表达量差异大的该光敏转录因子,以调节目的基因的表达,但不论何种选择与组合,只要能实现本发明所设想的光调控基因表达性能的的重组光敏转录因子,各种组合都包含在本发明的范围内。

本发明的细菌光控基因表达系统中,第二部分靶转录单元由转录因子特异性识别/结合的启动子-待转录核苷酸序列组成,或由启动子-反应元件-待转录核苷酸序列组成,或由反应元件-启动子-待转录核苷酸序列组成。其中启动子或启动子-反应元件或反应元件-启动子的核苷酸序列视不同实施方式所选重组光敏转录因子的第一多肽不同而不同。换言之,必须根据所选择的第一多肽来选择与其相对应的启动子或者启动子-反应元件或者反应元件-启动子序列。例如,第一多肽为LexA

本发明中与光敏转录因子相对应的反应元件一般是包含在启动子核苷酸序列内部,或者位于启动子的-10区下游,光敏转录因子与之结合后通过阻止RNA聚合酶与启动子区域的结合而下调下游目的基因的转录。在本发明具体的实施方式中,启动子是大肠杆菌colE

本领域技术人员知道,所谓“操作性连接”指反应元件与启动子之间或多个反应元件之间不是直接相连而可以隔开若干个核苷酸,只要仍能协同作用即可。

本发明靶转录单元启动子下游是待转录的核苷酸序列,指编码目的蛋白的核苷酸序列。如上所述,目的蛋白可以是目前已知和将来发现的任何有用的蛋白。为了验证本发明系统的效果和便于检测,在本发明的实施例中,采用了示范性的报告蛋白:红色荧光蛋白mCherry(其氨基酸序列为序列21)作为目的蛋白,但本发明的目的蛋白不限于这些报告蛋白。

可用标准重组DNA技术将本发明光控基因表达系统的第一部分和第二部分构建在一个细菌表达载体中或分别构建在二个细菌表达载体中。可用标准技术将这种表达载体引入各种细菌细胞中以表达所需目的蛋白。

本发明提供含有所述两种或者三种多肽各种组合的多种重组光敏转录因子基因的细菌表达载体。在本发明一优选实施方式中,提供含不同LexA

本发明提供含待转录核苷酸序列空缺的靶转录单元的细菌表达载体,待转录的核苷酸序列空缺是让用户可以自行选择所需的待转录的核苷酸序列,例如目的蛋白的编码基因,用标准的重组DNA技术将其插入本发明的这种表达载体中,通过上面所述重组光敏转录因子来调节待转录核苷酸序列(基因)的表达。在本发明的一些实施方式中,细菌表达载体的靶转录单元中空缺的待转录核苷酸序列分别是:LexA

本发明也提供分别转化了各种重组光敏转录因子基因的细菌表达载体或者基因组上整合了各种重组光敏转录因子表达框的细菌菌株,同时提供含有启动子或启动子-反应元件或反应元件-启动子而待转录核苷酸序列空缺的细菌表达载体。用户可用标准重组DNA技术将自行选择的待转录核苷酸序列(目的蛋白基因)插入该表达载体中,然后用该重新构建的载体转化已转化了各种重组光敏转录因子基因的细菌表达载体或者基因组上已整合了各种重组光敏转录因子表达框的细菌菌株,并培养这种细菌细胞表达他们所需的目的基因,或供他们研究如何调节目的基因的表达。

本发明还提供装有各种表达载体或已转化了这种载体或者基因组上整合了各种重组光转录因子表达框的细菌细胞的试剂盒。在一个实施方式中,该试剂盒中一些容器分别装有含一种或多种重组光敏转录因子基因的细菌表达载体。在另一个实施方式中,该试剂盒中的一些容器分别装有含一种或多种重组光敏转录因子基因的细菌表达载体,另一些容器分别装有含靶转录单元(其中启动子-待转录核苷酸序列空缺或启动子-反应元件-待转录核苷酸序列空缺或反应元件-启动子-待转录核苷酸序列空缺)的细菌表达载体。在还有一个实施方式中,该试剂盒中一些容器装有已转化了含重组光敏转录因子基因的细菌表达载体或者基因组上已整合了各种重组光敏转录因子表达框的细菌细胞,另一些容器装有启动子-待转录核苷酸序列空缺或者启动子-反应元件-待转录核苷酸序列空缺或者反应元件-启动子-待转录核苷酸序列空缺的细菌表达载体。本发明的试剂盒还可以包含相应的光照控制设备,例如LED灯及其调控装置。所有试剂盒都装有相应的说明书,以说明盒中的各成分、使用目的和使用方法,并提供有关的参考文献目录。

本发明还包括光控基因表达系统在细菌细胞中调控基因表达的方法,包括步骤:

a)将所述细菌光控基因表达系统构建在细菌表达载体中;

b)引入含被调控基因的细菌细胞;和

c)光照诱导所述细菌细胞,使所述细菌细胞中的被调控的核苷酸进行表达。

光照诱导所述细菌细胞的方法包括光源的选择和光源的使用。光源非限制地包括LED灯、白炽灯、荧光灯、激光。在本发明的一个实施方式中,光源选用蓝色LED(460-470nm)。光照方法包括光照量、光照强度、光照时间、光照频率以及用扫描、投影、光模具等方法在空间上控制目的基因的表达也包含在本发明范围中。在本发明的一个实施方式中,光照强度为0-30mW/cm

附图简要说明

图1光控基因表达系统质粒图谱。

图2以LexA、cI、Gal4和TetR为第一多肽的光敏转录因子的细菌表达载体的构建

图3含DsLOV为第二多肽的光敏转录因子的细菌表达载体的构建

图4以ω因子和α因子为光敏转录因子第三多肽的细菌表达载体的构建

图5分别构建含有LexA、cI、Gal4和TetR相对应反应元件的靶转录单元的细菌表达载体

图6光敏转录因子中不同linker的性质

图7光敏转录因子前不同SD序列的性质

图8对含有SD2、3、7、17和37的光控系统中的光敏转录因子进行Western blot验证。

图9含有SD2、17、37光控系统的光激活动力学

图10含有SD2、17、37光控系统的光依赖性曲线

图11光控系统在空间上对目的基因的表达调控

图12光控系统在不同菌株中的适用性

图13光控大肠杆菌分裂

图14光控大肠杆菌移动

图15利用光控基因表达系统构建基因回路

具体实施方式

以下用实施例对本发明作进一步阐述。这些实施例仅仅用于举例说明,而不对本发明的范围构成任何限制。实施例中主要采用常规的基因工程分子生物学克隆方法,这些方法是本领域普通技术人员所熟知的,例如:简·罗斯凯姆斯等的《分子生物学实验参考手册》和J.萨姆布鲁克,D.W.拉塞尔著,黄培堂等译:《分子克隆实验指南》(第三版,2002年8月,科学出版社出版,北京)中的有关章节。本领域普通技术人员按照以下实施例,不难根据具体情况略作修改和变换而成功实施本发明,这些修改和变换均落在本申请权利要求的范围内。

实施例中所用的pCDFDuet1质粒载体购自Novagen公司,pRSETb、pBAD/His A质粒载体购自Invitrogen公司,pKD3、pKD4、pCP20、pKD46由华东理工大学鲍杰老师实验室慷慨馈赠。所有用于PCR的引物均由上海杰瑞生物工程技术有限公司合成、纯化和经质谱法鉴定正确。实施例中构建的表达质粒都经过序列测定,序列测定由华大基因公司和杰李测序公司完成。各实施例所用的Taq DNA聚合酶购自东盛生物,pfu DNA聚合酶购自天根生化科技(北京)有限公司,PrimeSTAR DNA聚合酶购自TaKaRa公司,三种聚合酶购买时都附带赠送对应聚合酶缓冲液和dNTP。BamHI、BglII、HindIII、NdeI、XhoI、SacI、EcoRI、SpeI等限制性内切酶、T4连接酶、T4磷酸化酶(T4 PNK)购自Fermentas公司,购买时附带有相对应的缓冲液等。实施例中所用的CloneEZ PCR克隆试剂盒(含同源重组酶)购自南京金斯瑞生物科技有限公司(原金思特科技(南京)有限公司)。除非特别声明,无机盐类化学试剂均购自国药集团上海化学试剂公司。卡那霉素(Kanamycin)购自Ameresco公司;氨苄青霉素(Amp)购自Ameresco公司;链霉素购自Ameresco公司;ONPG购自Ameresco公司;384孔发光检测白板、384孔荧光检测黑板购自Grenier公司。

实施例中所用的DNA纯化试剂盒购自BBI公司(加拿大),普通质粒小抽试剂盒购自天根生化科技(北京)有限公司。克隆菌株Mach1购自Invitrogen公司。JM109(DE3)表达菌株购自Promega公司,BL21(DE3)菌株购自Novagen公司。

实施例中用到的主要仪器:Biotek Synergy 2多功能酶标仪(美国Bio-Tek公司),X-15R高速冷冻离心机(美国Beckman公司),Microfuge22R台式高速冷冻离心机(美国Beckman公司),PCR扩增仪(德国Biometra公司),活体成像系统(美国Kodak公司),光度计(日本和光公司),核酸电泳仪(申能博彩公司)。

缩写词意义如下:“h”指小时,“min”指分钟,“s”指秒,“d”指天,“μL”指微升,“ml”指毫升,“L“指升,“bp”指碱基对,“mM”指毫摩尔,“μM”指微摩尔。

20种氨基酸及简称

实施例中用到的常规分子生物学方法

(一)聚合酶链式反应(PCR):

1.目的片段扩增PCR:

扩增步骤(bp表示扩增片段的核苷酸数量):

2.长片段(>2500bp)扩增PCR:

扩增步骤(bp表示扩增片段的核苷酸数量):

或者

(二)核酸内切酶酶切反应:

1.对质粒载体进行双酶切的体系(n代表使体系达到总体积所需要加入的灭菌超纯水μL量):

2.对PCR产物片段进行双酶切的体系(n含义同上):

3.将双酶切后PCR产物片段连接入双酶切后的质粒载体成环的体系:

注:PCR产物片段与载体双酶切产物的质量比大致在2:1—6:1之间。

(三)DNA片段5’端磷酸化反应然后自身环化反应:

从微生物中抽提出的质粒或者基因组末端都含有磷酸基团,而PCR产物没有,故需对PCR产物的5’端碱基进行磷酸基团加成反应,只有末端含有磷酸基团DNA分子才能发生连接反应。自身环化连接反应指线性化载体的3’端和5’端连接反应。

T4 PNK为T4多聚核苷酸激酶的简写,用于对DNA分子的5’端磷酸基团的加成反应。使5’端磷酸化的DNA片段产物自身环化的反应体系:

(四)重叠PCR

重叠PCR是常用的将两段不同或相同的基因连接起来的方法。例如图1,将基因AD和基因BC连接起来,首先设计两对引物A、D和C、B,分别用来扩增基因AD和BC,在引物D和引物C的5’端含有一定长度的互补序列。第一轮PCR得到的扩增产物AD和BC经过回收后作为第二轮PCR的模板。

第二轮按常规PCR流程扩增10轮,PCR体系为:

第二轮PCR后加入引物A和引物B,再继续扩增30轮即可得到AD和BC连接了的序列。

(五)反向PCR

反向PCR是下述实施例中用于定点突变、截短突变、插入突变所用到的一种技术。其基本原理参考Takara公司的MutaBEST试剂盒的实验流程。如图2所示,在对应的变异部位设计反向PCR引物,其中一条引物的5’端包含变异的核苷酸序列。扩增后的产物经过胶回收纯化后,进行5’端磷酸化反应然后自身环化反应,转化入感受态细胞。

(六)感受态细胞的制备与转化

感受态细胞的制备:

1.挑取单菌落(如Mach1)接种于5mL LB培养基中,37℃摇床过夜。

2.取0.5-1ml过夜培养的菌液转种到50mL LB培养基中,37℃,220rpm/min培养3至5h,直到OD

3.冰浴预冷细胞2h。

4.4℃4000rpm/min离心10min。

5.弃上清,用5ml预冷的重悬缓冲液悬浮细胞,待均匀后再加入重悬缓冲液至终体积为50mL。

6.冰浴45min。

7.4℃4000rpm/min离心10min,用5mL冰预冷的储存缓冲液重悬细菌。

8.每个EP管中放100μL菌液,-80℃或液氮冻存。

重悬缓冲液:CaCl

储存缓冲液:0.5mL DMSO、1.9mL 80%甘油、1mL 10×CaCl

1.取100μl感受态细胞于冰浴上融化。

2.加入适当体积的连接产物,轻轻吹打混匀,冰浴30min。通常加入的连接产物的体积少于感受态细胞体积的1/10。

3.将菌液放入42℃水浴中热激90秒,迅速转移至冰浴中放置5min。

4.加入500μl LB,于37℃恒温摇床上200转培养1h。

5.将菌液4000rpm/min离心3min,留200μl上清将菌体吹匀,均匀涂布于含适当抗生素的琼脂平板表面,平板于37℃恒温培养箱内倒置过夜。

(七)大肠杆菌表达的mCherry荧光蛋白的检测

从转化大肠杆菌平板上分别挑取相应的单克隆接种48孔板中培养,每孔的LB为1000μl,每个样品重复6个,37℃培养过夜。按照1:200稀释到另一块每孔含1000μl新鲜LB的48孔板中。如无特殊指明,培养的条件都是37℃,摇床的转速为250rpm,光照强度为3mW/cm

(八)大肠杆菌基因组敲除

1.将pKD46质粒转化将要进行基因敲出的目标菌株中,在含氨苄抗性的培养皿上30℃培养过夜。

2.从平板上挑取单克隆到含5ml新鲜LB和氨苄抗性的LB培养基中培养过夜。

3.将过夜培养的试管菌以1:100的量加入事先配置好的50ml 2xYT培养基中,30℃培养至OD

4.将诱导后的培养基在冰上放置1h,然后于4℃4000rpm离心10min后弃上清,用20ml预冷的ddH

5.吸取10μl用于基因敲除的线性化基因片段到感受态溶液中,混匀后迅速加入到电转杯中,放于电转仪中进行电转,电转结束后立即加入500μl新鲜LB培养基,于37℃复苏培养1-2h。

6.4000rpm离心涂含相应抗性的培养板,37℃培养过夜,第二天进行鉴定。

实施例1光控基因表达系统质粒的构建

LexA

实施例2以LexA、cI、Gal4和TetR为第一多肽的光敏转录因子的细菌表达载体的构建

为了构建以LexA、cI、Gal4和TetR为第一多肽的光诱导转录因子的大肠杆菌表达载体,从质粒pLEVI-mCherry(本实验室收藏,相关文章:Chen,X.等,Cell Research,2016.)中扩增获得LexA,从λ噬菌体基因组中PCR扩增cI(1-102)基因片段,以pBIND质粒(Promega公司)为模板扩增Gal4(1-65)DNA结合结构域基因片段,TetR的DNA结合结构域基因片段(1-63位氨基酸)基因片段由上海捷瑞生物有限公司全基因合成,分别将LexA、cI、Gal4和TetR与RsLOV基因(无锡青兰生物科技有限公司合成)融合构建光敏转录因子,质粒图谱如图2所示。

实施例3含DsLOV为第二多肽的光敏转录因子的细菌表达载体的构建

在无锡青兰生物科技有限公司合成DsLOV基因,利用重叠PCR技术将DsLOV基因分别与实施例1和2中的LexA

实施例4以ω因子和α因子为光敏转录因子第三多肽的细菌表达载体的构建从大肠杆菌BL21(DE3)基因组中扩增ω因子和α因子基因片段,利用重叠PCR技术分别将ω因子和α因子基因片段与实施例1和2中的LexA

实施例5分别构建含有LexA、cI、Gal4和TetR相对应反应元件的靶转录单元的细菌表达载体

从JM109(DE3)菌株的基因组中扩增得到sulA、RecA和umuDC启动子基因片段,采用重叠PCR将sulA、RecA和umuDC启动子基因片段和mCherry基因片段连接在一起,得到三种含LexA相对应反应元件的靶转录单元。经重叠PCR得到P

实施例6含不同linker的转录因子筛选

为了提高光敏转录因子的特性,我们对阻遏蛋白LexA

实施例7光控系统调控动力学的微调

在linker为26R的基础上,通过改变光敏转录因子基因上游的SD序列来调节光敏转录因子的表达量,获得了一系列本底和最大激活水平不同的样品,如图7A,B所示。相对应的SD序列如表7C所示。我们选择含有SD2,3,7,17,37的光控系统检测光敏转录因子的含量。结果表明,光敏转录因子表达水平在这些系统之间存在显著差异。本底较高的光控系统显示出较低的光敏转录因子表达量,而本底较低的光控系统显示出较高的光敏转录因子表达量,如图8所示。推测光敏转录因子的高表达导致同源二聚体的形成与光照无关,即使在光照条件下也抑制了启动子的活性。相反,光敏转录因子的低表达不能形成足够数量的同源二聚体来抑制启动子的活性,从而在黑暗条件下产生较高的背景噪音。因此,可以通过调节转录因子的表达水平来高度调节光控系统的调控能力。

实施例8光控系统的性质

首先研究系统的光激活动力学,将一级菌黑暗培养过夜,二级菌初始OD

进一步检测系统的光强依赖性,将一级菌黑暗培养过夜,二级菌置于不同强度的蓝光下培养15h后检测mCherry表达量。结果如图10所示,分别含有SD2、SD17和SD37的系统表现出的光敏性k值(光激活最大程度一半时的光强)分别为1.312mW/cm

为了研究光敏转录因子在空间上对目的基因表达的调节,以荧光蛋白mCherry作为报告基因。配制含1%琼脂、0.5%蛋白胨、0.25%酵母提取粉和0.5%NaCl的固体培养基,经高温高压灭菌后待冷却至45度左右时,将黑暗下培养的转化有含SD17的系统质粒的大肠杆菌加入到还未凝固的固体培养基中混合均匀,然后倾倒平板。在平板的底部粘贴具有一定图案的打印膜片来控制接受光照的区域,调节光照强度,将平板倒置培养,培养约15h后使用天能成像仪对平板成像。成像结果如图11所示,平板中目的基因的表达与打印膜片图案相一致,荧光成像结果图片上白色区域表示报告基因表达量高,黑色区域表示报告基因表达量很低,并对成像结果中报告基因表达量进行定量分析,结果表明光控基因表达系统可以在空间上精确调控目的基因表达。

为了检测光控基因表达系统在不同菌株中的适用性,将含有SD17的系统质粒转化到实验室常用的菌株中,转化的平板于黑暗中培养过夜,在红光下挑取单克隆到48孔板中于黑暗条件下培养过夜作为一级菌,然后二级接菌初始OD

实施例9光控大肠杆菌分裂

构建FtsZ基因敲除的TOP10菌株和含有SD17并且FtsZ作为报告基因的光控质粒。将构建成功的质粒转化到敲除FtsZ的TOP10菌株中,在合适光强的蓝光下培养平板,然后挑取单克隆到试管中光照培养至OD

实施例10光控大肠杆菌移动

检测光控系统对大肠杆菌移动的调节,构建含有SD2并且报告基因是CheZ的光控质粒,配制含1%Trptone、0.5%NaCl和0.25%Agar的半固体培养基,经高温高压灭菌后,待冷却到50度以下时加入相应的抗性混匀,在培养皿中倒板,室温下放置1h待其冷却。将构建的光控质粒转化到敲除CheZ基因的JM109(DE3,ΔsulA,ΔLexA,ΔcheZ)菌种(本实验室收藏,相关文章:Chen,X.等,Cell Research,2016.)中,一级于黑暗条件下培养,第二天按照1:200的比例稀释到新鲜培养基中继续黑暗培养。待OD

实施例11利用光控基因表达系统构建基因回路

利用蓝光和阿拉伯糖作为双输入信号构建N-IMPLY逻辑门,构建含有SD2并且报告基因是cI(氨基酸序列为55)的光控质粒,光控阻遏蛋白cI的表达,LasI的表达由阿拉伯糖诱导,在报告质粒中PR启动子控制LasR表达,PlasI启动子控制目的基因mCherry表达。光照条件下cI表达,抑制LasR的表达,导致PlasI启动子不能启动下游基因表达,因此在N-IMPLY逻辑门中只要输入蓝光信号,目的基因mCherry就不会表达。在黑暗条件下,阻遏蛋白cI不表达,启动子PR启动LasR的转录,加入阿拉伯糖诱导LasI蛋白表达,合成信号分子AHL(3OC12HSL),信号分子AHL结合并激活LasR蛋白,LasR-AHL的复合物结合到启动子PlasI中的转录调控区,从而启动报告基因mCherry的表达,如图15所示。

应该理解,在实施例或实验材料方法中所显示的成分用量、反应条件等数字或是本说明书所使用的其它参数均为近似值(除非特别注明),可根据所需要获得的结果而加以改变。并且,这些参数并非用来限定本发明保护范围,而是应用正常的操作技术下所得到的较佳数据。除非另行定义,文中所使用的所有专业与科学用语术与本领域技术人员所熟悉的意义相同。此外,任何与所记载内容相似或均等的方法及材料及均可以应用于本发明中。文中本说明书中所述的较佳实验方法与材料仅作为示范之用。本说明书提及的所有文献都全文引入作为参考。此外应该理解,在阅读了本发明的上述内容后,本领域的技术人员可以对本发明作各种改动或修改,这些等价形式同样落在本申请所附权利要求书所限定的范围内。

序列表

<110> 华东理工大学

<120> 细菌光控基因表达系统及其调控基因表达的方法

<130> 2020.1.19

<160> 55

<170> SIPOSequenceListing 1.0

<210> 1

<211> 87

<212> PRT

<213> Synthetic Sequence

<400> 1

Met Lys Ala Leu Thr Ala Arg Gln Gln Glu Val Phe Asp Leu Ile Arg

1 5 10 15

Asp His Ile Ser Gln Thr Gly Met Pro Pro Thr Arg Ala Glu Ile Ala

20 25 30

Gln Arg Leu Gly Phe Arg Ser Ala Ser Ser Ala Glu Glu His Leu Lys

35 40 45

Ala Leu Ala Arg Lys Gly Val Ile Glu Ile Val Ser Gly Ala Ser Arg

50 55 60

Gly Ile Arg Leu Leu Gln Glu Glu Glu Glu Gly Leu Pro Leu Val Gly

65 70 75 80

Arg Val Ala Ala Gly Glu Pro

85

<210> 2

<211> 87

<212> PRT

<213> Synthetic Sequence

<400> 2

Met Lys Ala Leu Thr Ala Arg Gln Gln Glu Val Phe Asp Leu Ile Arg

1 5 10 15

Asp His Ile Ser Gln Thr Gly Met Pro Pro Thr Arg Ala Glu Ile Ala

20 25 30

Gln Arg Leu Gly Phe Arg Ser Pro Asn Ala Ala Glu Glu His Leu Lys

35 40 45

Ala Leu Ala Arg Lys Gly Val Ile Glu Ile Val Ser Gly Ala Ser Arg

50 55 60

Gly Ile Arg Leu Leu Gln Glu Glu Glu Glu Gly Leu Pro Leu Val Gly

65 70 75 80

Arg Val Ala Ala Gly Glu Pro

85

<210> 3

<211> 102

<212> PRT

<213> Synthetic Sequence

<400> 3

Met Ser Thr Lys Lys Lys Pro Leu Thr Gln Glu Gln Leu Glu Asp Ala

1 5 10 15

Arg Arg Leu Lys Ala Ile Tyr Glu Lys Lys Lys Asn Glu Leu Gly Leu

20 25 30

Ser Gln Glu Ser Val Ala Asp Lys Met Gly Met Gly Gln Ser Gly Val

35 40 45

Gly Ala Leu Phe Asn Gly Ile Asn Ala Leu Asn Ala Tyr Asn Ala Ala

50 55 60

Leu Leu Ala Lys Ile Leu Lys Val Ser Val Glu Glu Phe Ser Pro Ser

65 70 75 80

Ile Ala Arg Glu Ile Tyr Glu Met Tyr Glu Ala Val Ser Met Gln Pro

85 90 95

Ser Leu Arg Ser Glu Tyr

100

<210> 4

<211> 65

<212> PRT

<213> Synthetic Sequence

<400> 4

Met Lys Leu Leu Ser Ser Ile Glu Gln Ala Cys Asp Ile Cys Arg Leu

1 5 10 15

Lys Lys Leu Lys Cys Ser Lys Glu Lys Pro Lys Cys Ala Lys Cys Leu

20 25 30

Lys Asn Asn Trp Glu Cys Arg Tyr Ser Pro Lys Thr Lys Arg Ser Pro

35 40 45

Leu Thr Arg Ala His Leu Thr Glu Val Glu Ser Arg Leu Glu Arg Leu

50 55 60

Glu

65

<210> 5

<211> 63

<212> PRT

<213> Synthetic Sequence

<400> 5

Met Ser Arg Leu Asp Lys Ser Lys Val Ile Asn Ser Ala Leu Glu Leu

1 5 10 15

Leu Asn Glu Val Gly Ile Glu Gly Leu Thr Thr Arg Lys Leu Ala Gln

20 25 30

Lys Leu Gly Val Glu Gln Pro Thr Leu Tyr Trp His Val Lys Asn Lys

35 40 45

Arg Ala Leu Leu Asp Ala Leu Ala Ile Glu Met Leu Asp Arg His

50 55 60

<210> 6

<211> 16

<212> DNA

<213> Synthetic Sequence

<220>

<221> misc_feature

<222> (5)..(12)

<223> n is a, c, g, or t

<400> 6

ccgtnnnnnn nnacgg 16

<210> 7

<211> 16

<212> DNA

<213> Synthetic Sequence

<220>

<221> misc_feature

<222> (5)..(12)

<223> n is a, c, g, or t

<400> 7

ctgtnnnnnn nnacag 16

<210> 8

<211> 64

<212> DNA

<213> Synthetic Sequence

<400> 8

tatcaccgca agggataaat atctaacacc gtgcgtgttg actattttac ctctggcggt 60

gata 64

<210> 9

<211> 19

<212> DNA

<213> Synthetic Sequence

<220>

<221> misc_feature

<222> (5)..(6)

<223> n is a, c, g, or t

<220>

<221> misc_feature

<222> (10)..(10)

<223> n is a, c, g, or t

<220>

<221> misc_feature

<222> (12)..(12)

<223> n is a, c, g, or t

<220>

<221> misc_feature

<222> (14)..(14)

<223> n is a, c, g, or t

<220>

<221> misc_feature

<222> (16)..(16)

<223> n is a, c, g, or t

<400> 9

cggrnnrcyn ynyncnccg 19

<210> 10

<211> 19

<212> DNA

<213> Synthetic Sequence

<400> 10

tccctatcag tgatagaga 19

<210> 11

<211> 178

<212> PRT

<213> Synthetic Sequence

<400> 11

Met Ala Met Asp Gln Lys Gln Phe Glu Lys Ile Arg Ala Val Phe Asp

1 5 10 15

Arg Ser Gly Val Ala Leu Thr Leu Val Asp Met Ser Leu Pro Glu Gln

20 25 30

Pro Leu Val Leu Ala Asn Pro Pro Phe Leu Arg Met Thr Gly Tyr Thr

35 40 45

Glu Gly Gln Ile Leu Gly Phe Asn Cys Arg Phe Leu Gln Arg Gly Asp

50 55 60

Glu Asn Ala Gln Ala Arg Ala Asp Ile Arg Asp Ala Leu Lys Leu Gly

65 70 75 80

Arg Glu Leu Gln Val Val Leu Arg Asn Tyr Arg Ala Asn Asp Glu Pro

85 90 95

Phe Asp Asn Leu Leu Phe Leu His Pro Val Gly Gly Arg Pro Asp Ala

100 105 110

Pro Asp Tyr Phe Leu Gly Ser Gln Phe Glu Leu Gly Arg Ser Gly Asn

115 120 125

Ser Glu Glu Ala Ala Ala Ala Gly His Ala Gly Ala Leu Thr Gly Glu

130 135 140

Leu Ala Arg Ile Gly Thr Val Ala Ala Arg Leu Glu Met Asp Ser Arg

145 150 155 160

Arg His Leu Ala Gln Ala Ala Ala Ala Leu Val Arg Ala Trp Glu Arg

165 170 175

Arg Gly

<210> 12

<211> 146

<212> PRT

<213> Synthetic Sequence

<400> 12

Met Arg Arg His Tyr Arg Asp Leu Ile Arg Asn Thr Pro Met Pro Asp

1 5 10 15

Thr Pro Gln Asp Ile Ala Asp Leu Arg Ala Leu Leu Asp Glu Asp Glu

20 25 30

Ala Glu Met Ser Val Val Phe Ser Asp Pro Ser Gln Pro Asp Asn Pro

35 40 45

Thr Ile Tyr Val Ser Asp Ala Phe Leu Val Gln Thr Gly Tyr Thr Leu

50 55 60

Glu Glu Val Leu Gly Arg Asn Cys Arg Phe Leu Gln Gly Pro Asp Thr

65 70 75 80

Asn Pro His Ala Val Glu Ala Ile Arg Gln Gly Leu Lys Ala Glu Thr

85 90 95

Arg Phe Thr Ile Asp Ile Leu Asn Tyr Arg Lys Asp Gly Ser Ala Phe

100 105 110

Val Asn Arg Leu Arg Ile Arg Pro Ile Tyr Asp Pro Glu Gly Asn Leu

115 120 125

Met Phe Phe Ala Gly Ala Gln Asn Pro Val Leu Glu His His His His

130 135 140

His His

145

<210> 13

<211> 152

<212> DNA

<213> Synthetic Sequence

<400> 13

tgtttttttg atcgttttca caaaaatgga agtccacagt cttgacaggg aaaatgcagc 60

ggcgtagctt ttatgccgta tataaaaacg gcgtttatat gtacggtatt tatttttaac 120

ttattgtttt aaaagtcaaa gaggatttta ta 152

<210> 14

<211> 152

<212> DNA

<213> Synthetic Sequence

<400> 14

tgtttttttg atcgttttca caaaaatgga agtccacagt cttgacaggg aaaatgcagc 60

ggcgtagctt ttatgctgta tataaaacca gtggttatat gtacagtatt tatttttaac 120

ttattgtttt aaaagtcaaa gaggatttta ta 152

<210> 15

<211> 71

<212> DNA

<213> Synthetic Sequence

<400> 15

atagggttga tctttgttgt cactggatgt actgtacatc catacagtaa ctcacagggg 60

ctggattgat t 71

<210> 16

<211> 100

<212> DNA

<213> Synthetic Sequence

<400> 16

caatttctac aaaacacttg atactgtatg agcatacagt ataattgctt caacagaaca 60

tattgactat ccggtattac ccggcatgac aggagtaaaa 100

<210> 17

<211> 100

<212> DNA

<213> Synthetic Sequence

<400> 17

gcctatgcag cgacaaatat tgatagcctg aatcagtatt gatctgctgg caagaacaga 60

ctactgtata taaaaacagt ataacttcag gcagattatt 100

<210> 18

<211> 74

<212> DNA

<213> Synthetic Sequence

<400> 18

tatctaacac cgtgcgtgtt gactatttta cctctggcgg tgataatggt tgcatgtact 60

aaggaggtac tagt 74

<210> 19

<211> 81

<212> DNA

<213> synthetic sequence

<400> 19

ttaatacgac tcactatagg gagaccacaa cggtttccct ctagaaataa ttttgtttaa 60

ctttaagaag gagatataca t 81

<210> 20

<211> 47

<212> DNA

<213> Synthetic Sequence

<400> 20

ttatcacttg aaattggaag ggagattctt tattataaga attgtgg 47

<210> 21

<211> 236

<212> PRT

<213> Synthetic Sequence

<400> 21

Met Val Ser Lys Gly Glu Glu Asp Asn Met Ala Ile Ile Lys Glu Phe

1 5 10 15

Met Arg Phe Lys Val His Met Glu Gly Ser Val Asn Gly His Glu Phe

20 25 30

Glu Ile Glu Gly Glu Gly Glu Gly Arg Pro Tyr Glu Gly Thr Gln Thr

35 40 45

Ala Lys Leu Lys Val Thr Lys Gly Gly Pro Leu Pro Phe Ala Trp Asp

50 55 60

Ile Leu Ser Pro Gln Phe Met Tyr Gly Ser Lys Ala Tyr Val Lys His

65 70 75 80

Pro Ala Asp Ile Pro Asp Tyr Leu Lys Leu Ser Phe Pro Glu Gly Phe

85 90 95

Lys Trp Glu Arg Val Met Asn Phe Glu Asp Gly Gly Val Val Thr Val

100 105 110

Thr Gln Asp Ser Ser Leu Gln Asp Gly Glu Phe Ile Tyr Lys Val Lys

115 120 125

Leu Arg Gly Thr Asn Phe Pro Ser Asp Gly Pro Val Met Gln Lys Lys

130 135 140

Thr Met Gly Trp Glu Ala Ser Ser Glu Arg Met Tyr Pro Glu Asp Gly

145 150 155 160

Ala Leu Lys Gly Glu Ile Lys Gln Arg Leu Lys Leu Lys Asp Gly Gly

165 170 175

His Tyr Asp Ala Glu Val Lys Thr Thr Tyr Lys Ala Lys Lys Pro Val

180 185 190

Gln Leu Pro Gly Ala Tyr Asn Val Asn Ile Lys Leu Asp Ile Thr Ser

195 200 205

His Asn Glu Asp Tyr Thr Ile Val Glu Gln Tyr Glu Arg Ala Glu Gly

210 215 220

Arg His Ser Thr Gly Gly Met Asp Glu Leu Tyr Lys

225 230 235

<210> 22

<211> 265

<212> PRT

<213> Synthetic Sequence

<400> 22

Met Lys Ala Leu Thr Ala Arg Gln Gln Glu Val Phe Asp Leu Ile Arg

1 5 10 15

Asp His Ile Ser Gln Thr Gly Met Pro Pro Thr Arg Ala Glu Ile Ala

20 25 30

Gln Arg Leu Gly Phe Arg Ser Ala Ser Ser Ala Glu Glu His Leu Lys

35 40 45

Ala Leu Ala Arg Lys Gly Val Ile Glu Ile Val Ser Gly Ala Ser Arg

50 55 60

Gly Ile Arg Leu Leu Gln Glu Glu Glu Glu Gly Leu Pro Leu Val Gly

65 70 75 80

Arg Val Ala Ala Gly Glu Pro Met Ala Met Asp Gln Lys Gln Phe Glu

85 90 95

Lys Ile Arg Ala Val Phe Asp Arg Ser Gly Val Ala Leu Thr Leu Val

100 105 110

Asp Met Ser Leu Pro Glu Gln Pro Leu Val Leu Ala Asn Pro Pro Phe

115 120 125

Leu Arg Met Thr Gly Tyr Thr Glu Gly Gln Ile Leu Gly Phe Asn Cys

130 135 140

Arg Phe Leu Gln Arg Gly Asp Glu Asn Ala Gln Ala Arg Ala Asp Ile

145 150 155 160

Arg Asp Ala Leu Lys Leu Gly Arg Glu Leu Gln Val Val Leu Arg Asn

165 170 175

Tyr Arg Ala Asn Asp Glu Pro Phe Asp Asn Leu Leu Phe Leu His Pro

180 185 190

Val Gly Gly Arg Pro Asp Ala Pro Asp Tyr Phe Leu Gly Ser Gln Phe

195 200 205

Glu Leu Gly Arg Ser Gly Asn Ser Glu Glu Ala Ala Ala Ala Gly His

210 215 220

Ala Gly Ala Leu Thr Gly Glu Leu Ala Arg Ile Gly Thr Val Ala Ala

225 230 235 240

Arg Leu Glu Met Asp Ser Arg Arg His Leu Ala Gln Ala Ala Ala Ala

245 250 255

Leu Val Arg Ala Trp Glu Arg Arg Gly

260 265

<210> 23

<211> 267

<212> PRT

<213> Synthetic Sequence

<400> 23

Met Lys Ala Leu Thr Ala Arg Gln Gln Glu Val Phe Asp Leu Ile Arg

1 5 10 15

Asp His Ile Ser Gln Thr Gly Met Pro Pro Thr Arg Ala Glu Ile Ala

20 25 30

Gln Arg Leu Gly Phe Arg Ser Ala Ser Ser Ala Glu Glu His Leu Lys

35 40 45

Ala Leu Ala Arg Lys Gly Val Ile Glu Ile Val Ser Gly Ala Ser Arg

50 55 60

Gly Ile Arg Leu Leu Gln Glu Glu Glu Glu Gly Leu Pro Leu Val Gly

65 70 75 80

Arg Val Ala Ala Gly Glu Pro Val Phe Met Ala Met Asp Gln Lys Gln

85 90 95

Phe Glu Lys Ile Arg Ala Val Phe Asp Arg Ser Gly Val Ala Leu Thr

100 105 110

Leu Val Asp Met Ser Leu Pro Glu Gln Pro Leu Val Leu Ala Asn Pro

115 120 125

Pro Phe Leu Arg Met Thr Gly Tyr Thr Glu Gly Gln Ile Leu Gly Phe

130 135 140

Asn Cys Arg Phe Leu Gln Arg Gly Asp Glu Asn Ala Gln Ala Arg Ala

145 150 155 160

Asp Ile Arg Asp Ala Leu Lys Leu Gly Arg Glu Leu Gln Val Val Leu

165 170 175

Arg Asn Tyr Arg Ala Asn Asp Glu Pro Phe Asp Asn Leu Leu Phe Leu

180 185 190

His Pro Val Gly Gly Arg Pro Asp Ala Pro Asp Tyr Phe Leu Gly Ser

195 200 205

Gln Phe Glu Leu Gly Arg Ser Gly Asn Ser Glu Glu Ala Ala Ala Ala

210 215 220

Gly His Ala Gly Ala Leu Thr Gly Glu Leu Ala Arg Ile Gly Thr Val

225 230 235 240

Ala Ala Arg Leu Glu Met Asp Ser Arg Arg His Leu Ala Gln Ala Ala

245 250 255

Ala Ala Leu Val Arg Ala Trp Glu Arg Arg Gly

260 265

<210> 24

<211> 267

<212> PRT

<213> Synthetic Sequence

<400> 24

Met Lys Ala Leu Thr Ala Arg Gln Gln Glu Val Phe Asp Leu Ile Arg

1 5 10 15

Asp His Ile Ser Gln Thr Gly Met Pro Pro Thr Arg Ala Glu Ile Ala

20 25 30

Gln Arg Leu Gly Phe Arg Ser Ala Ser Ser Ala Glu Glu His Leu Lys

35 40 45

Ala Leu Ala Arg Lys Gly Val Ile Glu Ile Val Ser Gly Ala Ser Arg

50 55 60

Gly Ile Arg Leu Leu Gln Glu Glu Glu Glu Gly Leu Pro Leu Val Gly

65 70 75 80

Arg Val Ala Ala Gly Glu Pro Asn Tyr Met Ala Met Asp Gln Lys Gln

85 90 95

Phe Glu Lys Ile Arg Ala Val Phe Asp Arg Ser Gly Val Ala Leu Thr

100 105 110

Leu Val Asp Met Ser Leu Pro Glu Gln Pro Leu Val Leu Ala Asn Pro

115 120 125

Pro Phe Leu Arg Met Thr Gly Tyr Thr Glu Gly Gln Ile Leu Gly Phe

130 135 140

Asn Cys Arg Phe Leu Gln Arg Gly Asp Glu Asn Ala Gln Ala Arg Ala

145 150 155 160

Asp Ile Arg Asp Ala Leu Lys Leu Gly Arg Glu Leu Gln Val Val Leu

165 170 175

Arg Asn Tyr Arg Ala Asn Asp Glu Pro Phe Asp Asn Leu Leu Phe Leu

180 185 190

His Pro Val Gly Gly Arg Pro Asp Ala Pro Asp Tyr Phe Leu Gly Ser

195 200 205

Gln Phe Glu Leu Gly Arg Ser Gly Asn Ser Glu Glu Ala Ala Ala Ala

210 215 220

Gly His Ala Gly Ala Leu Thr Gly Glu Leu Ala Arg Ile Gly Thr Val

225 230 235 240

Ala Ala Arg Leu Glu Met Asp Ser Arg Arg His Leu Ala Gln Ala Ala

245 250 255

Ala Ala Leu Val Arg Ala Trp Glu Arg Arg Gly

260 265

<210> 25

<211> 267

<212> PRT

<213> Synthetic Sequence

<400> 25

Met Lys Ala Leu Thr Ala Arg Gln Gln Glu Val Phe Asp Leu Ile Arg

1 5 10 15

Asp His Ile Ser Gln Thr Gly Met Pro Pro Thr Arg Ala Glu Ile Ala

20 25 30

Gln Arg Leu Gly Phe Arg Ser Ala Ser Ser Ala Glu Glu His Leu Lys

35 40 45

Ala Leu Ala Arg Lys Gly Val Ile Glu Ile Val Ser Gly Ala Ser Arg

50 55 60

Gly Ile Arg Leu Leu Gln Glu Glu Glu Glu Gly Leu Pro Leu Val Gly

65 70 75 80

Arg Val Ala Ala Gly Glu Pro Lys Pro Met Ala Met Asp Gln Lys Gln

85 90 95

Phe Glu Lys Ile Arg Ala Val Phe Asp Arg Ser Gly Val Ala Leu Thr

100 105 110

Leu Val Asp Met Ser Leu Pro Glu Gln Pro Leu Val Leu Ala Asn Pro

115 120 125

Pro Phe Leu Arg Met Thr Gly Tyr Thr Glu Gly Gln Ile Leu Gly Phe

130 135 140

Asn Cys Arg Phe Leu Gln Arg Gly Asp Glu Asn Ala Gln Ala Arg Ala

145 150 155 160

Asp Ile Arg Asp Ala Leu Lys Leu Gly Arg Glu Leu Gln Val Val Leu

165 170 175

Arg Asn Tyr Arg Ala Asn Asp Glu Pro Phe Asp Asn Leu Leu Phe Leu

180 185 190

His Pro Val Gly Gly Arg Pro Asp Ala Pro Asp Tyr Phe Leu Gly Ser

195 200 205

Gln Phe Glu Leu Gly Arg Ser Gly Asn Ser Glu Glu Ala Ala Ala Ala

210 215 220

Gly His Ala Gly Ala Leu Thr Gly Glu Leu Ala Arg Ile Gly Thr Val

225 230 235 240

Ala Ala Arg Leu Glu Met Asp Ser Arg Arg His Leu Ala Gln Ala Ala

245 250 255

Ala Ala Leu Val Arg Ala Trp Glu Arg Arg Gly

260 265

<210> 26

<211> 267

<212> PRT

<213> Synthetic Sequence

<400> 26

Met Lys Ala Leu Thr Ala Arg Gln Gln Glu Val Phe Asp Leu Ile Arg

1 5 10 15

Asp His Ile Ser Gln Thr Gly Met Pro Pro Thr Arg Ala Glu Ile Ala

20 25 30

Gln Arg Leu Gly Phe Arg Ser Ala Ser Ser Ala Glu Glu His Leu Lys

35 40 45

Ala Leu Ala Arg Lys Gly Val Ile Glu Ile Val Ser Gly Ala Ser Arg

50 55 60

Gly Ile Arg Leu Leu Gln Glu Glu Glu Glu Gly Leu Pro Leu Val Gly

65 70 75 80

Arg Val Ala Ala Gly Glu Pro Lys Val Met Ala Met Asp Gln Lys Gln

85 90 95

Phe Glu Lys Ile Arg Ala Val Phe Asp Arg Ser Gly Val Ala Leu Thr

100 105 110

Leu Val Asp Met Ser Leu Pro Glu Gln Pro Leu Val Leu Ala Asn Pro

115 120 125

Pro Phe Leu Arg Met Thr Gly Tyr Thr Glu Gly Gln Ile Leu Gly Phe

130 135 140

Asn Cys Arg Phe Leu Gln Arg Gly Asp Glu Asn Ala Gln Ala Arg Ala

145 150 155 160

Asp Ile Arg Asp Ala Leu Lys Leu Gly Arg Glu Leu Gln Val Val Leu

165 170 175

Arg Asn Tyr Arg Ala Asn Asp Glu Pro Phe Asp Asn Leu Leu Phe Leu

180 185 190

His Pro Val Gly Gly Arg Pro Asp Ala Pro Asp Tyr Phe Leu Gly Ser

195 200 205

Gln Phe Glu Leu Gly Arg Ser Gly Asn Ser Glu Glu Ala Ala Ala Ala

210 215 220

Gly His Ala Gly Ala Leu Thr Gly Glu Leu Ala Arg Ile Gly Thr Val

225 230 235 240

Ala Ala Arg Leu Glu Met Asp Ser Arg Arg His Leu Ala Gln Ala Ala

245 250 255

Ala Ala Leu Val Arg Ala Trp Glu Arg Arg Gly

260 265

<210> 27

<211> 268

<212> PRT

<213> Synthetic Sequence

<400> 27

Met Lys Ala Leu Thr Ala Arg Gln Gln Glu Val Phe Asp Leu Ile Arg

1 5 10 15

Asp His Ile Ser Gln Thr Gly Met Pro Pro Thr Arg Ala Glu Ile Ala

20 25 30

Gln Arg Leu Gly Phe Arg Ser Ala Ser Ser Ala Glu Glu His Leu Lys

35 40 45

Ala Leu Ala Arg Lys Gly Val Ile Glu Ile Val Ser Gly Ala Ser Arg

50 55 60

Gly Ile Arg Leu Leu Gln Glu Glu Glu Glu Gly Leu Pro Leu Val Gly

65 70 75 80

Arg Val Ala Ala Gly Glu Pro Cys Val Thr Met Ala Met Asp Gln Lys

85 90 95

Gln Phe Glu Lys Ile Arg Ala Val Phe Asp Arg Ser Gly Val Ala Leu

100 105 110

Thr Leu Val Asp Met Ser Leu Pro Glu Gln Pro Leu Val Leu Ala Asn

115 120 125

Pro Pro Phe Leu Arg Met Thr Gly Tyr Thr Glu Gly Gln Ile Leu Gly

130 135 140

Phe Asn Cys Arg Phe Leu Gln Arg Gly Asp Glu Asn Ala Gln Ala Arg

145 150 155 160

Ala Asp Ile Arg Asp Ala Leu Lys Leu Gly Arg Glu Leu Gln Val Val

165 170 175

Leu Arg Asn Tyr Arg Ala Asn Asp Glu Pro Phe Asp Asn Leu Leu Phe

180 185 190

Leu His Pro Val Gly Gly Arg Pro Asp Ala Pro Asp Tyr Phe Leu Gly

195 200 205

Ser Gln Phe Glu Leu Gly Arg Ser Gly Asn Ser Glu Glu Ala Ala Ala

210 215 220

Ala Gly His Ala Gly Ala Leu Thr Gly Glu Leu Ala Arg Ile Gly Thr

225 230 235 240

Val Ala Ala Arg Leu Glu Met Asp Ser Arg Arg His Leu Ala Gln Ala

245 250 255

Ala Ala Ala Leu Val Arg Ala Trp Glu Arg Arg Gly

260 265

<210> 28

<211> 269

<212> PRT

<213> Synthetic Sequence

<400> 28

Met Lys Ala Leu Thr Ala Arg Gln Gln Glu Val Phe Asp Leu Ile Arg

1 5 10 15

Asp His Ile Ser Gln Thr Gly Met Pro Pro Thr Arg Ala Glu Ile Ala

20 25 30

Gln Arg Leu Gly Phe Arg Ser Ala Ser Ser Ala Glu Glu His Leu Lys

35 40 45

Ala Leu Ala Arg Lys Gly Val Ile Glu Ile Val Ser Gly Ala Ser Arg

50 55 60

Gly Ile Arg Leu Leu Gln Glu Glu Glu Glu Gly Leu Pro Leu Val Gly

65 70 75 80

Arg Val Ala Ala Gly Glu Pro Thr Gln Val Tyr Met Ala Met Asp Gln

85 90 95

Lys Gln Phe Glu Lys Ile Arg Ala Val Phe Asp Arg Ser Gly Val Ala

100 105 110

Leu Thr Leu Val Asp Met Ser Leu Pro Glu Gln Pro Leu Val Leu Ala

115 120 125

Asn Pro Pro Phe Leu Arg Met Thr Gly Tyr Thr Glu Gly Gln Ile Leu

130 135 140

Gly Phe Asn Cys Arg Phe Leu Gln Arg Gly Asp Glu Asn Ala Gln Ala

145 150 155 160

Arg Ala Asp Ile Arg Asp Ala Leu Lys Leu Gly Arg Glu Leu Gln Val

165 170 175

Val Leu Arg Asn Tyr Arg Ala Asn Asp Glu Pro Phe Asp Asn Leu Leu

180 185 190

Phe Leu His Pro Val Gly Gly Arg Pro Asp Ala Pro Asp Tyr Phe Leu

195 200 205

Gly Ser Gln Phe Glu Leu Gly Arg Ser Gly Asn Ser Glu Glu Ala Ala

210 215 220

Ala Ala Gly His Ala Gly Ala Leu Thr Gly Glu Leu Ala Arg Ile Gly

225 230 235 240

Thr Val Ala Ala Arg Leu Glu Met Asp Ser Arg Arg His Leu Ala Gln

245 250 255

Ala Ala Ala Ala Leu Val Arg Ala Trp Glu Arg Arg Gly

260 265

<210> 29

<211> 269

<212> PRT

<213> Synthetic Sequence

<400> 29

Met Lys Ala Leu Thr Ala Arg Gln Gln Glu Val Phe Asp Leu Ile Arg

1 5 10 15

Asp His Ile Ser Gln Thr Gly Met Pro Pro Thr Arg Ala Glu Ile Ala

20 25 30

Gln Arg Leu Gly Phe Arg Ser Ala Ser Ser Ala Glu Glu His Leu Lys

35 40 45

Ala Leu Ala Arg Lys Gly Val Ile Glu Ile Val Ser Gly Ala Ser Arg

50 55 60

Gly Ile Arg Leu Leu Gln Glu Glu Glu Glu Gly Leu Pro Leu Val Gly

65 70 75 80

Arg Val Ala Ala Gly Glu Pro Leu Trp Thr Ser Met Ala Met Asp Gln

85 90 95

Lys Gln Phe Glu Lys Ile Arg Ala Val Phe Asp Arg Ser Gly Val Ala

100 105 110

Leu Thr Leu Val Asp Met Ser Leu Pro Glu Gln Pro Leu Val Leu Ala

115 120 125

Asn Pro Pro Phe Leu Arg Met Thr Gly Tyr Thr Glu Gly Gln Ile Leu

130 135 140

Gly Phe Asn Cys Arg Phe Leu Gln Arg Gly Asp Glu Asn Ala Gln Ala

145 150 155 160

Arg Ala Asp Ile Arg Asp Ala Leu Lys Leu Gly Arg Glu Leu Gln Val

165 170 175

Val Leu Arg Asn Tyr Arg Ala Asn Asp Glu Pro Phe Asp Asn Leu Leu

180 185 190

Phe Leu His Pro Val Gly Gly Arg Pro Asp Ala Pro Asp Tyr Phe Leu

195 200 205

Gly Ser Gln Phe Glu Leu Gly Arg Ser Gly Asn Ser Glu Glu Ala Ala

210 215 220

Ala Ala Gly His Ala Gly Ala Leu Thr Gly Glu Leu Ala Arg Ile Gly

225 230 235 240

Thr Val Ala Ala Arg Leu Glu Met Asp Ser Arg Arg His Leu Ala Gln

245 250 255

Ala Ala Ala Ala Leu Val Arg Ala Trp Glu Arg Arg Gly

260 265

<210> 30

<211> 269

<212> PRT

<213> Synthetic Sequence

<400> 30

Met Lys Ala Leu Thr Ala Arg Gln Gln Glu Val Phe Asp Leu Ile Arg

1 5 10 15

Asp His Ile Ser Gln Thr Gly Met Pro Pro Thr Arg Ala Glu Ile Ala

20 25 30

Gln Arg Leu Gly Phe Arg Ser Ala Ser Ser Ala Glu Glu His Leu Lys

35 40 45

Ala Leu Ala Arg Lys Gly Val Ile Glu Ile Val Ser Gly Ala Ser Arg

50 55 60

Gly Ile Arg Leu Leu Gln Glu Glu Glu Glu Gly Leu Pro Leu Val Gly

65 70 75 80

Arg Val Ala Ala Gly Glu Pro Gln Arg Tyr Ser Met Ala Met Asp Gln

85 90 95

Lys Gln Phe Glu Lys Ile Arg Ala Val Phe Asp Arg Ser Gly Val Ala

100 105 110

Leu Thr Leu Val Asp Met Ser Leu Pro Glu Gln Pro Leu Val Leu Ala

115 120 125

Asn Pro Pro Phe Leu Arg Met Thr Gly Tyr Thr Glu Gly Gln Ile Leu

130 135 140

Gly Phe Asn Cys Arg Phe Leu Gln Arg Gly Asp Glu Asn Ala Gln Ala

145 150 155 160

Arg Ala Asp Ile Arg Asp Ala Leu Lys Leu Gly Arg Glu Leu Gln Val

165 170 175

Val Leu Arg Asn Tyr Arg Ala Asn Asp Glu Pro Phe Asp Asn Leu Leu

180 185 190

Phe Leu His Pro Val Gly Gly Arg Pro Asp Ala Pro Asp Tyr Phe Leu

195 200 205

Gly Ser Gln Phe Glu Leu Gly Arg Ser Gly Asn Ser Glu Glu Ala Ala

210 215 220

Ala Ala Gly His Ala Gly Ala Leu Thr Gly Glu Leu Ala Arg Ile Gly

225 230 235 240

Thr Val Ala Ala Arg Leu Glu Met Asp Ser Arg Arg His Leu Ala Gln

245 250 255

Ala Ala Ala Ala Leu Val Arg Ala Trp Glu Arg Arg Gly

260 265

<210> 31

<211> 268

<212> PRT

<213> Synthetic Sequence

<400> 31

Met Lys Ala Leu Thr Ala Arg Gln Gln Glu Val Phe Asp Leu Ile Arg

1 5 10 15

Asp His Ile Ser Gln Thr Gly Met Pro Pro Thr Arg Ala Glu Ile Ala

20 25 30

Gln Arg Leu Gly Phe Arg Ser Ala Ser Ser Ala Glu Glu His Leu Lys

35 40 45

Ala Leu Ala Arg Lys Gly Val Ile Glu Ile Val Ser Gly Ala Ser Arg

50 55 60

Gly Ile Arg Leu Leu Gln Glu Glu Glu Glu Gly Leu Pro Leu Val Gly

65 70 75 80

Arg Val Ala Ala Gly Glu Pro Ile Val Asp Met Ala Met Asp Gln Lys

85 90 95

Gln Phe Glu Lys Ile Arg Ala Val Phe Asp Arg Ser Gly Val Ala Leu

100 105 110

Thr Leu Val Asp Met Ser Leu Pro Glu Gln Pro Leu Val Leu Ala Asn

115 120 125

Pro Pro Phe Leu Arg Met Thr Gly Tyr Thr Glu Gly Gln Ile Leu Gly

130 135 140

Phe Asn Cys Arg Phe Leu Gln Arg Gly Asp Glu Asn Ala Gln Ala Arg

145 150 155 160

Ala Asp Ile Arg Asp Ala Leu Lys Leu Gly Arg Glu Leu Gln Val Val

165 170 175

Leu Arg Asn Tyr Arg Ala Asn Asp Glu Pro Phe Asp Asn Leu Leu Phe

180 185 190

Leu His Pro Val Gly Gly Arg Pro Asp Ala Pro Asp Tyr Phe Leu Gly

195 200 205

Ser Gln Phe Glu Leu Gly Arg Ser Gly Asn Ser Glu Glu Ala Ala Ala

210 215 220

Ala Gly His Ala Gly Ala Leu Thr Gly Glu Leu Ala Arg Ile Gly Thr

225 230 235 240

Val Ala Ala Arg Leu Glu Met Asp Ser Arg Arg His Leu Ala Gln Ala

245 250 255

Ala Ala Ala Leu Val Arg Ala Trp Glu Arg Arg Gly

260 265

<210> 32

<211> 233

<212> PRT

<213> Synthetic Sequence

<400> 32

Met Lys Ala Leu Thr Ala Arg Gln Gln Glu Val Phe Asp Leu Ile Arg

1 5 10 15

Asp His Ile Ser Gln Thr Gly Met Pro Pro Thr Arg Ala Glu Ile Ala

20 25 30

Gln Arg Leu Gly Phe Arg Ser Ala Ser Ser Ala Glu Glu His Leu Lys

35 40 45

Ala Leu Ala Arg Lys Gly Val Ile Glu Ile Val Ser Gly Ala Ser Arg

50 55 60

Gly Ile Arg Leu Leu Gln Glu Glu Glu Glu Gly Leu Pro Leu Val Gly

65 70 75 80

Arg Val Ala Ala Gly Glu Pro Met Arg Arg His Tyr Arg Asp Leu Ile

85 90 95

Arg Asn Thr Pro Met Pro Asp Thr Pro Gln Asp Ile Ala Asp Leu Arg

100 105 110

Ala Leu Leu Asp Glu Asp Glu Ala Glu Met Ser Val Val Phe Ser Asp

115 120 125

Pro Ser Gln Pro Asp Asn Pro Thr Ile Tyr Val Ser Asp Ala Phe Leu

130 135 140

Val Gln Thr Gly Tyr Thr Leu Glu Glu Val Leu Gly Arg Asn Cys Arg

145 150 155 160

Phe Leu Gln Gly Pro Asp Thr Asn Pro His Ala Val Glu Ala Ile Arg

165 170 175

Gln Gly Leu Lys Ala Glu Thr Arg Phe Thr Ile Asp Ile Leu Asn Tyr

180 185 190

Arg Lys Asp Gly Ser Ala Phe Val Asn Arg Leu Arg Ile Arg Pro Ile

195 200 205

Tyr Asp Pro Glu Gly Asn Leu Met Phe Phe Ala Gly Ala Gln Asn Pro

210 215 220

Val Leu Glu His His His His His His

225 230

<210> 33

<211> 265

<212> PRT

<213> Synthetic Sequence

<400> 33

Met Lys Ala Leu Thr Ala Arg Gln Gln Glu Val Phe Asp Leu Ile Arg

1 5 10 15

Asp His Ile Ser Gln Thr Gly Met Pro Pro Thr Arg Ala Glu Ile Ala

20 25 30

Gln Arg Leu Gly Phe Arg Ser Pro Asn Ala Ala Glu Glu His Leu Lys

35 40 45

Ala Leu Ala Arg Lys Gly Val Ile Glu Ile Val Ser Gly Ala Ser Arg

50 55 60

Gly Ile Arg Leu Leu Gln Glu Glu Glu Glu Gly Leu Pro Leu Val Gly

65 70 75 80

Arg Val Ala Ala Gly Glu Pro Met Ala Met Asp Gln Lys Gln Phe Glu

85 90 95

Lys Ile Arg Ala Val Phe Asp Arg Ser Gly Val Ala Leu Thr Leu Val

100 105 110

Asp Met Ser Leu Pro Glu Gln Pro Leu Val Leu Ala Asn Pro Pro Phe

115 120 125

Leu Arg Met Thr Gly Tyr Thr Glu Gly Gln Ile Leu Gly Phe Asn Cys

130 135 140

Arg Phe Leu Gln Arg Gly Asp Glu Asn Ala Gln Ala Arg Ala Asp Ile

145 150 155 160

Arg Asp Ala Leu Lys Leu Gly Arg Glu Leu Gln Val Val Leu Arg Asn

165 170 175

Tyr Arg Ala Asn Asp Glu Pro Phe Asp Asn Leu Leu Phe Leu His Pro

180 185 190

Val Gly Gly Arg Pro Asp Ala Pro Asp Tyr Phe Leu Gly Ser Gln Phe

195 200 205

Glu Leu Gly Arg Ser Gly Asn Ser Glu Glu Ala Ala Ala Ala Gly His

210 215 220

Ala Gly Ala Leu Thr Gly Glu Leu Ala Arg Ile Gly Thr Val Ala Ala

225 230 235 240

Arg Leu Glu Met Asp Ser Arg Arg His Leu Ala Gln Ala Ala Ala Ala

245 250 255

Leu Val Arg Ala Trp Glu Arg Arg Gly

260 265

<210> 34

<211> 280

<212> PRT

<213> Synthetic Sequence

<400> 34

Met Ser Thr Lys Lys Lys Pro Leu Thr Gln Glu Gln Leu Glu Asp Ala

1 5 10 15

Arg Arg Leu Lys Ala Ile Tyr Glu Lys Lys Lys Asn Glu Leu Gly Leu

20 25 30

Ser Gln Glu Ser Val Ala Asp Lys Met Gly Met Gly Gln Ser Gly Val

35 40 45

Gly Ala Leu Phe Asn Gly Ile Asn Ala Leu Asn Ala Tyr Asn Ala Ala

50 55 60

Leu Leu Ala Lys Ile Leu Lys Val Ser Val Glu Glu Phe Ser Pro Ser

65 70 75 80

Ile Ala Arg Glu Ile Tyr Glu Met Tyr Glu Ala Val Ser Met Gln Pro

85 90 95

Ser Leu Arg Ser Glu Tyr Met Ala Met Asp Gln Lys Gln Phe Glu Lys

100 105 110

Ile Arg Ala Val Phe Asp Arg Ser Gly Val Ala Leu Thr Leu Val Asp

115 120 125

Met Ser Leu Pro Glu Gln Pro Leu Val Leu Ala Asn Pro Pro Phe Leu

130 135 140

Arg Met Thr Gly Tyr Thr Glu Gly Gln Ile Leu Gly Phe Asn Cys Arg

145 150 155 160

Phe Leu Gln Arg Gly Asp Glu Asn Ala Gln Ala Arg Ala Asp Ile Arg

165 170 175

Asp Ala Leu Lys Leu Gly Arg Glu Leu Gln Val Val Leu Arg Asn Tyr

180 185 190

Arg Ala Asn Asp Glu Pro Phe Asp Asn Leu Leu Phe Leu His Pro Val

195 200 205

Gly Gly Arg Pro Asp Ala Pro Asp Tyr Phe Leu Gly Ser Gln Phe Glu

210 215 220

Leu Gly Arg Ser Gly Asn Ser Glu Glu Ala Ala Ala Ala Gly His Ala

225 230 235 240

Gly Ala Leu Thr Gly Glu Leu Ala Arg Ile Gly Thr Val Ala Ala Arg

245 250 255

Leu Glu Met Asp Ser Arg Arg His Leu Ala Gln Ala Ala Ala Ala Leu

260 265 270

Val Arg Ala Trp Glu Arg Arg Gly

275 280

<210> 35

<211> 243

<212> PRT

<213> Synthetic Sequence

<400> 35

Met Lys Leu Leu Ser Ser Ile Glu Gln Ala Cys Asp Ile Cys Arg Leu

1 5 10 15

Lys Lys Leu Lys Cys Ser Lys Glu Lys Pro Lys Cys Ala Lys Cys Leu

20 25 30

Lys Asn Asn Trp Glu Cys Arg Tyr Ser Pro Lys Thr Lys Arg Ser Pro

35 40 45

Leu Thr Arg Ala His Leu Thr Glu Val Glu Ser Arg Leu Glu Arg Leu

50 55 60

Glu Met Ala Met Asp Gln Lys Gln Phe Glu Lys Ile Arg Ala Val Phe

65 70 75 80

Asp Arg Ser Gly Val Ala Leu Thr Leu Val Asp Met Ser Leu Pro Glu

85 90 95

Gln Pro Leu Val Leu Ala Asn Pro Pro Phe Leu Arg Met Thr Gly Tyr

100 105 110

Thr Glu Gly Gln Ile Leu Gly Phe Asn Cys Arg Phe Leu Gln Arg Gly

115 120 125

Asp Glu Asn Ala Gln Ala Arg Ala Asp Ile Arg Asp Ala Leu Lys Leu

130 135 140

Gly Arg Glu Leu Gln Val Val Leu Arg Asn Tyr Arg Ala Asn Asp Glu

145 150 155 160

Pro Phe Asp Asn Leu Leu Phe Leu His Pro Val Gly Gly Arg Pro Asp

165 170 175

Ala Pro Asp Tyr Phe Leu Gly Ser Gln Phe Glu Leu Gly Arg Ser Gly

180 185 190

Asn Ser Glu Glu Ala Ala Ala Ala Gly His Ala Gly Ala Leu Thr Gly

195 200 205

Glu Leu Ala Arg Ile Gly Thr Val Ala Ala Arg Leu Glu Met Asp Ser

210 215 220

Arg Arg His Leu Ala Gln Ala Ala Ala Ala Leu Val Arg Ala Trp Glu

225 230 235 240

Arg Arg Gly

<210> 36

<211> 241

<212> PRT

<213> Synthetic Sequence

<400> 36

Met Ser Arg Leu Asp Lys Ser Lys Val Ile Asn Ser Ala Leu Glu Leu

1 5 10 15

Leu Asn Glu Val Gly Ile Glu Gly Leu Thr Thr Arg Lys Leu Ala Gln

20 25 30

Lys Leu Gly Val Glu Gln Pro Thr Leu Tyr Trp His Val Lys Asn Lys

35 40 45

Arg Ala Leu Leu Asp Ala Leu Ala Ile Glu Met Leu Asp Arg His Met

50 55 60

Ala Met Asp Gln Lys Gln Phe Glu Lys Ile Arg Ala Val Phe Asp Arg

65 70 75 80

Ser Gly Val Ala Leu Thr Leu Val Asp Met Ser Leu Pro Glu Gln Pro

85 90 95

Leu Val Leu Ala Asn Pro Pro Phe Leu Arg Met Thr Gly Tyr Thr Glu

100 105 110

Gly Gln Ile Leu Gly Phe Asn Cys Arg Phe Leu Gln Arg Gly Asp Glu

115 120 125

Asn Ala Gln Ala Arg Ala Asp Ile Arg Asp Ala Leu Lys Leu Gly Arg

130 135 140

Glu Leu Gln Val Val Leu Arg Asn Tyr Arg Ala Asn Asp Glu Pro Phe

145 150 155 160

Asp Asn Leu Leu Phe Leu His Pro Val Gly Gly Arg Pro Asp Ala Pro

165 170 175

Asp Tyr Phe Leu Gly Ser Gln Phe Glu Leu Gly Arg Ser Gly Asn Ser

180 185 190

Glu Glu Ala Ala Ala Ala Gly His Ala Gly Ala Leu Thr Gly Glu Leu

195 200 205

Ala Arg Ile Gly Thr Val Ala Ala Arg Leu Glu Met Asp Ser Arg Arg

210 215 220

His Leu Ala Gln Ala Ala Ala Ala Leu Val Arg Ala Trp Glu Arg Arg

225 230 235 240

Gly

<210> 37

<211> 538

<212> PRT

<213> Synthetic Sequence

<400> 37

Met Lys Ala Leu Thr Ala Arg Gln Gln Glu Val Phe Asp Leu Ile Arg

1 5 10 15

Asp His Ile Ser Gln Thr Gly Met Pro Pro Thr Arg Ala Glu Ile Ala

20 25 30

Gln Arg Leu Gly Phe Arg Ser Ala Ser Ser Ala Glu Glu His Leu Lys

35 40 45

Ala Leu Ala Arg Lys Gly Val Ile Glu Ile Val Ser Gly Ala Ser Arg

50 55 60

Gly Ile Arg Leu Leu Gln Glu Glu Glu Glu Gly Leu Pro Leu Val Gly

65 70 75 80

Arg Val Ala Ala Gly Glu Pro Met Ala Met Asp Gln Lys Gln Phe Glu

85 90 95

Lys Ile Arg Ala Val Phe Asp Arg Ser Gly Val Ala Leu Thr Leu Val

100 105 110

Asp Met Ser Leu Pro Glu Gln Pro Leu Val Leu Ala Asn Pro Pro Phe

115 120 125

Leu Arg Met Thr Gly Tyr Thr Glu Gly Gln Ile Leu Gly Phe Asn Cys

130 135 140

Arg Phe Leu Gln Arg Gly Asp Glu Asn Ala Gln Ala Arg Ala Asp Ile

145 150 155 160

Arg Asp Ala Leu Lys Leu Gly Arg Glu Leu Gln Val Val Leu Arg Asn

165 170 175

Tyr Arg Ala Asn Asp Glu Pro Phe Asp Asn Leu Leu Phe Leu His Pro

180 185 190

Val Gly Gly Arg Pro Asp Ala Pro Asp Tyr Phe Leu Gly Ser Gln Phe

195 200 205

Glu Leu Gly Arg Ser Gly Asn Ser Glu Glu Ala Ala Ala Ala Gly His

210 215 220

Ala Gly Ala Leu Thr Gly Glu Leu Ala Arg Ile Gly Thr Val Ala Ala

225 230 235 240

Arg Leu Glu Met Asp Ser Arg Arg His Leu Ala Gln Ala Ala Ala Ala

245 250 255

Leu Val Arg Ala Trp Glu Arg Arg Gly Thr Ser Ala Ala Ala Asp Tyr

260 265 270

Lys Asp Asp Asp Asp Lys Phe Arg Thr Gly Ser Lys Thr Pro Pro His

275 280 285

Gly Thr Met Gln Gly Ser Val Thr Glu Phe Leu Lys Pro Arg Leu Val

290 295 300

Asp Ile Glu Gln Val Ser Ser Thr His Ala Lys Val Thr Leu Glu Pro

305 310 315 320

Leu Glu Arg Gly Phe Gly His Thr Leu Gly Asn Ala Leu Arg Arg Ile

325 330 335

Leu Leu Ser Ser Met Pro Gly Cys Ala Val Thr Glu Val Glu Ile Asp

340 345 350

Gly Val Leu His Glu Tyr Ser Thr Lys Glu Gly Val Gln Glu Asp Ile

355 360 365

Leu Glu Ile Leu Leu Asn Leu Lys Gly Leu Ala Val Arg Val Gln Gly

370 375 380

Lys Asp Glu Val Ile Leu Thr Leu Asn Lys Ser Gly Ile Gly Pro Val

385 390 395 400

Thr Ala Ala Asp Ile Thr His Asp Gly Asp Val Glu Ile Val Lys Pro

405 410 415

Gln His Val Ile Cys His Leu Thr Asp Glu Asn Ala Ser Ile Ser Met

420 425 430

Arg Ile Lys Val Gln Arg Gly Arg Gly Tyr Val Pro Ala Ser Thr Arg

435 440 445

Ile His Ser Glu Glu Asp Glu Arg Pro Ile Gly Arg Leu Leu Val Asp

450 455 460

Ala Cys Tyr Ser Pro Val Glu Arg Ile Ala Tyr Asn Val Glu Ala Ala

465 470 475 480

Arg Val Glu Gln Arg Thr Asp Leu Asp Lys Leu Val Ile Glu Met Glu

485 490 495

Thr Asn Gly Thr Ile Asp Pro Glu Glu Ala Ile Arg Arg Ala Ala Thr

500 505 510

Ile Leu Ala Glu Gln Leu Glu Ala Phe Val Asp Leu Arg Asp Val Arg

515 520 525

Gln Pro Glu Val Lys Glu Glu Lys Pro Glu

530 535

<210> 38

<211> 378

<212> PRT

<213> Synthetic Sequence

<400> 38

Met Ala Arg Val Thr Val Gln Asp Ala Val Glu Lys Ile Gly Asn Arg

1 5 10 15

Phe Asp Leu Val Leu Val Ala Ala Arg Arg Ala Arg Gln Met Gln Val

20 25 30

Gly Gly Lys Asp Pro Leu Val Pro Glu Glu Asn Asp Lys Thr Thr Val

35 40 45

Ile Ala Leu Arg Glu Ile Glu Glu Gly Leu Ile Asn Asn Gln Ile Leu

50 55 60

Asp Val Arg Glu Arg Gln Glu Gln Gln Glu Gln Glu Ala Ala Glu Leu

65 70 75 80

Gln Ala Val Thr Ala Ile Ala Glu Gly Arg Ala Ala Ala Asp Tyr Lys

85 90 95

Asp Asp Asp Asp Lys Phe Arg Thr Gly Ser Lys Thr Pro Pro His Thr

100 105 110

Ser Met Lys Ala Leu Thr Ala Arg Gln Gln Glu Val Phe Asp Leu Ile

115 120 125

Arg Asp His Ile Ser Gln Thr Gly Met Pro Pro Thr Arg Ala Glu Ile

130 135 140

Ala Gln Arg Leu Gly Phe Arg Ser Ala Ser Ser Ala Glu Glu His Leu

145 150 155 160

Lys Ala Leu Ala Arg Lys Gly Val Ile Glu Ile Val Ser Gly Ala Ser

165 170 175

Arg Gly Ile Arg Leu Leu Gln Glu Glu Glu Glu Gly Leu Pro Leu Val

180 185 190

Gly Arg Val Ala Ala Gly Glu Pro Met Ala Met Asp Gln Lys Gln Phe

195 200 205

Glu Lys Ile Arg Ala Val Phe Asp Arg Ser Gly Val Ala Leu Thr Leu

210 215 220

Val Asp Met Ser Leu Pro Glu Gln Pro Leu Val Leu Ala Asn Pro Pro

225 230 235 240

Phe Leu Arg Met Thr Gly Tyr Thr Glu Gly Gln Ile Leu Gly Phe Asn

245 250 255

Cys Arg Phe Leu Gln Arg Gly Asp Glu Asn Ala Gln Ala Arg Ala Asp

260 265 270

Ile Arg Asp Ala Leu Lys Leu Gly Arg Glu Leu Gln Val Val Leu Arg

275 280 285

Asn Tyr Arg Ala Asn Asp Glu Pro Phe Asp Asn Leu Leu Phe Leu His

290 295 300

Pro Val Gly Gly Arg Pro Asp Ala Pro Asp Tyr Phe Leu Gly Ser Gln

305 310 315 320

Phe Glu Leu Gly Arg Ser Gly Asn Ser Glu Glu Ala Ala Ala Ala Gly

325 330 335

His Ala Gly Ala Leu Thr Gly Glu Leu Ala Arg Ile Gly Thr Val Ala

340 345 350

Ala Arg Leu Glu Met Asp Ser Arg Arg His Leu Ala Gln Ala Ala Ala

355 360 365

Ala Leu Val Arg Ala Trp Glu Arg Arg Gly

370 375

<210> 39

<211> 538

<212> PRT

<213> Synthetic Sequence

<400> 39

Met Lys Ala Leu Thr Ala Arg Gln Gln Glu Val Phe Asp Leu Ile Arg

1 5 10 15

Asp His Ile Ser Gln Thr Gly Met Pro Pro Thr Arg Ala Glu Ile Ala

20 25 30

Gln Arg Leu Gly Phe Arg Ser Pro Asn Ala Ala Glu Glu His Leu Lys

35 40 45

Ala Leu Ala Arg Lys Gly Val Ile Glu Ile Val Ser Gly Ala Ser Arg

50 55 60

Gly Ile Arg Leu Leu Gln Glu Glu Glu Glu Gly Leu Pro Leu Val Gly

65 70 75 80

Arg Val Ala Ala Gly Glu Pro Met Ala Met Asp Gln Lys Gln Phe Glu

85 90 95

Lys Ile Arg Ala Val Phe Asp Arg Ser Gly Val Ala Leu Thr Leu Val

100 105 110

Asp Met Ser Leu Pro Glu Gln Pro Leu Val Leu Ala Asn Pro Pro Phe

115 120 125

Leu Arg Met Thr Gly Tyr Thr Glu Gly Gln Ile Leu Gly Phe Asn Cys

130 135 140

Arg Phe Leu Gln Arg Gly Asp Glu Asn Ala Gln Ala Arg Ala Asp Ile

145 150 155 160

Arg Asp Ala Leu Lys Leu Gly Arg Glu Leu Gln Val Val Leu Arg Asn

165 170 175

Tyr Arg Ala Asn Asp Glu Pro Phe Asp Asn Leu Leu Phe Leu His Pro

180 185 190

Val Gly Gly Arg Pro Asp Ala Pro Asp Tyr Phe Leu Gly Ser Gln Phe

195 200 205

Glu Leu Gly Arg Ser Gly Asn Ser Glu Glu Ala Ala Ala Ala Gly His

210 215 220

Ala Gly Ala Leu Thr Gly Glu Leu Ala Arg Ile Gly Thr Val Ala Ala

225 230 235 240

Arg Leu Glu Met Asp Ser Arg Arg His Leu Ala Gln Ala Ala Ala Ala

245 250 255

Leu Val Arg Ala Trp Glu Arg Arg Gly Thr Ser Ala Ala Ala Asp Tyr

260 265 270

Lys Asp Asp Asp Asp Lys Phe Arg Thr Gly Ser Lys Thr Pro Pro His

275 280 285

Gly Thr Met Gln Gly Ser Val Thr Glu Phe Leu Lys Pro Arg Leu Val

290 295 300

Asp Ile Glu Gln Val Ser Ser Thr His Ala Lys Val Thr Leu Glu Pro

305 310 315 320

Leu Glu Arg Gly Phe Gly His Thr Leu Gly Asn Ala Leu Arg Arg Ile

325 330 335

Leu Leu Ser Ser Met Pro Gly Cys Ala Val Thr Glu Val Glu Ile Asp

340 345 350

Gly Val Leu His Glu Tyr Ser Thr Lys Glu Gly Val Gln Glu Asp Ile

355 360 365

Leu Glu Ile Leu Leu Asn Leu Lys Gly Leu Ala Val Arg Val Gln Gly

370 375 380

Lys Asp Glu Val Ile Leu Thr Leu Asn Lys Ser Gly Ile Gly Pro Val

385 390 395 400

Thr Ala Ala Asp Ile Thr His Asp Gly Asp Val Glu Ile Val Lys Pro

405 410 415

Gln His Val Ile Cys His Leu Thr Asp Glu Asn Ala Ser Ile Ser Met

420 425 430

Arg Ile Lys Val Gln Arg Gly Arg Gly Tyr Val Pro Ala Ser Thr Arg

435 440 445

Ile His Ser Glu Glu Asp Glu Arg Pro Ile Gly Arg Leu Leu Val Asp

450 455 460

Ala Cys Tyr Ser Pro Val Glu Arg Ile Ala Tyr Asn Val Glu Ala Ala

465 470 475 480

Arg Val Glu Gln Arg Thr Asp Leu Asp Lys Leu Val Ile Glu Met Glu

485 490 495

Thr Asn Gly Thr Ile Asp Pro Glu Glu Ala Ile Arg Arg Ala Ala Thr

500 505 510

Ile Leu Ala Glu Gln Leu Glu Ala Phe Val Asp Leu Arg Asp Val Arg

515 520 525

Gln Pro Glu Val Lys Glu Glu Lys Pro Glu

530 535

<210> 40

<211> 378

<212> PRT

<213> Synthetic Sequence

<400> 40

Met Ala Arg Val Thr Val Gln Asp Ala Val Glu Lys Ile Gly Asn Arg

1 5 10 15

Phe Asp Leu Val Leu Val Ala Ala Arg Arg Ala Arg Gln Met Gln Val

20 25 30

Gly Gly Lys Asp Pro Leu Val Pro Glu Glu Asn Asp Lys Thr Thr Val

35 40 45

Ile Ala Leu Arg Glu Ile Glu Glu Gly Leu Ile Asn Asn Gln Ile Leu

50 55 60

Asp Val Arg Glu Arg Gln Glu Gln Gln Glu Gln Glu Ala Ala Glu Leu

65 70 75 80

Gln Ala Val Thr Ala Ile Ala Glu Gly Arg Ala Ala Ala Asp Tyr Lys

85 90 95

Asp Asp Asp Asp Lys Phe Arg Thr Gly Ser Lys Thr Pro Pro His Thr

100 105 110

Ser Met Lys Ala Leu Thr Ala Arg Gln Gln Glu Val Phe Asp Leu Ile

115 120 125

Arg Asp His Ile Ser Gln Thr Gly Met Pro Pro Thr Arg Ala Glu Ile

130 135 140

Ala Gln Arg Leu Gly Phe Arg Ser Pro Asn Ala Ala Glu Glu His Leu

145 150 155 160

Lys Ala Leu Ala Arg Lys Gly Val Ile Glu Ile Val Ser Gly Ala Ser

165 170 175

Arg Gly Ile Arg Leu Leu Gln Glu Glu Glu Glu Gly Leu Pro Leu Val

180 185 190

Gly Arg Val Ala Ala Gly Glu Pro Met Ala Met Asp Gln Lys Gln Phe

195 200 205

Glu Lys Ile Arg Ala Val Phe Asp Arg Ser Gly Val Ala Leu Thr Leu

210 215 220

Val Asp Met Ser Leu Pro Glu Gln Pro Leu Val Leu Ala Asn Pro Pro

225 230 235 240

Phe Leu Arg Met Thr Gly Tyr Thr Glu Gly Gln Ile Leu Gly Phe Asn

245 250 255

Cys Arg Phe Leu Gln Arg Gly Asp Glu Asn Ala Gln Ala Arg Ala Asp

260 265 270

Ile Arg Asp Ala Leu Lys Leu Gly Arg Glu Leu Gln Val Val Leu Arg

275 280 285

Asn Tyr Arg Ala Asn Asp Glu Pro Phe Asp Asn Leu Leu Phe Leu His

290 295 300

Pro Val Gly Gly Arg Pro Asp Ala Pro Asp Tyr Phe Leu Gly Ser Gln

305 310 315 320

Phe Glu Leu Gly Arg Ser Gly Asn Ser Glu Glu Ala Ala Ala Ala Gly

325 330 335

His Ala Gly Ala Leu Thr Gly Glu Leu Ala Arg Ile Gly Thr Val Ala

340 345 350

Ala Arg Leu Glu Met Asp Ser Arg Arg His Leu Ala Gln Ala Ala Ala

355 360 365

Ala Leu Val Arg Ala Trp Glu Arg Arg Gly

370 375

<210> 41

<211> 553

<212> PRT

<213> Synthetic Sequence

<400> 41

Met Ser Thr Lys Lys Lys Pro Leu Thr Gln Glu Gln Leu Glu Asp Ala

1 5 10 15

Arg Arg Leu Lys Ala Ile Tyr Glu Lys Lys Lys Asn Glu Leu Gly Leu

20 25 30

Ser Gln Glu Ser Val Ala Asp Lys Met Gly Met Gly Gln Ser Gly Val

35 40 45

Gly Ala Leu Phe Asn Gly Ile Asn Ala Leu Asn Ala Tyr Asn Ala Ala

50 55 60

Leu Leu Ala Lys Ile Leu Lys Val Ser Val Glu Glu Phe Ser Pro Ser

65 70 75 80

Ile Ala Arg Glu Ile Tyr Glu Met Tyr Glu Ala Val Ser Met Gln Pro

85 90 95

Ser Leu Arg Ser Glu Tyr Met Ala Met Asp Gln Lys Gln Phe Glu Lys

100 105 110

Ile Arg Ala Val Phe Asp Arg Ser Gly Val Ala Leu Thr Leu Val Asp

115 120 125

Met Ser Leu Pro Glu Gln Pro Leu Val Leu Ala Asn Pro Pro Phe Leu

130 135 140

Arg Met Thr Gly Tyr Thr Glu Gly Gln Ile Leu Gly Phe Asn Cys Arg

145 150 155 160

Phe Leu Gln Arg Gly Asp Glu Asn Ala Gln Ala Arg Ala Asp Ile Arg

165 170 175

Asp Ala Leu Lys Leu Gly Arg Glu Leu Gln Val Val Leu Arg Asn Tyr

180 185 190

Arg Ala Asn Asp Glu Pro Phe Asp Asn Leu Leu Phe Leu His Pro Val

195 200 205

Gly Gly Arg Pro Asp Ala Pro Asp Tyr Phe Leu Gly Ser Gln Phe Glu

210 215 220

Leu Gly Arg Ser Gly Asn Ser Glu Glu Ala Ala Ala Ala Gly His Ala

225 230 235 240

Gly Ala Leu Thr Gly Glu Leu Ala Arg Ile Gly Thr Val Ala Ala Arg

245 250 255

Leu Glu Met Asp Ser Arg Arg His Leu Ala Gln Ala Ala Ala Ala Leu

260 265 270

Val Arg Ala Trp Glu Arg Arg Gly Thr Ser Ala Ala Ala Asp Tyr Lys

275 280 285

Asp Asp Asp Asp Lys Phe Arg Thr Gly Ser Lys Thr Pro Pro His Gly

290 295 300

Thr Met Gln Gly Ser Val Thr Glu Phe Leu Lys Pro Arg Leu Val Asp

305 310 315 320

Ile Glu Gln Val Ser Ser Thr His Ala Lys Val Thr Leu Glu Pro Leu

325 330 335

Glu Arg Gly Phe Gly His Thr Leu Gly Asn Ala Leu Arg Arg Ile Leu

340 345 350

Leu Ser Ser Met Pro Gly Cys Ala Val Thr Glu Val Glu Ile Asp Gly

355 360 365

Val Leu His Glu Tyr Ser Thr Lys Glu Gly Val Gln Glu Asp Ile Leu

370 375 380

Glu Ile Leu Leu Asn Leu Lys Gly Leu Ala Val Arg Val Gln Gly Lys

385 390 395 400

Asp Glu Val Ile Leu Thr Leu Asn Lys Ser Gly Ile Gly Pro Val Thr

405 410 415

Ala Ala Asp Ile Thr His Asp Gly Asp Val Glu Ile Val Lys Pro Gln

420 425 430

His Val Ile Cys His Leu Thr Asp Glu Asn Ala Ser Ile Ser Met Arg

435 440 445

Ile Lys Val Gln Arg Gly Arg Gly Tyr Val Pro Ala Ser Thr Arg Ile

450 455 460

His Ser Glu Glu Asp Glu Arg Pro Ile Gly Arg Leu Leu Val Asp Ala

465 470 475 480

Cys Tyr Ser Pro Val Glu Arg Ile Ala Tyr Asn Val Glu Ala Ala Arg

485 490 495

Val Glu Gln Arg Thr Asp Leu Asp Lys Leu Val Ile Glu Met Glu Thr

500 505 510

Asn Gly Thr Ile Asp Pro Glu Glu Ala Ile Arg Arg Ala Ala Thr Ile

515 520 525

Leu Ala Glu Gln Leu Glu Ala Phe Val Asp Leu Arg Asp Val Arg Gln

530 535 540

Pro Glu Val Lys Glu Glu Lys Pro Glu

545 550

<210> 42

<211> 393

<212> PRT

<213> Synthetic Sequence

<400> 42

Met Ala Arg Val Thr Val Gln Asp Ala Val Glu Lys Ile Gly Asn Arg

1 5 10 15

Phe Asp Leu Val Leu Val Ala Ala Arg Arg Ala Arg Gln Met Gln Val

20 25 30

Gly Gly Lys Asp Pro Leu Val Pro Glu Glu Asn Asp Lys Thr Thr Val

35 40 45

Ile Ala Leu Arg Glu Ile Glu Glu Gly Leu Ile Asn Asn Gln Ile Leu

50 55 60

Asp Val Arg Glu Arg Gln Glu Gln Gln Glu Gln Glu Ala Ala Glu Leu

65 70 75 80

Gln Ala Val Thr Ala Ile Ala Glu Gly Arg Ala Ala Ala Asp Tyr Lys

85 90 95

Asp Asp Asp Asp Lys Phe Arg Thr Gly Ser Lys Thr Pro Pro His Thr

100 105 110

Ser Met Ser Thr Lys Lys Lys Pro Leu Thr Gln Glu Gln Leu Glu Asp

115 120 125

Ala Arg Arg Leu Lys Ala Ile Tyr Glu Lys Lys Lys Asn Glu Leu Gly

130 135 140

Leu Ser Gln Glu Ser Val Ala Asp Lys Met Gly Met Gly Gln Ser Gly

145 150 155 160

Val Gly Ala Leu Phe Asn Gly Ile Asn Ala Leu Asn Ala Tyr Asn Ala

165 170 175

Ala Leu Leu Ala Lys Ile Leu Lys Val Ser Val Glu Glu Phe Ser Pro

180 185 190

Ser Ile Ala Arg Glu Ile Tyr Glu Met Tyr Glu Ala Val Ser Met Gln

195 200 205

Pro Ser Leu Arg Ser Glu Tyr Met Ala Met Asp Gln Lys Gln Phe Glu

210 215 220

Lys Ile Arg Ala Val Phe Asp Arg Ser Gly Val Ala Leu Thr Leu Val

225 230 235 240

Asp Met Ser Leu Pro Glu Gln Pro Leu Val Leu Ala Asn Pro Pro Phe

245 250 255

Leu Arg Met Thr Gly Tyr Thr Glu Gly Gln Ile Leu Gly Phe Asn Cys

260 265 270

Arg Phe Leu Gln Arg Gly Asp Glu Asn Ala Gln Ala Arg Ala Asp Ile

275 280 285

Arg Asp Ala Leu Lys Leu Gly Arg Glu Leu Gln Val Val Leu Arg Asn

290 295 300

Tyr Arg Ala Asn Asp Glu Pro Phe Asp Asn Leu Leu Phe Leu His Pro

305 310 315 320

Val Gly Gly Arg Pro Asp Ala Pro Asp Tyr Phe Leu Gly Ser Gln Phe

325 330 335

Glu Leu Gly Arg Ser Gly Asn Ser Glu Glu Ala Ala Ala Ala Gly His

340 345 350

Ala Gly Ala Leu Thr Gly Glu Leu Ala Arg Ile Gly Thr Val Ala Ala

355 360 365

Arg Leu Glu Met Asp Ser Arg Arg His Leu Ala Gln Ala Ala Ala Ala

370 375 380

Leu Val Arg Ala Trp Glu Arg Arg Gly

385 390

<210> 43

<211> 516

<212> PRT

<213> Synthetic Sequence

<400> 43

Met Lys Leu Leu Ser Ser Ile Glu Gln Ala Cys Asp Ile Cys Arg Leu

1 5 10 15

Lys Lys Leu Lys Cys Ser Lys Glu Lys Pro Lys Cys Ala Lys Cys Leu

20 25 30

Lys Asn Asn Trp Glu Cys Arg Tyr Ser Pro Lys Thr Lys Arg Ser Pro

35 40 45

Leu Thr Arg Ala His Leu Thr Glu Val Glu Ser Arg Leu Glu Arg Leu

50 55 60

Glu Met Ala Met Asp Gln Lys Gln Phe Glu Lys Ile Arg Ala Val Phe

65 70 75 80

Asp Arg Ser Gly Val Ala Leu Thr Leu Val Asp Met Ser Leu Pro Glu

85 90 95

Gln Pro Leu Val Leu Ala Asn Pro Pro Phe Leu Arg Met Thr Gly Tyr

100 105 110

Thr Glu Gly Gln Ile Leu Gly Phe Asn Cys Arg Phe Leu Gln Arg Gly

115 120 125

Asp Glu Asn Ala Gln Ala Arg Ala Asp Ile Arg Asp Ala Leu Lys Leu

130 135 140

Gly Arg Glu Leu Gln Val Val Leu Arg Asn Tyr Arg Ala Asn Asp Glu

145 150 155 160

Pro Phe Asp Asn Leu Leu Phe Leu His Pro Val Gly Gly Arg Pro Asp

165 170 175

Ala Pro Asp Tyr Phe Leu Gly Ser Gln Phe Glu Leu Gly Arg Ser Gly

180 185 190

Asn Ser Glu Glu Ala Ala Ala Ala Gly His Ala Gly Ala Leu Thr Gly

195 200 205

Glu Leu Ala Arg Ile Gly Thr Val Ala Ala Arg Leu Glu Met Asp Ser

210 215 220

Arg Arg His Leu Ala Gln Ala Ala Ala Ala Leu Val Arg Ala Trp Glu

225 230 235 240

Arg Arg Gly Thr Ser Ala Ala Ala Asp Tyr Lys Asp Asp Asp Asp Lys

245 250 255

Phe Arg Thr Gly Ser Lys Thr Pro Pro His Gly Thr Met Gln Gly Ser

260 265 270

Val Thr Glu Phe Leu Lys Pro Arg Leu Val Asp Ile Glu Gln Val Ser

275 280 285

Ser Thr His Ala Lys Val Thr Leu Glu Pro Leu Glu Arg Gly Phe Gly

290 295 300

His Thr Leu Gly Asn Ala Leu Arg Arg Ile Leu Leu Ser Ser Met Pro

305 310 315 320

Gly Cys Ala Val Thr Glu Val Glu Ile Asp Gly Val Leu His Glu Tyr

325 330 335

Ser Thr Lys Glu Gly Val Gln Glu Asp Ile Leu Glu Ile Leu Leu Asn

340 345 350

Leu Lys Gly Leu Ala Val Arg Val Gln Gly Lys Asp Glu Val Ile Leu

355 360 365

Thr Leu Asn Lys Ser Gly Ile Gly Pro Val Thr Ala Ala Asp Ile Thr

370 375 380

His Asp Gly Asp Val Glu Ile Val Lys Pro Gln His Val Ile Cys His

385 390 395 400

Leu Thr Asp Glu Asn Ala Ser Ile Ser Met Arg Ile Lys Val Gln Arg

405 410 415

Gly Arg Gly Tyr Val Pro Ala Ser Thr Arg Ile His Ser Glu Glu Asp

420 425 430

Glu Arg Pro Ile Gly Arg Leu Leu Val Asp Ala Cys Tyr Ser Pro Val

435 440 445

Glu Arg Ile Ala Tyr Asn Val Glu Ala Ala Arg Val Glu Gln Arg Thr

450 455 460

Asp Leu Asp Lys Leu Val Ile Glu Met Glu Thr Asn Gly Thr Ile Asp

465 470 475 480

Pro Glu Glu Ala Ile Arg Arg Ala Ala Thr Ile Leu Ala Glu Gln Leu

485 490 495

Glu Ala Phe Val Asp Leu Arg Asp Val Arg Gln Pro Glu Val Lys Glu

500 505 510

Glu Lys Pro Glu

515

<210> 44

<211> 356

<212> PRT

<213> Synthetic Sequence

<400> 44

Met Ala Arg Val Thr Val Gln Asp Ala Val Glu Lys Ile Gly Asn Arg

1 5 10 15

Phe Asp Leu Val Leu Val Ala Ala Arg Arg Ala Arg Gln Met Gln Val

20 25 30

Gly Gly Lys Asp Pro Leu Val Pro Glu Glu Asn Asp Lys Thr Thr Val

35 40 45

Ile Ala Leu Arg Glu Ile Glu Glu Gly Leu Ile Asn Asn Gln Ile Leu

50 55 60

Asp Val Arg Glu Arg Gln Glu Gln Gln Glu Gln Glu Ala Ala Glu Leu

65 70 75 80

Gln Ala Val Thr Ala Ile Ala Glu Gly Arg Ala Ala Ala Asp Tyr Lys

85 90 95

Asp Asp Asp Asp Lys Phe Arg Thr Gly Ser Lys Thr Pro Pro His Thr

100 105 110

Ser Met Lys Leu Leu Ser Ser Ile Glu Gln Ala Cys Asp Ile Cys Arg

115 120 125

Leu Lys Lys Leu Lys Cys Ser Lys Glu Lys Pro Lys Cys Ala Lys Cys

130 135 140

Leu Lys Asn Asn Trp Glu Cys Arg Tyr Ser Pro Lys Thr Lys Arg Ser

145 150 155 160

Pro Leu Thr Arg Ala His Leu Thr Glu Val Glu Ser Arg Leu Glu Arg

165 170 175

Leu Glu Met Ala Met Asp Gln Lys Gln Phe Glu Lys Ile Arg Ala Val

180 185 190

Phe Asp Arg Ser Gly Val Ala Leu Thr Leu Val Asp Met Ser Leu Pro

195 200 205

Glu Gln Pro Leu Val Leu Ala Asn Pro Pro Phe Leu Arg Met Thr Gly

210 215 220

Tyr Thr Glu Gly Gln Ile Leu Gly Phe Asn Cys Arg Phe Leu Gln Arg

225 230 235 240

Gly Asp Glu Asn Ala Gln Ala Arg Ala Asp Ile Arg Asp Ala Leu Lys

245 250 255

Leu Gly Arg Glu Leu Gln Val Val Leu Arg Asn Tyr Arg Ala Asn Asp

260 265 270

Glu Pro Phe Asp Asn Leu Leu Phe Leu His Pro Val Gly Gly Arg Pro

275 280 285

Asp Ala Pro Asp Tyr Phe Leu Gly Ser Gln Phe Glu Leu Gly Arg Ser

290 295 300

Gly Asn Ser Glu Glu Ala Ala Ala Ala Gly His Ala Gly Ala Leu Thr

305 310 315 320

Gly Glu Leu Ala Arg Ile Gly Thr Val Ala Ala Arg Leu Glu Met Asp

325 330 335

Ser Arg Arg His Leu Ala Gln Ala Ala Ala Ala Leu Val Arg Ala Trp

340 345 350

Glu Arg Arg Gly

355

<210> 45

<211> 514

<212> PRT

<213> Synthetic Sequence

<400> 45

Met Ser Arg Leu Asp Lys Ser Lys Val Ile Asn Ser Ala Leu Glu Leu

1 5 10 15

Leu Asn Glu Val Gly Ile Glu Gly Leu Thr Thr Arg Lys Leu Ala Gln

20 25 30

Lys Leu Gly Val Glu Gln Pro Thr Leu Tyr Trp His Val Lys Asn Lys

35 40 45

Arg Ala Leu Leu Asp Ala Leu Ala Ile Glu Met Leu Asp Arg His Met

50 55 60

Ala Met Asp Gln Lys Gln Phe Glu Lys Ile Arg Ala Val Phe Asp Arg

65 70 75 80

Ser Gly Val Ala Leu Thr Leu Val Asp Met Ser Leu Pro Glu Gln Pro

85 90 95

Leu Val Leu Ala Asn Pro Pro Phe Leu Arg Met Thr Gly Tyr Thr Glu

100 105 110

Gly Gln Ile Leu Gly Phe Asn Cys Arg Phe Leu Gln Arg Gly Asp Glu

115 120 125

Asn Ala Gln Ala Arg Ala Asp Ile Arg Asp Ala Leu Lys Leu Gly Arg

130 135 140

Glu Leu Gln Val Val Leu Arg Asn Tyr Arg Ala Asn Asp Glu Pro Phe

145 150 155 160

Asp Asn Leu Leu Phe Leu His Pro Val Gly Gly Arg Pro Asp Ala Pro

165 170 175

Asp Tyr Phe Leu Gly Ser Gln Phe Glu Leu Gly Arg Ser Gly Asn Ser

180 185 190

Glu Glu Ala Ala Ala Ala Gly His Ala Gly Ala Leu Thr Gly Glu Leu

195 200 205

Ala Arg Ile Gly Thr Val Ala Ala Arg Leu Glu Met Asp Ser Arg Arg

210 215 220

His Leu Ala Gln Ala Ala Ala Ala Leu Val Arg Ala Trp Glu Arg Arg

225 230 235 240

Gly Thr Ser Ala Ala Ala Asp Tyr Lys Asp Asp Asp Asp Lys Phe Arg

245 250 255

Thr Gly Ser Lys Thr Pro Pro His Gly Thr Met Gln Gly Ser Val Thr

260 265 270

Glu Phe Leu Lys Pro Arg Leu Val Asp Ile Glu Gln Val Ser Ser Thr

275 280 285

His Ala Lys Val Thr Leu Glu Pro Leu Glu Arg Gly Phe Gly His Thr

290 295 300

Leu Gly Asn Ala Leu Arg Arg Ile Leu Leu Ser Ser Met Pro Gly Cys

305 310 315 320

Ala Val Thr Glu Val Glu Ile Asp Gly Val Leu His Glu Tyr Ser Thr

325 330 335

Lys Glu Gly Val Gln Glu Asp Ile Leu Glu Ile Leu Leu Asn Leu Lys

340 345 350

Gly Leu Ala Val Arg Val Gln Gly Lys Asp Glu Val Ile Leu Thr Leu

355 360 365

Asn Lys Ser Gly Ile Gly Pro Val Thr Ala Ala Asp Ile Thr His Asp

370 375 380

Gly Asp Val Glu Ile Val Lys Pro Gln His Val Ile Cys His Leu Thr

385 390 395 400

Asp Glu Asn Ala Ser Ile Ser Met Arg Ile Lys Val Gln Arg Gly Arg

405 410 415

Gly Tyr Val Pro Ala Ser Thr Arg Ile His Ser Glu Glu Asp Glu Arg

420 425 430

Pro Ile Gly Arg Leu Leu Val Asp Ala Cys Tyr Ser Pro Val Glu Arg

435 440 445

Ile Ala Tyr Asn Val Glu Ala Ala Arg Val Glu Gln Arg Thr Asp Leu

450 455 460

Asp Lys Leu Val Ile Glu Met Glu Thr Asn Gly Thr Ile Asp Pro Glu

465 470 475 480

Glu Ala Ile Arg Arg Ala Ala Thr Ile Leu Ala Glu Gln Leu Glu Ala

485 490 495

Phe Val Asp Leu Arg Asp Val Arg Gln Pro Glu Val Lys Glu Glu Lys

500 505 510

Pro Glu

<210> 46

<211> 354

<212> PRT

<213> Synthetic Sequence

<400> 46

Met Ala Arg Val Thr Val Gln Asp Ala Val Glu Lys Ile Gly Asn Arg

1 5 10 15

Phe Asp Leu Val Leu Val Ala Ala Arg Arg Ala Arg Gln Met Gln Val

20 25 30

Gly Gly Lys Asp Pro Leu Val Pro Glu Glu Asn Asp Lys Thr Thr Val

35 40 45

Ile Ala Leu Arg Glu Ile Glu Glu Gly Leu Ile Asn Asn Gln Ile Leu

50 55 60

Asp Val Arg Glu Arg Gln Glu Gln Gln Glu Gln Glu Ala Ala Glu Leu

65 70 75 80

Gln Ala Val Thr Ala Ile Ala Glu Gly Arg Ala Ala Ala Asp Tyr Lys

85 90 95

Asp Asp Asp Asp Lys Phe Arg Thr Gly Ser Lys Thr Pro Pro His Thr

100 105 110

Ser Met Ser Arg Leu Asp Lys Ser Lys Val Ile Asn Ser Ala Leu Glu

115 120 125

Leu Leu Asn Glu Val Gly Ile Glu Gly Leu Thr Thr Arg Lys Leu Ala

130 135 140

Gln Lys Leu Gly Val Glu Gln Pro Thr Leu Tyr Trp His Val Lys Asn

145 150 155 160

Lys Arg Ala Leu Leu Asp Ala Leu Ala Ile Glu Met Leu Asp Arg His

165 170 175

Met Ala Met Asp Gln Lys Gln Phe Glu Lys Ile Arg Ala Val Phe Asp

180 185 190

Arg Ser Gly Val Ala Leu Thr Leu Val Asp Met Ser Leu Pro Glu Gln

195 200 205

Pro Leu Val Leu Ala Asn Pro Pro Phe Leu Arg Met Thr Gly Tyr Thr

210 215 220

Glu Gly Gln Ile Leu Gly Phe Asn Cys Arg Phe Leu Gln Arg Gly Asp

225 230 235 240

Glu Asn Ala Gln Ala Arg Ala Asp Ile Arg Asp Ala Leu Lys Leu Gly

245 250 255

Arg Glu Leu Gln Val Val Leu Arg Asn Tyr Arg Ala Asn Asp Glu Pro

260 265 270

Phe Asp Asn Leu Leu Phe Leu His Pro Val Gly Gly Arg Pro Asp Ala

275 280 285

Pro Asp Tyr Phe Leu Gly Ser Gln Phe Glu Leu Gly Arg Ser Gly Asn

290 295 300

Ser Glu Glu Ala Ala Ala Ala Gly His Ala Gly Ala Leu Thr Gly Glu

305 310 315 320

Leu Ala Arg Ile Gly Thr Val Ala Ala Arg Leu Glu Met Asp Ser Arg

325 330 335

Arg His Leu Ala Gln Ala Ala Ala Ala Leu Val Arg Ala Trp Glu Arg

340 345 350

Arg Gly

<210> 47

<211> 1400

<212> DNA

<213> Synthetic Sequence

<400> 47

ctgttttggc ggatgagaga agattttcag cctgatacag attaaatcag aacgcagaag 60

cggtctgata aaacagaatt tgcctggcgg cagtagcgcg gtggtcccac ctgaccccat 120

gccgaactca gaagtgaaac gccgtagcgc cgatggtagt gtggggtctc cccatgcgag 180

agtagggaac tgccaggcat caaataaaac gaaaggctca gtcgaaagac tgggcctttc 240

gttttatctg ttgtttgcgc tagcggatcc tgtttttttg atcgttttca caaaaatgga 300

agtccacagt cttgacaggg aaaatgcagc ggcgtagctt ttatgccgta tataaaaacg 360

gcgtttatat gtacggtatt tatttttaac ttattgtttt aaaagtcaaa gaggatttta 420

taatggtgag caagggcgag gaggataaca tggccatcat caaggagttc atgcgcttca 480

aggtgcacat ggagggctcc gtgaacggcc acgagttcga gatcgagggc gagggcgagg 540

gccgccccta cgagggcacc cagaccgcca agctgaaggt gaccaagggt ggccccctgc 600

ccttcgcctg ggacatcctg tcccctcagt tcatgtacgg ctccaaggcc tacgtgaagc 660

accccgccga catccccgac tacttgaagc tgtccttccc cgagggcttc aagtgggagc 720

gcgtgatgaa cttcgaggac ggcggcgtgg tgaccgtgac ccaggactcc tccctgcagg 780

acggcgagtt catctacaag gtgaagctgc gcggcaccaa cttcccctcc gacggccccg 840

taatgcagaa gaagaccatg ggctgggagg cctcctccga gcggatgtac cccgaggacg 900

gcgccctgaa gggcgagatc aagcagaggc tgaagctgaa ggacggcggc cactacgacg 960

ctgaggtcaa gaccacctac aaggccaaga agcccgtgca gctgcccggc gcctacaacg 1020

tcaacatcaa gttggacatc acctcccaca acgaggacta caccatcgtg gaacagtacg 1080

aacgcgccga gggccgccac tccaccggcg gcatggacga gctgtacaag taagaattcc 1140

ccctgttttg gcggatgaga gaagattttc agcctgatac agattaaatc agaacgcaga 1200

agcggtctga taaaacagaa tttgcctggc ggcagtagcg cggtggtccc acctgacccc 1260

atgccgaact cagaagtgaa acgccgtagc gccgatggta gtgtggggtc tccccatgcg 1320

agagtaggga actgccaggc atcaaataaa acgaaaggct cagtcgaaag actgggcctt 1380

tcgttttatc tgttgtttgc 1400

<210> 48

<211> 1400

<212> DNA

<213> Synthetic Sequence

<400> 48

ctgttttggc ggatgagaga agattttcag cctgatacag attaaatcag aacgcagaag 60

cggtctgata aaacagaatt tgcctggcgg cagtagcgcg gtggtcccac ctgaccccat 120

gccgaactca gaagtgaaac gccgtagcgc cgatggtagt gtggggtctc cccatgcgag 180

agtagggaac tgccaggcat caaataaaac gaaaggctca gtcgaaagac tgggcctttc 240

gttttatctg ttgtttgcgc tagcggatcc tgtttttttg atcgttttca caaaaatgga 300

agtccacagt cttgacaggg aaaatgcagc ggcgtagctt ttatgctgta tataaaacca 360

gtggttatat gtacagtatt tatttttaac ttattgtttt aaaagtcaaa gaggatttta 420

taatggtgag caagggcgag gaggataaca tggccatcat caaggagttc atgcgcttca 480

aggtgcacat ggagggctcc gtgaacggcc acgagttcga gatcgagggc gagggcgagg 540

gccgccccta cgagggcacc cagaccgcca agctgaaggt gaccaagggt ggccccctgc 600

ccttcgcctg ggacatcctg tcccctcagt tcatgtacgg ctccaaggcc tacgtgaagc 660

accccgccga catccccgac tacttgaagc tgtccttccc cgagggcttc aagtgggagc 720

gcgtgatgaa cttcgaggac ggcggcgtgg tgaccgtgac ccaggactcc tccctgcagg 780

acggcgagtt catctacaag gtgaagctgc gcggcaccaa cttcccctcc gacggccccg 840

taatgcagaa gaagaccatg ggctgggagg cctcctccga gcggatgtac cccgaggacg 900

gcgccctgaa gggcgagatc aagcagaggc tgaagctgaa ggacggcggc cactacgacg 960

ctgaggtcaa gaccacctac aaggccaaga agcccgtgca gctgcccggc gcctacaacg 1020

tcaacatcaa gttggacatc acctcccaca acgaggacta caccatcgtg gaacagtacg 1080

aacgcgccga gggccgccac tccaccggcg gcatggacga gctgtacaag taagaattcc 1140

ccctgttttg gcggatgaga gaagattttc agcctgatac agattaaatc agaacgcaga 1200

agcggtctga taaaacagaa tttgcctggc ggcagtagcg cggtggtccc acctgacccc 1260

atgccgaact cagaagtgaa acgccgtagc gccgatggta gtgtggggtc tccccatgcg 1320

agagtaggga actgccaggc atcaaataaa acgaaaggct cagtcgaaag actgggcctt 1380

tcgttttatc tgttgtttgc 1400

<210> 49

<211> 1319

<212> DNA

<213> Synthetic Sequence

<400> 49

ctgttttggc ggatgagaga agattttcag cctgatacag attaaatcag aacgcagaag 60

cggtctgata aaacagaatt tgcctggcgg cagtagcgcg gtggtcccac ctgaccccat 120

gccgaactca gaagtgaaac gccgtagcgc cgatggtagt gtggggtctc cccatgcgag 180

agtagggaac tgccaggcat caaataaaac gaaaggctca gtcgaaagac tgggcctttc 240

gttttatctg ttgtttgcgc tagcggatcc atagggttga tctttgttgt cactggatgt 300

actgtacatc catacagtaa ctcacagggg ctggattgat tatggtgagc aagggcgagg 360

aggataacat ggccatcatc aaggagttca tgcgcttcaa ggtgcacatg gagggctccg 420

tgaacggcca cgagttcgag atcgagggcg agggcgaggg ccgcccctac gagggcaccc 480

agaccgccaa gctgaaggtg accaagggtg gccccctgcc cttcgcctgg gacatcctgt 540

cccctcagtt catgtacggc tccaaggcct acgtgaagca ccccgccgac atccccgact 600

acttgaagct gtccttcccc gagggcttca agtgggagcg cgtgatgaac ttcgaggacg 660

gcggcgtggt gaccgtgacc caggactcct ccctgcagga cggcgagttc atctacaagg 720

tgaagctgcg cggcaccaac ttcccctccg acggccccgt aatgcagaag aagaccatgg 780

gctgggaggc ctcctccgag cggatgtacc ccgaggacgg cgccctgaag ggcgagatca 840

agcagaggct gaagctgaag gacggcggcc actacgacgc tgaggtcaag accacctaca 900

aggccaagaa gcccgtgcag ctgcccggcg cctacaacgt caacatcaag ttggacatca 960

cctcccacaa cgaggactac accatcgtgg aacagtacga acgcgccgag ggccgccact 1020

ccaccggcgg catggacgag ctgtacaagt aagaattccc cctgttttgg cggatgagag 1080

aagattttca gcctgataca gattaaatca gaacgcagaa gcggtctgat aaaacagaat 1140

ttgcctggcg gcagtagcgc ggtggtccca cctgacccca tgccgaactc agaagtgaaa 1200

cgccgtagcg ccgatggtag tgtggggtct ccccatgcga gagtagggaa ctgccaggca 1260

tcaaataaaa cgaaaggctc agtcgaaaga ctgggccttt cgttttatct gttgtttgc 1319

<210> 50

<211> 1348

<212> DNA

<213> Synthetic Sequence

<400> 50

ctgttttggc ggatgagaga agattttcag cctgatacag attaaatcag aacgcagaag 60

cggtctgata aaacagaatt tgcctggcgg cagtagcgcg gtggtcccac ctgaccccat 120

gccgaactca gaagtgaaac gccgtagcgc cgatggtagt gtggggtctc cccatgcgag 180

agtagggaac tgccaggcat caaataaaac gaaaggctca gtcgaaagac tgggcctttc 240

gttttatctg ttgtttgcgc tagcggatcc caatttctac aaaacacttg atactgtatg 300

agcatacagt ataattgctt caacagaaca tattgactat ccggtattac ccggcatgac 360

aggagtaaaa atggtgagca agggcgagga ggataacatg gccatcatca aggagttcat 420

gcgcttcaag gtgcacatgg agggctccgt gaacggccac gagttcgaga tcgagggcga 480

gggcgagggc cgcccctacg agggcaccca gaccgccaag ctgaaggtga ccaagggtgg 540

ccccctgccc ttcgcctggg acatcctgtc ccctcagttc atgtacggct ccaaggccta 600

cgtgaagcac cccgccgaca tccccgacta cttgaagctg tccttccccg agggcttcaa 660

gtgggagcgc gtgatgaact tcgaggacgg cggcgtggtg accgtgaccc aggactcctc 720

cctgcaggac ggcgagttca tctacaaggt gaagctgcgc ggcaccaact tcccctccga 780

cggccccgta atgcagaaga agaccatggg ctgggaggcc tcctccgagc ggatgtaccc 840

cgaggacggc gccctgaagg gcgagatcaa gcagaggctg aagctgaagg acggcggcca 900

ctacgacgct gaggtcaaga ccacctacaa ggccaagaag cccgtgcagc tgcccggcgc 960

ctacaacgtc aacatcaagt tggacatcac ctcccacaac gaggactaca ccatcgtgga 1020

acagtacgaa cgcgccgagg gccgccactc caccggcggc atggacgagc tgtacaagta 1080

agaattcccc ctgttttggc ggatgagaga agattttcag cctgatacag attaaatcag 1140

aacgcagaag cggtctgata aaacagaatt tgcctggcgg cagtagcgcg gtggtcccac 1200

ctgaccccat gccgaactca gaagtgaaac gccgtagcgc cgatggtagt gtggggtctc 1260

cccatgcgag agtagggaac tgccaggcat caaataaaac gaaaggctca gtcgaaagac 1320

tgggcctttc gttttatctg ttgtttgc 1348

<210> 51

<211> 1348

<212> DNA

<213> Synthetic Sequence

<400> 51

ctgttttggc ggatgagaga agattttcag cctgatacag attaaatcag aacgcagaag 60

cggtctgata aaacagaatt tgcctggcgg cagtagcgcg gtggtcccac ctgaccccat 120

gccgaactca gaagtgaaac gccgtagcgc cgatggtagt gtggggtctc cccatgcgag 180

agtagggaac tgccaggcat caaataaaac gaaaggctca gtcgaaagac tgggcctttc 240

gttttatctg ttgtttgcgc tagcggatcc gcctatgcag cgacaaatat tgatagcctg 300

aatcagtatt gatctgctgg caagaacaga ctactgtata taaaaacagt ataacttcag 360

gcagattatt atggtgagca agggcgagga ggataacatg gccatcatca aggagttcat 420

gcgcttcaag gtgcacatgg agggctccgt gaacggccac gagttcgaga tcgagggcga 480

gggcgagggc cgcccctacg agggcaccca gaccgccaag ctgaaggtga ccaagggtgg 540

ccccctgccc ttcgcctggg acatcctgtc ccctcagttc atgtacggct ccaaggccta 600

cgtgaagcac cccgccgaca tccccgacta cttgaagctg tccttccccg agggcttcaa 660

gtgggagcgc gtgatgaact tcgaggacgg cggcgtggtg accgtgaccc aggactcctc 720

cctgcaggac ggcgagttca tctacaaggt gaagctgcgc ggcaccaact tcccctccga 780

cggccccgta atgcagaaga agaccatggg ctgggaggcc tcctccgagc ggatgtaccc 840

cgaggacggc gccctgaagg gcgagatcaa gcagaggctg aagctgaagg acggcggcca 900

ctacgacgct gaggtcaaga ccacctacaa ggccaagaag cccgtgcagc tgcccggcgc 960

ctacaacgtc aacatcaagt tggacatcac ctcccacaac gaggactaca ccatcgtgga 1020

acagtacgaa cgcgccgagg gccgccactc caccggcggc atggacgagc tgtacaagta 1080

agaattcccc ctgttttggc ggatgagaga agattttcag cctgatacag attaaatcag 1140

aacgcagaag cggtctgata aaacagaatt tgcctggcgg cagtagcgcg gtggtcccac 1200

ctgaccccat gccgaactca gaagtgaaac gccgtagcgc cgatggtagt gtggggtctc 1260

cccatgcgag agtagggaac tgccaggcat caaataaaac gaaaggctca gtcgaaagac 1320

tgggcctttc gttttatctg ttgtttgc 1348

<210> 52

<211> 1322

<212> DNA

<213> Synthetic Sequence

<400> 52

ctgttttggc ggatgagaga agattttcag cctgatacag attaaatcag aacgcagaag 60

cggtctgata aaacagaatt tgcctggcgg cagtagcgcg gtggtcccac ctgaccccat 120

gccgaactca gaagtgaaac gccgtagcgc cgatggtagt gtggggtctc cccatgcgag 180

agtagggaac tgccaggcat caaataaaac gaaaggctca gtcgaaagac tgggcctttc 240

gttttatctg ttgtttgcgc tagcggatcc tatctaacac cgtgcgtgtt gactatttta 300

cctctggcgg tgataatggt tgcatgtact aaggaggtac tagtatggtg agcaagggcg 360

aggaggataa catggccatc atcaaggagt tcatgcgctt caaggtgcac atggagggct 420

ccgtgaacgg ccacgagttc gagatcgagg gcgagggcga gggccgcccc tacgagggca 480

cccagaccgc caagctgaag gtgaccaagg gtggccccct gcccttcgcc tgggacatcc 540

tgtcccctca gttcatgtac ggctccaagg cctacgtgaa gcaccccgcc gacatccccg 600

actacttgaa gctgtccttc cccgagggct tcaagtggga gcgcgtgatg aacttcgagg 660

acggcggcgt ggtgaccgtg acccaggact cctccctgca ggacggcgag ttcatctaca 720

aggtgaagct gcgcggcacc aacttcccct ccgacggccc cgtaatgcag aagaagacca 780

tgggctggga ggcctcctcc gagcggatgt accccgagga cggcgccctg aagggcgaga 840

tcaagcagag gctgaagctg aaggacggcg gccactacga cgctgaggtc aagaccacct 900

acaaggccaa gaagcccgtg cagctgcccg gcgcctacaa cgtcaacatc aagttggaca 960

tcacctccca caacgaggac tacaccatcg tggaacagta cgaacgcgcc gagggccgcc 1020

actccaccgg cggcatggac gagctgtaca agtaagaatt ccccctgttt tggcggatga 1080

gagaagattt tcagcctgat acagattaaa tcagaacgca gaagcggtct gataaaacag 1140

aatttgcctg gcggcagtag cgcggtggtc ccacctgacc ccatgccgaa ctcagaagtg 1200

aaacgccgta gcgccgatgg tagtgtgggg tctccccatg cgagagtagg gaactgccag 1260

gcatcaaata aaacgaaagg ctcagtcgaa agactgggcc tttcgtttta tctgttgttt 1320

gc 1322

<210> 53

<211> 1337

<212> DNA

<213> Synthetic Sequence

<400> 53

ctgttttggc ggatgagaga agattttcag cctgatacag attaaatcag aacgcagaag 60

cggtctgata aaacagaatt tgcctggcgg cagtagcgcg gtggtcccac ctgaccccat 120

gccgaactca gaagtgaaac gccgtagcgc cgatggtagt gtggggtctc cccatgcgag 180

agtagggaac tgccaggcat caaataaaac gaaaggctca gtcgaaagac tgggcctttc 240

gttttatctg ttgtttgcgc tagcggatcc ggaaattaat acgactcact ataggggcgg 300

agtactgtcc tccgcccctg tagaaataat tttgtttaac tttaataagg agatatacca 360

tggtgagcaa gggcgaggag gataacatgg ccatcatcaa ggagttcatg cgcttcaagg 420

tgcacatgga gggctccgtg aacggccacg agttcgagat cgagggcgag ggcgagggcc 480

gcccctacga gggcacccag accgccaagc tgaaggtgac caagggtggc cccctgccct 540

tcgcctggga catcctgtcc cctcagttca tgtacggctc caaggcctac gtgaagcacc 600

ccgccgacat ccccgactac ttgaagctgt ccttccccga gggcttcaag tgggagcgcg 660

tgatgaactt cgaggacggc ggcgtggtga ccgtgaccca ggactcctcc ctgcaggacg 720

gcgagttcat ctacaaggtg aagctgcgcg gcaccaactt cccctccgac ggccccgtaa 780

tgcagaagaa gaccatgggc tgggaggcct cctccgagcg gatgtacccc gaggacggcg 840

ccctgaaggg cgagatcaag cagaggctga agctgaagga cggcggccac tacgacgctg 900

aggtcaagac cacctacaag gccaagaagc ccgtgcagct gcccggcgcc tacaacgtca 960

acatcaagtt ggacatcacc tcccacaacg aggactacac catcgtggaa cagtacgaac 1020

gcgccgaggg ccgccactcc accggcggca tggacgagct gtacaagtaa gaattccccc 1080

tgttttggcg gatgagagaa gattttcagc ctgatacaga ttaaatcaga acgcagaagc 1140

ggtctgataa aacagaattt gcctggcggc agtagcgcgg tggtcccacc tgaccccatg 1200

ccgaactcag aagtgaaacg ccgtagcgcc gatggtagtg tggggtctcc ccatgcgaga 1260

gtagggaact gccaggcatc aaataaaacg aaaggctcag tcgaaagact gggcctttcg 1320

ttttatctgt tgtttgc 1337

<210> 54

<211> 1339

<212> DNA

<213> Synthetic Sequence

<400> 54

ctgttttggc ggatgagaga agattttcag cctgatacag attaaatcag aacgcagaag 60

cggtctgata aaacagaatt tgcctggcgg cagtagcgcg gtggtcccac ctgaccccat 120

gccgaactca gaagtgaaac gccgtagcgc cgatggtagt gtggggtctc cccatgcgag 180

agtagggaac tgccaggcat caaataaaac gaaaggctca gtcgaaagac tgggcctttc 240

gttttatctg ttgtttgcgc tagcggatcc ggaaattaat acgactcact ataggggtcc 300

ctatcagtga tagagacccc tgtagaaata attttgttta actttaataa ggagatatac 360

catggtgagc aagggcgagg aggataacat ggccatcatc aaggagttca tgcgcttcaa 420

ggtgcacatg gagggctccg tgaacggcca cgagttcgag atcgagggcg agggcgaggg 480

ccgcccctac gagggcaccc agaccgccaa gctgaaggtg accaagggtg gccccctgcc 540

cttcgcctgg gacatcctgt cccctcagtt catgtacggc tccaaggcct acgtgaagca 600

ccccgccgac atccccgact acttgaagct gtccttcccc gagggcttca agtgggagcg 660

cgtgatgaac ttcgaggacg gcggcgtggt gaccgtgacc caggactcct ccctgcagga 720

cggcgagttc atctacaagg tgaagctgcg cggcaccaac ttcccctccg acggccccgt 780

aatgcagaag aagaccatgg gctgggaggc ctcctccgag cggatgtacc ccgaggacgg 840

cgccctgaag ggcgagatca agcagaggct gaagctgaag gacggcggcc actacgacgc 900

tgaggtcaag accacctaca aggccaagaa gcccgtgcag ctgcccggcg cctacaacgt 960

caacatcaag ttggacatca cctcccacaa cgaggactac accatcgtgg aacagtacga 1020

acgcgccgag ggccgccact ccaccggcgg catggacgag ctgtacaagt aagaattccc 1080

cctgttttgg cggatgagag aagattttca gcctgataca gattaaatca gaacgcagaa 1140

gcggtctgat aaaacagaat ttgcctggcg gcagtagcgc ggtggtccca cctgacccca 1200

tgccgaactc agaagtgaaa cgccgtagcg ccgatggtag tgtggggtct ccccatgcga 1260

gagtagggaa ctgccaggca tcaaataaaa cgaaaggctc agtcgaaaga ctgggccttt 1320

cgttttatct gttgtttgc 1339

<210> 55

<211> 237

<212> PRT

<213> Synthetic Sequence

<400> 55

Met Ser Thr Lys Lys Lys Pro Leu Thr Gln Glu Gln Leu Glu Asp Ala

1 5 10 15

Arg Arg Leu Lys Ala Ile Tyr Glu Lys Lys Lys Asn Glu Leu Gly Leu

20 25 30

Ser Gln Glu Ser Val Ala Asp Lys Met Gly Met Gly Gln Ser Gly Val

35 40 45

Gly Ala Leu Phe Asn Gly Ile Asn Ala Leu Asn Ala Tyr Asn Ala Ala

50 55 60

Leu Leu Ala Lys Ile Leu Lys Val Ser Val Glu Glu Phe Ser Pro Ser

65 70 75 80

Ile Ala Arg Glu Ile Tyr Glu Met Tyr Glu Ala Val Ser Met Gln Pro

85 90 95

Ser Leu Arg Ser Glu Tyr Glu Tyr Pro Val Phe Ser His Val Gln Ala

100 105 110

Gly Met Phe Ser Pro Glu Leu Arg Thr Phe Thr Lys Gly Asp Ala Glu

115 120 125

Arg Trp Val Ser Thr Thr Lys Lys Ala Ser Asp Ser Ala Phe Trp Leu

130 135 140

Glu Val Glu Gly Asn Ser Met Thr Ala Pro Thr Gly Ser Lys Pro Ser

145 150 155 160

Phe Pro Asp Gly Met Leu Ile Leu Val Asp Pro Glu Gln Ala Val Glu

165 170 175

Pro Gly Asp Phe Cys Ile Ala Arg Leu Gly Gly Asp Glu Phe Thr Phe

180 185 190

Lys Lys Leu Ile Arg Asp Ser Gly Gln Val Phe Leu Gln Pro Leu Asn

195 200 205

Pro Gln Tyr Pro Met Ile Pro Cys Asn Glu Ser Cys Ser Val Val Gly

210 215 220

Lys Val Ile Ala Ser Gln Trp Pro Glu Glu Thr Phe Gly

225 230 235

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号