技术领域
本发明涉及生物技术中的遗传工程或合成生物学领域,具体地涉及基因表达调控领域更具体地涉及细菌细胞中基于光敏蛋白的光控基因表达系统,及采用该表达系统调控细菌细胞中基因表达的方法。
背景技术
在遗传工程领域,准确控制基因的表达对于研究基因的功能以及生命体的生命活动均具有非常重要的意义。相对于真核细胞复杂的基因表达系统,细菌的基因表达系统则简单很多。以细菌中被使用最广泛的大肠杆菌为例,基因表达的第一步是由RNA聚合酶完成的DNA转录为RNA。大肠杆菌的RNA聚合酶有五个亚基组成,其分子量为约为480Kd,含有α,β,β’,σ等4种不同的多肽,其中α为两个分子,所以全酶(holoenzyme)的组成是α
细菌的基因表达系统主要分为两种,一种是组成型表达,即在不需要诱导的条件下,使目的蛋白自主连续性的表达。另一种是诱导表达系统,在诱导表达系统中,根据诱导物的不同又可分成化学小分子诱导表达系统和物理方法诱导表达系统两种。化学小分子诱导表达系统中,IPTG是最常用的一种诱导剂。IPTG作为乳糖的类似物,是一种极强的诱导剂,它不被细菌代谢且十分稳定。目前最常用的一些表达载体中,多数含T7启动子、Lac启动子、Tac启动子、grac启动子的,其诱导剂均是IPTG。阿拉伯糖和色氨酸诱导表达系统现在也越来越被更多的采用,小分子阿拉伯糖和色氨酸具有对细胞没有毒性且能达到紧密调控等优点。Mn
以上所述细菌诱导表达系统虽已获得较广泛应用,但是仍存在一些缺点:(1)诱导剂本身对细胞有较大的毒性、且价格偏贵(如IPTG),在制备医疗目的的重组蛋白时并不合适;(2)金属离子诱导表达系统中,金属离子感受蛋白识别金属离子的特异性不强,同一家族或同一周期的不同金属离子可被同一感受蛋白结合而激活转录,因此细菌细胞内部坏境中存在的多种金属离子会对转录产生一定的干扰,而且细菌细胞本身的氧化环境会对低价金属离子产生氧化作用,从而干扰对氧化环境要求较高的金属离子的激活转录;(3)温度诱导表达系统中,外界温度的升高会导致大肠杆菌的热休克蛋白激活,一些蛋白酶会影响产物的稳定,很多目的蛋白质在高温下也难以正确折叠,因而UV诱导的囚笼技术可能造成对细胞的不可逆性损伤;(4)最重要的是,化学诱导物只能在时间上调节基因的表达,不能在空间上特异性调控某些细胞及组织的基因表达。
然而,光是一种易于时间和空间操作的诱导物,一般对细胞无上述毒性,且易获取。近些年来,人们也发现了一些生物体内调节生物钟系统中存在光可调节蛋白(也称为光敏蛋白),光照对其功能存在重要的影响。我们设想通过分子设计的方法,改造天然存在的转录因子去合成具有光反应性的人工转录因子,进而在细菌细胞中构建光调控基因表达系统。Anselm Levskaya等在2005年报道了一个基于光敏色素Cph1和大肠杆菌自身EnvZ/OmpR双组分信号通路的光调控蛋白质表达系统[Levskaya,A.等,Nature,2005.438(7067):p.441-2.][2]。在黑暗条件下,光敏转录因子发生自磷酸化后结合到OmpR依赖的ompC启动子上,从而启动目的基因的转录与表达。在红光的照射下,光敏转录因子的自磷酸化作用被抑制,不能结合到ompC启动子,因而不能激活目的基因的转录与表达。随后的几年里,同一研究小组对这种光激活表达系统进行了一些改变,得到可用多种颜色的光共同调节目的蛋白表达的系统[Tabor,J.J.等,J Mol Biol,2011.405(2):p.315-24,Tabor,J.J.等,Cell,2009.137(7):p.1272-81.][3,4]。Keith Moffat课题组开发了另一个新的重组光敏转录因子YF1,它是基于来自枯草芽孢杆菌(Bacillus subtilis)的YtvA蓝光光敏蛋白和来自慢生根瘤菌(Bradyrhizobium japonicum)的FixL蛋白构建而成[Moglich,A.等,J Mol Biol,2009.385(5):p.1433-44,Ohlendorf,R.等,J Mol Biol,2012.416,534-542.][5,6]。基于YF1的光激活基因表达系统在蓝光存在的情况下目的蛋白的表达受到抑制,没有蓝光存在时目的基因则高水平表达。Christopher A Voigt课题组在2017年结合以上的进展设计了一种基因编码系统,使大肠杆菌能够区分红色、绿色和蓝色(RGB)并通过改变基因表达做出响应[Fernandez-Rodriguez J等,Nat Chem Biol,2017.13(7):p.706-708][7]。然而,这些原核基因表达系统都有较大的局限性。基于光敏色素Cph1的系统非常复杂,除了需要光敏转录因子和报告系统外,还需要引入ho1和pcyA两个基因才能将血红素(haem)转化成系统正常工作所必需的藻蓝素(phycocyanobilin),大大增加了构建系统时的工作量。基于光敏转录因子YF1的系统在蓝光照射下依旧有较多的泄漏表达,诱导倍数仅有几十倍,这样就不能对目的基因的表达量进行非常精确的调控。以上所述缺点限制了这两个光激活表达系统在细菌中的使用。
2016年,Jayaraman等人开发了基于EL222的细菌光激活和光抑制基因表达系统,该系统只含EL222单个光控转录因子,当其与启动子-35区上游结合后会通过招募RNA聚合酶其他组分来激活目的基因的转录与表达,激活倍数约为5倍;当转录因子与EL222与启动子的-35和-10区之间的区域结合,目的基因的表达受到抑制,抑制倍数不足3倍。该系统的基因表达系统倍数明显偏低,并没有实际的使用价值。同年,杨弋课题组陈显军等人开发了基于单组份光敏转录因子的大肠杆菌光控基因表达系统LightOff,该系统的诱导倍数可达近10000倍,极低的本底泄漏表达和与T7启动子类似的激活表达水平。该系统具有快速诱导动力学及良好的可逆性,并且对基因表达调控存在光强依赖性。同时还可通过更换VVD突变体来调节系统的可逆性和光灵敏性。为避免细菌内野生型LexA蛋白干扰,将LexA蛋白的DNA结合结构域及其识别的SOS框突变成LexA
综上所述,从2005年至今科学家开发出多个大肠杆菌光控基因表达系统,而这些系统存在着组份复杂、依赖外源辅因子、诱导倍数低、光抑制基因表达等缺点。根据人们的操作习惯,更希望给光之后开启目的基因表达,而不是光抑制基因表达,此外,光激活基因表达系统允许我们能够随时观察研究对象的状态,避免使用光抑制基因表达系统时避光操作的不便,从而广泛用于研究细菌的各种生命活动以及绿色生物制造中。
到目前为止,除了上述系统使用的Cph1和YtvA光敏蛋白外,已知的其它光敏蛋白还有:以黄素类物质为生色团的光敏蛋白(亦称为黄素蛋白家族蓝光受体),分为三类:一是含光-氧-电压(light-oxygen-voltage,LOV)结构域的光受体蛋白,如光敏色素;二是类似光裂解酶的隐花色素(photolyase-like cryptochromes);第三类是近些年来才发现的利用FAD的蓝光蛋白(blue light using FAD,BLUF)。
光敏色素是含LOV结构域的光受体蛋白质最多的一类,研究较多的有phot1、WC-1、WC-2、PYP(光敏黄色蛋白,photoactive yellow protein)、Phy3、VIVID、RsLOV、DsLOV、EL222等。光敏色素通常是膜偶联激酶蛋白,在蓝光照射下发生自磷酸化改变激酶活性而调控相关的生理过程。大多数光敏色素的C端为丝氨酸/苏氨酸激酶结构域N端为结合黄素分子的两个LOV结构域,蓝光照射时LOV结构域与黄素分子共价结合生成黄色-半胱酰胺加成产物引起黄素结合口袋空间构象变化,导致C端激酶结构域改变其激酶活性,但此过程完全可逆。迄今,在真核生物细胞中已建立的最成功的光激活表达系统正是基于VIVID光敏蛋白。Yang课题组[Wang,X.等,Nat Methods,2012.p.266-269.][8]利用粗糙链孢霉菌的VIVID蓝光光敏蛋白经蓝光照射后会形成同源二聚体的原理构建了一个真核光调控基因表达系统。在这个系统中,光敏转录因子由三个或者四个多肽组成,蓝光照射后重组光敏转录因子的二聚化能力发生变化,二聚化的转录因子可结合于靶转录单元核苷酸序列中的反应元件,并通过该融合蛋白的第三多肽的转录激活/阻遏结构域和募集的宿主细胞本身的其它转录辅因子,一起协同作用于该靶转录单元中的启动子,从而调节(启动或阻遏)目的基因的转录和表达。该系统组分简单且具有诱导迅速、诱导倍数高、可逆性好、时间和空间特异性高等优点而被认为是迄今最优秀的真核生物细胞基因表达系统。但遗憾的是,由于细菌和真核生物细胞的转录翻译机理的不同,因此该系统不能应用于细菌中。此外,MasayukiYazawa等[Yazawa,M.等,Nat Biotechnol,2009.27(10):p.941-5.][9]利用拟南芥的FKF1(flavin-binding,kelch repeat,f box 1)与GI(GIGANTEA)蛋白二者经蓝光激发后可发生相互作用的原理也构建了一个真核光调控基因表达系统,但其低诱导倍数和稍显复杂的系统组分大大限制了它的应用。Laura B Motta-Mena等利用含LOV结构域的DNA结合蛋白EL222构建了具有快速激活(<10s)和失活(<50s)动力学特性的光激活基因表达系统
来自拟南芥(Arabidopsis thaliana)的隐花色素是第一个被分离得到的植物蓝光光敏蛋白,研究比较多的有隐花色素1(Cryptochromes 1,CRY1)、隐花色素2(Cryptochromes2,CRY2)、光敏色素A(phytochrome A,phyA)和光敏色素B(phytochrome B,phyB)等,主要功能是接受昼夜节律光调节高等植物的生长和运动。隐花色素的氨基酸序列和生色团组成与光裂解蛋白很相似,多数隐花色素的大小为70kD-80kD,包含相对保守的N端PHR(光裂酶相关)结构域和长度差异较大的C端未知结构域,其PHR结构域可非共价结合黄素。有研究利用拟南芥CRY2(隐花色素2)与CIB1(隐花色素2相互作用的螺旋环螺旋)蛋白二者经蓝光激发后可发生相互作用,构建了一个真核生物细胞内的光激活表达系统[Kennedy,M.J.等,Nat Methods,2010.7(12):p.973-5.][10]。
包含BLUF结构域的蓝光受体蛋白和包含LOV结构域的光受体蛋白与隐花色素不同的是,前者光照激活后不会与黄素生色团反应生成共价产物,而是导致生色团构象变化引起黄色吸收光发生10nm红移。包含BLUF结构域的光受体蛋白研究最多的是AppA,它是球状红杆菌(Rhodobacter sphaeroides)的一种转录抗阻遏蛋白,黑暗时AppA与细胞中的一种PpsR转录因子结合形成AppA-PpsR
Haifeng Ye等人[Ye,H.等,Science,2011.332(6037):p.1565-8.][12]利用黑视素(melanopsin)及细胞内信号通路构建得到一个蓝光激发的真核生物细胞光激活表达系统。黑视素是一种在某些视网膜细胞表面的感光色素。在蓝光存在下,黑视素会触发钙离子快速地涌入细胞内,经过细胞内一系列信号级联反应后,钙调蛋白(calmodulin)激活具有丝氨酸/苏氨酸磷酸酶活性的钙调神经磷酸酶(calcineurin),后者将转录因子NFAT去磷酸化,去磷酸化的NFAT转录因子进入细胞核内与NFAT特异性的启动子结合后启动目的基因的转录与表达。该系统最大的缺点是系统复杂且参与了细胞内的信号通路,因而系统本身稳定性差,并且有可能通过影响细胞的信号通路而影响细胞的正常生命活动。
相对于真核生物细胞,细菌具有增殖快、培养成本低、能够高效表达外源蛋白(甚至可以达到细菌总蛋白量的90%以上)等多种优点,这些优点使得细菌更适合作为大量表达目的蛋白的宿主细胞。然而如上所述,目前已有的广泛用于细菌的基因表达系统大多数采用化学诱导剂调控,虽然其诱导效果较好,背景低、表达强度高,但许多系统具有多效性因而副作用广泛并有潜在的细胞毒性。更为重要的是,化学诱导剂不能在空间上精确调控基因的表达;而物理方法(如温度)调节基因表达的系统目前很少,且温度的升高带来的副作用很多。少数几种基于光敏蛋白的基因表达系统,由于系统本身的复杂性或者诱导倍数低等原因限制了其应用。
综上所述,我们认为有可能综合这些系统的优点在细菌中创造出一种新的更优秀的光控基因表达系统,以克服前人研究的缺陷而广泛用于生物医药研究中。经过潜心研究,发明了一种新型的细菌光控基因表达系统,它具有良好的基因表达调控能力,可以在时间和空间上共同调控基因的表达。
因此,本发明的第一个目的是提供一种新型细菌光控基因表达系统。
本发明的第二个目的是提供用所述光控基因表达系统调节细菌细胞中基因表达的方法。
本发明的第三个目的是提供含有所述光控基因表达系统的细菌表达载体。
本发明的第四个目的是提供所述光控基因表达系统在调节细菌的生命活动(如细菌的移动、分裂等)上的用途。
本发明的第五个目的是提供装有所述细菌光控基因表达系统的表达载体或基因组上整合了所述表达系统中光敏转录因子表达框的细菌菌株的试剂盒。
发明概述
本发明涉及提供一种细菌光控基因表达系统,包括:a)重组光敏转录因子编码基因,所述重组光敏转录因子包括作为DNA结合结构域的第一多肽和作为光敏结构域的第二多肽,其中所述第二多肽选自球形红假单胞菌的LOV结构域RsLOV和海洋玫瑰杆菌的LOV结构域DsLOV及其截短体或氨基酸序列15%-99%相同或氨基酸序列36%-99%相似的突变体;b)靶转录单元,包括被第一多肽识别/结合的包含至少一个反应元件的启动子或启动子-反应元件或反应元件-启动子和待转录核酸序列。
本发明的细菌光控基因表达系统中,重组光敏转录因子是一种重组光敏DNA结合蛋白,在光照前后这种光敏DNA结合蛋白与相应反应元件的结合能力发生显著变化,从而直接启动或者抑制目的基因的转录与翻译。
重组光敏转录因子的第一多肽为DNA结合结构域,它能够特异性地识别反应元件,单独不能够结合到反应元件上或者是结合能力很弱,需要第二多肽来辅助其结合到反应元件。第一多肽与第二多肽之间可操作性连接。
第一多肽可选自螺旋-转角-螺旋DNA结合结构域、锌指基序或锌簇DNA结合结构域、亮氨酸拉链DNA结合结构域、翼状螺旋DNA结合结构域、翼状螺旋-转角-螺旋DNA结合结构域、螺旋-环-螺旋DNA结合结构域、高迁移率族DNA结合结构域、B3 DNA结合结构域。第二多肽为光敏结构域,通常来自以黄素类为生色团的光敏蛋白。第一多肽和第二多肽之间可以直接连接,也可操作性地通过接头肽连接。接头肽的氨基酸个数是可变的(如0-10个或更多)。
第一多肽可进一步选自大肠杆菌LexA
第二多肽选自含黄素类生色团的光敏蛋白的光敏结构域和含LOV结构域的光敏蛋白的光敏结构域。进一步可选自球形红假单胞菌的RsLOV和志贺氏杆菌的DsLOV结构域及其截短体或氨基酸序列15%-99%相同或氨基酸序列36%-99%相似的突变体。
本发明的细菌光控基因表达系统中,靶转录单元中的启动子-待转录核酸序列之间,或者启动子-反应元件-待转录核酸序列之间,或者反应元件-启动子与待转录核酸序列之间均可直接或操作性连接。
所述反应元件为可被第一多肽特异性识别和结合的DNA基序。反应元件选自LexA
所述启动子选自大肠杆菌的colE
按照本发明的细菌光控基因表达系统,重组光敏转录因子还可进一步包含附加的多肽,如可以招募RNA聚合酶其他组分的第三多肽。第三多肽与第一、第二多肽可直接连接或通过接头肽连接。第三肽可选自大肠杆菌的ω因子、α因子或氨基酸序列36%-99%相似的突变体。
本发明还涉及含有本发明的光控基因表达系统的细菌表达载体。所述表达载体可以是单独含有重组光敏转录因子编码基因的细菌表达载体,也可以是单独含有靶转录单元的细菌表达载体,所述靶转录单元中含有启动子但待转录核酸序列空缺或启动子-反应元件但待转录核酸序列空缺或反应元件-启动子但待转录核酸序列空缺。或者,也可以是同时含有重组光敏转录因子编码基因和靶转录单元的细菌表达载体。
所述表达载体中的所述重组光敏转录因子编码基因选自序列22,23,24,25,26,27,28,29,30,31,32,33,34,35,36,37,38,39,40,41,42,43,44,45,46。
本发明还涉及基因组上整合了本发明的光控基因表达系统中光敏转录因子表达框的细菌菌株。
本发明也涉及用本发明的光控基因表达系统在细菌细胞中调控基因表达的方法,包括以下步骤:
a)将所述细菌光控基因表达系统构建在细菌表达载体中;
b)引入含被调控基因的细菌细胞;和
c)光照诱导所述细菌细胞,使细菌细胞中的被调控的核苷酸进行表达。
本发明的在细菌中调控基因表达的方法,涉及光源的选择和照射方法的选择。光源非限制地包括LED灯、白炽灯、荧光灯、激光;照射方法包括光照量、光照时间、光照强度及光照频率的选定。用扫描、投影、光模具等方法在空间上控制目的基因的表达也包含在本发明范围中。
本发明还涉及用本发明的光控基因表达系统来调控细菌生命活动的方法,如移动、分裂等。
本发明还涉及一种试剂盒,该试剂盒装有含本发明光控基因表达系统的细菌(如大肠杆菌)表达载体或基因组上整合了本发明光控基因表达系统中光敏转录因子表达框的细菌菌株,及相应的说明书。本发明试剂盒中的细菌表达载体所包含的靶转录单元中待转录核酸序列可以是空缺的。
发明详述
本发明提供一种基于光敏多肽的、光控的细菌基因表达系统,用于在时间和空间上调节目的基因在细菌细胞中基因的表达。本发明的光控基因表达系统涉及至少两个部分:第一部分是能够在细菌细胞中表达的重组光敏转录因子融合蛋白的编码核苷酸序列,该融合蛋白由两个多肽组成,其中第一多肽是其DNA识别/结合域,第二多肽为光敏多肽;第二部分是由含启动子-待转录核苷酸序列或者启动子-反应元件-待转录核苷酸序列或者反应元件-启动子-待转录核苷酸序列组成的靶转录单元核苷酸序列,其中反应元件是与上述重组光敏转录因子融合蛋白第一多肽所识别/结合的DNA核苷酸序列。第一部分的两个多肽优选采用有关蛋白的截短的功能活性片段(即结构域)。可通过基因工程技术将本发明的光控基因表达系统的第一部分和第二部分构建在一个细菌表达载体中或分别构建在二个细菌表达载体中。在具体使用过程中,利用常规转化的方法将上述的两个组分转化到细菌细胞中去,或者将第一部分利用常规的基因敲除的方法整合到细菌细胞的基因组上去,使之表达本发明的重组光敏转录因子融合蛋白,用适当波长的光照射可导致其第二光敏多肽二聚化能力改变,二聚化的光敏多肽可以结合到本发明第二部分靶转录单元核苷酸序列中的反应元件上去,通过阻碍RNA聚合酶与启动子区域的结合来直接抑制下游目的基因的转录和表达,或者通过招募RNA聚合酶的其他组分到启动子区域来启动下游基因的转录与表达。
本发明提供的这种细菌光控基因表达系统,可利用不会损伤细胞的光照射,在时间上和空间上调节目的蛋白基因在细菌细胞中的表达。
本发明的这种细菌光控基因表达系统,可利用不同的光照强度等光照条件的差异来调节目的蛋白基因在细菌细胞中的表达。
本发明的这种细菌光控基因表达系统,可通过光来诱导一些蛋白的表达来控制细菌的生命活动,如运动、分裂等。所用的光廉价、易于获得、对细胞没有毒性。
“宿主细胞”在本专利中特指细菌细胞,可以是原始的未经改造的细菌细胞,也可以是基因组经过改造的商业化细菌菌株,如实验室常用的TOP10、BL21(DE3)、JM109(DE3)、Mach1等,也可以是在这些商业化菌株的基础上再进行基因组改造的得到的细菌菌株,如本发明中敲除了基因组中ftsz基因得到的TOP10(ftsz
“目的蛋白”也可称为“感兴趣蛋白”,指任何有用的蛋白,例如可用于预防或治疗目的或其他用途的、需要在大肠杆菌细胞中表达的有用生物蛋白质,包括天然的或人工修饰或突变的有用蛋白质。
“报告蛋白”为目的蛋白的一种,指其表达容易被检测的有用蛋白质。为便于检测本发明基于光敏多肽的、光可诱导的目的蛋白基因表达系统的效果,可以选择以下已知的广泛应用的报告蛋白:红色荧光蛋白(mCherry)等。但本发明的光可诱导目的蛋白基因表达系统不限于表达报告蛋白,而可用于表达任何有用的目的蛋白。
“基因”、蛋白质的“编码核苷酸序列”、“待转录核苷酸序列”在本文中含义相同可互换使用,指天然或重组的携带蛋白质氨基酸序列信息密码子的DNA序列。
“目的蛋白基因”、“目的蛋白的编码核苷酸序列”或简称为“目的基因”在本文中含义相同,可互换使用,指编码目的蛋白的基因,通常为脱氧核糖核酸DNA双链序列。这种基因可包含在宿主细胞的基因组DNA序列中或包含在人工构建的表达载体中,如本发明的靶转录单元序列中。同样,“报告基因”指编码报告蛋白的基因。
“转录”在本文中专指细菌细胞中通过RNA聚合酶将目的基因转录产生携带该基因信息的RNA。
“表达”、“目的蛋白基因表达”、“基因表达”在本文中含义相同可互换使用,指目的基因的DNA序列转录产生携带该基因信息的RNA(mRNA或反义RNA)和该RNA携带的信息在核糖体中被翻译产生目的蛋白二者,即转录产生信息RNA和翻译产生目的蛋白都叫做表达。本文包括这二种含义,主要指产生目的蛋白。
“转录调节”本文专门指细菌细胞中基因转录的调节。
“转录因子”或“转录因子融合蛋白”在本文中含义相同可互换使用,指细菌的转录因子,一般情况下是一个蛋白质,可以是天然的或人工改造的或人为融合的,包括能识别/结合靶转录单元核苷酸序列中的反应元件的多肽,通过与靶转录单元中反应元件的结合和相互作用,本身就能或者募集RNA聚合酶其他组分一起调节目的蛋白基因的转录。转录因子视其组成的不同可分为“转录激活因子”或“转录抑制因子”,二者简称“转录因子”。
“靶转录单元”指人造的由含反应元件的启动子和目的基因组成的DNA序列(不是蛋白质),其中反应元件位于启动子序列内部或者位于启动子的-35区的上游或者位于启动子-10区的下游,目的基因位于启动子下游,彼此可直接相连或操作性(即可隔开若干个核苷酸)相连。
“反应元件”指转录因子特异性识别/结合的一个或多个顺式DNA基序,不同的转录因子有与其相对应的不同的反应元件,转录因子包含能与这种DNA基序结合的结合结构域。当转录因子与其相对应的反应元件特异性结合后,该反应元件即向启动子传达反应性,转录因子本身就可以或者通过招募RNA聚合酶的其他组分一起抑制或者激活启动子活性,阻碍或激活下游目的基因转录产生相应的RNA。在本发明中,反应元件指能够与重组光敏转录因子的第一多肽特异性识别/结合的DNA基序,例如LexA
“启动子”指启动和指导其下游目的基因转录产生RNA的DNA序列,它是基因表达不可缺少的重要调控序列。启动子可以是天然基因的启动子或人工修饰的启动子。细菌的启动子是由两段彼此分开且又高度保守的核苷酸序列组成,对mRNA的合成极为重要。在转录起始点上游5~10bp处,有一段由6~8个碱基组成,富含A和T的区域,称为Pribnow盒,又名TATA盒或-10区。来源不同的启动子,Pribnow盒的碱基顺序稍有变化。在距转录起始位点上游35bp处,有一段由10bp组成的区域,称为-35区。转录时大肠杆菌RNA聚合酶识别并结合启动子。-35区与RNA聚合酶σ亚基结合,-10区与RNA聚合酶的核心酶结合,在转录起始位点附近DNA被解旋形成单链,RNA聚合酶使第一和第二核苷酸形成磷酸二酯键,以后在RNA聚合酶作用下向前推进,形成新生的RNA链。
“载体”、“表达载体”、“基因表达载体”、“重组基因表达载体”或“质粒”在本文中含义相同可互换使用,指能在细菌细胞中表达重组目的蛋白的载体。
“转化”指利用化学方法或者物理方法使外源质粒DNA分子进入细菌细胞中。具体的方法可参见Sambrooka等人(分子克隆实验手册,第二版,冷泉港出版社(1989)),和其它有关教材。
本发明的光控细菌基因表达系统中,第一部分的重组光敏转录因子是由两种或三种功能性多肽片段直接通过肽键串联连接或通过短肽接头串联连接形成的融合蛋白。在黑暗条件下,该融合蛋白形成同源二聚体结合于本发明第二部分靶转录单元核苷酸序列的反应元件,并通过其自身或者募集宿主细胞中RNA聚合酶其他组分,一起协同作用于启动子区域,从而阻遏靶转录单元中目的蛋白基因的转录与表达。在适当波长的光照射下,该融合蛋白由二聚体解聚成单体,进而从本发明第二部分靶转录单元核苷酸序列的反应元件上解离下来,从而启动靶转录单元中目的蛋白基因的转录与表达。并通过其自身或者募集宿主细胞中RNA聚合酶其他组分,一起协同作用于启动子区域,从而阻遏或启动靶转录单元中目的蛋白基因的转录与表达。
本文中,“重组光敏转录因子融合蛋白”与“重组光敏转录因子”含义相同,可互换使用。
本发明的重组光敏转录因子含有第一多肽,该多肽虽能特异性识别所述靶转录单元核苷酸序列中的反应元件但不能与其结合或结合能力弱,只有在第二多肽的协助下同源二聚化后方能结合反应元件;该多肽可衍生自任何已知的蛋白质DNA识别/结合结构域,优选氨基酸序列更短的DNA识别/结合结构域,包括天然的和合成的这种DNA识别/结合域或其类似物(如保留了甚至增强了结合能力的结合域突变体或截短体)。可用作本发明的第一多肽选自螺旋-转角-螺旋DNA结合结构域、锌指基序或锌簇DNA结合结构域、亮氨酸拉链DNA结合结构域、翼状螺旋DNA结合结构域、翼状螺旋-转角-螺旋DNA结合结构域、螺旋-环-螺旋DNA结合结构域、高迁移率族DNA结合结构域、B3 DNA结合结构域。第一多肽优选包括但不限于:LexA
LexA蛋白是存在于大肠杆菌细胞内的一种转录抑制因子,能调控细胞内20多种基因的转录,同源二聚化后的LexA二聚体能够识别/结合启动子中的反应元件16个碱基的CTGT(N)
cI蛋白是λ噬菌体cI基因编码的一种转录抑制因子,它可以阻止λ左、λ右两个早期起动子的转录导致不能产生复制及细胞裂解的蛋白。cI蛋白含有236个氨基酸,其N端为DNA识别/结合域(1-102位氨基酸)和C端为二聚化域(132-236位氨基酸)。cI蛋白同源二聚体识别/结合P
Gal4是酿酒酵母(Saccharomyces cerevisiae)菌的转录激活蛋白(其编码基因写成GAL4),能识别/结合基因启动子的上游反应元件-激活基序UAS
448-50.,Marmorstein,R.等,Nature,1992.356(6368):p.408-14.][17,18]。基于GAL4/UAS的双杂交系统是用于研究基因表达的一种有效工具。例如,普洛麦格公司(Promega)公司生产的哺乳动物双杂交系统(CheckMate
TetR阻遏蛋白是存在于很多革兰阴性菌中的一种转录因子,通过结合特定DNA基序抑制相关基因的转录。TetR蛋白的N端为DNA识别/结合域和C端为二聚化域。单体TetR蛋白可形成同质二聚体而识别/结合含有特定DNA序列的操纵子上,单体TetR几乎无结合能力[Wissmann,A.等.,EMBO J 10(13),4145-4152(1991),Ramos,J.L.等.,Microbiol MolBiol Rev 69(2),326-356(2005)][19,20]。
在本发明一优选实施方式中,第一多肽为LexA
本发明的光控基因表达系统中,重组光敏转录因子中的第二多肽是光敏多肽,选自球形红假单胞菌的RsLOV(其氨基酸序列为序列11)和志贺氏杆菌的DsLOV(其氨基酸序列为序列12)结构域。经适当波长光照射后,第二多肽的二聚化能力发生改变,使转录因子的二聚化能力发生变化,二聚化的转录因子结合于相对应的反应元件,从而直接调节目的基因的表达水平。
球形红杆菌的RsLOV蛋白N端和C端的螺旋延伸在其二聚界面处形成一些不寻常的螺旋束,与感觉视紫红质Ⅱ的螺旋转换器有些相似。蓝光激活的RsLOV构象变化,从光明和黑暗晶体结构的比较中揭示了LOV域蛋白的共同信号机制即光激活黄素-半胱氨酰光加合物的形成。加合物的形成破坏了RsLOV活性位点的氢键并促进了LOV结构域核心向N端和C端延伸传播的结构变化。在RsLOV蛋白的活性位点和二聚界面进行单点突变会改变光化产物的寿命并诱导结构的改变从而扰动寡聚物的状态。尺寸排阻色谱法,多角度光散射,小角度X射线散射和交联研究表明RsLOV在黑暗中二聚化,但在光激发下,解离成单体。RsLOV以独特的组合提供作为光控开关用于控制细胞过程的新功能[Conrad,K.S.,等.Biochemistry,2013.52(2):p.378-91][21]。
来自于光和异养的海洋α-变形细菌Dinoroseobacter shibae的DsLOV蛋白表现出平均加合物在20℃时的寿命为9.6s,是目前为止报道的LOV域蛋白恢复时间最快的。对DsLOV的突变分析揭示了在没有蓝光照射下的DsLOV在控制感光色素形成中的独特作用。在1.5埃分辨率下测定的黑暗状态下DsLOV的晶体结构揭示了保守性核心域和一个延伸的N端帽子。晶体结构的二聚体界面形成了一个独特的氢键网,涉及N端残基和β支架的核心区域。光激活的DsLOV结构表明N-帽区域的灵活性增加以及LOV核心结构域的N端和C端末端的β链的Cα主链发生显着变化。DsLOV以独特的光物理特性和调控功能,使其一种新的有前景的模型系统[Endres,S.,等,BMC Microbiol,2015.15:p.30.][22]。
以上所述第二多肽中,RsLOV和DsLOV用适当波长光照射可使由其构成的重组光敏转录因子二聚化减弱,导致其脱离反应元件上,从而开启下游基因的转录;而黑暗时二聚化而结合反应元件,从而抑制下游基因的转录。
本发明的光控基因表达系统中,重组光敏转录因子还可包括第三多肽,该多肽可以招募RNA聚合酶其他组分。可用作本发明的第三多肽包括但不限于:来自大肠杆菌的ω因子结构域和α因子结构域,这两种结构域在先前的大肠杆菌单杂交系统中已广泛被人们采用[Dove,S.L.等,1998.12(5):p.745-54,Dove,S.L.等,Nature,1997.386(6625):p.627-30.][23,24]。第三多肽可与第一、第二多肽直接或通过接头肽相连。
如上所述,重组光敏转录因子所含的两种或三种多肽之间可以有多种选择,将两种或者三种多肽连接成融合蛋白又可以有多种组合选择,本发明优选具有良好活性的两种或者三种多肽的功能结构域片段制备尽可能短的重组转录因子融合蛋白,通过在细菌细胞中选择对目的基因的表达调控效果好的,即光照和黑暗时导致目的基因表达量差异大的该光敏转录因子,以调节目的基因的表达,但不论何种选择与组合,只要能实现本发明所设想的光调控基因表达性能的的重组光敏转录因子,各种组合都包含在本发明的范围内。
本发明的细菌光控基因表达系统中,第二部分靶转录单元由转录因子特异性识别/结合的启动子-待转录核苷酸序列组成,或由启动子-反应元件-待转录核苷酸序列组成,或由反应元件-启动子-待转录核苷酸序列组成。其中启动子或启动子-反应元件或反应元件-启动子的核苷酸序列视不同实施方式所选重组光敏转录因子的第一多肽不同而不同。换言之,必须根据所选择的第一多肽来选择与其相对应的启动子或者启动子-反应元件或者反应元件-启动子序列。例如,第一多肽为LexA
本发明中与光敏转录因子相对应的反应元件一般是包含在启动子核苷酸序列内部,或者位于启动子的-10区下游,光敏转录因子与之结合后通过阻止RNA聚合酶与启动子区域的结合而下调下游目的基因的转录。在本发明具体的实施方式中,启动子是大肠杆菌colE
本领域技术人员知道,所谓“操作性连接”指反应元件与启动子之间或多个反应元件之间不是直接相连而可以隔开若干个核苷酸,只要仍能协同作用即可。
本发明靶转录单元启动子下游是待转录的核苷酸序列,指编码目的蛋白的核苷酸序列。如上所述,目的蛋白可以是目前已知和将来发现的任何有用的蛋白。为了验证本发明系统的效果和便于检测,在本发明的实施例中,采用了示范性的报告蛋白:红色荧光蛋白mCherry(其氨基酸序列为序列21)作为目的蛋白,但本发明的目的蛋白不限于这些报告蛋白。
可用标准重组DNA技术将本发明光控基因表达系统的第一部分和第二部分构建在一个细菌表达载体中或分别构建在二个细菌表达载体中。可用标准技术将这种表达载体引入各种细菌细胞中以表达所需目的蛋白。
本发明提供含有所述两种或者三种多肽各种组合的多种重组光敏转录因子基因的细菌表达载体。在本发明一优选实施方式中,提供含不同LexA
本发明提供含待转录核苷酸序列空缺的靶转录单元的细菌表达载体,待转录的核苷酸序列空缺是让用户可以自行选择所需的待转录的核苷酸序列,例如目的蛋白的编码基因,用标准的重组DNA技术将其插入本发明的这种表达载体中,通过上面所述重组光敏转录因子来调节待转录核苷酸序列(基因)的表达。在本发明的一些实施方式中,细菌表达载体的靶转录单元中空缺的待转录核苷酸序列分别是:LexA
本发明也提供分别转化了各种重组光敏转录因子基因的细菌表达载体或者基因组上整合了各种重组光敏转录因子表达框的细菌菌株,同时提供含有启动子或启动子-反应元件或反应元件-启动子而待转录核苷酸序列空缺的细菌表达载体。用户可用标准重组DNA技术将自行选择的待转录核苷酸序列(目的蛋白基因)插入该表达载体中,然后用该重新构建的载体转化已转化了各种重组光敏转录因子基因的细菌表达载体或者基因组上已整合了各种重组光敏转录因子表达框的细菌菌株,并培养这种细菌细胞表达他们所需的目的基因,或供他们研究如何调节目的基因的表达。
本发明还提供装有各种表达载体或已转化了这种载体或者基因组上整合了各种重组光转录因子表达框的细菌细胞的试剂盒。在一个实施方式中,该试剂盒中一些容器分别装有含一种或多种重组光敏转录因子基因的细菌表达载体。在另一个实施方式中,该试剂盒中的一些容器分别装有含一种或多种重组光敏转录因子基因的细菌表达载体,另一些容器分别装有含靶转录单元(其中启动子-待转录核苷酸序列空缺或启动子-反应元件-待转录核苷酸序列空缺或反应元件-启动子-待转录核苷酸序列空缺)的细菌表达载体。在还有一个实施方式中,该试剂盒中一些容器装有已转化了含重组光敏转录因子基因的细菌表达载体或者基因组上已整合了各种重组光敏转录因子表达框的细菌细胞,另一些容器装有启动子-待转录核苷酸序列空缺或者启动子-反应元件-待转录核苷酸序列空缺或者反应元件-启动子-待转录核苷酸序列空缺的细菌表达载体。本发明的试剂盒还可以包含相应的光照控制设备,例如LED灯及其调控装置。所有试剂盒都装有相应的说明书,以说明盒中的各成分、使用目的和使用方法,并提供有关的参考文献目录。
本发明还包括光控基因表达系统在细菌细胞中调控基因表达的方法,包括步骤:
a)将所述细菌光控基因表达系统构建在细菌表达载体中;
b)引入含被调控基因的细菌细胞;和
c)光照诱导所述细菌细胞,使所述细菌细胞中的被调控的核苷酸进行表达。
光照诱导所述细菌细胞的方法包括光源的选择和光源的使用。光源非限制地包括LED灯、白炽灯、荧光灯、激光。在本发明的一个实施方式中,光源选用蓝色LED(460-470nm)。光照方法包括光照量、光照强度、光照时间、光照频率以及用扫描、投影、光模具等方法在空间上控制目的基因的表达也包含在本发明范围中。在本发明的一个实施方式中,光照强度为0-30mW/cm
附图简要说明
图1光控基因表达系统质粒图谱。
图2以LexA、cI、Gal4和TetR为第一多肽的光敏转录因子的细菌表达载体的构建
图3含DsLOV为第二多肽的光敏转录因子的细菌表达载体的构建
图4以ω因子和α因子为光敏转录因子第三多肽的细菌表达载体的构建
图5分别构建含有LexA、cI、Gal4和TetR相对应反应元件的靶转录单元的细菌表达载体
图6光敏转录因子中不同linker的性质
图7光敏转录因子前不同SD序列的性质
图8对含有SD2、3、7、17和37的光控系统中的光敏转录因子进行Western blot验证。
图9含有SD2、17、37光控系统的光激活动力学
图10含有SD2、17、37光控系统的光依赖性曲线
图11光控系统在空间上对目的基因的表达调控
图12光控系统在不同菌株中的适用性
图13光控大肠杆菌分裂
图14光控大肠杆菌移动
图15利用光控基因表达系统构建基因回路
具体实施方式
以下用实施例对本发明作进一步阐述。这些实施例仅仅用于举例说明,而不对本发明的范围构成任何限制。实施例中主要采用常规的基因工程分子生物学克隆方法,这些方法是本领域普通技术人员所熟知的,例如:简·罗斯凯姆斯等的《分子生物学实验参考手册》和J.萨姆布鲁克,D.W.拉塞尔著,黄培堂等译:《分子克隆实验指南》(第三版,2002年8月,科学出版社出版,北京)中的有关章节。本领域普通技术人员按照以下实施例,不难根据具体情况略作修改和变换而成功实施本发明,这些修改和变换均落在本申请权利要求的范围内。
实施例中所用的pCDFDuet1质粒载体购自Novagen公司,pRSETb、pBAD/His A质粒载体购自Invitrogen公司,pKD3、pKD4、pCP20、pKD46由华东理工大学鲍杰老师实验室慷慨馈赠。所有用于PCR的引物均由上海杰瑞生物工程技术有限公司合成、纯化和经质谱法鉴定正确。实施例中构建的表达质粒都经过序列测定,序列测定由华大基因公司和杰李测序公司完成。各实施例所用的Taq DNA聚合酶购自东盛生物,pfu DNA聚合酶购自天根生化科技(北京)有限公司,PrimeSTAR DNA聚合酶购自TaKaRa公司,三种聚合酶购买时都附带赠送对应聚合酶缓冲液和dNTP。BamHI、BglII、HindIII、NdeI、XhoI、SacI、EcoRI、SpeI等限制性内切酶、T4连接酶、T4磷酸化酶(T4 PNK)购自Fermentas公司,购买时附带有相对应的缓冲液等。实施例中所用的CloneEZ PCR克隆试剂盒(含同源重组酶)购自南京金斯瑞生物科技有限公司(原金思特科技(南京)有限公司)。除非特别声明,无机盐类化学试剂均购自国药集团上海化学试剂公司。卡那霉素(Kanamycin)购自Ameresco公司;氨苄青霉素(Amp)购自Ameresco公司;链霉素购自Ameresco公司;ONPG购自Ameresco公司;384孔发光检测白板、384孔荧光检测黑板购自Grenier公司。
实施例中所用的DNA纯化试剂盒购自BBI公司(加拿大),普通质粒小抽试剂盒购自天根生化科技(北京)有限公司。克隆菌株Mach1购自Invitrogen公司。JM109(DE3)表达菌株购自Promega公司,BL21(DE3)菌株购自Novagen公司。
实施例中用到的主要仪器:Biotek Synergy 2多功能酶标仪(美国Bio-Tek公司),X-15R高速冷冻离心机(美国Beckman公司),Microfuge22R台式高速冷冻离心机(美国Beckman公司),PCR扩增仪(德国Biometra公司),活体成像系统(美国Kodak公司),光度计(日本和光公司),核酸电泳仪(申能博彩公司)。
缩写词意义如下:“h”指小时,“min”指分钟,“s”指秒,“d”指天,“μL”指微升,“ml”指毫升,“L“指升,“bp”指碱基对,“mM”指毫摩尔,“μM”指微摩尔。
20种氨基酸及简称
实施例中用到的常规分子生物学方法
(一)聚合酶链式反应(PCR):
1.目的片段扩增PCR:
扩增步骤(bp表示扩增片段的核苷酸数量):
2.长片段(>2500bp)扩增PCR:
扩增步骤(bp表示扩增片段的核苷酸数量):
或者
(二)核酸内切酶酶切反应:
1.对质粒载体进行双酶切的体系(n代表使体系达到总体积所需要加入的灭菌超纯水μL量):
2.对PCR产物片段进行双酶切的体系(n含义同上):
3.将双酶切后PCR产物片段连接入双酶切后的质粒载体成环的体系:
注:PCR产物片段与载体双酶切产物的质量比大致在2:1—6:1之间。
(三)DNA片段5’端磷酸化反应然后自身环化反应:
从微生物中抽提出的质粒或者基因组末端都含有磷酸基团,而PCR产物没有,故需对PCR产物的5’端碱基进行磷酸基团加成反应,只有末端含有磷酸基团DNA分子才能发生连接反应。自身环化连接反应指线性化载体的3’端和5’端连接反应。
T4 PNK为T4多聚核苷酸激酶的简写,用于对DNA分子的5’端磷酸基团的加成反应。使5’端磷酸化的DNA片段产物自身环化的反应体系:
(四)重叠PCR
重叠PCR是常用的将两段不同或相同的基因连接起来的方法。例如图1,将基因AD和基因BC连接起来,首先设计两对引物A、D和C、B,分别用来扩增基因AD和BC,在引物D和引物C的5’端含有一定长度的互补序列。第一轮PCR得到的扩增产物AD和BC经过回收后作为第二轮PCR的模板。
第二轮按常规PCR流程扩增10轮,PCR体系为:
第二轮PCR后加入引物A和引物B,再继续扩增30轮即可得到AD和BC连接了的序列。
(五)反向PCR
反向PCR是下述实施例中用于定点突变、截短突变、插入突变所用到的一种技术。其基本原理参考Takara公司的MutaBEST试剂盒的实验流程。如图2所示,在对应的变异部位设计反向PCR引物,其中一条引物的5’端包含变异的核苷酸序列。扩增后的产物经过胶回收纯化后,进行5’端磷酸化反应然后自身环化反应,转化入感受态细胞。
(六)感受态细胞的制备与转化
感受态细胞的制备:
1.挑取单菌落(如Mach1)接种于5mL LB培养基中,37℃摇床过夜。
2.取0.5-1ml过夜培养的菌液转种到50mL LB培养基中,37℃,220rpm/min培养3至5h,直到OD
3.冰浴预冷细胞2h。
4.4℃4000rpm/min离心10min。
5.弃上清,用5ml预冷的重悬缓冲液悬浮细胞,待均匀后再加入重悬缓冲液至终体积为50mL。
6.冰浴45min。
7.4℃4000rpm/min离心10min,用5mL冰预冷的储存缓冲液重悬细菌。
8.每个EP管中放100μL菌液,-80℃或液氮冻存。
重悬缓冲液:CaCl
储存缓冲液:0.5mL DMSO、1.9mL 80%甘油、1mL 10×CaCl
1.取100μl感受态细胞于冰浴上融化。
2.加入适当体积的连接产物,轻轻吹打混匀,冰浴30min。通常加入的连接产物的体积少于感受态细胞体积的1/10。
3.将菌液放入42℃水浴中热激90秒,迅速转移至冰浴中放置5min。
4.加入500μl LB,于37℃恒温摇床上200转培养1h。
5.将菌液4000rpm/min离心3min,留200μl上清将菌体吹匀,均匀涂布于含适当抗生素的琼脂平板表面,平板于37℃恒温培养箱内倒置过夜。
(七)大肠杆菌表达的mCherry荧光蛋白的检测
从转化大肠杆菌平板上分别挑取相应的单克隆接种48孔板中培养,每孔的LB为1000μl,每个样品重复6个,37℃培养过夜。按照1:200稀释到另一块每孔含1000μl新鲜LB的48孔板中。如无特殊指明,培养的条件都是37℃,摇床的转速为250rpm,光照强度为3mW/cm
(八)大肠杆菌基因组敲除
1.将pKD46质粒转化将要进行基因敲出的目标菌株中,在含氨苄抗性的培养皿上30℃培养过夜。
2.从平板上挑取单克隆到含5ml新鲜LB和氨苄抗性的LB培养基中培养过夜。
3.将过夜培养的试管菌以1:100的量加入事先配置好的50ml 2xYT培养基中,30℃培养至OD
4.将诱导后的培养基在冰上放置1h,然后于4℃4000rpm离心10min后弃上清,用20ml预冷的ddH
5.吸取10μl用于基因敲除的线性化基因片段到感受态溶液中,混匀后迅速加入到电转杯中,放于电转仪中进行电转,电转结束后立即加入500μl新鲜LB培养基,于37℃复苏培养1-2h。
6.4000rpm离心涂含相应抗性的培养板,37℃培养过夜,第二天进行鉴定。
实施例1光控基因表达系统质粒的构建
LexA
实施例2以LexA、cI、Gal4和TetR为第一多肽的光敏转录因子的细菌表达载体的构建
为了构建以LexA、cI、Gal4和TetR为第一多肽的光诱导转录因子的大肠杆菌表达载体,从质粒pLEVI-mCherry(本实验室收藏,相关文章:Chen,X.等,Cell Research,2016.)中扩增获得LexA,从λ噬菌体基因组中PCR扩增cI(1-102)基因片段,以pBIND质粒(Promega公司)为模板扩增Gal4(1-65)DNA结合结构域基因片段,TetR的DNA结合结构域基因片段(1-63位氨基酸)基因片段由上海捷瑞生物有限公司全基因合成,分别将LexA、cI、Gal4和TetR与RsLOV基因(无锡青兰生物科技有限公司合成)融合构建光敏转录因子,质粒图谱如图2所示。
实施例3含DsLOV为第二多肽的光敏转录因子的细菌表达载体的构建
在无锡青兰生物科技有限公司合成DsLOV基因,利用重叠PCR技术将DsLOV基因分别与实施例1和2中的LexA
实施例4以ω因子和α因子为光敏转录因子第三多肽的细菌表达载体的构建从大肠杆菌BL21(DE3)基因组中扩增ω因子和α因子基因片段,利用重叠PCR技术分别将ω因子和α因子基因片段与实施例1和2中的LexA
实施例5分别构建含有LexA、cI、Gal4和TetR相对应反应元件的靶转录单元的细菌表达载体
从JM109(DE3)菌株的基因组中扩增得到sulA、RecA和umuDC启动子基因片段,采用重叠PCR将sulA、RecA和umuDC启动子基因片段和mCherry基因片段连接在一起,得到三种含LexA相对应反应元件的靶转录单元。经重叠PCR得到P
实施例6含不同linker的转录因子筛选
为了提高光敏转录因子的特性,我们对阻遏蛋白LexA
实施例7光控系统调控动力学的微调
在linker为26R的基础上,通过改变光敏转录因子基因上游的SD序列来调节光敏转录因子的表达量,获得了一系列本底和最大激活水平不同的样品,如图7A,B所示。相对应的SD序列如表7C所示。我们选择含有SD2,3,7,17,37的光控系统检测光敏转录因子的含量。结果表明,光敏转录因子表达水平在这些系统之间存在显著差异。本底较高的光控系统显示出较低的光敏转录因子表达量,而本底较低的光控系统显示出较高的光敏转录因子表达量,如图8所示。推测光敏转录因子的高表达导致同源二聚体的形成与光照无关,即使在光照条件下也抑制了启动子的活性。相反,光敏转录因子的低表达不能形成足够数量的同源二聚体来抑制启动子的活性,从而在黑暗条件下产生较高的背景噪音。因此,可以通过调节转录因子的表达水平来高度调节光控系统的调控能力。
实施例8光控系统的性质
首先研究系统的光激活动力学,将一级菌黑暗培养过夜,二级菌初始OD
进一步检测系统的光强依赖性,将一级菌黑暗培养过夜,二级菌置于不同强度的蓝光下培养15h后检测mCherry表达量。结果如图10所示,分别含有SD2、SD17和SD37的系统表现出的光敏性k值(光激活最大程度一半时的光强)分别为1.312mW/cm
为了研究光敏转录因子在空间上对目的基因表达的调节,以荧光蛋白mCherry作为报告基因。配制含1%琼脂、0.5%蛋白胨、0.25%酵母提取粉和0.5%NaCl的固体培养基,经高温高压灭菌后待冷却至45度左右时,将黑暗下培养的转化有含SD17的系统质粒的大肠杆菌加入到还未凝固的固体培养基中混合均匀,然后倾倒平板。在平板的底部粘贴具有一定图案的打印膜片来控制接受光照的区域,调节光照强度,将平板倒置培养,培养约15h后使用天能成像仪对平板成像。成像结果如图11所示,平板中目的基因的表达与打印膜片图案相一致,荧光成像结果图片上白色区域表示报告基因表达量高,黑色区域表示报告基因表达量很低,并对成像结果中报告基因表达量进行定量分析,结果表明光控基因表达系统可以在空间上精确调控目的基因表达。
为了检测光控基因表达系统在不同菌株中的适用性,将含有SD17的系统质粒转化到实验室常用的菌株中,转化的平板于黑暗中培养过夜,在红光下挑取单克隆到48孔板中于黑暗条件下培养过夜作为一级菌,然后二级接菌初始OD
实施例9光控大肠杆菌分裂
构建FtsZ基因敲除的TOP10菌株和含有SD17并且FtsZ作为报告基因的光控质粒。将构建成功的质粒转化到敲除FtsZ的TOP10菌株中,在合适光强的蓝光下培养平板,然后挑取单克隆到试管中光照培养至OD
实施例10光控大肠杆菌移动
检测光控系统对大肠杆菌移动的调节,构建含有SD2并且报告基因是CheZ的光控质粒,配制含1%Trptone、0.5%NaCl和0.25%Agar的半固体培养基,经高温高压灭菌后,待冷却到50度以下时加入相应的抗性混匀,在培养皿中倒板,室温下放置1h待其冷却。将构建的光控质粒转化到敲除CheZ基因的JM109(DE3,ΔsulA,ΔLexA,ΔcheZ)菌种(本实验室收藏,相关文章:Chen,X.等,Cell Research,2016.)中,一级于黑暗条件下培养,第二天按照1:200的比例稀释到新鲜培养基中继续黑暗培养。待OD
实施例11利用光控基因表达系统构建基因回路
利用蓝光和阿拉伯糖作为双输入信号构建N-IMPLY逻辑门,构建含有SD2并且报告基因是cI(氨基酸序列为55)的光控质粒,光控阻遏蛋白cI的表达,LasI的表达由阿拉伯糖诱导,在报告质粒中PR启动子控制LasR表达,PlasI启动子控制目的基因mCherry表达。光照条件下cI表达,抑制LasR的表达,导致PlasI启动子不能启动下游基因表达,因此在N-IMPLY逻辑门中只要输入蓝光信号,目的基因mCherry就不会表达。在黑暗条件下,阻遏蛋白cI不表达,启动子PR启动LasR的转录,加入阿拉伯糖诱导LasI蛋白表达,合成信号分子AHL(3OC12HSL),信号分子AHL结合并激活LasR蛋白,LasR-AHL的复合物结合到启动子PlasI中的转录调控区,从而启动报告基因mCherry的表达,如图15所示。
应该理解,在实施例或实验材料方法中所显示的成分用量、反应条件等数字或是本说明书所使用的其它参数均为近似值(除非特别注明),可根据所需要获得的结果而加以改变。并且,这些参数并非用来限定本发明保护范围,而是应用正常的操作技术下所得到的较佳数据。除非另行定义,文中所使用的所有专业与科学用语术与本领域技术人员所熟悉的意义相同。此外,任何与所记载内容相似或均等的方法及材料及均可以应用于本发明中。文中本说明书中所述的较佳实验方法与材料仅作为示范之用。本说明书提及的所有文献都全文引入作为参考。此外应该理解,在阅读了本发明的上述内容后,本领域的技术人员可以对本发明作各种改动或修改,这些等价形式同样落在本申请所附权利要求书所限定的范围内。
序列表
<110> 华东理工大学
<120> 细菌光控基因表达系统及其调控基因表达的方法
<130> 2020.1.19
<160> 55
<170> SIPOSequenceListing 1.0
<210> 1
<211> 87
<212> PRT
<213> Synthetic Sequence
<400> 1
Met Lys Ala Leu Thr Ala Arg Gln Gln Glu Val Phe Asp Leu Ile Arg
1 5 10 15
Asp His Ile Ser Gln Thr Gly Met Pro Pro Thr Arg Ala Glu Ile Ala
20 25 30
Gln Arg Leu Gly Phe Arg Ser Ala Ser Ser Ala Glu Glu His Leu Lys
35 40 45
Ala Leu Ala Arg Lys Gly Val Ile Glu Ile Val Ser Gly Ala Ser Arg
50 55 60
Gly Ile Arg Leu Leu Gln Glu Glu Glu Glu Gly Leu Pro Leu Val Gly
65 70 75 80
Arg Val Ala Ala Gly Glu Pro
85
<210> 2
<211> 87
<212> PRT
<213> Synthetic Sequence
<400> 2
Met Lys Ala Leu Thr Ala Arg Gln Gln Glu Val Phe Asp Leu Ile Arg
1 5 10 15
Asp His Ile Ser Gln Thr Gly Met Pro Pro Thr Arg Ala Glu Ile Ala
20 25 30
Gln Arg Leu Gly Phe Arg Ser Pro Asn Ala Ala Glu Glu His Leu Lys
35 40 45
Ala Leu Ala Arg Lys Gly Val Ile Glu Ile Val Ser Gly Ala Ser Arg
50 55 60
Gly Ile Arg Leu Leu Gln Glu Glu Glu Glu Gly Leu Pro Leu Val Gly
65 70 75 80
Arg Val Ala Ala Gly Glu Pro
85
<210> 3
<211> 102
<212> PRT
<213> Synthetic Sequence
<400> 3
Met Ser Thr Lys Lys Lys Pro Leu Thr Gln Glu Gln Leu Glu Asp Ala
1 5 10 15
Arg Arg Leu Lys Ala Ile Tyr Glu Lys Lys Lys Asn Glu Leu Gly Leu
20 25 30
Ser Gln Glu Ser Val Ala Asp Lys Met Gly Met Gly Gln Ser Gly Val
35 40 45
Gly Ala Leu Phe Asn Gly Ile Asn Ala Leu Asn Ala Tyr Asn Ala Ala
50 55 60
Leu Leu Ala Lys Ile Leu Lys Val Ser Val Glu Glu Phe Ser Pro Ser
65 70 75 80
Ile Ala Arg Glu Ile Tyr Glu Met Tyr Glu Ala Val Ser Met Gln Pro
85 90 95
Ser Leu Arg Ser Glu Tyr
100
<210> 4
<211> 65
<212> PRT
<213> Synthetic Sequence
<400> 4
Met Lys Leu Leu Ser Ser Ile Glu Gln Ala Cys Asp Ile Cys Arg Leu
1 5 10 15
Lys Lys Leu Lys Cys Ser Lys Glu Lys Pro Lys Cys Ala Lys Cys Leu
20 25 30
Lys Asn Asn Trp Glu Cys Arg Tyr Ser Pro Lys Thr Lys Arg Ser Pro
35 40 45
Leu Thr Arg Ala His Leu Thr Glu Val Glu Ser Arg Leu Glu Arg Leu
50 55 60
Glu
65
<210> 5
<211> 63
<212> PRT
<213> Synthetic Sequence
<400> 5
Met Ser Arg Leu Asp Lys Ser Lys Val Ile Asn Ser Ala Leu Glu Leu
1 5 10 15
Leu Asn Glu Val Gly Ile Glu Gly Leu Thr Thr Arg Lys Leu Ala Gln
20 25 30
Lys Leu Gly Val Glu Gln Pro Thr Leu Tyr Trp His Val Lys Asn Lys
35 40 45
Arg Ala Leu Leu Asp Ala Leu Ala Ile Glu Met Leu Asp Arg His
50 55 60
<210> 6
<211> 16
<212> DNA
<213> Synthetic Sequence
<220>
<221> misc_feature
<222> (5)..(12)
<223> n is a, c, g, or t
<400> 6
ccgtnnnnnn nnacgg 16
<210> 7
<211> 16
<212> DNA
<213> Synthetic Sequence
<220>
<221> misc_feature
<222> (5)..(12)
<223> n is a, c, g, or t
<400> 7
ctgtnnnnnn nnacag 16
<210> 8
<211> 64
<212> DNA
<213> Synthetic Sequence
<400> 8
tatcaccgca agggataaat atctaacacc gtgcgtgttg actattttac ctctggcggt 60
gata 64
<210> 9
<211> 19
<212> DNA
<213> Synthetic Sequence
<220>
<221> misc_feature
<222> (5)..(6)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (10)..(10)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (12)..(12)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (14)..(14)
<223> n is a, c, g, or t
<220>
<221> misc_feature
<222> (16)..(16)
<223> n is a, c, g, or t
<400> 9
cggrnnrcyn ynyncnccg 19
<210> 10
<211> 19
<212> DNA
<213> Synthetic Sequence
<400> 10
tccctatcag tgatagaga 19
<210> 11
<211> 178
<212> PRT
<213> Synthetic Sequence
<400> 11
Met Ala Met Asp Gln Lys Gln Phe Glu Lys Ile Arg Ala Val Phe Asp
1 5 10 15
Arg Ser Gly Val Ala Leu Thr Leu Val Asp Met Ser Leu Pro Glu Gln
20 25 30
Pro Leu Val Leu Ala Asn Pro Pro Phe Leu Arg Met Thr Gly Tyr Thr
35 40 45
Glu Gly Gln Ile Leu Gly Phe Asn Cys Arg Phe Leu Gln Arg Gly Asp
50 55 60
Glu Asn Ala Gln Ala Arg Ala Asp Ile Arg Asp Ala Leu Lys Leu Gly
65 70 75 80
Arg Glu Leu Gln Val Val Leu Arg Asn Tyr Arg Ala Asn Asp Glu Pro
85 90 95
Phe Asp Asn Leu Leu Phe Leu His Pro Val Gly Gly Arg Pro Asp Ala
100 105 110
Pro Asp Tyr Phe Leu Gly Ser Gln Phe Glu Leu Gly Arg Ser Gly Asn
115 120 125
Ser Glu Glu Ala Ala Ala Ala Gly His Ala Gly Ala Leu Thr Gly Glu
130 135 140
Leu Ala Arg Ile Gly Thr Val Ala Ala Arg Leu Glu Met Asp Ser Arg
145 150 155 160
Arg His Leu Ala Gln Ala Ala Ala Ala Leu Val Arg Ala Trp Glu Arg
165 170 175
Arg Gly
<210> 12
<211> 146
<212> PRT
<213> Synthetic Sequence
<400> 12
Met Arg Arg His Tyr Arg Asp Leu Ile Arg Asn Thr Pro Met Pro Asp
1 5 10 15
Thr Pro Gln Asp Ile Ala Asp Leu Arg Ala Leu Leu Asp Glu Asp Glu
20 25 30
Ala Glu Met Ser Val Val Phe Ser Asp Pro Ser Gln Pro Asp Asn Pro
35 40 45
Thr Ile Tyr Val Ser Asp Ala Phe Leu Val Gln Thr Gly Tyr Thr Leu
50 55 60
Glu Glu Val Leu Gly Arg Asn Cys Arg Phe Leu Gln Gly Pro Asp Thr
65 70 75 80
Asn Pro His Ala Val Glu Ala Ile Arg Gln Gly Leu Lys Ala Glu Thr
85 90 95
Arg Phe Thr Ile Asp Ile Leu Asn Tyr Arg Lys Asp Gly Ser Ala Phe
100 105 110
Val Asn Arg Leu Arg Ile Arg Pro Ile Tyr Asp Pro Glu Gly Asn Leu
115 120 125
Met Phe Phe Ala Gly Ala Gln Asn Pro Val Leu Glu His His His His
130 135 140
His His
145
<210> 13
<211> 152
<212> DNA
<213> Synthetic Sequence
<400> 13
tgtttttttg atcgttttca caaaaatgga agtccacagt cttgacaggg aaaatgcagc 60
ggcgtagctt ttatgccgta tataaaaacg gcgtttatat gtacggtatt tatttttaac 120
ttattgtttt aaaagtcaaa gaggatttta ta 152
<210> 14
<211> 152
<212> DNA
<213> Synthetic Sequence
<400> 14
tgtttttttg atcgttttca caaaaatgga agtccacagt cttgacaggg aaaatgcagc 60
ggcgtagctt ttatgctgta tataaaacca gtggttatat gtacagtatt tatttttaac 120
ttattgtttt aaaagtcaaa gaggatttta ta 152
<210> 15
<211> 71
<212> DNA
<213> Synthetic Sequence
<400> 15
atagggttga tctttgttgt cactggatgt actgtacatc catacagtaa ctcacagggg 60
ctggattgat t 71
<210> 16
<211> 100
<212> DNA
<213> Synthetic Sequence
<400> 16
caatttctac aaaacacttg atactgtatg agcatacagt ataattgctt caacagaaca 60
tattgactat ccggtattac ccggcatgac aggagtaaaa 100
<210> 17
<211> 100
<212> DNA
<213> Synthetic Sequence
<400> 17
gcctatgcag cgacaaatat tgatagcctg aatcagtatt gatctgctgg caagaacaga 60
ctactgtata taaaaacagt ataacttcag gcagattatt 100
<210> 18
<211> 74
<212> DNA
<213> Synthetic Sequence
<400> 18
tatctaacac cgtgcgtgtt gactatttta cctctggcgg tgataatggt tgcatgtact 60
aaggaggtac tagt 74
<210> 19
<211> 81
<212> DNA
<213> synthetic sequence
<400> 19
ttaatacgac tcactatagg gagaccacaa cggtttccct ctagaaataa ttttgtttaa 60
ctttaagaag gagatataca t 81
<210> 20
<211> 47
<212> DNA
<213> Synthetic Sequence
<400> 20
ttatcacttg aaattggaag ggagattctt tattataaga attgtgg 47
<210> 21
<211> 236
<212> PRT
<213> Synthetic Sequence
<400> 21
Met Val Ser Lys Gly Glu Glu Asp Asn Met Ala Ile Ile Lys Glu Phe
1 5 10 15
Met Arg Phe Lys Val His Met Glu Gly Ser Val Asn Gly His Glu Phe
20 25 30
Glu Ile Glu Gly Glu Gly Glu Gly Arg Pro Tyr Glu Gly Thr Gln Thr
35 40 45
Ala Lys Leu Lys Val Thr Lys Gly Gly Pro Leu Pro Phe Ala Trp Asp
50 55 60
Ile Leu Ser Pro Gln Phe Met Tyr Gly Ser Lys Ala Tyr Val Lys His
65 70 75 80
Pro Ala Asp Ile Pro Asp Tyr Leu Lys Leu Ser Phe Pro Glu Gly Phe
85 90 95
Lys Trp Glu Arg Val Met Asn Phe Glu Asp Gly Gly Val Val Thr Val
100 105 110
Thr Gln Asp Ser Ser Leu Gln Asp Gly Glu Phe Ile Tyr Lys Val Lys
115 120 125
Leu Arg Gly Thr Asn Phe Pro Ser Asp Gly Pro Val Met Gln Lys Lys
130 135 140
Thr Met Gly Trp Glu Ala Ser Ser Glu Arg Met Tyr Pro Glu Asp Gly
145 150 155 160
Ala Leu Lys Gly Glu Ile Lys Gln Arg Leu Lys Leu Lys Asp Gly Gly
165 170 175
His Tyr Asp Ala Glu Val Lys Thr Thr Tyr Lys Ala Lys Lys Pro Val
180 185 190
Gln Leu Pro Gly Ala Tyr Asn Val Asn Ile Lys Leu Asp Ile Thr Ser
195 200 205
His Asn Glu Asp Tyr Thr Ile Val Glu Gln Tyr Glu Arg Ala Glu Gly
210 215 220
Arg His Ser Thr Gly Gly Met Asp Glu Leu Tyr Lys
225 230 235
<210> 22
<211> 265
<212> PRT
<213> Synthetic Sequence
<400> 22
Met Lys Ala Leu Thr Ala Arg Gln Gln Glu Val Phe Asp Leu Ile Arg
1 5 10 15
Asp His Ile Ser Gln Thr Gly Met Pro Pro Thr Arg Ala Glu Ile Ala
20 25 30
Gln Arg Leu Gly Phe Arg Ser Ala Ser Ser Ala Glu Glu His Leu Lys
35 40 45
Ala Leu Ala Arg Lys Gly Val Ile Glu Ile Val Ser Gly Ala Ser Arg
50 55 60
Gly Ile Arg Leu Leu Gln Glu Glu Glu Glu Gly Leu Pro Leu Val Gly
65 70 75 80
Arg Val Ala Ala Gly Glu Pro Met Ala Met Asp Gln Lys Gln Phe Glu
85 90 95
Lys Ile Arg Ala Val Phe Asp Arg Ser Gly Val Ala Leu Thr Leu Val
100 105 110
Asp Met Ser Leu Pro Glu Gln Pro Leu Val Leu Ala Asn Pro Pro Phe
115 120 125
Leu Arg Met Thr Gly Tyr Thr Glu Gly Gln Ile Leu Gly Phe Asn Cys
130 135 140
Arg Phe Leu Gln Arg Gly Asp Glu Asn Ala Gln Ala Arg Ala Asp Ile
145 150 155 160
Arg Asp Ala Leu Lys Leu Gly Arg Glu Leu Gln Val Val Leu Arg Asn
165 170 175
Tyr Arg Ala Asn Asp Glu Pro Phe Asp Asn Leu Leu Phe Leu His Pro
180 185 190
Val Gly Gly Arg Pro Asp Ala Pro Asp Tyr Phe Leu Gly Ser Gln Phe
195 200 205
Glu Leu Gly Arg Ser Gly Asn Ser Glu Glu Ala Ala Ala Ala Gly His
210 215 220
Ala Gly Ala Leu Thr Gly Glu Leu Ala Arg Ile Gly Thr Val Ala Ala
225 230 235 240
Arg Leu Glu Met Asp Ser Arg Arg His Leu Ala Gln Ala Ala Ala Ala
245 250 255
Leu Val Arg Ala Trp Glu Arg Arg Gly
260 265
<210> 23
<211> 267
<212> PRT
<213> Synthetic Sequence
<400> 23
Met Lys Ala Leu Thr Ala Arg Gln Gln Glu Val Phe Asp Leu Ile Arg
1 5 10 15
Asp His Ile Ser Gln Thr Gly Met Pro Pro Thr Arg Ala Glu Ile Ala
20 25 30
Gln Arg Leu Gly Phe Arg Ser Ala Ser Ser Ala Glu Glu His Leu Lys
35 40 45
Ala Leu Ala Arg Lys Gly Val Ile Glu Ile Val Ser Gly Ala Ser Arg
50 55 60
Gly Ile Arg Leu Leu Gln Glu Glu Glu Glu Gly Leu Pro Leu Val Gly
65 70 75 80
Arg Val Ala Ala Gly Glu Pro Val Phe Met Ala Met Asp Gln Lys Gln
85 90 95
Phe Glu Lys Ile Arg Ala Val Phe Asp Arg Ser Gly Val Ala Leu Thr
100 105 110
Leu Val Asp Met Ser Leu Pro Glu Gln Pro Leu Val Leu Ala Asn Pro
115 120 125
Pro Phe Leu Arg Met Thr Gly Tyr Thr Glu Gly Gln Ile Leu Gly Phe
130 135 140
Asn Cys Arg Phe Leu Gln Arg Gly Asp Glu Asn Ala Gln Ala Arg Ala
145 150 155 160
Asp Ile Arg Asp Ala Leu Lys Leu Gly Arg Glu Leu Gln Val Val Leu
165 170 175
Arg Asn Tyr Arg Ala Asn Asp Glu Pro Phe Asp Asn Leu Leu Phe Leu
180 185 190
His Pro Val Gly Gly Arg Pro Asp Ala Pro Asp Tyr Phe Leu Gly Ser
195 200 205
Gln Phe Glu Leu Gly Arg Ser Gly Asn Ser Glu Glu Ala Ala Ala Ala
210 215 220
Gly His Ala Gly Ala Leu Thr Gly Glu Leu Ala Arg Ile Gly Thr Val
225 230 235 240
Ala Ala Arg Leu Glu Met Asp Ser Arg Arg His Leu Ala Gln Ala Ala
245 250 255
Ala Ala Leu Val Arg Ala Trp Glu Arg Arg Gly
260 265
<210> 24
<211> 267
<212> PRT
<213> Synthetic Sequence
<400> 24
Met Lys Ala Leu Thr Ala Arg Gln Gln Glu Val Phe Asp Leu Ile Arg
1 5 10 15
Asp His Ile Ser Gln Thr Gly Met Pro Pro Thr Arg Ala Glu Ile Ala
20 25 30
Gln Arg Leu Gly Phe Arg Ser Ala Ser Ser Ala Glu Glu His Leu Lys
35 40 45
Ala Leu Ala Arg Lys Gly Val Ile Glu Ile Val Ser Gly Ala Ser Arg
50 55 60
Gly Ile Arg Leu Leu Gln Glu Glu Glu Glu Gly Leu Pro Leu Val Gly
65 70 75 80
Arg Val Ala Ala Gly Glu Pro Asn Tyr Met Ala Met Asp Gln Lys Gln
85 90 95
Phe Glu Lys Ile Arg Ala Val Phe Asp Arg Ser Gly Val Ala Leu Thr
100 105 110
Leu Val Asp Met Ser Leu Pro Glu Gln Pro Leu Val Leu Ala Asn Pro
115 120 125
Pro Phe Leu Arg Met Thr Gly Tyr Thr Glu Gly Gln Ile Leu Gly Phe
130 135 140
Asn Cys Arg Phe Leu Gln Arg Gly Asp Glu Asn Ala Gln Ala Arg Ala
145 150 155 160
Asp Ile Arg Asp Ala Leu Lys Leu Gly Arg Glu Leu Gln Val Val Leu
165 170 175
Arg Asn Tyr Arg Ala Asn Asp Glu Pro Phe Asp Asn Leu Leu Phe Leu
180 185 190
His Pro Val Gly Gly Arg Pro Asp Ala Pro Asp Tyr Phe Leu Gly Ser
195 200 205
Gln Phe Glu Leu Gly Arg Ser Gly Asn Ser Glu Glu Ala Ala Ala Ala
210 215 220
Gly His Ala Gly Ala Leu Thr Gly Glu Leu Ala Arg Ile Gly Thr Val
225 230 235 240
Ala Ala Arg Leu Glu Met Asp Ser Arg Arg His Leu Ala Gln Ala Ala
245 250 255
Ala Ala Leu Val Arg Ala Trp Glu Arg Arg Gly
260 265
<210> 25
<211> 267
<212> PRT
<213> Synthetic Sequence
<400> 25
Met Lys Ala Leu Thr Ala Arg Gln Gln Glu Val Phe Asp Leu Ile Arg
1 5 10 15
Asp His Ile Ser Gln Thr Gly Met Pro Pro Thr Arg Ala Glu Ile Ala
20 25 30
Gln Arg Leu Gly Phe Arg Ser Ala Ser Ser Ala Glu Glu His Leu Lys
35 40 45
Ala Leu Ala Arg Lys Gly Val Ile Glu Ile Val Ser Gly Ala Ser Arg
50 55 60
Gly Ile Arg Leu Leu Gln Glu Glu Glu Glu Gly Leu Pro Leu Val Gly
65 70 75 80
Arg Val Ala Ala Gly Glu Pro Lys Pro Met Ala Met Asp Gln Lys Gln
85 90 95
Phe Glu Lys Ile Arg Ala Val Phe Asp Arg Ser Gly Val Ala Leu Thr
100 105 110
Leu Val Asp Met Ser Leu Pro Glu Gln Pro Leu Val Leu Ala Asn Pro
115 120 125
Pro Phe Leu Arg Met Thr Gly Tyr Thr Glu Gly Gln Ile Leu Gly Phe
130 135 140
Asn Cys Arg Phe Leu Gln Arg Gly Asp Glu Asn Ala Gln Ala Arg Ala
145 150 155 160
Asp Ile Arg Asp Ala Leu Lys Leu Gly Arg Glu Leu Gln Val Val Leu
165 170 175
Arg Asn Tyr Arg Ala Asn Asp Glu Pro Phe Asp Asn Leu Leu Phe Leu
180 185 190
His Pro Val Gly Gly Arg Pro Asp Ala Pro Asp Tyr Phe Leu Gly Ser
195 200 205
Gln Phe Glu Leu Gly Arg Ser Gly Asn Ser Glu Glu Ala Ala Ala Ala
210 215 220
Gly His Ala Gly Ala Leu Thr Gly Glu Leu Ala Arg Ile Gly Thr Val
225 230 235 240
Ala Ala Arg Leu Glu Met Asp Ser Arg Arg His Leu Ala Gln Ala Ala
245 250 255
Ala Ala Leu Val Arg Ala Trp Glu Arg Arg Gly
260 265
<210> 26
<211> 267
<212> PRT
<213> Synthetic Sequence
<400> 26
Met Lys Ala Leu Thr Ala Arg Gln Gln Glu Val Phe Asp Leu Ile Arg
1 5 10 15
Asp His Ile Ser Gln Thr Gly Met Pro Pro Thr Arg Ala Glu Ile Ala
20 25 30
Gln Arg Leu Gly Phe Arg Ser Ala Ser Ser Ala Glu Glu His Leu Lys
35 40 45
Ala Leu Ala Arg Lys Gly Val Ile Glu Ile Val Ser Gly Ala Ser Arg
50 55 60
Gly Ile Arg Leu Leu Gln Glu Glu Glu Glu Gly Leu Pro Leu Val Gly
65 70 75 80
Arg Val Ala Ala Gly Glu Pro Lys Val Met Ala Met Asp Gln Lys Gln
85 90 95
Phe Glu Lys Ile Arg Ala Val Phe Asp Arg Ser Gly Val Ala Leu Thr
100 105 110
Leu Val Asp Met Ser Leu Pro Glu Gln Pro Leu Val Leu Ala Asn Pro
115 120 125
Pro Phe Leu Arg Met Thr Gly Tyr Thr Glu Gly Gln Ile Leu Gly Phe
130 135 140
Asn Cys Arg Phe Leu Gln Arg Gly Asp Glu Asn Ala Gln Ala Arg Ala
145 150 155 160
Asp Ile Arg Asp Ala Leu Lys Leu Gly Arg Glu Leu Gln Val Val Leu
165 170 175
Arg Asn Tyr Arg Ala Asn Asp Glu Pro Phe Asp Asn Leu Leu Phe Leu
180 185 190
His Pro Val Gly Gly Arg Pro Asp Ala Pro Asp Tyr Phe Leu Gly Ser
195 200 205
Gln Phe Glu Leu Gly Arg Ser Gly Asn Ser Glu Glu Ala Ala Ala Ala
210 215 220
Gly His Ala Gly Ala Leu Thr Gly Glu Leu Ala Arg Ile Gly Thr Val
225 230 235 240
Ala Ala Arg Leu Glu Met Asp Ser Arg Arg His Leu Ala Gln Ala Ala
245 250 255
Ala Ala Leu Val Arg Ala Trp Glu Arg Arg Gly
260 265
<210> 27
<211> 268
<212> PRT
<213> Synthetic Sequence
<400> 27
Met Lys Ala Leu Thr Ala Arg Gln Gln Glu Val Phe Asp Leu Ile Arg
1 5 10 15
Asp His Ile Ser Gln Thr Gly Met Pro Pro Thr Arg Ala Glu Ile Ala
20 25 30
Gln Arg Leu Gly Phe Arg Ser Ala Ser Ser Ala Glu Glu His Leu Lys
35 40 45
Ala Leu Ala Arg Lys Gly Val Ile Glu Ile Val Ser Gly Ala Ser Arg
50 55 60
Gly Ile Arg Leu Leu Gln Glu Glu Glu Glu Gly Leu Pro Leu Val Gly
65 70 75 80
Arg Val Ala Ala Gly Glu Pro Cys Val Thr Met Ala Met Asp Gln Lys
85 90 95
Gln Phe Glu Lys Ile Arg Ala Val Phe Asp Arg Ser Gly Val Ala Leu
100 105 110
Thr Leu Val Asp Met Ser Leu Pro Glu Gln Pro Leu Val Leu Ala Asn
115 120 125
Pro Pro Phe Leu Arg Met Thr Gly Tyr Thr Glu Gly Gln Ile Leu Gly
130 135 140
Phe Asn Cys Arg Phe Leu Gln Arg Gly Asp Glu Asn Ala Gln Ala Arg
145 150 155 160
Ala Asp Ile Arg Asp Ala Leu Lys Leu Gly Arg Glu Leu Gln Val Val
165 170 175
Leu Arg Asn Tyr Arg Ala Asn Asp Glu Pro Phe Asp Asn Leu Leu Phe
180 185 190
Leu His Pro Val Gly Gly Arg Pro Asp Ala Pro Asp Tyr Phe Leu Gly
195 200 205
Ser Gln Phe Glu Leu Gly Arg Ser Gly Asn Ser Glu Glu Ala Ala Ala
210 215 220
Ala Gly His Ala Gly Ala Leu Thr Gly Glu Leu Ala Arg Ile Gly Thr
225 230 235 240
Val Ala Ala Arg Leu Glu Met Asp Ser Arg Arg His Leu Ala Gln Ala
245 250 255
Ala Ala Ala Leu Val Arg Ala Trp Glu Arg Arg Gly
260 265
<210> 28
<211> 269
<212> PRT
<213> Synthetic Sequence
<400> 28
Met Lys Ala Leu Thr Ala Arg Gln Gln Glu Val Phe Asp Leu Ile Arg
1 5 10 15
Asp His Ile Ser Gln Thr Gly Met Pro Pro Thr Arg Ala Glu Ile Ala
20 25 30
Gln Arg Leu Gly Phe Arg Ser Ala Ser Ser Ala Glu Glu His Leu Lys
35 40 45
Ala Leu Ala Arg Lys Gly Val Ile Glu Ile Val Ser Gly Ala Ser Arg
50 55 60
Gly Ile Arg Leu Leu Gln Glu Glu Glu Glu Gly Leu Pro Leu Val Gly
65 70 75 80
Arg Val Ala Ala Gly Glu Pro Thr Gln Val Tyr Met Ala Met Asp Gln
85 90 95
Lys Gln Phe Glu Lys Ile Arg Ala Val Phe Asp Arg Ser Gly Val Ala
100 105 110
Leu Thr Leu Val Asp Met Ser Leu Pro Glu Gln Pro Leu Val Leu Ala
115 120 125
Asn Pro Pro Phe Leu Arg Met Thr Gly Tyr Thr Glu Gly Gln Ile Leu
130 135 140
Gly Phe Asn Cys Arg Phe Leu Gln Arg Gly Asp Glu Asn Ala Gln Ala
145 150 155 160
Arg Ala Asp Ile Arg Asp Ala Leu Lys Leu Gly Arg Glu Leu Gln Val
165 170 175
Val Leu Arg Asn Tyr Arg Ala Asn Asp Glu Pro Phe Asp Asn Leu Leu
180 185 190
Phe Leu His Pro Val Gly Gly Arg Pro Asp Ala Pro Asp Tyr Phe Leu
195 200 205
Gly Ser Gln Phe Glu Leu Gly Arg Ser Gly Asn Ser Glu Glu Ala Ala
210 215 220
Ala Ala Gly His Ala Gly Ala Leu Thr Gly Glu Leu Ala Arg Ile Gly
225 230 235 240
Thr Val Ala Ala Arg Leu Glu Met Asp Ser Arg Arg His Leu Ala Gln
245 250 255
Ala Ala Ala Ala Leu Val Arg Ala Trp Glu Arg Arg Gly
260 265
<210> 29
<211> 269
<212> PRT
<213> Synthetic Sequence
<400> 29
Met Lys Ala Leu Thr Ala Arg Gln Gln Glu Val Phe Asp Leu Ile Arg
1 5 10 15
Asp His Ile Ser Gln Thr Gly Met Pro Pro Thr Arg Ala Glu Ile Ala
20 25 30
Gln Arg Leu Gly Phe Arg Ser Ala Ser Ser Ala Glu Glu His Leu Lys
35 40 45
Ala Leu Ala Arg Lys Gly Val Ile Glu Ile Val Ser Gly Ala Ser Arg
50 55 60
Gly Ile Arg Leu Leu Gln Glu Glu Glu Glu Gly Leu Pro Leu Val Gly
65 70 75 80
Arg Val Ala Ala Gly Glu Pro Leu Trp Thr Ser Met Ala Met Asp Gln
85 90 95
Lys Gln Phe Glu Lys Ile Arg Ala Val Phe Asp Arg Ser Gly Val Ala
100 105 110
Leu Thr Leu Val Asp Met Ser Leu Pro Glu Gln Pro Leu Val Leu Ala
115 120 125
Asn Pro Pro Phe Leu Arg Met Thr Gly Tyr Thr Glu Gly Gln Ile Leu
130 135 140
Gly Phe Asn Cys Arg Phe Leu Gln Arg Gly Asp Glu Asn Ala Gln Ala
145 150 155 160
Arg Ala Asp Ile Arg Asp Ala Leu Lys Leu Gly Arg Glu Leu Gln Val
165 170 175
Val Leu Arg Asn Tyr Arg Ala Asn Asp Glu Pro Phe Asp Asn Leu Leu
180 185 190
Phe Leu His Pro Val Gly Gly Arg Pro Asp Ala Pro Asp Tyr Phe Leu
195 200 205
Gly Ser Gln Phe Glu Leu Gly Arg Ser Gly Asn Ser Glu Glu Ala Ala
210 215 220
Ala Ala Gly His Ala Gly Ala Leu Thr Gly Glu Leu Ala Arg Ile Gly
225 230 235 240
Thr Val Ala Ala Arg Leu Glu Met Asp Ser Arg Arg His Leu Ala Gln
245 250 255
Ala Ala Ala Ala Leu Val Arg Ala Trp Glu Arg Arg Gly
260 265
<210> 30
<211> 269
<212> PRT
<213> Synthetic Sequence
<400> 30
Met Lys Ala Leu Thr Ala Arg Gln Gln Glu Val Phe Asp Leu Ile Arg
1 5 10 15
Asp His Ile Ser Gln Thr Gly Met Pro Pro Thr Arg Ala Glu Ile Ala
20 25 30
Gln Arg Leu Gly Phe Arg Ser Ala Ser Ser Ala Glu Glu His Leu Lys
35 40 45
Ala Leu Ala Arg Lys Gly Val Ile Glu Ile Val Ser Gly Ala Ser Arg
50 55 60
Gly Ile Arg Leu Leu Gln Glu Glu Glu Glu Gly Leu Pro Leu Val Gly
65 70 75 80
Arg Val Ala Ala Gly Glu Pro Gln Arg Tyr Ser Met Ala Met Asp Gln
85 90 95
Lys Gln Phe Glu Lys Ile Arg Ala Val Phe Asp Arg Ser Gly Val Ala
100 105 110
Leu Thr Leu Val Asp Met Ser Leu Pro Glu Gln Pro Leu Val Leu Ala
115 120 125
Asn Pro Pro Phe Leu Arg Met Thr Gly Tyr Thr Glu Gly Gln Ile Leu
130 135 140
Gly Phe Asn Cys Arg Phe Leu Gln Arg Gly Asp Glu Asn Ala Gln Ala
145 150 155 160
Arg Ala Asp Ile Arg Asp Ala Leu Lys Leu Gly Arg Glu Leu Gln Val
165 170 175
Val Leu Arg Asn Tyr Arg Ala Asn Asp Glu Pro Phe Asp Asn Leu Leu
180 185 190
Phe Leu His Pro Val Gly Gly Arg Pro Asp Ala Pro Asp Tyr Phe Leu
195 200 205
Gly Ser Gln Phe Glu Leu Gly Arg Ser Gly Asn Ser Glu Glu Ala Ala
210 215 220
Ala Ala Gly His Ala Gly Ala Leu Thr Gly Glu Leu Ala Arg Ile Gly
225 230 235 240
Thr Val Ala Ala Arg Leu Glu Met Asp Ser Arg Arg His Leu Ala Gln
245 250 255
Ala Ala Ala Ala Leu Val Arg Ala Trp Glu Arg Arg Gly
260 265
<210> 31
<211> 268
<212> PRT
<213> Synthetic Sequence
<400> 31
Met Lys Ala Leu Thr Ala Arg Gln Gln Glu Val Phe Asp Leu Ile Arg
1 5 10 15
Asp His Ile Ser Gln Thr Gly Met Pro Pro Thr Arg Ala Glu Ile Ala
20 25 30
Gln Arg Leu Gly Phe Arg Ser Ala Ser Ser Ala Glu Glu His Leu Lys
35 40 45
Ala Leu Ala Arg Lys Gly Val Ile Glu Ile Val Ser Gly Ala Ser Arg
50 55 60
Gly Ile Arg Leu Leu Gln Glu Glu Glu Glu Gly Leu Pro Leu Val Gly
65 70 75 80
Arg Val Ala Ala Gly Glu Pro Ile Val Asp Met Ala Met Asp Gln Lys
85 90 95
Gln Phe Glu Lys Ile Arg Ala Val Phe Asp Arg Ser Gly Val Ala Leu
100 105 110
Thr Leu Val Asp Met Ser Leu Pro Glu Gln Pro Leu Val Leu Ala Asn
115 120 125
Pro Pro Phe Leu Arg Met Thr Gly Tyr Thr Glu Gly Gln Ile Leu Gly
130 135 140
Phe Asn Cys Arg Phe Leu Gln Arg Gly Asp Glu Asn Ala Gln Ala Arg
145 150 155 160
Ala Asp Ile Arg Asp Ala Leu Lys Leu Gly Arg Glu Leu Gln Val Val
165 170 175
Leu Arg Asn Tyr Arg Ala Asn Asp Glu Pro Phe Asp Asn Leu Leu Phe
180 185 190
Leu His Pro Val Gly Gly Arg Pro Asp Ala Pro Asp Tyr Phe Leu Gly
195 200 205
Ser Gln Phe Glu Leu Gly Arg Ser Gly Asn Ser Glu Glu Ala Ala Ala
210 215 220
Ala Gly His Ala Gly Ala Leu Thr Gly Glu Leu Ala Arg Ile Gly Thr
225 230 235 240
Val Ala Ala Arg Leu Glu Met Asp Ser Arg Arg His Leu Ala Gln Ala
245 250 255
Ala Ala Ala Leu Val Arg Ala Trp Glu Arg Arg Gly
260 265
<210> 32
<211> 233
<212> PRT
<213> Synthetic Sequence
<400> 32
Met Lys Ala Leu Thr Ala Arg Gln Gln Glu Val Phe Asp Leu Ile Arg
1 5 10 15
Asp His Ile Ser Gln Thr Gly Met Pro Pro Thr Arg Ala Glu Ile Ala
20 25 30
Gln Arg Leu Gly Phe Arg Ser Ala Ser Ser Ala Glu Glu His Leu Lys
35 40 45
Ala Leu Ala Arg Lys Gly Val Ile Glu Ile Val Ser Gly Ala Ser Arg
50 55 60
Gly Ile Arg Leu Leu Gln Glu Glu Glu Glu Gly Leu Pro Leu Val Gly
65 70 75 80
Arg Val Ala Ala Gly Glu Pro Met Arg Arg His Tyr Arg Asp Leu Ile
85 90 95
Arg Asn Thr Pro Met Pro Asp Thr Pro Gln Asp Ile Ala Asp Leu Arg
100 105 110
Ala Leu Leu Asp Glu Asp Glu Ala Glu Met Ser Val Val Phe Ser Asp
115 120 125
Pro Ser Gln Pro Asp Asn Pro Thr Ile Tyr Val Ser Asp Ala Phe Leu
130 135 140
Val Gln Thr Gly Tyr Thr Leu Glu Glu Val Leu Gly Arg Asn Cys Arg
145 150 155 160
Phe Leu Gln Gly Pro Asp Thr Asn Pro His Ala Val Glu Ala Ile Arg
165 170 175
Gln Gly Leu Lys Ala Glu Thr Arg Phe Thr Ile Asp Ile Leu Asn Tyr
180 185 190
Arg Lys Asp Gly Ser Ala Phe Val Asn Arg Leu Arg Ile Arg Pro Ile
195 200 205
Tyr Asp Pro Glu Gly Asn Leu Met Phe Phe Ala Gly Ala Gln Asn Pro
210 215 220
Val Leu Glu His His His His His His
225 230
<210> 33
<211> 265
<212> PRT
<213> Synthetic Sequence
<400> 33
Met Lys Ala Leu Thr Ala Arg Gln Gln Glu Val Phe Asp Leu Ile Arg
1 5 10 15
Asp His Ile Ser Gln Thr Gly Met Pro Pro Thr Arg Ala Glu Ile Ala
20 25 30
Gln Arg Leu Gly Phe Arg Ser Pro Asn Ala Ala Glu Glu His Leu Lys
35 40 45
Ala Leu Ala Arg Lys Gly Val Ile Glu Ile Val Ser Gly Ala Ser Arg
50 55 60
Gly Ile Arg Leu Leu Gln Glu Glu Glu Glu Gly Leu Pro Leu Val Gly
65 70 75 80
Arg Val Ala Ala Gly Glu Pro Met Ala Met Asp Gln Lys Gln Phe Glu
85 90 95
Lys Ile Arg Ala Val Phe Asp Arg Ser Gly Val Ala Leu Thr Leu Val
100 105 110
Asp Met Ser Leu Pro Glu Gln Pro Leu Val Leu Ala Asn Pro Pro Phe
115 120 125
Leu Arg Met Thr Gly Tyr Thr Glu Gly Gln Ile Leu Gly Phe Asn Cys
130 135 140
Arg Phe Leu Gln Arg Gly Asp Glu Asn Ala Gln Ala Arg Ala Asp Ile
145 150 155 160
Arg Asp Ala Leu Lys Leu Gly Arg Glu Leu Gln Val Val Leu Arg Asn
165 170 175
Tyr Arg Ala Asn Asp Glu Pro Phe Asp Asn Leu Leu Phe Leu His Pro
180 185 190
Val Gly Gly Arg Pro Asp Ala Pro Asp Tyr Phe Leu Gly Ser Gln Phe
195 200 205
Glu Leu Gly Arg Ser Gly Asn Ser Glu Glu Ala Ala Ala Ala Gly His
210 215 220
Ala Gly Ala Leu Thr Gly Glu Leu Ala Arg Ile Gly Thr Val Ala Ala
225 230 235 240
Arg Leu Glu Met Asp Ser Arg Arg His Leu Ala Gln Ala Ala Ala Ala
245 250 255
Leu Val Arg Ala Trp Glu Arg Arg Gly
260 265
<210> 34
<211> 280
<212> PRT
<213> Synthetic Sequence
<400> 34
Met Ser Thr Lys Lys Lys Pro Leu Thr Gln Glu Gln Leu Glu Asp Ala
1 5 10 15
Arg Arg Leu Lys Ala Ile Tyr Glu Lys Lys Lys Asn Glu Leu Gly Leu
20 25 30
Ser Gln Glu Ser Val Ala Asp Lys Met Gly Met Gly Gln Ser Gly Val
35 40 45
Gly Ala Leu Phe Asn Gly Ile Asn Ala Leu Asn Ala Tyr Asn Ala Ala
50 55 60
Leu Leu Ala Lys Ile Leu Lys Val Ser Val Glu Glu Phe Ser Pro Ser
65 70 75 80
Ile Ala Arg Glu Ile Tyr Glu Met Tyr Glu Ala Val Ser Met Gln Pro
85 90 95
Ser Leu Arg Ser Glu Tyr Met Ala Met Asp Gln Lys Gln Phe Glu Lys
100 105 110
Ile Arg Ala Val Phe Asp Arg Ser Gly Val Ala Leu Thr Leu Val Asp
115 120 125
Met Ser Leu Pro Glu Gln Pro Leu Val Leu Ala Asn Pro Pro Phe Leu
130 135 140
Arg Met Thr Gly Tyr Thr Glu Gly Gln Ile Leu Gly Phe Asn Cys Arg
145 150 155 160
Phe Leu Gln Arg Gly Asp Glu Asn Ala Gln Ala Arg Ala Asp Ile Arg
165 170 175
Asp Ala Leu Lys Leu Gly Arg Glu Leu Gln Val Val Leu Arg Asn Tyr
180 185 190
Arg Ala Asn Asp Glu Pro Phe Asp Asn Leu Leu Phe Leu His Pro Val
195 200 205
Gly Gly Arg Pro Asp Ala Pro Asp Tyr Phe Leu Gly Ser Gln Phe Glu
210 215 220
Leu Gly Arg Ser Gly Asn Ser Glu Glu Ala Ala Ala Ala Gly His Ala
225 230 235 240
Gly Ala Leu Thr Gly Glu Leu Ala Arg Ile Gly Thr Val Ala Ala Arg
245 250 255
Leu Glu Met Asp Ser Arg Arg His Leu Ala Gln Ala Ala Ala Ala Leu
260 265 270
Val Arg Ala Trp Glu Arg Arg Gly
275 280
<210> 35
<211> 243
<212> PRT
<213> Synthetic Sequence
<400> 35
Met Lys Leu Leu Ser Ser Ile Glu Gln Ala Cys Asp Ile Cys Arg Leu
1 5 10 15
Lys Lys Leu Lys Cys Ser Lys Glu Lys Pro Lys Cys Ala Lys Cys Leu
20 25 30
Lys Asn Asn Trp Glu Cys Arg Tyr Ser Pro Lys Thr Lys Arg Ser Pro
35 40 45
Leu Thr Arg Ala His Leu Thr Glu Val Glu Ser Arg Leu Glu Arg Leu
50 55 60
Glu Met Ala Met Asp Gln Lys Gln Phe Glu Lys Ile Arg Ala Val Phe
65 70 75 80
Asp Arg Ser Gly Val Ala Leu Thr Leu Val Asp Met Ser Leu Pro Glu
85 90 95
Gln Pro Leu Val Leu Ala Asn Pro Pro Phe Leu Arg Met Thr Gly Tyr
100 105 110
Thr Glu Gly Gln Ile Leu Gly Phe Asn Cys Arg Phe Leu Gln Arg Gly
115 120 125
Asp Glu Asn Ala Gln Ala Arg Ala Asp Ile Arg Asp Ala Leu Lys Leu
130 135 140
Gly Arg Glu Leu Gln Val Val Leu Arg Asn Tyr Arg Ala Asn Asp Glu
145 150 155 160
Pro Phe Asp Asn Leu Leu Phe Leu His Pro Val Gly Gly Arg Pro Asp
165 170 175
Ala Pro Asp Tyr Phe Leu Gly Ser Gln Phe Glu Leu Gly Arg Ser Gly
180 185 190
Asn Ser Glu Glu Ala Ala Ala Ala Gly His Ala Gly Ala Leu Thr Gly
195 200 205
Glu Leu Ala Arg Ile Gly Thr Val Ala Ala Arg Leu Glu Met Asp Ser
210 215 220
Arg Arg His Leu Ala Gln Ala Ala Ala Ala Leu Val Arg Ala Trp Glu
225 230 235 240
Arg Arg Gly
<210> 36
<211> 241
<212> PRT
<213> Synthetic Sequence
<400> 36
Met Ser Arg Leu Asp Lys Ser Lys Val Ile Asn Ser Ala Leu Glu Leu
1 5 10 15
Leu Asn Glu Val Gly Ile Glu Gly Leu Thr Thr Arg Lys Leu Ala Gln
20 25 30
Lys Leu Gly Val Glu Gln Pro Thr Leu Tyr Trp His Val Lys Asn Lys
35 40 45
Arg Ala Leu Leu Asp Ala Leu Ala Ile Glu Met Leu Asp Arg His Met
50 55 60
Ala Met Asp Gln Lys Gln Phe Glu Lys Ile Arg Ala Val Phe Asp Arg
65 70 75 80
Ser Gly Val Ala Leu Thr Leu Val Asp Met Ser Leu Pro Glu Gln Pro
85 90 95
Leu Val Leu Ala Asn Pro Pro Phe Leu Arg Met Thr Gly Tyr Thr Glu
100 105 110
Gly Gln Ile Leu Gly Phe Asn Cys Arg Phe Leu Gln Arg Gly Asp Glu
115 120 125
Asn Ala Gln Ala Arg Ala Asp Ile Arg Asp Ala Leu Lys Leu Gly Arg
130 135 140
Glu Leu Gln Val Val Leu Arg Asn Tyr Arg Ala Asn Asp Glu Pro Phe
145 150 155 160
Asp Asn Leu Leu Phe Leu His Pro Val Gly Gly Arg Pro Asp Ala Pro
165 170 175
Asp Tyr Phe Leu Gly Ser Gln Phe Glu Leu Gly Arg Ser Gly Asn Ser
180 185 190
Glu Glu Ala Ala Ala Ala Gly His Ala Gly Ala Leu Thr Gly Glu Leu
195 200 205
Ala Arg Ile Gly Thr Val Ala Ala Arg Leu Glu Met Asp Ser Arg Arg
210 215 220
His Leu Ala Gln Ala Ala Ala Ala Leu Val Arg Ala Trp Glu Arg Arg
225 230 235 240
Gly
<210> 37
<211> 538
<212> PRT
<213> Synthetic Sequence
<400> 37
Met Lys Ala Leu Thr Ala Arg Gln Gln Glu Val Phe Asp Leu Ile Arg
1 5 10 15
Asp His Ile Ser Gln Thr Gly Met Pro Pro Thr Arg Ala Glu Ile Ala
20 25 30
Gln Arg Leu Gly Phe Arg Ser Ala Ser Ser Ala Glu Glu His Leu Lys
35 40 45
Ala Leu Ala Arg Lys Gly Val Ile Glu Ile Val Ser Gly Ala Ser Arg
50 55 60
Gly Ile Arg Leu Leu Gln Glu Glu Glu Glu Gly Leu Pro Leu Val Gly
65 70 75 80
Arg Val Ala Ala Gly Glu Pro Met Ala Met Asp Gln Lys Gln Phe Glu
85 90 95
Lys Ile Arg Ala Val Phe Asp Arg Ser Gly Val Ala Leu Thr Leu Val
100 105 110
Asp Met Ser Leu Pro Glu Gln Pro Leu Val Leu Ala Asn Pro Pro Phe
115 120 125
Leu Arg Met Thr Gly Tyr Thr Glu Gly Gln Ile Leu Gly Phe Asn Cys
130 135 140
Arg Phe Leu Gln Arg Gly Asp Glu Asn Ala Gln Ala Arg Ala Asp Ile
145 150 155 160
Arg Asp Ala Leu Lys Leu Gly Arg Glu Leu Gln Val Val Leu Arg Asn
165 170 175
Tyr Arg Ala Asn Asp Glu Pro Phe Asp Asn Leu Leu Phe Leu His Pro
180 185 190
Val Gly Gly Arg Pro Asp Ala Pro Asp Tyr Phe Leu Gly Ser Gln Phe
195 200 205
Glu Leu Gly Arg Ser Gly Asn Ser Glu Glu Ala Ala Ala Ala Gly His
210 215 220
Ala Gly Ala Leu Thr Gly Glu Leu Ala Arg Ile Gly Thr Val Ala Ala
225 230 235 240
Arg Leu Glu Met Asp Ser Arg Arg His Leu Ala Gln Ala Ala Ala Ala
245 250 255
Leu Val Arg Ala Trp Glu Arg Arg Gly Thr Ser Ala Ala Ala Asp Tyr
260 265 270
Lys Asp Asp Asp Asp Lys Phe Arg Thr Gly Ser Lys Thr Pro Pro His
275 280 285
Gly Thr Met Gln Gly Ser Val Thr Glu Phe Leu Lys Pro Arg Leu Val
290 295 300
Asp Ile Glu Gln Val Ser Ser Thr His Ala Lys Val Thr Leu Glu Pro
305 310 315 320
Leu Glu Arg Gly Phe Gly His Thr Leu Gly Asn Ala Leu Arg Arg Ile
325 330 335
Leu Leu Ser Ser Met Pro Gly Cys Ala Val Thr Glu Val Glu Ile Asp
340 345 350
Gly Val Leu His Glu Tyr Ser Thr Lys Glu Gly Val Gln Glu Asp Ile
355 360 365
Leu Glu Ile Leu Leu Asn Leu Lys Gly Leu Ala Val Arg Val Gln Gly
370 375 380
Lys Asp Glu Val Ile Leu Thr Leu Asn Lys Ser Gly Ile Gly Pro Val
385 390 395 400
Thr Ala Ala Asp Ile Thr His Asp Gly Asp Val Glu Ile Val Lys Pro
405 410 415
Gln His Val Ile Cys His Leu Thr Asp Glu Asn Ala Ser Ile Ser Met
420 425 430
Arg Ile Lys Val Gln Arg Gly Arg Gly Tyr Val Pro Ala Ser Thr Arg
435 440 445
Ile His Ser Glu Glu Asp Glu Arg Pro Ile Gly Arg Leu Leu Val Asp
450 455 460
Ala Cys Tyr Ser Pro Val Glu Arg Ile Ala Tyr Asn Val Glu Ala Ala
465 470 475 480
Arg Val Glu Gln Arg Thr Asp Leu Asp Lys Leu Val Ile Glu Met Glu
485 490 495
Thr Asn Gly Thr Ile Asp Pro Glu Glu Ala Ile Arg Arg Ala Ala Thr
500 505 510
Ile Leu Ala Glu Gln Leu Glu Ala Phe Val Asp Leu Arg Asp Val Arg
515 520 525
Gln Pro Glu Val Lys Glu Glu Lys Pro Glu
530 535
<210> 38
<211> 378
<212> PRT
<213> Synthetic Sequence
<400> 38
Met Ala Arg Val Thr Val Gln Asp Ala Val Glu Lys Ile Gly Asn Arg
1 5 10 15
Phe Asp Leu Val Leu Val Ala Ala Arg Arg Ala Arg Gln Met Gln Val
20 25 30
Gly Gly Lys Asp Pro Leu Val Pro Glu Glu Asn Asp Lys Thr Thr Val
35 40 45
Ile Ala Leu Arg Glu Ile Glu Glu Gly Leu Ile Asn Asn Gln Ile Leu
50 55 60
Asp Val Arg Glu Arg Gln Glu Gln Gln Glu Gln Glu Ala Ala Glu Leu
65 70 75 80
Gln Ala Val Thr Ala Ile Ala Glu Gly Arg Ala Ala Ala Asp Tyr Lys
85 90 95
Asp Asp Asp Asp Lys Phe Arg Thr Gly Ser Lys Thr Pro Pro His Thr
100 105 110
Ser Met Lys Ala Leu Thr Ala Arg Gln Gln Glu Val Phe Asp Leu Ile
115 120 125
Arg Asp His Ile Ser Gln Thr Gly Met Pro Pro Thr Arg Ala Glu Ile
130 135 140
Ala Gln Arg Leu Gly Phe Arg Ser Ala Ser Ser Ala Glu Glu His Leu
145 150 155 160
Lys Ala Leu Ala Arg Lys Gly Val Ile Glu Ile Val Ser Gly Ala Ser
165 170 175
Arg Gly Ile Arg Leu Leu Gln Glu Glu Glu Glu Gly Leu Pro Leu Val
180 185 190
Gly Arg Val Ala Ala Gly Glu Pro Met Ala Met Asp Gln Lys Gln Phe
195 200 205
Glu Lys Ile Arg Ala Val Phe Asp Arg Ser Gly Val Ala Leu Thr Leu
210 215 220
Val Asp Met Ser Leu Pro Glu Gln Pro Leu Val Leu Ala Asn Pro Pro
225 230 235 240
Phe Leu Arg Met Thr Gly Tyr Thr Glu Gly Gln Ile Leu Gly Phe Asn
245 250 255
Cys Arg Phe Leu Gln Arg Gly Asp Glu Asn Ala Gln Ala Arg Ala Asp
260 265 270
Ile Arg Asp Ala Leu Lys Leu Gly Arg Glu Leu Gln Val Val Leu Arg
275 280 285
Asn Tyr Arg Ala Asn Asp Glu Pro Phe Asp Asn Leu Leu Phe Leu His
290 295 300
Pro Val Gly Gly Arg Pro Asp Ala Pro Asp Tyr Phe Leu Gly Ser Gln
305 310 315 320
Phe Glu Leu Gly Arg Ser Gly Asn Ser Glu Glu Ala Ala Ala Ala Gly
325 330 335
His Ala Gly Ala Leu Thr Gly Glu Leu Ala Arg Ile Gly Thr Val Ala
340 345 350
Ala Arg Leu Glu Met Asp Ser Arg Arg His Leu Ala Gln Ala Ala Ala
355 360 365
Ala Leu Val Arg Ala Trp Glu Arg Arg Gly
370 375
<210> 39
<211> 538
<212> PRT
<213> Synthetic Sequence
<400> 39
Met Lys Ala Leu Thr Ala Arg Gln Gln Glu Val Phe Asp Leu Ile Arg
1 5 10 15
Asp His Ile Ser Gln Thr Gly Met Pro Pro Thr Arg Ala Glu Ile Ala
20 25 30
Gln Arg Leu Gly Phe Arg Ser Pro Asn Ala Ala Glu Glu His Leu Lys
35 40 45
Ala Leu Ala Arg Lys Gly Val Ile Glu Ile Val Ser Gly Ala Ser Arg
50 55 60
Gly Ile Arg Leu Leu Gln Glu Glu Glu Glu Gly Leu Pro Leu Val Gly
65 70 75 80
Arg Val Ala Ala Gly Glu Pro Met Ala Met Asp Gln Lys Gln Phe Glu
85 90 95
Lys Ile Arg Ala Val Phe Asp Arg Ser Gly Val Ala Leu Thr Leu Val
100 105 110
Asp Met Ser Leu Pro Glu Gln Pro Leu Val Leu Ala Asn Pro Pro Phe
115 120 125
Leu Arg Met Thr Gly Tyr Thr Glu Gly Gln Ile Leu Gly Phe Asn Cys
130 135 140
Arg Phe Leu Gln Arg Gly Asp Glu Asn Ala Gln Ala Arg Ala Asp Ile
145 150 155 160
Arg Asp Ala Leu Lys Leu Gly Arg Glu Leu Gln Val Val Leu Arg Asn
165 170 175
Tyr Arg Ala Asn Asp Glu Pro Phe Asp Asn Leu Leu Phe Leu His Pro
180 185 190
Val Gly Gly Arg Pro Asp Ala Pro Asp Tyr Phe Leu Gly Ser Gln Phe
195 200 205
Glu Leu Gly Arg Ser Gly Asn Ser Glu Glu Ala Ala Ala Ala Gly His
210 215 220
Ala Gly Ala Leu Thr Gly Glu Leu Ala Arg Ile Gly Thr Val Ala Ala
225 230 235 240
Arg Leu Glu Met Asp Ser Arg Arg His Leu Ala Gln Ala Ala Ala Ala
245 250 255
Leu Val Arg Ala Trp Glu Arg Arg Gly Thr Ser Ala Ala Ala Asp Tyr
260 265 270
Lys Asp Asp Asp Asp Lys Phe Arg Thr Gly Ser Lys Thr Pro Pro His
275 280 285
Gly Thr Met Gln Gly Ser Val Thr Glu Phe Leu Lys Pro Arg Leu Val
290 295 300
Asp Ile Glu Gln Val Ser Ser Thr His Ala Lys Val Thr Leu Glu Pro
305 310 315 320
Leu Glu Arg Gly Phe Gly His Thr Leu Gly Asn Ala Leu Arg Arg Ile
325 330 335
Leu Leu Ser Ser Met Pro Gly Cys Ala Val Thr Glu Val Glu Ile Asp
340 345 350
Gly Val Leu His Glu Tyr Ser Thr Lys Glu Gly Val Gln Glu Asp Ile
355 360 365
Leu Glu Ile Leu Leu Asn Leu Lys Gly Leu Ala Val Arg Val Gln Gly
370 375 380
Lys Asp Glu Val Ile Leu Thr Leu Asn Lys Ser Gly Ile Gly Pro Val
385 390 395 400
Thr Ala Ala Asp Ile Thr His Asp Gly Asp Val Glu Ile Val Lys Pro
405 410 415
Gln His Val Ile Cys His Leu Thr Asp Glu Asn Ala Ser Ile Ser Met
420 425 430
Arg Ile Lys Val Gln Arg Gly Arg Gly Tyr Val Pro Ala Ser Thr Arg
435 440 445
Ile His Ser Glu Glu Asp Glu Arg Pro Ile Gly Arg Leu Leu Val Asp
450 455 460
Ala Cys Tyr Ser Pro Val Glu Arg Ile Ala Tyr Asn Val Glu Ala Ala
465 470 475 480
Arg Val Glu Gln Arg Thr Asp Leu Asp Lys Leu Val Ile Glu Met Glu
485 490 495
Thr Asn Gly Thr Ile Asp Pro Glu Glu Ala Ile Arg Arg Ala Ala Thr
500 505 510
Ile Leu Ala Glu Gln Leu Glu Ala Phe Val Asp Leu Arg Asp Val Arg
515 520 525
Gln Pro Glu Val Lys Glu Glu Lys Pro Glu
530 535
<210> 40
<211> 378
<212> PRT
<213> Synthetic Sequence
<400> 40
Met Ala Arg Val Thr Val Gln Asp Ala Val Glu Lys Ile Gly Asn Arg
1 5 10 15
Phe Asp Leu Val Leu Val Ala Ala Arg Arg Ala Arg Gln Met Gln Val
20 25 30
Gly Gly Lys Asp Pro Leu Val Pro Glu Glu Asn Asp Lys Thr Thr Val
35 40 45
Ile Ala Leu Arg Glu Ile Glu Glu Gly Leu Ile Asn Asn Gln Ile Leu
50 55 60
Asp Val Arg Glu Arg Gln Glu Gln Gln Glu Gln Glu Ala Ala Glu Leu
65 70 75 80
Gln Ala Val Thr Ala Ile Ala Glu Gly Arg Ala Ala Ala Asp Tyr Lys
85 90 95
Asp Asp Asp Asp Lys Phe Arg Thr Gly Ser Lys Thr Pro Pro His Thr
100 105 110
Ser Met Lys Ala Leu Thr Ala Arg Gln Gln Glu Val Phe Asp Leu Ile
115 120 125
Arg Asp His Ile Ser Gln Thr Gly Met Pro Pro Thr Arg Ala Glu Ile
130 135 140
Ala Gln Arg Leu Gly Phe Arg Ser Pro Asn Ala Ala Glu Glu His Leu
145 150 155 160
Lys Ala Leu Ala Arg Lys Gly Val Ile Glu Ile Val Ser Gly Ala Ser
165 170 175
Arg Gly Ile Arg Leu Leu Gln Glu Glu Glu Glu Gly Leu Pro Leu Val
180 185 190
Gly Arg Val Ala Ala Gly Glu Pro Met Ala Met Asp Gln Lys Gln Phe
195 200 205
Glu Lys Ile Arg Ala Val Phe Asp Arg Ser Gly Val Ala Leu Thr Leu
210 215 220
Val Asp Met Ser Leu Pro Glu Gln Pro Leu Val Leu Ala Asn Pro Pro
225 230 235 240
Phe Leu Arg Met Thr Gly Tyr Thr Glu Gly Gln Ile Leu Gly Phe Asn
245 250 255
Cys Arg Phe Leu Gln Arg Gly Asp Glu Asn Ala Gln Ala Arg Ala Asp
260 265 270
Ile Arg Asp Ala Leu Lys Leu Gly Arg Glu Leu Gln Val Val Leu Arg
275 280 285
Asn Tyr Arg Ala Asn Asp Glu Pro Phe Asp Asn Leu Leu Phe Leu His
290 295 300
Pro Val Gly Gly Arg Pro Asp Ala Pro Asp Tyr Phe Leu Gly Ser Gln
305 310 315 320
Phe Glu Leu Gly Arg Ser Gly Asn Ser Glu Glu Ala Ala Ala Ala Gly
325 330 335
His Ala Gly Ala Leu Thr Gly Glu Leu Ala Arg Ile Gly Thr Val Ala
340 345 350
Ala Arg Leu Glu Met Asp Ser Arg Arg His Leu Ala Gln Ala Ala Ala
355 360 365
Ala Leu Val Arg Ala Trp Glu Arg Arg Gly
370 375
<210> 41
<211> 553
<212> PRT
<213> Synthetic Sequence
<400> 41
Met Ser Thr Lys Lys Lys Pro Leu Thr Gln Glu Gln Leu Glu Asp Ala
1 5 10 15
Arg Arg Leu Lys Ala Ile Tyr Glu Lys Lys Lys Asn Glu Leu Gly Leu
20 25 30
Ser Gln Glu Ser Val Ala Asp Lys Met Gly Met Gly Gln Ser Gly Val
35 40 45
Gly Ala Leu Phe Asn Gly Ile Asn Ala Leu Asn Ala Tyr Asn Ala Ala
50 55 60
Leu Leu Ala Lys Ile Leu Lys Val Ser Val Glu Glu Phe Ser Pro Ser
65 70 75 80
Ile Ala Arg Glu Ile Tyr Glu Met Tyr Glu Ala Val Ser Met Gln Pro
85 90 95
Ser Leu Arg Ser Glu Tyr Met Ala Met Asp Gln Lys Gln Phe Glu Lys
100 105 110
Ile Arg Ala Val Phe Asp Arg Ser Gly Val Ala Leu Thr Leu Val Asp
115 120 125
Met Ser Leu Pro Glu Gln Pro Leu Val Leu Ala Asn Pro Pro Phe Leu
130 135 140
Arg Met Thr Gly Tyr Thr Glu Gly Gln Ile Leu Gly Phe Asn Cys Arg
145 150 155 160
Phe Leu Gln Arg Gly Asp Glu Asn Ala Gln Ala Arg Ala Asp Ile Arg
165 170 175
Asp Ala Leu Lys Leu Gly Arg Glu Leu Gln Val Val Leu Arg Asn Tyr
180 185 190
Arg Ala Asn Asp Glu Pro Phe Asp Asn Leu Leu Phe Leu His Pro Val
195 200 205
Gly Gly Arg Pro Asp Ala Pro Asp Tyr Phe Leu Gly Ser Gln Phe Glu
210 215 220
Leu Gly Arg Ser Gly Asn Ser Glu Glu Ala Ala Ala Ala Gly His Ala
225 230 235 240
Gly Ala Leu Thr Gly Glu Leu Ala Arg Ile Gly Thr Val Ala Ala Arg
245 250 255
Leu Glu Met Asp Ser Arg Arg His Leu Ala Gln Ala Ala Ala Ala Leu
260 265 270
Val Arg Ala Trp Glu Arg Arg Gly Thr Ser Ala Ala Ala Asp Tyr Lys
275 280 285
Asp Asp Asp Asp Lys Phe Arg Thr Gly Ser Lys Thr Pro Pro His Gly
290 295 300
Thr Met Gln Gly Ser Val Thr Glu Phe Leu Lys Pro Arg Leu Val Asp
305 310 315 320
Ile Glu Gln Val Ser Ser Thr His Ala Lys Val Thr Leu Glu Pro Leu
325 330 335
Glu Arg Gly Phe Gly His Thr Leu Gly Asn Ala Leu Arg Arg Ile Leu
340 345 350
Leu Ser Ser Met Pro Gly Cys Ala Val Thr Glu Val Glu Ile Asp Gly
355 360 365
Val Leu His Glu Tyr Ser Thr Lys Glu Gly Val Gln Glu Asp Ile Leu
370 375 380
Glu Ile Leu Leu Asn Leu Lys Gly Leu Ala Val Arg Val Gln Gly Lys
385 390 395 400
Asp Glu Val Ile Leu Thr Leu Asn Lys Ser Gly Ile Gly Pro Val Thr
405 410 415
Ala Ala Asp Ile Thr His Asp Gly Asp Val Glu Ile Val Lys Pro Gln
420 425 430
His Val Ile Cys His Leu Thr Asp Glu Asn Ala Ser Ile Ser Met Arg
435 440 445
Ile Lys Val Gln Arg Gly Arg Gly Tyr Val Pro Ala Ser Thr Arg Ile
450 455 460
His Ser Glu Glu Asp Glu Arg Pro Ile Gly Arg Leu Leu Val Asp Ala
465 470 475 480
Cys Tyr Ser Pro Val Glu Arg Ile Ala Tyr Asn Val Glu Ala Ala Arg
485 490 495
Val Glu Gln Arg Thr Asp Leu Asp Lys Leu Val Ile Glu Met Glu Thr
500 505 510
Asn Gly Thr Ile Asp Pro Glu Glu Ala Ile Arg Arg Ala Ala Thr Ile
515 520 525
Leu Ala Glu Gln Leu Glu Ala Phe Val Asp Leu Arg Asp Val Arg Gln
530 535 540
Pro Glu Val Lys Glu Glu Lys Pro Glu
545 550
<210> 42
<211> 393
<212> PRT
<213> Synthetic Sequence
<400> 42
Met Ala Arg Val Thr Val Gln Asp Ala Val Glu Lys Ile Gly Asn Arg
1 5 10 15
Phe Asp Leu Val Leu Val Ala Ala Arg Arg Ala Arg Gln Met Gln Val
20 25 30
Gly Gly Lys Asp Pro Leu Val Pro Glu Glu Asn Asp Lys Thr Thr Val
35 40 45
Ile Ala Leu Arg Glu Ile Glu Glu Gly Leu Ile Asn Asn Gln Ile Leu
50 55 60
Asp Val Arg Glu Arg Gln Glu Gln Gln Glu Gln Glu Ala Ala Glu Leu
65 70 75 80
Gln Ala Val Thr Ala Ile Ala Glu Gly Arg Ala Ala Ala Asp Tyr Lys
85 90 95
Asp Asp Asp Asp Lys Phe Arg Thr Gly Ser Lys Thr Pro Pro His Thr
100 105 110
Ser Met Ser Thr Lys Lys Lys Pro Leu Thr Gln Glu Gln Leu Glu Asp
115 120 125
Ala Arg Arg Leu Lys Ala Ile Tyr Glu Lys Lys Lys Asn Glu Leu Gly
130 135 140
Leu Ser Gln Glu Ser Val Ala Asp Lys Met Gly Met Gly Gln Ser Gly
145 150 155 160
Val Gly Ala Leu Phe Asn Gly Ile Asn Ala Leu Asn Ala Tyr Asn Ala
165 170 175
Ala Leu Leu Ala Lys Ile Leu Lys Val Ser Val Glu Glu Phe Ser Pro
180 185 190
Ser Ile Ala Arg Glu Ile Tyr Glu Met Tyr Glu Ala Val Ser Met Gln
195 200 205
Pro Ser Leu Arg Ser Glu Tyr Met Ala Met Asp Gln Lys Gln Phe Glu
210 215 220
Lys Ile Arg Ala Val Phe Asp Arg Ser Gly Val Ala Leu Thr Leu Val
225 230 235 240
Asp Met Ser Leu Pro Glu Gln Pro Leu Val Leu Ala Asn Pro Pro Phe
245 250 255
Leu Arg Met Thr Gly Tyr Thr Glu Gly Gln Ile Leu Gly Phe Asn Cys
260 265 270
Arg Phe Leu Gln Arg Gly Asp Glu Asn Ala Gln Ala Arg Ala Asp Ile
275 280 285
Arg Asp Ala Leu Lys Leu Gly Arg Glu Leu Gln Val Val Leu Arg Asn
290 295 300
Tyr Arg Ala Asn Asp Glu Pro Phe Asp Asn Leu Leu Phe Leu His Pro
305 310 315 320
Val Gly Gly Arg Pro Asp Ala Pro Asp Tyr Phe Leu Gly Ser Gln Phe
325 330 335
Glu Leu Gly Arg Ser Gly Asn Ser Glu Glu Ala Ala Ala Ala Gly His
340 345 350
Ala Gly Ala Leu Thr Gly Glu Leu Ala Arg Ile Gly Thr Val Ala Ala
355 360 365
Arg Leu Glu Met Asp Ser Arg Arg His Leu Ala Gln Ala Ala Ala Ala
370 375 380
Leu Val Arg Ala Trp Glu Arg Arg Gly
385 390
<210> 43
<211> 516
<212> PRT
<213> Synthetic Sequence
<400> 43
Met Lys Leu Leu Ser Ser Ile Glu Gln Ala Cys Asp Ile Cys Arg Leu
1 5 10 15
Lys Lys Leu Lys Cys Ser Lys Glu Lys Pro Lys Cys Ala Lys Cys Leu
20 25 30
Lys Asn Asn Trp Glu Cys Arg Tyr Ser Pro Lys Thr Lys Arg Ser Pro
35 40 45
Leu Thr Arg Ala His Leu Thr Glu Val Glu Ser Arg Leu Glu Arg Leu
50 55 60
Glu Met Ala Met Asp Gln Lys Gln Phe Glu Lys Ile Arg Ala Val Phe
65 70 75 80
Asp Arg Ser Gly Val Ala Leu Thr Leu Val Asp Met Ser Leu Pro Glu
85 90 95
Gln Pro Leu Val Leu Ala Asn Pro Pro Phe Leu Arg Met Thr Gly Tyr
100 105 110
Thr Glu Gly Gln Ile Leu Gly Phe Asn Cys Arg Phe Leu Gln Arg Gly
115 120 125
Asp Glu Asn Ala Gln Ala Arg Ala Asp Ile Arg Asp Ala Leu Lys Leu
130 135 140
Gly Arg Glu Leu Gln Val Val Leu Arg Asn Tyr Arg Ala Asn Asp Glu
145 150 155 160
Pro Phe Asp Asn Leu Leu Phe Leu His Pro Val Gly Gly Arg Pro Asp
165 170 175
Ala Pro Asp Tyr Phe Leu Gly Ser Gln Phe Glu Leu Gly Arg Ser Gly
180 185 190
Asn Ser Glu Glu Ala Ala Ala Ala Gly His Ala Gly Ala Leu Thr Gly
195 200 205
Glu Leu Ala Arg Ile Gly Thr Val Ala Ala Arg Leu Glu Met Asp Ser
210 215 220
Arg Arg His Leu Ala Gln Ala Ala Ala Ala Leu Val Arg Ala Trp Glu
225 230 235 240
Arg Arg Gly Thr Ser Ala Ala Ala Asp Tyr Lys Asp Asp Asp Asp Lys
245 250 255
Phe Arg Thr Gly Ser Lys Thr Pro Pro His Gly Thr Met Gln Gly Ser
260 265 270
Val Thr Glu Phe Leu Lys Pro Arg Leu Val Asp Ile Glu Gln Val Ser
275 280 285
Ser Thr His Ala Lys Val Thr Leu Glu Pro Leu Glu Arg Gly Phe Gly
290 295 300
His Thr Leu Gly Asn Ala Leu Arg Arg Ile Leu Leu Ser Ser Met Pro
305 310 315 320
Gly Cys Ala Val Thr Glu Val Glu Ile Asp Gly Val Leu His Glu Tyr
325 330 335
Ser Thr Lys Glu Gly Val Gln Glu Asp Ile Leu Glu Ile Leu Leu Asn
340 345 350
Leu Lys Gly Leu Ala Val Arg Val Gln Gly Lys Asp Glu Val Ile Leu
355 360 365
Thr Leu Asn Lys Ser Gly Ile Gly Pro Val Thr Ala Ala Asp Ile Thr
370 375 380
His Asp Gly Asp Val Glu Ile Val Lys Pro Gln His Val Ile Cys His
385 390 395 400
Leu Thr Asp Glu Asn Ala Ser Ile Ser Met Arg Ile Lys Val Gln Arg
405 410 415
Gly Arg Gly Tyr Val Pro Ala Ser Thr Arg Ile His Ser Glu Glu Asp
420 425 430
Glu Arg Pro Ile Gly Arg Leu Leu Val Asp Ala Cys Tyr Ser Pro Val
435 440 445
Glu Arg Ile Ala Tyr Asn Val Glu Ala Ala Arg Val Glu Gln Arg Thr
450 455 460
Asp Leu Asp Lys Leu Val Ile Glu Met Glu Thr Asn Gly Thr Ile Asp
465 470 475 480
Pro Glu Glu Ala Ile Arg Arg Ala Ala Thr Ile Leu Ala Glu Gln Leu
485 490 495
Glu Ala Phe Val Asp Leu Arg Asp Val Arg Gln Pro Glu Val Lys Glu
500 505 510
Glu Lys Pro Glu
515
<210> 44
<211> 356
<212> PRT
<213> Synthetic Sequence
<400> 44
Met Ala Arg Val Thr Val Gln Asp Ala Val Glu Lys Ile Gly Asn Arg
1 5 10 15
Phe Asp Leu Val Leu Val Ala Ala Arg Arg Ala Arg Gln Met Gln Val
20 25 30
Gly Gly Lys Asp Pro Leu Val Pro Glu Glu Asn Asp Lys Thr Thr Val
35 40 45
Ile Ala Leu Arg Glu Ile Glu Glu Gly Leu Ile Asn Asn Gln Ile Leu
50 55 60
Asp Val Arg Glu Arg Gln Glu Gln Gln Glu Gln Glu Ala Ala Glu Leu
65 70 75 80
Gln Ala Val Thr Ala Ile Ala Glu Gly Arg Ala Ala Ala Asp Tyr Lys
85 90 95
Asp Asp Asp Asp Lys Phe Arg Thr Gly Ser Lys Thr Pro Pro His Thr
100 105 110
Ser Met Lys Leu Leu Ser Ser Ile Glu Gln Ala Cys Asp Ile Cys Arg
115 120 125
Leu Lys Lys Leu Lys Cys Ser Lys Glu Lys Pro Lys Cys Ala Lys Cys
130 135 140
Leu Lys Asn Asn Trp Glu Cys Arg Tyr Ser Pro Lys Thr Lys Arg Ser
145 150 155 160
Pro Leu Thr Arg Ala His Leu Thr Glu Val Glu Ser Arg Leu Glu Arg
165 170 175
Leu Glu Met Ala Met Asp Gln Lys Gln Phe Glu Lys Ile Arg Ala Val
180 185 190
Phe Asp Arg Ser Gly Val Ala Leu Thr Leu Val Asp Met Ser Leu Pro
195 200 205
Glu Gln Pro Leu Val Leu Ala Asn Pro Pro Phe Leu Arg Met Thr Gly
210 215 220
Tyr Thr Glu Gly Gln Ile Leu Gly Phe Asn Cys Arg Phe Leu Gln Arg
225 230 235 240
Gly Asp Glu Asn Ala Gln Ala Arg Ala Asp Ile Arg Asp Ala Leu Lys
245 250 255
Leu Gly Arg Glu Leu Gln Val Val Leu Arg Asn Tyr Arg Ala Asn Asp
260 265 270
Glu Pro Phe Asp Asn Leu Leu Phe Leu His Pro Val Gly Gly Arg Pro
275 280 285
Asp Ala Pro Asp Tyr Phe Leu Gly Ser Gln Phe Glu Leu Gly Arg Ser
290 295 300
Gly Asn Ser Glu Glu Ala Ala Ala Ala Gly His Ala Gly Ala Leu Thr
305 310 315 320
Gly Glu Leu Ala Arg Ile Gly Thr Val Ala Ala Arg Leu Glu Met Asp
325 330 335
Ser Arg Arg His Leu Ala Gln Ala Ala Ala Ala Leu Val Arg Ala Trp
340 345 350
Glu Arg Arg Gly
355
<210> 45
<211> 514
<212> PRT
<213> Synthetic Sequence
<400> 45
Met Ser Arg Leu Asp Lys Ser Lys Val Ile Asn Ser Ala Leu Glu Leu
1 5 10 15
Leu Asn Glu Val Gly Ile Glu Gly Leu Thr Thr Arg Lys Leu Ala Gln
20 25 30
Lys Leu Gly Val Glu Gln Pro Thr Leu Tyr Trp His Val Lys Asn Lys
35 40 45
Arg Ala Leu Leu Asp Ala Leu Ala Ile Glu Met Leu Asp Arg His Met
50 55 60
Ala Met Asp Gln Lys Gln Phe Glu Lys Ile Arg Ala Val Phe Asp Arg
65 70 75 80
Ser Gly Val Ala Leu Thr Leu Val Asp Met Ser Leu Pro Glu Gln Pro
85 90 95
Leu Val Leu Ala Asn Pro Pro Phe Leu Arg Met Thr Gly Tyr Thr Glu
100 105 110
Gly Gln Ile Leu Gly Phe Asn Cys Arg Phe Leu Gln Arg Gly Asp Glu
115 120 125
Asn Ala Gln Ala Arg Ala Asp Ile Arg Asp Ala Leu Lys Leu Gly Arg
130 135 140
Glu Leu Gln Val Val Leu Arg Asn Tyr Arg Ala Asn Asp Glu Pro Phe
145 150 155 160
Asp Asn Leu Leu Phe Leu His Pro Val Gly Gly Arg Pro Asp Ala Pro
165 170 175
Asp Tyr Phe Leu Gly Ser Gln Phe Glu Leu Gly Arg Ser Gly Asn Ser
180 185 190
Glu Glu Ala Ala Ala Ala Gly His Ala Gly Ala Leu Thr Gly Glu Leu
195 200 205
Ala Arg Ile Gly Thr Val Ala Ala Arg Leu Glu Met Asp Ser Arg Arg
210 215 220
His Leu Ala Gln Ala Ala Ala Ala Leu Val Arg Ala Trp Glu Arg Arg
225 230 235 240
Gly Thr Ser Ala Ala Ala Asp Tyr Lys Asp Asp Asp Asp Lys Phe Arg
245 250 255
Thr Gly Ser Lys Thr Pro Pro His Gly Thr Met Gln Gly Ser Val Thr
260 265 270
Glu Phe Leu Lys Pro Arg Leu Val Asp Ile Glu Gln Val Ser Ser Thr
275 280 285
His Ala Lys Val Thr Leu Glu Pro Leu Glu Arg Gly Phe Gly His Thr
290 295 300
Leu Gly Asn Ala Leu Arg Arg Ile Leu Leu Ser Ser Met Pro Gly Cys
305 310 315 320
Ala Val Thr Glu Val Glu Ile Asp Gly Val Leu His Glu Tyr Ser Thr
325 330 335
Lys Glu Gly Val Gln Glu Asp Ile Leu Glu Ile Leu Leu Asn Leu Lys
340 345 350
Gly Leu Ala Val Arg Val Gln Gly Lys Asp Glu Val Ile Leu Thr Leu
355 360 365
Asn Lys Ser Gly Ile Gly Pro Val Thr Ala Ala Asp Ile Thr His Asp
370 375 380
Gly Asp Val Glu Ile Val Lys Pro Gln His Val Ile Cys His Leu Thr
385 390 395 400
Asp Glu Asn Ala Ser Ile Ser Met Arg Ile Lys Val Gln Arg Gly Arg
405 410 415
Gly Tyr Val Pro Ala Ser Thr Arg Ile His Ser Glu Glu Asp Glu Arg
420 425 430
Pro Ile Gly Arg Leu Leu Val Asp Ala Cys Tyr Ser Pro Val Glu Arg
435 440 445
Ile Ala Tyr Asn Val Glu Ala Ala Arg Val Glu Gln Arg Thr Asp Leu
450 455 460
Asp Lys Leu Val Ile Glu Met Glu Thr Asn Gly Thr Ile Asp Pro Glu
465 470 475 480
Glu Ala Ile Arg Arg Ala Ala Thr Ile Leu Ala Glu Gln Leu Glu Ala
485 490 495
Phe Val Asp Leu Arg Asp Val Arg Gln Pro Glu Val Lys Glu Glu Lys
500 505 510
Pro Glu
<210> 46
<211> 354
<212> PRT
<213> Synthetic Sequence
<400> 46
Met Ala Arg Val Thr Val Gln Asp Ala Val Glu Lys Ile Gly Asn Arg
1 5 10 15
Phe Asp Leu Val Leu Val Ala Ala Arg Arg Ala Arg Gln Met Gln Val
20 25 30
Gly Gly Lys Asp Pro Leu Val Pro Glu Glu Asn Asp Lys Thr Thr Val
35 40 45
Ile Ala Leu Arg Glu Ile Glu Glu Gly Leu Ile Asn Asn Gln Ile Leu
50 55 60
Asp Val Arg Glu Arg Gln Glu Gln Gln Glu Gln Glu Ala Ala Glu Leu
65 70 75 80
Gln Ala Val Thr Ala Ile Ala Glu Gly Arg Ala Ala Ala Asp Tyr Lys
85 90 95
Asp Asp Asp Asp Lys Phe Arg Thr Gly Ser Lys Thr Pro Pro His Thr
100 105 110
Ser Met Ser Arg Leu Asp Lys Ser Lys Val Ile Asn Ser Ala Leu Glu
115 120 125
Leu Leu Asn Glu Val Gly Ile Glu Gly Leu Thr Thr Arg Lys Leu Ala
130 135 140
Gln Lys Leu Gly Val Glu Gln Pro Thr Leu Tyr Trp His Val Lys Asn
145 150 155 160
Lys Arg Ala Leu Leu Asp Ala Leu Ala Ile Glu Met Leu Asp Arg His
165 170 175
Met Ala Met Asp Gln Lys Gln Phe Glu Lys Ile Arg Ala Val Phe Asp
180 185 190
Arg Ser Gly Val Ala Leu Thr Leu Val Asp Met Ser Leu Pro Glu Gln
195 200 205
Pro Leu Val Leu Ala Asn Pro Pro Phe Leu Arg Met Thr Gly Tyr Thr
210 215 220
Glu Gly Gln Ile Leu Gly Phe Asn Cys Arg Phe Leu Gln Arg Gly Asp
225 230 235 240
Glu Asn Ala Gln Ala Arg Ala Asp Ile Arg Asp Ala Leu Lys Leu Gly
245 250 255
Arg Glu Leu Gln Val Val Leu Arg Asn Tyr Arg Ala Asn Asp Glu Pro
260 265 270
Phe Asp Asn Leu Leu Phe Leu His Pro Val Gly Gly Arg Pro Asp Ala
275 280 285
Pro Asp Tyr Phe Leu Gly Ser Gln Phe Glu Leu Gly Arg Ser Gly Asn
290 295 300
Ser Glu Glu Ala Ala Ala Ala Gly His Ala Gly Ala Leu Thr Gly Glu
305 310 315 320
Leu Ala Arg Ile Gly Thr Val Ala Ala Arg Leu Glu Met Asp Ser Arg
325 330 335
Arg His Leu Ala Gln Ala Ala Ala Ala Leu Val Arg Ala Trp Glu Arg
340 345 350
Arg Gly
<210> 47
<211> 1400
<212> DNA
<213> Synthetic Sequence
<400> 47
ctgttttggc ggatgagaga agattttcag cctgatacag attaaatcag aacgcagaag 60
cggtctgata aaacagaatt tgcctggcgg cagtagcgcg gtggtcccac ctgaccccat 120
gccgaactca gaagtgaaac gccgtagcgc cgatggtagt gtggggtctc cccatgcgag 180
agtagggaac tgccaggcat caaataaaac gaaaggctca gtcgaaagac tgggcctttc 240
gttttatctg ttgtttgcgc tagcggatcc tgtttttttg atcgttttca caaaaatgga 300
agtccacagt cttgacaggg aaaatgcagc ggcgtagctt ttatgccgta tataaaaacg 360
gcgtttatat gtacggtatt tatttttaac ttattgtttt aaaagtcaaa gaggatttta 420
taatggtgag caagggcgag gaggataaca tggccatcat caaggagttc atgcgcttca 480
aggtgcacat ggagggctcc gtgaacggcc acgagttcga gatcgagggc gagggcgagg 540
gccgccccta cgagggcacc cagaccgcca agctgaaggt gaccaagggt ggccccctgc 600
ccttcgcctg ggacatcctg tcccctcagt tcatgtacgg ctccaaggcc tacgtgaagc 660
accccgccga catccccgac tacttgaagc tgtccttccc cgagggcttc aagtgggagc 720
gcgtgatgaa cttcgaggac ggcggcgtgg tgaccgtgac ccaggactcc tccctgcagg 780
acggcgagtt catctacaag gtgaagctgc gcggcaccaa cttcccctcc gacggccccg 840
taatgcagaa gaagaccatg ggctgggagg cctcctccga gcggatgtac cccgaggacg 900
gcgccctgaa gggcgagatc aagcagaggc tgaagctgaa ggacggcggc cactacgacg 960
ctgaggtcaa gaccacctac aaggccaaga agcccgtgca gctgcccggc gcctacaacg 1020
tcaacatcaa gttggacatc acctcccaca acgaggacta caccatcgtg gaacagtacg 1080
aacgcgccga gggccgccac tccaccggcg gcatggacga gctgtacaag taagaattcc 1140
ccctgttttg gcggatgaga gaagattttc agcctgatac agattaaatc agaacgcaga 1200
agcggtctga taaaacagaa tttgcctggc ggcagtagcg cggtggtccc acctgacccc 1260
atgccgaact cagaagtgaa acgccgtagc gccgatggta gtgtggggtc tccccatgcg 1320
agagtaggga actgccaggc atcaaataaa acgaaaggct cagtcgaaag actgggcctt 1380
tcgttttatc tgttgtttgc 1400
<210> 48
<211> 1400
<212> DNA
<213> Synthetic Sequence
<400> 48
ctgttttggc ggatgagaga agattttcag cctgatacag attaaatcag aacgcagaag 60
cggtctgata aaacagaatt tgcctggcgg cagtagcgcg gtggtcccac ctgaccccat 120
gccgaactca gaagtgaaac gccgtagcgc cgatggtagt gtggggtctc cccatgcgag 180
agtagggaac tgccaggcat caaataaaac gaaaggctca gtcgaaagac tgggcctttc 240
gttttatctg ttgtttgcgc tagcggatcc tgtttttttg atcgttttca caaaaatgga 300
agtccacagt cttgacaggg aaaatgcagc ggcgtagctt ttatgctgta tataaaacca 360
gtggttatat gtacagtatt tatttttaac ttattgtttt aaaagtcaaa gaggatttta 420
taatggtgag caagggcgag gaggataaca tggccatcat caaggagttc atgcgcttca 480
aggtgcacat ggagggctcc gtgaacggcc acgagttcga gatcgagggc gagggcgagg 540
gccgccccta cgagggcacc cagaccgcca agctgaaggt gaccaagggt ggccccctgc 600
ccttcgcctg ggacatcctg tcccctcagt tcatgtacgg ctccaaggcc tacgtgaagc 660
accccgccga catccccgac tacttgaagc tgtccttccc cgagggcttc aagtgggagc 720
gcgtgatgaa cttcgaggac ggcggcgtgg tgaccgtgac ccaggactcc tccctgcagg 780
acggcgagtt catctacaag gtgaagctgc gcggcaccaa cttcccctcc gacggccccg 840
taatgcagaa gaagaccatg ggctgggagg cctcctccga gcggatgtac cccgaggacg 900
gcgccctgaa gggcgagatc aagcagaggc tgaagctgaa ggacggcggc cactacgacg 960
ctgaggtcaa gaccacctac aaggccaaga agcccgtgca gctgcccggc gcctacaacg 1020
tcaacatcaa gttggacatc acctcccaca acgaggacta caccatcgtg gaacagtacg 1080
aacgcgccga gggccgccac tccaccggcg gcatggacga gctgtacaag taagaattcc 1140
ccctgttttg gcggatgaga gaagattttc agcctgatac agattaaatc agaacgcaga 1200
agcggtctga taaaacagaa tttgcctggc ggcagtagcg cggtggtccc acctgacccc 1260
atgccgaact cagaagtgaa acgccgtagc gccgatggta gtgtggggtc tccccatgcg 1320
agagtaggga actgccaggc atcaaataaa acgaaaggct cagtcgaaag actgggcctt 1380
tcgttttatc tgttgtttgc 1400
<210> 49
<211> 1319
<212> DNA
<213> Synthetic Sequence
<400> 49
ctgttttggc ggatgagaga agattttcag cctgatacag attaaatcag aacgcagaag 60
cggtctgata aaacagaatt tgcctggcgg cagtagcgcg gtggtcccac ctgaccccat 120
gccgaactca gaagtgaaac gccgtagcgc cgatggtagt gtggggtctc cccatgcgag 180
agtagggaac tgccaggcat caaataaaac gaaaggctca gtcgaaagac tgggcctttc 240
gttttatctg ttgtttgcgc tagcggatcc atagggttga tctttgttgt cactggatgt 300
actgtacatc catacagtaa ctcacagggg ctggattgat tatggtgagc aagggcgagg 360
aggataacat ggccatcatc aaggagttca tgcgcttcaa ggtgcacatg gagggctccg 420
tgaacggcca cgagttcgag atcgagggcg agggcgaggg ccgcccctac gagggcaccc 480
agaccgccaa gctgaaggtg accaagggtg gccccctgcc cttcgcctgg gacatcctgt 540
cccctcagtt catgtacggc tccaaggcct acgtgaagca ccccgccgac atccccgact 600
acttgaagct gtccttcccc gagggcttca agtgggagcg cgtgatgaac ttcgaggacg 660
gcggcgtggt gaccgtgacc caggactcct ccctgcagga cggcgagttc atctacaagg 720
tgaagctgcg cggcaccaac ttcccctccg acggccccgt aatgcagaag aagaccatgg 780
gctgggaggc ctcctccgag cggatgtacc ccgaggacgg cgccctgaag ggcgagatca 840
agcagaggct gaagctgaag gacggcggcc actacgacgc tgaggtcaag accacctaca 900
aggccaagaa gcccgtgcag ctgcccggcg cctacaacgt caacatcaag ttggacatca 960
cctcccacaa cgaggactac accatcgtgg aacagtacga acgcgccgag ggccgccact 1020
ccaccggcgg catggacgag ctgtacaagt aagaattccc cctgttttgg cggatgagag 1080
aagattttca gcctgataca gattaaatca gaacgcagaa gcggtctgat aaaacagaat 1140
ttgcctggcg gcagtagcgc ggtggtccca cctgacccca tgccgaactc agaagtgaaa 1200
cgccgtagcg ccgatggtag tgtggggtct ccccatgcga gagtagggaa ctgccaggca 1260
tcaaataaaa cgaaaggctc agtcgaaaga ctgggccttt cgttttatct gttgtttgc 1319
<210> 50
<211> 1348
<212> DNA
<213> Synthetic Sequence
<400> 50
ctgttttggc ggatgagaga agattttcag cctgatacag attaaatcag aacgcagaag 60
cggtctgata aaacagaatt tgcctggcgg cagtagcgcg gtggtcccac ctgaccccat 120
gccgaactca gaagtgaaac gccgtagcgc cgatggtagt gtggggtctc cccatgcgag 180
agtagggaac tgccaggcat caaataaaac gaaaggctca gtcgaaagac tgggcctttc 240
gttttatctg ttgtttgcgc tagcggatcc caatttctac aaaacacttg atactgtatg 300
agcatacagt ataattgctt caacagaaca tattgactat ccggtattac ccggcatgac 360
aggagtaaaa atggtgagca agggcgagga ggataacatg gccatcatca aggagttcat 420
gcgcttcaag gtgcacatgg agggctccgt gaacggccac gagttcgaga tcgagggcga 480
gggcgagggc cgcccctacg agggcaccca gaccgccaag ctgaaggtga ccaagggtgg 540
ccccctgccc ttcgcctggg acatcctgtc ccctcagttc atgtacggct ccaaggccta 600
cgtgaagcac cccgccgaca tccccgacta cttgaagctg tccttccccg agggcttcaa 660
gtgggagcgc gtgatgaact tcgaggacgg cggcgtggtg accgtgaccc aggactcctc 720
cctgcaggac ggcgagttca tctacaaggt gaagctgcgc ggcaccaact tcccctccga 780
cggccccgta atgcagaaga agaccatggg ctgggaggcc tcctccgagc ggatgtaccc 840
cgaggacggc gccctgaagg gcgagatcaa gcagaggctg aagctgaagg acggcggcca 900
ctacgacgct gaggtcaaga ccacctacaa ggccaagaag cccgtgcagc tgcccggcgc 960
ctacaacgtc aacatcaagt tggacatcac ctcccacaac gaggactaca ccatcgtgga 1020
acagtacgaa cgcgccgagg gccgccactc caccggcggc atggacgagc tgtacaagta 1080
agaattcccc ctgttttggc ggatgagaga agattttcag cctgatacag attaaatcag 1140
aacgcagaag cggtctgata aaacagaatt tgcctggcgg cagtagcgcg gtggtcccac 1200
ctgaccccat gccgaactca gaagtgaaac gccgtagcgc cgatggtagt gtggggtctc 1260
cccatgcgag agtagggaac tgccaggcat caaataaaac gaaaggctca gtcgaaagac 1320
tgggcctttc gttttatctg ttgtttgc 1348
<210> 51
<211> 1348
<212> DNA
<213> Synthetic Sequence
<400> 51
ctgttttggc ggatgagaga agattttcag cctgatacag attaaatcag aacgcagaag 60
cggtctgata aaacagaatt tgcctggcgg cagtagcgcg gtggtcccac ctgaccccat 120
gccgaactca gaagtgaaac gccgtagcgc cgatggtagt gtggggtctc cccatgcgag 180
agtagggaac tgccaggcat caaataaaac gaaaggctca gtcgaaagac tgggcctttc 240
gttttatctg ttgtttgcgc tagcggatcc gcctatgcag cgacaaatat tgatagcctg 300
aatcagtatt gatctgctgg caagaacaga ctactgtata taaaaacagt ataacttcag 360
gcagattatt atggtgagca agggcgagga ggataacatg gccatcatca aggagttcat 420
gcgcttcaag gtgcacatgg agggctccgt gaacggccac gagttcgaga tcgagggcga 480
gggcgagggc cgcccctacg agggcaccca gaccgccaag ctgaaggtga ccaagggtgg 540
ccccctgccc ttcgcctggg acatcctgtc ccctcagttc atgtacggct ccaaggccta 600
cgtgaagcac cccgccgaca tccccgacta cttgaagctg tccttccccg agggcttcaa 660
gtgggagcgc gtgatgaact tcgaggacgg cggcgtggtg accgtgaccc aggactcctc 720
cctgcaggac ggcgagttca tctacaaggt gaagctgcgc ggcaccaact tcccctccga 780
cggccccgta atgcagaaga agaccatggg ctgggaggcc tcctccgagc ggatgtaccc 840
cgaggacggc gccctgaagg gcgagatcaa gcagaggctg aagctgaagg acggcggcca 900
ctacgacgct gaggtcaaga ccacctacaa ggccaagaag cccgtgcagc tgcccggcgc 960
ctacaacgtc aacatcaagt tggacatcac ctcccacaac gaggactaca ccatcgtgga 1020
acagtacgaa cgcgccgagg gccgccactc caccggcggc atggacgagc tgtacaagta 1080
agaattcccc ctgttttggc ggatgagaga agattttcag cctgatacag attaaatcag 1140
aacgcagaag cggtctgata aaacagaatt tgcctggcgg cagtagcgcg gtggtcccac 1200
ctgaccccat gccgaactca gaagtgaaac gccgtagcgc cgatggtagt gtggggtctc 1260
cccatgcgag agtagggaac tgccaggcat caaataaaac gaaaggctca gtcgaaagac 1320
tgggcctttc gttttatctg ttgtttgc 1348
<210> 52
<211> 1322
<212> DNA
<213> Synthetic Sequence
<400> 52
ctgttttggc ggatgagaga agattttcag cctgatacag attaaatcag aacgcagaag 60
cggtctgata aaacagaatt tgcctggcgg cagtagcgcg gtggtcccac ctgaccccat 120
gccgaactca gaagtgaaac gccgtagcgc cgatggtagt gtggggtctc cccatgcgag 180
agtagggaac tgccaggcat caaataaaac gaaaggctca gtcgaaagac tgggcctttc 240
gttttatctg ttgtttgcgc tagcggatcc tatctaacac cgtgcgtgtt gactatttta 300
cctctggcgg tgataatggt tgcatgtact aaggaggtac tagtatggtg agcaagggcg 360
aggaggataa catggccatc atcaaggagt tcatgcgctt caaggtgcac atggagggct 420
ccgtgaacgg ccacgagttc gagatcgagg gcgagggcga gggccgcccc tacgagggca 480
cccagaccgc caagctgaag gtgaccaagg gtggccccct gcccttcgcc tgggacatcc 540
tgtcccctca gttcatgtac ggctccaagg cctacgtgaa gcaccccgcc gacatccccg 600
actacttgaa gctgtccttc cccgagggct tcaagtggga gcgcgtgatg aacttcgagg 660
acggcggcgt ggtgaccgtg acccaggact cctccctgca ggacggcgag ttcatctaca 720
aggtgaagct gcgcggcacc aacttcccct ccgacggccc cgtaatgcag aagaagacca 780
tgggctggga ggcctcctcc gagcggatgt accccgagga cggcgccctg aagggcgaga 840
tcaagcagag gctgaagctg aaggacggcg gccactacga cgctgaggtc aagaccacct 900
acaaggccaa gaagcccgtg cagctgcccg gcgcctacaa cgtcaacatc aagttggaca 960
tcacctccca caacgaggac tacaccatcg tggaacagta cgaacgcgcc gagggccgcc 1020
actccaccgg cggcatggac gagctgtaca agtaagaatt ccccctgttt tggcggatga 1080
gagaagattt tcagcctgat acagattaaa tcagaacgca gaagcggtct gataaaacag 1140
aatttgcctg gcggcagtag cgcggtggtc ccacctgacc ccatgccgaa ctcagaagtg 1200
aaacgccgta gcgccgatgg tagtgtgggg tctccccatg cgagagtagg gaactgccag 1260
gcatcaaata aaacgaaagg ctcagtcgaa agactgggcc tttcgtttta tctgttgttt 1320
gc 1322
<210> 53
<211> 1337
<212> DNA
<213> Synthetic Sequence
<400> 53
ctgttttggc ggatgagaga agattttcag cctgatacag attaaatcag aacgcagaag 60
cggtctgata aaacagaatt tgcctggcgg cagtagcgcg gtggtcccac ctgaccccat 120
gccgaactca gaagtgaaac gccgtagcgc cgatggtagt gtggggtctc cccatgcgag 180
agtagggaac tgccaggcat caaataaaac gaaaggctca gtcgaaagac tgggcctttc 240
gttttatctg ttgtttgcgc tagcggatcc ggaaattaat acgactcact ataggggcgg 300
agtactgtcc tccgcccctg tagaaataat tttgtttaac tttaataagg agatatacca 360
tggtgagcaa gggcgaggag gataacatgg ccatcatcaa ggagttcatg cgcttcaagg 420
tgcacatgga gggctccgtg aacggccacg agttcgagat cgagggcgag ggcgagggcc 480
gcccctacga gggcacccag accgccaagc tgaaggtgac caagggtggc cccctgccct 540
tcgcctggga catcctgtcc cctcagttca tgtacggctc caaggcctac gtgaagcacc 600
ccgccgacat ccccgactac ttgaagctgt ccttccccga gggcttcaag tgggagcgcg 660
tgatgaactt cgaggacggc ggcgtggtga ccgtgaccca ggactcctcc ctgcaggacg 720
gcgagttcat ctacaaggtg aagctgcgcg gcaccaactt cccctccgac ggccccgtaa 780
tgcagaagaa gaccatgggc tgggaggcct cctccgagcg gatgtacccc gaggacggcg 840
ccctgaaggg cgagatcaag cagaggctga agctgaagga cggcggccac tacgacgctg 900
aggtcaagac cacctacaag gccaagaagc ccgtgcagct gcccggcgcc tacaacgtca 960
acatcaagtt ggacatcacc tcccacaacg aggactacac catcgtggaa cagtacgaac 1020
gcgccgaggg ccgccactcc accggcggca tggacgagct gtacaagtaa gaattccccc 1080
tgttttggcg gatgagagaa gattttcagc ctgatacaga ttaaatcaga acgcagaagc 1140
ggtctgataa aacagaattt gcctggcggc agtagcgcgg tggtcccacc tgaccccatg 1200
ccgaactcag aagtgaaacg ccgtagcgcc gatggtagtg tggggtctcc ccatgcgaga 1260
gtagggaact gccaggcatc aaataaaacg aaaggctcag tcgaaagact gggcctttcg 1320
ttttatctgt tgtttgc 1337
<210> 54
<211> 1339
<212> DNA
<213> Synthetic Sequence
<400> 54
ctgttttggc ggatgagaga agattttcag cctgatacag attaaatcag aacgcagaag 60
cggtctgata aaacagaatt tgcctggcgg cagtagcgcg gtggtcccac ctgaccccat 120
gccgaactca gaagtgaaac gccgtagcgc cgatggtagt gtggggtctc cccatgcgag 180
agtagggaac tgccaggcat caaataaaac gaaaggctca gtcgaaagac tgggcctttc 240
gttttatctg ttgtttgcgc tagcggatcc ggaaattaat acgactcact ataggggtcc 300
ctatcagtga tagagacccc tgtagaaata attttgttta actttaataa ggagatatac 360
catggtgagc aagggcgagg aggataacat ggccatcatc aaggagttca tgcgcttcaa 420
ggtgcacatg gagggctccg tgaacggcca cgagttcgag atcgagggcg agggcgaggg 480
ccgcccctac gagggcaccc agaccgccaa gctgaaggtg accaagggtg gccccctgcc 540
cttcgcctgg gacatcctgt cccctcagtt catgtacggc tccaaggcct acgtgaagca 600
ccccgccgac atccccgact acttgaagct gtccttcccc gagggcttca agtgggagcg 660
cgtgatgaac ttcgaggacg gcggcgtggt gaccgtgacc caggactcct ccctgcagga 720
cggcgagttc atctacaagg tgaagctgcg cggcaccaac ttcccctccg acggccccgt 780
aatgcagaag aagaccatgg gctgggaggc ctcctccgag cggatgtacc ccgaggacgg 840
cgccctgaag ggcgagatca agcagaggct gaagctgaag gacggcggcc actacgacgc 900
tgaggtcaag accacctaca aggccaagaa gcccgtgcag ctgcccggcg cctacaacgt 960
caacatcaag ttggacatca cctcccacaa cgaggactac accatcgtgg aacagtacga 1020
acgcgccgag ggccgccact ccaccggcgg catggacgag ctgtacaagt aagaattccc 1080
cctgttttgg cggatgagag aagattttca gcctgataca gattaaatca gaacgcagaa 1140
gcggtctgat aaaacagaat ttgcctggcg gcagtagcgc ggtggtccca cctgacccca 1200
tgccgaactc agaagtgaaa cgccgtagcg ccgatggtag tgtggggtct ccccatgcga 1260
gagtagggaa ctgccaggca tcaaataaaa cgaaaggctc agtcgaaaga ctgggccttt 1320
cgttttatct gttgtttgc 1339
<210> 55
<211> 237
<212> PRT
<213> Synthetic Sequence
<400> 55
Met Ser Thr Lys Lys Lys Pro Leu Thr Gln Glu Gln Leu Glu Asp Ala
1 5 10 15
Arg Arg Leu Lys Ala Ile Tyr Glu Lys Lys Lys Asn Glu Leu Gly Leu
20 25 30
Ser Gln Glu Ser Val Ala Asp Lys Met Gly Met Gly Gln Ser Gly Val
35 40 45
Gly Ala Leu Phe Asn Gly Ile Asn Ala Leu Asn Ala Tyr Asn Ala Ala
50 55 60
Leu Leu Ala Lys Ile Leu Lys Val Ser Val Glu Glu Phe Ser Pro Ser
65 70 75 80
Ile Ala Arg Glu Ile Tyr Glu Met Tyr Glu Ala Val Ser Met Gln Pro
85 90 95
Ser Leu Arg Ser Glu Tyr Glu Tyr Pro Val Phe Ser His Val Gln Ala
100 105 110
Gly Met Phe Ser Pro Glu Leu Arg Thr Phe Thr Lys Gly Asp Ala Glu
115 120 125
Arg Trp Val Ser Thr Thr Lys Lys Ala Ser Asp Ser Ala Phe Trp Leu
130 135 140
Glu Val Glu Gly Asn Ser Met Thr Ala Pro Thr Gly Ser Lys Pro Ser
145 150 155 160
Phe Pro Asp Gly Met Leu Ile Leu Val Asp Pro Glu Gln Ala Val Glu
165 170 175
Pro Gly Asp Phe Cys Ile Ala Arg Leu Gly Gly Asp Glu Phe Thr Phe
180 185 190
Lys Lys Leu Ile Arg Asp Ser Gly Gln Val Phe Leu Gln Pro Leu Asn
195 200 205
Pro Gln Tyr Pro Met Ile Pro Cys Asn Glu Ser Cys Ser Val Val Gly
210 215 220
Lys Val Ile Ala Ser Gln Trp Pro Glu Glu Thr Phe Gly
225 230 235
机译: 利用原核细菌光诱导基因表达系统和调控基因表达的方法
机译: 利用原核细菌光诱导基因表达系统和调控基因表达的方法
机译: 利用原核细菌光诱导基因表达系统和基因表达调控的方法