首页> 中国专利> 一个可原核表达烟草丛顶病毒中国分离物RdRp蛋白的质粒载体

一个可原核表达烟草丛顶病毒中国分离物RdRp蛋白的质粒载体

摘要

本发明涉及植物病毒学和分子生物学,提供了一个烟草丛顶病毒(TBTV)RdRp蛋白的原核表达载体。该质粒载体名称为pMAL‑TB‑RdRp,含有TBTV中国分离物的RdRp编码序列。该质粒作为TBTV RdRp蛋白的原核表达载体,其原核表达产物通过亲和层析纯化可获得有活性的RdRp蛋白,建立RdRp介导的体外复制研究体系,此体外复制体系将来可用于TBTV复制调控的研究。

著录项

  • 公开/公告号CN106834325A

    专利类型发明专利

  • 公开/公告日2017-06-13

    原文格式PDF

  • 申请/专利权人 山东农业大学;

    申请/专利号CN201710091992.7

  • 申请日2017-02-21

  • 分类号C12N15/70(20060101);C12N15/66(20060101);C12N9/12(20060101);C12R1/19(20060101);

  • 代理机构37240 济南誉丰专利代理事务所(普通合伙企业);

  • 代理人李茜

  • 地址 271018 山东省泰安市岱宗大街61号

  • 入库时间 2023-06-19 02:28:50

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2020-05-22

    授权

    授权

  • 2017-07-07

    实质审查的生效 IPC(主分类):C12N15/70 申请日:20170221

    实质审查的生效

  • 2017-06-13

    公开

    公开

说明书

技术领域

本发明涉及植物病毒学和分子生物学,提供了一个可原核表达烟草丛顶病毒中国分离物RdRp蛋白的质粒载体。

背景技术

烟草丛顶病(tobacco bushy top disease)于1958年在非洲津巴布韦首次报道,后陆续在其邻国,以及亚洲的巴基斯坦、泰国发现。90年代,在云南保山、三江流域爆发流行,在部分烟区造成毁灭性灾害。目前,该病在大理、保山和玉溪等主要烟区零星发生。感病烟株叶色淡绿或黄化,并伴有系统坏死枯斑或坏死线纹,苗期感病烟株严重矮化、缩顶,叶片变小,而晚期感病的烟株腋芽过度增生,株型成为密生小叶、小枝的丛枝状塔型。

烟草丛顶病通常由番茄丛矮病毒科(Tombusviridae)幽影病毒属(Umbravirus)成员烟草丛顶病毒(Tobacco bushy top virus,TBTV)及黄症病毒科(Luteoviridae)的烟草扭脉病毒(Tobacco vein distorting virus,TVDV)复合侵染引起。自然条件下,烟草丛顶病主要由蚜虫传播;发病烟苗的汁液摩擦接种健康烟苗也可致病,但造成TVDV的丢失,且不能被蚜虫传播;表明TVDV不能通过机械接种传播,TBTV单独接种烟苗即可发病。

莫笑晗等于2003年报道了TBTV中国分离物的基因组全序列。TBTV的基因组是一条(+)ssRNA,由4152个核苷酸组成。其基因组编码4个蛋白,其中ORF1和ORF2的编码框重叠存在,表达产物是病毒的复制酶(RdRp)组分,ORF3蛋白可能参与病毒的长距离运输,ORF4蛋白可能是病毒细胞间运动的功能蛋白。与其他幽影病毒属成员相似,TBTV 5’端非编码区很短(10nt),ORF1编码35kD的蛋白,ORF2则编码98kD的蛋白,是ORF1通过-1位的移码翻译机制表达产生,其N端与ORF1蛋白序列相同,ORF2蛋白具备RNA依赖的RNA聚合酶(RNAdependentRNA polymerase,RdRp)活性。RdRp活性蛋白参与TBTV基因组的复制,直接决定TBTV在植物体内的复制水平和致病性。然而目前没有独立研究TBTV RdRp调控基因组复制的研究体系,同时由于TBTV RdRp是移码产物,植物体内表达量很低;有必要通过原核表达获得RdRp,进而建立体外复制体系进行复制调控的独立研究;但是现有技术标明具备RdRp活性的蛋白在原核表达、纯化过程中容易造成活性丧失,因而无法建立体外复制体系,因而根据现有技术是无法建立体外复制体系的。

发明内容

本发明提供了一个烟草丛顶病毒(TBTV)RdRp蛋白的原核表达载体。该质粒载体名称为pMAL-TB-RdRp,含有TBTV中国分离物的RdRp编码序列。该质粒作为TBTV RdRp蛋白的原核表达载体,原核表达产物通过亲和层析纯化可获得有活性的RdRp蛋白,建立RdRp介导的体外复制研究体系。

发明人首先公开了一个可原核表达烟草丛顶病毒中国分离物RdRp蛋白的质粒载体,该质粒载体名称为pMAL-TB-RdRp,含有TBTV中国分离物RdRp蛋白的编码序列,其核苷酸序列如Seq ID No.1所示,氨基酸序列如Seq ID No.2所示。

该质粒载体的原核表达产物经亲和层析纯化,利用纯化后蛋白构建体外复制体系,可利用TBTV特异RNA片段为模板合成其互补链,此TBTV RdRp介导的体外复制体系,可为进一步定性定量研究TBTV基因组复制调控奠定基础。

发明人还公开了该可原核表达烟草丛顶病毒中国分离物RdRp蛋白的质粒载体pMAL-TB-RdRp的构建方法如下:

根据TBTV中国分离物的基因组全序列(Genebank登录号:AF402620),设计引物M-TB-ORF1-5'F和M-TB-ORF2-3'R(详细信息见表1),分别对应于RdRp的起始密码子和终止密码子附近序列。

由于TBTV RdRp是通过ORF1以-1型移码翻译机制得到表达的,因此在TBTV序列中并不存在RdRp的直接编码序列,无法通过PCR直接扩增得到RdRp编码序列。为获得TBTVRdRp编码序列,通过重叠PCR方法在TBTV全长序列的955位与956位碱基间插入一个碱基(图1所示),形成RdRp的完整编码框。

以含有TBTV中国分离物全序列的质粒pMTB1(王国鲁等,2016,植物病理学报中公开)为模板,利用引物对M-TB-ORF1-5'F/TB-936+C+956-R以及引物对TB-948+C+956-F/M-TB-ORF2-3'R在pfu Taq DNA聚合酶的作用下扩增分别得到约950bp(A段产物)和1700bp(B段产物)的PCR产物,A段和B段PCR产物经胶回收后,再利用M-TB-ORF1-5'F和M-TB-ORF2-3'R在Fast Pfu Taq DNA聚合酶作用下进行重叠PCR得到约2600bp的片段,此PCR产物和质粒pMAL-C2X分别经Pst I和EcoR I双酶切进行连接,转化产物经菌落PCR筛选、酶切鉴定和质粒DNA测序,确认得到以pMAL-C2X为基础含TBTV RdRp蛋白编码序列的原核表达载体pMAL-TB-RdRp。

表1本研究中用到的引物

Primer nameSequence(5'to 3')PCR fragmentSeq ID NoM-TB-ORF1-5'FRdRpSeq ID No.3M-TB-ORF2-3'RRdRpSeq ID No.4TB-948+C+956-FATTTTTGCCTAGGGGATGTGGTCGCRdRpSeq ID No.5TB-936+C+956-RATCCCCTAGGCAAAAATCCTTGGGCCCACRdRpSeq ID No.6TB-T7-1-Ftaa tac gac tca ctataGAGGTTACGATATGGAGTTCTB 5'160ntSeq ID No.7TB-(144-160)-RGATCCCCGGGGCGTGACACCTCATTGGTB 5'160ntSeq ID No.8TB-T7-925-FGCtaatacgactcactataGGGCCCTTCAATGTGGGCTB int 195ntSeq ID No.9TB-1120-RGGGAGTTGTTGTGGACTCCTB int 195ntSeq ID No.10TB-T7-4003-FGCtaatacgactcactataGGCAGAAACCAAGTAGCAAATTB 3'150ntSeq ID No.11TB-4152Y-RGGGCGCGAGAGAAATB 3'150ntSeq ID No.12TBTV-210R-5'FAGGTTACGATATGGAGTTCATCAACAAGTB minus 3'210ntSeq ID No.13TBTV-210R-3'RTAGCtaatacgactcactataGGCAAGCGGTAGGTGGTB minus 3'210ntSeq ID No.14

注:酶切位点用下划线表示,T7启动子序列用小写斜体表示,插入碱基用阴影表示;

int:中间序列,nt:核苷酸,minus:基因组互补链

获得质粒pMAL-TB-RdRp后,发明人利用该质粒进行原核表达,并通过亲和层析方法纯化可溶性的RdRp融合蛋白,进而建立RdRp介导的体外复制体系,实验结果表明TBTVRdRp蛋白可特异识别TBTV基因组链或者互补链的3’末端片段,并以其为模板产生各自的互补链。主要步骤包括:

1)融合MBP标签的RdRp蛋白的预表达:

将质粒pMAL-TB-RdRp转化大肠杆菌Rossetta的感受态细胞,利用SDS-PAGE电泳测试0.5M IPTG浓度对目的蛋白(带MBP标签的RdRp蛋白,命名为MBP-RdRp)的诱导作用,确认0.5mM IPTG是否可以诱导目的蛋白的表达。

2)MBP-RdRp蛋白的可溶性分析:

在确认IPTG可诱导目的蛋白表达的前提下,分析目的蛋白的可溶性。测试不同诱导温度对于可溶性目的蛋白比例的影响,确认最佳的诱导温度为18℃,保证可溶性目的蛋白的比例可满足后续的亲和层析纯化。

3)可溶性蛋白的Amylose Resin亲和柱层析纯化(MBP标签):

利用Amylose Resin(NEB公司)制备层析柱,经装柱、平衡、上样、洗脱等步骤纯化可溶性MBP-RdRp蛋白,用于后续的体外复制活性测试。

4)NIb介导的体外复制体系:

首先通过体外转录制备TBTV基因组不同片段RNA(包括5'末端、中间序列、3'末端和互补链的3'末端),然后测试纯化的MBP-RdRp蛋白对于不同RNA片段的催化能力,最终体外复制实验表明MBP-RdRp蛋白可特异性识别TBTV基因组链或者互补链的3’末端片段,并以其为模板产生各自的互补链。

综上所述,本发明获得了一个可原核表达烟草丛顶病毒中国分离物RdRp蛋白的质粒载体,该质粒载体名称为pMAL-TB-RdRp,含有TBTV中国分离物的RdRp编码序列。该质粒作为TBTV RdRp蛋白的原核表达载体,原核表达产物通过亲和层析纯化可获得有活性的RdRp蛋白,建立RdRp介导的体外复制研究体系。

附图说明

图1为在955和956位间插入碱基构建人为-1型移码的示意图;

图2为质粒pMAL-TB-RdRp酶切鉴定结果电泳示意图,

其中M为SinoBio公司的DNA Ladder 5000,酶切后分别得到载体和NIb编码片段;

图3为质粒pMAL-TB-RdRp的原核表达的结果示意图,

其中M为Transgen公司的Blue Plus II Protein Marker。IPTG诱导后有约120kDa的特异蛋白表达,其分子量与RdRp(95kD)和MBP标签(40kD)的分子量之和基本相符;

图4为不同温度下原核表达产物的可溶性分析结果示意图,

其中M为Transgen公司的Blue Plus II Protein Marker,IPTG诱导后有约120kDa的特异蛋白表达,超声波处理后分析上清和沉淀中目的蛋白(MBP-RdRp)的比例,其中18℃诱导的目的蛋白在上清中的比例最高,约为20%;

图5为TBTV-RdRp介导的体外复制结果示意图,

体外复制实验是分析纯化得到RdRp融合蛋白是否具有催化活性及其识别的特异性模板,由图可知,MBP-RdRp可特异性识别TBTV正链和负链RNA的3'片段,催化产生各自的互补链。

具体实施方式

本发明实施例中除特殊说明外其他均采用现有技术;

实施例1

一个可原核表达烟草丛顶病毒中国分离物RdRp蛋白的质粒载体pMAL-TB-RdRp的构建方法,具体步骤如下:

根据TBTV中国分离物的基因组全序列(Genebank登录号:AF402620),设计引物M-TB-ORF1-5'F和M-TB-ORF2-3'R(表1)。同时为了扩增到RdRp的编码序列,通过重叠PCR在955位和956位间插入一个碱基(如图1所示),设计重叠PCR引物TB-936+C+956-R和TB-948+C+956-F(表1)。

以含有TBTV中国分离物全序列的质粒pMTB1(王国鲁等,2016,植物病理学报中公开)为模板,利用引物对M-TB-ORF1-5'F/TB-936+C+956-R和TB-948+C+956-F/M-TB-ORF2-3'R在Pfu Taq DNA聚合酶的作用扩增分别得到约950bp(RdRp A段产物)和1700bp(RdRp B段产物)的PCR产物,PCR条件94℃预变性5min;94℃,40s变性,55℃,40s退火,72℃延伸(A段延伸1min,B段延伸2min),30个循环;72℃延伸10min;4℃保存。

PCR产物经1.0%的琼脂糖凝胶电泳,切胶回收目的片段,经DNA回收试剂盒(全式金,EG101-02)回收。

回收的A段和B段产物再利用引物M-TB-ORF1-5'F和M-TB-ORF2-3'R在FastPfu TaqDNA聚合酶作用下进行重叠PCR得到约2600bp的片段,PCR反应条件94℃预变性5min;94℃变性40s,45℃退火40s,72℃延伸3min,5个循环;94℃变性40s,55℃退火40s,72℃延伸3min,25个循环;72℃延伸10min;4℃保存。重叠PCR产物经1.0%的琼脂糖凝胶电泳,切胶回收目的片段,用DNA回收试剂盒(全式金,EG101-02)回收。

重叠PCR产物和质粒pMAL-C2X分别经Pst I和EcoR I双酶切后进行连接,连接体系:酶切载体0.1μg、酶切目的DNA 2.0μg、10×T4DNA ligase Buffer 2μl、T4DNA ligase 1μl、ddH2O补齐至20μl,反应温度为16℃。过夜连接。

连接产物转化大肠杆菌DH5α感受态细胞,经菌落PCR筛选得到阳性克隆。提取质粒pMAL-TB-RdRp,进行酶切鉴定。Pst I和EcoR I的双酶切得到约2600bp与6000bp酶切条带(结果如图2所示),说明重组质粒中含有与ORF1/ORF2融合蛋白的编码片段大小吻合的插入片段。最终,经DNA测序确认得到以pMAL-C2X为基础的TBTV ORF1/ORF2融合蛋白的原核表达载体pMAL-TB-RdRp。

实施例2

TBTV-RdRp蛋白的原核表达::

将质粒pMAL-TB-RdRp转化大肠杆菌Rossetta的感受态细胞,涂带有100mg/mL氨苄青霉素的LB平板;挑取含重组质粒的Rossetta菌株置于5ml的LB液体培养基中(含抗生素),37℃,200rpm培养箱中培养过夜;取过夜培养的菌液按1:100的比例加入到20ml新鲜的LB液体培养基中(含抗生素),37℃,200rpm,培养至OD600至0.4-0.6之间;将新鲜培养的菌液放置在冰上10min,分装到指形管中,每管3ml,共2管。加入IPTG至终浓度分别为0mM、0.5mM。37℃,200pm培养4h;于1.5mL离心管中集3ml诱导培养物,13000rpm,离心30s,收集菌体,去上清。

样品处理:向收集的菌中加入30μl>2O,振荡悬浮,加入等体积的2×SDS蛋白上样缓冲液。沸水浴5min,冰上静置5min。跑胶及检测:将上述样品各取10μl点样,120V电泳,至溴酚蓝指示带完全跑出(2-3h)。染色:将分离胶放在培养皿中,加入染色液,保鲜膜密封,在微波炉里中高火加热15s,取出,水平摇床摇动10min,倒掉染色液,染色液回收。脱色:加入脱色液,在微波炉里中高火加热15s,水平摇床摇动10min,去脱色液,加入dd>

结果分析:SDS-聚丙烯酰胺凝胶电泳结果显示,0.5M IPTG诱导的菌液相对于未诱导的菌液而言,在120KDa左右有明显的诱导蛋白的表达,此蛋白大小与融合MBP的RdRp蛋白的大小基本吻合。(如图3所示)

实施例3

融合MBP的RdRp蛋白的可溶性分析:

按照原核表达的基本步骤,在不同温度下诱导50ml菌液,选取18℃、26℃、37℃温度环境,200rpm培养箱中培养过夜,设置CK组(无IPTG诱导);各诱导条件分别收集1ml菌液,处理样品备用,剩余样品离心集菌,8000rpm,5min,4℃;将菌体收集物用5.0ml蛋白缓冲液重新悬浮。从此步开始,所有操作在冰上进行。

悬浮液进行超声波破碎:400W,100次,工作4s,间隔4s,于冰上进行。

破碎后离心:13000rpm,15min,4℃,分离上清液与沉淀。

样品处理将1ml诱导的菌体收集物和1ml未诱导的菌体收集物分别加入20μl水,剧烈振荡悬浮后加入等体积的2×SDS蛋白上样缓冲液。对于超声波处理后的沉淀,处理方法同上;对于超声波处理后的上清液,加入等体积的2×SDS蛋白上样缓冲液。将上述样品沸水浴5min,冰上静置5min。然后,进行SDS-PAGE电泳,并进行染色和脱色检测。

结果分析:在不同温度条件下,目的蛋白的可溶性比例存在较大差异;通过对18℃、26℃、37℃的表达产物分析发现,18℃诱导的目的蛋白在上清中的比例最高,约为20%;而26℃、37℃下的比例仅为约3%和小于1%(如图4所示)。

实施例4

可溶性蛋白的Amylose Res in亲和柱层析纯化(MBP标签):

诱导并破碎,按照原核表达的方法,18℃温度下,0.5M IPTG诱导500ml菌液,并超声波破碎;将上清液用0.45μm的水系滤膜过滤至50ml corning tube中,放置冰上,等待过柱。(注:整个层析过程在4℃环境中进行)

装柱:取2mL Amylose Resin(NEB公司,0111207)填料加入层析柱中,使液体流出;平衡:用5-10倍柱体积的平衡缓冲液平衡层析柱;上样:将样品通过层析柱;洗涤:用5-10倍柱体积的平衡液洗涤层析柱,收集流出液;洗脱:用3ml洗脱液洗脱目的蛋白(用离心管收集洗脱液,每管500μl,标记顺序,冰上放置)。将每管洗脱蛋白取少量进行SDS-PAGE电泳,将含有目的蛋白储存在-80℃。

其中所采用的平衡缓冲液(Amylose Resin):20mM Tris-Cl(pH 8.0),25mM NaCl,1mM EDTA(pH 8.0),10mMβ-mercaptoethanol,10%glycerol;

洗脱缓冲液(Amylose Resin):在平衡液中加入0.5M maltose母液,maltose终浓度达到10mM。

实施例5

体外转录制备TBTV的不同RNA片段:

以含有TBTV中国分离物的质粒pMTB1(王国鲁等,2016,植物病理学报中公开)为模板,通过PCR扩增获得对应于TBTV不同位置的PCR片段(包括基因组5'末端,中间序列,3'末端和互补链的3'末端)(所用引物见表1),并利用DNA回收试剂盒(全式金,EG101-02)进行切胶回收。利用以上PCR产物为模板,在T7RNA聚合酶(普洛麦格,P2075)的作用下进行体外转录反应(反应体系:PCR产物4.0μg,100mM DTT 12.0μl,5mM rNTPs 12.0μl,5×T7Buffer24.0μl,Rnase酶抑制剂0.5μl,T7RNA聚合酶2.0μl,H2O补至120μl),反应温度37℃,反应时间2.5h;反应产物经1.5%的琼脂糖凝胶电泳后切胶纯化对应的RNA片段。纯化后RNA片段作为体外复制的模板备用。

实施例6

TBTV RdRp介导的体外复制体系:

在TBTV RdRp蛋白的作用下进行体外复制反应(反应体系:RNA模板1.0μg,1MTris-Cl(pH 8.2)2.5μl,1M MgCl2>32P-UTP>2O补至50μl),反应温度20℃,孵育1h-1.5h;反应结束后加入70μL>2O混匀,加入120μL酚/仿(0.5mL苯酚/0.5mL氯仿/0.04mL>

结果分析:TBTV RdRp蛋白可特异性识别TBTV基因组3'末端以及基因组互补链的3'末端,并以其为模板催化合成互补链(如图5所示)。说明此通过质粒pMAL-TB-RdRp原核表达并纯化的MBP-RdRp蛋白可介导针对TBTV的体外复制体系。

<110>山东农业大学

<120>一个可原核表达烟草丛顶病毒中国分离物RdRp蛋白的质粒载体

<160>14

<210>1

<211>2607

<212>DNA

<213>人工序列

<400>1

atg gag ttc atc aac aag ata aag caa ttg ttg gca atg aat ttc aag 48

Met Glu Phe Ile Asn Lys Ile Lys Gln Leu Leu Ala Met Asn Phe Lys

1 5 1015

ccc tca aag ggc gta atg tct cgg gag gag ctc cgt gaa gct ttc gat 96

Pro Ser Lys Gly Val Met Ser Arg Glu Glu Leu Arg Glu Ala Phe Asp

2025 30

ccc act tgg gag ctc ctc atc aca cag gcc cgt gtc acc aat gag gtg 144

Pro Thr Trp Glu Leu Leu Ile Thr Gln Ala Arg Val Thr Asn Glu Val

354045

tca cgc cag tgt gag gat tgg tac act cta gct gta ccc acc acc tac 192

Ser Arg Gln Cys Glu Asp Trp Tyr Thr Leu Ala Val Pro Thr Thr Tyr

505560

cgc ttg cca gag ttg gcg gta gaa gag gct gtg cgt gaa aag aac ata 240

Arg Leu Pro Glu Leu Ala Val Glu Glu Ala Val Arg Glu Lys Asn Ile

65707580

gcg cga gag gtg gcg gtc aag tgc ccc cct gag gac ccg att cct gca 288

Ala Arg Glu Val Ala Val Lys Cys Pro Pro Glu Asp Pro Ile Pro Ala

859095

atc ccg cag ggg tca cag cct gtc ccc ttg gtg atg agc tct gaa cgc 336

Ile Pro Gln Gly Ser Gln Pro Val Pro Leu Val Met Ser Ser Glu Arg

100 105 110

tct agc cag gat gcc gag cgt gag gcg ctc gat gag ata tgg ggg ctc 384

Ser Ser Gln Asp Ala Glu Arg Glu Ala Leu Asp Glu Ile Trp Gly Leu

115 120 125

ccc act ccc gag tca cat cct ctg ccc aag tac ttc gag cgg cgc tac 432

Pro Thr Pro Glu Ser His Pro Leu Pro Lys Tyr Phe Glu Arg Arg Tyr

130 135 140

cag gcg ctg gct cgg acc tgc gag aag gac tac tcc aac tgg cag att 480

Gln Ala Leu Ala Arg Thr Cys Glu Lys Asp Tyr Ser Asn Trp Gln Ile

145 150 155 160

gta ccc tac acg ggt ggg cca cgc gtg ctg aga gag gag gac gtg cta 528

Val Pro Tyr Thr Gly Gly Pro Arg Val Leu Arg Glu Glu Asp Val Leu

165 170 175

cca atg gct tcg ggg gtt ata ccc ttg cca cca ccc ccc cct aag gct 576

Pro Met Ala Ser Gly Val Ile Pro Leu Pro Pro Pro Pro Pro Lys Ala

180 185 190

tct gta atc gga gca gtc ttg ggg ctg att acc cgc ctt acc aag gtg 624

Ser Val Ile Gly Ala Val Leu Gly Leu Ile Thr Arg Leu Thr Lys Val

195 200 205

gcg ggg gag gtg aag agc agg ctg agc gta ccg ccg cgg gag ccc tcg 672

Ala Gly Glu Val Lys Ser Arg Leu Ser Val Pro Pro Arg Glu Pro Ser

210 215 220

ccc act tgc att ggc tta gag cag gtg gct ggt gag ccc atg ggc tac 720

Pro Thr Cys Ile Gly Leu Glu Gln Val Ala Gly Glu Pro Met Gly Tyr

225 230 235 240

atg aat gca cac tct gtg gcc atg gag ttg cgg gct agg tac gga gtc 768

Met Asn Ala His Ser Val Ala Met Glu Leu Arg Ala Arg Tyr Gly Val

245 250 255

cag ccc gcc aca gct gcg aac ttg cag ctt gga aac cgg gtg gcc agg 816

Gln Pro Ala Thr Ala Ala Asn Leu Gln Leu Gly Asn Arg Val Ala Arg

260 265 270

gaa atc ctg gaa aaa cag tgc ggg gcc acc cgc gac atg gtg ttc ata 864

Glu Ile Leu Glu Lys Gln Cys Gly Ala Thr Arg Asp Met Val Phe Ile

275 280 285

ctc ggg cac ctc gcc acc acc ttg tgg ttc acc cct acc atg gtg gac 912

Leu Gly His Leu Ala Thr Thr Leu Trp Phe Thr Pro Thr Met Val Asp

290 295 300

ttg gcc ctt caa tgt ggg ccc aag gat ttt tgC cta ggg gat gtg gtc 960

Leu Ala Leu Gln Cys Gly Pro Lys Asp Phe Cys Leu Gly Asp Val Val

305 310 315 320

gct cgg agg ggt gta gaa act aaa gtg aag acg aaa atc cac ccc aaa 1008

Ala Arg Arg Gly Val Glu Thr Lys Val Lys Thr Lys Ile His Pro Lys

325 330 335

atc cga gtg ctt agg gcg gcc cgt ccc cgg ccc gta gaa aga gtg tcg 1056

Ile Arg Val Leu Arg Ala Ala Arg Pro Arg Pro Val Glu Arg Val Ser

340 345 350

tac caa atc gac gtg gtg cgg ccc tgt gct gac ttt gga gtc cac aac 1104

Tyr Gln Ile Asp Val Val Arg Pro Cys Ala Asp Phe Gly Val His Asn

355 360 365

aac tcc ctc aac aat tta gtg cga ggg gtt aac gag cgg gtg ttc tac 1152

Asn Ser Leu Asn Asn Leu Val Arg Gly Val Asn Glu Arg Val Phe Tyr

370 375 380

aca gac cac aag agg aaa gag ccc cgc aga cct tca gct ggt agt ttt 1200

Thr Asp His Lys Arg Lys Glu Pro Arg Arg Pro Ser Ala Gly Ser Phe

385 390 395 400

gac aag att gac atc agc gag ata aaa gcg ttc aga gtc cag ccg tgg 1248

Asp Lys Ile Asp Ile Ser Glu Ile Lys Ala Phe Arg Val Gln Pro Trp

405 410 415

act ctc gag gag gtc gtt gac agc tac acg ggt agc cag agg gtg cgg 1296

Thr Leu Glu Glu Val Val Asp Ser Tyr Thr Gly Ser Gln Arg Val Arg

420 425 430

tat gga caa gct gtt gaa tcc tta gca gta acg ccc ctc tca cga aac 1344

Tyr Gly Gln Ala Val Glu Ser Leu Ala Val Thr Pro Leu Ser Arg Asn

435 440 445

gac gcc cgg gtc aaa aca ttt gta aag gcg gaa aag ata aac ttc acc 1392

Asp Ala Arg Val Lys Thr Phe Val Lys Ala Glu Lys Ile Asn Phe Thr

450 455 460

gcc aag ccc gac ccg gct cct cgc gta atc cag ccg cgg gat cca agg 1440

Ala Lys Pro Asp Pro Ala Pro Arg Val Ile Gln Pro Arg Asp Pro Arg

465 470 475 480

ttc aat gcc tgc ttt gcc aaa tac aca aag ccc ttg gaa ccc ctc cta 1488

Phe Asn Ala Cys Phe Ala Lys Tyr Thr Lys Pro Leu Glu Pro Leu Leu

485 490 495

tac aag cag ctg ggt aag ctt tac cag ttc cca tgc atc gca aaa ggc 1536

Tyr Lys Gln Leu Gly Lys Leu Tyr Gln Phe Pro Cys Ile Ala Lys Gly

500 505 510

ttt aac gcc gta gag acc gga gag ata gta gcc aag aag tgg aag tgc 1584

Phe Asn Ala Val Glu Thr Gly Glu Ile Val Ala Lys Lys Trp Lys Cys

515 520 525

ttc agt gac cct gtc tgt gtg ggt tta gat gcc tcc cgg ttt gac cag 1632

Phe Ser Asp Pro Val Cys Val Gly Leu Asp Ala Ser Arg Phe Asp Gln

530 535 540

cat gtg tca tgc gat gca cta cgg ttc acc cat agc gtg tac aaa cgg 1680

His Val Ser Cys Asp Ala Leu Arg Phe Thr His Ser Val Tyr Lys Arg

545 550 555 560

ttc gtg aag ggc agg gaa gtg aac aag ttg ctt tcc tgg atg tac aaa 1728

Phe Val Lys Gly Arg Glu Val Asn Lys Leu Leu Ser Trp Met Tyr Lys

565 570 575

aac cac gct ctg gga agt gcg aag gac gga ttc gtc aag tac gag gtg 1776

Asn His Ala Leu Gly Ser Ala Lys Asp Gly Phe Val Lys Tyr Glu Val

580 585 590

gaa ggc tgt cgg atg agt ggg gat atg gat aca gcc cta ggg aat tgt 1824

Glu Gly Cys Arg Met Ser Gly Asp Met Asp Thr Ala Leu Gly Asn Cys

595 600 605

gtc ctg atg gtc ctc atg act agg caa cta tgc aag aac ctc tcc ata 1872

Val Leu Met Val Leu Met Thr Arg Gln Leu Cys Lys Asn Leu Ser Ile

610 615 620

ccg cac gaa ctg atg aac aac ggc gac gac tgc ata gtt ata ttt gac 1920

Pro His Glu Leu Met Asn Asn Gly Asp Asp Cys Ile Val Ile Phe Asp

625 630 635 640

agg cag tac ctg tcc acc ttt cag gat gca gtc gag cct tgg ttt agg 1968

Arg Gln Tyr Leu Ser Thr Phe Gln Asp Ala Val Glu Pro Trp Phe Arg

645 650 655

gag cta ggg ttt aca atg aag gtc gag gag cca gtc tac cat ctc gaa 2016

Glu Leu Gly Phe Thr Met Lys Val Glu Glu Pro Val Tyr His Leu Glu

660 665 670

aga gta gat ttt tgc cag acc cgc ccc gtg tat gac ggc aag aag tgg 2064

Arg Val Asp Phe Cys Gln Thr Arg Pro Val Tyr Asp Gly Lys Lys Trp

675 680 685

aga atg gtc agg cat atc tca agt ata gcg aag gat tgc tgt tca gtc 2112

Arg Met Val Arg His Ile Ser Ser Ile Ala Lys Asp Cys Cys Ser Val

690 695 700

att gac tgg gaa cag tta ccg gct tgg tgg aac gcc att gga gaa tgt 2160

Ile Asp Trp Glu Gln Leu Pro Ala Trp Trp Asn Ala Ile Gly Glu Cys

705 710 715 720

ggc att gcc gtg gct ggt ggt ata ccc ata cac aac agc ttc ttg aga 2208

Gly Ile Ala Val Ala Gly Gly Ile Pro Ile His Asn Ser Phe Leu Arg

725 730 735

tgg ctc ctg aga tca ggt gag agc aac cct gat ctc ctg aag cat ggc 2256

Trp Leu Leu Arg Ser Gly Glu Ser Asn Pro Asp Leu Leu Lys His Gly

740 745 750

gca tgg aaa aat gag ggc cta gcg tgg tac cgg atg ggc atg gac cta 2304

Ala Trp Lys Asn Glu Gly Leu Ala Trp Tyr Arg Met Gly Met Asp Leu

755 760 765

tcc cat gag aga cac gtt agt gat gaa gcg cgc gcc agc ttc cac act 2352

Ser His Glu Arg His Val Ser Asp Glu Ala Arg Ala Ser Phe His Thr

770 775 780

gcc ttt gga atc gaa cca tcc atg cag gtc gca tta gag cag atc tat 2400

Ala Phe Gly Ile Glu Pro Ser Met Gln Val Ala Leu Glu Gln Ile Tyr

785 790 795 800

gac tca ttg cct gct ccc acc att ggt ggg aaa cga gcc aga gtg tgt 2448

Asp Ser Leu Pro Ala Pro Thr Ile Gly Gly Lys Arg Ala Arg Val Cys

805 810 815

aaa cct ggt gaa atg gta ttg gtt gat tca ctc cca ccg cgg cac ttt 2496

Lys Pro Gly Glu Met Val Leu Val Asp Ser Leu Pro Pro Arg His Phe

820 825 830

aat gat tac ttc cag gat gtt gga ata ggg ggg agt agc agt gat tac 2544

Asn Asp Tyr Phe Gln Asp Val Gly Ile Gly Gly Ser Ser Ser Asp Tyr

835 840 845

gtt gtc ccg ggg acc cac gag ttc gaa ccg ggg acg ttg tgg aca caa 2592

Val Val Pro Gly Thr His Glu Phe Glu Pro Gly Thr Leu Trp Thr Gln

850 855 860

tgC cta gtc aat tga 2607

Cys Leu Val Asn

865 868

<210>2

<211>868

<212>PRT

<213>人工序列

<400>2

Met Glu Phe Ile Asn Lys Ile Lys Gln Leu Leu Ala Met Asn Phe Lys

1 5 1015

Pro Ser Lys Gly Val Met Ser Arg Glu Glu Leu Arg Glu Ala Phe Asp

202530

Pro Thr Trp Glu Leu Leu Ile Thr Gln Ala Arg Val Thr Asn Glu Val

354045

Ser Arg Gln Cys Glu Asp Trp Tyr Thr Leu Ala Val Pro Thr Thr Tyr

505560

Arg Leu Pro Glu Leu Ala Val Glu Glu Ala Val Arg Glu Lys Asn Ile

65707580

Ala Arg Glu Val Ala Val Lys Cys Pro Pro Glu Asp Pro Ile Pro Ala

859095

Ile Pro Gln Gly Ser Gln Pro Val Pro Leu Val Met Ser Ser Glu Arg

100 105 110

Ser Ser Gln Asp Ala Glu Arg Glu Ala Leu Asp Glu Ile Trp Gly Leu

115 120 125

Pro Thr Pro Glu Ser His Pro Leu Pro Lys Tyr Phe Glu Arg Arg Tyr

130 135 140

Gln Ala Leu Ala Arg Thr Cys Glu Lys Asp Tyr Ser Asn Trp Gln Ile

145 150 155 160

Val Pro Tyr Thr Gly Gly Pro Arg Val Leu Arg Glu Glu Asp Val Leu

165 170 175

Pro Met Ala Ser Gly Val Ile Pro Leu Pro Pro Pro Pro Pro Lys Ala

180 185 190

Ser Val Ile Gly Ala Val Leu Gly Leu Ile Thr Arg Leu Thr Lys Val

195 200 205

Ala Gly Glu Val Lys Ser Arg Leu Ser Val Pro Pro Arg Glu Pro Ser

210 215 220

Pro Thr Cys Ile Gly Leu Glu Gln Val Ala Gly Glu Pro Met Gly Tyr

225 230 235 240

Met Asn Ala His Ser Val Ala Met Glu Leu Arg Ala Arg Tyr Gly Val

245 250 255

Gln Pro Ala Thr Ala Ala Asn Leu Gln Leu Gly Asn Arg Val Ala Arg

260 265 270

Glu Ile Leu Glu Lys Gln Cys Gly Ala Thr Arg Asp Met Val Phe Ile

275 280 285

Leu Gly His Leu Ala Thr Thr Leu Trp Phe Thr Pro Thr Met Val Asp

290 295 300

Leu Ala Leu Gln Cys Gly Pro Lys Asp Phe Cys Leu Gly Asp Val Val

305 310 315 320

Ala Arg Arg Gly Val Glu Thr Lys Val Lys Thr Lys Ile His Pro Lys

325 330 335

Ile Arg Val Leu Arg Ala Ala Arg Pro Arg Pro Val Glu Arg Val Ser

340 345 350

Tyr Gln Ile Asp Val Val Arg Pro Cys Ala Asp Phe Gly Val His Asn

355 360 365

Asn Ser Leu Asn Asn Leu Val Arg Gly Val Asn Glu Arg Val Phe Tyr

370 375 380

Thr Asp His Lys Arg Lys Glu Pro Arg Arg Pro Ser Ala Gly Ser Phe

385 390 395 400

Asp Lys Ile Asp Ile Ser Glu Ile Lys Ala Phe Arg Val Gln Pro Trp

405 410 415

Thr Leu Glu Glu Val Val Asp Ser Tyr Thr Gly Ser Gln Arg Val Arg

420 425 430

Tyr Gly Gln Ala Val Glu Ser Leu Ala Val Thr Pro Leu Ser Arg Asn

435 440 445

Asp Ala Arg Val Lys Thr Phe Val Lys Ala Glu Lys Ile Asn Phe Thr

450 455 460

Ala Lys Pro Asp Pro Ala Pro Arg Val Ile Gln Pro Arg Asp Pro Arg

465 470 475 480

Phe Asn Ala Cys Phe Ala Lys Tyr Thr Lys Pro Leu Glu Pro Leu Leu

485 490 495

Tyr Lys Gln Leu Gly Lys Leu Tyr Gln Phe Pro Cys Ile Ala Lys Gly

500 505 510

Phe Asn Ala Val Glu Thr Gly Glu Ile Val Ala Lys Lys Trp Lys Cys

515 520 525

Phe Ser Asp Pro Val Cys Val Gly Leu Asp Ala Ser Arg Phe Asp Gln

530 535 540

His Val Ser Cys Asp Ala Leu Arg Phe Thr His Ser Val Tyr Lys Arg

545 550 555 560

Phe Val Lys Gly Arg Glu Val Asn Lys Leu Leu Ser Trp Met Tyr Lys

565 570 575

Asn His Ala Leu Gly Ser Ala Lys Asp Gly Phe Val Lys Tyr Glu Val

580 585 590

Glu Gly Cys Arg Met Ser Gly Asp Met Asp Thr Ala Leu Gly Asn Cys

595 600 605

Val Leu Met Val Leu Met Thr Arg Gln Leu Cys Lys Asn Leu Ser Ile

610 615 620

Pro His Glu Leu Met Asn Asn Gly Asp Asp Cys Ile Val Ile Phe Asp

625 630 635 640

Arg Gln Tyr Leu Ser Thr Phe Gln Asp Ala Val Glu Pro Trp Phe Arg

645 650 655

Glu Leu Gly Phe Thr Met Lys Val Glu Glu Pro Val Tyr His Leu Glu

660 665 670

Arg Val Asp Phe Cys Gln Thr Arg Pro Val Tyr Asp Gly Lys Lys Trp

675 680 685

Arg Met Val Arg His Ile Ser Ser Ile Ala Lys Asp Cys Cys Ser Val

690 695 700

Ile Asp Trp Glu Gln Leu Pro Ala Trp Trp Asn Ala Ile Gly Glu Cys

705 710 715 720

Gly Ile Ala Val Ala Gly Gly Ile Pro Ile His Asn Ser Phe Leu Arg

725 730 735

Trp Leu Leu Arg Ser Gly Glu Ser Asn Pro Asp Leu Leu Lys His Gly

740 745 750

Ala Trp Lys Asn Glu Gly Leu Ala Trp Tyr Arg Met Gly Met Asp Leu

755 760 765

Ser His Glu Arg His Val Ser Asp Glu Ala Arg Ala Ser Phe His Thr

770 775 780

Ala Phe Gly Ile Glu Pro Ser Met Gln Val Ala Leu Glu Gln Ile Tyr

785 790 795 800

Asp Ser Leu Pro Ala Pro Thr Ile Gly Gly Lys Arg Ala Arg Val Cys

805 810 815

Lys Pro Gly Glu Met Val Leu Val Asp Ser Leu Pro Pro Arg His Phe

820 825 830

Asn Asp Tyr Phe Gln Asp Val Gly Ile Gly Gly Ser Ser Ser Asp Tyr

835 840 845

Val Val Pro Gly Thr His Glu Phe Glu Pro Gly Thr Leu Trp Thr Gln

850 855 860

Cys Leu Val Asn

865 868

<210>3

<211>35

<212>DNA

<213>人工序列

<400>3

gatcgaattc atggagttca tcaacaagat aaagc35

<210>4

<211>35

<212>DNA

<213>人工序列

<400>4

gatcctgcag tcactagcat tgtgtccaca acgtc35

<210>5

<211>25

<212>DNA

<213>人工序列

<400>5

atttttgcct aggggatgtg gtcgc 25

<210>6

<211>29

<212>DNA

<213>人工序列

<400>6

atcccctagg caaaaatcct tgggcccac 29

<210>7

<211>37

<212>DNA

<213>人工序列

<400>7

taatacgact cactatagag gttacgatat ggagttc37

<210>8

<211>27

<212>DNA

<213>人工序列

<400>8

gatccccggg gcgtgacacc tcattgg 27

<210>9

<211>37

<212>DNA

<213>人工序列

<400>9

gctaatacga ctcactatag ggcccttcaa tgtgggc37

<210>10

<211>19

<212>DNA

<213>人工序列

<400>10

gggagttgtt gtggactcc19

<210>11

<211>40

<212>DNA

<213>人工序列

<400>11

gctaatacga ctcactatag gcagaaacca agtagcaaat 40

<210>12

<211>14

<212>DNA

<213>人工序列

<400>12

gggcgcgaga gaaa 14

<210>13

<211>28

<212>DNA

<213>人工序列

<400>13

aggttacgat atggagttca tcaacaag28

<210>14

<211>37

<212>DNA

<213>人工序列

<400>14

tagctaatac gactcactat aggcaagcgg taggtgg37

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号