首页> 中国专利> 一种重组溶组织梭菌II型胶原酶及其制备方法和应用

一种重组溶组织梭菌II型胶原酶及其制备方法和应用

摘要

本发明公开了本发明提供了一种重组溶组织梭菌II型胶原酶,包含溶组织梭菌II型胶原酶和连接到所述组织梭菌II型胶原酶N端的标签蛋白;所述标签蛋白包含肝片形吸虫钙结合蛋白(Fh8);优选地,所述肝片形吸虫钙结合蛋白的氨基酸序列为SEQ ID NO:2。本发明还提供了表达该重组溶组织梭菌II型胶原酶的表达载体和重组工程菌,同时还提供了溶组织梭菌II型胶原酶的制备方法。本发明的重组溶组织梭菌II型胶原酶能够高效表达,不形成包涵体,易于分离纯化,有利于溶组织梭菌II型胶原酶的工业化生产。

著录项

  • 公开/公告号CN112941058A

    专利类型发明专利

  • 公开/公告日2021-06-11

    原文格式PDF

  • 申请/专利权人 重庆科润生物医药研发有限公司;

    申请/专利号CN202110358892.2

  • 申请日2021-04-02

  • 分类号C12N9/52(20060101);C07K19/00(20060101);C12N15/62(20060101);C12N15/70(20060101);C12N1/21(20060101);A61K38/48(20060101);A61P19/04(20060101);A61P21/00(20060101);A61P17/00(20060101);A61P15/00(20060101);C12R1/19(20060101);

  • 代理机构50210 重庆志合专利事务所(普通合伙);

  • 代理人胡荣珲

  • 地址 401121 重庆市北部新区高新园黄山大道水星科技发展中心北翼厂房5楼1号

  • 入库时间 2023-06-19 11:22:42

说明书

技术领域

本发明涉及生物工程领域,特别涉及一种高纯度重组溶组织梭菌II型胶原酶及其制备方法和应用。

背景技术

溶组织梭菌型胶原酶(Collagenase Clostridium Histolyticum)为BioSpecifics Technologies集团原研的药物,其于2010年2月2日获得美国食品药品管理局(FDA)批准,2011年2月28日获得欧洲药物管理局(EMA)批准,2015年7月3日获得日本医药品医疗器械综合机构(PMDA)批准上市。商品名为

生理学条件下胶原酶的作用是水解天然三重螺旋构象的胶原,可使沉积胶原溶解。注射

原研公司BioSpecifics是通过培养溶组织梭菌,从发酵上清液中纯化AUX-I和AUX-II。但是溶组织梭菌本身是一种气性坏疽的致病菌,从其发酵上清液常常混杂各种毒素,成分复杂,如果没有原研公司的菌株以及生产和纯化工艺,很难保证得到达到药用标准的精制品。用基因重组技术生产溶组织梭菌II型胶原酶是解决这个问题的可能途径,但由于AUX-II分子量较大(113kD),常规大肠杆菌表达难以实现。即使表达大都在胞内积累,易形成包涵体。包涵体复性过程复杂、技术难度大、得率低、生产成本高,当前尚不能应用于工业化生产。

发明内容

本发明的目的在于提供一种用于制备重组溶组织梭菌II型胶原酶的易于高效表达的标签蛋白,该标签蛋白包括来源于肝片形吸虫钙结合蛋白(Fh8),其氨基酸序列如SEQID NO.2所示,其核苷酸序列如SEQ ID NO.3所示。所述标签蛋白能促进重组溶组织梭菌II型胶原酶的可溶高效表达,且不影响重组溶组织梭菌II型胶原酶的生物活性。

一种重组溶组织梭菌II型胶原酶,包含溶组织梭菌II型胶原酶和连接到所述组织梭菌II型胶原酶N端的标签蛋白;所述标签蛋白包含肝片形吸虫钙结合蛋白(Fh8);优选地,所述肝片形吸虫钙结合蛋白的氨基酸序列为SEQ ID NO:2。

在根据本发明的一个实施方案中,所述标签蛋白还包含转录终止抗终止因子(NusA)、大肠杆菌硫氧还蛋白A(TrxA)、二硫键氧化还原酶(DsbA、DsbC)或者谷胱甘肽S-转移酶(GST)中的一种。

在根据本发明的一个实施方案中,所述标签蛋白通过柔性连接肽连接至溶组织梭菌II型胶原酶的N端;优选地,所述柔性连接肽的氨基酸序列为SEQ ID NO:7。

在根据本发明的一个实施方案中,氨基酸序列为SEQ ID NO:4。

本发明还提供了一种用于编码上述的重组溶组织梭菌II型胶原酶的重组基因,包含溶组织梭菌II型胶原酶编码基因SEQ ID NO:1和位于所述溶组织梭菌II型胶原酶编码基因上游的标签蛋白编码基因,所述标签蛋白编码基因中包含肝片形吸虫钙结合蛋白(Fh8)的编码基因。

在根据本发明的一个实施方案中,所述肝片形吸虫钙结合蛋白(Fh8)的编码基因为SEQ ID NO:3。

在根据本发明的一个实施方案中,所述重组基因的核苷酸序列为SEQ ID NO:5。

本发明进一步提供了一种用于表达重组溶组织梭菌II型胶原酶的重组载体,包含如权利要求上述的重组基因;

优选地,所述重组载体的骨架质粒选自pET-28a-c(+)、pET29a、pET-30a-c(+)、pET39b(+)、pET-40b(+)、pET-41a(+)或pET-43.1a(+)中的任一种。

本发明还提供一种用于表达重组溶组织梭菌II型胶原酶的重组工程菌,包含上述的重组载体;优选地,所述重组工程菌的宿主菌为细菌或真菌;优选地,所述宿主菌为大肠杆菌,进一步优选为BL21(DE3)、BL21(DE3)P1ysS或TB1中的任一种。

本发明还进一步提供了一种重组溶组织梭菌II型胶原酶制备方法,包括:

1)将标签蛋白的编码基因连接至溶组织梭菌II型胶原酶编码基因的上游,获得编码重组溶组织梭菌II型胶原酶的重组基因;

2)将所述重组基因连接至骨架质粒中得到重组载体;

3)将所述重组载体转化到宿主菌中,得到重组工程菌;

4)将所述重组工程菌接种于发酵罐中,诱导表达;

5)当菌体和蛋白浓度达到预设阈值后,从培养物中分离纯化得到重组溶组织梭菌II型胶原酶;

6)将所述重组溶组织梭菌II型胶原酶酶解;

7)将酶解后的样品依次经过QFF层析、Butyl-4FF层析、Phenyl 6FF层析和QFF流穿层析,获得溶组织梭菌II型胶原酶纯品。

本发明还提供了上述重组溶组织梭菌II型胶原酶在制备用于治疗杜普征氏掌挛缩(Dupuytren’s contracture)、佩罗尼病(Peyronie’s disease)或橘皮组织(Cellulite)的药物中的应用。

本发明的有益效果是:

本发明提供的重组溶组织梭菌II型胶原酶中的标签蛋白能促进重组溶组织梭菌II型胶原酶的可溶高效表达,且不影响重组溶组织梭菌II型胶原酶的生物活性;

通过接头将标签蛋白融合至溶组织梭菌II型胶原酶N端形成融合蛋白,进行融合表达,利用纯化手段将产物完全分离,实现了溶组织梭菌II型胶原酶的可溶、高效表达。

同时本发明提供的柔性连接肽,使得融合蛋白标签未对目的蛋白的结构发生影响,产物具有生物活性;包含肠激酶位点-DDDDK-,使得标签蛋白被有效去除,最终获得的重组溶组织梭菌II型胶原酶的N端序列与天然序列完全一致,还可以进一步添加组氨酸标签,以利于纯化,提高收率。

对编码溶组织梭菌II型胶原酶的核苷酸序列进行优化,同时选择Fh8作为标签蛋白,使得重组溶组织梭菌II型胶原酶在大肠杆菌中实现高效、可溶表达。

利用本发明的方法制备重组溶组织梭菌II型胶原酶融合蛋白为可溶表达,表达量大于菌体总蛋白的20%。最终重组溶组织梭菌II型胶原酶得率为大于300mg纯品/100g菌体,纯度大于96%,生物活性达到170000U/mg,内毒素小于5EU/mg。

本发明利用肝片形吸虫钙结合蛋白Fh8作为标签蛋白,可高效促进溶组织梭菌II型胶原酶(ColH)可溶表达,避免了包涵体复性,降低生产成本,能够满足工业化生产的需求。

附图说明

图1为本发明构建的表达质粒pET30-a(+)-ColH的结构图;

图2为本发明构建的pET30-a(+)-ColH/BL21(DE3)工程菌摇瓶诱导筛选结果;

图3为RP-HPLC检测结果,纯度大于96%;

图4为重组ColH N端氨基酸序列检测结果;

图5a为根据本发明的重组溶组织梭菌II型胶原酶的质谱总离子流(TIC)谱图;

图5b为根据本发明的重组溶组织梭菌II型胶原酶的一级质谱图;

图5c为根据本发明的重组溶组织梭菌II型胶原酶的解卷积图;

图5d为根据本发明的重组溶组织梭菌II型胶原酶的解卷积放大图;

图6a为测定酶活性时的亮氨酸标准曲线图;

图6b为根据本发明的重组溶组织梭菌II型胶原酶的酶活性测定结果统计图表。

具体实施方式

下面对本发明的较佳实施例进行详细阐述,以使本发明的优点和特征能更易被本领域人员理解,从而对本发明的保护范围做出更为清楚明确的界定。

下述实施例中所使用的实验方法如无特殊说明,均为常规方法。下述实施例中所用的材料、试剂等,如无特殊说明,均可从商业途径得到。

实施例1重组溶组织梭菌II型胶原酶融合蛋白工程菌构建

1、pET30-a(+)-ColH/BL21(DE3)工程菌构建

溶组织梭菌II型胶原酶成熟蛋白含有991个氨基酸,溶组织梭菌II型胶原酶基因序列如SEQ ID NO.1所示。

标签蛋白选取来源于肝片形吸虫钙结合蛋白Fh8(GenBank登录号:AAF31420.1);所述标签蛋白蛋白的氨基酸序列如SEQ ID NO.2所示,其核苷酸序列如SEQ ID NO.3所示。

设计接头序列为SEQ ID NO:7-GSGSGHMHHHHHHSSGPDLDDDDK-,通过接头将上述Fh8标签蛋白C端与溶组织梭菌II型胶原酶成熟蛋白序列N端连接,所获融合蛋白的氨基酸序列如SEQ ID NO.4所示,该融合蛋白的核酸序列如SEQ ID NO.5所示。

将设计的融合蛋白核酸序列(SEQ ID NO.5)委托通用生物系统(安徽)有限公司进行全基因合成,并通过NdeI/NotI位点亚克隆至表达载体,其载体选自商业化载体pET-28a-c(+),或者pET29a,或者pET-30a-c(+),或者pET39b(+),或者pET-40b(+),或者pET-41a(+),或者pET-43.1a(+),载体的宿主细胞为细菌或真菌,所述宿主细胞为大肠杆菌,选自商业化菌株BL21(DE3),或者BL21(DE3)PlysS,或者TB1。本实施例采用大肠杆菌表达载体pET30-a(+),构建获得表达载体pET30-a(+)-ColH,构建示意图如图1所示。

将构建的表达载体用化学转染法,转入大肠杆菌表达宿主菌BL21(DE3),利用LB+kan固体平板筛选,获得重组表达工程菌pET30-a(+)-ColH/BL21(DE3)。

2、工程菌诱导筛选

随机挑取上述pET30-a(+)-ColH/BL21(DE3)工程菌接种至10ml LB培养基(100ug/ml kan),100ml锥形瓶培养,37℃ 220rpm摇床培养过夜。第二天取过夜培养的母液按1%比例转接于40ml LB液体培养基(100ug/ml kan),在250ml锥形瓶中,37℃,220rpm培养2.5h,至OD

SDS-PAGE电泳检测,结果如图2所示,泳道1-4:pET30-a(+)-ColH/BL21(DE3)1-4号诱导4h总蛋白;对照:未诱导总蛋白;泳道M:蛋白质分子量Marker。与对照比较,在高于97kD位置处实现特异表达,表达量占菌体总蛋白20%以上。对诱导表达菌体进行破菌分析,表明全部实现可溶表达。

实施例2重组溶组织梭菌II型胶原酶工程菌发酵

种子液体活化:将pET30-a(+)-ColH/BL21(DE3)甘油管菌种60ul转接于100ml2xYT的培养基中,kan+100ug/ml;培养温度33℃,220r/min,培养12h左右(OD值4.5-5.5)。

发酵过程:采用5L保兴发酵罐发酵,设置温度37℃,通气3vvm,接入4ml微量元素,kan+0.06g无菌过滤后接入发酵罐pH7.0;取4℃保存的LB培养基下制取的种子,按照比例5%(100ml)接种于装有2L的发酵培养基(M9改良培养基);起始转速300rpm,启动转速溶氧联动,溶氧值设置30%,转速提升至600r/min时,溶氧值设置15%,转提升至800r/min,此时将通气量调节至4vvm,转速联动改为手动,期间溶氧反弹(OD值31左右)进行补料,补料速度根据溶氧不小于30%,将补料速度设定在100ml/h-130ml/h;当培养OD值为36-42时(培养时间约3-4h),设置温度25℃,当温度达到26℃以下进行诱导,诱导剂为异丙基-β-D-硫代半乳糖苷(IPTG,鼎国生物),诱导4h,诱导后每隔1h取样并测定OD值,观察菌体生长及蛋白表达情况。

实施例3重组溶组织梭菌II型胶原酶分离纯化

1、菌体破碎与澄清

菌体高速冷冻离心收集菌体,按照1:10的比例(1g:10ml缓冲液:20mM Tris-HClpH7.6),混悬菌体,在700~800Bar、冰浴控制温度10~15℃下,破菌3次,然后高速冷冻离心,收集上清,丢弃沉淀;用0.65μm中空纤维柱,超滤澄清破菌液。

2、Ni

用平衡缓冲液25mM Tris-HCl pH8.0,平衡层析柱,负载破菌液,然后用洗脱缓冲25mM Tris-HCl pH8.0 10mM咪唑洗脱杂蛋白;用洗脱缓冲25mM Tris-HCl pH8.0 50mM咪唑洗脱目的融合蛋白。

3、肠激酶酶解

在上述融合蛋白溶液中,按每毫克蛋白加入重组肠激酶0.8U,酶解融合蛋白,酶解时间12小时,酶解温度4-8℃。

4、QFF初步纯化

酶解后的样品,用0.45μm纤维素膜过滤,用4M盐酸,调节pH7.6,用超纯水稀释至电导率小于2800μs/cm,用平衡缓冲液(20mM Tris-HCl pH7.6)平衡层析柱,然后进样,进样体积为10-15倍柱体积,用洗脱缓冲50mM NaCl,20mM Tris-HCl pH7.6洗脱杂质;用100mMNaCl,20mM Tris-HCl pH7.6的缓冲液,洗脱目的蛋白。

5、Butyl-4FF层析

用平衡缓冲液20mM Tris-HCl pH7.6,2M NaCl平衡层析柱,负载上一步QFF层析获得的样品,然后用洗脱缓冲1.6M NaCl,20mM Tris-HCl pH7.6洗脱杂质,用1.4M NaCl,20mMTris-HCl pH7.6的缓冲液洗脱目标蛋白,用20mM Tris-HCl pH7.6洗柱。

6、Phenyl 6FF层析

平衡缓冲液20mM Tris-HCl pH7.6,1M NaCl平衡层析柱,负载上一步F层析获得的样品,然后用洗脱缓冲0.4M NaCl,20mM Tris-HCl pH7.6洗脱杂质,用0.1M NaCl,20mMTris-HCl pH7.6的缓冲液洗脱目标蛋白,

7、QFF流穿层析

用超滤膜包浓缩Phenyl 6FF层析获得样品5倍,用1M Tris-HCl pH6.6控制电导率4800-5000μS/cm,用0.1M盐酸调节50mM Tris-HCl的pH至6.6后,进样。收集流穿(目标组分)再超滤浓缩流穿组分,浓缩5倍左右,蛋白浓度达到1.0-1.5mg/ml。HPLC分析纯度大于96%,见图3。

实施例4重组溶组织梭菌II型胶原酶理化性质测定

1、N末端氨基酸序列测定

将上述方法制备得到的重组溶组织梭菌II型胶原酶(rColH),委托北京百泰派克生物科技有限公进行N末端氨基酸序列测定,测定结果与ColH成熟蛋白N端序列一致,见图4。

2、质谱分子量

将上述方法制备得到的rColH进行质谱分析,委托南京金斯瑞生物科技有限公司测定分子量为112971.6Da,与理论分子量相当。相应的质谱总离子流(TIC)谱图见图5a,一级质谱图见图5b,解卷积图见图5c,解卷积放大图见图5d。

实施例5重组溶组织梭菌II型胶原酶生物活性测定

采用GPA-荧光胺法检测重组胶原酶ColH的生物学活性,其原理是人工合成肽Carbobenzoxy-glycyl-L-prolyl-glycyl-glycyl-L-prolyl-L-alanine(hexapeptide)是胶原酶ColH的底物,可以被切割成Carbobenzoxy-glycyl-L-prolyl-glycyl(ZGPG)和glycyl-L-prolyl-L-alanine(GPA),GPA的N端具有α-氨基,通过荧光胺标记反应可以定量检测GPA含量,以每分钟释放出的GPA相当于亮氨酸的nmol数,反映ColH的活性。

1、实验方法

(1)将水浴锅加热至37℃准备,除荧光胺溶液和底物hexapeptide放置于4℃备用,其余试剂从冰箱取出平衡至室温备用;

(2)向样品管中分别加入20μL底物(20μg),加入37/42/57μL的HEPES buffer;向酶对照管中加入57/62/67μL的HEPES buffer;以上各管放入37℃水浴10min;

(3)向样品管和酶对照管中加入18/13/8μL稀释好的酶液;振荡混匀各管后短暂离心,继续在37℃水浴30min;

(4)向所有管中加入25μL 20mM邻菲罗啉,涡旋混匀并短暂离心,置37℃继续水浴10min,取出后置4℃(当天使用)或-20℃(隔天使用)待进行荧光胺反应;

(5)用于标曲制作的亮氨酸梯度溶液:向EP管中加入10μL、20μL、30μL、40μL、亮氨酸工作液,补加硼酸缓冲液至100μL,以100μL硼酸缓冲液作为空白管;

(6)荧光胺反应:向所有测试管中分别加入50μL 3.3mg/mL的丙酮-荧光胺溶液,振荡混匀后分别加入850μL硼酸缓冲液,振荡混匀并短暂离心;置于25℃水浴中反应20min;

(7)检测:所有测试管在荧光胺反应到时间后,振荡混匀并在12000rpm离心5min,然后各取200μL溶液加入黑色96孔酶标板中,在酶标仪上390nm激发,490nm发射读取检测值。

2、酶活计算

(1)根据亮氨酸质量和490nm的荧光值绘制标准曲线,线性拟合出标准曲线公式;

(2)各样品管的荧光值减去酶对照管的荧光值,得到各样品管的净荧光值,代入亮氨酸标线公式,得到对应的亮氨酸质量;

(3)酶的活性单位定义为:胶原酶AUX-II在37℃,PH7.2条件下降解hexapeptide,每分钟释放出的GPA相当于荧光胺标记1nmol亮氨酸的量为1个活性单位,即U=亮氨酸质量μg×1000×5/131.2×30;公式中的131.2是亮氨酸相对分子质量,5是检测体积0.2mL相对于荧光胺反应总体积1mL的系数,30是GPA水解反应时间。

酶活性(U/mL)=(U/参与反应的酶量mg)×(原液蛋白浓度mg/mL)

比活力(U/mg)=U/参与反应的酶量mg

3、实验结果

亮氨酸标准曲线见图6a,酶活性统计结果如图6b所示。根据标准曲线计算rColH比活为179425U/mg,RSD为6.6%。

上述发明内容及具体实施方式意在证明本发明所提供技术方案的实际应用,不应解释为对本发明保护范围的限定。本领域技术人员在本发明的精神和原理内,当可作各种修改、等同替换、或改进。本发明的保护范围以所附权利要求书为准。

序列表

SEQID NO.1:溶组织梭菌II型胶原酶成熟蛋白核苷酸序列

GCCGTTGATAAAAATAATGCAACCGCAGCCGTGCAGAATGAAAGCAAACGTTATACCGTTAGTTATCTGAAAACCCTGAATTATTACGATCTGGTTGATCTGCTGGTGAAAACCGAAATTGAAAATCTGCCGGATCTGTTTCAGTATAGTAGCGATGCCAAAGAATTTTATGGCAATAAGACCCGTATGAGTTTTATTATGGATGAAATTGGCCGTCGTGCACCGCAGTATACCGAAATTGATCATAAAGGTATTCCGACCCTGGTGGAAGTGGTTCGTGCAGGTTTTTATCTGGGTTTTCATAATAAGGAACTGAATGAAATCAACAAGCGTAGTTTTAAAGAGCGTGTTATTCCGAGTATTCTGGCAATTCAGAAAAATCCGAATTTTAAACTGGGTACAGAAGTTCAGGATAAAATTGTGAGCGCCACCGGCCTGCTGGCCGGCAATGAAACCGCCCCGCCGGAAGTGGTGAATAATTTTACCCCGATTATTCAGGATTGCATTAAGAATatgGATCGTTATGCACTGGATGATCTGAAAAGCAAAGCACTGTTTAATGTTCTGGCAGCCCCGACCTATGATATTACCGAATATCTGCGTGCAACCAAAGAAAAACCGGAAAATACCCCGTGGTATGGCAAAATTGATGGTTTTATTAACGAGCTGAAGAAACTGGCACTGTATGGCAAAATCAATGATAATAATAGCTGGATTATCGACAACGGTATCTATCATATTGCACCGCTGGGTAAACTGCATAGCAATAATAAGATTGGTATCGAAACCCTGACCGAAGTGATGAAAATTTATCCGTATCTGAGTATGCAGCATCTGCAGAGTGCAGATCAGATTGAACGTCATTATGATAGTAAAGATGCAGAAGGTAATAAGATTCCGCTGGATAAATTCAAAAAGGAAGGCAAAGAAAAGTACTGCCCGAAAACCTATACCTTTGATGATGGCAAAGTGATTATTAAGGCCGGCGCCCGCGTTGAAGAAGAAAAAGTGAAACGTCTGTATTGGGCCAGCAAAGAAGTTAATAGCCAGTTTTTCCGCGTGTATGGTATTGATAAACCGCTGGAAGAAGGCAATCCGGATGATATTCTGACCATGGTTATCTATAATAGCCCGGAAGAATATAAACTGAATAGCGTGCTGTATGGCTATGATACCAATAATGGTGGTATGTATATCGAACCGGATGGCACCTTTTTCACCTATGAACGCAAAGCAGAAGAAAGCACCTATACCCTGGAAGAACTGTTTCGTCATGAATATACCCATTATCTGCAGGGTCGTTATGCAGTTCCGGGTCAGTGGGGTCGCACCAAACTGTATGATAATGATCGCCTGACCTGGTATGAAGAAGGTGGTGCAGAACTGTTTGCAGGCAGTACCCGTACCAGTGGCATTCTGCCGCGTAAAAGTATTGTTAGTAATATTCATAACACCACCCGCAATAATCGCTATAAACTGAGCGATACCGTTCATAGTAAATATGGTGCAAGCTTTGAATTTTACAACTATGCCTGCATGTTTATGGATTATATGTATAATAAGGACATGGGTATCCTGAATAAGCTGAATGATCTGGCCAAAAATAATGATGTGGATGGCTATGATAACTATATTCGTGATCTGAGCAGCAATCATGCACTGAATGATAAATATCAGGACCACATGCAGGAACGTATTGATAATTATGAAAACCTGACCGTGCCGTTTGTGGCAGATGATTATCTGGTGCGTCATGCCTATAAAAATCCGAACGAAATCTATAGCGAAATTAGTGAAGTTGCCAAACTGAAAGATGCAAAAAGCGAAGTGAAAAAATCACAGTATTTCAGTACCTTTACCCTGCGTGGCAGCTATACCGGCGGTGCAAGCAAAGGCAAACTGGAAGATCAGAAAGCAATGAATAAGTTTATCGATGATAGCCTGAAAAAGCTGGATACCTATAGTTGGAGTGGTTATAAAACCCTGACCGCCTATTTTACCAATTATAAAGTTGATAGCAGCAACCGCGTTACCTATGATGTTGTTTTTCATGGTTATCTGCCGAATGAAGGTGACAGCAAAAATAGTCTGCCGTATGGTAAAATTAACGGCACCTATAAAGGTACAGAAAAAGAAAAAATCAAGTTCAGTAGCGAAGGCAGCTTTGATCCGGATGGCAAAATTGTGAGTTATGAATGGGATTTTGGCGATGGCAATAAGAGTAATGAAGAAAATCCGGAACATAGTTATGATAAAGTTGGTACATACACCGTTAAACTGAAAGTTACCGATGATAAAGGTGAAAGTAGTGTGAGCACCACCACCGCAGAAATTAAGGATCTGAGTGAAAATAAGCTGCCGGTTATCTATATGCATGTGCCGAAAAGTGGCGCACTGAATCAGAAAGTTGTGTTTTATGGCAAAGGTACATACGATCCGGATGGTAGCATTGCAGGTTATCAGTGGGATTTTGGTGACGGCAGTGATTTTAGTAGTGAACAGAATCCGAGCCATGTGTATACCAAAAAAGGCGAATATACCGTGACCCTGCGCGTTATGGATAGTAGCGGTCAGATGAGCGAAAAAACCATGAAAATTAAGATCACCGATCCGGTTTATCCGATTGGCACCGAAAAAGAACCGAATAATAGCAAAGAAACCGCAAGCGGTCCGATTGTTCCGGGCATTCCGGTTAGCGGCACCATTGAAAATACCAGTGATCAGGATTATTTCTATTTCGATGTTATCACCCCGGGCGAAGTGAAAATTGATATTAATAAGCTGGGTTACGGCGGCGCCACCTGGGTGGTTTATGATGAAAATAATAATGCCGTGAGTTACGCCACCGATGATGGCCAGAATCTGAGTGGTAAATTCAAAGCCGATAAACCGGGCCGTTATTATATTCATCTGTATATGTTTAACGGTAGCTATATGCCGTATCGTATTAATATTGAAGGCAGTGTTGGCCGT

SEQID NO.2:标签蛋白的氨基酸序列

MPSVQEVEKLLHVLDRNGDGKVSAEELKAFADDSKCPLDSNKIKAFIKEHDKNKDGKLDLKELVSILSS

SEQID NO.3:标签蛋白的核苷酸序列ATGCCGAGTGTTCAGGAAGTGGAAAAACTGCTGCATGTGCTGGATCGTAATGGTGACGGCAAAGTTAGCGCAGAAGAACTGAAAGCATTTGCAGATGATAGCAAATGCCCGCTGGATAGTAATAAGATTAAGGCATTCATTAAGGAGCATGATAAAAATAAGGACGGCAAACTGGATCTGAAAGAACTGGTTAGTATTCTGAGTAGC

SEQID NO.4:重组溶组织梭菌II型胶原酶融合蛋白的氨基酸序列

MPSVQEVEKLLHVLDRNGDGKVSAEELKAFADDSKCPLDSNKIKAFIKEHDKNKDGKLDLKELVSILSSGSGSGHMHHHHHHSSGPDLDDDDKAVDKNNATAAVQNESKRYTVSYLKTLNYYDLVDLLVKTEIENLPDLFQYSSDAKEFYGNKTRMSFIMDEIGRRAPQYTEIDHKGIPTLVEVVRAGFYLGFHNKELNEINKRSFKERVIPSILAIQKNPNFKLGTEVQDKIVSATGLLAGNETAPPEVVNNFTPIIQDCIKNMDRYALDDLKSKALFNVLAAPTYDITEYLRATKEKPENTPWYGKIDGFINELKKLALYGKINDNNSWIIDNGIYHIAPLGKLHSNNKIGIETLTEVMKIYPYLSMQHLQSADQIERHYDSKDAEGNKIPLDKFKKEGKEKYCPKTYTFDDGKVIIKAGARVEEEKVKRLYWASKEVNSQFFRVYGIDKPLEEGNPDDILTMVIYNSPEEYKLNSVLYGYDTNNGGMYIEPDGTFFTYERKAEESTYTLEELFRHEYTHYLQGRYAVPGQWGRTKLYDNDRLTWYEEGGAELFAGSTRTSGILPRKSIVSNIHNTTRNNRYKLSDTVHSKYGASFEFYNYACMFMDYMYNKDMGILNKLNDLAKNNDVDGYDN008YIRDLSSNHALNDKYQDHMQERIDNYENLTVPFVADDYLVRHAYK NPNEIYSEISEVAKLKDAKSEVKKSQYFSTFTLRGSYTGGASKGKLEDQKAMNKFIDDSLKKLDTYSWSGYKTLTAYFTNYKVDSSNRVTYDVVFHGYLPNEGDSKNSLPYGKINGTYKGTEKEKIKFSSEGSFDPDGKIVSYEWDFGDGNKSNEENPEHSYDKVGTYTVKLKVTDDKGESSVSTTTAEIKDLSENKLPVIYMHVPKSGALNQKVVFYGKGTYDPDGSIAGYQWDFGDGSDFSSEQNPSHVYTKKGEYTVTLRVMDSSGQMSEKTMKIKITDPVYPIGTEKEPNNSKETASGPIVPGIPVSGTIENTSDQDYFYFDVITPGEVKIDINKLGYGGATWVVYDENNNAVSYATDDGQNLSGKFKADKPGRYYIHLYMFNGSYMPYRINIEGSVGR

SEQID NO.5:重组溶组织梭菌II型胶原酶融合蛋白的核苷酸序列

ATGCCGAGTGTTCAGGAAGTGGAAAAACTGCTGCATGTGCTGGATCGTAATGGTGACGGCAAAGTTAGCGCAGAAGAACTGAAAGCATTTGCAGATGATAGCAAATGCCCGCTGGATAGTAATAAGATTAAGGCATTCATTAAGGAGCATGATAAAAATAAGGACGGCAAACTGGATCTGAAAGAACTGGTTAGTATTCTGAGTAGCGGTTCTGGTTCTGGCCACATGCACCATCATCATCATCATTCTTCTGGTCCAGATCTGGATGATGATGATAAAGCCGTTGATAAAAATAATGCAACCGCAGCCGTGCAGAATGAAAGCAAACGTTATACCGTTAGTTATCTGAAAACCCTGAATTATTACGATCTGGTTGATCTGCTGGTGAAAACCGAAATTGAAAATCTGCCGGATCTGTTTCAGTATAGTAGCGATGCCAAAGAATTTTATGGCAATAAGACCCGTATGAGTTTTATTATGGATGAAATTGGCCGTCGTGCACCGCAGTATACCGAAATTGATCATAAAGGTATTCCGACCCTGGTGGAAGTGGTTCGTGCAGGTTTTTATCTGGGTTTTCATAATAAGGAACTGAATGAAATCAACAAGCGTAGTTTTAAAGAGCGTGTTATTCCGAGTATTCTGGCAATTCAGAAAAATCCGAATTTTAAACTGGGTACAGAAGTTCAGGATAAAATTGTGAGCGCCACCGGCCTGCTGGCCGGCAATGAAACCGCCCCGCCGGAAGTGGTGAATAATTTTACCCCGATTATTCAGGATTGCATTAAGAATatgGATCGTTATGCACTGGATGATCTGAAAAGCAAAGCACTGTTTAATGTTCTGGCAGCCCCGACCTATGATATTACCGAATATCTGCGTGCAACCAAAGAAAAACCGGAAAATACCCCGTGGTATGGCAAAATTGATGGTTTTATTAACGAGCTGAAGAAACTGGCACTGTATGGCAAAATCAATGATAATAATAGCTGGATTATCGACAACGGTATCTATCATATTGCACCGCTGGGTAAACTGCATAGCAATAATAAGATTGGTATCGAAACCCTGACCGAAGTGATGAAAATTTATCCGTATCTGAGTATGCAGCATCTGCAGAGTGCAGATCAGATTGAACGTCATTATGATAGTAAAGATGCAGAAGGTAATAAGATTCCGCTGGATAAATTCAAAAAGGAAGGCAAAGAAAAGTACTGCCCGAAAACCTATACCTTTGATGATGGCAAAGTGATTATTAAGGCCGGCGCCCGCGTTGAAGAAGAAAAAGTGAAACGTCTGTATTGGGCCAGCAAAGAAGTTAATAGCCAGTTTTTCCGCGTGTATGGTATTGATAAACCGCTGGAAGAAGGCAATCCGGATGATATTCTGACCATGGTTATCTATAATAGCCCGGAAGAATATAAACTGAATAGCGTGCTGTATGGCTATGATACCAATAATGGTGGTATGTATATCGAACCGGATGGCACCTTTTTCACCTATGAACGCAAAGCAGAAGAAAGCACCTATACCCTGGAAGAACTGTTTCGTCATGAATATACCCATTATCTGCAGGGTCGTTATGCAGTTCCGGGTCAGTGGGGTCGCACCAAACTGTATGATAATGATCGCCTGACCTGGTATGAAGAAGGTGGTGCAGAACTGTTTGCAGGCAGTACCCGTACCAGTGGCATTCTGCCGCGTAAAAGTATTGTTAGTAATATTCATAACACCACCCGCAATAATCGCTATAAACTGAGCGATACCGTTCATAGTAAATATGGTGCAAGCTTTGAATTTTACAACTATGCCTGCATGTTTATGGATTATATGTATAATAAGGACATGGGTATCCTGAATAAGCTGAATGATCTGGCCAAAAATAATGATGTGGATGGCTATGATAACTATATTCGTGATCTGAGCAGCAATCATGCACTGAATGATAAATATCAGGACCACATGCAGGAACGTATTGATAATTATGAAAACCTGACCGTGCCGTTTGTGGCAGATGATTATCTGGTGCGTCATGCCTATAAAAATCCGAACGAAATCTATAGCGAAATTAGTGAAGTTGCCAAACTGAAAGATGCAAAAAGCGAAGTGAAAAAATCACAGTATTTCAGTACCTTTACCCTGCGTGGCAGCTATACCGGCGGTGCAAGCAAAGGCAAACTGGAAGATCAGAAAGCAATGAATAAGTTTATCGATGATAGCCTGAAAAAGCTGGATACCTATAGTTGGAGTGGTTATAAAACCCTGACCGCCTATTTTACCAATTATAAAGTTGATAGCAGCAACCGCGTTACCTATGATGTTGTTTTTCATGGTTATCTGCCGAATGAAGGTGACAGCAAAAATAGTCTGCCGTATGGTAAAATTAACGGCACCTATAAAGGTACAGAAAAAGAAAAAATCAAGTTCAGTAGCGAAGGCAGCTTTGATCCGGATGGCAAAATTGTGAGTTATGAATGGGATTTTGGCGATGGCAATAAGAGTAATGAAGAAAATCCGGAACATAGTTATGATAAAGTTGGTACATACACCGTTAAACTGAAAGTTACCGATGATAAAGGTGAAAGTAGTGTGAGCACCACCACCGCAGAAATTAAGGATCTGAGTGAAAATAAGCTGCCGGTTATCTATATGCATGTGCCGAAAAGTGGCGCACTGAATCAGAAAGTTGTGTTTTATGGCAAAGGTACATACGATCCGGATGGTAGCATTGCAGGTTATCAGTGGGATTTTGGTGACGGCAGTGATTTTAGTAGTGAACAGAATCCGAGCCATGTGTATACCAAAAAAGGCGAATATACCGTGACCCTGCGCGTTATGGATAGTAGCGGTCAGATGAGCGAAAAAACCATGAAAATTAAGATCACCGATCCGGTTTATCCGATTGGCACCGAAAAAGAACCGAATAATAGCAAAGAAACCGCAAGCGGTCCGATTGTTCCGGGCATTCCGGTTAGCGGCACCATTGAAAATACCAGTGATCAGGATTATTTCTATTTCGATGTTATCACCCCGGGCGAAGTGAAAATTGATATTAATAAGCTGGGTTACGGCGGCGCCACCTGGGTGGTTTATGATGAAAATAATAATGCCGTGAGTTACGCCACCGATGATGGCCAGAATCTGAGTGGTAAATTCAAAGCCGATAAACCGGGCCGTTATTATATTCATCTGTATATGTTTAACGGTAGCTATATGCCGTATCGTATTAATATTGAAGGCAGTGTTGGCCGT

SEQID NO.6:接头的核苷酸序列

GGTTCTGGTTCTGGCCACATGCACCATCATCATCATCATTCTTCTGGTCCAGATCTGGATGATGATGATAAA

SEQID NO.7:接头的氨基酸序列

GSGSGHMHHHHHHSSGPDLDDDDK

序列表

<110> 重庆科润生物医药研发有限公司

<120> 一种重组溶组织梭菌II型胶原酶及其制备方法和应用

<141> 2021-04-01

<160> 7

<170> SIPOSequenceListing 1.0

<210> 1

<211> 2973

<212> DNA

<213> 溶组织梭菌(C. histolyticum)

<400> 1

gccgttgata aaaataatgc aaccgcagcc gtgcagaatg aaagcaaacg ttataccgtt 60

agttatctga aaaccctgaa ttattacgat ctggttgatc tgctggtgaa aaccgaaatt 120

gaaaatctgc cggatctgtt tcagtatagt agcgatgcca aagaatttta tggcaataag 180

acccgtatga gttttattat ggatgaaatt ggccgtcgtg caccgcagta taccgaaatt 240

gatcataaag gtattccgac cctggtggaa gtggttcgtg caggttttta tctgggtttt 300

cataataagg aactgaatga aatcaacaag cgtagtttta aagagcgtgt tattccgagt 360

attctggcaa ttcagaaaaa tccgaatttt aaactgggta cagaagttca ggataaaatt 420

gtgagcgcca ccggcctgct ggccggcaat gaaaccgccc cgccggaagt ggtgaataat 480

tttaccccga ttattcagga ttgcattaag aatatggatc gttatgcact ggatgatctg 540

aaaagcaaag cactgtttaa tgttctggca gccccgacct atgatattac cgaatatctg 600

cgtgcaacca aagaaaaacc ggaaaatacc ccgtggtatg gcaaaattga tggttttatt 660

aacgagctga agaaactggc actgtatggc aaaatcaatg ataataatag ctggattatc 720

gacaacggta tctatcatat tgcaccgctg ggtaaactgc atagcaataa taagattggt 780

atcgaaaccc tgaccgaagt gatgaaaatt tatccgtatc tgagtatgca gcatctgcag 840

agtgcagatc agattgaacg tcattatgat agtaaagatg cagaaggtaa taagattccg 900

ctggataaat tcaaaaagga aggcaaagaa aagtactgcc cgaaaaccta tacctttgat 960

gatggcaaag tgattattaa ggccggcgcc cgcgttgaag aagaaaaagt gaaacgtctg 1020

tattgggcca gcaaagaagt taatagccag tttttccgcg tgtatggtat tgataaaccg 1080

ctggaagaag gcaatccgga tgatattctg accatggtta tctataatag cccggaagaa 1140

tataaactga atagcgtgct gtatggctat gataccaata atggtggtat gtatatcgaa 1200

ccggatggca cctttttcac ctatgaacgc aaagcagaag aaagcaccta taccctggaa 1260

gaactgtttc gtcatgaata tacccattat ctgcagggtc gttatgcagt tccgggtcag 1320

tggggtcgca ccaaactgta tgataatgat cgcctgacct ggtatgaaga aggtggtgca 1380

gaactgtttg caggcagtac ccgtaccagt ggcattctgc cgcgtaaaag tattgttagt 1440

aatattcata acaccacccg caataatcgc tataaactga gcgataccgt tcatagtaaa 1500

tatggtgcaa gctttgaatt ttacaactat gcctgcatgt ttatggatta tatgtataat 1560

aaggacatgg gtatcctgaa taagctgaat gatctggcca aaaataatga tgtggatggc 1620

tatgataact atattcgtga tctgagcagc aatcatgcac tgaatgataa atatcaggac 1680

cacatgcagg aacgtattga taattatgaa aacctgaccg tgccgtttgt ggcagatgat 1740

tatctggtgc gtcatgccta taaaaatccg aacgaaatct atagcgaaat tagtgaagtt 1800

gccaaactga aagatgcaaa aagcgaagtg aaaaaatcac agtatttcag tacctttacc 1860

ctgcgtggca gctataccgg cggtgcaagc aaaggcaaac tggaagatca gaaagcaatg 1920

aataagttta tcgatgatag cctgaaaaag ctggatacct atagttggag tggttataaa 1980

accctgaccg cctattttac caattataaa gttgatagca gcaaccgcgt tacctatgat 2040

gttgtttttc atggttatct gccgaatgaa ggtgacagca aaaatagtct gccgtatggt 2100

aaaattaacg gcacctataa aggtacagaa aaagaaaaaa tcaagttcag tagcgaaggc 2160

agctttgatc cggatggcaa aattgtgagt tatgaatggg attttggcga tggcaataag 2220

agtaatgaag aaaatccgga acatagttat gataaagttg gtacatacac cgttaaactg 2280

aaagttaccg atgataaagg tgaaagtagt gtgagcacca ccaccgcaga aattaaggat 2340

ctgagtgaaa ataagctgcc ggttatctat atgcatgtgc cgaaaagtgg cgcactgaat 2400

cagaaagttg tgttttatgg caaaggtaca tacgatccgg atggtagcat tgcaggttat 2460

cagtgggatt ttggtgacgg cagtgatttt agtagtgaac agaatccgag ccatgtgtat 2520

accaaaaaag gcgaatatac cgtgaccctg cgcgttatgg atagtagcgg tcagatgagc 2580

gaaaaaacca tgaaaattaa gatcaccgat ccggtttatc cgattggcac cgaaaaagaa 2640

ccgaataata gcaaagaaac cgcaagcggt ccgattgttc cgggcattcc ggttagcggc 2700

accattgaaa ataccagtga tcaggattat ttctatttcg atgttatcac cccgggcgaa 2760

gtgaaaattg atattaataa gctgggttac ggcggcgcca cctgggtggt ttatgatgaa 2820

aataataatg ccgtgagtta cgccaccgat gatggccaga atctgagtgg taaattcaaa 2880

gccgataaac cgggccgtta ttatattcat ctgtatatgt ttaacggtag ctatatgccg 2940

tatcgtatta atattgaagg cagtgttggc cgt 2973

<210> 2

<211> 69

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 2

Met Pro Ser Val Gln Glu Val Glu Lys Leu Leu His Val Leu Asp Arg

1 5 10 15

Asn Gly Asp Gly Lys Val Ser Ala Glu Glu Leu Lys Ala Phe Ala Asp

20 25 30

Asp Ser Lys Cys Pro Leu Asp Ser Asn Lys Ile Lys Ala Phe Ile Lys

35 40 45

Glu His Asp Lys Asn Lys Asp Gly Lys Leu Asp Leu Lys Glu Leu Val

50 55 60

Ser Ile Leu Ser Ser

65

<210> 3

<211> 207

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 3

atgccgagtg ttcaggaagt ggaaaaactg ctgcatgtgc tggatcgtaa tggtgacggc 60

aaagttagcg cagaagaact gaaagcattt gcagatgata gcaaatgccc gctggatagt 120

aataagatta aggcattcat taaggagcat gataaaaata aggacggcaa actggatctg 180

aaagaactgg ttagtattct gagtagc 207

<210> 4

<211> 1084

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 4

Met Pro Ser Val Gln Glu Val Glu Lys Leu Leu His Val Leu Asp Arg

1 5 10 15

Asn Gly Asp Gly Lys Val Ser Ala Glu Glu Leu Lys Ala Phe Ala Asp

20 25 30

Asp Ser Lys Cys Pro Leu Asp Ser Asn Lys Ile Lys Ala Phe Ile Lys

35 40 45

Glu His Asp Lys Asn Lys Asp Gly Lys Leu Asp Leu Lys Glu Leu Val

50 55 60

Ser Ile Leu Ser Ser Gly Ser Gly Ser Gly His Met His His His His

65 70 75 80

His His Ser Ser Gly Pro Asp Leu Asp Asp Asp Asp Lys Ala Val Asp

85 90 95

Lys Asn Asn Ala Thr Ala Ala Val Gln Asn Glu Ser Lys Arg Tyr Thr

100 105 110

Val Ser Tyr Leu Lys Thr Leu Asn Tyr Tyr Asp Leu Val Asp Leu Leu

115 120 125

Val Lys Thr Glu Ile Glu Asn Leu Pro Asp Leu Phe Gln Tyr Ser Ser

130 135 140

Asp Ala Lys Glu Phe Tyr Gly Asn Lys Thr Arg Met Ser Phe Ile Met

145 150 155 160

Asp Glu Ile Gly Arg Arg Ala Pro Gln Tyr Thr Glu Ile Asp His Lys

165 170 175

Gly Ile Pro Thr Leu Val Glu Val Val Arg Ala Gly Phe Tyr Leu Gly

180 185 190

Phe His Asn Lys Glu Leu Asn Glu Ile Asn Lys Arg Ser Phe Lys Glu

195 200 205

Arg Val Ile Pro Ser Ile Leu Ala Ile Gln Lys Asn Pro Asn Phe Lys

210 215 220

Leu Gly Thr Glu Val Gln Asp Lys Ile Val Ser Ala Thr Gly Leu Leu

225 230 235 240

Ala Gly Asn Glu Thr Ala Pro Pro Glu Val Val Asn Asn Phe Thr Pro

245 250 255

Ile Ile Gln Asp Cys Ile Lys Asn Met Asp Arg Tyr Ala Leu Asp Asp

260 265 270

Leu Lys Ser Lys Ala Leu Phe Asn Val Leu Ala Ala Pro Thr Tyr Asp

275 280 285

Ile Thr Glu Tyr Leu Arg Ala Thr Lys Glu Lys Pro Glu Asn Thr Pro

290 295 300

Trp Tyr Gly Lys Ile Asp Gly Phe Ile Asn Glu Leu Lys Lys Leu Ala

305 310 315 320

Leu Tyr Gly Lys Ile Asn Asp Asn Asn Ser Trp Ile Ile Asp Asn Gly

325 330 335

Ile Tyr His Ile Ala Pro Leu Gly Lys Leu His Ser Asn Asn Lys Ile

340 345 350

Gly Ile Glu Thr Leu Thr Glu Val Met Lys Ile Tyr Pro Tyr Leu Ser

355 360 365

Met Gln His Leu Gln Ser Ala Asp Gln Ile Glu Arg His Tyr Asp Ser

370 375 380

Lys Asp Ala Glu Gly Asn Lys Ile Pro Leu Asp Lys Phe Lys Lys Glu

385 390 395 400

Gly Lys Glu Lys Tyr Cys Pro Lys Thr Tyr Thr Phe Asp Asp Gly Lys

405 410 415

Val Ile Ile Lys Ala Gly Ala Arg Val Glu Glu Glu Lys Val Lys Arg

420 425 430

Leu Tyr Trp Ala Ser Lys Glu Val Asn Ser Gln Phe Phe Arg Val Tyr

435 440 445

Gly Ile Asp Lys Pro Leu Glu Glu Gly Asn Pro Asp Asp Ile Leu Thr

450 455 460

Met Val Ile Tyr Asn Ser Pro Glu Glu Tyr Lys Leu Asn Ser Val Leu

465 470 475 480

Tyr Gly Tyr Asp Thr Asn Asn Gly Gly Met Tyr Ile Glu Pro Asp Gly

485 490 495

Thr Phe Phe Thr Tyr Glu Arg Lys Ala Glu Glu Ser Thr Tyr Thr Leu

500 505 510

Glu Glu Leu Phe Arg His Glu Tyr Thr His Tyr Leu Gln Gly Arg Tyr

515 520 525

Ala Val Pro Gly Gln Trp Gly Arg Thr Lys Leu Tyr Asp Asn Asp Arg

530 535 540

Leu Thr Trp Tyr Glu Glu Gly Gly Ala Glu Leu Phe Ala Gly Ser Thr

545 550 555 560

Arg Thr Ser Gly Ile Leu Pro Arg Lys Ser Ile Val Ser Asn Ile His

565 570 575

Asn Thr Thr Arg Asn Asn Arg Tyr Lys Leu Ser Asp Thr Val His Ser

580 585 590

Lys Tyr Gly Ala Ser Phe Glu Phe Tyr Asn Tyr Ala Cys Met Phe Met

595 600 605

Asp Tyr Met Tyr Asn Lys Asp Met Gly Ile Leu Asn Lys Leu Asn Asp

610 615 620

Leu Ala Lys Asn Asn Asp Val Asp Gly Tyr Asp Asn Tyr Ile Arg Asp

625 630 635 640

Leu Ser Ser Asn His Ala Leu Asn Asp Lys Tyr Gln Asp His Met Gln

645 650 655

Glu Arg Ile Asp Asn Tyr Glu Asn Leu Thr Val Pro Phe Val Ala Asp

660 665 670

Asp Tyr Leu Val Arg His Ala Tyr Lys Asn Pro Asn Glu Ile Tyr Ser

675 680 685

Glu Ile Ser Glu Val Ala Lys Leu Lys Asp Ala Lys Ser Glu Val Lys

690 695 700

Lys Ser Gln Tyr Phe Ser Thr Phe Thr Leu Arg Gly Ser Tyr Thr Gly

705 710 715 720

Gly Ala Ser Lys Gly Lys Leu Glu Asp Gln Lys Ala Met Asn Lys Phe

725 730 735

Ile Asp Asp Ser Leu Lys Lys Leu Asp Thr Tyr Ser Trp Ser Gly Tyr

740 745 750

Lys Thr Leu Thr Ala Tyr Phe Thr Asn Tyr Lys Val Asp Ser Ser Asn

755 760 765

Arg Val Thr Tyr Asp Val Val Phe His Gly Tyr Leu Pro Asn Glu Gly

770 775 780

Asp Ser Lys Asn Ser Leu Pro Tyr Gly Lys Ile Asn Gly Thr Tyr Lys

785 790 795 800

Gly Thr Glu Lys Glu Lys Ile Lys Phe Ser Ser Glu Gly Ser Phe Asp

805 810 815

Pro Asp Gly Lys Ile Val Ser Tyr Glu Trp Asp Phe Gly Asp Gly Asn

820 825 830

Lys Ser Asn Glu Glu Asn Pro Glu His Ser Tyr Asp Lys Val Gly Thr

835 840 845

Tyr Thr Val Lys Leu Lys Val Thr Asp Asp Lys Gly Glu Ser Ser Val

850 855 860

Ser Thr Thr Thr Ala Glu Ile Lys Asp Leu Ser Glu Asn Lys Leu Pro

865 870 875 880

Val Ile Tyr Met His Val Pro Lys Ser Gly Ala Leu Asn Gln Lys Val

885 890 895

Val Phe Tyr Gly Lys Gly Thr Tyr Asp Pro Asp Gly Ser Ile Ala Gly

900 905 910

Tyr Gln Trp Asp Phe Gly Asp Gly Ser Asp Phe Ser Ser Glu Gln Asn

915 920 925

Pro Ser His Val Tyr Thr Lys Lys Gly Glu Tyr Thr Val Thr Leu Arg

930 935 940

Val Met Asp Ser Ser Gly Gln Met Ser Glu Lys Thr Met Lys Ile Lys

945 950 955 960

Ile Thr Asp Pro Val Tyr Pro Ile Gly Thr Glu Lys Glu Pro Asn Asn

965 970 975

Ser Lys Glu Thr Ala Ser Gly Pro Ile Val Pro Gly Ile Pro Val Ser

980 985 990

Gly Thr Ile Glu Asn Thr Ser Asp Gln Asp Tyr Phe Tyr Phe Asp Val

995 1000 1005

Ile Thr Pro Gly Glu Val Lys Ile Asp Ile Asn Lys Leu Gly Tyr Gly

1010 1015 1020

Gly Ala Thr Trp Val Val Tyr Asp Glu Asn Asn Asn Ala Val Ser Tyr

1025 1030 1035 1040

Ala Thr Asp Asp Gly Gln Asn Leu Ser Gly Lys Phe Lys Ala Asp Lys

1045 1050 1055

Pro Gly Arg Tyr Tyr Ile His Leu Tyr Met Phe Asn Gly Ser Tyr Met

1060 1065 1070

Pro Tyr Arg Ile Asn Ile Glu Gly Ser Val Gly Arg

1075 1080

<210> 5

<211> 3252

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 5

atgccgagtg ttcaggaagt ggaaaaactg ctgcatgtgc tggatcgtaa tggtgacggc 60

aaagttagcg cagaagaact gaaagcattt gcagatgata gcaaatgccc gctggatagt 120

aataagatta aggcattcat taaggagcat gataaaaata aggacggcaa actggatctg 180

aaagaactgg ttagtattct gagtagcggt tctggttctg gccacatgca ccatcatcat 240

catcattctt ctggtccaga tctggatgat gatgataaag ccgttgataa aaataatgca 300

accgcagccg tgcagaatga aagcaaacgt tataccgtta gttatctgaa aaccctgaat 360

tattacgatc tggttgatct gctggtgaaa accgaaattg aaaatctgcc ggatctgttt 420

cagtatagta gcgatgccaa agaattttat ggcaataaga cccgtatgag ttttattatg 480

gatgaaattg gccgtcgtgc accgcagtat accgaaattg atcataaagg tattccgacc 540

ctggtggaag tggttcgtgc aggtttttat ctgggttttc ataataagga actgaatgaa 600

atcaacaagc gtagttttaa agagcgtgtt attccgagta ttctggcaat tcagaaaaat 660

ccgaatttta aactgggtac agaagttcag gataaaattg tgagcgccac cggcctgctg 720

gccggcaatg aaaccgcccc gccggaagtg gtgaataatt ttaccccgat tattcaggat 780

tgcattaaga atatggatcg ttatgcactg gatgatctga aaagcaaagc actgtttaat 840

gttctggcag ccccgaccta tgatattacc gaatatctgc gtgcaaccaa agaaaaaccg 900

gaaaataccc cgtggtatgg caaaattgat ggttttatta acgagctgaa gaaactggca 960

ctgtatggca aaatcaatga taataatagc tggattatcg acaacggtat ctatcatatt 1020

gcaccgctgg gtaaactgca tagcaataat aagattggta tcgaaaccct gaccgaagtg 1080

atgaaaattt atccgtatct gagtatgcag catctgcaga gtgcagatca gattgaacgt 1140

cattatgata gtaaagatgc agaaggtaat aagattccgc tggataaatt caaaaaggaa 1200

ggcaaagaaa agtactgccc gaaaacctat acctttgatg atggcaaagt gattattaag 1260

gccggcgccc gcgttgaaga agaaaaagtg aaacgtctgt attgggccag caaagaagtt 1320

aatagccagt ttttccgcgt gtatggtatt gataaaccgc tggaagaagg caatccggat 1380

gatattctga ccatggttat ctataatagc ccggaagaat ataaactgaa tagcgtgctg 1440

tatggctatg ataccaataa tggtggtatg tatatcgaac cggatggcac ctttttcacc 1500

tatgaacgca aagcagaaga aagcacctat accctggaag aactgtttcg tcatgaatat 1560

acccattatc tgcagggtcg ttatgcagtt ccgggtcagt ggggtcgcac caaactgtat 1620

gataatgatc gcctgacctg gtatgaagaa ggtggtgcag aactgtttgc aggcagtacc 1680

cgtaccagtg gcattctgcc gcgtaaaagt attgttagta atattcataa caccacccgc 1740

aataatcgct ataaactgag cgataccgtt catagtaaat atggtgcaag ctttgaattt 1800

tacaactatg cctgcatgtt tatggattat atgtataata aggacatggg tatcctgaat 1860

aagctgaatg atctggccaa aaataatgat gtggatggct atgataacta tattcgtgat 1920

ctgagcagca atcatgcact gaatgataaa tatcaggacc acatgcagga acgtattgat 1980

aattatgaaa acctgaccgt gccgtttgtg gcagatgatt atctggtgcg tcatgcctat 2040

aaaaatccga acgaaatcta tagcgaaatt agtgaagttg ccaaactgaa agatgcaaaa 2100

agcgaagtga aaaaatcaca gtatttcagt acctttaccc tgcgtggcag ctataccggc 2160

ggtgcaagca aaggcaaact ggaagatcag aaagcaatga ataagtttat cgatgatagc 2220

ctgaaaaagc tggataccta tagttggagt ggttataaaa ccctgaccgc ctattttacc 2280

aattataaag ttgatagcag caaccgcgtt acctatgatg ttgtttttca tggttatctg 2340

ccgaatgaag gtgacagcaa aaatagtctg ccgtatggta aaattaacgg cacctataaa 2400

ggtacagaaa aagaaaaaat caagttcagt agcgaaggca gctttgatcc ggatggcaaa 2460

attgtgagtt atgaatggga ttttggcgat ggcaataaga gtaatgaaga aaatccggaa 2520

catagttatg ataaagttgg tacatacacc gttaaactga aagttaccga tgataaaggt 2580

gaaagtagtg tgagcaccac caccgcagaa attaaggatc tgagtgaaaa taagctgccg 2640

gttatctata tgcatgtgcc gaaaagtggc gcactgaatc agaaagttgt gttttatggc 2700

aaaggtacat acgatccgga tggtagcatt gcaggttatc agtgggattt tggtgacggc 2760

agtgatttta gtagtgaaca gaatccgagc catgtgtata ccaaaaaagg cgaatatacc 2820

gtgaccctgc gcgttatgga tagtagcggt cagatgagcg aaaaaaccat gaaaattaag 2880

atcaccgatc cggtttatcc gattggcacc gaaaaagaac cgaataatag caaagaaacc 2940

gcaagcggtc cgattgttcc gggcattccg gttagcggca ccattgaaaa taccagtgat 3000

caggattatt tctatttcga tgttatcacc ccgggcgaag tgaaaattga tattaataag 3060

ctgggttacg gcggcgccac ctgggtggtt tatgatgaaa ataataatgc cgtgagttac 3120

gccaccgatg atggccagaa tctgagtggt aaattcaaag ccgataaacc gggccgttat 3180

tatattcatc tgtatatgtt taacggtagc tatatgccgt atcgtattaa tattgaaggc 3240

agtgttggcc gt 3252

<210> 6

<211> 72

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 6

ggttctggtt ctggccacat gcaccatcat catcatcatt cttctggtcc agatctggat 60

gatgatgata aa 72

<210> 7

<211> 24

<212> PRT

<213> 人工序列(Artificial Sequence)

<400> 7

Gly Ser Gly Ser Gly His Met His His His His His His Ser Ser Gly

1 5 10 15

Pro Asp Leu Asp Asp Asp Asp Lys

20

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号