首页> 中国专利> 在哺乳动物细胞的蛋白质内选择性地掺入5-羟色胺酸

在哺乳动物细胞的蛋白质内选择性地掺入5-羟色胺酸

摘要

本发明提供了利用正交氨酰tRNA合成酶/tRNA对将非天然氨基酸掺入到肽内的方法和组合物。更具体地说,本发明提供了正交对用于将5-羟基-L-色氨酸插入到乳白突变所编码的位置上。

著录项

  • 公开/公告号CN1897969A

    专利类型发明专利

  • 公开/公告日2007-01-17

    原文格式PDF

  • 申请/专利权人 斯克利普斯研究院;

    申请/专利号CN200480038116.9

  • 发明设计人 张致文;L·阿方达;P·舒尔茨;

    申请日2004-12-16

  • 分类号A61K38/43(20060101);C12N9/00(20060101);C12P21/06(20060101);C07K1/00(20060101);C07H21/02(20060101);

  • 代理机构31100 上海专利商标事务所有限公司;

  • 代理人范征

  • 地址 美国加利福尼亚州

  • 入库时间 2023-12-17 18:12:30

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2017-02-08

    未缴年费专利权终止 IPC(主分类):A61K38/43 授权公告日:20130918 终止日期:20151216 申请日:20041216

    专利权的终止

  • 2013-09-18

    授权

    授权

  • 2007-03-14

    实质审查的生效

    实质审查的生效

  • 2007-01-17

    公开

    公开

说明书

                    相关申请的交叉参考

本申请要求Zhang等于2004年2月26日提交的题为“在哺乳动物细胞的蛋白质内选择性地掺入5-羟色胺酸”(Selective Incorporation of 5-Hydroxytryptophan into Proteinsin Mammalian Cells)的在先美国临时申请No.60/548,761;以及Zhang等于2003年12月18日提交的题为“在哺乳动物细胞的蛋白质内选择性地掺入5-羟色胺酸”(SelectiveIncorporation of 5-Hydroxytryptophan into Proteins in Mammalian Cells)的在先美国临时申请No.60/531,312的优先权和利益;这两个申请本文都已完整纳入作为参考。

  有关由联邦政府资助的研究和开发项目所形成的发明的权利声明

来自于NRAS、DOE和EMBO的政府基金(基金号为DE-FG03-00ER45812和NIHGM66494)被用于本发明权利要求某些方面的研究或开发,因此,美国联邦政府对本发明也享有一定的权利。

                              发明领域

本发明属于蛋白质表达领域。例如,本发明提供了用于正交表达含非天然氨基酸残基的蛋白质的组合物和方法。

                              发明背景

蛋白质是生命系统的主要建筑材料和催化剂。通过重组核酸技术进行基因的改造以及天然蛋白质和基因工程蛋白质的表达为我们提供了许多与遗传工程革命相关的利益。蛋白质工程,包括肽内掺入非天然氨基酸可以使我们从生命科学中进一步获益。

由核酸序列编码的肽的翻译是生命系统中许多翻译系统通过复杂的相互作用而完成的,翻译系统包含各种组分,如核糖体、mRNA、tRNA、氨酰-tRNA合成酶以及氨基酸。一套严格的规则和可信的反应可使活细胞内的内源性翻译系统翻译出非常一致的蛋白质。一个RNA聚合酶家族首先通过转录DNA序列产生出核糖体RNA(rRNA)、tRNA和mRNA。一个内源性氨酰-tRNA合成酶家族中的不同成员可以分别将不同的特异性氨基酸(20种天然氨基酸中的不同氨基酸)结合和连接到不同的特异性tRNA上。由蛋白质和rRNA组装成的核糖体可以使每个tRNA上的独特反密码子与被翻译mRNA链上存在的互补密码子配对。最后,核糖体催化沿mRNA链排列的tRNA上的氨基酸之间形成肽键。核糖体可识别启动子附近的起始密码子(AUG-蛋氨酸)以确定翻译的起始位置和阅读框架。核糖体一般可对三个mRNA终止密码子(UAG、UGA和UAA)作出反应,这些终止密码子没有任何相关的tRNA,只是作为终止翻译的信号。

一种制备含非天然侧链的蛋白质的方法是在翻译后修饰蛋白质。某些氨基酸的侧链基团是化学反应性的,可进行化学修饰。半胱氨酸的巯基、酪氨酸的羟基和谷氨酰胺的氨基可发生化学领域熟知的反应,导致氨基酸被修饰或共价结合到氨基酸残基的侧链上。例如赖氨酸残基的侧链含有ε氨基基团,可通过乙酰转移酶的酶催化反应或与化学乙酰化试剂如乙酰乙酸盐发生化学反应而被转化成乙酰赖氨酸。然而,翻译后修饰通常都是非特异性的和/或非定向的。

非天然氨基酸也可以通过化学合成的方法被掺入到肽内。在固相支持物上进行自动化学合成是一种掺入非天然氨基酸的直接方法。但是,常规的固相肽合成一般只限于小肽或少于100个氨基酸残基的蛋白质。通过最近开发出的方法进行肽片段的酶催化连接或天然化学连接有可能制备较大的蛋白质,但是这种方法不易规模化。

还可以利用突变的转录系统组分将非天然氨基酸掺入到蛋白质中。例如,正交翻译组分可被加到内源性的天然翻译系统中,从而可以翻译出与内源性翻译系统在正常情况下所翻译的肽不同的肽。见“真核翻译系统中的一种用于将非天然氨基酸位点特异性地掺入到蛋白质内的大肠杆菌基因工程酪氨酰-tRNA合成酶及其在麦胚无细胞系统中的应用”(An Engineered Escherichia coli Tyrosyl-tRNA Synthetase forSite-specifc Incorporation of an Unnatural Amino Acid into Proteins in Eukaryotic Translationand Its Application in a Wheat Germ Cell-free System),A.K.Kowal等,Proc.Natl.Acad.Sci.USA 98,2268-73(2001),来源于大肠杆菌的酪氨酰-tRNA合成酶(TyrRS)经改造后可优先识别3-碘-L-酪氨酸而不是L-酪氨酸,并且可以位点特异性地将3-碘-L-酪氨酸掺入到体外真核翻译系统的蛋白质内。一种相似的翻译系统经改造后可在哺乳动物系统内掺入非天然酪氨酸类似物。见“在哺乳动物细胞内将非天然氨基酸位点特异性地掺入到蛋白质内”(Site-specific Incorporation of an Unnatural Amino Acid into Proteinsin Mammalian Cells),K.Sakamoto,N.A.Res.,第30卷,No.21 4692-4699,(2002),大肠杆菌TyrRS构建物可与嗜热脂肪芽孢杆菌琥珀突变型抑制因子一起在哺乳动物细胞内表达产生出含有TAG密码子编码的碘酪氨酸残基的ras蛋白。该系统对碘-酪氨酸的掺入是特异性的,但是这种肽有用的独特特性并没有被描述。

从上面的描述可以看出,我们依然需要一种更好的方法来利用真核翻译系统将非天然氨基酸残基特异性地掺入到肽内我们所期望的位置上。我们需要有一种方法将非天然氨基酸残基而不是卤代酪氨酸残基掺入到肽内。通过掺入不需标记物就可检测的非天然氨基酸是很有意义的。具有特异反应性化学连接基团的非天然氨基酸的掺入方法可用于诊断学、治疗学和材料科学。通过阅读下文可以发现本发明提供了这些方法以及其他一些特色。

                            发明概述

本发明包括将氨基酸插入到正在延伸的肽链的非典型位置上的组合物和方法。所述组合物包括正交氨酰-tRNA合成酶/正交tRNA(O-RS/O-tRNA)对,该对可以将氨基酸如5-羟基-L-色氨酸(5-HTPP)插入到选择密码子所编码的位置上。本发明包括含有正交对的哺乳动物细胞,其中的正交对用于在体内掺入非天然氨基酸。本发明的方法包括制备正交对构建物从而在翻译系统内表达正交对,其中O-RS可将氨基酸加载到O-tRNA上以使氨基酸掺入到肽内。

本发明的组合物一般包括:翻译系统;正交氨酰-tRNA合成酶(O-RS),如正交色氨酰-tRNA合成酶(O-TrpRS);突变的正交色氨酰-tRNA合成酶(O-muTrpRS)或其衍生物;以及正交tRNA(O-tRNA);这样O-RS用氨基酸或非天然氨基酸优先氨酰化O-tRNA。翻译系统包括体外翻译系统或细胞,如真核细胞、非洲蟾蜍细胞或哺乳动物细胞。体外翻译系统一般包括含细胞裂解组分的翻译系统。在一个优选实施方式中,组合物包含用5-羟基-L-色氨酸(5-HTPP)优先氨酰化tRNA(或者O-tRNA)的正交氨酰-tRNA合成酶(O-RS)。

组合物中的O-RS可能包含酶催化活性改善或提高的正交氨酰-tRNA合成酶,如对非天然氨基酸的Km和/或Kcat优于天然氨基酸。在一个优选实施方式中,O-RS可能由含枯草芽孢杆菌(Bacillus subtilis)色氨酰-tRNA合成酶多核苷酸序列的核酸编码,其中的合成酶多核苷酸序列含有突变,其中144位的缬氨酸被脯氨酸取代,其密码子为CCC,如Val144ProBsTrpRS(SEQ ID NO:1)的核酸序列或其保守突变体,和/或互补的多核苷酸序列。在另一个优选实施方式中,O-RS包含氨基酸序列Val144ProBsTrpRS(SEQ ID NO:2)和/或其保守突变体。

O-tRNA可被其同源O-RS优选氨酰化,同时O-tRNA基本不能被内源翻译系统的内源性氨酰-tRNA合成酶氨酰化。在一个优选实施方式中,O-tRNA含有突变型正交乳白抑制型tRNA,如mutRNAUCATrp(SEQ ID NO:3)的多核苷酸序列、其保守突变体和/或其互补多核苷酸序列编码。本发明的O-tRNA通常都可以识别选择密码子,如四碱基密码子、稀有密码子、UUA、CUA或UCA。

正交对、内源性翻译系统、非天然氨基酸等可用于将非典型氨基酸掺入到肽产物中。肽产物可被含选择密码子的核酸编码,其中的选择密码子可被O-tRNA识别。许多有用的肽产物所具有的氨基酸序列与野生型治疗蛋白、诊断蛋白、工业用酶或其片段的氨基酸序列至少有75%的一致性。

本发明的组合物可包括例如内源性翻译系统,该翻译系统由RS、tRNA、氨基酸、mRNA、rRNA和其他组分组成,这些组分对于活生物体、细胞或细胞裂解物的天然翻译系统来说是内源性的。正交组分,如O-tRNA、O-RS、含选择密码子的mRNA和/或非天然氨基酸可加入到内源性翻译系统内,从而可以获得异常的转录产物。内源性翻译系统对于细胞、细胞裂解物、体外翻译系统、或其衍生物来说可以是天然的。

本发明包括具有多核苷酸编码序列所编码的氨基酸序列的多肽,其中的多核苷酸编码序列如a)SEQ ID NO:1的多核苷酸编码序列或其保守突变体;b)编码SEQ IDNO:2多肽的多核苷酸编码序列或其保守突变体;c)在高严格条件下可与基本全长的(a)或(b)的多核苷酸序列杂交的多核苷酸序列;和/或d)与(a)、(b)或(c)互补的序列;其中的多肽具有氨酰-tRNA合成酶活性,可将色氨酸类似物如5-HTPP加载到tRNA上。

本发明包括含tRNA序列的核酸,如:a)SEQ ID NO:1的多核苷酸编码序列或其互补序列;b)可识别选择密码子的(a)的保守突变体;和/或c)在高严格条件下可与基本全长的多核苷酸序列(a)杂交的多核苷酸序列,该序列包含可识别选择密码子如四碱基密码子、UGA、UAA和UAG的tRNA。

在本发明的一个方面,哺乳动物细胞能在翻译mRNA的过程中掺入色氨酸类似物。例如,哺乳动物细胞可利用正交氨酰-tRNA合成酶(O-RS)和正交tRNA(O-tRNA)将氨基酸掺入到正在延伸的肽链上,其中正交氨酰-tRNA合成酶的例子有正交色氨酰-tRNA合成酶(O-TrpRS)、正交突变的色氨酰-tRNA合成酶(O-muTrpRS)和/或其衍生物,其中的正交tRNA优先被O-RS用天然或非天然氨基酸氨酰化。在某些实施方式中,O-RS由含SEQ ID NO:1多核苷酸序列的核酸序列、其保守突变体或互补的多核苷酸序列编码。O-RS可含有SEQ ID NO:2的氨基酸序列或其保守取代突变体。在许多情况下,O-tRNA基本上不能被细胞的任何内源性氨酰-tRNA合成酶氨酰化。O-tRNA可作为SEQ ID NO:3的多核苷酸序列、其保守突变体或互补的多核苷酸序列存在于细胞内。可被哺乳动物细胞以正交翻译组分掺入的典型非天然氨基酸包括色氨酸类似物和5-羟基-L-色氨酸(5-HTPP)。

本发明包括将氨基酸掺入到肽内的方法,一般来说是通过在内源性翻译系统内加入正交翻译系统组分来实现的。例如,本发明的方法包括制备含正交突变的色氨酰-tRNA合成酶(O-muTrpRS)和/或其衍生物编码核酸序列的构建物,制备含正交tRNA(O-tRNA)编码核酸序列的构建物,用O-muTrpRS构建物和O-tRNA构建物转染真核细胞,以及用氨基酸或非天然氨基酸优先加载表达的O-tRNA,用表达的O-muTrpRS将氨基酸掺入到细胞内的肽上。

在一个优选实施方式中,非天然氨基酸是5-羟基-L-色氨酸(5-HTPP)。通过本发明的方法掺入有5-HTPP的肽可用于交联到其他分子上,如通过给肽加电压,使5-HTPP与反应性分子反应,例如使肽与反应性分子交联。在一个实施方式中,反应性分子是掺入有非天然氨基酸如5-HTPP的另一种肽。掺入有5-HTPP的肽也可用于检测肽与肽之间的相互作用,如通过荧光显微镜检测。

本发明的方法可用编码色氨酰-tRNA合成酶肽序列的O-muTrpRS构建物来实现,其中色氨酰-tRNA合成酶肽序列上的一个或多个氨基酸残基基于色氨酰-tRNA合成酶或类似的氨酰-tRNA合成酶的结构数据而被突变。例如,突变的色氨酰-tRNA合成酶可以是芽孢杆菌色氨酰-tRNA合成酶,其中的突变发生在残基144区或附近。在一个优选实施方式中,O-muTrpRS构建物被如下多核苷酸序列编码:a)SEQ ID NO:1或其保守突变体,b)编码SEQ ID NO:2多肽序列或其保守取代突变体的多核苷酸序列,c)在高严格条件下可与基本全长的(a)或(b)的多核苷酸序列杂交的多核苷酸序列;或d)和(a)、(b)或(c)互补的序列。

本发明方法中的O-tRNA可由在内源性翻译系统中有功能的构建物来表达。O-tRNA构建物包含SEQ ID NO:3的多核苷酸序列、其保守突变体或其互补的多核苷酸序列。O-tRNA构建物可能包含一个或多个tRNA侧翼序列,该序列可与作为翻译系统的细胞内的RNA聚合酶发生有功能的相互作用。例如,O-tRNA构建物可包含A盒真核转录调控元件,如通过突变原核tRNA序列使其包含A盒真核转录调控元件。这种突变优选通过位点定向突变来实现。其他有用的O-tRNA构建物元件包括报告子标记物或纯化标记物。O-tRNA构建物可以包含与编码肽的mRNA选择密码子mRNA序列互补的反密码子,以便于将非天然氨基酸掺入到肽内。从同一个构建物内可以翻译出多个正交翻译组分,例如O-muTrpRS和O-tRNA序列可位于同一个构建物上。

构建物可以转导到活细胞内以便于在体内翻译系统中表达,和/或从细胞中分离出来以便于插入到体外翻译系统中。导入用在本发明的方法中时可以包括将构建物插入到活细胞以复制和/或表达的任何方式。在优选实施方式中,构建物被转染到真核细胞或哺乳动物细胞内。表达产物如全蛋白质、O-tRNA、O-RS等可以是粗产物,如果需要也可以进行部分纯化和/或高度纯化。

                                定义

除了在此处和说明书的其余部分所定义的,本文所用的所有技术术语和科学术语都与本发明所属领域的技术人员所通常理解的意义相同。

在详细描述本发明前,需要说明的是本发明并不局限于某些特定的装置或生物系统,本发明可以有各种变化。还应当说明的是本文所用的方法只是为了描述特定的实施方式,并不意味着对本发明的限制。如本发明的说明书和附属权利要求所使用的,除非特别指明,单数形式“一个”、“一种”和“这种”也包括复数。因此,“一个组分”也包括两个或多个组分的组合;“一个氨基酸”也包括适当氨基酸的混合物等。

虽然许多与本文所描述的方法和材料相似的、经改进的或等价的方法和材料都可用于实现本发明而不需要特别的试验,但是本文所描述的材料和方法是优选的。在本发明的说明书和权利要求中,下面的方法将根据下面所描述的定义而使用。

O-RS“优先氨酰化”同源O-tRNA是指O-RS用氨基酸加载O-tRNA的效率比其加载表达系统中其他任何内源性tRNA的效率都高。也就是说,当O-tRNA和其他任何给定的内源性tRNA以大致相同摩尔比例同时存在于翻译系统内时,O-RS加载O-tRNA的频率要高于其加载内源性tRNA的频率。优选的是当O-tRNA和内源性tRNA以相同摩尔比例同时存在于翻译系统内时,被O-RS所加载的O-tRNA与O-RS所加载的内源性tRNA的相对比例较高,其结果导致O-RS只加载、或者几乎只加载O-tRNA。当O-tRNA和O-RS以相同摩尔浓度存在时,被O-RS加载的O-tRNA和内源性tRNA之间的相对比例大于1∶1,优选至少约为2∶1,更优选的是5∶1,甚至10∶1、20∶1、50∶1、75∶1、95∶1、98∶1、99∶1、100∶1、500∶1、1,000∶1、5,000∶1或更高。

O-RS“优先用非天然氨基酸氨酰化O-tRNA”是指(a)与内源性tRNA相比,O-RS更容易氨酰化O-tRNA,以及(b)与O-RS用任何天然氨基酸氨酰化O-tRNA相比,其中的氨酰化是非天然氨基酸特异性的。也就是说,当非天然氨基酸和天然氨基酸以等摩尔的量存在于含O-RS和O-tRNA的翻译系统中时,O-RS用非天然氨基酸加载O-tRNA的频率要高于用天然氨基酸加载O-tRNA的频率。优选的是非天然氨基酸加载的O-tRNA与天然氨基酸加载的O-tRNA之间的相对比例较高。更优选的是O-RS只用或者几乎只用非天然氨基酸加载O-tRNA。当非天然氨基酸和天然氨基酸以等摩尔的浓度存在于翻译系统中时,非天然氨基酸加载的O-tRNA与天然氨基酸加载的O-tRNA之间的相对比例高于1∶1,优选至少约为2∶1,更优选的是5∶1,甚至10∶1、20∶1、50∶1、75∶1、95∶1、98∶1、99∶1、100∶1、500∶1、1,000∶1、5,000∶1或更高。

本文所用的术语正交色氨酰-tRNA(trp-O-tRNA)是与目的翻译系统正交的tRNA,其中tRNA:(1)与天然的色氨酰tRNA相同或基本类似,(2)来源于发生自然突变或人工诱变的天然色氨酰tRNA,(3)由考虑到(1)或(2)的野生型或突变trp-tRNA序列的任意方法所制备,(4)与野生型或突变的trp-tRNA同源,(5)与被定义为Val144ProBsTrpRS(SEQ ID No.:2)底物的任何典型tRNA同源,或(6)被定义为Val144ProBsTrpRS底物的典型tRNA的保守突变体。trp-tRNA可以携带一个氨基酸,或者处于非负载状态。还需要说明的是“trp-O-tRNA”还可以被同源的合成酶加载(氨酰化)上色氨酸之外的氨基酸,如氨基酸HTPP。本发明的trp-O-tRNA确实可用于将任何必需的氨基酸,无论是天然的或是人工合成的,插入到正在合成的多肽内,如翻译期间,以响应选择密码子。

本文所用的正交色氨酰-tRNA合成酶(O-TrpRS)是一种可以在目的翻译系统内用氨基酸优先氨酰化O-tRNA(如trp-O-tRNA)的合成酶。被O-TrpRS加载到O-tRNA上的氨基酸可以是任何氨基酸,无论是天然的还是人工合成的,不仅仅局限于本文所描述的。合成酶还可以与天然的色氨酰氨基酸合成酶相同或同源,或者与Val144ProBsTrpRS相同或同源。例如,O-TrpRS可以是肽SEQ ID No.:2、核酸SEQID No.:1所编码的肽的保守变体,和/或与SEQ ID.:2的O-RS或SEQ ID No.:1所编码的序列至少有50%、60%、70%、80%、90%、95%、98%、99%或更高的序列一致性。

术语“选择密码子”是指能被翻译系统内的O-tRNA识别但通常不被翻译系统内源性tRNA明显识别的密码子。O-tRNA反密码子环可识别mRNA上的选择密码子,从而将其氨基酸(优选氨酰化的非天然氨基酸)插入到肽内选择密码子所编码的位置上。选择密码子包括无意义密码子如终止密码子,以及琥珀密码子、赭石密码子和乳白密码子;四碱基或多碱基密码子;来源于天然或非天然碱基的密码子等。对于一个给定的系统来说,选择密码子还可以包含一个天然的三碱基密码子,其中翻译系统的内源性组分不能有效利用天然的三碱基密码子,如系统缺乏能识别天然三碱基密码子的tRNA或天然三碱基密码子是稀有密码子的系统。

本文所用的术语“正交”是指一个分子(如正交tRNA(O-tRNA)和/或正交氨酰tRNA合成酶(O-RS))的功能与细胞或翻译系统的内源性组分一样,但是其活性与细胞或翻译系统内的其相应的内源性分子相比下降,或者与细胞的内源性组分配对时不能发挥其功能。在用于tRNA和氨酰-tRNA合成酶时,正交的是指与合适的(如同源的或类似的)内源性tRNA和内源性互补的tRNA合成酶配对时的能力相比,正交的tRNA与内源性tRNA合成酶配对时无功能或其效率下降(如下降到20%、10%、5%或1%以下);或者与合适的内源性tRNA合成酶与内源性互补的tRNA配对时的能力相比,正交的氨酰-tRNA合成酶与内源性的tRNA配对后无功能或其效率下降(如下降到20%、10%、5%或1%以下)。正交分子缺乏细胞内内源性互补分子的正常功能。例如,与内源性的tRNA被内源性RS氨酰化相比,细胞内的正交tRNA被细胞的内源性RS氨酰化时其效率降低,甚至根本检测不到。在另外一个实施例中,与互补的内源性RS氨酰化内源性的tRNA相比,正交的RS在目的细胞内氨酰化任何内源性的tRNA时其效率降低,或者根本检测不到。第二正交分子可以被引入到细胞内和第一正交分子配合一起发挥功能。例如,正交tRNA/RS对包括引入的互补组分,在细胞内一起行使功能时其效率与对照,如相应的(如类似的)内源性tRNA/RS对或活性正交对(如色氨酰正交tRNA/RS对)相比可以达到45%、50%、60%、70%、75%、80%、90%、95%、99%或更高。“正交性的改善”是指与给定的起始组分相比正交性得以提高(如正交对的效率改善和/或与内源性的翻译组分配对时正交组分的效率下降)。

本文所用的术语“类似物”是指可提供类似功能但是来源于不同系统的组分。例如,芽孢杆菌tRNATrp和酵母tRNATrp可以发挥相同的功能,但是它们来源于不同的翻译系统。如本文所描述,生物系统的衍生(或人工)组分可以被认为是天然组分的类似物。

术语“衍生物”用于本文中是指来源于亲本化合物的化学(如生物)化合物,如通过与亲本化合物的化学反应或亲本化合物的突变,或者通过亲本化合物的合成形成修饰的形式(因而形成亲本化合物的化学类似物)。衍生物可以来源于亲本化合物的化学修饰,如化学基团的添加或去除,改变分子键的结构或改变离子状态。衍生的核酸或肽可能具有天然聚合的序列(如通过突变制备)和/或来自于经修饰的已知亲本序列的合成序列。本发明的衍生核酸或多肽可包括本文所描述的序列的功能性保守突变体。

术语“翻译系统”是指可以将氨基酸插入到正在合成的多肽链(如蛋白)上的必须组分。例如,翻译系统包括一整套内源性的翻译组分,如核糖体、tRNA、合成酶、mRNA等。本发明的正交组分(如O-tRNA、O-RS、编码选择密码子的核酸和/或非天然氨基酸)也可以加入到含有内源性组分的体外或体内翻译系统中,如非真核细胞如细菌(如大肠杆菌)或真核细胞如酵母细胞、哺乳动物细胞、植物细胞、藻类细胞、真菌细胞、昆虫细胞等翻译系统。

本文所用的术语“真核生物”是指属于真核生物域的有机体,如动物(如哺乳动物、昆虫、爬行动物、鸟类等)、纤毛虫、植物(如单子叶植物、双子叶植物、藻类等)、真菌、酵母、鞭毛虫、微孢子虫、原生生物等。

本文所用的术语“非真核生物”是指非真核有机体。例如,非真核有机体可能属于真细菌系统发育区(如大肠杆菌、嗜热栖杆菌、嗜热脂肪芽孢杆菌等)或古细菌(如詹氏甲烷球菌(Methanococcus jannaschii)(Mj)、马氏微球菌(Methanosarcinamazei)(Mm)、热自养甲烷球菌(Methanobacterium thermoautotrophicum)(Mt)、海沼甲烷球菌(Methanococcus maripaludis)、坎氏甲烷嗜热菌(Methanopyrus kandleri)、盐杆菌属如沃氏盐杆菌(Haloferax volcanii)和嗜盐菌NRC-1(Halobacterium speciesNRC-1)、闪烁古生球菌(Archaeoglobus fulgidus)(Af)、激烈火球菌(Pyrococcusfurious)(Pf)、超嗜热古菌(Ph)、超耐高温热棒菌(Pyrobaculum aerophilum)、火球菌(Pyrococcus abyssi)、硫磺矿硫化叶菌(Sulfolobus solfataricus)(Ss)、硫化叶菌(Sulfolobustokodaii)、Aeuropyrum pernix(Ap)、噬酸热原体(Thermoplasma acidophilum)、火山热原体(Thermoplasma volcanium)等)系统发育区。

术语“互补”用于指翻译系统的组分时是指能在一起发挥功能的组分。正交O-tRNA/O-RS对配合在一起可有效氨酰化O-tRNA,因此可被认为是一个互补对。

“抑制型tRNA”是一种可在给定的翻译系统内改变信使RNA(mRNA)的阅读的tRNA,例如通过将氨基酸插入到多肽链内以响应选择密码子的机制来改变mRNA的阅读。例如,抑制型tRNA可阅读过终止密码子、四碱基密码子、稀有密码子等。

如本文所述,术语“抑制活性”通常是指tRNA(如抑制型tRNA)在翻译过程中阅读过密码子(如为琥珀密码子或四碱基或多碱基密码子的选择密码子)的能力,如果阅读不过则翻译终止或产生错误翻译(如移码突变)。抑制型tRNA的抑制活性可以表达为与第二抑制型tRNA或对照系统如缺乏O-RS的对照系统相比所观察到的翻译通读活性的百分数。

如本文所描述,术语“编码”是指利用多聚大分子或序列符号串上的信息指导合成第二分子或序列符号串的过程,其中的第二分子或序列符号串与第一分子或序列符号串是不同的。如本文所描述,该术语的使用范围很宽,可用于许多方面。一方面,术语“编码”可用于描述DNA的半保留复制过程,其中双链DNA分子的一条链作为模板由DNA依赖的DNA聚合酶编码出新合成的一条互补姊妹链。

另一方面,术语“编码”是指利用一个分子上的信息指导合成化学性质与第一分子不同的第二分子的过程。例如,DNA分子编码一个RNA分子(如通过DNA依赖的RNA聚合酶参与的转录过程)。另外,RNA分子也可以编码多肽,比如在翻译过程中。当该术语用于描述翻译过程时,该术语也可以扩展到编码氨基酸的三联密码子。在某些方面,RNA分子也可编码DNA分子,比如通过RNA依赖的DNA聚合酶参与的反转录过程。在另一个方面,DNA分子可编码多肽,应当理解的是,在这种情况下,术语编码是指转录和翻译两个过程。

术语“同源”是指能联合发挥功能的组分,如正交tRNA和优先氨酰化同源正交tRNA的正交氨酰-tRNA合成酶;或者可被正交RS有效插入到肽内的同源非天然氨基酸/tRNA对。功能配对组分也被称为“互补的”。

如本文所描述,蛋白和/或蛋白序列是“同源的”是指它们天然的或人工的来源于共同的蛋白或蛋白序列起源。同样,核酸和/或核酸序列是同源的是指它们天然的或人工的来源于共同的核酸或核酸序列起源。例如,任何天然核酸都可以通过现有的各种突变方法加以修饰使其包含一个或多个选择密码子。当其表达时,这个突变的核酸可编码一个含一个或多个非天然氨基酸的多肽。当然,突变过程还可能改变一个或多个标准密码子,从而使所得到的突变蛋白内的一个或多个标准氨基酸发生改变。同源性一般是指两个或多个核酸或蛋白(或其序列)之间的相似性。两个序列之间相似性的准确百分数可用于描述组织内核酸和蛋白的同源性,一般来说,如果有25%的序列一致性就可以确立同源性了。更高水平的序列一致性如30%、40%、50%、60%、70%、80%、90%、95%、99%或更高也可用于确立同源性。确立序列一致性百分率的方法(如使用默认参数的BLASTP和BLASTN)在本文中作了描述,通常都可以被使用。

本文所用的术语“来源于”是指从特定分子或有机体、或者特定分子或有机体的序列信息中分离的组分,或者利用特定分子或有机体、或者特定分子或有机体的信息制备的组分。

术语“保守变体”是指一个翻译组分,如保守突变的O-tRNA或保守突变的O-RS,其功能特性与保守变体来源的组分相似,但是其序列有变化。例如,O-RS可用非天然氨基酸如5-HTPP氨酰化互补的O-tRNA或保守突变的O-tRNA,但是O-tRNA和保守突变的O-tRNA在序列上是有差异的。保守变体在序列上可能含有一个、两个、三个、四个、五个或更多个突变,只要保守变体与相应的O-tRNA或O-RS配对(保持互补)时能够发挥正常功能。表1所列的就是氨基酸序列的典型保守变体。

本文所用的术语“非天然氨基酸”是指大多数生命系统中的蛋白质在正常情况下所掺入的20种天然氨基酸之外的氨基酸,或稀有天然氨基酸、硒氨酸或吡咯赖氨酸。“非天然氨基酸”是指下列20个遗传密码编码的α氨基酸之外的所有氨基酸、修饰氨基酸或氨基酸类似物:丙氨酸、精氨酸、天冬酰胺、天冬氨酸、半胱氨酸、谷氨酰胺、谷氨酸、甘氨酸、组氨酸、异亮氨酸、亮氨酸、赖氨酸、蛋氨酸、苯丙氨酸、脯氨酸、丝氨酸、苏氨酸、色氨酸、酪氨酸和缬氨酸。α氨基酸的通用结构可用结构式I表示:

非天然氨基酸一般都具有结构式I的结构,其中R基团代表20个天然氨基酸使用的基团之外的任何取代侧链基团。可参见任何生物化学教材,如L.Stryer编的《生物化学》(Biochemistry)(第三版,1988,Freeman and Company,New York)以了解20个天然氨基酸的结构。需要注意的是,本发明的非天然氨基酸也可以是上述20个α氨基酸之外的天然化合物。由于本发明的非天然氨基酸与天然氨基酸之间的不同之处通常只是在于侧链,因此非天然氨基酸也可以其他氨基酸,天然的或非天然的,形成酰胺键,形成的方式与天然蛋白中的酰胺键一样。但是,非天然氨基酸含有将其与天然氨基酸区别开来的侧链基团。例如,结构式I中的R基团可以是不常见的烷基、芳基、酰基、酮基、叠氮基、羟基、肼、腈基、卤素、酰肼、烯基、炔基、醚、巯醇、硒基、磺酰基、硼酸基、磷酸基、磷、杂环、烯酮、亚胺、醛、酯、硫代酸、羟胺、胺等,或上述基团的混合物。我们感兴趣的其他非天然氨基酸包括而不限于含光活化交联物的氨基酸、自旋-标记的氨基酸、荧光标记的氨基酸、金属结合的氨基酸、含金属的氨基酸、放射性氨基酸、含有新功能团的氨基酸、与其他分子共价或非共价结合的氨基酸、光陷阱(photocaged)和/或可感光异构的(photoisomerizable)氨基酸、含生物素或生物素类似物的氨基酸、糖基化的氨基酸如糖取代的丝氨酸、其他糖链修饰的氨基酸、含酮的氨基酸、含聚乙二醇或聚醚的氨基酸、重原子取代氨基酸、可化学裂解或光裂解的氨基酸、与天然氨基酸相比侧链延长的氨基酸(如超过约5个、约10个碳原子的聚醚或长链烃)、含碳连接糖的氨基酸、具有氧化还原活性的氨基酸、含氨基硫代酸的氨基酸、以及含一个或多个毒性基序的氨基酸。本发明典型的优选非天然氨基酸包括色氨酸衍生物如5-羟基-L-色氨酸(5-HTPP)。

本文所用的术语“构建物”是指包含合成的和/或重组的目的序列的核酸构建物。本发明的构建物包括编码正交氨酰-tRNA合成酶、正交tRNA和/或含选择密码子的肽编码序列的核酸序列。构建物也可以包含其他序列,如转录和翻译终止子、转录和翻译起始序列、侧翼序列和/或用于调节表达的启动子等。构建物还可以包含用于鉴定和纯化转录产物的标记物和/或标记编码序列。本发明的构建物可以是质粒的形式,其中包含可在体内和/或体外转录和/或翻译的序列。

本文所用的术语“导入”用于本发明的构建物时通常是指本领域已知的可将本发明的遗传构建物功能性地插入到活细胞内以复制、转录、翻译和/或表达的任何方式。例如,将构建物导入到细胞内包括转化、转导、转染、电穿孔等。

                            附图简述

图1是一个直方图,描述的是枯草芽孢杆菌色氨酸乳白抑制型tRNA(SEQ ID NO:4)的四叶苜蓿型结构。箭头指的是序列内引入的突变。上面的框指的是从本发明的mutRNAUCATrp(SEQ ID NO.3)的受体臂上删除的CCA序列。

图2显示的是从转染pTrptRNA的293T细胞内获得的mutRNAUCATrp的表达水平和RNA印迹分析结果。图2A显示的是从大肠杆菌(1道)、牛肝(2道)、293T细胞(3道)和转染pTrptRNA质粒的293T细胞(4道)中分离的纯化总tRNA的3%琼脂糖凝胶电泳图。图2B显示的是从大肠杆菌(1道)、牛肝(2道)、293T细胞(3道)和转染pTrptRNA质粒的293T细胞(4道)中分离的纯化总tRNA分别点到膜上并与mutRNAUCATrp的27-44位核苷酸互补的5’-32P标记的寡核苷酸探针杂交后的点杂交图。

图3显示的是用于检测293T细胞内的乳白型抑制的蛋白印迹分析结果。来自于TGA68foldon构建物转染细胞的裂解物显示在1道。来自于野生型foldon构建物转染细胞的裂解物显示在5道作为阳性对照。在缺少乳白抑制型tRNATrp(2道)或BsTrpRS(3道)的情况下,用抗V5抗体通过蛋白印迹分析没有检测到全长蛋白的表达。在乳白抑制型tRNATrp和BsTrpRS都存在的情况下,TGA68foldon构建物内的乳白抑制子被抑制,全长foldon蛋白得以表达(4道)。

图4显示的是利用蛋白印迹分析293T细胞内5-HTPP掺入到foldon蛋白内的水平。含V5标记的野生型BsTrpRS在293T细胞内得以表达(1道)。在没有5-HTPP、mutRNAUCATrp或Val144ProBsTrpRS的情况下,TGA68foldon构建物不翻译全长蛋白(2-4道)。如果存在5-HTPP、Val144ProBsTrpRS和mutRNAUCATrp,则用抗V5抗体通过蛋白印迹分析可以检测到全长乳白突变型foldon蛋白的表达(5道)。

图5显示的是利用Macromodel(8.1版,Schrodinger,LLC.)进行计算机模拟所得到的TrpRS与其底物所形成的复合物的模拟图。氢键用点线(-------)表示。左边的结构说明的是野生型枯草芽孢杆菌TrpRS与其同源底物色氨酸-5’AMP的连接,其中包括吲哚NH基团和Asp133之间形成的氢键。右边的结构说明的是Val144ProBsTrpRS与其底物5-HTPP-5’AMP之间形成的复合物。其中需要注意的是吲哚NH基团和Asp133之间的氢键消失,而5-OH与His44、Asp133之间、吲哚NH和Ser7之间形成新的氢键。

图6显示的是野生型foldon蛋白(—)和HTPP68突变蛋白(……)在用310nm的激发光激发时产生的荧光光谱。

图7显示的是电化学蛋白交联的直方图。图7Al显示的是氧化的5-HTPP分子的二聚化产物;图7A2显示的是氧化的5-HTPP和半胱氨酸之间反应产物。图7B显示的是用5-HTPP氧化交联的蛋白的SDS-PAGE分析结果。蛋白用4-20%梯度SDS-PAGE分离,考马斯染色。1道和3道分别为纯化的HTPP68foldon和野生型foldon蛋白。2道是HTPP68foldon的交联产物,4道是野生型foldon蛋白的交联产物。没有检测到野生型foldon的交联产物,野生型foldon蛋白单体的分子量为14.5kDa。HTPP68foldon交联后可形成一个二聚物,分子量为29kDa。

                            详细描述

为了在翻译过程中将非天然氨基酸如5-羟基-L-色氨酸(5-HTPP)插入到肽内,如本文所描述,可以利用能发挥正常功能的氨酰-tRNA合成酶和tRNA的正交对。该正交对在目的翻译系统内不依赖翻译系统内源性的合成酶和tRNA就可行使功能。我们希望正交对所具有的特性包括tRNA只能解码或识别一个特异性的新密码(如选择密码子),该密码不被任何内源性的tRNA所解码,氨酰-tRNA合成酶只用特异性的非天然氨基酸如5-HTPP优先氨酰化(或加载)其tRNA。正交tRNA(O-tRNA)也不能被翻译系统内源性的合成酶有效氨酰化。例如,在大肠杆菌翻译系统内,一个正交对包含一个基本不能氨酰化任何内源性tRNA的氨酰tRNA合成酶和一个基本不能被任何内源性合成酶氨酰化的正交tRNA,在大肠杆菌内,内源性的tRNA有40种,内源性的氨酰tRNA合成酶有21种。

在本文中我们报道了新型合成酶/tRNA正交对的制备方法,该正交对包括正交色氨酰-tRNA合成酶、突变的正交色氨酰-tRNA合成酶(O-muTrpRS)和/或其衍生物,能将氨基酸或非天然氨基酸(如色氨酸衍生物)掺入到肽内。本发明包括将核酸构建物制备物导入到细胞内的方法,其中O-tRNA优先被O-muTrpRS用氨基酸氨酰化,从而将氨基酸掺入到肽内。

在一个典型实施方式中,突变的tRNA乳白抑制子和突变的色氨酰-tRNA合成酶正交对(O-tRNA/O-RS对)从理论上说可以被构建出来,然后可以检测其在哺乳动物系统内在翻译过程中特异性加载并在肽内掺入5-羟色氨酸(5-HTPP)的能力。O-tRNA可通过构建具有乳白突变反密码环的枯草芽孢杆菌突变tRNATrp来提供。O-RS可通过筛选枯草芽孢杆菌突变的色氨酰-tRNA合成酶来获得,其中突变的合成酶含有位点定向突变,在可能导致无法有效利用加载有5-HTPP的tRNA的位置上有19个氨基酸发生改变。哺乳动物细胞内的O-tRNA/O-RS对在含5-HTPP的培养基中可将5-HTPP特异性地插入到TGA(终止密码)密码子所编码的位置上。

含正交翻译组分的组合物

一般来说,本发明的组合物包括含正交tRNA(O-tRNA)和正交色氨酰tRNA合成酶(O-TrpRS)的翻译系统,其中的合成酶用氨基酸优先加载O-tRNA,从而将氨基酸插入到肽内的选择密码子所编码的位置上。另外,合成酶可以是突变的正交色氨酰-tRNA合成酶,该合成酶经特异性地改造和/或筛选后可用特殊的非天然氨基酸如5-HTPP加载O-tRNA。

本发明的正交翻译系统组分一般都是内源性组分的类似物,如突变组分和/或外源细胞来源的组分,这些组分不依赖内源性的目的翻译系统就可以完成某些翻译功能。正交翻译组分利用某些内源性的翻译系统组分其运行效率通常都会降低或者不能发挥功能。但是,互补的正交组分如O-RS/O-tRNA对(正交对)可与内源性翻译系统一起发挥正常功能,可以成功参与序列的翻译。例如,正交对可作为翻译系统的一部分将特殊的氨基酸有效地插入到正在延伸的肽链内特殊的选择密码子所编码的位置上。

本发明的特征是细胞或其他翻译系统内有多种O-tRNA/O-RS对,因此可以掺入不止一个非天然氨基酸,如5-HTPP和其他非天然氨基酸。例如,细胞内可包含本发明的正交对和其他不同的O-tRNA/O-RS对以及第二种非天然氨基酸,其中这个附加的O-tRNA可识别第二选择密码子,这个附加的O-RS优先用第二种非天然氨基酸氨酰化O-tRNA。例如,包含O-tRNA/O-RS对(其中的O-tRNA识别乳白选择密码子)的细胞还可以包含第二种正交对,如亮氨酰、赖氨酰、谷氨酰等(其中的第二种O-tRNA可识别不同的选择密码子,如琥珀型密码子、四碱基密码子、稀有密码子等)。

正交色氨酰-tRNA合成酶

本发明的正交氨酰-tRNA合成酶(O-RS)包括正交色氨酰-tRNA合成酶(来源于外源系统的基本未经修饰的RS)、突变的正交色氨酰-tRNA合成酶(O-muTrpRS,如通过突变而被修饰的内源性或外源RS)和/或其衍生物。本发明的O-RS可用氨基酸加载tRNA用于将氨基酸插入到肽内,其插入的位置是内源性的翻译系统在正常情况下无法利用的。在一个典型的实施方式中,O-RS是可以利用非天然氨基酸如5-HTPP加载tRNA的O-muTrpRS。因此非天然氨基酸可以被翻译系统插入到正在延伸的肽链内tRNA反密码子所编码的位置上。在另一个实施方式中,O-TrpRS或O-muTrpRS可用氨基酸加载正交tRNA(O-tRNA)。O-tRNA可包含与选择密码子或编码异常氨基酸的其他密码子互补的反密码子,这样氨基酸就可以被插入到正在延伸的肽链内在正常翻译中无法达到的位置上。在一个优选实施方式中,本发明的O-RS优先用非天然氨基酸氨酰化O-tRNA。在一个更优选的实施方式中,非天然氨基酸是色氨酸的类似物(如衍生物)。

本发明的正交氨酰-tRNA合成酶被证明可优先用非天然氨基酸氨酰化O-tRNA。本发明的O-TrpRS或O-muTrpR可优先用一种氨基酸而不是另一种加载tRNA。例如,作为用同源氨基酸加载tRNA的天然RS的突变形式而构建的O-muTrpRS可用与起始同源氨基酸不同的氨基酸来优先加载tRNA。本发明的O-RS可用与起始同源氨基酸不同的氨基酸来优先加载tRNA,其比例大于约1∶1、约2∶1、约4∶1、约5∶1、约20∶1、约100∶1或更高。本发明的O-RS用天然或非天氨基酸优先氨酰化(加载)O-tRNA而不是内源性的(如类似的)tRNA。例如,如果O-tRNA是内源性tRNA的突变形式,那么本发明的O-RS加载O-tRNA与tRNA的比例超过约1∶1、约2∶1、约4∶1、约5∶1、约20∶1、约100∶1或更高。

本发明的O-RS的活性足以提供有用量的转录产物。在一个优选实施方式中,O-RS是有活性的,因为O-RS将其同源氨基酸加载到其配对(互补)O-tRNA上的速率就代表了翻译系统中内源性RS/tRNA对的典型速率。例如,本发明的正交对(O-RS/O-tRNA)用其同源氨基酸(可以是非天然的,如5-HTPP)加载O-tRNA的活性约为翻译系统中内源性(可以是类似的)RS活性的约1%、约5%、约10%、约25%、约50%、约80%、约90%、约100%或更高。在另一方面,目的翻译系统中本发明的O-RS氨酰化任何内源性的tRNA时与同源的内源性RS氨酰化内源性tRNA相比其效率下降,甚至为0。在许多情况下,本发明的O-RS能够用非天然氨基酸氨酰化同源tRNA,但是在用天然氨基酸氨酰化tRNA时其效率相对下降。本发明的这种O-RS具有改进的或增强的酶催化活性,例如与天然氨基酸如20种已知氨基酸之一相比其对非天然氨基酸的Km较低,kcat较高,kcat/Km值较高。这可以被认为是O-RS优先氨酰化tRNA。kcat和Km值可以计算出来,例如通过非线性抑制分析来直接套用Michaelis-Menton公式,该方法是本领域熟知的。

本发明的O-RS和正交对可以可靠地将其同源氨基酸(可以是非天然的,如5-HTPP)插入到正在延伸的肽链内。O-RS和正交对可以高精度将其同源氨基酸正确地插入到正在延伸的肽链内。例如,同源氨基酸如5-HTPP可被插入到肽链内相关tRNA(如O-tRNA)反密码子所确定的位置上,其保真度超过70%,约90%、约95%、约97%、约99%或者基本达到100%的保真度。本发明的O-RS和正交对可以可靠地将天然或非天然氨基酸插入到其他氨基酸的密码子相应的位置上,或者将天然或非天然氨基酸插入到选择密码子(如终止密码子或四碱基密码子)相应的位置上。

在一个优选实施方式中,本发明的O-RS是突变的色氨酰-tRNA合成酶(O-muTrpRS)。O-muTrpRS可以是:目的翻译系统内源性的色氨酰-tRNA合成酶(TrpRS)修饰版本,来源于外源翻译系统(不同的界、族、属或种)的经修饰(或突变)的TrpRS,经突变并筛选其与目的天然氨基酸或非天然氨基酸活性的TrpRS,经突变并筛选其与目的tRNA或O-tRNA活性的TrpRS,基于结构(结晶学)数据而确定的位置上发生突变(如通过位点定向突变)的TrpRS,和/或其衍生物。在一个更优选的实施方式中,O-muTrpRS可以是经突变后可用色氨酸类似物优先氨酰化tRNA的外源TrpRS。在一个更优选的实施方式种,O-muTrpRS可以是在靠近约144位残基的区域内缬氨酸密码子发生突变的芽孢杆菌TrpRS。在一个更优选的实施方式中,O-muTrpRS具有氨基酸序列SEQ ID NO:2(Val144ProBsTrpRS氨基酸序列)或其保守取代序列。在一个更优选的实施方式中,O-muTrpRS具有核酸序列SEQ ID NO:1(编码Val144ProBsTrpRS的核酸序列)或其保守突变体编码的氨基酸序列。例如,残基144上缬氨酸密码子的头两个碱基可从“GT”突变成“CC”使其在残基144上编码脯氨酸。在一个更优选的实施方式中,O-muTrpRS可以是发生Val144Pro突变的枯草芽孢杆菌TrpRS,用于将5-羟基-L-色氨酸掺入到哺乳动物翻译系统内。

正交tRNA

本发明的正交tRNA(O-tRNA)可被翻译系统的内源性氨酰-tRNA合成酶加载,但其效率下降,也可以被本发明的同源O-RS用天然或非天然氨基酸有效加载。在一个典型的实施方式中,O-tRNA可被O-RS用非天然氨基酸加载。加载在O-tRNA上的非天然氨基酸可被翻译系统插入到正在延伸的肽链内O-tRNA反密码子编码的位置上。在另一个实施方式中,本发明的O-tRNA可被内源性的RS用天然或非天然氨基酸加载,从而为正在延伸的肽链内O-tRNA反密码子相应的特殊位置提供氨基酸。在一个优选实施方式中,本发明O-tRNA可被本发明的O-RS用非天然氨基酸如5-HTPP优先氨酰化。

转运核糖核酸(tRNA)一般都具有D臂10、反密码环11、C臂12和受体臂13,如图1所示。tRNA上的碱基A、U、G和C(腺嘌呤、尿嘧啶、鸟嘌呤和胞嘧啶)根据其同源氨基酸、其存在的细胞类型、突变、基因操作等的不同而不同。tRNA序列重要的部分是反密码环及其相关的反密码子14,反密码子与信使RNA(mRNA)上的互补密码子结合,在转录过程中为正在延伸的肽链提供合适的氨基酸。由于共有4种碱基,而每个密码子含3个碱基,因此总共有64种可能的三联密码子来定义20种天然氨基酸。64种三联密码子中有3个(mRNA上的UUA、CUA和UCA;是DNA上TAA、TAG和TGA的相应转录子)来定义翻译的终止,正常情况下不用于编码氨基酸。含有与终止密码子互补的反密码子的抑制型tRNA可在终止位置上提供氨基酸,已知这种情况也可能自然发生。在本发明的一个方面,O-tRNA包含一个与终止密码子互补的反密码子,因此可将氨基酸插入到正在延伸的肽链内终止密码子相应的位置上。

本发明包括本文所描述的特定O-tRNA相应的O-tRNA保守变体。例如,O-tRNA的保守变体包括具有序列SEQ ID NO:3的O-tRNA功能相似的那些分子,以及通过适当的自身互补能保持tRNA L型结构的那些分子,但是其序列与图、表中所列的以及本文实施例所描述的序列不完全一致(以及,最好是有别于野生型tRNA分子)。参见下面的“保守变体”部分。本发明的O-tRNA包括人工多核苷酸,如与天然tRNA序列至少有75%,、80%、90%、95%、98%或更高序列一致性的tRNA(但是不是天然tRNA),以及列表中的或本文实施例所描述的任何tRNA。

本发明的O-tRNA还可以包含其他的各种反密码子。O-tRNA可以包含在正常情况下为一种氨基酸所使用但是也可以被另一种氨基酸加载的反密码子。O-tRNA可以包含与3个以上碱基的密码子互补的反密码子,如4碱基密码子或5碱基密码子。O-tRNA可以包含有非天然碱基的反密码子或与含非天然碱基的密码子互补的反密码子。选择密码子可以是加长的密码子,例如4碱基或多碱基密码子,如4、5、6或多碱基密码子。四碱基密码子的例子包括AGGA、CUAG、UAGA、CCCU等。五碱基密码子的例子有AGGAC、CCCCU、CCCUC、CUAGA、CUACU、UAGGC等。本发明的方法包括根据移码抑制来使用加长的密码子。四碱基或多碱基密码子可用于将一个或多个非天然氨基酸如5-HTPP插入到同一个蛋白内。在其他的实施方式中,反密码环可解码至少一个四碱基密码子、至少一个五碱基密码子、至少一个六碱基密码子或多碱基密码子。由于有256个可能的四碱基密码子,因此利用四碱基密码子或多碱基密码子可以在同一个细胞内编码多种非天然氨基酸。见Anderson等,(2002)Exploring the Limits of Codon and Anticodon Size,Chemistry and Biology,9:237-244;以及Magliery,(2001)Expanding the Genetic Code:Selection of EfficientSuppressors of Four-base Codons and Identification of“Shifty”Four-base Codons with aLibrary Approach in Escherichia coli,J.Mo1.Biol.307:755-769。

选择密码子还包括非天然碱基对。这些非天然碱基对进一步扩充了现有的遗传密码表。例如,一个额外的功能性碱基对就可以将三联密码子的数目从64个增加到125个。第三碱基对的特性包括稳定而特异的碱基配对、可以被聚合酶高保真地插入到DNA内、以及在起始非天然碱基对合成以后可进一步延伸引物。可用于本发明的方法和组合物中的非天然碱基对描述于Hirao等,(2002)An unnatural base pair forincorporating amino acid analogues into protein,Nature Biotechnology,20:177-182。参见Wu,Y.等,(2002)J.Am.Chem.Soc.124:14626-14630。对于体内应用来说,非天然核苷一般是可以穿透膜的,可被磷酸化形成相应的三磷酸盐。

在一个优选实施方式中,本发明的O-tRNA是突变的抑制型tRNA,含有UCA、UUA或CUA反密码子,分别与mRNA上的UGA、UAA和UGA互补。在一个更优选的实施方式中,O-tRNA是正交色氨酸加载的tRNA(O-tRNATrp)或正交突变的tRNA(O-mutRNATTrp),能被天然氨基酸(如色氨酸)或非天然氨基酸(如5-HTPP)特异性地加载。在一个更优选的实施方式中,O-tRNA是正交抑制型突变tRNA,如正交突变的乳白抑制型tRNA,能被非天然氨基酸加载(如mutRNAUCATrp),含有与UGA终止选择密码子互补的反密码子。

本发明的典型O-tRNA作为功能性互补正交对的成员优先被O-RS氨酰化。例如,作为正交对的一个成员,O-tRNA基本上不被目的翻译系统中的内源性RS氨酰化,O-tRNA优先加载同源的天然或非天然目的氨基酸,优先被基本不用同源氨基酸加载其他tRNA的同源O-RS对成员加载。例如,正交tRNA与内源性RS配对进行氨酰化反应的效率只有与互补的O-RS配对进行氨酰化反应的效率的不到20%、10%、5%或1%。

在本发明的一个方面,正交对可以是来源于原核翻译系统并被用于添加到真核翻译系统中的O-tRNA和O-RS突变体,其中O-tRNA优先被O-RS用非天然氨基酸氨酰化,用于将氨基酸插入到正在延伸的肽链内。在一个优选实施方式中,O-tRNA来源于芽孢杆菌翻译系统,与芽孢杆菌翻译系统来源的突变型O-RS配对。在一个更优选的实施方式中,O-tRNA是芽孢杆菌翻译系统来源的突变型tRNATrp,O-RS是突变的芽孢杆菌RS,可优先用非天然氨基酸如5-HTPP加载O-tRNA。

非天然氨基酸插入到产物肽内

本发明的组合物可用于本发明的方法中将天然和/或非天然氨基酸插入到正在延伸的肽链内。本发明的非天然氨基酸可以是本领域熟知的20种天然氨基酸之外的任何氨基酸。非天然氨基酸可被掺入到各种治疗性、诊断性和工业用蛋白内使其具有良好的特性。

本发明的非天然氨基酸包括天然化合物、合成化合物和/或经修饰的天然化合物。例如,20种常见的α氨基酸之外的天然氨基酸、硒氨酸和吡咯赖氨酸可以被认为是本发明的非天然氨基酸。本发明的非天然氨基酸通常由于侧链基团的修饰而与天然氨基酸不同。非天然氨基酸通常都可以与其他氨基酸,天然的或非天然色,形成酰胺键,形成的方式与天然蛋白中的酰胺键一样。在一个优选实施方式中,天然氨基酸上的化学活性基团可与反应性分子发生反应从而将额外的化学基团连接到天然氨基酸侧链上形成非天然氨基酸。在本发明的一个方面,非天然氨基酸是通过添加化学基团来修饰天然氨基酸而形成的,如烷基-、芳基-、酰基-、酮基-、叠氮基-、羟基-、肼、腈基-、卤素-、酰肼、烯基、炔基、醚、巯醇、硒基-、磺酰基-、硼酸基、boronate、磷酸基、磷、亚磷基、三氢化磷、杂环、烯酮、亚胺、醛、酯、硫代酸、羟胺、氨基等。

在另一方面,本发明的非天然氨基酸可以被掺入到蛋白内使其具有新的特性。非天然氨基酸可提供新的化学特性、抗原性的改变、交联位点、光吸收特性的改变、荧光特性的改变、报告基团等。例如,可将化学基团添加到荧光氨基酸上以改变其激发特性、发射特性和/或发射密度。例如,将羟基添加到色氨酸上形成5-羟基-L-色氨酸(5-HTPP)可以使最大发射波长明显偏移,因此可用于含5-HTPP的蛋白探针中。化学基团如荧光化学基团可以被添加到基本无荧光特性的氨基酸上从而为这个经修饰的非天然氨基酸提供荧光信号。活性基团被添加到天然氨基酸上形成含侧链的非天然氨基酸,可以提供交联位点用于和常见的交联子发生交联反应,如羟基琥珀酰亚胺交联子(与伯胺反应)、马来酰亚胺交联子、卤代乙酰基、二硫吡啶(与巯基(sulfhydral group)反应)、肼交联子(与醛反应)和/或乙基二乙基胺丙基碳化二亚胺(EDC,与羧基反应)。在本发明的一个方面,非天然氨基酸可以是氧化还原反应可控的连接子,如在特定电压电位和pH范围内活化。例如,掺入有5-HTPP的蛋白质可在约pH7.4、800mV电位的溶液中与其他反应性分子反应。在一个优选的实施方式中,其他反应性分子是掺入有5-HTPP的其他蛋白质,反应的结果是蛋白之间发生交联,如二聚化。

本发明的肽产物(如全蛋白质)通常都是治疗性蛋白、诊断蛋白和/或工业用蛋白的衍生物。肽产物与目的蛋白至少有60%、70%、75%、80%、90%、95%、99%或更高的一致性,其中包含一个或多个非天然氨基酸。可被修饰使其包含一个或多个5-HTPP的治疗性蛋白、诊断蛋白、工业用蛋白以及其他蛋白可在下列文献中找到,但是又不仅仅局限于这些文献:题为“扩充真核遗传密码”(Expanding the EukaryoticGenetic Code)的USSN 60/479,931和60/496,548;以及WO 2002/085923,题为“非天然氨基酸的体内掺入”(In Vivo Incorporation of Unnatural Amino Acids)。可被修饰使其包含一个或多个5-HTPP残基的治疗性蛋白、诊断蛋白、工业用蛋白以及其他蛋白包括而不限于α-1抗胰蛋白酶、血管他丁、抗溶血因子、抗体、载脂蛋白、脱辅基蛋白、心房利钠因子、心房利钠多肽、心房肽、C-X-C趋化因子(如T39765、NAP-2、ENA-78、Gro-a、Gro-b、Gro-c、IP-10、GCP-2、NAP-4、SDF-1、PF4、MIG)、降钙素、CC趋化因子(如单核细胞趋化蛋白-1、单核细胞趋化蛋白-2、单核细胞趋化蛋白-3、单核细胞炎症蛋白-1α、单核细胞炎症蛋白-1β、RANTES、1309、R83915、R91733、HCC1、T58847、D31065、T64262)、CD40配基、C-kit配基、胶原蛋白、集落刺激因子(CSF)、补体因子5a、补体抑制因子、补体受体1、细胞因子(如上皮细胞中性粒细胞活化肽-78、GROα/MGSA、GROβ、GROγ、MIP-1α、MIP-1δ、MCP-1)、表皮生长因子(EGF)、红细胞生成素(EPO)、剥脱毒素A和B、因子IX、因子VII、因子VIII、因子X、成纤维细胞生长因子(FGF)、纤维蛋白原、纤溶酶、G-CSF、GM-CSF、葡萄糖脑苷脂酶、绒毛膜促性腺激素、生长因子、Hedgehog蛋白(如Sonic、Indian、Desert)、血红素、肝细胞生长因子(HGF)、水蛭素、人血清白蛋白、胰岛素、胰岛素样生长因子(IGF)、干扰素(如IFN-α、IFN-β、IFN-γ)、白细胞介素(如IL-1、IL-2、IL-3、IL-4、IL-5、IL-6、IL-7、IL-8、IL-9、IL-10、IL-11、IL-12等)、角质化细胞生长因子(KGF)、乳铁蛋白、白血病抑制因子、荧光素酶、Neurturin、中性粒细胞抑制因子(NIF)、抑瘤素M、骨形成蛋白、甲状旁腺激素、PD-ECSF、PDGF、肽类激素(如人生长激素)、多效营养因子、蛋白A、蛋白G、发热外毒素A、B和C、松弛素、肾素、SCF、可溶性补体受体1、可溶性I-CAM1、可溶性白细胞介素受体(IL-1、2、3、4、5、6、7、9、10、11、12、13、14、15)、可溶性TNF受体、生长调节素、生长抑素、生长激素、链激酶、超抗原即葡萄球菌肠毒素(SEA、SEB、SEC1、SEC2、SEC3、SED、SEE)、超氧化物歧化酶(SOD)、中毒性休克综合征毒素(TSST-1)、胸腺激素α1、组织纤溶酶原激活因子、肿瘤坏死因子β(TNFβ)、肿瘤坏死因子受体(TNFR)、肿瘤坏死因子-α(TNFα)、血管内皮生长因子(VEGEF)、尿激酶等。

可以利用本发明的组合物和方法在体内制备出的含5-HTPP的一类蛋白质是转录调节因子或其片段。转录调节因子的例子包括能调节细胞生长、分化、调控等的基因和转录调节蛋白。转录调节因子存在于原核细胞、病毒和真核生物如真菌、植物、酵母、昆虫和动物如哺乳动物,提供了一个大范围的治疗靶位。应当理解的是表达和转录活化因子调节转录的机制有很多,如与受体结合、刺激信号转导级联反应、调节转录因子的表达、与启动子和增强子结合、与启动子和增强子结合的蛋白结合、解链DNA、剪接mRNA前体、多聚腺苷酸化RNA和降解RNA。

本发明的一类肽产物(如通过掺入一个或多个非天然氨基酸如5-HTPP或其他色氨酸衍生物残基而被修饰的蛋白质)包括表达活化因子,包括细胞因子、炎症分子、生长因子及其受体、以及癌基因产物,如白细胞介素(如IL-1、IL-2、IL-8等)、干扰素、FGF、IGF-I、IGF-II、FGF、PDGF、TNF、TGF-α、TGF-β、EGF、KGF、SCF/c-Kit、CD40L/CD40、VLA-4/VCAM-1、ICAM-1/LFA-1和hyalurin/CD44;信号转导分子及其相应的癌基因产物,如Mos、Ras、Raf和Met;以及转录活化因子和抑制因子,如p53、Tat、Fos、Myc、Jun、Myb、Rel,以及类固醇激素受体,如雌激素、孕酮、睾丸酮、醛固酮、LDL受体的配基和皮质酮的受体。

本发明还提供了至少携带一个5-HTPP或其他色氨酸衍生物残基的酶(如工业用酶或医用酶)或其片段。酶的例子包括而不限于酰胺酶、氨基酸消旋酶、酰基转移酶、脱氢酶、二氧合酶、二芳基丙烷过氧化物酶、表位酶、环氧化物水解酶、酯酶、异构酶、激酶、葡萄糖异构酶、糖苷酶、葡萄糖酰基转移酶、卤素过氧化物酶、单假氧酶(如p450)、脂肪酶、木素过氧化物酶、腈水合酶、腈水解酶、蛋白酶、磷酸酯酶、枯草杆菌蛋白酶、转氨酶和核酶。

这些蛋白中有许多是可以从公司购买到的(见Sigma BioSciences 2003年的产品目录和价目表),其相应的蛋白序列和基因及其变体通常都是已知的(见Genbank)。它们都可以按照本发明的方法通过插入一个或多个本发明相应的异常氨基酸或色氨酸衍生物来加以修饰,例如改变蛋白质的一种或多种治疗、诊断或酶催化特性。与治疗相关的特性包括药代动力学特性、血清半衰期、保存半衰期、稳定性、免疫原性、治疗活性、可检测性(如通过在非天然氨基酸如5-HTPP上插入报告基团(如标记物或标记物结合位点))、LD50或其他负效应的降低、通过胃肠道进入体内的能力(如口服利用度)等。诊断特性包括保存半衰期、稳定性、诊断活性、可检测性等。相关的酶催化特性包括保存半衰期、稳定性、热耐受性、酶活性、生产能力等。

其他的多种蛋白也可加以修饰使其包含一个或多个本发明的非天然氨基酸。例如,本发明包括在一种或多种疫苗蛋白上用5-HTPP取代一个或多个天然氨基酸,这些蛋白来自于感染性真菌,如曲霉属、念珠菌属的真菌;细菌,特别是大肠杆菌,可以作为致病菌的模型,和医学上有重要影响的细菌如葡萄球菌属(如金黄色葡萄糖球菌)或链球菌属(如肺炎链球菌)的细菌;原虫如孢子虫(如刚地弓形虫)、根足虫(如内阿米巴原虫)和鞭毛虫(锥形虫、利什曼原虫、毛滴虫、鞭毛虫等);病毒如(+)RNA病毒(例子包括痘病毒类如痘苗病毒;细小核糖核酸病毒如脊髓灰质炎病毒;披膜病毒如风疹病毒;黄病毒如HCV;以及冠状病毒),(-)RNA病毒(如弹状病毒如VSV;副黏液病毒如RSV;正粘病毒如流感病毒;布亚病毒;以及沙粒病毒),dsDNA病毒(如呼肠孤病毒),RNA到DNA的病毒,即逆转录病毒如HIV和HTLV,以及某些DNA到RNA的病毒如乙肝病毒。

与农业有关的蛋白质如昆虫抗性蛋白(如Cry蛋白)、淀粉和脂质生成酶、植物和昆虫毒素、毒素抗性蛋白、霉菌毒素解毒蛋白、植物生长酶(如核酮糖1,5-二磷酸羧化酶/氧合酶,″RUBISCO″)、脂肪加氧酶(LOX)、以及磷酸烯醇丙酮酸(PEP)羧化酶也是用本发明的非天然氨基酸修饰的适宜靶位。

来源和宿主有机体

本发明的正交翻译组分一般来源于非真核有机体。例如,O-tRNA可来源于非真核有机体(或有机体混合物),例如古细菌,如詹氏甲烷球菌、热自养甲烷球菌,嗜盐菌如沃氏盐杆菌和盐杆菌NRC-1,闪烁古生球菌,激烈火球菌,超嗜热古菌,Aeuropyrum pernix,海沼甲烷球菌,坎氏甲烷嗜热菌,马氏微球菌(Mm),超耐高温热棒菌,火球菌(Pyrococcus abyssi),硫磺矿硫化叶菌(Ss),硫化叶菌(Sulfolobustokodaii),噬酸热原体,火山热原体等,或者真细菌,如大肠杆菌、嗜热栖热菌(Thermusthermophilus)、嗜热脂肪芽孢杆菌(Bacillus stearothermphilus)等,本发明的正交O-RS也可以来源于非真核有机体(或有机体混合物),例如古细菌,如詹氏甲烷球菌、热自养甲烷球菌,嗜盐菌属如沃氏盐杆菌和盐杆菌NRC-1,闪烁古生球菌,激烈火球菌,超嗜热古菌,Aeuropyrum pernix,海沼甲烷球菌,坎氏甲烷嗜热菌,马氏微球菌,超耐高温热棒菌,火球菌(Pyrococcus abyssi),硫磺矿硫化叶菌,硫化叶菌(Sulfolobustokodaii),噬酸热原体,火山热原体等,或者真细菌,如大肠杆菌、嗜热栖热菌、嗜热脂肪芽孢杆菌等。在一个实施方式中,真核有机体如植物、藻类、原生生物、真菌、酵母、动物(如哺乳动物、昆虫、节肢动物等)等也可作为O-tRNA和O-RS的来源,或者作为构建突变型O-tRNA和/或突变型O-RS的材料。

本发明的O-tRNA/O-RS对的各个组分可以来源于同一有机体,也可以来源于不同有机体。在一个实施方式中,O-tRNA/O-RS对来源于同一有机体。另外O-tRNA/O-RS对的O-tRNA和O-RS也可以来源于不同有机体。在一个优选实施方式中,枯草芽孢杆菌的色氨酰合成酶/tRNA对被用作哺乳动物细胞翻译系统的正交对。如本文所描述,这个正交对被修饰使其能够识别乳白突变型选择密码子,也可以被修饰成能够用非常见的或非天然的氨基酸如5-HTPP加载O-tRNA的形式。这个正交对(或其修饰形式)也可以与以前描述的正交对联合使用,如那些詹氏甲烷球菌来源的,经修饰后能识别终止选择密码子的正交对。这样在目的翻译系统中制备出的蛋白质就含有两个不同的非天然氨基酸。

本发明的正交组分可在各种活细胞的体内翻译系统中发挥功能。可在体内或体外,和/或利用细胞,如非真核细胞或真核细胞,来筛选本发明的O-tRNA、O-RS或O-tRNA/O-RS对,用于在翻译系统中制备出含5-HTPP残基的多肽。非真核细胞可以是各种来源的,如真细菌,如大肠杆菌、嗜热栖热菌、枯草芽孢杆菌、嗜热脂肪芽孢杆菌等,或者古细菌,如詹氏甲烷球菌、热自养甲烷球菌,嗜盐菌属如沃氏盐杆菌和盐杆菌NRC-1,闪烁古生球菌,激烈火球菌,超嗜热古菌,Aeuropyrum pernix,海沼甲烷球菌,坎氏甲烷嗜热菌,马氏微球菌(Mm),超耐高温热棒菌,火球菌(Pyrococcus abyssi),硫磺矿硫化叶菌(Ss),硫化叶菌(Sulfolobus tokodaii),噬酸热原体,火山热原体等。真核细胞也可以是各种来源的,如植物(如复杂植物,如单子叶植物或双子叶植物)、藻类、原生生物、真菌、酵母(如酿酒酵母)、动物(如哺乳动物、昆虫、节肢动物等)等。含本发明翻译组分的细胞组合物也是本发明的特征。

筛选一个物种的O-tRNA和/或O-RS用于另外一个物种的描述见USSN60/479,931和60/496,548,名称为“扩展真核遗传密码”(Expanding the Eukaryotic GeneticCode)。

核酸和多肽序列突变体

本发明提供了O-tRNA和O-RS的核酸多核苷酸序列和多肽氨基酸序列,以及含所述序列的组合物和方法。本发明O-tRNA和O-RS的典型序列在本文中作了描述。但是,本领域的技术人员应该了解本发明并不仅仅局限于这些特殊的序列。本领域的技术人员也应该可以为功能性的O-tNRA、O-muTrpRS、O-TrpRS、全长蛋白质等提供许多相关的和不相关的序列。

本领域的技术人员还应当了解公开序列的许多突变体也包括在本发明之中。例如,能形成功能一致性序列的公开序列的保守变体也包括在本发明之中。核酸多核苷酸序列的突变体或突变体的互补序列如果至少能与一个公开序列杂交,那么也被认为包括在本发明之中。本文所述序列的独特亚序列,如通过标准的序列比较技术确定以后也包括在本发明之中。公开肽序列的独特保守取代也包括在本发明之中。

保守变体

由于遗传密码的简并性,“静默取代”(即核酸序列上的取代不会导致其编码多肽的改变)是每个编码氨基酸的核酸的隐含特性。同样,氨基酸序列上的一个或几个氨基酸发生“保守氨基酸取代”是指用特性高度相似的不同氨基酸来取代,也很容易被鉴定为与公开的构建物高度相似。每一个公开序列的这种保守变体也是本发明的特征。

特定核酸序列的“保守变体”是指编码一样或基本一样的氨基酸序列的那些核酸(见下面的表1),或者是指虽然不编码完全一致的氨基酸序列、但序列基本相同的那些核酸。本领域的技术人员应该认识到导致编码序列上单个氨基酸或一小部分氨基酸(一般少于5%,更常见的是少于4%、2%或1%)发生改变、添加或删除的单个取代、缺失或插入是“保守修饰的变体”,其中的改变可导致氨基酸的删除、氨基酸的添加或以化学相似的氨基酸取代原来的氨基酸。因此,本发明所列出的多肽序列的“保守变体”包括用具有相同保守取代基的氨基酸取代一小部分氨基酸,一般低于多肽氨基酸总数的5%,更常见的是低于2%或1%。最后,不改变核酸分子编码活性的序列添加,如添加非功能序列或具有辅助功能的序列,被称为基础核酸的保守变体。

表1-保守取代基

  1  丙氨酸(A)  丝氨酸(S)  苏氨酸(T)  2  天冬氨酸(D)  谷氨酸(E)  3  天冬酰胺(N)  谷氨酰胺(Q)  4  精氨酸(R)  赖氨酸(K)  5  异亮氨酸(I)  亮氨酸(L)  蛋氨酸(M)  缬氨酸(V)  6  苯丙氨酸(F)  酪氨酸(Y)  色氨酸(W)

在表1中,用具有相同基团的另一个氨基酸取代一个氨基酸可以被认为是保守取代。

核酸杂交

对比杂交可用于鉴定本发明的核酸,其中包括本发明的核酸的保守变体,这种对比杂交方法是区别本发明核酸的优选方法。另外,能与SEQ ID NO:1或SEQ ID NO:3所代表的核酸在严格条件、高、超高、超超高严格条件下杂交的靶核酸也是本发明的特征。这类核酸的典型例子包括那些与一个给定核酸序列相比发生一个或几个静默核酸取代或保守核酸取代的核酸。

如果一个被检测核酸被说成可与一个核酸探针特异性杂交,那么这个被检测核酸与探针的匹配程度至少相当于与完全匹配的互补靶核酸匹配程度的1/2,即信噪比至少是探针与靶核酸杂交的1/2,杂交的条件为完全匹配的探针与完全匹配的互补靶核酸结合所产生的信噪比至少等于与任何不匹配的靶核酸杂交所产生的信噪比的约5倍到10倍。

当核酸相遇时发生“杂交”,一般是在溶液中或固相支持物上。核酸之所以可以发生杂交是由各种已知的物理-化学作用力造成的,如氢键、溶剂排斥、碱基堆积等。较全面的有关核酸杂交的指导手册是Tijssen(1993)的《生物化学和分子生物学实验技术-与核酸探针杂交》(Laboratory Techniques in Biochemistry and Molecular Biology-Hybridization with Nucleic Acid Probes)中第I部分第2章,“杂交原理和核酸探针分析策略概述”(Overview of principles of hybridization and the strategy of nucleic acidprobe assays),(Elsevier,New York),以及上述Ausubel的文献。Hames和Higgins(1995)编辑的Gene Probes 1(基因探针1),牛津大学出版社IRL出版社,英国牛津(Hames和Higgins 1)以及Hames和Higgins(1995)编辑的Gene Probes 2(基因探针2),牛津大学出版社IRL出版社,英国牛津(Hames和Higgins 2)详细描述了DNA和RNA,其中包括寡核苷酸的合成、标记、检测和定量方法。

在DNA印迹或RNA印迹中,含有约50%GC、超过约100个互补残基的互补核酸杂交到滤膜上的一个典型杂交条件是50%甲醛、1mg肝素、42℃杂交过夜。严格洗涤条件的例子是65℃用0.2×SSC洗涤15分钟(见上述文献Sambrook有关SSC缓冲液的描述)。一般情况下先用低严格条件再用高严格条件洗涤以去除背景探针信号。低严格洗涤条件的一个例子是40℃用2×SSC洗涤15分钟。一般来说,如果所检测到的信噪比比不相关探针在特定杂交试验中所产生的信噪比高5倍(或更高),就说明这是一个特异性杂交。

“严格杂交”的洗涤条件用于核酸杂交试验如DNA印迹和RNA印迹时是序列依赖性的,在不同的环境参数下该条件是不同的。较全面的有关核酸杂交的指导手册是上述的Tijssen(1993)和Hames和Higgins,1和2。任何被检测核酸所用的杂交和洗涤条件的严格程度根据经验可以很容易地确定。例如,在确定杂交和洗涤条件的严格程度时,可以逐渐提高杂交和洗涤条件的严格程度(如,在杂交或洗涤过程中通过升高温度、降低盐浓度、增加洗涤剂的浓度和/或增加有机溶剂如甲醛的浓度),直到满足了所选择的一组标准。例如,逐渐增加杂交和洗涤条件直到探针与互补靶核酸完全匹配,所产生的信噪比至少是探针与不匹配靶核酸杂交所产生的信噪比的5倍。

对于一个特定探针来说,“十分严格”的条件等于其热熔点(Tm)。Tm是指50%的被检测核酸与完全匹配的探针杂交时的温度(在特定离子强度和pH下)。一般来说,为了实现本发明,在一定的离子强度和pH条件下,所选择的“高严格”杂交和洗涤条件比一个特定序列的Tm约低5℃。

“超高严格”的杂交和洗涤条件是指杂交和洗涤条件的严格程度逐渐升高,直到探针与完全匹配的互补靶核酸结合所产生的信噪比至少达到探针与不匹配核酸杂交所产生的信噪比的10倍。靶核酸在这种条件下与探针杂交,如果所产生的信噪比至少是完全匹配的互补靶核酸所产生的信噪比的1/2,那么就可以说靶核酸可以在超高严格条件下与探针结合。

同样可以通过逐渐提高相关杂交试验的杂交和/或洗涤条件的严格程度来确定更高严格程度的杂交条件。例如,逐渐升高杂交和洗涤条件的严格程度,直到探针与完全匹配的互补靶核酸结合所产生的信噪比至少达到探针与不匹配核酸杂交所产生的信噪比的10倍、20倍、50倍、100倍、500倍或更高。靶核酸在这种条件下与探针杂交,如果所产生的信噪比至少是完全匹配的互补靶核酸所产生的信噪比的1/2,那么就可以说靶核酸可以在超超高严格条件下与探针结合。

如果核酸编码的多肽是基本相同的,即使在严格条件下核酸不能彼此杂交,那么这个核酸与本发明的核酸也是基本一致的。这种情况发生在核酸的拷贝是充分利用遗传密码所允许的最大简并性来制备的时候。

独特的亚序列

一方面,本发明提供了含独特亚序列的核酸,这些亚序列位于选自本文所描述的O-tRNA和O-RS序列的核酸内,如SEQ ID NO:3或SEQ ID NO:1。与任何已知的O-tRNA或O-RS核酸序列如GenBank中的核酸相应的核酸相比,独特亚序列都是独特的。可利用BLAST进行核酸的排列,使用默认参数。任何独特亚序列都可作为探针用于鉴定本发明的核酸。

同样,本发明还包括含独特亚序列的多肽,这些独特亚序列位于选自本文所描述的O-RS序列的多肽内,如SEQ ID NO:2。在这里,与任何已知的多肽序列相应的多肽相比,独特亚序列都是独特的。

本发明还提供了能在严格条件下与独特编码寡核苷酸杂交的靶核酸,该寡核苷酸编码选自O-RS序列的多肽内的独特亚序列,其中的独特亚序列与任何对照多肽相应的多肽相比都是独特的。独特序列可通过上面所提到的以及下面的方法确定。

序列比较、一致性和同源性

如果O-tRNA和O-RS与本发明的组分序列具有某种程度的同源性(如序列一致性),那么它们就被认为是本发明的翻译组分。根据本发明的方法翻译出的肽产物所含有的氨基酸序列与野生型的治疗性蛋白、诊断蛋白和工业用蛋白或其片段至少具有75%、约90%、约95%、约99%或更高的一致性,并且掺入有至少一个非常见或非天然氨基酸残基,那么这个肽产物就可以被认为是本发明的肽产物。

术语“一致的”或“百分一致性”用于两个或多个核酸或多肽序列的比较时是指两个或多个序列或亚序列在一起排列并比较其最大相似性时,这两个或多个序列或亚序列是相同的,或者有特定百分比的氨基酸残基或核苷酸是相同的,这种比较可利用下面所描述的一种序列比较算法(或本领域技术人员所熟知的其他算法)或通过肉眼观察来完成。

术语“基本一致的”用于两个或多个核酸或多肽(如编码O-tRNA或O-RS的DNA,O-RS的氨基酸序列)的比较时是指两个或多个序列或亚序列在一起排列并比较其最大相似性时,这两个或多个序列或亚序列至少有约60%的核苷酸或氨基酸残基是相同的,优选的是80%,最优选的是90-95%的核苷酸或氨基酸残基是相同的,这种比较可利用序列比较算法或通过肉眼观察来完成。无论实际来源于何种家系,这种“基本一致的”序列一般被认为是“同源的”。“实质一致性”优选存在于序列的一个区域内,这个区域至少约含20个、50个残基,更优选的是至少约含100个残基,最优选的是至少约含150个残基,或者在两个序列的全长上进行比较。本发明包括与本文所描述的本发明的独特翻译组分基本一致的核酸序列和氨基酸序列。

为了进行序列比较并确定其同源性,一般需要把一个序列看作参考序列,被检测序列与之比较。在使用序列比较算法时,将被测序列与参考序列输入到计算机内,如果需要,设定亚序列匹配值和序列算法程序的参数。序列比较算法就可以根据设定的程序参数计算出被测序列相对于参考序列的百分序列一致性。

进行序列比较的理想序列排列方法可用下列算法完成:局部同源性算法,Smith&Waterman,Adv.Appl.Math.2:482(1981);同源性排列算法,Needleman&Wunsch,J.Mol.Biol.48:443(1970);相似性检索方法,Pearson&Lipman,Proc.Nat′l.Acad.Sci.USA 85:2444(1988),以及这些算法的计算机程序(WisconsinGenetics Software Package内的GAP、BESTFIT、FASTA和TFASTA,GeneticsComputer Group,575 Science Dr.,Madison,WI),或者通过肉眼检查(一般参见下面Ausubel等的文献)。

适于确定百分序列一致性和序列相似性的算法的一个例子是BLAST算法,该算法描述于文献Altschul等,J.Mol.Biol.215:403-410(1990)中。执行BLAST分析的软件可在国家生物技术信息中心的网站(www.ncbi.nlm.nih.gov/)免费下载。这种算法首先通过鉴定查询序列中长度为W的短字符来确定高分序列对(HSP),这个短字符在与数据库中相同长度的字符一起排列时可匹配或达到某些正阈值记分T。T被称为相邻字符记分阈值(A1tschul等,同上)。这些初始的相邻字符采样数作为种子启动检索来寻找含有这些字符的更长的HSP。然后字符采样数在每一序列的两个方向上扩展,直到累积排列记分升高。用参数M(匹配残基对的奖赏分数;总是大于0)和N(错配残基的惩罚分数;总是小于0)来计算核苷酸序列的累积记分。对于氨基酸来说,可利用计分矩阵来计算累积记分。字符采样数在每个方向上的延伸停止于下列时刻:累积排列记分从其曾达到的最大数值开始回落时;由于累积了一个或多个负记分残基排列使累积记分达到0或0以下时;或者达到序列的末端时。BLAST算法的参数W、T和X决定了算法的灵敏度和速度。BLASTN程序(用于核苷酸序列)的默认参数为:字长(W)=11,期望值(E)=10,终止值=100,M=5,N=-4,两条链进行比较。对于氨基酸序列来说,BLASTP程序的默认参数为:字长(W)=3,期望值(E)=10,使用BLOSUM62计分矩阵(见Henikoff和Henikoff(1989)Proc.Natl.Acad.Sci.USA 89:10915)。

除了能够计算百分序列相同性以外,BLAST算法还可以进行两个序列之间相似性的统计分析(见Karlin和Altschul,Proc.Nat′l.Acad.Sci.USA 90:5873-5787(1993))。BLAST算法所提供的一个相似性数据是最小总概率(P(N)),这一数据说明了两个核苷酸或氨基酸序列之间相匹配的可能性。例如,如果将被测核酸与参考核酸比较后得到的最小总概率约在0.1以下、优选约0.01以下、最优选的是约0.001以下,则这个核酸被认为与参考序列是相似的。如果核酸与本发明的独特核酸是相似的,其最小总概率约为0.1、优选约0.01以下、更优选的是约0.001以下,则核酸被认为是相似的,包含在本发明的范围之内。

根据免疫活性定义多肽

由于本发明的多肽提供了多种新的多肽序列(如在本文的翻译系统中合成的蛋白中含有5-HTPP残基或者在新型合成酶、标准氨基酸的新型序列中含有5-HTPP),因此多肽可能会提供能被免疫分析方法识别的新型结构特征。能特异性结合本发明多肽的抗血清的制备以及能被这些抗血清结合的多肽也是本发明的特征。例如,本发明的肽包括能与抗体发生免疫反应的肽,其中抗体与上述本发明的肽有特异性的结合亲和性,但是与其他已知的肽没有明显的免疫活性。

本文所用的术语“抗体”包括而不限于免疫球蛋白基因或其片段编码的多肽,这些多肽可特异性识别并结合分析物(抗原)。例子包括多克隆抗体、单克隆抗体、嵌合抗体和单链抗体等。免疫球蛋白的片段,其中包括Fab片段和表达文库如噬菌体展示文库产生的片段,也包括在本文所用的术语“抗体”之中。见Paul编的《基础免疫学》(Funcamental Immunology),第四版,1999,Raven Press,New York,中关于抗体结构和方法学的描述。

为了制备用于免疫分析中的抗血清,可按照本文所描述的方法制备和纯化一种或多种免疫原性多肽。例如,用重组细胞制备重组蛋白。纯系小鼠(用于此分析中,因为纯系小鼠具有遗传相同性,因此得到的结果重复性更高)用含标准佐剂如福氏完全佐剂的免疫原性蛋白按照标准的免疫方法免疫(见Harlow和Lane(1988),《抗体-实验室操作手册》(Antibodies,A Laboratory Manual)(冷泉港出版社,纽约)中关于抗体制备、用于确定特异性免疫反应的免疫分析方法和条件的描述)。关于蛋白、抗体、抗血清等的其他详细描述见USSN 60/479,931、60/463,869和60/496,548,题为“扩充真核遗传密码”(Expanding the Eukaryotic Genetic Code);WO 2002/085923,题为“非天然氨基酸的体内插入”;专利申请USSN 60/441,450,名称为“糖蛋白合成”,申请日为2003年1月16日。

肽内掺入非天然氨基酸的方法

利用本发明的组合物和方法可将氨基酸特异性地掺入到肽内。本发明的正交转录组分经改造后被插入到内源性转录系统内。正交组分可将天然的或非天然的氨基酸引入到正在延伸的肽链内的非常见位置上,所得到的肽具有独特的特性,可用于技术开发领域,如医学、分析、生物学研究、工业处理等。

非常见位置上氨基酸的插入包括天然或非天然氨基酸插入到肽内标准密码子翻译未提供的位置上。非常见位置的插入包括将一个天然氨基酸插入到在正常情况下编码(根据61个标准的翻译密码子)一个不同的天然氨基酸的位置上。也就是说,标准三联密码子可作为某种异常加载的O-tRNA的选择密码子。天然或非天然氨基酸的插入可以是对正常情况下为非编码密码子,如终止密码子、非天然密码子、四碱基密码子等的反应。非天然氨基酸插入到肽的任何位置上都被认为是插入到异常位置上。

将一个氨基酸插入到蛋白内的异常位置上可通过以下方法实现:制备本发明的正交氨酰-tRNA合成酶(O-RS)的构建物,制备本发明的正交tRNA(O-tRNA)的构建物,将构建物转染到细胞内,表达构建物以提供O-RS和O-tRNA,将O-RS和O-tRNA添加到内源性的翻译系统内,利用O-RS加载O-tRNA,以及翻译含密码子的mRNA,其中的密码子与O-tRNA的反密码子互补,这样就可以将氨基酸插入到蛋白内的异常位置上。构建物表达产物可以被纯化出来添加到体外的内源性翻译系统内,或者在含内源性体内翻译系统的活细胞内表达。本发明的O-RS可用天然的或非天然的氨基酸加载O-tRNA。O-tRNA的反密码子与非标准的选择密码子互补,或者与O-RS加载到O-tRNA上的氨基酸不同的氨基酸所分配的选择密码子互补。

制备和筛选O-tRNA、O-RS和正交对的方法描述于Shultz等的美国专利No.10/126,927中,名称为“体内掺入非天然氨基酸”,以及Shultz等的美国专利申请No.10/126,931中,名称为“制备正交tRNA-氨酰tRNA合成酶对的方法和组合物”,本文已纳入作为参考。例如,本发明的重组正交氨酰-tRNA合成酶(O-RS)可通过如下方法制备:制备来源于第一有机体的至少一种氨酰-tRNA合成酶(RS)的RS文库(可以是突变的),选择(和/或筛选)RS文库以获得能氨酰化正交tRNA(O-tRNA)的一组活性RS,以及筛选这组RS以获得能在非天然氨基酸存在的情况下优先氨酰化O-tRNA的活性RS。在另一个实施例中,本发明的重组正交tRNA(O-tRNA)可通过如下方法制备:制备来源于至少一种tRNA的文库,筛选文库以获得能在第一有机体来源的RS缺失的情况下被第二有机体来源的氨酰-tRNA合成酶(RS)氨酰化的一组功能性tRNA,以及筛选这组tRNA中能被导入的正交RS(O-RS)氨酰化的成员以获得至少一种重组O-tRNA,这种O-tRNA可识别选择密码子,不能被第二有机体来源的RS有效识别,并且优先被O-RS氨酰化。本发明的这种O-tRNA和O-RS作为互补的O-tRNA/O-RS对来提供,其功能是利用内源性的翻译系统来特异而有效地将非天然氨基酸插入到本发明的肽内。

突变和其他分子生物学技术

本发明的多核苷酸和多肽可以用分子生物学技术进行制备和改造。描述分子生物学技术的综合性教科书包括:Berger和Kimmel的《分子克隆技术指导》(Guide toMolecular Cloning Techniques)第152卷“酶学方法”,Academic Press,Inc.,San Diego,CA(Berger);Sambrook等人的《分子克隆实验手册》(Molecular Cloning-A LaboratoryManual)(第三版)1-3卷,冷泉港实验室,纽约冷泉港,2001(″Sambrook″)和《现代分子生物学操作指南》(Current Protocols in Molecular biology),F.M.Ausubel等人编辑,《现代操作指南》(Current Protocols),Greene Publishing Associates,Inc.和John Wiley&Sons,Inc.共同投资出版,(2003年增补)(″Ausubel″)。这些教科书描述了突变、载体的使用、启动子以及许多其他相关主题,如与基因制备有关的主题,这些包含选择密码子的基因可用于蛋白质的制备,其中包括色氨酸衍生物、正交tRNA、正交合成酶及其正交对。

各种突变技术都可用于本发明中进行tRNA分子的突变、tRNA文库的制备、合成酶的突变、合成酶文库的制备、和/或选择密码子向编码目的蛋白或多肽的核酸内的插入。突变技术包括而不限于位点定向突变、随机点突变、同源重组、DNA重组或其他的回归突变方法、嵌合构建物、利用含尿嘧啶的模板进行的突变、寡核苷酸定向突变、硫代磷酸修饰的DNA突变、利用带缺口的双链DNA进行的突变等,或上述方法的组合。其他合适的方法包括点错配修复、利用修复缺陷宿主系进行的突变、限制性筛选和限制性纯化、缺失突变、通过总基因合成进行的突变、双链断裂修复等。利用嵌合构建物进行的突变也包括在本发明中。在一个实施方式中,可以利用已知的有关天然分子或者改变的或突变的天然分子的信息指导突变,如序列、序列比较、物理特性、晶体结构等。

宿主细胞可用本发明的多核苷酸或包含本发明多核苷酸的构建物,如本发明的载体进行遗传改造(如转化、转导或转染),这些载体可以是克隆载体和/或表达载体。例如,正交tRNA、正交tRNA合成酶以及掺入有非常见氨基酸的蛋白质的编码区可以被可操控地连接到能在目的宿主细胞内发挥功能的基因表达调节元件上。典型的载体都包含转录和翻译终止子、转录和翻译起始序列和用于调节特定靶核酸表达的启动子。载体还可以包含基因表达盒,其中至少含有一个独立的终止子序列,允许表达盒在真核或原核宿主、或者二者内(如穿梭载体)复制的序列以及用于原核和真核系统内的筛选标记。载体可以在原核或真核宿主内表达和/或整合,最好是既可在真核宿主内又可在原核宿主内表达和/或整合。见Giliman和Smith,Gene 8:81(1979);Roberts等,Nature,328:731(1987);Schneider,B.等,Protein Expr.Purif.6435:10(1995);Ausubel,Sambrook,Berger(这三篇文献同上)。载体可以是质粒、细菌、病毒、裸多核苷酸或共轭多核苷酸的形式。可用标准方法将载体导入到细胞和/或微生物内,如电穿孔(From等,Proc.Natl.Acad.Sci.USA 82,5824(1985));用病毒载体感染;用含核酸的小粒子高压渗透,其中核酸位于小珠或离子的基质内或表面上(Klein等,Nature 327,70-73(1987))。

ATCC提供了可用于克隆的细菌和噬菌体的目录,如ATCC出版的《细菌和噬菌体的ATCC目录》(The ATCC Catalogue of Bacteria and Bacteriophage)(1996),Ghema等(编)。用于测序、克隆和分子生物学其他方面的其他基础方法及其理论阐述见于Sambrook(同上)、Ausubel(同上)和Watson等(1992)科学美国人丛书第二版重组DNA(Recombinant DNA Second Edition Scientific American Books),NY。另外,几乎所有核酸(以及几乎所有的标记核酸,无论是标准的还是非标准的)都可以从各个公司里购买或订购,如Midland Certified Reagent Company(Midland,TX mcrc.com)、The Great American Gene Company(Ramona,CA,网址是www.genco.com)、ExpressGen Inc.(Chicago,IL,网址是www.expressgen.com)、Operon TechnologiesInc.(Alameda,CA)等。

经遗传改造的宿主细胞可用经过适当改变以便于进行下列操作的常规营养培养基进行培养:筛选、活化启动子或筛选转化子。这些细胞还可以培养成转基因有机体。有关细胞分离和培养(如用于亚序列核酸分离)的其他有用文献包括Freshney(1994)《动物细胞培养-基本操作技术》(Culture of Animal Cells,a Manual of BasicTechnique),第三版,Wiley-Liss,New York及其引用的参考文献;Payne等(1992)《在液体系统中进行植物细胞培养和组织培养》(Plant Cell and Tissue Culture inLiquid Systems),John Wiley & Sons,Inc.,New York,NY;Gamborg和Phillips(编)(1995)《植物细胞、组织和器官培养》(Plant Cell,Tissue and Organ Culture),FundamentalMethods Springer Lab Manual,Springer-Verlag(Berlin Heidelberg New York)以及Atlas和Parks(编)《微生物学培养基手册》(The Handbook of Microbiological Media)(1993),CRC Press,Boca Raton,FL。

制备O-RS构建物

本发明的氨酰-tRNA合成酶构建物可被改造使其包含各种元件以适应目的表达系统、筛选系统和/或翻译系统。O-RS构建物包括含合适启动子和筛选标记的质粒。编码O-RS蛋白的构建物序列可包含增强氨基酸特异性、tRNA特异性、酶活性和/或表达酶的保真度的突变。表达构建物可以是包含纯化标记物和可检测标记物的嵌合体。

一般来说,本发明的O-RS可用质粒来表达,这种质粒含有O-RS编码核酸序列、启动表达启动子和维持质粒存在于细胞内的筛选标记物的序列。启动子可以是包含转录起始位点的DNA序列,该启动子与表达细胞内的RNA聚会酶相匹配。启动子可以是高活性的和可诱导的。原核表达系统常用的启动子是lac启动子。哺乳动物细胞表达细胞常用的启动子包括CMV启动子和人细胞EF-1α启动子。表达载体所编码的筛选标记可稳定质粒,使其避免被细胞宿主清除掉,并且提供了一种鉴定含载体的细胞的方法。正筛选标记可以是抗生素耐药基因,这样只有那些被载体转化的细胞可在含抗生素的培养基内生长。负筛选标记如可诱导毒素可用于鉴定含载体的细胞克隆,因为那些在毒素诱导试剂存在的情况下死亡或不能旺盛生长的细胞就是含载体的细胞。

在构建物内插入报告序列以便于载体和/或表达蛋白的检测和定量通常是很方便的。一般来说,可检测标记肽序列与O-RS序列融合,这样就可以确定O-RS是否表达以及表达的量。例如,绿色荧光蛋白(FGP)序列可以被融合到本发明的O-RS上,通过检测特征性的荧光激发/发射光谱就可以检测表达的融合蛋白。另外一种便于检测和定量表达的O-RS的方法是将序列与抗原序列(如FLAG或V5序列)融合,通过蛋白印迹分析就可以检测表达的融合蛋白。

在需要方便地纯化本发明表达的O-RS的情况下,序列需要包含纯化标记以便于通过特异性亲和技术将蛋白与其他生物分子分开。例如,与鳌合镍有亲和性的his6标记或能与抗体结合的抗原标记可用于亲和层析中以快速地纯化表达的蛋白质。然后分析纯化出的O-RS/标记融合蛋白,如利用质谱或加入到翻译系统内进行分析。

本发明的O-RS可通过筛选技术、随机突变、定向突变等方法制备。当外源RS加入到内源性翻译系统中时可以是O-RS。例如,来源于原核生物的RS可作为真核生物内源性翻译系统的O-RS来发挥功能。另外,外源RS或天然RS可以用本领域熟知的随机突变技术进行改造,然后用O-tRNA和/或非天然氨基酸来分析其功能从而加以筛选。更常见的是可以利用现在已知的结构信息,特别是RS活性位点的信息来了解最可能影响RS与氨酰化tRNA之间相互作用的活性和特异性的氨基酸位置。例如,根据RS或RS类似物上的x射线结晶学数据,可以预测出能干扰或促进与特定氨酰化tRNA匹配和相互作用的氨基酸残基位置。例如,在一个实施方式中,能用一种氨基酸加载的正交对(O-RS/O-tRNA)可以被突变使其能加载更大的(或衍生的)氨基酸,或者通过位点定向突变使其能够加载不同的氨基酸。通过结晶学数据鉴定出的O-RS氨基酸残基如果延伸到活性位点内以可以被特异性突变,用侧链较短的氨基酸来取代它,这样可以减少活性位点内的空间位阻,改善活性位点内较大氨基酸的匹配程度。另外,与RS活性和/或特异性相关的一个或多个氨基酸也可以被突变,制备出含有不同的19个其他氨基酸的RS,用于筛选和鉴定对于我们所需要的功能来说是最佳的突变。

正交色氨酰tRNA合成酶(O-TrpRS),特别是原核色氨酰-tRNA合成酶在本发明的O-RS构建物的实施方式中是优选的。正交突变的色氨酰tRNA合成酶(O-muTrpRS)在本发明的O-RS构建物中是优选的。在一个实施例中,本发明的O-muTrpRS构建物来源于原核生物的TrpRS,是通过位点定向突变酶活性位点上的氨基酸而得到的。

在本实施例的一个优选实施方式中,O-muTrpRS是Val144或Val144Pro突变的枯草芽孢杆菌TrpRS或其保守突变体。例如,O-muTrpRS可由编码Val144ProBsTrpRS(即SEQ ID NO:1)的核酸、其互补序列或其保守变体编码。最优选的O-muTrpRS包括那些含氨基酸序列Val144ProBsTrpRS(即SEQ ID NO:2)或其保守取代变体的O-muTrpRS。

筛选O-RS构建物

本发明的O-RS构建物可在体外翻译系统或体内翻译系统(如活细胞内)内表达以筛选所需要的活性和/或特异性。在蛋白设计工程的可信度较高或构建物在以前已被确定出特征的情况下,可将构建物导入、转化或转染到宿主细胞内来表达和制备本发明的O-RS(和/或O-tRNA)。在许多情况下需要制备不同候选构建物的文库,进行一系列的表达、筛选和选择步骤鉴定出在特定正交转录亚系统中具备我们所期望的特征的构建物。

现在已经有好几种大家所熟知的方法用于将靶核酸导入到细菌细胞内,这些方法都可用于本发明中。其中包括:受体细胞与含DNA的细菌原生质体融合,电穿孔、发射物轰击、用病毒载体感染等。细菌细胞可用于大量扩增含本发明DNA构建物的质粒。细菌可以生长到指数期,然后利用本领域熟知的各种方法(如Sambrook)将细菌内复制的质粒载体分离出来。另外,现在有很多商业化的试剂盒可用于从细菌内纯化质粒(如Pharmacia Biotech的EasyPrepTM和FlexiPrepTM;Stratagene的StrataCleanTM;以及Qiagen的QIAprepTM)。然后,分离和纯化出的质粒可以被进一步操作以制备其他质粒,用于转染细胞或将相关的载体掺入到感染有机体内。典型的载体都包含转录和翻译终止子、转录和翻译起始位点、以及用于调节特定靶序列表达的启动子。载体还可以包含基因表达盒,其中至少含有一个独立的终止子序列,允许表达盒在真核或原核宿主、或者二者内(如穿梭载体)复制的序列以及用于原核和真核系统内的筛选标记。载体可以在原核或真核宿主内表达和/或整合,最好是既可在真核宿主内又可在原核宿主内表达和/或整合。见Giliman和Smith,Gene 8:81(1979);Roberts等,Nature,328:731(1987);Schneider,B.等,Protein Expr.Purif.6435:10(1995);Ausubel,Sambrook,Berger(这三篇文献同上)。用于克隆的细菌和噬菌体目录由ATCC提供,如《ATCC细菌和噬菌体目录》(1992),Ghema等(编),由ATCC出版。其他用于测序、克隆和分子生物学其他方面的基本方法及其理论参见Watson等,(1992),《重组DNA》(第二版),Scientific American Books,NY。

筛选具有预期O-RS功能的RS候选酶的方法包括以表达载体DNA的形式将候选酶导入到体内翻译系统中,或者以mRNA或肽的形式将候选酶导入到体外翻译系统中。首先用可能的tRNA正交对成员筛选RS候选酶找出具有氨酰化活性的RS,形成一个活性RS文库。然后筛选活性RS文库,例如通过检测只有在合适的功能性O-RS存在的情况下才能表达的标记物蛋白。例如,标记物蛋白包括可筛选标记物和/和可检测标记物。标记物蛋白可提供细胞的存活能力(如抗生素耐药性)、细胞毒性和死亡(如毒素蛋白)、荧光信号(如荧光蛋白)、可用夹心法检测的抗原等。标记物蛋白的核酸序列可包含选择密码子,如不能被内源性翻译系统翻译成氨基酸的选择密码子,这样功能性的标记物蛋白就只能在活性RS加载具有互补反密码子的tRNA的情况下才表达。假阳性信号发生在活性RS用错误的氨基酸加载选择密码子互补的tRNA的情况下,这种假阳性信号可通过观察标记物蛋白异常的功能或定量分析标记物蛋白产物(如电离质谱)来检测和消除。

经筛选找到的具有正确功能的O-RS可被进一步检测从而筛选出具有我们所需要的特异性的本发明的O-RS。对于在正常情况下能用第一氨基酸加载配对的tRNA来源的突变O-RS来说,它可以用第二氨基酸(可以是非天然氨基酸)加载tRNA,这种突变的O-RS可被进一步检测从而筛选出能优先用第二氨基酸而不是第一氨基酸加载配对的tRNA的突变O-RS。例如,检测包含突变O-RS的翻译系统,观察其在第二氨基酸存在和不存在的情况下是否表达标记物蛋白。如果标记物蛋白能在不含第二氨基酸的翻译系统内表达,那么这个突变的RS可能是用第一氨基酸来加载配对的tRNA。如果在第二氨基酸存在的情况下表达全长的标记物蛋白,而在无第二氨基酸的情况下之表达截短形式的标记物蛋白,那么这个突变的RS可能就会优先用第二氨基酸而不是内源性翻译系统的天然氨基酸来氨酰化tRNA。在添加有突变RS和第二氨基酸的翻译系统内表达的标记物蛋白可被进一步分析(如通过电离质谱或蛋白印迹技术)以检测是否存在因突变RS不一致地加载配对的tRNA而导致的翻译错误和/或存在的比例。虽然本发明的O-RS所导致的不一致加载在一定程度上存在是允许的,但是最好是O-RS能够优先用预期的氨基酸加载其配对的tRNA。例如,本发明的O-RS用预期的(可能是非天然的)氨基酸氨酰化其配对的tRNA(可能是O-tRNA)要超过用非预期的(一般是天然的)氨基酸氨酰化其配对的tRNA,二者的比例要超过1∶1、约2∶1、约4∶1、约5∶1、约20∶1、约100∶1或更高。

经筛选找到的具有合适功能的O-RS可被进一步检测以便于筛选出具有合适活性的O-RS。和其配对的tRNA一起被添加到内源性翻译系统内的O-RS可将同源氨基酸(一般是非天然的氨基酸)掺入到肽内,其速率与相同条件下的内源性氨基酸的掺入速率相同。O-RS的活性可以被测定,例如通过检测肽内放射性同源氨基酸的掺入量,SDS-PAGE定量检测相关表达产物的量等。活性可与类似蛋白的内源性表达水平相类似。在本发明中,O-RS的活性是典型的内源性(可以是类似的)RS活性的约1%、约5%、约10%、约25%、约50%、约80%、约90%、约100%或更高。例如,野生型蛋白的表达水平与经突变后包含选择密码子的野生型序列所编码的蛋白(如全蛋白质)的表达水平相类似。另外,O-RS的Km和/或Kcat可按照本领域熟知的方法根据经验来计算以确定O-RS的活性。在一个优选实施方式中,本发明的O-RS(如来源于突变的、筛选的和/或选择的RS文库)可根据其提高的或增强的酶特性来选择,例如对非天然氨基酸和天然氨基酸的Km和Kcat。

如果通过筛选O-RS没有找到具有预期活性和/或特异性的O-RS,那么就应该继续研究,再进行几轮的制备外源RS、蛋白设计、突变、筛选和/或选择。

制备O-tRNA构建物

本发明的O-tRNA可用上述重组技术类似的方法制备的DNA构建物表达。但是,tRNA表达为最终不翻译成肽的核糖核酸。O-tRNA构建物和RNA表达产物有一些蛋白表达构建物所没有的特殊考虑。例如,tRNA序列由特殊的RNA聚合酶(RNA聚合酶III)转录,这种聚会酶与转录mRNA的RNA聚合酶不同。

本发明的O-tRNA序列包含能影响表达、活性和特异性的各种元件。例如,在许多情况下,本发明的O-tRNA对内源性翻译系统来说是外源性的tRNA。真核生物的tRNA由RNA聚合酶III转录,该聚合酶可识别两个保守的基因内转录调控元件A盒和B盒。真核生物RNA聚合酶III可能无法有效识别原核tRNA序列的起始信号。在这种情况下,tRNA D臂上的核酸残基可以被突变使其编码能被真核RNA聚会酶III识别的“A盒”15片段,如图1所示。真核生物内某些tRNA基因的表达也依赖于是否存在某些5’侧翼序列。例如真核生物内的tRNATrp的表达需要5’侧翼序列,这种序列明显的富含AT,含有及格可能的TATA元件。这种序列可包含在本发明的O-tRNA构建物内以提高表达效率。本发明的O-tRNA构建物内另一种有用的表达元件可能是3’侧翼序列内正确定位的终止子元件。这种序列可来源于内源性翻译系统来源有机体或类似有机体所使用的3’侧翼序列。

本发明的O-tRNA构建物通常都包含反密码环上的突变,使其可以识别选择密码子。在本发明的一个方面,反密码子与正常情况下定义20种天然氨基酸之一的61种密码子中的一种(优选稀有密码子)互补,O-tRNA可被不同的(异常的,如非天然的)氨基酸加载。在一个优选实施方式中,O-tRNA的反密码子与选择密码子如独特的三碱基密码子、无意义密码子如终止密码子、琥珀密码子或乳白密码子、赭石密码子、非天然密码子、含非天然碱基的密码子、四碱基(或多碱基)密码子等互补。例如,本发明的O-tRNA可以是含反密码子如UCA、UUA或CUA的抑制型密码子。在一个优选实施方式中,O-tRNA含有UCA乳白抑制型反密码子。

本发明的O-tRNA优先被本发明的互补配对O-RS氨酰化。也就是说,O-RS优先加载O-tRNA而不是内源性翻译系统的内源性tRNA。O-tRNA可被突变使其成为O-RS的优选底物。更常见的是,本发明的O-RS/O-tRNA对来自于相同的或类似的对内源性翻译系统来说是外源的翻译系统。由于来自于相同的或类似的翻译系统,这个对的成员之间趋向于发生特异性的相互作用。在某些情况下,O-RS被突变以保留其对O-tRNA的特异性以对应引入到O-tRNA内的突变,例如允许在内源性系统内表达或使其优先用不同的氨基酸加载。在另一个实施方式中,被O-RS优先氨酰化的特性可通过筛选O-tRNA文库以鉴定O-RS的优选底物和目的氨基酸而实现。这种筛选可通过上面所描述的O-RS筛选方法类似的方式或本领域熟知的其他筛选方法实现。优选的是,本发明的O-tRNA优先被其配对的O-RS用我们所期望的氨基酸氨酰化,与加载其他tRNA如内源性tRNA之比高于1∶1、约2∶1、约4∶1、约5∶1、约20∶1、约100∶1或更高。

用异常氨基酸加载的本发明的tRNA优选可用来源于色氨酸的色氨酸或色氨酸类似物加载的正交tRNA。本发明的O-tRNA可以是tRNATrp、正交突变的tRNATrp(O-mutRNATrp)或含抑制型反密码子的正交突变的tRNATrp如mutRNAUCATrp。在一个优选实施方式中,mutRNAUCATrp来源于芽孢杆菌属的细菌,如枯草芽孢杆菌或嗜热脂肪芽孢杆菌。在一个最优选的实施方式中,构建物编码O-tRNA序列5’AGGGGCGUGGCUUAACGGUAGAGCAGAGGUCUUCAAAACCUCCGGUGUGGGUUCGAUUCCUACCGCCCCUG3’(SEQ ID NO:3)、其互补多核苷酸序列或保守变体。另外,本发明的构建物可编码能识别选择密码子的SEQ ID NO:3的保守变体,或者在高严格条件下能与全长多核苷酸序列(SEQ ID NO:3)实质杂交的多核苷酸序列。

本发明的O-tRNA构建物可通过导入到活细胞内复制和/或表达。将遗传构建物导入到细胞内的方法是大家所熟知的,在上文已作了描述,参见“制备O-RS构建物”部分。在一个更优选的实施方式中,真核细胞是哺乳动物细胞,如人细胞系。

将非天然氨基酸插入到肽内

本发明的O-RS可用异常氨基酸(通常为非天然氨基酸)加载其配对的O-tRNA,该氨基酸可内掺入到肽内,由与O-tRNA反密码子互补的密码子编码。非天然氨基酸可影响全蛋白产物的特性。全蛋白质具有独特的特性,可作为治疗性蛋白、诊断蛋白用于工业处理、材料科学、纳米技术、计算机科学、电子学等等之中。

用于表达本发明的全蛋白质的核酸构建物可经过重组改造,例如利用上述“制备O-RS构建物”部分所描述的限制性内切酶、DNA合成酶、载体和宿主细胞。全蛋白质构建物可以是具有功能性编码区的载体,这些编码区编码复制起始位点、筛选标记、检测标记、转录起始位点等。全蛋白质编码序列可包含一个或多个选择密码子,如决定异常氨基酸(如非天然氨基酸)插入的位置。全蛋白质构建物可在同一个载体内包含O-RS和O-tRNA的编码序列,以便于共转染和表达。另外,本发明正交翻译组分的序列可位于不同的载体构建物上

本发明的全蛋白质构建物可被导入到活细胞内进行体内翻译。在这种情况下,非天然氨基酸常常作为细胞培养介质的添加剂来提供。例如,用含本发明的正交对和全蛋白质编码序列的载体转染的哺乳动物细胞可在含1M合适同源非天然氨基酸的最基础培养基内生长,翻译处的全蛋白质含有非天然氨基酸的掺入。本发明的非天然氨基酸通常都是能作为tRNA氨酰化底物并且能在核酸序列翻译成肽序列的过程中形成肽键的α氨基酸。非天然氨基酸可通过化学方法在体外合成和/或通过生物方法在细胞内合成。如上所述,在许多情况下非天然氨基酸都是天然氨基酸的衍生物。例如,可通过化学方法或酶催化方法将化学基团添加到天然氨基酸上为氨基酸提供功能性基团、连接子、离子电荷、疏水基团、协调结构、亲和基团、可检测标记物、放射性标记等(最终到达全蛋白质内)。在本发明方法的一个方面,非天然氨基酸是色氨酸衍生物,如5-HTPP,正交对是O-muTrpRS和O-tRNA,其功能是将色氨酸衍生物插入到表达蛋白构建物无意义突变选择密码子所定义的位置上。

体外翻译可通过将本发明的正交组分直接添加到含内源性翻译系统的溶液中从而在肽内掺入非天然氨基酸来完成。在添加到内源性体外翻译系统内之前,正交组分可以是未经纯化的、部分纯化的或高度纯化的、例如,亲和纯化的O-RS(来源于含纯化标记的构建物)、来源于总tRNA制备物的O-tRNA、化学修饰和结晶化的非天然氨基酸以及从总mRNA制备物中纯化的poly-T以合适的量添加到麦芽精裂解物翻译系统内用于在体外制备全长的全蛋白质(通常是在容器内,如Eppendorf管)。

内源性翻译系统包含将mRNA核酸翻译成含20种常见天然氨基酸的全长肽序列所需的所有组分。本发明的正交翻译组分,如O-RS、O-tRNA、含有不能被翻译系统正确阅读的内部密码子的蛋白质编码基因和/或非天然氨基酸可以被加入到内源性翻译系统内以获得从单独的内源性翻译系统中无法得到的翻译产物。例如,含40个氨基酸的肽的编码核酸其编码21位氨基酸的密码子发生无意义突变,这个基因在内源性翻译系统内所表达的产物为含20个氨基酸的肽片段。如果在翻译系统内加入本发明的非天然氨基酸和合适的正交对就可以表达出21位氨基酸为非天然氨基酸的含40个氨基酸的全长全蛋白质。

在体内掺入非天然氨基酸如5-HTPP无需明显改变宿主细胞就可以做到。例如,在非真核细胞如大肠杆菌内,由于终止选择密码子如UCA密码子的抑制效率依赖于O-tRNA(如乳白抑制型tRNA)和释放因子(RF)之间的竞争,其中的释放因子可与UCA密码子结合,启动正在延伸的肽链从核糖体上释放出来,因此可通过增加O-tRNA的表达水平或者通过使用RF缺陷株来调节抑制效率。在真核细胞内,由于UCA密码子的抑制效率依赖于O-tRNA和真核释放因子(如eRF)之间的竞争,,因此可通过增加O-tRNA的表达水平来调节抑制效率。其他化合物也可用于调节释放因子的活性,例如还原剂如二硫苏糖醇(DTT)。

在本发明的一个方面,组合物至少包含一个含至少1、2、3、4、5、6、7、8、9、10个或更多个异常氨基酸,如非标准密码子编码的氨基酸、色氨酸类似物、衍生物和/或其他非天然氨基酸的蛋白质。异常和/或非天然氨基酸可以是相同的,也可以是不同的,如蛋白上可以有1、2、3、4、5、6、7、8、9、10或更多个不同位点包含1、2、3、4、5、6、7、8、9、10或更多个不同的异常或非天然氨基酸。在另一方面,组合物包含至少含一个,但少于全部特定氨基酸的蛋白质,其中蛋白上的特定氨基酸被色氨酸衍生物取代。对于一个给定的含多个非天然氨基酸的蛋白来说,非天然氨基酸可以是相同的,也可以是不同的(如蛋白可能包含两个或多个不同类型的非天然氨基酸,或者包含两个相同的非天然氨基酸。对于一个给定的含两个以上非天然氨基酸的蛋白来说,非天然氨基酸可以是相同的,也可以是不同的,也可以是多个非天然氨基酸与至少一个不同的非天然氨基酸的组合。

编码本发明的肽产物的核酸可在细胞的翻译系统内表达以大量制备含非天然氨基酸或异常氨基酸的蛋白产物。在一个方面,组合物可以包含至少10μg、至少50μg、至少75μg、至少100μg、至少200μg、至少250μg、至少500μg、至少1mg、至少10mg或更多含5-HTPP的蛋白质,或者所含蛋白的量为体内蛋白制备方法所能达到的量(本文提供了重组蛋白制备和纯化方法的详细描述)。在另一方面,组合物内存在的蛋白浓度可以是每升细胞培养介质、细胞裂解物、缓冲液、药用缓冲液或其他液体悬液中至少含10μg、至少50μg、至少75μg、至少100μg、至少200μg、至少250μg、至少500μg、至少1mg、至少10mg或更多蛋白质(如总体积为约1nL到约100nL或更多)。利用细胞大量(一般要超过其他方法如体内翻译所能达到的量)制备至少含1个5-HTPP的蛋白质是本发明的一个特征。

掺入有色氨酸衍生物的全蛋白质的应用

利用本发明的方法进行蛋白的修饰表达,如掺入非天然氨基酸,可以为医学、分析学、制造业和加工业提供有用的产物。治疗性蛋白可以被改造以提高其生物利用度、降低其毒性、增强其稳定性、提供新活性、提高其活性、提供连接位点、提高其可描绘性等。诊断蛋白可能会有新的机会进行化学连接、与标记物进行更特异的连接、提供更强的信号、更易于从其他蛋白中改造出来等。工业用蛋白可以被改造使其具有新的活性、活性得以提高、稳定性得以增强、提高与催化表面的连接能力、底物特异性得以改变等。

在肽内掺入5-HTPP可以复合物或纯化混合物中肽产物的灵敏检测和准确测定提供独特的荧光信号。与色氨酸相比,5-HTPP所具有的荧光激发光谱和发射光谱明显偏移、例如,含色氨酸残基的肽所具有的最大荧光发射波长λmax为367nm,而用5-HTPP替换色氨酸后的λmax为334nm。天然氨基酸和5-HTPP修饰肽之间发射光的差异超过10倍。仔细调整激发波长可用于进一步增大发射光的差异。利用本发明的这些技术和其他技术,通过观察色氨酸荧光背景信号就可以将掺入有5-HTPP的蛋白与其他蛋白质或修饰肽自身内的色氨酸区分开来。

在另一方面,掺入有5-HTPP的肽可作为探针用于检测某些相互作用。例如,肽可以被修饰使其在肽链的目的区插入有5-HTPP。根据5-HTPP荧光信号的偏移或淬灭就可以检测该区与其他蛋白或细胞膜的相互作用。

肽内掺入5-HTPP可提供独特的连接化学特性。溶液内掺入的5-HTPP在存在电位的情况下可经历氧化还原反应生产活化的色氨酸-4,5-dione。这个活化的基团可与其他反应性分子形成共价键,因此可用于在肽上连接连接子基团或可检测标记物。另外,5-HTPP修饰的肽可在合适电位的影响下发射交联。在一个优选实施方式中,可以通过提供合适的pH和确定合适的电压如约400mV到1000mV来控制含修饰肽的溶液内的交联反应的时程。

                            实施例

下面所提供的实施例是为了说明本发明,而不是对本发明权利要求的限制。应当理解的是本文所描述的实施例和实施方式仅仅是为了说明的目的,本领域的技术人员根据本发明的精神对本发明作出各种修改和改变也是可以的,也包括在本申请的精神和范围以及所附权利要求的范围之内。

实施例-肽内5-HTPP的正交插入

制备正交色氨酰-tRNA合成酶(O-TrpRS)-乳白抑制子(mutRNAUCATrp)对用于哺乳动物细胞。将枯草芽孢杆菌tRNATrp的反密码环突变成UCA,突变D臂上的3个位置生成内部启动子序列,并将mutRNAUCATrp基因插入到来自阿布属(Arabidopsis)的tRNATrp1基因的3’和5’侧翼序列之间以增强其在哺乳动物细胞内的表达。体外氨酰化水平分析和体内乳白抑制型分析结果表明枯草芽孢杆菌TrpRS(BsTrpRS)可加载同源的mutRNAUCATrp,但是不能加载哺乳动物内源性翻译系统的内源性tRNA。同样,mutRNAUCATrp可被枯草芽孢杆菌TrpRS特异性加载,但是不被哺乳动物细胞的内源性合成酶加载。因而位点定向的正交突变可用于改变BsTrpRS的特异性,使其只加载5-羟基-L-色氨酸(5-HTTP)。所得到的突变BsTrpRS-mutRNAUCATrp正交对可将5-HTPP有效而特异地掺入到哺乳动物蛋白内以响应密码子TGA。这个氨基酸可被插入到独特的荧光探针肽和/或作为原位蛋白交联剂的肽内。

材料和方法

概述  哺乳动物细胞用Fugene 6试剂(Roche)转染。放射性标记的氨基酸购自Perkin Elmer(Boston,MA),寡核苷酸购自Proligo(La Jolla,CA)。基因组DNA来自ATCC(Manassas,VA)。抗体、抗生素和TRIZOL溶液购自Invitrogen(Carlsbad,CA)。V5-抗体固定的琼脂糖购自Bethyl Laboratories,Inc.(Montgomery,TX)。5-羟基-L-色氨酸购自Sigma(St.Louis,MO),无需进一步纯化就可以使用。Nucleobond色谱柱购自Clontech(Palo Alto,CA)。

菌株和细胞系  大肠杆菌菌株DH10B和TOP10用于质粒扩增和分离。人肾293T细胞用于非天然氨基酸向蛋白质内的掺入。

质粒编码枯草芽孢杆菌TrpRS(BsTrpRS)的DNA片段通过聚合酶链式反应(PCR)从基因组DNA中扩增,然后克隆到pMH4载体(GNF,La Jolla,CA)的XhoI-PacI位点。所得到的质粒pMHTrpRS用于在大肠杆菌内表达N端为His6纯化标记的BsTrpRS。为了在哺乳动物细胞内表达BsTrpRS,将编码合成酶的PCR片段连接到pEF6-V5-His6-TOPO载体(Invitrogen,Carlsbad,CA)内。所得到的质粒pEF6-TrpRS编码C端为V5和His6表位标记的枯草芽孢杆菌TrpRS。利用QuikchangeXL(Stratagene,La Jolla,CA)和突变引物通过位点定向突变技术在这个载体内制备一系列突变的合成酶。

抑制型mutRNAUCATrp基因解链两个寡聚脱氧核苷酸构建。第一个寡聚脱氧核苷酸编码相应的mutRNAUCATrp序列,该序列被融合到tRNATrp1基因的5’侧翼序列(AAAATTAATTAAACGTTTAGAAATATATAGATGAACTTTATAGTACAA,SEQ ID NO:5)上。第二个寡聚脱氧核苷酸编码相应的mutRNAUCATrp,该序列被融合到3’侧翼序列GTCCTTTTTTTG(SEQ ID NO:6)上。Klenow片段被用于制备双链DNA,制备出的DNA被插入到pZeoSV2(+)(Invitrogen,Carlsbad,CA)的PstI和XhoI位点内。所得到的质粒pTrptRNA用于在哺乳动物细胞内转录mutRNAUCATrp

以前的研究表明质粒pFoldon可在293T细胞内表达噬菌体T4 fibritin foldon区,该质粒是通过将PCR扩增基因片段插入到pCDA3.1-V5-His-TOPO载体(Invitrogen,Carlsbad,CA)内构建的。编码Trp68TGA foldon突变体的pFoldonTGA是利用QuikchangeXL方法及其相应的HPLC纯化引物通过位点定向突变构建的。

在哺乳动物细胞内表达和检测mutRNAUCATrp。哺乳动物293T细胞用质粒pTrptRNA转染后在37℃、5%CO2中孵育60小时。利用TRIZOL溶液按照厂家的说明书(Invitrogen)提取细胞RNA,然后利用NucleoBond分离柱按照厂家的说明书(Clontech)分离总tRNA。用3%琼脂糖凝胶分析纯化出的tRNA的产量和纯度。为了检测mutRNAUCATrp,纯化出的tRNA首先点样,然后利用Stratalinker 2400(Stratagene)通过UV照射1分钟交联到尼龙转移膜(Osmonics,Westborough,MA)。照射后将膜置于100ml杂交缓冲液(0.9M NaCl,0.09M柠檬酸钠,pH 7.0,1%SDS,含25μg/ml鱼精DNA的5×Denhardt试剂)中孵育,68℃温和振荡1小时。与抑制型tRNA的27到44位核苷酸互补的寡核苷酸CGGAGGTTTTGAAGACCTCTGCT(SEQ ID NO:7)用[γ-32P]ATP进行5’标记,用作探针在50℃的条件下与膜杂交6小时。然后用洗涤缓冲液(15mM NaCl,1.5mM sodium,pH 7.0,0.1% SDS)洗涤膜3次。利用PhosphorImager(Molecular Dynamics)定量测定每个点上的信号强度。

枯草芽孢杆菌TrpRS在哺乳动物293T细胞内的表达  细胞用质粒pEF6-TrpRS转染后在37℃、5%CO2中孵育60小时。收获细胞,用1×被动裂解缓冲液(Promega,Madison,WI)裂解,细胞裂解物20,000×g离心。用变性的SDS聚丙烯酰胺凝胶电泳分离蛋白,然后转移到硝酸纤维素膜上进行蛋白印迹分析。蛋白与一抗抗His6抗体杂交,然后与二抗辣根过氧化物酶标记的羊抗兔IgG反应。用底物(SuperSignal WestDura,Pierce)使信号显色。

体外氨酰化分析  氨酰化分析基本按照《酶学方法113》,55-59页,Hoben,P.& Soil,D.,(1985)所描述的方法进行,以评价本发明的RS和tRNA。20μL反应液中包含50mM Tris-HCl,pH 7.5,30mM KCl,20mM MgCl2,3mM谷胱甘肽,0.1mg/ml BSA,10mM ATP,1μM(33Ci/mM)L-[5-3H]-色氨酸,750nM合成酶和20μM纯化的总tRNA。试验进行到10%的转化。

哺乳动物细胞内的乳白型抑制  转染所用的试剂为Fugene 6,每个9.5cm2的培养皿共转染2μg DNA,按厂家的说明书(Roche)操作。极限必需α培养基(Gibco BRL)用作培养介质。转染后48小时制备细胞提取物,然后进行SDS聚丙烯酰胺凝胶电泳,利用抗V5抗体(Invitrogen)和SuperSignal West Dura免疫检测系统(Pierce)进行蛋白印迹分析,通过使膜暴露于Hyperfilm MP(Amersham Pharmacia)来检测所产生的信号。

哺乳动物细胞内非天然氨基酸的掺入  按照上面所描述的方法用质粒pTrptRNA、pFoldonTGA和突变的pEF6-TrpRS(即pVal144ProBsTrpRS)共转染293T细胞。24小时后,培养基换成含1mM 5-羟基-L-色氨酸和适宜抗生素的极限必需α培养基。在37℃、5%CO2中培养48小时后收获细胞,用1×被动裂解缓冲液(Promega,Madison,WI)裂解,通过20,000×g离心收集细胞裂解物。利用Ni-NTA小珠再利用抗V5抗体固定的琼脂糖小珠按照厂家的说明书(Bethyl Laboratories,Montgomery,TX)从细胞裂解物(20个50ml培养板)中纯化含5-羟基-L-色氨酸的foldon蛋白。取一些纯化的蛋白进行高分辨率电离质谱分析。

荧光分光光度镜检查  用pH7.5的10mM K2PO4、100mM KCl缓冲液稀释蛋白使其终浓度达到50nM。在Fluromax-2荧光分光光度计测定荧光光谱并加以校正。用4nm的激发带通记录激发光谱,用4nm的发射带通记录发射光谱。

含5-羟基-L-色氨酸的蛋白质的电化学特征  一种常规的三电极单元,其中包括一个金电极,一个用玻璃材料制成的剥离碳辅助电极和一个连接有含工作液的Luggin毛细管的饱和甘汞电极(SCE),用于电化学检测。细胞置于接地的Faraday盒内。利用连接到网络操作软件EC-Lab v6.61上的电势恒定器(Princeton Applied Research,model VMP2,Oak Ridge,TN)进行环形伏安测量。所有的电化学测量都在氩气环境中在0.1M的磷酸盐缓冲液,pH7.4中进行。底物5-HTPP溶解到100mM磷酸盐缓冲液中,终浓度为10μg/mL。在0-800mV的范围内以1V/秒的扫描速率测定电位。对于交联试验来说,电极电位设定为800mV,在氩气环境、10μg/mL野生型foldon或5-HTPP-foldon蛋白、0.1M磷酸盐缓冲液(pH 7.4)存在的情况下进行30分钟。然后收集溶液,蛋白通过透析脱盐,浓缩后加样到凝胶上做进一步分析。

结果和讨论

哺乳动物细胞内所使用的正交乳白抑制型  tRNA为了编码哺乳动物细胞内的非天然氨基酸,我们制备了不被哺乳动物内源性翻译系统内任何氨酰tRNA合成酶识别的正交tRNA(O-tRNA),但是这种氨酰tRNA合成酶可有效掺入其同源氨基酸以响应独特的密码子,如乳白无意义密码子TGA。本发明还提供了其相应的(配对互补的)正交氨酰-tRNA合成酶(O-RS),该O-RS可特异性地识别O-tRNA并用非天然氨基酸选择性(优先)地加载它,但是不能用内源性的氨基酸加载它。O-RS/O-tRNA正交对的制备利用了tRNA识别元件的种间差异。例如,文献报道枯草芽孢杆菌tRNATrp一般都不是酵母和哺乳动物细胞色氨酸-tRNA合成酶的底物。另外,其他的动力学研究表明这个tRNA的反密码环的突变对同源枯草芽孢杆菌TrpRS的氨酰化只有很小的影响(<5%)。因此,枯草芽孢杆菌tRNATrp是制备哺乳动物细胞内正交抑制型tRNA的良好候选者。

但是,令我们惊奇的是,通过RNA印迹分析转染有序列的293T细胞来源的总tRNA没有检测到枯草芽孢杆菌tRNATrp。因而需要对枯草芽孢杆菌抑制型tRNATrp序列(见图1)进行一系列修饰。真核生物的转运RNA是由RNA聚合酶III转录的,该酶可识别两个保守的基因内转录调控元件,A盒和B盒。由于枯草芽孢杆菌tRNATrp序列只含有B盒,因此将核苷酸A7、A9和U11分别突变成G7、G9和C11以制备假A盒。为了保留正确的臂结构,所得到的错配的碱基对U7-U64和C11-A23分别用G7-C64和C11-G23替换。已知真核生物内tRNATrp基因的表达依赖于5’侧翼序列,该序列明显富含AT,并且包含几个可能的TATA元件。因此,需要添加5’侧翼序列,该序列来源于阿布属(Arabidopsis)(Trpl)的tRNATrp1基因,以前的研究证实该序列可增强植物tRNATrp基因在人293T细胞内的转录。由于正确定位的终止子元件只有植物tRNATrp基因有效表达所需的3’侧翼序列,因此我们使用了同一个tRNATrp1基因来源的3’侧翼序列。最后,三核苷酸反密码子序列CCA突变成乳白抑制型密码子UCA(C33U)。

经修饰的乳白抑制型tRNATrp(mutRNAUCATrp)的表达通过RNA印迹分析来验证。突变的tRNAUCATrp基因与其5’和3’侧翼序列一起被克隆到哺乳动物载体pZeoSV2(+)内,所得质粒用Fugene 6转染到人293T细胞内。然后分离总tRNA并点到膜上。人293T细胞、牛肝和大肠杆菌来源的相同量的总tRNA作为对照也转移到同一个膜上(图2A)。[γ-32P]ATP标记的与mutRNAUCATrp的27-44核苷酸互补的合成寡核苷酸作为与mutRNAUCATrp杂交的探针。只有从293T转染细胞中分离出的总tRNA产生了信号(图2B的4道);与放射性寡核苷酸探针共孵育后对照tRNA没有产生信号(图2B的1-3道)。这些结果说明mutRNAUCATrp在哺乳动物细胞内得到了表达。

BsTrpRS是哺乳动物细胞的正交合成酶  已知哺乳动物正交抑制型tRNA的生物利用度,我们下一步要检测的是其相应的BsTrpRS是否能有效氨酰化mutRNAUCATrp而不能氨酰化内源性的哺乳动物tRNA。为了确定mutRNAUCATrp被BsTrpRS氨酰化的效率,我们用从大肠杆菌中纯化出的BsTrpRS进行体外氨酰化分析。质粒pMHTrpRS用于表达含N端His6纯化标记的BsTrpRS,位于L-阿拉伯糖启动子的控制之下。用Ni-NTA亲和层析纯化BsTrpRS,产率为5mg/L。然后用3H-标记的色氨酸和各种总tRNA进行体外氨酰化分析。结果发现BsTrpRS可有效地加载含同源枯草芽孢杆菌tRNATrp的枯草芽孢杆菌来源的总tRNA。与发表的文献数据一样,在可检测水平上,BsTrpRS不能氨酰化293T细胞来源的哺乳动物总tRNA。但是表达tRNAUCATrp的293T转染细胞来源的总tRNA可被BsTrpRS用3H-色氨酸有效加载。哺乳动物总tRNA中BsTrpRS对mutRNAUCATrp的氨酰化活性的总体水平约为对细菌总tRNA中枯草芽孢杆菌tRNATrp氨酰化活性的40%,这可能是由于哺乳动物细胞mutRNAUCATrp的表达水平较低。但是,这个试验显示BsTrpRS可有效加载mutRNAUCATrp,更为重要的是,BsTrpRS不能将哺乳动物内源性tRNA氨酰化到任何可检测的水平上。

可利用质粒pEF6-TrpRS在哺乳动物细胞内表达BsTrpRS,该质粒含有位于人启动子EF-1α控制之下的含C端His6标记的BsTrpRS基因。利用Fugene 6将质粒pEF6-TrpRS瞬时转染到哺乳动物293T细胞内。通过SDS-PAGE分离细胞裂解物内的蛋白质,然后用抗C端V5抗体探针进行蛋白印迹分析。可以看到全长原核BsTrpRS蛋白(~36kDa)相应的条带,这说明合成酶在哺乳动物细胞内的表达可达到可检测水平上(图4的1道)。外源性的枯草芽孢杆菌TrpRS的表达对细胞的生长速度没有明显的影响。

293T细胞内的乳白型抑制依赖于BsTrpRS-mutRNAUCATrp正交对的表达我们检测了mutRNAUCATrp-BsTrpRS正交对在哺乳动物细胞内有效抑制乳白型突变的能力。突变噬菌体T4 fibritin foldon构建体使其Trp68的密码子突变成乳白密码子(TGA)作为抑制试验的底物。根据上面的数据,位于foldon蛋白内部的Trp68突变成色氨酸类似物不可能打破这个蛋白的结构。为了检测全长foldon蛋白的表达,通过重组DNA技术将V5表位检测标记和His6纯化标记融合道野生型蛋白(pFoldonWT)和突变foldon蛋白(pFoldonTGA)的C端。将这些foldon表达构建体与BsTrpRS和mutRNAUCATrp构建体中的一个或两个一起转染到人293T细胞内。利用抗V5抗体通过蛋白印迹分析细胞提取物来检测表达的全长蛋白。

当293T细胞只用突变的foldon构建体(pFoldonTGA)(图3的1道)转染或者用突变的foldon构建体与野生型BsTrpRS(图3的2道)一起转染时没有检测到全长蛋白的表达。这些结果说明人293T细胞不含TGA68突变的内部乳白抑制型tRNA。另外,在只有mutRNAUCATrp而没有野生型BsTrpRS(图3的3道)的情况下也没有观察到乳白突变的抑制,说明mutRNAUCATrp不能被人293T细胞内的内源性合成酶加载。但是,在mutRNAUCATrp、野生型BsTrpRS和TGA68突变foldon基因存在的情况下可检测到全长蛋白的表达(图3的4道)。与此相对的是,5道显示的是293T细胞内野生型(wt)foldon蛋白的表达。根据4道和5道蛋白印迹信号的整合可以计算出抑制效率约为38%。这些试验与上述的体外氨酰化分析一起说明BsTrpRS只氨酰化mutRNAUCATrp,而不能氨酰化哺乳动物内源性的tRNA,表达的mutRNAUCATrp只能被其同源的BsTrpRS加载,而不能被哺乳动物内源性的合成酶加载。因此,枯草芽孢杆菌TrpRS-mutRNAUCATrp代表了可在哺乳动物细胞和翻译系统内发挥功能的正交对。

这个tRNATrp-TrpRS同源正交对(都来源于枯草芽孢杆菌)的抑制效率明显高于已报道的嗜热脂肪芽孢杆菌(B.stear)的异源对(K.Sakamoto等,N.A.Res.,第30卷,No.21 4692-4699,(2002))。tRNATyr-E.c.TyrRS在哺乳动物细胞内的抑制效率,与已报道的人抑制型RNATyr和其他抑制型tRNA在哺乳动物细胞内的抑制效率相似(20-40%)。Sakamoto的研究表明含有9个抑制型tRNA拷贝基因簇的构建体可有效增强在哺乳动物细胞内的抑制效率。但是,这种方法不适用于本实施例,因为通过蛋白印迹分析发现单拷贝的mutRNAUCATrp基因就足以抑制TGA68密码子,在可检测的水平上可产生全长蛋白质(≥10pg/cell)。另外,在较高的转染水平上产生了毒性(4μg对2μg质粒pTrptRNA/106细胞),说明对于293T细胞内的这些mutRNAUCATrp构建体来说,多拷贝的抑制是不需要的。

在哺乳动物细胞内位点特异性地掺入5-羟基L-色氨酸(5-HTPP)我们下一步需要了解的是mutRNAUCATrp-BsTrpRS正交对能否用于将5-羟基-色氨酸(5-HTPP)选择性地掺入到哺乳动物细胞的蛋白质内以响应乳白无意义密码子。这个氨基酸具有独特的光谱学特征和氧化还原特性,可以作为探针在体外和体内检测蛋白质的结构和功能。已知野生型枯草芽孢杆菌TrpRS不能利用5-HTTP作为底物。因此,为了利用BsTrpRS将5-HTPP选择性地掺入到蛋白质内,需要突变合成酶的活性位点使其能加载5-HTPP而不能加载色氨酸。虽然还不了解BsTrpRS的结构用于对该蛋白进行改造,但是对类似的嗜热脂肪芽孢杆菌翻译系统来源的高度同源的色氨酰-tRNA合成酶来说,我们对其结构的了解已经达到1.9的分辨率。这个酶的活性位点具有图8类似的形状,具有两个相邻的结合袋,这两个结合袋被α螺旋肽分开,该螺旋肽由残基Asp140、Ile141、Val142、Pro143、Val144和Gly145组成。Val144直接对着色氨酸的C5,与位置5上具有其他取代化学基团的任何色氨酸的相互作用都不理想。将Val144突变成较小的氨基酸从逻辑上来说可能是一种为取代的色氨酸类似物提供空间的方法。

为了验证这种想法,通过位点定向突变技术将野生型BsTrpRS的Val144突变成其他19种氨基酸中的任何一种,然后筛选这些突变,检测其用5-HTPP氨酰化mutRNAUCATrp的能力,及其抑制突变foldon构建体上TGA68的能力。转染的细胞在有或无1mM 5-HTPP的条件下生长,用抗V5抗体通过蛋白印迹分析细胞提取物以检测全长蛋白质(图4)。从理论上说,在5-HTPP存在的条件下如果有全长foldon蛋白的表达就说明5-HTPP或天然氨基酸(可能是色氨酸)被插入到foldon蛋白的位置68上。天然氨基酸的其他掺入方式可以被排除,因为在相同的条件下如果没有5-HTPP就检测不到全长蛋白的表达。在本实施例中,19个TrpRS突变中只有Val144Gly突变在存在1mM 5-HTPP和mutRNAUCATrp的情况下可抑制可抑制TGA68密码子。但是,如果没有5-HTPP,突变的BsTrpRS和mutRNAUCATrp也能抑制乳白突变,说明Val144GlyBsTrpRS突变体也能加载天然氨基酸。只有一个TrpRS突变体Val144ProBsTrpRS在存在1mM 5-HTPP和mutRNAUCATrp的情况下可抑制可抑制TGA68突变(图4的5道)。另外,含Val144ProBSTrpRS和TGA68 foldon基因的人293T细胞在没有5-HTPP或mutRNAUCATrp的情况下不能产生全长蛋白(图4的2-4道。这些结果表明Val144ProBsTrpRS突变体可选择性地用5-HTPP,而不能用任何内源性的天然氨基酸氨酰化mutRNAUCATrp。每升培养物所产生的HTPP68突变蛋白的产量约为100μg,产生野生型蛋白的产量约为1mg/升,说明在含1mM 5-HTPP的培养基内所具有的活性只要天然活性的约10%。

为了确定所表达的突变蛋白是否含有5-HTPP,首先通过Ni-NTA亲和层析纯化蛋白,然后利用抗V5固定的琼脂糖小珠通过免疫沉淀方法纯化。将一部分纯化的蛋白进行高分辨率的电离(ESI)质谱分析。HTPP68突变蛋白的理论分子量为14323.6Da;所检测到分子量为14323.69Da。没有检测到野生型foldon蛋白相应的峰。这个结果证明5-HTPP以高保真度(>97%)掺入到哺乳动物细胞的蛋白内以响应乳白密码子。

正交氨酰化活性的特征  研究发现Val144ProBsTrpRS突变体可用5-HTPP选择性地氨酰化mutRNAUCATrp,其活性与许多内源性的RS/tRNA对相似。例如,如果正交对对天然色氨酸底物的活性未被检测到,而对5-羟色氨酸底物的米氏常数(Km)和催化速率常数(kcat)所处的范围与内源性组分所处的范围类似,那么这个正交对就是选择性的。这些Val144ProBsTrpRS-mutRNAUCATrp对对5-HTPP的选择性至少是翻译系统中天然色氨酰的33倍。这种催化活性与许多内源性RS/tRNA对对其天然氨基酸底物的催化活性相似。

多少有些让人惊奇的是BsTrpRS活性位点内的单个突变就完全使其底物特异性从L-色氨酸改变为5-HTPP。利用计算机辅助模型(Macromodel version 8.1,Schrodinger,LLC.)分析这种特异性,结果发现Val144Pro突变为吲哚环的转动提供了空间,并且吲哚NH-Asp之间的氢键消失。这就可以解释为什么Val144ProBsTrpRS不能加载L-色氨酸了。但是,5-HTPP的5-OH基团与His44的咪唑侧链及Asp133的羧化基团之间,以及5-HTPP的吲哚NH与Ser7的羟基之间又可以形成新的氢键(如图5所示)。其他位点发生随机突变的BsTrpRS(和其他RS)突变体文库也可以利用计算机模型进行相似的研究,和/或在实验室中进行筛选以获得能选择性识别其他侧链结构的突变体。

以5-HTPP为探针研究蛋白质的结构和功能  5-羟基-L-色氨酸在310nm、pH 7.5有明显的吸收(ε=2450M-1cm-1),与此相对的是色氨酸在310nm处的吸收(ε=62M-1cm-1),这说明5-HTPP是蛋白质内有用的分光光度探针。野生型foldon蛋白只有一个色氨酸残基,在突变foldon蛋白内该残基被5-HTPP取代。为了比较这两种蛋白的荧光特性,我们纯化了这两种蛋白,在310nm、pH7.4的条件下进行激发并记录其发射光谱(见图6)。结果发现HTPP68 foldon蛋白的最大发射波长λmax为334nm(点线),而野生型foldon蛋白的荧光λmax为367nm(实线)。如果两种蛋白都在310nm处激发,HTPP68foldon蛋白在334nm处的荧光发射强度比野生型foldon蛋白高11倍。这种光谱偏移可使5-HTPP成为某些用途的光学探针。

5-HTPP也可以发生氧化还原反应形成色氨酸-4,5-二酮。环形伏安测量法用于确定HTPP68foldon突变体内是否能观察到5-HTPP的氧化还原波。测定含10μM HTPP、wt foldon或foldon突变体的溶液的伏安测量反应。只有在存在突变foldon的情况下或在含游离5-HTPP的溶液中才检测到来自HTPP氧化作用的阳极电流,分别为E=400mV和E=450mV,说明突变foldon中存在5-HTPP。突变蛋白的氧化电位轻微下降可能是由于水溶液中氧化形式和还原形式的5-HTPP对疏水性蛋白核心的稳定化作用不同而造成的。在试图氧化野生型foldon蛋白时没有检测到电流。

一旦5-HTPP在800mV、7.4的磷酸盐缓冲液中发生点化学氧化作用就会形成二聚物(1,图7A)。同样,5-HTPP可通过谷胱甘肽上的半胱氨酸残基氧化交联到谷胱甘肽上(2,图7A)。因此,选择性掺入到蛋白质内的5-HTPP可用作氧化还原作用的交联子。为了验证这种假设,我们尝试着通过电化学方法交联HTPP68foldon突变体,方法是将800mV的正电位加到溶液的工作电极上,其中的溶液含有HTPP68foldon蛋白或野生型foldon,溶液为磷酸盐缓冲液,作用时间30分钟。所得到的蛋白脱盐,浓缩,然后用4-20%梯度的变性SDS-PAGE分离。得到的凝胶用考马斯染色(图7B)。1道是分子量为14.5kDa的全长HTPP68foldon突变体。3道是具有相同分子量的野生型foldon蛋白。2道是HTPP68foldon蛋白的电化学氧化产物,其分子量约为29kDa,对应二聚化的突变foldon蛋白。根据条带的密度判断产率为80%。与此相对的是,4道上没有交联产物,该道为相同条件下的野生型foldon蛋白。这个结果表明HTPP68foldon全蛋白质可通过其掺入的5-HTPP形成交联蛋白。

上面所描述的本发明的某些细节是为了说明和理解的目的,对于本领域的技术人员来说,通过阅读本说明书就可以对形式和细节作出各种修改而不偏离本发明真实范围。例如,上面所描述的许多技术和构建体可以各种方式组合使用,或者利用其他的突变体或底物。

本申请所引用的所有出版物、专利、专利申请和/或其他文献都已完整纳入本文作为参考,这就如同各个出版物、专利、专利申请和/或其他文献皆被明确并独立地纳入本文作为参考。

                             序列表

<110>斯克利普斯研究院(The Scripps Research Institute)

     张致文(Zhang,Zhiwen)

     L.阿方达(Alfonta,Lital)

     P.舒尔茨(Schultz,Peter)

<120>在哺乳动物细胞的蛋白质内选择性地掺入5-羟色胺

<130>54A-001020PC

<160>7

<170>PatentIn version 3.2

<210>1

<211>993

<212>DNA

<213>人工的

<220>

<223>编码枯草芽孢杆菌色氨酰-tRNA合成酶Val144Pro突变体

<400>1

atgaaacaaa cgattttttc aggcattcag ccaagcggct cagtgacgct cggcaactat   60

atcggtgcaa tgaagcagtt tgtcgaactg cagcatgatt ataacagcta tttttgcatc  120

gtcgatcagc atgcgataac tgttcctcaa gaccggcttg agcttagaaa gaatatccgc  180

aatctcgcgg cgctttactt agctgtcgga cttgatccag aaaaagcaac attgtttatt  240

cagtcagagg tccccgcaca tgcgcaggcc ggatggatga tgcagtgtgt cgcctatatc  300

ggcgagcttg agcggatgac tcaatttaag gacaaatcca aaggcaatga agctgtcgtc  360

tccggcctgt taacatatcc gccgctgatg gccgctgata ttctgctgta cggaacggat  420

cttgtacctc ccggcgagga tcaaaagcag caccttgagc tgacgcggaa tcttgcagaa  480

cgcttcaaca aaaaatacaa cgacatcttt acgattccgg aagtgaaaat tccaaaagtc  540

ggtgcacgta tcatgtctct gaatgatccg ctgaagaaaa tgagcaaatc tgatccgaat  600

cagaaagctt atattacatt gctggatgag ccgaagcagc ttgaaaagaa aatcaaaagc  660

gcagtaacgg attctgaagg cattgtcaaa tttgataagg aaaacaaacc gggcgtttcc  720

aaccttctta caatttattc aatcctcggc aatacgacaa ttgaagagct tgaagcaaag  780

tacgaaggaa aaggctacgg cgagtttaaa ggtgatttgg cagaagtcgt agtgaacgca  840

ttaaaaccga tccaggaccg ctattacgag ctgatagaat ctgaagaatt agaccggatt  900

cttgatgaag gcgcggaacg agcgaatcgg acagcaaaca aaatgctgaa aaaaatggag  960

aatgccatgg gtcttggaag aaaaagacgc taa                               993

<210>2

<211>330

<212>PRT

<213>人工的

<220>

<223>枯草芽孢杆菌色氨酰-tRNA合成酶的Val144Pro突变体

<400>2

Met Lys Gln Thr Ile Phe Ser Gly Ile Gln Pro Ser Gly Ser Val Thr

1               5                   10                  15

Leu Gly Asn Tyr Ile Gly Ala Met Lys Gln Phe Val Glu Leu Gln His

            20                  25                  30

Asp Tyr Asn Ser Tyr Phe Cys Ile Val Asp Gln His Ala Ile Thr Val

        35                  40                  45

Pro Gln Asp Arg Leu Glu Leu Arg Lys Asn Ile Arg Asn Leu Ala Ala

    50                  55                  60

Leu Tyr Leu Ala Val Gly Leu Asp Pro Glu Lys Ala Thr Leu Phe Ile

65                  70                  75                  80

Gln Ser Glu Val Pro Ala His Ala Gln Ala Gly Trp Met Met Gln Cys

                85                  90                  95

Val Ala Tyr Ile Gly Glu Leu Glu Arg Met Thr Gln Phe Lys Asp Lys

            100                 105                 110

Ser Lys Gly Asn Glu Ala Val Val Ser Gly Leu Leu Thr Tyr Pro Pro

        115                 120                 125

Leu Met Ala Ala Asp Ile Leu Leu Tyr Gly Thr Asp Leu Val Pro Pro

    130                 135                 140

Gly Glu Asp Gln Lys Gln His Leu Glu Leu Thr Arg Asn Leu Ala Glu

145                 150                 155                 160

Arg Phe Asn Lys Lys Tyr Asn Asp Ile Phe Thr Ile Pro Glu Val Lys

                165                 170                 175

Ile Pro Lys Val Gly Ala Arg Ile Met Ser Leu Asn Asp Pro Leu Lys

            180                 185                 190

Lys Met Ser Lys Ser Asp Pro Asn Gln Lys Ala Tyr Ile Thr Leu Leu

        195                 200                 205

Asp Glu Pro Lys Gln Leu Glu Lys Lys Ile Lys Ser Ala Val Thr Asp

    210                 215                 220

Ser Glu Gly Ile Val Lys Phe Asp Lys Glu Asn Lys Pro Gly Val Ser

225                 230                 235                 240

Asn Leu Leu Thr Ile Tyr Ser Ile Leu Gly Asn Thr Thr Ile Glu Glu

                245                 250                 255

Leu Glu Ala Lys Tyr Glu Gly Lys Gly Tyr Gly Glu Phe Lys Gly Asp

            260                 265                 270

Leu Ala Glu Val Val Val Asn Ala Leu Lys Pro Ile Gln Asp Arg Tyr

        275                 280                 285

Tyr Glu Leu Ile Glu Ser Glu Glu Leu Asp Arg Ile Leu Asp Glu Gly

    290                 295                 300

Ala Glu Arg Ala Asn Arg Thr Ala Asn Lys Met Leu Lys Lys Met Glu

305                 310                 315                 320

Asn Ala Met Gly Leu Gly Arg Lys Arg Arg

                325                 330

<210>3

<211>71

<212>RNA

<213>人工的

<220>

<223>突变型乳白抑制型tRNA

<400>3

aggggcgugg cuuaacggua gagcagaggu cuucaaaacc uccggugugg guucgauucc  60

uaccgccccu g                                                       71

<210>4

<211>74

<212>RNA

<213>枯草芽孢杆菌(Bacillus subtilis)

<400>4

aggggcauag uuuaacggua gaacagaggu cuccaaaacc uccggugugg guucgauucc  60

uacugccccu gcca                                                    74

<210>5

<211>48

<212>DNA

<213>阿布属(Arabidopsis sp.)

<400>5

aaaattaatt aaacgtttag aaatatatag atgaacttta tagtacaa               48

<210>6

<211>12

<212>DNA

<213>阿布属(Arabidopsis sp.)

<400>6

gtcctttttt tg                                                      12

<210>7

<211>23

<212>DNA

<213>人工的

<220>

<223>寡核苷酸探针

<400>7

cggaggtttt gaagacctct gct                                          23

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号