首页> 中国专利> 重组II型限制性内切核酸酶MmeI和相关内切核酸酶以及制备这些酶的方法

重组II型限制性内切核酸酶MmeI和相关内切核酸酶以及制备这些酶的方法

摘要

根据本发明,提供一种编码重组II型限制性内切酶MmeI的DNA(脱氧核糖核酸)片段。这种酶具备两种相关的酶学功能;一个是识别DNA序列5’-TCC(Pu)AC-3’的内切酶活性,并在如箭头标记的地方剪切DNA:5’-TCCRAC(N20)↓-3’和3’-AGGYTG(N18)↑-5’,另一个酶活性是识别同样的DNA序列5’-TCC(Pu)AC-3’,但是通过增加甲基的方式来修饰该序列以防止MmeI内切酶活性的剪切。

著录项

  • 公开/公告号CN1668740A

    专利类型发明专利

  • 公开/公告日2005-09-14

    原文格式PDF

  • 申请/专利权人 新英格兰生物实验室公司;

    申请/专利号CN03816564.3

  • 申请日2003-07-10

  • 分类号C12N15/00;C12N15/09;C12N15/11;C12N15/64;C12N15/66;

  • 代理机构11245 北京纪凯知识产权代理有限公司;

  • 代理人赵蓉民;路小龙

  • 地址 美国麻萨诸塞州

  • 入库时间 2023-12-17 16:29:32

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2015-09-02

    未缴年费专利权终止 IPC(主分类):C12N15/00 授权公告日:20100224 终止日期:20140710 申请日:20030710

    专利权的终止

  • 2010-02-24

    授权

    授权

  • 2005-11-16

    实质审查的生效

    实质审查的生效

  • 2005-09-14

    公开

    公开

说明书

发明背景

本发明涉及DNA(脱氧核糖核酸)片段,该片段编码具有两种相关的酶功能的多肽,一个酶功能是识别DNA序列5’-TCC(Pu)AC-3’并且剪切位于这个识别序列3’端第20和第21个残基之间的磷酸二酯键以及互补链上的识别序列5’-GT(Py)GGT-3’的5’端第18和19个残基之间的磷酸二酯键,从而产生具有两个碱基的3’粘末端(以下称为MmeI限制性内切酶),而第二个酶活性是识别同样的DNA序列,5’-TCC(Pu)AC-3’,但是通过增加一个甲基来修饰这段序列以防止内切酶MmeI的剪切。本发明还涉及含有该DNA片段的载体、含有该DNA片段的转化宿主,以及从这样的转化宿主中制备出MmeI限制性内切酶的改进的方法。本发明还涉及鉴定编码具有和MmeI同样特性但却很可能具有独特的DNA识别序列的酶的其它DNA片段的方法。这个方法依赖于本申请中所提出的MmeI酶的氨基酸序列的使用,或者由此依赖于通过这个方法鉴定出来的别的序列。本发明还涉及可以通过所述的该方法鉴定出来的其它的DNA片段,这些片段中的每一个都编码与MmeI多肽具有显著的氨基酸序列相似性的多肽。由这些DNA片段编码的多肽被预测表现出和MmeI相似的功能。特别地,这些多肽被预测具有双重的酶学功能:在离特异性识别序列相对远的距离处以特异性的方式剪切DNA,而又修饰它们的识别序列以防止宿主DNA由于内切酶活性而被剪切。通过这种方法鉴定出来的酶的一个实例是CstMI(参见申请序列号为_____的美国专利申请,其与本申请同时提交)。CstMI由于其与MmeI高度显著的氨基酸序列相似性而被认为是一种潜在的内切酶。CstMI识别序列5’-AAGGAG-3’,并剪切位于该识别序列3’端第20和第21个残基之间的磷酸二酯键以及互补链上识别序列5’-CTCCTT-3’的5’端第18和19个残基之间的磷酸二酯键,由此产生具有两个碱基的3’粘末端。

限制性内切酶是一类自然存在于原核生物中的酶。已知的限制性酶切系统有好几种,其中II型内切酶是在遗传工程中非常有用的一类。当这些II型内切酶与原核生物中的其它杂质组分分开而被纯化出来以后,就可以在实验室中用来将DNA分子打断成准确的片段。这种特性使得DNA分子可以被特定地鉴定出来并且被分到它们的组成基因中。限制性内切酶已经被证明是现代遗传学研究中不可或缺的工具。它们是生物化学上的“剪刀”,通过它们遗传工程和分析得以进行。

限制性内切酶通过识别并结合到DNA分子上特定的核苷酸序列(“识别序列”)而起作用。一旦结合到DNA序列上,II型内切酶就在这段序列的内部或者是一侧剪切核酸分子。不同的限制性内切酶对不同的识别序列具有亲和性。大多数限制性内切酶识别的序列长度为4到6个核苷酸,虽然最近也有少数识别7或8个特异核苷酸的限制性内切酶已经被分离出来。绝大多数识别序列都含有一对对称轴,而且在绝大多数情况下所有的核苷酸都是独特地确定的。然而,有些限制性内切酶具有简并或者不严格的特异性,因为它们在它们的识别序列中一个或者多个位置处识别多种碱基,而且有的限制性内切酶识别非对称的序列。HaeIII识别的序列是5’-GGCC-3’,这是具有对称性、非简并识别序列的一个实例;HaeII识别的序列是5’-(Pu)GCGC(Py)-3’,这是典型的具有简并的或者不严格的识别序列的限制性内切酶;而BspMI识别的序列为5’-ACCTGC-3’,这是典型的具有非对称识别序列的限制性内切酶。具有对称性识别序列的II型内切酶一般对称地在识别位点内部或者与之相邻的位置剪切,而那些识别非对称序列的限制性内切酶往往在距离识别位点一端1到20个碱基范围内剪切。本申请的酶MmeI(还有CstMI)具有的特性就是在距离所有已知的II型限制性内切酶的识别序列最远的位置剪切DNA。目前有多于200种独特的限制性内切酶在几千种已经研究过的细菌物种中被鉴定出来。

限制性系统的另一个组分是甲基化修饰酶。这些酶与限制性内切酶互补,它们为细菌提供可以保护自身的DNA并与外源侵染的DNA区分开来的手段。甲基化修饰酶识别并结合到与对应的限制性内切酶同样的识别序列上,但它们不是打断DNA,而是通过添加甲基基团来化学修饰序列中的一个或者其它的核苷酸。甲基化之后,识别序列便不再会被限制性内切酶剪切。细菌细胞的DNA借助它的甲基化修饰酶的活性而被修饰,因而它对内源限制性内切酶的存在变得不敏感。只有未被修饰因而也就被认为是外源的DNA才对限制性内切酶的识别和剪切敏感。甲基转移修饰酶常常是不同于它们的同源内切酶伴侣的另外一种酶。在某些情况下,一种单个的多肽同时具有甲基转移修饰酶和内切酶的功能,比如Eco57I。在这样的情况下,会有另外一个甲基转移酶存在并作为限制-修饰系统的一部分。相反,本申请中的MmeI系统没有另外的甲基转移酶与内切酶-甲基转移酶多肽相伴。

内切酶的命名是根据它们来源的细菌而制定的。因此,比如嗜血杆菌(Haemophilus ageyptius)合成三种不同的限制性内切酶,它们就会被命名为HaeI、HaeII和HaeIII。这些酶识别和剪切的序列分别为5’-(W)GGCC(W)-3’、5’-(Pu)GCGC(Py)-3’和5’-GGCC-3’。另一方面,大肠杆菌(Escherichia coli)RY13只合成一种内切酶EcoRI,它识别的序列是5’-GAATTC-3’。

虽然并不想受到理论的约束,但是一般认为在自然界中,限制性内切酶在细菌细胞的保障系统中起着保护性作用。它们可以使细菌能够抵抗外源DNA分子比如病毒或者质粒的侵染,不然这些分子可能会破坏或者寄生于细胞。它们是通过识别侵染DNA分子中出现的识别序列并在这些位置剪切DNA而达到抵抗的目的。由此产生的这种瓦解使得很多侵染性的基因失活,而且促使这些DNA易于进一步被外切酶降解。

已经有多于3000种限制性内切酶从各种细菌株系中被分离出来。其中超过240种是识别独特的序列,而其他种类的内切酶则分享共同的识别特异性。识别同样的核苷酸序列的限制性内切酶被称为“同裂酶(isoschizomer)”。虽然同裂酶的识别序列是一样的,但是它们的剪切位点却有可能会不同(比如XmaI和SmaI,Endow等,J.Mol.Biol.112:521(1977);Waalwijk等,Nucleic Acids Res.5:3231(1978)),并且在不同位点的剪切速率也会有所不同(XhoI和PaeR7I,Gingeras等,Proc.Natl.Acad.Sci.U.S.A.80:402(1983))。

限制性内切酶传统地被分成三个主要的大类:I型、II型和III型。I型限制性系统召集多种肽构成复合物,其由限制性多肽、修饰性多肽和特异性或者DNA识别多肽组成。I型系统需要二价阳离子、ATP和S-腺苷甲硫氨酸(SAM)作为辅助因子。I型系统剪切DNA的位置随机,最远可以在距离它们的特异性识别位点几千个碱基对的位置。III型系统一般识别非对称的DNA序列,而剪切则发生在距离识别序列一侧20到30个碱基对的特异性位置。这样的系统需要ATP作为辅助因子,同时也需要SAM和二价阳离子。III型系统是由内切酶多肽和修饰性多肽构成的复合体组成,这样它便可以修饰识别序列处的DNA或者剪切DNA。由于它们的修饰活性和剪切活性之间的竞争,III型系统产生的是部分消化的DNA底物,因此也没有在遗传操作中被使用。

MmeI的DNA剪切活性不需要ATP,而且它剪切完全;因此它可以被归为一种II型内切酶。尽管如此,与其他II型内切酶所不同的是,MmeI由一条结合了内切酶和修饰活性的单个多肽组成,这使得它自身就足可以形成完整的限制-修饰系统。MmeI也是所有II型内切酶中在距离特异性DNA识别序列的最远处进行剪切的(本申请的CstMI也是如此)。MmeI相当大,似乎三个功能性结构域整合在一段多肽中。这些结构域由氨基末端结构域、DNA修饰结构域和羧基末端结构域组成;氨基末端结构域包含内切酶DNA剪切基序(motif),也参与DNA识别,DNA修饰结构域与γ类N6mA甲基转移酶最相似,羧基末端结构域被推测参与二聚体的形成和并可能参与DNA识别。这种酶的剪切和修饰活性都需要SAM。单个MmeI多肽足可以在体内条件下修饰携带基因的质粒载体以使得在体外条件下免受MmeI的剪切,而在使用含饰的DNA。

对于新的II型限制性内切酶的需要一直在持续不断。虽然目前已经有识别大量特异性核苷酸序列的II型限制性内切酶可以利用,但是识别新的序列的新的限制性内切酶对遗传操作会提供更多的机会和能力;每一个新的独特的内切酶都可以使科学家利用这种内切酶提供的所有机会来准确地在DNA分子内新的位置剪切DNA。

发明概述

根据本发明,提供了编码新型的限制性内切酶的新的DNA片段,这个片段可以从嗜甲醇营养菌(Methylophilus methylotrophus)(NEB#1190)中获得。因此这种内切酶被命名为“MmeI”,这种内切酶:

(1)识别双链DNA分子中的简并核苷酸序列,如下所示:

5’-TCC(Pu)AC-3’

3’-AGG(Py)TG-5’

(其中G代表鸟嘌呤,C代表胞嘧啶,A代表腺嘌呤,T代表胸腺嘧啶,(Pu)代表一种嘌呤,A或者G,而(Py)代表一种嘧啶,C或者T);(2)在识别序列5’-TCC(Pu)AC-3’的3’侧第20个核苷酸位置后面的磷酸二酯健处和在互补链上识别序列5’-GT(Py)GGA-3’的5’侧第18个核苷酸位置前面的磷酸二酯键处剪切DNA,产生一个伸出两个碱基的3’端:

5’-TCC(Pu)AC(N20)-3’

3’-AGG(Py)TG(N18)-5’;

(3)在体内条件下使(1)中指出的识别序列甲基化以保护宿主DNA免受内切酶MmeI活性造成的剪切。

本发明进一步涉及其它的DNA片段,这些片段中的每一个都被鉴定出编码具有与MmeI限制-修饰多肽显著的序列相似性的多肽。编码MmeI多肽的DNA片段使得这些其它的潜在的内切酶可以被鉴定出来,其中利用程序如BLAST(Altschul等,Nucleic Acids Res.25:3389-3402(1997))在数据库例如GENBANK可获得的序列中进行MmeI序列的相似性搜索。这些DNA片段以及其它的将会在以后提交到数据库中的具有与MmeI这样的相似性的片段,都是可以编码与MmeI类似的多肽的候选者,这些被编码的多肽同时作为限制性内切酶和甲基转移酶。类似于MmeI,这些多肽可以在距离识别序列类似远的位置处剪切DNA,范围是18到20个核苷酸或者更长,这种特性是独特的而且在某些分子生物学技术中是有用的。特别地,这些多肽含有在N6mA DNA甲基转移酶中普遍的氨基酸基序,具有在限制性内切酶中普遍的并且位于多肽氨基末端部分的基序,这个基序由氨基酸D/E(X8~X12)D/EXK组成,而且这些多肽在保守的甲基转移酶基序之后还具有一个由数百个氨基酸组成的区域,它与MmeI的相应区域具有显著的相似性,这个区域被认为在二聚体化中起作用,也有可能是一个DNA序列识别结构域。这样的多肽的一个例子就是CstMI。已经表明CstMI识别6个碱基对的非对称序列5’-AAGGAG-3’,剪切DNA的方式和MmeI一样:5’-AAGGAGN20/N18-3’。由这些DNA片段编码的内切酶可以通过如下所述的用于MmeI的方法来制备。

本发明进一步涉及生产限制性内切酶MmeI的方法。这个方法包括培养含有编码MmeI限制性系统多肽的DNA片段的转化宿主,比如大肠杆菌,收集培养的细胞,从中获得无细胞抽提物(cell-free extract),并从所述无细胞抽提物中分离和收集限制性内切酶MmeI。本发明进一步涉及生产由被鉴定为与MmeI同源的DNA序列编码的限制性内切酶的方法。这个方法包括培养含有编码这些限制性系统的基因的转化宿主,比如大肠杆菌,收集培养的细胞,从中获得无细胞抽提物,并从所述无细胞抽提物中分离和收集限制性内切酶。

附图说明

图1-显示了MmeI剪切Lamda、T7、phiX174、pBR322和pUC19 DNA的琼脂糖凝胶。

图2-MmeI基因座的DNA序列(SEQ ID NO:1)。

图3-MmeI基因座的氨基酸序列(SEQ ID NO:2)。

图4-显示了MmeI剪切pTBMmeI.1 DNA和未修饰DNA底物的琼脂糖凝胶。

图5-显示了MmeI剪切非甲基化、半甲基化和全甲基化的DNA底物的琼脂糖凝胶。

图6-将带标记的甲基整合到未甲基化、半甲基化和全甲基化的DNA底物中。

图7-MmeI氨基酸序列(SEQ ID NO:3到SEQ ID NO:14)和来自于公共数据库的同源多肽之间的多序列比对。

发明详述

本发明的内切酶的识别序列和剪切位点在以前已有过描述(Boyd,Nucleic Acids Res.14:5255-5274(1986))。然而,MmeI酶被证明从天然宿主嗜甲醇营养菌中的生产是困难的,这是由于这种酶的低产率以及嗜甲醇营养菌宿主相对比较难以大量培养。为了克服生产MmeI的这些限制,本申请描述了编码MmeI基因的DNA序列的鉴定,以及在合适的宿主——在本例中是大肠杆菌——中MmeI基因的表达。对编码MmeI的DNA片段的这种操作导致每克细胞所生产的酶的量的显著增加以及含有MmeI酶的大量细胞的生长的显著增加。

被克隆技术领域的技术人员经常采用的数种标准方法曾被应用于克隆MmeI,结果都没有获得成功。特别地,甲基化酶选择方法(Wilson等,美国专利号5,200,333)也没有试验成功。嗜甲醇营养菌DNA的数个随机文库已在大肠杆菌中被建立起来,并且经历了MmeI消化的考验,但是没有获得含有MmeI甲基化酶的克隆。

还尝试了另一种方法,但仍然失败了。在这种方法中,特异地针对N6mA的抗体被用于筛选在lamda噬菌体替换型载体中构建的随机克隆文库。这种方法成功地获得了甲基化酶的阳性克隆,但是所有的克隆经过验证之后都发现是在嗜甲醇营养菌中表达另外一个限制性系统的甲基转移酶,MmeII甲基化酶(识别序列为5’-GATC-3’),而不是所要的MmeI甲基化酶活性。

成功获得所需要的编码MmeI限制性系统的DNA片段的方法包括数个步骤。首先,一种新的纯化程序被发展出来以从嗜甲醇营养菌中纯化出同质的内切酶MmeI肽。一旦成功地获得了显著量的这种超纯的内切酶MmeI多肽,氨基端的氨基酸序列和内部溴化氰降解肽的氨基酸序列就可以被确定。利用所获得的氨基酸序列,互补于编码该氨基酸序列的DNA的简并DNA引物就可以被合成出来,并用于PCR扩增MmeI基因的一部分。这部分MmeI基因的DNA序列被测定。然后整个MmeI内切酶基因及其周围DNA序列可以通过应用反向PCR技术获得。与获得的DNA序列匹配的大量引物被设计、合成出来,并与大量不同的模板组合使用。反向PCR的模板是通过用各种限制性内切酶消化嗜甲醇营养菌基因组DNA,然后再将这些切开的嗜甲醇营养菌DNA在低浓度下连接以获得环状的分子而获得的。不同的引物尝试与不同的模板组合,以便找到能够产生特异性PCR扩增产物的引物-模板组合。将这样得到的产物进行测序。一旦编码整个内切酶MmeI基因的DNA序列被获得,就可以设计引物从嗜甲醇营养菌基因组DNA中特异性地扩增该基因。扩增后的基因被插入到一个表达载体中,再克隆到大肠杆菌宿主中。宿主经测试发现表达内切酶MmeI活性和在体内条件下修饰重组表达载体使得载体在体外条件下不被内切酶MmeI活性剪切。

编码内切酶MmeI的单个多肽也在体内条件下提供抵抗MmeI的保护这个发现与以前发表的关于MmeI的信息(Tucholski,Gene223:293-302(1998))形成对比。特别地,这篇文献教导内切酶MmeI多肽不提供抵抗内切酶MmeI剪切的保护。这篇文献报道为了修饰两条链上的MmeI位点并由此阻止内切酶MmeI的剪切需要一个独立的48kD的甲基转移酶。特别地,该文献教导内切酶MmeI多肽只修饰识别序列上链(top strand)5’-TCCRAC-3’中的腺嘌呤,而这种被修饰的DNA会被内切酶MmeI剪切。本发明的DNA片段编码内切酶MmeI基因,当它单独在大肠杆菌宿主中生长的时候,可导致含有该内切酶MmeI的载体产生对纯化的内切酶MmeI的抗性。进一步,由这个片段产生的内切酶MmeI不剪切在上链5’-TCCRAC-3’的腺嘌呤处有修饰而在反链或者下链(bottom strand)中都没有修饰存在的DNA片段。这个结果与Tucholski的文献中的教导相反。另外,本申请的内切酶MmeI不剪切其下链5’-GTYGGA-3’中的腺嘌呤残基被修饰的DNA片断,这也与Tucholski的文献中的教导相反。当上链和下链中腺嘌呤残基都被修饰时,内切酶MmeI不剪切该DNA。在该内切酶MmeI基因附近没有发现如Tucholski的文献中所报道的另一种甲基转移酶基因。在紧接着该内切酶MmeI基因的3’端的位置有一个开放阅读框,它所编码的蛋白的大小接近于所报道的第二甲基转移酶活性蛋白(48kD)。然而,这条潜在的多肽不具有在甲基转移酶中发现的氨基酸基序,而且在克隆进大肠杆菌后也不会提供抵抗内切酶MmeI的保护作用。虽然Tucholski的文献教导第二甲基转移酶多肽在保护宿主细胞免受内切酶MmeI活性影响中的必要性,但本申请表明编码内切酶MmeI多肽的DNA片段足可以提供这种保护作用。另外,在此所述的编码与MmeI相似的氨基酸序列的11个DNA片段两侧都没有可识别到的DNA甲基转移酶基因。这表明这些多肽本身也极有可能提供对宿主DNA的保护作用和对未修饰DNA底物的内切酶活性,而不需要别的甲基转移酶作为该限制性修饰系统的一部分。这与其它的II型限制性修饰系统形成对比。

同一研究组(Tucholski,Gene 223:293-302(1998)和Anna Podhajska,私人交流)之前报道过单个内部溴化氰消化片段的8个残基的氨基酸序列(序列GRGRGVGV(SEQ ID NO:_))。基于这段序列的PCR被尝试,然而失败了。在根据本发明确定了真实的MmeI氨基酸序列之后,发现上述序列与MemI没有关系。因此,使得MmeI基因得以克隆的内部氨基酸序列的正确测定依赖于本申请中描述的新的纯化方法,其中可以生产出足够量的足够纯的MmeI以便确定溴化氰消化的内部片段氨基酸序列,如在本申请中所实施的。

在实施例II中,我们通过培养带有MmeI基因的转化宿主,比如携带pTBMmeI.1的大肠杆菌ER2683,并从这些细胞中回收内切酶来获得MmeI。携带有pTBMmeI.1的大肠杆菌ER2683样品(NEB#1457)已经在布达佩斯条约的条款和条件下于2002年7月3日保藏于美国典型培养物保藏中心(ATCC),其相应的专利注册号(the Patent AccessionNo.)是PTA-4521。

为了回收本发明的酶,携带有pTBMmeI.1的大肠杆菌(NEB#1457)可以使用任何合适的技术来培养。比如,携带有pTBMmeI.1的大肠杆菌可以在含有100μg/ml氨苄青霉素的Luria broth培养基中,37℃通风有氧培养。处于对数生长期晚期的细胞通过加入0.3mM的IPTG进行诱导,继续生长4个小时,离心收集,然后立即破碎细胞或者于-70℃冷冻保存。

MmeI酶可以通过传统的蛋白纯化技术从携带有pTBMmeI.1的大肠杆菌中分离出来。比如,可以将细胞沉积物在缓冲液中重悬,然后再通过超声、高压分散或者酶消化来处理,使得内切酶被提取到缓冲溶液中。完整的细胞和细胞碎片然后通过离心除去,得到含有MmeI的无细胞抽提物。然后,伴随有其相应的内源性甲基化酶活性的内切酶MmeI通过离子交换层析、亲合层析、分子筛层析或者这些方法的组合从无细胞抽提物中纯化出来以生产出本发明的内切酶。

本发明还涉及鉴定其它的DNA片段的方法,其中每个片段都编码具有与MmeI多肽显著的氨基酸序列相似性的多肽。由这些DNA片段编码的多肽被预测执行与MmeI相似的功能。特别地,它们被预测具有双重酶功能,既在距离特定识别序列相对远的位置处以特定的方式剪切DNA,又修饰它们的识别序列以保护宿主DNA免受它们的内切酶活性的攻击。一旦内切酶MmeI的氨基酸序列根据本申请中描述的方法被确定出来,存储在数据库中的序列可以与该MmeI序列相比较,从而找出那些与MmeI极为显著相似的序列。这种方法与美国专利6,383,770(Roberts等)中描述的方法有些类似,不同的是在这里我们是寻找与内切酶MmeI序列的相似性,而不是寻找与甲基转移酶或内切酶蛋白数据库匹配的序列,然后在潜在的甲基转移酶开放阅读框的附近检查没有被鉴定出的开放阅读框。在鉴定出MmeI的氨基酸序列之前,编码与MmeI相关的蛋白的DNA序列还没有被包含在Roberts等如上所用的限制性和甲基转移酶基因序列数据库中,因为这些序列还没有联系到任何已知的内切酶功能上。在此公开的鉴定潜在MmeI样内切酶的方法因此要比美国专利6,383,770(Roberts等)中的方法更加具有特异性。

在数据库如GENBANK中对可获得的序列进行MmeI序列的相似性搜索是利用程序如BLAST(Altschul等.Nucleic Acids Res.25:3389-3402(1997))完成的。期望值(expectation value,E)分数低于E=e-10的序列被认为是潜在的内切酶候选者。期望值低得更多,比如低于E=e-30的序列被认为极有可能是类似于MmeI的内切酶。这些候选MmeI样肽被进一步检验以确认它们是否符合MmeI所表现出来的结构域组成。一个真正的候选者将会含有一个内切酶折叠基序,常常是以(D/E)X8~X12(D/E)XK的形式出现在肽的氨基端部分(Aravind等,Nucleic Acids Res.28:3417-3432(2000))。一个真正的候选者将会在肽的中间部分含有与γ类N6甲基腺嘌呤甲基转移酶类似的甲基转移酶基序,而且在候选肽的羧基端部分含有与MmeI的羧基端部分相似的序列。这样的BLAST搜索是在2003年6月12日进行的,返回的如下序列与MmeI高度相似:

记录编号:NEB-207-PCT

    Genbank注册号                                                               描述                  分数                   E值

(Genbank accession ID)                                                      (Description)            (Score)                (E value)

    Genbank注册号    描述分数 E值 SEQ ID NO:1.gi|15794682|ref|NP_284504.1|假想蛋白[Neisseri643 0.0 62.gi|9945797|gb|AAG03371.1|Gcry[纹带棒杆菌(Corynebacterium striatum)604 e-171 83.gi|16077744|ref|NP_388558.1|类似于假想蛋白564 e-159 74.gi|28373198|ref|NP_783835.1|推定为YeeA蛋白[Lactoba...531 e-149 35.gi|23110638|gb|ZP_00096791.1|假想蛋白[Novosph...426 e-118 106.gi|27450519|gb|AAO14619.1|AF465251_62未知[Lactobacillus...217 9e-55 47.gi|15807258|ref|NP_295988.1|DNA修饰甲基转移酶...213 1e-53 148.gi|15807788|ref|NP_285443.1|保守的假想蛋白...164 7e-39 139.gi|21231551|ref|NP_637468.1|保守的假想蛋白...142 2e-32 N/A10.gi|20803963|emb|CAD31540.1|推定为DNA甲基化酶蛋白...134 7e-30 1111.gi|23451826|qb|AAN32874.1|AF461726_1未知[Pseudomonas f...98 6e-19 912.gi|16125079|ref|NP_419643.1|保守的假想蛋白...92 3e-17 1213.gi|10954534|ref|NP_044172.1|M.jannaschii预测的编码...76 2e-12 N/A

这些蛋白中的大多数在它们的数据库记录中被标记为假想(hypothetical)蛋白或者推定的(putative)蛋白。其中有许多似乎是全长的多肽,比如上面的序列#2:GcrY。这些候选蛋白可以按照Roberts描述的方法来表达以鉴定期望的内切酶活性。一些内切酶基因在用于测序的特定菌株中可能是没有活性的(Lin等,Proc.Natl.Acad.Sci.USA98:2740-2745(2001))。在这样的情况下,通过修复导致这些基因失活的突变来表达功能性的内切酶被证明是可能的。MmeI的数个同源物,比如#7(SEQ ID NO:14)(耐放射异常球菌(Deinococcus radiodurans)DR2267)和#8(SEQ ID NO:13)(耐放射异常球菌DR0119.1),在它们的开放阅读框架中都有缺陷。DR2267在MmeI上由密码子GAG编码谷氨酸的位置处含有一个终止密码子TAG,它可以过早地终止该开放阅读框架。通过将这个TAG终止密码子改变成GAG,则有可能会重新激活这个潜在的内切酶基因。DR0119.1也是有缺陷的,因为它出现了框架漂移(frameshift),这使得开放阅读框架被破坏。通过使DR0119.1序列和MmeI序列之间的相似性最大化,可以将MmeI序列用作指导修复这种框架漂移的指南。这样可能会很好地恢复DR0119.1内切酶的活性。

另外一种产生新的潜在内切酶的方法是通过进行结构域交换(domain swapping)来利用它们之间相似的结构域。可以将MmeI蛋白的氨基端结构域与一种MmeI样肽的氨基端结构域交换,比如将新的潜在基因中直至第一个甲基转移酶基序(基序X,“Gly Ala His TyrThr Ser”)的序列与MmeI中直至同一序列的这一部分交换。当只能获得部分的序列或者潜在基因已经由于多个突变而丧失了功能时,这种方法非常有效。这种方法会产生一个嵌合蛋白,这个蛋白可能具有内切酶活性并在距离识别序列一定距离的位置剪切DNA,就像MmeI一样,但是它识别的序列是新的DNA序列。也可能在数据库中发现有的序列虽然与MmeI相比具有高度的相似性,但却是不完全的序列。比如,上述的序列#11(SEQ ID NO:9)(荧光假单胞菌(Pseudomonasfluorescens))就是来自于数据库中的DNA序列的一个小片段。为了由这个序列获得像MmeI一样有功能性的内切酶,可以用反向PCR或者其他技术获得与报道的片段相邻的DNA序列,然后用该序列获得完整的内切酶基因。

一旦序列被鉴定出来,潜在的内切酶就可以被表达并按照Roberts等如上描述的方法鉴定其特征。然而,在这里没有另外独立的甲基转移酶基因与该内切酶一起表达。一旦这样一个潜在的内切酶被克隆并在合适的宿主比如大肠杆菌中表达,那么无细胞抽提物可以被制备出来并被分析以检测任何内切酶活性。这样一个内切酶分析必须包括这些内切酶所需要的辅助因子SAM。一旦发现有特异性的DNA剪切活性,则识别序列和剪切位点就可以通过标准方法来确定(Schildkraut,(1984)在Genet.Eng.(NY)第6卷,(Setlow J.K.,Hollaender,A.Ed.).117-140页,Plenum Press,New York.“Screening for and Characterizingrestriction endonuclease.”)。

这样确定的酶可以通过传统的蛋白纯化技术从携带含有DNA片段的合适载体的大肠杆菌细胞中分离出来。例如,细胞沉积物可以在缓冲液中重悬,然后再通过超声、高压分散或者酶消化来处理,以使内切酶被提取到缓冲溶液中。完整的细胞和细胞碎片然后通过离心除去,得到含有所述酶的无细胞抽提物。所述内切酶,伴随着它对应的内源性甲基化酶活性,然后通过离子交换层析、亲合层析、分子筛层析或者这些方法的组合从无细胞抽提物中纯化出来以生产出本发明中的内切酶。

这些DNA片段以及其它的将会在以后提交到数据库中的与MmeI具有这样的相似性的片段,都被预测编码与MmeI类似的多肽,因为这些被编码的多肽同时作为限制性内切酶和甲基转移酶。类似于MmeI,这些多肽可以在距离识别序列类似远的位置处剪切DNA,范围是大约18到20个核苷酸或者更长,这种特性是独特的而且在某些分子生物学技术中是有用的。

根据这种方法鉴定出来的这样的酶的一个实例是CstMI(参见序列号为____美国专利申请,与本申请同时提交)。因为与MmeI高度显著的氨基酸序列相似性,CstMI被确定是一种潜在的内切酶。CstMI由上述序列#2(SEQ ID NO:8)编码,这个序列在用BLAST与MmeI比对的时候给出了高度显著的期望值e-171。CstMI识别6个碱基对的非对称序列5’-AAGGAG-3’,而且剪切DNA的方式和MmeI一样:它剪切位于这个识别序列3’侧第20和第21个残基之间的磷酸二酯键,以及互补链上的识别序列5’-CTCCTT-3’的5’侧第18和19个残基之间的磷酸二酯键,由此产生一个有两个碱基的3’粘末端。

本发明通过下面的实施例来进一步说明。提供这些实施例是用来帮助理解本发明,而并不作为本发明的限制。

以上和以下引用的文献都在此引入作为参考。

                       实施例1

                   内切酶MmeI的纯化

嗜甲醇营养菌(NEB#1190)的单个克隆在1升培养基M(0.08μMCuSO4、0.448μM MnSO4、0.348μM ZnSO4、6.0μM FeCl3、18μM CaCO3、1.6mM MgSO4、9.0mM NaH2PO4、10.9mM K2HPO4、13.6mM(NH4)2SO4)中生长24个小时。使用该培养物接种到100升的培养基M中。这些细胞在有氧条件下37℃过夜培养直至进入稳定期。用5份100升的发酵液收集到752克的湿细胞沉淀。

将750克嗜甲醇营养菌细胞沉淀悬浮在2.25升缓冲液A(20mMTris-HCl(pH 8.0)、50mM NaCl、1.0mM DTT、0.1mM EDTA、5%甘油)中,然后以大约12000psig通过Gaulin匀浆机,裂解物于13000×G离心40分钟后收集上清。

将上清溶液加到已经用缓冲液A平衡的500ml Heparin Hyper-D柱(Biosepra SA)上。用1升缓冲液A清洗柱子,然后将2升的NaCl浓度梯度为0.05M到1M的缓冲液A加到柱子上并收集分离级分。对级分进行MmeI内切酶活性的分析:在补充有32μM的S-腺苷-L-甲硫氨酸(SAM)的50μl NEBuffer1中与1μg的Lamda DNA(NEB)于37℃温育15分钟。MmeI活性是在0.3M到0.4M NaCl之间被洗脱下来。

含有MmeI活性的Heparin Hyper-D柱分离级分被汇集到一起,用(不含有NaCl的)缓冲液A稀释到50mM NaCl浓度,然后上样到105ml的已经用缓冲液A平衡好的Source15 Q柱(Amersham Biotech)上。用210ml的缓冲液A清洗柱子,再用1升的NaCl浓度梯度为0.05M到0.7M的缓冲液A加到柱子上进行洗脱。级分被收集,并分析MmeI的内切酶活性。MmeI活性在未被结合的级分中被发现。

将Source15 Q的汇集物加载到22ml的已经用缓冲液A平衡好的AF-Heparin-TSK柱(TosoHaas)上。用44ml的缓冲液A清洗柱子之后,接着用NaCl浓度梯度从0.05M到1M的缓冲液A线性洗脱。各级分被收集并分析内切酶MmeI的活性。MmeI活性在NaCl浓度为0.26M到0.29M之间被洗脱下来。这些含有活性的级分被汇集到一起,然后用缓冲液B(20mM NaPO4(pH7.0)、50mM NaCl、1.0mM DTT、0.1mMEDTA、5%甘油)中透析。

经过透析的AF-Heparin-TSK汇集物被加载到已经用缓冲液B平衡好的6ml的Resource15 S柱(Amersham Biotech)上。用12ml缓冲液B清洗柱子之后,再用NaCl浓度梯度从0.05M到1M的缓冲液B线性洗脱。各级分被收集并分析内切酶MmeI的活性。MmeI活性在NaCl浓度0.14M和0.17M之间被洗脱下来。

这样洗脱下来的汇集级分被上样到已经用缓冲液C(20mMTris-HCl,pH8.0、500mM NaCl、1.0mM DTT、0.1mM EDTA、5%甘油)平衡好的2升的Superdex 75大小分离柱(Amersham Biotech)上。用缓冲液C洗脱出的500ml和1500ml之间的洗脱级分被收集起来,然后通过Mme内切酶分析进行分析,在4-20%梯度胶上进行聚丙烯酰氨凝胶电泳,然后再用考马斯亮兰对蛋白质染色。在775ml到825ml之间洗脱出的级分对应于MmeI活性,对应的蛋白条带是105kDa。这些级分被汇集在一起,然后用缓冲液D(20mM NaPO4(pH7.0)、50mM NaCl、1mM DTT、5%甘油)进行透析。

透析之后的分离级分被上样到已经用缓冲液D平衡好的CeramicHTP柱(BioRad)上。用32ml缓冲液D清洗之后,再用NaPO4浓度梯度从0.02M到1M的缓冲液D线性洗脱。收集各级分并分析Mme内切酶活性,在4-20%的梯度胶上进行聚丙烯酰氨凝胶电泳,然后再用考马斯亮兰对蛋白质染色。MmeI在NaPO4浓度为0.26M和0.3M之间被洗脱下来。含有105kDa的单个同质的蛋白条带的数个级分中的一部分被用于蛋白质测序。剩下的纯化的MmeI级分被汇集到一起(6ml,浓度为0.36mg/ml),然后用保存缓冲液(10mM Tris(pH7.9)、50mMKCl、1mM DTT、0.1mM EDTA、50%甘油)透析。纯化后的MmeI酶在-20℃保存。

活性测定:

将1-4μl的样品加到50μl由1×NEBuffer 1、32μM的S-腺苷-L-甲硫氨酸和1μg的DNA(Lamda、PhiX174或者pUC19 DNA)组成的底物溶液中。反应在37℃进行15分钟,然后加入20μl终止溶液,用1%琼脂糖凝胶电泳分析结果。

                       优化内切酶活性

从嗜甲醇营养菌中纯化出MmeI之后,进行实验以确定DNA剪切的最优反应条件。发现内切酶活性会由于反应缓冲液中钾离子的存在而大大增强。反应条件从4℃变化到37℃和从5分钟变化到60分钟都没有明显地改变剪切DNA的量。为了达到最大程度的剪切,要求酶浓度与DNA位点在化学计量上相等或接近。大大过量的酶会阻断剪切的发生。这些发现被用于重新评估MmeI的活性和定义可行的内切酶单位。

                        单位定义

一个单位(one unit)的MmeI被定义为在15分钟内在补充有80μM的S-腺苷-L-甲硫氨酸(SAM)的NEBuffer 4(20mM Tris-乙酸盐、10mM乙酸镁、50mM乙酸钾、1mM二硫苏糖醇(在25℃时pH7.9))中于37℃完全剪切1μg的PhiX174 DNA所需要的用量。

                        实施例II

                     MmeI内切酶的克隆

1.DNA纯化:制备嗜甲醇营养菌的总基因组DNA。5克的沉积细胞悬浮在20ml的25%蔗糖、0.05M Tris-HCl pH8.0中,其中还加入10ml的0.25M的EDTA,pH8.0。然后加入6ml的溶菌酶溶液(10mg/ml溶菌酶在0.25M的Tris-HCl中,pH8.0),之后细胞悬浮液在4℃放置16个小时。接着25ml的裂解混合物(1%Triton-X100、0.05M Tris、62mMEDTA,pH8.0)和5ml的10%SDS被加入,然后在37℃放置5分钟。接着用一倍体积的平衡酚∶氯仿∶异戊醇(50∶48∶2,v/v/v)提取该溶液,回收水相,再用一倍体积的氯仿∶异戊醇(24∶1,v/v)提取两次。将得到的水溶液用2升的10mM Tris、1mM EDTA,pH8.0的溶液透析四次。透析过的DNA溶液用RNase(100μg/ml)在37℃消化1小时。加入1/10体积的5M NaCl和0.55个体积的2-丙醇让DNA沉淀,并缠绕在玻璃棒上。用70%乙醇简单润洗DNA之后,简单地进行空气干燥,然后溶解在20ml的TE缓冲液(10mM Tris、1mM EDTA,pH8.0),浓度至大约500μg/ml,4℃保存。

2.MmeI内切酶按照上述实施例1中描述的方法纯化到同质。

3.MmeI内切酶的氨基酸序列是针对MmeI多肽的氨基端和数段内部溴化氰消化产物获得的。对按照上述实施例1中描述的方法制备的MmeI限制性内切酶进行电泳分析,然后根据Matsudaira(Matsudaira.J.Biol.Chem.262:10035-10038,1987)的程序进行电印迹,其中按照已有的描述做了一定的修改(Looney等,Gene 80:193-208(1989))。然后用考马斯亮兰R-250染膜,将大约105kD的蛋白条带切下来,然后在一台带有气相传递的ABI Procise 494 Protein/Peptide Sequencer上进行有序的降解(Waite-Rees等,J.Bacteriol.173:5207-5219(1991))。头14个氨基端残基的氨基酸序列被获得,如下:ALSWNEIRRKAIEF(SEQID NO:15)。

MmeI内切酶的另外一个样品——20μl中有20μg——用溶解在200μl88%蒸馏甲酸中的2μg溴化氰(Sigma)在室温于黑暗处处理24个小时。这个反应混合物被蒸发至干,然后重新悬浮在20μl的上样缓冲液(1.5M Tris-HCl,pH8.5、12%甘油、4%SDS、0.05%Serva Blue G、0.05%酚红)中,100℃保持5分钟。这个样品在Tris-Tricine系统中的10到20%聚丙烯酰氨梯度凝胶(Invitrogen)上进行3个小时的电泳,然后再用10mM CAPS缓冲液(10mM 3-[环己胺基]-1-丙磺酸、10%甲醇、0.05%SDS、0.005%二硫苏糖醇,用NaOH调节pH至11.0)将蛋白转移到聚偏二氟乙烯(PVDF)膜(Problott,Applied Biosystems Inc.),转移是在用槽式电转仪(TE52,Hoeffer)在200伏特转移18小时完成的。用考马斯亮兰R-250染膜,观察到的主要条带是25kD、14kD、7.5kD和6kD,以及一些更小的条带。这些被染上的蛋白条带从膜上被切下来,然后进行渐次降解。这些不是氨基端片断的片断是来自于溴化氰在蛋白内甲硫氨酸残基位置处的剪切,因此其前面应该有甲硫氨酸。25kD的肽的前29个残基序列为

(M)KISDEFGNYFARIPLKSTXXIXEXNALQ(SEQ ID NO:16)。标记成X的残基20、21、23和25是没有被鉴定出的残基。14kD片段的前40个氨基酸残基序列为

(M)DAKKRRNLGAHYTSEANILKLIKPLLLDELWVVFXKVKN(SEQID NO:17)。第36号残基没有鉴定出来。7.5kD肽的前25个残基的序列对应为(M)KSRGKDLDKAYDQALDYFSGIAER(SEQ ID NO:18)。

6kD片段被发现含有三个序列的混合物。

4.扩增MmeI内切酶的一部分:从氨基端肽、25kD、14kD和7.5kD肽获得的肽段序列信息被用于构建一系列对应于氨基酸残基密码子的简并PCR引物。这些内部肽片断的顺序是未知的,因此针对这些片段都制备了正向(正义链)和反向(反义链)引物,这些引物是:

25kD片段:残基DEFGNYFA(SEQ ID NO:19)

正向:

1)5’-GARTTYGGNAAYTAYTTYGC-3’(SEQ ID NO:20)

反向:

2)5’-AARTARTTNCCRAAYTCRTC-3’(SEQ ID NO:21)

14kD片段:残基MDAKKR(SEQ ID NO:22)

正向A:

3)5’-ATGGAYGCNAARAARCG-3’(SEQ ID NO:23)

正向B:

4)5’-ATGGAYGCNAARAARAG-3’(SEQ ID NO:24)

反向:

5)5’-CGNCGYTTYTTNGCRTCCAT-3’(SEQ ID NO:25)

7.5kD片段:残基DKAYDQA(SEQ ID NO:26)

正向:

6)5’-GAYAARGCNTAYGAYCARGC-3’(SEQ ID NO:27)

反向:

7)5’-GCYTGRTCRTANGCYTTRTC-3’(SEQ ID NO:28)

其中

Y=T、C

R=A、G

H=A、T、C

S=G、C

N=A、C、G、T

引物1和2源自MmeI的25kD的CNBr肽段,准备导引基因的正义链(1)或者反义链(2)。引物3到5源自MmeI的14kD的CNBr肽段,准备导引基因的正义链(3和4)或者反义链(5),其中引物3和4在精氨酸残基的密码子使用上有所不同。引物6和7源自MmeI的7.5kD的CNBr肽段,准备导引基因的正义链(6)或者反义链(7)。

PCR扩增反应采用引物组合1和5、1和7、3和2、3和7、4和2、4和7、6和2、以及6和7来进行。MmeI基因的一部分可以在PCR反应中被扩增出来,反应溶液包括:

80μl 10×Thermopol缓冲液(NEB)

50μl 4mM dNTP溶液(NEB)

4μl MmeI基因组DNA(500μg/ml储液)

16μl 100mM MgSO4

586μl dH2O

16μl(32个单位)Ventexo-DNA聚合酶(NEB)

上述混合溶液被分成每份90μl的8个等份,然后往每个等份中加入5μl的正向引物(10μM储液)和5μl的反向引物(10μM储液)。反应循环参数为95℃3分钟,一个循环;然后95℃30秒,46℃30秒,72℃2分钟,25个循环。

扩增反应的产物在1%的琼脂糖凝胶上电泳分离并分析。获得的主要的DNA扩增产物是450个碱基对(bp)(引物2和4)、650bp(引物5和6)和1100bp(引物2和6)的片段。这些片段的大小与7.5kD的CnBr降解片段位于最靠近蛋白氨基端的位置并距离14kD的CnBr片段大约650bp,14kD片段位于7.5kD片段和25kD片段中间而且邻近25kD片段相一致。这些扩增出来的DNA片段经过胶纯化,并利用用于扩增的引物进行测序。获得的DNA序列的翻译与来自于纯化的MmeI内切酶的氨基酸序列匹配,这表明MmeI内切酶基因DNA序列的一部分已经被成功获得了。

5.测定整个MmeI基因和邻近DNA的DNA序列:利用反向PCR技术从上面得到的1060bp的MmeI基因片段的两端出发延伸DNA序列。为了达到这个目的,一系列与MmeI基因DNA序列匹配并用于反向PCR的引物被设计和合成出来。MmeI基因组DNA用一系列限制性内切酶剪切之后,在低浓度条件下连接形成环状的DNA模板。

A.MmeI基因组DNA用10种不同的限制性内切酶消化,然后环状连接以获得可以利用反向PCR技术来扩增的DNA模板。使用的限制性酶是:

BspHI(T/CATGA)

EcoRI(G/AATTC)

HindIII(A/AGCTT)

HinPlI(G/CGC)

MspI(C/CGG)

NlaIII(CATG/)

PstI(CTGCA/G)

SacI(GAGCT/C)

SphI(GCATG/C)

XbaI(T/CTAGA)

为了进行限制性内切酶消化,将下列试剂组合:

5μl 10×为不同酶所推荐的NEBuffer(随着酶改变)

2μl嗜甲醇营养菌基因组DNA(1μg)

43μl dH2O

1μl(10~20单位)限制性酶。

反应在37℃温浴1个小时。将反应加热到65℃(对于PstI是80℃)持续20分钟使限制性内切酶失活。被消化的DNA通过加入50μl的10×T4 DNA连接酶缓冲液、400μl dH2O和3μl浓的T4 DNA连接酶(6000单位,新英格兰生物实验室公司)并在16℃温浴16小时而被连接成环状的片段。连接后的DNA用酚和氯仿提取,再用2-丙醇沉淀,之后重悬在100μl TE缓冲液中。

B.扩增与MmeI内切酶基因的1060bp片段邻近的DNA:两对PCR引物被设计出来,一对分别靠近用简并引物直接PCR出来的1060bp序列的两端。这些引物序列是:

引物IP1:

5’-GTTGGATCCCGCACAGATTGCTCAGG-3’(SEQ ID NO:29)

引物IP2:

5’-GTTGGATCCTACGTTAATCTGAATAAGATG-3’(SEQ IDNO:30)

引物IP3:

5’-GTTGGATCCTGTTAATCTGAAACGCTGG-3’(SEQ IDNO:31)

引物IP4:

5’-GTTGGATCCTTATACCAAAATGTGAGGTC-3’(SEQ IDNO:32)。

反向PCR反应是利用引物对IP1和IP2、IP3和IP4、以及IP1和IP3,以上述10种环状模板为模板进行的。为了进行扩增反应,将下列试剂组合:

80μl 10×Thermopol缓冲液(NEB)

50μl 4mM dNTP溶液(NEB)

40μl IP引物(正向)

40μl IP引物(反向)

16μl 100mM MgSO4

534μl dH2O

16μl(32个单位)Ventexo-DNA聚合酶(NEB)

上述混合液被分装成10管,每管76μl,然后再往每管中加入4μl经过适当消化并环状连接的模板。反应循环参数为95℃3分钟,一个循环,然后95℃30秒,56℃30秒,72℃3分钟,25个循环。扩增产物用琼脂糖凝胶电泳分析。

对于引物IP1和IP2与SphI模板和NlaIII模板,得到的扩增产物大约是825bp。对于引物IP3和IP4与BspHI模板,得到的产物大约是800bp。对于引物IP1和IP3与EcoRI模板,得到的产物大约是1500bp。这些扩增得到的DNA片段经过胶纯化,测序,并与前面得到的序列组装。组装后的序列并不含有完整的MmeI内切酶开放阅读框。这个组装后的序列被用于指导第二轮反向PCR引物对的合成。这些引物的序列是:

引物IP5:

5’-TTCAGAAATACGAGCGATGC-3’(SEQ ID NO:33)

引物IP6:

5’-GTCAAGCCATAAACACCATC-3’(SEQ ID NO:34)

引物IP7:

5’-GAGGGTCAGAAAGGAAGCTG-3’(SEQ ID NO:35)

引物IP8:

5’-GTCCAACTAACCCTTTATGG-3’(SEQ ID NO:36)。

反向PCR扩增反应按照上述条件进行。采用引物IP5和IP6,可以从NlaIII模板(大约450bp)和MspI模板(大约725bp)得到产物,但不能从其它环状连接模板得到产物。采用引物IP7和IP8,可以从EcoRI模板(大约500bp)、SphI模板(大约825bp)和BspHI模板(大约750bp)得到产物。这些DNA片段被测序,然后再与前面得到的序列组装。组装后的序列依然不含有完整的MmeI内切酶开放阅读框,因此要进行又一轮引物合成和反向PCR。额外的DNA模板按照上述方法获得,但是是用限制性酶ApoI(R/AATTY)、AseI(AT/TAAT)、BsaHI(GR/CGYC)、MfeI(C/AATTG)、SspI(AAT/ATT)和EcoRV(GAT/ATC)来消化嗜甲醇营养菌基因组DNA。第三轮中的引物的序列是:

引物IP9:

5’-TTCCTAGTGCTGAACCTTTG-3’(SEQ ID NO:37)

引物IP10:

5’-GTTGCGTTACTTGAAATGAC-3’(SEQ ID NO:38)

引物IP11:

5’-CCAAAATGGAACTTGTTTCG-3’(SEQ ID NO:39)

引物IP12:

5’-GTGAGTGCGCCCTGAATTAG-3’(SEQ ID NO:40)。

反向PCR扩增反应如上所述地进行。采用引物IP9和IP10,可以从NlaIII模板(大约425bp)、MfeI模板(大约750bp)、ApoI模板(大约800bp)和MspI模板(大约2100bp)得到产物。采用引物IP11和IP12,可以从SphI模板(大约875bp)、BspHI模板(大约925bp)和EcoRI模板(大约950bp)得到产物。这些DNA片段被测序,然后再与前面获得的序列组装。利用如下三个额外的引物,进一步对IP9、IP10的MspI 2100bp产物进行测序:

引物S1:

5’-GCTTCATTTCATCCTCTGTGC-3’(SEQ ID NO:41)

引物S2:

5’-TAACCGCCAAAATTAATCGTG-3’(SEQ ID NO:42)

引物S3:

5’-CCACTATTCATTACAACACC-3’(SEQ ID NO:43)。

最终组装成的序列(图2)含有完整的MmeI限制性内切酶基因,还包括基因上游1640bp的序列以及基因下游1610bp的序列。

6.在大肠杆菌中克隆MmeI内切酶基因:推定的MmeI内切酶开放阅读框从由各反向PCR扩增出的DNA片段序列组装而获得的DNA序列中鉴定出来。开放阅读框的起始位点是基于预测的开放阅读框氨基端氨基酸序列与由MmeI内切酶蛋白确定的序列的匹配而鉴定出来的。预测的开放阅读框末端能够保证编码大约105kD的多肽,这与观察到的天然MmeI内切酶大小一致。从这个开放阅读框翻译得到的氨基酸序列含有N6mA DNA甲基转移酶的保守序列基序。然而,在邻近MmeI内切酶基因的区域没有发现含有在DNA甲基转移酶中保守的序列基序的开放阅读框,这与预测的结果是一致的。因此决定在没有另一个甲基转移酶存在以保护大肠杆菌宿主DNA免受剪切的情况下,在大肠杆菌中尝试表达MmeI内切酶。寡聚核苷酸引物被合成出来以特异性地从嗜甲醇营养菌基因组DNA中扩增出MmeI基因,使得它可以用克隆载体pRRS(Skoglund,Gene 88:1-5(1990))表达。正向引物含有方便克隆的PstI位点、与载体的lacZ基因处于同一阅读框的终止密码子、保守的大肠杆菌核糖体结合位点、ATG翻译起始位点(修改了嗜甲醇营养菌使用的GTG,这是为了在大肠杆菌中更好地表达),以及与嗜甲醇营养菌DNA序列匹配的20个核苷酸:

5’-GTTCTGCAGTTAAGGATAACATATGGCTTTAAGCTGGAACGAG-3’(SEQ ID NO:44)。

反向引物含有方便克隆的BamHI位点,以及与MmeI开放阅读框末端3’侧的嗜甲醇营养菌DNA序列匹配的22个核苷酸:

5’-GTTGGATCCGTCGACATTAATTAATTTTTGCCCTTAG-3’(SEQ IDNO:45)。

为了在PCR反应中扩增MmeI基因,将下列试剂组合:

50μl 10×Thermopol缓冲液(NEB)

30μl 4mM dNTP溶液(NEB)

12.5μl正向引物(10μM储液)

12.5μl反向引物(10μM储液)

5μl MmeI基因组DNA(500μg/ml储液)

387μl dH2O

3μl(6个单位)VentDNA聚合酶

反应溶液混合后分装到5个管中,每管80μl。将MgSO4(100mM储液)分别加入到各管使得终浓度分别为2mM、3mM、4mM、5mM和6mM。反应循环参数为95℃30秒,60℃30秒,72℃3分钟,24个循环。反应产物用凝胶电泳分析,结果发现Mg++浓度为3mM到6mM时的反应得到了所要的2.8kb的DNA条带。这些反应产物被汇集到一起,2.8kb的条带被胶纯化。2.8kb的MmeI基因扩增片段用BamHI和PstI内切酶(NEB)降解,条件如下:

15μl 10×BamHI反应缓冲液(NEB)

1.5μl BSA(NEB)

50μl MmeI基因的2.8kb扩增DNA片段

80μl dH2O

5μl BamHI内切酶(100单位)

5μl PstI内切酶(100单位)

反应液混合之后在37℃温浴1小时。按照制造商提供的说明通过Qiagen的QiaPrep spin column进行纯化,将从2.8kb的DNA片段末端剪切下来的小片段和内切酶去除。

剪切后的MmeI基因DNA片段按照如下的程序被连接到pRRS载体中:10μl经过消化、纯化的2.8kb MmeI片段与5μl事先用BamHI和PstI剪切并纯化过的pRRS载体混合,加入5μl的dH2O、20μl的2×QuickLigase缓冲液(NEB),混合,再加入2μl的QuickLigase。反应在室温温育5分钟。将5μl的连接反应产物转化到50μl的大肠杆菌ER2683化学感受态细胞中,将这些细胞涂在含有100μg/ml氨苄青霉素的L-broth平板上,37℃温育过夜。结果得到大约200个转化子,挑出18个代表性转化子进行如下分析:来自每个克隆的质粒通过小量制备程序被分离出来,接着用AlwNI和NdeI内切酶消化以确定它们是否含有正确大小的插入片段。18个转化子中有2个具有正确大小的插入片段,大约是2800bp。两个克隆都被测试是否产生MmeI内切酶活性。这些克隆在500ml含有100μg/ml氨苄青霉素的L-broth培养基中37℃过夜培养。细胞通过离心收集,悬浮在10mL超声缓冲液(20mMTris-HCl、1mM DTT、0.1mM EDTA,pH7.5)中用超声破碎细胞。粗裂解物通过离心使之澄清,回收上清。裂解液被用来检测内切酶活性,将裂解液用含有20μg/ml Lamda DNA底物并补充有终浓度为100μM的SAM的1×反应缓冲液NEBuffer1(新英格兰生物实验室)进行一系列稀释。反应在37℃温浴1小时。反应产物用1%的琼脂糖凝胶和1×TBE缓冲液通过琼脂糖凝胶电泳分析。两个克隆中有1个具有MmeI内切酶活性。这个有活性的克隆被标记为菌株NEB1457,可用于后续的MmeI生产。该克隆中表达MmeI活性的质粒构建物被标记为pTBMmeI.1。

                      实施例III

MmeI内切酶在体内条件下提供抗MmeI剪切的保护作用

质粒pTBMmeI.1通过Qiagen的小量制备(miniprep)程序从NEB1457中纯化出来。这个质粒在载体骨架中具有两个MmeI位点,在MmeI基因中也有一个MmeI位点。质粒用MmeI消化以检测这段DNA是否对MmeI内切酶活性具有抗性,这种抗性意味着单个MmeI基因可以在体内条件下甲基化DNA以保护宿主DNA免受内切酶活性的影响。为了检测将下列试剂混合:

10μl pTBMmeI.1 miniprep DNA

15μl 10×NEBuffer4

15μl SAM(1mM储液)

110μl dH2O

1μl MmeI内切酶(15单位)。

反应液混合之后分成三份。往第一个三分之一反应液中加入0.5μl水,往第二个三分之一反应液中加入0.5μl pRRS载体,往第三个三分之一反应液中加入0.5μl PhiX174 DNA作为阳性对照。pTBMmeI.1不被MmeI内切酶活性剪切,而同在一个反应体系中的PhiX174和pRRSDNA都被剪切,这表明pTBMmeI.1 DNA中的三个MmeI位点对MmeI内切酶活性都具有抗性。

                        实施例IV

               MmeI内切酶对甲基化的灵敏性

现有技术的文献报道MmeI内切酶只甲基化其识别序列中的一条链,并且认为这种半甲基化并不能阻止该内切酶继而对该DNA的剪切(Tucholski,Gene 223(1998)293-302)。为了测试这一点,四种寡聚核苷酸被合成出来,从而得到两条链都没有甲基化(寡聚物1+寡聚物2)、只有上链被甲基化(寡聚物3+寡聚物2)、只有下链被甲基化(寡聚物1+寡聚物4),或者两条链都被甲基化(寡聚物3+寡聚物4)的DNA底物。这些合成的寡聚核苷酸如下:

寡聚物1:

5’-FAM-GTTTGAAGACTCCGACGCGATGGCCAGCGATCGGCGCCTCAGCTTTTG-3’(SEQ ID NO:46)

寡聚物2:

5’-FAM-CAAAAGCTGAGGCGCCGATCGCTGGCCATCGCGTCGGAGTCTTCAAAC-3’(SEQ ID NO:47)

寡聚物3:

5’-FAM-GTTTGAAGACTCCG(6mA)

CGCGATGGCCAGCGATCGGCGCCTCAGCTTTTG-3’(SEQ IDNO:48)

寡聚物4:

5’-FAM-CAAAAGCTGAGGCGCCGATCGCTGGCCATCGCGTCGG(6mA)GTCTTCAAAC-3’(SEQ ID NO:49)。

(MmeI识别序列以外的其它核苷酸也在其它研究中被甲基化,但由于MmeI对于这些核苷酸没有任何序列特异性,因此确实可能影响MmeI活性的才表示出来,而其它甲基化为了简明起见而在这里略去)。双链DNA是通过将100μl上链寡聚核苷酸(14μm储液)和100μl下链寡聚核苷酸(14μm储液)混合,加热到85℃然后经20分钟缓慢冷却到30℃而形成的。然后使用MmeI在30μl的反应中剪切寡聚核苷酸对,反应体积中包括1×NEBuffer4、2.5μM寡聚核苷酸、100μM的SAM和2.5单位的MmeI。作为对照,限制性内切酶Hpy188I也被用于剪切所述寡聚DNA。Hpy188I的识别序列覆盖了这段DNA中MmeI识别序列的前5个核苷酸,5’-TCNGA-3’,而且Hpy188I的活性会被这段DNA中任一条链上的腺嘌呤甲基化所阻断。结果发现MmeI按照预想的一样剪切没有甲基化的DNA。与以前的教导(Tucholski,Gene 223:293-302(1998))相反,MmeI并不剪切只有上链被甲基化的半甲基化DNA:5’-TCCG(N6Ma)C-3’。当只有下链被甲基化的时候,MmeI确实会剪切该DNA。当两条链都被甲基化的时候,MmeI不剪切DNA。(图5)这个发现与观察到的单个MmeI酶在体内条件下保护宿主DNA免受剪切的能力以及MmeI只甲基化其识别序列上链的观察一致。我们通过用带有氚标记的H3-SAM甲基化上述寡聚核苷酸对,再洗去没有整合的SAM并对DNA进行放射性活性计数,从而确认MmeI酶只甲基化其识别序列的上链。未甲基化的寡聚DNA和上链没有甲基化、下链甲基化的DNA都具有比背景高10倍以上的计数量,而下链没有甲基化、上链甲基化的DNA和两条链都甲基化的DNA具有接近背景的计数量(图6)。这些发现表明MmeI是一种新型的不需要另外单独的甲基转移酶来修饰宿主DNA以提供抗该内切酶活性的保护作用的限制性修饰系统,就像IIG型(也称为IV型)的酶如Eco57I一样。

                      实施例V

                    DNA测序和分析

DNA测序:DNA测序是在ABI373或ABI377自动测序仪上用双链模板进行的。扩增的DNA片段和各个克隆用上述合成的引物或者载体上的通用引物进行测序。

计算机分析:获得的DNA序列的计算机分析是用GeneticsComputer Group程序(Deverenx等,Nucleic Acids Res.12:387-395(1984))进行的,而数据库相似性搜索是通过因特网在美国国立生物信息中心的网站(http://www.ncbi.nlm.nih.gov/BLAST/)上用BLASTX和BLASTP算法(Altschul等,J.Mol.Biol 215:403-410(1990)和Gish等,Nature Genet.3:266-722(1993))实施的。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号