首页> 中国专利> 调节产纤维植物中纤维素生物合成的方法和手段

调节产纤维植物中纤维素生物合成的方法和手段

摘要

本发明提供了用于在产纤维植物例如棉属植物中调节(即增强或降低)纤维素生物合成和/或纤维品质的嵌合基因,以及利用所述嵌合基因调节纤维素生物合成的方法。本发明还提供了包括本发明的嵌合基因的植物细胞和植物以及此类包括本发明的嵌合基因的植物的种子。本发明还提供了用于在包括一种特定植物品种的不同基因型或变种的群体中鉴别编码参与纤维素生物合成的蛋白质的基因的等位基因变异的方法。

著录项

  • 公开/公告号CN1732262A

    专利类型发明专利

  • 公开/公告日2006-02-08

    原文格式PDF

  • 申请/专利权人 澳大利亚国立大学;

    申请/专利号CN200380105797.1

  • 发明设计人 理查德·威廉森;乔安妮·伯恩;

    申请日2003-12-12

  • 分类号C12N15/29(20060101);A01H5/00(20060101);A01H5/10(20060101);

  • 代理机构72002 永新专利商标代理有限公司;

  • 代理人林晓红

  • 地址 澳大利亚澳大利亚首都地区

  • 入库时间 2023-12-17 16:59:29

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2013-02-20

    未缴年费专利权终止 IPC(主分类):C12N15/29 授权公告日:20080903 终止日期:20111212 申请日:20031212

    专利权的终止

  • 2008-09-03

    授权

    授权

  • 2006-03-29

    实质审查的生效

    实质审查的生效

  • 2006-02-08

    公开

    公开

说明书

发明领域

本发明涉及农业生物工程学领域。更具体地,本发明提供了参与纤维素生物合成的新的基因以及使用此类基因调节产纤维植物例如棉属植物中的纤维素生物合成的方法。本发明也提供了用于在产纤维植物群体中鉴别并分离这些基因的与产生的纤维的品质有关联的等位基因的方法。

背景技术

纤维素是高等植物细胞壁的主要结构多糖。β-1,4-联葡糖残基(β-1,4-1inked glucosyl residues)的链在合成后迅速组装形成坚硬的、在化学性质上具有抵抗力的微纤维。其机械特性及其在细胞壁的定位影响了细胞在不同反向的相对伸展性,并决定成熟细胞和器官的最终机械特性。这些机械特性对于木材、纸张、纺织品和化学工业极为重要。

很多用于纺织业的高质量纤维是棉属植物产生的。全世界的大约90%的棉属植物是陆地棉(Gossypium hirsutum L.),而海岛棉(Gossypiumbarbadense)占大约8%。

已经在多种植物中通过突变分析鉴定了若干种参与纤维素生物合成的基因。鼠耳芥(Arabidopsis thaliana)的突变株说明,体内纤维素合成需要编码糖基转移酶的AtCesA基因家族成员的活性(Arioli等,1998;Taylor等,1999;Fagard等,2000;Taylor等,2000;Scheible等,2001;Burn等,2002a;Desprez等,2002)、编码膜相关性内-1,4-β-D-葡聚糖酶的AtKOR1基因(At5g49720)活性(Nicol等,1998;Zuo等,2000;Lane等,2001;Sato等,2001)、编码一种功能未知的质膜蛋白的KOBITO1的活性(Pagant等,2002)和编码ER中进行N-糖基化/品质控制途径的酶的基因的活性(Lukowitz等,2001;Bum等,2002b;Gillmor等,2002)。

内-1,4-β-D-葡聚糖酶在纤维素合成中的功能仍有待确定,但其缺乏BnCel16的对结晶纤维素的活性,BnCel16是一种相关的欧洲油菜(Brassica napus)酶(Mlhj等,2001),这提示这种酶可能裂解非结晶葡聚糖链,例如脂质连接引物(lipid-linked primer)或葡聚糖供体(Williamson等,2001;Peng等,2002)。番茄Ce13(LeCe13)是第一种得到鉴定的膜相关性内-1,4-β-D-葡聚糖酶(Brummel1等,1997),而LeCe13的抗体检测到棉纤维蛋白在除草剂抑制纤维素合成的过程中被上调(Peng等,2001)。棉纤维膜成分的体外纤维素合成活性需要Ca2+,而由于外源性的Ca2+-非依赖性内-1,4-β-D-葡聚糖酶可使得纤维素合成活性恢复,因此认为KOR(GhKOR)的棉属植物直向同源物是内源性Ca2+-依赖性因子(Peng等,2002)。截短形式的BnCel16在体外显示出Ca2+-依赖性(Mlhj等,2001)。

进一步遗传学数据指向应答于N-糖基化/品质控制途径的酶缺陷的纤维素合成。这些步骤出现于ER而不是在质膜,且因此可能通过为质膜提供关键的糖蛋白而仅仅间接作用于合成。当富甘露糖寡糖Glc3Man9GlcNac2在ER膜的多萜醇上组装并被转移到含有Asn-X-Ser或Asn-X-Thr基序(其中X是除Pro以外的任何氨基酸)的新合成的蛋白质的Asn残基的时候即开始N-糖基化。

通过葡糖苷酶I和II进一步加工糖蛋白,N-糖基化与负责保证新合成的蛋白质正确折叠的品质控制途径相交(Helenius and Aebi,2001;Vitale,2001)。葡糖苷酶I去除末端α-1,2-联葡糖残基以产生Glc2Man9GlcNac2,而葡糖苷酶II去除下一个α-1,3-葡糖残基。携带所得GlcMan9GlcNac2的多肽特异性结合分子伴侣(钙连接蛋白和钙网蛋白)以及或许其他的可促进新合成的蛋白质的正确折叠的蛋白质。当葡糖苷酶II将结合分子伴侣所需的最后的Glc残基去除后,糖蛋白释放所述分子伴侣。然后糖蛋白葡糖基转移酶将一个Glc残基再次结合到非正确折叠的糖蛋白的Man9GlcNAc2,如此使得它们可再次结合分子伴侣并仍拥有正确折叠的机会。不过,正确折叠的蛋白质则不能被该酶再次葡糖基化,而是通过分泌途径前进以进一步加工和输送。

该途径中的若干个环节的缺陷可影响纤维素合成。序列分析显示,马铃薯MAL1基因编码一种葡糖苷酶II,且反义抑制降低了葡糖苷酶II活性(Taylor等,2000a)。与对照相比,当生长于田间环境时,M4LJ反义植物积聚较少的纤维素,不过,在暖房条件下没有明显的表型。胚芽致死knopf突变体缺乏葡糖苷酶I并严重缺乏纤维素(Gillmor等,2002)。最后,胚芽致死cyt1突变体是来自甘露糖-1-磷酸guanylyltransferase缺陷的纤维素缺陷体,该酶产生组装高甘露糖寡糖所需的(包括其他)UDP-Man,高甘露糖寡糖自多萜醇转移至新生的蛋白质(Lukowitz等,2001)。影响纤维素合成的突变主要针对那些N-糖基化途径与品质控制途径发生交叉的早期步骤。似乎特别重要的是品质控制,而不是在重要蛋白质上产生成熟聚糖,这是由于一种N-乙酰氨基葡萄糖转移酶I的缺陷没有产生可检测到的表型,该缺陷阻断了高尔基体中形成成熟的N-联聚糖的步骤(von Schaewen等,1993)。

Baskin等,1992描述了鼠耳芥属突变体,这些突变体显示出根部径向膨胀,这些突变体称为rsw1、rsw2和rsw3。这些突变系显示出纤维素的产生具有选择性降低(Peng等,2000)。

WO98/00549一般性涉及分离的基因,这些基因编码参与植物中纤维素生物合成的多肽,还涉及转基因植物,其表达有义或反义方向的所述基因或作为核酶、共抑制或基因导向分子的所述基因。更具体地,其请求保护一种核酸分子,其分离自鼠耳芥、稻米(Oryza sativa)、小麦、大麦、玉米、芸苔(Brassica ssp.)、陆地棉和桉(Eucalyptus ssp),其编码一种对纤维素生物合成十分重要的酶,特别是纤维素合酶及其同源物、类似物和衍生物,及其在产生表达改变了的纤维素生物合成特性的转基因植物中的用途。

WO 98/50568公开了使用编码内-1,4-β-葡聚糖酶的核苷酸序列在植物中抑制细胞的生长。所述核苷酸序列与鼠耳芥属KOR蛋白序列或如下所述的一种蛋白序列完全或部分相对应,所述的一种蛋白序列的N端与所述KOR的前107个氨基酸具有至少40%相同性且优选地具有70%相同性。

WO 97/24448描述了重组的和分离的核酸,所述核酸编码一种植物α-葡糖苷酶。其也提供了一种反义核苷酸以及所述分离的或重组的序列和反义序列的用途。该发明的用途包括增强和降低α-葡糖苷酶的表达以及提供新的淀粉。

WO 00/08175涉及编码来自马铃薯的具有α-葡糖苷酶活性的蛋白质的核酸分子。该发明也涉及用于产生合成改性淀粉的转基因植物细胞和植物的方法。该发明进一步涉及含有所述核酸分子的载体和宿主细胞、由该发明的方法得到的植物细胞和植物、由所述植物细胞合成的淀粉以及产生此类淀粉的方法。

WO 98/39455公开了一种参与微生物合成纤维素的基因和酶。提供了编码纤维素酶、纤维素合酶复合体和α-葡糖苷酶的特定的基因。

WO9818949和US6271443提供了来自棉属植物(陆地棉)的两种植物cDNA克隆,它们是编码纤维素合酶的催化亚基的细菌CelA基因的同源物。其还提供了纤维素合酶的编码区的基因组启动子区域。还提供了在改良棉纤维和木材品质中使用纤维素合酶的方法。

不过,现有技术仍然亟需那些已知参与纤维素生物合成的基因的替代物,且没有公开参与纤维素生物合成的野生型基因的核苷酸序列以及在rsw3突变体鼠耳芥系中是突变的核苷酸序列。此外,现有技术没有公开来自棉属植物的参与纤维素生物合成的RSW2或RSW3的棉属植物同源物基因。

这些以及其他的问题通过以下公开的本发明的各种不同实施方式和权利要求书而得以解决。

发明内容

本发明的一个目的是提供一种用于增加产纤维植物,特别是棉属植物中的纤维素生物合成,例如棉绒纤维生物合成的方法,其包括以下步骤:

(a)给所述产纤维植物的细胞提供一种嵌合基因,所述嵌合基因包括以下可操纵连接的DNA片段:

i)在所述植物的所述细胞中可表达的启动子,例如组成型启动子、纤维特异性启动子或者苹果青霉素启动子;

ii)编码包括SEQ ID No.5或SEQ ID No.6或SEQ ID No.7或SEQ ID No.8的氨基酸序列的蛋白质(或者所述蛋白质的具有同样酶活性的变体)的DNA区域,例如SEQ ID No.1的自第位核苷酸至第1986位核苷酸的核苷酸序列或SEQ ID No.2的自第47位核苷酸至第1906位核苷酸的核苷酸序列或SEQ ID No.3的或SEQ ID No.4的自第2位核苷酸至第1576位核苷酸的核苷酸序列或SEQ ID No.9的核苷酸序列;

iii)参与转录终止和聚腺苷酸化的3’区域。

本发明的另一个目的是提供一种用于降低产纤维植物,特别是棉属植物中的纤维素生物合成,例如绒毛纤维生物合成的方法,其包括给所述产纤维植物的细胞提供一种能够降低所述产纤维植物的一种内源性基因的表达的嵌合基因的步骤,其中所述内源性基因编码一种包括SEQID No.5或SEQ ID No.6或SEQ ID No.7或SEQ ID No.8的氨基酸序列的蛋白质或其变体,所述变体具有同样的酶活性。所述导入的嵌合基因可包括:一种具有21个连续的核苷酸的核苷酸序列,其选自编码一种包括SEQ ID No.5或SEQ ID No.6或SEQ ID No.7或SEQ ID No.8的氨基酸序列的蛋白质的核苷酸序列,例如SEQ ID No.1或SEQ ID No.2或SEQ ID No.3或SEQ ID No.4或SEQ ID No.9的核苷酸序列或其互补序列,所述核苷酸序列可操纵地连接于在植物中可表达的启动子例如组成型启动子或绒毛纤维特异性启动子,以及参与转录终止和聚腺苷酸化的3’区域。所述嵌合基因也可包括:一种具有21个连续的核苷酸的第一核苷酸序列,其选自编码一种包括SEQ ID No.5或SEQ ID No.6或SEQ ID No.7或SEQ ID No.8的氨基酸序列的蛋白质的核苷酸序列,例如SEQ ID No.1、SEQ ID No.2、SEQ ID No.3和SEQ ID No.4或SEQID No.9的核苷酸序列,和一种与所述第一核苷酸序列互补的第二核苷酸序列,所述核苷酸序列可操纵地连接于在植物中可表达的启动子,以及参与转录终止和聚腺苷酸化的3’区域,由此在所述嵌合基因转录后形成一种RNA,所述RNA可在所述第一和第二核苷酸序列之间形成一个双链RNA区域。

本发明进一步涉及一种用于增加产纤维植物中,特别是棉属植物中的纤维素生物合成的嵌合基因,其包括以下可操纵连接的DNA片段:在所述植物的所述细胞中可表达的启动子,例如组成型启动子、(棉绒)纤维特异性启动子或苹果青霉素启动子;编码包括SEQ ID No.6或SEQID No.7或SEQ ID No.8的氨基酸序列的蛋白质或其变体的DNA区域,所述变体具有同样的酶活性,例如SEQ ID No.1的自第121位核苷酸至第1986位核苷酸或SEQ ID No.2的自第47位核苷酸至第1906位核苷酸或SEQ ID No.3的或SEQ ID No.4的自第2位核苷酸至第1576位核苷酸或SEQ ID No.9的核苷酸序列;以及参与转录终止和聚腺苷酸化的3’端区域。

本发明也涉及一种用于降低产纤维植中,特别是棉属植物中的纤维素生物合成的嵌合基因,其包括一种可操纵地连接于在植物中可表达的启动子的具有21个连续的核苷酸的核苷酸序列,所述序列选自编码一种包括SEQ ID No.6或SEQ ID No.7或SEQ ID No.8的氨基酸序列的蛋白质的核苷酸序列,例如SEQ ID No.2、SEQ ID No.3或SEQ ID No.4或SEQ ID No.9的核苷酸序列或其互补序列,以及参与转录终止和聚腺苷酸化的3’区域。

本发明还涉及一种用于降低产纤维植物中,特别是棉属植物中的纤维素生物合成的嵌合基因,其包括可操纵地连接于在植物中可表达的启动子的一种具有21个连续的核苷酸的第一核苷酸序列和一种与所述第一核苷酸序列互补的第二核苷酸序列以及参与转录终止和聚腺苷酸化的3’区域,所述第一核苷酸序列选自编码一种包括SEQ ID No.6或SEQID No.7或SEQ ID No.8的氨基酸序列的蛋白质的核苷酸序列,由此在所述嵌合基因转录后形成一种RNA,所述RNA可在所述第一和第二核苷酸序列之间形成一个双链RNA区域。

本发明的另一方面提供了包含本发明的嵌合基因的植物细胞和植物,以及包含本发明的嵌合基因的此类植物的种子。此类植物优选地基本上由包含本发明的嵌合基因的植物细胞组成。

因此本发明涉及本发明的嵌合基因在调节产纤维植物的,例如棉属植物的,纤维素生物合成和纤维品质中的用途。

本发明的另一方面还在于提供了一种用于在包括一种特定植物品种的不同基因型或变种的群体中鉴别编码参与纤维素生物合成的蛋白质的基因的等位基因变异的方法,所述特定植物品种优选地是产纤维植物品种,例如棉属植物,所述等位基因变异单独地或者组合地与纤维素生产的数量和/品质以及纤维生产有关联,所述方法的步骤包括:

a)提供包含不同等位基因形式的编码包括SEQ ID No.5、6、7或8的氨基酸序列的蛋白质的核苷酸序列的特定植物品种或杂种繁殖植物品种的不同变种或基因型的群体;

b)确定所述群体中每一个个体的与纤维生产和/或纤维素生物合成有关的参数;

c)确定所述群体中每一个个体是否存在一种特定等位基因形式的编码包括SEQ ID No.5、6、7或8的氨基酸序列的蛋白质的核苷酸序列;以及

d)将出现特定的纤维或纤维素参数与是否存在一种特定等位基因形式的所述核苷酸序列或此类等位基因形式的一种特定组合相关联。

附图说明

图1:蛋白质GhKOR(SEQ ID No.6)、LeCel3(保藏号T07612)和AtKOR1(保藏号At5g49720;SEQ ID No.5)与BnCel16(保藏号CAB51903)的ClustalW比对。突出的部分是:极性化导向基序,涉及导向细胞板(cell plate)(Zuo等,2000);推定的靠近N端的跨膜区(跨膜);4个潜在参与催化的保守残基(Asp-198、Asp-201、His-516和E-555;标记为o)以及与家族9糖苷水解酶非常相似的代表性部分;富Pro且具有内-1,4-β-葡聚糖酶家族的膜结合成员的特征的C端区域;8个推定的N-糖基化位点(Asn-X-Ser/Thr;标记为G1至G8)。

图2:通过以可操纵地连接于CaMV 35S启动子的GhKOR1 cDNA(SEQ ID No.2)进行转染而与rsw2-1互补。(A)在29℃暴露2天后,rsw2-1根发生膨胀,而野生型(Co)和含有AtKOR1或GhKOR的互补植物则不发生膨胀。(B)两株植物的成熟的茎,各自为rsw2-1(左)野生型和表达GhKOR的rsw2-1。在21℃生长于罐中的植株的照片,直至开始抽苔(bolting),此时将抽苔切下并将植株转移至29℃以使抽苔再生。

图3:编码葡糖苷酶II基因的突变引起径向膨胀。(a)以自野生型基因组扩增的5.8kB片段转化的rsw3互补根部径向膨胀。Columbia野生型(左)、rsw3(中)和以葡糖苷酶II基因的基因组拷贝转化的rsw3卡那霉素抗性T1幼苗(右)。野生型基因抑制径向膨胀。在拍照前,将所有植物转移至30℃放置2天。(b)rsw3突变是插入性突变体5GT5691的等位基因突变,其在葡糖苷酶II基因的第一个外显子中含有Ds元件。Columbia野生型(左)、rsw3(中)和来自5GT5691与rsw3杂交的杂合F1植物。F1杂合子和rsw3纯合子显示温度诱导的径向膨胀。在拍照前,将所有植物转移至30℃放置2天。

图4:Aglu-3/RSW3序列(Genbank NP_201189)与来自马铃薯(保藏号T07391)、小鼠(NP_032086)和裂殖酵母(CAB65603)的ER固有的葡糖苷酶II的序列的比对。Monroe等(1999)的进化枝2证实了这种高保守性。它们包括若干参与催化的残基(Asp 512和Asp 617;*)。rsw3-1突变的位点(Ser599●)在这些共有序列附近并在这些以及其他葡糖苷酶II序列中是保守的。预测的N端信号序列示于框中。在C端没有HDELER-保留序列。

图5:推荐的鼠耳芥属(At5g56360)的和水稻(我们修改的BAA88186)的β-亚基与来自小鼠(AAC53183)的和裂殖酵母(BAA13906)的葡糖苷酶IIβ-亚基的比对。注意推定的N端信号序列(框中)、C端H/VDEL ER-保留信号和靠近N端的甘露糖受体同源区域(MHR)。给出了MHR中的6个半胱氨酸(f酵母中仅为4个)的编号,并标出了参与底物结合的R和Y残基(●)和半胱氨酸5和6之间的底物识别环。在该序列的其他部分,注意N端和C端结构域具有相对高水平的相似性,而中部区域的相似性要低得多并具有植物特异性插入体。

图6:在所有测试的鼠耳芥属组织中均检测到α-亚基(a)和β-亚基(b)的mRNA。使用来自根(道1)、完整莲座叶(2)、叶片(3)、成熟的茎组织(4)、茎生叶片(5)、花芽(6)、花(7)、长角果(8)、黑暗中生长的胚轴(9)的mRNA的RT-PCR。(在另一个实验中证实黑暗中生长的胚轴存在β-亚基)。

图7:rsw3的形态学。

(a)幼苗的根系显示在膨胀和停止延长之前侧根延伸一定距离。植物在21℃生长5天并在30℃生长6天。比例尺=2mm。

(b)根继续生长产生密集的、高度分枝的根系,并在30℃生长21天的植物上产生大量密集的极小的叶片。比例尺=5mm。

(c)在黑暗中21℃生长3天并在30℃生长3天的胚轴。左起:野生型、rsw1-1、rsw2-1、rsw3、rsw1-1rsw2-1、rsw1-1rsw3。相对于其他单突变体,rsw3对胚轴的影响较弱,而rsw1-1rsw3较rsw1-1rsw2-1更弱。比例尺=5mm。

(d)在30℃在琼脂上生长35天的rsw3的光镜检查。自若干个花结出现接近正常大小的花芽的微弱荧光(右上和左下)。比例尺=5mm。

(e)在30℃生长21天的rsw3植物的扫描电子显微镜并显示出现多个花结。比例尺=1mm。

(f)(e)中环形部分的细节显示细小的叶片的非常复杂的排列,其中很多带有近似正常大小和形态的毛状体。比例尺=200μm。

(g)在30℃生长10天的植物上的野生型叶片表面的扫描电子显微镜照片。注意那些清晰显示出的细胞边界、气孔和毛状体。

(h)rsw3叶片的表面显示出铺路石状细胞(pavement cells)的轮廓明显欠清晰、在其次生细胞环的顶部有明显塌陷的毛状体(CT)以及许多气孔,其保卫细胞突出于叶片表面以上。(g)和(h)的比例尺=100μm。

图8:rsw3的茎生长和再生性发生。

(a和b)21℃(a)和30℃(b)时Columbia野生型、rsw3、rsw1和rsw1rsw3双突变体的次生茎延长的动力学。所有植物生长于21℃直至茎开始出现。将其切下并在指定的温度再次生长次生抽苔。单突变体与野生型在21℃仅有极小的差异,不过双突变体延长得更加缓慢且最终高度明显更矮小。在30℃达到的最终高度差异很大,这与其经由的轨迹一样。rsw1延长得更加缓慢,但延长一直持续,至少与其野生型一样。rsw3延长得几乎与野生型一样迅速,但4天后停止延长达大约6天。rsw1rsw3双突变体延长比较不迅速,并在大约第5天停止延长。

(c和d)光镜显示野生型具有间隔良好的花(c)以及rsw3的因其早期停止延长而形成的成簇的花(d)。

(e和f)冷扫描电子显微镜显示了野生型(e)和rsw3(f)的花芽,花芽的大小相似,但rsw3过早开花。注意rsw3的柱头(St)的未成熟状态和萼片(Se)上的细胞的不规则形状。(e)和(f)的比例尺=200μm。

(g和h)冷扫描电子显微镜显示出保持在21℃(g)和30℃(h)的植物产生的吸液后的rsw3的种子。30℃的种子皱缩并缺乏21℃的种子所具有的清晰的细胞图案。

(i-n)吸液后的种子以钌红染色后的光镜照片,显示表面黏液覆层。野生型(i,j)、rsw1(k,l)、rsw3(m,n)。i,k,m中的种子产生于21℃的植物,j,l,n中的种子产生于30℃的植物。分泌黏液的通常是30℃的rsw1(l)和野生型(j)而不是rsw3(n)。

发明的详细描述

本发明基于鉴定了已经发生突变的鼠耳芥属突变体rsw3的野生型基因并阐明了其功能。本发明人还鉴定了相应于rsw2和rsw3鼠耳芥属突变体中的突变基因的棉属植物基因。这些棉属植物基因参与纤维素的产生。

在一个实施方式中,本发明涉及一种用于在植物中增加纤维素产生的方法,其步骤包括为植物的细胞提供一种嵌合基因,所述嵌合基因包括可操纵地连接于一种DNA区域的在植物中可表达的启动子以及参与转录终止和聚腺苷酸化的3’区域,所述DNA区域编码一种包括SEQ IDNo.5、SEQ ID No.6、SEQ ID No.7或SEQ ID No.8的氨基酸序列的蛋白质或其变体,所述变体具有与所述蛋白质相似的活性。所述植物可以是产纤维植物例如棉属植物,纤维素产生增加可导致产生更大量的棉纤维,优选地为棉绒纤维,或导致产生的棉纤维的长度发生改变或长度增加,或品质的改变例如抗张强度提高。

在此,“嵌合基因”或“嵌合核酸”指的是任何基因或任何核酸,其在正常情况下不存在于具体的真核生物物种中,或者指的是任何基因,其中启动子在天然情况下不与部分或全部被转录的DNA区域相关联,或不与该基因的至少一种其他调节区域相关联。

在此,术语“启动子”指的是任何在转录起始过程中被DNA-依赖性RNA-聚合酶识别并(直接或间接)结合的DNA。启动子包括转录起始位点和与转录起始因子和RNA聚合酶的结合位点,并可以包含多种可与基因表达调节蛋白结合的其他位点(如增强子)。在此,术语“调节区域”指的是任何参与驱动转录并控制(如调节)特定DNA序列的转录时机和水平的DNA,所述特定DNA序列例如为编码蛋白质或多肽的DNA。例如,5′调节区域(或“启动子区域”)是位于编码序列上游(即5′)的DNA序列并包含启动子和5′非翻译前导序列。3′调节区域是位于编码序列下游(即3′)的DNA序列并包含合适的转录终止(和/或调节)信号,包括一或多个聚腺苷酸化信号。

在本发明的一个实施方式中,启动子是组成型启动子。在本发明的另一个实施方式中,启动子活性可被外在的或内在的刺激增强(诱导型启动子),例如但不限于激素、化学品、机械刺激、非生物性或生物学应激条件。能够以时间的或空间的方式来调节启动子的活性(组织特异性启动子;发育调节的启动子)。

在本发明的一个具体实施方式中,启动子是植物可操纵的(即植物可表达的)启动子。在此,术语“植物可表达的启动子”指的是能够在植物细胞内控制(起始)转录的DNA序列。这包括任一一种植物来源的启动子,但也可以是非植物来源的但能够在植物细胞中指导转录的启动子,即特定的病毒或细菌来源的启动子,例如CaMV 35S启动子(Hapster等,1988)、地三叶草(subterranean clover)病毒启动子No 4.或No.7(WO9606932)或T-DNA基因启动子,但也可以是组织特异性或器官特异性启动子,包括但不限于种子特异性启动子(如WO89/03887)、器官原基特异性启动子(An等,1996)、茎特异性启动子(Keller等,1988)、叶片特异性启动子(Hudspeth等,1989)、叶肉特异性启动子(例如光诱导型Rubisco启动子)、根特异性启动子(Keller等,1989)、块茎特异性启动子(Keil等,1989)、血管组织特异性启动子(Peleman等,1989)、雄蕊选择性启动子(WO 89/10396,WO 92/13956)等等。

优选的植物可表达的启动子包括纤维特异性和/或次生细胞壁特异性启动子,可根据WO 98/18949、WO98/00549或US5932713所述对其进行分离。WO98/18949或US 6,271,443所公开的启动子也是合适的,特别优选的是棉绒纤维特异性启动子。

在上述方法的一个实施方式中,编码包含SEQ ID No.5、SEQ IDNo.6、SEQ ID No.7或SEQ ID No.8的氨基酸序列的蛋白质的DNA区域包含的核苷酸序列为SEQ ID No.1的第121至1986位核苷酸、SEQID No.2的第47至1906位核苷酸、SEQ ID No.3或SEQ ID No.4的第2至1576位核苷酸、或SEQ ID No.9。

在上述方法的另一个实施方式中,DNA区域编码包含SEQ ID No.5、SEQ ID No.6、SEQ ID No.7或SEQ ID No.8的氨基酸序列的蛋白质的变体。在此,“变体”蛋白质指的是这样的蛋白质,所述蛋白质通过取代、缺失、插入,使得其中一或多个氨基酸与具有SEQ ID No.5、SEQ ID No.6、SEQ ID No.7或SEQ ID No.8的氨基酸序列的蛋白质中的相应位置的氨基酸不同;且所述蛋白质具有由SEQ ID No.5、SEQ ID No.6、SEQ ID No.7或SEQ ID No.8编码的蛋白质的至少一种功能,例如同样的酶或催化活性。获得变体的方法例如位点特异性诱变方法以及鉴定由这些变体序列所编码的酶活性的测试方法是本领域已知的。优选的取代也称为保守性取代,其中多肽中的一种氨基酸残基被替换为另一种具有相似化学性质的天然存在的氨基酸,例如GlyAla,ValIleLeu,AspGlu,LysArg,AsnGln或PheTrpTyr。

根据说明书,编码变体蛋白质的等位基因形式的核苷酸序列可在严格性条件下通过文库杂交进行鉴定,例如不同变种或植物品系的cDNA或基因组文库,特别是棉属植物变种和植物品系。上述优选的编码区域的功能性等价物是在严格性条件下与编码SEQ ID No.5、6、7或8的氨基酸序列的核苷酸序列或SEQ ID No.1、2、3、4或9的核苷酸序列杂交的核苷酸序列或其足够大的一部分(优选地大约25个连续的核苷酸,特别优选地至少大约50个连续的核苷酸,更加特别优选地至少大约100个连续的核苷酸),并且其编码一种功能性蛋白质,该蛋白质能够互补鼠耳芥属的rsw2或rsw3突变体品系中的至少一种功能,但优选地能够互补全部受影响的能够功能。也可采用例如聚合酶链反应进行扩增而鉴别并分离此类核苷酸,扩增可使用合适的寡核苷酸对,其具有SEQ ID No.1、SEQ ID N.2、SEQ ID No.3、SEQ ID No.4或SEQ ID No.9的核苷酸的至少大约25个连续的核苷酸,特别优选地至少大约50个连续的核苷酸,更加特别优选地至少大约100个连续的核苷酸。

“严格性杂交条件”在此指的是,如果探针与靶序列之间具有至少95%且优选地至少97%的序列相同性,则通常会发生杂交。严格性杂交条件的实例是在包括50%甲酰胺,5×SSC(150mM NaCl,15mM柠檬酸钠),50mM磷酸钠(pH 7.6),5×Denhardt溶液,10%硫酸右旋糖苷和20μg/ml变性的剪断的载体DNA例如鲑精DNA的溶液中孵育过夜,随后在大约65℃在0.1×SSC中洗涤杂交支持物。其他的杂交和洗涤条件是已知的并可参照Sambrook等,Molecular Cloning:A Laboratory Manual,Second Edition,Cold Spring Harbor,NY(1989),特别是11章。

在本发明的另一方面,所鉴定的基因可用于在植物如产纤维植物中,例如棉属植物中,降低纤维素的生物合成。因此,本发明的另一个实施方式提供了一种在植物如产纤维植物中,特别是棉属植物中,降低纤维素生物合成的方法,其步骤包括给所述产纤维植物的细胞提供一种嵌合基因,所述嵌合基因能够降低所述产纤维植物的一种内源性基因的表达,其中所述内源性基因编码一种包括SEQ ID No.5或SEQ ID No.6或SEQ ID No.7或SEQ ID No.8的氨基酸序列的蛋白质或其变体,所述变体具有相同的功能或酶活性。

在本发明的这种方法的一个实施方式中,将嵌合基因提供给所述植物的细胞,其中所述嵌合基因包括一种可操纵地连接于在植物中可表达的启动子的具有21个连续的核苷酸的序列以及参与转录终止和聚腺苷酸化的3’区域,该序列选自编码一种包括SEQ ID No.5或SEQ ID No.6或SEQ ID No.7或SEQ ID No.8的氨基酸序列的蛋白质的核苷酸序列,例如为一种选自SEQ ID No.1或SEQ ID No.2或SEQ ID No.3或SEQID No.4或SEQ ID No.9的核苷酸序列的具有21个连续的核苷酸的核苷酸序列(所谓“有义”RNA介导的基因沉默)。在本发明的这种方法的另一个实施方式中,将嵌合基因提供给所述植物的细胞,其中所述嵌合基因包括一种可操纵地连接于在植物中可表达的启动子的具有21个连续的核苷酸的序列以及参与转录终止和聚腺苷酸化的3’区域,该序列选自编码一种包括SEQ ID No.5或SEQ ID No.6或SEQ ID No.7或SEQ IDNo.8的氨基酸序列的蛋白质的核苷酸序列的互补序列,例如为一种选自SEQ ID No.1或SEQ ID No.2或SEQ ID No.3或SEQ ID No.4或SEQ ID No.9的核苷酸序列的互补序列的具有21个连续的核苷酸的核苷酸序列(所谓“反义”RNA介导的基因沉默)。

反义或有义核苷酸序列的长度可以是自大约21个核苷酸(nt)直至长度等同于靶核酸的长度(以核苷酸计)。优选地,所述反义或有义核苷酸序列的总长度为至少大约50nt,100nt,150nt,200nt,或500nt。可以预期的是,除了靶核酸的总长度以外,反义或有义核苷酸序列的总长度没有上限。不过,从实际出发(例如为了嵌合基因的稳定性),预期反义或有义核苷酸序列的长度不应该超过5000nt,特别不应该超过2500nt,且应该在大约1000nt以内。

应该可以理解的是,反义或有义核苷酸序列的总长度越长,对总反义或有义核苷酸序列与靶基因的相应的序列或其互补序列之间的序列相同性的要求也就越不严格。优选地,总反义核苷酸序列应该与相应的靶序列的互补序列具有至少大约75%的序列相同性,优选地至少大约80%,更加优选地至少大约85%,相当优选地大约90%,特别优选地大约95%,更加特别优选地大约100%,相当特别优选的是与靶核酸的相应部分的互补序列完全相同。不过,优选地所述反义或有义核苷酸序列总是包括一种大约20-21nt的序列,其与靶核酸的相应部分或其互补序列具有100%的序列相同性。优选地,为了计算序列相同性并设计相应的反义或有义序列,应当将缺口数量降至最低,特别是对于那些更短的反义或有义序列。

在本发明中,两种相关的核苷酸或氨基酸序列的“序列相同性”,以百分数表示,指的是两种最佳比对的序列中的具有相同残基的位置数目(×100)除以进行比较的位置数目。缺口是比对中的一种位置,在该处,残基出现于一条序列中但未出现于另一条中,缺口被视为不具有相同性的残基位置。通过Needleman和Wunsch算法(Needleman andWunsch 1970)进行两序列的比对。采用标准的软件程序可常规进行计算机辅助序列比对,例如采用GAP,其是Wisconsin Package Version 10.1(Genetics Computer Group,Madison,Wisconsin,USA)的一部分,使用默认评分阵列,缺口创建罚分为50,缺口延伸罚分为3。

本发明的另一种实施方式涉及用于降低产纤维植物的内源性基因表达的方法,其中所述内源性基因编码包括SEQ ID No.5或SEQ ID No.6或SEQ ID No.7或SEQ ID No.8或的氨基酸序列的蛋白质或其变体,该方法使用置于植物中可表达的启动子控制下的DNA区域,该区域的转录产生所谓双链RNA分子,其既包括有义序列又包括反义序列,能够形成如WO 99/53050所述的双链RNA分子(其全部内容在此并入作为参考)。

因此,在本发明的一个方面,可给植物细胞提供一种嵌合基因,其包括可操纵地连接于一种DNA区域的在植物中可表达的启动子,该DNA区域包含编码区域的一部分,所述部分包含来自编码具有SEQ IDNo.5、6、7或8的氨基酸序列的蛋白质的核酸的编码区域的至少20或21个连续的核苷酸(所谓有义部分),以及一种DNA序列,所述DNA序列至少包含该有义部分的至少20或21个核苷酸的互补DNA序列,但其能够完全互补于该有义部分(所谓反义部分)。所述嵌合基因可包含额外的区域,例如在植物中具有转录终止和聚腺苷酸化功能的区域。转录后可产生一种RNA,其可在有义和反义区域的互补部分之间形成一种双链RNA茎。在有义和反义核苷酸序列之间可存在间隔区域。所述嵌合基因可进一步包含内含子序列,优选地位于间隔区域内部。

在本发明的另一个实施方式涉及一种用于降低产纤维植物的内源性基因的表达的嵌合基因,其中所述内源性基因编码一种包括SEQ ID No.5或SEQ ID No.6或SEQ ID No.7或SEQ ID No.8的氨基酸序列的蛋白质或其变体,所述变体具有相同的功能或酶活性,所述嵌合基因编码一种核酶,其识别并裂解一种RNA,所述RNA具有编码一种包括SEQ ID No.5或SEQ ID No.6或SEQ ID No.7或SEQ ID No.8的氨基酸序列的蛋白质或其变体的RNA的核苷酸序列。在另一个实施方式中,所述核酶识别并裂解一种RNA,所述RNA具有包括SEQ ID No.1、2、3或4的核苷酸序列的RNA的核苷酸序列。Haseloff和Gerlach(1988)已经公开了设计并使用核酶的方法,也参见WO 89/05852。

显然,只要RNA分子的核苷酸序列是通引用相应的DNA分子的核苷酸序列进行限定时,核苷酸序列中的胸腺嘧啶(T)均应替换为尿嘧啶(U)。引用的究竟是RNA或DNA分子可从本申请的上下文进行判断。在本发明的另一个实施方式中,提供了核酸(DNA或RNA分子),其可用于改变植物中的纤维素生物合成。因此本发明提供了一种嵌合基因(DNA分子),其包含以下可操纵连接的DNA片段:

i)在所述植物的所述细胞中可表达的启动子;

ii)包含具有至少21个核苷酸的核苷酸序列的DNA区域,所述核苷酸序列选自编码包含SEQ ID No.6或SEQ ID No.7或SEQ ID No.8的氨基酸序列的蛋白质(或具有相同酶活性的该蛋白质的变体)的核苷酸序列,例如SEQ ID No.1、2、3、4或9核苷酸序列;和/或

iii)包含具有至少21个核苷酸的核苷酸序列的DNA区域,所述核苷酸序列选自编码包含SEQ ID No.6或SEQ ID No.7或SEQ ID No.8的氨基酸序列的蛋白质(或具有相同酶活性的该蛋白质的变体)的核苷酸序列的互补序列,例如SEQ ID No.1、2、3、4或9核苷酸序列;和

iv)参与转录终止和聚腺苷酸化的3’端区域。

本发明还提供了可自本发明的嵌合基因获得的RNA分子。此类RNA分子通过在体内或体外对所述嵌合基因进行转录产生。它们可以通过体外转录而获得,其中转录区域置于一种启动子的控制下,该启动子被单亚基RNA聚合酶识别,其选自噬菌体例如SP6、T3或T7。或者,可通过本领域已知的方法在体外合成所述RNA分子。此外,本领域已知可对RNA核糖核苷骨架进行化学修饰以使得嵌合RNA分子更加稳定。

以上已经根据所提供的方法描述了嵌合基因或RNA分子用于改变纤维素生物合成的不同实施方式并可根据实际情况对这些实施方式进行必要的修改。

可将嵌合基因或RNA稳定地或瞬时地提供给植物细胞。典型地,可通过将嵌合基因整合入植物细胞的基因组而稳定地提供嵌合基因或RNA分子。将嵌合基因导入植物的方法是本领域已知的,并包括土壤杆菌介导的转化、微粒枪输送、微注射、对完好的细胞进行电穿孔、聚乙二醇介导的原生质体转化、原生质体电穿孔、脂质体介导的转化、硅晶须介导的转化等等。以这些方式获得的转化的细胞可再生为成熟的能够繁殖的植物。

在另一个实施方式中,本发明的嵌合基因或嵌合RNA分子可提供在一种DNA或RNA分子,所述DNA或RNA分子能够在植物细胞中自主复制,例如病毒载体。也可将本发明的嵌合基因或RNA分子瞬时地提供给植物的细胞。

本发明的目的还在于提供含有本发明的嵌合基因或RNA分子的植物细胞和植物。通过常规育种方法产生的那些包含本发明的嵌合基因的植物的配子、种子、胚芽、合子或体细胞、后代或杂合体,也属于本发明的范围内。

本发明的方法和手段特别适合用于棉属植物(陆地棉和海岛棉均可),特别适于Coker 312、Coker310、Coker 5Acala SJ-5、GSC25110、FiberMax819、FiberMax832、FiberMax966、FiberMax958、FiberMax989、FiberMax5024(和具有除草剂或害虫抗性性状的FiberMax转基因变种)Siokra 1-3、T25、GSA75、Acala SJ2、Acala SJ4、Acala SJ5、Acala SJ-C1、Acala B1644、Acala B1654-26、Acala B1654-43、Acala B3991、Acala GC356、Acala GC510、Acala GAM1、Acala C1、Acala Royale、Acala Maxxa、Acala Prema、Acala B638、Acala B1810、Acala B2724、Acala B4894、Acala B5002、非 Acala“picker”Siokra、“stripper”变种FC2017、Coker 315、STONEVILLE506、STONEVILLE 825、DP50、DP61、DP90、DP77、DES119、McN235、HBX87、HBX191、HBX107、FC 3027、CHEMBRED A1、CHEMBRED A2、CHEMBRED A3、CHEMBRED A4、CHEMBRED B1、CHEMBRED B2、CHEMBRED B3、CHEMBRED C1、CHEMBRED C2、CHEMBRED C3、CHEMBRED C4、PAYMASTER 145、HS26、HS46、SICALA、PIMA S6和ORO BLANCO PIMA。FiberMax是Australia of Cotton Seed Distributors Pty Ltd.的注册商标。

不过,这些方法和手段也可用于其他植物品种,例如大麻、黄麻、亚麻和木本植物,包括但不限于松(Pinus spp.)、杨(Populus spp.)、杉(Picea spp)和桉,等等。

在另一个实施方式中,提供了一种用于在一种特定植物品种(优选地为一种产纤维植物品种)的不同基因型或变种的群体中鉴别编码参与纤维素生物合成的蛋白质的基因的等位基因变异的方法,所述等位基因变异单独地或者组合地与纤维素生产的数量和/品质以及纤维生产有关联。所述方法包括以下步骤:

a)提供包含不同等位基因形式的编码包括SEQ ID No.5、6、7或8的氨基酸序列的蛋白质的核苷酸序列的特定植物品种或杂种繁殖植物品种的不同变种或基因型的群体。可采用本申请其他部分所述的方法来鉴别所述不同等位基因形式。优选地提供一种分异群体(segregatingpopulation),其中存在编码参与纤维素生物合成的蛋白质的基因的不同组合的等位基因变异。用于产生分异群体的方法是植物育种领域所熟知的。

b)确定所述群体中每一个个体的与纤维生产和/或纤维素生物合成有关的参数;

c)确定所述群体中每一个个体是否存在一种特定等位基因形式的编码包括SEQ ID No.5、6、7或8的氨基酸序列的蛋白质的核苷酸序列;以及

d)将出现特定的纤维或纤维素参数与是否存在一种特定等位基因形式的所述核苷酸序列或此类等位基因形式的一种特定组合相关联。

根据得到的信息可筛选那些对纤维素生物合成或纤维生产具有所需影响的等位基因。根据得到的信息,可通过使用常规的分子生物学技术来确定是否存在等位基因的形式,由此加快育种程序以分离或产生具有特定纤维或纤维素特征的变种或加快回交程序。本领域已知用于确定多倍体植物的等位基因形式的方法,包括例如Denaturing High-Performance Liquid Chromatography(DHPLC;Underhill等,1997Genome Research 7:996-1005)。显然,在育种或回交程序中,不仅等位基因本身的序列可用于确定其存在与否,也可使用那些与所需等位基因邻近的核苷酸序列,优选地与其直接邻近的并且是连续的核苷酸序列,这些序列只能在有丝分裂过程中通过重组在有丝分裂过程中以低频率自所述等位基因中分离。

在此,“杂种繁殖植物品种”是一种品种,其能够与产纤维植物例如棉属植物杂交(包括使用杂交等技术)并能够产生子代植物。杂种繁殖植物品种可包括所述产纤维植物的野生亲缘植物。通常,对于棉属植物,指的是在海岛棉与陆地棉(G.hirsitum)之间进行杂交的杂种繁殖和在两株海岛棉或两株陆地棉(G.hirsitum)亲代之间进行杂交的种内杂交。

以下非限制性实例描述了用于在产纤维植物中调节纤维素生物合成的方法和手段。除非在实施例中另有说明,所有重组DNA技术均按照以下出版物所述的标准技术进行:Sambrook等,(1989)MolecularCloning:A Laboratory Manual,Second Edition,Cold Spring HarborLaboratory Press,NY和Ausubel等,(1994)Current Protocols in MolecularBiology,Current Protocols,USA(Volumes 1和2)。用于植物分子研究的标准材料和方法见R.D.D.Croy的Plant Molecular Biology Labfax(1993),由BIOS Scientific Publications Ltd(UK)和Blackwell ScientificPublications,UK联合出版。其他标准分子生物学技术的参考书包括Sambrook和Russell(2001)Molecular Cloning:A Laboratory Manual,ThirdEdition,Cold Spring Harbor Laboratory Press,NY,Volumes I and II ofBrown(1998)Molecular Biology LabFax,Second Edition,Academic Press(UK)。用于聚合酶链反应的标准材料和方法可参见:Dieffenbach和Dveksler(1995)PCR Primer:A Laboratory Manual,Cold Spring HarborLaboratory Press,以及McPherson等,(2000)PCR-Basics:FromBackground to Bench,First Edition,Springer Verlag,Germany。

在整个说明书和实施例中,引用了以下序列:

SEQ ID No.1:鼠耳芥属核苷酸序列rsw2(基因组;保藏号At5g4970)

SEQ ID No.2:棉属植物核苷酸序列rsw2(cDNA)

SEQ ID No.3:鼠耳芥属核苷酸序列rsw3(基因组)

SEQ ID No.4:棉属植物核苷酸序列rsw3(相应于3′端;cDNA)

SEQ ID No.5:鼠耳芥属氨基酸序列rsw2

SEQ ID No.6:棉属植物氨基酸序列rsw2

SEQ ID No.7:鼠耳芥属氨基酸序列rsw3

SEQ ID No.8:棉属植物氨基酸序列rsw3(部分)

SEQ ID No.9:鼠耳芥属核苷酸序列rsw2(cDNA)

SEQ ID No.10:寡核苷酸PCR引物(正向rsw2棉属植物)

SEQ ID No.11:寡核苷酸PCR引物(反向rsw2棉属植物)

SEQ ID No.12:寡核苷酸PCR引物(正向LFY3)

SEQ ID No.13:寡核苷酸PCR引物(反向LFY3)

SEQ ID No.14:寡核苷酸PCR引物(正向MBK5/α)

SEQ ID No.15:寡核苷酸PCR引物(反向MBK5/α)

SEQ ID No.16:寡核苷酸PCR引物(在葡糖苷酶IIα正向)

SEQ ID No.17:寡核苷酸PCR引物(在葡糖苷酶IIα反向)10

SEQ ID No.18:寡核苷酸PCR引物(在葡糖苷酶IIβ正向)

SEQ ID No.19:寡核苷酸PCR引物(在葡糖苷酶IIβ反向)

SEQ ID No.20:寡核苷酸PCR引物(分离的基因组拷贝RSW3的正向引物)

SEQ ID No.21:寡核苷酸PCR引物(分离的基因组拷贝RSW3的反向引物)

SEQ ID No.22:寡核苷酸PCR引物(正向RWS3同源物棉属植物)

SEQ ID No.23:寡核苷酸PCR引物(反向RSW3同源物棉属植物)。

实施例

实施例1.分离GhKOR基因(与鼠耳芥属的rsw2突变相应的棉属植物基因)的全长cDNA

NCBI EST数据库中有7个来自Gossypium arboreum 7-10dpa(花期后天数(days post anthesis))纤维文库的EST,其均与AtKOR1的序列具有相似性。上述7个EST中的5个序列是相同的。将三种不同的棉属植物EST与AtKOR1 cDNA进行比对发现,棉属植物克隆AW726657含有ATG起始密码子和47bp的5’非翻译区。克隆BE052640跨越了KOR基因的中部区域并与克隆AW668085重叠,AW668085在与AtKOR1相同的位置上含有TGA终止密码子并含有126bp的3’非翻译序列。ORF的翻译显示出与AtKOR1蛋白的区域具有>80%的氨基酸序列相同性。使用了针对G.arboreum EST的5’和3’非翻译区而设计的引物,自来自陆地棉栽培品种Siokra 1-4的18dpa纤维cDNA文库,扩增一1.9kb PCR产物。正向引物是5’-CCGCTCGAGCGGGCATTTTCCGCCCACTA-3’(SEQ ID No.10),且反向引物是5’-CGGGATCCCGTCACACATGGACAGAAGAA-3’(SEQ ID No.11)。通过对来自陆地棉的18dpa纤维的棉属植物cDNA文库进行PCR而产生棉属植物KOR基因的全长cDNA,并对若干个扩增的产物进行测序(SEQ ID No.2)。encoded a protein该cDNA编码一种具有619个氨基酸(SEQ ID No.6)的蛋白质(GhKOR),其与LeCel3(86%氨基酸相同性)、AtKOR1(82%氨基酸相同性)和BnCel16(82%相同性)高度相似(图1)。所有蛋白质共同具有:参与将AtKOR1导向细胞板的极化导向基序(Zuo等,2000);靠近N端的推定的跨膜区域;作为与糖苷水解酶家族9具有强相似性部分的4个可能参与催化作用的保守残基(Asp-198、Asp-201、His-516和E-555;Nicol等,1998);富Pro的且具有内-1,4-β-D-葡聚糖酶家族的膜结合成员的特征的C端区域;位于N端结构域的8个推定的N-糖基化位点(Asn-X-Ser/Thr),推测其在糖基化过程中位于ER内腔(仅存在于GhKOR的一个额外的位点(14-16位残基)可能朝向细胞浆)。

实施例2.以GhKOR互补鼠耳芥属rsw2-1变体

按照以下方式将编码GhKOR的棉属植物PCR产物克隆到CaMV35S启动子之后:正向引物插入XhoI位点(下划线标出),反向引物插入BamHI位点(下划线标出),使得扩增的1.9kb片段连接于载体pART7的合适位点(Gleave,1992)。这将cDNA以有义方向置于花椰菜花叶病毒(cauliflower mosaic virus)35S启动子之后。通过以NotI消化将完整的表达盒分离并克隆入双载体pART27的相应位点。对扩增产物进行测序以确认其相同性。将这一构建体导入根癌突然杆菌(Agrobacteriumtumefaciens)菌株AGL1并用于通过植物浸渍法(floral dipping)转化rsw2-1突变体和野生型Columbia(Clough和Bent,1998)。

在含有卡那霉素(50μg ml-1)和替卡西林钠/克拉维酸钾(100μg ml-1)的Hoagland培养皿上选择卡那霉素抗性转化体,转移至不含选择物的垂直Hoagland培养皿,在29℃放置2天后筛选根膨胀的转化体。自10株显示野生型表型的单独的T1植株收集T2种子并在T2代检验互补表型的遗传性。对在29℃暴露2天的卡那霉素抗性纯合子T3幼苗的根进行拍照。其他植物在21℃生长于罐中直至开始抽苔,切下抽苔,然后转移至29℃并再生次生抽苔,成熟后拍照。rsw2-1与Columbia在At5g49720具有一个单一核苷酸的改变,其在AtKOR1中将Gly-429取代为Arg,并产生了一种易受温度影响的表型(Baskin等,1992;Lane等,2001)。植物或生长于罐中(泥炭∶堆肥∶沙子的1∶1∶1混合)或无菌生长于培养皿中(MS或Hoagland的培养基加上琼脂)(Bum等,2002a)。除非特别说明,否则生长箱提供100μmol m-2s-1的连续光照,21℃。rsw2突变体的根显示出易受温度影响的径向膨胀(Baskin等,1992),而茎显示出对延长所产生的易受温度影响的抑制(Lane等,2001)。

75株卡那霉素抗性T1幼苗中的63株的根在29℃两天后没有出现膨胀。野生型表型稳定地异常给T3代,并且根(图2A)和茎(图2B)在限制性温度条件下正常延长。卡那霉素抗性纯合子T3植株的茎生长在数量上与野生型没有区别。因此鉴别了一种编码AtKOR1的棉属植物同源物的基因,且发现其能够在rsw2-1纤维素合成突变体中在功能上替代鼠耳芥属基因。

这将涉及在鼠耳芥属中纠正减数分裂和细胞延伸的缺陷的GhKOR(Nicol等,1998;Zuo等,2000;Lane等,2001;Sato等,2001)以及与纤维素合成机制的其他元件和/或产物的适当相互作用。以前的研究鉴别了一种棉纤维蛋白质,其在免疫学上与LeCel3相关(Peng等,2001),而间接证据提示其参与棉属植物纤维膜在体外合成纤维素(Peng等,2002)。与LeCel3、BnCel16和AtKOR1的相似性包括所有已知的具有重要功能的主要特征以及那些目前尚不清楚其功能的特征,例如富Pro C端。内-1,4-β-D-葡聚糖酶在纤维素合成中的作用尚不清楚,不过可能涉及自脂质结合的引物或供体切断尚未结晶的葡聚糖(Williamson等,2001;Peng等,2002)。

实施例3:鉴定并分离鼠耳芥的rsw3突变体中发生突变的基因

rsw3等位基因是一种基于图谱策略而鉴定的单一孟德尔隐性基因座(Baskin等,1992)。rsw3与可见标记物品系W9杂交产生的F2子代将RSW3与第5号染色体短臂上的yi相连锁。对rsw3(Columbia背景)与Landsberg erecta ecotype杂交产生的F2群体进行筛选以产生具有根膨胀表型的植物。使用FastDNA试剂盒(BIO 101,Carlsbad,CA)自每株植物的2-3个莲座叶制备DNA,并使用LFY3(正向引物5’-GACGGCGTCTAGAAGATTC-3’(SEQ  ID  No.12),反向5’-TAACTTATCGGGCTTCTGC-3’;SEQ ID No.13;以RsaI裂解)和MBK5/α(正向5‘-CCCTCGCTTGGTACAAGGTAT-3’(SEQ ID No.14)和反向5’-TCCTGATCCTCTCACCACGTA-3’(SEQ ID No.15)绘制图谱。使用来自Landsberg erecta ecotype的杂交种的F2,将RSW3绘制于距离LFY3基因座的6cM处(4out of 70条染色体中有4条显示出杂交事件),因此将RSW3定位于yi和LFY3之间。对另外372条染色体的分析鉴定了MBK5/α和rsw3之间的一个重组事件,概念性图谱距离为0.27cM。在rsw3中对该区域中的若干该候选基因进行测序。P1克隆mgi19(AB007646)上的一个基因(At5g63840),编码一种葡糖苷酶II的推定的催化亚基,而rsw3等位基因显示具有一个T到C的取代,根据推定,其造成蛋白质中的Ser599被取代为Phe(野生型RSW3基因的核苷酸序列如SEQ ID No.3所示,所编码的蛋白质的氨基酸序列如SEQ ID No.7所示)。

RSW3序列与糖苷水解酶家族31(Henrissat,1991;Henrissat andBairoch,1993)的序列从大约150位残基起具有很高的相似性。Monroe等通过针对与α-葡糖苷酶的相似性对鼠耳芥属EST进行搜索鉴定了RSW3葡糖苷酶II基因,并将其命名为Aglu-3(Monroe等,1999)。其蛋白产物形成若干葡糖苷酶II的进化枝,这些葡糖苷酶II的催化活性均分别是已知的。它们均与鼠耳芥属的质外体α-糖苷酶分开,而Aglu-3/RSW3与之仅具有8%的序列相同性。图4显示了含有Aglu3/RSW3的进化枝的两种特征基序,其被认为包括催化残基和底物结合残基。Aglu3/RSW3含有这些基序中的所有保守残基,以及被认为是催化残基的Asp512和Asp617(Frandsen和Svensson,1998)。Ser599在rsw3中是突变的,其可能在功能上是重要的,因为其在来自小鼠(NP 032086)、人类(NP 055425)、猪(AAB49757)、粘液菌(AAB18921)、马铃薯(P07391)和棉属植物(见下)的同源基因产物中均是保守的,而且在相关性更加遥远的由鼠耳芥属基因Aglu-1和Aglu-2(Monroe等,1999)编码的质外体α-葡糖苷酶中也是保守的。鼠耳芥属Aglu-3/RSW3基因似乎是单拷贝的,其跨越3.84kb,具有5个内含子,并编码一种推定的2766bp转录产物,推定的翻译产物为104kDa。

最近的生物化学(Trombetta等,1996)和遗传学研究(D’Alessio等,1999;Pelletier等,2000)提示,天然的哺乳动物和酵母的葡糖苷酶II由一种催化性α-链(Aglu-3/RSW3与之同源)和一种较小的非催化性β-链组成,其在ER中保持异二聚体形式。为了确定鼠耳芥属是否含有β-亚基的直向同源物,以小鼠β-亚基进行对NCBI数据库进行BLAST搜索。未知蛋白At5g56360(来自染色体5的P1克隆MCD7(AB009049)上的蛋白质MCD7.9)与小鼠β-亚基具有27%的氨基酸相同性和42%的相似性。水稻染色体1存在一种密切相关的序列(Genbank BAA88186),但其中的终止密码子使其在496位残基后截断。理论上对PAC克隆P0038F12(AP000836)的邻近3’序列进行翻译并考虑到推测的剪切位点,提示其可能编码一种全长的β-亚基,后者与鼠耳芥属基因产物非常相似。该基因产物的推测的序列可得到与推测的外显子相匹配的一种EST(AU030896)的支持。因此图5包括我们对该全长水稻蛋白质的建议。鼠耳芥属、水稻、小鼠和Schizosaccharomyces pombe序列共同具有:C端的HDEL ER-保留信号;其N端的推定的前导序列;富半胱氨酸的N端区域;C端位于HDEL序列前方的MHR(甘露糖受体同源区域)(Munro,2001);预期可能形成螺旋卷曲的序列富含酸性残基且两侧具有在程序(“螺旋”和“Paircoil”)中得到高分的区域的中心区域(Berger等,1995;Lupas等,1991)。

Munro(2001)将MRH结构域与碳水化合物识别联系起来。其包含一种与阳离子依赖性甘露糖-6-磷酸受体具有相似性的区域,所述受体的结晶结构是已知的。至关重要的保守部分(图5)包括形成3个二硫键(不过S.pombe蛋白质缺乏半胱氨酸1和2)的6个Cys残基、半胱氨酸5和6之间的底物识别环以及参与配体结合的Y和R残基(Roberts等,1998)。小鼠α和β亚基之间的相互作用被绘制于β-亚基N端第118位残基(其在所有序列中均相当保守)至273-400位残基(其不具有保守性)(Arendt和Ostergaard,2000)。不过,图5显示所有序列均具有高百分比的酸性氨基酸。

如下所述采用RT-PCR分析编码α-和β-亚基的基因的表达。按照生产商的说明,以RQ1无Rnase的Dnase(Promega,Madison,WI)处理RNA(Parcy等,1994)。针对鼠耳芥属葡糖苷酶II的α-和β-亚基编码区域的3’末端设计PCR引物:

α-正向5’-CGTAGTGGTCTACTGGTTCAA-3’(SEQ ID No.16),

α-反向5’-TGAGCTGTGTCCCAAGAGGAT-3’(SEQ ID No.17),

β-正向5’-GGTGATGAGGATACCAGCGAT-3’(SEQ ID No.18),

β-反向5’-CCCACTCCCTAACCGGAGTTT-3’(SEQ ID No.19)。

每一种引物跨越一个内含子,如此可将RT-PCR产物与基因组DNA和mRNA区别开(对于α-亚基为724bp对452bp,对于β-亚基为996对474)。按照生产商的说明,使用Gibco BRL Superscript一步法RT-PCR试剂盒进行RT-PCR,RT-PCR循环为48℃-45分钟,94℃ 2分钟,(94℃/30秒,54℃/1分钟,68℃/2分钟)×45次,72℃/7分钟。

RT-PCR在所有测试的鼠耳芥属组织中检测到编码α-和β-亚基的基因的表达(图6),但是,在所采用的条件下,无法明确说明相对表达水平。鼠耳芥属的低数目的EST(α-亚基13个,β-亚基4个)说明两种均非高表达(作为对照,在相似的搜索中,一种参与纤维素合成的糖基转移酶AtCesA1/RSW1检测到40个EST)。

实施例4:通过鼠耳芥属基因的基因组拷贝互补rsw3突变

通过PCR扩增BAC F20A11产生了包括830bp的启动子区域的基因组拷贝的葡糖苷酶II的α-亚基,使用了正向引物:5’-CCGCTCGAGCGGTTTCACTCACAACTGTGGTCTCT-3’(SEQ ID No.20)和反向引物:5’-CCGCTCGAGCGGTCTCCTAAGTCCTAACCCCATA-3’(SEQ ID No.21)。两种引物均包括XhoI位点(下划线标出),其能够使得扩增的5.8kb片段连接至双载体pBin19中的SalI位点。扩增产物具有不同于基因组序列的单碱基对改变(C至T)。这造成以Leu替代Ser 142(该残基在马铃薯中是保守的,但在其他物种则不是)(图4),但并不削弱该片段互补rsw3的能力。将该构建体导入根癌土壤杆菌菌株AGL1并用于通过植物浸渍法转化rsw3突变体(Clough和Bent,1998)。在21℃在含有卡那霉素(50μg ml-1)和替卡西林钠/克拉维酸钾(100μg ml-1)的Hoaglands培养皿中选择卡那霉素抗性转化体。将幼苗转移至垂直Hoagland培养皿并在30℃放置2天以筛选根部膨胀。当在21℃生长5天且随后在30℃生长2天后,卡那霉素抗性T1子代显示出野生型的根(图3a)。花序表型(见后)也被互补。

rsw3与标记的突变体SGT5691(Parinov等,1999)之间的杂交种提供了另一个证据,突变体SGT5691在编码推定的糖苷酶II的基因的第一个启动子中含有Ds元件。其大概代表一种无效等位基因,且该突变具有纯合子致死性,因此采用看起来为野生型的半合子植物进行杂交。Ds元件中的NPTII基因将卡那霉素抗性赋予接受来自SGT5691的标记等位基因的F1植物。所有卡那霉素抗性F1幼苗(含有无效等位基因和对温度敏感的等位基因)的根在21℃看起来为野生型,但在30℃发生膨胀(图3b)。这证实Ds插入突变体与EMS产生的突变体rsw3是等位基因,且葡糖苷酶II缺陷引起径向膨胀。

实施例5:对鼠耳芥属中与rsw3突变相关的其他表型的研究

rsw3在容许温度21℃象野生型一样生长,当转移至30℃时幼苗根部膨胀。根部膨出的细胞(Baskin等,1992)通常位于根须的基部,提示RSW3在根须发育的早期阶段具有作用。仅当在48小时之内将膨胀的初生根放回容许温度时其才能重新开始延长,但根可继续产生侧根(图7a)。这些侧根的原基在转移至31℃时是不可见的,侧根先延长数毫米,随之膨胀并停止生长。因此,成熟的生长性植株的根系短小而呈高度分支状(图7b)。双重纤维素缺陷突变体rsw1-rsw3处于限制性温度24小时仅出现根尖膨胀,但由于处于这种高温条件下任何更长的时间均导致死亡,因此在限制性温度条件下24小时后膨胀过程可能已经减弱。

对于在黑暗中生长的胚轴的表型,rsw3的表型明显若于rsw1-1和rsw2-1,而rsw1-1rsw3的表型若于rsw1-1rsw2-1(图7c)。rsw3在光亮处的花结生长被强烈抑制,且许多细小的叶片堆积成密集的垫状,其中无法识别规则的叶序(图7d-f)。野生型叶片的复杂铺路石细胞形状(图7g)在rsw3中变得简单,气孔自叶片表面突出,且一些毛状体似乎要破裂(图5h)。一些拥挤的花结开始出现细小的花序(图7d),不过它们出现得明显迟于野生型花序(对于生长于琼脂中的植物来说为28.6士0.5天对15.5+0.17天;平均值+SE,n=98(rsw3),n=45(野生型))。细小的rsw3花序上的少数花朵是基本上完全长大的,不过花药丝、雌蕊和萼片轻度缩短,而芽在柱头受精之前提早开放(与下文中讨论的图8e、f所示的来自土壤中生长的rsw3植株的芽相似)。

为了研究突变对茎生长的直接作用,将野生型和rsw3在21℃生长于土壤中,这样随后花序的发育将不会受限于仅提供很少光合作用产物的小花结。在这样的条件下,rsw3的花结与野生型十分相似,而再生性生长按照正常时间开始。

切下初生抽苔并在21℃或30℃再生次生抽苔(图6a,b)。rsw3和rsw1-1在21℃的再生遵循略微呈S形的曲线,相对于野生型来说在生长速度和最终高度上没有统计学显著意义的降低。Rsw1-1rsw3的速度和最终高度显示出明显的下降。不过,在30℃,rsw3在少数几天中的生长速度与野生型相似,但其在大约第5天停止延长,而野生型则继续延长到第16天,rsw1-1甚至更长(图8b)。rsw1-1rsw2(Lane等,2001)在30℃没有再生出次生抽苔,而rsw1-1rsw3仅生长大约35mm(图8b),产生极少的花且没有产生种子。

我们每天测量了茎生长的增量以及外层细胞的长度,外层细胞在抽苔生长至大约一半时已经离开延长区(表1)。这样可以估计那时的细胞流(cell flux)(每天离开延长区的细胞数),因为每天的生长增量=细胞长度x细胞流。生长于21℃的rsw3的细胞流或细胞长度没有明显降低。rsw1-1rsw3在21℃的组成型表型完全归因于细胞长度的降低。在30℃,相对于野生型来说,rsw1-1的细胞长度降低57%,而细胞流降低35%。

此类分析要求植物的生长速度、延长区的长度等等均处于近乎稳定的状态。不过,当rsw3和rsw1-1rsw3的延长迅速减慢的时候条件远远达不到稳定状态,因此无法准确推算出这些表型的细胞流。为了至少对在生长减慢的情况下细胞长度是如何改变有一些了解,我们在rsw3茎的大约80mm高度处测量了细胞长度(图8b显示,当这些细胞离开延长区时,茎应该是接近其生长期的终点,这是因为根据那时生长区的长度,那时总的植物高度应该已经超过80mm;野生型为40mm,根据Fukaki等,1996)。即便如此,rsw3的细胞也仅仅略微短于野生型(表1),提示对于茎延长减慢来说,细胞产生速度的下降可能比细胞体积增加的降低更加重要。相反,当茎的延长正在减慢时,我们对30mm的rsw1-1rsw3茎进行取样用于细胞成熟(图8b),细胞的长度降低了57%(表1)。这与双突变体中存在rsw1-1使得平衡明显向细胞长度降低倾斜是一致的。

在一个更加简单的系统中验证了有关细胞分裂和细胞体积增加的结论,该系统使用冷扫描电子显微镜来检测受精的柱头的花中的雄蕊花丝(表2)。结果是相似的:rsw3植物同样显示出细胞数量减少较细胞长度降低的比例更高,并且双突变体rsw1-1rsw3显示出细胞长度进一步下降但细胞数量没有额外降低。Rsw1-1显示出细胞长度较细胞数量降低更明显(表2)。在30℃进行再生的野生型和rsw3的茎在第一朵花开花前均达到大约相同的高度,即使它们的最终高度可能差别很大(图8b)。野生型茎在延长停止前产生大约27朵具有良好间隔的花,但rsw3在延长停止前仅产生大约6朵间隔紧密的花,留下一个花簇(图8c,d)。rsw3花芽在柱头受精之前即提早开花(图8e,f)。

在持续生长于其限制性温度的rsw3植物的细小的抽苔形成很少的花且没有形成种子(图7d)。对于那些在21℃具有完全生长力的植物,既便是在31℃形成的大得多的抽苔上的花(图8d,f)也仅仅拮出极少的种子。这种种子(图8g,h)是皱缩的(可能是由于种子贮存蛋白质积聚量降低所致;Boisson等,2001),其表面缺乏生长于30℃的野生型或生长于21℃的rsw3所具有的规则的细胞结构,并且其在吸涨后仅有极少的分泌黏液(图8i-n)。黏液分泌减少在纤维素缺陷体突变体是不常见的:rsw1-1(CesA1糖基转移酶缺陷;图8k,l)和rsw2-1(KOR内-1,4β-葡聚糖酶缺陷)具有正常的黏液层。

为了将在单倍体阶段对花粉和胚珠发育的影响与在二倍体阶段的影响分开,我们检测了半合子Ds突变体SGT5691(一种推定的葡糖苷酶II催化亚基的无效等位基因)中的结籽(seed set)。通过自身传粉,结籽分异为147个卡那霉素抗性个体和153个敏感个体。显性纯合子致死性等位基因的比例低于预期的2∶1,说明无效等位基因影响的是花粉和/或胚珠的有丝分裂后发育。通过在半合子标记突变体与Landsberg erecta(该突变体的适当的野生型)之间进行交互杂交,我们区分了对雄性和雌性途径的影响。如果花粉或胚珠的发育不受影响,则卡那霉素抗性和敏感性植株将按照1∶1分异,如果无效等位基因降低花粉或胚珠的繁殖力,则比例会降低。来自Ds标记突变体的花粉产生的分异比例为1∶16(6个抗性个体,94个敏感性个体),提示Ds标记花粉产生有活力的种子的能力下降了94%(相对于野生型)。这与当Ds标记胚珠与野生型花粉杂交时的41%的降低程度(比例为1∶1.7,37∶63个体)相当。因此,葡糖苷酶II的无效等位基因对花粉发育单倍体阶段的影响比其对有丝分裂后胚珠的影响要严重得多。

生长于31℃的rsw3的7天幼苗的根仅含有野生型纤维素的51%(表示为每毫克组织干重),该数字与CesA1糖基转移酶(rsw1-1)和KOR内-1,4-β-葡聚糖酶(rsw2-1)中的单个氨基酸取代(Peng等,2000)产生的结果相当。形态学改变提示所有三种基因对于在初生细胞壁中产生纤维素均是必需的。

rsw3幼苗中来源于高尔基体的非纤维素多糖的产生基本没有改变(Peng等,2000)。对纤维素产生的选择性与在葡糖苷酶I缺陷(Gillmor等,2002)中所见的情况相当,葡糖苷酶I产生用于葡糖苷酶II加工的最初底物。其超出了在鼠耳芥属的胚芽致死性cyt1突变体(甘露糖-1-磷酸guanylyltransferase缺陷)(Lukowitz等,2001)和通过反义下调MALl(编码葡糖苷酶IIα-亚基)的马铃薯(Taylor等,2000a)中所见的选择性,其中非纤维素多糖和木质素出现复杂的改变。因此,我们认为,与高尔基体中的非纤维素多糖的合成相比,纤维素合成对N-聚糖加工缺陷的敏感性要高得多。

rsw3中的来源于高尔基体的种子黏液的分泌明显减少,但rsw1-1或rsw2-1则没有明显减少。黏液能够产生,但保留在细胞内(可能是因为纤维素缺陷引起的结构改变),或者黏液产生本身可能是减少的。许多发育阻滞减少黏液的产生(Western等,2001;Western等,2000),不过我们还不能排除这样一种可能性,即rsw3具有产生组成黏液的特定非纤维素多糖所需的高尔基体酶的缺陷型加工。

雄蕊花丝中的细胞数量和体积提示,rsw3对细胞分离的影响强于对细胞体积增加的影响。茎的细胞长度数据与这一发现相符和。rsw3对细胞分裂的显著影响可以解释为何其表型在黑暗中生长的缺少细胞分裂的胚轴中相当弱(Gendreau等,1997)。由于对细胞分裂的影响明显强于对细胞体积增加的影响,rsw3更加类似于rsw2-1(Bum等,2002)而不是rsw1-1(Burn等,2002)或携带针对RSW1/CesA1或CesA3的反义构建体的植物(Bum等,2002),后者对细胞长度的影响更加严重(尽管CesA1的改变对分裂速度没有什么影响,但CesA1可能在分裂的根细胞中表达,因为当rsw1-1处于其限制性温度时,细胞的细胞壁超微结构有改变(Sugimoto等,2001)并膨胀(Baskin等,1992;Beemster和Baskin,1998))。

尽管rsw3中的纤维素生物合成被削弱,但rsw3影响纤维素合成的机制还不清楚。正如在葡糖苷酶I突变(Boisson等,2001)中所注意到的,无法在高尔基体中组装成熟N-联聚糖的突变体显示出最低程度的表型(von Schaewen等,1993),这说明关键蛋白质缺少成熟N-联聚糖并不会引起明显的糖苷酶II缺陷时所见的表型。Glc1Man9GlcNAc2和Man9GlcNAc2产生速度的降低可能会同时减慢糖蛋白/分子伴侣复合体的形成和解离,于是产生一个瓶颈,可降低分泌途径上其他位点的糖蛋白的稳态水平。由于糖蛋白参与多种植物过程,因此还不清楚为何与例如非纤维素多糖合成相比,纤维素合成对ER中的加工缺陷要敏感得多。

当Gillmor等(2002)没有检测到knopf(葡糖苷酶I缺陷)发生SDS-PAGE迁移改变或改变N-糖苷酶F处理时,且当他们没有在knopf中观察到采用非定量免疫染色可观察到的CesA丰度的改变时,他们认为CesA蛋白不发生糖基化。KOR内-1,4-β-葡聚糖酶是一种更好的候选物。当在巴斯德毕赤氏酵母(pichia pastoris)中异源性表达时,KOR的欧洲油菜直向同源物的一种可溶性片段发生大量N-糖基化,且这种N-聚糖对于其体外活性是必需的(Molhoi等,2001)。rsw3和rsw2-1表型对细胞分裂的影响比对细胞体积增加的影响更大,而rsw1-1表型正好与此相反,这进一步提供了证据,支持KOR是一种靶向。

rsw1-1和rsw2-1突变影响了编码那些可能直接参与纤维素合成的质膜酶的基因,而在限制性温度条件下酶性能的改变将迅速影响纤维素合成。相反,rsw3编码一种ER内的加工酶,仅当其限制了对纤维素合成的位点的正确折叠的糖蛋白的供应时,其性能的改变才会降低纤维素合成。当将这三种突变体转移至较高温度时,会在不同的时间出现可见的表型,这似乎反映了它们不同的作用模式。径向膨胀在rsw3出现较晚(潜伏期>24h,而rsw1-1和rsw2-1<12h),而在最初的12小时内高温实际上加速了根的延长,尽管不及野生型(Baskin等,1992)。与此不同,rsw1-1或rsw2-1在最初12小时即减慢,根部明显膨胀,且rsw1-1在4小时内即出现细胞壁超微结构的改变(Sugimoto等,2001)。

已经发现,rsw3的编码推定的糖苷酶IIα-亚基的基因是突变的,已经鉴定了由两种植物基因组编码的推定的β-亚基,并发现rsw3表型的许多方面是初生细胞壁中纤维素合成降低的结果。对细胞分裂的影响似乎比对细胞体积增加的影响更大,这说明KOR内-1,4-β-葡聚糖酶(其突变同样明显影响细胞分裂)可能是受到加工缺陷影响的糖蛋白。除了在纤维素合成中的作用,葡糖苷酶II的温度敏感型等位基因也有助于对ER中的N-糖基化和质量控制的研究,并有助于确立其与其他发育和生理学过程之间的联系。

实施例6:自棉属植物中分离相应于RSW3的(部分)cDNA

使用序列RSW3搜索dbEST鉴定到一种Gossypium aboreumcDNA,具有833bp的高质量序列。使用自EST设计的引物自陆地棉cDNA的18dpa纤维文库来扩增一种700bp产物,使用了如下引物:

Cot-rsw3f 5′-CGGGATGAAGAGGATGTAGAG 3′(SEQ ID No.22)

Cot-rsq3r 5′-GAACCCCTGAGATGATCCCAA 3′(SEQ ID No.23)

将PCR产物用作探针以鉴定更长的cDNA。鉴定到5种推定的克隆并对2种进行了测序。三种克隆有部分重叠,并组装了棉属植物RSW3同源物的cDNA序列(SEQ ID No.4)。编码N端的区域是缺失的。

实施例7:在棉属植物中表达RSW2/RSW3嵌合基因

将分离自鼠耳芥属或棉属植物的相应于RSW2或RSW3的cDNA可操纵地连接于启动子如苹果青霉素启动子和参与转录终止和聚腺苷酸化的3’-端区域。

其次,将选自分离自鼠耳芥属或棉属植物的RSW2或RSW3基因的大约100bp长的片段克隆入置于启动子例如CaMV 35S启动子控制下的反向重复序列。

将嵌合基因导入进一步含有选择标记基因的T-DNA载体,并将得到的T-DNA载体导入含有辅助Ti质粒的根癌土壤杆菌菌株。使用这些土壤杆菌菌株获得转基因棉属植物。

如WO 98/00549所述进一步分析表达不同转基因拷贝的植物的细胞壁成分,例如纤维素、非晶体β-1,4葡聚糖聚合体、淀粉和碳水化合物含量。

表1.根据细胞长度以及,如果出现接近稳定的生长速度时,根据细胞流(每天离开延长区的细胞数),来分析茎延长的速度。结果表示为平均值±SE,n=5。使用T-检验分析其与野生型之间差异的统计学显著性(*=p<0.05;**=p<0.01;***=5p<0.001)。

  生长速度(mm/天)  细胞流(天-1)  细胞长度(μm)  21℃  Columbia  38.7±1.0  101±3.5  384±4.0  rsw3  38.4±1.4  95.9±4.6  402±7.0  rsw1  38.9±1.6  102±6.9  382±9.8  rsw1rsw3  30.2±1.9**  100±7.6  299±8.4**  30℃  Columbia  53.8±1.2  133±2.7  404±3.2  rsw3  41.8±3.1**  378±22  rsw1  15.2±1.4***  87.2±7.0**  174±5.8***  rswlrsw3  13.6±1.8***  173±15***

表2.生长于30℃的成熟雄蕊花丝中的细胞长度和数量。结果表示为平均值±SE,n>7。使用T-检验分析其与野生型之间差异的统计学显著性(*=p<0.05;**=p<0.01;***p=<0.001)。

  总长度(μm)  细胞数  细胞长度(μm)  Columbia  2407_38  17.0_1.0  152.7_6.2  rsw3  1458_52***  11.4_0.3***  127.0_0.1**  rsw1-1  1050_57***  15.0_0.4  72.7_9.8***  rsw1-1rsw3  415_41***  12.4_0.5***  29.4_2.1***

参考文献:

Arioli et al..(1998)Science 279:717-720.

Arendt et al.(2000)Glycobiology 10:487-492.

Baskin et al..Aust.J.Plant Phys.19:427-437.

Beemster et al.(1998)Plant Physiol,116:1515-1526.

Berger et al.(1995)Proc.Nat Acad.Sci.USA 92:8259-8263.

Boisson et al.(2001)EMBO J.,20:1010-1019.

Brada et al.(1984)Eur.J.Biochem.,141:149-156.

Brummell et al.Proc.Nat.Acad.Sci.USA 94:4794-4799.

Burn et al (2002a)Plant Physiol.129:797-807.

Clough et al.(1998)Plant J.16:735-743.

D’Alessio et al.(1999)J.Biol.Chem.,274:25899-25905.

Desprez,et al.(2002)Plant Physiol.128:482-490.

Fagard et al.(2000)Plant Cell 12:2409-2424.

Frandsen et al.(1998)Plant Mol.Biol.37:1-13

Fukaki et al.(1996)Plant Physiol.110,933-943.

Gendreau et al.(1997)Plant Physiol.,114:295-305.

Gillmor et al.(2002)J.Cell Biol.156:1003-1013.

Gleave,A.P.(1992)Plant Mol.Biol.20:1203-1207.

Helenius et al.(2001)Science 291:2364-2369.

Henrissat (1991)Biochem.J.280:309-316

Henrissat and Bairoch (1993)Biochem.J.293:781-788.

Hino and Rothman (1985)Biochemistry 24:800-805.

Kimura et a1.(1999)Plant Cell 11:2075-2085.

Lane et al.(2001)Plant Physiol.126:278-288.

Lukowitz et al.(2001)Proc.Nat.Acad.Sci.USA 98:2262-2267.

Lupas et al.(2001)Plant Physiol.127:674-684.

Mlhj et al.(2001)Plant Physiol.127:674-684.

Monroe et al.(1999)Plant Physiol.119:385-397.

Munro (2001)Curr.Biol.11:R499-501.

Murashige and Skoog (1962)Phys.Plant 15:473-497.

Nicol et al.(1998)EMBO J.17:5563-5576.

Pagant et al.(2002)Plant Cell 14:2001-2013.

Parcy et al.(1994)Plant Cell 6:1567-1582

Parinov et al.(1999)Plant Cell 11:2263-2270.

Pelletier et al.(2000)Glycobiology 10:815-827.

Peng et al.(2000)Planta 211:406-414.

Peng et al.(2002)Science 295:147-150.

Peng et al.(2001)PlantPhysiol.126:981-992.

Roberts et al.(1998)Cell 93:639-648.

Sato et al.(2001)Plant Cell Physiol 42:251-263.

Scheible et al.(2001)Proc.Nat.Acad.Sci.USA 98:10079-10084.

Silk et al.(1989)Plant Physiol.90:708-713.

Sugimoto et al.(2001)Protoplasma 215:172-183.

Taylor et al.(2000a)Plant J.24:305-316

Taylor et al.(2000)Plant Cell 12:2529-2539.

Taylor et al.(1999)Plant Cell 11:769-780.

Treml et al.(2000)Glycobiology 10:493-502.

Trombetta et al.(2001)Biochemistry 40:10717-10722.

Trombetta et al.(1996)J.Biol.Chem.271:27509-27516.

Vitale (2001)Plant Cell 13:1260-1262

von Schaewen et al.(1993)Plant Physiol 102:1109-1118.

Western et al.(2001)Plant Physiol 127:998-1011.

Western et al.(2000)Plant Physiol 122:345-355.

Williamson et al.(2001a)Protoplasma 215:116-127.

Williamson et al.(2001)Cell.Molec.Life Sci.58:1475-1490.

Zuo et al.(2000)Plant Cell 12:1137-1152.

                        序列表

<110>澳大利亚国立大学

<120>调节产纤维植物中纤维素生物合成的方法和手段

<130>501987/MRO

<150>US 60/432,674

<151>2002-12-12

<160>23

<170>PatentIn version 3.1

<210>1

<211>2303

<212>DNA

<213>Arabidopsis thaliana

<220>

<221>misc_feature

<222>(121)..(1986)

<223>coding RSW2

<400>1

acatttcttc acttccacac acttttactt ctttctctct tctcttctct tctccagatc      60

tgatcccaaa cctttgattc attgttgttg ttctctgctg ctttatcaga gagcatcatc     120

atgtacggaa gagatccatg gggaggtcca ttggagataa acactgcaga ttccgccacc     180

gacgatgatc gtagtcggaa tttaaacgat ttggatcgtg cggctctttc acgtccacta     240

gatgagacgc agcagagttg gttacttggt ccaacggagc agaagaagaa gaagtacgtc     300

gatctcggtt gtattatcgt tagccgcaag atcttcgtct ggactgttgg tactcttgtt     360

gccgccgcgt tactcgccgg attcattacc ttgatcgtta aaactgtgcc gcgtcatcat     420

cctaagactc cgccgccgga taattatact atagctctac acaaagctct taagttcttc     480

aatgctcaga aatctgggaa attgccaaag cataataacg tgtcatggag aggtaattct     540

gggcttcaag atgggaaagg tgaaacagga agcttctata aagatttggt gggaggttat     600

tatgatgctg gtgatgctat caagttcaat ttccccatgg cttatgctat gactatgttg     660

agctggagtg ttattgaata tagtgctaaa tacgaagctg ctggtgagct cactcatgtt     720

aaggagctta tcaaatgggg aactgattac tttctcaaga ctttcaatag tactgctgat     780

tccattgatg atcttgtgtc acaggttgga tcagggaata ctgatgatgg aaatacagat     840

cctaatgacc attactgttg gatgcgacct gaggatatgg actataaaag gcccgtgact     900

acttgtaatg gtggatgttc ggatctcgct gcagagatgg cagctgctct ggcttcagca     960

tctattgtat tcaaggataa caaggaatat tctaaaaagc ttgtccatgg tgctaaggtg    1020

gtgtatcagt ttggaaggac gaggagaggg agatatagtg caggcactgc ggaatctagc    1080

aagttctata attcaagtat gtattgggat gagttcattt ggggtggtgc ttggatgtat    1140

tatgctaccg gaaatgtaac gtatctcaat ctaatcaccc aacctactat ggccaagcat    1200

gctggtgcct tctggggtgg cccttactat ggtgtattta gctgggacaa caagcttgct    1260

ggtgctcagt tgctgttgag ccggttgagg ttgtttctga gtcctggata tccatatgaa    1320

gaaattctaa ggaccttcca caatcagacc aqcatagtca tgtgctcata cttgcctatt    1380

ttcaacaaat ttaacagaac caatggaggt ttaatagagt tgaatcatgg agctccacag    1440

ccgctgcaat attctgtaaa tgcagctttc ttagcgactc tatacagtga ttatctggat    1500

gctgctgata ctcctggatg gtactgtgga cctaatttct attcgacaag tgtgctacgt    1560

gactttgcta gatcccagat tgattatata ctgggtaaaa accctcggaa aatgagttat    1620

gtcgttggtt ttggcacaaa atacccaaga catgtgcatc acagaggagc ttcgataccc    1680

aagaacaaag tcaagtataa ctgcaaagga ggatggaaat ggagagacag caagaaacca    1740

aacccaaaca cgattgaagg agccatggtt gctggtcctg acaagcgcga cgggtaccgt    1800

gatgtccgta tgaactacaa ctacactgaa ccgactcttg caggcaatgc tggtctagtc    1860

gcagctcttq tggcattatc gggtgaagaa gaagccaccg gtaagataga caaaaacact    1920

attttctcag ctgttcctcc tttgttccct actccaccac ctccaccagc accatggaaa    1980

ccttgagaaa gctagacttg tgtgattctg tcgctgctgc caaaaaaaat gaatgaggta    2040

agaaggattt gggtgtgaga ccagaagatt agaagctaaa cacaagtcag ccataaccaa    2100

actactaagg atttcatttg gctttactag atacaaacac ggggtgggtt actttaccac    2160

aagcattgtc tttcttttct ttttttgggt tgctgttttg ttcttgtgag atatcatata    2220

tatctatgcg ttttactctg tatatgtttg ataccaaact tgtattcttt gataaacaat    2280

ttaatgaact gtattaaact ttt                                            2303

<210>2

<211>2031

<212>DNA

<213>Artificial  Sequence

<220>

<223>cDNA RSW2 homologue from cotton

<220>

<221>misc_feature

<222>(47)..(1906)

<223>coding region RSW2 homologue

<400>2

ggcacgagcc tgcattttcc gcccactact cttccaaatc ctcatcatgt acggcagaga      60

tccgtgggga ggtcccctgg agataaacgc cactgattct gccactgacg acgacaggag     120

caggaatctg caggacctgg atagggctgc actctctcgc cccttggacg agactcagca     180

aagctggctg cttggccccg gggagcaaaa gaagaagaag aagtacgttg atctcggatg     240

tatcattgtg agccgcaaga tctttgtatg gaccgtgggg accctgctag tctccgccct     300

cctggccgga ctcatcaccc tcatcgtcaa gactgtccca cgtcatcacc accgccactc     360

tccgcccgat aactacactc tggctcttca caaggcgctc atgttcttta atgctcagcg     420

ttctqgaaag ctgcccaagc ataataatgt gtcgtggaga gggaactcgg gcctccaaga     480

tggcaaatcc gatccctccg ttttgatgaa agatctggtc ggcggatatt acgatgctgg     540

agatgctatc aagtttaact ttcctgcatc tttttcaatg actatgttga gctggagtgt     600

catcgaatac agtgctaaat acgaggctgc cggcgagctc aatcatgtta aagagatcat     660

caaatggggt actgattatc ttctgaagac cttcaacaat actqctgata ccattgacag     720

gattgctgcg caggtaggga taggagatac atctggagga agttcagccc caaatgatca     780

ttattgctgg atgcgccctg aggacattga ttacccccgt cctgtatatg aatgtcatag     840

ttgctccgat cttgctgctg aaatggctgc tgctttggct tctgcttcca tcgttttcaa     900

agacaacaaa gcatactctc aaaagcttgt ccatggtgcc cgaacactct ttatgtttgc     960

tagggatcaa agaggcagat atagtgctgg tggttctgac cctgccctct tttataattc    1020

ctcaagttac tgggatgagt ttgtttgggg tggagcctgg ttatactatg ccactgggaa    1080

ttcatcctat cttcagttag ctactcatcc taaacttgcc aagcatgctg gtgctttctg    1140

gggtggccca gattatggtg ttcttagctg ggataataag cttgctggtg ctcaggtgct    1200

tctgagccga ttgagattgt ttttgagtcc tgggtatcca tatgaggaaa tattgagtac    1260

qtttcataat caaaccaqca taattatqtq ctcattcctt ccggttttca ctagctttaa    1320

tagaacaaaa ggaggtttga ttcagttaaa ccatggaagg cctcagccac tgcaatacgt    1380

agtcaatgca gccttcttag ccgccctata tagtgattat cttgatactg ctgatacacc    1440

tggatggtat tgtggtccca atttctattc aactgatgtc ctgcgtgaat ttgccaaaac    1500

ccagattgat tatatccttg gcaaaaatcc tcgaaaaatg agctatgttg tgggctttgg    1560

taaccattat ccaaagcatg ttcaccatag aggggcatct atccctaaga ataagatcaa    1620

atataactgt aaagggggat ggaaatggag ggatacgtca aaaccaaacc ccaacacact    1680

tgtgggagcc atggtagctg gacctgacaa gcatgatggg tttcgtgatg ttcgcaccaa    1740

ctacaactat acggagccaa ctctagcagg caacgcaggg ttggttgctg cactcgtggc    1800

attgtctggt gacaagqcaa ccgtgattga caagaatacc attttttctg cagttccacc    1860

aatqtttcct acaccaccac cacctccqqc accttgqaaa ccatgaaaac gttttgatct    1920

ttcttctgtc catgtgtgac ttacagtctg atgattttgg aattagtttt tggtacgtaa    1980

atgaccttgg aagtgtaagt aacgcaaaag gcaagacagg agatgagtga t             2031

<210>3

<211>4500

<212>DNA

<213>Arabidopsis thaliana

<400>3

gtgtactgcg agaactgctt attacataca tggcagataa tccgcgtaga agaagggttt      60

aacggagacg aatttgaact ctccgacgaa ataatcgtct tctccggcat catcttcaga     120

aagctattcc aaattagggt tttgactttt gattgaagaa gacaggtcta gaaacttaca     180

tacaccaatt ttaaaatcga gtttgggccg aattatggac cgtactttgg gctatgggcc     240

ttcattttaa taaacaggtc ggatatatcc accggacccg gaatgatcgt cttcctcagt     300

gttgtatttt ggctttcctc attgcttcct caatctaagg atttccatga acaaggaact     360

aaaatgagat ctcttctctt tgtactatca ctcatttgct tttgctctca aacagcactt     420

tcatggaaga aggaagagtt tcgcagctgt gaccaaactc cattttgtaa acgcgctcga     480

tctcgtactc ccggcgcgtg ttctctaatt gtcggcqatg tttccatcac tgatggagat     540

ctcgtagcga agcttctacc gaaagcgcct aatcaaggcg atggggatca gatcaagccg     600

ttgattcttt ctctctcagt ttacaaggat gggatcgtgc ggcttaaaat cgatgaggac     660

cattcgttga acccgccgaa gaagaggttc caagttcctg atgtggtagt gtctgagttt     720

gaggagaaga agatctggct gcagaaagta gcgacggaga cgatctctgg agacactagt     780

ccgtcttcag tagtttatgt atccgatggt tacgaggcgg tggtgcgaca cgatccgttt     840

gaggtgtatg tgcgtgagaa atcaggtgat cgccgtcgcg ttgtgtcatt gaattctcat     900

ggattatttg attttgagca gttggggagg aaaactgaag gagataactg ggaagagaaa     960

tttaggactc atacagattc tagaccatct ggtcctcaat ctattagttt cgatgtttcg    1020

ttttatgatt ccagtttcgt ttatggaatt cctgaacacg ccactagctt cgcgttgaag    1080

cctaccaagg gtcctggagt tgaggaatct gaaccctaca ggctttttaa tctagatgtg    1140

tttgaatacg atcatgaatc accgtttggg ctttacgggt cgattccgtt catggtttcg    1200

catgggaagt ctggtaaaac ttcaggattt ttctggttga atgctgcgga aatgcagatt    1260

gatgtgttgg ctaatggttg ggatgcagag agtggtattt ctttgccttc tagtcacagt    1320

aggatcgaca cattctggat gagcgaggca gggattgtgg atacattctt tttcgttggg    1380

cctgagccaa aggatgttgt aaagcagtat gcaagtqtga caggtacttc agccatgcct    1440

cagttgtttg ccactggtta tcatcaatgt aggtggaact acaaagatga ggaggatgtg    1500

gcacaggtgg actcgaaatt cgatgaacac gatattcctt atgatgttct ctggcttgac    1560

attgagcata cagatgggaa gagatacttt acatgggata gtgtgttgtt tcctcatcca    1620

gaggagatgc aaaagaaatt ggctgcaaag ggtaggaaga tggtgaccat tgtggatcct    1680

catatcaaga gggatgactc atacttctta cacaaagagg ctactcaqat gggatactat    1740

gttaaggatt catctggaaa agactttgat ggttggtgct ggcctggttc atcatcttac    1800

attgatatgt tgagcccaga gattagaaaa tggtggggtg ggaggttctc gtataagaac    1860

tatgttggtt caactccatc attgtacacc tggaatgaca tgaatgagcc ttctgtattc    1920

aatggtcccg aggtataact ttctgtctga atggtctttt tttcttgttc cgttattgtt    1980

tttctgtaat ctgtatagct catttctcat attcattttg ggattgcagt tgaatatagc    2040

aatccattgt ttttctattg cacaattatg gatatgtttg aactctgata gattatacat    2100

cccttatctt gcatactatg acacctttta ttaattattg cactactaaa gcaagtattt    2160

taagatccat tttatgttta tqtggtttta cattggatat ttgtttctgt gacttcttta    2220

agagtggagt gtaagctatg gttgcatatc tccacctctg atttgcttat atcgtaqaaa    2280

gtttatcata tatgtaaagg tctattactg agatgaagac tggcactttt ttctttcttt    2340

tttgttggag taggttacta tgccaagaga tgcattacat gttgggggtg ttgaacacag    2400

agaagttcat aacgcatatg gatattactt ccacatggcg acttccgatg gacttgttat    2460

gcgtgaagaa ggaaaggata ggccttttgt attgtcaaga gcaatctttc ccggcactca    2520

aagatacgga gcaatttgga ctggagataa cacagccgaa tgggaacacc ttagagtctc    2580

cattccaatg atattgacac ttggtcttac tggaattaca ttctctggta caaacaaatt    2640

tagctgttca aattctgctg gcgttttttt tttctttctc aaatttaatg gaagttttct    2700

tttcttttgc aggagctgat attggtgggt tttttggaaa tcctgaacca gaacttctag    2760

ttaggtggta ccaagtgggt gcttactatc catttttcag gggtcatgct catcacgata    2820

ccaaaagacg agagccttgg ttgtttgggt aagatgtgat ttagtactta attttttctt    2880

gtcaagaggt attattttag tatgcggtcc aggtctagtc tatggatatt tgcttgatgg    2940

atgatcaaqc agattgaaat gtagtgatac tggttattga gaaaagaata caattgcgga    3000

aactaaaacc tggtgttgca ctctagtcag ttgattgtct aaatagttag gccattagtt    3060

tcatcaagta ggcattgcaa cggttgtcca gaagtctctc tgcctttgtt ttgctggctc    3120

ataaatgttg cactttctca ttcgaatcaa atcaatgttc tcttgtttca gtgaacggaa    3180

cacagaactc atgagagatg ccatacacac tcgttacaca ctgctcccat acttctacac    3240

gttgttcaga gaagcaaacg ttacgggtgt tcctgttgta cqcccattat ggatggaatt    3300

cccgcaagat gaagctactt ttagcaacga tgaagccttc atggtcggta gtggtctact    3360

ggttcaagga gtttacacca aggtacttga gcgctaagta caacttccta cttatttata    3420

ttttggcctt tgtatctctt tacttaatca tatactccag ataaatgatc aaaccctgcc    3480

acataccctc ttctcgtctt tctgcaaaat tagggaacaa cgcaagcttc cgtgtatttg    3540

cctggcaaag aatcatggta tgacttgaga aacggtaaga cttacgttgg aggcaagact    3600

cacaagatgg atgctccaga ggagagtatt cctgcgtttc aaaaggcagg aaccatcatc    3660

ccaaggaagg accggtttag gcgaagttcc tctcaaatgg acaatgatcc ttatactttg    3720

qtacqtacaa cacttqcatc acactqtttt atcatctgct atcaqcacca tqaacaaaqt    3780

aaaaccggtt ggtaaaaaga ttatctctga aagtgaaatc ccaatgataa actatgtgat    3840

ctaacatcta aaacccttca ggtggtagct ttgaacagtt ctcaagaagc agaaggtgaa    3900

ctctacatcg atgacggcaa aagctttgaa ttcagacgag gctcttacat ccatcgtcgc    3960

ttcgtcttct caaagggtgt tcttacatca acgaacttag ctcctccaga agctcgtctc    4020

tcttcccaat gcttgatcga cagaattatc ctcttgggac acagctcagg tccaaaatct    4080

gcgttggtgg aaccgttgaa tcaaaaggca gagattgaga tgggacctct gcgaatgggt    4140

gggcttgtag cttcctcggg tacaaaggtg ttgactatcc gcaaaccggg tgttcgagtg    4200

gaccaagact ggaccgtaaa gattctgtga ttgaacggtt tgaaccagtt tcactcatgg    4260

ccgttagaqt ggccgaaatc tgcttttccg gcgacggaat atcacacttt ttaatatatg    4320

tttggagatt tagacttaaa tagttgtaag agctaacagt ttgaaagtca ctttgcattg    4380

ttgtttatct tcatataaat gagtttagat tttgataatt tcagaattcg tggaatcata    4440

attaacaatt ttgataggga aaaataattt gtttttttta gtcagagggt caaataatct    4500

<210>4

<211>1773

<212>DNA

<213>Artificial Sequence

<220>

<223>cDNA RSW3 homologue from cotton(partial 3′end)

<220>

<221>misc_feature

<222>(2)..(1576)

<223>C-terminal part of the coding region

<400>4

atatgatgtt ttgtggcttg atattgagca tactgatgga aagaggtatt tcacatggga      60

taagatgcta ttcccacatc cagaagagat qcaaaggaaa ttggctgcca aaggtaggca     120

tatggtgaca attgtggatc cgcatattaa gagggatgag tcatttcact tgcacaagga     180

tgcttcccag agggggtatt atgtaaagga tgcaactggc aaggattatg atgggtggtg     240

ctggccaggc tcctcctcct acccagatat gttaaatccc gagattaggt catggtgggc     300

tgagaagttc tcctatgata attatgtcgg ttcaactcct tcattgtaca tttggaatga     360

catgaatgag ccttctgtgt ttaatggacc tgaggtgaca atgcccagag atgctttaca     420

tgttggtgga gtggaacatc gggagttaca taatgcctat ggatattact tccacatggc     480

aacagctgaa ggccttctaa agcgtggaga tggtaaggac agaccttttg tcttgtccag     540

agcattcttt gctggaagtc aaaggtatgg agcagtctgg actggtgata attcggcaga     600

ttgggatcat ctcagggttt cagtcccaat ggttttgacg cttggtctta ctggaatgac     660

attctctggg gctgatgttg gtggattttt tggcaatcct gagcctgagt tattagtgcg     720

ttggtatcaa cttggtgctt attatccttt ctttagaggt catgctcatc atgacacaaa     780

aagacgagag ccttggttgt ttggtgaacg aaataccgca cttatgagag atgccatacg     840

aattcgttac accttgcttc catacttcta cacattattc agagaagcaa atgttagtgg     900

tgttcctgtt gtacggccat tatggatgga gttcccatct gatgaagcag ctttcagcaa     960

tgatgaagcc ttcatggttg ggaacagtct tttagtacaa gggatctata ctgcaagggc    1020

taaacatgca tcagtatatt tgcctgggaa ggaatcgtgg tacgacctta gaacaggaac    1080

tgcatataag ggaggaaagg tccataaact tgaagtttca gaagagagca ttcctgcttt    1140

ccaaagagct ggcacaatag tgccaagaaa agaccggttc cgtagaagct ccacacaaat    1200

ggtgcatgat ccttacacac tqqtaatagc tctgaacagt tcccaagcag ctgaaggtga    1260

actctatgtt gatgatggaa aaagctatga cttcaaacat ggggcataca tccatcgccg    1320

ctttgtgttc tcgaatgggc atctaacatc ctctcccgtt ggcaactcta ggttttcgtc    1380

tgactgcatt atcgagcggg ttattcttct tggatttacc cctggggcta aaactgctct    1440

tgtcgaacca ggaaatcaga aggctgaaat cgaacttggt ccacttcggt tcgggggaca    1500

acatgctgct gttgctgtaa ccatccggaa gcctggtgtg agggtggctg aagattggaa    1560

gataaaaatt ttgtaggatg tctatttagt tcggtgaaaa tgtaatgcca agtaaagctc    1620

tcctgctact tcgttattct cgacttttta gagtttatga tggagaaaac tggaaagccg    1680

ttgacatttc cttcgttcaa tttactttct acttttaaga atttaaaaaa aaagtcgacg    1740

cggccgcgaa ttccggaccg gtacctgcag gcg                                 1773

<210>5

<211>621

<212>PRT

<213>Arabidopsis thaliana

<400>5

Met Tyr Gly Arg Asp Pro Trp Gly Gly Pro Leu Glu Ile Asn Thr Ala

1               5                   10                  15

Asp Ser Ala Thr Asp Asp Asp Arg Ser Arg Asn Leu Asn Asp Leu Asp

            20                  25                  30

Arg Ala Ala Leu Ser Arg Pro Leu Asp Glu Thr Gln Gln Ser Trp Leu

        35                  40                  45

Leu Gly Pro Thr Glu Gln Lys Lys Lys Lys Tyr Val Asp Leu Gly Cys

    50                  55                  60

Ile Ile Val Ser Arg Lys Ile Phe Val Trp Thr Val Gly Thr Leu Val

65                  70                  75                  80

Ala Ala Ala Leu Leu Ala Gly Phe Ile Thr Leu Ile Val Lys Thr Val

                85                  90                  95

Pro Arg His His Pro Lys Thr Pro Pro Pro Asp Asn Tyr Thr Ile Ala

            100                 105                 110

Leu His Lys Ala Leu Lys Phe Phe Asn Ala Gln Lys Ser Gly Lys Leu

        115                 120                 125

pro Lys His Asn Asn Val Ser Trp Arg Gly Asn Ser Gly Leu Gln Asp

    130                 135                 140

Gly Lys Gly Glu Thr Gly Ser Phe Tyr Lys Asp Leu Val Gly Gly Tyr

145                 150                 155                 160

Tyr Asp Ala Gly Asp Ala Ile Lys Phe Asn Phe Pro Met Ala Tyr Ala

                165                 170                 175

Met Thr Met Leu Ser Trp Ser Val Ile Glu Tyr Ser Ala Lys Tyr Glu

            180                 185                 190

Ala Ala Gly Glu Leu Thr His Val Lys Glu Leu Ile Lys Trp Gly Thr

        195                 200                 205

Asp Tyr Phe Leu Lys Thr Phe Asn Ser Thr Ala Asp Ser Ile Asp Asp

    210                 215                 220

Leu Val Ser Gln Val Gly Ser Gly Asn Thr Asp Asp Gly Asn Thr Asp

225                 230                 235                 240

Pro Asn Asp His Tyr Cys Trp Met Arg Pro Glu Asp Met Asp Tyr Lys

                245                 250                 255

Arg Pro Val Thr Thr Cys Asn Gly Gly Cys Ser Asp Leu Ala Ala Glu

            260                 265                 270

Met Ala Ala Ala Leu Ala Ser Ala Ser Ile Val Phe Lys Asp Asn Lys

        275                 280                 285

Glu Tyr Ser Lys Lys Leu Val His Gly Ala Lys Val Val Tyr Gln Phe

    290                 295                 300

Gly Arg Thr Arg Arg Gly Arg Tyr Ser Ala Gly Thr Ala Glu Ser Ser

305                 310                 315                 320

Lys Phe Tyr Asn Ser Ser Met Tyr Trp Asp Glu Phe Ile Trp Gly Gly

                325                 330                 335

Ala Trp Met Tyr Tyr Ala Thr Gly Asn Val Thr Tyr Leu Asn Leu Ile

            340                 345                 350

Thr Gln Pro Thr Met Ala Lys His Ala Gly Ala Phe Trp Gly Gly Pro

        355                 360                 365

Tyr Tyr Gly Val Phe Ser Trp Asp Asn Lys Leu Ala Gly Ala Gln Leu

    370                 375                 380

Leu Leu Ser Arg Leu Arg Leu Phe Leu Ser Pro Gly Tyr Pro Tyr Glu

385                 390                 395                 400

Glu Ile Leu Arq Thr Phe His Asn Gln Thr Ser Ile Val Met Cys Ser

                405                 410                 415

Tyr Leu Pro Ile Phe Asn Lys Phe Asn Arg Thr Asn Gly Gly Leu Ile

            420                 425                 430

Glu Leu Asn His Gly Ala Pro Gln Pro Leu Gln Tyr Ser Val Asn Ala

        435                 440                 445

Ala Phe Leu Ala Thr Leu Tyr Ser Asp Tyr Leu Asp Ala Ala Asp Thr

    450                 455                 460

Pro Gly Trp Tyr Cys Gly Pro Asn Phe Tyr Ser Thr Ser Val Leu Arg

465                 470                 475                 480

Asp Phe Ala Arg Ser Gln Ile Asp Tyr Ile Leu Gly Lys Asn Pro Arg

                485                 490                 495

Lys Met Ser Tyr Val Val Gly Phe Gly Thr Lys Tyr Pro Arg His Val

            500                 505                 510

His His Arg Gly Ala Ser Ile Pro Lys Asn Lys Val Lys Tyr Asn Cys

        515                 520                 525

Lys Gly Gly Trp Lys Trp Arg Asp Ser Lys Lys Pro Asn Pro Asn Thr

    530                 535                 540

Ile Glu Gly Ala Met Val Ala Gly Pro Asp Lys Arg Asp Gly Tyr Arg

545                 550                 555                 560

Asp Val Arg Met Asn Tyr Asn Tyr Thr Glu Pro Thr Leu Ala Gly Asn

                565                 570                 575

Ala Gly Leu Val Ala Ala Leu Val Ala Leu Ser Gly Glu Glu Glu Ala

            580                 585                 590

Thr Gly Lys Ile Asp Lys Asn Thr Ile Phe Ser Ala Val Pro Pro Leu

        595                 600                 605

Phe Pro Thr Pro Pro Pro Pro Pro Ala Pro Trp Lys Pro

    610                 615                 620

<210>6

<211>619

<212>PRT

<213>cotton

<400>6

Met Tyr Gly Arg Asp Pro Trp Gly Gly Pro Leu Glu Ile Asn Ala Thr

1               5                   10                  15

Asp Ser Ala Thr Asp Asp Asp Arg Ser Arg Asn Leu Gln Asp Leu Asp

            20                  25                  30

Arg Ala Ala Leu Ser Arg Pro Leu Asp Glu Thr Gln Gln Ser Trp Leu

        35                  40                  45

Leu Gly Pro Gly Glu Gln Lys Lys Lys Lys Lys Tyr Val Asp Leu Gly

    50                  55                  60

Cys Ile Ile Val Ser Arg Lys Ile Phe Val Trp Thr Val Gly Thr Leu

65                  70                  75                  80

Leu Val Ser Ala Leu Leu Ala Gly Leu Ile Thr Leu Ile Val Lys Thr

                85                  90                  95

Val Pro Arg His His His Arg His Ser Pro Pro Asp Asn Tyr Thr Leu

            100                 105                 110

Ala Leu His Lys Ala Leu Met Phe Phe Asn Ala Gln Arg Ser Gly Lys

        115                 120                 125

Leu Pro Lys His Asn Asn Val Ser Trp Arg Gly Asn Ser Gly Leu Gln

    130                 135                 140

Asp Gly Lys Ser Asp Pro Ser Val Leu Met Lys Asp Leu VaL Gly Gly

145                 150                 155                 160

Tyr Tyr Asp Ala Gly Asp Ala Ile Lys Phe Asn Phe Pro Ala Ser Phe

                165                 170                 175

Ser Met Thr Met Leu Ser Trp Ser Val Ile Glu Tyr Ser Ala Lys Tyr

            180                 185                 190

Glu Ala Ala Gly Glu Leu Asn His Val Lys Glu Ile Ile Lys Trp Gly

        195                 200                 205

Thr Asp Tyr Leu Leu Lys Thr Phe Asn Asn Thr Ala Asp Thr Ile Asp

    210                 215                 220

Arg Ile Ala Ala Gln Val Gly Ile Gly Asp Thr Ser Gly Gly Ser Ser

225                 230                 235                 240

Ala Pro Asn Asp His Tyr Cys Trp Met Arg Pro Glu Asp Ile Asp Tyr

                245                 250                 255

Pro Arg Pro Val Tyr Glu Cys His Ser Cys Ser Asp Leu Ala Ala Glu

            260                 265                 270

Met Ala Ala Ala Leu Ala Ser Ala Ser Ile Val Phe Lys Asp Asn Lys

        275                 280                 285

Ala Tyr Ser Gln Lys Leu Val His Gly Ala Arg Thr Leu Phe Met Phe

    290                 295                 300

Ala Arg Asp Gln Arg Gly Arg Tyr Ser Ala Gly Gly Ser Asp Pro Ala

305                 310                 315                 320

Leu Phe Tyr Asn Ser Ser Ser Tyr Trp Asp Glu Phe Val Trp Gly Gly

                325                 330                 335

Ala Trp Leu Tyr Tyr Ala Thr Gly Asn Ser Ser Tyr Leu Gln Leu Ala

            340                 345                 350

Thr His Pro Lys Leu Ala Lys His Ala Gly Ala Phe Trp Gly Gly Pro

        355                 360                 365

Asp Tyr Gly Val Leu Ser Trp Asp Asn Lys Leu Ala Gly Ala Gln Val

    370                 375                 380

Leu Leu Ser Arg Leu Arg Leu Phe Leu Ser Pro Gly Tyr Pro Tyr Glu

385                 390                 395                 400

Glu Ile Leu Ser Thr Phe His Asn Gln Thr Ser Ile Ile Met Cys Ser

                405                 410                 415

Phe Leu Pro Val Phe Thr Ser Phe Asn Arg Thr Lys Gly Gly Leu Ile

            420                 425                 430

Gln Leu Asn His Gly Arg Pro Gln Pro Leu Gln Tyr Val Val Asn Ala

        435                 440                 445

Ala Phe Leu Ala Ala Leu Tyr Ser Asp Tyr Leu Asp Thr Ala Asp Thr

    450                 455                 460

Pro Gly Trp Tyr Cys Gly Pro Asn Phe Tyr Ser Thr Asp Val Leu Arg

465                 470                 475                 480

Glu Phe Ala Lys Thr Gln Ile Asp Tyr Ile Leu Gly Lys Asn Pro Arg

                485                 490                 495

Lys Met Ser Tyr Val Val Gly Phe Gly Asn His Tyr Pro Lys His Val

            500                 505                 510

His His Arg Gly Ala Ser Ile Pro Lys Asn Lys Ile Lys Tyr Asn Cys

        515                 520                 525

Lys Gly Gly Trp Lys Trp Arg Asp Thr Ser Lys Pro Asn Pro Asn Thr

    530                 535                 540

Leu Val Gly Ala Met Val Ala Gly Pro Asp Lys His Asp Gly Phe Arg

545                 550                 555                 560

Asp Val Arg Thr Asn Tyr Asn Tyr Thr Glu Pro Thr Leu Ala Gly Asn

                565                 570                 575

Ala Gly Leu Val Ala Ala Leu Val Ala Leu Ser Gly Asp Lys Ala Thr

            580                 585                 590

Val Ile Asp Lys Asn Thr Ile Phe Ser Ala Val Pro Pro Met Phe Pro

        595                 600                 605

Thr Pro Pro Pro Pro Pro Ala Pro Trp Lys Pro

    610                 615

<210>7

<211>921

<212>PRT

<213>Arabidopsis thaliana

<400>7

Met Arg Ser Leu Leu Phe Val Leu Ser Leu Ile Cys Phe Cys Ser Gln

1               5                   10                  15

Thr Ala Leu Ser Trp Lys Lys Glu Glu Phe Arg Ser Cys Asp Gln Thr

            20                  25                  30

Pro Phe Cys Lys Arg Ala Arg Ser Arg Thr Pro Gly Ala Cys Ser Leu

        35                  40                  45

Ile Val Gly Asp Val Ser Ile Thr Asp Gly Asp Leu Val Ala Lys Leu

    50                  55                  60

Leu Pro Lys Ala Pro Asn Gln Gly Asp Gly Asp Gln Ile Lys Pro Leu

65                  70                  75                  80

Ile Leu Ser Leu Ser Val Tyr Lys Asp Gly Ile Val Arg Leu Lys Ile

                85                  90                  95

Asp Glu Asp His Ser Leu Asn Pro Pro Lys Lys Arg Phe Gln Val Pro

            100                 105                 110

Asp Val Val Val Ser Glu Phe Glu Glu Lys Lys Ile Trp Leu Gln Lys

        115                 120                 125

Val Ala Thr Glu Thr Ile Ser Gly Asp Thr Ser Pro Ser Ser Val Val

    130                 135                 140

Tyr Val Ser Asp Gly Tyr Glu Ala Val Val Arg His Asp Pro Phe Glu

145                 150                 155                 160

Val Tyr Val Arg Glu Lys Ser Gly Asp Arg Arg Arg Val Val Ser Leu

                165                 170                 175

Asn Ser His Gly Leu Phe Asp Phe Glu Gln Leu Gly Arg Lys Thr Glu

            180                 185                 190

Gly Asp Asn Trp Glu Glu Lys Phe Arg Thr His Thr Asp Ser Arg Pro

        195                 200                 205

Ser Gly Pro Gln Ser Ile Ser Phe Asp Val Ser Phe Tyr Asp Ser Ser

    210                 215                 220

Phe Val Tyr Gly Ile Pro Glu His Ala Thr Ser Phe Ala Leu Lys Pro

225                 230                 235                 240

Thr Lys Gly Pro Gly Val Glu Glu Ser Glu Pro Tyr Arg Leu Phe Asn

                245                 250                 255

Leu Asp Val Phe Glu Tyr Asp His Glu Ser Pro Phe Gly Leu Tyr Gly

            260                 265                 270

Ser Ile Pro Phe Met Val Ser His Gly Lys Ser Gly Lys Thr Ser Gly

        275                 280                 285

Phe Phe Trp Leu Asn Ala Ala Glu Met Gln Ile Asp Val Leu Ala Asn

    290                 295                 300

Gly Trp Asp Ala Glu Ser Gly Ile Ser Leu Pro Ser Ser His Ser Arg

305                 310                 315                 320

Ile Asp Thr Phe Trp Met Ser Glu Ala Gly Ile Val Asp Thr Phe Phe

                325                 330                 335

Phe Val Gly Pro Glu Pro Lys Asp Val Val Lys Gln Tyr Ala Ser Val

            340                 345                 350

Thr Gly Thr Ser Ala Met Pro Gln Leu Phe Ala Thr Gly Tyr His Gln

        355                 360                 365

Cys Arg Trp Asn Tyr Lys Asp Glu Glu Asp Val Ala Gln Val Asp Ser

    370                 375                 380

Lys Phe Asp Glu His Asp Ile Pro Tyr Asp Val Leu Trp Leu Asp Ile

385                 390                 395                 400

Glu His Thr Asp Gly Lys Arg Tyr Phe Thr Trp Asp Ser Val Leu Phe

                405                 410                 415

Pro His Pro Glu Glu Met Gln Lys Lys Leu Ala Ala Lys Gly Arg Lys

            420                 425                 430

Met Val Thr Ile Val Asp Pro His Ile Lys Arg Asp Asp Ser Tyr Phe

        435                 440                 445

Leu His Lys Glu Ala Thr Gln Met Gly Tyr Tyr Val Lys Asp Ser Ser

    450                 455                 460

Gly Lys Asp Phe Asp Gly Trp Cys Trp Pro Gly Ser Ser Ser Tyr Ile

465                 470                 475                 480

Asp Met Leu Ser Pro Glu Ile Arg Lys Trp Trp Gly Gly Arg Phe Ser

                485                 490                 495

Tyr Lys Asn Tyr Val Gly Ser Thr Pro Ser Leu Tyr Thr Trp Asn Asp

            500                 505                 510

Met Asn Glu Pro Ser Val Phe Asn Gly Pro Glu Val Thr Met Pro Arg

        515                 520                 525

Asp Ala Leu His Val Gly Gly Val Glu His Arg Glu Val His Asn Ala

    530                 535                 540

Tyr Gly Tyr Tyr Phe His Met Ala Thr Ser Asp Gly Leu Val Met Arg

545                 550                 555                 560

Glu Glu Gly Lys Asp Arg Pro Phe Val Leu Ser Arg Ala Ile Phe Pro

                565                 570                 575

Gly Thr Gln Arg Tyr Gly Ala Ile Trp Thr Gly Asp Asn Thr Ala Glu

            580                 585                 590

Trp Glu His Leu Arg Val Ser Ile Pro Met Ile Leu Thr Leu Gly Leu

        595                 600                 605

Thr Gly Ile Thr Phe Ser Gly Ala Asp Ile Gly Gly Phe Phe Gly Asn

    610                 615                 620

Pro Glu Pro Glu Leu Leu Val Arg Trp Tyr Gln Val Gly Ala Tyr Tyr

625                 630                 635                 640

Pro Phe Phe Arg Gly His Ala His His Asp Thr Lys Arg Arg Glu Pro

                645                 650                 655

Trp Leu Phe Gly Glu Arg Asn Thr Glu Leu Met Arg Asp Ala Ile His

            660                 665                 670

Thr Arg Tyr Thr Leu Leu Pro Tyr Phe Tyr Thr Leu Phe Arg Glu Ala

        675                 680                 685

Asn Val Thr Gly Val Pro Val Val Arg Pro Leu Trp Met Glu Phe Pro

    690                 695                 700

Gln Asp Glu Ala Thr Phe Ser Asn Asp Glu Ala Phe Met Val Gly Ser

705                 7l0                 715                 720

Gly Leu Leu Val Gln Gly Val Tyr Thr Lys Gly Thr Thr Gln Ala Ser

                725                 730                 735

Val Tyr Leu Pro Gly Lys Glu Ser Trp Tyr Asp Leu Arg Asn Gly Lys

            740                 745                 750

Thr Tyr Val Gly Gly Lys Thr His Lys Met Asp Ala Pro Glu Glu Ser

        755                 760                 765

Ile Pro Ala Phe Gln Lys Ala Gly Thr Ile Ile Pro Arg Lys Asp Arg

    770                 775                 780

Phe Arg Arg Ser Ser Ser Gln Met Asp Asn Asp Pro Tyr Thr Leu Val

785                 790                 795                 800

Val Ala Leu Asn Ser Ser Gln Glu Ala Glu Gly Glu Leu Tyr Ile Asp

                805                 810                 815

Asp Gly Lys Ser Phe Glu Phe Arg Arg Gly Ser Tyr Ile His Arg Arg

            820                 825                 830

Phe Val Phe Ser Lys Gly Val Leu Thr Ser Thr Asn Leu Ala Pro Pro

        835                 840                 845

Glu Ala Arg Leu Ser Ser Gln Cys Leu Ile Asp Arg Ile Ile Leu Leu

    850                 855                 860

Gly His Ser Ser Gly Pro Lys Ser Ala Leu Val Glu Pro Leu Asn Gln

865                 870                 875                 880

Lys Ala Glu Ile Glu Met Gly Pro Leu Arg Met Gly Gly Leu Val Ala

                885                 890                 895

Ser Ser Gly Thr Lys Val Leu Thr Ile Arg Lys Pro Gly Val Arg Val

            900                 905                 910

Asp Gln Asp Trp Thr Val Lys Ile Leu

        915                 920

<210>8

<211>524

<212>PRT

<213>cotton

<400>8

Tyr Asp Val Leu Trp Leu Asp Ile Glu His Thr Asp Gly Lys Arg Tyr

1               5                   10                  15

Phe Thr Trp Asp Lys Met Leu Phe Pro His Pro Glu Glu Met Gln Arg

            20                  25                  30

Lys Leu Ala Ala Lys Gly Arg His Met Val Thr Ile Val Asp Pro His

        35                  40                  45

Ile Lys Arg Asp Glu Ser Phe His Leu His Lys Asp Ala Ser Gln Arg

    50                  55                  60

Gly Tyr Tyr Val Lys Asp Ala Thr Gly Lys Asp Tyr Asp Gly Trp Cys

65                  70                  75                  80

Trp Pro Gly Ser Ser Ser Tyr Pro Asp Met Leu Asn Pro Glu Ile Arg

                85                  90                  95

Ser Trp Trp Ala Glu Lys Phe Ser Tyr Asp Asn Tyr Val Gly Ser Thr

            100                 105                 110

Pro Ser Leu Tyr Ile Trp Asn Asp Met Asn Glu Pro Ser Val Phe Asn

        115                 120                 125

Gly Pro Glu Val Thr Met Pro Arg Asp Ala Leu His Val Gly Gly Val

    130                 135                 140

Glu His Arg Glu Leu His Asn Ala Tyr Gly Tyr Tyr Phe His Met Ala

145                 150                 155                 160

Thr Ala Glu Gly Leu Leu Lys Arg Gly Asp Gly Lys Asp Arg Pro Phe

                165                 170                 175

Val Leu Ser Arg Ala Phe Phe Ala Gly Ser Gln Arg Tyr Gly Ala Val

            180                 185                 190

Trp Thr Gly Asp Asn Ser Ala Asp Trp Asp His Leu Arg Val Ser Val

        195                 200                 205

Pro Met Val Leu Thr Leu Gly Leu Thr Gly Met Thr Phe Ser Gly Ala

    210                 215                 220

Asp Val Gly Gly Phe Phe Gly Asn Pro Glu Pro Glu Leu Leu Val Arg

225                 230                 235                 240

Trp Tyr Gln Leu Gly Ala Tyr Tyr Pro Phe Phe Arg Gly His Ala His

                245                 250                 255

His Asp Thr Lys Arg Arg Glu Pro Trp Leu Phe Gly Glu Arg Asn Thr

            260                 265                 270

Ala Leu Met Arg Asp Ala Ile Arg Ile Arg Tyr Thr Leu Leu Pro Tyr

        275                 280                 285

Phe Tyr Thr Leu Phe Arg Glu Ala Asn Val Ser Gly Val Pro Val Val

    290                 295                 300

Arg Pro Leu Trp Met Glu Phe Pro Ser Asp Glu Ala Ala Phe Ser Asn

305                 310                 315                 320

Asp Glu Ala Phe Met Val Gly Asn Ser Leu Leu Val Gln Gly Ile Tyr

                325                 330                 335

Thr Ala Arg Ala Lys His Ala Ser Val Tyr Leu Pro Gly Lys Glu Ser

            340                 345                 350

Trp Tyr Asp Leu Arg Thr Gly Thr Ala Tyr Lys Gly Gly Lys Val His

        355                 360                 365

Lys Leu Glu Val Ser Glu Glu Ser Ile Pro Ala Phe Gln Arg Ala Gly

    370                 375                 380

Thr Ile Val Pro Arg Lys Asp Arg Phe Arg Arg Ser Ser Thr Gln Met

385                 390                 395                 400

Val His Asp Pro Tyr Thr Leu Val Ile Ala Leu Asn Ser Ser Gln Ala

                405                 410                 415

Ala Glu Gly Glu Leu Tyr Val Asp Asp Gly Lys Ser Tyr Asp Phe Lys

            420                 425                 430

His Gly Ala Tyr Ile His Arg Arg Phe Val Phe Ser Asn Gly His Leu

        435                 440                 445

Thr Ser Ser Pro Val Gly Asn Ser Arg Phe Ser Ser Asp Cys Ile Ile

    450                 455                 460

Glu Arg Val Ile Leu Leu Gly Phe Thr Pro Gly Ala Lys Thr Ala Leu

465                 470                 475                 480

Val Glu Pro Gly Asn Gln Lys Ala Glu Ile Glu Leu Gly Pro Leu Arg

                485                 490                 495

Phe Gly Gly Gln His Ala Ala Val Ala Val Thr Ile Arg Lys Pro Gly

            500                 505                 510

Val Arg Val Ala Glu Asp Trp Lys Ile Lys Ile Leu

        515                 520

<210>9

<211>2766

<212>DNA

<213>Arabidopsis thaliana

<400>9

atgagatctc ttctctttgt actatcactc atttgctttt gctctcaaac agcactttca      60

tggaagaagg aagagtttcg caqctgtgac caaactccat tttgtaaacg cgctcgatct     120

cgtactcccg gcgcgtgttc tctaattgtc ggcgatgttt ccatcactga tggagatctc     180

gtagcgaagc ttctaccgaa agcgcctaat caaggcgatg gggatcagat caagccgttg     240

attctttctc tctcagttta caaggatggg atcgtgcggc ttaaaatcga tgaggaccat     300

tcgttgaacc cgccgaagaa gaggttccaa gttcctgatg tggtagtgtc tgagtttgag     360

gagaagaaga tctggctgca gaaagtagcg acggagacga tctctggaga cactagtccg     420

tcttcagtag tttatgtatc cgatggttac gaggcggtgg tgcgacacga tccgtttgag     480

gtgtatgtgc gtgagaaatc aggtgatcgc cgtcgcgttg tgtcattgaa ttctcatgga     540

ttatttgatt ttgagcagtt ggggaggaaa actgaaggag ataactggga agagaaattt     600

aggactcata cagattctag accatctggt cctcaatcta ttagtttcga tgtttcgttt     660

tatgattcca gtttcgttta tggaattcct gaacacgcca ctagcttcgc gttgaagcct     720

accaagggtc ctggagttga ggaatctgaa ccctacaggc tttttaatct agatgtgttt     780

gaatacgatc atgaatcacc gtttgggctt tacgggtcga ttccgttcat ggtttcgcat     840

ggqaagtctg gtaaaacttc aggatttttc tggttgaatg ctgcggaaat gcagattgat     900

gtgttggcta atggttggga tgcagagagt ggtatttctt tgccttctag tcacagtagg     960

atcgacacat tctggatgag cgaggcaggg attgtggata cattcttttt cgttgggcct    1020

gagccaaagg atgttgtaaa gcagtatgca agtgtgacag gtacttcagc catgcctcag    1080

ttgtttgcca ctggttatca tcaatgtagg tggaactaca aagatgagga ggatgtggca    1140

caggtggact cgaaattcga tgaacacgat attccttatg atgttctctg gcttgacatt    1200

gagcatacag atgggaagag atactttaca tgggatagtg tgttgtttcc tcatccagag    1260

gagatgcaaa agaaattggc tgcaaagggt aggaagatgg tgaccattgt ggatcctcat    1320

atcaagaggg atgactcata cttcttacac aaaqaggcta ctcagatggg atactatgtt    1380

aaggattcat ctggaaaaga ctttgatggt tggtgctggc ctggttcatc atcttacatt    1440

gatatgttga gcccagagat tagaaaatgg tggggtggga ggttctcgta taagaactat    1500

gttggttcaa ctccatcatt gtacacctgg aatgacatga atgagccttc tgtattcaat    1560

ggtcccgagg ttactatgcc aagagatgca ttacatgttg gqggtgttga acacagagaa    1620

gttcataacg catatggata ttacttccac atggcgactt ccgatggact tgttatgcgt    1680

gaagaaggaa aggataggcc ttttgtattg tcaagagcaa tctttcccgg cactcaaaga    1740

tacggagcaa tttggactgg agataacaca gccgaatggg aacaccttag agtctccatt    1800

ccaatgatat tgacacttgg tcttactgga attacattct ctqgagctga tattggtqgg    1860

ttttttggaa atcctgaacc agaacttcta gttaggtggt accaagtggg tgcttactat    1920

ccatttttca ggggtcatgc tcatcacgat accaaaagac gagagccttg gttgtttggt    1980

gaacggaaca cagaactcat gagagatgcc atacacactc gttacacact gctcccatac    2040

ttctacacgt tgttcagaga agcaaacgtt acgggtgttc ctgttgtacg cccattatgg    2100

atggaattcc cgcaagatga agctactttt agcaacgatg aagccttcat ggtcggtagt    2160

ggtctactgg ttcaaggagt ttacaccaag ggaacaacgc aagcttccgt gtatttgcct    2220

ggcaaagaat catggtatga cttgagaaac ggtaagactt acgttggagg caagactcac    2280

aagatggatg ctccagagga gagtattcct gcgtttcaaa aggcaggaac catcatccca    2340

aggaaggacc ggtttaggcg aagttcctct caaatggaca atgatcctta tactttggtg    2400

gtagctttga acagttctca agaagcagaa ggtgaactct acatcgatga cggcaaaagc    2460

tttgaattca gacgaggctc ttacatccat cgtcgcttcg tcttctcaaa gggtgttctt    2520

acatcaacga acttagctcc tccagaagct cgtctctctt cccaatgctt gatcgacaga    2580

attatcctct tgggacacag ctcaggtcca aaatctgcgt tggtggaacc gttgaatcaa    2640

aaggcagaga ttgagatggg acctctgcga atgggtgggc ttgtagcttc ctcgggtaca    2700

aaggtgttga ctatccgcaa accgggtgtt cgagtggacc aagactggac cgtaaagatt    2760

ctgtga                                                               2766

<210>10

<211>29

<212>DNA

<213>Artificial sequence

<220>

<223>oligonucleotide PCR primer

<400>10

ccgctcgagc gggcattttc  cgcccacta                                       29

<210>11

<211>29

<212>DNA

<213>Artificial Sequence

<220>

<223>oligonucleotide PCR primer

<400>11

cgggatcccg tcacacatgg acagaagaa                                        29

<210>12

<211>19

<212>DNA

<213>Artificial Sequence

<220>

<223>oligonucleotide PCR primer

<400>12

gacggcgtct  agaagattc                                                  19

<210>13

<211>19

<212>DNA

<213>Artificial Sequence

<220>

<223>oligonucleotide PCR primer

<400>13

taacttatcg  ggcttctgc                                                  19

<210>14

<211>21

<212>DNA

<213>Artificial Sequence

<220>

<223>oligonucleotide PCR primer

<400>14

 ccctcgcttg gtacaaggta t                                               21

<210>15

<211>21

<212>DNA

<213>Artificial Sequence

<220>

<223>oligonucleotide PCR primer

<400>15

tcctqatcct ctcaccacgt a                                                21

<210>16

<211>21

<212>DNA

<213>Artificial Sequence

<220>

<223>oligonucleotide PCR primer

<400>16

cgtagtggtc tactggttca a                                                21

<210>17

<211>21

<212>DNA

<213>Artificial Sequence

<220>

<223>oligonucleotide PCR primer

<400>17

tgagctgtgt cccaagagga t                                               21

<210>18

<211>21

<212>DNA

<213>Artificial Sequence

<220>

<223>oligonucleotide PCR primer

<400>18

ggtgatgagg ataccagcga t                                             21

<210>19

<211>21

<212>DNA

<213>Artificial Sequence

<220>

<223>oligonucleotide PCR primer

<400>19

cccactccct aaccggagtt t                                              21

<210>20

<211>35

<212>DNA

<213>Artificial Sequence

<220>

<223>oligonucleotide PCR primer

<400>20

ccgctcgagc ggtttcactc acaactgtgg tctct                               35

<210>21

<211>34

<212>DNA

<213>Artificial Sequence

<220>

<223>oligonucleotide PCR primer

<400>21

ccgctcgagc ggtctcctaa gtcctaaccc cata                                34

<210>22

<211>21

<212>DNA

<213>Artificial Sequence

<220>

<223>oligonucleotide PCR primer

<400>22

cgggatgaag aggatgtaga g                                              21

<210>23

<211>21

<212>DNA

<213>Artificial Sequence

<220>

<223>oligonucleotide PCR primer

<400>23

gaacccctga  gatgatccca a                                             21

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号