首页> 中国专利> 与对核盘菌属的全植株大田抗性相关联的QTL和鉴定对核盘菌属的全植株大田抗性的方法

与对核盘菌属的全植株大田抗性相关联的QTL和鉴定对核盘菌属的全植株大田抗性的方法

摘要

本发明提供了与核盘菌属(Sclerotinia)全植株大田抗性相关联的标记。提供了使用所述标记鉴定核盘菌属抗性的和易感的植物的方法。鉴定和分离QTL的方法,以及与核盘菌属全植株大田抗性相关联的QTL是本发明的特征。

著录项

  • 公开/公告号CN103443292A

    专利类型发明专利

  • 公开/公告日2013-12-11

    原文格式PDF

  • 申请/专利权人 先锋国际良种公司;

    申请/专利号CN201180068000.X

  • 申请日2011-12-21

  • 分类号C12Q1/68;A01H5/10;

  • 代理机构中国专利代理(香港)有限公司;

  • 代理人邹雪梅

  • 地址 美国依阿华州

  • 入库时间 2024-02-19 21:40:17

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2018-02-23

    授权

    授权

  • 2014-01-08

    实质审查的生效 IPC(主分类):C12Q1/68 申请日:20111221

    实质审查的生效

  • 2013-12-11

    公开

    公开

说明书

相关申请的交叉引用

根据35 U.S.C.§1.19(e)要求至申请日的提交于2010年12月22日的 美国临时申请61,426,170、提交于2011年3月7日的美国临时申请 61/449,776和提交于2011年12月2日的美国临时申请61/566,064的权益, 每一上述专利申请的全文以引用方式并入本文。

技术领域

本发明一般涉及植物分子生物学。更具体地,其涉及芸苔属中与对核 盘菌属的全植株大田抗性相关联的数量性状基因座(QTL),和使用这些 QTL来鉴定芸苔属和其它植物物种中对核盘菌属的全植株大田抗性。

背景技术

核盘菌属(Sclerotinia)感染加拿大全境的超过400种植物物种,包括 众多经济上重要的作物,例如芸苔属(Brassica)物种、向日葵、干豆、红 豌豆、扁豆、和马铃薯(Boland和Hall(1994)Can.J.Plant Pathol.16:93- 108)。核盘菌(Sclerotinia sclerotiorum)是超过99%的该病害的原因,而 小核盘菌(Sclerotinia minor)导致小于1%的该病害。核盘菌属产生菌核, 菌核是能够在土壤中存活四至五年的不规则形状的深色越冬体。依赖于环境 条件和作物冠层,菌核能够产子实体地或产菌丝地发芽。这两种不同的发芽 类型导致两种不同的病害类型。产子实体地发芽的菌核产生感染地上组织的 子囊盘和子囊孢子,导致植物的茎疫病、茎腐病、头腐病、荚果腐病、白绢 病和花枯病。产菌丝地发芽的菌核产生能够感染根组织的菌丝,导致冠腐 病、根腐病和茎基腐病。

核盘菌属在芸苔属包括卡诺拉中导致菌核茎腐病,也叫白绢病。卡诺 拉是在种子中具有低水平的芥子油甙和芥酸的一种芸苔属植物。菌核在夏季 产子实体地发芽,产生子囊盘。子囊盘释放传播至多一千米的靠风传播的子 囊孢子。在卡诺拉开花之前和期间,该病害受湿润的土壤条件(至少10天 或接近的田间持水量)和15-25℃的温度促进。孢子不能直接感染叶和茎。 它们必须先降落在花、落下的花瓣、以及茎和叶上的花粉上。花瓣年龄影响 感染效率,较老的花瓣更加能够发生感染(Heran等人(1999)“The Effect  of Petal Characteristics,Inoculum Density and Environmental Factors on Infection  of Oilseed Rape by Sclerotinia sclerotiorum”The Regional Institute Ltd. http://www.regional.org.au/au/gcirc/3/428.htm)。真菌孢子利用花的部分作为 食物来源来发芽和感染植物。

芸苔属在某些条件下还能够发生根腐病。例如,冬性和春性卡诺拉偶 尔会在Europe(冬性卡诺拉)和Georgia,US(春性卡诺拉)的温和的冬季 发生根腐病。

核盘菌属在芸苔属中的严重程度是可变的,并且依赖于感染的时间和 气候条件(Heran等人,参见上文)。该病害受低温和长时间的降水促进。 最理想的植物感染需要20和25℃之间的温度和大于80%的相对湿度 (Heran等人,参见上文)。对于个别田地,已报道了从5至100%范围的 损失(Manitoba Agriculture,Food and Rural Initiatives,2004)。平均地,产 量损失等于0.4至0.5乘以感染百分比。例如,如果一块田地具有20%的感 染(20/100感染的植株),那么产量损失将是约10%。此外,核盘菌属还 能够在湿的收割物中导致严重损失。

核盘菌属感染的症状通常在开花开始后几星期发生。在土壤线处或其 上方以及上部分枝和豆荚上,植物发生浅灰色至白色的病变。感染经常在叶 和茎接合处发生,因为被感染的花瓣嵌在那里。感染的茎表现为变白的并且 倾向于撕裂。硬的黑色真菌菌核在感染的茎、枝、或豆荚内发育。在开花时 感染的植物产生很少的或不产生种子。具有缠绕的茎的植物枯萎和过早地成 熟。严重感染的作物经常倒伏、在铺条时损坏、和使得铺条更加耗时。感染 能够在全部的地上植物部分发生,尤其是在稠密的或倒伏的区片中。一旦植 物被感染,霉菌持续地向茎中生长并侵入健康的组织。新的菌核将形成,以 将病害延续到下一季。

具有某些形态学性状的卡诺拉品种更加能够抵抗核盘菌属感染。例 如,波兰的品种(芜菁(Brassica rapa))具有更轻的冠层,并且看起来具 有低得多的感染水平。此外,没有花瓣的品种(无花瓣品种)不提供初始的 感染源(即,花瓣)并以更大的程度避免了核盘菌属感染(Okuyama等人 (1995)Bulletin of the Tohoku National Agricultural Experiment Station. National Agriculture Research Center,Tsukuba,Ibaraki 305,JAP 3-1-1an. 89:11-20;Fu(1990)Acta Agriculture Shanghai.Economic Crop Research  Institute,Jiangsu Province Academy of Agricultural Sciences,Nanjing 210024,China 6(3):76-77。在芸苔属中赋予对核盘菌属一定程度降低的 易感性的形态学性状的例子包括提高的抗倒伏性、较低的花瓣保留、较高的 分枝(程度和位置)、开花(较早开始和/或短的历时)和较早的叶片脱 离。Jurke和Fernando(“Plant Morphology of Canola and its Effects on  Sclerotinia sclerotiorum infection in ICPP”2003 8th International Congress of  Plant Pathology,New Zealand)针对核盘菌属病害发生率筛选了十一种卡诺 拉基因型。通过植物形态学解释了病害发生率的显著变化,并且花瓣保留的 差异被鉴定为最重要的因素。然而,这些形态学性状单独并不赋予对核盘菌 属的抗性,并且加拿大的大多数卡诺拉品系被认为对核盘菌属是易感的。

在被感染的农作物中控制核盘菌属的主要手段是喷洒杀真菌剂。用于 控制芸苔属上核盘菌属的典型的杀真菌剂包括来自Bayer的RovralTM/Proline  和来自BASF的RonilanTM/LanceTM。如果感染已是明显的,施用杀真菌剂是 没有用的,因为已太迟了而无法起效。因此,种植者必须针对病害风险对他 们的田地进行评估,以决定是否施用杀真菌剂。这能够通过使用政府提供的 检查表或通过使用花瓣测试试剂盒来进行。无论哪种方式,所使用的方法都 很繁琐并且易于出错。

已进行了大量努力来培育核盘菌属抗性的春性芸苔属植物。与通过施 用杀真菌剂来控制核盘菌属相比,内在的抗性将是更加方便、经济、和对环 境友好的。由于该性状是多基因的,其将是稳定的,并且不会像杀真菌剂那 样功效容易变化。冬性卡诺拉对核盘菌属也是易感的。

春性卡诺拉(甘蓝型油菜变种(Brassica napus subsp.oleifera var. annua))与冬性卡诺拉(甘蓝型油菜变种(Brassica napus subsp.oleifera  var.biennis))的不同之处主要在于不需要强制春化处理。亚洲的油菜籽和 卡诺拉品种对于春化处理具有低的至中等的需求。虽然冬性卡诺拉当在春季 被种植时不能够完成其生殖周期,亚洲的品种如果在晚春被种植不能够完成 其生殖周期,但在早春时种植和遭受寒冷使得亚洲的品种能够开花和结籽。 在受控的条件下,冬性品种需要12至14个星期的春化处理,而亚洲的品种 需要2至8个星期。表1总结了冬性、半冬性(亚洲的)和春性卡诺拉品种 之间的差异。

表1:甘蓝型油菜(Brassica napus)材料的生长习性的主要测定

*就春性卡诺拉而言,加拿大、欧洲和澳大利亚的春性品种能够在任何环境和播种时 间被种植和生长。

油菜籽/卡诺拉的一些中国的栽培品种对核盘菌属是部分抗性的。例 如,ChunYun等人((2003)Acta Agronomica Sinica 29(5):715-718); HanZhong等人((2004)Scientia Agricultura Sinica 37(1):23-28); WeiXin等人((2002)Chinese Journal of Oil Crop Sciences 24(3):47- 49);YongJu等人((2000)Chinese Journal of Oil Crop Sciences 22(4): 1-5)描述了油菜籽的部分抗性的品种。然而,这些品种中的一些不是卡诺 拉品质的,并且它们全部需要春化处理。中国的品种的部分大田抗性起源于 油菜籽品种Zhong you 821。尽管Zhong you 821有部分抗性的改进,它在有 利于核盘菌属的发育的环境条件下对病原体的反应是较不稳定的(Li等人 (1999)“Breeding,inheritance,and biochemical studies on Brassica napus cv. Zhongyou 821:Tolerance to Sclerotinia sclerotiorum(stem rot)”. Proceedings of the 10th International Rapeseed Congress,Canberra, Australia)。

油菜籽的一些日本的栽培品种具有对核盘菌属的部分茎抗性。部分茎 抗性是在与冬性卡诺拉的比较中通过室内测试检测到的(Brun等人 (1987)“A field study of rapeseed(Brassica napus)resistance to Sclerotinia  sclerotiorum.”7th International Rapeseed Congress,Poznan,Poland)。然 而,这些品种不是卡诺拉品质的并且是半冬性类型(参见表1)。

由于该性状的数量性质,在卡诺拉中培育对核盘菌属的抗性是非常困 难的。此外,生理学抗性与避免或减少感染的形态学性状的整合倍增了针对 抗性育种的复杂度。此外,由于与植物的直接的环境与遗传(GXE)相互 作用(即,温度和湿度要求,以及微环境要求),对抗性的筛选是非常困难 的。如上文所述,尽管有多年的共进化和环境压力来针对该性状进行选择, 只有很少的加拿大春性芸苔属品种具有对核盘菌属的抗性。在中国,通过育 种工作已获得了油菜籽中(以及最近在一些卡诺拉品种中)一定水平的大田 抗性,如对Zhong you 821的描述(Li等人,参见上文)。然而,此类部分 抗性或耐受性的水平是相对低的,并且杀真菌剂的施用对于在中国的全部油 菜籽和卡诺拉品种依然是推荐的(口头交流)(Hu等人(1999)“Effect of  cultural control on rapeseed stem rot(Sclerotinia sclerotiorum)in Brassica  napus.”Proceedings of the 10th International Rapeseed Congress,Canberra, Australia)。其它的育种工作举例来说包括数量性状基因座分析(Zhao和 Meng(2003)Theoretical and Applied Genetics 106(4):759-764),诱变 育种(Mullins等人(1999)European Journal of Plant Pathology 105(5): 465-475;Wu等人(1996)Sichuan Daxue Xuebao(Ziran Kexueban)33 (2):201-205;LiangHong等人,2003,大量筛选工作(Sedun等人 (1989)Canadian Journal of Plant Science 69(1):229-232;Zhao等人 (2004)Plant Disease 88(9):1033-1039);和对表达序列标签(EST) 的筛选(Li等人(2004)Fungal Genetics and Biology 41(8):735-753)。 已培育了对核盘菌属具有中等耐受性的几个春性卡诺拉品种(Ahmadi等人 (2000)Seed and Plant 16(1):Pe127-Pe129,en14;Ahmadi等人 (2000)Introduction of rapeseed(Brassica napus L.),cultivar Esteghlal. Seed and Plant 16(1):Pe127-Pe126,en13;BaoMing等人(1999) Chinese Journal of Oil Crop Sciences 4:12-14;和Liu等人(1991)ScientiaAgricultura Sinica 24(3):43-49),然而耐受性的水平是低的,并且这些 品种不能耐受高的病害压力。最近,已培育了携带草酸氧化酶基因的转基因 卡诺拉(美国专利6,166,291及其分案专利),然而存在与转基因植物相关 的监管和社会问题。需要显著的技术上的人工干预来培育抗核盘菌属的卡诺 拉品种。

更加最近,在长期的和高强度的育种程序之后,培育了对核盘菌属具 有高水平的抗性的芸苔属和卡诺拉品种(参见,例如,WO 2006/135717, 其全部教导内容以引用方式并入本文)。该方法是时间和劳动高度密集型 的,并且需要长的时间来确定育种程序是否成功。针对核盘菌属全植株大田 抗性的育种中的困难是(至少部分地)由于该性状的多基因性质。

本领域和产业上所需要的是利用分子标记物鉴定赋予对核盘菌属的全 植株大田抗性的基因的方法。然后,这些标记物能够被用于在分离群体中标 记这些基因的有利的等位基因,并且随后被用于使针对抗性的选择更加有 效。本发明提供了上述的以及其它的优势。

发明内容

本发明提供了鉴定植物中与对核盘菌属的全植株大田抗性或提高的全 植株大田抗性相关联的数量性状基因座(“QTL”)的方法和标记。

本发明的第一个方面的特征是鉴定表现出对核盘菌属的全植株大田抗 性或提高的全植株大田抗性的芸苔属植物或种质的方法。所述方法包括在所 述植物或种质中检测与所述对核盘菌属的全植株大田抗性或提高的全植株大 田抗性相关联的至少一个数量性状基因座(QTL)的至少一个等位基因,其 中所述QTL被定位至选自N1、N3、N4、N7、N8、N9、N10、N11、 N12、N13、N15、N18或N19的连锁群,其中每个连锁群包含以p≤0.01的 统计显著性与所述对核盘菌属的全植株大田抗性或提高的全植株大田抗性相 关联的至少一个标记,从而鉴定将表现出对核盘菌属的全植株大田抗性或提 高的全植株大田抗性的芸苔属植物或种质。

在一个实施例中,所述QTL被定位至选自下列的染色体区间:(a)在 连锁群N1上侧接并包含(i)标记CA0614和PE0177、或(ii)标记 AG0093和AG0482的区间;(b)在连锁群N3上侧接并包含标记CA0410 和AG0023的区间;(c)在连锁群N4上侧接并包含标记BG1442和 BG0106的区间;(d)在连锁群N7上侧接并包含标记AG0510和CA0105 的区间;(e)在连锁群N8上侧接并包含标记CA0837和BG1286的区间; (f)在连锁群N9上侧接并包含(i)标记CA1034和AG0441、或(ii)标 记AG0378和KK66的区间;(g)在连锁群N10上侧接并包含标记BG0228 和PE0131的区间;(h)在连锁群N11上侧接并包含(i)标记CA0120和 CA0163、或(ii)标记CA0120和CA1097的区间;(i)在连锁群N12上侧 接并包含(i)标记BG1321和CA0991、或(ii)标记CA0753和PE0250的 区间;(j)在连锁群N13上侧接并包含标记CA0603和CA0736的区间; (k)在连锁群N15上侧接并包含标记PE0286和AG0369的区间;(l)在 连锁群N18上侧接并包含(i)标记BG0278和CA0636、或(ii)标记 UB0315和CA0739的区间;和(m)在连锁群N19上侧接并包含(i)标记 CA1107和CA0221、或(ii)标记UB0307和KK98G的区间。

在另一个实施例中,所述QTL被定位至选自下列的染色体区间:(a) 在连锁群N1上的一个或多个区间,其侧接并包含标记(i)AG0093和 PE0203、或(ii)BG0111和BG1392、或(iii)BG1090和AG0482、或 (iv)BG1090和PE0203、或(v)CA0614和BG1392、或(vi)BG0988和 AG0482、或(vii)AG0243和AG0482、或(viii)AG0243和BG1453、或 BG0988;(b)在连锁群N3上的一个或多个区间,其侧接并包含标记(i) BG1197和AG0023、或(ii)CA0410和BG1368、或(iii)CA0410和 BG1197;(c)在连锁群N4上的一个或多个区间,其侧接并包含标记(i) BG1442和BG0106、或(ii)UB0181和BG0106;(d)在连锁群N8上的 一个或多个区间,其侧接并包含标记(i)BG1449和BG1062、或(ii) CA0837和AG0328、或(iii)CA0837和BG1062、或(iv)CA0837和 BG1101、或(v)CA0837和BG1286、或(vi)CA0837和BG1449、或 (vii)PE0281和BG0647;(e)在连锁群N9上的一个或多个区间,其侧 接并包含标记(i)AG0323和BG0295、或(ii)CA1034和AG0378、或 (iii)BG1123和AG0441;(f)在连锁群N10上的一个或多个区间,其侧 接并包含标记(i)BG0228和AG0047、或BG0255和PE0131;(g)在连 锁群N11上的一个或多个区间,其侧接并包含标记(i)BG0031和 BG1149、或(ii)BG0031和BG1230、或(iii)BG0031和BG1513、或 (iv)CA0120和CA0328、或(v)PE0283和CA0163、或(vi)PE0324和 PE0283、或(vii)CA0328和PE0324、或(viii)CA0226和BG0713、或 (ix)CA0233和CA1080、或(x)CA0233和AG0370;(h)在连锁群 N12上的一个或多个区间,其侧接并包含标记(i)BG1321和CA0991、或 (ii)BG1321和CA1027、或(iii)BG1321和PE0133、或(iv)PE0063和 CA0991、或(v)PE0133和CA0991、或(vi)CA1027和PE0063、或 (vii)CA1027和UB0331、或(viii)CA0423和PE0250、或(ix)AG0359 和PE0250、或(x)AG0359和CA0896;(i)在连锁群N13上的一个或多 个区间,其侧接并包含标记(i)BG0516和AG0148、或(ii)CA0488和 AG0148、或(iii)CA0488和CA0736、或(iv)CA0603和AG0504、或 (v)BG1288和AG0504;(j)在连锁群N15上的一个或多个区间,其侧 接并包含标记(i)CA0719和AG0369、或(ii)PE0091和PE0187、或 (iii)PE0286和AG0369、或(iv)PE0286和PE0187、或(v)PE0286和 CA0719;(k)在连锁群N18上的一个或多个区间,其侧接并包含标记 (i)AG0285和CA0636、或(ii)BG0278和CA07739、或(iii)CA0739 和CA0636、或(iv)UB0315和CA0636、或(v)UB0315和CA0739;和 (l)在连锁群N19上的一个或多个区间,其侧接并包含标记(i)CA0552 和CA0221、或(ii)CA1107和CA0552、或(iii)CA1107和CA0221、或 (iv)CA0221和KK98G、或(v)UB0307和BG1241、或(vi)BG1241和 KK98G、或(vii)CA0221和BG1241。

在一个具体实施例中,所述QTL被定位至在连锁群N1、N9、N11、 N12、N18或N19上的染色体区间。

在其它实施例中,所述标记包含多态性,所述多态性将所述至少一个 数量性状基因座(QTL)的至少一个等位基因鉴定为与所述对核盘菌属的全 植株大田抗性或提高的全植株大田抗性相关联,并且所述检测包括鉴定所述 多态性。多态性可以是,例如,单核苷酸多态性(SNP)或简单重复序列 (SSR)。在本发明的方法的另一个实施例中,所述检测包括检测包含所述 多态性的至少一个标记,所述标记选自:AG0023;AG0045;AG0047; AG0070;AG0086;AG0093;AG0125;AG0148;AG0171;AG0203; AG0239;AG0243;AG0272;AG0304;AG0323;AG0324;AG0328; AG0359;AG0369;AG0370;AG0378;AG0391;AG0410;AG0441; AG0477;AG0482;AG0504;AG0510;BG0031;BG0106;BG0111; BG0119;BG0181;BG0228;BG0255;BG0278;BG0295;BG0452; BG0516;BG0647;BG0651;BG0713;BG0864;BG0869;BG0988; BG1062;BG1090;BG1101;BG1123;BG1127;BG1149;BG1182; BG1197;BG1230;BG1241;BG1244;BG1286;BG1288;BG1321; BG1368;BG1392;BG1442;BG1449;BG1453;BG1513;CA0105; CA0120;CA0163;CA0221;CA0226;CA0233;CA0328;CA0410; CA0423;CA0456;CA0488;CA0546;CA0552;CA0603;CA0614; CA0636;CA0681;CA0719;CA0736;CA0739;CA0753;CA0834; CA0837;CA0896;CA0991;CA1027;CA1032;CA1034;CA1035; CA1066;CA1080;CA1090;CA1097;CA1107;PE0012;PE0017; PE0063;PE0091;PE0131;PE0133;PE0177;PE0187;PE0203; PE0250;PE0281;PE0283;PE0286;PE0324;PE0340;PE0355; UB0015;UB0126;UB0163;UB0181;UB0196;UB0307;UB0315; UB0331;KK66;和KK98G。

在本发明的方法的另一个实施例中,所述检测包括检测至少一个标记 中的所述多态性,所述标记选自:AG0093;AG0304;AG0378;AG0391; AG0482;BG1149;BG1230;BG1241;BG1453;BG1513;CA0120; CA0221;CA0546;CA0739;CA1027;PE0063;PE0203;UB0163;和 UB0315。

在其它实施例中,所述方法包括检测位于两个或更多个不同连锁群的 两个或更多个标记、位于三个或更多个不同连锁群的三个或更多个标记、位 于四个或更多个不同连锁群的四个或更多个标记、位于五个或更多个不同连 锁群的五个或更多个标记、位于六个或更多个不同连锁群的六个或更多个标 记、位于七个或更多个不同连锁群的七个或更多个标记、位于八个或更多个 不同连锁群的八个或更多个标记、位于九个或更多个不同连锁群的九个或更 多个标记、位于十个或更多个不同连锁群的十个或更多个标记、位于十一个 或更多个不同连锁群的十一个或更多个标记、或位于十二个或更多个不同连 锁群的十二个或更多个标记。

在其它实施例中,在所述方法中,所述检测包括从所述植物或种质的 基因组DNA扩增所述标记,以及确定所述标记是否包含与所述对核盘菌属 的全植株大田抗性或提高的全植株大田抗性相关联的多态性。在其它实施例 中,所述植物是甘蓝型油菜(Brassica napus);芥菜(Brassica juncea); 芜菁(Brassica rapa);甘蓝(Brassica oleracea);或埃塞俄比亚芥 (Brassica carinata)。在其它实施例中,所述植物是春性卡诺拉、冬性卡 诺拉、或半冬性卡诺拉。在另一个实施例中,所述全植株大田抗性或提高的 全植株大田抗性是由于与缺少所述QTL的等位基因的植物相比降低的病害 发生率,所述QTL的等位基因与所述全植株大田抗性或提高的全植株大田 抗性相关联。在另一个实施例中,所述全植株大田抗性或提高的全植株大田 抗性是由于与缺少所述QTL的等位基因的植物相比降低的病害严重程度, 所述QTL的等位基因与所述全植株大田抗性或提高的全植株大田抗性相关 联。在另一个实施例中,所述植物具有对核盘菌的全植株大田抗性或提高的 全植株大田抗性。

本发明另一个方面的特征是通过将根据上文所述方法鉴定的植物或子 代与第二植物异花授粉使核盘菌属抗性渗入第二植物中的方法,其中所述第 二植物缺少在所鉴定的植物中检测到的至少一个QTL的至少一个等位基 因。

在另一个方面,本发明的特征是制备F1杂交体种子的方法,其中来源 于所述F1杂交体种子的F1杂交体植物是抗核盘菌属的,所述方法包括将根 据上文所述方法鉴定的植物或子代与第二植物异花授粉,其中所述第二植物 缺少在所鉴定的植物中检测到的至少一个QTL的至少一个等位基因。

在另一个方面,本发明的特征是定位克隆包含与核盘菌属全植株大田 抗性或提高的全植株大田抗性相关联的数量性状基因座(QTL)的核酸的方 法,所述方法包括:提供来自包含标记的植物的核酸,所述标记以p≤0.01 的统计显著性与核盘菌属全植株大田抗性或提高的全植株大田抗性相关联, 其中所述QTL被定位至选自N1、N3、N4、N7、N8、N9、N10、N11、 N12、N13、N15、N18或N19的连锁群,并且其中所述连锁群包含所述标 记;以及克隆包含与核盘菌属全植株大田抗性或提高的全植株大田抗性相关 联的数量性状基因座(QTL)的核酸。(a)在连锁群N1上侧接并包含 (i)标记CA0614和PE0177、或(ii)标记AG0093和AG0482的区间; (b)在连锁群N3上侧接并包含标记CA0410和AG0023的区间;(c)在 连锁群N4上侧接并包含标记BG1442和BG0106的区间;(d)在连锁群 N7上侧接并包含标记AG0510和CA0105的区间;(e)在连锁群N8上侧 接并包含标记CA0837和BG1286的区间;(f)在连锁群N9上侧接并包含 (i)标记CA1034和AG0441、或(ii)标记AG0378和KK66的区间; (g)在连锁群N10上侧接并包含标记BG0228和PE0131的区间;(h)在 连锁群N11上侧接并包含(i)标记CA0120和CA0163、或(ii)标记 CA0120和CA1097的区间;(i)在连锁群N12上侧接并包含(i)标记 BG1321和CA0991、或(ii)标记CA0753和PE0250的区间;(j)在连锁 群N13上侧接并包含标记CA0603和CA0736的区间;(k)在连锁群N15 上侧接并包含标记PE0286和AG0369的区间;(l)在连锁群N18上侧接并 包含(i)标记BG0278和CA0636、或(ii)标记UB0315和CA0739的区 间;和(m)在连锁群N19上侧接并包含(i)标记CA1107和CA0221、或 (ii)标记UB0307和KK98G的区间。

在另一个实施例中,所述QTL被定位至选自下列的染色体区间:(a) 在连锁群N1上的一个或多个区间,其侧接并包含标记(i)AG0093和 PE0203、或(ii)BG0111和BG1392、或(iii)BG1090和AG0482、或 (iv)BG1090和PE0203、或(v)CA0614和BG1392、或(vi)BG0988和 AG0482、或(vii)AG0243和AG0482、或(viii)AG0243和BG1453、或 BG0988;(b)在连锁群N3上的一个或多个区间,其侧接并包含标记(i) BG1197和AG0023、或(ii)CA0410和BG1368、或(iii)CA0410和 BG1197;(c)在连锁群N4上的一个或多个区间,其侧接并包含标记(i) BG1442和BG0106、或(ii)UB0181和BG0106;(d)在连锁群N8上的 一个或多个区间,其侧接并包含标记(i)BG1449和BG1062、或(ii) CA0837和AG0328、或(iii)CA0837和BG1062、或(iv)CA0837和 BG1101、或(v)CA0837和BG1286、或(vi)CA0837和BG1449、或 (vii)PE0281和BG0647;(e)在连锁群N9上的一个或多个区间,其侧 接并包含标记(i)AG0323和BG0295、或(ii)CA1034和AG0378、或 (iii)BG1123和AG0441;(f)在连锁群N10上的一个或多个区间,其侧 接并包含标记(i)BG0228和AG0047、或BG0255和PE0131;(g)在连 锁群N11上的一个或多个区间,其侧接并包含标记(i)BG0031和 BG1149、或(ii)BG0031和BG1230、或(iii)BG0031和BG1513、或 (iv)CA0120和CA0328、或(v)PE0283和CA0163、或(vi)PE0324和 PE0283、或(vii)CA0328和PE0324、或(viii)CA0226和BG0713、或 (ix)CA0233和CA1080、或(x)CA0233和AG0370;(h)在连锁群 N12上的一个或多个区间,其侧接并包含标记(i)BG1321和CA0991、或 (ii)BG1321和CA1027、或(iii)BG1321和PE0133、或(iv)PE0063和 CA0991、或(v)PE0133和CA0991、或(vi)CA1027和PE0063、或 (vii)CA1027和UB0331、或(viii)CA0423和PE0250、或(ix)AG0359 和PE0250、或(x)AG0359和CA0896;(i)在连锁群N13上的一个或多 个区间,其侧接并包含标记(i)BG0516和AG0148、或(ii)CA0488和 AG0148、或(iii)CA0488和CA0736、或(iv)CA0603和AG0504、或 (v)BG1288和AG0504;(j)在连锁群N15上的一个或多个区间,其侧 接并包含标记(i)CA0719和AG0369、或(ii)PE0091和PE0187、或 (iii)PE0286和AG0369、或(iv)PE0286和PE0187、或(v)PE0286和 CA0719;(k)在连锁群N18上的一个或多个区间,其侧接并包含标记 (i)AG0285和CA0636、或(ii)BG0278和CA07739、或(iii)CA0739 和CA0636、或(iv)UB0315和CA0636、或(v)UB0315和CA0739;和 (l)在连锁群N19上的一个或多个区间,其侧接并包含标记(i)CA0552 和CA0221、或(ii)CA1107和CA0552、或(iii)CA1107和CA0221、或 (iv)CA0221和KK98G、或(v)UB0307和BG1241、或(vi)BG1241和 KK98G、或(vii)CA0221和BG1241。

在一个具体实施例中,所述QTL被定位至在连锁群N1、N9、N11、 N12、N18或N19上的染色体区间。

在其它实施例中,所述标记包含多态性,所述多态性将所述至少一个 数量性状基因座(QTL)的至少一个等位基因鉴定为与所述对核盘菌属的全 植株大田抗性或提高的全植株大田抗性相关联,并且所述检测包括鉴定所述 多态性。多态性可以是,例如,单核苷酸多态性(SNP)或简单重复序列 (SSR)。在本发明的方法的另一个实施例中,所述检测包括检测至少一个 标记,所述标记选自:AG0023;AG0045;AG0047;AG0070;AG0086; AG0093;AG0125;AG0148;AG0171;AG0203;AG0239;AG0243; AG0272;AG0304;AG0323;AG0324;AG0328;AG0359;AG0369; AG0370;AG0378;AG0391;AG0410;AG0441;AG0477;AG0482; AG0504;AG0510;BG0031;BG0106;BG0111;BG0119;BG0181; BG0228;BG0255;BG0278;BG0295;BG0452;BG0516;BG0647; BG0651;BG0713;BG0864;BG0869;BG0988;BG1062;BG1090; BG1101;BG1123;BG1127;BG1149;BG1182;BG1197;BG1230; BG1241;BG1244;BG1286;BG1288;BG1321;BG1368;BG1392; BG1442;BG1449;BG1453;BG1513;CA0105;CA0120;CA0163; CA0221;CA0226;CA0233;CA0328;CA0410;CA0423;CA0456; CA0488;CA0546;CA0552;CA0603;CA0614;CA0636;CA0681; CA0719;CA0736;CA0739;CA0753;CA0834;CA0837;CA0896; CA0991;CA1027;CA1032;CA1034;CA1035;CA1066;CA1080; CA1090;CA1097;CA1107;PE0012;PE0017;PE0063;PE0091; PE0131;PE0133;PE0177;PE0187;PE0203;PE0250;PE0281; PE0283;PE0286;PE0324;PE0340;PE0355;UB0015;UB0126; UB0163;UB0181;UB0196;UB0307;UB0315;UB0331;KK66;和 KK98G。

在本发明的方法的另一个实施例中,所述检测包括检测至少一个标 记,所述标记选自:AG0093;AG0304;AG0378;AG0391;AG0482; BG1149;BG1230;BG1241;BG1453;BG1513;CA0120;CA0221; CA0546;CA0739;CA1027;PE0063;PE0203;UB0163;和UB0315。

在其它实施例中,所述植物是全植株、植物器官、植物种子或植物细 胞。在其它实施例中,所述植物是卡诺拉。所述植物可以是,例如,甘蓝型 油菜(Brassica napus)、芥菜(Brassica juncea)、芜菁(Brassica  rapa)、甘蓝(Brassica oleracea)、或埃塞俄比亚芥(Brassica  carinata)。所述植物可以是,例如,春性卡诺拉、冬性卡诺拉、或半冬性 卡诺拉。在另一个实施例中,所述核盘菌属全植株大田抗性植物是抗核盘菌 的。

在另一个方面,本发明的特征是制备包含与核盘菌属全植株大田抗性 或提高的全植株大田抗性相关联的数量性状基因座(QTL)的转基因双子叶 植物的方法,所述方法包括以下步骤:将根据上文所述的方法克隆的核酸导 入双子叶植物细胞中;以及使所述细胞在细胞生长条件下生长。在一个实施 例中,所述QTL被定位至选自下列的染色体区间:(a)在连锁群N1上侧 接并包含(i)标记CA0614和PE0177、或(ii)标记AG0093和AG0482的 区间;(b)在连锁群N3上侧接并包含标记CA0410和AG0023的区间; (c)在连锁群N4上侧接并包含标记BG1442和BG0106的区间;(d)在 连锁群N7上侧接并包含标记AG0510和CA0105的区间;(e)在连锁群 N8上侧接并包含标记CA0837和BG1286的区间;(f)在连锁群N9上侧接 并包含(i)标记CA1034和AG0441、或(ii)标记AG0378和KK66的区 间;(g)在连锁群N10上侧接并包含标记BG0228和PE0131的区间; (h)在连锁群N11上侧接并包含(i)标记CA0120和CA0163、或(ii)标 记CA0120和CA1097的区间;(i)在连锁群N12上侧接并包含(i)标记 BG1321和CA0991、或(ii)标记CA0753和PE0250的区间;(j)在连锁 群N13上侧接并包含标记CA0603和CA0736的区间;(k)在连锁群N15 上侧接并包含标记PE0286和AG0369的区间;(l)在连锁群N18上侧接并 包含(i)标记BG0278和CA0636、或(ii)标记UB0315和CA0739的区 间;和(m)在连锁群N19上侧接并包含(i)标记CA1107和CA0221、或 (ii)标记UB0307和KK98G的区间。

在另一个实施例中,所述QTL被定位至选自下列的染色体区间:(a) 在连锁群N1上的一个或多个区间,其侧接并包含标记(i)AG0093和 PE0203、或(ii)BG0111和BG1392、或(iii)BG1090和AG0482、或 (iv)BG1090和PE0203、或(v)CA0614和BG1392、或(vi)BG0988和 AG0482、或(vii)AG0243和AG0482、或(viii)AG0243和BG1453、或 BG0988;(b)在连锁群N3上的一个或多个区间,其侧接并包含标记(i) BG1197和AG0023、或(ii)CA0410和BG1368、或(iii)CA0410和 BG1197;(c)在连锁群N4上的一个或多个区间,其侧接并包含标记(i) BG1442和BG0106、或(ii)UB0181和BG0106;(d)在连锁群N8上的 一个或多个区间,其侧接并包含标记(i)BG1449和BG1062、或(ii) CA0837和AG0328、或(iii)CA0837和BG1062、或(iv)CA0837和 BG1101、或(v)CA0837和BG1286、或(vi)CA0837和BG1449、或 (vii)PE0281和BG0647;(e)在连锁群N9上的一个或多个区间,其侧 接并包含标记(i)AG0323和BG0295、或(ii)CA1034和AG0378、或 (iii)BG1123和AG0441;(f)在连锁群N10上的一个或多个区间,其侧 接并包含标记(i)BG0228和AG0047、或BG0255和PE0131;(g)在连 锁群N11上的一个或多个区间,其侧接并包含标记(i)BG0031和 BG1149、或(ii)BG0031和BG1230、或(iii)BG0031和BG1513、或 (iv)CA0120和CA0328、或(v)PE0283和CA0163、或(vi)PE0324和 PE0283、或(vii)CA0328和PE0324、或(viii)CA0226和BG0713、或 (ix)CA0233和CA1080、或(x)CA0233和AG0370;(h)在连锁群 N12上的一个或多个区间,其侧接并包含标记(i)BG1321和CA0991、或 (ii)BG1321和CA1027、或(iii)BG1321和PE0133、或(iv)PE0063和 CA0991、或(v)PE0133和CA0991、或(vi)CA1027和PE0063、或 (vii)CA1027和UB0331、或(viii)CA0423和PE0250、或(ix)AG0359 和PE0250、或(x)AG0359和CA0896;(i)在连锁群N13上的一个或多 个区间,其侧接并包含标记(i)BG0516和AG0148、或(ii)CA0488和 AG0148、或(iii)CA0488和CA0736、或(iv)CA0603和AG0504、或 (v)BG1288和AG0504;(j)在连锁群N15上的一个或多个区间,其侧 接并包含标记(i)CA0719和AG0369、或(ii)PE0091和PE0187、或 (iii)PE0286和AG0369、或(iv)PE0286和PE0187、或(v)PE0286和 CA0719;(k)在连锁群N18上的一个或多个区间,其侧接并包含标记 (i)AG0285和CA0636、或(ii)BG0278和CA07739、或(iii)CA0739 和CA0636、或(iv)UB0315和CA0636、或(v)UB0315和CA0739;和 (l)在连锁群N19上的一个或多个区间,其侧接并包含标记(i)CA0552 和CA0221、或(ii)CA1107和CA0552、或(iii)CA1107和CA0221、或 (iv)CA0221和KK98G、或(v)UB0307和BG1241、或(vi)BG1241和 KK98G、或(vii)CA0221和BG1241。

在一个具体实施例中,所述QTL被定位至在连锁群N1、N9、N11、 N12、N18或N19上的染色体区间。

在其它实施例中,所述标记包含多态性,所述多态性将所述至少一个 数量性状基因座(QTL)的至少一个等位基因鉴定为与所述对核盘菌属的全 植株大田抗性或提高的全植株大田抗性相关联,并且所述检测包括鉴定所述 多态性。多态性可以是,例如,单核苷酸多态性(SNP)或简单重复序列 (SSR)。在本发明的方法的另一个实施例中,所述检测包括检测至少一个 标记,所述标记选自:AG0023;AG0045;AG0047;AG0070;AG0086; AG0093;AG0125;AG0148;AG0171;AG0203;AG0239;AG0243; AG0272;AG0304;AG0323;AG0324;AG0328;AG0359;AG0369; AG0370;AG0378;AG0391;AG0410;AG0441;AG0477;AG0482; AG0504;AG0510;BG0031;BG0106;BG0111;BG0119;BG0181; BG0228;BG0255;BG0278;BG0295;BG0452;BG0516;BG0647; BG0651;BG0713;BG0864;BG0869;BG0988;BG1062;BG1090; BG1101;BG1123;BG1127;BG1149;BG1182;BG1197;BG1230; BG1241;BG1244;BG1286;BG1288;BG1321;BG1368;BG1392; BG1442;BG1449;BG1453;BG1513;CA0105;CA0120;CA0163; CA0221;CA0226;CA0233;CA0328;CA0410;CA0423;CA0456; CA0488;CA0546;CA0552;CA0603;CA0614;CA0636;CA0681; CA0719;CA0736;CA0739;CA0753;CA0834;CA0837;CA0896; CA0991;CA1027;CA1032;CA1034;CA1035;CA1066;CA1080; CA1090;CA1097;CA1107;PE0012;PE0017;PE0063;PE0091; PE0131;PE0133;PE0177;PE0187;PE0203;PE0250;PE0281; PE0283;PE0286;PE0324;PE0340;PE0355;UB0015;UB0126; UB0163;UB0181;UB0196;UB0307;UB0315;UB0331;KK66;和 KK98G。

在另一个实施例中,所述检测包括检测至少一个标记,所述标记选 自:AG0093;AG0304;AG0378;AG0391;AG0482;BG1149;BG1230; BG1241;BG1453;BG1513;CA0120;CA0221;CA0546;CA0739; CA1027;PE0063;PE0203;UB0163;和UB0315。

在另一个实施例中,所述双子叶植物细胞被再生,以形成第一植物。 在另一个实施例中,所述第一植物与相同物种的第二植物杂交。在另一个实 施例中,所述双子叶植物是大豆、向日葵、卡诺拉、或苜蓿。在另一个实施 例中,所述双子叶植物是卡诺拉,例如,春性卡诺拉、冬性卡诺拉、或半冬 性卡诺拉。在另一个实施例中,所述双子叶植物是甘蓝型油菜(Brassica  napus)、芥菜(Brassica juncea)、芜菁(Brassica rapa)、或甘蓝 (Brassica oleracea)。在另一个实施例中,所述核盘菌属全植株大田抗性 植物是抗核盘菌的。在其它实施例中,所述全植株大田抗性是由于与缺少所 述QTL的双子叶植物相比降低的病害发生率或降低的病害严重程度。

本发明的另一个方面的特征是鉴定包含与核盘菌属全植株大田抗性相 关联的QTL的来自双子叶植物的候选核酸的方法,所述方法包括:提供根 据上文所述的方法克隆的核酸;以及鉴定双子叶植物中所述核酸的同源物。

本发明的另一个方面的特征是标记辅助选择(MAS)与对核盘菌属的 全植株大田抗性相关联的数量性状基因座(QTL)的方法,所述方法包括以 下步骤:获得第一芸苔属植物,所述第一芸苔属植物具有标记基因座的至少 一个等位基因,其中所述标记基因座以p≤0.01的统计显著性与对核盘菌属 的全植株大田抗性或提高的全植株大田抗性相关联;将所述第一芸苔属植物 与第二芸苔属植物杂交;至少针对所述等位基因评估子代;以及选择至少具 有所述等位基因的子代植物。在一个实施例中,所述植物是分离群体的成 员。在另一个实施例中,所述标记辅助选择是通过高通量筛选进行的。

本发明的另一个方面的特征是通过上文的方法鉴定的芸苔属植物、和 其子代,包括F1、F2和F3子代。

本发明的另一个方面的特征是分离的或重组的核酸,其包含选自下列 的多核苷酸:选自任何一个下列标记序列的序列:AG0023(SEQ ID NO: 1);AG0045(SEQ ID NO:2);AG0047(SEQ ID NO:3);AG0070 (SEQ ID NO:4);AG0086(SEQ ID NO:5);AG0093(SEQ ID NO: 6);AG0125(SEQ ID NO:7);AG0148(SEQ ID NO:8);AG0171 (SEQ ID NO:9);AG0203(SEQ ID NO:10);AG0239(SEQ ID NO: 11);AG0243(SEQ ID NO:12);AG0272(SEQ ID NO:13);AG0304 (SEQ ID NO:14);AG0323(SEQ ID NO:15);AG0324(SEQ ID NO: 16);AG0328(SEQ ID NO:17);AG0359(SEQ ID NO:18);AG0369 (SEQ ID NO:19);AG0370(SEQ ID NO:20);AG0378(SEQ ID NO: 21);AG0391(SEQ ID NO:22);AG0410(SEQ ID NO:23);AG0441 (SEQ ID NO:24);AG0477(SEQ ID NO:25);AG0482(SEQ ID NO: 26);AG0504(SEQ ID NO:27);AG0510(SEQ ID NO:28);BG0031 (SEQ ID NO:29);BG0106(SEQ ID NO:30);BG0111(SEQ ID NO: 31);BG0119(SEQ ID NO:32);BG0181(SEQ ID NO:33);BG0228 (SEQ ID NO:34);BG0255(SEQ ID NO:35);BG0278(SEQ ID NO: 36);BG0295(SEQ ID NO:37);BG0452(SEQ ID NO:38);BG0516 (SEQ ID NO:39);BG0647(SEQ ID NO:40);BG0651(SEQ ID NO: 41);BG0713(SEQ ID NO:42);BG0864(SEQ ID NO:43);BG0869 (SEQ ID NO:44);BG0988(SEQ ID NO:45);BG1062(SEQ ID NO: 46);BG1090(SEQ ID NO:47);BG1101(SEQ ID NO:48);BG1123 (SEQ ID NO:49);BG1127(SEQ ID NO:50);BG1149(SEQ ID NO: 51);BG1182(SEQ ID NO:52);BG1197(SEQ ID NO:53);BG1230 (SEQ ID NO:54);BG1241(SEQ ID NO:55);BG1244(SEQ ID NO: 56);BG1286(SEQ ID NO:57);BG1288(SEQ ID NO:58);BG1321 (SEQ ID NO:59);BG1368(SEQ ID NO:60);BG1392(SEQ ID NO: 61);BG1442(SEQ ID NO:62);BG1449(SEQ ID NO:63);BG1453 (SEQ ID NO:64);BG1513(SEQ ID NO:65);CA0105(SEQ ID NO: 66);CA0120(SEQ ID NO:67);CA0163(SEQ ID NO:68);CA0221 (SEQ ID NO:69);CA0226(SEQ ID NO:70);CA0233(SEQ ID NO: 71);CA0328(SEQ ID NO:72);CA0410(SEQ ID NO:73);CA0423 (SEQ ID NO:74);CA0456(SEQ ID NO:75);CA0488(SEQ ID NO: 76);CA0546(SEQ ID NO:77);CA0552(SEQ ID NO:78);CA0603 (SEQ ID NO:79);CA0614(SEQ ID NO:80);CA0636(SEQ ID NO: 81);CA0681(SEQ ID NO:82);CA0719(SEQ ID NO:83);CA0736 (SEQ ID NO:84);CA0739(SEQ ID NO:85);CA0753(SEQ ID NO: 86);CA0834(SEQ ID NO:87);CA0837(SEQ ID NO:88);CA0896 (SEQ ID NO:89);CA0991(SEQ ID NO:90);CA1027(SEQ ID NO: 91);CA1032(SEQ ID NO:92);CA1034(SEQ ID NO:93);CA1035 (SEQ ID NO:94);CA1066(SEQ ID NO:95);CA1080(SEQ ID NO: 96);CA1090(SEQ ID NO:97);CA1097(SEQ ID NO:98);或 CA1107(SEQ ID NO:99);(b)与(a)的多核苷酸具有至少70%、 71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、 82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、 93%、94%、95%、96%、97%、98%、99%或100%的序列同一性的多核苷 酸序列;和(c)与(a)或(b)的多核苷酸序列互补的多核苷酸序列。在 一个实施例中,所述分离的或重组的核酸与对核盘菌属的全植株大田抗性相 关联。

在另一个实施例中,所述分离的或重组的核酸包含选自下列的多核苷 酸:(a)选自任何一个下列标记序列的序列:AG0093(SEQ ID NO:6); AG0304(SEQ ID NO:14);AG0378(SEQ ID NO:21);AG0391(SEQ  ID NO:22);AG0482(SEQ ID NO:26);BG1149(SEQ ID NO:51); BG1230(SEQ ID NO:54);BG1241(SEQ ID NO:55);BG1453(SEQ  ID NO:64);BG1513(SEQ ID NO:65);(SEQ ID NO:67);CA0221 (SEQ ID NO:69);CA0546(SEQ ID NO:77);CA0739(SEQ ID NO: 85);或CA1027(SEQ ID NO:91);(b)与(a)的多核苷酸具有至少 70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、 81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、 92%、93%、94%、95%、96%、97%、98%、99%或100%的序列同一性的 多核苷酸序列;和(c)与(a)或(b)的多核苷酸序列互补的多核苷酸序 列。

本发明的另一个方面的特征是用于检测植物DNA中与对核盘菌属的全 植株大田抗性或提高的全植株大田抗性相关联的多态性的分离的核酸分子, 其中所述核酸分子包含至少15个核苷酸,并且与所述多态性所位于区域中 的植物DNA的任一链中相同数量的连续核苷酸的序列是相同的,其中所述 核酸分子包含与选自下列标记的标记序列或标记序列的片段至少70%、 71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、 82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、 93%、94%、95%、96%、97%、98%、99%或100%相同的序列:AG0023 (SEQ ID NO:1);AG0045(SEQ ID NO:2);AG0047(SEQ ID NO: 3);AG0070(SEQ ID NO:4);AG0086(SEQ ID NO:5);AG0093 (SEQ ID NO:6);AG0125(SEQ ID NO:7);AG0148(SEQ ID NO: 8);AG0171(SEQ ID NO:9);AG0203(SEQ ID NO:10);AG0239 (SEQ ID NO:11);AG0243(SEQ ID NO:12);AG0272(SEQ ID NO: 13);AG0304(SEQ ID NO:14);AG0323(SEQ ID NO:15);AG0324 (SEQ ID NO:16);AG0328(SEQ ID NO:17);AG0359(SEQ ID NO: 18);AG0369(SEQ ID NO:19);AG0370(SEQ ID NO:20);AG0378 (SEQ ID NO:21);AG0391(SEQ ID NO:22);AG0410(SEQ ID NO: 23);AG0441(SEQ ID NO:24);AG0477(SEQ ID NO:25);AG0482 (SEQ ID NO:26);AG0504(SEQ ID NO:27);AG0510(SEQ ID NO: 28);BG0031(SEQ ID NO:29);BG0106(SEQ ID NO:30);BG0111 (SEQ ID NO:31);BG0119(SEQ ID NO:32);BG0181(SEQ ID NO: 33);BG0228(SEQ ID NO:34);BG0255(SEQ ID NO:35);BG0278 (SEQ ID NO:36);BG0295(SEQ ID NO:37);BG0452(SEQ ID NO: 38);BG0516(SEQ ID NO:39);BG0647(SEQ ID NO:40);BG0651 (SEQ ID NO:41);BG0713(SEQ ID NO:42);BG0864(SEQ ID NO: 43);BG0869(SEQ ID NO:44);BG0988(SEQ ID NO:45);BG1062 (SEQ ID NO:46);BG1090(SEQ ID NO:47);BG1101(SEQ ID NO: 48);BG1123(SEQ ID NO:49);BG1127(SEQ ID NO:50);BG1149 (SEQ ID NO:51);BG1182(SEQ ID NO:52);BG1197(SEQ ID NO: 53);BG1230(SEQ ID NO:54);BG1241(SEQ ID NO:55);BG1244 (SEQ ID NO:56);BG1286(SEQ ID NO:57);BG1288(SEQ ID NO: 58);BG1321(SEQ ID NO:59);BG1368(SEQ ID NO:60);BG1392 (SEQ ID NO:61);BG1442(SEQ ID NO:62);BG1449(SEQ ID NO: 63);BG1453(SEQ ID NO:64);BG1513(SEQ ID NO:65);CA0105 (SEQ ID NO:66);CA0120(SEQ ID NO:67);CA0163(SEQ ID NO: 68);CA0221(SEQ ID NO:69);CA0226(SEQ ID NO:70);CA0233 (SEQ ID NO:71);CA0328(SEQ ID NO:72);CA0410(SEQ ID NO: 73);CA0423(SEQ ID NO:74);CA0456(SEQ ID NO:75);CA0488 (SEQ ID NO:76);CA0546(SEQ ID NO:77);CA0552(SEQ ID NO: 78);CA0603(SEQ ID NO:79);CA0614(SEQ ID NO:80);CA0636 (SEQ ID NO:81);CA0681(SEQ ID NO:82);CA0719(SEQ ID NO: 83);CA0736(SEQ ID NO:84);CA0739(SEQ ID NO:85);CA0753 (SEQ ID NO:86);CA0834(SEQ ID NO:87);CA0837(SEQ ID NO: 88);CA0896(SEQ ID NO:89);CA0991(SEQ ID NO:90);CA1027 (SEQ ID NO:91);CA1032(SEQ ID NO:92);CA1034(SEQ ID NO: 93);CA1035(SEQ ID NO:94);CA1066(SEQ ID NO:95);CA1080 (SEQ ID NO:96);CA1090(SEQ ID NO:97);CA1097(SEQ ID NO: 98);或CA1107(SEQ ID NO:99)。在一个实施例中,所述核酸选自任 何的SEQ ID NO:126-323。

在另一个实施例中,所述标记序列是:AG0093(SEQ ID NO:6); AG0304(SEQ ID NO:14);AG0378(SEQ ID NO:21);AG0391(SEQ  ID NO:22);AG0482(SEQ ID NO:26);BG1149(SEQ ID NO:51); BG1230(SEQ ID NO:54);BG1241(SEQ ID NO:55);BG1453(SEQ  ID NO:64);BG1513(SEQ ID NO:65);(SEQ ID NO:67);CA0221 (SEQ ID NO:69);CA0546(SEQ ID NO:77);CA0739(SEQ ID NO: 85);或CA1027(SEQ ID NO:91)。在一个实施例中,所述核酸选自任 何的SEQ ID NO:136、137、152、153、166、167、168、169、176、177、 226、227、232、233、234、235、252、253、254、255、258、259、262、 263、278、279、294、295、306、或307。

本发明的另一个方面的特征是用于针对与对核盘菌属的全植株大田抗 性相关联的QTL筛选植物或种质的试剂盒,所述试剂盒包括容器,所述容 器中包含一种或多种如上文所述的权利要求的分离的核酸分子;和用于针对 与对核盘菌属的全植株大田抗性或提高的全植株大田抗性相关联QTL筛选 植物的说明书。

在一个实施例中,所述试剂盒还包括缓冲液。在另一个实施例中,所 述试剂盒是用于高通量筛选中的,并且包括至少一种用于此类用途的组分。 在另一个实施例中,所述试剂盒是用于整合体系中的高通量筛选中的。

在另一个方面,本发明的特征是表现出对核盘菌属的全植株大田抗性 或提高的全植株大田抗性的芸苔属植物,所述植物在至少1个QTL包含有 利于核盘菌属全植株大田抗性的等位基因,所述QTL被定位至选自下列的 染色体区间:(a)在连锁群N1上侧接并包含(i)标记CA0614和 PE0177、或(ii)标记AG0093和AG0482的区间;(b)在连锁群N3上侧 接并包含标记CA0410和AG0023的区间;(c)在连锁群N4上侧接并包含 标记BG1442和BG0106的区间;(d)在连锁群N7上侧接并包含标记 AG0510和CA0105的区间;(e)在连锁群N8上侧接并包含标记CA0837 和BG1286的区间;(f)在连锁群N9上侧接并包含(i)标记CA1034和 AG0441、或(ii)标记AG0378和KK66的区间;(g)在连锁群N10上侧 接并包含标记BG0228和PE0131的区间;(h)在连锁群N11上侧接并包 含(i)标记CA0120和CA0163、或(ii)标记CA0120和CA1097的区间; (i)在连锁群N12上侧接并包含(i)标记BG1321和CA0991、或(ii)标 记CA0753和PE0250的区间;(j)在连锁群N13上侧接并包含标记 CA0603和CA0736的区间;(k)在连锁群N15上侧接并包含标记PE0286 和AG0369的区间;(l)在连锁群N18上侧接并包含(i)标记BG0278和 CA0636、或(ii)标记UB0315和CA0739的区间;和(m)在连锁群N19 上侧接并包含(i)标记CA1107和CA0221、或(ii)标记UB0307和 KK98G的区间。

在另一个实施例中,所述QTL被定位至选自下列的染色体区间:(a) 在连锁群N1上的一个或多个区间,其侧接并包含标记(i)AG0093和 PE0203、或(ii)BG0111和BG1392、或(iii)BG1090和AG0482、或 (iv)BG1090和PE0203、或(v)CA0614和BG1392、或(vi)BG0988和 AG0482、或(vii)AG0243和AG0482、或(viii)AG0243和BG1453、或 BG0988;(b)在连锁群N3上的一个或多个区间,其侧接并包含标记(i) BG1197和AG0023、或(ii)CA0410和BG1368、或(iii)CA0410和 BG1197;(c)在连锁群N4上的一个或多个区间,其侧接并包含标记(i) BG1442和BG0106、或(ii)UB0181和BG0106;(d)在连锁群N8上的 一个或多个区间,其侧接并包含标记(i)BG1449和BG1062、或(ii) CA0837和AG0328、或(iii)CA0837和BG1062、或(iv)CA0837和 BG1101、或(v)CA0837和BG1286、或(vi)CA0837和BG1449、或 (vii)PE0281和BG0647;(e)在连锁群N9上的一个或多个区间,其侧 接并包含标记(i)AG0323和BG0295、或(ii)CA1034和AG0378、或 (iii)BG1123和AG0441;(f)在连锁群N10上的一个或多个区间,其侧 接并包含标记(i)BG0228和AG0047、或BG0255和PE0131;(g)在连 锁群N11上的一个或多个区间,其侧接并包含标记(i)BG0031和 BG1149、或(ii)BG0031和BG1230、或(iii)BG0031和BG1513、或 (iv)CA0120和CA0328、或(v)PE0283和CA0163、或(vi)PE0324和 PE0283、或(vii)CA0328和PE0324、或(viii)CA0226和BG0713、或 (ix)CA0233和CA1080、或(x)CA0233和AG0370;(h)在连锁群 N12上的一个或多个区间,其侧接并包含标记(i)BG1321和CA0991、或 (ii)BG1321和CA1027、或(iii)BG1321和PE0133、或(iv)PE0063和 CA0991、或(v)PE0133和CA0991、或(vi)CA1027和PE0063、或 (vii)CA1027和UB0331、或(viii)CA0423和PE0250、或(ix)AG0359 和PE0250、或(x)AG0359和CA0896;(i)在连锁群N13上的一个或多 个区间,其侧接并包含标记(i)BG0516和AG0148、或(ii)CA0488和 AG0148、或(iii)CA0488和CA0736、或(iv)CA0603和AG0504、或 (v)BG1288和AG0504;(j)在连锁群N15上的一个或多个区间,其侧 接并包含标记(i)CA0719和AG0369、或(ii)PE0091和PE0187、或 (iii)PE0286和AG0369、或(iv)PE0286和PE0187、或(v)PE0286和 CA0719;(k)在连锁群N18上的一个或多个区间,其侧接并包含标记 (i)AG0285和CA0636、或(ii)BG0278和CA07739、或(iii)CA0739 和CA0636、或(iv)UB0315和CA0636、或(v)UB0315和CA0739;和 (l)在连锁群N19上的一个或多个区间,其侧接并包含标记(i)CA0552 和CA0221、或(ii)CA1107和CA0552、或(iii)CA1107和CA0221、或 (iv)CA0221和KK98G、或(v)UB0307和BG1241、或(vi)BG1241和 KK98G、或(vii)CA0221和BG1241。

在一个具体实施例中,所述QTL被定位至在连锁群N1、N9、N11、 N12、N18或N19上的染色体区间。

本发明的其它特征和优点将通过下文的发明内容和例子被了解。

具体实施方式

综述

本发明涉及与核盘菌属全植株大田抗性相关的遗传标记(例如,标记 基因座和对应于(或来源于)这些的标记基因座的核酸,如对于对植物的基 因分型有用的探针和扩增产物)的鉴定。本发明的标记被用于鉴定对核盘菌 属抗性的或表现出提高的抗性的植物,尤其是甘蓝型油菜(Brassica napus (B.napus))(卡诺拉)物种的植物。因此,这些标记对于核盘菌属抗性 植物的标记辅助选择(MAS)和育种,以及对于易感植物的鉴定是有用 的。本发明的标记还被用于鉴定和限定邻近与核盘菌属全植株大田抗性相关 联的数量性状基因座的核酸和/或对应于或包括所述数量性状基因座的染色 体区间。与核盘菌属全植株大田抗性相关联的数量性状基因座(QTL),是 通过对由本文所述的一对标记限定的遗传区间、或由此类标记限定并且包括 此类标记的区间的子序列的核酸或邻近所述遗传区间或子序列的核酸的定位 克隆分离的。此类分离的QTL核酸能够被用于制备表现出对核盘菌属的提 高的抗性的转基因细胞和植物。此外,从一种生物(例如,卡诺拉)分离的 QTL核酸,能够转而用来从其它易感生物(包括多种商业上重要的双子叶 植物,例如大豆、苜蓿、向日葵、亚麻、豆类(例如,白豆)、马铃薯、豌 豆和花生)分离针对核盘菌属全植株大田抗性的QTL的同源物。

定义

单位、前缀、和符号以它们的国际单位制(SI)接受的形式表示。除 非另外说明,核酸是以5′到3′方向从左往右写;氨基酸序列分别是以氨基到 羧基方向从左往右写。本说明书中提及的数值范围包括限定该范围的数字, 并且包括在该限定范围内的每一个整数。核苷酸在本文中可以以IUPAC- IUBMB命名委员会推荐的它们的单字母符号表示。把说明书作为一个整体 时,下面定义的术语就定义得更全面。本说明书通篇提供的章节标题是为了 方便起见而提供,并不是对本发明的各种对象和实施例的限制。

术语“核盘菌属全植株大田抗性”或“对核盘菌属的全植株大田抗 性”,是指在大田条件下或在极端的病害压力大田研究条件下(如,例如本 文和WO 2006/135717中所述),植物对植物病原体核盘菌属的抗性。它反 映了全植株当在这些条件下暴露于核盘菌属时的抗性。在一个实施例中,基 于核盘菌发病严重度(SSDIS)量表,具有核盘菌属全植株大田抗性的植物 具有5.0或更高的病害发展评分。在其它实施例中,基于核盘菌发病严重度 (SSDIS)量表,具有核盘菌属全植株大田抗性的植物具有5.5、6.0、6.5、 7.0、7.5、8.0、8.5、9.0或更高的病害发展评分。病害发展的评分有时以范 围表示;例如以5-6、6-7、7-8、8-9的范围或以5-7、7-9等等的范围,或者 以整数之内的数值范围,例如,5.5-6.5、5.5-7.5、6-7.5、7-8.5。在这些例子 中,基于核盘菌发病严重度(SSDIS)量表,具有核盘菌属全植株大田抗性 的植物具有至少5-6、或6-7、或7-8、或8-9范围的病害发展评分。

技术人员将知道,植物所具有的对于核盘菌属全植株大田抗性有利的 等位基因的数量(或百分比)越高,所表现出的抗性水平将越高。参考本文 的表8能够理解这一概念。在某些实施例中,具有核盘菌属全植株大田抗性 的植物具有包含至少约50%的有利等位基因的基因组。在更具体的实施例 中,具有核盘菌属全植株大田抗性的植物具有包含至少51%、52%、53%、 54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、 65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、 76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、 87%、88%、89%、90%、91%、92%、93%、94%、95%或更多的有利等位 基因的基因组。有利等位基因的百分比还能够表示为数值。例如,如表8中 所显示的,如果总数为15个的有利等位基因在某个作图群体中是可能的, 具有这些等位基因中的12个的植物将具有80%的有利等位基因。在某些实 施例中,植物中有利等位基因的数量或百分数能够作为植物将表现出的预期 的核盘菌属全植株大田抗性水平的粗略的预测指标。

技术人员还将知道,本文所描述的QTL代表了包含有助于植物的核盘 菌属全植株大田抗性的基因的基因组区域。此外,每一QTL能够不同地有 助于该抗性水平。因此,育种工作指向了提高种质中存在的这些QTL的数 量,尤其是数量上重要的QTL。育种程序的早期,特定种质中可能存在较 少的QTL,但该数量将随着育种程序的进行而提高。因此,在某些实施例 中,表现出核盘菌属全植株大田抗性的植物可包含至少6个本文所述的 QTL。更具体地,所述植物可包含至少7、8、9或10个本文所述的QTL。 更加具体地,所述植物可包含11、12个或全部的本文所述的QTL。

在本发明中,对全植株大田抗性的评估使用,例如,极端的病害压力 大田研究条件,模拟了卡诺拉的种植者的大田条件和最坏情况的大田情况 (其需要施用两种杀真菌剂来保护作物免受核盘菌属感染)。

术语“核盘菌属提高的全植株大田抗性”或“对核盘菌属的提高的全 植株大田抗性”,是指在大田条件下或在极端的病害压力大田研究条件下 (如,例如本文和WO 2006/135717中所述),植物对植物病原体核盘菌属 的抗性的提高。在一个实施例中,具有对核盘菌属的提高的全植株大田抗性 的植物,是与不具有所述至少一个等位基因的植物相比,具有与对核盘菌属 的全植株大田抗性相关联的QTL的至少一个等位基因,并且具有5.0或更 高的基于SSDIS量表的病害发展评分的植物。核盘菌属提高的全植株大田 抗性的其它实施例类似于上文所列的对核盘菌属全植株大田抗性的描述中所 概述的那些。

核盘菌属影响植物的许多不同的组织。核盘菌属的天然的感染开始于 花瓣的感染。当被感染的花瓣落在叶上,病害即传播至叶。然后,病变在每 一植株上在许多叶片上同时发展。这些病变向叶片扩展并使叶片枯萎,同时 感染通过叶柄向着茎进一步发展。然后,感染到达茎,并在茎中进一步发 展,导致过早的成熟。

具有对核盘菌属的全植株大田抗性的植物,是在该植物的全部组织中 抗核盘菌属病害发展的途径的植物。因此,具有对核盘菌属的全植株大田抗 性的植物也能够被称为具有对核盘菌属的“途径抗性”或“大田途径抗性” 的植物。本文所描述的筛选方法被用于鉴定具有对核盘菌属的全植株大田抗 性的植物。与用于评估对核盘菌属的抗性的本领域中已知的其它筛选方法相 比,这些方法是特别的。用于评估对核盘菌属的抗性的本领域中已知的其它 筛选方法仅检测植物的部分,并且这些方法是在与病害的天然发展不相关联 的生长阶段进行。例如,Zhou等人(2003,TAG 106:759-764)通过在幼 苗阶段接种叶和通过在成熟植株阶段接种茎进行了表型分析。Zhou等人 (2006,TAG 112:509-5160)基于叶柄接种对每一品系单个植株进行了表 型分析,而Bela等人(17th Crucifer Genetics Workshop(Brassica 2010), 2010年9月,Saskatoon,Canada)基于叶柄接种对每一品系12个植株进行 了表型分析。Yin等人(2010,Euphytica,在线版本:DOI 10.1007/s10681- 009-0095-1)采用了三种接种方法:向茎生叶上的菌丝体牙签接种、菌丝体 堵塞物接种和感染的花瓣接种。尽管使用此类筛选方法有可能鉴定一个或多 个与核盘菌属抗性相关联的QTL,这些筛选方法是不像如本文所述的鉴定 对核盘菌属的全植株大田抗性的筛选方法那样全面的。这意味着尽管这些其 它筛选方法可被用于揭示在植物的特定组织中与对核盘菌属的抗性相关联的 一个或少数几个QTL,它们不能被用于鉴定遍及整个植株的与核盘菌属抗 性相关联的全部QTL。此外,涉及单种组织而不是全植株的筛选方法,将 不能够检测在不同组织中的基因共同起作用来影响核盘菌属抗性所造成的上 位效应。

使用全植株方法来检测对核盘菌属的抗性有多种优点。首先,该方法 最接近地类似于核盘菌属和植物在大田中的天然相互作用,并因此应该是在 其中鉴定与对核盘菌属的抗性相关联的QTL的优异的体系。第二,相对于 仅检测一种植物组织的其它筛选方法,全植株方法允许对更多数量的QTL 的鉴定。第三,不同于其它筛选方法,该方法允许对上位效应的分析。第 四,该方法允许从其数据预测实际的大田表现。

术语“数量性状基因座”或“QTL”是指具有至少两个差异地影响连 续分布的表型性状(例如,对核盘菌属的全植株大田抗性或对核盘菌属的提 高的全植株大田抗性)的等位基因的多态性遗传基因座。例如,QTL可具 有有利的等位基因,其赋予或有助于对核盘菌属的全植株大田抗性或对核盘 菌属的提高的全植株大田抗性。

术语“有利的等位基因”是在特定基因座的等位基因,其赋予或有助 于所期望的表型,例如对核盘菌属的全植株大田抗性或对核盘菌属的提高的 全植株大田抗性,或者作为另外一种选择,是允许对具有降低的全植株大田 抗性的植物的鉴定的等位基因,所述植物能够被从育种程序或种植中移除 (“反选择”)。标记的有利等位基因是与有利表型共分离的标记等位基 因,或者作为另外一种选择,与不利植物表型共分离,从而提供鉴定植物的 有益效果。例如在表7和表13中,提供了对于对核盘菌属的全植株大田抗 性或对核盘菌属的提高的全植株大田抗性有利的等位基因。

术语“与相关联”或“相关联的”在本发明的上下文中是指,例如, 处于连锁不平衡中的核酸和表型性状或第二核酸,即,与所述核酸和表型/ 第二核酸分别地分离的情况相比,所述核酸和所述性状/第二核酸更经常地 被发现一起存在于子代植物中。

术语“连锁”用于描述一个标记基因座与另一个标记基因座或一些其 它基因座(例如,QTL)“相关联”的程度。分子标记和表型之间的连锁关 系用“概率”或“调整概率”表示。连锁可以用期望的限度或范围表达。例 如,在一些实施例中,当标记以小于50、40、30、25、20、或15图谱单位 (或cM)被分离时,任何标记(遗传上和物理上)与任何其它标记连锁。 在一些方面,限定加括号的连锁范围是有利的,例如介于10和20cM之 间,介于10和30cM之间,或者介于10和40cM之间。标记与第二基因座 的连锁越紧密,标记对第二基因座的指示效果越好。因此,“紧密连锁的基 因座”如标记基因座和第二基因座显示10%或更低,优选约9%或更低,更 优选约8%或更低,更优选约7%或更低,更优选约6%或更低,更优选约 5%或更低,更优选约4%或更低,更优选约3%或更低,更优选约2%或更 低的基因座内重组频率。在高度优选的实施例中,关联基因座显示约1%或 更低的重组频率,例如约0.75%或更低,更优选约0.5%或更低,更优选约 0.25%或更低的重组频率。被定位至相同染色体上,并且它们间的距离使得 两个基因座间的重组发生频率小于10%(例如约9%、8%、7%、6%、5%、 4%、3%、2%、1%、0.75%、0.5%、0.25%、或更低)的两个基因座也被称 为是彼此“邻近”或“邻近于”彼此的。因为1cM是显示出1%的重组频率 的两个标记之间的距离,任何标记与紧邻的任何其它标记紧密连锁(基因上 和物理上),例如等于或小于10cM的距离。在相同染色体上的两个紧密连 锁的标记可被彼此定位于9、8、7、6、5、4、3、2、1、0.75、0.5或 0.25cM或更小。

术语“连锁不平衡”指基因座的非随机的分离。这意味着此类基因座 沿染色体的长度物理上充分地邻近,使得它们倾向于以大于随机的频率共同 分离。

术语“遗传上连锁的”是指处于连锁不平衡中并且统计上被确定不能 独立地组合的基因座。从51%至99%的时候或之间的任何整数值(优选至 少60%、70%、80%、90%、95%或99%),遗传上连锁的基因座相关地组 合。以这种方式遗传的基因座或等位基因被称为是连锁的,并且被称作“连 锁群”。

“概率值”或“P值”是表型的特定组合和特定标记的存在或不存在是 随机的统计学概率。概率值越低,表型和特性标记将共分离的可能性越大。 在某些方面,概率值被认为是“显著的”或“不显著的”。在一些实施例 中,认为随机分离的概率值为0.05(p=0.05,或5%的概率)是共分离的显 著性指示。然而,可接受的概率可为小于50%(p=0.5)的任何概率。例 如,显著概率能够小于0.25、小于0.2、小于0.15、小于0.1、小于0.05、小 于0.01或小于0.001。

术语“标记基因座”是物种基因组中能够在其中发现特定标记的特定 染色体位置。“标记基因座”可用于追踪存在的第二连接基因座,例如编码 或有助于表达表型性状的连接基因座。例如标记基因座能够用于监控等位基 因在某一基因座的分离,例如QTL或单基因,它们与标记基因座在遗传上 或在物理上连锁。

术语“标记”是用作参考点的核苷酸序列或其编码产物(例如蛋白 质)。对于用于检测重组的标记,它们需要在被监测的种群内检测差异、或 多态性。对于分子标记,这是指归因于多核苷酸序列差异的DNA水平的差 异(例如,SSR、RFLP、FLP、SNP)。基因组可变性可为任何一种起源, 例如插入、缺失、复制、重复元件、点突变、重组事件、或转座因子的存在 和序列。分子标记可来源于基因组或表达的核酸(例如EST),并且也可指 用作探针或引物对的核酸,所述引物对能够通过使用基于PCR的方法扩增 序列片段。大量芸苔属分子标记是本领域已知的,并且是已公布的或可从多 种来源获得的。

标记的例子提供于SEQ ID NO:1-125中。本领域的技术人员应该理 解,本发明的标记可包含SEQ ID NO:1-125中所列的任何一个序列的完整 序列、或这样的序列的片段。所述片段能够是,例如,SSR(如在例如表 14中所列的,或侧翼的序列(例如,如SEQ ID NO:126-325所列的那些) 并且包括所述SSR。本领域的技术人员还应该理解,标记如任何的SEQ ID  NO:1-125中所列的那些的序列或这样的序列的片段在品系与品系之间将具 有一些变异。因此,本发明的标记包括与如任何SEQ ID NO:1-125中所提 供的序列或其片段具有70%、71%、72%、73%、74%、75%、76%、77%、 78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、 89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%或 100%的序列同一性的序列。

对应于种群成员之间的遗传多态性的标记能够通过本领域已建立的方 法进行检测。这些方法包括例如DNA测序、基于PCR的序列特异性扩增方 法、限制性片段长度多态性检测(RFLP)、同功酶标记检测、通过等位基 因特异性杂交(ASH)进行的多核苷酸多态性检测、植物基因组的扩增可变 序列检测、自主序列复制检测、简单重复序列检测(SSR)、单核苷酸多态 性检测(SNP)、或扩增片段长度多态性检测(AFLP)。已经建立的方法 也已知用于检测表达序列标签(EST)和来源于EST序列的SSR标记以及 随机扩增的多态性DNA(RAPD)。

当鉴定连锁基因座时,术语“分子标记”可用于指任何类型的基于核 酸的标记,或其用作参照点的编码产物(例如,蛋白质)。标记能够来源于 基因组核苷酸序列或来源于表达的核苷酸序列(例如来源于剪接的RNA、 cDNA等),或来源于编码的多肽。该术语也指与标记序列互补或侧接标记 序列的核酸序列,如用作探针或能够扩增标记序列的引物对的核酸。“分子 标记探针”是能够被用于鉴定标记基因座的存在的核酸序列或分子,例如与 标记基因座序列互补的核酸探针。作为另外一种选择,在某些方面分子标记 探针指能够区别(即基因分型)存在于标记基因座上的特定等位基因的任何 类型的探针。当核酸在溶液中特异性杂交时,例如根据Watson-Crick碱基 配对原则杂交,核酸是“互补的”。任何合适的标记检测技术都可用于鉴定 此类杂交标记,例如,SSR技术被用于本文提供的例子。

“标记等位基因”或者“标记基因座的等位基因”可以指种群中位于 标记基因座的多个多态性核苷酸序列的其中一个,它就标记基因座而言是多 态的。

术语“区间”是指具有终点的染色体DNA的连续线性范围,其通常由 分子标记限定并且包括分子标记。

术语“核酸”、“核苷酸”、“多核苷酸”、“多核苷酸序列”和 “核酸序列”是指单链或双链的脱氧核糖核酸或核糖核酸聚合物、或它们的 嵌合物。如本文所用,该术语能够附加地或替代性地包括天然存在的核苷酸 的类似物,所述类似物在以与天然存在的核苷酸相似的方式与单链核酸杂交 方面具有天然核苷酸的基本性质(例如,肽核酸)。除非另外指明,除了明 确指出的序列之外,本发明的特定核酸序列还任选地涵盖互补序列。术语 “基因”被用于指,例如,cDNA和由基因组序列编码的mRNA,以及该基 因组序列。

术语“同源”是指核酸序列通过天然的或人工的过程来源于共同的祖 先基因(例如,是相同的基因家族的成员),并因此通常具有序列相似性。 通常,同源核酸具有充分的序列同一性,使得序列之一或其互补序列能够在 选择性杂交条件下与另一序列选择性地杂交。术语“选择性杂交”包括指在 严格杂交条件下,核酸序列与特定核酸靶序列以比其与非靶核酸序列的杂交 更高的可检测程度(例如至少2倍于背景)杂交,并指基本排除了非靶核 酸。选择性杂交的序列彼此之间具有约至少70%、71%、72%、73%、 74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、 85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、 96%、97%、98%、99%或100%的序列同一性。表现出与参考核酸至少一些 程度的同源性的核酸能够是与该参考核酸或它的互补序列相同的或其特有 的。

术语“分离的”是指材料,例如核酸或蛋白质,基本上游离于在其天 然存在的环境中通常与其在一起或与其相互作用的组分。分离的材料任选地 包括不在该材料的天然环境(例如,细胞)中被发现的材料。此外,如果所 述材料是在其天然环境(例如细胞)中,所述材料已被置于对该环境中存在 的材料而言非天然的细胞中的位置(例如,基因组或亚细胞细胞器)。例 如,天然存在的核酸(例如,启动子),如果其通过非天然存在的方式被导 入对该核酸而言非天然的基因组中的基因座,则被认为是分离的。如本文所 定义的“分离的”核酸,也被称作“异源的”核酸。

术语“重组”表示该材料(例如,核酸或蛋白质)已通过人工干预被 合成地(非天然地)改变。能够在材料的天然环境或状态下、或使其脱离天 然环境或状态,对所述材料进行改变以产生合成的材料。例如,如果在天然 存在核酸所源自的细胞中通过人工干预使得天然存在的核酸被改变,或者转 录出该核酸的DNA已经发生了改变,则该天然存在的核酸被认为是重组核 酸。参见,例如,Compounds and Methods for Site Directed Mutagenesis in  Eukaryotic Cells,Kmiec,美国专利5,565,350;In Vivo Homologous Sequence  Targeting in Eukaryotic Cells;Zarling等人,PCT/US93/03868。

术语“导入”当指异源的或分离的核酸时,是指核酸向真核或原核细 胞中的掺入,其中所述核酸在所述细胞中能够被整合进该细胞的基因组中 (例如,染色体、质粒、质体或线粒体DNA)、转化进自主复制子中、或 瞬时地表达(例如,转染的mRNA)。该术语包括导入核酸的方法如“转 染”、“转化”和“转导”。

术语“SSR”或“简单重复序列”是指存在于核或细胞器DNA中的由 1-6个碱基对长度的重复单元组成的多态性位点。不同的等位基因能够具有 不同数量的重复SSR,导致等位基因的不同长度,如可通过,例如,在扩 增所述等位基因之后的凝胶电泳检测的。例如,二核苷酸重复可以是 GAGAGAGA,并且三核苷酸重复可以是ATGATGATGATG。据信当DNA 被复制时,在该过程中会发生错误,并且这些重复序列的额外的组被添加至 链中。随着时间流逝,这些重复序列在一个栽培品种和另一个之间在长度上 发生差异。SSR中等位变异的例子可以是:等位基因A:GAGAGAGA (GA序列的4个重复)和等位基因B:GAGAGAGAGAGA(GA序列的6 个重复)。这些长度上的变异是容易在实验室中发现的,并且它们允许在育 种程序中对基因型变异的跟踪。

术语“微卫星”是SSR的替代性术语。

术语“单核苷酸多态性”或“SNP”是当基因组(或其它共有的序列) 中单个核苷酸—ATCG—在一个物种的成员之间(或在个体的配对 的染色体之间)不同时所发生的DNA序列变异。例如,来自不同个体的两 段被测序的DNA片段,AAGCCTA与AAGCTTA,包含单个核苷酸的差 异。在这种情况下我们说有两个等位基因:C和T。几乎全部一般的SNP都 仅具有两个等位基因。

术语“宿主细胞”是指包含异源的核酸(例如载体)并且支持该核酸 的复制和/或表达的细胞。宿主细胞可以是原核细胞例如大肠杆菌 (E.coli),或真核细胞例如酵母、昆虫、两栖动物、或哺乳动物细胞。宿 主细胞能够是单子叶植物或双子叶植物细胞。双子叶植物宿主细胞能够是, 例如,卡诺拉宿主细胞。

术语“转基因植物”是指在其基因组中包含异源多核苷酸的植物。异 源多核苷酸一般被稳定地整合进基因组中,使得该多核苷酸传递至连续的世 代。异源多核苷酸可单独地或作为重组表达盒的部分整合进基因组中。本文 所用的“转基因”包括因异源核酸存在而已经改变了基因型的任何细胞、细 胞系、愈伤组织、组织、植物部分或植物,包括初始进行此类改变的转基因 以及从初始的转基因生物或细胞通过杂交或无性繁殖产生的那些转基因生物 或细胞。如本文所用,术语“转基因”不涵盖通过常规植物育种方法(即, 杂交)或通过诸如随机异花受精、非重组病毒感染、非重组细菌转化、非重 组转座或自发突变之类的自然发生事件导致的基因组(染色体基因组或染色 体外基因组)改变。

术语“双子叶植物”是指也被称为“双子叶植物纲”的被子植物的子 类,并且包括指全植株、植物器官(例如,叶、茎、根,等等)、种子、植 物细胞、和其子代。如本文所用,植物细胞包括但不限于种子、悬浮培养 物、胚、分生区、愈伤组织、叶、根、芽、配子体、孢子体、花粉和小孢 子。

在本发明上下文中的术语“杂交的”或“杂交”指经由授粉产生子代 (即,细胞、种子或植物)的配子融合。该术语包括有性杂交(一株植物被 另一株植物授粉)和自交(自花授粉,即,当花粉和胚珠来自相同植物 时)。

术语“渗入”指基因座的期望等位基因从一种遗传背景传递到另一种 遗传背景的现象。例如,所期望的等位基因在特定基因座的渗入能够通过两 个亲本植株间的有性杂交被传递到至少一个子代植株,其中至少一个亲本植 株在其基因组中具有所期望的等位基因。作为另外一种选择,例如等位基因 的传递能够通过两个供体基因组之间的重组而发生,例如在融合原生质体 中,其中至少其中一个供体原生质体在其基因组中具有期望的等位基因。所 期望的等位基因能够是,例如,转基因或标记或QTL的所选择的等位基 因。

术语“极端的病害压力大田研究条件”是指如,例如,WO 2006/135717中所述的受控的病害研究条件。例如,极端的病害压力能够通 过应用黑芝麻(Niger)籽载体模拟核盘菌属定殖的花瓣来产生。天然的种 菌可作为后备种菌存在于大田中。受试植物的百分比病害发生率被根据经常 检查调整,并给予了1至9的SSDIS评分。然而,在这些极端的条件下,植 物至少由于下列原因而对核盘菌属是更加易感的:(1)在极端的病害压力 大田研究条件下,植物经受了通过雾化灌溉提供的潮湿,这有利于核盘菌属 的发展,(2)在极端的病害压力大田研究条件下,由于人工的遮盖,植物 处于半封闭的环境,这确保了有利于核盘菌属发展的持续的潮湿条件,以及 (3)在极端的病害压力大田研究条件下,在每一区块中有六行不同的受试 植物,因此具有特定形态学表型的任何一行受试植物可能被具有不同的形态 学表型的两行不同的植物围绕。因此,来自较少地有利于核盘菌属感染的形 态学表型(例如高的分枝)的任何有益效果被降低,因为任何一行可能被具 有不同的形态学表型(例如,低的分枝)的植物围绕。与此相对,在天然的 大田条件下生长的植物:(1)不被封闭在确保了持续的潮湿的人工遮盖之 中,和(2)在被具有相同形态学表型的植物围绕的区块中生长,这使得来 自该形态的全部有益效果能够被表达。因此,具有较少地有利于核盘菌属感 染的形态(例如,高的分枝)的选择,在天然的大田条件下比在极端的病害 压力大田研究条件下进行得显著更好。

已很确定的是,以年度为基础产生可靠的大田数据是不普通的。核盘 菌属是烈性的病害,但其仅在温度温和的潮湿夏季发展。多年来,当核盘菌 属的条件是次优的时,对于在大田中对核盘菌属抗性的筛选,多个问题变得 至关重要。潮湿的持续时间、水质、种菌的存在、和潮湿或湿热微环境的存 在影响病害在作物中的发展。尽管本发明描述的方法针对的是芸苔属,应当 理解的是,所述方法可应用于对通过子囊孢子的核盘菌属感染易感的任何植 物。这包括向日葵(头腐病)、红花(头腐病)、干豆(荚果腐病)、干豌 豆(荚果腐病)、大豆(茎腐病和荚果腐病)、苜蓿(花枯病)、和莴苣 (莴苣菌核病)。Bardin和Huang 2001。关于核盘菌属对大豆的影响还可参 加美国专利申请公布2003/0150016。

大田中的关键问题已被解决如下:

(a)用于数据收集的连续统一体的适当的人工种菌:由于天然的种菌 并不总是在大田中被触发,开发了模拟通过花瓣的感染的种菌。 真菌的载体能够是定殖了核盘菌属的黑芝麻籽(小葵子(Guizotia  abyssinica)-尼日尔籽),并且在完整花瓣脱落的时候散布。

(b)水质和核盘菌属:最初,地下水被用于灌溉核盘菌属定殖的大 田。然而,在具有低的降雨和高或低的温度的几年内观察到了感 染转移的缺少。体外测试已确认了地下水抑制核盘菌属的生长。 通过实验室和大田测试,确定了去离子(D1)水处理充分地改变 了地下水的品质,以防止对核盘菌属发育的抑制。之后,DI水被 用于灌溉极端的病害压力大田研究地块。理论上,经过处理的去 离子水与最初的地下水不同之处在于矿物(例如镁和钙(石 灰))被降低而pH不受影响。核盘菌属产生草酸(一种可扩散的 毒素)来帮助感染过程(US 6,380,461)。钙能够与草酸结合,产 生草酸钙。钙的去除很可能是去离子水中使得核盘菌属能够生长 的质变因素。因此,矿物含量低或不含矿物的水源(例如降低了 或去除了镁和钙)能够被使用。

(c)通过叶片湿度传感器操纵的灌溉:为了在大田中实现持续的湿 润,使用了仅在湿度低于设定的阈值时触发灌溉的叶片湿度传感 器(Campbell Scientific)。最优化的灌溉使得病害能够发展并且 增强了对病害抗性的筛选。然而,过度的灌溉可能干扰有意义的 评估。具体地,在独特基因型的行很靠近的研究设置中,一行的 倒伏能够通过植物与植物的接触导致病原体的传播,并提高在第 二种基因型上的病害发生率。因此,对于第二种基因型的核盘菌 属抗性评分可能低估了它在更加同质化的群体中的潜在性能。在 天然的大田数据试验中,过度灌溉能够通过倒伏的增加产生对核 盘菌属而言比通常用于给定基因型的更有利的环境。因此,上述 试验项目的表现可能由于过度灌溉而是失真的。

(d)提供遮盖来帮助维持病害的发展所必需的微环境:为了使病害在 干燥、炎热和/或多风的季节能够发展,可使用网式的遮盖。

上述新的方法使得能够实现病害的受控制的发展、表型的可靠的表 达、和在优化的核盘菌属条件下对多种不同品系的表征。

标记

本发明提供了跟与对核盘菌属的全植株大田抗性相关联的数量性状基 因座(“QTL”)遗传上连锁的分子标记。此类分子标记对于鉴定和生产抗 核盘菌属或具有对核盘菌属的提高的抗性的双子叶植物是有用的,具体地, 此类商业上重要的双子叶作物如向日葵、卡诺拉、苜蓿、和大豆。

几百种分子标记的基因作图生成了覆盖大约1400cM(厘摩)的遗传连 锁图谱,对应于19条卡诺拉染色体。下文标题为“植物的标记辅助的选择 和育种”的部分提供了关于分子标记的性质和使用的附加的细节。

与对核盘菌属的全植株大田抗性相关联的示例性标记基因座被定位至 甘蓝型油菜(Brassica napus)中的十三个连锁群:N1、N3、N4、N7、 N8、N9、N10、N11、N12、N13、N15、N18和N19。这些示例性的标记基 因座描绘了包括与对核盘菌属的全植株大田抗性或提高的全植株大田抗性的 表型测量相关联的数量性状基因座(QTL)的染色体区间。例如,本文的表 5和11列出了被定位至连锁群N1、N3、N4、N7、N8、N9、N10、N11、 N12、N13、N15、N18和N19的标记。基于本文提供的序列信息能够设计 对应于这些标记或这些标记的片段的附加的引物和探针。

AG0023(SEQ ID NO:1);AG0045(SEQ ID NO:2);AG0047 (SEQ ID NO:3);AG0070(SEQ ID NO:4);AG0086(SEQ ID NO: 5);AG0093(SEQ ID NO:6);AG0125(SEQ ID NO:7);AG0148 (SEQ ID NO:8);AG0171(SEQ ID NO:9);AG0203(SEQ ID NO: 10);AG0239(SEQ ID NO:11);AG0243(SEQ ID NO:12);AG0272 (SEQ ID NO:13);AG0304(SEQ ID NO:14);AG0323(SEQ ID NO: 15);AG0324(SEQ ID NO:16);AG0328(SEQ ID NO:17);AG0359 (SEQ ID NO:18);AG0369(SEQ ID NO:19);AG0370(SEQ ID NO: 20);AG0378(SEQ ID NO:21);AG0391(SEQ ID NO:22);AG0410 (SEQ ID NO:23);AG0441(SEQ ID NO:24);AG0477(SEQ ID NO: 25);AG0482(SEQ ID NO:26);AG0504(SEQ ID NO:27);AG0510 (SEQ ID NO:28);BG0031(SEQ ID NO:29);BG0106(SEQ ID NO: 30);BG0111(SEQ ID NO:31);BG0119(SEQ ID NO:32);BG0181 (SEQ ID NO:33);BG0228(SEQ ID NO:34);BG0255(SEQ ID NO: 35);BG0278(SEQ ID NO:36);BG0295(SEQ ID NO:37);BG0452 (SEQ ID NO:38);BG0516(SEQ ID NO:39);BG0647(SEQ ID NO: 40);BG0651(SEQ ID NO:41);BG0713(SEQ ID NO:42);BG0864 (SEQ ID NO:43);BG0869(SEQ ID NO:44);BG0988(SEQ ID NO: 45);BG1062(SEQ ID NO:46);BG1090(SEQ ID NO:47);BG1101 (SEQ ID NO:48);BG1123(SEQ ID NO:49);BG1127(SEQ ID NO: 50);BG1149(SEQ ID NO:51);BG1182(SEQ ID NO:52);BG1197 (SEQ ID NO:53);BG1230(SEQ ID NO:54);BG1241(SEQ ID NO: 55);BG1244(SEQ ID NO:56);BG1286(SEQ ID NO:57);BG1288 (SEQ ID NO:58);BG1321(SEQ ID NO:59);BG1368(SEQ ID NO: 60);BG1392(SEQ ID NO:61);BG1442(SEQ ID NO:62);BG1449 (SEQ ID NO:63);BG1453(SEQ ID NO:64);BG1513(SEQ ID NO: 65);CA0105(SEQ ID NO:66);CA0120(SEQ ID NO:67);CA0163 (SEQ ID NO:68);CA0221(SEQ ID NO:69);CA0226(SEQ ID NO: 70);CA0233(SEQ ID NO:71);CA0328(SEQ ID NO:72);CA0410 (SEQ ID NO:73);CA0423(SEQ ID NO:74);CA0456(SEQ ID NO: 75);CA0488(SEQ ID NO:76);CA0546(SEQ ID NO:77);CA0552 (SEQ ID NO:78);CA0603(SEQ ID NO:79);CA0614(SEQ ID NO: 80);CA0636(SEQ ID NO:81);CA0681(SEQ ID NO:82);CA0719 (SEQ ID NO:83);CA0736(SEQ ID NO:84);CA0739(SEQ ID NO: 85);CA0753(SEQ ID NO:86);CA0834(SEQ ID NO:87);CA0837 (SEQ ID NO:88);CA0896(SEQ ID NO:89);CA0991(SEQ ID NO: 90);CA1027(SEQ ID NO:91);CA1032(SEQ ID NO:92);CA1034 (SEQ ID NO:93);CA1035(SEQ ID NO:94);CA1066(SEQ ID NO: 95);CA1080(SEQ ID NO:96);CA1090(SEQ ID NO:97);CA1097 (SEQ ID NO:98);CA1107(SEQ ID NO:99);PE0012(SEQ ID NO: 100);PE0017(SEQ ID NO:101);PE0063(SEQ ID NO:102);PE0091 (SEQ ID NO:103);PE0131(SEQ ID NO:104);PE0133(SEQ ID NO: 105);PE0177(SEQ ID NO:106);PE0187(SEQ ID NO:107);PE0203 (SEQ ID NO:108);PE0250(SEQ ID NO:109);PE0281(SEQ ID NO: 110);PE0283(SEQ ID NO:111);PE0286(SEQ ID NO:112);PE0324 (SEQ ID NO:113);PE0340(SEQ ID NO:114);PE0355(SEQ ID NO: 115);UB0015(SEQ ID NO:116);UB0126(SEQ ID NO:117); UB0163(SEQ ID NO:118);UB0181(SEQ ID NO:119);UB0196(SEQ ID NO:120);UB0307(SEQ ID NO:121);UB0315(SEQ ID NO: 122);UB0331(SEQ ID NO:123);KK66(SEQ ID NO:124);和 KK98G(SEQ ID NO:125)(有时被称为“SEQ ID NO:1-125所例示的标 记”)。包含简单重复序列(SSR)多态性或单核苷酸多态性(SNP),它 们鉴定了有助于核盘菌属全植株大田抗性或提高的全植株大田抗性的QTL 并且能够被用作其标记。应当理解,SSR中的重复的数量能够变化。例如在 表7和表13中,提供了有助于对核盘菌属的全植株大田抗性或对核盘菌属 的提高的全植株大田抗性的有利等位基因。

要指出的是,无论它们的分子性质如何,例如,无论标记是SSR、 AFLP、RFLP等等,标记通常是品系特异性的。即,特定的多态性标记,例 如上文所述的本发明的示例性标记,是相对于所关注的亲本品系规定的。对 于每一标记基因座,对每一对亲本品系鉴定了抗性相关联的、并且相反地为 易感性相关联的等位基因。在将特定等位基因与杂交体的亲本的易感性和抗 性相关联之后,所述标记能够被用于鉴定具有对应于所期望的抗性表型的基 因型的子代。在一些情况下,即,在一些亲本品系的杂交体中,本文所述的 示例性标记将不是最佳地提供信息的。在此类情况下,附加的有信息量的标 记,例如,某些连锁的标记和/或同源性标记,被评估和替代用于基因分 型,例如用于标记辅助的选择等。在标记对应于QTL的情况下,在抗性和 易感性相关联的等位基因的鉴定之后,有可能直接筛选样品的群体,例如从 种子库获得的样品,而不用首先将亲本的表型与等位基因相关联。

连锁标记

本领域的技术人员将认识到,在通过上文所述的标记对限定的区间内 能够鉴定附加的分子标记。此类标记也是与本文中鉴定为与核盘菌属全植株 大田抗性相关联的QTL遗传上连锁的,并且是在本发明的范围内。标记能 够通过任何的多种遗传或物理作图技术被鉴定。确定标记是否跟与对核盘菌 属的抗性相关联的QTL(或特定的标记)遗传上连锁的方法是本领域的技 术人员已知的,并且包括,例如,区间作图法(Lander和Botstein(1989) Genetics 121:185)、回归作图法(Haley和Knott(1992)Heredity 69: 315)或MQM作图法(Jansen(1994)Genetics 138:871)。此外,诸如染 色体步移、重叠群作图和装配等的物理作图技术,能够被用于鉴定和分离作 为本发明的上下文中的标记有用的附加的序列。

同源核苷酸序列

此外,AG0023;AG0045;AG0047;AG0070;AG0086;AG0093; AG0125;AG0148;AG0171;AG0203;AG0239;AG0243;AG0272; AG0304;AG0323;AG0324;AG0328;AG0359;AG0369;AG0370; AG0378;AG0391;AG0410;AG0441;AG0477;AG0482;AG0504; AG0510;BG0031;BG0106;BG0111;BG0119;BG0181;BG0228; BG0255;BG0278;BG0295;BG0452;BG0516;BG0647;BG0651; BG0713;BG0864;BG0869;BG0988;BG1062;BG1090;BG1101; BG1123;BG1127;BG1149;BG1182;BG1197;BG1230;BG1241; BG1244;BG1286;BG1288;BG1321;BG1368;BG1392;BG1442; BG1449;BG1453;BG1513;CA0105;CA0120;CA0163;CA0221; CA0226;CA0233;CA0328;CA0410;CA0423;CA0456;CA0488; CA0546;CA0552;CA0603;CA0614;CA0636;CA0681;CA0719; CA0736;CA0739;CA0753;CA0834;CA0837;CA0896;CA0991; CA1027;CA1032;CA1034;CA1035;CA1066;CA1080;CA1090; CA1097;和CA1107;以及PE0012;PE0017;PE0063;PE0091; PE0131;PE0133;PE0177;PE0187;PE0203;PE0250;PE0281; PE0283;PE0286;PE0324;PE0340;PE0355;UB0015;UB0126; UB0163;UB0181;UB0196;UB0307;UB0315;UB0331;KK66;和 KK98G对于鉴定在与不同的双子叶植物品系、品种、或物种中的核盘菌属 全植株大田抗性相关联的QTL的鉴定中具有实用性的同源核苷酸序列是有 用的。此类同源性标记也是本发明的特征。

此类同源序列能够通过与参考序列的选择性杂交被鉴定。参考序列通 常是来源于本文所列的任何标记基因座的独特序列或其互补序列,例如独特 的寡核苷酸引物序列、EST、扩增的片段(例如,对应于AFLP标记)等 等。

两种单链核酸当形成双链体时“杂交”。双链区域能够包括单链核酸 之一或全部两者的全长,或一种单链核酸的全部与另一种单链核酸的子序 列,或者所述双链区域能够包括每一核酸的子序列。选择性杂交条件区分了 与参考序列(或其互补序列)相关(例如,共有显著的序列同一性)的核酸 和以非特异性的方式与参考序列相关联的那些。一般来讲,选择性杂交条件 是如下那些条件:在pH7.0至8.3盐浓度低于约1.5M钠离子,通常约0.01 至1.0M钠离子浓度(或其它盐),并且对于短探针(例如10至50个核苷 酸)温度为至少约30℃,并且对于长的探针(例如多于50个核苷酸)温度 为至少约60℃。选择性杂交条件也可以通过加入诸如甲酰胺之类的去稳定 剂来实现。选择性能够通过改变杂交和/或洗涤条件的严格性来实现。示例 性的低严格条件包括在37℃于含有30至35%甲酰胺、1M NaCl、1%SDS (十二烷基硫酸钠)的缓冲液中杂交,以及在50至55℃用1×至2×SSC (20×SSC=3.0M NaCl/0.3M柠檬酸三钠)洗涤。示例性的中等严格条件包 括在37℃于40至45%甲酰胺、1M NaCl、1%SDS中杂交,以及在55至60 ℃下用0.5×至1×SSC洗涤。示例性的高严格条件包括在37℃于50%甲酰 胺、1M NaCl、1%SDS中杂交,以及在60至65℃用0.1×SSC洗涤。

特异性通常取决于杂交后洗涤,最后的洗涤溶液的离子强度和温度是 关键因素。通常,在确定的离子强度和pH下,严格条件选择为比特定序列 及其互补序列的热解链温度(Tm)低约5℃。然而,极严格条件可采用在比 熔解温度(Tm)低1、2、3或4℃的温度下杂交和/或洗涤;中等严格条件 可采用在比熔解温度(Tm)低6、7、8、9或10℃的温度下杂交和/或洗 涤;低严格条件可采用在比熔解温度(Tm)低11、12、13、14、15或20℃ 温度下杂交和/或洗涤。

Tm指(在确定的离子强度和pH下)50%的互补靶序列与完全匹配的探 针杂交时的温度。对于DNA-DNA杂交体,Tm能够用Meinkoth和Wahl ((1984)Anal.Biochem.138:267-284)的方程式估算:Tm=81.5℃+ 16.6(log M)+0.41(%GC)-0.61(%form)-500/L;其中M为单价阳离 子的体积摩尔浓度,%GC为DNA中鸟苷和胞嘧啶核苷酸的百分比,%form 为杂交溶液中甲酰胺的百分比,并且L为以碱基对表示的杂交体的长度。 每出现1%的错配,Tm降低约1℃;因此,可调节Tm杂交和/或洗涤条件以 与具有期望同一性的序列杂交。例如,如果要寻求具有≥90%同一性的序 列,则可将Tm降低10℃。

利用上述等式、杂交和洗涤组合物以及所需的Tm,一般技术人员将会 理解,杂交和/或洗涤溶液的严格性的变化已经在本质上得以描述。如果所 需的错配程度导致Tm低于45℃(水溶液)或32℃(甲酰胺溶液),则优选 增加SSC的浓度以便能使用更高的温度。杂交和/或洗涤条件可进行至少 10、30、60、90、120或240分钟。对于核酸杂交的详尽指导可在以下文献 中找到:Tijssen(1993)Laboratory Techniques in Biochemistry and Molecular  Biology--Hybridization with Nucleic Acid Probes第I部分,第2章“Overview  of principles of hybridization and the strategy of nucleic acid probe assays” Elsevier,New York。讨论与核酸的杂交、探针的选择、和缓冲液与孵育条 件等相关的注意事项,以及本发明的上下文中关注的多种其它主题(例如, 对应于标记和QTL的核酸的克隆、克隆的标记/QTL的测序、启动子的使 用、载体等等)的一般性文本能够见于Berger和Kimmel(1987)Guide to  Molecular Cloning Techniques,Methods in Enzymology第152卷,Academic  Press,Inc.,San Diego(“Berger”);Sambrook等人,(2001)Molecular  Cloning-A Laboratory Manual,第3版第1-3卷,Cold Spring Harbor  Laboratory,Cold Spring Harbor(“Sambrook”);和Ausubel等人(编 辑)(supplemented through 2001)Current Protocols in Molecular Biology, John Wiley and Sons,Inc.,(“Ausubel”)。

除了上文所述的杂交方法之外,本发明的标记的同源物还能够使用任 何的多种序列比对和比较规程通过电脑鉴定。出于后续的讨论的目的,下列 术语被用于描述标记核苷酸序列和参考多核苷酸序列之间的序列关系:

“参考序列”是被用作与本发明的测试序列(例如,候选的标记同源 物)的序列比较的基础的限定的序列。参考序列可以是指定序列的子序列或 全部;例如,全长cDNA或基因序列的一个片段,或全长cDNA或基因序 列。

如本文所用,“比较窗口”是将与参考序列比较的多核苷酸/多肽序列 的连续的和特定的片段(例如,子序列)。就两种序列的最优化的比对而 言,所述多核苷酸/多肽序列在比较窗口中的片段能够包括相对于参考序列 的一个或多个添加或删除(即,缺口),所述参考序列(按照定义)不包含 添加或删除。两种序列的最优化的比对在比较窗口中产生最少数量的不同的 核苷酸/氨基酸残基。一般来讲,比较窗口的长度为至少20个连续的核苷酸/ 氨基酸残基,任选地能够是30、40、50、100种核苷酸,或者更长。本领域 的技术人员懂得,为了避免由于在多核苷酸/多肽序列中包含空位导致的两 种序列之间错误的高相似度,通常进行空位罚分的评估,并从匹配数目中减 去空位罚分。

在两种核酸或多肽序列中的上下文中的“序列同一性”或“同一性” 是指在特定比较窗口上进行比对以寻求最大对应时两种序列中相同的残基。

“百分比序列同一性”是指通过在比较窗口中比较两种最优化地对齐 的序列确定的值。百分比通过以下方法进行计算:确定两序列具有相同核苷 酸或氨基酸残基的位点的数目,确定匹配位点的数目,将该匹配位点的数目 除以比较窗口中位点的总数,并将所得结果乘以100来获得序列同一性的百 分比。

已经认识到当序列同一性百分比用于蛋白质时,不同的残基位点的差 异常常在于保守的氨基酸取代,其中氨基酸残基被取代为具有相似化学性质 (例如电荷或疏水性)的其它氨基酸残基,并因此不改变该分子的功能特 性。当序列出现保守残基取代差异时,可上调序列同一性百分比以进行针对 取代的保守性质的校正。由此类保守取代导致的序列差异被称为具有“序列 相似性”或“相似性”。用于进行此调节的方法是本领域技术人员所熟知 的。通常这涉及给一个保守取代评分为部分而不是完全错配,因此提高序列 同一性百分比。因此例如其中一个相同氨基酸得分为1,并且非保守取代得 分为零,保守取代得分介于零和1之间。按照例如Meyers和Miller (1988)Computer Applic.Biol.Sci.4:11-17的算法计算保守取代的评分, 例如,如程序PC/GENE(Intelligenetics,Mountain View,California, USA)中所应用的。

比对序列以供比较的方法是本领域中众所周知的。用于比较的最优化 的序列比对可通过Smith和Waterman的局部同源性算法((1981)Adv.Appl.Math.2:482);Needleman和Wunsch的同源比对算法((1970)J. Mol.Biol.48:443);Pearson和Lipman的相似性搜索算法((1988)Proc.Natl.Acad.Sci.USA 85:2444);以及这些算法的计算机化的应用进行,所 述计算机化的应用包括但不限于:在PC/Gene程序(Intelligenetics, Mountain View,California)中的CLUSTAL;Wisconsin Genetics Software  Package(Genetics Computer Group(GCG),Madison,Wisconsin,USA) 中的GAP、BESTFIT、BLAST、FASTA、和TFASTA;CLUSTAL程序详述 于Higgins和Sharp((1988)Gene 73:237-244);Higgins和Sharp ((1989)CABIOS 5:151-153);Corpet等人((1988)Nucleic AcidsResearch 16:10881-90);Huang等人((1992)Computer Applications in  the Biosciences 8:155-65)、和Pearson等人((1994)Methods in  Molecular Biology 24:307-331)。

能够被用于数据库相似性检索的BLAST家族的程序包括:用于针对核 苷酸数据库序列检索核苷酸查询序列的BLASTN;用于针对蛋白质数据库 序列检索核苷酸查询序列的BLASTX;用于针对蛋白质数据库序列检索蛋 白质查询序列的BLASTP;用于针对核苷酸数据库序列检索蛋白质查询序列 的TBLASTN;和用于针对核苷酸数据库序列检索核苷酸查询序列的 TBLASTX。参见,例如,Current Protocols in Molecular Biology,第19章, Ausubel等人编辑,(1995)Greene Publishing and Wiley-Interscience,New  York;Altschul等人,1990,J.Mol.Biol.215:403-410;和Altschul等人 (1997)Nucleic Acids Res.25:3389-3402。

用于进行BLAST分析的软件是可公开获得的,例如,通过美国国立生 物技术信息中心(National Center for Biotechnology Information) (http://www.ncbi.nlm.nih.gov/)。该算法包括首先通过鉴定查询序列中长度 为W的短字节来鉴定高评分序列对(HSP),所述短字节当与数据库序列 中相同长度的字节对齐时,或者是匹配的,或者是满足某些正值的阈值分数 T。T被称为相邻字节分数阈值。这些初始的相邻字节命中作为种子用于开 始进行检索,以发现包含它们的更长的HSP。然后,这些字节的命中在两 个方向上沿每一序列延伸,直到累积的比对分数不能再增加为止。就核苷酸 序列而言,使用参数M(对一对匹配残基的奖励分数;总是>0)和N(对 错配残基的罚分;总是<0)来计算累积的分数。就氨基酸序列而言,评分 矩阵被用于计算累积的分数。字节命中在每一方向上的延伸当出现下列情况 时停止:累积的比对分数从其达到的最高值降低数值X;由于一个或多个负 值评分的残基对齐,累积的分数达到零或更低;或达到序列之一的末端。 BLAST算法的参数W、T、和X确定了比对的灵敏度和速度。BLASTN程 序(用于核苷酸序列)默认采用11的字长(W)、10的期望值(E)、100 的截止阈值(cutoff)、M=5、N=-4,并对两条链均进行比较。就氨基酸序 列而言,BLASTP程序默认采用3的字长(W)、10的期望值(E)、和 BLOSUM62评分矩阵(参见,例如,Henikoff和Henikoff(1989)Proc.Natl.Acad.Sci.USA 89:10915)。

除了计算百分比序列同一性之外,BLAST算法还进行两种序列之间相 似度的统计学分析(参见,例如,Karlin和Altschul(1993)Proc.Nat’l.Acad.Sci.USA 90:5873-5877)。BLAST算法提供的一种相似度的测量是 最小和概率(P(N)),其提供了两种核苷酸或氨基酸序列之间偶然地发生匹 配的概率的指示。

BLAST检索假定蛋白质能够被模式化为随机序列。然而,许多实际的 蛋白质包含非随机序列区域,其可以是同聚体束(homopolymeric tract)、 短周期重复、或富含一种或多种氨基酸的区域。此类低复杂度的区域可能在 不相关的蛋白质之间对齐,即使蛋白质的其它区域是完全相异的。多种低复 杂度过滤程序能够被用于减少此类低复杂度的对齐。例如,SEG(Wooten 和Federhen(1993)Comput.Chem.17:149-163)和XNU(Claverie和 States(1993)Comput.Chem.17:191-201)低复杂度过滤器能够被单独地 或组合地使用。

除非另外指明,本文提供的核苷酸和蛋白质同一性/相似度值是使用 GAP(GCG版本10)在默认值下计算的。

GAP(全局比对程序)还能够被用于将本发明的多核苷酸或多肽与参 考序列进行比较。GAP使用Needleman和Wunsch的算法((1970)J.Mol.Biol.48:443-453),以发现两个最大化匹配数和最小化空位数的完整序列 的比对结果。GAP考虑所有可能的比对和空位位点,并制备最大数目的匹 配碱基和最少的空位。它允许以匹配碱基单位提供空位形成罚分和空位延伸 罚分。GAP必须对它插入的每个空位形成空位形成罚分匹配数。如果选择 空位延伸罚分大于零,GAP必须另外形成对每个空位延伸罚分的空位次数 的插入长度的空位罚分。用于蛋白质序列的Wisconsin Genetics Software  Package版本10默认的空位形成罚分值和空位延伸罚分值分别是8和2。核 苷酸序列的默认空位形成罚分是50,而默认空位延伸罚分是3。空位形成罚 分和空位延伸罚分能够表示为选自0至100的整数。因此,例如,空位形成 和空位延伸罚分能够各自独立地是:0、1、2、3、4、5、6、7、8、9、10、 15、20、30、40、50、60或更高。

GAP提供了比对家族中的其中一个最好的成员。此家族中可能有很多 成员,但是其它成员没有更好的质量。GAP显示了用于比对的四个质量因 数:质量、比率、同一性、和相似性。质量是比对序列的最大量度。比率是 质量除以较短片段中的碱基数。同一性百分比是实际匹配的符号的百分比。 百分比相似性是相似符号的百分比。忽略来自空位对面的符号。当一对符号 的得分矩阵值大于或等于0.50时(相似性阈值),对相似性打分。 Wisconsin Genetics Software Package版本10中使用的得分矩阵是 BLOSUM62(参见,例如,Henikoff和Henikoff(1989)Proc.Natl.Acad.Sci.USA 89:10915)。

序列的多重比对能够使用CLUSTAL比对方法(Higgins和Sharp (1989)CABIOS.5:151-153),采用默认参数(GAP PENALTY=10、 GAP LENGTH PENALTY=10)进行。使用CLUSTAL方法进行成对比对的 默认参数是KTUPLE 1、GAP PENALTY=3、WINDOW=5、以及 DIAGONALS SAVED=5。

同源标记与其参考标记(例如,任何一种本文所述的标记)的百分比 序列同一性通常是至少70%,并且,向上取最小整数能够表示为选自70和 99之间的整数。因此,例如,与参考序列的百分比序列同一性能够是至少 70%、75%、80%、85%、90%、95%、97%、或99%。序列同一性能够使 用,例如,BLAST、CLUSTALW、或GAP算法在默认条件下计算。

标记基因座的检测

对应于在种群成员间的遗传多态性的标记能够通过本领域已经确定的 多种方法进行检测(例如,限制性片段长度多态性、同功酶标记、等位基因 特异性杂交(ASH)、植物基因组的扩增的可变序列、自主序列复制、简单 重复序列(SSR)、单核苷酸多态性(SNP)、或扩增片段长度多态性 (AFLP))。

大多数遗传标记依靠核酸的一个或多个特性进行检测。例如,用于遗 传标记检测的一些技术利用探针核酸与对应于遗传标记的核酸的杂交。杂交 方式包括但不限于溶液相、固相、混合相、或原位杂交检测。限制性片段长 度多态性(RFLP)的标记,通过将通常是将被检测的核酸的子片段的探针 (或者对应于子片段的合成的寡核苷酸),与经限制性消化的基因组DNA 进行杂交而被检测。限制性酶被选择为提供在不同个体中至少两种替代性 (或多态性)长度并且经常在品系与品系之间变化的限制性片段。确定产生 针对每一杂交的提供信息的片段的(一种或多种)限制性酶是简单的过程, 在本领域中是众所周知的。标记探针在合适基质(例如,琼脂糖)中根据长 度分离并转移到膜(例如,硝化纤维、尼龙)上后,它在导致探针平衡结合 的条件下与靶杂交,随后通过洗涤移除过多的探针。

可克隆和/或合成用于标记座位的核酸探针。适合与核酸探针一起使用 的可检测标记物包括通过光谱、放射性同位素、光化学、生物化学、免疫化 学、电学、光学或化学方法可检测的任何组合物。可用的标记物包括用于染 色的生物素,它具有标记的链霉亲和素、磁珠、荧光染料、放射标记物、 酶、和色度标记。其它标记物包括与抗体结合的配体,该抗体被荧光团、化 学发光试剂、和酶标记。使标记带上标记物能够容易地实现,例如通过对标 记基因座使用带标记物的PCR引物。

然后最典型地使用放射自显影或其它类似的检测技术(例如,荧光照 相、液体闪烁计数器,等等)检测杂交的探针。特定杂交规程的例子是本领 域广泛可用的,参见例如Berger、Sambrook、Ausubel,均参见上文。

扩增的可变序列指植物基因组的扩增序列,该序列在相同物种的成员 间表现出高的核酸残基可变性。所有生物具有可变基因组序列,并且每种生 物(除了克隆以外)具有不同的一组可变序列。一旦确认,可使用存在的特 定可变序列预测表型性状。来自植物的DNA与侧接DNA可变序列的引物 一起优选地起到扩增模板的作用。扩增可变序列,然后进行测序。

体外扩增技术是本领域中为人们所熟知的。足以指导技术人员使用此 类体外方法,包括聚合酶链反应(PCR)、连接酶链反应(LCR)、Qβ-复 制酶扩增和其它RNA聚合酶介导的技术(例如,NASBA)的技术的例子, 见于Berger、Sambrook和Ausubel(全部参见上文)以及Mullis等人 ((1987)美国专利4,683,202);PCR Protocols,A Guide to Methods and  Applications((Innis等人编辑)Academic Press Inc.,San Diego Academic  Press Inc.San Diego,CA(1990)(Innis));Arnheim和Levinson ((1990年10月1日)C&EN 36-47);The Journal Of NIH Research(1991)3,81-94;Kwoh等人((1989)Proc.Natl.Acad.Sci.USA 86, 1173);Guatelli等人((1990)Proc.Natl.Acad.Sci.USA 87,1874); Lomell等人((1989)J.Clin.Chem.35,1826);Landegren等人 ((1988)Science 241,1077-1080);Van Brunt((1990)Biotechnology8,291-294);Wu和Wallace((1989)Gene 4,560);Barringer等人 ((1990)Gene 89,117)、和Sooknanan和Malek((1995) Biotechnology 13:563-564)。克隆体外扩增的核酸的改进的方法描述于 Wallace等人,美国专利5,426,039中。通过PCR扩增大的核酸的改进的方 法总结于Cheng等人(1994)Nature 369:684以及其中的参考文献中,在 其中产生了最多40kb的PCR扩增子。技术人员将会知道使用逆转录酶和聚 合酶,基本上能够将任何RNA转化成适于限制性消化、PCR扩增和测序的 双链DNA。参见Ausubel、Sambrook和Berger,全部参见上文。

供(例如,在扩增反应中)用作引物的寡核苷酸和供用作核酸序列探 针的寡核苷酸通常按照Beaucage和Caruthers((1981)Tetrahedron Lett.22:1859)描述的固相亚磷酰胺三酯方法化学地合成,或者能够简单地以商 品方式订购。

作为另外一种选择,可使用自主复制序列鉴定遗传标记。自主序列复 制指使用靶核酸序列进行核酸扩增的一种方法,该序列在基本上等温的条件 下通过使用逆转录复制涉及的下列三种酶活性进行体外的指数复制:(1) 逆转录酶,(2)RNA酶H,以及(3)依赖DNA的RNA聚合酶(Guatelli 等人(1990)Proc.Natl.Acad.Sci.USA 87:1874)。通过cDNA中间体模 仿RNA逆转录复制机制,这种方法积聚初始靶的cDNA和RNA拷贝。

扩增片段长度多态性(AFLP)也能够被用作遗传标记(Vos等人 (1995)Nucl.Acids Res.23:4407。短语“扩增片段长度多态性”指在用 限制性核酸内切酶裂解之前或之后扩增的选择的限制性片段。扩增步骤使得 特定限制性片段检测较容易。AFLP允许对大量的多态性标记的检测,并且 已被用于植物的基因作图(Becker等人(1995)Mol.Gen.Genet.249:65; 和Meksem等人(1995)Mol.Gen.Genet.249:74

可使用等位基因特异性杂交(ASH)鉴定本发明的遗传标记。ASH技 术基于短的单链寡核苷酸探针与单链靶核酸的完全互补序列的稳定退火。经 由结合到探针上的同位素或非同位素标记进行检测。

就每种多态性而言,设计两个或更多个不同的ASH探针,所述探针除 了多态核苷酸之外具有相同的DNA序列。每个探针与一个等位基因序列将 具有确切同源性以便探针的范围能够识别所有已知的可供选择的等位基因序 列。每个探针与靶DNA杂交。使用适当的探针设计和杂交条件,探针和靶 DNA之间的单碱基错配将阻止杂交。用这种方法,仅仅其中一个供选择探 针将与靶样品杂交,所述样品是与等位基因纯合的或同质的。两个等位基因 是杂合的或异质的样品将与两个供选择探针杂交。

使用ASH标记作为显性标记,其中是否存在仅一个等位基因通过仅一 个探针杂交或不杂交来确定。可供选择的等位基因可从不杂交的等位基因中 推断得到。ASH探针和靶分子任选地是RNA或DNA;靶分子是任何长度 的核苷酸,除了与探针互补的序列;设计探针与DNA靶的任一链杂交;确 认探针大小范围,不同的严格杂交条件等。

PCR使得ASH的靶序列从相对小量的低浓度核酸中扩增。此外用限制 性核酸内切酶消化来自基因组DNA的靶序列并通过凝胶电泳分离不同大小 的序列。随着靶序列结合到膜表面上,或者如美国专利5,468,613所述ASH 探针序列可结合到膜上,通常发生杂交。

在一个实施例中,ASH数据通过以下步骤获得:使用PCR从基因组 DNA中扩增核酸片段(扩增子),将扩增子靶DNA以点杂交形式转移到膜 上,将带标记物的寡核苷酸探针与扩增子靶杂交,以及通过放射自显影观察 杂交斑点。

单核苷酸多态性(SNP)是由共有序列组成的标记,该序列基于单核苷 酸而不同。通常,这种区别可通过包含SNP的扩增子在例如丙烯酰胺凝胶 上的不同迁移模式而被检测。然而,并不排除替代性的检测方法,如杂交, 例如ASH、或RFLP分析。

在用于提供遗传连锁图谱的另一种基本原理中,简单重复序列(SSR) 利用了基因组中高水平的二、三、四、五或六核苷酸串联重复。二核苷酸重 复已被报道以从10至60或更多变化的n值在人类基因组中发生多达50,000 次(Jacob等人(1991)Cell 67:213。二核苷酸重复在高等植物中也已被发 现(Condit和Hubbell(1991)Genome 34:66)。

简而言之,通过使引物与在SSR序列侧翼的植物基因组保守区域杂 交,产生了SSR数据。然后,PCR被用于扩增引物之间的核苷酸重复。然 后,对扩增的序列进行电泳,以确定其大小,并从而确定二、三、和四核苷 酸重复的数目。重复的数目使得有利等位基因与不利等位基因相区别。例如 在表7和表13中,提供了对于对核盘菌属的全植株大田抗性或对核盘菌属 的提高的全植株大田抗性有利的等位基因。

作为另外一种选择,同功酶标记被用作遗传标记。同功酶是酶的多样 形式,它们的氨基酸彼此不同,因此它们的核酸序列不同。一些同功酶是包 含些微不同的亚基的多聚体酶。其它同功酶是多聚体或单体,但是已经在氨 基酸序列的不同位点被从酶原上裂解。同功酶能够在蛋白水平上被表征和分 析,或者,在核酸水平上不同的同功能能够被测定。在这些情况下可使用本 文所述的任何基于核酸的方法分析同功酶标记。

在替代性实施例中,通过电脑的方法能够被用于检测标记基因座。例 如,包含所述标记的核酸序列能够被存储在电脑中。所期望的标记基因座序 列或其同源物能够使用合适的核酸搜索算法被鉴定,所述算法如由,例如, 诸如BLAST的易得的程序提供。

OTL作图

发展了多种实验范式,以鉴定和分析QTL。一般来讲,这些范式涉及 杂交一对或多对亲本,亲本的对能够是,例如,来源于两个近交系的一对, 或不同近交系或品系的多种相关或不相关的亲本,其各自表现出与所关注的 表型性状相关联的不同特性。对亲本和子代的种群进行基因分型,通常针对 多个标记基因座,并就所关注的性状进行评估。在本发明的上下文中,针对 任何的本文所例示的一种或多种分子标记、或与任何本文所例示的一种或多 种标记连锁的同源物或替代性标记,对亲本和子代植物进行基因分型,并就 对核盘菌属的全植株大田抗性或提高的全植株大田抗性进行评估。基于所评 估的子代植物的标记基因型和抗性表型之间的显著的统计相关性,鉴定了与 核盘菌属全植株大田抗性相关联的QTL。确定标记是否跟与对核盘菌属的 全植株大田抗性相关联的QTL(或其它标记)遗传上连锁的多种方法是本 领域的技术人员已知的,并且包括,例如,区间作图法(Lander和Botstein (1989)Genetics 121:185)、回归作图法(Haley和Knott(1992) Heredity 69:315)或MQM作图法(Jansen(1994)Genetics 138:871)。 此外,下列申请提供了关于可用于复杂的育种种群的替代性统计方法的附加 的细节,所述方法能够被用于鉴定和定位与核盘菌属全植株大田抗性相关联 的QTL:Beavis等人的USSN 09/216,089“QTL MAPPING IN PLANT  BREEDING POPULATIONS”和Jansen等人的PCT/US00/34971“MQM  MAPPING USING HAPLOTYPED PUTATIVE QTLS ALLELES:A SIMPLE  APPROACH FOR MAPPING QTLS IN PLANT BREEDING  POPULATIONS。”

标记辅助选择和植物育种

在作物中开发分子标记的主要动力是通过标记辅助选择(MAS)在植 物育种中提高效率。遗传标记等位基因,或者作为另外一种选择,被鉴定的 QTL等位基因,被用于鉴定在一个或多个基因座包含所期望的基因型、并 且预期将所期望的基因型与所期望的表型一起传递至它们的子代植物。遗传 标记等位基因(或QTL等位基因)能够被用于鉴定在一个基因座或若干个 不连锁或连锁基因座包含期望基因型的植物(例如单倍型),并且该植物预 期将所期望的基因型与所期望的表型一起传递至它们的子代。本发明提供了 通过鉴定具有特定等位基因(例如,在一个或多个本文所例示的标记、或在 本文所列的区间内的其它标记)的植物,鉴定抗性的、或表现出对核盘菌属 的提高的全植株大田抗性的植物,尤其是双子叶植物(例如,芸苔属)的方 法。类似地,通过鉴定缺少所述标记的期望的等位基因的植物,能够鉴定易 感的植物,并且,例如,将其从后续的杂交中排除。应当理解,就MAS的 目的而言,术语标记能够既涵盖标记又涵盖QTL基因座,因为二者都能够 被用于鉴定抗核盘菌属或具有对核盘菌属的提高的抗性的植物。

在所期望的表型(例如,核盘菌属全植株大田抗性)和多态性染色体 座位(例如,标记基因座或QTL)被确定为共分离之后,有可能利用这些 多态性基因座来选择对应于所期望的表型的等位基因——即被称为标记辅助 选择(MAS)的方法。简而言之,检测来自将进行选择的植物的生物样品 中对应于标记核酸的核酸。这种检测能够采取探针核酸与标记杂交的形式, 例如,使用等位基因特异性杂交、DNA印迹分析、RNA印迹分析、原位杂 交、引物杂交后进行标记区域的PCR扩增等。本文描述了检测标记的多种 方法,例如在题目为“标记基因座的检测”的部分。在确认在生物样品中存 在(或不存在)特定标记后,植物被选择,即,被用于通过选择性育种制备 子代植物。

植物育种者需要组合病害耐受性基因座与用于高产量和其它所期望的 性状的基因,以开发出改进的植物品种。对大量样品的病害筛选能够是昂 贵、耗时、和不可靠的。使用本文所述的多态性基因座和遗传上连锁的核酸 作为病害抗性基因座的遗传标记,是在育种程序中选择耐受性品种的有效方 法。例如,就病害抗性而言,标记辅助选择(MAS)相对于田间评价的一 个优点是,MAS能够在一年中的任何时间进行,不受生长季节的限制。此 外,环境效应与标记辅助选择无关。

当一个种群在分离影响一个或多个性状的多个基因座(例如涉及对单 种病害的抗性的多个基因座或每个涉及对不同病害的抗性的多个基因座) 时,MAS效率与表型筛选相比变得甚至更高,因为所有基因座能够从DNA 的单个样品中一起在实验室中被处理。在本发明的例子中,这意味着选自 AG0023;AG0045;AG0047;AG0070;AG0086;AG0093;AG0125; AG0148;AG0171;AG0203;AG0239;AG0243;AG0272;AG0304; AG0323;AG0324;AG0328;AG0359;AG0369;AG0370;AG0378; AG0391;AG0410;AG0441;AG0477;AG0482;AG0504;AG0510; BG0031;BG0106;BG0111;BG0119;BG0181;BG0228;BG0255; BG0278;BG0295;BG0452;BG0516;BG0647;BG0651;BG0713; BG0864;BG0869;BG0988;BG1062;BG1090;BG1101;BG1123; BG1127;BG1149;BG1182;BG1197;BG1230;BG1241;BG1244; BG1286;BG1288;BG1321;BG1368;BG1392;BG1442;BG1449; BG1453;BG1513;CA0105;CA0120;CA0163;CA0221;CA0226; CA0233;CA0328;CA0410;CA0423;CA0456;CA0488;CA0546; CA0552;CA0603;CA0614;CA0636;CA0681;CA0719;CA0736; CA0739;CA0753;CA0834;CA0837;CA0896;CA0991;CA1027; CA1032;CA1034;CA1035;CA1066;CA1080;CA1090;CA1097; CA1107;PE0012;PE0017;PE0063;PE0091;PE0131;PE0133; PE0177;PE0187;PE0203;PE0250;PE0281;PE0283;PE0286; PE0324;PE0340;PE0355;UB0015;UB0126;UB0163;UB0181; UB0196;UB0307;UB0315;UB0331;KK66;和KK98G或与它们同源的 或连锁的标记的多种标记,能够在单个样品或样品的群体中被同时地或顺序 地检测。因此,任何的一种或多种这些标记,例如,两种或更多种、至多 (并且包括)全部这些确定的标记,能够被同时地检测。在一些情况下,希 望评估对应于与核盘菌属全植株大田抗性相关联的每一连锁群的标记。

MAS在植物育种中的另一个用途是辅助通过回交育种恢复轮回亲本基 因型。回交育种是将子代与其亲本之一回交的方法。回交通常用于将来自供 体亲本的一个或一些基因座渗入来自轮回亲本的其它期望的遗传背景中。回 交进行的轮次越多,轮回亲本对所得的品种的遗传贡献越大。这常常是必需 的,因为耐受性植物否则可能是非期望的,即,因为低产量、低结实率等。 与此相反,作为高强度的育种程序的结果的品种可能具有优异的产量、结实 率等,只是缺乏一种所期望的性状如对特定病原体的抗性(例如,核盘菌属 全植株大田抗性)。

通过任何上文所列的方法,例如RFLP、AFLP、SSR等,确定特定遗 传标记基因座或其同源物在表现出优选的表型性状的植物基因组中的存在和 /或不存在。如果来自所述植物的核酸就所期望的遗传标记而言是阳性的, 则所述植物能够进行自交以产生具有相同基因型的真实遗传品系,或者其能 够与具有相同标记或具有其它所期望的特性的植物杂交,以产生两性杂交的 杂种世代。

如上文所述,技术人员将知道,本文所描述的QTL代表了包含有助于 植物的核盘菌属全植株大田抗性的基因的基因组区域。此外,每一QTL能 够不同地有助于该抗性水平。因此,育种工作指向了提高种质中存在的这些 QTL的数量,尤其是数量上重要的QTL。育种程序的早期,特定种质中可 能存在较少的QTL,但该数量将随着育种程序的进行而提高。因此,在某 些实施例中,表现出核盘菌属全植株大田抗性的植物可包含至少6个本文所 述的QTL。更具体地,所述植物可包含至少7、8、9或10个本文所述的 QTL。更加具体地,所述植物可包含11、12个或全部的本文所述的QTL。

定位克隆

本发明的分子标记和与其同源的核酸,能够如前文所述被用于鉴定另 外的连锁的标记基因座,其能够通过已完善建立的流程被克隆,例如,如 Ausubel、Berger和Sambrook(参见上文)中所详述的。类似地,示例性标 记以及任何另外的鉴定的连锁的分子标记,能够被用于在物理上分离(例 如,通过克隆)与有助于核盘菌属全植株大田抗性的QTL相关联的核酸。 此类核酸(即,与QTL连锁)具有多种用途,包括在随后的标记辅助选择 (MAS)的应用中作为遗传标记用于鉴定附加的QTL。

这些核酸首先通过它们与本发明的标记的遗传连锁而被鉴定。所关注 的核酸的分离通过很多方法实现,如在例如Ausubel、Berger和Sambrook, 参见上文,和Clark,编辑(1997)Plant Molecular Biology:A LaboratoryManual Springer-Verlag,Berlin的参考文献中所详细讨论的。

例如,定位基因克隆利用遗传标记的邻近性来在物理上限定与QTL连 锁的分离的染色体片段。能通过此类熟知的方法制备分离的染色体片段:如 用一种或多种限制性酶消化染色体DNA,或通过聚合酶链反应(PCR)、 或替代性的扩增反应扩增染色体区域。经消化或扩增的片段通常被连接至适 合复制和任选地表达所插入片段的载体(例如,质粒、粘性质粒、噬菌体、 人工染色体等)中。邻近与表型性状关联的开放阅读框(ORF)的标记能与 DNA克隆杂交,从而鉴定ORF位于其上的克隆。如果标记距离较远,通过 连续若干轮筛选和分离克隆,鉴定包含开放阅读框的片段,其共同包含连续 的DNA序列——“重叠群”。足以指导技术人员分离与连锁标记关联的克 隆的规程见于,例如Berger、Sambrook和Ausubel,全部参见上文。

邻近标记的核酸/分离的染色体区间

本发明提供了包含与核盘菌属全植株大田抗性相关联的QTL的分离的 核酸。所述QTL邻近本文所述的标记和/或被定位在由本发明的两个标记限 定的区间内,其中每一标记位于所述QTL的侧翼。此类核酸和/或区间能够 被用于鉴定同源的核酸和/或能够被用于产生具有通过所导入的QTL赋予的 对核盘菌属的全植株大田抗性的转基因植物。所述核酸和/或包含QTL的染 色体区间被分离,例如,通过上文所述的定位克隆方法被克隆。染色体区间 能够包含一个或多个与抗性相关联的ORF,并且能够被克隆在一个或多个 单独的载体上,例如,根据所述染色体区间的大小。

应当理解,本领域中有多种载体可用于本发明的核酸的分离和复制。 例如,质粒、粘性质粒和噬菌体载体是本领域中为人们所熟知的,并且足够 用于许多应用(例如,用于涉及从小于1至约20千碱基(kb)范围的核酸 的插入的应用)。在某些应用中,制备或克隆大的核酸,来鉴定更远地与给 定标记连锁的核酸、或分离超过10-20kb的核酸(例如,多达数百千碱基或 更多,如在与如本文鉴定的QTL连锁的两个连锁的标记之间的整个区间, 即多达并且包括一个或多个厘摩(cM)),是有利的。在这种情况下,本 领域中有多种能够容纳大核酸的载体可用,这些包括酵母人工染色体 (YAC)、细菌人工染色体(BAC)、植物人工染色体(PAC)等。对作 为人工染色体的YAC、BAC、PAC和MAC的一般性介绍参见,例如, Monaco和Larin(1994)Trends Biotechnol.12:280。此外,用于体外扩增 与遗传标记连锁的大核酸的方法是普遍地可用的(例如,Cheng等人 (1994)Nature 369:684,以及其中的参考文献)。克隆体系能够被构建或 商品化地获得;参见,例如,Stratagene Cloning Systems,目录2000(La  Jolla,CA)。

转基因植物和细胞的产生

本发明还涉及用对应于根据本发明鉴定QTL和其它基因的核酸转化的 宿主细胞和生物体。例如,此类核酸包括染色体区间、ORF、和/或 cDNA,或对应于包括在所鉴定的染色体区间或ORF内的序列或子序列。此 外,本发明提供了对应于QTL的多肽通过重组技术的生产。宿主细胞是用 本发明本发明的载体(即,包含根据本发明的方法鉴定的QTL或其它核酸 并且如上文所述的载体)遗传工程化(即,转导、转染或转化)的,所述载 体包括,例如,克隆载体或表达载体。除了上文描述的那些之外,此类载体 还包括,例如,农杆菌属(agrobacterium)、病毒(例如植物病毒)、 “裸”多核苷酸、或偶联的多核苷酸。载体通过多种标准方法被导入植物组 织、培养的植物细胞或植物原生质体,所述方法包括电穿孔(From等人 (1985)Proc.Natl.Acad.Sci.USA 82;5824)、病毒载体如花椰菜花叶病 毒(CaMV)感染(Hohn等人(1982)Molecular Biology of Plant Tumors(Academic Press,New York,第549-560页);Howell美国专利 4,407,956)、用在微球或颗粒基质内或表面上具有核酸的微粒进行高速轰 击穿入(Klein等人(1987)Nature 327;70)、用花粉作载体(WO 85/01856)、或用携带在其中克隆了DNA片段的T-DNA质粒的根癌农杆菌 (Agrobacterium tumefaciens)或发根农杆菌(A.rhizogenes)。T-DNA质粒 通过根癌农杆菌感染被传递到植物细胞中,并且一部分T-DNA质粒被稳定 整合进植物基因组中(Horsch等人(1984)Science 233;496;Fraley等人 (1983)Proc.Natl.Acad.Sci.USA 80;4803)。将本发明的核酸导入宿主 细胞的方法对于本发明而言并非关键。因此,能够使用提供了核酸向细胞或 原生质体内的有效导入的任何方法,例如,包括但不限于上文的例子。

可在常规营养物质培养基中培养工程化宿主细胞,所述培养基经合适 的改性以获得此类活性如活化启动子或选自转化体。可任选地培养这些细 胞,使它们进入转基因植物。从培养的原生质体中再生植物描述于Evans等 人((1983)“Protoplast Isolation and Culture,”Handbook of Plant Cell  Cultures 1,124-176(MacMillan Publishing Co.,New York);Davey ((1983)“Recent Developments in the Culture and Regeneration of Plant  Protoplasts,”Protoplasts,第12-29页,(Birkhauser,Basel));Dale ((1983)“Protoplast Culture and Plant Regeneration of Cereals and Other  Recalcitrant Crops,”Protoplasts,第31-41页,(Birkhauser,Basel));和 Binding((1985)“Regeneration of Plants,”Plant Protoplasts,第21-73页, (CRC Press,Boca Raton))。

本发明还涉及用核酸(例如,克隆的本发明的QTL)转导的转基因生 物的产生,所述转基因生物可以是细菌、酵母、真菌、或植物。与细菌、单 细胞真核生物和细胞培养物有关的技术的详细讨论可见于上文列举的参考文 献并在下文中略述。将靶核酸导入细菌细胞的若干种熟知方法是可用的,本 发明可使用任何一种方法。这些包括:使受体细胞与包含DNA的细菌原生 质体融合、用包含DNA的脂质体处理细胞、电穿孔、抛射体轰击(基因 枪)、碳纤维输送、和用病毒载体感染(详述于下文)等。细菌细胞能够被 用于扩增包含本发明的DNA构建体的质粒的数量。细菌生长至对数期,并 且细菌中的质粒能够通过本领域已知的多种方法分离(参见,例如, Sambrook)。此外用于纯化来自细菌的质粒的多种试剂盒是可商购获得 的。按照制造商的说明书正确地使用它们(参见,例如,EasyPrepTM、 FlexiPrepTM,它们都来自Pharmacia Biotech;StrataCleanTM,来自Stratagene; 以及QIAprepTM,来自Qiagen)。然后进一步操纵经分离和纯化的质粒以制 备其它质粒,所述质粒用于转染植物细胞或整合进根癌农杆菌相关载体以感 染植物。一般的载体包含转录和翻译终止子、转录和翻译启动序列、以及用 于调控特定靶核酸表达的启动子。载体任选地包含遗传表达盒,该表达盒包 含至少一个独立的终止子序列、允许该盒在真核生物或原核生物或两种细胞 中均复制的序列(例如穿梭载体)以及用于原核系统和真核系统的选择标 记。载体适于在原核生物、真核生物、或优选两者中复制并整合。参见, Giliman和Smith((1979)Gene 8:81);Roberts等人((1987)Nature328:731);(Schneider等人(1995)Protein Expr.Purif. 6435:10); Ausubel、Sambrook、Berger(全部参见上文)。由例如美国典型培养物保 藏中心(ATCC)提供了用于克隆的细菌和噬菌体的目录,例如,TheATCC Catalogue of Bacteria and Bacteriophage(1992)Gherna等人(编 辑),ATCC出版。关于测序、克隆和分子生物学的其它方面的附加的基本 流程,以及作为基础的理论上的考量可见于Watson等人(1992) Recombinant DNA,第二版,Scientific American Books,NY。

将核酸转入植物

本发明的实施例涉及包含本发明的克隆的核酸(例如,与QTL相关联 的染色体区间、分离的ORF、和cDNA)的转基因植物的生产。用于用核 酸转化植物细胞的技术是普通地可获得的,并且能够通过使用编码或对应于 QTL、QTL同源物、分离的染色体区间等的核酸,适用于本发明。除 Berger、Ausubel和Sambrook之外,关于植物细胞克隆、培养和再生的有用 的一般性参考文献包括Jones(编辑)((1995)Plant Gene Transfer and  Expression Protocols-- Methods in Molecular Biology,第49卷Humana Press  Towata NJ);Payne等人((1992)Plant Cell and Tissue Culture in LiquidSystems John Wiley & Sons,Inc.New York,NY(Payne));和Gamborg 和Phillips(编辑)((1995)Plant Cell,Tissue and Organ Culture;Fundamental Methods Springer Lab Manual,Springer-Verlag  (Berlin  Heidelberg New York)(Gamborg))。多种细胞培养培养基描述于Atlas 和Parks(编辑)(The Handbook of Microbiological Media(1993)CRC  Press,Boca Raton,FL(Atlas))中。植物细胞培养的附加信息可见于可 商购获得的文献如Life Science Research Cell Culture Catalogue(1998),得 自Sigma-Aldrich,Inc.(St Louis,MO)(Sigma-LSRCCC),以及,例 如,Plant Culture Catalogue and supplement(1997),同样得自Sigma- Aldrich,Inc.(St Louis,MO)(Sigma-PCCS)。关于植物细胞培养的附加 细节可见于Croy,(编辑)((1993)Plant Molecular Biology Bios  Scientific Publishers,Oxford,U.K.)。

通过多种常规技术将本发明的核酸构建体如质粒、黏性质粒、人工染 色体、DNA和RNA多核苷酸导入在培养物或植物器官中的植物细胞。其中 表达所述序列,该序列任选地与转录和翻译启动调控序列结合,所述调控序 列在转化植物的目标组织中指导来自外源DNA的序列的翻录或翻译。

可根据本领域已知的多种技术将本发明的分离的核酸导入植物。用于 转化多种高等植物物种的技术也是为人们所熟知的,并且被描述于技术、科 学、和专利文献中。参见,例如,Weising等人(1988)Ann.Rev.Genet.22:421-477。

本发明的DNA构建体,例如,质粒、噬菌粒、粘性质粒、噬菌体、裸 多核苷酸或多种偶联的DNA多核苷酸(例如,聚赖氨酸偶联的DNA、多肽 偶联的DNA、脂质体偶联的DNA等)、或人工染色体,能够利用诸如电穿 孔和显微注射植物细胞原生质体的技术,被直接导入植物细胞的基因组 DNA,或者所述DNA构建体能够利用基因枪方法如DNA颗粒轰击,被直 接导入植物细胞。

用于注射,例如,细胞、胚芽、愈伤组织和原生质体,的显微注射技 术,是本领域已知的并详述于科学和专利文献中。例如,多种方法描述在 Jones(编辑)((1995)Plant Gene Transfer and Expression Protocols--Methods in Molecular Biology,第49卷Humana Press Towata NJ),以及本 文提及的其它参考文献中,并可见于文献中。

例如,使用聚乙二醇沉淀导入DNA构建体,描述于Paszkowski等人 (EMBO J.3:2717(1984))。电穿孔技术描述于Fromm等人(Proc.Nat’l.Acad.Sci.USA 82:5824(1985))。基因枪转化技术描述于Klein等 人(Nature 327:70-73(1987))。附加的细节见于Jones(1995)和 Gamborg和Phillips(1995),参见上文,以及美国专利5,990,387中。

作为另外一种选择,农杆菌属介导的转化被用于产生转基因植物。农 杆菌属介导的转化技术,包括二元载体的解毒和使用,也详述于科学文献 中。参见,例如,Horsch等人(1984)Science 233:496;和Fraley等人 (1984)Proc.Nat’l.Acad.Sci.USA 80:4803,并且综述于Hansen和 Chilton(1998)Current Topics in Microbiology 240:22和Das(1998) Subcellular Biochemistry 29:Plant Microbe Interactions第343-363页中。

DNA构建体可与合适的T-DNA侧接区域结合并被导入常规的根癌农 杆菌宿主载体。当根癌农杆菌感染细胞时,根癌农杆菌宿主的致病功能将引 导构建体和邻近的标记插入植物细胞DNA。参见美国专利5,591,616。尽管 农杆菌属主要用于双子叶植物,但某些单子叶植物能够被农杆菌属转化。例 如,玉米的农杆菌属转化描述于美国专利5,550,318中。

转染或转化的其它方法包括(1)发根农杆菌介导的转化(参见,例 如,Lichtenstein和Fuller(1987):Genetic Engineering,第6卷,PWJ  Rigby,编辑,London,Academic Press;和Lichtenstein;C.P.,和Draper (1985):DNA Cloning,第II卷,D.M.Glover编辑,Oxford,IRI  Press);WO 88/02405,公布于1988年4月7日,描述了发根农杆菌菌株 A4和其Ri质粒与根癌农杆菌载体pARC8或pARC16一起的使用,(2)脂 质体介导的DNA摄入(参见,例如,Freeman等人(1984)Plant CellPhysiol.25:1353),(3)涡旋方法(参见,例如,Kindle(1990)Proc.Natl.Acad.Sci.,(USA)87:1228)。

DNA还能够通过向花粉中直接的DNA转入被导入植物,如Zhou等人 ((1983)Methods in Enzymology,101:433);Hess((1987)Intern Rev.Cytol.107:367);和Luo等人((1988)Plant Mol.Biol.Reporter 6: 165)所述。可通过将DNA注入植物生殖器官获得多肽编码基因的表达, 如Pena等人((1987)Nature 325:274)所述。也可将DNA直接注入未成 熟胚芽和再水化的干燥胚芽细胞中,如Neuhaus等人((1987)Theor.Appl.Genet.75:30);和Benbrook等人((1986)在Proceedings Bio ExpoButterworth,Stoneham,Mass.,第27-54页)所述。可用作载体的多种植物 病毒是本领域已知的并包括花椰菜花叶病毒(CaMV)、双生病毒、雀麦花 叶病毒、和烟草花叶病毒。

转基因植物的再生

可培养通过任何一种上述转化技术获得的转化植物细胞以再生具有转 化的基因型并因此具有所期望的表型的完整植株。此类再生技术依靠操纵在 组织培养物生长培养基中的某些植物激素,通常依靠与所期望的核苷酸序列 一起被导入的生物杀灭剂和/或除草剂标记。从培养的原生质体中再生植物 描述于Evans等人((1983)Protoplasts Isolation and Culture,Handbook of  Plant Cell Culture,第124-176页,Macmillian Publishing Company,New  York);和Binding((1985)Regeneration of Plants,Plant Protoplasts第21- 73页,CRC Press,Boca Raton)。也可从植物愈伤组织、外植体、体细胞 胚芽(Dandekar等人(1989)J.Tissue Cult.Meth.12:145;McGranahan等 人(1990)Plant Cell Rep.8:512)器官、或它们的部分实现再生。此类再 生技术一般性地描述于Klee等人((1987)Ann.Rev.of Plant Phys.38: 467-486)中。附加的细节见于Payne(1992)和Jones(1995),均参见上 文,以及Weissbach和Weissbach编辑,((1988)Methods for Plant  Molecular Biology Academic Press,Inc.,San Diego,CA)。这种再生和生 长过程包括以下步骤:选择转化的细胞和苗,使转化体苗生根,并在土壤中 使小植物生长。使这些方法适合于本发明,以制备携带根据本发明的方法分 离的QTL和其它基因的转基因植物。

此外,包含通过农杆菌属被导入叶片外植体细胞的本发明的多核苷酸 的植物的再生,能够如Horsch等人((1985)Science 227:1229-1231)所 述实现。该方法中,转化体选择剂的存在下生长于诱导被转化的植物物种幼 苗再生的培养基中,如Fraley等人((1983)Proc.Natl.Acad.Sci.(U.S.A.)80:4803)所述。该方法通常在二至四周内生成苗,然后将这些 转化体苗转移到合适的苗诱导培养基中,该培养基包含选择剂和防止细菌生 长的抗生素。本发明的转基因植物可为能繁殖的或不能繁殖的。

用于转化和表达对核盘菌属的全植株大田抗性关联的QTL以及根据本 发明鉴定和克隆的其它核酸的植物包括但不限于,农学上和园艺学上重要的 物种。此类物种主要包括双子叶植物,例如,以下的科的:十字花科 (Brassicaceae)、豆科(Leguminosae)(包括豌豆、豆、兵豆、花生、豆 薯、豇豆、藜豆、大豆、三叶草、苜蓿、羽扇豆、野豌豆、莲、草木樨、紫 藤、和香豌豆);以及,菊科(维管植物中最大的科,包括至少1,000个 属,包括重要的经济作物如向日葵)。

此外,用于用本发明的核酸改造的靶,以及上文指明的那些,来自下 列的属的植物:葱属(Allium)、芹属(Apium)、花生属(Arachis)、芸 苔属(Brassica)、辣椒属(Capsicum)、鹰嘴豆属(Cicer)、黄瓜属 (Cucumis)、南瓜属(Curcubita)、胡萝卜属(Daucus)、荞麦属 (Fagopyrum)、大豆属(Glycine)、向日葵属(Helianthus)、莴苣属 (Lactuca)、兵豆属(Lens)、蕃茄属(Lycopersicon)、苜蓿属 (Medicago)、豌豆属(Pisum)、菜豆属(Phaseolus)、茄属 (Solanum)、三叶草属(Trifolium)、豇豆属(Vigna)、和许多其它的。

是本发明的靶标的普通作物植物包括大豆、向日葵、油菜、豌豆、 豆、扁豆、花生、豆薯、豇豆、藜豆、三叶草、苜蓿、羽扇豆、野豌豆、草 木樨、香豌豆、红豌豆、蚕豆、西兰花、抱子甘蓝、卷心菜、花椰菜、羽衣 甘蓝、大头菜、芹菜、莴苣、胡萝卜、洋葱、辣椒、土豆、茄子、和番茄。

在本发明的重组表达盒构建过程中(表达盒包括,例如,包含致病功 能的辅助质粒、以及包含外源DNA序列如结构基因的质粒或病毒),植物 启动子片段被任选地用于指导核酸在再生的植物的任何或全部组织中表达。 组成型启动子的例子包括花椰菜花叶病毒(CaMV)35S转录初始区、来源 于根癌农杆菌的T-DNA的1′-或2′-启动子、以及来自技术人员已知的多种植 物的其它转录初始区。作为另外一种选择,植物启动子可在特定组织中引导 本发明多核苷酸的表达(组织特异性启动子),或者否则可在较精确的环境 控制条件下引导本发明多核苷酸的表达(诱导型启动子)。处于发育控制下 的组织特异性启动子的例子包括仅在某些组织,例如果实、种子、或花中启 动转录的启动子。

在植物细胞中引导转录的多个启动子中的任何的能够是适合的。该启 动子可为组成型启动子或诱导型启动子。除上述启动子外,在植物中起作用 的细菌来源启动子还包括章鱼碱合酶启动子、胭脂碱合酶启动子和其它来源 于天然Ti质粒的启动子。参见,Herrara-Estrella等人((1983),Nature, 303:209)。病毒启动子包括花椰菜花叶病毒35S和19S RNA启动子。参 见,Odell等人((1985)Nature,313:810)。其它植物启动子包括核酮 糖-1,3-二磷酸羧化酶小亚基启动子和菜豆蛋白启动子。也可使用来自E8基 因和其它基因的启动子序列。E8启动子的分离和序列详述于Deikman和 Fischer((1988)EMBO J.7:3315)。当前使用许多其它启动子,并且能 将启动子连接到外源DNA序列上以引导核酸表达。

如果期望表达多肽,包括由与本发明的表型性状相关联的QTL或其它 核酸编码的那些,在编码区的3′-末端的聚腺苷酸化区域通常是被包括的。 该聚腺苷酸化区可源自天然基因、源自多种其它植物基因或源自例如T- DNA。

包含来自编码表达产物的基因的序列(例如,启动子或编码区)和本 发明的转基因的载体,将通常包括核酸子序列、赋予植物细胞可选择的或者 可筛选的表型的标记。例如,所述标记可编码生物杀灭剂抗性,尤其是抗生 素抗性,例如对卡那霉素、G418、博莱霉素、潮霉素的抗性,或除草剂抗 性,例如对氯磺隆、或草胺膦(除草剂双丙氨膦或Basta的活性成分)的抗 性。参见,例如,Padgette等人(1996):Herbicide-Resistant Crops(Duke 编辑),第53-84页,CRC Lewis Publishers,Boca Raton(“Padgette, 1996”)。例如可通过工程化基因到作物中赋予作物对特定除草剂的选择 性,所述基因编码来自其它生物如微生物的合适的除草剂代谢酶。参见 Vasil(1996):Herbicide-Resistant Crops(Duke编辑),第85-91页,CRC  Lewis Publishers,Boca Raton)(“Vasil”,1996)。

技术人员将认识到在将重组表达盒稳定地导入转基因植物中并确认其 可操作后,可通过有性杂交将其导入其它植物。取决于将进行杂交的物种, 可使用多种标准育种技术中的任何一种。在无性繁殖作物中,成熟的转基因 植物能通过插枝或组织培养技术来繁殖以制备多个相同植物。选择期望转基 因并获取新品种,将其无性繁殖用于商业。在种子繁殖的农作物中,成熟的 转基因植物可以自交而产生纯合的自交系植物。自交植物产生包含新导入的 异源核酸的种子。这些种子可生长以产生植物,该植物将产生所选择的表 型。本发明包括从再生的植物获取的部分,例如花、种子、叶片、枝、果实 等,前提条件是这些部分包含具有本发明的分离的核酸的细胞。再生的植物 的子代和变型、以及突变体也在本发明的范围内,前提条件是这些部分包含 导入的核酸序列。

通过,例如,标准的免疫印迹和DNA检测技术,能够针对本发明的核 酸的传递,筛选表达本发明的多核苷酸的转基因植物。能够首先测定RNA 水平的表达,以鉴定和测定阳性表达的植物。能够使用RNA分析的标准技 术,所述技术包括使用设计为仅扩增异源RNA模板的寡核苷酸引物的PCR 扩增检测法,以及使用异源核酸特异性探针的溶液杂交检测法。然后,通过 使用本发明的特异性地反应的抗体的Western免疫印迹分析,能够就蛋白质 的表达对RNA阳性的植物进行分析。此外,能够根据标准规程进行原位杂 交和免疫细胞化学分析,该分析分别使用异源核酸特异性多核苷酸探针和抗 体来定位在转基因组织中的表达位点。通常筛选许多转基因品系的导入核酸 以鉴定和选择具有最适合的表达谱的植物。

一个实施例是就加入的异源核酸而言是纯合的转基因植物;即,包含 两段加入的核酸序列的转基因植物,一个基因在染色体对的每一染色体上的 相同基因座。通过有性交配(自交)包含单种加入的异源核酸的杂合的转基 因植物、使一些产生的种子发芽和针对相对于对照植物(即,天然的、非转 基因的)的本发明的多核苷酸改变的表达分析所得到的植物,能够获得纯合 的转基因植物。还设想了与亲本植物的回交和与非转基因的植物的异交。

高通量筛选

在本发明的一个方面,遗传标记等位基因的测定是通过高通量筛选进 行的。高通量筛选涉及提供遗传标记的文库,例如RFLP、AFLP、同功酶、 特异性等位基因和可变序列,包括SSR。然后针对植物基因组筛选此类文 库,以产生被研究的每一植物的“指纹”。在一些情况下,在所关注的区域 中产生了包含所述标记的子部分的局部指纹。鉴定了植物的遗传标记等位基 因之后,基于本发明的方法,通过统计学关联性确定一个或多个标记等位基 因和所期望的表型性状之间的对应性。

高通量筛选能够以许多不同的形式进行。杂交能够以96-、324-、或 1524-孔形式,或在硅芯片上的矩阵中或以其它形式发生。

在一种常用的形式中,斑点杂交设备被用于使片段化并且变性的基因 组DNA的样品沉积在尼龙或硝化纤维膜上。在通过暴露于紫外光或通过热 使核酸与膜交联之后,用带标记物的杂交探针孵育所述膜。标记物通过任何 的多种本领域中为人们所熟知的方法被掺入核酸探针。洗涤膜,以除去未杂 交的探针,测定标记物与靶核酸序列的缔合。

已开发了多种众所周知的机器人系统用于高通量筛选,尤其是以96孔 的形式。这些系统包括类似由Takeda Chemical Industries,LTD.(Osaka, Japan)开发的自动化合成设备的自动化工作站,和许多利用机械臂的机器 人系统(Zymate II,Zymark Corporation,Hopkinton,MA.;ORCATM, Beckman Coulter,Fullerton CA)。任何的上述设备均适合用于本发明。用 于使得这些设备能够如本文所讨论的运行的对这些设备的调整(如果有任何 此类调整的话)的性质和实施,对相关领域的技术人员而言将是显而易见 的。

此外,高通量筛选系统自身是可商购获得的(参见,例如,Zymark  Corp.,Hopkinton,MA;Air Technical Industries,Mentor,OH;Beckman  Instruments,Inc.Fullerton,CA;Precision Systems,Inc.,Natick,MA 等)。这些系统通常自动化整个的流程,包括全部的样品和试剂移液、液体 的分配、定时孵育、以及最终在适合该检测的检测器中对微孔板或膜的读 数。这些可配置的系统提供了高通量和快速启动以及高度的灵活度和用户定 制化。此类系统的制造商提供了用于在高通量应用中使用它们的产品的详细 的规程。

在本发明的一个变型中,固相阵列被用于快速和特异性地检测多种多 态性核苷酸。通常,核酸探针被连接至固体支持体,靶核酸则与探针杂交。 探针、或靶、或二者都能够被(通常是被荧光基团)标记。如果靶是被标记 的,通过检测结合的荧光评估杂交。如果探针是被标记的,杂交通常通过结 合的核酸使标记物的淬灭而被检测。如果探针和靶都是被标记的,杂交的检 测通常通过监测两种结合的标记物的邻近导致的色移进行。

在一个实施例中,在固体支持体上合成了探针的阵列。通过芯片掩盖 技术和光保护化学,有可能产生定制的核酸探针阵列。这些被称为,例如, “DNA芯片”或超大规模固定化聚合物阵列(VLSIPSTM阵列)的阵列能够 在具有约1cm2至几cm2的面积的基质上包括以百万计的限定的探针区域。

在另一个实施例中,毛细管电泳被用于分析多态性。当多态性是基于 大小时,例如,AFLP和SSR,该技术的效果最好。该技术详细描述于美国 专利5,534,123和5,728,282中。简而言之,用分离基质填充毛细管电泳管。 分离基质包含羟乙基纤维素、尿素和任选的甲酰胺。AFLP或SSR样品被上 样至毛细管上,并进行电泳。由于毛细管电泳只需少量的样品和分离基质, 运行时间是非常短的。通过本文所述的技术测定了分子大小,并从而测定了 核酸样品中存在的核苷酸的数量。在高通量形式中,许多毛细管被置于毛细 管电泳设备中。样品被上样至这些管上,并且样品的电泳同时地进行。参 见,Mathies和Huang(1992)Nature 359:167。

整合的系统

由于在一个阵列中存在的可能的组合数量庞大,在本发明的一个方 面,整合的体系如计算机、对应于本发明的统计模型的软件、以及对应于遗 传标记和表型值的数据集,帮助了对表型性状包括QTL的作图。在本发明 的上下文中,短语“整合的系统”是指这样一种系统:其中进入计算机的数 据对应于物理目标或电脑的外部处理,例如,核酸序列杂交和在计算机内的 处理,该处理引起输入信号被物理转化成不同的输出信号。换句话讲,输入 数据,例如,在阵列上特定区域的杂交,被转化为输出数据,例如,杂交的 序列的鉴定。计算机内的处理是一套指令或“程序”,由此通过整合系统识 别阳性杂交信号并将个体样品归为基因型。附加的程序将各个样品的基因 型,更具体地在本发明的方法中为单倍型,与表型值相关联,例如,使用本 发明的HAPLO-IM+、HAPLO-MQM、和/或HAPLO-MQM+模型。例如,程 序和尤其适合这种类型的分析,并且能够被扩展为包括 本发明的HAPLO-IM+、HAPLO-MQM、和/或HAPLO-MQM+模型。此外, 存在多种的,例如,用于计算的C/C++程序、用于GUI界面的Delphi和/或 Java程序、和用于制图工具的Active X应用(例如,Olectra Chart和True  WevChart)。在本发明的整合系统中其它有用的软件工具包括统计软件包 如SAS、Genstat、和S-Plus。此外,附加的程序语言如Fortran等也适用于 本发明的整合系统。

在一个方面,本发明提供包括计算机或计算机可读介质的整合系统, 所述介质包含具有至少一个对应于对遗传标记的基因分型的数据集的数据 库。所述系统还包括用户界面,允许使用者选择性地查阅一个或多个数据 库。此外,还能够使用标准文本处理软件如字处理软件(例如Microsoft  WordTM或Corel WordperfectTM)以及数据库或电子表格软件(例如,电子表 格软件如Microsoft ExcelTM、Corel Quattro ProTM、或数据库程序如Microsoft  AccessTM或Paradox)与用户界面(例如,在标准操作系统如Windows、 Macintosh、或Linux系统中的GUI)一起操纵字符串。

本发明还提供了用于包含了如前文所述的机器人装置的样品操作的整 合系统。机械手液体控制电枢用于将溶液(例如植物细胞提取物)从一个来 源转移到目的地,例如从微滴定板转移到阵列基质,任选地,将该电枢可操 作地连接至数字计算机(或者连接至整合系统中的附加的计算机)。输入装 置一般是整合系统的一个特征,该装置用于将数据输入数字电脑以通过机械 手液体控制电枢控制高通量液体转移,并且任选地通过电枢控制到固体载体 的转移。

用于本发明的遗传标记分析的整合系统通常包括数字计算机,它具有 一个或多个高通量液体控制软件、图像分析软件、数据解释软件、可操作地 连接至数字计算机的用于将溶液从一个来源转移到目的地的机械手液体控制 电枢、用于输入数据到数字计算机中以通过机械手液体控制电枢控制高通量 液体转移的输入装置(例如计算机键盘)、以及任选地用于数字化来自带标 记的探针的标记物信号的图像扫描仪,所述探针,例如,在可操作地连接至 数字计算机的固体支持体上与表达产物杂交。图像扫描仪界面具有图像分析 软件,用以提供对,例如,当与阵列样品核酸群体杂交时的不同的核酸探针 标记强度的测量,其中探针标记强度测量由数据解释软件进行解释以显示标 记探针与标记物是否杂交以及杂交到何种程度。然后,使用本发明的统计学 模型,如此产生的数据被与表型值相关联,以确定表型和对遗传标记的基因 分型之间的对应性,从而确定染色体位置。

光学图像,例如通过照相机或其它记录装置(例如,光电二极管和数 据存储装置)观察到(并任选地记录)的杂交模式,在本发明的任何实施例 中被任选地进一步处理,例如,通过数字化所述图像和/或在计算机上存储 和分析该图像。多种可商购获得的外围设备和软件可用于数字化、存储并分 析数字化的视频或数字化的光学图像,例如使用PC(基于Intel x86或 pentium芯片兼容的DOSTM、OS2TM WINDOWSTM、WINDOWS NTTM或 WINDOWS95TM的机器),基于MACINTOSHTM、LINUX、或UNIX(例 如,SUNTM工作站)的计算机。

试剂盒

还提供了试剂盒以帮助针对本发明的标记筛选种质。试剂盒包括本发 明的多核苷酸、其片段或互补序列,它们作为探针或引物用于检测核盘菌属 全植株大田抗性或对核盘菌属的提高的全植株大田抗性的标记。使用所述多 核苷酸的说明书、以及缓冲剂和/或其它溶液也可被提供,以帮助使用所述 多核苷酸。所述试剂盒对于高通量筛选,具体地,使用整合系统的高通量筛 选,是有用的。

实例

下列实验方法和结果提供了关于与本发明的实施相关的规程和方法的 特定方面的附加的细节。不受限制地提供了用于说明受权利要求书保护的本 发明的实例,这些实例涉及本领域的技术人员所熟知的、并且详述于本文引 用的参考文献中的规程的应用。实例1-6描述了一个甘蓝型油菜(Brassica  napus)作图种群的分析。实例7-10描述了不同的甘蓝型油菜(Brassica  napus)作图种群的分析。

实例1:作图种群1

用于所述作图种群的亲本是04DHS11418(一种核盘菌属抗性双单倍 体,作为ATCC登录号PTA-6778被保藏)和PHI2004HS1(一种相对于抗 性品系具有多态性的非抗性的卡诺拉DH品系,因其具有相似的农学表型并 且在04DHS11418品系在其中因抗性而被选择的测试环境中具有稳定的高易 感性而被选择)(参见表2)。这些品系被用于产生由186个子代组成的双 单倍体作图种群。

表2:测量在极端的病害压力下的大田表现(研究试验)

*SSDI%:核盘菌病害发生率%。SSDI%是针对与预期的04DHS11418(25%) 和PHI2004HS1(75%)检验平均值的偏差调整的UNSSDI评分(其中UNSSDI是种群 中被核盘菌属感染的植物的百分比),如表4中所述。上述评分仅在受控的极端病害压 力大田研究条件下使用。它是通过用观察的SSDI%乘以因子X计算的,其中因子X是 使适当的检验的平均SSDI%变成50%的因子。没有进行针对严重程度的调整。

**SSDIS:核盘菌SSDIS是针对与春性卡诺拉在极端病害压力下的预期的检验 46A65/46A76的平均值的偏差调整的UNSSDI评分。它是通过用观察的UNSSDI乘以因 子X计算的,其中因子X是使适当的检验的平均SSDI%变成50%的因子。在发生率调 整之后进行了针对严重程度的调整。

UNSSDS是受影响的植物上病害发展程度的评分。本发明中使用了两种量度标 准。先驱SSDS量度范围是从1(死亡)至9(无病害)而公用量度范围是从0(无病 害)至5(死亡)植株。关于先驱SSDS量度标准的细节,参见WO 2006/135717的表 15。公用量度标准提供如下:0=无病害;1=表面病变或小的分枝受影响;2=大的分枝 死亡;3=主要的茎至少50%缠绕;4=主要的茎缠绕,但植株产生良好的种子;5=主要 的茎缠绕,大量减产。

两种亲本均具有良好的抗倒伏性。因此,抗倒伏性或倒伏耐受性是固 定的,从而在作图过程中排除了这个变量。高度易感品系的选择导致了没有 超亲分离的种群(即,全部的抗性来自04DHS11418,并且没有DH子代品 系是比抗性亲本抗性更高的)。经过四年的时间,对上述种群在大田中进行 表型分析,并用SSR分子标记进行基因分型。表型分析如WO 2006/135717 中所述进行,其完整的教导内容以引用方式并入本文。

实例2:RNA表达谱

使用04DHS11418、PHI2004HS1、抗性的和易感的批次(包括易感的 和抗性的双单倍体(DH)子代)进行了RNA表达谱实验。使用了未受损的 叶组织(没有接种的)、以及用菌丝接种后6、24和48小时取样的叶组 织。通过用包含芸苔属(85,820)和拟南芥属(Arabidopsis)(17,617)胁 迫相关的核酸序列的芯片对不同的批次进行探针检测,进行了RNA表达谱 分析。多种与核盘菌属病害抗性相关的基因或与果胶相关的基因(这些基因 与细胞壁完整性相关)在用菌丝接种后6、24和48小时处是上调的。结果 的总结可见于表3中。在抗性的和易感的品系中对这些基因中的一些进行了 测序,以发现任何的SNP。然后,这些SNP被加入到基因图谱中(被称为 KK)。

表3:在不同的处理时间上调的病害相关基因的数量

实例3:核盘菌属筛选

病害评分

针对病害对如实例1中所述产生的双单倍体作图种群的植株进行评 分,如表4中所述。未调整的参数(例如,UNSSDI和UNSSDS)显示了由 于环境的变化如在大田中位置的变化和气象条件导致的逐年变化。此类变化 将是本领域的技术人员预期的。

表4:大田收集的核盘菌属(Sclerotinia)参数UNSSDI和UNSSDS以及它们与衍生的参数SSDI%、SSDIS(研究数据)和SSFS(天然/研究数据)的关系

UNSSDI是种群中受核盘菌属感染的植株的百分比。

UNSSDS是受影响的植物上病害发展程度的评分。本发明中使用了两种量度标 准。先驱SSDS量度范围是从1(死亡)至9(无病害)而公用量度范围是从0(无病 害)至5(死亡)植株。关于先驱SSDS量度标准的细节,参见WO 2006/135717的表 15。公用量度标准提供如下:0=无病害;1=表面病变或小的分枝受影响;2=大的分枝 死亡;3=主要的茎至少50%缠绕;4=主要的茎缠绕,但植株产生良好的种子;5=主要 的茎缠绕,大量减产。

SSDI%是针对与预期的04DHS11418(25%)和PHI2004HS1(75%)检验平均 值的偏差调整的UNSSDI评分,如表4中所述。上述评分仅在受控的极端病害压力大田 研究条件下使用。它是通过用观察的SSDI%乘以因子X计算的,其中因子X是使适当 的检验的平均SSDI%变成50%的因子。没有进行针对严重程度的调整。

SSDIS是针对与预期的04DHS11418(25%)和PHI2004HS1(75%)检验平均 值的偏差调整的UNSSDI评分,如表4中所述。上述评分仅在受控的极端病害压力大田 研究条件下使用。它是通过用观察的UNSSDI乘以因子X计算的,其中因子X是使适 当的检验的平均SSDI%变成50%的因子。在发生率调整之后进行了针对严重程度的调 整。

SSFS是大田中在天然病害压力下的病害发生率和严重程度的量度。它的计算如 下:SSFS=[SSDI%×SSDS(0-5量度)]÷5

实例4:基因作图和QTL分析

使用JoinMap v3.0(Van Ooijen,J.W.和R.E.Voorrips,20013.0,Software for the calculation of genetic linkage maps.Plant Research  International,Wageningen,the Netherlands)进行了基因作图和QTL分析。 使用了Kosambi厘摩功能。如果LOD评分超过了2.0的阈值,则表明其是 QTL。

基因作图

基因作图将351个分子标记置于19个连锁群(Lg),这些连锁群对应 于19个卡诺拉染色体和公用的连锁群命名。连锁图谱覆盖了~1400cM。

QTL分析

采用简单区间作图和复合区间作图(CIM)(Zeng(1994),Genetics 136:1457)的QTL分析鉴定了有助于对核盘菌属的全植株大田抗性的7个 连锁群(N1、N7、N9、N11、N12、N18和N19)。此外,通过在P≤0.01 显著性水平的对核盘菌属参数的单因素方差分析(PROC GLM,SAS  Enterprise Guide 4.2)确认了通过区间作图被鉴定为与核盘菌属抗性相关联 的区域。在下文的表5和6中鉴定了这些QTL。如通过表6中的“解释的表 型变化”值所显示的,一些QTL具有比其它的更大的对核盘菌属抗性的影 响。

使用JoinMap v3.0(Van Ooijen,J.W.和R.E.Voorrips,20013.0,Software for the calculation of genetic linkage maps.Plant Research  International,Wageningen,the Netherlands)进行了基因作图和QTL分析。 使用了Kosambi厘摩功能。如果LOD评分超过了2.0的阈值,则表明其是 QTL。LOD代表几率的对数(以10为底)。

表5:以P≤0.01显著地与核盘菌属(Sclerotinia)抗性相关联的标记

表6:与核盘菌属(Sclerotinia)全植株大田耐受性相关联的QTL

关于与对核盘菌属的全植株大田抗性相关联的七个QTL侧接的SSR标 记的附加信息显示在实例12的表14中。还提供了用于每一标记的正向和反 向引物序列。“重复”表示与每一标记相关联的SSR或SNP。SSR和SNP 的位置显示在位于说明书最后的序列信息中。

关于与对核盘菌属的全植株大田抗性相关联的7个QTL侧接的每一 SSR标记的等位基因和等位基因大小的附加信息提供在表7中。

表7:与七个核盘菌属(Sclerotinia)(SCL)QTL侧接的每一SSR标记的等位基因和等位基因大小

实例5:与对核盘菌属的全植株大田抗性相关联的7个QTL的验证

在极端病害压力大田研究条件下,在来自Pioneer Hi-Bred的春性卡诺 拉计划的16种核盘菌属抗性的和10种核盘菌属易感的育种品系上,进行了 对与对核盘菌属的全植株大田抗性相关联的7个QTL的模拟验证。这使得 能够每年发展极端的病害条件,无论天然的环境如何。

参见下文的表8,针对与所鉴定的七个QTL侧接的SSR标记,对每一 抗性品系进行了基因分型。在表9中,QTL组中的第一个数字是指连锁 群,并且第二个数字是指在该连锁群上的QTL编号。标记名称上方的数字 表示该标记在连锁群上的位置(以厘摩计)。每一等位基因被表示i)仅在 抗性品系中存在(浅灰色),ii)仅在易感品系中存在(深灰色),或iii) 在抗性和易感品系中都存在(白色)。通过对每一育种品系指定为1(仅在 抗性品系中存在的等位基因)、0.5(在抗性和易感品系中都存在的等位基 因)或0(仅在易感品系中存在的等位基因)的数值相加,得到了有利等位 基因的总数。有利等位基因的百分比在抗性品系中是从63-90%范围,并且 在易感的育种品系中仅13-47%。这种相关性表明,与在育种种群中被鉴定 为与核盘菌属相关联的七个QTL侧接的标记能够被用于在育种种群中选择 具有最高数量的有利等位基因的个体。这些具有最高的有利等位基因百分比 的个体将被选择作为就核盘菌属抗性而言的良好候选。

实例6:核盘菌属抗性从春性甘蓝型油菜(Brassica napus)向冬性甘蓝型油菜(Brassica napus)的渗入

在双亲本、3方或复杂杂交中,使核盘菌属抗性来源04DHS11418与冬 性卡诺拉品系杂交(例如,如表9中所示)。然后将F1杂种与新易感亲本 回交。在BC1F1代,对于每一杂交产生了大约500个子代(用于鉴定具有 全部有利基因存在的至少一个个体所需的最小数量),并提交用于采用在春 性卡诺拉中被鉴定为与核盘菌属相关联的标记的标记分析。就来自核盘菌属 抗性品系04DHS11418的有利等位基因的存在,检验了每一个体的样品。计 算了每一样品中存在的有利等位基因的百分比,来自每一群体的最高的三个 被用于与轮回亲本回交。在BC2阶段再次重复了该过程。此外,还使选中 的个体相互配对,以发展在其中的个体能够被鉴定为具有纯合的期望的核盘 菌属等位基因的群体。

表9:使用标记辅助选择的核盘菌属(Sclerotinia)抗性向冬性甘蓝型油菜(B.napus)渗入的实例

实例7:作图种群2

用于所述作图种群的亲本是06DSB13911(一种核盘菌属抗性双单倍 体)和PHI2008HS1(一种相对于抗性品系具有多态性的易感的卡诺拉DH 品系,因其具有相似的农学表型并且在06DSB13911品系在其中因抗性而被 选择的测试环境中具有稳定的高易感性而被选择)(参见表10)。这些品 系被用于产生由187个子代组成的双单倍体作图种群。

表10:测量在极端的病害压力下的大田表现(研究试验)

*SSDI%:核盘菌病害发生率%。SSDI%是针对与预期的06DSB13911(15%) 和PHI2008HS1(75%)检验平均值的偏差调整的UNSSDI评分(其中UNSSDI是种群 中被核盘菌属感染的植物的百分比)。上述评分仅在受控的极端病害压力大田研究条件 下使用。它是通过用观察的SSDI%乘以因子X计算的,其中因子X是使适当的检验的 平均SSDI%变成45%的因子。

**SSDIS:核盘菌SSDIS是针对与春性卡诺拉在极端病害压力下的预期的检验平 均值的偏差调整的UNSSDI评分。上述评分仅在受控的极端病害压力大田研究条件下使 用。它是通过用观察的UNSSDI乘以因子X计算的,其中因子X是使适当的检验的平 均SSDI%变成45%的因子。在发生率调整之后进行了针对严重程度的调整。

UNSSDS是受影响的植物上病害发展程度的评分。本发明中使用了两种量度标 准。先驱SSDS量度范围是从1(死亡)至9(无病害)而公用量度范围是从0(无病 害)至5(死亡)植株。关于先驱SSDS量度标准的细节,参见WO 2006/135717的表 15。公用量度标准提供如下:0=无病害;1=表面病变或小的分枝受影响;2=大的分枝 死亡;3=主要的茎至少50%缠绕;4=主要的茎缠绕,但植株产生良好的种子;5=主要 的茎缠绕,大量减产。

两种亲本均具有良好的抗倒伏性。因此,抗倒伏性或倒伏耐受性是固 定的,从而在作图过程中排除了这个变量。高度易感品系的选择导致了没有 超亲分离的种群(即,全部的抗性来自06DSB13911,并且没有DH子代品 系是比抗性亲本抗性更高的)。经过三年的时间,对上述种群在大田中进行 表型分析,并用SSR分子标记进行基因分型。表型分析如WO 2006/135717 中所述进行,其完整的教导内容以引用方式并入本文。

实例8:核盘菌属筛选

病害评分

针对病害对如实例7中所述产生的双单倍体作图种群的植株进行评 分,如实例3的表4中所述。未调整的参数(例如,UNSSDI和UNSSDS) 显示了由于环境的变化如在大田中位置的变化和气象条件导致的逐年变化。 此类变化将是本领域的技术人员预期的。

实例9:基因作图和QTL分析

使用JoinMap v3.0(Van Ooijen,J.W.和R.E.Voorrips,20013.0,Software for the calculation of genetic linkage maps.Plant Research  International,Wageningen,the Netherlands)进行了基因作图和QTL分析。 使用了Kosambi厘摩功能。如果LOD评分超过了2.0的阈值,则表明其是 QTL。LOD代表几率的对数(以10为底)。

基因作图

基因作图将278个分子标记置于19个连锁群(Lg),这些连锁群对应 于19个卡诺拉染色体和公用的连锁群命名。连锁图谱覆盖了~1100cM。

QTL分析

采用简单区间作图和复合区间作图(CIM)(Zeng(1994),Genetics 136:1457)的QTL分析鉴定了有助于对核盘菌属的全植株大田抗性的12 个连锁群(N1、N3、N4、N8、N9、N10、N11、N12、N13、N15、N18和 N19)。此外,通过在P≤0.01显著性水平的对核盘菌属参数的单因素方差 分析(PROC GLM,SAS Enterprise Guide 4.2)确认了通过区间作图被鉴定 为与核盘菌属抗性相关联的区域。在下文的表11和12中鉴定了这些 QTL。如通过表12中的“解释的表型变化”值所显示的,一些QTL具有比 其它的更大的对核盘菌属抗性的影响。

表11:以P≤0.01显著地与核盘菌属(Sclerotinia)抗性相关联的标记

表12:与核盘菌属(Sclerotinia)全植株大田抗性或提高的全植株大田抗性相关联的QTL的QTL区间、LOD评分和解释的表型变化

关于与对核盘菌属的全植株大田抗性相关联的十二个QTL侧接的SSR 标记的附加信息显示在实例12的表14中,其中还提供了用于每一SSR的 示例性的正向和反向引物序列的组。“重复”表示与每一标记相关联的 SSR或SNP。SSR的位置显示在实例12中的序列信息中。关于与对核盘菌 属的全植株大田抗性相关联的12个QTL侧接的每一SSR标记的等位基因和 等位基因大小的附加信息提供在表13中。

表13:与十二个核盘菌属(Sclerotinia)QTL侧接的每一SSR标记的等位基因和等位基因大小,以及就核盘菌属(Sclerotinia)(SCL)抗性而言有利的等位基因

实例10:核盘菌属抗性从春性甘蓝型油菜(Brassica napus)向冬性甘蓝型油菜(Brassica napus)的渗入。

在双亲本、3方或复杂杂交中,使核盘菌属抗性来源06DSB13911与冬 性卡诺拉品系杂交。然后将F1杂种与新易感亲本回交。在BC1F1代,对于 每一杂交产生了大约800-1000个子代(用于鉴定具有全部有利基因存在的 至少一个个体所需的最小数量),并提交用于采用在春性卡诺拉中被鉴定为 与核盘菌属相关联的标记的标记分析。就来自核盘菌属抗性品系 06DSB13911的有利等位基因的存在,检验了每一个体的样品。计算了每一 样品中存在的有利等位基因的百分比,来自每一群体的最高的三个被用于与 轮回亲本回交。在BC2阶段再次重复了该过程。此外,还使选中的个体相 互配对,以发展在其中的个体能够被鉴定为具有纯合的期望的核盘菌属等位 基因的群体。

实例11:使用核盘菌属抗性品系进行杂交体种子生产

就SSDIS而言,具有5以及更高的评分的核盘菌属抗性品系被选择用 于杂交体种子生产和杂交体测试。这些种子的生产能够按照技术人员已知的 和例如WO 2006/135717中所描述的方法进行。

实例12:包含多态性的标记序列和示例性的引物

下文列出了以P≤0.01显著地与核盘菌属全植株大田抗性相关联的QTL 的标记的序列信息,如前文的实例所示出的。在这些序列中,n=未知的核 苷酸;带下划线的序列表示来自下文的表14的引物序列,并且方括号中的 序列表示多态性区域(SSR、SNP)。

AG0023(SEQ ID NO:1)

CGAATTCGCCCTTCTCTTGCTTAGATCTGGACTAACTACTTCnnAA AGAAAACATTnnnTTAATGTTTATGTCGAATGTCATTTATGCTGAACAAA ATAACCTTGAAAATATGTTCTGTAGGCTAAAGTTGGGAGAGAGAAGGA GGTTGAAGAGATTTTGTCAAGATTGCGAGGAGAAAATTCTGATGTATC AGATGAGGCAGGAGAGATATTAGTAAGCATATATATGCATGAATAATC ATATGATCAATGTATATATTTTTTACTTCACAATATTTTGATGATCATCA GGCATATACAGAACATGTTAAACAACAAGGAGATGATCGCGGTTTCCT CAAGTTGTTTCAGCGAAAATACGCGTTCTCACTTACTGTAATT[CTTCTT CTTCTTCTTCTTCTTCTTTTTCTTCTTCTTCTTCTTCTT]TAATAACCCGTTTGGTTTACACAGATTGGAGTTGTTCTTATAGCTTTGCCTCAACTTGGAG GTCTTAGTGGTTATTCTTTTTACACTGAGTCCATTTTCATATCTACAGGT AnnnTAACTCTTACTTCTTCAACAAAATCTTGATTTTTATATATTTATTTA CCGTAACGATAATTGTTGATAATTACGnnnATCAGGTGTATCGAGTGAT GTTGGATTCATATCGACATCTATAGTTC

AG0045(SEQ ID NO:2)

ACGAATTCGCCCTTCTCTTGCTTAGATCTGGACTAnnnnnTGATTTG CCCGCTATGTTCGACGGGTGGAGATTTTAGTTTTACTTCCTCGATCTGA TTGTATGGGTTGGGAGTAGGGTCTAATATATCAACTGCGAGTGTATGTT CGTTTCCTCCTCAGTTTCGAAGTTGGGTTCTTATGTGTTTAGCCTAAGnn nCTGTGAnnnGnTAGTTTTTTTTTAATCAGTTCCAACAGGATTCATTTCAG GnnnTTGGAACTTGTGTATATGTGTTAGCCTGAGATCTCTGTAGTGTCCG GAAATGATATTTnnnnATTATCATTAATTTAGTTCGAAGnATGAAGCTCA GTGTTGTTGGACTTGTGTATATGGAGCTCGAAGAGTGAAGCTCAGTGC GTTTTCATCTGAGGATGATGATGATGGAGCTAATGTGCTGAGCAATGA GAACTCGAGATGATAAGGCTTGAGGGACATGCCAGTGAGT[GAAGAAA ]CCGTCGGGCTATAGCTTAGT[GAAGAAGAAGAAGAA]GAGCTCGTGGA GTGATCAAATTTGCAGGTATGCCCAAACTTGCCAATCCCACATTGTGG AGAATGGCTGCATTTTTACCACAAAGCTGTTTCTGTGGAGCCAAAAAT GAATGGAGGATAGTAAAACAGAACGTCATAATCAAATCAAGAAATTTT AACTTTTTTTGTCAGCACAAATTTnnnCTTTATCTTTAATTATTTAC

AG0047(SEQ ID NO:3)

CGAATTCGCCCTTCTCTTGCTTAnnnnCTGGACTAACAACAATTCCA AAATACTAATTCACAAACTTTGTTTACAATCCAAAGAAAATCCGCTCTT TTGAAGCGCGGATCAAGATCTAGTGTTATAATATATCTAGAACATGGG AGTTTGGTCCAATGAACTACTGTATAGTTCTATCGAAATTTTTGAGTGA TAAGATTGAAGCTCCAGCACTCACTTATCTATTTGAGAAGCAAATAATA GAAAAAGAAGTAGATTTGAGGAAGAGATGATGGAGTTGAACAAGGAG CTTTAAGATTTGAGTTCTGACAGTGTAGAAGCTGCAATACTGAGGCACCAAGGAAGAAAT[CATCATCATCATCATCATCATCATCAT]CAAGAATT AGTTTCAGTTCATATCCACAACCATTTTTTCTTTCAAAGAAATTTGCTG GTAGTAATTTTGAAGTTGTAAATTTTACATTTTCAGTGTTTCATTTTTCT CACGTTTTCTTAATAATTGTTTACTTGCCAAATGATTCCATCACTTGGA AACTCACTATTGTTTGACATTTTGGTGTGCTTAAGTGACTCTTTTCGAGT ATTCATACATTATAGAAATTGTTTGGGACAACAGGTAAGAATTGCTTGG CACAAGTAATGGCATCCCTCCCTGCAAATATATATAAATATTACAGTTG TCCTGGAACTTTTnnnnTCTATCCTCTGCTGACAGGATGAGATATATGCA TATAGAATATTAACTTCnnTCnGCCCGTATGTTCATGGATGnnnAGCTCCA T

AG0070(SEQ ID NO:4)

CGAGGAGTTGAATGACCCTGACTGTACTTTGGCCTCGAGACAGTC CCATCAAGAATAATTTACTGGGTCGATTTTTATTTTTAATTCTGGTCGA GCCAACTCCGAACTGGTCGAGCGGGATTTTTTAATTCTGGTCGACCAA AATCATATCCGCTCGTGAGGGTCTTTACAACCACCATCACCACACTCG GACGATCACCCCACCACCACTTGGACGA[CCACCACCACCACCA]CCGG CGGCTCGGCTAGCTCTCGGGGGGCTCGCGGCGAG[GAGAGA]GGAAGA TATCCNACGGAAAGAGAAAAGAGAGG[GAGAGAGAGAGAGA]GGCGT GAGAGAAGAAGAGAGAAAAGGAAAAGAGAAGCTTGACGGCTAGGGTTTCCTAGTCTCTATAAATTCCTGCAGAGCTTCACTCAAGTTTCAGAATGA GAGAAGAGTAAGAGGAGGCAGCTTCATTTATAGAAACAGGAGGAAAC CCTAGGTCATTTACCCTAATGGGCTGCAGTCTTAATGGGCTCTCCTTAA GAAAATTTTGGGCTAGGAACCGGGACGTTACAATAATGCTTCTTATGA ATATGTCTGAGTAGTTCTTTTGTTAGATTTAGGGTTCTTCAAGGGGTGA ATTATGGTTTGCTANATTTATATTGTTGTTTGTGTGATTT

AG0086(SEQ ID NO:5)

GCTCGCCGACTTCGGAGTCGCCTCGCCGCTCGATATCCCTTTCAG CCTCGCCTCCATCTCTTTTCCCCAAACTCTAGGCTGTTGCTGTTGCGTC GCCGCCGCCGCCGCCGTGGCTGTTATCGAGCTATTTGATCTACCGTAC AGCATTTTAAACCGTTGATCAGATTCGGGATCAGACTTTGTCGTCACCG GAGGGCTCTTGATCGGCGGTTGCACTTCCCCCTCCGTACACGGCGTACAATGTCGGTAAGCACCGGAAGCTTTCAGAGCCATATCTTTGAGCTGAG AATGAATTTACGAAAATACCCTTGATCAGTATAGAGAATGACAAGAGG TGGAGGATGAGCAAA[GAGAGAGAGAGAGAGAGAGA]AGTCTACCTGA GATGTTAGAGATTTGGCTTGCTTGGAATCCGGATCGTCGGGTTGACCC GAGGTTTCATCGCCGGCTCGCTTCGAACGAGCTATACAAGTCAGCATTTTCCGGCAGCTGCTGTTTCTTGGTAATGTGATTTTGTTTCTTCTCTTTTT GGATACG[GAGAGA]CAGTAGATGCTGTCAGTTTCTAACTTTGGTTTGTG TTGTGTGTTTGGTCATGGTGCTCTTTTTATGTTTTATACTCACTTTACCA NNGAAAACGGTTCCATTTTTTTAA

AG0093(SEQ ID NO:6)

TAGGAGATGAGATGTACTGTTGCTTAGGGCTCTTATTTCTCTTGAA ACTAGAATAAGCTGCCATCGGGTCGGTGTAATAATCAAACCTTGGCTT ATCATACGATTCCTGCTGATGTATGGATGCTTCAGCCAAGGGATTTGAGAGGTGACTTGTGTTCATAGAGGTTCCAAGCTCTGTAGAACCATCATTCT CTG[CAGCAGCAGCAGCAGCAG]CTTCCATCCGCATTGCTTTTAGCATTT [CTTTTCTTTT]CTCTGAATCTTCCATTACTGCTCAGCTTCAAAGCTAATC AACTACAAAAATATAAACTTTTTTTCGAAATTATCAATCGAATCGCACCAAAAGAGCTAAGATCTCCACGCGAGAACAATCTAACTAACCCTAAACC CCCAAATTATCCCAAACTCTGTACGGATACTCAAATTGGAAAAGCGAA ATTGAGAGGATGCTAACCTTGGTTTACTCAACTTCTTCACTTCCTGGTC GCCAGAGGTAGAGGATGAATGACAAGTGAAAACCCAGAACACGATGA TGACGACAACNAAGCCTCCACAAATAAATATAANACCCGGTTCGTGTT CGACCGTGTTTTTCCNATTAAAACCGGTTTACGGCGATNAGAATCATA AACCAAATACGATNATCACGAAGGGTGACGATTAANACGAGACTTCCC AAAACCGGTTCGT

AG0125(SEQ ID NO:7)

CTGTTGAGGGGAGGAAACAAGAGCCTGGGAGGAGAACTCCTTGC TGGGGAAGACGAGATCATTCTCCTCAGAGGCAATGGATTCACCTAAGA CCACAGCGTTTAACTGAGAGATCTTGCCGGCACCTGAGGGTAGCAGAG ACATGGACTCCACATGCCTTAGGTGATTGGATGA CATTGTCTTACACCG GAGAAGTTTGTCCAACGGAGATGATCTGCCACACCCTTACAAGTCAGA TGTCATTTGAATAAAATTTAAAACAAAACCACAAATGTCTTTTTGACTT ATTTATCAAAACTGCCTAAACCCCAAACCCAAT[CATCATCATCATCAT CATCAT]AACCATATTCATCAATCATTCTATCATTATTGTCATCATTGGA TCAGATTATTCATTCACCTTTGAGAAGCCGGAAGAATCCGAGATCCAA GTGATCCGCTTGTTTTCAGATCCTGAAGAAACAAAAACAGATCANAGG CGAATATTCTTTTTTGATTACNATCAGATCATAAGAAGAAGAANAGATT GAAACTTTCGTANACCCAAAACATATCATTATGACNAAAGATCACATC TTTAACTCCNATGATCCCTAAGATTCGACTTACAGGTCGAGAACGAAG AGAGGAAATTTTTTGAAAAATTGTAAGAAGGGGCG

AG0148(SEQ ID NO:8)

CTTGAGAGAGAGATTGAAAGTGAGCTGCGCCAAGAACCAAAACG GACATATCACAAGGCTTACTTTAGCAACACGCATCCTTGTCCAACGTCCCTTCTCATCTAAACCTTTAGCACAAATCTCACCACTAACATCAAGCTCT ACACTTTCCACACCAGATTCAATCCCACTACCATCTCCCTCCTCTTCTC TAACAACAACCCCTGATCCTTCAGACACATCTGACA[CCACCACCACAC CACCTCCTCCT]AGCAAAACATCCTTCTGTGACTCAGCCGACTCCTGCA AATGAGACCTTTTGCTTCTCCGAAACAGTATACTCCCATACGCATCTGC TAAATACCGACCGATCTCGAAGAGAGGAAGGTTAGTCCAGATCTAAGC AAGAGAAGGGCGAATTCGCGGCCGCTAAATTCAATTCGCCCTATAGTG AGTCGTATTACAATTCACTGGACCGTCGTTTTACAACGACATGACTGGG AAAACCCTGGCGTTACCCAACTTAATCGCCTTGCAGCACATCCCCCTTT CGCCATCTGGCGTAATAGCTAACAGGCCCGGACCGATCGCCCTTCCCA ACAGTTGCGCAGCCTATACGTACGGCGGATTAAGGTTTACACCTATCA GAGAGAGAGCCGTTATCGTCTGTTTGTGGATGTACAGAGTGATATTATT GACACGCCGGGG

AG0171(SEQ ID NO:9)

CACTTTGCATAAATACTTTTACGAGCAATTTTAAAAAAAAATTCTA AAAATGTCTATTATTTGTGGACTTGGAATAGCCGTTTATCTGCTTTGAT TTTGTCGTTTCTTAAATCAAAGTCCTAATCAGGGTCCTTATATAAGATC AGTCCTCTAGAATCTGAATAGCTTTTTAAGACAAAAAAAAAACAAAAC AGATTAGAGTCCGAATCGGACTCGAACATCTCCAATTTAACTTCTATCT TTTTTTTTTCTAAAATAAAATGTAAAATAAAAATATTTTAATTGTATGAA AAATTGCATTCAATAGCTAAAAAAAAATAAAAATTCAATACATAACTA AAATCCCACTTT[CTCTCCTCTTTTCTCTTCCTATCTCTCTCTTCTCTCTC TCT]AAAAATCTAATTTTTCTTTTTTTTTCTGGTTATTCCCTAAATAAGCCCTAATTGTATTCTATTTTCACTCTAAAAAATAGCTTGATTTTATAAATAG AATAATTCATTTGTTTTTTTAAAAATAAATTATCATTAGAATATAATTTA ACTTTATTATAAAATTATTCTCTTTTAGAGCAAAAAAATAAAATAAACC ATTAGAAATTGTTTTAGAGAAATCATCAGTCAAAATCTCACNNNTTCCA CTATTTAGTTTCATCTCTNNNGCAATCAGACGTAAGAACACAAAAACA TATGTTAT

AG0203(SEQ ID NO:10)

CAGCCATTCTCTATGGCCTTGGTGACCATGGAGATCAAGTGCCTT AACAGCAACCGGTTGGGCTTCTAAACCCGGTTTAACCTTGTCATCAAT GAACCCTTTGTAAACTGGCCCAAACCCTCCTTCTCCCAGCATGTTACTT CTTGAGAAATTATGCGTAATAACTCTCAGCTCAGACAAGGTGAACATA CGAAGCTTTTGAGATGTGGAGGAGTTTGAGAGGTCATCCATGACCGAC ATGGGCGAGCTTGGATCACTTATGTCCGATAACGACAGCCTCTTGATC ACCGGACAAGTTCTTATTTTCATTGCGTTGCCCCTCTCCTCTACTTCGTA TCTACTCGCGTTCTTTGTCCTGTAACATCCTAAAAACAGAGATGTCAAT GATGT[CTTCTTGTTCTT]GGTTACTGCCATTTT[CTTCTTCTTCTTCTTCT TCTTCTTCTTCTTCTTCTTCTTCTTCTTCTTCTTCTT]CAACTTTTTGGAGA AAATGGAAGATAGATAGTGTTTTACTCTTTTTGATGTATCTTTTGTAGATTGCGTNNNNNTNNNAATTAAGGGTGTTTTAGTTAACCTACTTGTCTTC AAAGTCCTGTATTTATAGNGGTTGTTGTGTCTTATTCGTAGTGACTACC TTGGAACTTTCTNNNGACATATACTGTN

AG0239(SEQ ID NO:11)

AAGCAACCTACGGTGTTCTCTTATTACCGAGTGCTATTAGGCTTGT CTTAATGTCCTAAACAATTACGTTTTTACTTTGAATGTGAACCTGCTCTT GAACGAAATATCTTCATGACTTCATATCATTTGTTTAATTCTACTACTGT CTGGTTAAAAATGGTTGTATGTTGCATATATTGCTATTTTAACCACATG TAAGAAAAGAGAAACGATCCCACGTTTATACTCAAATTCAAGAATCCA ACACAAATCCTCTCACAATTCTATTAGATTGGAAGAAAGAAACTCATA AAATAATTATAAATAACAAAAGGACAAGTAAATAGAGTCTATCTGGAA CATAAAAACACTAACGGGTCTTGTGGGGTTTACAGA[TTTTCTTCTTTCT CTTCTTGACAGATTTGGGTGTCTTGTTCTTCCTAGCCTCTCTCTTCTCTT CTTTTACTTTCTTCTTGAGCTCTTTCCTTGCTGCTTTCTTGTCTT]CANGACCCAACTCCTCTTCACTCTCACTTCCACTTTCCTCTTCTTCNNNNTCACT TTCTTCTTCTCCTTCTCCTTTTTCTTCCTCTTTTCCCTCTTCAACATCAAC CTTTACTNNCTGCTCATCTACTTTAGGANNNCATCCTTANNN

AG0243(SEQ ID NO:12)

TTTAGAATCAACACAAGACATAGNCAANTTGATTTTGGCTACTGG GTATTAATAATCCCCAAAATCACATCCTTCAAACCGAACGAACAATCA ACAAGAAAATAAGAGCTACGATTCAGAAAAAGCCTATGATCAAAACG CCTAAAATAACNNNAAAAAAANNNGGAGCAATTTTAAACAAATGGAA TTGAATAGTATGAGATGAGATGAGAAACAAAAGAGAAAGCAGTGTGC ATAGATCATCAGGGAAGCTAACCTGAAATGATTTGTTGATTGGGGGATGAGATTGTTGGAAGGGGACAGAGA[GAAGAAGAA]GGTTTGCTTGAAG ACTCGAAAATTAAAGCTTGTTAAG[GAAGAAGAA]GAG[GAAGAAGAA] GAGGATATAAATTGACATGGACCTATTAAATGCCCATTTTGTTCTGNTT ATTTACTTAAGATTGCCACTATGACCTTTGACTTTTGGACGGCGNNTGT AGCTAAGCTACTGTTTCTTCATTAATCACGCTTGCCATGATTAGTTTTTT TTTTCCTCCTATAGNNTTCATANNTAGCCCGAAATTACTGACTTTTATG AGATAAAGATCGTATTTTTTTATTTCTTANNGTTTAATACCCT

AG0272(SEQ ID NO:13)

CTACTTCCAAAAGAAAACATTAAATTAATGTTTATGTCGAATGTCA TTTATACTGAACAAAATAACCTTGAAAATATGTTCTGTACGCTAAAGTT GGGAGAGAGAAGGAGGTTGAAGAGATTTTGTCAAGATTGCGAGGAGA AAATTCTGATGTATCAGATGAAGCAGGAGAGATATTAGTAAGCATATA TATGCATGAATAATCATATGATCAATGTATATATTTTTTACTTCATAATA TTTTGATGATCATCACGCATATACAGAACATGTTAAACAACAACGAGATGATCGCGGTTTCCTCAAGTTGTTTCAGCGAAAATACACGTTCTCACTT ACTGTAATT[CTTCTTCTTCTTCTTCTTTTTCTTCTTCTTCTTCTTCTTCTT CTTCTT]TAATAACCCNNNTGGTTTACACAGATTGGAGTTGTTCTTATAGCTTTGCCTCAACTTGGAGGTCTTAGTGNGTATTCTTTTTACACTGAGTC CATTTTCATATCTACAGGTAAAATAATTCTTCTTCTTNNNCAAAATATT GATTTTTATATATTTATTTACCTTAACGATAATTGTTGATAATTACNNNN ATCACGTGTATCGAGTGATGTTGGATTCATATCGACATCTATAGTTCNN NNNTTACCGATTTCGAGTGACCTTGTTTAGAGTTC

AG0304(SEQ ID NO:14)

ACAAACATAATTGCAATTAAACGGATAGTAAGGGTCACAGATCAC ACAATACTGCATCGAAGTTTTGTCATCAACACAAGTGCGCATCGTTTCA TTCTTTTCTTTCTTCCGGCTTACCTGAGCCCGGCCGTGGCACAATCTTCT TCAACAGACAGCGTTTAAATAAAACTTAACTTGGTAGGGCTGAGGATT CAAGAATCATTTCTTGTAATTCACTGGCACATCGTCGTCATCTTCTTCA AGATCACTAAACGTTACATCTTCATCCTCATCCACAACATGTTTGGTTGCTACGGTGGAGCTAACAGTTCCTGCATTATCTTCATCCTTCAACCAATC ATCAA[CATCATCATCATCATCATCAT]CGACTTGAACGTCAATAACTCT AGGTGAAGATCCAGTGACTGGCTTGTCATGGGGCGCTGGTGCTGGTTT TTCTTCAATCACAGGCTTGTCAACAACTTGTATCTCCTTGCTCTCGATT GGGTGCTTCTCCGTCTCAACCTCNNNTGTATCACTCAAATGTATTGTTT CCANNNAGATGNANTTGACTGNNNCTGGTGAAGACACAGTAAGTGGT TCCTCATTGGCA

AG0323(SEQ ID NO:15)

AATCATCCTAAATTTACCTAACCCATGGATTCAAAAGGTAACTAA CTACTCGCTAATAGACATGATAAACCCAAAACCAATAGTGATTGAAGG TTAATCATGATTAGTGATCAAGATAATCCAATAAACACAAGACAAAGA TGAAAAGAGGCTAAAGATTGAATCTTTCACCAAAATATGTTCATGTCTA GAGAAAACAAGATAGATCCTAAGAATCTAACAATACTAAAAGCATGAT AGTAAGCCCTCTAAGCGTGTCCACGTAAGTTAATATATTCAGCTAATCA GAGATTACTAGCTATTTTGCCATGTCATAACAATTTTAAGTCGACCAATACAAAAACCGGGCAAGGCGTCTGGGCCATTAGTAATATCCAGTGGCCA ATACGAAACCCATCTCATTAATATCAAATCTCCAATGAAAGCCATTATC GTGGCGACTCTTCTTTTT[CATCATCATCATCATCCTCATCATCATCATC ATCATCATCAT]CGCTTGGGATCACAACAATTTCCTGTTAGCACAACCCACTCTCCATCAATCAATCAGGGTCTTTACTACTCTTTTCATGCTTTCGTN TCAACTCCCTTTGTTTATCCTCCTATATAAATCATTGAATATCNNNATTT TGATCCAAG

AG0324(SEQ ID NO:16)

TAGTCTCACCAACTCCAAACTTGTTAACATCTGAAGGAGTCTGAA TATTCTCCTCCT[CATCATCATCATCATCATCATCATCATCATCAT]CACA ATCAACAACTTCAACCTTCTTCTTATTGTTATCATCATCCTTTACTAATT TCTCCTCATCACAATCAATAACTTCAATGACTGAATCTTGAGAAACTGC TTCTTCTTCTTCTTCCTCCAAATCGATAAACTCTTTATCTTTGGTAAGGAACCTGAAGGCATTCAAAGCCGATCTCTTGGCGTTATCATACTCGCGAG TGAAAAGCTCCCCCTTCTCGCAGCAATCGTTAGGCTTAGCCGTGGGTG ATCCTCCGTATATAAGGTTCGCTCTGCTANNAGCGTGGATTGCTCGTCT AAGTGGAGTTTTGGCGTCGGGATACCTCGAAATCCTCGAAGATGGCTT GTTGGGATCCTGAGACATGGTTCCGAAGGAGAATCTGCGTTTCTTCGG AGCTTGGAAGTAGGGCGAATGTCAGCGGAATTGGGCGGTGGAAGGGT GGTTGGAGTATAAGGAATCTTCGCTGCGCTTGCGATTGATGGCGACNG CGCTCATTTNNNGAGTCGATCACTGAACCCTANNGATTGGGAGATCGA CGNNNGGAGAGGAACCATAAGAGTNGAGA

AG0328(SEQ ID NO:17)

TTGCCAAAACATTTAACCAGGTGAGCACTTAAACTCTTGTCTGGC CCAAAAAAAAAAGAGTGAGACTGTATAGAGGATCAAGCCAACAGTAG ATGAGGAAGAGGAAGGCCATGTAATCTCTAATCCACAACGATCTTGAT TACCCATATAGGTCCATTGACTTTGAATCTTAATTTCAGAACATCAACA AATCTTCATCTTTACTAAAATTACAAAAAATCTTTTAACTTTTTAATTTT TGAAAAAAATACATATACACACATACAGCTAGTCTCTTACGAAACACT ACACAACTAGATAACTCCAAACATTTACAACTGAAAGTTTATCAGCTTG GAAAATCATCACTCAGATTTCTTGTGGAACTTCACGGAGTCTATCAAGT GTATTAACAATCTCACTCAGACAAGCGATGAGCTCGTCTCCTTGCTGTCTCACAAACTTTAACTTGTCCTCAATGCCAACATCATCCTCTGTTTCACTT CCATTTGCTAGATTTCTCCCGACTATTGCATGTATCATGTCAGCTTTCTC ACCTAGCTTTGCTTCCAACGCTTTAACCTCTTCTTCTATGCTCATCGTTT [CTTCCTCTTCTTCTTCTTCTTCTTCTTCTTCTTCTTCTTCTTCTTCTT]CTA CATCANNNGAAATTTCTACCACCGGCTTCTTCTTCACTTCCATGGTTTT ATTCTTCTGATGGNNNGCTTTTGCACG

AG0359(SEQ ID NO:18)

CTCTTGCTTAGNTCTGGACTAACCCATATCCGAAAAGNTTCGAGG ACCGACTCGAAAACCCAACCCGAAGATCTGCACGCCTAGGCCTAGTTT ACAAGCAAGCCTACCAAAATATGTCAACTCGTTAAAAGCCTTTTAACC TGTCTGGTTCGGTGCACGGTTCAATTCCCGGTTTAGTTGTAACCGGTTT GTGATTGCTCAAAACCCTAGTCGTCACCCTTTTTTATCATTATTGTGAA CAAGTAGTCACCTCTACAAGTAAAACCTTAAACCCTATTGAGCGAGTA GCAGAGCGCAGCAAGAAGAAACAAAACCAAAATATGAGACCACCACG TGGCGGCGGAAGCTTCAGAGGAAGAGGAGGAAGAGATGGCAGCGGAC GCGGAGGTGGCGGACGTTTTAATCGTGGAGGTGGCCGCTTT[GGTGGT GGTGGTGGTGGT]GGCTGGCGTGACGAAGGACCTCCCGACCAAGTCGT NNNTTCGTTTTCTCTCCTCTCTTGGTTTTCGCTCTCACTTTACAGCTCAA GCAGAAGTCTTTATTAACAAAAGTTGTCACCTTTGACAAATTAGTCTTA TCCCTTTGTTAGAGTCATCTTTAAGTTAAAGGTATAAACTTTGTGAAGT TATTCGTTATGACAAAGTTTCTTTCTTTCGTTGGGTTATAACAGAAGTT GCAACGTTTGTTCATGCTNN

AG0369(SEQ ID NO:19)

TTTTGAAGGAGGTTGCTTGGGTGATTTTTGATGAGATTCATTACAT GAAGGATAGGGAGAGAGGGGTTGTTTGGGAGGA GAGTATTATTTTCTT GCCGCCTGCTATTAAGATGGTTTTTCTTTCGGCCACGATGTCTAATGCT ACTGAGTTTGCGGAGTGGATTTGCTATCTGCATAAGCAGCCGTGTCAC GTGGTGTATACGGACTTTAGGCCCACGCCTCTGCAGCATTATGCTTTTC CTATGGGTGGGAGTGGGCTGTACCTTGTAGTTGATGAGAATGAGCAGT TTAGAGAGGCTAATTTCATTAAGATGCATGATACTTTCCCAAAACCAAA ATCTGAGGGGAAAAAGAGTGCAAATGGCAAATCA[GGTGGTAGGGGCG GCGCTAAAGGTGGTGGCGGCGGC]GGTGGTGATTCTGATGTTTACAAAATTGTAAA

AG0370(SEQ ID NO:20)

TAAAAAATACCTTAAATATATAAAAAATCTATCTTTGTCGAACAA GTAAAAAATTTAAAACATCTTACTTTTGGAAACGAGGGAATATGATATT TTGGAATGAATCAAAATTGACAATCACCTTGTATAGAACCCATAGGTT CGTGGATTCGCGGTCCTCACCACTAATAGGTTGGACCTGGTTAAGAAT CCTTGCACACAGAAATAAACTTAACCATTGCCGCCTTACATTGTATTCC AAATTTGTTAATTACCGGCCAACAACACAATTATGTTATCTCCATTATTACAACCACCCGCCGCAATAATTATCTCAATCA[GTTTTGTTTTGTTTT]TA TTTATATTCAAACGGAATATCGTTATTTAATTATTAGAGCTTTAAATAA TCTATATAAAGTCCATACAATTTTTGTTTATGGAAATAGACACTACAAA CGCGTATTTTCAGTTTTTTTTTCATATGGAGAGAACTACCAATCAGTTG AAAGAAAAAAGAGAACTACCAATCTACCATATAATATAAAAACAATAA TAGTATTAAAAAAAGGAGAGGGCAACGGAACGGGACGGAAGAGAATG GAAATGGTTACGTTTATAATAGCAATGATCTGTTGAACAGCTTATGACA CCTCACTCTGCGCTTGCTTCCATTCCTCATCTCTCTCTCTCTCTNNNAAC TCTCTACGAAACCCTACCTTCTTCN

AG0378(SEQ ID NO:21)

TACAAGACAGACGGACATAATAAGAAGAAATGCAAATAGACAAG TCCTGAGAGAGAGTATCCAAAATAGAGATTTTAAAATCTGTCACTAAC TTTTAGGCATAGCTTGTTTAGTTCGCTTAGTCCCTCCTTTCTTCACAAAA CCAAAACCAAAAAAAAAAAGATGAGAGAGAGCAGTTTGTTGATAAAG AAGCAAATGAAATGTAACTTACTTTTCTACCGGCGGTGGTGGTTGCTGGTGGAGTTGCTGCTGCAATTGAGTAACGTCACAACAAAAAGGAAGATG GAAATGAAAAAAAGGAGGATTCAATGGATATCAACAAAAACGTGTTA GAAAGACTCACCACTCTGTTGAGCTTCACCACCTTGGCTGCCTCCTCTT CTCGTCGGGGTCTACACATTTCAATAGATTCGTCAACAACAGTAACGA GATTGCGTCGAAACCTAACTCAGAAAAAAAAAGAGATGACGTACCGC ACTCGGACCTG[CCGCCGCCGCCGCCG]AAGATGAAGCAGTCGCATCTACAAATTTCAGATGCCAAATTAGGGTTTAACCTAGAAAATAAAAATATC AATAAGGCAAAGAGAGAGAGAGAGAGTACTAGTTGGATTGCGATCT

AG0391(SEQ ID NO:22)

GTCTTCTCACGGCCGTACGGATAACGCCGTGAAAAACCACTGGAA CTCGACGCTCAAGAGGAAATGCTTAGGCGGCGGTGGAGATGGTAATCT CATTGTGATGAGGAC[GGAGGAGGAGGAGGA]TCAGGATCGGCGGAAG AAGAGGAGATCGGTGAGCTCTGAGTCTGCTACTCCGGTGGACACTGGG TTGTACATGAGCCCGGAGAGTCCCACCGGAATCCCATCTCCGCCGTCT CCGGTTGATGCTCAGCTTTTAAAACCAATGGCGATGCCGTCACCGGTG GAAATGTCTTCGGTGGAGGAGGATCCGACAGCGTCATTGAGCCTGTCA CTGTCACTTCCTGGTCCTGATGTCAGACAGGAGTTGAAGAACGCGGGT TCGAAACACAACTCGTTGCTGTTTCCCCGGTTTGGGAGTCAAATGAAA ATTAATGTTGAGGAGAGAGGAGAAGCACGTGTTGGACATAAAGCTGA GTTTTTGACGGTGGTGCAAGAGATGATTAAGGTGGAAGTGAGGAGTTA TATGGCGGAGATGCAAAAAAATAGCGGTGGTGGCGGTGGTGAATTCAT CGTCAGTGGTTTTTATGATGCCGGCAACGGCGGTTTCAGGGATAGTGG G

AG0410(SEQ ID NO:23)

AAAAGGAAAGTTTAAGACTTTAAGCTTTACCTGATGATCCATATCGGGGAAAATCGCGGCGAGGTGATCGAGGAGAAGC[GAGGAGGAGGCA GGAGGAGGAGGA]GGGGGAAAACGCGGCGGAGAAGAGGATGAGAAGT AACGGAGTTTCTTGGAGACGGGAGGGGAAGAAGCGGCGGACAAATCC TCGAACAGAGATCTCTTGCTACCGCAAACAATCGCAGACATGTTATCT GCTTCCACCTTCTTTTTCTTCTTCTTTCTTCCTTCCTTCAGATCTCAACCT TTCCTTTTTGTTTGGTTTTTTTTTTTCCTTTTT]CCTCTAATCCATCTCTGA TCTGTTTCTGTCGGAAACCAAGCAAAAAAAAGTCAAAACACATCGGAT CTTCTTCCGCATCTAAATAGATCCAACAACCCGGACTCGGATTCAAAT

AG0441(SEQ ID NO:24)

AAAAGACGTTGACTTGATTTGATATGCCATAGAGCTAAACCCTAA TTGAATTTCAATCAATTAGGGGTAAAGATCTCTCAATCTACGAACAAA AGATCTAATATTTACAGTCAAAATCTACGGAAAA CACAAAGAAAAGGC TTACGGCGACTGGGCTGCGAGGAGCGCGATTCTGATTACGGATCGGCA TCTTCCGATTCTGGATCCGAGCTAGGCGATACGAAAGATGATTTCTTCCGGAAACCTCCGATTGAGTAACAAGAATCTCGACAGAAGTTGTTTCTTC TCAGTTAGAGAGAAGAGATTAGGCTTCGGCCCTTTTTGTGATTTTGAGA AGGAT[GAGAGAGAGAGAGA]GT[GGAGGAGGAAGGAGGAGGAGGAG GAGGAGGA]GCCTTTGTTATTTTGAAAGTTTGAAAATAGATCTTGAGAA TAATTGTAACGTTACTCTTGGTCCTCTATATGCTTATTTATTTATTCCAC TAATACTTTATAAGGTATATGGGCTTTATATGGACTATAATCTCGGCCCATCTATGTTAAACTAATCCGTAATTTTCTTGGTTTTTTTTAAACTTGCGC GCTCCTTAATTTGAAT

AG0477(SEQ ID NO:25)

ACTTTTTATAACCGACACTTAAATCAAAACTTGAAAAATAGCATC AATTAGATTTGTAACGGAGTATCATCAATCATCAAGAAACAACAATCT TGTAGGTGAGTAAATAAAAGATACCGTGAATAATGTCAACAATCGTAA TCTCATACCACTAATACGTAATTAAAGAAAATAATCATATAATTAGGGAGATAATGTTGGGAATCTTAATCGTATAATCAGAAGCGTATTCATTTCA TTACAAATTGATTCTCTTGTCATTTGTTATAT[AATAATAAT]AAAAAAA ACGTTAAATCAATTCAAACTAAACCTT[CTCTCTCTCTCTCTCTCT]TTCT ATTTCGCTCATCATCATTTTATCTGATGAATACGCCCAATTGAAATCCT TTCCTTATCAACTCAAATTGAGTTTTCAAAATTATTCAATTTTCGGATCT CCGTAGATTTGCTCGGCGGAGGAGGAGGAAGGATGGCTCAGTTGGCG GCGGCGGCGGGGAGGAGAATAGGGGATTACGCGGTGGGAAGACAAAT CGGGTCGGGTTCGTTTTCGGTGGTGTGGGAAGGGAGGCATCTGGGAGA TGGAAACGTGGTTGTAATCAAGGAGATAGCCATGGCGAGGCTTAGTAA GAAGTTGCAAGATAGTCTCATGTCCGAGATTATCATCTTGAGGAA

AG0482(SEQ ID NO:26)

ACCCAAACGAATTGCTCTGTCCGTAGAAAGAACAGGCTCGGGAG CTGAGT[GGTGGTGGTGGTGGT]GGAGAAGCGACGGTGGACCATCCGG GAACGAGTGCAGCGAGAGACGGAGATCTTGACTCGGAGGAGCTTCCG TCGAGGAGCCAACCACCGGGAAAAACGACTCCGAATCCATCGACGGC GGAAGAAAACTCGGAAGCTCCGCCACTCCGTCGAATCCACCGGACCGT GCACCACCGAACTGAAGCTGTTCCCGCTG[CGGCGGCGGCGG]CGACG GAGATATTTTAGTTTTGGCGGCGGTTCTTCTCGGTTTAGCGTTTGCGGC GGCGTTGCGAACAGCGTCGGCGGGACTCCACGGAGGAAGCTGAGCGA GCTCGTCGATGGAAGTCTGAGCCTTTCTGATCAGCCAGTCAACGGCTTT GCTCGGTCGGTCGAAGCCAAGGCGGTCTTGAACGTCGTAGAACTGAAT CGCCGTGTGAGCCGATAGCCTCACGCGCCGGTCACGTGGCCCTTTGGC CGTGCAGACTTTGCTGTGCCGGTCTTTTCTCCCCGTCGACCGCACAATG TGACCTCCTTGCACCTCCACTATCTCGTCTGACGCAGCGCGGTGCCTCA TTGAAGAAGGCNGNNNGGGTTGAGGGGTGGAGGAAGTGGTGAGCTTC GTCGTGGTCGTCTGCCATTGGTTGAGCATAC

AG0504(SEQ ID NO:27)

ACAACTTTGAAGTGTGAATAGAGTAAAAGATTCAATCTTTCATAT CAAAAGACTAACCTAGACTCGAACTCACGGATCTCAGCAAGTTCTTTC CCCATCAAATCCACCCACTGCACCTTCTTCTTCTTCTCCCTTCTCTCACC ATCCTCTGAATCTAAAGTTTCCTTTTTTAGACTACTCTTCAGGATCTCTC CATTACTTTGACCTTCCTCTAAGGCACAATCTTCTTCCTTTCCCTCTTCT TCTGTTCCCTCATTCACCAAACTATCAACGTGATCAACAACTTCCTCTA CTTGTGCATCAACATACTGAT[CATCATCATCACCGTCAT]CAACAACCG AAGAGACTTGA[GGAGGAGGAGGAGGAGGAGGAGGAGGA]GTGTCCTC CAATTTCAGAGAACCAGATGCGTAGATGTGAGGAGAAGGCTTACAGAA GCAGATGAAAGAAGGGCACTGGATCTTACAAAGCAAAACCCTCATCAA AACATATGTTCCAATCATCAACCAATTCAACAAGATCTCTTTTGTCTTT GGCAAAGTTAGAAACTTTGTGTGCCCATTGATATGCCCAGATTGAGAA AAGGAAACACTTTTGATTTCTGAATAAAAAGTAGAAACAGAGCAGCAA AGAAGTTAGTATATATCTCTCGTCTTGGATAGAATCCAAAGACCATAA ATAACGAGTTGATCAGATGANNNAGCAGACAAA

AG0510(SEQ ID NO:28)

ACTGGTCTCAATGGAGGTGGTGGAGGAGGAGGAGGAAGAATACG ACTGGAATCTCTTTTAGACCTTGTAGAGAGTTAAAAGATAGTTTTAAGA AACAAATGTCAATCTCTCAAAATAGGAATACTATACTCTTTACCTGTGA GATAGCTGAGCAAAATCATCATCTGATTCATCGTCATCATCATGATTGA TGCTGACAAGTTGAGCT[GGAGGAGGAGGAGGAGGAGGA]GCTGTTGC ACCGCCTCCATTTGAAGGAACAGAGGCGATATCGTCATGACGCTGAAG AACACGCTGCAAGTTATCGTTCAATGCTAATCCCTGGCACAGAAGCTC CTCGTCTCTGAAGAAAAGAAACATCATCAAAAGGGGATGAAACATCAG GTGAT[GAAGCAAGAAGAAGAAGAA]AACTCACGTGGTGGTGTTGACAAGAGTCATCACACGTTTCTGATAGGT

BG0031(SEQ ID NO:29)

CGAGGAAGCAT[AGGAGGAGGAGGAGG]AAGCAGTTTGAGTGTTT GGAGGAGATGCCTGAGG[AGAGAGAG]GAAGGGAGGGAGTCGGACGA AGGCGTGTGTTTTTGCACGTGCAGCGGAGGAGAATCCGGATCCGAAGA CGGAGAGGGAGAGTGGGAGTCGGTGGAATGGACGGCTGAGATGGAGG CGGAGGCTGAGGGAATGGGATGGGCCGTTGATTTGGGGATTTGGGTTATGTGTTTAGGTGTGGGCTACTTGGTGTCCAAAGCCTCAACTAAAACCTT GAGAGGTGGAGGAAGGAGAAGAAGATCAAAAAGTTTCTTTTAGAGTTC TCTGTAATCAGTCAGTCTAGTTGTTCAATAACGTTCTAATGTAATAGTA CAGATCAATAAACCATAAATGTAAAACAATCCATGATTTTGAATACCA AGAGTCGCACGAGTTCCATTTTATTTGAGAGCATAGAACAATAAACTTT CTCCTCTGACCTGATGAACTAAGGCAAGTTCATGCAAGAATCTAATGA ATGCAAGCAATCAAGTACGTCAAATCATATTGCATTTACAAATTATACA AATACACAAAGGATCCAAAAAGTGCCTTCTCCCTTTTCTTACTAACAAT AATAATAATGCAGCAAAAAGGAATAAAAGTTTATCAAAAACGTGTGAT GATAATTCAATGTAAATAAGCAAATATGTGGAGAGCT

BG0106(SEQ ID NO:30)

GTAGCCTTGTGTGAGTTGGAACCAGACTTTCCTGTTTCCCTGCCTT GTCTCAAGGTTATGCATTTAGAGAGAGTTATAGCTAACCTTGAGAGGC TTATAACTAGCTGCCCTGTTCTTGAAAAGTTAACCATAATCAGGGATTC TTTTGAAGTTCTCGAAATTATGTGTGTGCGCTCCAAGTCTTTAAAAAGT TTGGCTCTACTGATTGAAGCTTCTGATACTGATCTCTTAGAAGATCACG ATTTGGAGATCGATGCCCCAAAGCTTGAGCGTATGAGTCTCTGTGATC ACTTATCCAGAAGCATCGTTATACACAGTATTGCTCCCTCTGCAGTGGT ACAGATCGATGTTAACTTTAAT[AGGGAGGG]TGGTGATACATTATTGG ACCAA[GATGATGATGATGATGATGATGATGAT]TCCAAGAGAACTATGATCCGTAATTTCCTAACCGGGATATCCACAGTCAGCCTCATGAAGATCT CCTCTGATACTCTACAGGTAC

BG0111(SEQ ID NO:31)

GTAATCATTTCTTTGTTATCTCTCTTTCCATGATCGTCCGTCCAAGA GATATGTAATTGGCGTTGTTTGATTCTGCAATCCGTACAATCCATTTCT AGCTGTTAATCTGAATATAGCCATCTTATTAGACTGAAATCTAAGCGCC TGGATGGGGTGGTTTTATTTTCATTTTGACTTTTGGCGTTTGGTTTTCAG ATCTTTAAGATAT[GATGATGATGATGATGATGATGAT]GAAAATGATG AGATTTAGATTTTACTG[ACCACC]CTTTTTTTTTTTTTGTCTTTACGTTTC TTTCAGCTCAATTCAGAGAAGAGCCCTTTTCAACGTACTTATGCAGCTC AGGTAAATTTCATGTTTATCTGACACTTGTCTAGTAATGTGTGATACAA TCTAAGAATGTAAATCTTACAATTGTGATAAAAATATTCTCTCTCGTGT TTAGATAAAAAGATGTGGAGAGATGGCAC

BG0119(SEQ ID NO:32)

GTGCGGGTTCGAGCAGCTCTCAGCGCTCGCGGAGGGAGGCATGA ACGTGGCCAGGCTCAACATGTGCCACGGCACTCGCGACTGGCACCGTG ACGTCATCCGCAGCGTCAGGAGGCTCAATGAGGAGAAAGGATTCGCGGTCGCGATCATGATGGATACCGAAGGTAGCGAGATTCACATGGGAGAT CT[CGGCGG]CGAGGCCTCGGCTAAAGCAGAGGTTCCTTCCTCTTCTTG AAATCTT[GATGATGATGATGATGATGATGAT]GCAT[GTTGTT]AATCAG ATTATTGGATATAATCCGGTTTAGTTAGAGACCGGTTTAGTTAG[ATTA ATTA]TGGTTAAGTTTCTTTTTGCTTAATCATGTATATAAAGAAATGTTA ACACAGATGAGGTTTTTGTAGGATGGTGAGGTTTGGACGTTTACCGTTA GAGCTTTTGATTCGTCTCGTCCTCAACGTACCATTAGTGTGAGTTATGA TGGTTTCGCTGAAGGTAATGTGTCTTTTTTTTTTGTGTTATGAAAGCATC AAGTGGATGTGAGTATGAGATGGGGATCGATTTTTTTTTTTTTTTTGTG ATTTCAGATGTAAGAGTTGGTGATGAGCTTCTTGTTGATGGTGGAATGG TTAGATTTGATGTGATTGAGAAGATTGGTTCCGATGTGAAGTGTCTGTG TACTGACCCTGGGCTGTTGCTTCCTCGAGCTAACTTGACTTTCTGGAGA GATGGGAGTCTTGTAC

BG0181(SEQ ID NO:33)

GTAACATATACAAATACTTCTAGGAATCAATCGAAATATATATTTC ATATCGCAATTTCACAATACTGTTGAACTTACAAACGTGTATAATTACA CCATTTTTTTACACAAAATCTTTAACATGTCGATTTCTTATACCATTTGT AATTAACTCAACATATTTTTTTAACTAAATCAGCCTCGCCAATTTGTGTT GGTTTACGGAACCGGTACAAATATTGTTGGCCTGGCCGTTATTAATTTC AAATGATTGATTCATAGGTAACATGAGAAGTTTGGAGAGCTTACTAAC GAAAGCAGGAGCGGAGACATTGCCATTGGCAGAGCAACGAAGTACGCCTTGAATATTGATGAGACCTAAAATGCCTCCAAGGAC[ACCACCACCAC C]AAGAATCCCACCAAGGCCACCATTACCAAGAAGCCCCCCTACTAGG CCACCATTACCAAGAAGGCCACCTAGGCC[ACCACCACC]AAGAAGGC CACCTAGGCC[ACCACCACCACCACCACCACCACCACCACC]AAGAAGG CCACCTAGACCCCCAAGCTGAGCCTTAACCATTGGAGACACCATCACGAGACACACGAAGATCAGTGAGAAGGTTATGCGTTTGTTCTCAAGCATT GTCATGTTCTTGG

BG0228(SEQ ID NO:34)

GTATCTATCTCCTCTTGCCTAAATCACACCATGACTGACTTTCCCA AAATAACCTAGAGATCCAGAAAGAACGGAGGAAAGAAAGAAAAAATG GAGGAGACGAAGCCATTGGTAGGGAACCATCCCCAGCAAC[AGCAGC] AG[CAACAACAACAACAACAACAGCAG]CTCCTGTATCAACACCAATTA CAACAGAGACAGCAACAGATGCTTCTATTACAGCAGTTGCAGAAACAGCAACAACAACAAGCCGCCATGTCTAGGTTCCCCTCCAACATCGACGTT CATCTCCGACCTCCAGGGTCAATCCAGACCCGACCAATTGTTCCCCCTC AGCAGCAGAACCCTAATCCCAACCCTAGCTTGGGACAGCCTACACCGA ATCTTCAGCAGCAGCAGCAGCAGCAGCAACAGCAGGTTGTAGCGAGTC AGCAGATGCTGCAGCAGCAGCAACAACAGCAGCAGCAGAAGTTGATG CGTCCTTTGAATCACATCGAGCTTCAATTCGCTTATCAGGACGCTTGGC GTGTCTGCCACCCTGATTTCAAGCGACCTTTCTCTTCTCTCGAAGACGC TTGCGAAAGGTTCAGTTCTAATTTTTATCTAATTACATTTGTCTTTTTGA GATATTTCCTTAAATAAAATCGGTTATAGACAATCTCATCCGTTCAATC TTATTTCAGGCTATCGTGTGATATATGCATACGGGTCTTGTGATCTTTG AAATGAAACATTGATCTGTTAATGACTTACTTACTGGTCATATCTGCAA CTTGTATGTTCTTCTTTAGTTCGTGTTTGGTATTATGGTGATGATATCTG TTAGCCTTTTCGTTAATTTCTATACTTCTTTTCATTGATATTGTTTGTGTT AGATCCAATAGATCCTGCTTCTTTTGGTGTTCGTGCGAAACTTAAATCT CTTTCTGAGTTTAGTGTGGTTGATTTTATATTATTTTTGTCATCTAATGT GGTTGATTTAGAATTACAAAACTTTGTGATTGTTTCCTATTTTAGTATAA CCACCTGATTCACTGATACTGATAATTATTCCCTGACTTTTATATTTATG CTAAAAGTTTACAACTTTACATTAGCATATTATTGGTTTTATTAGATAC ATTTGTTGCCTTGATTGAACATTTCTGTATATTGTTTGTTTTATCTTACC TCATAC

BG0255(SEQ ID NO:35)

CTAGTGGCTACAAATCCAACTGTCGGTTCTCACTTGGGAGACCCA GGTTTGGATCTATCAAGTTTAAAAATCCAAACTCAGCACAGCCTTTCAT TTCTGAAACAAGAAAAGAGATG[GAAGAAGAA]GATCAAGAAGCCAAA AGCATCGGTTTCAGGGAG[GAAGAAGAAGAAGAAGAA]GATTAT[GATG AT]GGAGCTAAGGGTATTGATCTAGAAGGAGAAGAGAAGAAGCATATATGCTGTGAATGTGGCAAACGTTTCAAGTCAGGCAAGGCGTTAGGTGGC CATAAAAGGATCCATGTGCTCGAAACTCGCAAATTCTCAATGGTGAGA CCGAAGATGGTGGTGACGTCTGGTGCGGTTGCGGTTGCGGTTGGTAGA TCTGATGAGCAGAGAGATGATTTCGAAGTTGATTGCTGTGTTTGTCATA AGAAGTTTACATCGATGAAGGCTTTGTCTGGACACATGAGGTTTCATCC AGACAGAGGATGGAAAGGTGTTTTGCCTCCTCATCATCCACTTGATGA TCATCATGGTGGGGAGTTTATAAGCTCCGATTACGATGATGATGCTGAT TATGATTATCATGAGGATGATGATTATGAGAACTCGGAGTTATGGGAT ATTAATCGTTGGGAATTGGACAACGTGGTTGACCTTAAGGACTCGATC AAAGAAGGATGGACGGTGACAGGAAAGAGAGGAAGGAGAAGTGCTTT GAAGATTGATGAACCTGATGATATTGATGCTAAGGATCTATTGTTCTTA GCTACTACAGCAGAATCTGTCGATGCTGCAGAGACTTGTTGTGATTCG CTTTTGGGGGAAGAGATGATGATGAAGAAGAGGAAAAAGAAGAAGAA AAGATTGTCTGAGATGGAGAAAGAGTCATCATCTAGTCATGGTCATCA TCAGCTTGAGGTTGGTGATGCTGCTGAGGGAGGTGGCGGTGCAC

BG0278(SEQ ID NO:36)

GTATATGTCTTTGGTTATTTTTTTTGGTATCCAAATAACCGTAAAT AAAAATTAAAAATGGCCCGTTTTCCCTCGGATAAAAAAATTGTAGAGT TTAAATCATGTCTTTTAAAACCATGGGAGCAAAATCAAAGGAAGAGAG AAGATAAATTAAATGGTGGCTGTTCAGTTGTTTAGCTGGAAGACATTG ATTCTTCTACCTTCACAAGCTTCAAGACATAAGGGTTTCACTTCTTTTA ACAGGTTTTTAATCTGT[CTTCTTCTTCTTCTTCTTCTTCTTCTTCTTCTTC TTCTTCTTCTTCTTCTTCTTCTTCTTCTTCTTCTTCTTCTTATTATTATTAT TATT]ATAATAGTTTCAAGTTTCTGAAAAACAATTGATTCCATGGTGGTG CATGTGTTTTACAAGATATCTCACTGAAAATTAACTTTGTTGCAGAACA TTGAGTTTGCACTCTCTGCCTTCAAATGGGATTGATTCTTTTAGATCCC GAGGTGAGGAGGCTCTGAAACACATTCCACGTCTTAATGTCCTTCCTCT CAACAAAGACTCATACTTTCATACTATCATATTTTCATAATTTCATTATT ACAGGAACCTTCAGAGTCAAATCTCAAAAGACAGGAGACACAGAGTC ATCTACTTCCAACTTGAATCAACCTAATGATTTAAAATCCAAATTCCAT AAGGTGCGTGTGTGTCATGCATGTCTTTACTTTTTTTATCTAATGATTTA CTTAATGCTTTATGTTATAATCTTTCTTAATATACATATCTGCAGAGTCT CCAATATAAACTTGTACTAGGATGCATCCCACTGTATGCGGTATCGAG AATTGTACAAAAGATCATTCATGGGCTTCCACTCCACATTCAGAACTCA GTAGGGGCTGGCTTGCCTTTTGCTTGTGCATCAGACTCTCTGAATAAAC CATCTTTAAGTGGTATCAAATGGAGTCTTGCAAGGTTCTTTTTCCTGTT CAATATTCGGCTCGAGAAGAACGTTGCTAC

BG0295(SEQ ID NO:37)

CTGTTCCGTTTAACTATGCTCGCACCTCCATTATCTCTCCTCTTTCA TAACTCTCTCTCCTCCTTCTTTCTTCTCCACATCTCTCCGATTTCATCGCTAGAATTCTCCACCGATTCTTAAGGTATGTTTTATCTTCACTTCAACTCT TGTCGGAATTCACTCTCCTTGCCTGTCTGAAACTTTCCATTTGCAGATC TGTAAAACTTTCTATTTGTGTTTCCTCCTTTCCGTAGATCGAGAAGAAA CGATGACTTCAACGG[AGGGAGGG]ATACGATCCCTCTTGTCTC[TCCTC CTCCTCCTCCTCC]TTCTCTTATCCATAACCACTCTAATCTCAGCCGCTG ACTACACACCCACCGACAAAATCCTCTTAAACTGCGGCGGCTCCTCCG ACCTAACCGACACAGATAACAGAACATGGATCCCCGATGTCAAATCCA AGTTCCTGTCTTCCTCCGGAGACTCCAAAACATCCCCCGCCGCAACAC AAGACCCCTCCGTCCCCACCGTCCCTTACATGTCCGCCAGAATCTTCAG ATCTCCCTTCACTTACTCCTTCCCGGTCGCCTCAGGTATTGGTTCAATC CTGGTTTAGTAATTGTACTTTGGTTTACTCATTTCCGGTTTACTAAACAC TTTTCCCTATCACAGGTCGCAAGTTCGTGCGTCTCTACTTCTACCCCAA CTCCTACGACAGCCTCAACGCAACCAACTCCCTCTTCTCCCTCTCCTCA GGACCCTACACTCTTCTCAAAAACTTCAGCGCCGCTCAAACCTCCCAG GCGTTGAACTACGCTCACATCATCAAAGAGTTCGTAGTCAACGTCGAA GGTGGGACCTTAAACATAACCTTCACACCAGAGTCAACGCCTTCTAAC GCCTACGCCTTCGTCAACGGTATCGAAGTAACTTCGATGCCTGATATCT ACAGTAGCGCCGACGGGACGTTGACCGTTGTAGGGACTTCTAGTGGCG TCACGATCGATAACACCACCGCTCTCGAGAATGTCTACAGGCTCAACG TCGGCGGGAACGACATCTCTCCTTCTGCTGACACCGGTTTGTTTAGGTC TTGGTACGATGATCAGGATTACATCTTCGCCGCGAGTCTCGGTATCCCC GAGACA

BG0452(SEQ ID NO:38)

GGTCTGAGATATATCCTCGAGGGTTGTCCTAAACTAGAGAAGCTT GGGATCAGGGACAGTCCCTTTGGTGATGTTGGACTGCGCTCTGGGATG CATAGGTATAACGACATGAGGTTTGTTTGGATGTCGTCATGTCGGTTAT CCCGGGGAGCCTGCAGGGACATTGCTCATACTCTGCCTAGTG[TGGTGG TGG]AGGCGTTTGGGTCA[GATGATGATGATGATGATGAT]GACGAAGACGACAATGCAGATTATGTGGAGACGTTGTACATGTATCGGTCCCTTGAT GGCCCAAGGAAGGATGCTCCAAAGTTTGTAACAATTTTATGAAGACAA GCTTAGAGAAAGCAGGAGCTGAAGTAGAAGAGAATGTGTGTTTGTATG ATTGTTTGTACCATTTGATTTGATTGGCTCCCCTCTGTTTTTGGATTTGT CTTGTACCAAGAAAGAGTGAAGAGTCAGTGAAGAAAGAGGTTGTTTGT GGAAGTCAAAGAATGAAACTTTTATTATTTGTGTGTAATCAAGAATATG ATTTTACAGCCATTTCACGATTATTTTTGTCTACAAGAAGTATTGGTTAT ACATTACATTATAAGATCTTCACCAATCTTGACTTCGTCCTCCATCAGC AGATGCTCTAAGGTGTCGATGAAAGCAGTAACTTTCTCCAAGCTCTTCT CATCAAGCCTTGGGACCGTGTGGCCCTTGGGATGATGGACCACCACCG GATTCTTGAAGGAATCTATCAGCTCAGTTCCGTAAGGTTTCAAAAAATC AGTCTCTCCTGCAAAGAAAAAACTCATTTTTCACATTGAAATTTGCAAA CCAGATATACAATTTAGTAGGTCATCAAATTACCTAGAAAGTGGAGGG AGGGAATGTCCATGGTAGACGAATACGCATCCTTCGCCACCTTGGTGG ATTTGAACATAGCTCCTCCAATAATTATGATAAACTTGATCTTTGGTAC TTTCTGGAGTGCAATTCCCTGCAATATAAAATATAATTCTAAGATAATG TAATGCGATTTCCCAACGCAAAAGCAACACTACTGACGTACCTTAGCT TGCAGTCCTGGTAATCCTCCAGACAATATTGCACCCTGCAAAATTAAC ATAGAGATATATTATTAGATCTTATATAAGAAACTGTTAAATGAGAAAT GAAGCAATTTTGTAATTAGAGTACCTGAGAAAAGCCAATGAGACCATC AAAGGGACCAAGCTCGATCATACGATCCTCTAAATACTCCAAACATTT CTCGAAATTCG

BG0516(SEQ ID NO:39)

GATGTGTTCTTCATTGTATCTAGCAGAAGCTTGGTCAACAGAAAATGGCCTGAAACAT[GATGATGATGATGATGATGATGATGATGAT]GAGA CTATAAAACTTAGGACAAAGGTA[TAATAA]TC[TTGGTTTGGT]TTCTCT TAGCTCACCTAGATGGTTAGTTGCGAATTGCAGCTCAATATTGTCCTTA GAGAGCATGAAAGGACATGCCATTACCCCAGCGTTGTTGCTAACAAGA TTTGAGAGATTACAAAACATTAAAACCGTCACAAAACACTAGACATGA ACTACTGTGTTTCGAGAGCTTACATCAAGATGTTTAGTGGAAGACCAG TAGATTTGTAGTCAGATGCAAATCTCCTGACAGATTCAATTGAGCTGAG ATCTAACTCCATGACGTCGAGTTTAGCACCAGGGACTTGATTGAGGAT ATCTTGCTTAACTTTAGCACCGGAGACAGTGTTCCTCACCGCCATAACC

BG0647(SEQ ID NO:40)

GCACATATGTCCGCACCTGTACAAAACCGCCTCGACCTGCGTTTC GTCGCAGACGCAGCATTTGCGTTTCATTGGGTTTTCTCTGTAAACCGAT TGTTGCAAGCTCGCGTTAGCATCCAAACACGTTTTGACAGAATCTCGTA GTAAGGACATTTCTTGTTGAAGCTGTTGGATCTGTGTTCTCATATCGGT TATCAGCTCCATTTCCTGAAAACGTTTTAAAGCGGTTCAAAGATTTTAC TATTCTACTAGTTGGGGTTTGCGAGTTTTCTATGCAATAACAAGAAATC GAAAATTACTTACATGTGAAGGAGGATTGTGAACAGACAAGACAGGA GTGGAAGTTACTTCGGTGTCTTGACAACTCCATGATCCTGCAGGAGAC GATGCAAAGATGGGCGAAGAAGACGATCTGCTTGAGTCATCTCTATCG TTTTGTTCTTCACCTTCCGTTGATGGCTCTTCTTCAGTTTCCTCCGCAGT GTCATCTCTATGTTCTTCCT[CTTCTTCTTCTTCTTCTTCTTCTT]GTTGCA ATTCCCATGATTCAGAATGCTTTTTCGAATGTGTCTGCAGACGAGACAT CATGAGCCTATCGATCTGATCTCGTAACCCGCTCTCGAGAAAGTCTGTC ACTGTTCTTCTGTAATAGCAAGAAAATATTTATCTTCTTAGTTAATGGTT TAACAAATAAGAAAAGGGATTTGTTGAATCGATGTTGCGTACCGCTCA AGGAGTCT

BG0651(SEQ ID NO:41)

AATGCATAACAAAAGATTTGAACCCGGGTCTTTGGTCAAACAATA ATCATCCTAAATTTATGCTAATAGTGATTCTTTTGTTAGCCACTGAACA CAAACTCT[CTTCTTCTTCTTCTTCTTCTTCTTCTTCTTCTT]CCTCTTTCC TCTGCACTCTCTCCGACACAAGACGGCGGTCAACGGAGTCCTTGTCGG TCAAATGATCCCTAAGGACGAAGGAGGAGTTGTGGAGATTTCCGATTCTGTTCCGCTCTTTTGCTCCAACCTCGCTCTCCTTCCTCCTCTCTAGATCT CGCTCATCATGGTCGCTCTCACTACATAAGTTTTTGAAATTGAATATTG AAAAACTTAGGATCTGAGTGCACTGTTGCGAATTCTCAATATTGTTGTT CTGTAGCTGTGTTTGGGAGAGAGGCAGTGTCTGTAATAC

BG0713(SEQ ID NO:42)

ACGGTTCAGCACAGTAAAAAAAAAGTTTTTTTGACTTTTTTTTCTT TGACCGCCAAAGAAGACGAAAATGAGTCTTTGAGAAAATCACAAAAA AGAAGAAGAAGAAAAATGAATCCTTTTTGTTTCTTCTGCACAGAATCTT CTT[CTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCT CTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCT]TTCTTGAGGTTTCTTTT CCTCCACGATTCCTCGTCCCTCTTGCTTCTGTGTGATCGATTTTGGTGA AATTGAGCTGAGTGTATCTGTCCGCCGAGGCCTTTTGTTCACTGTTCAA TTCAACATCAGATCAATTTTAGGGGCTTTCAGTCAAAGATCGCTGCTTT GGTGTAAGTTTGAATTTGGGTAACTGAATGAATGTGATCTTTGGTTCCA GTTCATGTAATTATGTTTGATTGACTGGGAAAGTATCATCCTTTATTAC GGATTGTAAACATTTAAGGTTGAATCTTAACATTAGCACCATTTGGATT CGAATTTGTTTGGTGGGTTTGGCTTTAGATCCATAAGCAAGCTTATGAG CTCTTAAAGTTATGTTGTTTTTTTTTGCTTAAGCCATTCAAACTGATGAG ATATACTCTCTTTGTCTTGCTTCCTAGGTTTGTGATTTTAGTATAGAATC CTGTTATCATGGATGAACACAATAGGAATCCATTTGCAAGTGCAAGCG GAAGAGCAAGTGGAAGTACAAGTGTGAGTTCCAACTCCAGTTTTAGTA GCAGCGTGGCGGATACAGAGGATGATCAAACCATTGC

BG0864(SEQ ID NO:43)

TGCAAAGGAAGCAGGTGTAGCAGCTCAAGCTTATGAAGCTCTAAA GACACTGAGAGAAAAAAAAACATCTGCAAAGTGGTAAACAAACTCTTC TTATTTCACACAACACATGGTAAAGAAAATACTTTTTCATGGAGAATAA GAAGAAGAAGAAGCTAAATGCGTTGCGTTGCAGGTG[GAGAGAGAGA GAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGA GAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGA GAGA]AGCGCATAAGTAGTGTTTGTGTGTTGGTGATTTTCTATTTGGAA ACTCTTTTGTAAGCAATAATCTCAGATGCTAAAGCCATTGTATTTATTGCTCACTTCATTTTACAGCCAAACTAAGTTTTAAAAACTGAAAATATAAA ACGCTAAAATTTTCTTTGGTTGACATCAGCATAATATAAATTTAGCTTA CTCCCTCGATTCAACAATACAAAAAAAACGACATAAGTTTGAGTTTAC ATGCTTTCAACCAATAAAATGGAACTCTTTATCATAAAATAACAGTCAA CGTATTATTAAGTCCAAACCACCACAAACCAATATTTGCACAAATAAA AGTTTCCAACCTTAGCTGCCACTATAAAGTTATAAACCACCATCCAAAG TCCATTATTTTAAGATAGATTTCGTACGGTAC

BG0869(SEQ ID NO:44)

TCGTATAAAATAAAATTCTGAACAAAAATAATTATATAATTTCAA ATTGCGGCTCAAAATCTATTATTTTTAAAAACTCAACAAAATTGTATAT GGGCCGATGAAGCCCAAGTATTTTAATTACCGTAAAGGAGGGTTTGAGTCGGCCACAAATCAAGGAATTATTTC[CTCTCTCTCTCTCT]CCTGTGAC GAGTTG[CTCTCTCTCTCTCTCTCT]CGTCTCGTCCGCGCTCCGAAGAAA TTTCACAGATTCCTGTCATGTCTTCCGGCGGAAACTCTACCCTCTCCAA CGTCGAAAAGATGTTCTTCTGTTACCAGTGCAATCGCACAGTCACCATCTCAATCTCCTCCTCCTCCGACGATCCTTTCTGCCCTCGCTGCTCCGGTG GGTTTCTAGAAGAATACGACGAGCCAAACCCTAATCCGCCCCCAAATC TCAACCCTCTCGGTTTCCTCCCCATGGCCGATCCTTTCTCCACCCTGCT CCCGCTCCTATTCGGCTCCTCCTCCTCTCCTCCTTCCTCCACGAACCAG AGCTTCTTCGGCCAGAATCAGCACCCTCCTCGCGGCGGAGCTTTCGAT CCGGTGTCGTTTCTCCAGAACCATCTCCAGCACCTGCAATCCAGCGGC ACTCACGTCCAGTTCGTGGTGGAGGATCATCCCTCGGATCCGTTTGGC CGGATGCCGGGGAACATGGGGGACTACTTCTTCGGCCCTGGCCTCGAG CA

BG0988(SEQ ID NO:45)

AACGGTTTTGTATAAATAGTATATTCTATATATGTATGCATATAAT CTTTTTTCGTAACTTAAAAGGATTAAACCGGATTTATTAAAGACACAAA TCTAACTTCCAGATGAGAGGTGCAATACACATATGGATTATTTTCCAGA TATTTAAATGGACCATAAATATAGACCCATAACCGCGTGGCCACATAT GGAACTAATGATTTCGCACTAGAAGGGAATCGATTCCTGACCTGAACC AACAGGACAATTCCTCCTCTAGCGGAAACCATTAAGCCACCACAACAT GGTTTTAAACAAAAAATTGTACGCATCTGCGTGGCTTACTATTAAAACA TCTCTATCTCTCTCTTAAAATACATCAAGAGTATAATGAGAGATATCTC AGTTTCATGTAGTAAGACAAAACCCAAGACTCCAACCGGAAAATTCCA ACCCTAAGAGGCAAACTAAATTTCATTGTACAATAAAATAATTAATGCT ATTCAGTTTTCTAAAAGCAGATTTAAGTCTCTAACTCCAATTTTCCAT[C TCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCT CTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCT]AA ATCCCCACTAGGATTATGGGAACTCACGTCCTCGTTTAATGCGATTCAT GACTCCTCAAAGCCCAGCATTCCCACTCTGCAAATTACTAGTACCTCTT AGTCTTAATTACCATTTGACCAATCT

BG1062(SEQ ID NO:46)

GTAATGCGGCAGGACAGCCCTCCTCGGAGTCCACTTCATGGAGGA GCATACTATTCATCCAGTGATGATGATAACCACTCCACCTACCTCTTCC CAGAAATTGGCACCCCAACTCGTTCCATCCCAGTCTCCGCCAACACCA CTGTATGAAT[CTCTCTCTCTCTCTCTCTATCTCTCT]TTCACCATTGTTTT TATGATCTTATGGACCTTAATAAATAAACATATGCAGCCTGTTCACCAC AACTACCAAATCATTGCGGTGGAAACCTACGAGCAAGAGAAGCAGTACGAGCCACCGGAGCTAGCGGACGAGTCACAGAGCTTCTCGATCCAGG AGATCGCCAAAATGCGAGGACTCAAGGAAGAGA GCCAATCGATGATC TCCGAGTCCTAC

BG1090(SEQ ID NO:47)

GTGAAACCGGTTCTGGAGAACTCTAAGGTTGTTTTGAAAGATCGC AAAAGAGAGTGGAAGCGGAATTAGGGTTCTGGTTATGGCAAGGAGAT GAACCGGAAGGAGGTACGAATCCTTTGGGAAGCATAACAGAAAACGT ATCCGGTCGGACCGGTCGGTTAAAACCGTTACTGTTTTTCTTGGTCATC ATCTTGAAGTAGTTGGCACGGTGACGAAGACCACGGCGACGAATGCTA TGGCGGTAGTAGTAGTAGTGATGGTTGTAACGAAGACGACGGTGCTGA TCACGTTGCCGCGGGTTCAAGATAAACGGCGTCATTTTCTTGATGTAGA CGAGTTGGTGCGGTGATTCGTCGCCGTTGAGGTAGGTTTCTGCCTTTTG TGTAGATACTCTTGTTTCTTGATTCGATAATGATGAGGATGATGATGAT GGCGATGATGGTAAT[GATGATGATGAT]GGTGAGATAGGGAAGACGA GAATGAGAATGAGAGAGATGATGAAGCATTTGACAAGGTTGTGTTTCA TCAAAACATCCATTGCGATT[GAGAGAGAGA]GGGAGTAGGACTTTTGG TTTAATAGAGAGAGGGAGAGTAAAGATGAAACAAAAAGATGTGAGCGAGGCAACTATAACAAATCTTGGTATGGCGTCTAAATAATTCGTTTAGTT ATTCGAATTTTAATTAATTTTAGTATGATTTTTGATTGCGTATAATTTGG AAATTAGTTGGGCTTTTTGTTGGTCTGAGGC

BG1101(SEQ ID NO:48)

CACATGCTTGTGGATAAAT[CATCATCATCATCATCATCATCAACA TCATCATCATCATCATCAT]CAATATCAAATATATGGTAAGTCCATTTTC ATTTAGCTTTCAGTAAAACTGTTAATCTATGCATTCGATAATTAAGAGA ATCAAACGAATTGTGTTTGCAACATTATAATTAATGGTTGAAATTCATT AAGAATATTTAGTTTGGGTTTTCTCATTTTCATACAAACATTATCCATGC ATACGGTTGGTCATTAGGTTTTGAAAATATATGAAATCAGAAACATTTT AATTTTTTTTAATGTAATTTGAAAGCATACAAGTTATGTATATTAACTTT GTGTAATTTGAAAGCATACAACTTATGTATATTAACTTTTCAAAATTTG GACTATAAATAAATATTTCTTTGATCTGCCCAAAATCACAAAAGATTCT TTTACAAGATAAACTGTATCTTTTACTCTCTTTTTTGTCAATACTGTATG TTTCACTTGTCACGAATTTGCATTCAAATAACTATGTAGCAGCACATTA TGATAAAGTTGGAAGTGTATGAATAAATTGATAATGTAGATTGTAGGG TGAGAAGTTAAAAAAAATGAGTAATTTTTAGGGGCCAAATGTATTTTC GTATAAATTAAGGGTGGAAACATGAAAATTAGATTTTTTATGTCCGAA CTACCCACTGACTTGTCCGAAGTCCGT

BG1123(SEQ ID NO:49)

GTTCAAAGGCATATTTATATTATATTTAAATTGGGACCAAGATTTG CTTTGGGACAAGCTGTGCCCCACGACTTTCTCGCTAGTGCTCTCTGGTC GCTTCTCCTTCTAGAGACCAACCATTTCCACCAACTCCGTTTTCAGTTC ACACCATGCCCACCACTGCATCAGTTAGTTGATATGAGCCCAACTTCTT TCTTCACTGTTTAACAAAATGGACTGGTCAACACAGTCTCTGTCACACC CGAGAATTCTAATGTGGTGGACACAATCTTCACTAGGCCACCTTTTGTCACCAGTCTCTCTCTCTCTTTTCCTGTTTTGATCCTTCCATAAGATTAAAC CTTTATGGTTACTACCATATTATAACGATCTCGGTGGTGGTAGCGTAGC CCAAAGATGATGATCCGAAACTGAATGTAAACTATGTACCAAA[GAGA GAGAGAGAGAGAGAGAGAGAGAGAGAGA]GG[GAGAGAGAGAGAGAG AGAGAGAGAGAGAGAGAGA]GTAATAATTAAAACAAATGGGACAAATTAACCCCCC

BG1127(SEQ ID NO:50)

CCGCCATAACAAAAATCTTCCCACAAGCGTGTAGAGATCTG[GAG AGAGAGAGAGAGAGAGAGAGA]GCTTTCAAGTGATTAAATCCAAAAGT AATAAAGAGAAGACGGAGAAACTAAAGTGACGCGCCCCCTTCCTAAC GGATTATATTTATTTTATTCTTATATATTTATGGGCTTATTGCAGCAATA GCCATATTTGAAATGAAAATTAAGAGAGTAGCCATGATGTTGACATAA TGTACTCACTGTCTTTTTACAATTTTACTAGCCGGTTATACCTTTGTAGGAAACAGGTTCCCAGTTCCTTTAACTAAAGTAAACGATGTGGTGATTTAC TGACCCATAGTAACAATGAGAGTATTTTAGCAACGCCTAAAATTAAAA TGAAAGGAAGGAAAACATTCTATAGAGATGAAAATATAAAAAAAACA GAAGTGTAAAAGAAAGAACGTTACAAACGGAGAATGCATGGATCGTA ATGCTGATGCCAAAATATGGAAATAGTTCCACTTCAAATAGAATACAC ATAGTATAACAATAGTTTAAAGTTTGTCACCGCTATGTCATATGAGAAT ATTTTCCATTCTATCGGATATAGATCAGTTTATATTTACTAATATAATCA C

BG1149(SEQ ID NO:51)

GTAGAGTGATAAGAGAACATCTTGTCTGACTCATGCTTCTTTTCTG CTATGTTAGGCTATTGCTCTTAATGATCTGCCTTCCACTAACGTATCGA GACTGGGGCTTGCTCTTAACTTATCTCTTTTCTACTATGAGACTCTCATA TCAACTAAAGCTGCGCGTAAGATCGCAAAGGCGGTATGTTGTTGCTTT CTCTCATTTAGTATTTTGGTTTATGTTATGCGATTATCATCTATTCTCCC AGATGCTCTGTTTGATAAAACTTAATGCTTTTCTTTCTTTTTTTTTGTTCT GACAATCGTTACTGTTCAATTGTATTCATATTGTGGCATAAATATGTAT ATGTTGCTACACTTCCCTGTGGGTGTGCAATCTTCATATGATATAGTAA TGGTTTGCAGATTGCTTATCATTTGGAAGATAGATATTGTAATTGATTA TGATGATGATGTGCATAATTTGGAAAGTAGAGCCTATCGTTATTCCCTT ACACTAATGGAATTATATATTGATGATGTTCCAAATTTTTTAAATATGA TGAATT[GATGATGATGATGATGATGAT]GGTAGGCTTTCGAAGCGTCA ATAACAGAAATGCACGCAGTGAGAGAGGAATCATACGAGCAAACTGC ATTGATCACGAATCTTATCCTTGACCGTATCACCCCTCTGG

BG1182(SEQ ID NO:52)

GTGTTTCTAAGCACTTTTTTTTTATAATCAAATCACATACAGCAAA CATAAACATGAGTCTCAGCTTCAAGAGCCAATGAAATTAGCTTCCTTTA TAATATTCAAGAACTAACCAGTTTCACTTCTACTAATCCTCGGCGCACTGATGATGTTTCTAACTAAATTGGATACTAAAGAACGTAGCTTTTCACCT CGAATCAAACAACTTGAAAACCAAAACAATCTAAACGAAATTTCATAA CCTAAGGAGGATCGGAAACTAAAATTTCTACATCGGAATCGAATCGAC GCGAAGTGAAACGAAGATCGAT[AGAGAGAGAGAGAGAGAGAG]GACT CACTCGCCAGGAGAAGACATGTTCGTCGATTTCGAAGATCCGATTGAT TCAGAAGCGGAGAACAATCCAAGTTTTTTATTGAGAGAGCACCGAACAAACTCTCTCCCTAGAACGTTCCTTCCCAGCTTCTCTACAAATCACTTGT TCCGCGACTGCGTATCTTATCCAATCATGTCTTGCCACG

BG1197(SEQ ID NO:53)

BG1197(SEQ ID NO:224)

GAACATCCTGCTGTTTCAGTTCTATTTTTCTTGTGTAGTCAAAAAG ACATTATTACCCCATTGGAAATTACAACAACACATTAGTTGTGAGCGCCAAGATAAGGCTAAAGACGTAAAAACGCTCTGAGTATTCATTCTTTCAG GTCAGGTTCAGAAACTAGTTTCGTTT[CATTTCATTTCATTTCATTTCATT T]CATCCACCTCCTCTTCACTTGAGAAGTTCTGTCTTTTGCGATCCTTGT CATTTTTGTAAAGGTGAGTCGATCTATATATGGTCACTAGTATTCTGGA AATGATGCTATTTTAATACTCAGTTCGAACATTCTGTTATCAAATCCGG TTCTAGTTAGTTGTTCGCGGGATAGGGTTTGCTTGAGATCATTTCGCTT CTTTATTTTTTTTAATGTCACTGATGGATCTGGTAATCTTCCTTATCGAA TTAGGAAAATGAATCTGTATTAAGTGGACTAATCTCAAATCTAGGTAA AAAAAATGGGAGGAGGAGGAGGAGGAGAAGGAGTTGGCGATTTCAGA GCCAAAGTATGGAGCATGTCTGGTGGGCCTTACTGTAGGCCCAAGCAC TGGCGTCGCAACACCGCCTTTGCAATGCTCGGCGTTTTCCTTGTCTGCA TCCCCATTGCCATGAAGTCTGCCGAGCTCGAGG

BG1230(SEQ ID NO:54)

AGAGAGACCTCCAGTCACCTCGTCTCTTCAGGCCTCTTGTGTTTCCTCCAACTTCCTTTACCAAAAAAAAACAAATCAAAATCAGATTCAAAGG AGAGAAAGAGAGAGGGAGAGAGCACTACAAGAGTGGAAAAGAAGAG AATCAGGTCGTG[GAGAGAGAGAGAGAGATGG]CG[GATGGTGGTGG]T GATGAATCTGAGATGCGATGGTGGTCGTGATGAATCTGAGATGC[GAT GGTGGTGG]TGAGGAATGATGGCGGATGGGAAAGATGGC[GATGGTGG TGGTGG]TGACGAGTGAATGAGCGG[TGGTGGTGG]TGACGAGTGGGAGGAGAGATGGCGGTAGTGGTGGTGGTGGTGATGAGGAGGTCAAACCTG ATGGATTGGAGGAGAAAAGGAGGCGTCACAAAGAGAGAGAGAGAGAT TTGTGTGTTAGGTTAAAGATTGCACATTCAGAAATGTGCTTAGACAATG ATCTGAAGTGGTCTTGGTCGAGGTAGTCCGTACATGTCCGTACACAGT GC

BG1241(SEQ ID NO:55)

GGATGGGATGAGTCAGCTGCTGGTGATAGGCCCAGTCGAGTTTCA GTTTGGGACATTGAACCAGTTTTAACTCCTTTCTACATATGTCCTCCTC CATTTTTTCGACCTCGGTTTGCTGGACAACCAGGAATGCCAGGTAAAG TCTTTGTACAGTTTCATTTTGCACATCATCTTTGAATCTCCTTAGAGATG GCAATTCTGGTGGTCTTGCAGATGATGGGACTGACATGGAGTCTGCGT TGAAGAGAGCAATGCCGTGGCTTGACAATGGCCTAGAGATGAAGGAC CCTTCCAGTACGATATTTCCTGGTCTGAGTTTAGTTCAGTGGATGAGTA TGCAACAGCAGAACGGCCAGGTCCCTTCTGCCGCTGCACAGCCTGGTT TCTTCCCGTCAATGCTCCCTCCAACCGCGGCTCTGCACAACAATCTTGG CGGGGCTGATGATTCCTCAAAGTTACTGAGCTTTCAGGCGCCTCCAGG GGGGGTTTCCTCATCAAACCTCCAATTTAACAAACCGAATCCGCAAGCGGCAATGTCCCAGTTACCTCAGCCACCAACTACGTTGTCCCAACAACA GCAGCTGCAGCAGTTGTTGCACTCCTCTTTGAACCATCAGCAGCAGCA GCAATCACAGCCTCAGCAACCACAGTCGTTGCAGCAACAACAACAACC GCAATCCCTGC[AACAACAAC]AATCACTG[CAGCAGCAACAAC]AATCA CTACTG[CAGCAGCAGCAGCAACAAC]AATCTCTGCAGCAGCAGCAGCAACAACAATCTCTGCAGCAA

BG1244(SEQ ID NO:56)

ATGATGATGAAATAGCTCTGAAGAAGAAGTTAATTAAGGAATTGT TGCTGTCTAATTAGGTGTTCTTGTTGTTTGGTTAATTATGTTTGGTTCTC GGATTTGAAAGCTCTGTTAAAGAGCTTCAGTTTTAACTTTAATTATCGG ATTTGAAAGCTCTGTGAAGAGCTTTATTTTTCACTTTATCTGTAATTGTT CTCCTGTTCTTGATGATATAAAATATTTAAGTTGTTCTTGTGTTGTTCAG TTATATTTACAGTTGTTGTTTATGATATATCATGTTTCTTTGTCTTGTAG AGAAGTCACGGAGTCCACAGAGATGCTTGGACTGAAGGGAGTCACGG AGTCCACAGAGAGATGTCATGTACCATGTCTTGTAGTGTGCAGGGTCT GTAACGAGTCACGGACCATGTGTTTGTATGTGTCAGTATGTGTTTGTAC GTGTCTTGTATGTGTCACAGAGTCCATGTTTTTGTTTGTGTCTGTATGTG TTTGTA TGTGTCGATGTCTTGTAGTCACGGACAGTATTTTTGTAGTCAC GGACTTTTACCAAACTCATCTTCTATTTATAACATCAATCTCATCTTCTA TTTATATCAACCTTCTCTCTCGAAACATATACAACGAACTCTTCTTCTCTGCTTTACAACAACAAACT[CTTCTT]CT[CTTCTT]AACAACAACAAACT[C TTCTT]ACCATATTTATATTTTTTCCCCTTATTATAAACACCAAAACCAT CTTTATAAAAACTTTATATGG[CTTCTTCTT]CTC[ATGATGATGATG]CGT TTG[ATGATG]CATTTG[ATGATG]TTTTTG[ATGATG]TCTATGATCAATAT TTTGATCAAGCATTTGAGAATTTGACCATTTGTCGTGATCAAGAAGAAC GAAGAAAGAAAAGAAAAAAACGAGCGTATATCGAAAGACATCGTGAG GAA

BG1286(SEQ ID NO:57)

AGTCCGAGACAGAGTATGCTA[AGCAGCAGCAGCAGCAGCAGC]T GAATACTGCATATGATGCGTCACAGACAAATGCTCAGAATCAGATGCA GAATCTTGCTTCTTTATCAAATGTGATGGTAAGCTACATGTGCATTATT CATATTTGAAGTGATCCACCAATGACATTCTCCAATGGCATTGCTAACA TTGGTACTTTGTTTGTGTGTTTTTGACTCAGCAGGGATATCCACACTCA GATCCCAACAGTTTATTGGCACAAAACGCTAGGGAGCTTGAGTTCCAG TATTCCAATTTTGCACAGTCTATGCAGTCAAGAAATAGCAATAATGCTT CTTCACTTGGTGGTCAAAGCATTTCCATGCCAGAGGTAAATAACCACTT TTGTCTTCTTTTTTTTTAAGAAACACAAGATGTCTTGTTAATTAGGTTTT GCTCGACTATGGAGTGATCTATATGTATCCAAATCTATACAACAAGAG GAATTTATATGATTTTGATTATATATTTTCTTACATTGTAGGCGCCCCGA GGCAGTGGAATCCAAGCGACGCAGCAAAACTTACAAGGTGCTAATATC GCCACTGGACCAGCACTTCCTCAACAGCTT

BG1288(SEQ ID NO:58)

ATAAGCATACCAATGAAGATATCAAAGAATGCAATATGTATGTTT TGTGTTGTGAAAGCTAAAGGATTCTACTTTATTTGTGTTGAGTGATGGT TCTTTAGTTTGGTGTTAATGTCTTGTGAATTGTGTTTGGCAGGTACAAG CTAGGTTTTTGTCCCAACGGTCCTGATTGTCGGTACAGGCACGCGAAG CTGCCTGGACCGCCGCCTCCAGTTGAGGAAGTTCTTCAGAAGATACAG CAGCTGACTTCGTATAATTACGGGCCTAATAGATTCTATCAGCCACGGAACGCTGCTCCGCAGTTGGGAGATAGTAATAAGCCTCAGGTGCAAGTT CAGACGCAAGAGGCGGGTAACTTGC[AGCAGCAGCAGCAGCAGCAGC AGC]AACAACCTCAGCAGTCACAACATCAGGTCAGCCAGACTCAGACA CAAAACACTGCTGACCAAACGTCTCATCCTTTGCCTCGTGGGGTAAATAGGTGTGTTCAGAGTTTCTAAAGTTTTTAATTGGGTTGTGTAAACTATG CTTCTGTATATCTGTCAAGACATTGTTTATTG

BG1321(SEQ ID NO:59)

ATGAAGATTGATGTATATTCGAATTTATAAAGTCTACGTTTAGTAA AGGTATACAAATCAGAGGTCTGAATTTGTTCAACTTCCTCCTCATTCCC CCATCCCCAAAAGAATCCGAGTTTTTTTGGATCAAGCCTATATAGATCC AAAAACCAACATAATGGCCCATTAAAGATGCATAGACTCGAACCAAACCGGATTAATACACTGCGGGTGAAACCGGTTTGGGAATTTTCACAATTG ACTGAAGAATCAGGGTTTAAGGAGAAGTCACAGACCCAGG[AAGAAGA AGAAGAAGAAGAAGAAGAAGAAGAAGAAGAAGCAGAAG]AATGGAGT CAGAGCACCAAACGATGGAACAGTTCCTACGATGGGCAGCAGAGCTTGGCGTATCAGATTCCATCGATCCTTCTCGATCTCAAGATTCATGTCTCG GCCATTCCCTTTCCGTCGCCGACTTCCCTCTCGCCGGCGGGTGCGTAGA AACAAAAATCACATCTTTTTATCATTCAAATTCCTAAACTTTTTCGACC ATTGATGGGAAACTAGGAGAGGGTTGGGGGCTGTT

BG1368(SEQ ID NO:60)

CTTCAAGTTTCTATTATTATCAGTTCAGGAAGTGACACTCACTAGA CCAACAGAAGAAGAAAAAAATCAACATACAGAAAACAGATAAGCACT GCTCATATTAATCATGAATCGTTCAACAAATTTGATCCGAACATTACAG AAACTATACGTGTTTGATCCAACAACGAAAGGAGCACAAACAAAATGA GATCAATACGATCGTTCTTCATTGTCGTTCTATTACAAAACTGTGCTTG CTTTGTTGGTTCGAACTCGAACATACAACAACATAGATAGTTATGTCGG GATATACTTATTTATATTTAGATTTAATTATGGATAACGACGGCGAGAG ATTCTCGGCGACGGAATATCAACTGTTTCGCGATGAATGCTTCGATCGT TTTCTGAAACTCTTCGTTTGTCAGATTATCCTCCGGAAACGGCACTTCT TCGCACGACGCGACGGTTTCACGGCACTTCTCCGTCTCCGATCGCCGG AGCGTAGGTTTCGTCACCGTCTCCGGACTCTGTTTCGCAGAGATTTCCG TTTTGCTTCTTTTATAGACCTT[CGTCGTCGTCGTCGT]CGGAGGATGAT CATTCGTCGATTC

BG1392(SEQ ID NO:61)

CTCAATCTTTGTGTGGGTGGAGCAATACATAAATTTTGTGTGGTTG GAAGGTTATGAAATGAAACTTTTAGTGGAAACGTGAATAGATCATCCA ACTTATTTTGTGTGTTTTAAGAAAGATTAGATGAATTTGACTCAGCTCA TTGGAGAGAGAGAGAGAGAGAGAGAGAGAGGCTTCACAGAGCCCATC GAATCCTATGCGCGTGTGAAAAGCACGATCCAATCACGAAGCTAAAAT CTTCAGCTTCGTTGTATAAAAAAAACTTATTGAAACAAACCTCAAATTC CAATTACACCCTTGACAGCGATACACACTCTCTCTCTCTCCAACTAAAA CATATCTGGAAATTATAAATAAAATTTATACTTTATCTGGTAACCCATC AAATAAAGCTATTAGTCACATAATAGATGACAAAAAAAAAACAAATAA AGAAAATTTAGGAAACAAATCTACTGAGATTAGGCTGTAAATCATACG TATATCTTTCCCGTATACAGAGTGCCGTTTTAAGTATAATGTCGACACG TGTCGGTCAGAGGCTCGGCTTCCAAGGGTAAGATTGTAAAATCACGAT CGTCATCTCTCTTTAAGAATTTCCAGAGTGCT[GAGAGAGAGAGAGAGA GAGAGAGAGAGAGA]GGTGCTTTCCCATAGCCATTCACGTC[GAGAGA GAGAGAGAGAGA]GGAAGGAGATGGAGGATATACAGGAGGAAGAGAA CGGTACGGACGAGGAGGTGCTGGGATCGAGCTTGACCATGGAGAAAG TGGCGGCAGCTAAGCAGTACATCGAGAATCACTACAAAGCTCAGAATA AGAACATTCAGGAGAGGAAAGAGAGGTATTATAAATCGTCTCTTTCGT TGAGTGAGAGATTTGAGATTTGGAATATCGTTTTTTTTTAGAGACTAGT TAGGGCGAAATTAGTTGCGTGAGCTTTGATTAGTCTCTCGTATTTGATG ATAATCATGGT

BG1442(SEQ ID NO:62)

GAACAATAACCTGATCAAGGCTCTGCTCAGCTGCTTTACGCTCGT CGGGATTGGGACTGCAAGCAGCCGCAGCGATGATTACTGCCAGGTTAG ACAGATCCATCGGGAAAATTCAGCAACAGATTCTCCGAGGAATAGTCG GCGTGTCAAGAATTTTCCGGTGAATCGAAGAGGCGAGGAGGAAGAAGATGACCGACGAAGACGAGGACGAG[GAGAGAGAGAGAGAGAGAGAGA GAGAGAGAGAGA]GGTATAAGAAGGAAGGTCTAAGCTAGGGTTTTAAT GTATGGTTCGTTGGTCTGTTATGGTAAGTCTATCGCACGCACGCGCGTG GTAAAAAAGTGAAAAAAAAGAAAAATCGACGTGAGACACGATACACA ACCCAGACTTGCCTGGACCTCTAGTCACCTATTTATTTTCACCGCCTGCTCGTTTAGTTAGTTACGGTCAATCGATTGACTTTTGGTTATTTTCTATGT GTTTTCAATATAATCAAATTCAAATGATTTTTTAA TCAAATCAAATGTA AATAATAAATAATAAAAATCCAAATGGAATTAATTAGTTTAAACTTATT AAACTATTTTGTCATCTTTTTAGTTATTTAAGAATTATATTAAAACTTGT AAAATTCTAGTTACAAATATAATTTAATGCATAAATCTAATGAATTTGG GAGAAAATAG

BG1449(SEQ ID NO:63) GGTTTCCGCCGCAATGATTTGGTAGTTGTGGTGAACAGGCTGCATATGTTTATTTATTAAGGTCCATAAGATCATAGAAACAATGGTGAAA[GA GAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGA]TTCATACA GTGGTGTTGGCGGAGACTGGGATGGAACGAGTTGGGGTGCCAATTTCT GGGAAGAGGTAGGTGGAGTGGTTATCATCATCACTGGATGAGTAGTAT GCTCCTCCATGAAGTGGACTCCGAGGAGGGCTGTCCTGCCGCATAACG TAGCCATCTGGCTCATACATTGCTTCCATTTGCTCATCATTATGATTGTT GCTGCGACGGTCAGGCTGCGATTTGTTTAGGAGAGCTGATTATTTATTG TCAAGAATATGTTTTATCACTAGAGAGAAGCTCAGGCTTGAGAATGTT GTTTGAGTACCGTTCTGTATTGTTGTGGTGGTGGCGAACGGGTCGCAG CTGGATGAAATGGGCTTGGTGGAGAGCTGTTTCGTGGTGTTACTTCGC CGTCTCGCTCATACACTTCCTCGGATTGCTGATTATCAGGGTGGTTTCT ACGACGATCAGGCTGTTAGAATTAGAATAACGAACTTTATTGTCAGGT TAAGTGAATCACTTTATCTGTTTCTGGAAAATAAGGCTGAGTTTTATGG TACCGTTCTGTATGGTTGTGGTGGTGGTGGCGAACGTCTTGCGGCTGG ATGAAAGGGGCTCGGTGGAGAGCTGGTTCGTGGTGTTACCTCGCCG

BG1453(SEQ ID NO:64)

AGTGCTTTAGGAGAGGAGGATCTTGATACAAAATTGTTCTCAAGA ATTGAGAAGAGGAAGAAGAAAAAAGGGTATTAAAAGGAAGAAGAGGA GGGCTTTATTAATCATGTATTGCTAAAGAGGAAGATGAGGAACTCATCACCTTCCTTCCTTCAATGGCAATGAAATGAAAA[GAGAGAGATATGAAT GAGAGA]GTGAGTGAAAAA[GAGAGAGAGAGAGAGAGAGAGAGAGAG AGAGAGAGAGAGAGAGAGAGAGAGAGA]GTTGGGTCTACCATGAAAAGCAGAGGAGGTGGGTCAAAGCAAAAGTTTTCGACTCTTTTTTTAGGGC TTTTCAATTTCCTTTTTTTCTTTACTTTCCATGTTTGTATATTTCCCAAAA CTCGAATTCATACACAAGTATCTCGGGAAAACGGCTTATTCATGCCCG AACTAGGGGTTGCTGAGAGAATACATACCTCAACTTTTACTGCAAGTC GAAACATAC

BG1513(SEQ ID NO:65)

ATAGGTTCTGTGTCGTAACCATTAGAGTCTTAAAACCGTCAATTTC GATTCTCACATCCAAAAGGTTTTAACATTTATATATATAGTAAGATGGG TAAAGTTTGTAACCGCTCGTGTATAAAAATCAGGTTTACGAAAATCGC ATTACTTTTGATTTTCTGATCGAAACAGAGCTTCGAAAAGGAACTACTA CGCAGTAAATAAACTTACTTGAAGAAACGAAACTTACTTCGAAAAGGA ATTACTTTCTGAAGGTTGCGATAGCGAAGAGAAACTT[GAGAGAGAGA GAGAGAGA]GCGAGCGAGAGAGATATGAGAGTGATACCGCGGCGGAA ATGAAGAAAAAAAAAAAAGGTTTAGGGTTTAACGACGACTGTTGCAAG TTGTAACCTTTGACTTGTTTTTTTTTAATAAATCTTTTTTTCTTTAAATTA AAAGAATAAACTCTAGAGTGGAAACCCCCTGATAAGTAATAATGTTTC AGTTCCGACCCCAAAGTAAAGTTTCAAATAATTTAACCCAACTTTATTG TAAATAAAAAAAATATTTCGATGAAACGAATATGTGCAAAATTTCATA TATCCATAATTCATTACGATGTGTTTTATCAAAAAAAAAATCTTTT

CA0105(SEQ ID NO:66)

GGTTAGTCATCCAAGAACAGAAAAATCTCTAAAGAAAACAAACA AACCTTGATGTAATAAGCCTTGCGAATCTCTTCCTCAGAAGCGGAGGG AGTGACACCAAGAACATCATAATATACTGTTTCCTTCACCATGATCGGATCAAAGCAAGAGATGTAACTTTTTTGTGTAGATAAGAAAATAAAGGTT GGTTTTGTGGATTGTGTGTGAAGCTTTTAGGAGATATGGG[GAAGAAGA AGAAGAAGAAGAAGAAGAAGAAGAAGAA]GTTGGGACACAAGAGAGGTAGGGTGTGTGATCTGCTTGAAGAAGCAAATAAAGAGATGTCTTTACA GTTATGCACTTTTGATTTAATAAATAAAAAACTTTATAGCGGGGAGGCT ACACTACACTTTCACCATCTCTTTTTAACTGTCCACTCAATTGCTTTATT GATCTCATGCCTCCTTTTTTATTATTCCATTGCTTTTCTGTATTGTTGAA CATACTGAAGAAAAAGAAGATGATGATTTTTGCAATACGATTGTGATC TGGTGTATCTTATCATTTAGCCAAATGGATATTAAGTTGGAAAAAAATT CAAAAATATAGGTCCTACCGGGAGTCGAACCCAGGTCGCTGGATTCAA AGTCCAGAGTGCTAACCACTACACCATAGAACCTTGTTGTCTTAACTTT ACTTTATTTATTTATAATGAAACATTATAT

CA0120(SEQ ID NO:67)

TTTAAGCCAAAATGTCATAACACAACAAAATGAGACAATAATAAC ATTACTGTAACAAATACATAGTTTCTAATTAGAACAAAGACTAAACCAGACCAAGAGAAAAGTCGACAACAACTTTTAACTCTGTCCTT[CCACCAT CATCATCATCATCATCATCATCATCATCATCATCATCA]TCCTCATAACT TATTGTTGTACCAGAACACACCTTTCTTCTCACCTTGCCTATCCGGTTCAACATAGATACACTCCTTCGCCTCCCTCCACATCGCCTTAACCACCGGC GTTCCATCAAACTGGTAATACTCTCCAAGTATCGGCTTTATCGCCTTGG TCGCTTCCATCGCGTTATAATGCGGCATCGTCGAGAACAGATGATGCG CCACGTGCGTGTCCGTGATGTTATGAAACACCTTGTTCAAGATTCCATA GTCTCTATCCACAGTAGCCAAAGCTCCTCTCAACCAATCCCACTCCGAA GAATATAGTGAGGCAGCGAAGGGTGCGTGTGCTGCAAGTAAGTGATCA AGACGAGGAAACAGTTGACAATCATAAGCGGAACTCCGTAGACACAG ACCATCGAGGCCACTCCTCGCGAACCAGCGTAGCGGTAGAGACCGTAA CATACGGAGAGGACGCCAGCGTCAGAGATGTATATCTGGAGACGCTCG CGGTCGTTGTAGATGGGAGCGTTCGGGTGGAAATGGCAAGCGAAACC GTCGCTGTAAGGTCTTCCAGAGACGTTGAAGGCTAAGTACAACGGCCA GCCGAGCGTGAACTGGACGGTTAGCATCACCGTGCGTCCTAGCGGG

CA0163(SEQ ID NO:68)

TGAGCTATTAAAACTACATTATCTTAACGTCATATCAATTTGACAT TTGCTTAATATTCATTTTCTTAGAACCGCTTGTCAAAAGCTTTCCCAGTT TTCCATTAACTAAAGAATGCTATCAGGAGAAGTTTCTGAAATTAGATCA TCATCATCATCATTTCTTAGCAACTTTTCTGAGATTGAGATCATATATTA TCATCACCATCATCACCACCACCATCATCATAATCATATTTGCTTAGCA AATTTTTCTAAGAATCGTATATTATAACCACAAAATCTATATTTACTAA CTTACAAGATAGATCCCATAAATTTATAACATTCTGCGATTACTCATTC CCTATATAAATAACGTTCCATCTATTATATCCTACATTAT[CATCATCAT CATCAT]CACCATCACAAT[CATCATCAT]CACCATCACAATCATCACCA TCACAGTCATCATTTTTTCATAGCAAACTTACAATTCGAAGAAACGAGC GCCAAAACATCCGACCTTCTCCAGCAAGACTGAATCCAAAAATCCGAA ATCGACAACATCTCCAGCTCATCACGAACCCTAGGCAGCCACACCCGC ACGAATTCGACATCGGTAAGGTACAATTCGTCGGAATCGTCTTCGACC AAGTCGTCGAACGACATCCCGCTGAGCGCCTTATCAACCCCAACCGAT ATGACCCTAACGTTGCGAGAATCTTCGATCAGATTCCTGAAGACCGTC TTGAACGGCGTGACGGAGGTCGAGCGCGATTTGGAGTACCGTGACAAC GTGCATAGG

CA0221(SEQ ID NO:69)

TGTTCCTCTGTTTCTTCAACCTCAAAAGCTCTTTCCACAGAACAGT GCAGTTCGGTGGACGAGGAGAAGGGTCGTCGTCAAGAAACCAGCTTC CTCTGTTATTATTCTCCTGCTCCTTGGTGCTGTTGTGAACAGTCTCCTCT TTCTTAACTCTACGAT[CTTCTTCTTCTTCTTCTTCTTCTT]CTACTACTTC TACTTCGTCTACGTCGACGACTTTTGTTTTCAAGGTAACGTTTTGAAGC TTCTCCGAGTGTTTGGCTTGCCAGAAAGGAAGCAGCTTTCCTTCGGAG AACAGCTCGTCTGCGGCGGTGAGCATCGTTTGTGTGTTCGACAGAAAC TCAAAGTCTCCAGCTTTCACTTGTTCTTCTTTTCCCCTTAGGAGATTCTC AGGGTTGATGCAGATGTAGTCTCCCTCGCTGTCTGATGATGACAGATC GGCGGAGAAGGAAATGCGAGGTCCTTCCGTCGTGAAAACCATCGTAGC CTCCGCCGTTTCCGCTACTACCATGATCGTACAAATGTGTAGTTATGAA GTGAAAGACAAATCAAGTGGA

CA0226(SEQ ID NO:70)

TCTTAAATTTAAATTCTATTCCTCAAACACTAAATCTTAAATCTAC ACTCTATATCTAATACTCTATACCACAAATTTAAACTCTATATACAAAA TCATAAACTCAATCTTTACAAACTTATAATAGAAACTTTAAATTTAAAC CTAAGTATATTATAAAACTCAAATTATATACTTAATCCTAAATCTTAAC CCTAACTCATAAACCACATATTTCATAAAATATTAAATCTTAATTTTTA AATAAATTATAGTTCCATAAATAAATTAAAATTTCAAATAAAAAATTTA GATTTTAAATTTGAAATTATGATATCAAAGTATTTAAAACTTAAATAAT TTTTATAATAGCTATAAATAAATAAGAAGATAATTTGTATTGTTTTTTTA TACCATTGATTGATTTGAATCAAAGACTCAAGATAGCTCTTGTATCTAT TTTCGCCTTTTTTTCTTATCGGTAGTTGTTGTTTATGGCATGGATCACCTGCACCCTTAGATAATATTGAACCAGAGATTAATTGTTCTTTTATTCTTTT TTTTTTAATTTACTTTTCTCAGATCTACGAAA[GAGAGAGAGAGAAGAG A]TGGAGTTCAAGGTAGAGAAGGAGAACGCGACGGCTGTTCGTC[ACC ACCACCACCACCACCACCACCACC]ATCGTTCGTCACTACCACCTTCGC TTCTCAGATACGTCTTCACCGGAGTCGCCAGAACCACCGTCACGCTCG TCATAACCAACATCGCTCGTTCCCACAACCACCGCCATCTCTCCCATCA GCCATCGCTCGTCACCACCACATCACTTCTCAGATCCGTCTTCACCGGA GTCGCCACCACAACCGTCACGCTCCTCATAA

CA0233(SEQ ID NO:71)

TTTTTTTGGTTCTTTTAACTTTTAATAATTAATTCAATAATCTGTAA CCTCTCTATGTATCTCTTCCTCATTGTATCTGATTGAGTTTGAATCAGTT TTTGAGCAGGACGTGGTGATGCCAGAAGATCTAGCGAATGTCCTTAGG ACAGCGAAAGAGATTGTCGTTGCCACAGTCCTTCCCGTCACACTTTGCT TTTTGTACATCTCTATGCCTTGACGCCGCCGTAGGAACACGCTATCAAA GCTTGCGGGGTTGGAGGGAGCTCGACGACGGAGGAGGCAAGCATGGTCTCGTCAGATACAACAGAGTCAGCATTATCTCAACATTCCGGTCATGTA AGCGGTGTAGTCGTTTATACAAATTTGATTTTCAGATCTGAGATTCGCT TTTTGACTTTACAGTTTTTGTGTATATTTTTGTAGGATAGGATGAAGGG[ GAAGAAGAAGAA]GGAGGAGACGAAGACGAGAGGCTGTGTGGTTGGC GTCAGTTATAT[CACCACCACCACCACCACCACCAC]TACCGTCACGCTT GTCACCACCATGCTCCTTTCCATTCGAGGCGGCTGGAATCTTTTTTTTT CTAGGTTTAGA

CA0328(SEQ ID NO:72)

ATGGTACAAACAATCATACAGACACGCATTCTCTTCTAGTTCAGC TGCTGCTTTCTCTAAGCTTGTCTTCATAAAATTGTTACAAACTTTGGAGCATCCTTCCTTGGGCCATCAAGGGACCGATACATGTACAACGTCTCCA CATAATCTGCATTGT[CGTCTTCGTCGTCGTCGTCGTCTTCGTCGTCGTC GTCATCATCAT]CTGACCCAAACACCT[CCACCACCA]CACTAGGCAGAG TATGAGCAACATCCCTGCAGGCTCCCCGGGACAACCTACATGACGACA TCCAAACAAACCTCATCTCGTTATACCTATGCATACCAGAGCGCAGTCCAACATCACCAAAGGGACTGTCCCTGATCTCAAGCTTCTCTAGTTTAGG ACACCCCTCGAGGATATATCTCAGACCCATGTCACTGTCCCCTGCAAA AGCTACAGATAGAGTACGTATCAGTTTCCCATACTCTCCTATAAGGCTA AAGGCTTGGTCCGTTAGTAATCCAGATACTGCAA GCCTGGTTAGCTTCT TGCAGTTTTTAACAATGGCGCCAAATCCATCGTCCATTGGCTTCCTTGT CACGTGGTCAGGCCTATGGCGACCCATTATGCAAAGCCTAAACACGGT AAGCTGGGGACAGTTCTCAGACATGGCTGTCACAGCTACATTTGTCAT CCGCTGGCAGAAGTAGAGAATAGACTCAAGTTTCTTACAACCTTTCTG AAATTGCTTGGAGGCCTAATCCCGAGACAGGACCTTCACTGTCTTCACT AGGATCCAAAGGGAAAATCCCTAGCTCACGGAGCTCCTTGCATG

CA0410(SEQ ID NO:73)

CGCCGCGTCTCCTCACTCTCCGGATTACTCTCCGTCTGAATCCTCT CCTTCTCGCTCGCGATCTCCCTCTCCTCCTTCCCGCGACGCTCCCTACC GTCTCCGATCGAAAGCCGCCGCCGCCTCCGCGAATCAAGGAGCTGGTG GTAATCCATCGGGAAGCCGTACTACTAGGAGCCGTCAACAAGCTGGGA ACATCCGTACGTTCGCCGATCTGAACCGTTCCCCCGCTGACGGCGCGG ATAGTGATTCCGACGAAGGCCAAGAGTACTATACTGGTGGACAGAGGA GGTAAAATTGTGTTTATATTGAATGATCATAAACTGAGTAATGTGGAAT CATGGAGAATTGTGCTATTGATTGTTTGTGTTGGCTTCTCTTTAGCTAAT GGATTGGGCCTTGTGTGTTTAGTGGGATGATGGTTCAAGATCCTACTAA GAAAGCAAAAGATGTTGATGCACTCTTTGAGCAAGCTAGGCTTTCAGC TGTGGACAGGCCTGTTGAGCCATCGAGATCAGCTTCTACAAGCTTCAC TGGAGCTTCTAAGATGTTATCTGGTGAGCCTGTTCCCTCTGCTACTCCT[ CAGCAGCAGCAGCAGCAG]CAAGACCAGCCTCAGTTGGTTATGCACACCATCACTTTCTGG

CA0423(SEQ ID NO:74)

CCCTATTTCGCTGAATCTGCTTTCTAACCCTAATTTTCTCGATTTTT CTGCTCAAGCGTGTTGGCAATGTCGGAGGACATGGTGATGCATTTCTC CTCCAATTCCTCCAATCAGTCCGATCACTCCCTGCCCGACAAAATCGCG AAGCTCGAGGCTCGCTTGACCGGCAAAACCGCCTCCTCCGCCAAGCCG CAGCCTC[AGCAGCAGCAGCAGC]TCTCCGTCTGGTCATCTGCTTCCGC CCCTGCCAAAGTCGCGGCGGGTTCGTCGGATGTCTCTATCAGTGATTCCGACGACGAGGTAACTTCCGATGATTTTTTTTTATTATTTTTTTTTTTAA GATTTGATGTCTAATAGTATTCTCGTTGTTACTACTGTCTCAGAACACA GGAGATTTCCTGATCCGAGCAAATACCAAGAAGCGCCAGAAAGTTCAA GACTTTAACAACAACAACTCCACTCTTGTTGATCATGCTGAGGTAGTGA ATTTTCAGTTTAAATATCGATCTTTTCGTCCCTTGCCTGGTTCGTAGTTA TATTGATATGGTAACTAAGGTTGTGCGATACTGAAACAATCTGATATGA TGCAAGTTTTGTATTCCCTTTTGATGAATTATTATAATGTCGAAATTGA AGCCGCAAGAGGCAGCATATGATGGAAGGAAAAACGACGCTGAGAAC CAGACAGGCGTCGATGTGAGTAAGAAGAAGCAAGGTCGAGGTCGAGG TTCATC

CA0456(SEQ ID NO:75)

CTTCTGTTAGAATTCTACCG[TTGTTGTTGTTGTTGTTGTTG]TCTTG GTTGTCTTAGAAGC[TCAATCAA]CGCCTCCGCCTTTAGCTTAGCTCGAC TCTTACTACTCTGCGACAAAG[CCACCA]CAGGAGCAATCGCACCTTCT CGCGCCACCATGGTTCGATACACCACACT[CTCCTC]ACAAAGCTGCAG CAATATCGACACGCCCATCTCCTTCTGCCTCTGCGTTCCCACCTCCACT ATCTCCACAAGCACCGGAACTCCTCCTTCCTCCACCACCGCCGGCTTCG ACTCCGGCGCCGACATCAGCAGATTCATCACGTACGCCGATTTATCCA CCATGTTCGAATCGAAATCCGCCATCAGCTCCACGAGCGGCTTCATAA CTCCCGATTCCACGGCCCTGGTCTTGTTCTCCTTGGCCGAGCAGAGCGA GTAAAGAGCCGTCGCCGCGTCCTTCTTCCCCCTGAACCCGCCGGTTTCC AGAAGGTTCACCAAGTGAGGAATCGCTCCGGATCTCCCGATCGCGATC TTGTTGTCTTCGATCTGCGATAGGCGGAGGAGAGCGCAGGCGGCGTTC TCTTTCGCCGTCGGCGTTCCCGATTTCAAAACCCTAACGAGCGGTTTAA TCGCGCCGGAGGAAGCGATCAGCTCCTTGGTCTCGTCGCAGAGGGAGA GGTTCAGCACAGCGGTG

CA0488(SEQ ID NO:76)

GCCAAGCTCTCCGACTTGTCACCGGTGCCAAGAAGCAGCCACTGA GAAAATAAAACTCATTCAAGATTCAAAATCCTTGTGTGCTTCTTCAATG CCATTTTAGTTTGACTTCTTCATTTGCTACAGTTCATTAGTTATTTCCTT ATTTGCAAAAGAGCCCTCGAGTTTGTTAGAAACGTGAAATAAAGCCAT TAAATACCAATTCCCTCCACTTTGAAGGGGTTTTGAATATCTTTCCCTC GACTCCAAAATCCTCGCCGGCGATAAGCAAACCCTAGATTCGATTCGC CGTCTGTTCATCCAGCAATGTCGTCGTTCAATCCATTCTCTACCCCACA GCGACATCAGCAGACGCCTCAGCCGCAGAGCATCTCCTTCTTCTCGCC ACCGCAGAGCACTCC[CTTCTT]CTCTCAACTG[CAACAA]CAGCAAACG CCGTCGTTTCAGCCGCACCAGTTCCAGCAG[CAACAACAACAACAACA ACAA]AGTCAGCAGCAGCTGTATTTGTTCACGAACGATCAAGCTCCGGCGAGTTACAGCACCGAATGGGAGTGATCTTTCATCCGATTCTCAGAAAC TTCTCCTTGAGATTGAGTATTGCTCTTCTTTC

CA0546(SEQ ID NO:77)

ATCAAACCATAGAAATACATGACTTACTACATTCACTCATCTGTGT TGGAAAACTTTTCAAATTTATTATATCTTAATTTATATTATTTACAAATG TTTATAATTGCATGATTTCAATTATCCCCCATCACAACATATTTTAAAA AATTTAAAAATTATTTTTAAGATATACAATATGAGAAGATTTTCAGAAG GCTTCTATGAGTATGTTCTTAAAAATACATTCTATTTTTTTTTTTTGGTC TAATGGACTATTTATAATTTCAGTAGCATTTTAGATTAATTTTGCATTTG ATCCATGAGGTATATCTTTGTGTTTAAAACCAAGTTTTAGGTTATATTT GGAAATTTCCTCTTGATAGTTTGAAGGTTTGAAGTTTTGATGCGGATAG CAATGGATAATAAAACGGATTTTGGATCTAGGACAATAATTCGTCCAT CTCCTACGTGGGGTCTTTAGTGATAATGAAAAAACTCTTCTGGTAAAAA CAAAATGTTTTAATAAATATGGGGCTCATCCATAAGTGAAAAATACCT CTCTTCTTCACTGCAAATGAATTATAAACCCCTTCCTTATCCACACACACACAGACTTGTTCGCTCTCTTAAACCCCT[GAAGAGGAAGAAGAAGAA GAAGAAGAAGAAGAAGAAGAAGAAGAAGAA]GGCGAATCATGCAGAT TTGCCAAGCAGCGGTAACCTTCACCTTCACGAACCCAACAAACCCTAA TTTCTGCAAACCCAAACCTCTCTTCCCAAGCTTCCAACCCCCTCGCCGC GTCGCCTTGCCGCCATGCCGTGGCTTCAGCTCCGACGAGTTCCCCGTC GACGAAACCTTCCTCGAGAAATTCGGACCCCAGGACAAAGACACAGA GGACGAAGC

CA0552(SEQ ID NO:78)

GATTTAAAATGACAATTTTTTATTGGTTGGTTCCGCTAGGGGGTGAACCAAGAATAACT[CTTCTT]TTATTTCTACGTTCTCATTCTTT[CTTCTTC TTCTTCTTCTTCTTCTTCTTCTTCTT]CTACGATTTTTAATTTCATTCAATG AAACAACAAAGTAGATCTGATTTTTATTTGAGTTTGGGTCCAAGAAGTG AAGAAAAATATTGGAGAGGAGGATCGACGCCTCTGTTCAATAGCCATG GAAACTCTGTACGCTTCCTCTCAAGCTCCGTGGAGAAGAATACCAGGA AGACGGCGAGCAAGCTCCGTGGAGAAGAAGACCACGAAGACGGCGAG CGACTATGAAGGTGGCTGGATGCAACGACAAGTACGCCTCATCTCTGA AGCTTGACTCTCAAATCCCACAGCGAAGAAGAAGAATCAAGGCGGAT GTGAAGAGCATAGAAGAGACAACGACGAAGGTGGTGGTGGGGCTGGT GAGGACTGGAAGATGAAGAAGACCACGTAGGTGGTGCCATGGTGGTG TGCGGCGGCGTACAAGATGAAGAAGACGACATATGGTAGTTAATTAGA AATTAGGTTTAAGCTTGGTTTAGGGTTTTGGTTTATTTGGTTTGGTTTTA GTACTTTTTTATCTAATTAGATTTTTTTTAATATTTTTGTAAAACAATTA A

CA0603(SEQ ID NO:79)

CATCATCATCCATTCATCATCATCATCATCATCATCATCATCATCA GCCACCTTTCTACTTTGTCTGTTTCACAACTGCCCAATCTACCTCCCAAAGTCGTCTCTTCCATGTGATACACTTCGCTTGGCTTCTTCTGCCTTTAGC TGTTCCCGTCTCAACGTTCGTACGTTAAAGGTAAAGT[CTTCTTCTTCTT CTTCTTCTTCCCTT]ACGTATTTTCGTTTTCCATCTAAAGATTCATTCTCT CCTCCGAGTTTCGTCCCCTGTCTACTCTGTTTCTGTGATGTTGACCTCTC TCTTAAGCTGATCTGATATGTGTTCTTCTTCCTCTTTGATGCTTCTGTCT CTGTAATTCTTTGACTACTTTAGATATTTTATCTTATGGGTTTCATTAAA CTCGCACAAAGCTCGTGACTTTGAGTTATATAACCAGTTCAGCTCTATT AAAGTTTTCTTGTAGACCAAACACTCATGAGTTACAGTGTCTTGTTCTT AATCTTCCTTTTGACTATTTTATGAAAAGTTCTTGATCTTCGTTACTTTT CAATAGTCTGATTC

CA0614(SEQ ID NO:80)

CGAGGGACACGAGGATAGGACCTGGGATGCCTTGAGTGCAGGCT GTGCAGCACCATAGGCGGGCACCTTTTTAATATTGTATGTTGTAATATT TCATCTAAAATTATAAGATAATAGGGTATACATAACTTATTTGCGTGTA AATAGATCTCATTTCTACATTTGAGAATCATGAAAAATATATATGTTCCAAGTGGTTCTGCAATGTGTTAAA[TATATATATATATATATATATATATA ]GATATTATTTTCAATTAATATACTCACAAAGTTGGTTATGACTTATAGT ACAAAACAAAATGTGGAGTTCATTAACTACACGAAACCCATTTGTCCA CAATATTGAAGTAGTCTTTTGTGATGATTGACATAAATTCTCATTTTAA TTGCCCTTTATTGGGATAGCTGACAACAACAAAATAAGTAATTCTTTTC AGATTTGAGAAAATTTCAACTACATATGTAAACAATTCAAAGAACATA AATATAATAAGAAATGTGCACAAAAAAAAATATAGAGATATATAAGAA ATAGGTAAATGAGGCCAAAGATTGTTGTTATATAGAAAGCAAGTCACT GCATCATAATATCATGTGGTGGTTCAACTTTATGACGATAGTGAATAGG TCCTCTCTTACGCCTTGAGATTTTGTTTCCGTTGAAGCTGCAGATAACA CACCTACACCTATATCTTGGATGATAGTGATGATGATAATTATGATGAT GAGGATGATGACGCAAGTGATGATGGTTTTTCCTAAGAGCGCAACAAA CCGAGCTGTCTGATACC

CA0636(SEQ ID NO:81)

CTCGGAAGAACGAATCGGGTCAGCTCAATGCTCCATCGGGTCAAC CTTATCTCTACTCGGATCTCTCTCTCGGGTCGAACTTCACTTGCGCGAC GCGAAGCTCGAACAGCTCTGTGACTTGCTGGGGAGGAGGAGCGGAGA GGTTCAACAATGTAACCGAAAAGATCTCATTCGAGTCAGTTACATCCG GGTCGGGTCTAATCTGCGGGTTGATATCCGGTAACCTCTCGGTCATGTG TTGGAGCCCTAATAACTTCTCAAGAATCTTCCTTCCTTTCCCAGATATC TTACCAGGTCCTTGCGTTGAATCATCTATTTGCAAATGTGGTGTGTATC CACGATCTGATCAGCTATGCTCCGGCTCGGGTTCGATCTGCAGCAAAT GCAAAATCTCA[CCTCCTCCACAACCACCATCACCACCACCACCACCA] CCGTCAGATTCATCTCCATCTCCATCTCCGCCGCCGTCGAAGGCGTTAA CGAGAGGATTACTAGCGTTTGCGATCGTTGGATCAGTAGGAGCGTTTGCAGGGATATGCAGTGTGGTGTACTGTTTGTGGACCGGAGCTTTCTTGG GGAAAGAGAAAGTTCATAACTCGGTTCAACCGACGATAACCCGCGGC GGTTCGAGTACCCGGTCAAGCAGCTCGCCGCCTTCTCGGTCCTTGACG AATAGACGTCAGGGATCGAGAATATTTTCGATGAGAA

CA0681(SEQ ID NO:82)

TATACTGCTAACTATTTACATGTAAAATCTCTGTCAATTATCTTTTC CTATTCTATACAATTTTCCACAGTTATTTTTGTAGTTCTGTTGCTGAACT TGAAGCTGAGTTTGTGGTGAAGAAACAATAACACCAAACACAGCATAT CACCTCCTTCCTTCTTCTAATGCATCTCTTCTCCTCTTCAACCCCACACTGGATGCGAACCTGTTGTTCTTGCTTCAATCGTTTGAGCTTGGATTTTTTC AATCTCCATCTCCCCTCCTCTTCCACCAACATTACTCTCTTCATCCCCAT CCAATACCAACTTCTCAAACCTACACTGTTTTGTTGCAAAACACACAGT CTCAGCCACATCATTAAAAAAAAGGAAGAGG[AAGGAAGGAAGGAAG G]AAAGTTTTACATTTTCACATTCCCATAAGGGTAGGTGAGACGGCTGATACATTCGCAACTCTGTTTGAGACACGTACAGCTGATGGTTGTTATCCA CCACACGAGGGGCCTTTCCTTTCTTAGTTGCTTTCCACGGCTCCTCAGC ACTCTGCTTTATAACAACCTCCGGAAACACGTTACTTCCAGAACCCGA AGTTGATCCACCTCCTCCATATACGTCACTCTGCTGATCTTGCATCTCT CTTCTAGATCGGTTCTGGACCATGTACCACCTTCGTATCCTCACAACCG GTCCTTCAGTCTCTGCACCAGACTCGGAATCAATCCCCGTCATCACAAA GCCTCACCACCATCCCCAGCCTTCAACGCGTACTGTGTCATACATCCAG AAGGAGCAAAAACAGTAGATTCCTCGTTACGCTATTATCAGAAGCAGT A

CA0719(SEQ ID NO:83)

GCTACATATGTCCCTAAAGAGTGAAACTAAAGCGAATTGCGAGGA TTATTGAACAAGTTTCCTTCCAACTTTCTAACGAATCAGCCATCATAGT AGCTCGCAATCAACATTTAGTTTCTGGGAAGATGAACAAACACAAATT ACCCAAGAACACGAGACACCCAGAACATAAACAAAATCAAATACATC ATGAATCCGATTAAAAAGAACGAAGATGGAGCAAAGTACCTTTTCTCG ATTCGACTTGGAGAGAAACTCGAACGAAAGGGAATAAAACCCGAGGA GTGACTTAATTGGGTCACATAATTTTGTTAACCGGAAAGTTACCGAACCGGAATCATACAGCTCGTTGTGTAGT[GGTTGGTTGGTTGGTT]TTACAAC TTCCACAGACTAAAAATGACATGAAAAATTAATCAATTATTTACCTGAA ATGTACGATTAGCCAACAATTAGTTCTGTTATTCATAACAAAAGAAAA CATTTTAATTACAGAGGTGAACGTATCCTAAAGAGAAATCTTTTTTTTC AAAACAATTAAACTTCCATTCATTAACATTAACCATCGCAAATACAAAT CAAGGTCCAATCACACATATACGACTCAGACTCAGGATCTGACTGGTTCAAACGCAGC

CA0736(SEQ ID NO:84)

GCTTTTATCCCGGTTTAATAACTTTGAAATTCAATCCATCGACGTG GTCGGTTCATGGTCGAACCAATTACTGGACCCAACCCGACTATACAAC CGGTTCATGGTCGAACCCGGTCCAACCATCGGGTCGGTCCGGTTTTAA AAACACTGCTCTAAATGGAAAAATATAGTCCTTTTTAACTATTGTTTAA TTCAAAATCTGTTGACTATAGTGATGGATAATACAATTTATATGGGATT TGAATTTATGTATTAGATGTAAAAATTGAAAAAGAAAACATATTATATA CGCTCTACGAGCTTTTTAAATAGATTTATTGGACCTAAGTATTTCATAA GTTTTGAAAACATGGGCTTACAAAACCTTTTTAACGATGTTCAACCCGGGCTTAGACAAACTTTATGAGATCACGGCTAGGCCTTTGAGTGCTATTAT TTTATTTTATTTATTTCTTGAATTTTAGGGATTAATAAATGTGAGAAGGA GTAGATAGTACATAATTAGAGATTGATGGAACAAATTGCAATAATTTA AAAGTAAAAGGATTTAAAATGCAAAAAAAAATATGAGGACACATGTCA ACAAACCCTCCTTCTATATGTCATAAGAAGGGAAAAAATCAACTTTAT ATAT[ATAGATAGATAGATA]GATATGTATAATTTGGGATAAAAGTCGG TATAGCCGTACAGGCGTTTGTGCGATCAATCGGTCATCAACTAAACAA AATTTTAAAATGATTTTTTAAACAAAAAAAAATATTATTTAATATTTATT AAATAATTTGCAATTTTTAATAAAAAATAGTTTTCATATGGGATAAAAT TTATCAATCTCATCTACTATATAAA

CA0739(SEQ ID NO:85)

GATCTTATCACCAAATTTTATATTGTCACGTTTAAGTATATCTTTC GTAGAAACATATTTTCCTCGAAATGAAACTATATGATATAATATTTTTT TTGTCTAAACATTTTTATACTAAAAACTGATAAGATTATTGTTGGTAACTACAATTATATTTACCTTGATAAATATATAAAG[ATATATATATATATAT ATATATATATGTATGTATGTATGTATGTATGTAT]ATATATCATCTTTTA TTGAATTTGGATAATAGCAGATTAATTAATATTTTTTAGATAATGATAA TATATAATTAAATTTTGATTTACTCAATTATTATTTATGCAAGTTTAACTTTTATTTTTGGGTGATTTATTATTGTATATGAATATATAAATATATTATG AATAAATATAATTATCTAATTATTAAGCATTATAAATATAATTATTCATT AAATGTAAAATGACTCTAATTACTCTAGTTTTTAATGCGATAGTTCAGA TCAAAAATATCAATCAGAAACTAATAATATCACAATTTTATATTAGAGT ATATTTGTTTAATTAACTAACTAATACAATCTGTGAATTTGTATCATTAC CAGAAACAACCAATTGAGCAAGTCGGTTAAAAAGTTCATGCCATGTTT TAATTTTTGAGCTCATACATTTTTCATTTACTCAGGATTCAC

CA0753(SEQ ID NO:86)

GAGTATCAGCTCTACAACATCGTCCGGAAGCAATTGCAACTCTTC GCGATGCCTTTTCAGTGTTCTTGTTTTGAACGGAAACATCCTTCTCGTC CTCGTCGTCTCTAAATTTTATTGAATTTGATCAACAGATCTGATATATAT ATATAGATACAGGCAGCTAAGGAATCTGGAAACACAAAAAAAAAAAA AAGAGAAAATTTCCTCTCCGTTTAAGTAAGATTTCCTTTTTTGAATTTA AACAGAATCGAAACATCAAATC[TAATAATAATAATAA]TACAAAT[ATA CATACATACATAC]ATATTACCTCAGACTCAGGCAATGAACAAGCCTTT TCTAATCCTCAGGAATCATCCA[TCTCTCTCTCTCTCTCTCTC]GTTTTGT TTGTGAGCATCGATG[CGGCGGCGG]CGCTTAGACAAAGACATCTCATCGGGACGCCTCTTTTACAACTCCTCCTCCTGTCTTCTTTTGGGCTTTCTGT AAGGCCCGACCCGGTTTCCCTTAACGCCGGTACGTCCTTAGTTCGCTTA CCTCGACCAAACTGGCCCTATCCGAATTTATTCTCTTAACTTAGGATTA TTATGCAATTTTCCTCTAAGAGGTTCAGTTCAGTACACAAGGTTCGCTA AGTCTAATCCAGCAACTTAGCAGTCTACTAGTAATCGCAGCATAATGA ACATGTACCTACTGCCTCTGTACTTTGGTATCTGATAATCCATCCATAC ACTCCTTCA

CA0834(SEQ ID NO:87)

GCCATTTTCCTGATTCGAATCCAGATACTGCATAATAAATTTGAGA ATAATAATCACTTTTTATTCACTGCGACATTGTAAGAGTGACTGTTATT CATAAGGCTGTTACTGTTAGGGTCGAAGGCAACTATTATTCTTTTTTTT GTTAAAGCCTTTATTCTTTCTTTTTCTTTTTGAATCTTTAGTTCGTAAATA TTCTCTTTCATATTCATAAAAAATACACAACACAACATATGTATTACTA TTAGAGGCATAACCATTAACATTGGATTTATTGAGGTTAGTAATTATTA TGGTTGTTTGACAACAAAAAAAAAAGTAATTTTTTTTTGAGCAAACAAA AAGTAATTATCTGACAATAGTAGAAACTAAAAAATGCAACCATGCAATACGTGGTTTTATAATCATTCTATTGTTAAATATGATGAT[AATAATAATA AT]GAT[AATAATAATAATAATAATAATAATAATAATAATAATAATAAT] ATTACAGAATGTTGATGTAATAAACAAAAATAGTTTGTTAGCTAACGC CTCAGATCGATCAATGAGTAATTCATTCAGTTACCACATAAAGAAACA AATAAAAACTATGATAAAAAAGTTTTGACATCATTTTTTATTGACATGT CAATATGTGATAATACACTCTCTGCAGCAGTGACAACAAATACTACAAAC

CA0837(SEQ ID NO:88)

TTGGAGTCCTCCGACTTGGTCTTGATACAAGATTGTGAGGAAATC ACTGTCCGTGTGTGGCATCAAACCATACACCTCCGATGGTTTCGGACAT GGTGGATAACGGTTCATCCTTAGATAACATGTGTTTCGCACACAGGTTT TTTTGAAGAAACTTGATTTCCGTCCTGATTTCTCTGCAAGGACCTCTGC CAATGAATATGCCAGAGCCTCGGATTCTGAAGCAAAATTTTCCATTGTT GAGCTGCGATATAAAATGTACATATTATAACTAAGGTTAATTTATTATA GAGACAAATAAATCATGTTAAATAAATTAGGTGAAATAATTGCGAAAGCCATGAACCTTTCTTGTTCCTTTTGTTTAATCCAAGCCATGAATTGTTCA TTTGTTTTAACGTAGAATTGCTAAGATTTTTTTTTTTGTAAACCATGAAT TGAAGTTATGATAAGAAAAGAAATGGAAAAT[ATTATTATTATTATTAT TATTATTATT]TAATGGTAGAATGATATAGTATAAATAATTATTTCACGG TAATTATTTGATTTGGTAGAAAATTGCGGAAATTATTTGATTTGCTGAT TTTTTTTGTGAAGAACAAAATTCACCTAACAAAAGAAACACGTAAGAT TATTTGTTATTTGTGGTACATAT

CA0896(SEQ ID NO:89)

TAAATTTACATGTAAATTACCACGAAACATTTTCTTTGTAACTTTA CTACGACCTTACTACGAAATTCAGTTTTGTCGTAAAATCGTAGTAATTT TCTCGTAAATTTACGAGGAATATATTTCCTCGTAATTTTTCCTTGTTATA GGCATGTTTTCTTGTAGTGTTTATGTTGCCGTTGTTCTGACCACGATAG TTATGATACCTTTGTGATTTTCTGGTCACATATTCACTTAATTATTTTGT ATGCTGACATACCTCATGGGAGGTTCGCTTGATATAAATCATCACTTAC AAACAAAAAATATTCATAAAAAAAAATATTCACACGTTTACAAAATCA AAAAGAGTTATATATAAATAGCTAT[AATAATAATAAT]GATACTAATAT TAATAACAGT[AATAATAATAAT]GTTTAGAAAGCTAAACAACAAGGAT TAGAACATGTATTTTTACAATTGCAAAAACAACAACAAAGTCGTAGCT TAGGACATTTAAAACAAGATGACCATTTGATCTTGCAGTTGCAGCTGC AACATGAGCTCTTCTTATTAAGACATGATGGTCGACTGCAACTGCGGA AACATGTGGGTATGCAACAACATAAGTCCGGACAAGAACAACAGCAA CCTAGGAAGCATGAACAGCTCGGGCAGCTCAGGCATTTGGGGCAGCTC GGTTTCGGGCAACAACAGCTGTTTGAGCAGCAGGACCCGTTGCAGCAT TTGGAACAACGCAGCTACAACATGTGGAAGTGCAGCATTTTGGCTTCC TCAGATGGCACGAACACTCGGGTCGG

CA0991(SEQ ID NO:90)

GGCCGACGGCGATCTGTATCATCGCCCTGTGGTGGAATTCCTCCT CCGAGGGTATAGAAGGAAGCTAACTTGGTCTGCTTGTGAAGCTAAAAT GAAAGGCTCGAATTTGTTGTACCTTCGTCCACCGTTGACATCAATAACA CCGAATTTCTTAGACCGAACACCTCTGTTGACGACGGGGCAATGGAAT GTATGAAAAACTTAAGGCAGTTTCAGGTTACGTTTGCAATGGATTATTC TCAATTGGTGAAGATGGTTTTCTGAACCAGATGAATGACCAGCATTTG AAAGCTACCTGGAAGATATTAAGCTTTTGCGACGAAGTTTCGTCAACT CAGATATTATTCATGTTCATAGGGCGGAGAACATAAGGGCGGATAGCT TGGCACACGTAGTACTCAGAAACAACCGTCTTTCGTCGTGCATATGGA CGCAGAGTTGCCACATTGGTTTACAGAGTCTACATGAGTCTGTAAATAT TTGCTGTTAA[AATAATAATAATAATAATAAT]ATATATCTGTCTATCAA TTTTTAAAACACAATAAGTTTACGGTATATTTTTCATTGAATAGATTGTTTTCAACTTTCACATGTATTTGTATCTTCTTCTATATATATATTTTCAGAT TATTATTTCATTATTANAATCGTAACAATATGTATAAAAATTAGTAAAA TATTGTTTTGTTGTCATATTCAAAGATA

CA1027(SEQ ID NO:91)

AGCGGCGATCTGATTCTCGCCCTGTGGTGGATTCTTCTTTCTTTAG TCTTTCCATTATTCTATGACGGTGTAATTCCCTATATATAAAAGGCTCCT TATATTTATGAATAATATAGAAACATAGATTTCATTACGACTATATTAT TAGTATATCAGTCTAGGCGTTTACCAATACCAATATACTTAATATATTT AGTATAATATCTTATGATTTACAATTATTTTCATATGATTTTGTACTATA ATATGTCAATTATTATAATTTATAAAAAACTT[ATTCATTATTTATTATTA TTATTATT]ATAAACCTACAACCTTTCAACTTAATTAGAATTCACAACCT TTAGAATTAATTGAGATTCTTATTATTAATAGATATTATAATCTTTTAAA TGGTATATAAGATAATCACCACGGTACTAGAAAGCCTAGAGCCAAAGCACCGCCTAAGCCGCCGCCTAGAACAATTACCTAATTTAAAGAAAAACT AATACTTATATTTGATTTTGAAATTTTATTAAACTTTGCAAAAAAAGAA GAAGATGGAAACATGTTAGAAACATATATCCAAATATAAAAATATAAG AATAATTTTATAAAAATTAATGATTAAAAACATATGCAAGATTTCGTAT GAAAAAACTATTCTGCACAAAAATAATTTATAATATTAGTTTAATATTT ACATATTTC

CA1032(SEQ ID NO:92)

NGGCGACGGCGATTGATTCTCGCCCTGTGGTGGAATTCCAGTTTG ACCAGGACTGTCGTAAGCTTAGTTTAATTTCACCAGCAGACACCGACT CAATAGCACCCTGGAAAAAACACACTCAAACCAGAAGCAAATGAACT ATAATAGTCCAAGTAGAAGAAACACAATCAATCATCCAAGAAAAGATA CTACTACATCACCAACAATACTGCTAGATAATGTAAAAAATGGACAGA AGAAATAAAACTACACTGGTCTTCCACCGAAAGAGTCCAAATAGAAAC ACAAGGAATAAAGCAAAAGAAAACTAAAATTACCATAGCACTAGCAA GATAATGTAAAAACCTACATTGATCTTCTACAGAAGCAGTTTGTTTTAT TTTTTCTCCGTTTAGAGAATTTTGGGGTGCTTCTCACCTTATTGAACTTGACGACGACATCCCTGAGGCATTTCCAACCGCCAAAACGGAACACAACA GATGCTCCCAGCACTCGGCTAAGAATCCATGCAAAGAATCTTGAACAG AGTCTGGAGAGTCAAAATG[AAATAAATAAATAAATATAATAATAATA ATAATAAT]AAGACCACTATAGCAGCATAGTCCAGCAGCTAAATCATGCAATCTCAGCTACTGAAGGAAATTAGAGAATGTGCAAACCGAACTANAA TCATCACTAGAACTAACTCACACGAAGATCATCCACAAGACCATGGAA AGAATCAGGAAC

CA1034(SEQ ID NO:93)

AACGGAGACTGATATCTCGCCCTGTGGTGGAATTCTCTGACAATA GTAGAAACTAAAAAATGCAACCATGCAATACGTGGTTTTATAATCATT CTATTGTTAAATATGATGAT[AATAATAATAATGATAATAATAATAATA ATAATAATAATAATAATAATAATAATAAT]ATTACAGAATGTTGATGTA ATAAACAAAAATAGTTTGTTAGCTAACGCCTCAGATCGATCAATGAGT AATTCATTCAGTTACAACATAAAGAAACAAATAAAAACTATGATAAAA AAAGTTTTGACATCATTTTTTATTGACATGTCAATATGTGATAATACAC TCTCTG CAGCAGTGACAAACAAATACTACAAACTCTTATTTTTAATCGT TCAAAGATAAGAGTCTATACTAGTAGACTAGAAAGTGGGGGGAAACA AATAAATTTAGGAGGATTCATTGACAATTTAAGAAGACATTTTTGATAC GCCTCGTCTTATTAGAATTGGGAATGGCCTATGGAGAGGATATGAATG TGATGGGCATAGTGATAAGGTAGAGGAGATAATGCAGAAAAGCGAGA AGAAGAATCTTAAACTATCATTTATGAATTATGAGTTAACCTCAGAAAG CCAGTTTACAAAAAAAAAAAATTATGATATCTCCACTCGTTTCTATTAA CTTATTCCTCCATGATTGGTCGTTTTTGTAAACTTCTGATGATTC

CA1035(SEQ ID NO:94)

AGCGGAGATTGATTCTCGCCACTGTGGTGGAATTCAGTAGCTATG TGCTATTAGTGCATTGATTGTTCTTTTGTGTGGTGTAATAGACACCTGTT TGTTCCATGCTAGAGCTAGGCCTAAATTTTTGTAGTGCTATTAACTAAG TCAGTGGTTTGTGGTTTAGCATCCCATACCTCACTGAGTGACTCCCTTA TTGCTCACCCCTCCTTCGTTCTCCCAGGTGAGACCGACAATCATGAGTG ATTTTATCGGATTGGTACTTTTGAGCTTTTATCGTTACTGAGCTTTTAGA CCTTTGGACTTTTATCTTTTATGCTATTTCATATTTCAGACTTTCGGTTTT ATATTGCTATCTATATTTCAGATGTTATCGGACCTTCTGATATTGACTTT TGTATTATGAAGTGGAG[ATTATTATTATTATTATTATTATTATTATTATT ATT]ACTAGATTCCTTTTCCGCGCTACGCGCGGATAGTATCTTATAAATT TTAAATTTATTTTTAAAAAAAAAAATATTTAAAGTTTAATTTACATTATT TTATACCAAAAATCACAAATATGGCTAAGAATTGGTTGATTTTATTTGT GATTTTTTGACAATATTAAATTGATTTATTTATTGCTCATAGTTAACAGA TTTGTTTGATTGGTTTTCAGTTCATAGTAATGTATAGTATTATATTTGGT GAGTGTATATA

CA1066(SEQ ID NO:95)

TCTCAGCGCTGAGCTCCATGTGGTGGAATTCATCCTAAATCTCTTT GATGCGATTGATCTCTTTTATAACTCATTTTGACTCTTTTGGAATTGGAA GAGATGGACTGGACGGCTATTGCAAAGCCTTTGGAAGAGATGCAAAG GAGCTGGCTATTGCAATCTTCTACGCTCAAGAATAAGAAGACATATGT CAAGAAGAAGAAGATATATGCCTGGACTCTTGCCTTCATCGGCGTACTTGTGGTTATTGCATTTAGTTTGAACATAAAGCTCTTAGGGGCTCATGCA TAACGCTTTCTTAATTAGCTCTGTTTTTTCCAACTGATGTTTACTCTTTC TGAT[ATTATTATTATTATTATTATT]AATTGTTAGTTGCTGTTGACCGGT TGAGGCTGTTTTTGAGCCCTGGATATCTTTCTGAGTTGAGAAAAATTTC ATAACCAAATCGAGATTGTTATGTGCTCTTTCTTGCCTCCTTTCAACAA GTTTAATAGAACCAAAGGCAAATAGTTTGTCTTTATTCTATACTAGGAT TGCGAATCCCCGCGGTCCGCGGGGAAAAAAAGATGTTTTACCGCAAAA AAAATGATGTTAAAACTTAAATGTAATAGTAAAATTTTAGTTTGTAACA ATCAACCGGTTGAATGGTTAATAATCAAATATTGCAATGTTAACTATTA AAAATTACAGTGGAACATTTAAAAGTTGTGAATATTTATATAAAA

CA1080(SEQ ID NO:96)

AGCGGCAATTGTATCTCGCCCTGTGGTGGAATTCTGTGATGATCA AAAACAAGTTTCAATCCAAATATCCTGATTTTGCAAATTATTTGACAAAATCCACATCTCTAATGGTGTTAGAACACTAATAAG[ATTATTATTATTAT TATTATTATTATTATTATTATTATTATTATT]AACAGTCTTTCCAAAATAA ATGATTGATAAAATATTGAAAAAGAAGGCAAAGAAGAGGTTGAGAAA CAATTCTTATTTCAAAATTTTACAAAAATACAAATTGTTCGCGTAACAT TTTCATTTTCTATTTAGTTTAATTTTTGTCATTTAAAATTATCTTGTTGGT GTTGTTGGCGTAAGCCCAAAACCGATGTAGCCTACACTGGGCCAATCT CCTGCGCAAGCCCAAGACATAAAGCATTAGGGTTTTGTTGCTAGCTCA TATGTAAACAAAACTTAAGCTATCTTGTTGCCTAAGGTTTTAAGTTTTC TAAGATACAAAGCTTGTACATACACAAGCTAGATCATAGTTGTGATCA CCTCTGTACTCTCTTATTCATAGTGAAGTTTGGGAGGACAGTCTCCCAC GAGACGTACCGGTTAGAGGCCGGGAACTCGTTAAATTGTGTGTGTTCT TATTGCTTTAGTTTAATCTCTTCTTAAACAACCATAAGCATGATAAGAA CTAGTTA

CA1090(SEQ ID NO:97)

GGAAACGGCAGTCTGATATCATCGCCACTGTGGTGGAATTCTAAC ATAACATATGATTGATAGTACATTGTATATTCTAATTCAAATTAAAAAA TATAAATATACAAATATAAATCACCAATATAGTATTTTTACATATTAAT TTTATAATGCTTTATTCTAATATTTTCTTATACCTACTTATTAATTTTTAA CTTATTAATTCTAATCAATGGTCTATTCTGTATTTATTCTCATAAAGAGA AAATAAAGATCTACCAGAAATTGATATTTATGTACATTCATTACATGTA CAGTAATAAGACCCACATAATCATTTTGTTTTAGCTATGGCTCGTGTTA GGAAAAATCTATAAGATGTATCTAATAGTGTGTTGCAATACTAGACTA CCAGTTGATCCAGTTGTTTCAAATAATTAGTTATGTTTCGGAAACTTTG TAGATTGGCTTATTTTCCATGCAGCTTTTTGTTACGACAGAACAAATTA CGCATAAACCTTTAGGCTGAGCAAAGTTGATGACTTTAACCAAGATTG AGTCTTGAATATGTGTCATTACATCGAAATATCGAATGTTAAAAATA[T AATAATAATAATAATAATAATAATAATAA]CAATAACGGGTTCATATAT CATTACAATTATAACGTAATAGCTGAAAATTCAAAATTGACTAAAATA ATATTATGACCCGTCCCTTTTTATGGTTCCCCCGTTCGTGTATTTGCATTGTTGGCCGTTGGTGATCCCATGNCGCACTTACCCTCCAAGTCTTCA

CA1097(SEQ ID NO:98)

TCTGGAGCTGAAGTCCATGTGGTGGAATTCTGATTTTTGAAAAAA TTAAGCGTTATTTTTGTGATTTTTGACTTTGAGTGCTAATTTGGAAACAA AAACTTGATTTAGAGATATTTTTGTCTTTTTTTCTTCTCCAAGCGTGTAT CTTTATTTTTATTTTTTATAATTAAACAGGCGGCTTTTTATCCTAATTCA ATTCAGGTGGGGTTTTGTTCTTTTACACATGTCAATTTTGTTCTTTTAAT GGTAAAAATTTAAGATAAATTATAAACTGAACCGGAATCGCAATTGGT AATAAACTGAACAAAATTCCTAATAAGATATATTCCTGAAAAAATCCC CGGAAGATTTTGATACGTATTAAAATCATATTAAGTTTGAAATATCAAG TTTTATATAATAAGATATACATTATATGCAACATCTTTGAATAACTCTC AACCTTTTGGTCATATCACAATAAAGTGGTGGAGCTTTTTCCAGTTACT GATGAATGAGTTAAAAAGTACTTAAGTTGCAATAATCTATTCATATTCC ATGATCAAAAGCTCTTACAAGAAACAAAAGATTACATGAAAATGTCCA AAAGGGTACTTT[ATTATTATTATTATTATTATTATTATT]ATCAGGATTG AGACCCACGTATACGTAATAAGAAAATATATAACTAATAGCGAATGCT ACCTTATGTCATATACACGTAAACACATCCCACTGGTCTTGGCAACACA AGGTGTCATCCTTCTCTTAAACATTCAAC

CA1107(SEQ ID NO:99)

AGACGGAAATCTGATATCATCGCCACTGTGGTGGAATACTAAACA AGGCATATAGCATAATATTATTTCATGATATAAAAGCAAAAAAAAAAT AGAATAATTAAATATACAATAAAAAAAATAAACAATAACTAAATATAC AATAGCAAAAATGAAAAAAACTAAATGAAACATCTATCTGAAAAATGT ATAATAAATAAATAATAAGTAAATATATAATATGAGAAATAAAAATAT TACACTAAATATCTATCGTAATATTAAAATAAAAATGGAGGTGGAGGC GTTAATATGGGCAATGGAGTGTATGAGGAATTTGCGTCAGTTTCATGTC ACGTTTGCAACAGATTTTCCTCAATTGGTGAAGATGGTTTGAGAACCA GAAAAATGACCAGCATTTGAAAGTTATCTAGAAGACATCAAGATTTTG AAAGAAAGTTTCATCAACTCAGAGATCATTCATGTACCTCGGACGGAG AATTTAAGAGCGGAGAGTCTAGCACGTAGTGTCAAAAAACATTTGTCTTTCATCGTTCACATGGATTTAGAGTTACCAGTTAGGTTTACAAAGTCGG TATGAGTCTGTAAAAGTCGATTACAA[AATAATAATAATAATAATAATA ATAATAATAAT]AAGTAAATATATGATACAAAAAATAGAAAAACTACAT TGAAAATGTGTAGTAAAATAAATAATAAATAAATATAAAATATGATGACAAAAAAATGACAAAAAAGTAAATATAAAATATAACAT

PE0012(SEQ ID NO:100)

ATACGCCAAGCTTCAATCAAAGGAGGGAAGTGGTGAGAATACAA ACCTAGCCTTATTCTCTCTATGTATCTTCCTCAACTCTGCATCTTCCAAC TGTGCCTGAAAAAAGAAAAGCAAAACCCATTAGACGCTAAGCTAATGC AATTTCGAGTTTAATGTTTCAGCTTAATCCACATAAAGACGGAAACATA CCTGCTCCTGGGTGAATTCCTCCGGTGCACCGTCGGAGTCTGAATCGG AGTTGTGATCTTTGTTATCCGACATCTGATTATTAT[CTTCTTCTTCTTCT TCTTCTTCTTCTTCTT]CGTTGCTTTCTTCTCCCTCAGACGACACACACTANGGTTTAACGGCTCTTCAGTTTCTCAAAAACAGAAGATTTCTATTCTGA GAGTTAATTGCTTCTCTCCTTTATGGTGGATTCTATTGGGAAGCTTGCA TGCCTGCAGGTCGACTCTAGANGATCCCCGGGTACCGAGCTCGAATTC ACTGGCCGTCGTTTTACAACGTCGTGACTGGGAAAACCTGGGCGTTAC CCAACTTAATCGCCTTGCAGCACATCCCCTTTCGCCAGCTGGGGTTANT ANCGAAAAGGCCGCACCGATCGCCTTCCAACANTTGCGCANCTGAATG GCGAATGGCGCCTGATGCGGTATTTTCTCTTACCTCTGTGCGGTATTTC CNCCGCNTATGGTGCCTCTCANTACAATCTGCCTGATGNCGCNTANTT AACCANCCCGAAANCCGCCANNNCCGCTGAANCCCCTGAAGGGGNTG TTCGGCNCCGGNATCCGCTTTAAAAAAANCTGTTAACGTCTCCGGAAC CGCTTTTTTCAAGGTTTTCCCGTCTCNCNAAN

PE0017(SEQ ID NO:101)

CGCCNNGCTTCCTTTAAGAGTTAATTTCATACAAATAAGCCCACT AAACAGCGTTGTTTAAACTTTAAACCCTGTCTTCTTACCAAAGCTCCTC TTCTTACATAGTAGCTCTGCTAAACCTTCGCCGCAATAAACCCAAAGTC GTAAGAAACCGTCGCCATGCCTGCTCTTACGCGTAACAAGCAGAAGGG AGCTAAGTCGCAGACTCCTCCACTGATTAAGCGGACTAAATCGAATCC CACGCCTCCACCGAAGAAGGCGATGAAGTCCCGTAAGCCTCCGTTGAA GAAACAGAGGAAAGGTGTTTCGGATGAGAAGCCTGAAGTTTCTAATGA TGAGGAGGAAGAGGAAGAAGAAGAAGAAGAAGAAGTGAGTGAAGAG TCTGATGACGGGAGATGAATTGGGTTCTGACCTTTTCTCAGATGGTGAC G[AAGAAGAAGAAGAAGAAGAAGAAGAAG]ATGATATAGAGCCTTCGG ATGACGACTTTCTTGGTGGTAGCGATGAGGAAAAGGGAACTTTGGGTT CTGATTCTGACTCTGATGAGTCAGATAAGCTTGCATGCCTGCAGGTCG ACTCTAGANGATCCCGGGTACCGAGCTCGAATTCCTGGNCGTCGTTTT ACNACGTCGTGACTGGGAAAACCTGGCGTTACCACTTAATCGCCTTGC AGCACATCCCCTTTCGCCNGCTGGCGTTNTACCNAAAAGGCCGCNCCG ATCGCCTTCCACAGTTGCGCNCCTGAATGGCGAATGGGGCCTGGATGC GGTTTTTTCCCCTTCCCCTCTGTTGCGGTTTTCCNCCGCCTNTGGTGCCT CTCNTTCATCTGCNCTGATGCCCCTTNTTTANCCNNCCCGAACCCGCCA NNCCCGTGAACCC

PE0063(SEQ ID NO:102)

ATCTCTATCGCTATACTTGTCACTTTGTTCACTTTCTCAGCAGTTCC TTCCACATGGTGATGCAACCATCTCGCCATTACACTCAGCAAGCCTCCC TTAGCCTTCTTGCATCGTTCTGACCTGTCGTTATATCCATAATTCTTTGC AATTTTTGTCATTCT[CTTCTTCTTCTTCTTCTTCCTCTTCCTCTTCCTCTT CCTCTTCCTCTTCTTCTT]TATGAACATGAGCAGCCATTTCCTGTCAACT CTTTGACGGATGTGCACCAATTGACAAGAGCTTACTCTGTTACACCACT CCAACAAACTCTTCCTTCGTCTCTTAGATATTTTCTCCATTTGTATTCCC AGTGTCTCAAAGTTATCATTATCCTTTTCGCTCAAAGTATCATCCAAAT GCTTTTCAATATCTAGAAAAGTTTTTTTCCATCTCTTTCTCTTCCTTGTT ACTCTTACACCTCCCTCAACCATTTGATCGAACACATGGTGGGCATACT TCTCCTTCTTGGTCTCAAGCAACTCCTCTCTTGCATCNTTACCCCTCTCA AAGT

PE0091(SEQ ID NO:103)

CGGCAATAATGGACCACTGGTTTGGTTGAACCACTAAAAAGAGTG C[GTGTGTGTGTGTGTGTGTGTGTGTGT]GAGGGACTCTATTTAAAAGCA CTGCTTAACTCAATAATTATTCCATCGCTCCAAAATAAAANAGAATAGC TAAAAGATGGCTCTCGAAGTCTGCGTGAAAGCCGCCGTTGGTGCCCCT GATGCTCTCGGCGACTGTAACTTCCCTTCTCTCTCTCTAGCTCTTTTTTT TTATATCAGATTATGATCTCTGATGATCTTCAAATGTAAAATTTATAAT ACATGATTTGTCTGTCGTTTCAGG

PE0131(SEQ ID NO:104)

CCGATAAGAGCCATCATCTCGAGGAGGGGTATTAAGGGATATGTA TCCCACATTGGAAAATCAATGGGACATTAAGTAATATATAAAGGGTTA GGGCCAATCCACTAATAGCCAATTGGTTTTGAGTTGGAAGCCCATAAT AAACCCGAATCTAACAAGATTTTAGATTGATTAAGGAAATTAATATATT ATATGCAATATTTCATGGTTAACGTCAAAATAAGTCCAATTTATAAACA AGCGGATAAACATTTCCCTATATATATGGGAAGGTTTGTGGTTGCCAA ACTCAAAGCACATTGGGTCTTATCTCTCTCTAA[CACACACACACACAC ACACA]AACTCACGTATATATTTAGAGCTA[GAGAGAGAGA]TGGGTGA AGAGATGAAAGAAGTGAGAGTAATCGAGGAGTGGTCTCCGGTTATAGT AATGGTGAT

PE0133(SEQ ID NO:105)

CCTCCTGTGCCAAGTTTTACAAGGCACCCAACCTGTGAACCTAAA TTGCTTTGAAAGAGAAGTTTCTCTATCTATAT[CACACACACACACACA CACACA]AATCTAATCTTTCTCTTTCAACCGTAAATTTTGCTCACCACCA AGGCAAGTTTCCTTCTTTTGCTCCCCTAGCAATATTAATTGCTACTAAAATATCTTGCTAAGGGTAACCAAATCTTGCTTCATTCCTCTGTAATATCA CAGAAAGAAACTAAAATTTAGGGTTTTTTTTTGGGTTCTTTCCATGTGA TGTGAGCATTTTTGGGTGAGAAAGATGAAGACTATAATTAAGTTAGGG ATTGGGTTGAGTTTGGTGTTTGGGTTTCTTCTCTTAGCACTTATTGCAGA AGTCTATTACCTTCTGAGATGGAAGAAGCACAAGAAGAGAGTCATAAG CCAAGAGAGTGAGGAAGAGAAAGAAGAAGAGCAACAACAACAAACTG GGT

PE0177(SEQ ID NO:106)

TACCCAAGCTTCCACGATCGGAGGGATCTATCGGGACTTCTCGGA GATTTGTTTCACGGTGATGTCTATTGATCTTTGGCTCTCTGTTTCGATTG TTGTTGTC[TTCTTCTTCTTCTTTTTCTTCTTCTTC]TCGAGAGGTTGCGGG GTTTTGAAATCGTCTCCTTCGTCCATGTAGTCGTTTTGGTGTTTGTCCGC CAT[GAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGA]GCGAAGACGTTACGAAAAACTTCGATAGAGAGTATAAGAGAGAGATG CTGAAACTGCTTAAACCCTAATTTTGATCGAGTGTGTTTTGGGAAATTT GCAGAGTAAGTCCTTATATTTGAGCCGAATTAATTAAAGTAAGCTTGC ATGCCTGCAGGTCGACTCTAGAGGATCCCCGGGTACCGAGCTCGAATT CACTGGCCGTCGTTTTACAACGTCGTGACTGGGAAAACCCTGGCGTTA CCCAACTTAATCGCCTTGCAGCACATCCCCCTTTCGCCAGCTGGCGTTA TAGCGAANAGGCCCGCACCGATCGCCCTTCCCAACAGTTGCGCNCCTG AATGGCGAATGGCCCTGATGCNGTATTTCTCCTTACNCNTCTGTGCGGT ATTCCCNCCGCATATGGTGCCTCTCNTTACATCTGCTCTGAAGCCGCNT NTTTANCCAGCCCGACACCCGCCAACACCCGCTGACCCCCCTGAAGGG CTTGTCTGCCCCCGGGNTCCCTTNCAAACAACTGTTNACCGNCCCCGG GAACCGCNTNTTTCAAANGTTTCCCCCGCCTCCCCGAAACCCCCAAAA AAAGGGGCNCTNANACCCCNNTTTTNNGGGTTANGTCNGAAAANAAN GGTTCCTAAANTTCGGGGGGCCTTN

PE0187(SEQ ID NO:107)

ATCTAGGACCCCATGATCCGAATAAGGATAATAAAAAAATGGATC TGCCGAATAAGTATCTGGATAACTTAAAATTCCCTAGATACCCCCCCCC CGC[CACACACACACACACACACACACA]TCAATTTTCCTTGTAATTTTT CTCTTGTTCTCTATTTTTCTAAACTCCAATAAAGCAAGTCTTTAACATAT ACTCCACCTTTATTTGAGTAAATAATCATGGATTTAATCTCTAAAGTGA AGGACACTTTGTTTATGTTTTCTGTTTTTCTAAATTGTAAAATCTATTTT CTACCTTTTTAATGTGCTAATTTTAGGAAAAATTATATCAATATTTTGTG TCGTAATTAAATCTGTCAACATGAAGTAAATCTGTGTCAAAAAGAAAA AAAAATCTATAGAAACATAATTAAAGTAAATGTATGAACATATAAAAT AAATCTATGAATGATGTATAAATCTATCAAAATTAAATAAATATGTGG

PE0203(SEQ ID NO:108)

CTTTAATGCTTAAAGCTCGTTCCAGCTCAGGGGTTGGGAGTTTAA GCCTAAAACTCGAGATCTGCTCATCCGCAGTTGCTGATTTGGCAGCTTA TTCACCTTCGCATACCTACAAATCAACGAATACAACGCAAACGTTCCTC CTG[CACACACACACACACACACACA]TATACTTAGAACCACATAACAC CACTTTTTACAAAAAAAAACAAGGATTAGGGATGTAATATTATTACCTT CGCCATTGTCGTTGGCTTTAAGGACAACAAAGACATACTTTGCTAAAG GAATGACAGCAATGGTGTAGATAACGAGAGACAAGGCACCAAGAACATCAACTTCTGATCTGATAGGAACTTTACTGAAGACATCACTAAACACAT ACAAAGGGCTTGTTCCCATGTCTCCATACACAACACCTAACGTCTGAA ACGCTATCCCAATCGT

PE0250(SEQ ID NO:109)

ACTCAATAACATCAGGCTTTTCTGGATGCAA TCTTGCATTGGTTTG GTCCAGTTTGCATCGGGACAAATATTGTTGCTGGTGTATATGGGATCGGAATCTTTGCTCCGACATTCTCTTCGGTGTCTT[CATCATCATCATCATC ATCATCATCATCATCATCATCAT]CAGTATCAGTATCATCTCTTATTCCA AACTTCTTATATTGTAGATGTTCTTGACCGGAGTGGCAAATGAAGACAT CTCATATATGGCATTGCTTTTAGGGTTTTTAAGAAGATGTGGTGTTGCT ATGTTGGTCTTTGATGCAACCACGGTGGTCGGAA TGGGCGAGAATGGTCTGCAAACTAATGGAGATTGTAGGTGTTCACATGGGTTCATCGACTATT ACTTTGGGAGAAGTCCAACAACATCAAGCCCTCTTCTTCCTGCAGGAA AATAAAATATTTCGTTCATCAATTAAAGTAAGAGAATTAACTCATCACT ATGGTGATATGTTAGTTTCTGTTTATTGTAAGACTTAAAATTACCAG

PE0281(SEQ ID NO:110)

ACAAAACCGCTTCCACCTGCGTTTCGTCGCAGNCAAGCATTTGCG TTTCATTGGGTTTTCTCGGTGAACCAAGCTCGCGTTAGTATCCAAACAT GTTTTCACAGAATCTCGTAGTAACGACATTTCTTGTTGAAGTTGTTGGA TCTGTGTTCTCATTTCGCTTATCAGCTCCATTTCCTGAAACGTTTTTAAT TAAGCGGTTCAATGATTCTCTTCTATGGGGATAACAATAAAATCTAAAA ACCTTACAGGTGACGGAGGGTTGTGAACAGACAAGACAGGAGTTGAA GTTACTTCAGTGTCTTGACAACTCCATGATCCTGCAGGAGACGATGCAAAGATCGGCGAAGAAGACGAGTCATCTCCATCGTCTTGCTCTTCACCTT CTTCAGTAAATGGCT[CTTCTTCTTCTTCTTCTTCTTCTTCTTCTTCTTCTT CTTCTT]CAGTTCCTCCACATTTTCATTCTATGGTCTTCCTCTTCTTCTTC ATGTTGCAATTCCCATTTTTCAGAATGTTTGTTCGAATGTGTCTGCACA CGAGACATCATGAGCCTATCGATCTGATCTCTTAAACCGGTCTGGGAG AANGTCTGTGACCGGTCCTCTGTAATATCCAAAAACCACACATTTTTCT TAGTNAATGGGTACCCAATTAGGAAAATGGGATTTAAAAGATTGGATC AG

PE0283(SEQ ID NO:111)

AATGAACGAGACAGGAGGTGCCACCCTATTGTCTTTGATGGACCA GAGTCTAGCTATCCGGTAAACAGTATTTTATAACAAAGACATGATCAT GAAATGATTTTTTTCTTCTGAAGTTTAACTGATGACTCATATATCTATAT CTGACTAGTTCATCGTGGACATGGAGCATTCACAGGACCAGAGCACAC ATCGAAGCTGACATACAAATGAATCTCTTATTGCCTCTAGTTTCACACG TAAATATTCAGTTTCTAG[GATGATGATGATGAATTGATGATGATGATG ACGATGATGAT]CAGTCAAAAGTACTGTAAATTGATGGTTATGGTTGTCTTGGCTTTGCTTAATCATGT

PE0286(SEQ ID NO:112)

ACAAGTTACCATTTGAGGATATATCAGAGAAGAAGGAGTTGCTTG AAGATGACGAGAAAACCAAAAAGAAGATGAGTTCTAATGGTCGTTGGT ACGAGGAGCTTGATGTCTTCATAGAGAAACCTGAAACTGGTGTTCTTA CTGGTGATGGTGCTGTGGTGGACGCATGACTGGGAACGAACCTGTTGATGGTGACGAGTTGGATGTTGAGCAACAAGATGATAATTCTGATGGTGA TCATGGTGATCATGAAGCAG[GAGAGAGTGAAGA]TGAGTATCAAGCG AGTGATGAATCTGATAAAGAAGAGGATATTGACAGAAATTTTGAAGAG GATGTTGAGATGTTCCAGGGATGAGAACTACGATGGAGGAGATTCCAGACGAGGAGGAGGTATATTCTGACACGGAGGAGTCATCTGATGATGAAG AGGAACAAGCTGAGAAGGATGCTAATAGGGGTGAATTAGATGGCATTT TTAAGTCTTAGGCAGGAANTTGCAATGCCTGCAAGTCGACCTCTAGAG GATNCCCGGGTACCGAGCTCGAATTTCCACTGGGCCGTCCGTTTTACA ACGTCCGNGACTGGGAAAAACCCTGGGGTTAACCCAACTTAATCGCCT TTCAGCACATNCCCCNTTCGCCANGNTNGGGGTAATAGCCNANAAGGC CCGCAACCGATNGGNCCTTTCCCAANAGTNGCCGCACCTNAAATGGNG NATTGGCGCCTTANGNGGGAANTTTNNCCTTANGNATT

PE0324(SEQ ID NO:113)

ACATAAGCCCTTTTTATTATCTCTGCATATCATTACATTCATTTTAT GTCACATATGTTTATTGCTCTTCTCTTCAGATTACTATTACATCGCAAGT AAAACAAAAGAGTTAGAAAATAAAGTAAACACTCCATACATAGTCAAA GTATCTCCATTACTCCTCTTCTTCGTGTTAACAAGTCTTTAGGCGTTTCT AAACCGCAGAAACCATCATAGCCGGTGATGCACCAACCATCAAGT[CT TCTTCTTCTTCATCATCATCATCATCATCAT]CCTCTGCTTCCCACATGA AATGAGCGTATGATCCCAAAACCATACTACAAAAGTCACAAACCTTTA ACATTCTGAAAAAAAAACTCATCAAAGAATCCAAACTCTACATATAAC ATAACATACCAATCATCAGGAGAAGCGTTAACAGCTTGATCAAAGTAA CACTGAGCTCTCTTCTCATCTCTCTTCGTCTCCCAAATCAGCTTCCCATA CATCGACAACGCTTCACCATCACCTGGATCCGCAAGTATAGCTCTCCC GTAATACTCCTCCG

PE0340(SEQ ID NO:114)

CTTAGTGACCCAAAAGCCATTGGTGTATGATAGAAAAGTTAGTTA AATACCGTTACTCGCAAGGAAGACCACACATTTTTTAATTCTATCTCAC TTAGTCAGACCAGCTCGGATCCTTCTCTAGAAC[CACACACACACACAC ACA]CTCAGAGTGAGAGATTCATCAATGGCGGTTTCTTGCAGCCACTCA TCGATTCTCTTGCCCCCAACCACCTCCTCCGTTGGCTTCAACCGCTTCC CTTGTCTCCAAACGCTGCGTTTCAAATCCAGAAACGTTTATCAGAAAGC GAGGATCTCTACAGTGTCGGCGTCATCTTCACGGTCTCTCGAAGCTCTG ATCTTCGACTGCNACGGTGTGATACTCGAATCGGAGAATCTACACCGT C

PE0355(SEQ ID NO:115)

TCAAAGAGCACTTACAAGGATCCAGACGATGGAAGGCAACGATTCTTACTCGAACTTGAGTTCATTCAGTGTCTCGCGAATCCTACTTACATA CACTGTAAGCTCTTATGATTCCTTATCACATAGTATCTACTTATAGCATT TAGGAAGTGATAAGAGATCTT[GTGTGTGTGTGTGTGTGTGTGT]TTTAT GCTCTATGATGAACTTACCACTTAGCTTTTNGATTCTGTTTTGGCAGACCTAGCACAGAATCGTTATTTTGAAGATGAAGCATTTATTGAATACTTGA AGTATCTTCAGTATTGGCAGCGACCAGAGT

UB0015(SEQ ID NO:116)

ACTTCAGTGGTCGAAAATCAAAATATTCTTCCATCATTTTAGTTTT TTTTTTTCTCTATGTTCGCATCAAGAAAACGAAATGAAAGGGATTATAA AAGGAAGAAGAACTTGTGAATCACGGTAAGTTTCGGGGTTTGTTGTGAGGAGATTTCGAGAGAATCAAGAATAAAATTATATCACGAGATTTTTTT GTTTGAAGTGAGAAAGAAATCAAAGATTTTATTTTTTCTCTTTTGGTGA GTGATA[GAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAG AGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGA] CGTGTTTTGGAACTACGGTGATTTTTACTATTTTGATGATGTTTTCAACT TTGAAGAAGACCTTCTCTCATGCTCACTCTTAGCATCCTCCTCATTTAT AGGATTAGATGGGAGAGAGAGAGCGTTTTAGCCATTAATACTTTAATA ACAAAATGAAAAATCTGATATTAACATTTCTTTTTTCACTTCTCCATCA GTGGCATTTTCGATATTTT

UB0126(SEQ ID NO:117)

ACCTCCTGATGACTGCTTAAACAGCGCCTGCGAAGATCTGGATTC TGTAGTTAACCAGGCTAGGGAGTTCTTAGAGGACTGGTCCCCAAAGTT GAGCAAGCTCTTTGGTGTAAGTTGATGAACAAGCTCTCATTTTCAGTTT TCTTT[CTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCT CTCTCTCTCTCTCTCTCTCTCT]TTGCATCATTCATTGAGTTGTGTGTGTG CAGGTGTTTCACTCCGAGCTTTTGTTGGAGAAGGTCCAGACTTGTTCAC TGGAGATTAATCGCATACTTCTTCAGTTATCACAGTCAAGTCCTGTAAC TTCAAGTGT

UB0163(SEQ ID NO:118)

ACAGAAACAGTAACATCAACACACACAACAAACAGCTCGCGAAA TGAATTACAGATTCCTCTCCGAAATCAAAACAGG AAACGGACACA[GA GAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGATGAGA]AGGT GATACCGTCGAGAGGTTTGATGTTGCCGTCGCGGCGATCGACGGAGAA GCCTTCATGAGGCGAATCGACGGGTTTGACGACGT

UB0181(SEQ ID NO:119)

ACAGACGCGATGATGACACTTCTGGTCCTAAGCGTTGTGTTACGT TTGATACTCCTGCGCTTGTTTACTTGGAGTATTCTGATGTGGTTGCTGA TAAGTATGAGAATCTGAGTTTGGACAGCTTGGTTGAAGTTAGGCTTGAT CTTCAGTTGACTGCAGATCAAATCATGCGCAAGAATGCTACAGACAGT GTTGGTTTTGTTCCCGGTGATGTTTCAACTTTGTTCATGGGGGTCAAGAACGTCAAGATCCTCTGCTTATCTCCTGATTCTTTAGATGTGAGTCCAGT CCTTTTTAAGTTAGCTTCATCACTGTGTAGCATTTGTTTTTTTTTTAAAT TTGATTGGTTAGTGATGATACAAAATATTTGATTCTG[GTGTGTGTGTGT GTGT]TTGTGAAAGTTCAGTCCCTTTAACTTAGCTTCATGAGTGTGTAGC CTTTGTTTTTTAATTGGTTACTGATGATATGGTGTGTGTGTGTGTGTGTG TGTTTCAGACGCTCTACTACCGTGGTGGTGACATGCCGGTGTTCAACAA TCTGATTT

UB0196(SEQ ID NO:120)

ACATGAGAACAAGATGGGTTCGAATTACCTCTAGCCTAGATCTGG ATCTGGAAACAAGAGACAAGGGAGAGACGAGATCTTGTCACCACCAC CAATCGGCTGCCACCACCACCACCACAACACGGCGCCAGCGAAAGGG AGATA[GAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGA GAGAGAGAGAGAGAGAGAGAGAGAGAGAGAGA]AGAAGAAGAAGAG AGAAAAGGAAAAGAGAAGCTTGATGGCTAGGGTTTCTTAGTCTCTCTA AATCTCTGCAGGGCTTTGCTCAAGTTTCAGAATGAGAGAAAAAAGAGA GGAGGCAACTTTATTTATAGGAAATGGAGGGAACCCTAGGTCATTTAC CTTAATGGGCTGCAGTCCTAACGAGCTCTCGTTAAAAAAATTTGGGCC GGGTATCGGGATGTTACACTAACGGTGTGTGGCGATGAAGGCTCTTCG ACTCTCAAAATTAATGATGTCCATAACTAAATAAAAACTACTCGACTTT ATTAAGATATAGCTTCAATGATTTAAAATTAAATATAGAACTCT

UB0307(SEQ ID NO:121)

ACCTNTGGGTAAGTAACTGTGGTGGC[CTCTCTCTCTCTCTCTCTCT CTCTCTCTCTCTCT]CAATACACTCTTCACTTAATAAATGTGAANACGTT AACTNGTTTCTTTTNTCACTTCTCAGTTATGTAGCTCCAGAGTATGCGAACTCTGATCTTCTGAATGAGAAAAGTGATGTCTATAGCTTTGGTGTTGT

UB0315(SEQ ID NO:122)

CACGAAAGCAGGCCCCACCCAATAAGCGATGAGCTGTATATTTAT TTTGTCTTGTTTTCACAAAAAATAACCCTTCATGTTTACAGTTAATTACA CAACAGCCCCTTTCTTTCCTCCATGACCAACGACAAGGTCGAATTT[CT CTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCTCT]CCGTCGTCTTCA TTCAATCTATCTCAGTGATTTACTCGCAATAGAAGTCGCCTCTTAATCT CTCGAGAGAGAAGCTCAAGT

UB0331(SEQ ID NO:123)

CGTGGACTAACGCTCGTGTGCAGGAAACGATGTTCGTGAAAAGGT ATCCGATCAGAGGAGCCTCCGCCGGTAAAAACCCTTCG[CCGCCGCCG CCTCCG]TTGAATGGTAATAACTCTTGTTCTCGCTTTCTCTTCAAACTCCCTTTTTTTTCTCTGATTATTTTTGTTGGTTA

KK66(SEQ ID NO:124)

GAATGGGAAGCATCACAATGATAATGCTAATGGCGGTTTTGGTCT GGTCCATTACTCTAGAGACCTGCATTGCTAGAAGAGGAAGACATTGGA GACATAACCACCGAAGCTCCTC[A/T]GACTTGTCTGATTCCTTGTCAAG CAAGAAACCAAAAAGCCACAGTCACCACCACAGCTCTCA[C/T]AACAA CAACCATAATCATCACCACAAGTCTAAACCTAAACCAAA[A/G]CCAAA GCTGAAAACGCCGCCAAAAAGTGACCACA[A/C]TAAATCTCCGGTGGT TTCACCGCCACCAAAAGTCCAACCACCGTCTCTTCCGCCGCCAAAGGG ATCCAAAGTTTTCAATGTGATGGATTTTGGCGCAAAGGGTGATGGCAA ATGTGATGACACTAAGTCGTTTGAAGCGGCTTGGGCAGCAGCTTGCAA AGTGGAGGCATCCATGATGATCATACCGCCTGAATACACTTTCCTTGTG GGTCCAATCTCATTCTCTGGTCCTTATTGTCAAGCTAACATTGTGTTTCA GCTTGATGGTACTATTATAGCTCCAACGGATTCAAAATCATGGGGAAA AGGGTTAATGTGGTGGCTTGAATTCACAAAGCTGAAAGGAATTAAAGT ACAAGGTAAAGGTGTGATTGATGGAAGAGGCTCTGGT

KK98G(SEQ ID NO:125)

GACAGAGATAGCCCTAACTTAGTCACTCTCTCTCACACACACTCC AGTTCAAAGTTCAAA[A/C]AATGGCTCCTCCACAGAAGCTCTTTCTCGC CGCCATTGTCGCTGCCGTCATTGTAGCCGCCACCACCGGATATGCACC TAATAGTGCTGCGGAAGATATTGTGCATTCCTCATGCGTGCACGCGAG CTATCCATCGCTATGCGTCCGTACACTCTCTACCTACTC[C/T]GGTCCAA CCATCACAAACCGTCGCGAGCTAGCTCAAGCCGCCGTCAAGATAAGCC TCTCCCACGCTCGAGCAGC[C/T]GCTAAGAAACTCGCGGCTGTGAGAG AAACCGTGGG[A/G]AAGAAACGGGTGAAAGCGGCGGTTGTGGACTGCG TGGAGATGATTGGAGACTCGGTGGACGAGCTG[A/C]GCCGCACGCTAG GCGTTTTAAAGCATCT[A/C]CACGTTTCGGGCGTTTCGGCGAACGAGTT CA[A/G]GTGGCAGATGAGCAACGCGCAGACGTGGGCTAGTGCGGCGTT GACGGATGACGACACGTGTCTCGATGGGTTTAAAGGGGTCGAGGGTAA GGTTAAAACGGAGGTGAAGCA[G/T]TGGATGACGAAAGTGGCGAGGGT TAC[A/G]AGCAACGCGCTTTACATGATCAACCAGCTAGATGAATCACGT GGCTAGCCCCACGTAGTACGTTCTTGATGTTATGATGTGCTTGTCCTAA TGGACAGTTATGATTTGGTGTTAGTTTTTTTCGTGTTTGCTTAATTGCGA GTTATCTACTATTTAAAAATGAGAGGCATTGTCCTTTTAAGTAGTTCTG ATAATGGTATACTAAATAAATGGTTTATCTCTTTTTTCGGACGGTATGT CATTGTATCGTATTGTGTTGTTCCCTTCGGATTCGATAGCATGTGATTTT GTCTTGACGTGTAGTAGCGCCTTGGCTGAGCTAATGCTCTAAATAAAA GTTTTAAGTGGC

下文的表14列出了关于与对核盘菌属的全植株大田抗性相关联的QTL 的标记的附加信息,以及用于每一多态性区域的示例性的正向和反向引物序 列的组。

表14:SSR和SNP标记以及用于扩增与核盘菌属(Sclerotinia)全植株大田抗性相关联的基因座的引物序列

尽管已经出于清楚和理解的目的以一些细节描述了上文所描述的本发 明,对于本领域的技术人员而言,从对本公开的阅读中将显而易见的是,能 够进行形式和细节上的多种改变而不背离本发明的真实范围。例如,上文描 述的全部的技术、方法、组合物、设备和系统可以以多种组合被使用。本申 请所引用的任何出版物、专利、专利申请、或其它文件都是出于全部目的以 全文引用的方式并入本文,其引用程度就如同将每一个别的出版物、专利、 专利申请、或其它文件个别地出于全部目的以全文引用的方式并入本文。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号