首页> 中国专利> 膀胱癌患者总体生存率预后模型

膀胱癌患者总体生存率预后模型

摘要

本发明属于生物工程及肿瘤标志物领域技术领域,涉及一种膀胱癌患者总体生存率预后模型,具体涉及基于12个DNA修复相关基因可预测膀胱癌患者的总体生存率的预后模型。本发明建立了具有12个DRRG的预后模型,并将膀胱癌患者分为高、低风险组。在训练队列中膀胱癌患者的风险评分与OS显著相关(P<0.001;HR=6.3[4.1,9.8])。ROC曲线分析显示,在1年,3年和5年随访中,AUC分别为0.763、0.735 and 0.735。预测性能已在测试集中得到验证。

著录项

  • 公开/公告号CN112725454A

    专利类型发明专利

  • 公开/公告日2021-04-30

    原文格式PDF

  • 申请/专利号CN202110156793.6

  • 发明设计人 宋伟;康维亭;

    申请日2021-02-03

  • 分类号C12Q1/6886(20180101);G16B20/00(20190101);

  • 代理机构37218 济南泉城专利商标事务所;

  • 代理人张贵宾

  • 地址 250000 山东省济南市经五纬七路324号

  • 入库时间 2023-06-19 10:49:34

说明书

技术领域

本发明属于生物工程及肿瘤标志物领域技术领域,涉及一种膀胱癌患者总体生存率预后模型,具体涉及基于12个DNA修复相关基因可预测膀胱癌患者的总体生存率的预后模型。

背景技术

膀胱癌(BLCA)是泌尿系统最常见的恶性肿瘤,其发病率和死亡率很高,初诊时约有75%的膀胱癌患者为非肌肉浸润性膀胱癌(NMIBC),约25%的患者是肌肉浸润性膀胱癌(MIBC)或转移性疾病。NMIBC通常通过膀胱内化疗或免疫疗法联合TURBT进行局部治疗,然而大多数NMIBC在6-12个月内复发,10%-15%的患者可能进展为浸润性或转移性疾病。总体而言,膀胱癌各个阶段的5年生存率仍不超过20%。

大多数膀胱肿瘤具有复杂的基因组,其特征在于高的突变负担以及频繁的拷贝数改变和染色体重排。膀胱肿瘤中存在DNA修复途径的改变,包括双链断裂(DSB)和核苷酸切除修复(NER)途径,可能会导致基因组不稳定并驱动肿瘤表型。DNA损伤(例如顺铂,丝裂霉素C和放射线)通常用于治疗肌肉浸润性或转移性膀胱癌,最近的一些研究已将特定的DNA修复途径缺陷与对基于DNA损伤的疗法的敏感性联系起来。另外,肿瘤DNA修复缺陷对于免疫治疗和其他靶向药物在膀胱癌中的使用具有重要意义。DNA修复相关基因与临床治疗密切相关,但是没有研究以此构建预后模型,因此,进一步了解膀胱癌DNA修复改变的前景的努力对于推进膀胱癌的治疗至关重要。而目前,尚未有基于DNA修复相关基因对膀胱癌患者进行预后分层的研究。因此很必要对DNA修复相关基因在膀胱癌中的表达和预后进行分析,为构建预后风险模型和治疗提供基础理论依据。

发明内容

本发明针对传统DNA修复相关基因在膀胱癌中的表达和预后进行分析存在技术空白的问题,提出一种新型的膀胱癌患者总体生存率预后模型。

为了达到上述目的,本发明是采用下述的技术方案实现的:

检测12种DNA修复基因表达水平的试剂盒在制备膀胱癌患者总体生存率诊断或辅助诊断产品中的应用。

12种DNA修复基因为HMGA1、 PRPF19、COPS2、 PAGR1、 RBM17、 PARP10、FBXO6、UBE2D3、 SIRT6、 FANCF、 RAD9A、REV1,序列如SEQ ID NO:1-12所示。

所述试剂盒还包括一个诊断模型,所述模型为:风险评分=(0.000133 * HMGA1的表达水平) + (0.007990 * PRPF19的表达水平) + (0.003889 * COPS2的表达水平) +(0.007473 * PAGR1的表达水平) + (-0.008353 * RBM17的表达水平) + (-0.000486 *PARP10的表达水平) +( -0.012050 * FBXO6的表达水平) +( -0.010389 * UBE2D3的表达水平) +( -0.004033 * SIRT6的表达水平) +( -0.030894 * FANCF的表达水平) +( -0.029960 * RAD9A的表达水平) +( -0.075726 * REV1的表达水平)。

膀胱癌患者总体生存率预后模型的构建方法,包括如下步骤:

(1)从癌症基因组图谱TCGA中下载标准化的RNA sequencing数据集和临床数据,该数据集包含来自411个肿瘤样品和19个非肿瘤样品;归一化处理后,使用R包org.Hs.eg.db将探针转化为基因名,对于多个探针对应的基因选取平均表达值最大的探针;

(2)从Gene Set Enrichment Analysis获取DNA修复相关基因DRRG,使用R包limma分析在肿瘤组织和正常组织中差异表达的DRRG,P < 0.05且差异倍数的绝对值>2作为筛选差异基因的截止值;筛选同时具有生存时间>30天和生存状态的膀胱癌患者,使用Cox回归分析和生存分析对差异基因对进行预后分析,P < 0.05作为筛选预后相关基因的截止值;

(3)以临床分期为参考,将TCGA数据集中的膀胱癌患者以7:3的比例随机分配到训练集和测试集,使用初始候选DRRG,在训练集中进行最小绝对收缩和选择算子回归分析;使用每个基因的系数计算个体化的风险评分,并通过风险评分将膀胱癌患者的分为高风险组与低风险组;使用ROC计算在多个时间点曲线下面积AUC,以评估预后模型辨别能力;然后在测试集中使用相同风险评分公式和临界值验证模型的准确性。

本发明使用DNA修复相关的基因(DNA repair relative genes,DRRG)开发一种实用性强的预后模型,以估计膀胱癌的总体生存期(overall survival, OS)。本发明分析了来自癌症基因组图谱(TCGA)中膀胱癌患者的基因表达谱,共有430例膀胱癌患者,其中具有完整临床信息的膀胱癌患者有392例。基于TCGA数据集鉴定差异表达的DRRG,对差异的基因使用单变量Cox回归分析和生存分析确定了预后相关的DRRG。随后,我们将TCGA数据集分为训练(n = 277)和测试数据集(n = 115)。基于训练数据集,我们使用L1-penalized Coxproportional hazards regression建立了具有12个DRRG的预后模型,并将膀胱癌患者分为高、低风险组。最后,通过结合临床特征和风险评分构建诺模图,以预测膀胱癌患者的生存可能性。校准曲线评估列线图预测与实际观测之间的一致性。从Gene Set EnrichmentAnalysis (GSEA)网址下载DNA 修复相关的基因,共包括563个DRRG。差异分析发现在563个DRRG中共有220个差异表达,其中70个DRRG与预后相关。对70个预后相关的DRRG使用LASSO回归分析确定了12个DRRG用于构建预后模型。基于12个DRRG的表达水平及相关系数,计算每个膀胱癌患者的风险评分,根据风险评分与截止值的大小将膀胱癌患者分为高、低风险组。在训练队列中膀胱癌患者的风险评分与OS显著相关(P <0.001; HR = 6.3 [4.1,9.8])。ROC曲线分析显示,在1年,3年和5年随访中,AUC分别为0.763、0.735 and 0.735。预测性能已在测试集中得到验证。多因素分析表明,风险评分是膀胱癌患者的独立预后因素。最后,通过结合临床特征和风险评分我们构建了诺模图,可预测膀胱癌患者的生存可能性。校准曲线验证了诺模图预测与实际观测之间具有良好的一致性。基于12个DRRG的风险评分可以很好地将膀胱癌患者分为高危、低危人群,这可能有助于临床治疗方案的选择。

与现有技术相比,本发明的优点和积极效果在于:

本发明建立了具有12个DRRG的预后模型,并将膀胱癌患者分为高、低风险组。在训练队列中膀胱癌患者的风险评分与OS显著相关(P <0.001; HR = 6.3 [4.1,9.8])。ROC曲线分析显示,在1年,3年和5年随访中,AUC分别为0.763、0.735 and 0.735。预测性能已在测试集中得到验证。

附图说明

图1为热图显示差异表达的DNA修复相关基因。

图2为生存分析预后相关的DRRG。

图3表示在TCGA训练集中基于DRRG开发预后模型。图3中(A-B)通过LASSO回归分析确定了12个DRRG;(C)基于DRRG的膀胱癌患者的风险评分分布;(D)不同组患者的生存状况;(E)热图显示DRRG的表达谱;(F)对特征定义的风险组的生存分析;(G)12个DRRG构建预后模型的时间依赖性ROC曲线。

图4表示在TCGA测试集中验证基于DRRG开发的预后模型。图4中(A)基于DRRG的膀胱癌患者的风险评分分布;(B)不同组患者的生存状况;(C)热图显示DRRG的表达谱;(D)对特征定义的风险组的生存分析;(E)12个DRRG构建预后模型的时间依赖性ROC曲线。

图5 为构建生存预测的诺模图。图5中(A)结合了风险评分和临床信息特征的列线图;(B)校准图显示列线图预测的1年生存概率与实际观察到的1年生存概率相对应;(C)校准图显示列线图预测的3年生存概率与实际观察到的3年生存概率相对应;(D)校准图显示列线图预测的4年生存概率与实际观察到的4年生存概率相对应。

具体实施方式

为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合具体实施例对本发明做进一步说明。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。

在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可以采用不同于在此描述的其他方式来实施,因此,本发明并不限于下面公开说明书的具体实施例的限制。

实施例1

如图1-5所示,本实施例提供可预测膀胱癌患者的生存可能性的模型构建方法和效果验证。

1.1数据下载和预处理

从癌症基因组图谱(TCGA)中下载Fragments Per Kilobase of transcript perMillion mapped reads (FPKM) 标准化的RNA sequencing数据集和临床数据,该数据集包含来自411个肿瘤样品和19个非肿瘤样品。归一化处理后,使用R包“org.Hs.eg.db“将探针转化为基因名,对于多个探针对应的基因则选取平均表达值最大的探针。

1.2 筛选预后相关的DNA修复基因

为了构建DNA修复相关的预后模型,从Gene Set Enrichment Analysis (GSEA)(https://www.gsea-msigdb.org/gsea/index.jsp)获得了563个DNA修复相关基因(DRRG)。使用R包“limma”分析在肿瘤组织和正常组织中差异表达的DRRG。P < 0.05且差异倍数的绝对值>2作为筛选差异基因的截止值。筛选同时具有生存时间(>30天)和生存状态的膀胱癌患者,使用Cox回归分析和生存分析对差异基因对进行预后分析。P < 0.05作为筛选预后相关基因的截止值,共筛选出220个差异表的DRRG,其中70个DRRG与预后相关,可作为初始候选DRRG用于构建预后模型。

1.3构建DRRG的预后模型

以临床分期为参考,将TCGA数据集中的膀胱癌患者以7:3的比例随机分配到训练集和测试集。使用初始候选DRRG,我们在训练集中进行了最小绝对收缩和选择算子(theleast absolute shrinkage and selection operator, LASSO)回归分析。随后,我们使用每个基因的系数计算了个体化的风险评分,并通过风险评分将膀胱癌患者的分为高风险组与低风险组。使用ROC(the receiver operating characteristic)计算在多个时间点曲线下面积(AUC),以评估预后模型辨别能力。提出如下模型:

风险评分 = (0.000133 * HMGA1的表达水平) + (0.007990 * PRPF19的表达水平) + (0.003889 * COPS2的表达水平) + (0.007473 * PAGR1的表达水平) + (-0.008353 * RBM17的表达水平) + (-0.000486 * PARP10的表达水平) +( -0.012050 *FBXO6的表达水平) +( -0.010389 * UBE2D3的表达水平) +( -0.004033 * SIRT6的表达水平) +( -0.030894 * FANCF的表达水平) +( -0.029960 * RAD9A的表达水平) +( -0.075726 * REV1的表达水平)。

然后在测试集中使用相同风险评分公式和临界值验证模型的准确性。同样,预后模型在每个数据集中以风险图形式呈现,涵盖了所含基因的表达水平,风险评分分布和个体生存状况。

1.4 多因素回归分析风险评分的预后价值

从TCGA数据库中收集膀胱癌患者的临床特征,包括生存时间、生存状态、年龄、性别、分期、淋巴结转移和远处转移状态。使用临床数据和风险评分进行多元cox回归分析,评估风险评分的预后价值是否与临床特征相关。p <0.05的值被认为具有统计学意义。

1.5构建诺模图

使用R包“survival”和“rms”根据年龄、性别、T分期、N分期、M分期、临床分期和风险评分构建诺模图。然后绘制校准曲线,以评估实际和预期生存结果之间的一致性。

1.6统计分析

使用R软件(版本3.6.1; https://www.R-project.org)进行统计分析,统计显著性设为p <0.05。使用Kaplan-Meier曲线分析、单变量Cox回归分析进行生存分析。多元Cox回归分析用于确定独立的预后因素。时间依赖的ROC分析用于评估预后预测模型的准确性。AUC> 0.60被认为可以接受预测。

2.结果

2.1筛选预后相关的DNA修复基因

从Gene Set Enrichment Analysis (GSEA)(https://www.gsea-msigdb.org/gsea/index.jsp)下载GO_DNA_REPAIR基因集,共包含563个DNA修复相关基因。使用TCGA数据集筛选差异表达的DNA修复相关基因,TCGA数据集纳入430例组织(肿瘤组织411例,正常组织19例)。使用R包“limma”共筛选出220个差异表达的DRRG(图1)。随后,使用Coxproportional hazards regression model和Survival analysis (Log-Rank test)联合筛选差异表达的DRRG中与预后相关的DRRG。在TCGA数据集中具有生存状态和生存时间(>30天)的膀胱癌患者共392例,联合筛选后发现共70个DRRG与膀胱癌患者的OS相关(图2)。使用这70个与预后相关的FRRG进行后续的模型构建。

2.2使用DNA修复相关基因构建膀胱癌患者的预后模型

TCGA数据集中共包括392名膀胱癌患者,随访时间>30天。TCGA数据集中的患者按照不同的临床分期以7:3的比例随机分配到训练组(n=277)和测试组(n=115)。

使用训练组的膀胱癌患者进行预后模型的构建。我们在训练集上使用L1罚分Cox比例风险回归定义DRRG系数,并最终选择了12个DRRG用于构建风险模型(表1,图3A和3B)。随后,根据DRRG系数计算训练组中每个患者的风险评分。通过设定最佳临界值设定为-0.67,将患者分为高风险、低风险组(图3C),高于临界值为高风险,低于等于临界值为低风险。风险评分 = (0.000133 * HMGA1的表达水平) + (0.007990 * PRPF19的表达水平) +(0.003889 * COPS2的表达水平) + (0.007473 * PAGR1的表达水平) + (-0.008353 *RBM17的表达水平) + (-0.000486 * PARP10的表达水平) +( -0.012050 * FBXO6的表达水平) +( -0.010389 * UBE2D3的表达水平) +( -0.004033 * SIRT6的表达水平) +( -0.030894 * FANCF的表达水平) +( -0.029960 * RAD9A的表达水平) +( -0.075726 *REV1的表达水平)。图3C-E表示风险图,包括基于签名高、低风险组之间个体的生存状态以及所包含的DRRG表达水平而组成的热图。研究发现危险组之间的生存状态有明显的区别,其中红色点表示死亡,蓝色点表示存活(原图为彩色)。高危组中发生大量死亡,而低危组中的大多数患者在随访中仍然活着。风险评分对训练组进行了显著分层,明显的将患者分为低风险和高风险组。我们的数据表明,高风险组的OS显著低于低风险组(P <0.001; HR =6.3 [4.1,9.8])(图3F)。ROC曲线分析(图3G)显示,在1年,3年和5年随访中,AUC分别为0.763、0.735和0.735,为可以接受的辨别力。

表1 构建风险模型的DNA修复相关基因参数

2.3 使用测试组数据验证预后模型

我们使用上述的DRRG系数和临界值评估测试组中膀胱癌患者风险评分,并将测试集中的患者分为高风险和低风险组。在测试组中,我们验证12个DRRG的临床效用和判别力。图4A-C表示风险图,包括基于签名高、低风险组之间个体的生存状态以及所包含的DRRG表达水平而组成的热图。由图可知高危组中发生大量死亡,而低危组中的大多数患者在随访中仍然活着。风险评分对测试组进行了显著分层,将患者分为低风险和高风险组。高风险组的OS显著低于低风险组( P <0.001; HR = 3.8 [1.5,9.5])(图4D)。ROC曲线分析(图4E)显示,在1年,3年和5年随访中,AUC分别为0.717、0.650和0.658,为可以接受的辨别力。测试组数据验证预后模型具有高度可靠性。

2.4风险评分作为膀胱癌患者的独立预后因素

为了进一步探讨风险评分是否可以作为独立的临床预后因子,将单变量和多变量Cox比例风险回归分析应用于TCGA队列。由表 2可知,在TCGA队列中,单因素分析发现riskscore、T分期、N分期、M分期和临床分期是膀胱癌患者总生存率的风险因子,多因素分析发现在调整T分期、N分期、M分期和临床分期后,riskscore仍然是膀胱癌患者总生存率的独立预后因素(HR =4.2 [2.81-6.3], p <.0001)(表2)。因此,风险评分作为膀胱癌患者的独立预后因素。

表2 在TCGA数据集中预后因素的单变量和多变量分析

2.5诺模图预测膀胱癌患者的预后

诺模图是一种强大的工具,已被用于通过综合多种风险因素来定量确定临床环境中的个体风险。通过组合风险评分、年龄、性别、T分期、N分期、M分期和临床分期,我们生成了诺模图以预测1年,3年和5年的预后。根据每个患者的风险评分、年龄、性别、T分期、N分期、M分期和临床分期所对应的分数,分值相加后得到总评分。在诺模图中,总评分对应的1年、3年和5年生存率分别为膀胱癌患者1年、3年和5年的预测生存率。如图5A所示,根据每个因素对预后的贡献为其分配了得分。校准曲线显示实际和预期生存率匹配(图5B,5C和5D),包括1年、3年和5年复发期。研究发现校准曲线显示实际和预期生存率具有较高的一致性,说明我们的预测模型具有较高的可信度。

SEQUENCE LISTING

<110> 山东第一医科大学附属省立医院(山东省立医院)

<120> 膀胱癌患者总体生存率预后模型

<130> 1

<160> 12

<170> PatentIn version 3.5

<210> 1

<211> 2160

<212> DNA

<213> 人工序列

<400> 1

ctttttaagc tcccctgagc cggtgctgcg ctcctctaat tgggactccg agccggggct 60

atttctggcg ctggcgcggc tccaagaagg cgtgagttcg cggccgctcc ggtggcttct 120

tttttttata tctataattt aattaaatta tttatttatt gaggccgcgc acgggccgtg 180

cccagcttcc tgcccctcgc catccttcgg gggaggggga atatttttgt ccccccgcct 240

ggctgtgaca cataaatacc ccgcgggggc ctgggcggcg agcacgcggc ggcggcggtc 300

tctgagcgcc tctgctctct cccggtttca gatccgcatt tgctaccagc ggcggccgcg 360

gcggagccag gccggtcctc agcgcccagc accgccgctc ccggcaaccc ggagcgcgca 420

ccgcaggccg gcggccgagc tcgcgcatcc cagccatcac tcttccacct gctccttaga 480

gaagggaaga tgagtgagtc gagctcgaag tccagccagc ccttggcctc caagcaggaa 540

aaggacggca ctgagaagcg gggccggggc aggccgcgca agcagcctcc ggtgagtccc 600

gggacagcgc tggtagggag tcagaaggag cccagcgaag tgccaacacc taagagacct 660

cggggccgac caaagggaag caaaaacaag ggtgctgcca agacccggaa aaccaccaca 720

actccaggaa ggaaaccaag gggcagaccc aaaaaactgg agaaggagga agaggagggc 780

atctcgcagg agtcctcgga ggaggagcag tgacccatgc gtgccgcctg ctcctcactg 840

gaggagcagc ttccttctgg gactggacag ctttgctccg ctcccaccgc ccccacccct 900

tccccaggcc caccatcacc accgcctctg gccgccaccc ccatcttcca cctgtgccct 960

caccaccaca ctacacagca caccagccgc tgcagggctc ccatgggctg agtggggagc 1020

agttttcccc tggcctcagt tcccagctcc ccccgcccac ccacgcatac acacatgccc 1080

tcctggacaa ggctaacatc ccacttagcc gcaccctgca cctgctgcgt ccccactccc 1140

ttggtggtgg ggacattgct ctctgggctt ttggtttggg ggcgccctct ctgctccttc 1200

actgttccct ctggcttccc atagtggggc ctgggagggt tcccctggcc ttaaaagggg 1260

cccaagcccc atctcatcct ggcacgccct actccactgc cctggcagca gcaggtgtgg 1320

ccaatggagg ggggtgctgg cccccaggat tcccccagcc aaactgtctt tgtcaccacg 1380

tggggctcac ttttcatcct tccccaactt ccctagtccc cgtactaggt tggacagccc 1440

ccttcggtta caggaaggca ggaggggtga gtcccctact ccctcttcac tgtggccaca 1500

gcccccttgc cctccgcctg ggatctgagt acatattgtg gtgatggaga tgcagtcact 1560

tattgtccag gtgaggccca agagccctgt ggccgccacc tgaggtgggc tggggctgct 1620

cccctaaccc tactttgctt ccgccactca gccatttccc cctcctcaga tggggcacca 1680

ataacaagga gctcaccctg cccgctccca acccccctcc tgctcctccc tgccccccaa 1740

ggttctggtt ccatttttcc tctgttcaca aactacctct ggacagttgt gttgtttttt 1800

gttcaatgtt ccattcttcg acatccgtca ttgctgctgc taccagcgcc aaatgttcat 1860

cctcattgcc tcctgttctg cccacgatcc cctcccccaa gatactcttt gtggggaaga 1920

ggggctgggg catggcaggc tgggtgaccg actaccccag tcccagggaa ggtggggccc 1980

tgcccctagg atgctgcagc agagtgagca agggggccca aatcgaccat aaagggtgta 2040

ggggccacct cctccccctg ttctgttggg gaggggtagc catgatttgt cccagcctgg 2100

ggctccctct ctggtttcct atttgcagtt acttgaataa aaaaaatatc cttttctgga 2160

<210> 2

<211> 2337

<212> DNA

<213> 人工序列

<400> 2

aatttccgtt aggtgctgaa ggctgtggcg cgcggctgtc cccattccca cgtgaagcgc 60

tacgctagca tcgctcggct ggcggctccc agctcgccgc ggagcagtcc cggcagcagc 120

gggggaccgg aagtggctcg cggaggctca gaagctagtc ccggagcccg gcgtgtggcg 180

cctcggagca cggtgacggc gccatgtccc taatctgctc catctctaac gaagtgccgg 240

agcacccatg tgtatcccct gtctctaatc atgtttatga gcggcggctc atcgagaagt 300

acattgcgga gaatggtacc gaccccatca acaaccagcc tctctccgag gagcagctca 360

tcgacatcaa agttgctcac ccaatccggc ccaagcctcc ctcagccacc agcatcccgg 420

ccattctgaa agctttgcag gatgagtggg atgcagtcat gctgcacagc ttcactctgc 480

gccagcagct gcagacaacc cgccaagagc tgtcacacgc tctgtaccag cacgatgccg 540

cctgccgtgt cattgcccgt ctcaccaagg aagtcactgc tgcccgagaa gctctggcta 600

ccctgaaacc acaggctggc ctcattgtgc cccaggctgt gccaagttcc caaccaagtg 660

ttgtgggtgc gggtgagcca atggatttgg gtgagctggt gggaatgacc ccagagatta 720

ttcagaagct tcaagacaaa gccactgtgc taaccacgga gcgcaagaag agagggaaga 780

ctgtgcctga ggagctggtg aagccagaag agctcagcaa ataccggcag gtggcatccc 840

acgtggggtt gcacagtgcc agcattcctg ggatcctggc cctggacctc tgcccgtccg 900

acaccaacaa gatcctcact ggtggggcgg ataaaaatgt cgttgtgttt gacaaaagtt 960

ctgaacaaat cctggctacc ctcaaaggcc ataccaagaa ggtcaccagc gtggtgtttc 1020

acccttccca ggacctggtg ttttctgctt cccccgatgc cactatcagg atttggtcgg 1080

tccccaatgc ctcttgtgta caggtggttc gggcccatga gagtgctgtg acaggcctca 1140

gccttcatgc cactggcgac tatctcctga gctcctccga tgatcagtac tgggctttct 1200

ctgacatcca gacagggcgt gtgctcacca aggtgacaga tgagacctcc ggctgctctc 1260

tcacctgtgc acagttccac cctgacggac tcatctttgg aacaggaacc atggactctc 1320

agatcaagat ctgggacttg aaggaacgta ctaatgtggc caacttccct ggccactcgg 1380

gccccatcac tagcatcgcc ttctctgaga atggttacta cctggctaca gcggctgatg 1440

actcctctgt caagctctgg gatctgcgca agcttaagaa ctttaagact ttgcagctgg 1500

ataacaactt tgaggtaaag tcactgatct ttgaccagag tggtacctac ctggctcttg 1560

ggggcacgga tgtccagatc tacatctgca aacaatggac ggagattctt cactttacag 1620

agcatagcgg cctgaccaca ggggtggcct tcgggcatca cgccaagttc atcgcttcaa 1680

caggcatgga cagaagcctc aagttctaca gcctgtaggc cctggccctt ctgatggaag 1740

ctgggcctca tctcagtaga ggggtagaat tagggtttgg gggggggggt ggggggaatc 1800

tatgggggga gggggctctg tggggtggga cattcacatc atttcactct ggtctgagtg 1860

gtggcctgag aaccatggtg gcatggacca ccctcatcca tgcaactcca ggccccatgg 1920

gaacggatgt ggaaggaaga actgtcaccc tcttaaggcc cagggtcgga gcccagggcc 1980

tctcccttcc tgtcgttcaa tggacgtggt ggtggctgtt ccacacccat tttgttgcag 2040

ttcctgtgag acaggagagg ctgagccaag ggaactgtga aggggatggg caggagggct 2100

tgtgcagggt tttgtaagca gtgatctagt ttcattaaaa aaagaaaaca ataaccataa 2160

ccacctcccc gtgtctgtct gcaccaggag cacctgggac tgggaaggtc aaggggaggg 2220

agcacacact gggacactgg cttccgggaa gcccatcttc ctttcctttc acagctctta 2280

cccttttttt ttttttttaa ttgcacagca gaaataaaaa caaatctgca gatgaaa 2337

<210> 3

<211> 6597

<212> DNA

<213> 人工序列

<400> 3

ctcctccccc tcccggccaa gatgtctgac atggaggatg atttcatgtg cgatgatgag 60

gaggactacg acctggaata ctctgaagat agtaactccg agccaaatgt ggatttggaa 120

aatcagtact ataattccaa agcattaaaa gaagatgacc caaaagcggc attaagcagt 180

ttccaaaagg ttttggaact tgaaggtgaa aaaggagaat ggggatttaa agcactgaaa 240

caaatgatta agattaactt caagttgaca aactttccag aaatgatgaa tagatataag 300

cagctattga cctatattcg gagtgcagtc acaagaaatt attctgaaaa atccattaat 360

tctattcttg attatatctc tacttctaaa cagaattctg attttttatg tcagatggat 420

ttactgcagg aattctatga aacaacactg gaagctttga aagatgctaa gaatgataga 480

ctgtggttta agacaaacac aaagcttgga aaattatatt tagaacgaga ggaatatgga 540

aagcttcaaa aaattttacg ccagttacat cagtcgtgcc agactgatga tggagaagat 600

gatctgaaaa aaggtacaca gttattagaa atatatgctt tggaaattca aatgtacaca 660

gcacagaaaa ataacaaaaa acttaaagca ctctatgaac agtcacttca catcaagtct 720

gccatccctc atccactgat tatgggagtt atcagagaat gtggtggtaa aatgcacttg 780

agggaaggtg aatttgaaaa ggcacacact gatttttttg aagccttcaa gaattatgat 840

gaatctggaa gtccaagacg aaccacttgc ttaaaatatt tggtcttagc aaatatgctt 900

atgaaatcgg gaataaatcc atttgactca caggaggcca agccgtacaa aaatgatcca 960

gaaattttag caatgacgaa tttagtaagt gcctatcaga ataatgacat cactgaattt 1020

gaaaagattc taaaaacaaa tcacagcaac atcatggatg atcctttcat aagagaacac 1080

attgaagagc ttttgcgaaa catcagaaca caagtgctta taaaattaat taagccttac 1140

acaagaatac atattccttt tatttctaag gagttaaaca tagatgtagc tgatgtggag 1200

agcttgctgg tgcagtgcat attggataac actattcatg gccgaattga tcaagtcaac 1260

caactccttg aactggatca tcagaagagg ggtggtgcac gatatactgc actagataaa 1320

tggaccaacc aactaaattc tctcaaccag gctgtagtca gtaaactggc ttaacagaga 1380

acaagctttt acagacgtcc ttaaggcaac agtgcagaga tgtaatcctt aaaagaactg 1440

ggaatggcaa aactactgtc ggttgatgtg tcctgaaaat tattggagtt atggcagaag 1500

tgcttttttg atcaactggt ttgtgttttg ctgctgcatt tatcccaaga aaaacagctt 1560

taatctccag aagaaaacca aaataccatg ggatttatgc tgtattgaca tcttgcccta 1620

aacgtacaac atcatagtaa tttgtcatgg gcaacatgac cagagagaag atttttgtca 1680

tgattttaaa tacactgaca cgctactgtt ggttaaattt aaacatgttt tacctgcaga 1740

aattctctca caaataacct gcaataactt gaaatgcata cccttttgaa cacttccttt 1800

tctcatgtat aaattaaaat gtttgctgca ttttgcaaaa tgtcaattct ctaaaaatgt 1860

gtccgtatat ttctgtacct gcagtgtagt aaaggtttag acgaaacccc ataattatag 1920

tggcatactg tcacttaggt ttcaagcagc aaaataaaca gtgcagctca gaaattgtag 1980

tttggttctt gatgtgtttt tattacattt ggagttgttt tgttttttag taccttcgaa 2040

atttcaaatt attttatctt cagttaatga ttttaaaaag cctgggggca aataagttgg 2100

ttatttgctt tcaagttttt aaaagtagtc tttattgata gagtaaggag aactactttc 2160

taacaaaaca cgtgcatagt tatgacagtg atgctttaaa ggaataaaat tctttttttt 2220

taaagagtga tattcctttt caaaagaata ctaactctca gaatgttcac tttaaacgaa 2280

tatgccagaa catagacagc taaatgaatg ttactctgca tagtgatcat gctggaaggt 2340

tatttcctaa tgccagcaat ctaccattgc ccaaaacctg ctgagtttac tcttttagaa 2400

ttgcattcaa agttaatttg tcacacacac taaactttat gattatacat tgttttaaaa 2460

aatatagtat taggaagctt gattattttt agttaccatt acttggcacc aaatgaaagt 2520

ttccaaaact tccacctaac tttgaggtaa tgcagaaagt atataactgg ctttgaaggc 2580

aatcccaaaa gagttttaaa ggttttttga gcagtggcag tatacttagg agaatgaact 2640

gtggccttcc aaggtaacta ccttaaagga actcagctca tttgaatgta ttgagttttg 2700

gatgtatttg tttcattttt taaaaagttc acattatttt atagtgtcga aaggaagaac 2760

taggattaac ataatttctt tggtttttct attgcttgtt attattatgt aaaaactggg 2820

tggcagttca gaaggaagat tgtggttaca gaagagtgac aaccaagaat tttttgatca 2880

ttaaatcaga ttttataaac agtggaagga gcatggactt aaaacaaggc atgcttattc 2940

ggttttgtca aaattttacg aaaatatgtg atatatattt atactaaaaa tatataatcc 3000

ttagatttag aaaagcaatc agttaatgtc tttagcagac taaagcagta ttaaacacag 3060

gtacaagttg gaaattgtag aaaacggaaa gaaaacaaaa gacaaaatgt ctatggtagg 3120

gaataaaagt ttaagatatt ataaaattat gtgtattttc tcttttacat aaatcatttg 3180

tgaaaagtgt gctaaacttt ttttacaaga gtgatattaa ttaggattta tttttcaata 3240

taatttggag accctttgtt atccaaataa aaatgatgag tttttgtgcc tgtattcaaa 3300

tatgtatgca tgtgataacc cttgaaagct aaagcccttc ttaacttttg agttgatgga 3360

attagaattc aaagatttga atgaaatgat ttaaccttta tcctccaatt cttacagtgc 3420

ccagttctcc tgtgctatct ttgctttgta caatagtgca tcttccactt tctagagaga 3480

aagcatgcac ttgttatttg gaaaactggg ctaaatatat aacagtatcc aaagttatac 3540

cataataatt tattgtaatt gtgtattaca tagctttgtt tacccagata taggtgcgtt 3600

cttttttttc tgttagtcat ctgtgacttt tgttctggaa tacaggtttt taaatatatc 3660

ttaacagtct gactaactta aaataattta ttcttccctt aaaacatttt tctgtgtttt 3720

tgtgcatcaa atattgtaga gttgaaatct tagagattgc ttatcgaaat ataaatttag 3780

gggaagttaa aaatcgattg gcaaatttgt agcatttatt cactgattaa atcttttcca 3840

cttttgtgaa aaccatacca gtggtttaca tcatattgta atgtgttcat ctcattcttc 3900

tttttatccc taaacctagc taaaagttac tgcaaagaaa tctttggctg ccacaagtag 3960

atgctctcta ctacaagagc tggatttcca ttactcactc ttgctcttac attaaagttg 4020

ttgattaaat actttttctc tacatcttaa tgtaacataa ctgatttctt tttaaagatg 4080

agtatatatg tactaagtaa tgctctcatt acatgagtcc cttctaacta caggctgata 4140

catctttcag gaaaactgag aacctaatat ttaagtgagg cctattttaa atgagctata 4200

ctgtgggtgg tagtgtttgt taccttatgt aagacttagg tttgtcttag actgaaaaac 4260

tcttattctt aatatttaaa atatccatga tggtagaaat tttgtgggaa attttctttt 4320

ttaatcaata gttacagttc ttcagtaaac acaggtatgt atgcttttgt ggtgtcagtg 4380

tcagtctaaa tctatgggtg aagcagttag tccataagac aaaaaattat ttgcctagtg 4440

gattcccttt acctcttttt aagaagctca gagatctgta atcattaatt tactaaggat 4500

tttttaaaat attattttag tcacttttaa acctgaaaat ttctcttttg atttagattt 4560

ttgaagtgag gcttgagcat acacaagtaa agctgggagt ttcattcttc atatgggatt 4620

tatgactaaa tatttctagc attttgaaga agataaacat tttgaactga agtatataac 4680

aaaaaaagga atttgacatt taactatttt gtatcaaagt gtttaagaac actatccaga 4740

acaagagatg gagtatcagg tttcagaatg tgacgcaaaa ggcatttggt cttcatttat 4800

gtgaccacaa ttaaaatttt cctctttttt tctttttctg gaggttttct tttagttttc 4860

attgttttag gttttttttt cccccaaatc agcatcctat ttatatttgt ttgatacggt 4920

ttttttgttt ttgtttttgt tttgcttttt ttggaaacag tttcgctctt gtcacccagg 4980

ctggagtgca gtggcgcaat ctcagttcac tgccacctcc acctcccggg ttcaagcgat 5040

tctcctgcct caatctccgg agtagctggg attacagaca cccgccacca cgcccagcta 5100

atttttgtgt ttttagtaga gacaagattt caccatgttg gccaggctgg tctcaaactc 5160

ctgacctcag gcgatccacc gctttggcct cccatagtgc tgggattaca ggcgtgagcc 5220

accacgccca gcctgataca gttttaagca ggaatttggc agaaatttcg taacgaagac 5280

aaattggagg ttctctttaa ctcgagatta ttaaatttat agtaacttct tgggccatta 5340

aaatgtgagt ttaaatgcca tttggaggat ttgtgttata ttaagcacca caaatttaaa 5400

ctgtcaacta gtgattctac atgtttctca aaatgctaaa gtttagcatc acttacttgc 5460

ttttgaattt taaggagatt cgtcttaggt aatgtctcag aagaaaccag tgtgtggttc 5520

tctaaaattt tactttttta ctgtcacgta taataatatc taaactacct gtagtagtta 5580

aaaatattac ggcatcaaag gtatatgcca agtgtacctt aaaaccctgt gacaggaaaa 5640

aagaaaaaat tatttcttaa gtacttacta ttcgggggca actttgttcc gtgttggcaa 5700

aattatgaac tttgctcaga atttccacat gaatagctga ccaaaacttt tttgtgtgca 5760

tatgtataca tatgtaataa gtgaaacata cttgtgggag tacaaaattc atcaccagtt 5820

tatcacagta attttccagt tttctatttt acttaatatc acttatttct gacacaggca 5880

aatgtcatat gccatgaaaa gaattaccag tgtaccagta acttgcgtgt tatgactagg 5940

tttcatgtgg aagactgtcc aaatttacat aatctagagt aattttttaa ttctgaagta 6000

agggcatttt aaaattaatt gctaaaggtt gttttattgt acatccattt tatgggagtt 6060

tagagtttag aaaaagtaat ctctagcgtc atcccatgaa gttgtcaaaa gttttggcat 6120

gcttattagc aacatattaa tgccaagtgt tgagtatcta atttctgttc aaatgtttgc 6180

ctatccctta ctgtttacga cagtaataaa tttttatgca tctattttaa ataacactga 6240

agaaaattaa aatatatttc aagaaatgga gcaatgacat ggaaaataga aagttgtttg 6300

gttttgcaat gtgttacata attggttgca ttataaattt tctccatttt gtttatgata 6360

agctaatata aaaggtatca aattccttga gctaacacta ggtgggaagg aagtagtagg 6420

tgattaggaa tgtaacagga tgtctgcctg aaatggtcag ttccaccaat taataattga 6480

gaactgatta tatgtgcagg atgtgtcata agatgctgta aggcttaaat actcaagggt 6540

ttttttattt atctggaagt gcacattcct tattggtaat aaaaaatacg taatcta 6597

<210> 4

<211> 3874

<212> DNA

<213> 人工序列

<400> 4

aggtgcgtac ggcatctgac ttgacgtggc ccacaactga aaggtctggg gagaaggcgc 60

cgtgtccggg tgtggagagg ggcgtcgtgg aagcgagaag agtggcccgt ccctctcctc 120

cccctttccc tctttcggaa agtggtttct gcggggcccg ggagcctcgg agtaccgaac 180

ctcgatctcc ggggcggggt ccttggtggg gactgagcgc cccctcccgg ggacgggcgg 240

tctggccgcg gagtcccctg cgggagcgtg attggctgga aacggtcccg aacccccagg 300

ggagcccgat ccctggggga ccctggcttc ggactccagt atctgtcgtc gcagggtccc 360

tgccctagtg gcctatgtcc cttgctcggg gccatggaga cactgcggcc agtacggcgg 420

cgcctctgtc tgaagaaggg gaagtgacct ccggcctcca ggctctggcc gtggaggata 480

ccggaggccc ctctgcctcg gccggtaagg ccgaggacga gggggaagga ggccgagagg 540

agaccgagcg tgaggggtcc gggggcgagg aggcgcaggg agaagtcccc agcgctgggg 600

gagaagagcc tgccgaggag gactccgagg actggtgcgt gccctgcagc gacgaggagg 660

tggagctgcc tgcggatggg cagccctgga tgcccccgcc ctccgaaatc cagcggctct 720

atgaactgct ggctgcccac ggtactctgg agctgcaagc cgagatcctg ccccgccggc 780

ctcccacgcc ggaggcccag agcgaagagg agagatccga tgaggagccg gaggccaaag 840

aagaggaaga ggaaaaacca cacatgccca cggaatttga ttttgatgat gagccagtga 900

caccaaagga ctccctgatt gaccggagac gcaccccagg aagctcagcc cggagccaga 960

aacgggaggc ccgcctggac aaggtgctgt cggacatgaa gagacacaag aagctggagg 1020

agcagatcct tcgtaccggg agggacctct tcagcctgga ctcggaggac cccagccccg 1080

ccagcccccc actccgatcc tccgggagta gtctcttccc tcggcagcgg aaatactgat 1140

tcccactgct cctgcctcta gggtgcagtg tccgtacctg ctggagcctg ggccctcctt 1200

ccccagccca gacattgaga aacttgggaa gaagagagaa acctcaagct cccaaacagc 1260

acgttgcggg aaagaggaag agagagtgtg agtgtgtgtg tgtgtttttt ctattgaaca 1320

cctgtagagt gtgtgtgtgt gttttctatt gaacacctat agagagagtg tgtgtgtttt 1380

ctattgaaca tctatataga gagagtgtgt gagtgtgtgt tttctattga acacctattc 1440

agagacctgg actgaatttt ctgagtctga aataaaagat gcagagctat catctcttaa 1500

aaggaggggc tgtagctgta gctcaacagt taggccccac ttgaagggag aggcagaatt 1560

gtactcaccc agattggaaa atgaaagcca gatgggtaga ggtgccctca gttagcacct 1620

gtcccatctc gggccctcca actcctccca gtcccactcc agtgcagcca gctggctcca 1680

aggtagaaac ccatgagcac tcagggagca gtgtgccttc agctgcagca gaagcagccc 1740

ggaggataaa atgagaacca gctgcacacg ggccctttaa ctcccaagcc ccacccctgg 1800

gcttggcctg ccttgccctg ccgggaagtg atccccaagg cagggtgaga gttccccatc 1860

tgaggcgttt gttgcagcta cctgcacttc tagatgtgag tacattgtac tagcccccca 1920

aaccccaaat caggggcaga tctttgtatc ccttgaggct ctctttagtc ctgtcttgct 1980

ttgaagggcc ttgcttctgc tggggcaggg aaaacatgtc tgaatcagag tggggaagga 2040

ggatgggtgg tggctttgct tttggaggtt tcactttcca atagttggga gtcttctggg 2100

ttttgaagta aaggcagatt aacaccaaca ccggtccccc acccccctgc aactctcagg 2160

cctctctctg acttcagggt cccacctggg aaatcaggtg gggaacctta cagggtcatt 2220

cagaccccat cttagcccta gatcggtgct tgctctactc acctgcactg tcctggggac 2280

ctgggctctg gcctgtcacc ttgagctcca agaatgtgac ctgtacccat tcaggcccct 2340

taactctgac agatgagggt ttcttactcc tccatgcagg gctgggccag ctgttggtct 2400

cagtcgatca ttcaggaagt cattagcaga gtgatttcca gaaggcgtag aatttagtga 2460

ccaaggttct ttcctttttg ggaggagaaa gtgaaaacta ggatgctcag ctggacccac 2520

cagcctgaga ttctggggat tttagagctg tcccttgggg agccaagcac ttgggggtgg 2580

aggtgatagc gaggctgatg gcccctgtgt tctcagctct ctgcctgggt agcccctggg 2640

tgatggggga gaggccagct gtcacgtggg gtatcaggtg gctctgccag aaactccctt 2700

ggcacacaga gcactgggtc ggccctcggg tgtggctgtt tgggcaggac agccctctgt 2760

atgtagcctt gagcaggtag gggggccacc ttgagtgggt ggcccagaga cagcctcagg 2820

gctccaaggt aacggggtgc tcaggttatc ttgggtgctg ccctcccagg ttctggggga 2880

gcagaggctg ggcgctggcc caacttacag gaaacactca cctttgaact gccattagca 2940

ccatctgggc agtacacagc cccacccagg tcctctagtt cttgttctcg gcttagaatc 3000

tttgtgtttc tgcctgagaa gccactgcct cctagtttgt ggtctctaca gttatagcca 3060

ggttggactt ccggctccgt cctttgataa ctgtgtgctc ttgggcaaat ttcttaactt 3120

gcaggttctt gtgaggataa catgagttaa ttgagggcac ttaacactac ctggcacaga 3180

ttaagctcat ctgaagtggg agctgttact taggggcgtt tgcctagaac acagggtcca 3240

gaggctctct cccggaaact tagacccagt gagtcagaag tgaggcctgc aaaaagcagc 3300

aggagtgggg ttaagaattc cagcctaggg ctggatgcgg tggctcaggc ctgtaatccc 3360

agtactttgg gaggcccgaa tgggaggatg gcttgaggcc aggagttcca gaccagcctg 3420

agcaacatag cgagaccctg tctctgtttg tgtgtgtgtg gttggggttt tgtttttttt 3480

ttttttttaa agaattatag ctcagtccta tgattaggca agttgagaaa atattgatga 3540

agatcagggg tgctgaagcc tggttcctgg ggtcgcttct gatctaggcg gttcttgcct 3600

ctggtgactg gtgttaattg gcaggagtgg gaggagggag gacaagtgga agtctaggct 3660

ggctgagctg ttctgtctcg aaaagttcct aaaactgtgc tgctttaaaa aaaaaaaaag 3720

taatttatga gacacattct caatttccat taatcatctc ctaaaggggg taaaccagga 3780

agccgctggg tgaaaacagg ctgttggcaa ttcctgagtc atgtgaccca ttctctaaag 3840

actagaatat ttaacttaaa tcagtgagaa actc 3874

<210> 5

<211> 3741

<212> DNA

<213> 人工序列

<400> 5

agtccccgcg gcgggcgctg gtctctccac gcggctgcgg cccggtaccc tccgcccgcc 60

gccgcctctg gtgaccctgg ccctgacctt ctccctcttc ccttcctcct cctcctcctc 120

atgtctgcct cgggctgttt ggtgctgaag agcgtttctt ctccgtctcg tgcaccgcat 180

cctgacgaaa ttgtctggtc accagaaccg agtagcccgt agcgtgtccc ccctggccct 240

gcacggttgc ccctctctgg ggctcggagc cggttcctcc cggggtctca gaactgggag 300

tgcagacgtt ggcgtttctc agactccgga gctgcccggg acaggaatgc agccctaacc 360

ccggcgtcgc ctcggctcgt gcagtttgag cggtgtttca gcgctcacgt ccgaccccag 420

gcagtctttg agcttcgcct cttgccccga gaatgtgtaa tgatcggaga atgcaggtgg 480

aatgaggttc tgcccctgct tgcaggagtt tggtttctgg gaaagcaggc gtgaaaaccc 540

aggcccgggt tgatttgaga aacgcaagtg gggtctggaa ggacctctct tgagagagga 600

ggtcatgctt atgttgagtc ttgaagcatt aaactgaaga aaagatgtcc ctgtacgatg 660

acctaggagt ggagaccagt gactcaaaaa cagaaggctg gtccaaaaac ttcaaacttc 720

tgcagtctca gcttcaggtg aagaaggcag ctctcactca ggcaaagagc caaaggacga 780

aacaaagtac agtcctcgcc ccagtcattg acctgaagcg aggtggctcc tcagatgacc 840

ggcaaattgt ggacactcca ccgcatgtag cagctgggct gaaggatcct gttcccagtg 900

ggttttctgc aggggaagtt ctgattccct tagctgacga atatgaccct atgtttccta 960

atgattatga gaaagtagtg aagcgccaaa gagaggaacg acagagacag cgggagctgg 1020

aaagacaaaa ggaaatagaa gaaagggaaa aaaggcgtaa agacagacat gaagcaagtg 1080

ggtttgcaag gagaccagat ccagattctg atgaagatga agattatgag cgagagagga 1140

ggaaaagaag tatgggcgga gctgccattg ccccacccac ttctctggta gagaaagaca 1200

aagagttacc ccgagatttt ccttatgaag aggactcaag acctcgatca cagtcttcca 1260

aagcagccat tcctccccca gtgtacgagg aacaagacag accgagatct ccaaccggac 1320

ctagcaactc cttcctcgct aacatggggg gcacggtggc gcacaagatc atgcagaagt 1380

acggcttccg ggagggccag ggtctgggga agcatgagca gggcctgagc actgccttgt 1440

cagtggagaa gaccagcaag cgtggcggca agatcatcgt gggcgacgcc acagagaaag 1500

atgcatccaa gaagtcagat tcaaatccgc tgactgaaat acttaagtgt cctactaaag 1560

tggtcttact aaggaacatg gttggtgcgg gagaggtgga tgaagacttg gaagttgaaa 1620

ccaaggaaga atgtgaaaaa tatggcaaag ttggaaaatg tgtgatattt gaaattcctg 1680

gtgcccctga tgatgaagca gtacggatat ttttagaatt tgagagagtt gaatcagcaa 1740

ttaaagcggt tgttgacttg aatgggaggt attttggtgg acgggtggta aaagcatgtt 1800

tctacaattt ggacaaattc agggtcttgg atttggcaga acaagtttga ttttaagaac 1860

tagagcacga gtcatctccg gtgatcctta aatgaactgc aggctgagaa aagaaggaaa 1920

aaggtcacag cctccatggc tgttgcatac caagactctt ggaaggactt ctaagatata 1980

tgttgattga tccctttttt attttgtggt tttttaatat agtataaaaa tccttttaaa 2040

aaaacaacaa tctgtgtgcc tctctggttg tttctctttt ttattattac tcctgagttg 2100

atgacatttt ttgttagatt tcatggtaat tctcaagtgc ttcaatgatg cagcatttct 2160

tgcactaaaa aaaaaaaaaa aaaaaaaact agaaagtttt gggacatggg gttatattaa 2220

attattcttt gtttttcttt ttcttttaat aaagcctgca agttactaaa ttgtagtttc 2280

ataaattctg tagtaaagta tcatcttggc agtgtgccaa aggtgaaaat gatgctttct 2340

ctaacagaga aattcttagt gactccagtc gtagaaaaac gtctttacaa cctgaataag 2400

attgaagaat tgtgaacata ccatggccta ttggatgaat catttgccgt aggctaaatc 2460

agactgtagg gtttgtgatg gatttatgga gtatgtgggt atagaaatca tgaatctagc 2520

atttgttttc agagattcaa gcatagtctt aagggtagat cagaaatgac aaatgaattc 2580

aaaacctagc aggtgcattg taaatgtgtg cccagttatg ttttggaaat ggcagttcct 2640

tggggtcatg tttctactgg caaaatttgc aatagtgttc tattgtatgt aattttaaaa 2700

tttataagat tatccacgtt ggccaagtaa actgtactgc caatagaatt ctggaattgt 2760

gagaaattgt atcattgaag ttcagtagga tgtgtggctt aaaaatttat caggaccaca 2820

aaaaagaaaa caaaaatatt tggtactgag gttcattgcc agggcaggag gtatttccag 2880

aaaatactca tgcctgtgtt ctgttccttg ctttcccaaa tactgcatgt gactttccta 2940

agcggcagct gaaagactcg agcccgtgct gtctcctttg gttattatga catgaaagtg 3000

tatcaagaac tcagcatttc tttgcatcca tggacttggt ttggagacat aaggaatatt 3060

ctgacccttt ttaaaaaagg attttctcat gtttttattt aacataaata aaagaataac 3120

attttatctt ttgtggtatt attttattga ataaaattga gttttatgat aaaagtgcac 3180

ctgttctgta aagtaagttg gggttaagga atgtgaggta aattacataa ttgaacattg 3240

tggaagacag aatcaaaagc agccctggaa cttcagttat ctatggaatt aggcatacca 3300

ttcctcaagt ggaaaccatg tttgtgctta caagtaccgg agtgtgcttg tttaatttta 3360

gaaactaatg gttccaaccc acctttcatg catgcattta ttgttgttat gctttgtaaa 3420

acattgtttg cacctaaatg ggtggctttt cctaacattc tcatggtcag caaccagaga 3480

gttgcaacca actcatacta cttgatttcc gttcgcatga ggacagcttg gtgtgtgcct 3540

ttctccccag tcttttattt ttaaaataac tgtgttaatc agttagtgct ttatttataa 3600

tgaatttctg atagtcgaat aatttctaaa tctcctgcaa gttagtactt gagaaatttg 3660

aaattaattt tcaatattaa catttaagct aatataaaaa ttttaaattt caataaaaat 3720

taaaaattat gtaagctaca a 3741

<210> 6

<211> 3629

<212> DNA

<213> 人工序列

<400> 6

acttttgttt tcctgctccc agcagggtta ggcttgctga ggggcaggca caggagtcct 60

ggctgagctc atggcctgag gctgcctagc ggccacgggg aatgtaagtg ctgtatgtgg 120

ggccacccat aatgggggag cattgaggac acaccttgga ggggcctggg gaggggcagg 180

aggggtggaa tgggctgttt ccctacccac ctgatgcccc gtcccagggt tgcaatggcg 240

gaggcagagg caggggtggc agtggaggtc cgtggactgc cccctgccgt gcccgacgag 300

ctgctcactc tctactttga aaaccgccga cgctctggag ggggacctgt gttgagctgg 360

cagagactgg gctgtggggg cgtcctcacc ttcagagagc ctgcagacgc cgagagggtc 420

ttggcccagg cagatcacga actacatggt gcccagctga gcctgcggcc agctccacca 480

cgagcccctg cacgcctgct gctccaagga ctgccccctg gcaccacgcc ccagcgcttg 540

gagcagcatg tccaggcctt gctgcgggcc tcggggctcc cagtacagcc ttgctgtgcc 600

ttggccagcc cccggccaga ccgggctctg gtccagttgc ccaagcccct ttctgaggca 660

gatgtccgtg tcctggagga gcaggcccag aatctgggcc tggaggggac cttggtgtcc 720

ctggcccggg ttccccaggc ccgagcggtg cgtgtggtgg gggatggtgc ctctgtggac 780

ctgctgttgc tggagttgta cctggagaat gagcgccgca gtggtggggg gcccctggag 840

gacctgcaac gcctacccgg gcccctgggc actgttgcct ccttccagca gtggcaagtg 900

gcagaacgag tgttgcagca ggagcaccgg ttgcagggct cagagctgag ccttgtcccc 960

cactacgaca tcctggagcc cgaggagctg gctgagaaca ccagtggagg ggaccacccg 1020

tccacccagg ggcctagggc taccaagcat gctctcctga ggaccggagg gttggtgacg 1080

gctctgcagg gtgcagggac tgtgacaatg ggctctggcg aggaaccagg gcagtcaggg 1140

gcctctctga ggacaggtcc catggtgcag ggtagaggga ttatgacaac aggctctggc 1200

caggaaccag ggcagtcagg gacctctctg aggacaggtc ccatggggtc tctgggacag 1260

gcagagcaag tcagctcgat gcccatgggg tctctggaac atgaggggct ggtaagcctg 1320

aggcctgtgg ggttgcagga acaggagggg cccatgagcc tggggcctgt ggggtctgca 1380

ggcccagtgg agacctctaa ggggttgctg gggcaggagg gcctggtgga aattgccatg 1440

gactcaccag agcaagaggg gctggtgggt cccatggaga tcaccatggg gtctctggag 1500

aaggcagggc ctgtgagccc aggatgtgtg aagctggcag ggcaggaggg cctggtggag 1560

atggtgctat tgatggagcc aggggcgatg cgcttcctgc agctctacca tgaggacctt 1620

cttgcgggcc tgggagacgt cgctctcttg ccacttgaag gaccggatat gactggcttt 1680

cggctctgtg gagcccaggc ttcctgccag gcggctgagg agtttctgcg gagcctgctg 1740

ggcagcatta gctgccatgt gttgtgcctg gagcacccgg gcagcgccag gtttctcctg 1800

ggcccagaag ggcagcacct tctccagggg ctggaggctc agttccagtg tgtctttggg 1860

acagagcgcc tggccacagc cacgttggac acaggccttg aagaggtgga ccctaccgag 1920

gccctcccag tgctccctgg caacgcccac accctgtgga ccccagacag tacaggtggt 1980

gaccaggagg acgtgagcct ggaggaggtc cgagaactgc tggccaccct ggagggccta 2040

gacctagacg gggaggactg gctgcctcgg gagctggagg aggaagggcc tcaggagcag 2100

ccagaggagg aggtgacccc agggcatgag gaggaggagc ctgtggcccc cagcactgtg 2160

gcacccaggt ggctggagga ggaggccgct ctgcagctgg ccctccaccg gtcactggag 2220

cctcaaggtc aggtggctga gcaggaggag gctgctgccc tgcggcaagc cctaaccctc 2280

tccctgctgg agcagccccc gttggaggca gaagagcccc cagatggggg gactgatggc 2340

aaggcccagc tggtggtgca ctcggccttt gagcaggatg tggaggagct ggaccgggcg 2400

ctcagggctg ccttggaggt ccacgtccag gaggagacgg tggggccctg gcgccgcaca 2460

ctgcctgcag agctgcgtgc tcgcctggag cggtgccatg gtgtgagtgt tgccctgcgt 2520

ggtgactgca ccatcctccg tggcttcggg gcccaccctg cccgtgctgc ccgccacttg 2580

gtggcacttc tggctggccc ctgggatcag agtttggcct ttcccttggc agcttcaggc 2640

cctaccttgg cggggcagac gctgaagggg ccctggaaca acctggagcg tctggcagag 2700

aacaccgggg agttccagga ggtggtgcgg gccttctacg acaccctgga cgctgcccgc 2760

agcagcatcc gcgtcgttcg tgtggagcgc gtgtcgcacc cgctgctgca gcagcagtat 2820

gagctgtacc gggagcgcct gctgcagcga tgcgagcggc gcccggtgga gcaggtgctg 2880

taccacggca cgacggcacc ggcagtgcct gacatctgcg cccacggctt caaccgcagc 2940

ttctgcggcc gcaacgccac ggtctacggg aagggcgtgt atttcgccag gcgcgcctcc 3000

ctgtcggtgc aggaccgcta ctcgcccccc aacgccgatg gccataaggc ggtgttcgtg 3060

gcacgggtgc tgactggcga ctacgggcag ggccgccgcg gtctgcgggc gccccctctg 3120

cggggtcctg gccacgtgct cctgcgctac gacagcgccg tggactgcat ctgccagccc 3180

agcatcttcg tcatcttcca cgacacccag gcgctgccca cccacctcat cacctgcgag 3240

cacgtgcccc gcgcttcccc cgacgacccc tctgggctcc cgggccgctc cccagacact 3300

taaccgaagg ggccaccctc tggcctcctg cttcccaggc tcccagctcc gcacaggctg 3360

atgctccccg cccccaactg tggccgcctg agctgtcccc ggggacgccc ctgcctccct 3420

ctgcgggctc cagaaggcgg tgtgggggat ggcggtcagc agcggccgag gggggccggg 3480

ctaggtccca gcctgggccg accccaccac caggggtcag cagagcccag gaggcgacac 3540

cgcccgcccg ccgctcccag acctcgcccg agtcggctct gttgtttgaa taaacgtgaa 3600

cgtgaaccca ggcggaaggg acccgggaa 3629

<210> 7

<211> 1444

<212> DNA

<213> 人工序列

<400> 7

gagacagctt caggacacgc aggccgcagc gagggcccgg gccctgggga tcccaggcca 60

tggatgctcc ccactccaaa gcagccctgg acagcattaa cgagctgccc gagaacatcc 120

tgctggagct gttcacgcac gtgcccgccc gccagctgct gctgaactgc cgcctggtct 180

gcagcctctg gcgggacctc atcgacctca tgaccctctg gaaacgcaag tgcctgcgag 240

agggcttcat caccaaggac tgggaccagc ccgtggccga ctggaaaatc ttctacttcc 300

tacggagcct gcataggaac ctcctgcgca acccgtgtgc tgaagaggat atgtttgcat 360

ggcaaattga tttcaatggt ggggaccgct ggaaggtgga gagcctccct ggagcccacg 420

ggacagattt tcctgacccc aaagtcaaga agtattttgt cacatcctac gaaatgtgcc 480

tcaagtccca gctggtggac cttgtagccg agggctactg ggaggagcta ctagacacat 540

tccggccgga catcgtggtt aaggactggt ttgctgccag agccgactgt ggctgcacct 600

accaactcaa agtgcagctg gcctcggctg actacttcgt gttggcctcc ttcgagcccc 660

cacctgtgac catccaacag tggaacaatg ccacatggac agaggtctcc tacaccttct 720

cagactaccc ccggggtgtc cgctacatcc tcttccagca tgggggcagg gacacccagt 780

actgggcagg ctggtatggg ccccgagtca ccaacagcag cattgtcgtc agccccaaga 840

tgaccaggaa ccaggcctcc tccgaggctc agcctgggca gaagcatgga caggaggagg 900

ctgcccaatc gccctaccga gctgttgtcc agattttctg acagctgtcc atcctgtgtc 960

tgggtcagcc agaggttcct ccaggcagga gctgagcatg gggtgggcag tgaggtccct 1020

gtaccagcga ctcctgcccc ggttcaaccc taccagcttg tggtaactta ctgtcacata 1080

gctctgacgt tttgttgtaa taaatgtttt caggccgggc actgtggctc acgcctgtaa 1140

tcccagcact ttgggagacc gaggcaggtg gatcacgagg tcaggagata gagaccatcc 1200

tggccaacac ggtgaaaccc tgtctctact aaaaatacaa aaaattagcc gggcgtggtg 1260

gcgggcgcct gtagtcccag ctactcggga ggctgatgca gaagaatggc gtgaacccgg 1320

aaggcagagc ttgcagtgag ccgagatcac gccactgcac tccagcctgg gtgacagagc 1380

gagactctgg ctcataaaat aataataata ataaataaat aaaaaataaa tgttttcagt 1440

aaaa 1444

<210> 8

<211> 4184

<212> DNA

<213> 人工序列

<400> 8

accaagtgag gaaactgggg gacgctgtgg ggaggggcgt ggggctggat cgcgcagcgg 60

ctgcttcctt taccttcctc ccatggtctc cttccggttc tcgatgcttc tctgagccta 120

agggtttccg ccactcgttc accctccccc cagctcatga tcctcctccc tcccccgccc 180

tcctggtcca atctccgatc tgtttagtaa gaaggtgctg ttccgagaag aaggaaaagg 240

gcttgacacg tattcactcg gccccggacg tgggaagcaa gccgtctggc ttcggcctca 300

catcggtctt gtgctcggga cggcggcgtt ggcggactga tccgcggcgg tgaagagagg 360

ccgggaagtt aaacttgtag ccaccacctc cgctcttccc gtcaccctcg cccccacttc 420

gggccgaaag cacggtacag aggctgttgg tggctttgcc acgccacccc acccaccccg 480

gatcgcggct gtcttaaggg acctggattc atcaggggct cttcggggcc tgtgcgagtg 540

ctgatctgct ccgtttttgc aaaaggcgcc tgtgtctggc agagctggtg tgagacgaga 600

caatcctgcc ccgccgccgg gataatcaag agttttggcc ggacctttga gcatacaccg 660

agagagtgag gagccagacg acaagcacac actatggcgc tgaaacggat taataaggaa 720

cttagtgatt tggcccgtga ccctccagca caatgttctg caggtccagt tggggatgat 780

atgtttcatt ggcaagccac aattatggga cctaatgaca gcccatatca aggcggtgta 840

ttctttttga caattcattt tcctacagac taccccttca aaccacctaa ggttgcattt 900

acaacaagaa tttatcatcc aaatattaac agtaatggca gcatttgtct cgatattcta 960

agatcacagt ggtcgcctgc tttaacaatt tctaaagttc ttttatccat ttgttcactg 1020

ctatgtgatc caaacccaga tgacccccta gtgccagaga ttgcacggat ctataaaaca 1080

gacagagata agtacaacag aatatctcgg gaatggactc agaagtatgc catgtgatgc 1140

taccttaaag tcagaataac ctgcattata gctggaataa actttaaatt actgttcctt 1200

ttttgatttt cttatccggc tgctccccta tcagacctca tcttttttaa ttttattttt 1260

tgtttacctc cctccattca ttcacatgct catctgagaa gacttaagtt cttccagctt 1320

tggacaataa ctgcttttag aaactgtaaa gtagttacaa gagaacagtt gcccaagact 1380

cagaattttt aaaaaaaaaa atggagcatg tgtattatgt ggccaatgtc ttcactctaa 1440

cttggttatg agactaaaac cattcctcac tgctctaaca tgctgaagaa atcatctgag 1500

ggggagggag atggatgctc agttgtcaca tcaaaggata cagcattatt ctagcagcat 1560

ccattcttgt ttaagccttc cactgttaga gatttgaggt tacatgatat gctttatgct 1620

cataactgat gtggctggag aattggtatt gaatttatag catcagcaga acagaaaatg 1680

tgatgtattt tatgcatgtc aataaaggaa tgacctgttc ttgttctaca gagaatggaa 1740

attggaagtc aaacaccctt tgtattccaa aatagggtct caaacatttt gtaattttca 1800

tttaaattgt taggaggctt ggagctatta gttaatctat cttccaatac actgtttaat 1860

atagcactga ataaatgatg caagttgtca atggatgagt gatcaactaa tagctctgct 1920

agtaattgat ttatttttct tcaataaagt tgcataaacc aatgagttag ctgcctggat 1980

taatcagtat gggaaacaat cttttgtaaa tgcaaagctg ttttttgtat atactgttgg 2040

gatttgcttc attgtttgac atcaaatgat gatgtaaagt tcgaaagagt gaatattttg 2100

ccatgttcag ttaaagtgca cagtctgtta caggttgaca cattgcttga cctgatttat 2160

gcagaattaa taagctattt ggatagtgta gctttaatgt gctgcacatg atactggcag 2220

ccctagagtt catagatgga cttttgggac ccagcagttt tgaaatgtgt ttatggagtt 2280

taagaaattt attttccagg tgcagcccct gtctaactga aatttctctt caccttgtac 2340

acttgacagc tgaaaaaaaa caacatggga gtaataatgg gtcaaaattt gcaaaataaa 2400

gtactgtttt ggtgtgggag ttgtcatgag gctgtgttga agtgacttat ctatgtggga 2460

tattgagtat ccattgaaat ggatttgttc agccatttac attaatgagc atttaaatgc 2520

aacagatatc atttcaggtg acttaacatg aatgaataaa agtcaatgct attggattgt 2580

tttttgtttg acaagtgcta tctgtgccac tgatttaact tctgtagtaa caagggcatt 2640

accattcttc acctttccta attctgatcc catagtttta catttttcct gtttattttg 2700

attttgttca ctgctttatt tcttaaagtt ctagcacatc tgtgactcct ccacttccac 2760

atttttgcac tgcttacact tacgtgcaat cttattcctt gtctgcacac acatgtggaa 2820

agctagaaat aaatgttaaa acttactttt tataaacatt ttaatatgta gtttggacat 2880

gatttattga cttaaggttc ttctctaaac tggaagtgaa atgcatgcct tctgaagatg 2940

ttctggcttt gttaattctg taatcatttc attggggaaa aaaccagcta cgcagttttt 3000

ccaatgagtg aattttttca ttttgtgttt tgcttaaaac ggctccttca gggtagatgt 3060

catactgcat aacttttttg gattcaaatt atgaatgaga aattagttaa cattctgctc 3120

cacaaggtaa gaaaaactgc tctttggctc tattttcaaa attacttctg agatgcatat 3180

agtctcaaaa taacagcttt agtaggcata tcacttcttg aaagccaaac atgagtgtaa 3240

gacactttta tgaaacacgg tggatcccta actggctttc aaattgacct ttatagcctt 3300

agacaaccct taggtattta cggagatgac ttctttgatt gtcataacaa ttagtggatg 3360

tgtccagttc tctgtatctt tgacttgatg ctttatacat catttcattt gttgcttcta 3420

agggaataag ccatagaggc ttctccaggt ttaaaagaac agtaaagtac ctggaaaacc 3480

aacatttttg aatgtatgga cactggacat gagatatgta caatgaaatc ttaaaagaat 3540

ctaagaattt gccctctttg ccccactcca cccagtaatt tgacattact agtgccatgt 3600

ataggaccca actgagtatt agaatcagtt ttgactatgt ctttgtattt cctaaatctt 3660

ttaatgcata aaccgaatta gggtccagtt ggcctgttaa tggtaaattt acattttaaa 3720

tgactcagtt tgtttttcct gggcgagttt gcaatgtgat aatcagattt tttaaaactg 3780

attaatttgc tttcttgtgt gggtgtactc acattttaaa gtatgaacca cagttaacta 3840

gtggtctcag gggtagtgaa acactcactt ttttttttgt ttgttttttt ttgtttgttg 3900

aaatggctta gttgaagtat acttaaggta ctgatcatgc tgtgttagta atttgggcgg 3960

ggaggggggt aactcagcca tgttttgtgt tggcataaca aaactgttaa tgattgttga 4020

ttacactttt aagtgaattt gtcttttatg aggaacccag tgcaagtcac taaatattgt 4080

ctaatagtga catctgcata agacttgtaa tagctgaagt taattgagct taaaggaatt 4140

gttaccatta aagtctgtgt ttaaagacaa aaaaaaaaaa aaaa 4184

<210> 9

<211> 1600

<212> DNA

<213> 人工序列

<400> 9

attgttcccg tggggcagtc gaggatgtcg gtgaattacg cggcggggct gtcgccgtac 60

gcggacaagg gcaagtgcgg cctcccggag atcttcgacc ccccggagga gctggagcgg 120

aaggtgtggg aactggcgag gctggtctgg cagtcttcca gtgtggtgtt ccacacgggt 180

gccggcatca gcactgcctc tggcatcccc gacttcaggg gtccccacgg agtctggacc 240

atggaggagc gaggtctggc ccccaagttc gacaccacct ttgagagcgc gcggcccacg 300

cagacccaca tggcgctggt gcagctggag cgcgtgggcc tcctccgctt cctggtcagc 360

cagaacgtgg acgggctcca tgtgcgctca ggcttcccca gggacaaact ggcagagctc 420

cacgggaaca tgtttgtgga agaatgtgcc aagtgtaaga cgcagtacgt ccgagacaca 480

gtcgtgggca ccatgggcct gaaggccacg ggccggctct gcaccgtggc taaggcaagg 540

gggctgcgag cctgcagggg agagctgagg gacaccatcc tagactggga ggactccctg 600

cccgaccggg acctggcact cgccgatgag gccagcagga acgccgacct gtccatcacg 660

ctgggtacat cgctgcagat ccggcccagc gggaacctgc cgctggctac caagcgccgg 720

ggaggccgcc tggtcatcgt caacctgcag cccaccaagc acgaccgcca tgctgacctc 780

cgcatccatg gctacgttga cgaggtcatg acccggctca tgaagcacct ggggctggag 840

atccccgcct gggacggccc ccgtgtgctg gagagggcgc tgccacccct gccccgcccg 900

cccaccccca agctggagcc caaggaggaa tctcccaccc ggatcaacgg ctctatcccc 960

gccggcccca agcaggagcc ctgcgcccag cacaacggct cagagcccgc cagccccaaa 1020

cgggagcggc ccaccagccc tgccccccac agacccccca aaagggtgaa ggccaaggcg 1080

gtccccagct gaccagggtg cttggggagg gtggggcttt ttgtagaaac tgtggattct 1140

ttttctctcg tggtctcact ttgttacttg tttctgtccc cgggagcctc agggctctga 1200

gagctgtgct ccaggccagg ggttacacct gccctccgtg gtccctccct gggctccagg 1260

ggcctctggt gcggttccgg gaagaagcca caccccagag gtgacaggtg agcccctgcc 1320

acaccccagc ctctgacttg ctgtgttgtc cagaggtgag gctgggccct ccctggtctc 1380

cagcttaaac aggagtgaac tccctctgtc cccagggcct cccttctggg ccccctacag 1440

cccaccctac ccctcctcca tgggccctgc aggaggggag acccaccttg aagtggggga 1500

tcagtagagg cttgcactgc ctttggggct ggagggagac gtgggtccac caggcttctg 1560

gaaaagtcct caatgcaata aaaacaattt ctttcttgca 1600

<210> 10

<211> 3291

<212> DNA

<213> 人工序列

<400> 10

cttcgcgcac ctcatggaat cccttctgca gcacctggat cgcttttccg agcttctggc 60

ggtctcaagc actacctacg tcagcacctg ggaccccgcc accgtgcgcc gggccttgca 120

gtgggcgcgc tacctgcgcc acatccatcg gcgctttggt cggcatggcc ccattcgcac 180

ggctctggag cggcggctgc acaaccagtg gaggcaagag ggcggctttg ggcggggtcc 240

agttccggga ttagcgaact tccaggccct cggtcactgt gacgtcctgc tctctctgcg 300

cctgctggag aaccgggccc tcggggatgc agctcgttac cacctggtgc agcaactctt 360

tcccggcccg ggcgtccggg acgccgatga ggagacactc caagagagcc tggcccgcct 420

tgcccgccgg cggtctgcgg tgcacatgct gcgcttcaat ggctatagag agaacccaaa 480

tctccaggag gactctctga tgaagaccca ggcggagctg ctgctggagc gtctgcagga 540

ggtggggaag gccgaagcgg agcgtcccgc caggtttctc agcagcctgt gggagcgctt 600

gcctcagaac aacttcctga aggtgatagc ggtggcgctg ttgcagccgc ctttgtctcg 660

tcggccccaa gaagagttgg aacccggcat ccacaaatca cctggagagg ggagccaagt 720

gctagtccac tggcttctgg ggaattcgga agtctttgct gccttttgtc gcgccctccc 780

agccgggctt ttgactttag tgactagccg ccacccagcg ctgtctcctg tctatctggg 840

tctgctaaca gactggggtc aacgtttgca ctatgacctt cagaaaggca tttgggttgg 900

aactgagtcc caagatgtgc cctgggagga gttgcacaat aggtttcaaa gcctctgtca 960

ggcccctcca cctctgaaag ataaagttct aactgccctg gagacctgta aagcgcagga 1020

tggagatttt gaagtacctg gtcttagcat ctggacagac ctcttattag ctcttcgtag 1080

tggtgcattt aggaaaagac aagttttggg tctcagcgca ggcctcagtt ctgtataggc 1140

aatgctgtgt tattacttga atatagaata tatagtttac aaaatgaaaa ttacaatgtt 1200

ctcaccaaat atatgccttc gtgtgtccaa agtataatta ttttagatgc taattttgaa 1260

tagtttatta aacagttata aatatgcaaa gtagctggca tgtagtgtca cggattttct 1320

ggatagagga agtgattgga agtactccac ttaaagccat ggaattagca atagtttgct 1380

ttttaataga aggcccattt gtaagaatgt tgaaaatatg tgtaccgttt aaagaaaaag 1440

cagctttaaa gtgacaaaca aaataccctt tttcttttag tatggtttat ttttctaggt 1500

tttctgtccc tccctcagta gtgaagagtt ttctttattc ctggcagtgt caggaatatt 1560

ggtttgaaaa gctgttggcc tatctggagt ttggccttgt taacctagta ttctaaccag 1620

ttaaccagcc ttagtatgca ttaaaattgt attgttcaga aagtttgttt ctcattttct 1680

gcaaattctt actttgaaaa tgaatcacca catagtatgt ccctttaaag cattgacgca 1740

cagacaaatg tttaaagcac agtaaatacg aatatatgcc tttggatatt aaattaatgc 1800

ttgatgataa aagaatcaaa cttttttttt tttgagatgg agtctcgctc tgtcacccag 1860

actggagtgc agtggtgtga tcactgctca gtgcaacctc tgcctcccag gatcaagcaa 1920

ttctgactca gcctcccaag tagctgggat tacaggcgca ggccaccatg cccggctaat 1980

tttttgtatt tttagtagag acggggtttc accatgctgg ccaggctggt ctcaaacacc 2040

tgaccttgtg atccgtccgc cttggcctcc caaagtgctg ggattacagg cgtgagccac 2100

cgcgcctggc caaaacaaca ttttaagtag aagatccagg ttttagtgca gcttctgccg 2160

ttaactaggt taataaatca caaccttggg gccacagttg ccttatatgt aaatgaagtg 2220

tttagaataa aatagttaaa tttccttatt tttcccttgg tggctgccct gtggaaacag 2280

tttagaatat ttgttttgtg tgtaggaacc tagttgtgtt agtttacctg ggtgttccac 2340

agctgatagt gattgccttg aataaattca agggcaattt attcattttt actagggaga 2400

tagaccttta cagcaatcaa gatatttttg tccatatcca ggttagctgg taagaggatt 2460

tttttggaga aaaaaatgat atttagaaag ttaatttcta attccggaat ggaataaaaa 2520

caatatgagt agtgtaatct tgtagaaaaa gagttgtata atcttgtaga atttctcatt 2580

ctgtggtaca acccaggggt aaactattat tccagtagtc agtacacttt tctagataaa 2640

tcttgagtga aaaccagcaa tttctttttc cttgtggtct gattcctttt tctaatccat 2700

gaaggccatc ttgtagatta catttatcat taatgcaaga ataaagacaa ttcctcctgt 2760

cagttgcgtg aatttttttt aagaaacaac ccagtgaaga gttctaccat agcaaggcct 2820

aatgttagct ttagctttag aaaataacag tttgtgaact tacttcccta tatttgcagc 2880

tgtatctcac actatgattt acaataaaat tgtaaagatt gacaatagac ttaagaaata 2940

acattttaaa atctatttta tacttaccat ttattattct gttattttag tctccatatg 3000

ttcattacat acataatctt atttaatctt cacaccaaaa ctgtattctt atgaatatac 3060

gctaaaagat taagtaaaat gcccaagggt ataaacaaaa gcaacatgaa agtggaagcc 3120

gtatctgtca tttattttat ttccagaagc ctagcacagt gtccagcata tggtagatac 3180

ttgtagtgtt tgaataaatg aaaccagcat tagagcttta tatactttct cttaaggact 3240

tgaaaagatt aggaatctac gcatacactg agagagaaaa aagtgagagg a 3291

<210> 11

<211> 2086

<212> DNA

<213> 人工序列

<400> 11

ggacccggag gtcgcggaga gctgggcagt gttggccgct ggcggagcgc tggggcagca 60

tgaagtgcct ggtcacgggc ggcaacgtga aggtgctcgg caaggccgtc cactccctgt 120

cccgcatcgg ggacgagctc tacctggaac ccttggagga cgggctctcc ctccggacgg 180

tgaactcctc ccgctctgcc tatgcctgct ttctctttgc cccgctcttc ttccagcaat 240

accaggcagc cacccctggt caggacctgc tgcgctgtaa gatcctgatg aagtctttcc 300

tgtctgtctt ccgctcactg gcgatgctgg agaagacggt ggaaaaatgc tgcatctccc 360

tgaatggccg gagcagccgc ctggtggtcc agctgcattg caagttcggg gtgcggaaga 420

ctcacaacct gtccttccag gactgtgagt ccctgcaggc cgtcttcgac ccagcctcgt 480

gcccccacat gctccgcgcc ccagcacggg ttctggggga ggctgttctg cccttctctc 540

ctgcactggc tgaagtgacg ctgggcattg gccgtggccg cagggtcatc ctgcgcagct 600

accacgagga ggaggcagac agcactgcca aagccatggt gactgagatg tgccttggag 660

aggaggattt ccagcagctg caggcccagg aaggggtggc catcactttc tgcctcaagg 720

aattccgggg gctcctgagc tttgcagagt cagcaaactt gaatcttagc attcattttg 780

atgctccagg caggcccgcc atcttcacca tcaaggactc tttgctggac ggccactttg 840

tcttggccac actctcagac accgactcgc actcccagga cctgggctcc ccagagcgtc 900

accagccagt gcctcagctc caggctcaca gcacacccca cccggacgac tttgccaatg 960

acgacattga ctcttacatg atcgccatgg aaaccactat aggcaatgag ggctcgcggg 1020

tgctgccctc catttccctt tcacctggcc cccagccccc caagagcccc ggtccccact 1080

ccgaggagga agatgaggct gagcccagta cagtgcctgg gactccccca cccaagaagt 1140

tccgctcact gttcttcggc tccatcctgg cccctgtacg ctccccccag ggccccagcc 1200

ctgtgctggc ggaagacagt gagggtgaag gctgaaccaa gaacctgaag cctgtaccca 1260

gaggccttgg actagacgaa gccccagcca gtggcagaac tgggtctctc agccctgggg 1320

atcagaaagg tgggcttgct ggagctgagc tgtttcactg cctctcgcag gccccagctg 1380

gctgtcactg taaagctgtc ccacagcggt cgggcctggg ccgttatctc cccacaaccc 1440

ccagccaatc aggactttcc agacttggcc ctgaactact gacgttccta cctcttattt 1500

ctcattgagc ctcaggctat actccagctg gccaaggctg gaaacctgtc tccctcaggc 1560

tcaccttcct aaggaaaatg tcatagtagg tgctgctggc ccctggtgat ccagcttctc 1620

tgccaatcat gacctgttcc ttcctgaagt cctgggcatg catctgggac ccccgtggag 1680

ctgacaagtt ttccttgctt tcctgatact ctttggcgct gacttggaat tctaagagcc 1740

ttggacccga gtgtgtggct agggttgccc tggctggggc ccggtgccga gactcccaag 1800

cggctctgtg cagaagagct gccaggcagt gtcttagatg tgagacggag gccatggcga 1860

gaatccagct ttgaccttta ttcaagagac cagatgggtt gccccaggat ccggctgcca 1920

gccctgaggc caagcacggc tggagaccca cgacctggcc tgccgttgcc ctgagctgca 1980

gcctcggccc caggatcctg ctcacagtca ccgcaggtgc aggcaggaag cagccctggg 2040

ggactggacg ctgctattga ttcattaaaa aaagaaaaga aaaata 2086

<210> 12

<211> 4931

<212> DNA

<213> 人工序列

<400> 12

gagccaccgc ggagcgcgcg cggggttggt tgccgcgagc gtgggggagc gtggaccgcg 60

gcgctgctca gcggtggggc tgccttcccc cggccctcct ccctggtccc tggcgagggc 120

actggcggcg gcggggccgg ggtccgcaag gccggagaag gccgccgggc ccgggcatgg 180

tggtctgggg caacgcggaa gaagctccac catgaggcga ggtggatgga ggaagcgagc 240

tgaaaatgat ggctgggaaa catggggtgg gtatatggct gccaaggtcc agaaattgga 300

ggaacagttt cgatcagatg ctgctatgca gaaggatggg acttcatcta caatttttag 360

tggagttgcc atctatgtta atggatacac agatccttcc gctgaggaat tgagaaaact 420

aatgatgttg catggaggtc aataccatgt atattattcc agatctaaaa caacacatat 480

tattgccaca aatcttccca atgccaaaat taaagaatta aagggggaaa aagtaattcg 540

accagaatgg attgtggaaa gcatcaaagc tggacgactc ctctcctaca ttccatatca 600

gctgtacacc aagcagtcca gtgtgcagaa aggtctcagc tttaatcctg tatgcagacc 660

tgaggatcct ctgccaggtc caagcaatat agccaaacag ctcaacaaca gggtaaatca 720

catcgttaag aagattgaaa cggaaaatga agtcaaagtc aatggcatga acagttggaa 780

tgaagaagat gaaaataatg attttagttt tgtggatctg gagcagacct ctccgggaag 840

gaaacagaat ggaattccgc atcccagagg gagcactgcc atttttaatg gacacactcc 900

tagctctaat ggtgccttaa agacacagga ttgcttggtg cccatggtca acagtgttgc 960

cagcaggctt tctccagcct tttcccagga ggaggataag gctgagaaga gcagcactga 1020

tttcagagac tgcactctgc agcagttgca gcaaagcacc agaaacacag atgctttgcg 1080

gaatccacac agaactaatt ctttctcatt atcacctttg cacagtaaca ctaaaatcaa 1140

tggtgctcac cactccactg ttcaggggcc ttcaagcaca aaaagcactt cttcagtatc 1200

tacgtttagc aaggcagcac cttcagtgcc atccaaacct tcagactgca attttatttc 1260

aaacttctat tctcattcaa gactgcatca catatcaatg tggaagtgtg aattgactga 1320

gtttgtcaat accctacaaa gacaaagtaa tggtatcttt ccaggaaggg aaaagttaaa 1380

aaaaatgaaa acaggcaggt ctgcacttgt tgtaactgac acaggagata tgtcagtatt 1440

gaattctccc agacatcaga gctgtataat gcatgttgat atggattgct tctttgtatc 1500

agtgggtata cgaaatagac cagatctcaa aggaaaacca gtggctgtta caagtaacag 1560

aggcacagga agggcacctt tacgtcctgg cgctaacccc cagctggagt ggcagtatta 1620

ccagaataaa atcctgaaag gcaaagcaga cttgggtcct ggcctctgat ttctccaacc 1680

gttcctccac attctccatg tgcccgtcta gtttgtcaag ttttgatgag cagttctcta 1740

ctttgccctc cagtgaggac agtgtgtccc tgcatttccc tgaatctcac atgaagcaac 1800

tcactccgct cgtggaggga cccacgcact ctgctgcact gtggaacagc agatatacca 1860

gattcatcat tgtgggagaa tccagattct gcgcaagcaa atggaattga ttctgttttg 1920

tcaagggctg aaattgcatc ttgtagttat gaggccaggc aacttggcat taagaacgga 1980

atgttttttg ggcatgctaa acaactatgt cctaatcttc aagctgttcc atacgatttt 2040

catgcatata aggaagtcgc acaaacattg tatgaaacat tggcaagcta cactcataac 2100

attgaagctg tcagttgtga tgaagcgctg gtagacatta ccgaaatcct tgcagagacc 2160

aaacttactc ctgatgaatt tgcaaatgct gttcgtatgg aaatcaaaga ccagacgaaa 2220

tgtgctgcct ctgttggaat tggttctaat attctcctgg ctagaatggc aactagaaaa 2280

gcaaaaccag atgggcagta ccacctaaaa ccagaagaag tagatgattt tatcagaggc 2340

cagctagtga ccaatctacc aggagttgga cattcaatgg aatctaagtt ggcatctttg 2400

ggaattaaaa cttgtggaga cttgcagtat atgaccatgg caaaactcca aaaagaattt 2460

ggtcccaaaa caggtcagat gctttatagg ttctgccgtg gcttggatga tagaccagtt 2520

cgaactgaaa aggaaagaaa atctgtttca gctgagatca actatggaat aaggtttact 2580

cagccaaaag aggcagaagc ttttcttctg agtctttcag aagaaattca aagaagacta 2640

gaagccactg gcatgaaggg taaacgtcta actctcaaaa tcatggtacg aaagcctggg 2700

gctcctgtag aaactgcaaa atttggaggc catggaattt gtgataacat tgccaggact 2760

gtaactcttg accaggcaac agataatgca aaaataattg gaaaggcgat gctaaacatg 2820

tttcatacaa tgaaactaaa tatatcagat atgagagggg ttgggattca cgtgaatcag 2880

ttggttccaa ctaatctgaa cccttccaca tgtcccagtc gcccatcagt tcagtcaagc 2940

cactttccta gtgggtcata ctctgtccgt gatgtcttcc aagttcagaa agctaagaaa 3000

tccaccgaag aggagcacaa agaagtattt cgggctgctg tggatctgga aatatcatct 3060

gcttctagaa cttgcacttt cttgccacct tttcctgcac atctgccgac cagtcctgat 3120

actaacaagg ctgagtcttc agggaaatgg aatggtctac atactcctgt cagtgtgcag 3180

tcgagactta acctgagtat agaggtcccg tcaccttccc agctggatca gtctgtttta 3240

gaagcacttc cacctgatct ccgggaacaa gtagagcaag tctgtgctgt ccagcaagca 3300

gagtcacatg gcgacaaaaa gaaagaacca gtaaatggct gtaatacagg aattttgcca 3360

caaccagttg ggacagtctt gttgcaaata ccagaacctc aagaatcgaa cagtgacgca 3420

ggaataaatt taatagccct tccagcattt tcacaggtgg accctgaggt atttgctgcc 3480

cttcctgctg aacttcagag ggagctgaaa gcagcgtatg atcaaagaca aaggcagggc 3540

gagaacagca ctcaccagca gtcagccagc gcatctgtgc caaagaatcc tttacttcat 3600

ctaaaggcag cagtgaaaga aaagaaaaga aacaagaaga aaaaaaccat tggttcacca 3660

aaaaggattc agagtccttt gaataacaag ctgcttaaca gtcctgcaaa aactctgcca 3720

ggggcctgtg gcagtcccca gaagttaatt gatgggtttc taaaacatga aggacctcct 3780

gcagagaaac ccctggaaga actctctgct tctacttcag gtgtgccagg cctttctagt 3840

ttgcagtctg acccagctgg ctgtgtgaga cctccagcac ccaatctagc tggagctgtt 3900

gaattcaatg atgtgaagac cttgctcaga gaatggataa ctacaatttc agatccaatg 3960

gaagaagaca ttctccaagt tgtgaaatac tgtactgatc taatagaaga aaaagatttg 4020

gaaaaactgg atctagttat aaaatacatg aaaaggctga tgcagcaatc ggtggaatcg 4080

gtttggaata tggcatttga ctttattctt gacaatgtcc aggtggtttt acaacaaact 4140

tatggaagca cattaaaagt tacataaata ttaccagaga gcctgatgct ctctgatagc 4200

tgtgccataa gtgcttgtga ggtatttgca aagtgcatga tagtaatgct cggagttttt 4260

ataattttaa atttctttta aagcaagtgt tttgtacatt tcttttcaaa aagtgccaaa 4320

tttgtcagta ttgcatgtaa ataattgtgt taattatttt actgtagcat agattctatt 4380

tacaaaatgt ttgtttataa agttttatgg atttttacag tgaagtgttt acagttgttt 4440

aataaagaac tgtatgtata ttttgtacag gctccttttt gtgaatcctt aaaaactcaa 4500

ctctaggaag caactactgt ttattatact aaaaggctga aaaacctcca ggccagactg 4560

ctaagctctg aaattcctga gaggtctcag accgggattc tacttgttcc aagaaagggt 4620

aaagcttcta aaccatctta ttcttgtctc caagcatgaa cacaggagca tgttaagaaa 4680

atctttacta cttcttccat gcggagaaat ctacatattt tgaattagaa acaccctcac 4740

acccacttga agattttttt cctgggaaca ttatgtcccg tagatcagag gtggtgttgt 4800

ctttttgctt ctactggcca ttgagaaact ttgatgataa aaaagaacgg tatagatttt 4860

tcaaacgtat ataaaatatt tttatgttat atgttatgcc ataactttaa aataaaaata 4920

gtttaaaatt c 4931

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号