文摘
英文文摘
声明
第一章绪论
1.1生物信息学及其主要内容
1.2原核生物基因组和原核生物基因识别
1.3与本论文相关的生物学知识
1.4本论文的主要工作
第二章蜡状芽孢杆菌ATCC 10987基因组蛋白质编码基因的重新注释与分析
2.1引言
2.2材料与方法
2.2.1原始数据分析
2.2.2生物信息学方法
2.3结果与讨论
2.4结论
2.5补充材料
第三章蛋白质编码基因注释文件的解读
3.1引言
3.2方法与结果
3.2.1注释基因分布特征统计
3.2.2注释基因异常状况统计
第四章原核生物基因识别程序Zcurve 2.0的研发
4.1引言
4.2 DNA序列的Z曲线理论
4.3支持向量机方法
4.3.1算法简介
4.3.2 SVM在生物信息学中的应用
4.4程序组成
4.4.1寻找种子ORFs和候选ORFs
4.4.2核心算法
4.4.3排除重叠ORFs的策略
第五章Zcurve 2.0基因识别能力的评价及讨论
5.1评价方法
5.2 Zcurve 2.0与Zcurve 1.02、Glimmer 3.02的比较
5.2.1对比之一:300 bp以上的注释基因
5.2.2对比之二:300 bp以上的功能已知基因或保守基因
5.2.3其它说明
第六章Z曲线数据库与必需基因数据库的更新
6.1 Z曲线数据库的更新
6.2必需基因数据库的更新
参考文献
发表论文和参加科研情况说明
附 录
致 谢