首页> 中文学位 >DNA序列3D图形表示及进化树算法研究
【6h】

DNA序列3D图形表示及进化树算法研究

代理获取

摘要

随着人类基因组计划的开展,以及各种生物基因序列的研究,产生了越来越多的分子序列数据。对这些序列数据进行科学的分析、处理推动了生物信息学的发展。随着基因序列的增长,基因序列的图形表达方法已成为研究基因序列的重要手段,如何给出有效的基因序列图形表达方式并在此基础上对基因的分类以及基因进化关系进行分析是生物信息学中一个热门课题。 本文将在DNA序列图形表示方法、生物序列的相似性分析及进化树构建算法方面进行研究。 本文首先对几种典型的DNA序列的三维图形表示方法进行讨论,在此基础上提出一种新的DNA序列的3D曲线表示法——N曲线,可以将DNA序列的字符编码转换成空间曲线。对于任意的DNA序列有唯一的N曲线与之对应,并证明了N曲线中不存在环和退化现象以及N曲线符合DNA序列的对称性,同时给出了N曲线所包含的生物特征。 在基于图形的序列相似性分析中,常用矩阵的不变量λ度量序列的特征,而λ的计算随着矩阵维数(序列长度)的增加而变得十分复杂,文中提出了一个新的序列特征参数Z_inv,通过11种常见物种的第一外显子的β基因序列的实验表明,Z_inv计算简单且非常接近于特征值λ,它与λ之间的误差最小为0.0008。 本文最后研究了经典进化树构建算法及PHYLIP进化树软件。基于N曲线,提出一种基于可凝聚层次聚类的进化树构建算法,并应用于禽流感病毒基因序列的进化树构建,实验结果表明该算法的有效性。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号