首页> 中文学位 >基于图能量的蛋白质2D图形表示及其应用
【6h】

基于图能量的蛋白质2D图形表示及其应用

代理获取

目录

声明

摘要

第一章 绪论

1.1 课题的研究背景及意义

1.2 生物序列的图形表示

1.2.1 序列比对

1.2.2 生物序列的图形表示

1.3 生物序列的相似性分析

1.3.1 生物序列的相似性分析

1.3.2 系统发育分析

1.4 文章的结构安排

1.4.1 论文的主要工作和研究内容

1.4.2 论文的组织结构

2.1.1 蛋白质与氨基酸

2.1.2 氨基酸常见的物理化学性质

2.2 20种氨基酸的图形表示

2.2.1 20种氨基酸的理化性质

2.2.2 20种氨基酸的图形表示

2.3 20种氨基酸的图能量

2.3.1 图能量的定义

2.3.2 20种氨基酸的图能量

2.4 本章小结

第三章 基于图能量的蛋白质序列2D图形表示

3.1 引言

3.2 蛋白质序列的图形表示

3.3 本章小结

4.1 引言

4.1.1 蛋白质数值特征的提取方法

4.1.2 多维向量距离的计算方法

4.1.3 常用的序列比对工具

4.2 蛋白质序列数值特征的提取

4.2.1 数值特征的提取

4.2.2 向量维数的确定

4.3 蛋白质序列的相似性分析

4.3.1 ND5数据集中蛋白质序列的相似性分析

4.3.2 24条转铁蛋白质序列的相似性分析

4.3.3 36条蛋白质序列的相似性分析

4.4 本章小结

5.1 总结

5.2 展望

参考文献

致谢

攻读学位期间发表的学术论文

附录

展开▼

摘要

人类基因组计划的顺利实行与测序技术的急速发展,造成了生物序列数量的急剧增多。面对数以万计的数据,如何发现潜藏在生物数据中的生物信息,分析这些生物序列间的关系,是分子生物学研究中的重要任务。
  作为构成生命体的物质基础,蛋白质在各种生命活动中发挥着非常重要的作用。在生物信息学的研究领域中,对蛋白质序列进行图形表示和相似性分析,是研究的热点也是难点。
  本文依据氨基酸的物理化学性质,构建20种氨基酸对应的图形表示。引入图能量的相关理论知识,计算20种氨基酸对应的图能量。进一步构建一种简单新颖的蛋白质序列的图形表示,并从中提取蛋白质序列的数值特征,对蛋白质序列进行相似性分析。论文的主要研究内容如下:
  (1)本文根据氨基酸的理化性质,提出了一种新颖的氨基酸2D图形表示方法。对于选取的6种理化性质,根据20种氨基酸在不同理化性质下的实验数据以及本文设定的阈值计算公式,构建20种氨基酸对应的图形表示,根据图能量的相关知识,计算20种氨基酸对应的图能量。
  (2)根据求得的20种氨基酸的图能量以及氨基酸在蛋白质序列中的位置信息,给出蛋白质序列的2D图形表示。应用该方法对ND5数据集中的蛋白质序列进行图形表示,结果证明本文提出的图形表示方法是简单有效的,且具有良好的可视效果。
  (3)根据本文构建的蛋白质序列的图形表示,进行蛋白质序列的相似性分析。利用转换公式将蛋白质序列转换为多维向量,根据相关理论和实验确定向量的维数。应用欧氏距离计算蛋白质序列两两间的距离并构造距离矩阵,应用距离矩阵构建系统发生树对结果进行检验。
  (4)为了验证本文提出方法的合理有效性,将该方法应用到ND5、24TFs和36PDs三个数据集中,实验结果与现有的算法一致甚至更加合理。
  实验证明,本文提出的根据氨基酸理化性质构建氨基酸2D图形表示的方法是合理的,并且具有一定的生物学意义。计算所得的20种氨基酸的图能量也可以很好地表征对应氨基酸。本文提出的蛋白质序列的图形表示方法是简单有效的,将该方法应用到蛋白质序列的相似性分析中,取得了比较理想的实验结果。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号