首页> 中文学位 >基于支持向量机和蛋白质全序列的蛋白质-蛋白质相互作用预测
【6h】

基于支持向量机和蛋白质全序列的蛋白质-蛋白质相互作用预测

代理获取

目录

文摘

英文文摘

第一章 引言

1.1 生物信息学简介

1.1.1 生物信息学的定义

1.1.2 生物信息学的主要研究内容

1.1.3 生物信息学的研究意义

1.2 蛋白质相关知识

1.2.1 20种氨基酸简介

1.2.2 蛋白质的结构

1.2.3 蛋白质的功能

1.3 蛋白质-蛋白质相互作用研究意义及现状

1.3.1 蛋白质-蛋白质相互作用研究意义

1.3.2 蛋白质-蛋白质相互作用研究现状

1.4 本论文的主要研究内容与创新点

1.4.1 论文的主要研究内容

1.4.2 论文的主要创新点

第二章 蛋白质间相互作用研究相关方法与数据库介绍

2.1 蛋白质-蛋白质相互作用的研究方法

2.1.1 研究蛋白质-蛋白质相互作用的实验方法

2.1.2 蛋白质-蛋白质相互作用研究的生物信息学计算方法

2.2 蛋白质相互作用数据库简介

2.2.1 DIP数据库

2.2.2 BIND数据库

2.2.3 MIPS数据库

第三章 支持向量机及相关软件介绍

3.1 支持向量机简介

3.1.1 支持向量机产生与发展

3.1.2 支持向量机原理

3.2 MATLAB软件介绍

3.2.1 MATLAB概述

3.2.2 MATLAB语言的优势及特点

3.3 LIBSVM软件介绍

3.4 EmEditor编辑器介绍

第四章 实验数据来源构建处理及预测结果评价方法

4.1 数据来源

4.1.1 正数据集的构建

4.1.2 负数据集的构建

4.1.3 独立预测数据集的构建

4.2 训练集和预测集的选取

4.3 蛋白质序列数据的表达

4.4 预测结果的评价方法

第五章 应用支持向量机方法预测蛋白质-蛋白质相互作用

5.1 氨基酸五位编码方法预测蛋白质间相互作用

5.1.1 氨基酸五位编码方式

5.1.2 SVM最适参数的选择

5.1.3 实验方法

5.1.4 预测结果和讨论

5.2 氨基酸7个理化参数编码方法预测蛋白质-蛋白质相互作用

5.2.1 氨基酸7个理化参数编码方式

5.2.2 SVM最优参数选择

5.2.3 实验方法

5.2.4 预测结果和讨论

5.3 小结

第六章 结论与展望

参考文献

附录 附录A 数据集1-let和Psnb的氨基酸五位编码方法的重复5次预测结果:

个人简历 在学期间发表的学术论文与研究成果

致谢

展开▼

摘要

随着人类基因组计划的完成,生命科学研究已经进入到后基因组时代,蛋白质组学是后基因组时代的一个重要研究内容。蛋白质是生命活动的主要承担者,蛋白质的在生物体内功能大部分与蛋白质间的相互作用有关联。蛋白质-蛋白质相互作用研究则成为蛋白质组学中的一个研究热点。用传统的实验方法来鉴定蛋白质相互作用不仅费时费力、代价高,而且有很高的假阳性和假阴性,发展先进高效的信息分析技术和数据挖掘手段,从大量蛋白质组数据中发掘蛋白质之间的内在联系,以揭示蛋白质的功能及相互作用关系具有极其重要的意义。因此,很多研究者选择用生物信息学方法去研究蛋白质-蛋白质相互作用。
   本论文首先从DIP数据集中下载啤酒酵母的蛋白质相互作用数据,然后从中筛选实验所需的原始正数据集,共得到5943对相互作用蛋白。然后在通过多序列比对,去除原始正数据集蛋白质序列中同源性大于40%的蛋白质,得到5594对相互作用蛋白,构建为非冗余的正数据集。由于目前缺乏非相互作用蛋白质对实验数据,通过随机组合正数据集中的蛋白质、组合不同亚定位的蛋白质和Shufflet软件组合正数据集中的相互作用蛋白序列这三种方法来构建原始负数据集,共得到5个负数据集,分别是Prcp、Psub、1-let、2-let、3-let负数据集。再去除Psub负数据集中蛋白质序列同源性大于40%的蛋白质,构建非冗余负数据集,也筛选出5594对非相互作用蛋白质。基于蛋白质一级序列信息结合氨基酸五位编码和氨基酸7个理化参数编码两种编码去表达蛋白质序列信息,使用支持向量机算法构建模型和预测。使用氨基酸五位编码方法时预测结果最好,当用1-let作为负数据集时,预测准确率达到95.50%,其次是Psub作为负数据集时,预测准确率为92.12%,非冗余数据集的预测准确率为90.84%。对1-let数据集和Psub数据集的五倍交叉验证的准确率分别为93.62%,90.31%。上述预测结果高于目前的文献预测值。
   本文最后,对预测工作进行了总结,工作中的不足之处也进行了探讨,并展望了蛋白质组学未来研究的重点和方向。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号