蛋白质相互作用网络中复合物识别算法研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

在后基因组时代，随着高通量技术的迅猛发展，产生了大量的蛋白质相互作用网络数据，如何从这些海量的蛋白质网络数据中挖掘出有意义的子结构是当前生物信息学研究的主要热点之一。蛋白质复合物作为细胞元件功能实现的主要载体，对于理解蛋白质网络的结构以及认识细胞内生命活动的组织及过程具有重要的意义。
　　本文以真实的蛋白质相互作用网络作为研究对象，分别从无权网络和加权网络研究了复合物的识别问题。对于无权网络，针对当前大多数算法主要采用单一网络拓扑特征挖掘复合物的现状，设计了以复合物密度、大小和特征路径长度为目标函数的多目标进化规划遗传算法。对于加权网络，针对现有重叠复合物发现算法精度不理想的现状，设计了不同地重叠蛋白质复合物发现算法。本文的主要研究工作如下:
　　(1)针对当前大多数蛋白质复合物发现算法主要采用单一网络拓扑特征从蛋白质相互作用网络中挖掘复合物的现状，本文提出一种以多个网络拓扑特征为目标的进化规划遗传算法MOEPGA。该算法首先分析了标准集中已有蛋白质复合物的网络拓扑特征，以密度、大小和特征路径长度为目标构建目标函数，随后设计基于子图的变异操作产生下一代子图种群，在每一代变异完成后，将满足非支配条件的子图作为复合物输出，选择适当的概率将子图进化到下一代。在DIP和GAVIN两个酵母蛋白质相互作用网络数据集中验证了该算法的可行性，实验结果表明，相比于现有算法（ClusterONE、DPClus、MCODE、NEMO、SPICi和HC-PIN），该算法在fscore、归一化聚类分数等性能上具有显著性的效果。
　　(2)针对现有蛋白质相互作用网络假阳性高且难以发现重叠复合物等问题，提出一种新的基于子结构（伪团）扩展的重叠蛋白质复合物发现算法FK-Medoids。该算法根据模糊关系发现蛋白质相互作用网络中互不重叠的具有较高密度和相似性的伪团，然后以伪团为种子进行扩展，改进K-Medoids算法，用带权蛋白质相互作用网络的边相似性作为蛋白质间的距离，借助于集合的上、下近似关系发现重叠的复合物。通过Krogan、Gavin和Colliins三组实验数据集对该算法的有效性进行了验证。实验结果表明，FK-Medoids在Krogan和Gavin数据集上，其精度、F-measure和敏感性等性能要优于已有算法(ClusterONE、CMC、MCL、OSLOM和RFC)。
　　(3)上述FK-Medoids算法在密度较小的蛋白质相互作用网络中识别效果较好，但在相对稠密的网络中则识别效果欠佳。而且，由于FK-Medoids算法运行时间较长，提出一种基于重叠邻居结点和模糊关系的伪团扩展识别算法PCE-ONNFR。首先利用蛋白质对之间的GO相似性值来构建蛋白质相互作用网络的边权。然后通过模糊关系形成互不重叠的伪团。紧接着，基于贪婪策略迭代地扩展伪团，将能提高伪团聚合分数的邻居结点加入伪团。最后合并重叠复合物。与FK-Medoids算法相比，在DIP、Collins、Krogan和Gavin数据集上，PCE-ONNFR的识别效果更好，运行效率更高。而且，在人类蛋白质相互作用网络数据集中对PCE-ONNFR进行了验证，发现了一些与真实复合物匹配较高的蛋白质复合物，其效果远远优于其它已有的重叠复合物发现算法。
　　(4)考虑到目前大多数算法多信息融合时需要人工干预调整参数，提出一种新的蛋白质复合物发现算法cwMINE。首先将边聚集系数与蛋白质对的GO相似性值以调和平均的方式进行组合计算边的权重。然后利用边的权重计算子图密度，并以此计算顶点的权重。为了进一步提高蛋白质复合物的预测精度，我们提出一种新的扩展规则，扩展系数，过滤掉低权重的蛋白质。在Krogan、Gavin和Collins三组酵母蛋白质相互作用网络数据集上与已有算法(CMC、RRW、ProRank+和HC-PIN)进行了比较。实验结果表明，cwMINE算法在大部分数据集中都要优于已有算法，而且，在人类蛋白质相互作用网络数据中进一步验证了该算法的有效性，发现了一些与疾病相关的复合物，为疾病的治疗提供了有价值的线索。

著录项

作者
曹步文;
展开▼
作者单位

湖南大学;

展开▼
授予单位湖南大学;
学科计算机科学与技术
授予学位博士
导师姓名骆嘉伟;
年度 2016
页码
总页数
原文格式 PDF
正文语种中文
中图分类 TP311.131;
关键词
数据挖掘; 蛋白质; 相互作用网络; 复合物; 识别算法;

相似文献

中文文献
外文文献
专利

1. 骨质疏松症蛋白质相互作用网络的构建和分子复合物通路预测 [J] . 张治国 ,牛旭艳 ,刘梅洁 . 中国组织工程研究 . 2011,第033期
2. 基于蛋白质相互作用网络的聚类算法研究 [J] . 刘昊 ,廖波 ,彭利红 . 计算机工程与应用 . 2008,第030期
3. 蛋白质相互作用网络中信号通路的识别算法 [J] . 刘红标 ,刘娟 . 武汉大学学报：理学版 . 2008,第3期
4. C6H6…H2X(X=O、S、Se)复合物中XH…π键的从头计算法研究 [J] . 王新利 . 泰山学院学报 . 2005,第006期
5. 车牌识别系统中的字符分割和识别算法研究 [J] . 武云飞 . 安阳师范学院学报 . 2020,第005期
6. 血清中的酶－免疫球旧白复合物－Ｉ、酶－免疫球蛋白复合物的特征、检出率和与疾病的关系 [C] . 徐荣佳 ,朱忠勇 . 中华医学会全国临床检验中青年学术会议 . 1987
7. 蛋白质相互作用网络中复合物识别算法研究 [A] . 于杨 . 2013

蛋白质相互作用网络中复合物识别算法研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅