首页> 中国专利> 一种基于逻辑模型分析信号转导网络中节点重要性的方法

一种基于逻辑模型分析信号转导网络中节点重要性的方法

摘要

本发明公开了一种基于逻辑模型分析信号转导网络中节点重要性的方法。该方法包括以下步骤:S1,根据数据库中存储的信号转导通路,构建一个信号转导网络;S2,根据信号转导网络中节点之间的连接关系将信号转导网络表示为逻辑的串并联模型;S3,对信号转导网络的总体结构分解为最基本的串联和并联结构;S4,当节点中的单个节点或多个节点的故障发生概率改变时,计算信号转导网络发生故障的概率改变值,通过信号转导网络发生故障的概率改变值度量单个节点或多个节点对保持信号转导网络功能的重要性。通过逻辑模型对整个网络结构进行建模,有利于从全局的网络拓扑属性角度来考察单个节点的重要性。

著录项

  • 公开/公告号CN103995983A

    专利类型发明专利

  • 公开/公告日2014-08-20

    原文格式PDF

  • 申请/专利权人 中国人民解放军国防科学技术大学;

    申请/专利号CN201410251938.0

  • 发明设计人 刘伟;孙志强;宫二铃;

    申请日2014-06-09

  • 分类号G06F19/00;

  • 代理机构北京康信知识产权代理有限责任公司;

  • 代理人金田蕴

  • 地址 410073 湖南省长沙市开福区德雅路109号

  • 入库时间 2023-12-17 00:50:37

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2019-05-31

    未缴年费专利权终止 IPC(主分类):G06F19/00 授权公告日:20170531 终止日期:20180609 申请日:20140609

    专利权的终止

  • 2017-05-31

    授权

    授权

  • 2014-09-17

    实质审查的生效 IPC(主分类):G06F19/00 申请日:20140609

    实质审查的生效

  • 2014-08-20

    公开

    公开

说明书

技术领域

本发明涉及生物信息学技术领域,具体而言,涉及一种基于逻辑模型分析信号转导网络 中节点重要性的方法。

背景技术

在信号转导网络中,衡量单个蛋白质的重要性有助于发现细胞信号转导过程中关键的蛋 白质以及生物系统的薄弱环节,关键的蛋白质以及生物系统的薄弱环节的发现将有助于人们 更好的认识生物体,将有助于一些药物的筛选和研发。目前,在信号转导网络中度量蛋白质 重要性的方法还较少。

在生物学上,愈加重要的节点对应的基因必要性愈高,愈加重要的节点具有更慢的进化 速率,以这种方法来衡量蛋白质重要性需要进行较多的实验研究,且不易进行定量分析。在 蛋白质相互作用网络中,连接度是最常用的描述蛋白质重要性的拓扑指标。节点的连接度是 指所有与该节点可以发生相互作用的节点的数目。通常连接度更高的节点对于保证网络的整 体结构和功能更加重要,但该指标仅考察了节点的局部特性,未考虑节点所在的整个网络的 拓扑结构。实际上,部分连接度较低的节点有可能成为网络的瓶颈,当它们发生故障时,整 个网络结构被破坏,使得信号无法有效传递,从而导致疾病的发生。

还有一些方法通过网络的流量分析来进行网络中节点重要性的预测。如文章Liu W,et al. SigFlux:a novel network feature to evaluate the importance of proteins in signal transduction  networks.BMC Bioinformatics,2006,7:515提出了一种基于网络中的最小路集预测节点重要性 的方法,详细步骤如下:

1)从文献中下载小鼠海马神经元的信号转导网络,作为待研究网络;

2)采用宽度优先搜索算法生成输入和输出之间的所有通路,采用MFinder软件搜索网络 中所有的反馈回路,得到网络中的最小路集;

3)提出了一种度量单个蛋白质重要性的新特征SigFlux,定义为包含该节点的最小路集数 占所有最小路集数目的比例,并根据网络中通路和反馈回路的分布情况计算蛋白质的SigFlux 值;

4)将SigFlux与小鼠基因的必要性和进化速率进行相关分析,进一步比较SigFlux与连接 度指标,说明SigFlux作为衡量蛋白质重要性指标的有效性。

从上述现有技术中可以看出,其预测节点重要性主要是基于信号转导网络的部分拓扑属 性来预测网络中单个节点的重要性,没有从网络的全局结构来分析节点的重要作用,并且缺 乏从概率上的故障分析机制,未考虑单个节点的故障发生概率的提高对整个网络所造成的影 响。

发明内容

本发明旨在提供一种基于逻辑模型分析信号转导网络中节点重要性的方法,以解决现有 技术中未考虑单个节点的故障发生概率的提高对整个网络所造成的影响的技术问题。

为了实现上述目的,根据本发明的一个方面,提供了一种基于逻辑模型分析信号转导网 络中节点重要性的方法。该方法包括以下步骤:S1,根据数据库中存储的信号转导通路,构 建一个信号转导网络;S2,根据信号转导网络中节点之间的连接关系将信号转导网络表示为 逻辑的串并联模型;S3,对信号转导网络的总体结构分解为最基本的串联和并联结构;S4, 当节点中的单个节点或多个节点的故障发生概率改变时,计算信号转导网络发生故障的概率 改变值,通过信号转导网络发生故障的概率改变值度量单个节点或多个节点对保持信号转导 网络功能的重要性。

进一步地,该方法还包括:S5,将信号转导网络发生故障的概率改变值与基因的必要性 和基因的进化速率进行相关分析,与预设连接度指标进行比较,进而对信号转导网络中的参 数进行调整。

进一步地,在步骤S4中,设定在不发生故障的情况下,信号转导网络中各个节点发生故 障的概率是一个固定值。

进一步地,在步骤S4中,设定在正常情况下,将在正常情况下信号转导网络中各个节点 发生故障的概率设定为一常数值,常数值为信号转导网络中各个节点发生故障的平均值,当 单个节点发生故障时,该单个节点发生故障的对应概率变为1,计算各个最基本的串联和并联 结构发生故障的概率,进而推算出信号转导网络发生故障的概率。

进一步地,步骤S1中,现有数据库中存储的各种信号转导通路为人、小鼠、果蝇、线虫 或酵母的各种信号转导通路。

应用本发明的技术方案,通过逻辑模型对整个网络结构进行建模,有利于从全局的网络 拓扑属性角度来考察单个节点的重要性;从概率上分析单个节点的故障发生概率的提高对整 个网络所造成的影响,容易进行定量分析;可以方便的将单个节点的重要性分析推广到多个 节点的联合重要性分析,发现网络中的薄弱模块。可以通过分析的方法发现信号转导网络中 重要的节点,为生物实验设计提供指导,帮助研究网络中节点的功能。

附图说明

构成本申请的一部分的说明书附图用来提供对本发明的进一步理解,本发明的示意性实 施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:

图1示出了根据本发明一典型实施方式的基于逻辑模型分析信号转导网络中节点重要性 的方法的流程图;

图2示出了根据本发明另一典型实施方式的基于逻辑模型分析信号转导网络中节点重要 性的方法的流程图;

图3A示出了真实的细胞凋亡信号转导网络的局部;

图3B示出了图3A对应的串并联逻辑模型;

图4A示出了最基本的串联结构;以及

图4B示出了最基本的并联结构;

图5示出了人的凋亡信号转导网络;

图6示出了图5模块划分后的示意图;

图7示出了图6对应的逻辑关系图;

图8示出了图7中模块1对应的中间子模块。

具体实施方式

需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。 下面将参考附图并结合实施例来详细说明本发明。

根据本发明一种典型的实施方式,提供一种基于逻辑模型分析信号转导网络中节点重要 性的方法。该方法包括以下步骤:S1,根据数据库中存储的信号转导通路,构建一个信号转 导网络;S2,根据信号转导网络中节点之间的连接关系将信号转导网络表示为逻辑的串并联 模型;S3,对信号转导网络的总体结构分解为最基本的串联和并联结构;S4,当上述节点中 的单个节点或多个节点的故障发生概率改变时,计算信号转导网络发生故障的概率改变值, 通过信号转导网络发生故障的概率改变值度量单个节点或多个节点对保持信号转导网络功能 的重要性,如图1所示。

应用本发明的技术方案,通过逻辑模型对整个网络结构进行建模,有利于从全局的网络 拓扑属性角度来考察单个节点的重要性;串并联关系是计算网络故障发生概率的基础,将大 的网络逐级分解成基本的串并联结构才能根据所有节点的故障概率计算出整个网络的故障概 率,从而从概率上分析单个节点的故障发生概率的提高对整个网络所造成的影响,与实际的 疾病发生情况比较吻合,容易进行定量分析;可以方便的将单个节点的重要性分析推广到多 个节点的联合重要性分析,发现网络中的薄弱模块。

对于复杂的信号转导网络,将其直接转换成逻辑关系模型是比较困难的。其基本思路是 将复杂网络逐级划分:第一步是将其划分为相互独立的多个模块;第二步是将由第一步获得 的模块继续划分,区分其内部的串并联关系,如果模块内部可以区分出单个节点的串并联关 系,则该模块的逻辑关系模型转换结束,否则继续将该模块进行划分,分为多个独立的小块, 重复划分步骤;最后是将由各模块内的逻辑关系模型进行拼接,形成最终的逻辑关系模型。

优选的,如图2所示,方法进一步包括:S5,将信号转导网络发生故障的概率改变值与 基因的必要性和基因的进化速率进行相关分析,与预设连接度指标进行比较,进而对信号转 导网络中的参数进行调整,从而更有利于得到令人满意的结果,即与生物学数据相吻合,如 与基因必要性一致。其中,基因的必要性和进化速率等数据采用现有的生物学数据库中的信 息,如小鼠的必要性数据存储在MGD中。其中,预设的连接度指标根据现有数据库中的信息 得到。

根据本发明一种典型的实施方式,在步骤S4中,设定在正常情况下,信号转导网络中各 个节点发生故障的概率是一个固定值,这样方便后续概率的计算。例如,在步骤S4中,将在 正常情况下信号转导网络中各个节点发生故障的概率设定为一常数值,常数值为信号转导网 络中各个节点发生故障的平均值,当单个节点发生故障时,该单个节点发生故障的对应概率 变为1,计算各个最基本的串联和并联结构发生故障的概率,进而推算出信号转导网络发生故 障的概率。其中,正常情况下是指信号转导网络能够正常转导的情况下。

本发明的基于逻辑模型分析信号转导网络中节点重要性的方法可以用于各种物种中信号 转导通路的评估,例如人、小鼠、果蝇、线虫或酵母的各种信号转导通路。

在本发明的一典型的实施方式中,该基于逻辑模型分析信号转导网络中节点重要性的方 法包括以下步骤:

1.信号转导网络的构建及表示为逻辑模型

对于信号转导网络,网络中的节点之间存在的连接关系,形成了拓扑结构。通过整个网 络结构保证信号的有效传输,特别是通过通路的冗余机制,保证网络的部分节点发生错误(故 障)时,网络仍能够正常的发挥功能。在一条通路中,根据节点之间的与和或的关系,可以 将其转换为串并联逻辑模型。例如,如图3A是一个真实的信号转导网络,其对应的串并联逻 辑模型如图3B所示。这里不区分节点之间的激活和抑制关系。

2.计算整个网络的故障概率

对于复杂的串并联逻辑网络,总可以将其划分为图4A和图4B中最基本的串并联结构。 其中,图4A示出了最基本的串联结构,图4B示出了最基本的并联结构。

对于串联结构,设节点A、B、C对应的故障发生概率分别为P(A)、P(B)和P(C),那么由 这三个节点构成的串联系统G发生故障的概率为:

P(G)=1-[1-P(A)][1-P(B)][1-P(C)]    (1)

由这三个节点构成的并联系统R发生故障的概率为:

P(R)=P(A)P(B)P(C)    (2)

通过将复杂系统划分为基本的串并联模块,可以根据单个节点的故障发生概率计算出整 个系统发生故障的概率。

由基本模块计算总体故障概率的过程与前面模块划分的步骤是相反的,前面是由大的网 络逐级划分为小的模块,这里则由小的模块开始计算故障概率,逐级扩大模块范围,直至包 含整个网络计算出整个网络的故障概率。

3.单个节点的重要性度量

假定在正常情况下,网络中各个节点i发生故障的概率是一个固定值,如P(i)=0.5,根据 网络的逻辑模型,可以计算出整个系统S0发生故障的总概率P(S0)。

对于网络中的单个节点i,当其发生故障时,其对应概率变为P(i)=1。认为此时没有其他 节点发生故障,那么可以计算出在此条件下,整个系统的故障概率Si的P(S1),正常情况下P(Si) ≧P(S0)。

节点i的重要性定义为:

F(i)=P(Si)-P(S0)    (3)

该值表征了节点i发生故障对整个网络发生故障的概率影响,从而可以定量的评估该节点 对于整个网络结构的重要性。

4.多个节点的重要性度量

与单个节点的重要性度量相类似,假定n个节点{1,…,n}同时发生故障,其节点的故障 概率均变为P(i)=1,i=1,…,n,可以计算出在此条件下,整个系统的故障概率Sn的P(Sn)。 这n个节点的联合重要性定义为:

F(n)=P(Sn)-P(S0)    (4)

注意到,该联合重要性并不等同于n个节点的单独重要性的叠加,而与这n个节点的分 布和连接情况有密切联系。

下面将结合实施例进一步说明本发明的有益效果,下列没有特别描述的步骤,均可采用 本领域的常规技术手段实现。

实施例1

1)根据现有数据库中存储的各种信号转导通路,构建人的凋亡信号转导网络,如图5所 示。对于如图5所示的人的凋亡信号转导网络,对其进行模块划分和逻辑关系转换。

2)将图5划分成相互独立的模块1和模块2,如图6所示。

3)根据图6进行逻辑关系划分,得到对应的逻辑关系图,如图7所示。

4)设定正常情况下,单个节点的故障发生概率为一个常值(如0.1),根据逻辑关系图, 可以计算出整个网络的故障发生概率。其计算方法是先计算各模块内的故障发生概率,然后 得到整个网络的故障发生概率。对于模块1,可以划分出中间子模块,如图8所示。

先计算中间子模块的故障发生概率Pm

Pm=0.1[1-(1-0.1)(1-0.01)][1-(1-0.1)(1-0.01)]=0.0012

然后综合得到整个模块概率为:

P(M1)=1-(1-0.1){1-Pm}(1-0.1)=0.1910

对于模块2,其为5个节点的串联,对应的故障概率为:

P(M2)=1-(1-0.1)5=0.4095

最后可得总的网络故障发生概率P(S0)=0.2241,此处计算较复杂,可编程实现。

当其中某个节点i发生故障时,其故障发生改变为1,重复以上计算过程,得到新的故障 发生概率P(Si),然后根据其差值衡量单个节点的重要性。

对于该网络,Caspase3节点是最为重要的,其重要性分值为1。其他节点的重要性概率均 小于1,如对于Caspase9,其重要性分值为0.5738。

类似的,可以计算模块1和模块2的重要性分值。

从上述实施例可以看出,采用本发明的技术方案至少具有以下有益效果:

1、通过逻辑模型对整个网络结构进行建模,有利于从全局的网络拓扑属性角度来考察单 个节点的重要性;

2、从概率上分析单个节点的故障发生概率的提高对整个网络所造成的影响,与实际的疾 病发生情况比较吻合,容易进行定量分析;

3、可以方便的将单个节点的重要性分析推广到多个节点的联合重要性分析,发现网络中 的薄弱模块。

以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员 来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等 同替换、改进等,均应包含在本发明的保护范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号