首页> 中国专利> 一种基于多通道图卷积神经网络的蛋白质互作网络节点分类方法

一种基于多通道图卷积神经网络的蛋白质互作网络节点分类方法

摘要

一种基于多通道图卷积神经网络的蛋白质互作网络节点分类方法,通过组合高阶信息来提高分类效果,根据蛋白质相互作用数据构建一个蛋白质互作网络,构建多通道图卷积神经网络模型,该模型包含两层结构,使用不同的图卷积核组合,在少数有标签蛋白质的数据基础上完成半监督分类,得到无标签蛋白质的类别。本发明通过多通道的高阶邻域图卷积神经网络组合来提取蛋白质互作网络的高阶信息,在较低的运算代价下提升了对蛋白质的分类精度。

著录项

  • 公开/公告号CN112364983A

    专利类型发明专利

  • 公开/公告日2021-02-12

    原文格式PDF

  • 申请/专利权人 浙江工业大学;

    申请/专利号CN202011260336.3

  • 发明设计人 杨旭华;马钢峰;徐新黎;

    申请日2020-11-12

  • 分类号G06N3/04(20060101);G06N3/08(20060101);G16B15/20(20190101);G06K9/62(20060101);

  • 代理机构33241 杭州斯可睿专利事务所有限公司;

  • 代理人王利强

  • 地址 310014 浙江省杭州市下城区朝晖六区潮王路18号

  • 入库时间 2023-06-19 09:54:18

说明书

技术领域

本发明涉及蛋白质分类领域,特别是指一种基于多通道图卷积神经网络的蛋白质互作网络节点分类方法。

背景技术

蛋白质是生命的物质基础,人体几乎所有的组成部分都离不开蛋白质,长期以来都是研究的热点。蛋白质往往通过相互作用来参与细胞代谢、基因表达调节等等生命过程,以此基础上形成了蛋白质互作网络。蛋白质互作网络通过网络来形象化描述蛋白质之间存在的关系,有助于研究分析,对于从分子层面了解生物组成和一些疾病原因起到十分重要的作用。

图卷积网络旨在对非规则复杂网络数据进行卷积分析。在半监督学习中,图卷积能够通过极少的有标签训练集得到较好的分类性能,且训练速度较快,被广泛应用于各类网络结构数据集。然而,高阶的邻域信息聚合会造成特征过平滑,因此,普通的图卷积网络往往只能聚集2~3阶邻域特征信息,但蛋白质互作网络中的蛋白质之间联系相对紧密,只聚合低阶信息是不够的。同时,蛋白质互作网络数据往往比较庞大且复杂,因此,在控制网络深度,即在较少参数下,捕捉高阶邻域信息,得到更好的蛋白质分类性能,就显得非常的必要。

发明内容

为了克服现有蛋白质互作网络分类结果偏差较大的问题,本发明提出一种准确性较高的一种基于多通道图卷积神经网络的蛋白质互作网络节点分类方法。

本发明解决其技术问题所采用的技术具体步骤是:

一种基于多通道图卷积神经网络的蛋白质互作网络节点分类方法,包括如下步骤:

步骤一:根据蛋白质相互作用数据构建一个蛋白质互作网络模型G(V,E),V为节点,E为连边,邻接矩阵用A表示,其中,一个节点表示一个蛋白质,节点集V={v

步骤二:构建多通道图卷积神经网络模型,该模型包含两层结构,第一层有k条通道,其中第i条通道上使用i阶卷积核SGC

步骤三:计算i阶卷积核

其中GCN表示不含激活函数的图卷积神经网络,其中1≤i≤k;

步骤四:计算多通道图卷积神经网络模型的第i通道的输出

y(i)=SGC

其中,1≤i≤k,f为relu函数;

步骤五:计算多通道图卷积神经网络模型的模型输出

其中,g为softmax激活函数;

步骤六:计算半监督分类的损失值

其中μ为带标签的节点集,Y

步骤七:重复步骤三到六,直到损失值收敛,将得到的Q作为蛋白质互作网络的分类结果。

本发明的技术构思为:本发明基于浅层的神经网络,在聚合高阶信息的同时,使用多通道来组合不同的卷积排列,有效的提高了对蛋白质互作网络中蛋白质的分类性能,提升了分类准确性。

本发明的有益效果为:通过多通道的高阶邻域图卷积信息组合来对蛋白质互作网络进行处理,在较低的运算代价下提升了对蛋白质的分类精度。

附图说明

图1为神经网络模型的示意图,为便于理解,设k=3,将特征输入到不同的通道下做卷积,经过两层图卷积,将得到的结果进行累加,激活,最后得到输出结果。

具体实施方式

下面结合附图对本发明做进一步说明。

参照图1,一种基于多通道图卷积神经网络的蛋白质互作网络节点分类方法,包括如下步骤:

步骤一:根据蛋白质相互作用数据构建一个蛋白质互作网络模型G(V,E),V为节点,E为连边,邻接矩阵用A表示,其中,一个节点表示一个蛋白质,节点集V={v

步骤二:构建多通道图卷积神经网络模型,该模型包含两层结构,第一层有k条通道,其中第i条通道上使用i阶卷积核SGC

步骤三:计算i阶卷积核

其中GCN表示不含激活函数的图卷积神经网络,其中1≤i≤k;

步骤四:计算多通道图卷积神经网络模型的第i通道的输出

y(i)=SGC

其中,1≤i≤k,f为relu函数;

步骤五:计算多通道图卷积神经网络模型的模型输出

其中,g为softmax激活函数,模型如图1所示;

步骤六:计算半监督分类的损失值

其中μ为带标签的节点集,Y

步骤七:重复步骤三到六,直到损失值收敛,将得到的Q作为蛋白质互作网络的分类结果。

如上所述,本专利实施的具体实现步骤使本发明更加清晰。在本发明的精神和权利要求的保护范围内,对本发明作出的任何修改和改变,都落入本发明的保护范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号