技术领域
本发明涉及蛋白质分类领域,特别是指一种基于多通道图卷积神经网络的蛋白质互作网络节点分类方法。
背景技术
蛋白质是生命的物质基础,人体几乎所有的组成部分都离不开蛋白质,长期以来都是研究的热点。蛋白质往往通过相互作用来参与细胞代谢、基因表达调节等等生命过程,以此基础上形成了蛋白质互作网络。蛋白质互作网络通过网络来形象化描述蛋白质之间存在的关系,有助于研究分析,对于从分子层面了解生物组成和一些疾病原因起到十分重要的作用。
图卷积网络旨在对非规则复杂网络数据进行卷积分析。在半监督学习中,图卷积能够通过极少的有标签训练集得到较好的分类性能,且训练速度较快,被广泛应用于各类网络结构数据集。然而,高阶的邻域信息聚合会造成特征过平滑,因此,普通的图卷积网络往往只能聚集2~3阶邻域特征信息,但蛋白质互作网络中的蛋白质之间联系相对紧密,只聚合低阶信息是不够的。同时,蛋白质互作网络数据往往比较庞大且复杂,因此,在控制网络深度,即在较少参数下,捕捉高阶邻域信息,得到更好的蛋白质分类性能,就显得非常的必要。
发明内容
为了克服现有蛋白质互作网络分类结果偏差较大的问题,本发明提出一种准确性较高的一种基于多通道图卷积神经网络的蛋白质互作网络节点分类方法。
本发明解决其技术问题所采用的技术具体步骤是:
一种基于多通道图卷积神经网络的蛋白质互作网络节点分类方法,包括如下步骤:
步骤一:根据蛋白质相互作用数据构建一个蛋白质互作网络模型G(V,E),V为节点,E为连边,邻接矩阵用A表示,其中,一个节点表示一个蛋白质,节点集V={v
步骤二:构建多通道图卷积神经网络模型,该模型包含两层结构,第一层有k条通道,其中第i条通道上使用i阶卷积核SGC
步骤三:计算i阶卷积核
其中GCN表示不含激活函数的图卷积神经网络,其中1≤i≤k;
步骤四:计算多通道图卷积神经网络模型的第i通道的输出
y(i)=SGC
其中,1≤i≤k,f为relu函数;
步骤五:计算多通道图卷积神经网络模型的模型输出
其中,g为softmax激活函数;
步骤六:计算半监督分类的损失值
其中μ为带标签的节点集,Y
步骤七:重复步骤三到六,直到损失值收敛,将得到的Q作为蛋白质互作网络的分类结果。
本发明的技术构思为:本发明基于浅层的神经网络,在聚合高阶信息的同时,使用多通道来组合不同的卷积排列,有效的提高了对蛋白质互作网络中蛋白质的分类性能,提升了分类准确性。
本发明的有益效果为:通过多通道的高阶邻域图卷积信息组合来对蛋白质互作网络进行处理,在较低的运算代价下提升了对蛋白质的分类精度。
附图说明
图1为神经网络模型的示意图,为便于理解,设k=3,将特征输入到不同的通道下做卷积,经过两层图卷积,将得到的结果进行累加,激活,最后得到输出结果。
具体实施方式
下面结合附图对本发明做进一步说明。
参照图1,一种基于多通道图卷积神经网络的蛋白质互作网络节点分类方法,包括如下步骤:
步骤一:根据蛋白质相互作用数据构建一个蛋白质互作网络模型G(V,E),V为节点,E为连边,邻接矩阵用A表示,其中,一个节点表示一个蛋白质,节点集V={v
步骤二:构建多通道图卷积神经网络模型,该模型包含两层结构,第一层有k条通道,其中第i条通道上使用i阶卷积核SGC
步骤三:计算i阶卷积核
其中GCN表示不含激活函数的图卷积神经网络,其中1≤i≤k;
步骤四:计算多通道图卷积神经网络模型的第i通道的输出
y(i)=SGC
其中,1≤i≤k,f为relu函数;
步骤五:计算多通道图卷积神经网络模型的模型输出
其中,g为softmax激活函数,模型如图1所示;
步骤六:计算半监督分类的损失值
其中μ为带标签的节点集,Y
步骤七:重复步骤三到六,直到损失值收敛,将得到的Q作为蛋白质互作网络的分类结果。
如上所述,本专利实施的具体实现步骤使本发明更加清晰。在本发明的精神和权利要求的保护范围内,对本发明作出的任何修改和改变,都落入本发明的保护范围。
机译: 产生一个或多个蛋白质的方法,加标签的蛋白质的文库,产生一组蛋白质的方法,排列。筛选一种或多种化合物对一种或多种蛋白质的生物活性的方法用于蛋白质-蛋白质和特定核酸的相互作用的核酸,一种排列的使用,用于产生一组抗体的方法,以及对蛋白质或蛋白质的功能依赖性的分类,以及使用标有标签的蛋白质。
机译: 基于卷积神经网络和特征图生成方法的深度学习中特征图计算的金字塔历史图生成方法
机译: 基于分配地址分配的树状结构网络的网络节点的操作方法,一种网络的形成方法以及一种包括能够降低基于分布地址的树状结构网络的地址浪费的网络节点的系统