首页> 中国专利> 一种缺失蛋白质相互作用关系补足方法和装置

一种缺失蛋白质相互作用关系补足方法和装置

页面导航

摘要
著录项
法律信息
说明书
相似文献

摘要

本发明公开了一种缺失蛋白质相互作用关系补足方法和装置，包括：S1，特征转换模块接收服务器采集的高通量筛选数据集合，将高通量筛选数据集合转化为蛋白质集合的特征向量集合，并将特征向量集合存储到数据模块；S2，数据模块存储由特征转换模块转化的蛋白质特征向量集合以及存储相互作用率计算模块计算的蛋白质相互作用率矩阵；S3，相互作用率计算模块特征向量集合，执行蛋白质相互作用率矩阵构造过程，并将构造完成的蛋白质相互作用率矩阵存入数据模块；S4，补足模块接收到服务器对蛋白质二元组之间进行补足的指令后，根据数据模块的相互作用率存储单元中存放的蛋白质相互作用率矩阵，对蛋白质二元组之间缺失的相互作用关系进行补足。

著录项

公开/公告号CN104636637A

专利类型发明专利
公开/公告日2015-05-20

原文格式PDF
申请/专利权人重庆大学;
展开▼

申请/专利号CN201510087543.6
发明设计人罗辛;夏云霓;
展开▼

申请日2015-02-25
分类号G06F19/18;
代理机构重庆市前沿专利事务所(普通合伙);
代理人郭云
地址 400020 重庆市沙坪坝区沙正街174号
入库时间 2023-12-18 08:44:53

法律信息

法律状态公告日

法律状态信息

法律状态
2017-08-29

授权

授权
2017-07-28

专利申请权的转移 IPC(主分类):G06F19/18 登记生效日:20170711 变更前: 变更后: 申请日:20150225

专利申请权、专利权的转移
2015-06-17

实质审查的生效 IPC(主分类):G06F19/18 申请日:20150225

实质审查的生效
2015-05-20

公开

公开

说明书

技术领域

本发明涉及计算机计算生物学领域，特别涉及计算生物学中，一种缺失蛋白质相互作用关系补足方法和装置。

背景技术

近年来,组合化学的长足发展使得短时间合成大量化合物成为可能,且遗传学研究，如人类基因组计划等，使靶蛋白数量以几何级数增加。传统小规模实验方法难以处理飞速增长的蛋白质分子，无法对其相互作用网络进行全面探索；导致对高通量筛选(High Throughput Screening)技术的迫切需求。高通量筛选技术，根据待测样品的合成路线，包括液相和固相筛选；根据筛选目标物，包括纯蛋白受体亲合性筛选、酶活性筛选、细胞活性筛选等。高通量筛选技术主要包括放射性染料筛选、荧光筛选、闪烁接近化验、酶连接免疫吸收剂化验、细胞功能筛选小鼠显型表型遗传学等方法。

高通量筛选技术具备很高的执行效率，对比小规模实验方法，能减少筛选单位的数量，并自动化重复工作，同时还能简化筛选过程和降低筛选成本。尽管高通量筛选技术具备很高的执行效率，基于此技术对全部的蛋白质相互作用关系进行彻底的搜索和标定仍然需要耗费巨量的时间和人力、物力成本。因此，对已有的高通量筛选数据，如果能应用计算机技术对其进行分析，并在此基础上对缺失蛋白质相互作用关系进行准确的补足，将能极大加快对蛋白质相互作用网络的探索进程。

现有基于计算机数据分析的缺失蛋白质相互作用关系补足方法主要包括基于知识的方法、基于信息整合的方法、基于重复实验的方法和基于高通量数据网络拓扑结构的方法。其中，基于知识的方法和基于信息整合的方法需要对涉及靶蛋白的性质进行进一步的分析，导致很大的工作量和分析成本；基于重复试验的方法则需要重复进行传统小规模实验或者高通量筛选实验，同样会耗费巨大的人力物力成本。基于高通量网络拓扑结构的方法，其主要优势在于只需要获得高通量筛选数据，即可对其对应的蛋白质相互作用网络进行拓扑结构分析，在此基础上对缺失的蛋白质相互作用关系进行补足。但是，基于高通量网络拓扑结构的方法在处理稀疏的蛋白质相互作用网络时，其性能会急剧降低。然而，受实际成本限制，现有的高通量筛选数据往往是稀疏的。因此，如何对在数据稀疏的条件下，对缺失蛋白质相互作用关系进行补足，是计算生物学领域的一个关键技术问题。

发明内容

本发明旨在至少解决现有技术中存在的技术问题，特别创新地提出了一种缺失蛋白质相互作用关系补足装置和方法。

为了实现本发明的上述目的，本发明提供了一种缺失蛋白质相互作用关系补足方法，其关键在于，包括如下步骤：

S1，特征转换模块接收服务器采集的高通量筛选数据集合，执行特征转换过程，将高通量筛选数据集合转化为蛋白质集合的特征向量集合，并将特征向量集合存储到数据模块；

S2，数据模块存储由特征转换模块转化的蛋白质特征向量集合以及存储相互作用率计算模块计算的蛋白质相互作用率矩阵；

S3，相互作用率计算模块根据数据模块存储的特征向量集合，执行蛋白质相互作用率矩阵构造过程，并将构造完成的蛋白质相互作用率矩阵存入数据模块；

S4，补足模块接收到服务器对蛋白质二元组之间缺失的相互作用关系进行补足的指令后，根据数据模块的相互作用率存储单元中存放的蛋白质相互作用率矩阵，执行缺失蛋白质相互作用关系补足过程，对蛋白质二元组之间缺失的相互作用关系进行补足。

所述的缺失蛋白质相互作用关系补足方法，优选的，所述S1包括：

S1-1，接收服务器采集的高通量筛选数据集合；

S1-2，对高通量筛选数据集合对应的蛋白质集合P中的所有蛋白质，按照 1～|P|进行顺序编号，构造长度为|P|的特征向量r_a，a指编号为第a个蛋白质；

S1-3，按照高通量筛选数据集合，对特征向量r_a中的每一个元素的值进行设置；

S1-4，判断特征向量r_a中的所有元素是否已执行步骤S1-3，若都执行完毕，则执行S1-5，否则，执行S1-3；

S1-5，将特征向量r_a存储至数据模块的特征向量存储单元；

S1-6，判断是否已处理完蛋白质集合P中所有的蛋白质，若处理完毕，则执行S1-7，否则，执行S1-2；

S1-7，执行蛋白质相互作用率矩阵构造过程。

所述的缺失蛋白质相互作用关系补足方法，优选的，所述S2包括：

S2-1，特征向量存储单元存储由特征转换模块转化的特征向量集合，将特征向量集合发送到相互作用率计算模块进行蛋白质相互作用率矩阵构造；

S2-2，相互作用率存储单元存储相互作用率计算模块根据特征向量集合构造的蛋白质相互作用率矩阵。

所述的缺失蛋白质相互作用关系补足方法，优选的，所述S3包括：

S3-1，从数据模块的特征向量存储单元中取出蛋白质特征向量集合R；

S3-2，根据蛋白质特征向量集合R涉及的蛋白质集合P，构造|P|行，|P| 列的空白矩阵C；

S3-3，对于r_a的每一元素r_a(b)，令其对应蛋白质b，对蛋白质二元组(a,b)，根据其特征向量r_a和r_b，对蛋白质相互作用率矩阵C，计算蛋白质相互作用率 C_a,b和C_b,a；

S3-4，判断是否处理完所有的蛋白质二元组，若处理完毕，则执行S3-5，否则，执行S3-3；

S3-5，将C存储至数据模块的相互作用率存储单元。

所述的缺失蛋白质相互作用关系补足方法，优选的，所述S4包括：

S4-1，接收服务器对蛋白质二元组(a,b)间缺失的相互作用关系进行补足的指令；

S4-2，从数据模块的相互作用率存储单元中取出蛋白质二元组(a,b)的相互作用率；

S4-3，对蛋白质二元组(a,b)间缺失的相互作用关系进行补足。

所述的缺失蛋白质相互作用关系补足方法，优选的，所述S1-3包括：

对于r_a当前的每一元素r_a(b)，令其对应蛋白质为b，并根据当前的高通量筛选数据集合，判断蛋白质二元组(a,b)是否存在相互作用关系，若存在相互作用关系，则令r_a(b)＝1；若不存在相互作用关系，则令r_a(b)＝0。

所述的缺失蛋白质相互作用关系补足方法，优选的，所述S3-3包括：

对蛋白质二元组(a,b)，根据其特征向量r_a和r_b，对蛋白质相互作用率矩阵 C，计算蛋白质相互作用率C_a,b和C_b,a，以如下公式表示：

$c_{a, b} = c_{b, a} = \frac{1}{1 + e^{- \frac{< r_{a}, r_{b} >}{(| | r_{a} | | + β) (| | r_{b} | | + β)}}},$

其中，<r_a,r_b>表示求特征向量r_a和r_b的内积，||r_a||和||r_b||表示对特征向量r_a和r_b求模，β表示饱和抑制参数，为大于1的正整数，上述公式是根据特征向量r_a和r_b，计算其向量相似性，然后使用sigmoid函数对相似性进行映射。

所述的缺失蛋白质相互作用关系补足方法，优选的，所述S4-3包括：

对蛋白质二元组(a,b)间缺失的相互作用关系进行补足，以下述公式表示：

其中，z_a,b和z_b,a表示蛋白质二元组(a,b)间缺失的相互作用关系，γ表示判断阈值，为开区间(0,1)内的正数，表示对c_a,b和γ之差进行向上取整，上述公式为，若蛋白质二元组(a,b)对应的相互作用率c_a,b大于判断阈值 γ，则认为蛋白质二元组(a,b)间存在尚未被发现的相互作用关系，并对其进行补足；若蛋白质二元组(a,b)对应的相互作用率c_a,b小于判断阈值γ，则认为蛋白质二元组(a,b)间不存在尚未被发现的相互作用关系，并对其进行标记。

本发明公开一种缺失蛋白质相互作用关系补足装置，其关键在于，包括：

特征转换模块，用于接收服务器采集的高通量筛选数据集合，执行特征转换过程，将高通量筛选数据集合转化为蛋白质集合的特征向量集合，并将特征向量集合存储到数据模块；

数据模块，用于存储由特征转换模块转化的蛋白质特征向量集合，以及相互作用率计算模块计算的蛋白质相互作用率矩阵；

相互作用率计算模块，用于根据数据模块存储的特征向量集合，执行蛋白质相互作用率矩阵构造过程，并将构造完成的蛋白质相互作用率矩阵存入数据模块；

补足模块，用于接收到服务器对蛋白质二元组之间缺失的相互作用关系进行补足的指令后，根据数据模块的相互作用率存储单元中存放的蛋白质相互作用率矩阵，执行缺失蛋白质相互作用关系补足过程，对蛋白质二元组之间缺失的相互作用关系进行补足。

所述的缺失蛋白质相互作用关系补足装置，优选的，所述数据模块包括：

特征向量存储单元，用于存储由特征转换模块转化的特征向量集合，将特征向量集合发送到相互作用率计算模块进行蛋白质相互作用率矩阵构造；

相互作用率存储单元，用于存储相互作用率计算模块根据特征向量集合构造的蛋白质相互作用率矩阵。

综上所述，由于采用了上述技术方案，本发明的有益效果是：

特征转换模块接收服务器采集的高通量筛选数据集合，执行特征转换过程，将高通量筛选数据集合转化为其所涉及的蛋白质集合的特征向量集合，并将特征向量集合存储到装置的数据模块；数据模块存储由特征转换模块转化的蛋白质特征向量集合，以及相互作用率计算模块计算的蛋白质相互作用率矩阵；包括特征向量存储单元，存储由特征转换模块转化的特征向量集合；相互作用率存储单元，存储相互作用率计算模块根据特征向量集合构造的蛋白质相互作用率矩阵；相互作用率计算模块根据装置存储的特征向量集合，执行蛋白质相互作用率矩阵构造过程，并将构造完成的蛋白质相互作用率矩阵存入数据模块的相互作用率存储单元；补足模块接收到服务器对蛋白质二元组(a,b)间缺失的相互作用关系进行补足的指令后，根据数据模块的相互作用率存储单元中存放的蛋白质相互作用率矩阵，执行缺失蛋白质相互作用关系补足过程，对蛋白质二元组(a,b)间缺失的相互作用关系进行补足。

本发明提供一种缺失蛋白质相互作用关系补足装置和方法，其专门作用于对应稀疏高通量筛选数据，能够对缺失蛋白质相互作用关系进行基于统计规律的、准确的补足，以解决生物计算学领域，基于稀疏的高通量筛选数据，对缺失蛋白质相互作用关系进行准确补足的技术问题。

本发明的附加方面和优点将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本发明的实践了解到。

附图说明

本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解，其中：

图1为本发明缺失蛋白质相互作用关系补足装置结构示意图；

图2为本发明特征转换流程图；

图3为本发明蛋白质相互作用率矩阵构造流程图；

图4为本发明缺失蛋白质相互作用关系补足流程图；

图5为应用本发明实施例前后，对缺失蛋白质相互作用关系进行补足准确度对比。

具体实施方式

下面详细描述本发明的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，仅用于解释本发明，而不能理解为对本发明的限制。

在本发明的描述中，需要理解的是，术语“纵向”、“横向”、“上”、“下”、“前”、 “后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系，仅是为了便于描述本发明和简化描述，而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作，因此不能理解为对本发明的限制。

在本发明的描述中，除非另有规定和限定，需要说明的是，术语“安装”、 “相连”、“连接”应做广义理解，例如，可以是机械连接或电连接，也可以是两个元件内部的连通，可以是直接相连，也可以通过中间媒介间接相连，对于本领域的普通技术人员而言，可以根据具体情况理解上述术语的具体含义。

本发明提供一种缺失蛋白质相互作用关系补足装置和方法，其专门作用于稀疏高通量筛选数据，能够对缺失蛋白质相互作用关系进行基于统计规律的、准确的补足，以解决生物计算学领域，基于稀疏的高通量筛选数据，对缺失蛋白质相互作用关系进行准确补足的技术问题。

图1为本发明缺失蛋白质相互作用关系补足装置(以下简称装置)结构示意图。装置包括：

特征转换模块：接收服务器采集的高通量筛选数据集合，执行特征转换过程，将高通量筛选数据集合转化为其所涉及的蛋白质集合的特征向量集合，并将特征向量集合存储到装置的数据模块。

数据模块：存储由特征转换模块转化的蛋白质特征向量集合，以及相互作用率计算模块计算的蛋白质相互作用率矩阵；包括特征向量存储单元，存储由特征转换模块转化的特征向量集合；相互作用率存储单元，存储相互作用率计算模块根据特征向量集合构造的蛋白质相互作用率矩阵。

相互作用率计算模块：根据装置存储的特征向量集合，执行蛋白质相互作用率矩阵构造过程，并将构造完成的蛋白质相互作用率矩阵存入数据模块的相互作用率存储单元。

补足模块：接收到服务器对蛋白质二元组(a,b)间缺失的相互作用关系进行补足的指令后，根据数据模块的相互作用率存储单元中存放的蛋白质相互作用率矩阵，执行缺失蛋白质相互作用关系补足过程，对蛋白质二元组(a,b)间缺失的相互作用关系进行补足。

本装置可部署于一个现有的服务器中，也可部署于一个单独设置的、专用于进行缺失蛋白质相互作用关系补足的服务器中。

如图2所示为特征转换流程。特征转换流程包括：

(1)装置接收服务器采集的高通量筛选数据集合。

(2)装置对高通量筛选数据集合对应的蛋白质集合P中的蛋白质a，构造长度为|P|的特征向量r_a；

(3)装置按照高通量筛选数据集合，对r_a中的每一元素的值进行设置。

(4)装置判断判断已处理r_a中的所有元素，若是，则执行步骤(5)，否则，执行步骤(3)。

(5)装置将r_a存储至数据模块的特征向量存储单元。

(6)装置判断已处理完P中所有的蛋白质，若是，则执行步骤(7)，否则，执行步骤(2)。

(7)装置执行蛋白质相互作用率矩阵构造过程。

如图3所示为蛋白质相互作用率矩阵构造流程。蛋白质相互作用率矩阵构造流程包括：

(1)装置从从数据模块的特征向量存储单元中取出蛋白质特征向量集合 R。

(2)装置根据R涉及的的蛋白质集合P，构造|P|行，|P|列的空白矩阵C。

(3)装置对蛋白质二元组(a,b)，根据其特征向量r_a和r_b，对蛋白质相互作用率矩阵C，计算蛋白质相互作用率c_a,b和c_b,a。

(4)装置判断已处理完所有的蛋白质二元组，若是，则执行步骤(5)，否则，执行步骤(3)。

(5)装置将C存储至数据模块的相互作用率存储单元。

如图4所示为缺失蛋白质相互作用关系补足流程。缺失蛋白质相互作用关系补足流程包括：

(1)装置接收服务器对蛋白质二元组(a,b)间缺失的相互作用关系进行补足的指令。

(2)装置从数据模块的相互作用率存储单元中取出蛋白质二元组(a,b)的相互作用率。

(3)装置对蛋白质二元组(a,b)间缺失的相互作用关系进行补足。

本发明专门作用于稀疏高通量筛选数据，能够对缺失蛋白质相互作用关系进行基于统计规律的、准确的补足，以解决生物计算学领域，基于稀疏的高通量筛选数据，对缺失蛋白质相互作用关系进行准确补足的技术问题。

下面，对本发明所提供的缺失蛋白质相互作用关系补足装置和方法进行详细说明。

图2为本发明实施例中特征转换流程示意图。参见图2，该过程包括：

步骤201：装置接收服务器采集的高通量筛选数据集合。

本步骤中，服务器向装置发送高通量筛选数据集合的方式可以是：定期、或根据所述装置的通知、或根据某服务器的通知，将采集的高通量筛选数据集合发送给装置。

步骤202：装置对高通量筛选数据集合对应的蛋白质集合P中的蛋白质a，构造长度为|P|的特征向量r_a。

本步骤中，装置构造特征向量r_a的具体方式为，根据服务器发送的高通量筛选数据对应的蛋白质集合P，求其势|P|，再根据|P|，建立长度为|P|的空白特征向量r_a。

步骤203：装置按照高通量筛选数据集合，对r_a中的每一元素的值进行设置。

本步骤中，装置按照高通量筛选数据集合，对r_a中的每一元素值进行设置的具体方式为，对于r_a当前的每一元素r_a(b)，令其对应蛋白b，并根据当前的高通量筛选数据集合，判断蛋白质二元组(a,b)是否存在相互作用关系，若是，则令r_a(b)＝1；若否，则令r_a(b)＝0。

步骤204：装置判断已处理r_a中的所有元素。

本步骤中，装置检验对于特征向量r_a，其所有元素是否均已进行处理。

步骤205：装置将r_a存储至数据模块的特征向量存储单元。

本步骤中，装置在完成对r_a中的所有元素的处理后，将得到的特征向量 r_a存储至数据模块120的特征向量存储单元。

步骤206：装置判断已处理完P中所有的蛋白质。

本步骤中，装置检验P中的所有蛋白质，是否已完成特征转换处理。

步骤207：装置执行蛋白质相互作用率矩阵构造过程。

本步骤中，装置对P中的所有蛋白质，均已完成特征转换处理，装置调用蛋白质相互作用率矩阵构造过程。

图3为本发明实施例中蛋白质相互作用率矩阵构造流程。参见图3，该过程包括：

步骤301：装置从从数据模块的特征向量存储单元中取出蛋白质特征向量集合R。

步骤302：装置根据R涉及的蛋白质集合P，构造|P|行，|P|列的空白矩阵 C。

本步骤中，装置构造空白矩阵C的具体方式为，根据从数据模块的特征向量存储单元中取出的特征向量集合R，其对应的蛋白质集合P，求其势|P|，再根据|P|，建立|P|行，|P|列的空白矩阵C。

步骤303：装置对蛋白质二元组(a,b)，根据其特征向量r_a和r_b，对蛋白质相互作用率矩阵C，计算蛋白质相互作用率c_a,b和c_b,a。对于P中的所有蛋白质，使用1～|P|的正整数进行顺序编号，每个蛋白质的编号唯一。然后，对于每个蛋白质，例如编号为a的蛋白质，构造一个长度为|P|的特征向量r_a；所有蛋白质的特征向量构成蛋白质特征向量集合R；R是一个包含了|P|个向量的集合。对于R中的每个蛋白质特征向量，例如对应于编号为a的蛋白质特征向量r_a，其都包含|P|个元素，按照1～|P|的顺序进行排列，令第b个元素，即r_a(b)，对应于P中编号为b的蛋白质。

本步骤中，装置对蛋白质二元组(a,b)，根据其特征向量r_a和r_b，对蛋白质相互作用率矩阵C，计算蛋白质相互作用率c_a,b和c_b,a，以如下公式表示：

$c_{a, b} = c_{b, a} = \frac{1}{1 + e^{- \frac{< r_{a}, r_{b} >}{(| | r_{a} | | + β) (| | r_{b} | | + β)}}},$

其中，<r_a,r_b>表示求特征向量r_a和r_b的内积，||r_a||和||r_b||表示对特征向量r_a和r_b求模，β表示饱和抑制参数，为大于1的正整数，如15。上述公式的物理意义是，首先根据特征向量r_a和r_b，计算其向量相似性，并使用饱和抑制方法抑制特征向量r_a和r_b的模对计算所得的相似性的影响；然后使用sigmoid函数对相似性进行映射，以达到在对相似度敏感性进行锐化的目的。

步骤304：装置判断已处理完所有的蛋白质二元组。

本步骤中，装置检验对特征向量集合R对应的蛋白质集合P，其任意的二元组(a,b)均已进行处理。

步骤305：装置将C存储至数据模块120的相互作用率存储单元122。

本步骤中，装置在完成蛋白质相互作用率矩阵C的构造后，将得到的蛋白质相互作用率矩阵C存储至数据模块120的相互作用率存储单元122。

图4为本发明实施例中缺失蛋白质相互作用关系补足流程示意图。参见图 4，该过程包括：

步骤401：装置接收服务器对蛋白质二元组(a,b)间缺失的相互作用关系进行补足的指令。

本步骤中，服务器向装置发送指令的方式可以是：定期、或根据所述装置的通知、或根据某服务器的通知，将要求对蛋白质二元组(a,b)间缺失的相互作用关系进行补足的指令发送给装置。

步骤402：装置从数据模块120的相互作用率存储单元122中取出蛋白质二元组(a,b)的相互作用率。

本步骤中，装置从数据模块120的相互作用率存储单元122中取出蛋白质二元组(a,b)的相互作用率，即c_a,b。

步骤403：装置对蛋白质二元组(a,b)间缺失的相互作用关系进行补足。

本步骤中，装置对蛋白质二元组(a,b)间缺失的相互作用关系进行补足，以下述公式表示：

其中，z_a,b和z_b,a表示蛋白质二元组(a,b)间缺失的相互作用关系，γ表示判断阈值，为开区间(0,1)内的正数，如0.3。表示对c_a,b和γ之差进行向上取整。上述公式的物理意义为，若蛋白质二元组(a,b)对应的相互作用率c_a,b大于判断阈值γ，则认为蛋白质二元组(a,b)间存在尚未被发现的相互作用关系，并对其进行补足；若蛋白质二元组(a,b)对应的相互作用率c_a,b小于判断阈值γ，则认为蛋白质二元组(a,b)间不存在尚未被发现的相互作用关系，并对其进行标记。

为了验证上述基于缺失蛋白质相互作用关系补足装置和方法，我们在PC 机上(配置：INTEL i5-760，2.8G处理器，8G内存)安装了本装置，并运行仿真实验进行实例分析。在实例分析中，采用的高通量筛选数据来源于Wang Lab收集的高通筛选数据，该数据集包含对6000个靶蛋白进行测定的63000 项相互作用高通筛选数据。在实例分析中，采用的验证数据为高通筛选数据集对应的蛋白质集合，所关联的基因本体数据(数据来源： http://www.geneontology.org)。基于验证数据，我们对应用本装置前后，基于稀疏的高通筛选数据对缺失蛋白质相互作用关系进行补足，其补足结果在基因本体数据上的功能相似性覆盖率进行了比较。功能相似性覆盖率越高，说明对缺失蛋白质相互作用关系进行补足的准确度越高。

图5为应用本发明实施例前后，对缺失蛋白质相互作用关系进行补足准确度对比。参见图5，应用本发明实施例后，基于稀疏高通量筛选数据，对缺失蛋白质相互作用关系进行补足时，补足结果在基因本体数据上的功能相似性覆盖率有明显上升，进行缺失蛋白质相互作用关系补足的准确度有明显提高。

由上述技术方案可见，本发明实施例提供了一种缺失蛋白质相互作用关系补足方法，其专门作用于稀疏高通量筛选数据，能够对缺失蛋白质相互作用关系进行基于统计规律的、准确的补足，以解决生物计算学领域，基于稀疏的高通量筛选数据，对缺失蛋白质相互作用关系进行准确补足的技术问题。

在本说明书的描述中，参考术语“一个实施例”、“一些实施例”、“示例”、 “具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中，对上述术语的示意性表述不一定指的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

尽管已经示出和描述了本发明的实施例，本领域的普通技术人员可以理解：在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型，本发明的范围由权利要求及其等同物限定。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 一种缺失蛋白质相互作用关系补足方法和装置 [P] . 中国专利： CN104636637B . 2017.08.29
2. 一种缺失蛋白质相互作用关系补足方法和装置 [P] . 中国专利： CN104636637A . 2015-05-20
3. Method for the production of one or more proteu00ecnas, library of proteu00ecnas labelled, method for the production of a set of proteu00ecnas, arrangement.Methods of screening for one or more compounds for biological activity of one or more proteu00ecnas for interactions of proteu00ecna - proteu00ecna and proteu00ecna - specific nucleic acid, use of an arrangement.Methods for the generation of a set of antibodies, and sorting of abund dependence for the or function of proteu00ecnas, and use of a proteu00ecna labelled. [P] . BR0113330A . 2003-12-30

机译：产生一个或多个蛋白质的方法，加标签的蛋白质的文库，产生一组蛋白质的方法，排列。筛选一种或多种化合物对一种或多种蛋白质的生物活性的方法用于蛋白质-蛋白质和特定核酸的相互作用的核酸，一种排列的使用，用于产生一组抗体的方法，以及对蛋白质或蛋白质的功能依赖性的分类，以及使用标有标签的蛋白质。
4. METHOD AND DEVICE FOR PREDICTING INTERACTION RELATIONSHIP BETWEEN MEMBRANE PROTEIN RESIDUES [P] . 世界知识产权组织专利： WO2018120128A1 . 2018-07-05

机译：预测膜蛋白残基之间相互作用关系的方法和装置
5. Protein interaction prediction apparatus, protein interaction prediction method, protein interaction prediction program, and recording medium recording the program [P] . 日本专利： JP4320145B2 . 2009-08-26

机译：蛋白质相互作用预测装置，蛋白质相互作用预测方法，蛋白质相互作用预测程序以及记录该程序的记录介质