首页> 中国专利> 一种缺失蛋白质相互作用关系补足方法和装置

一种缺失蛋白质相互作用关系补足方法和装置

摘要

本发明公开了一种缺失蛋白质相互作用关系补足方法和装置,包括:S1,特征转换模块接收服务器采集的高通量筛选数据集合,将高通量筛选数据集合转化为蛋白质集合的特征向量集合,并将特征向量集合存储到数据模块;S2,数据模块存储由特征转换模块转化的蛋白质特征向量集合以及存储相互作用率计算模块计算的蛋白质相互作用率矩阵;S3,相互作用率计算模块特征向量集合,执行蛋白质相互作用率矩阵构造过程,并将构造完成的蛋白质相互作用率矩阵存入数据模块;S4,补足模块接收到服务器对蛋白质二元组之间进行补足的指令后,根据数据模块的相互作用率存储单元中存放的蛋白质相互作用率矩阵,对蛋白质二元组之间缺失的相互作用关系进行补足。

著录项

  • 公开/公告号CN104636637A

    专利类型发明专利

  • 公开/公告日2015-05-20

    原文格式PDF

  • 申请/专利权人 重庆大学;

    申请/专利号CN201510087543.6

  • 发明设计人 罗辛;夏云霓;

    申请日2015-02-25

  • 分类号G06F19/18;

  • 代理机构重庆市前沿专利事务所(普通合伙);

  • 代理人郭云

  • 地址 400020 重庆市沙坪坝区沙正街174号

  • 入库时间 2023-12-18 08:44:53

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2017-08-29

    授权

    授权

  • 2017-07-28

    专利申请权的转移 IPC(主分类):G06F19/18 登记生效日:20170711 变更前: 变更后: 申请日:20150225

    专利申请权、专利权的转移

  • 2015-06-17

    实质审查的生效 IPC(主分类):G06F19/18 申请日:20150225

    实质审查的生效

  • 2015-05-20

    公开

    公开

说明书

技术领域

本发明涉及计算机计算生物学领域,特别涉及计算生物学中,一种缺失蛋 白质相互作用关系补足方法和装置。

背景技术

近年来,组合化学的长足发展使得短时间合成大量化合物成为可能,且遗 传学研究,如人类基因组计划等,使靶蛋白数量以几何级数增加。传统小规模 实验方法难以处理飞速增长的蛋白质分子,无法对其相互作用网络进行全面探 索;导致对高通量筛选(High Throughput Screening)技术的迫切需求。高通 量筛选技术,根据待测样品的合成路线,包括液相和固相筛选;根据筛选目标 物,包括纯蛋白受体亲合性筛选、酶活性筛选、细胞活性筛选等。高通量筛选 技术主要包括放射性染料筛选、荧光筛选、闪烁接近化验、酶连接免疫吸收剂 化验、细胞功能筛选小鼠显型表型遗传学等方法。

高通量筛选技术具备很高的执行效率,对比小规模实验方法,能减少筛选 单位的数量,并自动化重复工作,同时还能简化筛选过程和降低筛选成本。尽 管高通量筛选技术具备很高的执行效率,基于此技术对全部的蛋白质相互作用 关系进行彻底的搜索和标定仍然需要耗费巨量的时间和人力、物力成本。因此, 对已有的高通量筛选数据,如果能应用计算机技术对其进行分析,并在此基础 上对缺失蛋白质相互作用关系进行准确的补足,将能极大加快对蛋白质相互作 用网络的探索进程。

现有基于计算机数据分析的缺失蛋白质相互作用关系补足方法主要包括 基于知识的方法、基于信息整合的方法、基于重复实验的方法和基于高通量数 据网络拓扑结构的方法。其中,基于知识的方法和基于信息整合的方法需要对 涉及靶蛋白的性质进行进一步的分析,导致很大的工作量和分析成本;基于重 复试验的方法则需要重复进行传统小规模实验或者高通量筛选实验,同样会耗 费巨大的人力物力成本。基于高通量网络拓扑结构的方法,其主要优势在于只 需要获得高通量筛选数据,即可对其对应的蛋白质相互作用网络进行拓扑结构 分析,在此基础上对缺失的蛋白质相互作用关系进行补足。但是,基于高通量 网络拓扑结构的方法在处理稀疏的蛋白质相互作用网络时,其性能会急剧降 低。然而,受实际成本限制,现有的高通量筛选数据往往是稀疏的。因此,如 何对在数据稀疏的条件下,对缺失蛋白质相互作用关系进行补足,是计算生物 学领域的一个关键技术问题。

发明内容

本发明旨在至少解决现有技术中存在的技术问题,特别创新地提出了一种 缺失蛋白质相互作用关系补足装置和方法。

为了实现本发明的上述目的,本发明提供了一种缺失蛋白质相互作用关系 补足方法,其关键在于,包括如下步骤:

S1,特征转换模块接收服务器采集的高通量筛选数据集合,执行特征转换 过程,将高通量筛选数据集合转化为蛋白质集合的特征向量集合,并将特征向 量集合存储到数据模块;

S2,数据模块存储由特征转换模块转化的蛋白质特征向量集合以及存储相 互作用率计算模块计算的蛋白质相互作用率矩阵;

S3,相互作用率计算模块根据数据模块存储的特征向量集合,执行蛋白质 相互作用率矩阵构造过程,并将构造完成的蛋白质相互作用率矩阵存入数据模 块;

S4,补足模块接收到服务器对蛋白质二元组之间缺失的相互作用关系进行 补足的指令后,根据数据模块的相互作用率存储单元中存放的蛋白质相互作用 率矩阵,执行缺失蛋白质相互作用关系补足过程,对蛋白质二元组之间缺失的 相互作用关系进行补足。

所述的缺失蛋白质相互作用关系补足方法,优选的,所述S1包括:

S1-1,接收服务器采集的高通量筛选数据集合;

S1-2,对高通量筛选数据集合对应的蛋白质集合P中的所有蛋白质,按照 1~|P|进行顺序编号,构造长度为|P|的特征向量ra,a指编号为第a个蛋白质;

S1-3,按照高通量筛选数据集合,对特征向量ra中的每一个元素的值进行 设置;

S1-4,判断特征向量ra中的所有元素是否已执行步骤S1-3,若都执行完毕, 则执行S1-5,否则,执行S1-3;

S1-5,将特征向量ra存储至数据模块的特征向量存储单元;

S1-6,判断是否已处理完蛋白质集合P中所有的蛋白质,若处理完毕,则 执行S1-7,否则,执行S1-2;

S1-7,执行蛋白质相互作用率矩阵构造过程。

所述的缺失蛋白质相互作用关系补足方法,优选的,所述S2包括:

S2-1,特征向量存储单元存储由特征转换模块转化的特征向量集合,将特 征向量集合发送到相互作用率计算模块进行蛋白质相互作用率矩阵构造;

S2-2,相互作用率存储单元存储相互作用率计算模块根据特征向量集合构 造的蛋白质相互作用率矩阵。

所述的缺失蛋白质相互作用关系补足方法,优选的,所述S3包括:

S3-1,从数据模块的特征向量存储单元中取出蛋白质特征向量集合R;

S3-2,根据蛋白质特征向量集合R涉及的蛋白质集合P,构造|P|行,|P| 列的空白矩阵C;

S3-3,对于ra的每一元素ra(b),令其对应蛋白质b,对蛋白质二元组(a,b), 根据其特征向量ra和rb,对蛋白质相互作用率矩阵C,计算蛋白质相互作用率 Ca,b和Cb,a

S3-4,判断是否处理完所有的蛋白质二元组,若处理完毕,则执行S3-5, 否则,执行S3-3;

S3-5,将C存储至数据模块的相互作用率存储单元。

所述的缺失蛋白质相互作用关系补足方法,优选的,所述S4包括:

S4-1,接收服务器对蛋白质二元组(a,b)间缺失的相互作用关系进行补足的 指令;

S4-2,从数据模块的相互作用率存储单元中取出蛋白质二元组(a,b)的相互 作用率;

S4-3,对蛋白质二元组(a,b)间缺失的相互作用关系进行补足。

所述的缺失蛋白质相互作用关系补足方法,优选的,所述S1-3包括:

对于ra当前的每一元素ra(b),令其对应蛋白质为b,并根据当前的高通量 筛选数据集合,判断蛋白质二元组(a,b)是否存在相互作用关系,若存在相互作 用关系,则令ra(b)=1;若不存在相互作用关系,则令ra(b)=0。

所述的缺失蛋白质相互作用关系补足方法,优选的,所述S3-3包括:

对蛋白质二元组(a,b),根据其特征向量ra和rb,对蛋白质相互作用率矩阵 C,计算蛋白质相互作用率Ca,b和Cb,a,以如下公式表示:

ca,b=cb,a=11+e-<ra,rb>(||ra||+β)(||rb||+β),

其中,<ra,rb>表示求特征向量ra和rb的内积,||ra||和||rb||表示对特征向量ra和rb求模,β表示饱和抑制参数,为大于1的正整数,上述公式是根据特征向 量ra和rb,计算其向量相似性,然后使用sigmoid函数对相似性进行映射。

所述的缺失蛋白质相互作用关系补足方法,优选的,所述S4-3包括:

对蛋白质二元组(a,b)间缺失的相互作用关系进行补足,以下述公式表示:

其中,za,b和zb,a表示蛋白质二元组(a,b)间缺失的相互作用关系,γ表示判 断阈值,为开区间(0,1)内的正数,表示对ca,b和γ之差进行向上 取整,上述公式为,若蛋白质二元组(a,b)对应的相互作用率ca,b大于判断阈值 γ,则认为蛋白质二元组(a,b)间存在尚未被发现的相互作用关系,并对其进行 补足;若蛋白质二元组(a,b)对应的相互作用率ca,b小于判断阈值γ,则认为蛋 白质二元组(a,b)间不存在尚未被发现的相互作用关系,并对其进行标记。

本发明公开一种缺失蛋白质相互作用关系补足装置,其关键在于,包括:

特征转换模块,用于接收服务器采集的高通量筛选数据集合,执行特征转 换过程,将高通量筛选数据集合转化为蛋白质集合的特征向量集合,并将特征 向量集合存储到数据模块;

数据模块,用于存储由特征转换模块转化的蛋白质特征向量集合,以及相 互作用率计算模块计算的蛋白质相互作用率矩阵;

相互作用率计算模块,用于根据数据模块存储的特征向量集合,执行蛋白 质相互作用率矩阵构造过程,并将构造完成的蛋白质相互作用率矩阵存入数据 模块;

补足模块,用于接收到服务器对蛋白质二元组之间缺失的相互作用关系进 行补足的指令后,根据数据模块的相互作用率存储单元中存放的蛋白质相互作 用率矩阵,执行缺失蛋白质相互作用关系补足过程,对蛋白质二元组之间缺失 的相互作用关系进行补足。

所述的缺失蛋白质相互作用关系补足装置,优选的,所述数据模块包括:

特征向量存储单元,用于存储由特征转换模块转化的特征向量集合,将特 征向量集合发送到相互作用率计算模块进行蛋白质相互作用率矩阵构造;

相互作用率存储单元,用于存储相互作用率计算模块根据特征向量集合构 造的蛋白质相互作用率矩阵。

综上所述,由于采用了上述技术方案,本发明的有益效果是:

特征转换模块接收服务器采集的高通量筛选数据集合,执行特征转换过 程,将高通量筛选数据集合转化为其所涉及的蛋白质集合的特征向量集合,并 将特征向量集合存储到装置的数据模块;数据模块存储由特征转换模块转化的 蛋白质特征向量集合,以及相互作用率计算模块计算的蛋白质相互作用率矩 阵;包括特征向量存储单元,存储由特征转换模块转化的特征向量集合;相互 作用率存储单元,存储相互作用率计算模块根据特征向量集合构造的蛋白质相 互作用率矩阵;相互作用率计算模块根据装置存储的特征向量集合,执行蛋白 质相互作用率矩阵构造过程,并将构造完成的蛋白质相互作用率矩阵存入数据 模块的相互作用率存储单元;补足模块接收到服务器对蛋白质二元组(a,b)间缺 失的相互作用关系进行补足的指令后,根据数据模块的相互作用率存储单元中 存放的蛋白质相互作用率矩阵,执行缺失蛋白质相互作用关系补足过程,对蛋 白质二元组(a,b)间缺失的相互作用关系进行补足。

本发明提供一种缺失蛋白质相互作用关系补足装置和方法,其专门作用于 对应稀疏高通量筛选数据,能够对缺失蛋白质相互作用关系进行基于统计规律 的、准确的补足,以解决生物计算学领域,基于稀疏的高通量筛选数据,对缺 失蛋白质相互作用关系进行准确补足的技术问题。

本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描 述中变得明显,或通过本发明的实践了解到。

附图说明

本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中 将变得明显和容易理解,其中:

图1为本发明缺失蛋白质相互作用关系补足装置结构示意图;

图2为本发明特征转换流程图;

图3为本发明蛋白质相互作用率矩阵构造流程图;

图4为本发明缺失蛋白质相互作用关系补足流程图;

图5为应用本发明实施例前后,对缺失蛋白质相互作用关系进行补足准确 度对比。

具体实施方式

下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自 始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元 件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能 理解为对本发明的限制。

在本发明的描述中,需要理解的是,术语“纵向”、“横向”、“上”、“下”、“前”、 “后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”“内”、“外”等指示的方位或位 置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描 述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位 构造和操作,因此不能理解为对本发明的限制。

在本发明的描述中,除非另有规定和限定,需要说明的是,术语“安装”、 “相连”、“连接”应做广义理解,例如,可以是机械连接或电连接,也可以是两 个元件内部的连通,可以是直接相连,也可以通过中间媒介间接相连,对于本 领域的普通技术人员而言,可以根据具体情况理解上述术语的具体含义。

本发明提供一种缺失蛋白质相互作用关系补足装置和方法,其专门作用于 稀疏高通量筛选数据,能够对缺失蛋白质相互作用关系进行基于统计规律的、 准确的补足,以解决生物计算学领域,基于稀疏的高通量筛选数据,对缺失蛋 白质相互作用关系进行准确补足的技术问题。

图1为本发明缺失蛋白质相互作用关系补足装置(以下简称装置)结构示 意图。装置包括:

特征转换模块:接收服务器采集的高通量筛选数据集合,执行特征转换过 程,将高通量筛选数据集合转化为其所涉及的蛋白质集合的特征向量集合,并 将特征向量集合存储到装置的数据模块。

数据模块:存储由特征转换模块转化的蛋白质特征向量集合,以及相互作 用率计算模块计算的蛋白质相互作用率矩阵;包括特征向量存储单元,存储由 特征转换模块转化的特征向量集合;相互作用率存储单元,存储相互作用率计 算模块根据特征向量集合构造的蛋白质相互作用率矩阵。

相互作用率计算模块:根据装置存储的特征向量集合,执行蛋白质相互作 用率矩阵构造过程,并将构造完成的蛋白质相互作用率矩阵存入数据模块的相 互作用率存储单元。

补足模块:接收到服务器对蛋白质二元组(a,b)间缺失的相互作用关系进行 补足的指令后,根据数据模块的相互作用率存储单元中存放的蛋白质相互作用 率矩阵,执行缺失蛋白质相互作用关系补足过程,对蛋白质二元组(a,b)间缺失 的相互作用关系进行补足。

本装置可部署于一个现有的服务器中,也可部署于一个单独设置的、专用 于进行缺失蛋白质相互作用关系补足的服务器中。

如图2所示为特征转换流程。特征转换流程包括:

(1)装置接收服务器采集的高通量筛选数据集合。

(2)装置对高通量筛选数据集合对应的蛋白质集合P中的蛋白质a,构 造长度为|P|的特征向量ra

(3)装置按照高通量筛选数据集合,对ra中的每一元素的值进行设置。

(4)装置判断判断已处理ra中的所有元素,若是,则执行步骤(5),否 则,执行步骤(3)。

(5)装置将ra存储至数据模块的特征向量存储单元。

(6)装置判断已处理完P中所有的蛋白质,若是,则执行步骤(7),否 则,执行步骤(2)。

(7)装置执行蛋白质相互作用率矩阵构造过程。

如图3所示为蛋白质相互作用率矩阵构造流程。蛋白质相互作用率矩阵构 造流程包括:

(1)装置从从数据模块的特征向量存储单元中取出蛋白质特征向量集合 R。

(2)装置根据R涉及的的蛋白质集合P,构造|P|行,|P|列的空白矩阵C。

(3)装置对蛋白质二元组(a,b),根据其特征向量ra和rb,对蛋白质相互 作用率矩阵C,计算蛋白质相互作用率ca,b和cb,a

(4)装置判断已处理完所有的蛋白质二元组,若是,则执行步骤(5), 否则,执行步骤(3)。

(5)装置将C存储至数据模块的相互作用率存储单元。

如图4所示为缺失蛋白质相互作用关系补足流程。缺失蛋白质相互作用关 系补足流程包括:

(1)装置接收服务器对蛋白质二元组(a,b)间缺失的相互作用关系进行补 足的指令。

(2)装置从数据模块的相互作用率存储单元中取出蛋白质二元组(a,b)的 相互作用率。

(3)装置对蛋白质二元组(a,b)间缺失的相互作用关系进行补足。

本发明专门作用于稀疏高通量筛选数据,能够对缺失蛋白质相互作用关系 进行基于统计规律的、准确的补足,以解决生物计算学领域,基于稀疏的高通 量筛选数据,对缺失蛋白质相互作用关系进行准确补足的技术问题。

下面,对本发明所提供的缺失蛋白质相互作用关系补足装置和方法进行详 细说明。

图2为本发明实施例中特征转换流程示意图。参见图2,该过程包括:

步骤201:装置接收服务器采集的高通量筛选数据集合。

本步骤中,服务器向装置发送高通量筛选数据集合的方式可以是:定期、 或根据所述装置的通知、或根据某服务器的通知,将采集的高通量筛选数据集 合发送给装置。

步骤202:装置对高通量筛选数据集合对应的蛋白质集合P中的蛋白质a, 构造长度为|P|的特征向量ra

本步骤中,装置构造特征向量ra的具体方式为,根据服务器发送的高通量 筛选数据对应的蛋白质集合P,求其势|P|,再根据|P|,建立长度为|P|的空白特 征向量ra

步骤203:装置按照高通量筛选数据集合,对ra中的每一元素的值进行设 置。

本步骤中,装置按照高通量筛选数据集合,对ra中的每一元素值进行设置 的具体方式为,对于ra当前的每一元素ra(b),令其对应蛋白b,并根据当前的 高通量筛选数据集合,判断蛋白质二元组(a,b)是否存在相互作用关系,若是, 则令ra(b)=1;若否,则令ra(b)=0。

步骤204:装置判断已处理ra中的所有元素。

本步骤中,装置检验对于特征向量ra,其所有元素是否均已进行处理。

步骤205:装置将ra存储至数据模块的特征向量存储单元。

本步骤中,装置在完成对ra中的所有元素的处理后,将得到的特征向量 ra存储至数据模块120的特征向量存储单元。

步骤206:装置判断已处理完P中所有的蛋白质。

本步骤中,装置检验P中的所有蛋白质,是否已完成特征转换处理。

步骤207:装置执行蛋白质相互作用率矩阵构造过程。

本步骤中,装置对P中的所有蛋白质,均已完成特征转换处理,装置调用 蛋白质相互作用率矩阵构造过程。

图3为本发明实施例中蛋白质相互作用率矩阵构造流程。参见图3,该过 程包括:

步骤301:装置从从数据模块的特征向量存储单元中取出蛋白质特征向量 集合R。

步骤302:装置根据R涉及的蛋白质集合P,构造|P|行,|P|列的空白矩阵 C。

本步骤中,装置构造空白矩阵C的具体方式为,根据从数据模块的特征 向量存储单元中取出的特征向量集合R,其对应的蛋白质集合P,求其势|P|, 再根据|P|,建立|P|行,|P|列的空白矩阵C。

步骤303:装置对蛋白质二元组(a,b),根据其特征向量ra和rb,对蛋白质 相互作用率矩阵C,计算蛋白质相互作用率ca,b和cb,a。对于P中的所有蛋白质, 使用1~|P|的正整数进行顺序编号,每个蛋白质的编号唯一。然后,对于每个 蛋白质,例如编号为a的蛋白质,构造一个长度为|P|的特征向量ra;所有蛋白 质的特征向量构成蛋白质特征向量集合R;R是一个包含了|P|个向量的集合。 对于R中的每个蛋白质特征向量,例如对应于编号为a的蛋白质特征向量ra, 其都包含|P|个元素,按照1~|P|的顺序进行排列,令第b个元素,即ra(b),对 应于P中编号为b的蛋白质。

本步骤中,装置对蛋白质二元组(a,b),根据其特征向量ra和rb,对蛋白质 相互作用率矩阵C,计算蛋白质相互作用率ca,b和cb,a,以如下公式表示:

ca,b=cb,a=11+e-<ra,rb>(||ra||+β)(||rb||+β),

其中,<ra,rb>表示求特征向量ra和rb的内积,||ra||和||rb||表示对特征向量ra和rb求模,β表示饱和抑制参数,为大于1的正整数,如15。上述公式的物理意义 是,首先根据特征向量ra和rb,计算其向量相似性,并使用饱和抑制方法抑制 特征向量ra和rb的模对计算所得的相似性的影响;然后使用sigmoid函数对相 似性进行映射,以达到在对相似度敏感性进行锐化的目的。

步骤304:装置判断已处理完所有的蛋白质二元组。

本步骤中,装置检验对特征向量集合R对应的蛋白质集合P,其任意的二 元组(a,b)均已进行处理。

步骤305:装置将C存储至数据模块120的相互作用率存储单元122。

本步骤中,装置在完成蛋白质相互作用率矩阵C的构造后,将得到的蛋 白质相互作用率矩阵C存储至数据模块120的相互作用率存储单元122。

图4为本发明实施例中缺失蛋白质相互作用关系补足流程示意图。参见图 4,该过程包括:

步骤401:装置接收服务器对蛋白质二元组(a,b)间缺失的相互作用关系进 行补足的指令。

本步骤中,服务器向装置发送指令的方式可以是:定期、或根据所述装置 的通知、或根据某服务器的通知,将要求对蛋白质二元组(a,b)间缺失的相互 作用关系进行补足的指令发送给装置。

步骤402:装置从数据模块120的相互作用率存储单元122中取出蛋白质 二元组(a,b)的相互作用率。

本步骤中,装置从数据模块120的相互作用率存储单元122中取出蛋白质 二元组(a,b)的相互作用率,即ca,b

步骤403:装置对蛋白质二元组(a,b)间缺失的相互作用关系进行补足。

本步骤中,装置对蛋白质二元组(a,b)间缺失的相互作用关系进行补足,以 下述公式表示:

其中,za,b和zb,a表示蛋白质二元组(a,b)间缺失的相互作用关系,γ表示判断阈 值,为开区间(0,1)内的正数,如0.3。表示对ca,b和γ之差进行向 上取整。上述公式的物理意义为,若蛋白质二元组(a,b)对应的相互作用率ca,b大于判断阈值γ,则认为蛋白质二元组(a,b)间存在尚未被发现的相互作用关 系,并对其进行补足;若蛋白质二元组(a,b)对应的相互作用率ca,b小于判断阈 值γ,则认为蛋白质二元组(a,b)间不存在尚未被发现的相互作用关系,并对其 进行标记。

为了验证上述基于缺失蛋白质相互作用关系补足装置和方法,我们在PC 机上(配置:INTEL i5-760,2.8G处理器,8G内存)安装了本装置,并运行 仿真实验进行实例分析。在实例分析中,采用的高通量筛选数据来源于Wang  Lab收集的高通筛选数据,该数据集包含对6000个靶蛋白进行测定的63000 项相互作用高通筛选数据。在实例分析中,采用的验证数据为高通筛选数据集 对应的蛋白质集合,所关联的基因本体数据(数据来源: http://www.geneontology.org)。基于验证数据,我们对应用本装置前后,基于 稀疏的高通筛选数据对缺失蛋白质相互作用关系进行补足,其补足结果在基因 本体数据上的功能相似性覆盖率进行了比较。功能相似性覆盖率越高,说明对 缺失蛋白质相互作用关系进行补足的准确度越高。

图5为应用本发明实施例前后,对缺失蛋白质相互作用关系进行补足准确 度对比。参见图5,应用本发明实施例后,基于稀疏高通量筛选数据,对缺失 蛋白质相互作用关系进行补足时,补足结果在基因本体数据上的功能相似性覆 盖率有明显上升,进行缺失蛋白质相互作用关系补足的准确度有明显提高。

由上述技术方案可见,本发明实施例提供了一种缺失蛋白质相互作用关系 补足方法,其专门作用于稀疏高通量筛选数据,能够对缺失蛋白质相互作用关 系进行基于统计规律的、准确的补足,以解决生物计算学领域,基于稀疏的高 通量筛选数据,对缺失蛋白质相互作用关系进行准确补足的技术问题。

在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、 “具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特 征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明 书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描 述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中 以合适的方式结合。

尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理 解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、 修改、替换和变型,本发明的范围由权利要求及其等同物限定。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号