首页> 中国专利> 通过对存活事件进行联合建模来确定潜在的癌症治疗靶标

通过对存活事件进行联合建模来确定潜在的癌症治疗靶标

页面导航

摘要
著录项
说明书
相似文献

摘要

描述了通过对癌症存活事件的联合建模来促进确定潜在的癌症基因治疗靶标的技术。在一个实施例中，计算机实现包括由可操作地耦合至处理器的设备采用多任务学习模型以基于分别存活于不同类型的癌症的患者组的癌症存活数据和患者遗传数据来确定分别与不同类型的癌症相关联的活性遗传因子。该计算机实现的方法进一步包括，由该设备确定在不同类型的癌症中的两种或更多种类型的癌症之间共享的这些活性遗传因子的共同活性遗传因子。

著录项

公开/公告号CN112204667A

专利类型发明专利
公开/公告日2021-01-08

原文格式PDF
申请/专利权人国际商业机器公司;
展开▼

申请/专利号CN201980035553.1
发明设计人孙兆楠;Z·沙恩;张平;王飞;胡建英;
展开▼

申请日2019-05-13
分类号G16B40/00(20060101);G16H10/60(20060101);
代理机构11247 北京市中咨律师事务所;
代理人于静;杨晓光
地址美国纽约
入库时间 2023-06-19 09:29:07

说明书

背景技术

本申请涉及用于通过对真实世界患者存活事件进行联合建模系统地确定潜在癌症治疗靶标的技术。

发明内容

下面给出提供对本发明的一个或多个实施例的基本理解的内容提要。本内容提要不旨在标识关键或重要元素，也不旨在描绘不同实施例的任何范围或权利要求的任何范围。其唯一目的是呈现简化形式的概念，作为稍后呈现的更详细描述的前序。在本文所述的一个或多个实施例中，提供了系统、计算机实现的方法、装置和/或计算机程序产品，其提供用于通过对真实世界患者存活事件进行联合建模来系统地确定潜在癌症治疗靶标的技术。

根据本发明的实施例，一种系统可以包括存储计算机可执行组件的存储器和执行存储在存储器中的计算机可执行组件的处理器。计算机可执行组件可包含活性遗传因子识别组件，其使用多任务学习模型评估分别存活于不同类型的癌症的患者组的癌症存活数据和患者基因组数据，以识别与不同类型的癌症分别相关联的活性遗传因子。计算机可执行组件可进一步包含疾病关联组件，其确定在不同类型的癌症中的两种或更多种类型的癌症之间共享的活性遗传因子的共同活性遗传因子。在一些实现方式中，所述系统还可以包括评分组件，所述评分组件根据所述多任务学习模型确定所述活性遗传因子的分数，所述分数分别表示所述活性遗传因子与分别与所述活性遗传因子相关联的不同类型的癌症之间的关联程度。该系统还可以包括选择组件，该选择组件基于分别与所述活性遗传因子中的一个或多个活性遗传因子相关联的分数来选择所述一个或多个活性遗传因子作为基因治疗靶标。

在一些实施例中，多任务学习模型将确定分别与不同类型的癌症相关联的活性遗传因子的多个任务建模为优化问题。通过这些实施例，疾病关联组件可以基于在不同类型的癌症的子集中包括的相应类型的癌症之间共享的共同活性遗传因子的数目来确定代表不同类型的癌症的子集之间的关系的关系参数。在一些实现方式中，关系参数可以包括基于在所述子集中包括的相应类型的癌症之间共享的共同活性遗传因子的数量为所述子集确定的关联分数，其中所述关联分数反映相应类型的癌症相关的程度。该系统还可包括优化组件，该优化组件基于关系参数来更新多任务学习模型，由此生成更新的多任务学习模型，并且指导所述活性遗传因子识别组件采用所述更新的多任务学习模型来基于所述癌症存活数据和所述患者基因组数据识别分别与所述不同类型的癌症相关联的更新的活性遗传因子。在一些实施例中，疾病关联组件可以评估代表不同类型的癌症的子集之间的历史关系的不同类型的癌症的历史疾病关联信息。通过这些实施例，优化组件可以使用历史疾病关联参数和关系参数两者来更新多任务学习模型。

在一些实施例中，结合所披露的系统所描述的元件可以用不同的形式来实施，如计算机实现的方法、计算机程序产品、或另一种形式。

附图说明

图1示出依照所公开主题的一个或多个实施例的通过对真实世界患者存活事件进行联合建模来促进系统地确定潜在癌症治疗靶标的示例非限制性系统的框图。

图2呈现依照所公开主题的一个或多个实施例的包括通过癌症类型识别活性遗传因子关联的信息的示例非限制性表。

图3呈现依照所公开主题的一个或多个实施例的示例非限制性表，该表包括对针对不同癌症类型识别的活性遗传因子进行识别和评分的信息。

图4呈现依照所公开主题的一个或多个实施例的示例非限制性表，该表包括对不同癌症类型之间的关联关系进行识别和评分的信息。

图5提供依照所公开主题的一个或多个实施例的用于通过对真实世界患者存活事件进行联合建模来确定潜在癌症治疗靶标的示例计算机实现过程的高级流程图。

图6示出依照所公开的主题的一个或多个实施例的促进通过对真实世界患者存活事件进行联合建模系统地确定潜在的癌症治疗靶标的另一个示例非限制性系统的框图。

图7提供依照所公开的主题的一个或多个实施例的用于通过对真实世界患者存活事件进行联合建模来确定潜在癌症治疗靶标的另一示例计算机实现的过程的高级流程图。

图8示出依照所公开的主题的一个或多个实施例的多任务存活分析框架的示例实现方式。

图9示出依照所公开的主题的一个或多个实施例的便于通过对真实世界患者存活事件进行联合建模来系统地确定潜在的癌症治疗靶标的另一个示例非限制性系统的框图。

图10提供依照所公开的主题的一个或多个实施例的用于通过对真实世界患者存活事件进行联合建模来确定潜在癌症治疗靶标的另一个示例计算机实现过程的高级流程图。

图11提供依照所公开的主题的一个或多个实施例的用于通过对真实世界患者存活事件进行联合建模来确定潜在癌症治疗靶标的另一个示例计算机实现过程的高级流程图。

图12示出可以在其中促进本文描述的一个或多个实施例的示例非限制性操作环境的框图。

具体实施方式

以下详细描述仅是说明性的，并不旨在限制实施例和/或实施例的应用或用途。此外，无意受前面的发明内容部分或本具体实施方式部分中呈现的任何明示或暗示信息的约束。

癌症是细胞的异常生长，其直接原因是细胞增殖和死亡的失衡，打破了正常的生理检查和平衡系统。癌症是由多种基因改变中的一种或多种引起的。基因疗法是尝试将遗传物质(例如脱氧核糖核酸(DNA)、核糖核酸(RNA)等)引入活细胞的治疗形式。许多临床试验正在研究用于特定类型癌症的基因疗法，并且新类型的基因疗法治疗也在不断发展中。虽然基因疗法是一种有前景的癌症治疗技术，但是目前癌症基因疗法的开发过程是基于高成本、费力的体外和体内临床实验以及临床前动物模型。

本公开内容提供用于通过对真实世界患者存活事件进行联合建模来系统地确定潜在癌症基因治疗靶标的系统、计算机实现的方法、设备和/或计算机程序产品。所识别的潜在癌症基因治疗靶标可以包括表现出与特定类型的癌症高度关联的遗传因子以及与多种类型的癌症高度关联的那些遗传因子。因此，可以将高成本的临床基因疗法开发简化为具有相对较高的疗效潜力和/或适用于多种类型的癌症的基因疗法。具体地，许多不同类型的癌症具有共同的遗传机制，因此不同类型的癌症可能彼此相关联。所公开的技术提供了使用现实世界观察性健康数据的分析并且利用不同类型的癌症之间的关联来生成针对不同类型的癌症的基因治疗靶标的假设的系统方法。真实世界观察性健康数据可以包括分别被诊断患有不同类型的癌症的不同患者群组的存活数据和相应患者的遗传信息。在一些实现方式中，真实世界观察性健康数据可以进一步结合(例如，在通过临床试验等开发的临床文献中提供的)两种或更多种类型的癌症之间的关联的现有或历史知识。

在一个或多个实施例中，所公开的技术采用多任务机器学习存活模型来将生成基因治疗靶标的假设的任务表述为优化问题。该多任务存活模型可以包括每种类型的癌症的单独存活模型。可以配置每个存活模型来评估特定类型癌症的患者存活数据和患者遗传数据，以识别可归因于相应患者的存活时间的遗传因子。被确定为对癌症存活时间有贡献(例如，正贡献或负贡献)的遗传因子在本文中被称为活性遗传因子。通过引入定义两种或两种以上类型癌症之间关联的疾病关联参数，可以在多任务学习框架中将个体存活模型彼此耦合。就这一点而言，所公开的技术可以在统一模型框架下联合或同时求解不同癌症类型的个体存活模型，并且利用疾病-疾病关联来实现改善的存活模型性能。例如，在一个或多个实施例中，可以应用多任务存活模型，以使用针对每种类型的癌症的单独的存活模型来同时识别每种类型的癌症的活性遗传因子。然后可以识别在两种或更多种癌症类型之间共享的共同活性遗传因子，并且可以基于所识别的共同活性遗传因子开发新的疾病关联参数。然后可以使用新的疾病关联参数作为输入以优化或更新个体存活模型，由此使更新的存活模型提供活性遗传因子的增强识别。可以迭代地应用该多任务学习框架，直到达到收敛为止。多任务学习分析的输出包括识别每种类型的癌症的活性遗传因子的信息、两种或更多种类型的癌症之间共享的共同遗传因子、以及定义两种或更多种类型的癌症之间的关联的关联参数。

在一个或多个实施例中，确定与每种类型的癌症相关联的活性遗传因子的过程可以涉及产生每种相关联的活性遗传因子的贡献分数。贡献分数可以表示认为活性遗传因子对特定类型的癌症的存活时间有贡献的程度。例如，在一些实现方式中，与特定类型的癌症相关的活性遗传因子的更高分数可以指示活性遗传因子对该类型的癌症的存活时间的更高程度的贡献。就这一点而言，可选择并推荐具有比与特定癌症类型相关联的其他活性遗传因子相对更高的贡献分数的与特定癌症类型相关联的活性遗传因子，作为潜在的基因治疗靶标。此外，可以选择在一组两种或更多种类型的癌症之间共享并且还具有相对高的贡献分数的共同活性遗传因子，作为该组中的所有类型的癌症的潜在基因治疗靶标。结果，新基因疗法的临床开发可以集中在这些共同活性遗传因子上，以开发适用于多种类型的癌症(而非仅一种癌症)的新基因疗法。

现在参考附图来描述一个或多个实施例，其中，贯穿全文，相同的附图标记用于指代相同的元件。在以下描述中，出于解释的目的，阐述了许多具体细节以便提供对一个或多个实施例的更透彻的理解。然而，显而易见的是，在不同情况下，可以在没有这些具体细节的情况下实践一个或多个实施例。

现在转到附图，图1示出依照所公开主题的一个或多个实施例的通过对真实世界患者存活事件进行联合建模来促进系统地确定潜在癌症治疗靶标的示例非限制性系统100的框图。系统100和本文中详述的其他系统可以提供与识别有希望的基因靶标相关的实质性技术改进，针对所述基因靶标开发针对与治疗不同类型的癌症相关的基因疗法。

具体地，可以采用系统100和/或系统100的组件(以及在此披露的其他系统)来运用硬件和/或软件来解决本质上是高度技术性的、非抽象的、并且不能作为人类的一系列智力活动而执行的问题。例如，人类不可能自动地(例如，在几秒或更短时间内)和一致地评估大量的患者存活数据、遗传数据和疾病关联数据以缩小有希望的癌症基因治疗靶标的范围。所公开的技术提供系统地(例如，使用机器学习)和有效地确定用以使用体内和体外实验进一步研究的有希望的基因治疗靶标。所公开的技术进一步提供了确定适用于多种类型的癌症的基因治疗靶标。因此，可以以显著提高或强化的处理速度识别有希望的且具有成本效益的基因治疗靶标。系统100和/或系统100的组件或本文所述的其他系统还可用于解决由于技术、计算机网络、互联网等的进步而出现的新问题。例如，系统100和/或系统100(以及本文描述的其他系统)的组件提供基于对现有患者存活数据和遗传数据的机器学习分析来自动实时确定有希望的基因治疗靶标。

本文所述的系统的实施例可包括在一个或多个机器内体现(例如，在与一个或多个机器相关联的一个或多个计算机可读存储介质中体现)的一个或多个机器可执行组件。这些组件在由一个或多个机器(例如，处理器、计算机、计算设备、虚拟机等)执行时可使得一个或多个机器执行所描述的操作。例如，在所示实施例中，系统100包括计算设备102，该计算设备102包括多任务存活分析组件104。多任务存活分析组件104进一步包括建模组件106、活性因子标识组件108、评分组件110、疾病关联组件112和优化组件114。就这一点而言，多任务存活分析组件104、建模组件106、活性因子标识组件108、评分组件110、疾病关联组件112和优化组件114可分别对应于机器可执行组件。系统100还包括不同电子数据源和包括可由多任务存活分析组件104读取、使用和/或生成的信息的数据结构。例如，这些数据源和数据结构可以包括但不限于：患者存活信息124、患者遗传信息126、多任务存活模型数据122、活性因子信息128和疾病关联信息130。

计算设备102可以包括或操作地耦合到至少一个存储器120和至少一个处理器118。至少一个存储器120可以进一步存储可执行指令(例如，多任务存活分析组件104、建模组件106、活性因子标识组件108、评分组件110、疾病关联组件112和优化组件114)，这些可执行指令当由至少一个处理器118执行时，促进由所述可执行指令定义的操作的执行。在一些实施例中，存储器120还可存储系统100的各种数据源和/或结构(例如，患者存活信息124、患者遗传信息126、多任务存活模型数据122、活性因子信息128和疾病关联信息130)。在其他实施例中，系统100的不同数据源和结构可以存储在计算设备102(例如，通过一个或多个网络)可访问的(例如，在远程设备或系统处的)其他存储器中。计算设备102还可包括通信地耦合计算设备102的不同组件和数据源的设备总线116。所述处理器118和存储器120以及其他合适的计算机或基于计算的元件的示例可以参见图12找到，并且可以结合实现结合图1或本文公开的其他附图示出和描述的系统或组件中的一个或多个来使用。

在一些实现中，计算设备102和/或系统100的不同组件和数据源可通过一个或多个网络通信地连接。这样的网络可以包括有线和无线网络，包括但不限于蜂窝网络、广域网(WAD，例如互联网)或局域网(LAN)。例如，计算设备102可与提供患者存活信息124和/或患者遗传信息126的外部设备通信，和/或与提供活性因子信息128和/或疾病关联信息130的另一外部设备通信，(并且反之亦然)，所述通信可使用几乎任何期望的有线或无线技术，包括但不限于：无线保真(Wi-Fi)，全球移动通信系统(GSM)、通用移动电信系统(UMTS)、全球微波互联接入(WiMAX)，增强型通用分组无线电服务(增强型GPRS)、第三代合作伙伴计划(3GPP)长期演进(LTE)，第三代合作伙伴计划2(3GPP2)超移动宽带(UMB)、高速分组接入(HSPA)，Zigbee和其他802.XX无线技术和/或传统电信技术，

在各种实施例中，多任务存活分析组件104可以使用多任务学习模型或框架对患者存活信息124和患者遗传信息126进行机器学习分析，以系统地确定关于很可能成为用于开发与治疗不同类型的癌症相关联的新基因疗法的候选者的潜在基因治疗靶标的信息。就这一点而言，患者存活信息124可包括针对许多(例如，数以千计、数以万计、数以百万计等)被诊断患有不同类型的癌症的不同患者整理的生存信息。患者存活信息124可针对每个患者识别至少该患者被诊断患有的癌症类型和从诊断到以下两个事件之一的持续时间：死亡或确定患者已痊愈(或以其他方式清除诊断患者的癌症)。患者存活信息124中表示的癌症类型可以变化并且可以包括基本上任何已知类型的癌症。影响人类的癌症有一百多种。可以由系统100评估的一些常见类型的癌症可以包括例如：多形性成胶质细胞瘤(GBM)，成淋巴细胞性急性髓性白血病(LAML)、头颈部鳞状癌(HNSC)、肺腺癌(LUAD)、肺鳞状癌(LUSC)，乳腺癌(BRCA)、肾肾透明细胞癌(KIRC)、卵巢癌(OV)、膀胱癌(BLCA)，结肠腺癌(COAD)、子宫颈癌和子宫内膜癌(UCEC)、直肠腺癌(READ)等。

患者遗传信息126可包括患者存活信息124中表示的每个患者的遗传信息或组学信息。遗传信息或组学信息可以基本上包括可以涉及由一种或多种类型的癌症采用的遗传机制的任何类型的生物特征。例如，患者遗传信息126可以包括但不限于针对每个患者(或在一些实现方式中一位或多位患者)的：DNA序列数据、基因表达数据、microRNA(miRNA)表达数据、拷贝数变异数据、基因突变数据、DNA甲基化数据、反相蛋白阵列(RPPA)数据等。在一些实现方式中，患者遗传信息126和/或患者存活信息124还可包括关于相应患者的附加信息，诸如人口统计信息、医疗历史信息等。

在一个或多个实施例中，多任务存活分析组件104可以通过将鉴于患者遗传信息126评估患者存活信息124作为多任务存活优化问题来确定不同类型的癌症的基因治疗靶标。在这方面，可以使用多任务存活模型对多任务存活优化问题建模。多任务存活模型可包括患者存活信息124中表示的不同类型的癌症的单独存活模型。这些不同的存活模型中的每一个可被配置成采用一个或多个机器学习分析功能(例如，无监督的、受监督的、神经网络等)来确定遗传因子与被诊断为患有它们被配置来评估的相应类型的癌症的患者的存活时间之间的相关性。被确定为与癌症存活时间(例如，相对短的存活时间和/或相对长的存活时间)具有强相关性的遗传因子可以被推荐作为潜在的基因治疗靶标。

多任务存活模型还可以通过引入疾病关联参数在多任务学习框架中将不同的存活模型耦合在一起。就这一点而言，多任务存活分析组件104可以被配置成通过在统一模型框架下联合地求解针对不同癌症类型的不同存活模型，同时利用不同存活模型之间的共性和/或差异来解决多任务优化问题，从而与训练模型单独相比，有助于提高任务特定的存活模型的学习效率和预测准确度。不同存活模型之间的共性和差异可以基于所学习的疾病关联参数(并且在一些实现方式中是已知的疾病关联参数)，这些参数定义了两种或更多种不同类型的癌症之间的关联和/或不关联。例如，疾病关联参数可以包括识别两种或更多种相关的癌症类型、两种或更多种癌症类型如何相关(例如，它们共享哪些活性遗传因子)和/或两种或更多种癌症类型相关的程度的信息。例如，在一个或多个实施例中，用于解决多任务优化问题的高级过程可以包括使用针对不同类型的癌症的单独的存活模型来识别分别与不同类型的癌症相关联的活性遗传因子。然后可以识别在两种或更多种类型的癌症之间共享的共同活性遗传因子，并可以基于这些共同活性遗传因子确定疾病关联参数。该过程可以进一步使用在每次迭代中确定的疾病关联参数来迭代地进行，以优化单独的存活模型的性能，直到达到收敛为止。

在所示实施例中，为了促进多任务存活分析的执行，多任务存活分析组件104可以包括建模组件106、活性因子标识组件108、评分组件110、疾病关联组件112和优化组件。在一个或多个实施例中，建模组件106可促进将患者存活信息124和患者遗传信息126应用于多任务存活模型。例如，在一些实现方式中，建模组件106可以访问与不同类型的癌症相关联的不同患者群组的患者存活信息124和患者遗传信息126的子集。患者存活信息124和患者遗传信息126的每个子集可包括被诊断患有不同类型的癌症的患者的信息。建模组件106可进一步将患者存活信息124和患者遗传信息126的子集应用于针对不同癌症类型开发的相应个体存活模型。可以将定义多任务存活模型和针对不同类型的癌症的相关联的个体存活模型的信息存储在存储器中(例如，作为多任务存活模型数据122)。

与使用存活模型对患者存活信息124和患者遗传信息126的分析相关联，活性因子标识组件108可以识别，针对每种类型的癌症，患者遗传信息126中包括的参与由相应癌症类型采用来增殖的遗传机制的活性遗传因子。就这一点而言，活性因子标识组件108可以基于观察到的遗传因子与患者存活信息124中提供的癌症存活时间之间的相关性来识别活性遗传因子。例如，可以将经常被观察到与特定类型的癌症的短存活时间相关并且不经常被观察到与特定类型的癌症的长存活时间相关的遗传因子，识别为在特定类型的癌症的遗传机制中具有积极作用的活性遗传因子。

活性因子标识组件108可以进一步采用关于不同癌症类型之间关联的疾病关联参数来促进识别与不同癌症类型关联的活性遗传因子。例如，高度相关的癌症类型可以共享一种或多种共同的关键基础遗传因子。通过利用疾病关联信息，相关癌症类型的存活模型可以互相借鉴信息，由此促进对所有类型的癌症的活性遗传因子的更有效、更准确的识别。在各种实施例中，如以下进一步讨论的，由活性因子标识组件108应用来促进识别活性遗传因子的疾病关联参数，是由疾病关联组件112在多任务存活分析模型下确定的。在所示的实施例中，由疾病关联组件112确定的疾病关联参数可被存储在被标识为疾病关联信息130的数据库中。就这一点而言，活性因子标识组件108可以访问疾病关联信息130以促进识别与不同癌症类型关联的活性遗传因子。在其他实施例中，(下文参考图6讨论)，活性因子标识组件108也可采用历史或已知的疾病关联参数，以促进识别与不同类型的癌症相关联的活性遗传因子。个体存活模型可采用一种或多种机器学习算法来促进基于患者存活信息124、患者遗传信息126和疾病关联参数对分别与特定类型的癌症相关联的活性遗传因子的识别。

在一些实施例中，与识别与每种癌症类型相关联的活性遗传因子相关联，评分组件110可以确定活性遗传因子的贡献分数。活性遗传因子相对于特定类型的癌症的贡献分数可以反映活性遗传因子对特定类型的癌症的存活时间的贡献程度，这进而反映了该活性遗传因子在该特定类型的癌症的遗传机制中所起作用的程度。例如，贡献分数可以基于特定遗传因子是针对被诊断患有特定癌症类型的患者而识别出的频率。在另一个实例中，贡献分数可以基于某活性遗传因子是与被诊断患有特定癌症类型的患者的特定存活时间相关联地识别出的频率。例如，存活时间可以小于定义的阈值、大于定义的阈值等。在一些实现方式中，与特定的活性遗传因子和癌症类型相关的贡献分数越高，活性遗传因子对癌症存活时间的贡献越大，(因此该活性遗传因子对由该癌症类型进行增殖的遗传机制的贡献越大)。

可以在适合的数据结构中整理关于针对相应类型的癌症识别的活性遗传因子的信息和针对这些活性遗传因子确定的贡献分数。例如，在所示的实施例中，由活性因子标识组件108和/或评分组件110确定的关于针对不同类型癌症的识别的活性遗传因子的信息，可以被组织在被标识为活性因子信息128的数据库中。

图2呈现了依照所公开主题的一个或多个实施例的包括包括标识按癌症类型划分的活性遗传因子关联的信息的示例非限制性表200。具体而言，表200识别在let-7家族中包括的13种类型的miRNA遗传因子(例如，hsa.let.7a、hsa.let.7a.1、hsa.let.7a.2等)。已经发现let-7miRNA家族与细胞分化有关。表200进一步标识了四种不同类型的癌症，包括肾癌、结肠癌、CBM癌和肺癌。为各个癌症类型与miRNA遗传因子组合提供的勾号，标识该癌症类型与该miRNA遗传因子相关。如表200中所示，let-7家族的许多不同的miRNA遗传因子与两种或更多种类型的癌症有关联。例如，在所示实施例中，has.let.7a.1与肾癌、结肠癌和肺癌有关联。表200提供了根据一个或多个实施例的可以由活性因子标识组件108确定的活性遗传因子信息的类型的一个示例。就此而言，活性因子信息128可提供表200和/或与表200所提供的信息相似的信息。

图3呈现了根据本文描述的一个或多个实施例的包括可以由活性因子标识组件108和评分组件110确定的信息的示例表300。就此而言，表300和/或与表300提供的信息类似的信息也可在活性因子信息128中提供。表300包括根据所公开主题的一个或多个实施例对针对不同癌症类型所识别的活性遗传因子进行标识和评分的信息。在所示的实施例中，表300的每一行对应于特定癌症类型和活性遗传因子的组合。例如，第一行对应于癌症类型A(C-A)和活性遗传因子1(G-1)。第二行对应于癌症类型A(C-A)和活性遗传因子2(G-1)。第三行对应于癌症类型B(C-B)和活性遗传因子1(G-1)。表300进一步包括提供每种癌症类型和活性遗传因子组合(例如，由评分组件110确定的)的贡献分数的分数列。贡献分数反映了认为活性遗传因子在多大程度上参与了相应癌症类型增殖的遗传机制。对此，较高的贡献分数值表明活性遗传因子更有可能成为相应癌症类型的强基因治疗靶标。

再次参考图1，在各种实施例中，疾病关联组件112可以评估由活性因子标识组件108识别的每种不同类型的癌症的活性遗传因子，以确定在两种或更多种癌症类型之间共享的共同活性遗传因子。疾病关联组件112还可以至少部分地基于在两种或更多种类型的癌症之间共享的共同活性遗传因子来生成关于它们之间的关系的疾病关联信息130。例如，再次参照表200，疾病关联组件112可以确定肾癌、结肠癌和肺癌是相关的，因为它们共享活性遗传因子has.let.7a.1。在不同实施例中，疾病关联组件112和/或评分组件110可以进一步确定两种或更多种癌症类型相关的程度。疾病关联组件112和/或评分组件110还可以产生两种或更多种癌症类型的组的关联分数，其反映两种或更多种癌症类型关联的程度。例如，相对于较低的关联分数，较高的关联分数可表明两种或更多种类型的癌症之间较强的关联。

例如，图4呈现了根据本文描述的一个或多个实施例的包括可以由疾病关联组件112和/或评分组件110确定的信息的示例表400。就这一点而言，表400和/或类似于由表400提供的信息的信息可以由疾病关联信息130提供。表400包括根据所公开的主题的一个或多个实施例对不同癌症类型之间的关联关系进行识别和评分的信息。例如，癌症对C-A和C-B具有0.25的关联分数，癌症对C-A和C-C具有0.23的关联分数，癌症对C-B和C-D具有0.22的关联分数。

返回参考图1，在各种实施例中，疾病关联组件112和/或评分组件110可以基于在两种或更多种癌症类型之间共享的共同活性遗传因子的数目，来确定代表这两种或更多种癌症类型相关的程度的关联分数。在这点上，共同活性遗传因子的数目越大，则相应癌症之间的关联越大，并且关联分数越高。例如，再次参考表200，关于let-7家族，相对于肾癌和结肠癌，肾癌和肺癌共享更大数量的共同活性遗传因子。根据该实施例，肾癌和肺癌组合的关联分数可高于肾癌和结肠癌组合的关联分数。

在一些实现方式中，疾病关联组件112和/或评分组件110可以进一步基于分别与癌症类型之间共享的遗传因子相关联的贡献分数来确定两种或更多种类型的癌症的关联分数。对此，具有较高贡献分数的遗传因子可被给予比具有较低贡献分数的遗传因子更大的权重。例如，假定癌症类型D(C-D)和癌症类型E(C-E)共享活性遗传因子G-1和G-2。根据这个实例，关联分数可以基于与每个癌症类型和遗传因子对相关联的组合的贡献分数，其中，集体贡献分数越高，关联分数越高。例如，假设C-D和G-1具有0.25的贡献分数，C-E和G-1具有0.30的贡献分数，C-D和G-2具有0.15的贡献分数，C-E和G-2具有0.75的贡献分数。根据这个实例，组合的贡献分数将是1.45(例如，0.25+0.30+0.15+0.75)。在另一个实施例中，两种或更多种类型的癌症之间的关联程度还可以基于与共同活性遗传因子相关联的贡献分数之间的差异或偏差程度。例如，继续以上实例，G-1相对于C-D和C-E的贡献分数仅稍微偏离，差异仅为0.5。然而，G-2相对于C-D和C-E的贡献分数大大偏离，差异为0.6。根据这个实例，可以基于G-2的贡献分数之间的高度偏差，对针对癌症类型对C-D/C-E确定的关联分数进行调整或惩罚。

如上所述，在不同实施例中，多任务存活模型可以被表述为和/或评估为优化问题。就这一点而言，在一个或多个实施例中，使用针对不同癌症类型的相应存活模型，活性因子标识组件108和评分组件110可以基于患者存活信息124和患者遗传信息126来初始地确定不同癌症类型的活性遗传因子和活性遗传因子贡献分数。然后，疾病关联组件112和/或评分组件110可以基于在两种或更多种类型的癌症之间共享的共同活性遗传因子来确定初始疾病关联参数。对于这些实施例，在确定了初始活性遗传因子和初始疾病关联参数之后，可以将初始疾病关联参数反馈到多任务存活模型中并用于优化个体存活模型的性能和效率。就这一点而言，优化组件114可以使用初始疾病关联参数来更新和/或优化个体存活模型中的一个或多个。可以将更新的存活模型存储在多任务存活模型数据122中。活性因子标识组件108、评分组件110和疾病关联组件112然后可以使用更新的存活模型来重复多任务存活分析，以基于患者存活信息124和患者遗传信息来确定更新的活性遗传因子、更新的活性遗传因子贡献分数、和更新的疾病关联参数。活性因子标识组件108、评分组件110、疾病关联组件112和优化组件可以基于在每次迭代之后确定的新的疾病关联参数进一步迭代地重复这种存活分析和模型更新/优化过程，直到达到收敛为止。

在一个或多个实施例中，优化组件114可以基于当前模型输出与先前模型输出之间的改变程度来确定何时达到收敛。例如，假设模型的当前输出由信息数据集k表示，则优化组件可以将信息数据集k与信息数据集k-1进行比较。如果k与k-1之间的差异小于或等于定义的偏离程度，则优化组件可以确定已经达到收敛。最终数据集k，然后被存储。就这一点而言，对于每种类型的癌症，每次迭代的输出数据将包括识别的与癌症类型相关联的活性遗传因子和这些活性遗传因子的贡献分数。每次迭代的输出数据还将包括更新的疾病关联参数。因此，优化组件114可以基于当前确定的活性遗传因子、活性遗传因子的贡献分数、以及疾病关联参数相对于先前迭代确定的活性遗传因子、活性遗传因子的贡献分数、以及疾病关联参数的变化很小或没有变化，来确定何时达到收敛。

图5提供根据所公开的主题的一个或多个实施例的用于通过对真实世界患者存活事件进行联合建模来确定潜在癌症治疗靶标的示例计算机实现的过程500的高级流程图。就此而言，过程500反映了可以由多任务存活分析组件104执行以根据所公开的主题的一个或多个实施例确定疾病关联信息130和活性因子信息128的多任务存活分析的示例实现。为了简洁起见，省略了对在各个实施例中采用的类似元素的重复描述。

使用患者存活信息124和患者遗传信息126作为输入，在502处，(例如，通过建模组件106)可以采用多任务学习存活模型来对不同类型的癌症的存活事件进行联合建模，其中具有针对每种类型的癌症的单独任务。在504处，(例如，通过活性因子标识组件108)基于单独任务的输出识别每种不同类型的癌症的活性遗传因子。所识别的活性遗传因子可以由活性因子数据514表示。在一些实施例中，活性因子数据514可以包括针对对应的活性遗传因子确定的贡献分数。在一个或多个实施例中，活性因子数据514可被添加到活性因子信息128并被存储。在506处，(例如，通过疾病关联组件112)可以基于识别在两种或更多种类型的癌症之间共享的活性遗传因子的共同活性遗传因子而生成疾病关联数据512。例如，疾病关联组件112可以处理活性因子数据514以识别在由两种或更多种类型的癌症组成的组之间共享的一个或多个共同活性遗传因子。疾病关联组件112和/或评分组件110还可以部分地基于在两种或更多种类型的癌症之间共享的共同活性遗传因子的数目来确定代表它们之间的关联程度的关联分数。疾病关联数据512因此可以包括定义由过程500评估的不同类型的癌症的不同子集之间的关系的疾病关联参数。疾病关联数据512还可被添加到疾病关联信息130并被存储。

在508处，确定活性因子数据514和疾病关联数据512是否是过程502-506的第一次迭代的结果。如果是，则通过使用疾病关联数据512重复过程502-506来继续多任务学习分析以优化性能。就此而言，疾病关联数据512可用于优化或更新单独任务的存活模型(例如，通过优化组件114)，并且可使用更新的存活模型和(原始)患者存活信息124和患者遗传信息126作为输入来重复过程502-506。每次重复过程502-506时，将生成更新的活性因子数据514和疾病关联数据512。

如果在508处确定活性因子数据514和疾病关联数据512不是过程502-506的第一迭代的结果，则在510处，确定是否已达到收敛。例如，优化组件114可以将当前疾病关联数据512和当前活性因子数据514与在过程502-506的先前迭代中确定的疾病关联数据和活性因子数据进行比较。如果先前数据集合和当前数据集合之间的改变程度小于阈值偏离程度，则优化组件114可以确定已经达到收敛，过程500可以结束。随后在疾病关联信息130和活性因子信息128中分别存储的最终疾病关联数据512和活性因子数据514将反映对多任务存活问题的最优解。如果在510确定尚未达到收敛，则过程500可使用更新的疾病关联数据再次重复过程502-506，直到达到收敛为止。

图6示出了根据所公开的主题的一个或多个实施例的另一个示例非限制性系统600的框图，该系统通过对真实世界患者存活事件进行联合建模来促进系统地确定潜在的癌症治疗靶标。系统600包括与系统100相同或相似的特征和功能，只是增加了历史疾病关联信息602。为了简洁起见，省略了对在各个实施例中采用的类似元素的重复描述。

历史疾病关联信息602可以包括关于在由多任务存活分析组件104进行多任务存活分析之前的两种或更多种类型的癌症之间的已知关联的信息。例如，在一些实现方式中，历史疾病关联信息602可以识别已知与两种或更多种不同类型的癌症、两种或更多种相关类型的癌症的组、两种或更多种类型的癌症的相关度等相关联的活性遗传因子。历史疾病关联信息602可以由临床各种临床研究数据源提供。例如，历史疾病关联信息602可从现有科学报告、白皮书、开源miRNA癌症数据库等中开发。在一些实现方式中，疾病关联组件112可以访问包括关于与特定癌症类型相关联的活性遗传因子的信息的不同数据源，并且采用一种或多种机器学习技术来基于现有临床研究确定定义的历史疾病关联信息。

在一些实施例中，多任务存活分析组件104可以使用历史疾病关联信息602来进一步增强或优化多任务存活分析的性能。在这方面，除了患者存活信息124和患者遗传信息126之外，还可以使用历史疾病关联信息602作为多任务存活模型的输入。因此，历史疾病关联信息602可以用于在分析的第一次迭代时将个体存活模型彼此偶联。

例如，图7提供根据所公开的主题的一个或多个实施例的用于通过对真实世界患者存活事件进行联合建模来确定潜在癌症治疗靶标的另一示例计算机实现的过程700的高级流程图。过程700基本上类似于过程500，其中添加了历史疾病关联信息602作为输入。为了简洁起见，省略了对在各个实施例中采用的类似元素的重复描述。

在702处，将患者存活信息124、患者遗传信息126和历史疾病关联信息602用作多任务学习存活模型的输入。用多任务存活模型(例如，通过建模组件106)来对不同类型的癌症的存活事件进行联合建模，其中具有针对每种类型的癌症的单独任务。历史疾病关联信息602可被用于链接两个或更多个相应的任务。在704处，(例如，通过活性因子标识组件108)基于单独任务的输出识别出每种不同类型的癌症的活性遗传因子。所识别的活性遗传因子可以由活性因子数据714表示。在一些实施例中，活性因子数据714可以包括针对对应的活性遗传因子确定的贡献分数。在一个或多个实施例中，可以将活性因子数据714添加到活性因子信息128并存储。在706处，(例如，通过疾病关联组件112)可以基于对在两种或更多种类型的癌症之间共享的活性遗传因子的共同活性遗传因子的识别来生成疾病关联数据712。例如，疾病关联组件112可以处理活性因子数据714以识别在由两种或更多种类型的癌症组成的组之间共享的一种或多种共同活性遗传因子。疾病关联组件112和/或评分组件110还可以部分地基于在两种或更多种类型的癌症之间共享的共同活性遗传因子的数目来确定代表它们之间的关联程度的关联分数。疾病关联数据712因此可以包括定义由过程700评估的不同类型的癌症的不同子集之间的关系的疾病关联参数。疾病关联数据712也可被添加到疾病关联信息130并被存储。

在708处，确定活性因子数据714和疾病关联数据712是否是过程702-706的第一次迭代的结果。如果是，则通过使用疾病关联数据712重复过程702-706来继续进行多任务学习分析以优化性能。就此而言，可以(例如，通过优化组件114)将疾病关联数据712用于优化或更新单独任务的存活模型，并且可使用更新的存活模型和(原始)患者存活信息124和患者遗传信息126作为输入来重复过程702-706。每次重复过程702-706时，将生成更新的活性因子数据714和疾病关联数据712。

如果在708处确定活性因子数据714和疾病关联数据712不是过程702-706的第一迭代的结果，则在710处，确定是否已达到收敛。例如，优化组件114可以将当前疾病关联数据712和当前活性因子数据714与在过程702-706的先前迭代中确定的疾病关联数据和活性因子数据进行比较。如果先前数据集合和当前数据集合之间的改变程度小于阈值偏离程度，则优化组件114可以确定已经达到收敛，过程700可以结束。随后分别在疾病关联信息130和活性因子信息128中被存储的最终疾病关联数据712和活性因子数据714将反映对多任务存活问题的最优解。如果在710确定尚未达到收敛，则过程700可使用更新的疾病关联数据再次重复过程702-706，直到达到收敛为止。

图8展示了根据本披露主题的一个或多个实施例的多任务存活分析框架800的示例实现方式。为了简洁起见，省略了对在各个实施例中采用的类似元素的重复描述。

在所示的实施例中，多任务存活分析框架800可以包括针对一组癌症类型1-k中的多个癌症类型的多个存活模型801

对于多堆叠存活分析，可以使用分别由个体系数向量β

在一个或多个实施例中，多任务存活分析框架800可以由以下部分似然目标函数表示：

目标函数。

其中，

l(T,E,X,β)代表来自各个Cox模型的部分似然，系数矩阵β

(λ

在一个或多个实施例中，多任务存活分析组件104可以被配置成使用块坐标下降(BCD)过程通过初始化β(0)和Ω(0)来来求解以上目标函数。多任务存活分析组件104可以进一步迭代或重复求解目标函数直到达到收敛，每次都通过比较β列的稀疏性模式来识别共同活性遗传因子来更新β，并且使用患者存活信息124和患者遗传信息126来更新疾病关联信息Ω。

图9示出了根据所公开的主题的一个或多个实施例的通过对真实世界患者存活事件进行联合建模来促进系统地确定潜在的癌症治疗靶标的另一个示例、非限制性系统900的框图。为了简洁起见，省略了对在各个实施例中采用的类似元素的重复描述。

系统900可以包括与系统100相同或相似的特征，并添加了索引组件902和选择组件904。在一个或多个实施例中，索引组件902可以生成包括由多任务存活分析组件104确定的活性因子信息128和/或疾病关联信息130的一个或多个索引数据结构。例如，索引组件902可以生成表200、表300、表400等等。选择组件904可进一步利用所述索引数据结构的一个或多个来促进对作为强基因治疗靶标的一个或多个特定活性遗传因子的有效选择和推荐。

就此而言，在一些实施例中，索引组件902可以生成第一数据库，该第一数据库标识针对多种不同类型的癌症的每种类型(或在一些实施例中，一种或多种类型)的癌症的、由活性因子标识组件108确定为与该种类型的癌症相关联的活性遗传因子。在一些实现方式中，第一数据库可以进一步包括由评分组件110针对对应的活性遗传因子确定的贡献分数。例如，可以在活性因子信息128或另一合适的数据源中提供第一数据库。在一个或多个实施例中，选择组件904可以使用第一数据库来选择与一种或多种癌症类型相关联的一种或多种活性遗传因子用于推荐作为有希望的基因治疗靶标。例如，在一个实施例中，可以将选择组件904配置为选择具有高于定义的阈值分数的贡献分数的活性遗传因子。就这一点而言，选择组件904可以选择与每种类型的癌症相关联的具有高于定义的阈值的贡献分数的活性因子的一个子集。在另一个实现方式中，可以将选择组件904配置成选择与特定类型的癌症相关联的活性遗传因子的一个子集，该子集具有比与该类型的癌症相关联的其他活性遗传因子相对更高的贡献分数。例如，选择组件904可以选择前N％或前X％的活性遗传因子用于推荐作为基因治疗靶标。

索引组件902还可以生成第二数据库，该第二数据库标识在两种或更多种类型的癌症之间共享的共同活性遗传因子或基因治疗靶标。可以在疾病关联信息130或另一合适的数据源中提供该第二数据库。例如，索引组件902可以生成标识活性遗传因子和/或基因治疗靶标的数据库，并且然后列出分别与其相关联的癌症的类型。在一些实施例中，可以按照贡献分数对与特定活性遗传因子相关联的癌症类型进行排序，以指示每种类型的癌症与该活性遗传因子相关的程度。索引组件902可以基于与其相关联的癌症的数目进一步对相应的活性遗传因子进行排序。在一些实现方式中，索引组件902还可以根据与其相关联的不同癌症类型的数量和与不同癌症类型和活性遗传因子相关联的贡献分数对相应的活性遗传因子进行排名。在一个或多个实施例中，可以将选择组件904配置成基于与其相关联的癌症类型的数量和/或贡献分数来选择一种或多种活性遗传因子用于推荐作为潜在基因治疗靶标。

索引组件902还可以生成标识两种或更多种不同类型的癌症之间的关系的第三索引数据结构。可以在疾病关联信息130或另一合适的数据源中提供第三索引数据结构。例如，第三索引数据结构可以标识包括两种或更多种类型的相关癌症的癌症组。这些癌症组还可以包括(例如，由疾病关联组件112和/或评分组件110所确定的)反映组中包括的相应癌症类型之间的关联程度的关联分数。

图10提供根据所公开主题的一个或多个实施例的用于通过对真实世界患者存活事件进行联合建模来确定潜在癌症治疗靶标的另一个示例计算机实现的过程1000的高级流程图。为了简洁起见，省略了对在各个实施例中采用的类似元素的重复描述。

在1002处，可操作地耦合至处理器的设备(例如，计算设备102)可以采用多任务学习模型(例如，多任务存活分析框架800)以基于分别存活于不同类型的癌症的患者组的癌症存活数据和患者基因组数据(例如，通过活性因子标识组件108)来确定分别与不同类型的癌症相关联的活动遗传因子。在1004，设备可以(例如，使用疾病关联组件112)进一步确定在不同类型的癌症中的两种或更多种类型的癌症之间共享的活性遗传因子的共同活性遗传因子。

图11提供根据所公开的主题的一个或多个实施例的用于通过对真实世界患者存活事件进行联合建模来确定潜在癌症治疗靶标的另一示例计算机实现的过程1100的高级流程图。

在1102处，可操作地耦合至处理器的设备(例如，计算设备102)可以采用多任务学习模型(例如，多任务存活分析框架800)以迭代地基于分别存活于不同类型的癌症的患者组的癌症存活数据和患者基因组数据并且进一步基于关于包括在该不同类型的癌症中的癌症类型的子集之间的关系的关系参数来确定分别与不同类型的癌症相关联的活性遗传因子(例如，通过活性因子标识组件108)。在1104，设备可进一步确定在不同类型的癌症中的两种或更多种类型的癌症之间共享的活性遗传因子的共同活性遗传因子(例如，使用疾病关联组件112)。在1106，设备可基于共同的活性遗传因子(例如，使用疾病关联组件112)来确定疾病关联参数。

一个或多个实施例可以是处于任何可能的集成技术细节水平的系统、方法和/或计算机程序产品。计算机程序产品可包括其上具有用于使处理器执行本实施例的一个或多个方面的计算机可读程序指令的计算机可读存储介质(或多个介质)。

计算机可读存储介质可以是可以保留和存储指令以供指令执行设备使用的有形设备。计算机可读存储介质可以是例如但不限于电子存储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或前述各项的任何合适的组合。计算机可读存储介质的更具体例子的非穷举列表包括以下：便携式计算机盘，硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或闪存)，静态随机存取存储器(SRAM)、便携式致密盘只读存储器(CD-ROM)，数字通用盘(DVD)、记忆棒、软盘、机械编码设备(诸如穿孔卡片或具有记录在其上的指令的凹槽中的凸起结构)，以及上述内容的任何合适的组合。如在此使用的，计算机可读存储介质不应被解释为是瞬态信号本身，如无线电波或其他自由传播的电磁波、通过波导传播的电磁波或其他传输介质(例如，穿过光纤电缆的光脉冲)、或通过导线传输的电信号。

本文所述的计算机可读程序指令可从计算机可读存储介质下载到相应的计算/处理设备，或通过网络(例如，互联网、局域网、广域网和/或无线网络)下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光传输光纤、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配器卡或网络接口从网络接收计算机可读程序指令，并转发计算机可读程序指令以存储在相应计算/处理设备内的计算机可读存储介质中。

用于执行本发明的操作的计算机可读程序指令可以是汇编指令，指令集架构(ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据，集成电路的配置数据，或以一种或多种编程语言的任何组合编写的源代码或目标代码，包括面向对象的Smalltalk、C++等编程语言，以及过程式编程语言，例如“C”编程语言或类似的编程语言。计算机可读程序指令可以完全地在实体计算机上执行、部分地在实体计算机上执行、作为独立软件包执行、部分地在实体计算机上部分在远程计算机上执行、或者完全地在远程计算机或服务器上执行。在后一种情形中，远程计算机可以通过任何类型的网络(包括局域网(LAN)或广域网(WAN))连接到实体的计算机，或者可以连接到外部计算机(例如，通过使用互联网服务提供商的互联网)。在一些实施例中，电子电路(包括例如可编程逻辑电路、现场可编程门阵列(FPGA)或可编程逻辑阵列(PLA))可以通过利用计算机可读程序指令的状态信息来执行计算机可读程序指令以使电子电路个性化，以便执行本发明的各方面。

本文中参考根据本发明的实施例的方法、设备(系统)和计算机程序产品的流程图说明和/或框图描述本发明的各方面。可以理解，流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合，都可以通过计算机可读程序指令来实现。

这些计算机可读程序指令可以被提供给通用计算机的处理器、专用计算机或其他可编程数据处理装置，以产生机器，使得通过计算机或其他可编程数据处理装置的处理器执行的指令创建用于实现在流程图和/或方框图的一个或多个方框中指定的功能/动作的装置。这些计算机可读程序指令还可以存储在能够引导计算机、可编程数据处理装置、和/或其他设备以特定方式起作用的计算机可读存储介质中，，使得具有存储在其中的指令的计算机可读存储介质包括制品，该制品包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各方面的指令。

计算机可读程序指令还可以加载到计算机、其他可编程数据处理装置、或其它设备上，使得在计算机、其他可编程装置或其他设备上执行一系列操作步骤，以产生计算机实现的过程，使得在计算机、其他可编程装置或其他设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。

附图中的流程图和框图图示了根据本发明的不同实施例的系统、方法和计算机程序产品的可能实现的架构、功能和操作。对此，流程图或框图中的每个方框可以表示模块、段或指令的一部分，其包括用于实现规定的逻辑功能的一个或多个可执行指令。在一些替代实现方式中，框中所标注的功能可以不以图中所标注的顺序发生。例如，取决于所涉及的功能，连续示出的两个框实际上可以基本上同时执行，或者这些框有时可以以相反的顺序执行。还将注意的是，框图和/或流程图中的每个框、以及框图和/或流程图中的框的组合可以由基于专用硬件的系统来实现，所述基于专用硬件的系统执行指定的功能或动作或执行专用硬件与计算机指令的组合。

结合图12，下文描述的系统和过程可体现在诸如单个集成电路(IC)芯片、多个IC、专用集成电路(ASIC)之类的硬件内。进一步，在每个过程中出现的有些或所有过程框的的顺序不应被视为是限制性的。相反，应当理解，过程块中的有些可以按多种顺序执行，这些顺序并非全部都可在本文中明确说明。

参见图12，用于实现所要求保护的主题的各方面的示例环境1200包括计算机1202。计算机1202包括处理单元1204、系统存储器1206、编解码器1235和系统总线1208。系统总线1208将包括但不限于系统存储器1206的系统组件耦合到处理单元1204。处理单元1204可以是各种可用处理器中的任何处理器。双微处理器和其他多处理器架构也可以用作处理单元1204。

系统总线1208可以是若干类型的总线结构中的任何一种，包括存储器总线或存储器控制器、外围总线或外部总线、或使用各种可用总线架构的局部总线，所述总线架构包括但不限于工业标准架构(ISA)、微通道架构(MSA)、扩展ISA(EISA)，智能驱动电子装置(IDE)、VESA本地总线(VLB)、外围组件互连(PCI)、卡总线、通用串行总线(USB)，高级图形端口(AGP)、个人计算机存储卡国际协会总线(PCMCIA)、火线(IEEE13124)、以及小型计算机系统接口(SCSI)。

在各种实施例中，系统存储器1206包括易失性存储器1210和非易失性存储器1212，其可采用所公开的存储器架构中的一个或多个。包含诸如在启动期间在计算机1202内的元件之间传输信息的基本例程的基本输入/输出系统(BIOS)，存储在非易失性存储器1212中。另外，根据本发明，编解码器1235可包括编码器或解码器中的至少一者，其中编码器或解码器中的至少一者可由硬件、软件或硬件和软件的组合组成。尽管将编解码器1235描绘为单独组件，但编解码器1235可包含在非易失性存储器1212内。作为说明而非限制，非易失性存储器1212可包含只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)、快闪存储器、3D快闪存储器或例如电阻式随机存取存储器(RRAM)的电阻式存储器。在至少一些实施例中，非易失性存储器1212可采用所公开的存储器设备中的一个或多个。此外，非易失性存储器1212可以是计算机存储器(例如，与计算机1202或其主板物理地集成的)或可移除存储器。可以利用其实现所公开的实施例的合适的可移除存储器的示例可以包括安全数字(SD)卡、紧凑型闪存(CF)卡、通用串行总线(USB)记忆棒等。易失性存储器1210包括充当外部高速缓冲存储器的随机存取存储器(RAM)，并且在不同实施例中还可以采用一个或多个所公开的存储器设备。作为说明而非限制，RAM以诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双倍数据速率SDRAM(DDRSDRAM)和增强型SDRAM(ESDRAM)等的许多形式可用。

计算机1202还可以包括可移动/不可移动、易失性/非易失性计算机存储介质。图12示出了例如盘存储器1214。盘存储装置1214包括但不限于诸如磁盘驱动器、固态盘(SSD)、闪存卡或记忆棒的设备。此外，盘存储装置1214可以包括与其它存储介质分开的或与其他存储介质组合的存储介质，所述其他存储介质包括但不限于诸如致密盘ROM设备(CD-ROM)、CD可记录驱动器(CD-R驱动器)、CD可重写驱动器(CD-RW驱动器)或数字通用盘ROM驱动器(DVD-ROM)之类的光盘驱动器。为了便于将盘存储装置1214连接到系统总线1208，通常使用可移除或不可移除接口，诸如接口1216。可以理解，盘存储装置1214可以存储与实体相关的信息。这样的信息可被存储在或提供给服务器或在实体设备上运行的应用。在一个实施例中，实体可被通知(例如，通过输出设备1236)被存储到盘存储1214或被传送到服务器或应用的信息类型。可以(例如，通过从输入设备1228输入)向实体提供选择加入或选择退出让这样的信息被收集或与服务器或应用共享的机会。

应当理解，图12描述了充当在适当的操作环境1200中描述的实体和基本计算机资源之间的中介的软件。这样的软件包括操作系统1218。可以存储在磁盘存储器1214上的操作系统1218用于控制和分配计算机1202的资源。应用1220利用操作系统1218通过程序模块1224对资源的管理和存储在系统存储器1206中或存储在盘存储装置1214上的程序数据1226(诸如引导/关闭事务表等)。应当理解，所要求保护的主题可以用各种操作系统或操作系统的组合来实现。

实体通过输入设备1228将命令或信息输入到计算机1202中。输入设备1228包括但不限于诸如鼠标的定点设备、轨迹球、触控笔、触摸板、键盘、麦克风、操纵杆、游戏板、碟形卫星天线、扫描仪、TV调谐器卡、数码相机、数码摄像机、网络相机等。这些和其他输入设备通过接口端口1230经系统总线1208连接到处理单元1204。接口端口1230包括例如串行端口、并行端口、游戏端口和通用串行总线(USB)。输出设备1236使用一些与输入设备1228相同类型的端口。由此，例如，USB端口可用于向计算机1202提供输入并将信息从计算机1202输出到输出设备1236。提供输出适配器1234以说明存在需要特殊适配器的一些输出设备1236，比如监视器、扬声器和打印机以及其他输出设备1236。作为说明而非限制，输出适配器1234包括提供输出设备1236与系统总线1208之间的连接手段的视频和声卡。应当注意，其他设备或设备系统兼有输入和输出两种功能，诸如远程计算机1238。

计算机1202可使用到一个或多个远程计算机(诸如远程计算机1238)的逻辑连接在联网环境中操作。远程计算机1238可以是个人计算机、服务器、路由器、网络PC、工作站、基于微处理器的电器、对等设备、智能电话、平板电脑或其他网络节点，并且通常包括相对于计算机1202描述的许多元件。出于简明的目的，仅将内存存储设备1240与远程计算机1238在一起显示。远程计算机1238通过网络接口1242然后通过通信连接1244逻辑地连接到计算机120。网络接口1242包括有线或无线通信网络，诸如局域网(LAN)和广域网(WAN)和蜂窝网络。LAN技术包括光纤分布式数据接口(FDDI)、铜线分布式数据接口(CDDI)、以太网、令牌环等。WAN技术包括但不限于点对点链路、电路交换网络(如综合业务数字网(ISDN))及其变型、分组交换网络和数字用户线(DSL)。

通信连接1244指的是用于将网络接口1242连接到总线1208的硬件/软件。虽然为了说明清楚起见，通信连接1244被示为在计算机1202内部，但是它也可以在计算机1202外部。仅为了示范性目的，连接到网络接口1242所需的硬件/软件包括内部和外部技术，例如包括常规电话级调制解调器、电缆调制解调器和DSL调制解调器的调制解调器、ISDN适配器、以及有线和无线以太网卡、集线器和路由器。

虽然以上已经在运行在一个计算机和/或多个计算机上的计算机程序产品的计算机可执行指令的一般上下文中描述了本主题，但是本领域技术人员将认识到，本公开还可以用或可以结合其他程序模块来实现。通常，程序模块包括执行特定任务和/或实现特定抽象数据类型的例程、程序、组件、数据结构等。此外，本领域技术人员将认识到本发明的计算机实现的方法可以用其他计算机系统配置来实践，包括单处理器或多处理器计算机系统、小型计算设备、大型计算机、以及计算机、手持式计算设备(例如，PDA、电话)、基于微处理器的或可编程的消费或工业电子产品等。所示各方面还可在其中任务由通过通信网络链接的远程处理设备执行的分布式计算环境中实践。然而，本公开的一些方面(如果不是全部的话)可在独立计算机上实践。在分布式计算环境中，程序模块可以位于本地和远程内存存储设备两者中。

如在本申请中所使用的，术语“组件”、“系统”、“平台”、“接口”等可以指代和/或可以包括计算机相关实体或与具有一个或多个特定功能的操作机器相关的实体。本文公开的实体可以是硬件、硬件和软件的组合、软件或执行中的软件。例如，组件可以是但不限于在处理器上运行的进程、处理器、对象、可执行文件、执行的线程、程序和/或计算机。作为示例，在服务器上运行的应用和服务器两者都可以是组件。一个或多个组件可以驻留在进程和/或执行线程内，并且组件可以位于一个计算机上和/或分布在两个或更多个计算机之间。在另一实例中，相应组件可从具有存储于其上的不同数据结构的不同计算机可读媒体执行。组件可以诸如按照具有一个或多个数据分组的信号(例如，来自与本地系统、分布式系统中的另一组件交互和/或跨网络(诸如因特网)通过信号与其他系统交互的一个组件的数据)而通过本地和/或远程过程通信。作为另一实例，组件可以是具有由电气或电子电路操作的机械部件提供的特定功能的装置，该电气或电子电路由处理器执行的软件或固件应用操作。在这种情况下，处理器可以在装置内部或外部，并且可以执行软件或固件应用的至少一部分。作为又一实例，组件可以是通过没有机械部件的电子组件来提供特定功能的装置，其中电子组件可以包括处理器或执行至少部分地赋予电子组件功能的软件或固件的其他装置。在一方面，组件可通过例如云计算系统内的虚拟机来仿真电子组件。

此外，术语“或”旨在表示包含性的“或”而不是排他性的“或”。也就是说，除非另外指明或从上下文中清楚可见，“X采用A或B”旨在意指任何自然的包含性排列。即，如果X采用A；X采用B；或X采用A和B两者，则在任何前述情况下都满足“X采用A或B”。此外，在本说明书和附图中使用的冠词“一个/一种”总体上应被解释为意指“一个或多个”，除非另外指明或从上下文中清楚看出是针对单数形式。如在此所使用的，术语“实例”和/或“示范性”用于意指充当示例、例子或说明并且旨在是非限制性的。为了避免疑问，本文公开的主题不受这样的实例的限制。此外，在此描述为“实例”和/或“示范性”的任何方面或设计不一定被解释为比其他方面或设计优选或有利，也不旨在排除本领域普通技术人员已知的等效示范性结构和技术。

如在本说明书中所采用的，术语“处理器”可以指基本上任何计算处理单元或设备，包括但不限于单核处理器；具有软件多线程执行能力的单处理器；多核处理器；具有软件多线程执行能力的多核处理器；具有硬件多线程技术的多核处理器；并行平台；以及具有分布式共享存储器的并行平台。另外，处理器可指代集成电路、专用集成电路(ASIC)、数字信号处理器(DSP)、现场可编程门阵列(FPGA)、可编程逻辑控制器(PLC)、复杂可编程逻辑装置(CPLD)、离散门或晶体管逻辑、离散硬件组件，或经设计以执行本文中所描述的功能的其任何组合。进一步，处理器可以利用纳米级架构，诸如但不限于基于分子和量子点的晶体管、开关和栅极，以便优化空间使用或增强实体设备的性能。处理器还可以被实现为计算处理单元的组合。在本公开中，诸如“储存”、“存储”、“数据储存”、“数据存储”、“数据库”等术语以及与组件的操作和功能相关的基本上任何其他信息存储组件被用于指“存储器组件”、“存储器”中体现的实体、或包括存储器的组件。应理解，本文中所描述的存储器和/或存储器组件可为易失性存储器或非易失性存储器，或可包含易失性存储器和非易失性存储器两者。作为示例而非限制，非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除ROM(EEPROM)、闪存或非易失性随机存取存储器(RAM)(例如，铁电RAM(FeRAM))。易失性存储器可以包括可以例如充当外部高速缓存存储器的RAM。作为示例而非限制，RAM以许多形式可用，诸如同步RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双倍数据速率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、SynchlinkDRAM(SLDRAM)、直接RambusRAM(DRRAM)、直接Rambus动态RAM(DRDRAM)和Rambus动态RAM(RDRAM)。另外，本文所公开的系统或计算机实现的方法的存储器组件旨在包括但不限于包括这些和任何其他合适类型的存储器。

上述内容仅包括系统和计算机实现的方法的示例。当然，出于描述本公开的目的，不可能描述组件的每个可想到的组合或计算机实现的方法，但是本领域普通技术人员可以认识到，本公开的许多进一步的组合和排列是可能的。此外，就在具体实施方式部分、权利要求书、附录和附图中使用术语“包括”、“具有”、“拥有”等的程度而言，这些术语旨在以与术语“包含”在权利要求书中用作过渡词时被解释的类似的方式是包括性的。已出于说明的目的呈现了不同实施例的描述，但所述描述并非意在穷举或限于所揭示的实施例。在不脱离所描述的实施例的范围的情况下，许多修改和变化对本领域的普通技术人员而言可以是显而易见的。选择这里使用的术语是为了最好地解释实施例的原理，对市场上存在的技术的实际应用或技术上的改进，或者使得本领域普通技术人员能够理解本文所公开的实施例。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 通过对存活事件进行联合建模来确定潜在的癌症治疗靶标 [P] . 中国专利： CN112204667A . 2021-01-08
2. 自动行驶系统、自动行驶管理程序、记录有自动行驶管理程序的记录介质、自动行驶管理方法、区域确定系统、区域确定程序、记录有区域确定程序的记录介质、区域确定方法、联合收割机控制系统、联合收割机控制程序、记录有联合收割机控制程序的记录介质、联合收割机控制方法 [P] . 中国专利： CN111386030A . 2020-07-07
3. DETERMINING POTENTIAL CANCER THERAPEUTIC TARGETS BY JOINT MODELING OF SURVIVAL EVENTS [P] . 美国专利： US2019384889A1 . 2019-12-19

机译：通过生存事件联合建模确定潜在的癌症治疗靶标
4. DETERMINING POTENTIAL CANCER THERAPEUTIC TARGETS BY JOINT MODELING OF SURVIVAL EVENTS [P] . 世界知识产权组织专利： WO2019243909A1 . 2019-12-26

机译：通过生存事件联合建模确定潜在的癌症治疗靶标
5. Determination of potential cancer treatment targets by joint modeling of survival events [P] . JP2021527874A . 2021-10-14

机译：生存事件联合建模的测定潜在癌症治疗靶