首页> 中国专利> 用于预测患者护理未来结果的医疗系统和方法

用于预测患者护理未来结果的医疗系统和方法

摘要

提供了一种医疗数据系统及使用该医疗数据系统的方法。该医疗数据系统包括计算平台,用于使用来自多名患者中每一名患者在多个时间点处的患者特异性数据,以在多个时间点中的每个时间点处为该多名患者中的每一名患者生成多维向量,从而为每名患者提供多个时间相关的多维指数。该系统还使用从受试者在时间T1处的数据产生的多维向量将该受试者归类为第一组患者,以及使用从受试者在时间T2处的数据产生的多维向量将该受试者归类为第二组患者。

著录项

  • 公开/公告号CN106793957A

    专利类型发明专利

  • 公开/公告日2017-05-31

    原文格式PDF

  • 申请/专利权人 梅达器材有限公司;

    申请/专利号CN201680002209.9

  • 发明设计人 埃多·德克尔;

    申请日2016-04-19

  • 分类号A61B5/00;

  • 代理机构北京京万通知识产权代理有限公司;

  • 代理人齐晓静

  • 地址 以色列赖阿南纳

  • 入库时间 2023-06-19 02:20:31

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2020-08-18

    授权

    授权

  • 2017-06-23

    实质审查的生效 IPC(主分类):A61B5/00 申请日:20160419

    实质审查的生效

  • 2017-05-31

    公开

    公开

说明书

技术领域和背景技术

本发明涉及一种医疗数据系统及使用该医疗数据系统预测患者护理未来结果的方法。

近年来,电子医疗记录(EMR)和计算机化医生订单输入(CPOE)技术已经进入临床领域。这些技术提供了足够的信息来识别潜在有害的处方以及其他现有或近期的临床有价值的参数,然而,由于这样的系统仅分析特定的患者文件,它们仅限于其中包含的信息,因此不能得到医疗相关的可用于预测患者护理长期结果的信息。

用于预测患者护理长期结果(包括健康状况、护理成本等)的系统可以显著地改善护理系统的有效性与效率。在US 20120041772中描述了一种这样的系统,其公开了一种用于预测患者预后的系统。该系统将查询患者与类似患者的最佳锚定时间戳对准,并使用来自相似患者的数据来预测查询患者的长期结果测量。

虽然两个患者的时间相关对准可以用于预测不太晚期患者的未来结果(就疾病/护理的进展而言),但由于患者的多样性和疾病的非线性进展,比较个体患者是具有挑战性的。

因此,仍然需要一种医疗数据系统,其可以提供患者护理结果的高度精确预测。

发明内容

根据本发明的一个方面,提供了一种医疗数据系统,其包括计算平台,该计算平台被配置用于:(a)使用来自多名患者中每一名患者在多个时间点处的患者特异性数据,以在多个时间点中的每个时间点处为该多名患者中的每一名患者生成多维向量,从而为每名患者提供多个时间相关的多维指数;(b)使用从受试者在时间T1处的数据产生的多维向量将受试者归类为第一组患者;以及(c)使用从受试者在时间T2处的数据产生的多维向量将该受试者归类为第二组患者。

根据下述的本发明优选实施例中另外的特征,该计算平台还被配置为:(d)识别由第一组和第二组共享的患者子集。

根据所述的优选实施例中另外的特征,该计算平台还被配置为:(e)查询患者子集的时间相关数据,从而预测受试者在时间T3处的数据相关值。

根据所述的优选实施例中另外的特征,多维向量包括一个或多个参数,所述一个或多个参数选自:人口统计参数、生理参数、药物处方相关参数、疾病相关参数、治疗相关参数、护理提供者相关参数以及保险公司相关参数。

根据所述的优选实施例中另外的特征,该医疗系统还包括:使用受试者在一个或多个另外的时间TK…N处的数据产生的多维向量将受试者归类为至少第三组患者。

根据所述的优选实施例中另外的特征,该计算平台还被配置为:(d)识别由第一组、第二组和至少第三组共享的患者子集。

根据所述的优选实施例中另外的特征,受试者在时间T3处的数据相关值是缺失值。

根据所述的优选实施例中更进一步的特征,受试者在时间T3处的数据相关值选自药物处方、护理成本、预后,以及护理持续时间。

根据本发明的另一方面,提供了一种将受试者与患者组相关联的方法,包括:(a)使用来自多名患者中每一名患者在多个时间点处的患者特异性数据,以在多个时间点中的每个时间点处为该多名患者中的每一名患者通过计算生成多维向量,从而为每名患者提供多个时间相关的多维指数;(b)使用从受试者在时间T1处的数据产生的多维向量通过计算将该受试者归类为第一组患者;(c)使用从受试者在时间TN处的数据产生的多维向量通过计算将受试者归类为至少第二组患者;(d)识别由第一组和至少第二组共享的患者子集,从而将受试者与患者组相关联。

根据所述的优选实施例中另外的特征,该方法还包括:(e)查询患者子集的时间相关数据,从而预测受试者在时间T3处的数据相关值。

根据所述的优选实施例中另外的特征,多维向量包括一个或多个参数,一个或多个参数选自:人口统计参数、生理参数、药物处方相关参数、疾病相关参数、治疗相关参数、护理提供者相关参数以及保险公司相关参数。

根据所述的优选实施例中更进一步的特征,该方法还包括:使用受试者在一个或多个时间TK…N处的数据产生的多维向量将受试者归类为至少第三组患者。

根据所述的优选实施例中另外的特征,该方法还包括:(f)识别由第一组、第二组和至少第三组共享的患者子集。

根据所述的优选实施例中另外的特征,受试者在时间T3处的数据相关值是缺失值。

根据所述的优选实施例中另外的特征,受试者在时间T3处的数据相关值选自药物处方、护理成本、预后,以及护理持续时间。

本发明通过提供一种用于准确预测受试者健康护理结果的系统,成功地解决了目前已知配置的缺点。

除非另外定义,否则本文使用的所有技术和科学术语具有本发明所属领域内普通技术人员通常理解的相同含义。尽管与本文所述的方法和材料相类似或等同的方法和材料可以用于本发明的实践或测试,但是下面描述了合适的方法和材料。在出现冲突的情况下,以本专利说明书(包括定义)为准。此外,材料、方法和实施例仅仅是说明性的,而不是限制性的。

本发明的方法和系统的具体实施涉及手动地、自动地或者两者组合执行或完成所选择的任务或步骤。此外,根据本发明的方法和系统的优选实施例的实际仪器和设备,几个选定步骤可以通过硬件或通过任何固件的任何操作系统上的软件或其组合来实施。例如,作为硬件,本发明的选定步骤可以实施为芯片或电路。作为软件,本发明的选定步骤可以实施为由使用任何合适操作系统的计算机所执行的多个软件指令。在任何情况下,本发明的方法和系统的选定步骤可以被描述为由数据处理器执行,诸如用于执行多个指令的计算平台。

附图说明

本文中将参照附图仅通过举例方式描述本发明。现在具体参考附图,需要强调的是,所示的细节仅是示例性的并且仅用于说明性讨论本发明的优选实施例,并且被呈现为提供被认为是对本发明的原理和概念方面最有用和容易理解的描述。在这方面,并不打算示出除基本理解本发明所需细节以外的本发明的结构细节,附图说明使本领域技术人员明白如何在实践中实施本发明的几种形式。

在附图中:

图1a-图1b是框图,示出了本医疗数据系统(图1a)和存储的模块(图1b)。

图2是流程图,示出了根据本发明教导内容的参考组的识别。

图3示出了使用本发明教导内容所分析的受试者的护理和治疗结果的预测未来成本。

图4示出了使用本发明来提供组相似性测量。

具体实施方式

本发明是一种用于预测患者护理未来结果的系统。具体地,本发明可以用于在治疗或疾病进展的任何阶段预测受试者的例如预后、护理成本和治疗需求等。

参考附图和所附说明可以更好地理解本发明的原理和操作。

在详细解释本发明的至少一个实施例之前,应当理解,本发明在其应用上不限于在下文描述中阐述或在附图中示出的部件的结构和布置的细节。本发明能够具有其他实施例或以各种方式实践或实施。此外,应当理解,本文所使用的措辞和术语是为了描述的目的,而不应被认为是限制性的。

尽管用于预测患者预后的系统是已知的,但这样的系统通常利用一名或多名患者的历史数据作为另一医疗上类似患者的健康状况的未来预测因子。

两个个体或一个个体与一个组之间的相似性可随时间而改变。尽管患者“A”在时间X可能与患者“B”在时间Y最相似,但同一患者A在时间X+1可能与患者B或在时间Y+1或时间Y+2不相似。因此,基于最佳拟合时间点将患者A与患者B或组C聚类可能不足以获得未来护理的准确预测因子。

将本发明实践起来时,本发明人设计了一种系统,其利用更复杂的多维时间依赖性的相似性方法来识别在受试者的几个时间点处医疗上类似于受试者的患者组,由此显著增加识别受试者护理结果的精确预测因子(未来数据相关值)的可能性。

因此,根据本发明的一个方面,提供了一种用于预测受试者护理未来结果的医疗数据系统,包括例如未来预后、未来健康状况、未来护理成本、未来发病率或共发病率、寿命、药物需求、风险管理、质量管理和人口管理。

图1a-图1b示出了本发明的医疗数据库系统,其在本文中称为系统10。

系统10存储了与多个受试者(指查询个体)和患者(指组和参考组个体)相关的数据;为了清楚起见,在图1a中仅示出了与单个受试者相关的数据。

系统10包括用于存储模块14的数据单元12,该模块14表示一名受试者在不同时间点(T1,T2,T3,T4,…TK,TN)处的医疗记录。模块14通常被表示为多维向量,每个向量用不同的时间戳标记;图1b示出了在时间T1处的模块14。每个受试者在各种时间点中每个时间点处的多维向量提供多个时间相关的多维指数。在每个时间点为每个患者生成类似的多维向量。

模块14作为数据库(诸如标准关系数据库)中的记录,作为定界符分隔的文本文件中的行或者任何此类其它数据存储格式被存储。数据单元12被存储在计算机平台(诸如台式机、膝上型计算机、工作站、服务器等)的用户可访问的存储介质(磁/光驱动器)上。计算平台可以被本地访问或通过通信网络16通过任何计算设备18访问,计算设备18包括固定(例如台式计算机)和移动(例如智能电话、平板电脑等)设备。

受试者的每个模块14包括关于在特定的护理时间点所收集的医疗相关参数的信息,即填充单个模块14的受试者的医学相关参数全部在单个时间点处被收集(或输入到受试者的文件中)。因此,第一模块14可以包括在T1处‘收集的’医疗相关参数,第二模块14可以包括T2处的医疗相关参数,第三模块14可以包括T3处的医疗相关参数等。每个受试者可以由任何数量的模块14表示,这取决于护理持续时间、疾病类型等。不同时间段之间的时间间隔不需要相等,可以是小时、天、周或月。每个受试者的模块数量是无限的,且由受试者的病史确定。例如,可以参考实际医疗事件的时间或与医疗事件相关的时间,例如“II型糖尿病诊断前1年”或“住院后1个月”来创建模块。也可以参考受试者的年龄,即“当受试者为20岁时的诊断”创建模块。在任何情况下,可以通过医疗事件或预设时间段来确定时间范围。如图1b所示,模块14的每个医疗相关参数由模块元素20表示。每个元素20被分配了模块中特定的标识符22和对应于医疗相关参数的数值24。数值可以是布尔、离散或连续数值。

医疗相关参数的示例包括但不限于住院、护理点类型和名称、处方开的药物、生理参数(诸如年龄、体重、身高)、临床表现参数(诸如诊断的病症、血液测试结果、化学性质、血压、心率)、治疗相关参数(诸如手术)、社会经济状况、对治疗的依从性、体育活动和遗传因素。

每个参数占据模块的特定元素,并且由特定位置(数字)或标签(代码)标识。另外,如上所述,每个参数被分配了一个值,该值可以是布尔值(例如关于诊断的真或假、处方开的药物、特定专用临床的过去访问)、离散值(例如特定药物在过去已被开出处方的次数、以月计的年龄)或连续的(例如临床参数,诸如血细胞计数)。分配给每个元素的离散或连续值可以归一化为处于某一预定义范围内或具有某些期望的统计特性。

受试者的每个模块根据受试者在特定时间点的健康记录快照,即在时间T,天数X,月份Y,以及年份Z的患者医疗文件中的数据。健康记录数据被加以处理,并且产生数据的形式表示,作为固定长度-R=(f1,f2,f3,…,fN)的数值向量。

该向量的每个元素是在特定时间点的患者表示的“特征”。

向量生成过程具有3个主要阶段:数据提取、数据编码和特征计算:

a.在数据提取阶段,使用预定义代码表示在医疗记录中输入或用特定时间加戳的文本数据。例如,可以将“股骨的转子下骨折”的诊断转换为其ICD10代码S72.2。自然语言处理(NLP)技术可以用于识别存储在EMR中的自由文本内的词和短语,从而从中可以提取诊断和其他信息数据元素。

b.在数据编码阶段,将提取的数据变换成纯数字形式。例如,在前面的示例中,可以使用全ICD10代码的一个计数表将ICD10代码S72.2变换为索引38172。

c.在特征计算阶段,基于从患者记录所提取数据的数值表示来计算表示的预定义元素。患者记录的最终表示是该阶段所计算的所有特征的有序集合。

本发明的系统还可以包括用于计算的推理引擎,以基于标识符,将特定受试者各自在特定时间点(T1,T2,T3,T4,......TK,TN)的多个模块与患者的多个模块(在不同的时间点)进行比较,以便识别与受试者的每个时间戳模块相似的特定患者组。这种比较可以考虑模块(患者和受试者)每个模块元素的值或这些元素的至少一部分的值。在任何情况下,一旦识别出这样的模块特异性组,就对它们进行进一步分析以识别存在于所有组中的患者子集。

然后可以使用该患者子集(在本文中也称为“参考组”)来预测对受试者护理的未来结果(预测未来的数据相关值)。

与受试者“时间上更接近”的患者更可能是组中的成员。例如,如果受试者在被诊断患有II型糖尿病1年后住院,则另一名在被诊断患有II型糖尿病1年后住院的患者,比在被诊断患有II型糖尿病2年后住院的患者,更可能是组里的一份子。此外,时间接近度的分辨率与关键事件的时间间隔成比例。例如,如果时间戳是关键事件之前的一个月(即住院、死亡等),则参考天/周的时间变化,然而,如果时间戳是关键事件之前的10年,则参考多年的时间变化。

应当理解,由本发明的系统识别出的参考组显著地提高了预测因子的精确度,因为由于此类参考组包括在受试者的护理历史期间几个时间点上与受试者相似的患者。

图2是流程图,概括了识别本发明参考组的过程。

在WO 2014111933中描述了多种方法,用于比较受试者和患者的模块数据以及基于数据相似性将受试者与患者组聚类,其通过引用并入本文。备选方法可以利用已知的聚类工具,例如k-最近邻、主成分分析、决策树和类似算法。

聚类可以基于与受试者相关的预测因子来实现。例如,如果所寻求的预测因子是护理成本,则参考组将通过上述的一些或全部医学相关参数来识别,但也基于护理点和/或保险提供者。护理点参数可以是特定的医院或在类似位置(例如在美国的同一城市)具有相似大小的医院。“在护理点参数上更接近”受试者的患者更可能是聚类组的成员。类似地,如果用于比较的参数是社会经济方面的,则在社会经济上更接近受试者的患者更可能是聚类组的成员。

本发明的系统可以与EMR系统集成以电子地获得历史患者记录以及与患者相关的任何新信息。系统可以在医院环境、社区环境、药房环境、保险公司环境、药房或药学福利管理器(PBM)环境,或上述的组合中使用。

本系统的数据库组件可以将模块存储为团块(二进制大对象)。患者对象数据库包含患者‘对象’的序列化表示。当与特定患者有关的数据需要在线时,相应的序列化对象将被加载到存储器中,并且将可用于更新和分析。在医院环境中,当患者在ER处注册、被准予进入或到达门诊诊所时,对象将被加载。在社区环境中,当患者计划访问家庭医生、护士或顾问时,对象将被加载。当接收到关于患者的新数据(即,新的血液测试)时,将加载、更新患者对象,将生成处方错误(如果需要的话),并且随后将对象序列化并保存回数据库中。

如上所述,本系统可以用于预测任何受试者护理的近期或长期结果。本系统可以提供关于查询的反馈,诸如:

1.不向受试者开具对参考组的至少一些患者开具的药物(例如向50%或更多的患者);

2.不向参考组的至少一些患者(例如不向至50%或更多的患者)开具向受试者开具的药物;

3.最近X年受试者的医疗费用与参考组相比较结果如何;

4.未来X年该受试者的预计医疗费用是多少;

5.这名患者在未来X年的预测结果是什么;

6.受试者死亡、残疾、住院、再入院的风险有多高。

图3示出了基于参考组的三名患者对患者56(受试者)的护理和治疗结果的未来成本的预测。患者的诊断、血液测试和处方分别标记为Dx、BT和Rx。患者51、58和60形成一个患者组,该组与受试者具有相似的病史,达到相似性阈值。基于组中3名患者的已知未来病史,可以为受试者估计参数(例如未来治疗)。为该比较设置的相似性阈值为70%,但是,本系统可以设置任何阈值。阈值越低,将有更多的患者适合该组,因此统计将基于较大量的患者,花费所述组较低的相似性。一些实施例将在基于组中患者的相似性测量的平均预测参数中,应用加权方案。

图4示出了应用本发明为分组(而非个体)提供相似性测量。当测量分组的质量测量时,分组测量是与其本身的参考组相比每个个体的相对测量值的平均值。分组相似性测量使得能够校正群体中个体之间的差异,并且提供一种分组之间(而非个体与分组之间)比较的工具。例如,当比较同一医院中两个单元(例如一般与冠状动脉护理单元)中的护理质量时。在这些情况下,每个单元中每名患者的估计护理质量(通过与类似患者的组进行比较而估计)可以被平均以获得整个单元的护理质量分数。然后可以比较两个单元的单元分数以鉴定单元。

由本发明系统预测的数据相关值还可以用于在特定设施或特定医生下的护理资格鉴定。例如,比较某些医院病房的实际护理成本与可比较患者组的平均护理成本(参见下面的实例部分)。

由本发明的系统预测的数据相关值还可以用于,通过与向参考组所开具的慢性药物进行比较来确定特定受试者的长期治疗的有效性,或者通过计算每个受试者在各个医院部门中与相应参考组之间的质量测量差异的平均值,提供医院部门的质量测量鉴定。

通过查看以下不具有限制性的实例,本发明的其它目的、优点和新颖特征对于本领域普通技术人员将变得显而易见。

实例

现在参考以下实例,其与上述说明一起以非限制性方式说明本发明。

估计未来住院次数

使用在50岁被诊断患有II型糖尿病并随着时间的推移出现若干并发症的一名55岁女性受试者,来识别一个参考组,用于估计直到60岁的预期住院次数(或护理成本)。

受试者数据被布置在如上所述的时间戳模块中。在以下时间点构建31个模块:51,52,53,54和55岁(5个年龄模块)、15次就医(15个诊断模块)、8个血糖测量结果(8个血液测试模块)和3次医院就诊(3个门诊模块)。将这些模块与其他患者模块进行比较,在从大约50岁的第一次诊断开始的4-6年期间(允许疾病进展不均)分布。如上所述提取参考组。参考组直到55岁都显示出类似的疾病进展(如通过血液测试和并发症诊断所指示的);数据可用于该参考组到至少60岁。计算这30名患者5年以上(年龄55至60岁)的平均住院次数(和相关的护理成本)及其延长的病史,并将其用于推算未来5年内受试者的平均预计住院次数(和护理成本)。

应当理解,为了清楚起见在单独实施例的上下文中描述的本发明的特征也可以在单个实施例的组合中提供。相反,为了简便起见,在单个实施例中描述的本发明各种特征也可以单独提供或以任何合适的子组合提供。

尽管已经结合具体实施例描述了本发明,但显然的是,许多替代形式、修改和变型对于本领域技术人员将是显而易见的。因此,旨在包括落入所附权利要求的精神和广泛范围内的所有此类替代形式、修改和变型。本说明书中提及的所有出版物、专利和专利申请通过引用整体并入本说明书,并入的程度,如同每个单独的出版物、专利或专利申请被具体地和单独地被指示通过引用并入本文那样。此外,本申请中的任何参考文献的引用或标识不应被解释为承认这样的参考文献可作为本发明的现有技术。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号