技术领域
本发明涉及计算机应用技术领域,具体而言,涉及一种基于真实世界临床数据的治疗方案综合疗效评估方法。
背景技术
患者在治病问诊时,由于其自身身体原因,或者基于不同医师的经验等因素,可能会获得不同的治疗方案建议。无论是对于不同患者,还是对于同一患者,采用不同治疗方案时,其整体状态以及例如单一症状体征或身体指标变化等不同维度特征也会具有一定差异。而整体状态及各维度特征都可以通过量化打分的方式予以评价,例如属于正常、异常或恶化等不同情况,不同情况给予不同的打分。因此,不同的治疗方案的治疗效果是存在差异的,不过目前还无法较为准确地评估某个治疗方案的效果,这可能使患者承受更多的痛苦。
发明内容
针对现有技术的不足,本发明提出一种基于真实世界临床数据的治疗方案综合疗效评估模型构建及预测方法。
第一方面,本发明提供了一种基于真实世界临床数据的治疗方案综合疗效评估模型构建方法,该方法包括如下步骤:
基于临床数据获取患者的多个维度特征的评分以及整体状态的评分,其中,各所述维度特征分别对应有标准描述文本,所述标准描述文本包括按照时间顺序排列的症状体征描述和检查指标变化描述,所述症状体征描述和所述检查指标变化描述分别对应有多个等级;
获取所述标准描述文本的字向量,以所述字向量作为输入,根据所述维度特征的评分与模型预测评分的均方误差计算损失,对预设第一模型进行训练,获得维度特征评分模型;
以所述维度特征的评分作为输入,根据所述整体状态的评分与模型预测评分的均方误差计算损失,对预设第二模型进行训练,获得整体状态评分模型;
其中,治疗方案综合疗效评估模型包括所述维度特征评分模型和所述整体状态评分模型。
进一步,各所述维度特征的评分和所述整体状态的评分的区间范围一致。
进一步,所述预设第一模型包括:
s
z
其中,T、U、b、M分别表示网络参数,s
进一步,所述预设第二模型包括:
c=W
a=σ(c);
其中,W=(w
第二方面,本发明提供了一种基于真实世界临床数据的治疗方案综合疗效评估模型构建装置,该装置包括存储器和处理器;所述存储器,用于存储计算机程序;所述处理器,用于当执行所述计算机程序时,实现如上所述的基于真实世界临床数据的治疗方案综合疗效评估模型构建方法。
第三方面,本发明提供了一种基于真实世界临床数据的治疗方案综合疗效评估方法,该方法包括如下步骤:
根据患者的维度特征对应的标准描述文本获取字向量,将所述字向量输入如上所述的基于真实世界临床数据的治疗方案综合疗效评估模型构建方法构建的治疗方案综合疗效评估模型,获得所述患者的维度特征预测评分,其中,所述标准描述文本包括按照时间顺序排列的症状体征描述和检查指标变化描述,所述症状体征描述和所述检查指标变化描述分别对应有多个等级;
将所述患者的维度特征的预测评分输入如上所述的基于真实世界临床数据的治疗方案综合疗效评估模型构建方法构建的治疗方案综合疗效评估模型,获得所述患者的整体状态预测评分;
根据多个患者的所述维度特征预测评分和所述整体状态预测评分获得标定治疗方案的疗效评分指标。
进一步,所述根据多个患者的所述维度特征预测评分和所述整体状态预测评分获得标定治疗方案的疗效评分指标包括:
对所述多个患者进行聚合分类,获得多个簇;
将每个所述簇中的患者分为实验组患者和对照组患者,其中,所述实验组患者为使用了所述标定治疗方案的患者,所述对照组患者为未使用所述标定治疗方案的患者;
分别获取所述实验组患者和所述对照组患者的多个时间节点的所述整体状态预测评分,其中,多个所述时间节点包括采用所述标定治疗方案前的时间节点以及采用所述标定治疗方案后的时间节点;
根据所述实验组患者的所述整体状态预测评分和所述对照组患者的所述整体状态预测评分获得所述标定治疗方案的疗效评分指标。
进一步,所述根据所述实验组患者的所述整体状态预测评分和所述对照组患者的所述整体状态预测评分获得所述标定治疗方案的疗效评分指标包括:
分别获取同一簇中各所述实验组患者和各所述对照组患者在前后时间节点的所述整体状态预测评分的差值,作为状态变化;
根据所述状态变化分别获取同一簇中所有所述实验组患者和所有所述对照组患者在前后时间节点的平均状态变化;
根据所述平均状态变化获取同一簇中所述实验组患者和所述对照组患者的状态变化幅度的差异值;
根据各簇的所述状态变化幅度的差异值获取所有簇的状态变化幅度的差异平均值,作为所述标定治疗方案的疗效评分指标。
第四方面,本发明提供了一种基于真实世界临床数据的治疗方案综合疗效评估装置,该装置包括存储器和处理器;所述存储器,用于存储计算机程序;所述处理器,用于当执行所述计算机程序时,实现如上所述的基于真实世界临床数据的治疗方案综合疗效评估方法。
第五方面,本发明提供了一种计算机可读存储介质,所述存储介质上存储有计算机程序,当所述计算机程序被处理器执行时,实现如上所述的基于真实世界临床数据的治疗方案综合疗效评估模型构建方法,或者实现如上所述的基于真实世界临床数据的治疗方案综合疗效评估方法。
本发明提供的基于真实世界临床数据的治疗方案综合疗效评估模型构建及评估方法、装置和存储介质的有益效果是,治疗方案综合疗效评估模型包括维度特征评分模型,以根据维度特征的标准描述文本对维度特征进行预测评分,以及整体状态评分模型,以根据维度特征的评分或预测评分对整体状态进行预测评分,保证模型的稳定性。通过患者已知的标准描述文本便可获知相应的整体状态预测评分,进而根据多个患者的整体状态预测评分对例如标定中医治疗方案进行预测评估,可以较为准确地评估某个治疗方案的效果,综合考虑了不同患者之间的差异性,将患者多方面的差异进行融合评估与区分,有助于更准确全面地评估治疗方案的效果,有助于对治疗方案进行针对性的优化,有助于减轻患者的痛苦程度,甚至改善整体治疗效果。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单的介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例的基于真实世界临床数据的治疗方案综合疗效评估模型构建方法的流程示意图;
图2为本发明实施例的基于真实世界临床数据的治疗方案综合疗效评估方法的流程示意图。
具体实施方式
以下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。
如图1所示,本发明实施例的一种基于真实世界临床数据的治疗方案综合疗效评估模型构建方法包括如下步骤:
S11,基于临床数据获取患者的多个维度特征的评分以及整体状态的评分,其中,各所述维度特征分别对应有标准描述文本,所述标准描述文本包括按照时间顺序排列的症状体征描述和检查指标变化描述,所述症状体征描述和所述检查指标变化描述分别对应有多个等级。
具体地,数据来源可以是院内系统记录的某一专病患者的基本信息(性别、年龄等)、既往史、各项检查检测指标、用药记录、用药后表现记录、症状记录和不良反应记录(结论、分级、描述)等真实世界临床数据。
优选地,各所述维度特征的评分和所述整体状态的评分的区间范围一致。
具体地,在同一种专病范围内,首先根据院内系统的真实数据梳理出维度特征,并建立一套标准用于将每个维度的数据转换为数值评分,且每个维度评分范围一致,比如都在0-1之间。
根据医学团队梳理出评分规则,每个维度特征可分五个等级:正常,轻微异常,中度异常,严重异常,恶化。其中恶化评分区间为0.8-1.0,严重异常评分区间为0.6-0.8,中度异常评分区间为0.3-0.6,轻度异常评分区间为0.1-0.3,正常评分区间为0-0.1。
另外,医学团队也针对患者的整体状态进行评分,针对整体状态的评分同样可分为五个等级区间,等级划分与等级评分区间可与上面相同。
令Y为某个患者当前整体状态的评分,x
如果维度较多,还可通过例如PCA降维处理,对维度数量进行压缩,同时消除维度特征之间的共线性。通过降维处理之后,最终得到例如六个维度特征,其评分示例如表1所示。
表1
通过以上处理,可以得到一批患者的状态评分样本数据:((x
S12,获取所述标准描述文本的字向量,以所述字向量作为输入,根据所述维度特征的评分与模型预测评分的均方误差计算损失,对预设第一模型进行训练,获得维度特征评分模型。
具体地,各维度特征对应有标准描述文本,标准描述文本包括症状体征描述、检查指标变化描述等。其中,可将症状的描述情况分为三个等级进行标准化描述:轻度、中度、严重。以及将指标变化情况分为三种情况进行标准化描述:升高、降低、不变。最后将不同部分的文本描述按照发生的时间序列顺序进行拼接,得到形式如下的文本:
症状A严重症状B中度指标C升高指标D不变
通过大量医学语料,使用bigram统计相邻字的共现频数,得到统一的二维频数矩阵,从而得到字向量v。则输入文本的每个字向量为:v
优选地,所述预设第一模型包括:
s
z
其中,v
具体地,由于具有时间维度,最后得到的输出可表示为Z=[z
使用医学团队已经评分的患者样本,以患者对应维度特征的标准描述文本的字向量作为输入,将模型的预测评分与医学团队给出的该维度特征评分值p进行比较,采用均方误差计算损失:
其中,K为每次的训练样本数,训练样本来自医学团队已进行评分标注的患者样本,通过训练学习到模型参数。
将训练好的维度特征评分模型用于预测患者各维度特征的评分,模型的输入为某个维度特征相关的标准描述文本的字向量,输出为某个维度特征的预测评分。将各特征维度相关的标准描述文本的字向量作为模型输入,输出为对应维度特征的预测评分:
其中,n为维度数量。
S13,以所述维度特征的评分作为输入,根据所述整体状态的评分与模型预测评分的均方误差计算损失,对预设第二模型进行训练,获得整体状态评分模型。
优选地,所述预设第二模型可以为前馈神经网络,包括:
c=W
a=σ(c);
其中,W=(w
使用医学团队已评分标注的样本数据进行训练,同样根据医学团队的评分与模型预测评分的均方误差计算损失,通过反向传播和梯度下降算法进行参数优化,学习得到模型,最终学习得到的模型反映的就是患者各维度特征评分与患者整体状态评分的关联关系。
使用训练得到的患者整体状态评分模型,通过输入患者各维度特征评分,可预测患者的整体状态评分。
需要注意的是,在构建模型时,步骤S12和S13没有严格的先后顺序之分。
在本实施例中,治疗方案综合疗效评估模型包括维度特征评分模型,以根据维度特征的标准描述文本对维度特征进行预测评分,以及整体状态评分模型,以根据维度特征的评分或预测评分对整体状态进行预测评分,保证模型的稳定性。通过患者已知的标准描述文本便可获知相应的整体状态预测评分,进而根据多个患者的整体状态预测评分对例如标定中医治疗方案进行预测评估,可以较为准确地评估某个治疗方案的效果,综合考虑了不同患者之间的差异性,将患者多方面的差异进行融合评估与区分,有助于更准确全面地评估治疗方案的效果,有助于对治疗方案进行针对性的优化,有助于减轻患者的痛苦程度,甚至改善整体治疗效果。
在本发明另一实施例中,一种基于真实世界临床数据的治疗方案综合疗效评估模型构建装置包括存储器和处理器;所述存储器,用于存储计算机程序;所述处理器,用于当执行所述计算机程序时,实现如上所述的基于真实世界临床数据的治疗方案综合疗效评估模型构建方法。
如图2所示,本发明实施例的一种基于真实世界临床数据的治疗方案综合疗效评估方法包括如下步骤:
S21,根据患者的维度特征对应的标准描述文本获取字向量,将所述字向量输入如上所述的基于真实世界临床数据的治疗方案综合疗效评估模型构建方法构建的治疗方案综合疗效评估模型,获得所述患者的维度特征预测评分,其中,所述标准描述文本包括按照时间顺序排列的症状体征描述和检查指标变化描述,所述症状体征描述和所述检查指标变化描述分别对应有多个等级。
具体地,治疗方案综合疗效评估模型包括所述维度特征评分模型和所述整体状态评分模型。将患者的维度特征对应的标准描述文本的字向量输入所述维度特征评分模型,可以获得患者的维度特征预测评分。
S22,将所述患者的维度特征的预测评分输入如上所述的基于真实世界临床数据的治疗方案综合疗效评估模型构建方法构建的治疗方案综合疗效评估模型,获得所述患者的整体状态预测评分。
具体地,将上述患者的维度特征的预测评分输入所述整体状态评分模型,可以获得患者的总体状态预测评分。
S23,根据多个患者的所述维度特征预测评分和所述整体状态预测评分获得标定治疗方案的疗效评分指标。
优选地,所述根据多个患者的所述维度特征预测评分和所述整体状态预测评分获得标定治疗方案的疗效评分指标包括:
对所述多个患者进行聚合分类,获得多个簇。
具体地,针对被纳入患者各方面情况不一致的情况,对患者进行聚合分类,使得情况近似的患者分为一簇,在同一类中进行对照评估。需要注意的是,进行聚合分类时的患者数据,应为待评估治疗方案开始实施前的数据。
示例性地,随机选取m个患者,根据其维度特征X
计算其他每个患者的特征维度X
其中,D
然后根据距离D
再重新计算每个簇的质心(均值),每个簇各个维度求均值有:
其中,q为该簇聚合的患者数,
重复以上步骤,直到质心的位置不再需要发生变化,对此采用平方误差准则:
其中,m为纳入患者被聚合的簇数,p为纳入患者的总数。当E最小时质心不再需要变化,确定聚合分类结果。
将每个所述簇中的患者分为实验组患者和对照组患者,其中,所述实验组患者为使用了所述标定治疗方案的患者,所述对照组患者为未使用所述标定治疗方案的患者。
具体地,对于已经完成聚合分类的不同簇的患者,由于同一簇的患者情况近似,所以在同一簇内部建立实验组和对照组。对于患者数太少的簇可进行忽略。因此形成了针对不同情况患者群的实验组和对照组。
分别获取所述实验组患者和所述对照组患者的多个时间节点的所述整体状态预测评分,其中,多个所述时间节点包括采用所述标定治疗方案前的时间节点以及采用所述标定治疗方案后的时间节点。
示例性地,实验组(T):同一簇内使用了治疗方案A的纳入患者。
使用上述疗效评估预测模型分别计算实验组每个患者的起始时(采用治疗方案A前)整体状态预测评分Y
如果具备数据条件,还可以选取治疗过程多个时间节点计算患者整体状态预测评分Y
对照组(C):同一簇内没有使用治疗方案A的患者。
使用上述疗效评估预测模型分别计算对照组每个患者的起始时整体状态预测评分Y
如果具备数据条件,还可以选取治疗过程多个时间节点计算患者整体状态预测评分Y
根据所述实验组患者的所述整体状态预测评分和所述对照组患者的所述整体状态预测评分获得所述标定治疗方案的疗效评分指标。
优选地,所述根据所述实验组患者的所述整体状态预测评分和所述对照组患者的所述整体状态预测评分获得所述标定治疗方案的疗效评分指标包括:
分别获取同一簇中各所述实验组患者和各所述对照组患者在前后时间节点的所述整体状态预测评分的差值,作为状态变化。
具体地,通过选取前后不同时间节点,按不同簇群分别计算的方式,可以得到不同簇的以下数据:
某一簇实验组前后时间节点第i个患者的状态变化为:
ΔT
其中,n表示第n个时间节点。
根据所述状态变化分别获取同一簇中所有所述实验组患者和所有所述对照组患者在前后时间节点的平均状态变化。
具体地,某一簇对照组前后时间节点第j个患者的状态变化为:
ΔC
某一簇实验组前后时间节点所有患者的平均状态变化为:
其中,TN为该簇实验组的患者数。
某一簇对照组前后时间节点所有患者的平均状态变化为:
其中,CN为该簇对照组的患者数。
根据所述平均状态变化获取同一簇中所述实验组患者和所述对照组患者的状态变化幅度的差异值。
具体地,某一簇实验组与对照组之间的状态变化幅度的差异值为:
ΔTC
根据各簇的所述状态变化幅度的差异值获取所有簇的状态变化幅度的差异平均值,作为所述标定治疗方案的疗效评分指标。
使用ΔTC
作为衡量治疗方案A的治疗效果的指标值,此处m为簇数。
根据以上计算,通过不同的前后时间节点,可以计算得到多个ΔTC,可以用于评估不同时间节点治疗方案A的疗效情况。
通常情况,可将患者开始实施治疗方案A前(或入院时)的时间节点作为初始节点,将完成实施治疗方案A后(或出院时)的时间节点作为最终节点,则按以上方法,最后可以得到一个ΔTC,用于评估治疗方案A的疗效。
通过ΔTC可以分析实验组与对照组之间的变化差异,这种差异是根据不同患者情况进行聚合分类分组计算,最后取均值得到的,有利于排除和稀释干扰因素的影响,最终发现是否实施治疗方案A的效果差异。
在本实施例中,通过患者已知的标准描述文本便可获知相应的整体状态预测评分,进而根据多个患者的整体状态预测评分对例如标定中医治疗方案进行预测评估,可以较为准确地评估某个治疗方案的效果,综合考虑了不同患者之间的差异性,将患者多方面的差异进行融合评估与区分,有助于更准确全面地评估治疗方案的效果,有助于对治疗方案进行针对性的优化,有助于减轻患者的痛苦程度,甚至改善整体治疗效果。
另外,对于该治疗方案是否适合患者,可以通过该患者的各维度预测评分,看患者被聚合分类到哪一簇,然后根据这一簇的疗效指标近似判断该治疗方案针对该患者的效果,从而针对该患者选择合适的治疗方案。
在本发明另一实施例中,一种基于真实世界临床数据的治疗方案综合疗效评估装置包括存储器和处理器;所述存储器,用于存储计算机程序;所述处理器,用于当执行所述计算机程序时,实现如上所述的基于真实世界临床数据的治疗方案综合疗效评估方法。
在本发明另一实施例中,一种计算机可读存储介质上存储有计算机程序,当所述计算机程序被处理器执行时,实现如上所述的基于真实世界临床数据的治疗方案综合疗效评估模型构建方法,或者实现如上所述的基于真实世界临床数据的治疗方案综合疗效评估方法。
读者应理解,在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
尽管上面已经示出和描述了本发明的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本发明的限制,本领域的普通技术人员在本发明的范围内可以对上述实施例进行变化、修改、替换和变型。
机译: 基于协议复杂度和患者熟练水平的糖尿病治疗方案评估方法
机译: 基于协议复杂度和患者熟练水平的糖尿病治疗方案评估方法
机译: 虚拟健康指南 - 一种基于临床数据集和机器学习的综合治疗方法,以避免错误,实现有效的恢复