公开/公告号CN112784609A
专利类型发明专利
公开/公告日2021-05-11
原文格式PDF
申请/专利权人 云知声智能科技股份有限公司;厦门云知芯智能科技有限公司;
申请/专利号CN202110283632.3
申请日2021-03-16
分类号G06F40/30(20200101);G06F40/295(20200101);G16H10/60(20180101);
代理机构
代理人
地址 100096 北京市海淀区西三旗建材城内1幢一层101号
入库时间 2023-06-19 10:57:17
技术领域
本发明涉及医疗技术领域,具体涉及一种确定病历中是否包括会诊意见的方法、装置、设备和介质。
背景技术
目前,一些病情较为复杂的患者,在治疗过程中需要其他科室的医师协助,会诊医师根据患者的病情给出会诊意见,包括用药,诊疗方式或建议手术等,识别电子病历中的意见内容,并提取目标字段。但是只能支持数据库匹配的会诊意见抽取,召回率低,不能确定主治医师是否按照会诊意见调整患者的治疗方案。
发明内容
本发明提供一种确定病历中是否包括会诊意见的方法、装置、设备和介质,能够解决上述不能确定主治医师是否按照会诊意见调整患者的治疗方案的技术问题。
本发明解决上述技术问题的技术方案如下:
确定病历中是否包括会诊意见的方法,包括:
训练实体抽取模型;
使用所述实体抽取模型对会诊记录中的会诊意见字段进行预测得到第一会诊意见实体集;
使用所述实体抽取模型对病程记录中的会诊意见字段进行预测得到第二会诊意见实体集;
根据所述第一会诊意见实体集和所述第二会诊意见实体集的笛卡尔积,得到所述第一会诊意见实体集和所述第二会诊意见实体集的所有可能的实体对,以及每个实体对的共现概率,基于所述实体对的共现概率确定病历中是否包括所述会诊意见。
在一些实施例中,基于所述实体对的共现概率确定病历中是否包括所述会诊意见,包括:
当任意实体对的共现概率大于预设阈值时,确定所述病历中包括所述会诊意见;
当所述任意实体对的共现概率小于等于所述预设阈值时,确定所述病历中不包括所述会诊意见。
在一些实施例中,所述训练实体抽取模型的步骤如下:
构建会诊意见实体词表;
从病历中获取会诊意见文本,专家标注N条作为验证集,N为正整数;
使用所述会诊意见实体词表回标所述会诊意见文本,采用交叉验证的方法修正数据集;
直到所述验证集的指标不再更新,得到所述实体抽取模型。
在一些实施例中,所述方法还包括:筛选病历。
在一些实施例中,所述筛选病历包括:
对病历中的所有文书按照时间排序;
筛选掉时间早于第一份会诊记录的文书。
第二方面,本发明实施例还提供了一种确定病历中是否包括会诊意见的装置,包括:
训练模块:用于训练实体抽取模型;
第一预测模块:用于使用所述实体抽取模型对会诊记录中的会诊意见字段进行预测得到第一会诊意见实体集;
第二预测模块:用于使用所述实体抽取模型对病程记录中的会诊意见字段进行预测得到第二会诊意见实体集;
确定模块:用于根据所述第一会诊意见实体集和所述第二会诊意见实体集的笛卡尔积,得到所述第一会诊意见实体集和所述第二会诊意见实体集的所有可能的实体对,以及每个实体对的共现概率,基于所述实体对的共现概率确定病历中是否包括所述会诊意见。
在一些实施例中,上述装置中确定模块还用于:
当任意实体对的共现概率大于预设阈值时,确定所述病历中包括所述会诊意见;
当所述任意实体对的共现概率小于等于所述预设阈值时,确定所述病历中不包括所述会诊意见。
在一些实施例中,所述训练实体抽取模型的步骤如下:
构建会诊意见实体词表;
从病历中获取会诊意见文本,专家标注N条作为验证集,N为正整数;
使用所述会诊意见实体词表回标所述会诊意见文本,采用交叉验证的方法修正数据集;
直到所述验证集的指标不再更新,得到所述实体抽取模型。
在一些实施例中,上述装置还包括:筛选模块:用于筛选病历。
在一些实施例中,所述筛选模块还用于:
对病历中的所有文书按照时间排序;
筛选掉时间早于第一份会诊记录的文书。
第三方面,本发明实施例还提供了一种电子设备,包括:处理器和存储器;
所述处理器通过调用所述存储器存储的程序或指令,用于执行如上所述任一项所述确定病历中是否包括会诊意见的方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储程序或指令,所述程序或指令使计算机执行如上所述任一项所述确定病历中是否包括会诊意见的方法。
本发明的有益效果是:通过训练实体抽取模型;使用所述实体抽取模型对会诊记录中的会诊意见字段进行预测得到第一会诊意见实体集;使用所述实体抽取模型对病程记录中的会诊意见字段进行预测得到第二会诊意见实体集;根据第一会诊意见实体集和第二会诊意见实体集的笛卡尔积,得到第一会诊意见实体集和第二会诊意见实体集的所有可能的实体对,以及每个实体对的共现概率,基于实体对的共现概率确定病历中是否包括会诊意见。本申请实施例中通过采用病历通用的实体抽取模型,可以召回非名称完全匹配的实体,通过抽取会诊意见实体,结合会诊后的治疗方案如病程记录,计算得到实体对的共现概率确定会诊记录和病程记录是否存在实体共体,可以确定病历中是否包括会诊意见,从而有助于医师采取正确的方案。
附图说明
图1为本发明实施例提供的一种确定病历中是否包括会诊意见的方法之一;
图2为本发明实施例提供的一种确定病历中是否包括会诊意见的方法之二;
图3为本发明实施例提供的一种确定病历中是否包括会诊意见的装置之一;
图4为本发明实施例提供的一种确定病历中是否包括会诊意见的装置之二;
图5为本发明实施例提供的一种电子设备的示意性框图。
具体实施方式
以下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。
图1为本发明实施例提供的一种确定病历中是否包括会诊意见的方法之一。
结合图1,确定病历中是否包括会诊意见的方法,包括如下S101、S102、S103和S104四个步骤:
S101:训练实体抽取模型。
具体的,本申请实施例中训练实体抽取模型是病历上通用的实体抽取模型。
S102:使用所述实体抽取模型对会诊记录中的会诊意见字段进行预测得到第一会诊意见实体集。
具体的,本申请实施例中,使用病历上通用的实体抽取模型对会诊记录中的会诊意见字段进行预测,得到会诊意见实体集S1={e
S103:使用所述实体抽取模型对病程记录中的会诊意见字段进行预测得到第二会诊意见实体集。
具体的,本申请实施例中,使用病历上通用的实体抽取模型对对病程记录中的会诊意见字段进行预测得到第二会诊意见实体集S2={e
S104:根据所述第一会诊意见实体集和所述第二会诊意见实体集的笛卡尔积,得到所述第一会诊意见实体集和所述第二会诊意见实体集的所有可能的实体对,以及每个实体对的共现概率,基于所述实体对的共现概率确定病历中是否包括所述会诊意见。
具体的,本申请实施例中,根据第一会诊意见实体集和第二会诊意见实体集计算笛卡尔积S=S1×S2={(e
在一些实施例中,所述基于实体对的共现概率确定病历中是否包括所述会诊意见,包括:
当任意实体对的共现概率大于预设阈值时,确定所述病历中包括所述会诊意见;
当所述任意实体对的共现概率小于等于所述预设阈值时,确定所述病历中不包括所述会诊意见。
具体的,如下:
若实体对(e
若实体对(e
在一些实施例中,所述训练实体抽取模型的步骤如下:
构建会诊意见实体词表。
具体的,本申请实施例中,通过开源知识图谱,百度知道等数据源,获得手术、诊疗、药物等可能出现在会诊意见中的实体词表E。
从病历中获取会诊意见文本,专家标注N条作为验证集,N为正整数;
使用所述会诊意见实体词表回标所述会诊意见文本,采用交叉验证的方法修正数据集;
直到所述验证集的指标不再更新,得到所述实体抽取模型。
具体的,本申请实施例中训练实体抽取模型的步骤如下:
从病历中获取会诊意见文本,专家标注500条作为验证集。利用会诊意见实体词表E,回标病历中的文本,病历中的文本不限于会诊意见,采用交叉验证的方法,修正数据集;重复修正的步骤,直到在验证集上的指标不再更新,得到病历上通用的实体抽取模型。
图2为本发明实施例提供的一种确定病历中是否包括会诊意见的方法之二。
在一些实施例中,所述方法还包括:筛选病历。
在一些实施例中,结合图2,所述筛选病历包括如下S201和S202两个步骤:
S201:对病历中的所有文书按照时间排序;
S202:筛选掉时间早于第一份会诊记录的文书。
具体的,本申请实施例中排序模块对病历中的所有文书,按照时间排序,筛选掉时间早于第一份会诊记录的文书,对会诊记录的病历的质量进行把控,提高了确定病历中是否包括会诊意见的准确性。
图3为本发明实施例提供的一种确定病历中是否包括会诊意见的装置之一。
第二方面,结合图3,本发明实施例还提供了一种确定病历中是否包括会诊意见的装置30,包括训练模块301、第一预测模块302、第二预测模块303和确定模块304。
训练模块301:用于训练实体抽取模型。
具体的,本申请实施例中训练模块301训练实体抽取模型是病历上通用的实体抽取模型。
第一预测模块302:用于使用所述实体抽取模型对会诊记录中的会诊意见字段进行预测得到第一会诊意见实体集。
具体的,本申请实施例中,第一预测模块使用病历上通用的实体抽取模型对会诊记录中的会诊意见字段进行预测,得到会诊意见实体集S1={e
第二预测模块303:用于使用所述实体抽取模型对病程记录中的会诊意见字段进行预测得到第二会诊意见实体集。
具体的,本申请实施例中,第二预测模块使用病历上通用的实体抽取模型对对病程记录中的会诊意见字段进行预测得到第二会诊意见实体集S2={e
确定模块304:用于根据所述第一会诊意见实体集和所述第二会诊意见实体集的笛卡尔积,得到所述第一会诊意见实体集和所述第二会诊意见实体集的所有可能的实体对,以及每个实体对的共现概率,确定模块304基于所述实体对的共现概率确定病历中是否包括所述会诊意见。
具体的,本申请实施例中,根据第一会诊意见实体集和第二会诊意见实体集计算笛卡尔积S=S1×S2={(e
在一些实施例中,所述确定模块还用于:
当任意实体对的共现概率大于预设阈值时,确定所述病历中包括所述会诊意见;
当所述任意实体对的共现概率小于等于所述预设阈值时,确定所述病历中不包括所述会诊意见。
若实体对(e
若实体对(e
在一些实施例中,所述训练实体抽取模型的步骤如下:
构建会诊意见实体词表;
从病历中获取会诊意见文本,专家标注N条作为验证集,N为正整数;
使用所述会诊意见实体词表回标所述会诊意见文本,采用交叉验证的方法修正数据集;
直到所述验证集的指标不再更新,得到所述实体抽取模型。
图4为本发明实施例提供的一种确定病历中是否包括会诊意见的装置之二。
在一些实施例中,结合图4,上述装置30还包括:筛选模块401:用于筛选病历。
在一些实施例中,所述筛选模块还用于:
对病历中的所有文书按照时间排序;
筛选掉时间早于第一份会诊记录的文书。
具体的,本申请实施例中排序模块对病历中的所有文书,按照时间排序,筛选模块401筛选掉时间早于第一份会诊记录的文书。
第三方面,本发明实施例还提供了一种电子设备,包括:处理器和存储器;
所述处理器通过调用所述存储器存储的程序或指令,用于执行如上所述任一项所述确定病历中是否包括会诊意见的方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储程序或指令,所述程序或指令使计算机执行如上所述任一项所述确定病历中是否包括会诊意见的方法。
图5是本公开实施例提供的一种电子设备的示意性框图。
如图5所示,电子设备包括:至少一个处理器501、至少一个存储器502和至少一个通信接口503。电子设备中的各个组件通过总线系统504耦合在一起。通信接口503,用于与外部设备之间的信息传输。可理解,总线系统504用于实现这些组件之间的连接通信。总线系统504除包括数据总线之外,还包括电源总线、控制总线和状态信号总线。但为了清楚说明起见,在图5中将各种总线都标为总线系统504。
可以理解,本实施例中的存储器502可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。
在一些实施方式中,存储器502存储了如下的元素,可执行单元或者数据结构,或者他们的子集,或者他们的扩展集:操作系统和应用程序。
其中,操作系统,包含各种系统程序,例如框架层、核心库层、驱动层等,用于实现各种基础业务以及处理基于硬件的任务。应用程序,包含各种应用程序,例如媒体播放器(Media Player)、浏览器(Browser)等,用于实现各种应用业务。实现本申请实施例提供的确定病历中是否包括会诊意见的方法中任一方法的程序可以包含在应用程序中。
在本申请实施例中,处理器501通过调用存储器502存储的程序或指令,具体的,可以是应用程序中存储的程序或指令,处理器501用于执行本申请实施例提供的确定病历中是否包括会诊意见的方法各实施例的步骤。
训练实体抽取模型;
使用所述实体抽取模型对会诊记录中的会诊意见字段进行预测得到第一会诊意见实体集;
使用所述实体抽取模型对病程记录中的会诊意见字段进行预测得到第二会诊意见实体集;
根据所述第一会诊意见实体集和所述第二会诊意见实体集的笛卡尔积,得到所述第一会诊意见实体集和所述第二会诊意见实体集的所有可能的实体对,以及每个实体对的共现概率,基于所述实体对的共现概率确定病历中是否包括所述会诊意见。
本申请实施例提供的确定病历中是否包括会诊意见的方法中任一方法可以应用于处理器501中,或者由处理器501实现。处理器501可以是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器501中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器501可以是通用处理器、数字信号处理器(DigitalSignal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
本申请实施例提供的确定病历中是否包括会诊意见的方法中任一方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件单元组合执行完成。软件单元可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器502,处理器501读取存储器502中的信息,结合其硬件完成方法的步骤。
本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本申请的范围之内并且形成不同的实施例。
本领域的技术人员能够理解,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
虽然结合附图描述了本申请的实施方式,但是本领域技术人员可以在不脱离本申请的精神和范围的情况下做出各种修改和变型,这样的修改和变型均落入由所附权利要求所限定的范围之内以上,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
以上,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
机译: 提供用于确定在程序的实施例中是否发生错误的值的数据处理的方法,用于确定在程序的实施例中是否发生错误的数据处理的方法,用于产生程序代码的方法,用于提供值以确定在程序的实施例中是否发生错误的数据处理装置,用于确定在程序的实施例中是否发生错误的数据处理装置以及用于生成程序的代码
机译: 提供用于确定在程序的实施例中是否发生错误的值的数据处理的方法,用于确定在程序的实施例中是否发生错误的数据处理的方法,用于产生程序代码的方法,用于提供值以确定在程序的实施例中是否发生错误的数据处理装置,用于确定在程序的实施例中是否发生错误的数据处理装置以及用于生成程序的代码
机译: 用于创建意见属性确定数据库的方法,设备和程序,以及用于确定意见属性的方法,设备和程序以及计算机可读记录介质