首页> 中国专利> 一种基于医疗大数据的健康保险理赔风险预测方法和系统

一种基于医疗大数据的健康保险理赔风险预测方法和系统

摘要

本发明涉及一种基于医疗大数据的健康保险理赔风险预测方法和系统,其中,方法包括以下步骤:对医疗大数据进行多维度的特征提取,得到第一特征信息、第二特征信息和第三特征信息;基于所述第一特征信息、第二特征信息和第三特征信息构建特征分布模型;基于所述第一特征信息构建医疗行为时序模型;获取患者的医疗档案数据,并将所述医疗档案数据输入至所述特征分布模型和时序模型,根据所述特征分布模型和时序模型输出的结果进行风险提示。本发明能够更为全面地基于实际的医疗记录所提供的信息准确地对潜在的健康保险理赔欺诈进行识别。

著录项

  • 公开/公告号CN114862597A

    专利类型发明专利

  • 公开/公告日2022-08-05

    原文格式PDF

  • 申请/专利权人 好人生(上海)健康科技有限公司;

    申请/专利号CN202210511690.1

  • 发明设计人 汤文巍;章智云;

    申请日2022-05-11

  • 分类号G06Q40/08(2012.01);G06Q10/04(2012.01);G16H50/50(2018.01);G16H10/60(2018.01);G06N20/00(2019.01);

  • 代理机构上海泰能知识产权代理事务所(普通合伙) 31233;

  • 代理人宋缨

  • 地址 200241 上海市闵行区东川路555号戊楼1251室

  • 入库时间 2023-06-19 16:17:34

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-08-23

    实质审查的生效 IPC(主分类):G06Q40/08 专利申请号:2022105116901 申请日:20220511

    实质审查的生效

  • 2022-08-05

    公开

    发明专利申请公布

说明书

技术领域

本发明涉及大数据处理技术领域,特别是涉及一种基于医疗大数据的健康保险理赔风险预测方法和系统。

背景技术

随着互联网金融和电子商务的发展,人们利用网络进行交易、支付和借贷,通常在借贷和支付过程中,风险控制评估就显得非常关键。以保险领域的健康保险理赔为例,其可能存在理赔用户虚报案件进行骗保。

由于保险公司在处理健康保险理赔时需要一种快捷准确的方法来识别或评估大量的保险理赔可能存在的欺诈风险,而现有传统的风险预测是通过收集历史理赔案例的数据来进行建模并对未来的理赔案例进行预测评估,但这样做通常会由于理赔案例的样本过于少导致形成的模型无法提供足够准确有效的预测评估。

发明内容

本发明所要解决的技术问题是提供一种基于医疗大数据的健康保险理赔风险预测方法和系统,能够更为全面地基于实际的医疗记录所提供的信息准确地对潜在的健康保险理赔欺诈进行识别。

本发明解决其技术问题所采用的技术方案是:提供一种基于医疗大数据的健康保险理赔风险预测方法,包括以下步骤:

(1)对医疗大数据进行多维度的特征提取,得到第一特征信息、第二特征信息和第三特征信息;

(2)基于所述第一特征信息、第二特征信息和第三特征信息构建特征分布模型;

(3)基于所述第一特征信息构建医疗行为时序模型;

(4)获取患者的医疗档案数据,并将所述医疗档案数据输入至所述特征分布模型和时序模型,根据所述特征分布模型和时序模型输出的结果进行风险提示。

所述步骤(1)中的第一特征信息包括:性别、年龄、疾病诊断以及医疗行为的历史记录;所述第二特征信息包括:与所述医疗行为相关的检查项目和化验项目;所述第三特征信息为执行所述医疗行为的医疗机构等级和医疗费用。

所述步骤(2)具体为:将所述执行所述医疗行为的医疗机构等级、性别、年龄和疾病诊断作为自变量,将所述执行所述医疗行为的医疗费用、与所述医疗行为相关的检查项目和化验项目作为因变量构建回归模型,通过机器学习后得到所述特征分布模型。

所述步骤(3)具体为:将所述性别、年龄、疾病诊断作为自变量,将所述医疗行为的历史记录作为因变量构建回归模型,通过机器学习后得到所述医疗行为时序模型。

所述步骤(4)具体为:

获取患者的医疗档案数据,所述医疗档案数据中包括患者的性别、年龄、疾病诊断、医疗行为的历史记录、与所述医疗行为相关的检查项目和化验项目、以及执行所述医疗行为的医疗机构等级和医疗费用;

将所述患者的性别、年龄、疾病诊断、医疗行为的历史记录、以及执行所述医疗行为的医疗机构等级输入至所述特征分布模型,得到第一预测结果;

将所述第一预测结果与所述患者的执行所述医疗行为的医疗费用、与所述医疗行为相关的检查项目和化验项目进行比较,若超过第一阈值则进行风险提示;

将所述患者的性别、年龄和疾病诊断输入至所述医疗行为时序模型,得到第二预测结果;

将所述第二预测结果与患者的医疗行为的历史记录进行相似度评估,若相似度低于第二阈值则进行风险提示。

本发明解决其技术问题所采用的技术方案是:提供一种基于医疗大数据的健康保险理赔风险预测系统,包括:

特征提取模块,用于对医疗大数据进行多维度的特征提取,得到第一特征信息、第二特征信息和第三特征信息;

第一模型构建模块,用于基于所述第一特征信息、第二特征信息和第三特征信息构建特征分布模型;

第二模型构建模块,用于基于所述第一特征信息构建医疗行为时序模型;

风险提示模块,用于获取患者的医疗档案数据,并将所述医疗档案数据输入至所述特征分布模型和时序模型,根据所述特征分布模型和时序模型输出的结果进行风险提示。

所述第一特征信息包括:性别、年龄、疾病诊断以及医疗行为的历史记录;所述第二特征信息包括:与所述医疗行为相关的检查项目和化验项目;所述第三特征信息为执行所述医疗行为的医疗机构等级和医疗费用。

所述第一模型构建模块将所述执行所述医疗行为的医疗机构等级、性别、年龄和疾病诊断作为自变量,将所述执行所述医疗行为的医疗费用、与所述医疗行为相关的检查项目和化验项目作为因变量构建回归模型,通过机器学习后得到所述特征分布模型。

所述第二模型构建模块将所述性别、年龄、疾病诊断作为自变量,将所述医疗行为的历史记录作为因变量构建回归模型,通过机器学习后得到所述医疗行为时序模型。

所述风险提示模块包括:

获取单元,用于获取患者的医疗档案数据,所述医疗档案数据中包括患者的性别、年龄、疾病诊断、医疗行为的历史记录、与所述医疗行为相关的检查项目和化验项目、以及执行所述医疗行为的医疗机构等级和医疗费用;

第一预测单元,用于将所述患者的性别、年龄、疾病诊断、医疗行为的历史记录、以及执行所述医疗行为的医疗机构等级输入至所述特征分布模型,得到第一预测结果;

第一比较单元,用于将所述第一预测结果与所述患者的执行所述医疗行为的医疗费用、与所述医疗行为相关的检查项目和化验项目进行比较,若超过第一阈值则进行风险提示;

第二预测单元,用于将所述患者的性别、年龄和疾病诊断输入至所述医疗行为时序模型,得到第二预测结果;

第二比较单元,用于将所述第二预测结果与患者的医疗行为的历史记录进行相似度评估,若相似度低于第二阈值则进行风险提示。

有益效果

由于采用了上述的技术方案,本发明与现有技术相比,具有以下的优点和积极效果:本发明通过对医疗大数据的机器学习,基于医疗机构等级、疾病诊断、性别及年龄段的维度构建了医疗费用、检查、化验项目的特征分布模型;本发明通过对医疗大数据的机器学习,基于医疗档案中记载的医疗行为的历史记录形成对于特定疾病诊断、性别及年龄段维度的医疗行为时序模型。在进行预测时能够通过特征分布模型评估理赔案件潜在的过度收费或过度检查的风险能够比较好的符合实际的医疗费用发生情况,通过医疗行为时序模型评估理赔案件潜在的过度治疗或不合理诊断的风险,从而能够更为全面地基于实际的医疗记录所提供的信息准确地对潜在的健康保险理赔欺诈进行识别。

附图说明

图1是本发明第一实施方式的流程图。

具体实施方式

下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。此外应理解,在阅读了本发明讲授的内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。

本发明的第一实施方式涉及一种基于医疗大数据的健康保险理赔风险预测方法,如图1所示,包括以下步骤:

步骤1,对医疗大数据进行多维度的数据特征提取。具体包括:步骤1a,提取患者的性别、年龄、疾病诊断、医疗行为的历史记录等与医疗行为直接相关的特征信息,其中,医疗行为的历史记录包括:用药类型、用药剂量、治疗方式和就诊时间;步骤1b,提取与医疗行为相关的检查项目、化验项目等于医疗行为间接相关的特征信息;提取步骤1a和步骤1b中相关的医疗机构等级和医疗费用等相关特征信息。

步骤2,通过相同的医疗机构等级、疾病诊断、性别和年龄段的维度,对医疗费用及相关检查项目和化验项目的特征信息进行分布建模,得到特征分布模型。具体地说,将所述执行所述医疗行为的医疗机构等级、性别、年龄和疾病诊断作为自变量,将所述执行所述医疗行为的医疗费用、与所述医疗行为相关的检查项目和化验项目作为因变量构建回归模型,通过机器学习后得到所述特征分布模型。

步骤3,通过疾病诊断、性别及年龄段的维度对医疗行为的历史记录进行时序建模,得到医疗行为时序模型。具体地说,将所述性别、年龄、疾病诊断作为自变量,将所述医疗行为的历史记录作为因变量构建回归模型,通过机器学习后得到所述医疗行为时序模型。

步骤4,在进行健康保险理赔案件风险评估时,通过获取患者的医疗档案数据与特征分布模型和医疗行为时序模型进行匹配以生成风险评估结果。本步骤中具体包括:步骤4a,按理赔案件的医疗机构等级、疾病诊断、性别和年龄段维度将医疗费用及相关检查、化验项目匹配到特征分布模型中,即将所述患者的性别、年龄、疾病诊断、医疗行为的历史记录、以及执行所述医疗行为的医疗机构等级输入至所述特征分布模型,得到第一预测结果;将所述第一预测结果与所述患者的执行所述医疗行为的医疗费用、与所述医疗行为相关的检查项目和化验项目进行比较,若超过第一阈值则进行风险提示。本步骤中理赔案件与特征分布模型的预测结果越接近则说明风险越小,反之则提示风险较大。本实施方式中以特征分布模型的三倍标准差作为第一阈值以此进行风险提示。步骤4b,按理赔案件的医疗档案提取的医疗行为的历史记录并与所述医疗时序模型进行匹配,即将所述患者的性别、年龄和疾病诊断输入至所述医疗行为时序模型,得到第二预测结果,将所述第二预测结果与患者的医疗行为的历史记录进行相似度评估,若相似度低于第二阈值则进行风险提示。本实施方式中可以使用简单的字符串相似度评估算法或更为复杂的语义相似度评估算法来获得匹配度的估值,当处于较高的匹配度时,说明理赔案件的风险较小,反之这说明理赔案件存在过度治疗或其他风险的可能。

不难发现,本发明通过对医疗大数据的机器学习,基于医疗机构等级、疾病诊断、性别及年龄段的维度构建了医疗费用、检查、化验项目的特征分布模型;本发明通过对医疗大数据的机器学习,基于医疗档案中记载的医疗行为的历史记录形成对于特定疾病诊断、性别及年龄段维度的医疗行为时序模型。在进行预测时能够通过特征分布模型评估理赔案件潜在的过度收费或过度检查的风险能够比较好的符合实际的医疗费用发生情况,通过医疗行为时序模型评估理赔案件潜在的过度治疗或不合理诊断的风险,从而能够更为全面地基于实际的医疗记录所提供的信息准确地对潜在的健康保险理赔欺诈进行识别。

本发明的第二实施方式涉及一种基于医疗大数据的健康保险理赔风险预测系统,包括:特征提取模块,用于对医疗大数据进行多维度的特征提取,得到第一特征信息、第二特征信息和第三特征信息;第一模型构建模块,用于基于所述第一特征信息、第二特征信息和第三特征信息构建特征分布模型;第二模型构建模块,用于基于所述第一特征信息构建医疗行为时序模型;风险提示模块,用于获取患者的医疗档案数据,并将所述医疗档案数据输入至所述特征分布模型和时序模型,根据所述特征分布模型和时序模型输出的结果进行风险提示。

所述第一特征信息包括:性别、年龄、疾病诊断以及医疗行为的历史记录;所述第二特征信息包括:与所述医疗行为相关的检查项目和化验项目;所述第三特征信息为执行所述医疗行为的医疗机构等级和医疗费用。

所述第一模型构建模块将所述执行所述医疗行为的医疗机构等级、性别、年龄和疾病诊断作为自变量,将所述执行所述医疗行为的医疗费用、与所述医疗行为相关的检查项目和化验项目作为因变量构建回归模型,通过机器学习后得到所述特征分布模型。

所述第二模型构建模块将所述性别、年龄、疾病诊断作为自变量,将所述医疗行为的历史记录作为因变量构建回归模型,通过机器学习后得到所述医疗行为时序模型。

所述风险提示模块包括:获取单元,用于获取患者的医疗档案数据,所述医疗档案数据中包括患者的性别、年龄、疾病诊断、医疗行为的历史记录、与所述医疗行为相关的检查项目和化验项目、以及执行所述医疗行为的医疗机构等级和医疗费用;第一预测单元,用于将所述患者的性别、年龄、疾病诊断、医疗行为的历史记录、以及执行所述医疗行为的医疗机构等级输入至所述特征分布模型,得到第一预测结果;第一比较单元,用于将所述第一预测结果与所述患者的执行所述医疗行为的医疗费用、与所述医疗行为相关的检查项目和化验项目进行比较,若超过第一阈值则进行风险提示;第二预测单元,用于将所述患者的性别、年龄和疾病诊断输入至所述医疗行为时序模型,得到第二预测结果;第二比较单元,用于将所述第二预测结果与患者的医疗行为的历史记录进行相似度评估,若相似度低于第二阈值则进行风险提示。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号