首页> 中国专利> 基于元数据模型的医疗数据治理方法、系统、计算机设备

基于元数据模型的医疗数据治理方法、系统、计算机设备

摘要

本方案涉及一种基于元数据模型的医疗数据治理方法。所述方法包括:基于采集回收的元数据,根据医疗数据治理场景构建元数据模型;实时监测医疗数据,并通过TCG三维管理模型对医疗数据进行分类管理;当医疗数据存在医疗数据治理场景问题时,确定医疗数据的数据治理类型;根据医疗数据的数据治理类型选择对应的元数据模型,从而确定医疗数据的数据问题,并展示数据问题且进行干预。通过构建元数据模型,根据医疗数据的类型将医疗数据输入至不同的元数据模型中,得到各个医疗数据的数据问题,从而针对不同的数据问题采取不同的干预措施,无需人工进行数据治理,提高了数据治理的有效性。

著录项

说明书

技术领域

本发明涉及数据处理技术领域,特别是涉及一种基于元数据模型的医疗数据治理方法、系统、计算机设备及存储介质。

背景技术

随着医疗信息化的不断加速发展,医疗数字化转型已成为医疗机构和区域卫生健康机构都在积极推进的重要工作,但要保障医疗数字化成功转型,医疗数据治理的建设和实现是必经之路。如何能更高效、更体系化、更智能化的实现医疗数据治理,会决定医疗数字化转型的速度、效果和价值。目前在医疗数据治理实践中,绝大部分医疗行业数据治理实现方法和系统都突显人工治理、单一模块治理等特点,很难形成数据本身内聚化的数据治理模型或实现方法,而且会导致数据治理项目过程中人力投入大,治理效果不可持续,很难实现自动化数据治理。医疗数据具有敏感性、零误差、高价值、多样等特性,所以在医疗行业数据治理实现和效果尤为重要,会对整个医疗质量、医疗水平和医疗的运营管理有直接的影响,医疗数据治理主要包括数据质量治理、数据安全治理以及数据资产治理,在进行数据治理时,通常是人工逐一排查和定位,再进行问题干预和处理解决。

因此,传统的医疗数据治理方法在数据治理的过程中,对人的依赖较大,各个场景数据治理存在孤岛现象,且数据治理和数据管理存在脱节,导致数据治理过程很难持续等问题。

发明内容

基于此,为了解决上述技术问题,提供一种基于元数据模型的医疗数据治理方法、系统、计算机设备及存储介质,可以提高当前数据治理实现上的无序性和数据治理的低效性,打破纯人工经验依赖模式。

一种基于元数据模型的医疗数据治理方法,所述方法包括:

基于采集回收的元数据,根据医疗数据治理场景构建元数据模型;所述元数据模型包括TCG(target、classify、grade)三维管理模型、动态血缘关系模型、动态关联关系模型、动态冷热关系模型;

实时监测医疗数据,并通过所述TCG三维管理模型对所述医疗数据进行分类管理;当所述医疗数据存在医疗数据治理场景问题时,确定所述医疗数据的数据治理类型;所述数据治理类型包括数据质量治理、数据安全治理、数据资产治理;

当所述医疗数据的数据治理类型为数据质量治理时,排查定位数据质量原因,并调用所述动态血缘关系模型;将所述医疗数据输入至所述动态血缘关系模型中,得到数据直系血缘关系;根据所述数据直系血缘关系获取质量问题分类信息,展示所述数据直系血缘关系、所述质量问题分类信息并进行质量问题干预;

当所述医疗数据的数据治理类型为数据安全治理时,识别数据安全风险情况,并调用所述动态关联关系模型;将所述医疗数据输入至所述动态关联关系模型中,得到数据关联关系;根据所述数据关联关系获取安全防护方案,展示所述数据关联关系、所述安全防护方案并进行数据安全防护干预;

当所述医疗数据的数据治理类型为数据资产治理时,识别数据资产价值,并调用所述动态冷热关系模型;将所述医疗数据输入至所述动态冷热关系模型中,得到冷热关系数据;根据所述冷热关系数据获取资产价值等级,展示所述冷热关系数据、所述资产价值等级并进行数据资产价值标记。

在其中一个实施例中,所述通过所述TCG三维管理模型对所述医疗数据进行分类管理,包括:

将所述医疗数据输入至所述TCG三维管理模型中,所述TCG三维管理模型通过数据对象维度对所述医疗数据进行分类分级处理;所述TCG三维管理模型通过数据分级维度对所述医疗数据从敏感程度和影响程度进行等级划分;所述TCG三维管理模型通过数据分类维度对所述医疗数据从数据类型或数据场景应用需要角度进行类型划分,得到分类管理结果。

在其中一个实施例中,所述将所述医疗数据输入至所述动态血缘关系模型中,得到数据直系血缘关系;根据所述数据直系血缘关系获取质量问题分类信息,展示所述数据直系血缘关系、所述质量问题分类信息并进行质量问题干预,包括:

将所述医疗数据输入至所述动态血缘关系模型中,通过所述动态血缘关系模型针对数据仓库动态提取数据模型和数据作业job,形成数据模型和作业集合;

所述动态血缘关系模型对所述数据模型和作业集合进行数据库解析,识别出不同集合数据依赖关系,形成数据依赖集合;

所述动态血缘关系模型根据所述数据依赖集合,基于关联规则的关联算法,利用所述TCG三维管理模型形成与所述医疗数据对应的数据直系血缘关系,所述数据直系血缘关系中标记有所述质量问题分类信息;

展示所述数据直系血缘关系以及所述质量问题分类信息,并进行质量问题干预。

在其中一个实施例中,在进行质量问题干预之前,所述方法还包括:

根据所述直系血缘关系以及所述质量问题分类信息定位到存在质量问题的医疗数据;

获取质量评价策略,根据所述质量评价策略以及所述存在质量问题的医疗数据确定出现质量问题的原因,并根据所述出现质量问题的原因进行质量问题干预。

在其中一个实施例中,所述将所述医疗数据输入至所述动态关联关系模型中,得到数据关联关系;根据所述数据关联关系获取安全防护方案,展示所述数据关联关系、所述安全防护方案并进行数据安全防护干预,包括:

将所述医疗数据输入至所述动态关联关系模型中,通过所述动态关联关系模型形成数据依赖集合;

所述动态关联关系模型根据所述数据依赖集合过滤出所述医疗数据中的横向关联型数据,通过统计性聚类算法以及所述TCG三维管理模型,对所述横向关联型数据进行智能分类,形成初始数据关联关系;

所述动态关联关系模型对所述初始数据关联关系进行整合和去重,得到所述数据关联关系,并获取与所述数据关联关系对应的所述安全防护方案,展示所述数据关联关系、所述安全防护方案并进行数据安全防护干预。

在其中一个实施例中,所述将所述医疗数据输入至所述动态冷热关系模型中,得到冷热关系数据;根据所述冷热关系数据获取资产价值等级,展示所述冷热关系数据、所述资产价值等级并进行数据资产价值标记,包括:

将所述医疗数据输入至所述动态冷热关系模型中,通过所述动态冷热关系模型抽取和解析数据处理日志,得到所述医疗数据的使用频率;

所述动态冷热关系模型根据所述使用频率,结合聚类算法计算得到所述医疗数据的冷热度标签;

所述动态冷热关系模型根据所述冷热度标签,结合所述TCG三维管理模型对所述医疗数据进行聚类和分类处理,得到所述冷热关系数据;根据所述冷热关系数据获取资产价值等级,展示所述冷热关系数据、所述资产价值等级并进行数据资产价值标记。

一种基于元数据模型的医疗数据治理系统,所述系统包括:

模型构建模块,用于基于采集回收的元数据,根据医疗数据治理场景构建元数据模型;所述元数据模型包括TCG(target、classify、grade)三维管理模型、动态血缘关系模型、动态关联关系模型、动态冷热关系模型;

数据治理类型确定模块,用于实时监测医疗数据,并通过所述TCG三维管理模型对所述医疗数据进行分类管理;当所述医疗数据存在医疗数据治理场景问题时,确定所述医疗数据的数据治理类型;所述数据治理类型包括数据质量治理、数据安全治理、数据资产治理;

数据质量治理模块,用于当所述医疗数据的数据治理类型为数据质量治理时,排查定位数据质量原因,并调用所述动态血缘关系模型;将所述医疗数据输入至所述动态血缘关系模型中,得到数据直系血缘关系;根据所述数据直系血缘关系获取质量问题分类信息,展示所述数据直系血缘关系、所述质量问题分类信息并进行质量问题干预;

数据安全治理模块,用于当所述医疗数据的数据治理类型为数据安全治理时,识别数据安全风险情况,并调用所述动态关联关系模型;将所述医疗数据输入至所述动态关联关系模型中,得到数据关联关系;根据所述数据关联关系获取安全防护方案,展示所述数据关联关系、所述安全防护方案并进行数据安全防护干预;

数据资产治理模块,用于当所述医疗数据的数据治理类型为数据资产治理时,识别数据资产价值,并调用所述动态冷热关系模型;将所述医疗数据输入至所述动态冷热关系模型中,得到冷热关系数据;根据所述冷热关系数据获取资产价值等级,展示所述冷热关系数据、所述资产价值等级并进行数据资产价值标记。

一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:

基于采集回收的元数据,根据医疗数据治理场景构建元数据模型;所述元数据模型包括TCG(target、classify、grade)三维管理模型、动态血缘关系模型、动态关联关系模型、动态冷热关系模型;

实时监测医疗数据,并通过所述TCG三维管理模型对所述医疗数据进行分类管理;当所述医疗数据存在医疗数据治理场景问题时,确定所述医疗数据的数据治理类型;所述数据治理类型包括数据质量治理、数据安全治理、数据资产治理;

当所述医疗数据的数据治理类型为数据质量治理时,排查定位数据质量原因,并调用所述动态血缘关系模型;将所述医疗数据输入至所述动态血缘关系模型中,得到数据直系血缘关系;根据所述数据直系血缘关系获取质量问题分类信息,展示所述数据直系血缘关系、所述质量问题分类信息并进行质量问题干预;

当所述医疗数据的数据治理类型为数据安全治理时,识别数据安全风险情况,并调用所述动态关联关系模型;将所述医疗数据输入至所述动态关联关系模型中,得到数据关联关系;根据所述数据关联关系获取安全防护方案,展示所述数据关联关系、所述安全防护方案并进行数据安全防护干预;

当所述医疗数据的数据治理类型为数据资产治理时,识别数据资产价值,并调用所述动态冷热关系模型;将所述医疗数据输入至所述动态冷热关系模型中,得到冷热关系数据;根据所述冷热关系数据获取资产价值等级,展示所述冷热关系数据、所述资产价值等级并进行数据资产价值标记。

一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:

基于采集回收的元数据,根据医疗数据治理场景构建元数据模型;所述元数据模型包括TCG(target、classify、grade)三维管理模型、动态血缘关系模型、动态关联关系模型、动态冷热关系模型;

实时监测医疗数据,并通过所述TCG三维管理模型对所述医疗数据进行分类管理;当所述医疗数据存在医疗数据治理场景问题时,确定所述医疗数据的数据治理类型;所述数据治理类型包括数据质量治理、数据安全治理、数据资产治理;

当所述医疗数据的数据治理类型为数据质量治理时,排查定位数据质量原因,并调用所述动态血缘关系模型;将所述医疗数据输入至所述动态血缘关系模型中,得到数据直系血缘关系;根据所述数据直系血缘关系获取质量问题分类信息,展示所述数据直系血缘关系、所述质量问题分类信息并进行质量问题干预;

当所述医疗数据的数据治理类型为数据安全治理时,识别数据安全风险情况,并调用所述动态关联关系模型;将所述医疗数据输入至所述动态关联关系模型中,得到数据关联关系;根据所述数据关联关系获取安全防护方案,展示所述数据关联关系、所述安全防护方案并进行数据安全防护干预;

当所述医疗数据的数据治理类型为数据资产治理时,识别数据资产价值,并调用所述动态冷热关系模型;将所述医疗数据输入至所述动态冷热关系模型中,得到冷热关系数据;根据所述冷热关系数据获取资产价值等级,展示所述冷热关系数据、所述资产价值等级并进行数据资产价值标记。

上述基于元数据模型的医疗数据治理方法、系统、计算机设备和存储介质,通过基于采集回收的元数据,根据医疗数据治理场景构建元数据模型;所述元数据模型包括TCG(target、classify、grade)三维管理模型、动态血缘关系模型、动态关联关系模型、动态冷热关系模型;实时监测医疗数据,并通过所述TCG三维管理模型对所述医疗数据进行分类管理;当所述医疗数据存在医疗数据治理场景问题时,确定所述医疗数据的数据治理类型;所述数据治理类型包括数据质量治理、数据安全治理、数据资产治理;当所述医疗数据的数据治理类型为数据质量治理时,排查定位数据质量原因,并调用所述动态血缘关系模型;将所述医疗数据输入至所述动态血缘关系模型中,得到数据直系血缘关系;根据所述数据直系血缘关系获取质量问题分类信息,展示所述数据直系血缘关系、所述质量问题分类信息并进行质量问题干预;当所述医疗数据的数据治理类型为数据安全治理时,识别数据安全风险情况,并调用所述动态关联关系模型;将所述医疗数据输入至所述动态关联关系模型中,得到数据关联关系;根据所述数据关联关系获取安全防护方案,展示所述数据关联关系、所述安全防护方案并进行数据安全防护干预;当所述医疗数据的数据治理类型为数据资产治理时,识别数据资产价值,并调用所述动态冷热关系模型;将所述医疗数据输入至所述动态冷热关系模型中,得到冷热关系数据;根据所述冷热关系数据获取资产价值等级,展示所述冷热关系数据、所述资产价值等级并进行数据资产价值标记。通过构建元数据模型,根据医疗数据的类型将医疗数据输入至不同的元数据模型中,得到各个医疗数据的数据问题,从而针对不同的数据问题采取不同的干预措施,无需人工进行数据治理,提高了数据治理的有效性。

附图说明

图1为一个实施例中基于元数据模型的医疗数据治理方法的应用环境图;

图2为一个实施例中基于元数据模型的医疗数据治理方法的流程示意图;

图3为又一个实施例中基于元数据模型的医疗数据治理方法流程示意图;

图4为一个实施例中TCG三维管理模型的示意图;

图5为一个实施例中动态血缘关系模型的示意图;

图6为一个实施例中动态关联关系模型的示意图;

图7为一个实施例中动态冷热关系模型的示意图;

图8为另一个实施例中基于元数据模型的医疗数据治理方法的流程示意图;

图9为一个实施例中基于元数据模型的医疗数据治理系统的结构框图;

图10为一个实施例中计算机设备的内部结构图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。

本申请实施例提供的基于元数据模型的医疗数据治理方法,可以应用于如图1所示的应用环境中。如图1所示,该应用环境包括计算机设备110。计算机设备110可以基于采集回收的元数据,根据医疗数据治理场景构建元数据模型;元数据模型包括TCG(target、classify、grade)三维管理模型、动态血缘关系模型、动态关联关系模型、动态冷热关系模型;计算机设备110可以实时监测医疗数据,并通过TCG三维管理模型对医疗数据进行分类管理;当医疗数据存在医疗数据治理场景问题时,计算机设备110可以确定医疗数据的数据治理类型;数据治理类型包括数据质量治理、数据安全治理、数据资产治理;当医疗数据的数据治理类型为数据质量治理时,计算机设备110可以排查定位数据质量原因,并调用动态血缘关系模型;计算机设备110可以将医疗数据输入至动态血缘关系模型中,得到数据直系血缘关系;计算机设备110可以根据数据直系血缘关系获取质量问题分类信息,展示数据直系血缘关系、质量问题分类信息并进行质量问题干预;当医疗数据的数据治理类型为数据安全治理时,计算机设备110可以识别数据安全风险情况,并调用动态关联关系模型;计算机设备110可以将医疗数据输入至动态关联关系模型中,得到数据关联关系;计算机设备110可以根据数据关联关系获取安全防护方案,展示数据关联关系、安全防护方案并进行数据安全防护干预;当医疗数据的数据治理类型为数据资产治理时,识别数据资产价值,并调用动态冷热关系模型;计算机设备110可以将医疗数据输入至动态冷热关系模型中,得到冷热关系数据;计算机设备110可以根据冷热关系数据获取资产价值等级,展示冷热关系数据、资产价值等级并进行数据资产价值标记。其中,计算机设备110可以但不限于是各种个人计算机、笔记本电脑、智能手机、机器人、平板电脑等设备。

在一个实施例中,如图2所示,提供了一种基于元数据模型的医疗数据治理方法,包括以下步骤:

步骤202,基于采集回收的元数据,根据医疗数据治理场景构建元数据模型;元数据模型包括TCG(target、classify、grade)三维管理模型、动态血缘关系模型、动态关联关系模型、动态冷热关系模型。

计算机设备可以基于数据仓库的元数据,从元数据分类管理和元数据分析两个方向构建模型。具体的,计算机设备可以基于采集回收的源数据,根据实际场景需要和技术特征,从元数据管理和元数据分析两个维度构建元数据的四个核心模型。即,计算机设备可以根据医疗数据治理场景来构建元数据模型。

其中,构建的元数据模型可以包括TCG(target、classify、grade)三维管理模型、动态血缘关系模型、动态关联关系模型、动态冷热关系模型。TCG三维管理模型是从数据管理角度对具体元数据进行细化分类过程;动态血缘关系模型,是从数据依赖的血缘关系角度来设计,明确数据与数据上下级隶属和依赖关系,便于数据溯源和追溯;动态关联关系模型,是从数据与数据之间关联角度进行关系构建和设计,有别于数据血缘关系的纵向直系血缘关系,关联关系模型侧重数据之间横向联系,例如“兄弟姐妹”和“伴侣”等左右型旁系关系;动态冷热关系模型,是从数据价值角度设计的一种模型,结合“数以致用”的思维,越活跃的数据价值相对越好。

步骤204,实时监测医疗数据,并通过TCG三维管理模型对医疗数据进行分类管理;当医疗数据存在医疗数据治理场景问题时,确定医疗数据的数据治理类型;数据治理类型包括数据质量治理、数据安全治理、数据资产治理。

计算机设备可以实时监测医疗数据,且通过TCG三维管理模型进行分类管理。当医疗数据存在医疗数据治理场景问题或者被触发产生治理场景问题时,计算机设备可以确定医疗数据的数据治理类型。其中,数据治理类型可以分为数据质量治理、数据安全治理、数据资产治理。

步骤206,当医疗数据的数据治理类型为数据质量治理时,排查定位数据质量原因,并调用动态血缘关系模型;将医疗数据输入至动态血缘关系模型中,得到数据直系血缘关系;根据数据直系血缘关系获取质量问题分类信息,展示数据直系血缘关系、质量问题分类信息并进行质量问题干预。

计算机设备可以对医疗数据的数据治理类型进行分析确认,计算机设备可以首先判断数据治理类型是否为数据质量治理,若不是,计算机设备可以进一步判断数据治理类型是否为数据安全治理,若不是,计算机设备可以再进一步判断数据治理类型是否为数据资产治理。

当医疗数据的数据治理类型为数据质量治理时,计算机设备可以排查定位医疗数据的数据质量原因,并调用动态血缘关系模型。计算机设备可以将医疗数据输入至动态血缘关系模型中,得到与医疗数据对应的数据直系血缘关系,进一步获取到对应的质量问题分类信息。计算机设备可以在显示界面中展示数据直系血缘关系以及质量问题分类信息,用户可以根据数据直系血缘关系以及质量问题分类信息进行质量问题干预。

步骤208,当医疗数据的数据治理类型为数据安全治理时,识别数据安全风险情况,并调用动态关联关系模型;将医疗数据输入至动态关联关系模型中,得到数据关联关系;根据数据关联关系获取安全防护方案,展示数据关联关系、安全防护方案并进行数据安全防护干预。

在本实施例中,当医疗数据的数据治理类型为数据安全治理时,计算机设备可以识别出医疗数据的安全风险情况,并调用动态关联关系模型,从而将医疗数据输入至动态关联关系模型中,得到数据关联关系。计算机设备可以获取与数据关联关系对应的安全防护方案,并在显示界面中展示数据关联关系以及安全防护方案。用户可以根据数据关联关系以及安全防护方案进行数据安全防护干预。

步骤210,当医疗数据的数据治理类型为数据资产治理时,识别数据资产价值,并调用动态冷热关系模型;将医疗数据输入至动态冷热关系模型中,得到冷热关系数据;根据冷热关系数据获取资产价值等级,展示冷热关系数据、资产价值等级并进行数据资产价值标记。

计算机设备的显示界面中可以展示冷热关系数据以及资产价值登记,用户可以根据冷热关系数据以及资产价值登记进行数据资产价值标记。

在本实施例中,如图3所示,计算机设备基于已构建的医疗元数据TCG三维管理模型,实现动态血缘关系模型、G动态关联关系模型和动态冷热关系模型,并数据仓库层面进行模型物化处理;围绕数据不准确、数据作业异常、数据修改影响等数据质量原因排查场景,需要调用动态血缘关系模型,先定位到涉及到的相关数据,再结合质量评价策略中完整性、一致性、规范性、时效性、准确性等具体策略,确定具体质量导致的原因;围绕敏感数据保护、数据泄露,医疗数据合规等数据安全防护场景,调用动态关联关系模型,划分数据类集合,再结合数据安全防护策略,例如脱敏、加密、水印等策略,形成不同关联关系数据的安全评估和策略防护;依据数据成本控制和数据资产管理等资产评估场景,调用动态冷热关系模型,形成不同活性的数据资产,再结合资产评估策略,形成最终的资产等级划分和标记。

在本实施例中,计算机设备基于采集回收的元数据,根据医疗数据治理场景构建元数据模型;元数据模型包括TCG(target、classify、grade)三维管理模型、动态血缘关系模型、动态关联关系模型、动态冷热关系模型;实时监测医疗数据,并通过TCG三维管理模型对医疗数据进行分类管理;当医疗数据存在医疗数据治理场景问题时,确定医疗数据的数据治理类型;数据治理类型包括数据质量治理、数据安全治理、数据资产治理;当医疗数据的数据治理类型为数据质量治理时,排查定位数据质量原因,并调用动态血缘关系模型;将医疗数据输入至动态血缘关系模型中,得到数据直系血缘关系;根据数据直系血缘关系获取质量问题分类信息,展示数据直系血缘关系、质量问题分类信息并进行质量问题干预;当医疗数据的数据治理类型为数据安全治理时,识别数据安全风险情况,并调用动态关联关系模型;将医疗数据输入至动态关联关系模型中,得到数据关联关系;根据数据关联关系获取安全防护方案,展示数据关联关系、安全防护方案并进行数据安全防护干预;当医疗数据的数据治理类型为数据资产治理时,识别数据资产价值,并调用动态冷热关系模型;将医疗数据输入至动态冷热关系模型中,得到冷热关系数据;根据冷热关系数据获取资产价值等级,展示冷热关系数据、资产价值等级并进行数据资产价值标记。通过构建元数据模型,根据医疗数据的类型将医疗数据输入至不同的元数据模型中,得到各个医疗数据的数据问题,从而针对不同的数据问题采取不同的干预措施,无需人工进行数据治理,提高了数据治理的有效性。

在一个实施例中,提供的一种基于元数据模型的医疗数据治理方法还可以包括TCG三维管理模型对医疗数据进行分类管理的过程,具体过程包括:将医疗数据输入至TCG三维管理模型中,TCG三维管理模型通过数据对象维度对医疗数据进行分类分级处理;TCG三维管理模型通过数据分级维度对医疗数据从敏感程度和影响程度进行等级划分;TCG三维管理模型通过数据分类维度对医疗数据从数据类型或数据场景应用需要角度进行类型划分,得到分类管理结果。

如图4所示,TCG三维管理模型中的三维具体包括:数据对象维度(T,target)、数据分级维度(C,classify)、数据分类维度(G,grade)。

其中,数据对象维度,主要指需要做数据分类分级处理的具体内容类型,具体包括技术元数据、业务元数据和管理元数据。根据需要也可以再进一步细分,譬如:技术元数据:数据库、数据表、字段等,业务元数据:分析模型、指标等,管理元数据:人员、组织机构等。

数据分级维度,主要指对医疗数据从敏感程度和影响程度进行等级划分,如图3所示,具体包括5个等级:十分敏感L5、一般敏感L4、受控访问L3、部分公开L2、全部公开L1。

数据分类维度,主要指从数据类型或数据场景应用需要角度对数据进行类型划分,至少包括六个类型:个人属性、健康状况、医疗应用、医疗支付、卫生资源、公共卫生。

举例说明,针对技术元数据中跟患者相关的三个字段元数据:身份证号、患者主诉、诊断名称,通过TCG三维模型进行分类管理后结果如下:

在一个实施例中,提供的一种基于元数据模型的医疗数据治理方法还可以包括动态血缘关系模型进行数据处理的过程,具体过程包括:将医疗数据输入至动态血缘关系模型中,通过动态血缘关系模型针对数据仓库动态提取数据模型和数据作业job,形成数据模型和作业集合;动态血缘关系模型对数据模型和作业集合进行数据库解析,识别出不同集合数据依赖关系,形成数据依赖集合;动态血缘关系模型根据数据依赖集合,基于关联规则的关联算法,利用TCG三维管理模型形成与医疗数据对应的数据直系血缘关系,数据直系血缘关系中标记有质量问题分类信息;展示数据直系血缘关系以及质量问题分类信息,并进行质量问题干预。

当医疗数据的数据治理类型为数据质量治理时,计算机设备可以调用动态血缘关系模型,并将医疗数据输入至动态血缘关系模型中。如图5所示,动态血缘关系模型针对数据仓库,每日动态提取数据模型和数据作业job,形成数据模型和数据集合;动态血缘关系模型通过对作业日志和建模SQL等系列SQL关系解析,识别出不同数据集合的数据依赖关系,形成数据依赖集合;动态血缘关系模型根据解析后的结果,利用TCG三维管理模型和基于关联规则的关联算法,进行进一步的按分类合并和关系串联,形成“家谱”型的数据直系血缘关系,其中,数据直系血缘关系中包含有质量问题分类信息。

计算机设备可以对明确的数据直系血缘关系,利用可视化的技术手段,形成明确的数据直系血缘关系图并展示在显示界面中,便于用户进行场景展示和调用。用户可以根据展示的数据直系血缘关系进行质量问题干预。

在一个实施例中,提供的一种基于元数据模型的医疗数据治理方法还可以包括确定出现质量问题的原因的过程,具体过程包括:根据直系血缘关系以及质量问题分类信息定位到存在质量问题的医疗数据;获取质量评价策略,根据质量评价策略以及存在质量问题的医疗数据确定出现质量问题的原因,并根据出现质量问题的原因进行质量问题干预。

其中,存在不同质量问题的医疗数据可以对应有不同的质量评价策略,计算机设备在定位到存在质量问题的医疗数据后,可以获取到对应的质量评价策略,进一步确定出现质量问题的原因,用户可以根据出现质量问题的原因对医疗数据进行质量问题人工干预。

在一个实施例中,提供的一种基于元数据模型的医疗数据治理方法还可以包括动态关联关系模型进行数据处理的过程,具体过程包括:将医疗数据输入至动态关联关系模型中,通过动态关联关系模型形成数据依赖集合;动态关联关系模型根据数据依赖集合过滤出医疗数据中的横向关联型数据,通过统计性聚类算法以及TCG三维管理模型,对横向关联型数据进行智能分类,形成初始数据关联关系;动态关联关系模型对初始数据关联关系进行整合和去重,得到数据关联关系,并获取与数据关联关系对应的安全防护方案,展示数据关联关系、安全防护方案并进行数据安全防护干预。

当医疗数据的数据治理类型为数据安全治理时,计算机设备可以调用动态关联关系模型,并将医疗数据输入至动态关联关系模型中。如图6所示,计算机设备可以通过每日动态从数据仓库中提取出数据模型,形成数据模型的集合,再通过解析工具,进行SQL解析;动态关联关系模型对解析后的数据关系具体情况,过滤出横向关联型的内容,再通过统计型聚类算法和TCG三维管理模型,进行衍生关系和同源关系等不同类型的智能分类,分类后的数据就形成了数据关联关系,动态关联关系模型可以对同类的关联关系进行进一步整合和去重;对处理后的数据关联关系,计算机设备可以利用可视化的技术手段,形成明确的关联关系图,并在显示界面中进行场景展示。其中,不同的数据关联关系可以对应有不同的安全防护方案,计算机设备可以获取与数据关联关系对应的安全防护方案,并在显示界面中展示安全防护方案,用户可以对数据关联关系进行调用,并进行数据安全防护人工干预。

在一个实施例中,提供的一种基于元数据模型的医疗数据治理方法还可以包括动态冷热关系模型进行数据处理的过程,具体过程包括:将医疗数据输入至动态冷热关系模型中,通过动态冷热关系模型抽取和解析数据处理日志,得到医疗数据的使用频率;动态冷热关系模型根据使用频率,结合聚类算法计算得到医疗数据的冷热度标签;动态冷热关系模型根据冷热度标签,结合TCG三维管理模型对医疗数据进行聚类和分类处理,得到冷热关系数据;根据冷热关系数据获取资产价值等级,展示冷热关系数据、资产价值等级并进行数据资产价值标记。

当医疗数据的数据治理类型为数据资产治理时,计算机设备可以调用动态冷热关系模型,并将医疗数据输入至动态冷热关系模型中。如图7所示,计算机设备可以通过动态冷热关系模型针对数据处理日志系统,对其中调用接口日志,数据建模日志等内容进行抽取和解析;动态冷热关系模型可以根据数据被调用或被建模应用的频次和频度,结合利用k-means聚类算法,划分成冰数据、冷数据、温数据和热数据四个不同等级,并打上冷热度标签;动态冷热关系模型可以结合TCG三维管理模型,对不同等级的数据进一步进行医疗业务分类和归集,通过多次聚类和分类后,形成不同业务分类型的冷热关系数据;其中,不同的冷热关系数据可以对应有不同的资产价值等级,计算机设备可以获取与冷热关系数据对应的资产价值等级,并在显示界面中展示冷热关系数据、资产价值等级,用户可以进一步进行数据资产价值标记。

如图8所示,在一个实施例中,提供的一种基于元数据模型的医疗数据治理方法中,结合实际业务,计算机设备发现具体业务中数据治理场景需求和存在的治理问题,对数据治理的需求和问题进行分类分析,找到合适的元数据模型和治理方案。具体为:

1、针对数据质量问题,识别问题,需要根据数据血缘关系模型和质量评价策略,定位问题,并形成精准、智能的干预方案;

2、针对数据安全问题,识别现状,调用数据关联关系模型和安全防护方案,明确每类数据的安全方案,再进行安全实现干预;

3、针对数据资产问题,识别资产价值现状,调用数据冷热关系模型和资产评估策略,形成不同等级的资产,再完成资产价值的分类打标。

应该理解的是,虽然上述各个流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,上述各个流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些子步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。

在一个实施例中,如图9所示,提供了一种基于元数据模型的医疗数据治理系统,包括:模型构建模块910、数据治理类型确定模块920、数据质量治理模块930、数据安全治理模块940和数据资产治理模块950,其中:

模型构建模块910,用于基于采集回收的元数据,根据医疗数据治理场景构建元数据模型;元数据模型包括TCG(target、classify、grade)三维管理模型、动态血缘关系模型、动态关联关系模型、动态冷热关系模型;

数据治理类型确定模块920,用于实时监测医疗数据,并通过TCG三维管理模型对医疗数据进行分类管理;当医疗数据存在医疗数据治理场景问题时,确定医疗数据的数据治理类型;数据治理类型包括数据质量治理、数据安全治理、数据资产治理;

数据质量治理模块930,用于当医疗数据的数据治理类型为数据质量治理时,排查定位数据质量原因,并调用动态血缘关系模型;将医疗数据输入至动态血缘关系模型中,得到数据直系血缘关系;根据数据直系血缘关系获取质量问题分类信息,展示数据直系血缘关系、质量问题分类信息并进行质量问题干预;

数据安全治理模块940,用于当医疗数据的数据治理类型为数据安全治理时,识别数据安全风险情况,并调用动态关联关系模型;将医疗数据输入至动态关联关系模型中,得到数据关联关系;根据数据关联关系获取安全防护方案,展示数据关联关系、安全防护方案并进行数据安全防护干预;

数据资产治理模块950,用于当医疗数据的数据治理类型为数据资产治理时,识别数据资产价值,并调用动态冷热关系模型;将医疗数据输入至动态冷热关系模型中,得到冷热关系数据;根据冷热关系数据获取资产价值等级,展示冷热关系数据、资产价值等级并进行数据资产价值标记。

在一个实施例中,数据治理类型确定模块920还用于将医疗数据输入至TCG三维管理模型中,TCG三维管理模型通过数据对象维度对医疗数据进行分类分级处理;TCG三维管理模型通过数据分级维度对医疗数据从敏感程度和影响程度进行等级划分;TCG三维管理模型通过数据分类维度对医疗数据从数据类型或数据场景应用需要角度进行类型划分,得到分类管理结果。

在一个实施例中,数据质量治理模块930还用于将医疗数据输入至动态血缘关系模型中,通过动态血缘关系模型针对数据仓库动态提取数据模型和数据作业job,形成数据模型和作业集合;动态血缘关系模型对数据模型和作业集合进行数据库解析,识别出不同集合数据依赖关系,形成数据依赖集合;动态血缘关系模型根据数据依赖集合,基于关联规则的关联算法,利用TCG三维管理模型形成与医疗数据对应的数据直系血缘关系,数据直系血缘关系中标记有质量问题分类信息;展示数据直系血缘关系以及质量问题分类信息,并进行质量问题干预。

在一个实施例中,数据质量治理模块930还用于根据直系血缘关系以及质量问题分类信息定位到存在质量问题的医疗数据;获取质量评价策略,根据质量评价策略以及存在质量问题的医疗数据确定出现质量问题的原因,并根据出现质量问题的原因进行质量问题干预。

在一个实施例中,数据安全治理模块940还用于将医疗数据输入至动态关联关系模型中,通过动态关联关系模型形成数据依赖集合;动态关联关系模型根据数据依赖集合过滤出医疗数据中的横向关联型数据,通过统计性聚类算法以及TCG三维管理模型,对横向关联型数据进行智能分类,形成初始数据关联关系;动态关联关系模型对初始数据关联关系进行整合和去重,得到数据关联关系,并获取与数据关联关系对应的安全防护方案,展示数据关联关系、安全防护方案并进行数据安全防护干预。

在一个实施例中,数据资产治理模块950还用于将医疗数据输入至动态冷热关系模型中,通过动态冷热关系模型抽取和解析数据处理日志,得到医疗数据的使用频率;动态冷热关系模型根据使用频率,结合聚类算法计算得到医疗数据的冷热度标签;动态冷热关系模型根据冷热度标签,结合TCG三维管理模型对医疗数据进行聚类和分类处理,得到冷热关系数据;根据冷热关系数据获取资产价值等级,展示冷热关系数据、资产价值等级并进行数据资产价值标记。

在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图10所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种基于元数据模型的医疗数据治理方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。

本领域技术人员可以理解,图10中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。

在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:

基于采集回收的元数据,根据医疗数据治理场景构建元数据模型;元数据模型包括TCG(target、classify、grade)三维管理模型、动态血缘关系模型、动态关联关系模型、动态冷热关系模型;

实时监测医疗数据,并通过TCG三维管理模型对医疗数据进行分类管理;当医疗数据存在医疗数据治理场景问题时,确定医疗数据的数据治理类型;数据治理类型包括数据质量治理、数据安全治理、数据资产治理;

当医疗数据的数据治理类型为数据质量治理时,排查定位数据质量原因,并调用动态血缘关系模型;将医疗数据输入至动态血缘关系模型中,得到数据直系血缘关系;根据数据直系血缘关系获取质量问题分类信息,展示数据直系血缘关系、质量问题分类信息并进行质量问题干预;

当医疗数据的数据治理类型为数据安全治理时,识别数据安全风险情况,并调用动态关联关系模型;将医疗数据输入至动态关联关系模型中,得到数据关联关系;根据数据关联关系获取安全防护方案,展示数据关联关系、安全防护方案并进行数据安全防护干预;

当医疗数据的数据治理类型为数据资产治理时,识别数据资产价值,并调用动态冷热关系模型;将医疗数据输入至动态冷热关系模型中,得到冷热关系数据;根据冷热关系数据获取资产价值等级,展示冷热关系数据、资产价值等级并进行数据资产价值标记。

在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:

基于采集回收的元数据,根据医疗数据治理场景构建元数据模型;元数据模型包括TCG(target、classify、grade)三维管理模型、动态血缘关系模型、动态关联关系模型、动态冷热关系模型;

实时监测医疗数据,并通过TCG三维管理模型对医疗数据进行分类管理;当医疗数据存在医疗数据治理场景问题时,确定医疗数据的数据治理类型;数据治理类型包括数据质量治理、数据安全治理、数据资产治理;

当医疗数据的数据治理类型为数据质量治理时,排查定位数据质量原因,并调用动态血缘关系模型;将医疗数据输入至动态血缘关系模型中,得到数据直系血缘关系;根据数据直系血缘关系获取质量问题分类信息,展示数据直系血缘关系、质量问题分类信息并进行质量问题干预;

当医疗数据的数据治理类型为数据安全治理时,识别数据安全风险情况,并调用动态关联关系模型;将医疗数据输入至动态关联关系模型中,得到数据关联关系;根据数据关联关系获取安全防护方案,展示数据关联关系、安全防护方案并进行数据安全防护干预;

当医疗数据的数据治理类型为数据资产治理时,识别数据资产价值,并调用动态冷热关系模型;将医疗数据输入至动态冷热关系模型中,得到冷热关系数据;根据冷热关系数据获取资产价值等级,展示冷热关系数据、资产价值等级并进行数据资产价值标记。

本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。

以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。

以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号