首页> 中国专利> 人群健康问题诊断与报告自动生成方法、装置、电子设备及储存介质

人群健康问题诊断与报告自动生成方法、装置、电子设备及储存介质

摘要

本发明提供了一种人群健康问题诊断与报告自动生成方法、装置、电子设备及储存介质,涉及数据分析技术领域,所述方法,包括:建立目标模板,并导入用户的报告要求数据和预先收集的人群健康状况数据,得到用户定制的报告准备文件;根据报告准备文件中的报告要求数据和人群健康状况数据进行人群健康问题诊断,并根据诊断结果生成初始人群健康报告和数据质量报告;根据所述数据质量报告对所述初始人群健康报告进行校验,输出目标人群健康报告。本发明解决了现有技术中缺乏人群健康报告自动生成方案的问题,并且避免了采用人工进行报告撰写的方式,减少了人力成本投入,提高了报告生成的效率和稳定性。

著录项

  • 公开/公告号CN114927186A

    专利类型发明专利

  • 公开/公告日2022-08-19

    原文格式PDF

  • 申请/专利权人 四川省疾病预防控制中心;

    申请/专利号CN202210494620.X

  • 发明设计人 胥馨尹;邓颖;张新;董婷;曾晶;

    申请日2022-05-07

  • 分类号G16H10/60(2018.01);G16H15/00(2018.01);G16H50/70(2018.01);

  • 代理机构四川云首创专利代理事务所(普通合伙) 51359;

  • 代理人万利

  • 地址 610000 四川省成都市武侯区中学路6号

  • 入库时间 2023-06-19 16:25:24

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-09-06

    实质审查的生效 IPC(主分类):G16H10/60 专利申请号:202210494620X 申请日:20220507

    实质审查的生效

说明书

技术领域

本发明涉及数据分析技术领域,尤其涉及一种人群健康问题诊断与报告自动生成方法、装置、电子设备及储存介质。

背景技术

人群健康报告用于表征各类大型人群健康调查中,大量健康指标的数据处理、分析及文字、图表呈现,多项结果以统一、规范的报告形式表达,数量上关注于群体健康问题的流行(数量、率、均值等),应用者为政府、企业事业单位、专业人士等调查组织或实施方,阅读对象除上述三方还包括大众。此类健康报告,目前往往由专业人员完成数据清理以后,一字一句编写出来,一幅一幅图表绘制而出,其中文字部分涉及的数字是从图表人工提取,效率低易出错,后期修正工程量大,无论是以调研报告还是以书籍出版形式公布,周期漫长,往往会经历较长时间。

相关技术中,缺乏对数据智能分析,并自动生成人群健康报告的方法。

发明内容

本发明实施例提供一种人群健康问题诊断与报告自动生成方法、装置、电子设备及储存介质,旨在解决或者部分解决目前针对政府、企事业、专业人士开展不同人群健康调查时,都需要依靠人工撰写报告导致的低效性、稳定性差的问题。

为了解决上述技术问题,本发明是这样实现的:

第一方面,本发明提供了一种人群健康问题诊断与报告自动生成方法,方法包括:

建立目标模板,并导入用户的报告要求数据和预先收集的人群健康状况数据,得到用户定制的报告准备文件;

根据报告准备文件中的报告要求数据和人群健康状况数据进行人群健康问题诊断,并根据诊断结果生成初始人群健康报告和数据质量报告;

根据数据质量报告对初始人群健康报告进行校验,输出目标人群健康报告。

可选地,目标模板包括报告样本库和报告相关数据库;

报告样本库包括各应用场景对应的人群健康报告样本,每个人群健康报告样本包括示例的文字组合和待填写的子展示区,子展示区的目标任务的类型包括数据值、图表以及文字描述;

报告相关数据库包括人群健康状况数据子库、数据相关描述子库、数据分析定义子库、以及健康问题阈值区间子库。

可选地,获取用户定制的报告准备文件,包括:

通过预设平台、预设采集渠道、预设采样方式获取个体健康状况数据,个体健康状况数据包括:个体的地域归属信息、性别、年龄、权重信息、以及健康问题信息;

根据预设采集渠道将个体健康状况数据汇总,生成人群健康状况数据并存储至目标模板中的人群健康状况数据子库;

将用户设置的报告要求数据分别存储至目标模板中的对应的子库,报告要求数据包括目标应用场景、数据相关描述数据、数据分析定义数据、以及健康问题阈值区间数据;

得到用户定制的报告准备文件。

可选地,生成初始人群健康报告和数据质量报告,包括:

匹配用户选择的目标应用场景对应的人群健康报告样本及其待填写的子展示区;

根据每个子展示区的目标任务提取对应的报告要求数据和人群健康状况数据,执行健康问题的分析诊断;

将执行分析诊断的结果,分别导入对应的子展示区,完成人群健康报告样本的自动撰写,并生成对应的初始人群健康报告;

生成初始人群健康报告对应的数据质量报告。

可选地,执行健康问题的分析诊断,包括:

根据报告要求数据和人群健康状况数据进行特征分析得到目标任务值,目标任务值包括第一点估计值和第二点估计值;

根据第一点估计值生成分组表和分组文字描述;

根据第二点估计值生成趋势图和趋势文字描述;

将分组表和分组文字描述、趋势图和趋势文字描述作为执行分析的结果。

可选地,对初始人群健康报告进行校验,包括:

根据数据质量报告确定人群健康状况数据的极值情况;

若人群健康状况数据的极值分布在预设阈值范围外,则自动评估个体极值所占比例;

若个体极值所占比例在可控范围内,则使用预设阈值范围的门槛值替换个体极值或去掉个体极值,在数据质量报告中呈现评估结果,并继续执行健康问题的分析诊断步骤,输出两份目标人群健康报告供用户选择;

若个体极值所占比例在可控范围外,则初始人群健康报告中不输出极值对应的健康指标结果,并在数据质量报告中记录预警信息;

若极值分布在预设阈值范围内,则数据质量报告中极值对应的健康指标结果显示合格,并将初始人群健康报告确定为目标人群健康报告。

第二方面,本发明提供了一种人群健康问题诊断与报告自动生成装置,装置包括:

数据导入模块,用于将用户的报告要求数据和预先收集的人群健康状况数据导入目标模板,生成对应的报告准备文件;

撰写模块,根据报告准备文件中的报告要求数据和人群健康状况数据进行人群健康问题诊断,并根据诊断结果生成初始人群健康报告和数据质量报告;

输出模块,用于根据数据质量报告对初始人群健康报告进行校验,输出目标人群健康报告。

第三方面,本发明提供了一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;

存储器,用于存放计算机程序;

处理器,用于执行存储器上所存放的程序时,实现本发明第一方面提出的方法步骤。

第四方面,本发明提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明第一方面提出的方法。

本发明包括以下优点:

本发明提供的人群健康问题诊断与报告自动生成方法,能够根据用户采集的人群健康状况数据进行人群健康问题诊断,并针对目标应用场景自动生成用户定制的人群健康报告,解决了目前技术中缺乏人群健康报告自动生成方案的问题,并且避免了采用人工进行报告撰写的方式,减少了人力成本投入,提高了报告生成的效率和稳定性。

附图说明

为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本发明实施例中一种人群健康问题诊断与报告自动生成方法的步骤流程图;

图2是本发明实施例中一种人群健康问题诊断与报告自动生成装置的模块示意图;

图3是本发明实施例中电子设备的功能模块示意图。

具体实施方式

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

实施例1:

相关技术中,没有基于政府、专业人士、大众对人群健康调查数据的自动撰写方法。部分有针对医院各类体检结果的个体患者指标数据提取及报表输出,和本申请专利适用对象不同,数量上关注于个体,应用者为医院、检测中心等,阅读对象为检测个体,现有产品不具有群体社会经济效应,更多是提高个体检测机构效率。无法解决政府、企事业机构、专业人士对大型调查多指标人群健康数据的快速健康“诊断”报告问题。

并且现有的健康报告更多在专业人员完成数据清理以后,一字一句编写出来,一幅一幅图表绘制而出,其中文字部分涉及的数字是从图表人工提取,效率低易出错,后期修正工程量大,无论是以调研报告还是以书籍出版形式公布,周期漫长,特别是针对人员紧缺但又大量承担部分政府政策咨询职责的公共事业机构、基层医疗卫生机构,如果专业人员流动甚至导致报告夭折,前期花费大量资金投入的调查分析草草收尾、不符合验收要求、低质量展示,或需要继续投入大量资金请第三方机构完成报告。

基于此,提出本申请的发明核心构思,提供一种应用于多场景的方法,完成人群健康数据智能分析及人群“诊断”报告的自动撰写,关注于群体健康指标流行情况、数量、率、均值描述,达成结果为实现快速批量化完成数据智能分析和常规报告撰写,以期缩短投入大量公共事业、科研资金开展的人群健康调查的结果反馈周期,更高效、及时地同社会发布大型人群调查结果。

如图1所示,本实施例公开了一种人群健康问题诊断与报告自动生成方法,方法包括:

S101:建立目标模板,目标模板包括报告样本库和报告相关数据库;

报告样本库包括各应用场景对应的人群健康报告样本,每个人群健康报告样本包括示例的文字组合和待填写的子展示区,子展示区的目标任务的类型包括数据值、图表以及文字描述;用于向用户展示不同应用场景生成的人群健康报告的示例,用户可以选择本次报告的目标应用场景;

根据人群健康状况数据,作为示例的,人群健康状况数据来源可以为大型人群调查(如现有的成人慢性病与营养监测、慢性病及其危险因素监测、慢阻肺监测、儿童乳母营养调查、老年健康调查、口腔调查等)、生命统计调查(如现有的死亡登记、肿瘤登记、伤害监测、心脑血管疾病监测等)、(多中心)大型健康体检数据,分为不同应用场景,根据人群报告确定描述需求不同,提供不同的报告的描述组合进行场景选择,对不同场景提供对应人群健康报告样本;

报告相关数据库包括人群健康状况数据data子库、数据相关描述description子库、数据分析定义type子库、以及健康问题阈值区间reference子库;

data子库分5个颜色区,先后反映地域(或其它分类元素)、性别、年龄、权重信息、健康问题信息(去掉非相关信息,不纳入报告的问题不纳入),首行为变量名,用户按颜色区先后顺序整理好数据粘贴至data库即可;

description子库分两列,第1列会自动生成(基于data子库中的最后一个颜色区),即data子库中健康问题对应的变量名,第2 列由用户做开放式个性定义,用于某健康问题在报告文字或图表中的名称描述(如“高血压”、“现在吸烟”、“肥胖”……);

type子库分3列,第1列同上会自动生成,第2列由用户提需求,标识对该健康问题做二分类、多分类还是定量均值分析的要求(目标模板中type子库第2列对应数字可选1、2、3三个选项),如确定为做分类分析,在第3列由用户提供该健康问题分组依据,该子库也将提供常见的健康指标参考分组依据;

reference子库分3列,第1列会自动识别type子库中被标识为定量的健康问题,第2列提供下拉菜单选择匹配模板提供的人体身体生理指标、行为或环境暴露常规区间;本实施例赋予用户自定义权利,对于未在第2列下拉菜单匹配参考区间或用户希望自定义者,可在第3列根据实际情况和科学依据自定义调整区间;

建立好上述子库后,并导入用户的报告要求数据和预先收集的人群健康状况数据,得到用户定制的报告准备文件,包括:

S101-1:通过预设平台、预设采集渠道、预设采样方式获取个体健康状况数据,个体健康状况数据包括:个体的地域归属信息、性别、年龄、权重信息、以及健康问题信息;

本发明旨在分析人群健康状况在不同地域(或其它分类元素)、性别、年龄段的特征分布和变化趋势,故需要数据源中每条个案数据包含一个人的地域归属信息、性别、年龄、权重,以及拟纳入报告反映的核心健康问题5类,这是每条个案包含的基本元素;

在步骤S101-1中,可以按照无权重信息的预设采样方式获取个体健康状况数据,并且,核心健康问题可以为二分类或多分类的疾病的发病、患病、死亡或是否有风险暴露(饮食、身体活动、吸烟、饮酒等行为或居家/工作环境等)信息,也可以是量化的身体测量及生化检测指标值(如身高、体重、BMI、血压、血糖、血脂、血红蛋白等等)及风险暴露值(饮食、身体活动、吸烟、饮酒等行为或居家/ 工作环境等);

个体健康状况数据可以通过政府、医院、公共卫生机构、部分从事人群健康工作的企事业单位等预设平台进行获取,在上述平台上常常会因为需要了解人群健康问题而即进行个体健康状况数据的采集,采集的种类可以包括人群健康调查、(多中心)大型健康体检等,采集渠道分现场或网络采集,预设采集可以是随机调查也可以是抽样调查;

S101-2:根据预设采集渠道将个体健康状况数据汇总,生成人群健康状况数据并存储至目标模板中的人群健康状况数据data子库;

当采集渠道为现场采集时,对于个体的个体健康状况数据,通常是纸质内容,因此需要将对应的纸质内容进行归档整理,生成对应的文本数据信息,当采集渠道为网络采集时,则需要将对应的个体健康状况数据对应的网络数据进行整理合并,从而生成人群健康状况数据;

S101-3:将用户设置的报告要求数据分别存储至目标模板中的对应的子库,报告要求数据包括目标应用场景、数据相关描述 description数据、数据分析定义type数据、以及健康问题阈值区间数据;

S101-4:得到用户定制的报告准备文件;

S102:根据报告准备文件中的报告要求数据和人群健康状况数据进行人群健康问题诊断,并根据诊断结果生成初始人群健康报告和数据质量报告,包括:

S102-1:匹配用户选择的目标应用场景对应的人群健康报告样本及其待填写的子展示区;

S102-2:根据每个子展示区的目标任务提取对应的报告要求数据和人群健康状况数据,执行健康问题的分析诊断,包括:

S102-2-1:根据报告要求数据和人群健康状况数据进行特征分析,即某健康问题按地域(或其它分类元素)、性别、年龄进行特征分析,得到目标任务值(率、构成比或均值等点估计值),完成分年龄、地域、性别特征的制表(如横向类别包含总体、性别、城乡及城镇或乡村不同性别,纵向包括不同年龄组),如表1所示,由于后期制图依据也源于本步的点估计值,故本步点估计过程设计为两次估计,还可根据需要设计多次,因此,目标任务值包括第一点估计值和第二点估计值;

表1不同城乡、男女分性别某健康指标流行率(%)

S102-2-2:第一次点估计值用于制表分组和总体描述及组间文字描述时的数值提取(选择较粗的年龄分组,如调查对象为成人,设计为18-44岁、45-59岁、60-75岁、75岁及以上),根据第一点估计值生成分组表和分组文字描述;

S102-2-3:第二次点估计值用于制图和趋势文字描述时的数值提取(选择较细的年龄分组,如调查对象为成人,设计为18-29岁、30-39 岁、40岁-49岁、50-59岁、60-69岁、70-79岁、80岁及以上),根据第二点估计值生成趋势图和趋势文字描述;

S102-2-4:将分组表和分组文字描述、趋势图和趋势文字描述作为执行分析的结果;

从data子库中,定位提取制表栏中关键点估计值(如第一次点估计制表中第一行合计对应的各种特征值(如上表中**符号所对应的格子);第二次点估计制表中总人群、男性、女性(如上图#符号所对应的格子)的第一个年龄组和最后一个年龄组值,定位总人群最低、最高值时的年龄组),提取目的便于后期文字组合时进行调取,即确定出目标任务值在健康状况子数据库对应的位置;然后使用type子库中的类别标识,就某健康问题是分类(type子库第2列为1或2) 还是定量变量(type子库第2列为3),选择调用专利程序中编写的基于两类情况对应的组间检验语句(前者检验率或构成比,后者检验均值);最后,以常见统计分析语言SAS语言的应用规则举例可选择 proc surveyfreq和proc surveyreg语句编写两类检验宏,完成检验后,程序会从后台检验结果所在库提取检验;

S102-3:将执行分析诊断的结果,分别导入对应的子展示区,完成人群健康报告样本的自动撰写;

完成检验后,程序会从后台检验结果所在库提取检验指标(如p 值,设定p<0.05表示组间有显著性差异),并将其设计为宏变量,根据检验结果继续执行描述文字的自动编写,基于第二步中**符号所在格子设定好的宏变量,自动化提取数值完成第一句,阐述目标人群该健康问题的总体值、分地区、分性别流行值:如“某某省18岁及以上居民高血压患病率总体为……%,其中男性、女性分别为……%、……%,城镇和乡村分别为……%、……%”。随后编写第二句,对总体值的分组比较结果进行描述:如程序先比较男性与女性谁高谁低,再自动提取第三步中组间检验结果(p值)判断输出“男性”“明显高于”、“高于”、“一致”、“接近”、“低于”或“明显低于”“女性”等。最后基于第二步中#符号所在格子设定好的趋势宏变量自动做判断,输出第三句:“随着年龄组的增长而升高”、“随着年龄组的增长而下降”、“随着年龄组的增长先升高后下降”、“随着年龄组的增长先下降后升高”、“随着年龄组的增长呈现一定波动”、“各年龄组基本变化不大”等,以及输出第四句:“男性人群中……年龄组最高、……年龄组最低;女性人群中,……年龄组最高、……年龄组最低”等;最后,基于第二次点估计的总体值(首行数值信息)和分年龄总体及男女(前三列数值信息)绘制总体图和年龄趋势图(其中制图色系字体等可设计为可调);

S102-4:除上述的根据用户提供的人群健康状况数据进行健康问题诊断的情况外,延伸的健康问题诊断还包括将健康问题诊断结果与标准人群的流行数据比较,标准人群由用户可选(含国际、全国、某个省级水平等),比较步骤包括人口标化处理等环节,根据S102-3及本步骤用户可选需求,最后生成对应的初始人群健康报告;

S102-5:生成初始人群健康报告对应的数据质量报告;

S103:根据数据质量报告对初始人群健康报告进行校验,输出目标人群健康报告,包括:

S103-1:根据数据质量报告确定人群健康状况数据的极值情况;

S103-2:若人群健康状况数据的极值分布在预设阈值范围外,则自动评估个体极值所占比例;

S103-3:若个体极值所占比例在可控范围内,则使用预设阈值范围的门槛值替换个体极值或去掉个体极值,在数据质量报告中呈现评估结果,并继续执行健康问题的分析诊断步骤,输出两份目标人群健康报告供用户选择;

S103-4:若个体极值所占比例在可控范围外,则初始人群健康报告中不输出极值对应的健康指标结果,并在数据质量报告中记录预警信息;

预警信息供用户确认以下三种处理方式:校正阈值重新出具报告、核实数据重新出具报告、采用假定极值比例在可控范围内的同路径方式重新出具报告;

S103-5:若极值分布在预设阈值范围内,则数据质量报告中极值对应的健康指标结果显示合格,并将初始人群健康报告确定为目标人群健康报告;

在步骤S103中,生成的“数据质量报告”对本阶段发现的极端值情况进行阐述,供用户参考是否去掉极端值,重新分析,根据数据质量报告来对其进行校验和修正,排除极值的干扰,输出的目标人群健康报告可以为输出电脑自带office软件word功能可读取、编辑的文档格式,或非编辑的PDF文档格式,或网页展示的html等格式的报告成品。

本发明提供的人群健康问题诊断与报告自动生成方法,能够根据用户采集的人群健康状况数据进行人群健康问题诊断,并针对目标应用场景自动生成用户定制的人群健康报告,解决了目前技术中缺乏人群健康报告自动生成方案的问题,并且避免了采用人工进行报告撰写的方式,减少了人力成本投入,提高了报告生成的效率和稳定性。

进一步地,本发明实现了快速批量化完成数据智能分析和常规报告撰写,缩短国家投入大量公共事业、科研资金开展的人群健康调查的结果反馈周期,更高效、及时地同社会发布大型人群调查结果,提升公共资金的社会经济价值,帮助政府、专业人士、大众更快的了解、重视人群健康问题,为出台更有益的国家或地方健康政策提供依据,为居民增强自我健康管理意识,做好健康守护者释放积极信息。

实施例2:

如图2所示,本实施例公开了一种人群健康问题诊断与报告自动生成装置,装置包括:

数据导入模块201,用于将用户的报告要求数据和预先收集的人群健康状况数据导入目标模板,生成对应的报告准备文件;

撰写模块202,根据报告准备文件中的报告要求数据和人群健康状况数据进行人群健康问题诊断,并根据诊断结果生成初始人群健康报告和数据质量报告;

输出模块203,用于根据数据质量报告对初始人群健康报告进行校验,输出目标人群健康报告。

实施例3:

如图3所示,本实施例公开了一种电子设备,其特征在于,包括处理器31、通信接口32、存储器33和通信总线34,其中,处理器 31,通信接口32,存储器33通过通信总线34完成相互间的通信;

存储器33,用于存放计算机程序;

处理器31,用于执行存储器33上所存放的程序时,实现本发明实施例1提出的方法步骤。

实施例4:

本实施例公开了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明实施例1提出的方法。

本发明不局限于上述可选的实施方式,任何人在本发明的启示下都可得出其他各种形式的产品。上述具体实施方式不应理解成对本发明的保护范围的限制,本发明的保护范围应当以权利要求书中界定的为准,并且说明书可以用于解释权利要求书。

以上对本发明所提供的一种人群健康问题诊断与报告自动生成方法、装置、电子设备及储存介质,进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号