首页> 中文学位 >基于电子病历的急性冠脉综合征患者主要不良心血管事件预测
【6h】

基于电子病历的急性冠脉综合征患者主要不良心血管事件预测

代理获取

目录

声明

致谢

摘要

1 绪论

1.1 引言

1.2 研究现状

1.2.1 队列研究

1.2.2 基于电子病历的不良事件预测研究

1.3 研究目标与内容

1.3.1 研究目标与任务

1.3.2 研究贡献

1.3.3 研究内容安排

2 数据准备与处理

2.1 检查检验数据处理

2.2 入院记录数据处理

2.2.1 基于规则的患者特征提取方法

2.2.2 基于条件随机场的患者特征提取方法

2.2.3 特征合并

2.2.4 提取结果与评估

2.3 主要不良心血管事件标注

2.4 本章小结

3 独立主要不良心血管事件预测模型

3.1 独立不良事件预测模型构建

3.2 独立不良事件预测模型评估

3.2.1 独立不良事件预测模型性能评估

3.2.2 入院记录患者特征对独立预测模型性能影响评估

3.2.3 独立不良事件预测模型性能提升因素分析

3.3 风险因子

3.4 本章小结

4 集成主要不良心血管事件预测模型

4.1 预备知识

4.1.1 粗糙集理论

4.1.2 Dempster-Shafer证据理论

4.2 集成不良事件预测模型构建方法

4.2.1 基于粗糙集理论的权值计算

4.2.2 基于Dempster-Shafer证据理论的独立预测模型融合

4.3 集成不良事件预测模型构建与评估

4.4 本章小结

5.1 总结

5.2 展望

附录

参考文献

作者简历

展开▼

摘要

主要不良心血管事件预测与评估是研究急性冠脉综合征等心血管疾病致病危险因素与疾病发病率、死亡率之间数量依存关系及规律的技术,被普遍认为是进行疾病防治的核心环节。预测结果能够为医生提供临床决策支持,辅助医生制定合理的治疗及护理方案,从而减小患者发生不良事件的几率;更能规范医疗流程,减少医疗开支。
  传统队列研究通过入组标准控制患者质量,采用少量精选风险因子构建模型,使用简单并已得到广泛的临床认可。但其存在如入组标准导致入组患者与实际临床环境不同;少量风险因子限制模型性能;难以纳入新的风险因子等不足。随着电子病历等医疗信息系统的快速发展,大量研究开始采用电子病历数据构建预测模型。相对于队列研究,该类模型没有严格的入组标准,数据反应真实临床环境;数据丰富,可用患者信息多;可纳入新的风险因子。尽管克服了队列研究的不足,但依然存在如1)电子病历数据尚未充分利用2)数据不准确值及缺失值导致模型不确定性大、预测结果不准确等问题。
  因此,本论文针对上述基于电子病历数据预测方法的不足,提出了一种基于电子病历数据挖掘的主要不良心血管事件预测方法。该方法主要由四部分组成:第一,在处理检查检验数据同时,使用自然语言处理技术从入院记录中提取患者特征,充分使用获取到的电子病历数据。第二,使用四种常用的机器学习算法,即支持向量机、随机森林、朴素贝叶斯及范数一逻辑回归,构建独立不良事件预测模型。第三,使用粗糙集理论计算各独立不良事件预测模型的权重值,来确定其在集成模型中所应发挥的作用。第四,采用Dempster-Shafer证据理论,将多个独立预测模型的输出结果和已得到广泛临床认可的队列研究模型GRACE相融合,从而得到本轮文提出的集成主要不良心血管事件预测模型。
  通过使用从医院收集到的2,930份急性冠脉综合征电子病历数据对本论文所提出的集成主要不良心血管事件预测方法进行评估。评估结果表明:1)使用自然语言处理技术深度挖掘非结构化电子病历数据能有效提高不良事件预测精度;2)使用Dempster-Shafer证据理论构建的集成预测模型在与独立预测模型和其他集成模型对比时,取得了最佳的综合预测性能,有效减少了电子病历数据中不准确值及缺失值对模型预测性能产生的影响。

著录项

代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号