首页> 中文学位 >基于命名实体识别的电子病历文档匿名化系统设计与实现
【6h】

基于命名实体识别的电子病历文档匿名化系统设计与实现

代理获取

目录

声明

致谢

摘要

第一章 绪论

1.1 研究背景及意义

1.2 国内外研究现状

1.3 论文研究内容

1.4 论文结构安排

第二章 相关理论及技术

2.1 中文命名实体概述

2.2 正则表达式及中文分词技术

2.2.1 正则表达式

2.2.2 中文分词技术概述

2.2.3 隐马尔可夫模型

2.2.4 最大熵模型

2.3 OpenSSL身份认证开发工具

第三章 文档匿名化系统详细设计

3.1 系统架构

3.2 医疗文本匿名化

3.2.1 受保护健康信息

3.2.2 年龄处理

3.2.3 联系方式与ID信患处理

3.2.4 日期信息处理

3.2.5 人名信息处理

3.2.6 医疗机构信息处理

3.3 身份认证模块设计

3.4 文件加密传输

3.5 本章小结

第四章 文档匿名化系统具体实现

4.1 文档匿名化的算法测试与模块实现

4.1.1 年龄信息测试

4.1.2 联系方式与ID信息测试

4.1.3 日期信息测试

4.1.4 中文人名测试

4.1.5 医疗机构名测试

4.1.6 文档匿名化模块实现

4.2 身份认证模块的实现

4.2.1 CA认证中心搭建

4.2.2 服务器证书创建

4.2.3 客户端证书申请与吊销

4.3 文件加密传输模块实现

第五章 总结与展望

5.1 总结

5.2 展望

参考文献

作者在硕士研究生期间的科研成果

展开▼

摘要

随着信息技术在医院现代化建设中的不断推广和应用,电子病历系统对患者的整个医疗行为实现了智能化的管理和记录。近年来,电子病历系统数据量呈几何倍数急剧增长,已经成为医疗数据存载的最主要媒介。正因如此,在海量的电子病历医疗数据中挖掘出有价值的医疗知识已经成为人们研究的热点。但是医疗数据在挖掘以前必须先进行匿名化处理,即患者个人隐私信息保护处理,如何在尽可能保护患者隐私不被泄露的同时保持数据完整性成了一大难题,本论文从这一极具现实意义的医疗现状出发,设计开发了一套基于命名实体识别的电子病历文档匿名化系统。
  本论文系统的基本架构包括三个部分:CA身份认证安全服务、受保护健康信息识别模块、医疗文档加密传输服务。CA身份认证能够有效保障网站安全,阻止不合法用户对网站的攻击与数据剽窃。在受保护健康信息的识别中,隐私信息识别的总体召回率与准确率都达到了90%以上,远远高于单人手工检查的平均检出率81%,与双人手工检查的平均检出率94%成绩接近。文档加密传输能够弥补FTP文件传输协议在数据明文传输上的安全缺陷,保障数据机密。本论文的电子病历文档匿名化系统在这三大模块的协同工作下,最终达到了患者隐私保护的目的。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号