首页> 中文学位 >基于编辑距离的序列聚类算法及其在临床异常检测中的应用
【6h】

基于编辑距离的序列聚类算法及其在临床异常检测中的应用

代理获取

目录

声明

第一章 绪论

1 .1 研究背景和意义

1 .2 国内外研究现状

1 .3 论文主要研究内容

1 .4 论文的组织形式

第二章 相关概念和技术

2 .1 医疗异常的传统检测方法

2 .2 异常检测

2 .3 聚类算法分析

2 .4 本章小结

第三章 领域分析及数据预处理

3 .1 领域分析

3 .2 临床行为数据预处理

3 .3 临床行为序列生成

3 .4 本章小结

第四章 临床行为序列聚类算法

4 .1 问题分析

4 .2 基于编辑距离的二分K均值聚类算法

4 .3 实验结果及分析

4 .4 本章小结

第五章 临床异常行为检测模型

5 .1 检测模型的工作机制

5 .2 临床行为序列到正常轮廓的距离度量

5 .3 临床序列异常检测

5 .4 本章小结

第六章 临床异常检测原型系统的设计

6 .1 原型系统分析

6 .2 核心功能类的设计

6 .3 系统主要功能的实现

6 .4 本章小结

第七章 总结与展望

7 .1 总结

7 .2 展望

参考文献

致谢

攻读硕士期间发表的学术论文及科研成果

展开▼

摘要

目前,医疗保险的服务范围和面对的人群不断扩大,伴随而生的医疗欺诈及违规行为屡见不鲜。由于医疗领域高度的专业性以及医保交易的三方(医保机构、医疗单位、患者)存在着信息不对称,医疗异常行为对医保机构而言具有相当的隐蔽性。为此,研究临床异常行为的发现方法,对规范医疗秩序、预防医疗欺诈行为的发生具有重要的理论研究和实际应用价值。
  结合国内外的研究成果,本文分析了临床行为序列的时序性和自然凝聚性的特点,利用二分 K均值算法对正常临床行为序列数据集进行聚类,将得到的簇作为正常轮廓,针对临床医疗事件异常行为的特征,研究了基于距离的异常检测技术,实现了临床异常检测原型系统,用以发现临床医疗数据中潜藏的异常行为。本文的主要工作如下:
  (1)提出基于整体相似度匹配的二分K均值序列聚类算法(PSC lu)。PSC lu对二分 K均值算法的距离计算方式进行优化,采用编辑距离作为簇间序列相似性度量的函数,结合编辑距离的上下界、等长前缀子序列的编辑距离计算以及簇的质心近似求解方法,过滤部分编辑距离的计算,降低二分 K均值算法的时间复杂度,最终快速聚类生成正常临床行为序列的簇。
  (2)提出待检序列到簇质心的相似度计算方法。为更有效的发现异常的临床行为序列,在比较用药事件相似度时,研究了在药效相似性的基础上加入了药物用量和价格相似性的比较,并根据医疗行为重要性的差异,采用了加权编辑距离算法(WED)计算待检序列与簇质心的相似度。
  (3)构建异常检测模型。利用PSClu算法对序列聚类生成正常簇,并以这些簇作为正常轮廓;引入WED算法计算待检序列与簇质心的相似度,以待检序列与正常序列簇质心的差异程度作为判断是否存在异常的依据,构建包含数据预处理、聚类生成、相似性判断等机制的异常检测模型。
  (4)设计并实现了原型系统,基于异常检测模型,对原型系统的页面、服务层、持久层等进行了实现。通过某医疗机构的临床行为数据,对该异常检测系统的性能进行分析和评价。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号