首页> 中文学位 >一种基于最小生成树聚类的数据匿名方法
【6h】

一种基于最小生成树聚类的数据匿名方法

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

第1章 绪论

1.1 研究背景及意义

1.2 国内外研究现状

1.3 数据匿名化问题

1.4 论文主要研究内容

1.5 论文组织结构

第2章 相关理论与技术

2.1 攻击模型

2.2 典型的隐私模型

2.3 主流匿名技术

2.4 基于l-多样性模型的匿名算法

2.5 本章小结

第3章 基于最小生成树聚类的数据匿名算法

3.1 本文算法的改进思路

3.2 基于最小生成树聚类的数据匿名算法

3.3 算法实现

3.4 算法的可行性和复杂性分析

3.5 本章小结

第4章 实验与结果分析

4.1 实验环境

4.2 实验内容及方案

4.3 实验结果及分析

4.4 本章小结

结论

参考文献

攻读硕士学位期间发表的论文和取得的科研成果

致谢

展开▼

摘要

在信息技术迅猛发展,信息化办公越来越普及的今天,大量个人信息被政府部门、商业机构或个人等存储和发布。基于对这些数据信息的分析能够做出归纳性的推理,人们运用挖掘出的潜在模式,创造了巨大的便利。然而,原始的数据往往包含敏感信息,发布这类数据会侵犯个体隐私。这就引发了对数据发布和共享中隐私保护问题的探索,旨在寻找一种好的方案,一方面保留数据的效用,一方面适当损失原始数据的某些信息以确保数据的安全性,从而达到保护数据安全与保留数据价值之间的良好平衡。本文对当前数据发布隐私保护中的隐私模型和主流技术等进行分析、研究,提出了一种新的匿名方案及算法,主要研究内容及工作如下:
  本文首先对隐私保护中的匿名化进行了研究,在已有的基于聚类的l-多样性模型的基础上,提出了一种基于最小生成树聚类的数据匿名方法。由于最小生成树算法采用了贪心算法,因此在对生成的各聚类匿名化后数据能保留较高的数据效用,同时在构建最小生成树和聚类两个阶段针对具体问题采用了能有效降低时间复杂度的方法。并且,文中对敏感属性中的数值型和分类型数据分别给出了各自灵活的概化策略;在定义信息损失时,巧妙地选择数据在概化前后准标识符属性值的不确定性程度来量化的表示。最后通过实验,验证该方法能够在满足数据共享中隐私要求的情况下,完成匿名化,同时采用该方法进行匿名所造成的信息损失较小,尽可能多地保留数据效用。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号