一种基于最小生成树聚类的数据匿名方法

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

在信息技术迅猛发展,信息化办公越来越普及的今天,大量个人信息被政府部门、商业机构或个人等存储和发布。基于对这些数据信息的分析能够做出归纳性的推理,人们运用挖掘出的潜在模式,创造了巨大的便利。然而,原始的数据往往包含敏感信息,发布这类数据会侵犯个体隐私。这就引发了对数据发布和共享中隐私保护问题的探索,旨在寻找一种好的方案,一方面保留数据的效用,一方面适当损失原始数据的某些信息以确保数据的安全性,从而达到保护数据安全与保留数据价值之间的良好平衡。本文对当前数据发布隐私保护中的隐私模型和主流技术等进行分析、研究,提出了一种新的匿名方案及算法,主要研究内容及工作如下:
　　本文首先对隐私保护中的匿名化进行了研究,在已有的基于聚类的l-多样性模型的基础上,提出了一种基于最小生成树聚类的数据匿名方法。由于最小生成树算法采用了贪心算法,因此在对生成的各聚类匿名化后数据能保留较高的数据效用,同时在构建最小生成树和聚类两个阶段针对具体问题采用了能有效降低时间复杂度的方法。并且,文中对敏感属性中的数值型和分类型数据分别给出了各自灵活的概化策略;在定义信息损失时,巧妙地选择数据在概化前后准标识符属性值的不确定性程度来量化的表示。最后通过实验,验证该方法能够在满足数据共享中隐私要求的情况下,完成匿名化,同时采用该方法进行匿名所造成的信息损失较小,尽可能多地保留数据效用。

著录项

作者
王珊;
展开▼
作者单位

哈尔滨工程大学;

展开▼
授予单位哈尔滨工程大学;
学科软件工程
授予学位硕士
导师姓名杨静,肖宏;
年度 2013
页码
总页数
原文格式 PDF
正文语种中文
中图分类数据安全;
关键词
数据发布; 隐私保护; 匿名方法; 最小生成树聚类; 贪心算法;

相似文献

中文文献
外文文献
专利

1. 一种基于聚类的数据匿名方法 [J] . 王智慧 ,许俭 ,汪卫 . 软件学报 . 2010,第004期
2. 一种基于网格和最小生成树的数据流聚类算法 [J] . 王海波 ,王宪鹏 ,王芳 . 计算机系统应用 . 2011,第002期
3. 一种基于逆聚类的个性化隐私匿名方法 [J] . 王波 ,杨静 . 电子学报 . 2012,第005期
4. 基于聚类的快速数据流匿名方法 [J] . 郭昆 ,张岐山 . 软件学报 . 2013,第008期
5. 基于杂度增益与层次聚类的数据匿名方法 [J] . 熊平 ,朱天清 . 计算机研究与发展 . 2012,第007期
6. 一种最小生成树聚类算法 [C] . 王小乐 ,刘青宝 ,陆昌辉 . 第二届全国智能信息处理学术会议 . 2009
7. 基于最小生成树思想改进后的KK-MEANS聚类方法研究及其在地震数据集中的应用 [A] . 刘志才 . 2009

一种基于最小生成树聚类的数据匿名方法

目录

摘要

著录项

相似文献

相关主题

期刊订阅