首页> 中国专利> 一种车联网位置隐私保护算法性能评估方法及系统

一种车联网位置隐私保护算法性能评估方法及系统

摘要

本发明公开了一种车联网位置隐私保护算法性能评估方法及系统。该方法包括:采用待评估位置隐私保护算法对真实位置进行处理,得到匿名位置;计算真实位置与匿名位置之间的量化值以及匿名参量的平均化处理值;量化值包括融合距离、杰卡德相似度和海林格散度;基于真实位置、匿名位置、量化值和匿名参量的平均化处理值,采用信息增益法和熵权法计算权重值;权重值包括量化值的权重和匿名参量的平均化处理值的权重;基于量化值、匿名参量的平均化处理值和权重值计算待评估位置隐私保护算法的隐私保护度评估值和位置服务质量评估值。本发明能对多种车联网位置隐私保护算法进行评估,适应范围广。

著录项

  • 公开/公告号CN112861176A

    专利类型发明专利

  • 公开/公告日2021-05-28

    原文格式PDF

  • 申请/专利权人 兰州理工大学;

    申请/专利号CN202110155257.4

  • 申请日2021-02-04

  • 分类号G06F21/62(20130101);G06F16/215(20190101);G06F16/29(20190101);H04W4/30(20180101);H04W12/02(20090101);

  • 代理机构11569 北京高沃律师事务所;

  • 代理人刘凤玲

  • 地址 730050 甘肃省兰州市七里河区兰工坪路287号

  • 入库时间 2023-06-19 11:08:20

说明书

技术领域

本发明涉及车联网(Internet of Vehicles,IoV)安全领域,特别是涉及一种车联网位置隐私保护算法性能评估方法及系统。

背景技术

车联网代表了以云计算为支撑的车辆自组网向物联网范式的演变,由在道路上行驶的具有感知和通信能力的汽车、路边通信单元以及后端服务器共同构成。基于位置服务(Location Based Services,LBS)是通过电信移动运营商的无线电通讯网络或GPS等外部定位方式获取移动终端用户的位置信息,在地理信息系统平台的支持下,为用户提供相应服务的一种增值业务。LBS通常需要车载用户上报连续路段位置信息,当车辆处于开放的物理空间,驾驶人身份信息、车牌号、位置和行程等隐私的泄露可能会给司机与乘客的生命财产安全带来威胁。评价主体、评价对象和评价尺度组合的多样性决定了评价指标体系的不唯一性,目前存在的位置隐私保护算法性能评估指标量化方法主要是进行安全态势分级,从数据的准确性、完整性和可用性、能耗等角度进行分析。这类方法大多都只针对特定的应用、攻击模型(如重放攻击、消息修改和生成攻击、否认攻击、模拟攻击、位置跟踪攻击等)和隐私威胁,很难被泛化,在经典算法及其改进算法的评估上缺乏普遍适用性,无法对多种车联网位置隐私保护算法进行评估,采用最优的车联网位置隐私保护算法实现位置隐私保护。

发明内容

基于此,有必要提供一种车联网位置隐私保护算法性能评估方法及系统,能对多种车联网位置隐私保护算法进行评估,适应范围广,从而提高车联网位置隐私的安全性。

为实现上述目的,本发明提供了如下方案:

一种车联网位置隐私保护算法性能评估方法,包括:

获取用户实体的真实位置;

采用待评估位置隐私保护算法对所述真实位置进行处理,得到匿名位置;

计算所述真实位置与所述匿名位置之间的量化值以及匿名参量的平均化处理值;所述量化值包括融合距离、杰卡德相似度和海林格散度;

基于所述真实位置、所述匿名位置、所述量化值和所述匿名参量的平均化处理值,采用信息增益法和熵权法计算权重值;所述权重值包括所述量化值的权重和所述匿名参量的平均化处理值的权重;

基于所述量化值、所述匿名参量的平均化处理值和所述权重值计算所述待评估位置隐私保护算法的评估结果;所述评估结果包括隐私保护度评估值和位置服务质量评估值。

可选的,所述获取用户实体的真实位置,具体包括:

获取用户实体的原始位置数据;

对所述原始位置数据进行数据清洗,将所述原始位置数据中的二维位置坐标确定为用户实体的真实位置。

可选的,所述计算所述真实位置与所述匿名位置之间的量化值以及匿名参量的平均化处理值,具体包括:

计算所述真实位置与所述匿名位置之间的马氏距离和欧式距离;

计算所述匿名位置的相关系数矩阵;

由所述马氏距离、所述欧式距离和所述相关系数矩阵确定所述真实位置与所述匿名位置之间的融合距离;

基于相似度量化法,计算所述真实位置与所述匿名位置之间的杰卡德相似度;

确定所述真实位置的概率分布与所述匿名位置的概率分布;

基于散度量化法,由所述真实位置的概率分布与所述匿名位置的概率分布计算所述真实位置与所述匿名位置之间的海林格散度;

基于规模量化法,计算匿名参量的平均化处理值;所述匿名参量包括匿名集用户和匿名区域大小。

可选的,所述基于所述真实位置、所述匿名位置、所述量化值和所述匿名参量的平均化处理值,采用信息增益法和熵权法计算权重值,具体包括:

对所述量化值和所述匿名参量的平均化处理值进行归类赋值,生成评价信息矩阵,并确定所述评价信息矩阵中各指标的指标类型;所述指标类型包括正向指标和逆向指标;

采用熵值法计算所述评价信息矩阵中各指标类型的熵值;

基于所述真实位置与所述匿名位置,采用信息增益法计算所述待评估位置隐私保护算法的隐私增益;

由所述熵值和所述隐私增益计算所述评价信息矩阵中各指标类型的权重。

可选的,所述基于所述量化值、所述匿名参量的平均化处理值和所述权重值计算所述待评估位置隐私保护算法的评估结果,具体包括:

将所述评价信息矩阵中的正向指标与相应指标类型的权重加权求和,得到所述待评估位置隐私保护算法的隐私保护度评估值;

将所述评价信息矩阵中的逆向指标与相应指标类型的权重加权求和,得到所述待评估位置隐私保护算法的位置服务质量评估值。

本发明还提供了一种车联网位置隐私保护算法性能评估系统,包括:

数据获取模块,用于获取用户实体的真实位置;

匿名模块,用于采用待评估位置隐私保护算法对所述真实位置进行处理,得到匿名位置;

算法性能指标量化模块,用于计算所述真实位置与所述匿名位置之间的量化值以及匿名参量的平均化处理值;所述量化值包括融合距离、杰卡德相似度和海林格散度;

指标量化值定权模块,用于基于所述真实位置、所述匿名位置、所述量化值和所述匿名参量的平均化处理值,采用信息增益法和熵权法计算权重值;所述权重值包括所述量化值的权重和所述匿名参量的平均化处理值的权重;

算法综合评判模块,用于基于所述量化值、所述匿名参量的平均化处理值和所述权重值计算所述待评估位置隐私保护算法的评估结果;所述评估结果包括隐私保护度评估值和位置服务质量评估值。

可选的,所述数据获取模块,具体包括:

原始数据获取单元,用于获取用户实体的原始位置数据;

筛选单元,用于对所述原始位置数据进行数据清洗,将所述原始位置数据中的二维位置坐标确定为用户实体的真实位置。

可选的,所述算法性能指标量化模块,具体包括:

第一计算单元,用于计算所述真实位置与所述匿名位置之间的马氏距离和欧式距离;

第二计算单元,用于计算所述匿名位置的相关系数矩阵;

融合距离计算单元,用于由所述马氏距离、所述欧式距离和所述相关系数矩阵确定所述真实位置与所述匿名位置之间的融合距离;

相似度计算单元,用于基于相似度量化法,计算所述真实位置与所述匿名位置之间的杰卡德相似度;

概率分布确定单元,用于确定所述真实位置的概率分布与所述匿名位置的概率分布;

散度计算单元,用于基于散度量化法,由所述真实位置的概率分布与所述匿名位置的概率分布计算所述真实位置与所述匿名位置之间的海林格散度;

匿名参量平均化单元,用于基于规模量化法,计算匿名参量的平均化处理值;所述匿名参量包括匿名集用户和匿名区域大小。

可选的,所述指标量化值定权模块,具体包括:

信息矩阵生成单元,用于对所述量化值和所述匿名参量的平均化处理值进行归类赋值,生成评价信息矩阵,并确定所述评价信息矩阵中各指标的指标类型;所述指标类型包括正向指标和逆向指标;

熵值计算单元,用于采用熵值法计算所述评价信息矩阵中各指标类型的熵值;

隐私增益计算单元,用于基于所述真实位置与所述匿名位置,采用信息增益法计算所述待评估位置隐私保护算法的隐私增益;

指标权重计算单元,用于由所述熵值和所述隐私增益计算所述评价信息矩阵中各指标类型的权重。

可选的,所述算法综合评判模块,具体包括:

隐私保护度评估单元,用于将所述评价信息矩阵中的正向指标与相应指标类型的权重加权求和,得到所述待评估位置隐私保护算法的隐私保护度评估值;

位置服务质量评估单元,用于将所述评价信息矩阵中的逆向指标与相应指标类型的权重加权求和,得到所述待评估位置隐私保护算法的位置服务质量评估值。

与现有技术相比,本发明的有益效果是:

本发明提出了一种车联网位置隐私保护算法性能评估方法及系统,采用待评估位置隐私保护算法对真实位置进行处理,得到匿名位置;计算真实位置与匿名位置之间的融合距离、杰卡德相似度、海林格散度量化值和匿名参量的平均化处理值;采用信息增益法和熵权法计算上述四个指标对应的权重值;基于权重值计算待评估位置隐私保护算法的隐私保护度评估值和位置服务质量评估值。本发明具有普遍适用性,解决了现有的评估方法不足以支撑车辆的高速移动、系统的储存负担等性能要求,且指标大多都针对特定的应用、攻击模型和隐私威胁的问题,并且解决了单一距离度量方法带来的局限,本发明的方法或系统,适用于多种车联网位置隐私保护算法的评估,从而选出性能最优的位置隐私保护算法,提高车联网位置隐私的安全性。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例提供的基于LBS的车联网体系框架图;

图2为本发明实施例提供的车联网位置隐私保护算法性能评估方法的流程图;

图3为本发明实施例提供的隐私保护度和服务质量的对应评估流程图;

图4为本发明实施例提供的车联网位置隐私保护算法性能评估系统的结构图;

图5为本发明实施例提供的PPA、P2P-IS-CA-HL和SCAPGID三种k-匿名衍生出的位置隐私保护算法进行评估的评估结果示意图;其中,图5(a) 为对三种k-匿名衍生出的位置隐私保护算法进行评估时,隐私保护度随设置车辆数目变化示意图;图5(b)为对三种k-匿名衍生出的位置隐私保护算法进行评估时,服务质量随设置车辆数目变化示意图;

图6为本发明实施例提供的对PPA、P2P-IS-CA-HL和SCAPGID三种k- 匿名衍生出的位置隐私保护算法进行评估时,匿名成功率随匿名度k变化示意图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明的目的是提供一种车联网位置隐私保护算法性能评估方法及系统,解决传统评估算法只适用于单一隐私保护算法评估的局限,为后续研究人员择优和改进合适量级隐私保护方案提供理论基础和技术支撑,提高车联网位置隐私的安全性。

为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。

图1为本发明实施例提供的基于LBS的车联网体系框架图。参见图1,构建的隐私保护算法性能评估模型包括车联网体系和安全结构框架,该模型同样遵循移动自组网络(Mobile Ad-hoc Networks,MANETs)的感知层、网络层和应用层三层体系构架。

其中,感知层面临的安全威胁为:环境中布置的用于数据采集的感知节点易被改装受到恶意利用,窃取通信车辆的位置隐私和其他用户敏感信息,通常采用对节点的身份认证和安全管理等机制避免隐私的泄露;多传感器数据融合则是进行数据真实性验证和异常节点检测等。

网络层面临的安全威胁为:主要分为接入、传输和业务三个模块。本发明暂不讨论恶意节点攻击部分的接入安全隐患,传输层负责有效传输采集到的数据信息,需保证信息的准确性、完整性和可用性;兴趣点查询等位置服务则属于业务层范畴。

应用层面临的安全威胁为:涉及大量用户隐私信息的存储和计算,多种服务种类的背后需要诸如大数据处理、业务管理控制等技术支持。

本发明构建的车联网体系与隐私保护技术评估指标度量借鉴MANETs中的三层架构模型,可充分对现有云服务计算下的指标加以利用。并从权威的国家标准化细则、cc标准、BS7799标准以及ISO/IEC21827-2002(SSE-CMM) 等网络安全的风险评估标准入手,从上述三层体系构架中分别析出具有普适性的车联网隐私保护算法性能评估指标,即隐私保护度、服务质量和开销。本实施例以隐私保护度和服务质量作为评价指标进行评估。

本实施例提供的车联网位置隐私保护算法性能评估方法,初始化时先使数据通过待评估位置隐私保护算法匿名;然后,基于距离、相似度、散度和规模四种量化方法进行隐私保护算法性能指标的量化;再对量化值进行定权,最终得到算法的综合评判值。图2为本发明实施例提供的车联网位置隐私保护算法性能评估方法的流程图。参见图2,本实施例的车联网位置隐私保护算法性能评估方法,具体包括:

步骤101:获取用户实体的真实位置。真实位置X←[x

所述步骤101,具体包括:

获取用户实体的原始位置数据;对所述原始位置数据进行数据清洗(数据筛选),将所述原始位置数据中的二维位置坐标确定为用户实体的真实位置。

步骤102:采用待评估位置隐私保护算法对所述真实位置进行处理,得到匿名位置。匿名位置Y←[y

步骤103:计算所述真实位置与所述匿名位置之间的量化值以及匿名参量的平均化处理值;所述量化值包括融合距离、杰卡德相似度和海林格散度。

所述步骤103,具体包括:

1、基于距离(Distance,D)的方法进行量化

(1)计算所述真实位置X与所述匿名位置Y之间的马氏距离和匿名位置 Y的相关系数矩阵,如公式(1)~(3)所示。

公式(1)~(2)中,MD(X,Y)为真实位置X与所述匿名位置Y之间的马氏距离;Cov(X,Y)为真实位置X与所述匿名位置Y之间的协方差矩阵;真实位置X作为聚类样本;匿名位置Y作为样本真实位置空间集,也叫马氏空间;

其中,公式(3)中的ρ

由相关系数ρ

(2)计算所述真实位置X与所述匿名位置Y之间的欧式距离,如公式(4) 所示。

采用所述欧氏距离的方法分析个体间多维数值大小中的差异,需要保证各维度指标在相同的刻度级别,令X、Y分别为车辆节点的真实位置和模糊位置 (匿名位置),并明确位置坐标x

(3)由所述马氏距离、所述欧式距离和所述相关系数矩阵确定所述真实位置与所述匿名位置之间的融合距离,如公式(5)~(6)所示。

d

其中,公式(5)~(6)中MD(X,Y)为向量X到向量Y的马氏距离;ED(X,Y)为向量X到向量Y的欧氏距离;C

2、基于相似度(Similarity,S)的方法进行量化

基于相似度量化法,计算所述真实位置与所述匿名位置之间的杰卡德 (Jaccard)相似度。具体为:

计算数据集X到数据集Y的Jaccard相似度,将多个位置点组成的集合看作一条轨迹,利用轨迹重合度进行评估,比较有限样本集之间的相似性与差异性,且Jaccard相似度系数越大表明样本相似度越高,Jaccard相似系数公式如 (7)所示。

3、基于散度(F-divergence,F)的方法进行量化

(1)确定所述真实位置的概率分布与所述匿名位置的概率分布。

(2)基于散度量化法,由所述真实位置的概率分布与所述匿名位置的概率分布计算所述真实位置与所述匿名位置之间的海林格(Hellinger)散度,通过同一属性值在原始数据集和匿名数据集中准确定位到某条记录的概率差值,具体为:

通过对可度量性、收敛性和灵敏度的比较,计算Hellinger散度,以此作为评估的散度函数;f-散度定义式通常转变为离散形式,对于离散分布的Hel 散度,其定义式如公式(8)所示。

公式(8)中的参数可通过f-散度的基础定义解释,即假设概率空间Ω中有2个概率分布P={p

本实施例中,采用公式(8)计算海林格散度。

4、基于所述规模(Scale,S)的方法进行量化

基于规模量化法,计算匿名参量的平均化处理值;所述匿名参量包括匿名集用户(或轨迹数目)和匿名区域大小等参量,根据待评估算法的实际情况将这些位置匿名化程度以外的客观指标参量进行编号,即j=1,2,...。其基于平均化的处理方法,结合线性无量纲化的思想对各项基础指标进行统一处理,得到 0~1区间内的分布值

基于平均化的处理方法,公式如(10)所示。

所述公式(10)中C

步骤104:基于所述真实位置、所述匿名位置、所述量化值和所述匿名参量的平均化处理值,采用信息增益法和熵权法计算权重值;所述权重值包括所述量化值的权重和所述匿名参量的平均化处理值的权重。

为了更加清晰的说明问题,首先,为信息熵和隐私增益如下定义:

定义1:N个有相同概率的消息,每个消息的概率p均为1/N,则每个消息所携带的信息量如公式(11)所示。

-logp=log(1/N) (11)

定义2:对于给定的概率分布P={p

当P取(0.5,0.5)时H(P)为1,若P取(1,0)则H(P)为0,可以看出通过信息熵对权重公式进行调整可以克服权重计算中忽略类内分布的缺陷。

当对于P,在获得M之前的结果不确定性为H(P),在获得信息M之后的结果不确定性为H(P|M),则信息M中关于P的信息量为: IG(P,M)=H(P)-H(P|M),IG表示信息增益。

定义3:原始位置信息经过匿名处理后隐私提升的程度,即原始样本集和匿名样本集中通过同一属性值能准确定位到某条记录的概率差值。本发明中应用的信息增益(Information Gain,IG)计算公式如(13)所示。

所述公式(13)中,IG(L,k)表示隐私保护度为k的位置隐私保护算法加密处理后的车辆终端v

对于隐私保护度k来说,其信息增益值即整个评估系统在它存在和不存在时的信息量差值(此即“隐私增益”)。若有它,则系统熵等同于公式(11);若没有它,则可认为待评估算法中包含k,k值固定无法改变,故此时可以认为它的取值有两种:k表示k出现;

p(k)表示隐私保护度k在数据集中出现的概率;p(l)表示位置坐标变量l 在总查询调用过程中出现的概率;p(l|k)表示包含k并且属于坐标匿名类隐私算法的条件概率;

定义4:基于隐私增益和信息熵的权重计算公式如(14)所示。

w

公式(14)中w

所述步骤104,具体包括:

1、对所述量化值和所述匿名参量的平均化处理值进行归类赋值,生成评价信息矩阵(r

将所述量化值、所述匿名参量的平均化处理值分别进行归类赋值,a←d

2、采用熵值法计算所述评价信息矩阵中各指标类型的熵值,具体为:

(1)对评价信息矩阵中的各指标根据公式(15)~(16)进行归一化处理。若评价信息矩阵中的指标r

对于正向指标

对于逆向指标

其中,

(2)计算第i行j列的指标的比重,如公式(17)所示。

(3)基于熵值法计算第i行指标的熵值,如公式(18)所示。

其中,公式(17)~(18)中,

本实施例中,评价信息矩阵为

3、基于所述真实位置与所述匿名位置,采用信息增益法计算所述待评估位置隐私保护算法的隐私增益;隐私增益的计算公式如公式(13)所示。

4、由所述熵值和所述隐私增益计算所述评价信息矩阵中各指标类型的权重。权重的计算公式如公式(14)所示,从而得到正向指标的权重w

步骤105:基于所述量化值、所述匿名参量的平均化处理值和所述权重值计算所述待评估位置隐私保护算法的评估结果;所述评估结果包括隐私保护度评估值和位置服务质量评估值。

所述步骤105,具体包括:

将所述评价信息矩阵中的正向指标与相应指标类型的权重加权求和,得到所述待评估位置隐私保护算法的隐私保护度评估值E

图3为本发明实施例提供的隐私保护度和服务质量的对应评估流程图。参见图3,衡量个体间差异的量化方法主要包括基于距离、相似度、散度和规模的量化;通过比较分析选择:融合距离、Jaccard相似度、Hellinger散度和平均化处理法对差异进行定量描述。

基于图1性能评估方法框架中的所述步骤101~103,进行步骤104前完成指标正逆向区分的操作;将量化结果分别进行归类赋值,a←d

本发明还提供了一种车联网位置隐私保护算法性能评估系统,图4为本发明实施例提供的车联网位置隐私保护算法性能评估系统的结构图,参见图4,该系统包括:

位置数据处理模块401,用于评估前的准备工作;所述准备工作是指对用户实体位置坐标集合进行数据筛选;验证坐标集合内元素均为二维坐标;将处理完成的数据通过待评估算法获得匿名化后的位置坐标集合。位置数据处理模块401包括:数据获取模块,用于获取用户实体的真实位置;匿名模块,用于采用待评估位置隐私保护算法对所述真实位置进行处理,得到匿名位置。

算法性能指标量化模块402,用于计算所述真实位置与所述匿名位置之间的量化值以及匿名参量的平均化处理值;所述量化值包括融合距离、杰卡德相似度和海林格散度;具体的,算法性能指标量化模块402,度量性能指标的优劣程度;对车联网体系结构中析出的位置隐私评估指标进行探讨,在量化方法上拟采用同一种方法进行量化,应用融合距离、Jaccard相似度、Hellinger散度和平均化处理的方法,并将量化值经过正逆向区分后组成权重矩阵;由此可量化数据的准确性、完整性、可用性以及客观因素对隐私保护度和服务质量的影响。

指标量化值定权模块403,用于基于所述真实位置、所述匿名位置、所述量化值和所述匿名参量的平均化处理值,采用信息增益法和熵权法计算权重值;所述权重值包括所述量化值的权重和所述匿名参量的平均化处理值的权重。具体的,指标量化值定权模块403,进一步完善车联网位置隐私保护算法性能评价指标体系;通过信息熵对权重公式进行调整,克服权重计算中忽略类内分布的缺陷;引入车联网位置隐私增益的概念,即原始位置信息经过匿名处理后隐私提升的程度;考虑到隐私增益和熵权法的各自适用场景进行建模。

算法综合评判模块404,用于基于所述量化值、所述匿名参量的平均化处理值和所述权重值计算所述待评估位置隐私保护算法的评估结果;所述评估结果包括隐私保护度评估值和位置服务质量评估值。具体的,算法综合评判模块 404,对车联网隐私保护算法性能进行综合评判;将上述四项量化方法的结果进行正逆向区分,对原始数据作归一化处理;将指标的信息增益值和权重矩阵相互匹配,计算出隐私保护度和位置服务质量两项评估指标的综合评判值。

作为一种可选的实施方式,所述数据获取模块,具体包括:

原始数据获取单元,用于获取用户实体的原始位置数据。

筛选单元,用于对所述原始位置数据进行数据清洗,将所述原始位置数据中的二维位置坐标确定为用户实体的真实位置。

作为一种可选的实施方式,所述算法性能指标量化模块,具体包括:

第一计算单元,用于计算所述真实位置与所述匿名位置之间的马氏距离和欧式距离。第二计算单元,用于计算所述匿名位置的相关系数矩阵。融合距离计算单元,用于由所述马氏距离、所述欧式距离和所述相关系数矩阵确定所述真实位置与所述匿名位置之间的融合距离。第一计算单元、第二计算单元和融合距离计算单元构成基于距离的量化单元,基于距离的量化单元衡量匿名前后位置坐标间的个体差异,选取欧氏距离和马氏距离加权的融合距离进行量化;融合距离的加权权重,由位置数据处理模块中输出的位置坐标集合,即匿名前后向量之间的相关系数生成的相关系数矩阵决定。

相似度计算单元,用于基于相似度量化法,计算所述真实位置与所述匿名位置之间的杰卡德相似度。具体的,相似度计算单元比较有限样本集之间的相似性与差异性,选取杰卡德相似度,将多个位置点组成的集合看作一条轨迹,利用轨迹重合度进行评估。

概率分布确定单元,用于确定所述真实位置的概率分布与所述匿名位置的概率分布。散度计算单元,用于基于散度量化法,由所述真实位置的概率分布与所述匿名位置的概率分布计算所述真实位置与所述匿名位置之间的海林格散度。概率分布确定单元和散度计算单元构成基于散度的量化单元,基于散度的量化单元通过同一属性值在原始数据集和匿名数据集中准确定位到某条记录的概率差值,选取海林格散度作为评估的散度函数。

匿名参量平均化单元,用于基于规模量化法,计算匿名参量的平均化处理值;所述匿名参量包括匿名集用户和匿名区域大小。具体的,匿名参量平均化单元对各项基础指标进行统一处理,选取匿名集用户或轨迹数目、匿名区域大小等参量进行量化;基于平均化的处理方法,结合线性无量纲化的思想,得到 0~1区间内的分布值。

作为一种可选的实施方式,所述指标量化值定权模块,具体包括:

信息矩阵生成单元,用于对所述量化值和所述匿名参量的平均化处理值进行归类赋值,生成评价信息矩阵,并确定所述评价信息矩阵中各指标的指标类型;所述指标类型包括正向指标和逆向指标。

熵值计算单元,用于采用熵值法计算所述评价信息矩阵中各指标类型的熵值;

隐私增益计算单元,用于基于所述真实位置与所述匿名位置,采用信息增益法计算所述待评估位置隐私保护算法的隐私增益。

指标权重计算单元,用于由所述熵值和所述隐私增益计算所述评价信息矩阵中各指标类型的权重。

作为一种可选的实施方式,所述算法综合评判模块,具体包括:

隐私保护度评估单元,用于将所述评价信息矩阵中的正向指标与相应指标类型的权重加权求和,得到所述待评估位置隐私保护算法的隐私保护度评估值。

位置服务质量评估单元,用于将所述评价信息矩阵中的逆向指标与相应指标类型的权重加权求和,得到所述待评估位置隐私保护算法的位置服务质量评估值。

本发明根据隐私保护度和位置服务质量之间的动态平衡需求,比较分析位置隐私保护经典算法,验证并优化评估指标和策略。本发明性能的优越性可通过以下仿真实验进一步说明:

采用python3编译环境,在CW-KNN、VMware虚拟机上安装Ubuntu,搭建相应的路网环境进行实验仿真。

将sumo中生成的车辆移动模型以trace文件的形式载入到ns-2中获取车辆节点。

通过模拟设有十字路口的共6条双向直线车道,在1500m*1500m的RSU 信号覆盖范围内调整节点分布密度,对车辆行驶过程中的位置隐私保护度及位置服务质量进行讨论。

仿真实验过程分为交通场景和网络通信两部分,相关实验配置参数如表1 所示。

表1

本发明提出的评估方法选取进行仿真的实施例有如下三种:

基于PSSM的改进P2P隐私保护算法(Privacy Preserving Algorithm, PPA);

点对点-信息共享-隐匿区域-历史位置算法(Peer to Peer-InformationSharing-Cloaked Area-Historical Location,P2P-IS-CA-HL);

基于P2P和网格ID的空间隐匿算法(Spatial Cloaking Algorithm Based on P2Pand Grid ID,SCAPGID)进行对比实验。

其中,P2P-IS-CA-HL算法是对匿名区域进行节点信息共享和区域调整方案的算法;SCAPGID算法是用网格划分平面,通过网格的动态扩增和相同网格中的用户协作完成位置匿名的算法。

进一步的,通过分析PPA的有效性和真实性的评估结果对评估算法进行逆向验证。

本发明对实施例PPA、P2P-IS-CA-HL和SCAPGID三种k-匿名衍生出的位置隐私保护算法进行评估时,隐私保护度和服务质量随设置车辆数目变化示意图如图5所示。

在实验中分别比较车辆数目[100,500]以及在[0,1]区间内的隐私保护度和位置服务质量评判值E

通过分析得到,图5的三种隐私保护算法的变化情况符合客观规律和预期效果,验证了本发明的有效性和可用性。

由此可以看出,隐私保护度与位置服务质量两个指标之间存在一定的反比例关系,即无法同时达到最优值,只能根据用户隐私需求和指标中包含的信息量寻找平衡点。

通过计算,在车辆数目处于[200,300]时的隐私增益IG(l,v

实施例P2P-IS-CA-HL的算法综合评判值优于SCAPGID,如表2所示,且除去在样本值极小的情况下,PPA都具有明显的优势性,基本达到了改进需求;

表2

基于同一参数下的交通场景中,车辆数目越多,所形成的匿名区域内的协助邻居节点数目越大,从而提升了PPA算法的匿名成功率。

进一步的,当车辆数目增加到一定规模时,算法的最小匿名区域无法满足匿名保护度,需要通过另两种类型的算法扩增匿名区域面积来使整个通信网络趋于稳定。

本发明对实施例PPA、P2P-IS-CA-HL和SCAPGID三种k-匿名衍生出的位置隐私保护算法进行评估时,匿名成功率随隐私保护度k变化示意图,如图 6所示。

车辆数目设置为200,当k增加时,车辆终端需要招募更多的同伴帮助收集足够的对等体位置信息使它的位置模糊化,PPA中的假名节点和匿名区域的扩增方案能够有效避免网络分区等问题,所以在图中呈稳步上升状态。

本发明提供的车联网位置隐私保护算法性能评估方法及系统,具有如下优点:

(1)本发明设计了统一的性能评估方法和标准,研发出一种具有普遍适用性的评价指标和评价体系对匿名化技术进行客观合理评价。现有隐私评估方法不足以支撑车辆的高速移动、系统的储存负担等性能要求,且指标大多都针对特定的应用、攻击模型和隐私威胁。

(2)本发明解决了单一距离度量方法带来的局限。在车联网高移动性和瞬时性的特性环境下,单独使用欧氏距离作为度量方式可能会造成变量间的量纲的实际含义难以解释、忽视样本的分布情况且无法解释多元数据间的相关性。选用融合距离对指标进行量化,能够同时兼顾特征变量的相关性和独立性。

(3)本发明为能够高效地实现动态评估。位置服务的优劣与位置隐私保护的质量几乎呈反比例关系,根据不同上下文环境下用户的隐私保护需求对性能指标权重进行有针对性地调节,使隐私保护算法适应不同量级下的隐私保护要求。

(4)本发明构建科学、合理的数学模型,并根据定量描述的特征进行多重嵌套,实现优势互补。对隐私保护度和位置服务质量两项具有相关性的评估指标进行一一对应的量化,既体现了两者之间的比例关系,又方便进行一致化的量级调节。

本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。

本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号