首页> 中国专利> 一种中心式认知无线网络中基于嵌套博弈的信任管理方法

一种中心式认知无线网络中基于嵌套博弈的信任管理方法

摘要

本发明公开一种中心式认知无线网络中基于嵌套博弈的信任管理方法,其方法步骤为:建立嵌套博弈模型、感知频谱状态、次级用户选择感知阶段策略并上传感知数据、数据中心融合感知数据、次级用户选择传输阶段策略、选用滑动窗口值、计算历史信誉值和本次基于策略的信誉值、计算博弈第一阶段和第二阶段的效用函数、根据博弈理论优化效用函数求得最优策略、更新信任函数值、根据信任值排序分配频谱。本发明着眼整个认知循环的构成,应用嵌套博弈理论和边际效用理论,可以有效抵抗恶意攻击,将认知过程分为感知阶段和数据传输阶段,次级用户在不同时间内的决策来评价其信誉值。次级用户之间为获得频谱进行博弈,剔除恶意用户,使得整个系统趋于良好。

著录项

  • 公开/公告号CN106790213A

    专利类型发明专利

  • 公开/公告日2017-05-31

    原文格式PDF

  • 申请/专利权人 西安电子科技大学;

    申请/专利号CN201710014916.6

  • 发明设计人 裴庆祺;冷昊;马立川;肖阳;

    申请日2017-01-10

  • 分类号H04L29/06;H04W12/00;H04W16/18;

  • 代理机构西安长和专利代理有限公司;

  • 代理人黄伟洪

  • 地址 710071 陕西省西安市太白南路2号西安电子科技大学

  • 入库时间 2023-06-19 02:20:31

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2020-01-10

    授权

    授权

  • 2017-06-23

    实质审查的生效 IPC(主分类):H04L29/06 申请日:20170110

    实质审查的生效

  • 2017-05-31

    公开

    公开

说明书

技术领域

本发明涉及通信技术领域,尤其涉及一种中心式认知无线网络中基于嵌套博弈的信任管理方法。

背景技术

认知无线网络允许非授权用户在不干扰授权用户的前提下,伺机利用空闲谱,从而有效提高频谱资源的利用率,满足更多用户的需求。认知无线网络的这些新功能又引入了许多新型网络攻击,比如:感知数据篡改攻击、学习威胁、干扰主用户攻击、合伙欺骗等。而传统的加密技术、认证技术、访问控制技术等安全策略又无法解决这些来自认知无线网络内部的软安全威胁。信任管理机制是目前公认的解决认知无线网络软安全威胁最有效的策略和方法之一。

高效信任管理机制是保障认知无线网络安全的前提和基础,准确可靠的信任值更新方案是频谱分配的可靠保证。目前已被提出的认知无线电网络中信任管理机制大多数都是为了解决SSDF攻击等局部问题提出的。因此提出一种着眼于整个认知循环,将认知过程中次级用户行为的每一步都作为评价其信誉值得一部分,对判定系统中用户的良莠以及公平的分配频谱,对于整个系统剔除恶意用户,实现良性循环非常必要。而在认知环境下,次级用户为获得频谱所做出的努力其本质上是一种博弈,因此将博弈理论应用于信任管理方案,并抵抗恶意攻击对认知无线电安全的研究有重要的意义。

近年来,国内外学者对认知无线点网络信任机制进行了许多研究和探索,也大多数针对单一角色的需求,很少结合认知无线电网络的特点,从整体需求出发,进行信任管理机制的研究,并且这些研究还处于初步阶段,虽然有一些研究针对无线网络的信任设计有一些研究,还没有学者设计和提出完整的信任管理机制方法和体系。

Parveen Kailgineedi等人提出了一种平均组合的数据融合算法,利用信任因子来参与频谱决策,这样大大提高了系统的决策性能。但是,该算法只能识别那些上传的感知结果一直是“授权用户正在使用”或者“授权用户当前不在”的恶意用户,所以该算法在某种程度上有一些缺陷。Sazia Parvin在随后的文章中还把信任作为认知无线网络的安全通信认证,其优点在于证书机构可以提供认证、不可否认性、访问控制等安全保障,不可忽视的是信誉值高的次级用户充当了证书机构,所以当这个次级用户被发现具有不良行为时,其损失是巨大的,当证书失效有备用证书机构替代时,之前存储的信誉信息就会丢失,网络进入重启状态。

发明内容

有鉴于现有技术的上述缺陷,本发明所要解决的技术问题是提供一种中心式认知无线网络中基于嵌套博弈的信任管理方法,该方法为在中心式式认知无线网络的框架下基于嵌套博弈决策理论的信任管理方案和信任评价融合机制。在该方案下可以实现最大限度公平分配频谱,且可以抵御恶意用户攻击,并通过学习使得系统不断趋于良性循环。

为实现上述目的,本发明提供了一种中心式认知无线网络中基于嵌套博弈的信任管理方法,其特征在于,包括以下步骤:

步骤一、建立模型:

将中心式认知无线网络中次用户的活动分为感知阶段和传输阶段两个时期,并根据两个时段的次级用户的行为建立博弈模型;

步骤二、次级用户感知频谱状态信息:

次级用户对于参与频谱分配的次级用户,通过能量感知的方式感知目前频谱空洞信息;

步骤三、次级用户上传感知信息:

次级用户将感知到的频谱状态信息上传到数据中心DC,上传信息的准确性概率即为用户的博弈策略,策略集为

上传的频谱状态信息表示为本地频谱表,记录次用户检测频段结果,表示为1*m的矩阵,m为次用户所检测到的频段的数目,矩阵中用1表示该处频谱空洞,0表示该处频谱忙碌不可用;

步骤四、数据中心DC对于频谱状态进行数据收集融合:

频谱状态信息的融合方式为次级用户上传的频谱状态的均值,其大于0.8则认为该处频谱空洞;

步骤五、数据中心更新感知阶段信任值:

数据中心根据各个次级用户上传的感知数据,对该阶段的用户行为进行信任值的更新,感知的评价值表示为函数的计算公式是Fi代表每一个次级用户i其物理感知准确率我们假设次级用户的感知准确率服从泊松分布,均值为λ;

步骤六、数据传输阶段,次级用户进行频谱传输:

获得信道的次级用户利用信道对频谱进行传输,并作出该阶段的博弈决策,其策略内容为传输阶段用户良好利用频谱的概率取值范围为

步骤七、根据其传输阶段的表现,数据中心对该阶段的用户行为进行信任值的更新,本次传输的信誉值变化为α为权重因子,根据对于此次传输的重视程度人为设定,历史传输信誉值为TQi,其中

其中TNi为传输正常的次数,TTi为传输的总次数;

步骤八、信誉值计算;

步骤九、计算嵌套博弈效用函数和优化迭代:

步骤十、根据频谱分配方案进行频谱分配,根据信誉值的大小进行排序,按顺序分配频谱;

步骤十一、更新传输阶段用户信任值;

步骤十二、系统在多次频谱分配后剔除恶意用户,用户行为通过相互学习趋于良好,并使得整个系统趋于良性循环。

进一步地,所述步骤八包括:

第一步、滑动窗口选择:

系统随机生成滑动窗口Win1,其中滑动窗口的大小代表了在计算历史信誉值时选取多少次的值作为历史信誉值来计算;

第二步、计算滑动窗口时间内的信誉值:

根据滑动窗口的大小,计算滑动窗口时间内次级用户的历史感知信誉值

SAi代表第i个用户的感知正确率,STi代表在Win1中用户i参与频谱感知并上传感知结果数据的总次数,SRi代表正确感知的信道个数,uks_d和uko_d分别是用户的感知时长和在线时长,感知时长指节点从入网来参与的总感知次数,在线时长指节点从入网来经历的总感知次数和历史传输信誉值;

第三步:根据次级用户选择的策略计算该次的直接感知信誉值和直接传输信誉值;

第四步:对历史感知数据和直接感知数据进行融合,为了实现系统的慢升快降,加入边际函数做为参数,

进一步地,所述步骤九包括:

第一步、通过计算和融合感知阶段和传输阶段的信誉值计算出博弈第一阶段和第二阶段的效用函数:

第一阶段为照下式计算的效用函数:

其中w1+w2=1,w1,w2分别代表信任值融合时的系数;

第二阶段代表照下式计算系统第二阶段的效用函数:

pT代表了实际的传输阶段的表现与承诺的策略之间的差距值,φ代表了系统的收益值系数。price代表共享信道的造成的利益损耗值,αi代表了每一条共享信道的收益值;

第二步、通过嵌套博弈的优化理论对效用函数进行迭代优化,用户选择最优策略,利用嵌套博弈的优化方法自底向上进行嵌套博弈迭代优化,得出纳什均衡下的用户策略。

进一步地,所述步骤十一包括:

第一步、次用户在分配到的空闲频段传输数据,记录传输数据时实际的表现和时间;

第二步、若次用户传输数据时实际的时间和功率都高于其在博弈进行时所声称的传输质量,则将传输阶段次用户信任值乘以奖励参数更新;反之,将该阶段次用户信任值乘以惩罚因子更新。

本发明的有益效果是:

第一,本发明着眼于整个认知循环,将认知过程中次级用户行为的每一步都作为评价其信誉值得一部分,对判定系统中用户的良莠以及公平的分配频谱,对于整个系统剔除恶意用户,实现良性循环非常必要。而在认知环境下,次级用户为获得频谱所做出的努力其本质上是一种博弈,因此将博弈理论应用于信任管理方案,有重要的意义。。

第二,本发明应用嵌套博弈理论绘制博弈树,建立子博弈,对良好行为用户进行奖励,恶意用户进行惩罚,使得整个系统趋于良性循环,以达到频谱分配按需,公平的目的。在每一次交互过后,对于信任值得增长变化,采用边际效用理论,引入边际效用递减函数来增加不同的值,剔除恶意用户,是整个系统趋于良性循环。

以下将结合附图对本发明的构思、具体结构及产生的技术效果作进一步说明,以充分地了解本发明的目的、特征和效果。

附图说明

图1为本发明的流程图;

图2为本发明实施例的场景图;

图3位本发明博弈模型图。

具体实施方式

本发明的应用场景为中心式认知无线网络,网络中次用户处于同一地理位置中,存在数据中心记录用户行为和存储用户的信誉值,次用户采用能量感知的方法感知信号数据,然后进行数据通信。

如图1、2所示,本发明提供了一种中心式认知无线网络中基于嵌套博弈的信任管理方法,其特征在于,包括以下步骤:

步骤一、建立模型:

将中心式认知无线网络中次用户的活动分为感知阶段和传输阶段两个时期,并根据两个时段的次级用户的行为建立博弈模型,其博弈树模型如图3所示。

步骤二、次级用户感知频谱状态信息:

次级用户对于参与频谱分配的次级用户,通过能量感知的方式感知目前频谱空洞信息;

步骤三、次级用户上传感知信息:

次级用户将感知到的频谱状态信息上传到数据中心DC,上传信息的准确性概率即为用户的博弈策略,策略集为上传的感知信息的准确性除了受到策略选择的影响,还与次级用户i本身的物理感知准确率Fi,其准确率分布服从泊松分布。

上传的频谱状态信息表示为本地频谱表,记录次用户检测频段结果,表示为1*m的矩阵,m为次用户所检测到的频段的数目,矩阵中用1表示该处频谱空洞,0表示该处频谱忙碌不可用;

步骤四、数据中心DC对于频谱状态进行数据收集融合:

频谱状态信息的融合方式为次级用户上传的频谱状态的均值,其大于0.8则认为该处频谱空洞;

步骤五、数据中心更新感知阶段信任值:

数据中心根据各个次级用户上传的感知数据,对该阶段的用户行为进行信任值的更新,感知的评价值表示为函数的计算公式是

步骤六、数据传输阶段,次级用户进行频谱传输:

获得信道的次级用户利用信道对频谱进行传输,并作出该阶段的博弈决策,其策略内容为传输阶段用户良好利用频谱的概率取值范围为

步骤七、根据其传输阶段的表现,数据中心对该阶段的用户行为进行信任值的更新,本次传输的信誉值变化为

步骤八、信誉值计算;

步骤九、计算嵌套博弈效用函数和优化迭代:

步骤十、根据频谱分配方案进行频谱分配,根据信誉值的大小进行排序,按顺序分配频谱;

步骤十一、更新传输阶段用户信任值;

步骤十二、系统在多次频谱分配后剔除恶意用户,用户行为通过相互学习趋于良好,并使得整个系统趋于良性循环。

本实施例中,所述步骤八包括:

第一步、滑动窗口选择:

系统随机生成滑动窗口Win1,其中滑动窗口的大小代表了在计算历史信誉值时选取多少次的值作为历史信誉值来计算;

第二步、计算滑动窗口时间内的信誉值:

根据滑动窗口的大小,计算滑动窗口时间内次级用户的历史感知信誉值

SAi代表第i个用户的感知正确率,STi代表在Win1中用户i参与频谱感知并上传感知结果数据的总次数,SRi代表正确感知的信道个数,uks_d和uko_d分别是用户的感知时长和在线时长,感知时长指节点从入网来参与的总感知次数,在线时长指节点从入网来经历的总感知次数和历史传输信誉值;

第三步:根据次级用户选择的策略计算该次的直接感知信誉值和直接传输信誉值;

第四步:对历史感知数据和直接感知数据进行融合,为了实现系统的慢升快降,加入边际函数做为参数,

本实施例中,所述步骤九包括:

第一步、通过计算和融合感知阶段和传输阶段的信誉值计算出博弈第一阶段和第二阶段的效用函数:

第一阶段为照下式计算的效用函数:

其中w1+w2=1,w1,w2分别代表信任值融合时的系数;

第二阶段代表照下式计算系统第二阶段的效用函数:

pT代表了实际的传输阶段的表现与承诺的策略之间的差距值;

第二步、通过嵌套博弈的优化理论对效用函数进行迭代优化,用户选择最优策略,利用嵌套博弈的优化方法自底向上进行嵌套博弈迭代优化,得出纳什均衡下的用户策略。

本实施例中,所述步骤十一包括:

第一步、次用户在分配到的空闲频段传输数据,记录传输数据时实际的表现和时间;

第二步、若次用户传输数据时实际的时间和功率都高于其在博弈进行时所声称的传输质量,则将传输阶段次用户信任值乘以奖励参数更新;反之,将该阶段次用户信任值乘以惩罚因子更新。

以上详细描述了本发明的较佳具体实施例。应当理解,本领域的普通技术人员无需创造性劳动就可以根据本发明的构思做出诸多修改和变化。因此,凡本技术领域中技术人员依本发明的构思在现有技术的基础上通过逻辑分析、推理或者有限的实验可以得到的技术方案,皆应在由权利要求书所确定的保护范围内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号