法律状态公告日
法律状态信息
法律状态
2019-10-29
未缴年费专利权终止 IPC(主分类):G05D1/10 授权公告日:20170315 终止日期:20181105 申请日:20141105
专利权的终止
2017-03-15
授权
授权
2015-04-08
实质审查的生效 IPC(主分类):G05D1/10 申请日:20141105
实质审查的生效
2015-03-11
公开
公开
技术领域
本发明涉及一种不确定环境下的多无人机同时到达多个目标方法,具体的说是指一种基于区间一致性算法的多无人机同时到达攻击多目标的控制方法,属于多无人机协调控制技术领域。
背景技术
在多智能体系统中,“一致”是指多智能体的某一个状态随着时间变化而趋于相同,一致性算法就是被设计用来实现该目标的方法。
经过几十年的不断发展,人们对于一致性理论的研究不断深入,前后共经历了三个阶段。其中第一阶段(1987-1995)被称作生物群体行为模拟阶段,对自然界中的生物群体的协同一致现象进行了研究;第二阶段为一致性理论的深入探究阶段(1995-2004),在这一阶段中,研究者对于一致性理论进行了进一步的探索,对提出的一致性算法模型给予了理论上的推导和证明,为一致性理论向更深层次发展奠定了基础,另外也对一致性理论进行了研究,并取得了一定的研究成果,这些研究成果逐渐成为了多智能体一致性理论研究的框架;第三阶段为多智能体一致性理论的完善阶段(2004-),研究者对于一致性理论的各个方面进行了研究,包括有向/无向通信网络的多智能体一致性理论、固定/动态拓扑情况下的多智能体一致性理论、时滞系统的一致性理论、信息不确定以及异步通信情况下的多智能体一致性理论等问题,同时也在一阶、二阶和高阶一致性理论方面取得了一定的成果。
霍尼韦尔技术中心对多智能体协同控制进行了深入的研究,研究内容主要是多智能体系统的实时控制方面,并在此基础之上对多智能体自适应控制进行了研究,更好地实现多智能体的实时控制。该研究主要应用于无人机,目的是为了实现无人机缩短处理威胁和突发事件的时间,将处理时间缩短到几毫秒,并将多无人机的协同控制调整时间控制在几十毫秒以内,最后将多无人机编队的动态重构时间控制在10秒内。
将一架无人机作为一个智能体,多架无人机组成一个多智能体系统,通过无人机之间的通信,多无人机在高度自主的同时又相互协调完成任务。各国军事机构以及专家学者对多无人机的协同控制进行了大量的研究,并且取得了丰硕的成果,但仍有不少重要问题尚未解决,主要表现在,虽然在多无人机协同控制研究方面已经取得一定的成果,然而考虑不确定环境下的多无人机协同控制研究还很少。在实际战场环境下,无人机由于受到机载传感器的精度有限、战场环境的不可预测性以及无人机间通信易被干扰等因素的影响,常常获得的是不一致的态势信息,这些信息在数学上可以用区间信息来描述。迄今为止,不确定信息环境下的多无人机协同到达多个目标问题还没有得到解决。
针对不确定环境下多无人机同时到达的控制策略问题,提出了不确定环境下的多无人机同时到达多个目标的控制方法。首先将不确定距离信息用区间数值来表示,将拍卖算法和区间一致性算法相结合,实现了不确定环境下的多无人机同时到达的控制方法。首先通过拍卖算法,以无人机到达攻击目标的路径长度总和为目标函数,给出了多无人机对多目标的任务分配方法。然后定义了区间一致性算法,提出了不确定环境下的多无人机同时到达的控制方法,实现了多无人机到达多目标的趋于一致的时间范围。最后针对无突发威胁情况下和有突发威胁情况下的多无人机到达多目标的协同控制问题分别进行了研究,结果表明该方法具有很好的可靠性和鲁棒性。
发明内容
鉴于现有技术存在的问题,本发明的目的是要提供一种不确定环境下的多无人机同时到达多个目标方法,其为基于一致性算法的多无人机同时到达多目标的方法,通过对多无人机的控制实现多无人机同时到达,具有很好的通用性,灵活性、鲁棒性和可伸缩性。
为了实现上述目的,本发明所采用的技术方案为不确定环境下的多无人机同时到达多个目标方法,其通过拍卖算法,以无人机到达攻击目标的路径长度总和为目标函数,给出了多无人机对多目标的任务分配方法;定义区间一致性算法,实现了多无人机到达多目标的趋于一致的时间范围;再分别针对无突发威胁情况下和有突发威胁情况下的多无人机到达多目标的协同控制问题进行试验。其中有突发威胁情况下的多无人机协同控制要考虑运用两次拍卖算法,并改变无人机的攻击目标,以保证目标函数最优;其具体过程如下:
步骤1:无人机的质点运动模型建立;
将无人机看作为二维平面内运动的质点,其简化运动模型为:
其中,xi,yi为第i架无人机在平面中的位置坐标,
>
无飞行速度在不确定环境下区间形式的一阶动态近似模型为:
>
其中,
步骤2:基于拍卖算法的任务分配模型求解;
假定有n架无人机和m个目标,目标分配矩阵定义为X=[xij]n×m,目标分配变量定义为:
无人机到达目标的距离表示为区间信息,即:l(xij)=[l-(xij),l+(xij)],(i=1,2,...,n);其中l-(xij)和l+(xij)分别表示无人机i到达目标j距离的上下界;
定义目标函数为:
>
其中:
则最优目标分配结果定义为:
[X*-,X*+]=argmin[L-,L+] (6)
按拍卖算法来确定目标的分配结果;
步骤3:编队控制,编队间的通信是由两个编队的领机来完成的;
当固定通信拓扑时,若编队1和编队2内部的通信拓扑结构均存在有向生成树,且编队1和编队2之间的通信由两个编队的领导节点完成,则编队1和编队2内部以及编队之间可实现全局渐近收敛或一致性可达;否则无法实现全局渐近收敛或一致性可达;
当存在拓扑结构变换时,若网络拓扑集中的每个拓扑图都为平衡有向图且为强连通图,则对任意初始状态,可实现全局渐近收敛或一致性可达;否则无法实现全局渐近收敛或一致性可达;
步骤4:不确定环境下的多无人机同时到达多目标的控制策略;
在一个由n个智能体组成的系统中,其通信关系用G=(V,E)来描述,其中每个节点代表一个智能体,假设节点的状态满足区间一阶动态方程为:
>
若所有智能体最终的状态趋于相等,即
>
从而得出区间信息条件下的多无人机同时到达的控制策略
>
其中:
步骤5:控制策略的实现。
所述的拍卖算法的具体拍卖过程步骤如下:
步骤2.1:初始化参数,给出多个目标和每架无人机所在位置坐标,根据路径规划模块规划的路径,计算不同无人机到达不同目标点的距离,设定循环次数。
步骤2.2:随机生成N个无人机的竞拍序列。
步骤2.3:开始竞拍,当前竞拍的无人机根据目标函数判断最优的目标分配的无人机数是否已满,若是,则从其余的目标中选择,否则选此目标作为要攻击的目标。
步骤2.4:更新各目标所分配的无人机个数,若所有的UAV都完成竞拍则执行下一步骤,否则,转向步骤2.3。
步骤2.5:拍卖结束,计算当前生成的分配方案目标函数,并与上次形成的方案进行比较,若优于上次,则存储当前的方案,否则保留上次的方案。
步骤2.6:若循环结束则执行下一步骤,否则,转向步骤2.2。
步骤2.7:给出最终的分配方案和目标函数。
本发明的特点及有益效果:本发明是基于区间一致性算法的不确定环境下的多无人机同时到达多个目标的方法。首先运用拍卖算法对多架无人机进行任务分配,使得目标函数最小,并运用区间一致性算法使得多无人机在一定时间范围内同时到达多个目标。该发明在保证目标函数到达最优的要求下,并最终实现了多无人机同时到达多个目标。
附图说明:
图1是本发明中多无人机攻击多目标示意图;
图2是本发明中编队内和编队间的通信拓扑结构图;
图3是本发明中无突发威胁且所选路径长度区间下限时多无人机时协同控制;
图4是本发明中无突发威胁且所选路径长度区间上限时多无人机时协同控制;
图5是本发明中有突发威胁且所选路径长度区间下限时多无人机时协同控制;
图6是本发明中有突发威胁且所选路径长度区间上限时多无人机时协同控制;
具体实施方式
参看图1-图6,基于一致性算法的不确定环境下多无人机同时到达多目标的方法,该方法将不确定距离信息用区间数值来表示,将拍卖算法和区间一致性算法相结合,提出了不确定环境下的多无人机同时到达的控制方法。
通过拍卖算法,以无人机到达攻击目标的路径长度总和为目标函数,并对有突发威胁和无突发威胁的情况下,给出了多无人机对多目标的任务分配方法。
定义了区间一致性算法,提出了不确定环境下的多无人机同时到达的控制方法,实现了多无人机到达多目标的趋于一致的时间范围。
步骤1:无人机的质点运动模型建立。
参看附图1,将无人机看作为二维平面内运动的质点,其简化运动模型为:
其中,xi,yi为第i架无人机在平面中的位置坐标,
>
假定无人机的飞行控制系统具有自动驾驶仪的速度保持功能,可以跟踪给定的速度指令。自动驾驶仪的速度保持用一阶动态模型近似描述。由于机载传感器的精度限制和各种干扰的影响,速度指令和速度可表示为区间形式,则不确定环境下的速度保持一阶动态模型近似描述为:
>
其中,
步骤2:基于拍卖算法的任务分配模型求解。
考虑目标分配问题,假定有n架无人机和m个目标,目标分配矩阵定义为X=[xij]n×m,目标分配变量定义为:
由于无人机机载传感器的测量误差和天气情况等影响,无人机到达目标的距离通常不能表示为一个确定的数值,在数学上可表示为区间信息l(xij)=[l-(xij),l+(xij)],(i=1,2,...,n)。其中l-(xij)和l+(xij)分别表示无人机i到达目标j距离的上下界。则目标函数定义为:
>
则最优目标分配结果定义为:
[X*-,X*+]=argmin[L-,L+] (6)
假定无人机带有路径规划模块,可实时进行路径规划,并近似计算出到达目标的剩余距离l(xij),所有的无人机到目标的距离和为L,求其最小值。
拍卖算法来确定目标的分配结果。具体拍卖过程步骤如下:
步骤2.1:初始化参数,给出多个目标和每架无人机所在位置坐标,根据路径规划模块规划的路径,计算不同无人机到达不同目标点的距离,设定循环次数。
步骤2.2:随机生成N个无人机的竞拍序列。
步骤2.3:开始竞拍,当前竞拍的无人机根据目标函数判断最优的目标分配的无人机数是否已满,若是,则从其余的目标中选择,否则选此目标作为要攻击的目标。
步骤2.4:更新各目标所分配的无人机个数,若所有的UAV都完成竞拍则执行下一步骤,否则,转向步骤2.3。
步骤2.5:拍卖结束,计算当前生成的分配方案目标函数,并与上次形成的方案进行比较,若优于上次,则存储当前的方案,否则保留上次的方案。
步骤2.6:若循环结束则执行下一步骤,否则,转向步骤2.2。
步骤2.7:给出最终的分配方案和目标函数。
步骤3:编队控制。
参看附图2,编队间的通信是由两个编队的领机来完成的,则上述多无人机编队能否到达一致可根据下面定理1判定。
定理1:固定通信拓扑情况下,若编队1和编队2内部的通信拓扑结构均存在有向生成树,且编队1和编队2之间的通信由两个编队的领导节点完成,则编队1和编队2内部以及编队之间可实现全局渐近收敛或一致性可达。对于存在拓扑结构变换的情况,如编队1中的成员由于任务的变更成为了编队2中的成员,则网络拓扑切换时系统是否到达一致可由定理2判定:
定理2:假设网络拓扑集中的每个拓扑图都为平衡有向图且为强连通图,则对任意初始状态,系统最终渐近收敛到平均一致。
步骤4:不确定环境下的多无人机同时到达多目标的控制策略。
区间一致性算法,在一个由n个智能体组成的系统中,其通信关系用G=(V,E)来描述,其中每个节点代表一个智能体,假设节点的状态满足区间一阶动态方程为:
>
若所有智能体最终的状态趋于相等,即
>
各个智能体通过局部信息传递,使它们最终的状态收敛到一致。令
>
第i架无人机能实时估算出t时刻它的期望到达时刻:
>
其中,为第i架无人机在t时刻的期望到达时间。根据式(9)可得
>
多无人机同时到达多个目标是使所有无人机的期望到达时刻趋于一致,即
>
或者期望到达时间趋于相同,即
>
对式(10)左右两边关于t求导,可有
>
令>则有
>
将式(3)和式(9)代入并整理上式可得
>
联立公式(8)和公式(16),可得出区间信息条件下的多无人机同时到达的控制策略
>
步骤5:控制策略的实现。
对于一阶动态系统式(7),一致性算法(8)的收敛性和收敛速度与状态变量的取值无关,只是最终的一致(平衡)状态与初始值有关。由此可知,当剩余路径长度发生突变时,控制策略式(17)的收敛性和收敛速度不会受影响,已有的一致(平衡)状态会被打破,一段时间以后将达到新的一致(平衡)状态。
基于上述特点,可以将式(17)与路径规划结合起来。无人机重新规划路径会导致其剩余路径长度发生突变,但是多无人机同时到达的控制目标式(13)还是能实现,只是无人机的最终到达时刻可能有变化。
当无人机在攻击目标的行进过程中遇到了突发威胁,需要选择新路径以回避威胁,在这种情况下无人机需要重新进行路径规划,无人机远离目标位置时,尽量通过路径规划调整路径长度,使其以合适的速度飞行,这样可以保留较大的速度调整裕量,能更好地应对路径误差和突发威胁。无人机接近目标位置时,主要以速度控制为主,可以保证精确地同时到达。
先举一个具体实例对本发明作进一步说明:
假定有五架无人机、两个目标,其中每个目标至少分配两个无人机,则有三架无人机攻击其中一个目标,另外两架无人机攻击另一个目标。采用上述的拍卖算法对五架无人机进行任务分配,然后各架无人机沿着已规划好的路径朝目标点飞行。分别对无突发威胁下和有突发威胁下基于一致性算法的无人机的协同控制方法进行了研究。
具体的实施效果:没有突发威胁的情况下多无人机的同时到达多目标问题。经过一次拍卖算法将五架无人机分成两个编队,编队内的无人机通过分散化协调控制,使它们的状态达到一致,即期望到达时间相同,同时,编队间的联系由两个编队的领队完成,由定理1可以证明,最终可以实现多无人机同时到达不同的目标。根据协同控制方法,在无人机的起始位置运用拍卖算法分别对区间信息值的上下界进行任务分配,求得的任务分配结果,此时满足目标函数的要求,即总的路径代价最小。然后五架无人机按照图2所示的拓扑结构进行通信,最终实现同时到达,各架无人机的期望到达时间、剩余路径长度、速度的结果如图3、图4所示。当无人机在攻击目标的行进过程中遇到了突发威胁,此时由路径规划器自动进行路径重规划,并计算出到达目标的更新距离长度。若在保证无人机不超过速度限制的情况下,则有的无人机要选择增加路径长度使多无人机同时到达,这样无疑增加了总的路径长度,使得路径目标函数达不到最优值。所以,需要采用拍卖算法重新进行任务分配,在保证路径最优的前提下,实现多无人机最终同时到达多目标问题。相应的拓扑结构也发生了变化。根据定理2可知,系统最终能够收敛到一致。当路径长度为路径区间值的下界和上界时,各架无人机的剩余路径长度、飞行速度和期望到达时间的结果如图5、图6。实验结果表明,该方法能够保证目标函数最优的要求,并最终实现了多无人机同时到达多个目标。
机译: 目标点到达检测器,目标点到达检测方法,目标点到达检测程序的载体介质以及车载设备控制系统
机译: 目标点到达检测器,目标点到达检测方法,目标点到达检测程序的存储介质以及车载设备控制系统
机译: 目标点到达检测器,目标点到达检测方法,目标点到达检测程序的载体介质以及车载设备控制系统