首页> 中国专利> 一种基于贝叶斯网络的空空导弹态势感知与决策方法

一种基于贝叶斯网络的空空导弹态势感知与决策方法

页面导航

摘要
著录项
说明书
相似文献

摘要

本发明公开了一种基于贝叶斯网络的空空导弹态势感知与决策方法，采用最小二乘法拟合当前量测数据，从而获得目标轨迹方程，完成目标机动轨迹的预测；当拟合精度达到要求时，将得到的目标轨迹方程在时间序列上进行延拓，实现机动目标的轨迹超前预测；然后，建立机动决策贝叶斯网络模型，将基于目标机动预测的攻击区信息作为网络的输入，通过网络的推理得到具有超前指导意义的决策信息。以解决现有技术中空空导弹的传统静态攻击区对高机动目标适应性较差，致使导弹决策与实际空战情景不符且落后于目标的实际运动状态的问题。

著录项

公开/公告号CN113139331A

专利类型发明专利
公开/公告日2021-07-20

原文格式PDF
申请/专利权人西北工业大学;
展开▼

申请/专利号CN202110333611.8
发明设计人王小旭;孙昱竹;
展开▼

申请日2021-03-29
分类号G06F30/27(20200101);G06N20/00(20190101);
代理机构61257 西安维赛恩专利代理事务所(普通合伙);
代理人刘春
地址 710072 陕西省西安市友谊西路127号
入库时间 2023-06-19 11:54:11

说明书

技术领域

本发明属于导弹智能化技术领域，具体涉及一种基于贝叶斯网络的空空导弹态势感知与决策方法。

背景技术

随着现代战争的发展，作战模式的重心已逐渐从传统的陆战转移到高技术信息化空战。因此，夺取和掌握制空权已经逐渐成为决定战争胜负的关键，而空空导弹作为实施精确打击来夺取制空权的利器之一，由于其敏捷性与致命性，将会成为未来智能作战体系中必不可少的组成部分。因此，世界很多国家和地区都在大力积极推动空空导弹的相关研究，其核心技术的突破一直以来都受到各国的关注与重视。与此同时，随着机载传感器、干扰技术、隐身技术、火控系统等关键技术的不断完善，未来的空战环境将会呈现出更加复杂与混沌的状态。此外，第五代战斗机和新型无人机的陆续装备使得攻击目标的逃逸能力不断增强，战场中敌我态势瞬息万变。因此，为了应对日趋复杂的空战环境，空空导弹需要借助更加智能化和自主化的手段来参与空战的博弈。其中，空战决策技术将成为未来空战中的关键词，智能化的决策辅助系统将能够模仿人类的思维和判断能力，为系统提供关键性的态势判断和战术决策。一个完整的空战决策系统必不可少的环节即为对自身武器系统效能的评估。空空导弹是一个复杂的系统，其性能会随着不同的作战条件而表现出非常大的差异。其主要影响因素包括作战高度、天气、导弹与目标各自的运动状态、弹目相对速度、相对位置、传感器性能、发动机工作状态等等。反应空空导弹武器系统综合性能的指标有许多，其中最重要的评价指标之一就是导弹攻击区。空空导弹攻击区是指一片由封闭的曲线包围的空域，这些曲线代表着空空导弹在不同进入角对攻击目标的最大和最小可达射程，若载机在这片空域范围内中发射导弹，就能以一定概率命中目标；若在空域范围外发射导弹，则一定不会命中目标。换言之，攻击区是导弹命中目标的必要条件，而不是充要条件。由于导弹昂贵的造价，不可能通过大量实战实验来确定武器系统的效能。因此，导弹攻击区作为一种通过建模和仿真所得到的形象的图像化工具，为导弹自身作战效能的评估与决策提供了强有力的参考依据。

然而，日趋复杂的空战环境对空空导弹攻击区的计算带来了新的挑战，即对目标的高速度、高机动逃逸能力的适应性有待提高。传统攻击区的计算仅考虑发射时刻的弹目运动信息，若忽略目标的机动，空战后续的态势发展与最初发射时刻相比已发生巨大变化，攻击区所提供的决策信息将会具有较大的误差，甚至会产生误导。此外，随着超视距空战的发展，作战时间被延长，战场被极大地延伸，由数据链信号传输和导弹舵机响应将带来的不可避免的延迟，从而导致导弹攻击区的计算与效能的评估往往落后于导弹和目标的真实运动状态。然而，现役空空导弹普遍缺乏隐身措施，飞行过程中非常容易被敌方的来袭警告系统探察觉，因此当飞行员根据发射时刻的攻击区信息在预定位置发射导弹,目标在检测到来袭弹的威胁后做出逃逸机动，在经过一段时间的飞行之后，导弹可能已经偏离更新后的目标攻击区，最终导致导弹脱靶，此时的空战示意图如图1所示。由此可知，对于如何合理地将目标机动信息、导弹自身运动和战场外部环境加入攻击区的计算，从而挖掘到能够适应复杂环境的动态决策信息，将对导弹智能化与自主化的发展有着重大的研究价值。

发明内容

本发明的目的是提供一种基于贝叶斯网络的空空导弹态势感知与决策方法，以解决现有技术中空空导弹的传统静态攻击区对高机动目标适应性较差，致使导弹决策与实际空战情景不符且落后于目标的实际运动状态的问题。

本发明采用以下技术方案：一种基于贝叶斯网络的空空导弹态势感知与决策方法，其特征在于，采用最小二乘法拟合当前量测数据，从而获得目标轨迹方程，完成目标机动轨迹的预测；当拟合精度达到要求时，将得到的目标轨迹方程在时间序列上进行延拓，实现机动目标的轨迹超前预测；然后，建立机动决策贝叶斯网络模型，将基于目标机动预测的攻击区信息作为网络的输入，通过网络的推理得到具有超前指导意义的决策信息。

进一步的，按照以下步骤实施：

步骤一、建立空空导弹机动决策贝叶斯网络，所述贝叶斯网络包括观测层、决策层和隐藏层，所述贝叶斯网络每一个节点的条件概率初始化为均匀分布；

其中，所述观测层包括导弹是否在发射时刻攻击区范围内的判定AZ、导弹方位角Q、弹目相对高度RH、相对高度变化率dRH、相对速度RV和相对速度变化率dRV六个证据节点，用于战场环境的实时感知；所述决策层的决策节点为导弹机动决策类型DM，用于输出满足导弹过载限制的导弹机动动作；所述隐藏层包括目标机动类型MT和空战态势评估SA两个中间节点，用于推断空战中被攻击目标的机动类型和整体的空战态势；所述SA分别连接至AZ、Q、RV和dRV，所述MT分别连接至Q、RV、dRV、RH、dRH，所述DM分别连接至SA和MT；

步骤二、利用经过空空导弹攻防对抗仿真系统验证过的符合实际空战规律的数据，对所述贝叶斯网络每一个节点的条件概率进行优化，从而得到完整的空空导弹机动决策贝叶斯网络；

步骤三、利用最小二乘法对空空导弹弹载传感器或中继制导平台在当前时刻之前所观测到的被攻击目标的坐标进行拟合，得到被攻击目标的轨迹方程，然后将轨迹方程在时间序列上进行延拓，实现目标轨迹的预测；

步骤四、将步骤三预测得到的目标轨迹中的运动参数作为贝叶斯网络的输入，通过贝叶斯网络的推理得到具有超前指导意义的导弹机动决策指令，在空空导弹自身导引信号的基础上进行实时地修正与补偿。

进一步的，步骤二中空空导弹攻防对抗仿真系统，包括导弹运动模型、目标运动模型、导弹和目标相对运动模型、制导律模型、导引头信息滤波模型以及基于黄金分割法的传统攻击区计算模型；通过将以上模型进行有效集成，得到了符合空空导弹空战攻防对抗规律的训练样本数据；然后调用Matlab中内置的贝叶斯网络工具箱的参数学习函数，利用样本数据对参数进行优化，从而得到最终完整的空空导弹决策贝叶斯网络模型。

进一步的，步骤三具体为：分别采用线性函数、多项式函数和三角函数对目标运动轨迹进行拟合：

(4)线性函数

f(t)＝A

(5)多项式

f(t)＝p

(6)三角函数

f(t)＝a

其中，A

本发明的有益效果是：通过对影响攻击区边界的相关运动参数的分析，建立弹目运动参数与导弹决策之间的基于贝叶斯网络的决策模型，提出了一种基于空空导弹攻击区和目标机动预测的导弹动态决策模型，以增强空空导弹对高速度、高机动逃逸能力的目标的适应能力。本发明的工作对于提升我国空战攻防对抗水平具有一定的参考和借鉴价值。通过将导弹和目标的运动参数抽象为可以评价导弹效能的攻击区，从分析导弹各运动参数对空战态势的影响入手，从而在一定程度上弱化了对导弹自身运动学模型的依赖。模型的初始参数由专家知识给定，为了减弱对专家知识的依赖，后续引入了贝叶斯网络的参数学习，利用空战数据对网络参数进行更新与优化，从而提升模型的决策性能。此外，通过加入目标机动的辨识与预测器，为决策模型赋予了超前态势预测的能力，从而解决了空战信息滞后的问题，增强了导弹对大机动目标条件下的空战环境适应能力。

附图说明

图1是本发明一种基于贝叶斯网络的空空导弹态势感知与决策方法的空战示意图；

图2是本发明一种基于贝叶斯网络的空空导弹态势感知与决策方法的网络结构图；

图3是传统的基于黄金分割法计算攻击区边界的算法流程图；

图4是本发明一种基于贝叶斯网络的空空导弹态势感知与决策方法的未加入决策指令时导弹和目标的运动轨迹图；

图5是本发明一种基于贝叶斯网络的空空导弹态势感知与决策方法的未加入决策指令时导弹过载和弹目相对速度变化曲线；

图6是本发明一种基于贝叶斯网络的空空导弹态势感知与决策方法的发射时刻攻击区与目标机动后动态攻击区的对比图；

图7是本发明一种基于贝叶斯网络的空空导弹态势感知与决策方法的加入决策指令后导弹和目标的运动轨迹图；

图8是本发明一种基于贝叶斯网络的空空导弹态势感知与决策方法的加入决策指令后导弹过载和弹目相对速度变化曲线；

图9是本发明一种基于贝叶斯网络的空空导弹态势感知与决策方法的目标机动类型推理结果；

图10是本发明一种基于贝叶斯网络的空空导弹态势感知与决策方法的空战态势推理结果。

具体实施方式

下面结合附图和具体实施方式对本发明进行详细说明。

本发明提供了一种基于贝叶斯网络的空空导弹态势感知与决策方法，按照以下步骤实施：

步骤一、建立空空导弹机动决策贝叶斯网络：

其中，贝叶斯网络的证据节点组成了网络的观测层(又称为输入层)，用于战场环境的实时感知，包括导弹进入角、弹目相对高度、相对高度变化率、相对速度、相对速度变化率等因素。贝叶斯网络的决策节点组成了网络的决策层(又称为输出层)，用于输出满足导弹过载限制的导弹机动动作。贝叶斯网络的中间节点组成了网络的隐藏层(又称为中间层)，用于推断空战中被攻击目标的机动类型和整体的空战态势。这样的网络将同时具备目标机动辨识、空战态势评估和空战自主决策的功能。确认贝叶斯网络的结构之后，将网络中各个节点的条件概率初始化为均匀分布。

步骤二、为了使决策模型能够更加符合实际空战场景，引入决策贝叶斯网络的参数学习，利用经过空空导弹攻防对抗仿真系统验证过的数据对网络参数进行优化，从而得到完整的空空导弹机动决策贝叶斯网络。

步骤三、利用最小二乘法对已获得的被攻击目标的坐标进行拟合，得到其轨迹方程，然后将轨迹方程在时间序列上进行延拓，实现目标轨迹的预测。其中，对于最大过载加速机动和最大过载减速机动这一类相关机动，可以使用线性函数进行拟合；对于最大过载爬升、俯冲机动和最大过载左转、右转机动分别对应竖直平面和水平平面的机动，可以利用多项式拟合得到较为精确的轨迹方程；对于S型机动这种带有周期性质的机动，可以选用三角函数对其轨迹进行拟合。

步骤四、将步骤三预测得到的目标运动参数作为网络的输入，通过网络的推理得到具有超前指导意义的导弹机动决策指令，在空空导弹自身导引信号的基础上进行实时地修正与补偿，从而实现了空空导弹的轨迹动态优化。这种“自身导引+超前指令修正”的方法将能带给导弹前所未有的多样化运用弹性从而提高了其机动目标的毁伤能力。

在一些实施例中，步骤一建立空空导弹机动决策贝叶斯网络的具体方法为：

贝叶斯网络就是一种带有参数的有向无环图，包括网络结构和网络参数两个要素。图的节点对应于模型中的变量，有向边代表变量之间的条件依赖关系。网络参数指每一个节点所对应的条件概率数表。

(1)空空导弹机动决策贝叶斯网络的结构：

空空导弹机动决策贝叶斯网络一共分为三层。其中，观测层作为整个网络的输入，用于提取战场环境特征。由于输入层的数据可以直接由弹载传感器或是中继制导平台上的传感器检测到，因此将输入层的节点命名为网络的证据节点，其主要作用是对空战战场环境进行感知，为网络提供证据信息。由于影响空空导弹攻击区的主要因素有进入角、相对高度、相对速度等因素。因此，观测层的证据节点及其状态集定义见表1。

表1证据节点定义

决策层的决策节点综合了目标机动辨识和空战态势评估的结果，为空空导弹提供具体的机动决策。决策节点的状态集定义如表2所示，将空空导弹在空战中复杂的机动分解为一些基本的机动策略。决策层的输出节点及其状态集定义见表2。

表2决策节点定义

网络隐藏层的中间节点则用于利用感知到的信息进行机动辨识和态势感知。根据证据节点输入的信息，可以推断出目标机动的类型。此外，还需要一个节点来进行空战敌我双方态势的评估，因此在网络证据节点的基础上，定义目标机动辨识和空战态势评估两个节点作为网络的中间节点。因此，隐藏层的中间节点具体定义及其状态集见表3。

表3隐藏节点定义

空空导弹机动决策贝叶斯网络的输入层共有6个证据节点，用于向网络实时输入空战环境信息。其中，目标机动类型主要取决于Q，RH，dRH，RV和dRV一共5个变量，而与攻击区边界无关；而空战态势评估的节点则显著依赖于攻击区边界，例如，当位于攻击区边界内，即使目标做出了机动，出于节省导弹自身动能的考虑，可以仍旧考虑不做出机动。但一旦导弹已经不在目标攻击区范围内，即使目标的机动较小，依旧应该做出相应机动。因为一旦导弹偏离攻击区，则几乎可以判断如果导弹不做出相应机动则一定攻击失败。由以上分析可知，空空导弹机动决策贝叶斯网络结构如图2所示。

(2)空空导弹机动决策贝叶斯网络的参数

在空空导弹机动决策贝叶斯网络引入参数学习之前，现将各节点的参数初始化为均匀分布，即每一个节点的每一个状态出现的概率相等。

在一些实施例中，步骤二具体为：为空空导弹机动决策模型引入参数学习。在没有经过大量空战样本数据进行参数优化前，机动决策网络能够根据主观经验设定的初始参数输出相应的机动策略，此时输出的机动策略以战场特征提取为依据。随着空战样本数据的不断积累，借助样本数据对决策网络进行训练，能够使得网络参数通过参数学习不断得到优化。但由于空空导弹这一研究对象的特殊性与敏感性，无法从大量实战中采集训练用的样本数据，因此本发明建立了基于Matlab的空空导弹空战攻防对抗仿真模型，利用仿真模型模拟实际中目标做多种机动动作时的导弹和目标的运动参数，将这些数据采集下来整理成数据集，然后利用Matlab中内置的贝叶斯网络工具箱中的参数学习函数对网络参数进行训练，从而得到完整的空空导弹机动决策贝叶斯网络。

其中，空空导弹空战攻防对抗仿真模型包括导弹运动模型、目标运动模型、导弹和目标相对运动模型、制导律模型、导引头信息滤波模型以及基于黄金分割法的传统攻击区计算模型。

A.导弹运动模型：

其中，v

其中，t表示空战进行的时间(单位为秒)，式中，S

B.目标运动模型：

其中，v

C.导弹和目标相对运动模型：

对其求导可得：

其中，

D.制导律模型:

其中，K为比例系数，取3.6，n

E.导引头信息滤波模型

导弹导引头具备信息滤波和融合的能力。这一模块对于导弹导引系统起着至关重要的作用。由于弹载传感器接收到的信号本身会带有噪声，因此要想准确地估计出目标的特性，需要为导弹加入导引头信息滤波模块，从而提高制导精度，平滑弹道。本发明采用UKF(Unscented Kalman Filter)对接收到的信号进行处理。

导弹上的传感器接收到目标的信号为距离，方向角和俯仰角三个信号，通过这三个信号解算出目标的位置和速度信息，从而计算出控制导弹的加速度信号。要想将UKF算法应用在导弹导引头信息解算中，需要得到具体的状态方程和量测方程。导弹导引头捕获到的信息并不直接是目标的坐标和速度，而是弹目相对距离、视线的倾角和偏角，因此，我们可以定义六个状态值:

分别表示目标在地面坐标系下x,y,z轴的坐标和速度。测量值：

分别表示弹目之间的相对距离、视线的倾角和偏角。在不清楚目标的机动类型的情况下，可暂且选用最简单的CV模型。

过程噪声额方差可以表示为：

其中：

经滤波之后，利用六个状态值可以实时解算出用于计算制导指令的参数。其中，弹目基于地面坐标系的三个轴的相对距离和相对速度为：

弹目之间总的相对距离和相对速度为：

F.基于黄金分割法的传统攻击区计算模型：

本发明使用黄金分割法对攻击区远边界进行搜索。首先以目标为参考，选取载机的进入角的方向，在这一方向上确定初始的导弹飞行射程为[a

若飞行过程中某一时刻不满足攻击区边界条件，则跳出弹道解算循环，判定为攻击失败；

否则，利用导弹是否成功命中目标的条件进行判断：若满足命中条件，则攻击成功。

此时，如果攻击成功，则令a

然后回到算法的最外层循环，重新选择载机进入角方向，以此类推，直到每一个遍历完所有的方向，各个方向得到的边界点连接起来就得到了一个封闭的攻击区。

近边界的搜索与远边界的搜索原理相同，只是在迭代过程中，如果导弹攻击成功，令a

在一些实施例中，步骤三具体为：利用最小二乘法对已获得的被攻击目标的坐标进行拟合。分别采用线性函数、多项式函数和三角函数对目标运动轨迹进行拟合。其中：

3.1、线性函数

f(t)＝A

3.2、多项式

f(t)＝p

3.3、三角函数

f(t)＝a

其中，A

(1)最大过载右转机动：

f(x)＝p

其中，轨迹方程的具体系数如表所示：

表1最大过载右转机动轨迹方程参数

(2)S型机动：

f(x)＝a

其中，轨迹方程的具体系数如表所示：

表2 S型机动轨迹方程参数

在一些实施例中，步骤四具体为：将基于目标轨迹预测的信息和当前导弹运动状态参数作为网络的输入，通过调用Matlab中内置的贝叶斯网络工具箱中的推理函数，实现导弹机动决策的推理，从而得到不同目标机动类型下的导弹最优决策。然后，在导弹自身导引指令的基础上，加入附加的过载修正指令，从而实现空空导弹的轨迹动态优化。

实施例

以目标做最大过载右转机动为例，空空导弹载机朝向目标飞行并同时不断地跟踪目标的运动数据。当载机检测到进入敌方目标的攻击区时，下达发射导弹的指令。空空导弹离开载机后，首先向着根据发射时刻攻击区得到的预定拦截点飞行。与此同时，随着导弹和目标的相对距离的缩小，目标检测到来袭弹的威胁，为了规避导弹的攻击，目标做出以最大过载右转的机动。仿真初始参数如表4所示：

表4仿真算例初始参数

在未加入决策指令的情况下，仿真图如图4和图5所示。目标在检测到导弹来袭的威胁后做出机动，从而导致在导弹飞行过程中的某一时刻偏离了动态攻击区，其相对距离在缩小至一定值时又开始大幅度增长，由此可见攻击失败。如图6可见，通过对比发射时刻和发射一段时间后的空空导弹攻击区，目标机动将导致空空导弹攻击区大幅度缩小，因此更进一步地验证了前述空空导弹攻击失败的原因。

如图7和图8所示，在不改变空战导弹和目标的初始作战参数的情况下，在加入推理得到的决策修正指令之后，导弹的俯仰和偏航两个方向的过载产生了一个较大的突变。与此同时，导弹和目标相对距离不再发散，而是逐渐趋于0，由此可见攻击成功。与不加入决策修正指令的仿真结果相比可以看出，25s左右的决策修正指令起到了将空空导弹的飞行轨迹重新调节到导弹攻击区的关键作用。如图9的目标机动推理结果，作战初期，目标大概率出于稳定飞行的匀速直线运动，随着导弹和目标之间的距离不断减小，目标开始做出右转的规避机动，因此此时通过推理，右转机动的概率逐渐上升。如图10的空战态势推理结果，由于载机在进入发射时刻攻击区时发射导弹，因此作战初期空战态势是我方导弹占优。然而随着时间的推移，我方导弹的优势会随着目标机动而下降。然后通过加入决策修正指令，我方导弹重新进入了动态的攻击区，因此优势又重新上升。当然，制导指令的补偿作用是有限的，是应该收到导弹自身能量和机动能力的严格限制，否则将不具备实用价值，因此，决策网络所能提供的修正能力也是有限的。当导弹偏离攻击区过远，则无论决策网络做出何种判断，都无法使得导弹重新回到攻击区，因此，每一时刻空空导弹的修正过载指令都不可超过导弹自身的机动能力的限制。

本发明针对空空导弹由于高机动目标所导致的命中率低的问题，提出了一种基于决策贝叶斯网络的空空导弹轨迹动态优化方法，解决了传统利用发射时刻攻击区做决策而导致决策的不准确与不及时的缺点，从而提升了空空导弹应对超视距空战下弹目态势变化日趋剧烈的决策能力，为机载武器系统攻防对抗的国防工程应用提供新思路。

空战态势评估与决策技术是未来空战中的关键词，智能化的决策辅助系统将模仿人类的思维和判断能力，为系统提供关键性的态势判断和战术决策。现有的态势评估与自主决策技术在军事中的应用在无人机领域已较为成熟。然而，随着机载传感器、干扰技术、隐身技术、火控系统等关键技术的不断完善，未来空空导弹的作战环境将会呈现出更加复杂与混沌的状态。被攻击目标的逃逸能力不断增强，战场中敌我态势瞬息万变。因此，为了应对日趋复杂的空战环境，空空导弹同样需要借助更加智能化和自主化的手段来参与空战的博弈。

空空导弹是一个复杂的系统，其性能会随着不同的作战条件而表现出非常大的差异。因此，空空导弹与无人机的态势评估与决策模型不同之处在于，其飞行运动规律不同，影响其自身作战性能的因素也不同，所要解决的决策任务也不同。

反应空空导弹武器系统综合性能的指标有许多，其中最重要的评价指标之一就是导弹攻击区。导弹攻击区作为一种通过建模和仿真所得到的形象的图像化工具，为导弹自身作战效能的评估与决策提供了强有力的参考依据。因此，本发明基于影响空空导弹攻击区边界的主要因素建立了空空导弹机动决策贝叶斯网络模型，为空空导弹提供自适应的轨迹修正能力，解决了传统利用发射时刻攻击区做决策而导致决策的不准确与不及时的缺点，提升了空空导弹应对超视距空战下弹目态势变化日趋剧烈的决策能力，为机载武器系统攻防对抗的国防工程应用提供新思路。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 一种基于贝叶斯网络的空空导弹态势感知与决策方法 [P] . 中国专利： CN113139331A . 2021-07-20
2. 基于D-S证据理论的无人船态势感知及避碰决策方法、装置 [P] . 中国专利： CN112101558A . 2020-12-18
3. A method of situation awareness based on Ontology [P] . 韩国专利： KR20200085557A . 2020-07-15

机译：一种基于本体的态势感知方法
4. An al-based next-generation key information infrastructure network security situational awareness system [P] . 英国专利： GB201814147D0 . 2018-10-17

机译：一种基于al的下一代关键信息基础设施网络安全态势感知系统
5. APPARATUS AND METHOD FOR SECURITY SITUATION AWARENESS AND SITUATION INFORMATION GENERATION BASED ON SPATIAL LINKAGE OF PHYSICAL AND IT SECURITY [P] . 韩国专利： KR20120068611A . 2012-06-27

机译：基于物理和IT安全的空间链接的安全态势感知和态势信息生成的装置和方法