摘要:为了提高无人作战效率,将深度强化学习应用于雷达对抗侦察无人机的航线规划中.首先对雷达对抗的侦察行动进行分析,建立无人机飞行航线仿真与分幕评价侦察效果的模型;然后根据训练强化学习智能体的需求,对规划航线过程中所需信息进行了参数化,以雷达对抗侦察行动的特点设计了动作与奖励机制,给出了适用的智能体神经网络结构和训练算法.仿真结果表明,与两种固定航线的规划策略相比,采用本文深度强化学习的航线规划方法,在平均收益上提高了37%,完成既定侦察任务次数提高了超过1.5倍,完成任务平均消耗的航程减少了13%.