首页> 中国专利> 水声目标识别模型的训练方法及水声目标识别方法

水声目标识别模型的训练方法及水声目标识别方法

页面导航

摘要
著录项
法律信息
说明书
相似文献

摘要

本发明公开了一种水声目标识别模型的训练方法及水声目标识别方法，其中训练方法包括：获取多幅水下声波图像及其对应的标注图像；确定水下声波图像的特征向量及标注图像的特征向量；对水下声波图像的特征向量进行方差预测，将方差输入至对抗生成网络的噪声生成器中，得到幅度服从瑞利分布的对抗噪声；根据对抗噪声和水下声波图像的特征向量确定对抗例；将对抗例和标注图像的特征向量输入至对抗生成网络的噪声判别器中，训练噪声生成器的参数和噪声判别器的参数。本发明采用基于对抗生成网络构建的自适应无监督噪声生成网络生成对抗例，实现自动添加噪声的功能，使得水声目标识别模型的可泛化性及噪声攻击的鲁棒性得到大幅提升。

著录项

公开/公告号CN114841220A

专利类型发明专利
公开/公告日2022-08-02

原文格式PDF
申请/专利权人北京邮电大学;
展开▼

申请/专利号CN202210639772.4
发明设计人张高唯;王微;韩洪勇;
展开▼

申请日2022-06-08
分类号G06K9/00(2022.01);G06K9/62(2022.01);G06N3/04(2006.01);G06N3/08(2006.01);
代理机构西安迪业欣知识产权代理事务所(普通合伙) 61278;
代理人校丽丽
地址 100876 北京市海淀区西土城路10号
入库时间 2023-06-19 16:16:00

法律信息

法律状态公告日

法律状态信息

法律状态
2022-08-19

实质审查的生效 IPC(主分类):G06K 9/00 专利申请号:2022106397724 申请日:20220608

实质审查的生效

说明书

技术领域

本发明公开了一种水声目标识别模型的训练方法及水声目标识别方法，属于水声目标探测技术技术领域。

背景技术

水声目标探测技术是可以在一定范围内实现对水声目标的探测、跟踪、定位与识别的信号处理技术。水声目标探测技术是水声信号处理与探测领域的重要研究方向，是环境感知、目标监测、资源勘探、情报收集等海洋应用领域的核心技术之一，一直是国内外研究学者重点关注的热点问题。具体来说，基于水声目标的探测有助于准确绘制海床的大部分区域，定位管道或电缆路线、障碍物和其他功能。

在复杂海洋环境下，面向越来越低的目标输入信噪比条件，如何提高水声目标识别性能是水声信号处理领域亟待解决的问题。而从目标角度出发，通过研究目标信号在产生、传播与接收过程的特征，并利用目标特征进行高增益处理，以提高对目标信号侦察与识别性能是一种自然的选择。目前，基于特征的目标识别技术发展主要包括5个方面：

(1)基于固有特征量的目标识别技术。所谓固有特征量，就是指目标辐射噪声中受海洋信道长距离传输影响变化较小，或即使有变化，但变化规律已知或者是可控的那一部分分量。根据目标辐射噪声形成和传播机理，固有特征量往往集中在低频、甚低频段，因此此类目标识别技术主要聚焦在目标的低频、甚低频特征识别上。

(2)矢量信号处理方法。水声场既有声压场，也有振速场，随着矢量水听器在工程上的日臻成熟，通过矢量水听器同时获取声压和质点振速矢量，为水声目标识别提供了更多维度上的目标声场特征。在自由场条件下，通过声场声压标量和质点振速矢量联合测量，可对声压、振速、振动加速度、位移、声波强度等特征进行单独或者组合检测，有效区分目标和噪声矢量场，从而达到提高目标识别能力的目的。

(3)基于非高斯、非线性特征提取的目标识别技术。利用Wigner-Vill分布、小波变换、高阶统计、非线性等现代信号处理工具对接收数据进行分析与特征提取，然后进行识别也是基于特征识别的一个较为活跃的研究课题。其中，非高斯信号处理包括高阶统计(高阶谱估计、基于高阶累积量的ARMA模型估计、超定递推辅助变量法参数估计、随机梯度法参数估计等)、盲解卷、非监督自适应滤波(盲均衡器、码率盲均衡器、常数模算法)等方面。非线性信号处理则包括随机共振理论、基于随机统计学理论的非线性时间序列分析(非参数化模型估计、非线性ARMA模型参数估计等)、基于混沌动力学理论的非线性时间序列分析(嵌入维估计、相空间重构技术、分形维和Lyapunov指数估计、全局与局部动力学模型估计、非线性预测与降噪等)、自相似随机信号模型(分数布朗运动、分数高斯噪声、分数Lévy稳定运动)等方面的工作。

(4)基于信号或噪声宽容性特征的处理方法，依赖于较少的传播信道先验知识，通过信号或噪声的依靠鉴别性特征进行处理，改善其宽容性。

(5)基于CNN的水下声学图像识别。

现有技术中的水下声学图像目标识别由于过度依赖水下环境噪声等条件，经典的识别方法(例如模板匹配(TM)方法)的性能不可靠。同时，基于手工设计特征的方法，如高光阴影模式和模板匹配等算法泛化能力弱，无法解释水下声波图像固有表示的特征，不可避免地导致水下声波图像数据的无效学习，难以应用到不同的水下环境。随着基于CNN的目标识别器的出现，普通场景图像目标识别的准确性得到大幅提升。然而，基于CNN的模型在有限数据场景下的泛化能力和鲁棒性很难得到保证。因此，在水下声波上直接使用容易过拟合从而导致识别结果不准确，这主要是由两方面的原因造成：一是可用的水下声波数量很少，不同于丰富的光学图像数据集，高质量水下声波获取成本高，难以收集；二是噪声的扰动是多样化，水下声波成像通常伴随着不同类型和大小的各种噪声，这些噪声使得获取到的水下声波退化并困扰现有的目标识别算法。具体来说，用于训练识别器的有限样本使得优化的参数只适合目标值样本空间，所构建的识别模型无法对不同水下环境中的噪声进行有效的处理。

由于水下声波识别算法面临强烈的环境噪声扰动，为了减轻散斑噪声对检测算法的影响，现有技术中的普遍做法是在水下声波本身的噪声之外引入额外的环境噪声，这有助于增强图像并提高检测算法对于噪声的鲁棒性。然而，直接将散斑噪声作为固定参数引入水下声波通常仅限于有限的样本空间中，无法将其应用在真实的水下环境中。

发明内容

本申请的目的在于，提供一种水声目标识别模型的训练方法及水声目标识别方法，以解决现有技术中直接将散斑噪声作为固定参数引入水下声波进行目标识别时，存在的识别模型泛化能力弱、鲁棒性差的技术问题。

本发明的第一方面提供了一种水声目标识别模型的训练方法，包括：

获取多幅水下声波图像及其对应的标注图像；

确定所述水下声波图像的特征向量及所述标注图像的特征向量；

对所述水下声波图像的特征向量进行方差预测，将所述方差输入至对抗生成网络的噪声生成器中，得到幅度服从瑞利分布的对抗噪声；

根据所述对抗噪声和所述水下声波图像的特征向量确定对抗例；

将所述对抗例和所述标注图像的特征向量输入至对抗生成网络的噪声判别器中，训练所述噪声生成器的参数和所述噪声判别器的参数。

优选地，对所述水下声波图像的特征向量进行方差预测，具体包括：

将所述水下声波图像的特征向量输入至方差预测模块，得到所述水下声波图像的特征向量的方差；

所述方差预测模块包括依次连接的第一卷积层和第一全连接层。

优选地，根据所述对抗噪声和所述水下声波图像的特征向量确定对抗例，具体包括：

根据第一公式确定对抗例，所述第一公式为：

式中，A

优选地，所述对抗生成网络的噪声判别器为卷积神经网络的第二全连接层；

相应的，将所述对抗例和所述标注图像的特征向量输入至对抗生成网络的噪声判别器中，具体为：

将所述对抗例和所述标注图像的特征向量输入至第二全连接层中。

优选地，训练所述噪声生成器的参数和所述噪声判别器的参数，具体包括：

以总损失函数最小为目标函数，训练所述噪声生成器的参数和所述噪声判别器的参数；

所述总损失函数是根据原始损失函数、对抗损失函数和模型损失函数确定的；

所述原始损失函数为所述水下声波图像的特征向量及其对应的标注图像的特征向量之间的损失函数；

所述对抗损失函数为所述标注图像的特征向量和所述对抗例之间的损失函数；

所述模型损失函数为所述水下声波图像的特征向量的分布和所述对抗例的分布之间的损失函数。

优选地，所述总损失函数是根据原始损失函数、对抗损失函数和模型损失函数确定的，具体包括：

根据第二公式确定总损失函数，所述第二公式为：

式中，L

优选地，所述对抗损失函数根据第三公式确定，所述第三公式为：

式中，L

优选地，所述模型损失函数为所述水下声波图像的特征向量的分布和所述对抗例的分布之间的损失函数，具体包括：

利用KL散度，结合所述所述水下声波图像的特征向量的分布和所述对抗例的分布，确定所述模型损失函数。

本发明的第二方面提供了一种水声目标识别方法，包括：

获取待识别水下声波图像；

将所述待识别水下声波图像输入至利用上述水声目标识别模型的训练方法训练得到的水声目标识别模型中，得到识别结果。

本发明的水声目标识别模型的训练方法及水声目标识别方法，相较于现有技术，具有如下有益效果：

本发明基于对抗生成网络构建的自适应无监督噪声生成网络，由于采用了对抗博弈策略生成对抗噪声，因此，其允许训练数据与测试数据存在较大的差异性，使得水声目标识别模型的可泛化性得到很大提升，无需针对不同的水下环境进行调整，易于部署在不同的海洋区域。

本发明在噪声生成过程中采用无监督训练，通过在语义低但分辨率高的特征中引入对抗噪声，实现在合理的范围内自动添加噪声的功能，以使识别模型获得更好的泛化能力并提高噪声攻击的鲁棒性，在不增加计算成本的情况下提高了识别模型对环境噪声的抗干扰性。

附图说明

图1为本发明实施例水声目标识别模型的训练方法的概要流程图；

图2为本发明实施例水声目标识别模型的训练方法的详细流程图；

图3为本发明实施例水声目标识别模型的训练方法中噪声生成网络的结构示意图；

图4为现有技术中对抗生成网络的结构示意图；

图5为本发明实施例水声目标识别方法的概要流程图。

具体实施方式

以下描述中，为了说明而不是为了限定，提出了诸如特定系统结构、技术之类的具体细节，以便透彻理解本发明实施例。然而，本领域的技术人员应当清楚，在没有这些具体细节的其它实施例中也可以实现本发明。在其它情况中，省略对众所周知的系统、装置、电路以及方法的详细说明，以免不必要的细节妨碍本发明的描述。

本发明实施例的第一方面公开了一种水声目标识别模型的训练方法，如图1和图2所示，包括：

步骤1、获取多幅水下声波图像及其对应的标注图像。

声波具备穿透泥土和淤泥的能力，因此水下声波图像相较于水下光学图像可以在更大范围内准确捕获水下目标。故，本发明实施例使用水下声波图像进行目标识别。

本发明实施例中，水下声波图像的标注图像为使用检测框手工标注出目标的标注图像。

步骤2、确定水下声波图像的特征向量及标注图像的特征向量。

本发明实施例中，确定水下声波图像的特征向量及标注图像的特征向量的方法为将水下声波图像及其对应的标注图像输入至卷积神经网络中，利用卷积神经网络的卷积层及池化层确定水下声波图像的特征向量及标注图像的特征向量。

示例性地，在一个更为具体的实施例中，可以使用FasterR-CNN作为基线模型，相应的，确定水下声波图像的特征向量及标注图像的特征向量的具体过程中：

首先使用FasterR-CNN中的第二卷积层提取水下声波图像和标注图像的原始特征向量；

然后将原始特征向量输入至ROI池化层中，得到水下声波图像的特征向量及标注图像的特征向量。本发明实施例中特征向量可表示为：χ＝{χ

步骤3、对水下声波图像的特征向量进行方差预测，将方差输入至对抗生成网络的噪声生成器中，得到幅度服从瑞利分布的对抗噪声。

水下声波回波信号主要受三种噪声的影响，即环境噪声、混响和自噪声，其中混响为主要的噪声来源，尤其是在浅水区。混响被定义为水听器接收到的水或水边界内异质体的散射声能，强度随着散射体的距离和传输信号的强度而变化。基于上述的分析，本发明将混响作为主要的扰动噪声来源来设计抗噪声干扰的水声目标识别模型。根据米德尔顿的海底混响模型，t时刻的混响可以定义为如公式(1)所示的实部和虚部之和：

X(t)＝Re(t)+jIm(t) (1)

假设V

根据中心极限定理(CLT)，如果N足够大，Re(t)和Im(t)将收敛于高斯分布。对于随机散点，V

其中，

将对抗噪声与水下声波图像的特征向量利用噪声模型进行结合，即可得到含有噪声的近似于真实情况的特征向量，本发明将生成对抗噪声及得到近似于真实情况的特征向量的网络记为噪声生成网络，其结构如图3所示。噪声生成网络的设计遵循两个原则：(1)噪声生成网络的训练目的为从卷积特征空间生成符合真实样本分布的噪声扰动，而不是简单的在输入图像上添加随机扰动值；(2)噪声生成网络无需增加额外的计算成本，并且容易嵌入到识别模型中以保证端到端的训练。

基于上述原则，步骤3具体包括：

步骤31、将水下声波图像的特征向量输入至方差预测模块，得到水下声波图像的特征向量的方差；其中方差预测模块包括依次连接的第一卷积层和第一全连接层，具体地：

步骤311、将水下声波图像的特征向量首先输入至第一卷积层，利用第一卷积层对特征向量进行降采样，减少特征维度。本发明实施例对第一卷积层的卷积核尺寸不作限定，可以为4*4的卷积核，也可以为2*2的卷积核，具体卷积核的尺寸可以根据需要设定。

步骤312、将第一卷积层输出的降采样后的特征输入至第一全连接层，得到水下声波图像的特征向量的方差。第一全连接层的作用为对降采样过后的特征进行融合。本发明实施例中第一全连接层的数量为至少一个。当为多个第一全连接层时，可以使得所得的方差更为精确。

示例性地，在一个更为具体的实施例中，如图3所示，方差预测模块包括一个卷积层和两个级联的第一全连接层。经过最后一个第一全连接层后输出的方差可表示为：σ＝{σ

步骤32、将方差输入至对抗生成网络的噪声生成器中，得到幅度服从瑞利分布的对抗噪声。

本发明实施例中的噪声生成器为基于卷积神经网络的噪声生成器。

步骤4、根据对抗噪声和水下声波图像的特征向量确定对抗例。

一旦方差σ

式中，A

步骤5、将对抗例和标注图像的特征向量输入至对抗生成网络的噪声判别器中，训练噪声生成器的参数和噪声判别器的参数。

本发明实施例中，将卷积神经网络的全连接层作为对抗生成网络的噪声判别器，为与方差预测模块中的第一全连接层进行区分，本发明实施例将作为噪声判别器的全连接层记为第二全连接层，第二全连接层中全连接层的数量为至少一层，当为多层时，可提高识别精度。

进一步地，本发明实施例中训练噪声生成器的参数和噪声判别器的参数，具体包括：

以总损失函数最小为目标函数，训练噪声生成器的参数和噪声判别器的参数；

其中总损失函数是根据原始损失函数、对抗损失函数和模型损失函数确定的；原始损失函数为水下声波图像的特征向量及其对应的标注图像的特征向量之间的损失函数；对抗损失函数为对抗例和标注图像的特征向量之间的损失函数；模型损失函数为水下声波图像的特征向量的分布和对抗例的分布之间的损失函数。

本发明在模型的训练方法过程中，使用总损失函数来微调模型，使其对各种噪声攻击具有鲁棒性并且具有更强的泛化能力。

本发明实施例中的总损失函数如公式(7)所示：

式中，L

其中原始损失函数如公式(8)所示：

式中，L

基于对抗性学习的方法旨在生成欺骗判别器的对抗性示例(对抗例)，因此本发明实施例直接将对抗性例作为原始示例的额外的表示辅助决策来预测类别和边界框，对抗损失函数如公式(9)所示：

式中，L

模型的损失通过原始样本和对抗样本的分布之间的差异来模拟真实的噪声攻击r

式中，L

本发明引入与水下声波相关的对抗性噪声扰动来泛化模型并提高噪声攻击的鲁棒性，具体为：在利用池化层获取水下声波图像的特征向量后，通过方差预测模块(包含卷积层和全连接层)得到特征向量对应的方差。然后将方差输入至对抗生成网络的噪声生成器中，通过噪声生成器以随机方式生成幅度遵循瑞利分布的噪声。再将噪声生成器生成的噪声添加到水下声波图像的特征向量中，通过特定的噪声模型生成对抗例。最后结合使用对抗例和标注图像的特征向量训练噪声生成器和噪声判别器，得到训练完成后优化的水声目标识别模型。本发明在噪声生成过程中采用无监督训练而不使用带标签的噪声数据，通过在语义低但分辨率高的特征中引入噪声，实现在合理的范围内自动添加噪声的功能，以使模型获得更好的泛化能力并提高噪声攻击的鲁棒性，在不增加计算成本的情况下实现模型对环境噪声的抗干扰性。

本发明使用对抗生成网络构建了一种非固定可学习的自适应噪声生成方法，从而对环境噪声进行建模。主要包括了水下声波检测模型(基线模型，本发明实施例中使用Faster R-CNN作为基线模型)和无监督噪声生成网络。其中的无监督噪声生成网络可以根据需要嵌入至合适的基线模型中。本发明通过带有辅助部分噪声块的横向噪声对抗生成网络生成符合特有噪声特性的对抗例，增强岸基阵水下声波目标检测的鲁棒性和泛化能力。本发明使用的对抗生成网络的结构如图4所示。

本发明的第二方面公开了一种水声目标识别方法，其流程如图5所示，包括：

步骤101、获取待识别水下声波图像；

步骤102、将待识别水下声波图像输入至利用上述水声目标识别模型的训练方法训练得到的水声目标识别模型中，得到识别结果。

本发明基于对抗生成网络构建的自适应无监督噪声生成网络，其可以无监督方式产生符合真实水下环境的对抗性噪声样本(对抗例)，将其加入岸基阵获取的水下声波中来消除水下环境混响所带来的噪声干扰，提高了水下声波目标识别的鲁棒性。

本发明的水声目标识别方法所使用的模型具有可泛化性。自适应抗噪声水下声波目标识别模型由于采用了对抗博弈策略来生成噪声样本，因此，其允许训练数据与测试数据存在较大的差异性，使得整体模型的可泛化性得到很大提升，无需针对不同的水下环境进行调整，易于部署在不同的海洋区域。

以上所述，仅是本申请的几个实施例，并非对本申请做任何形式的限制，虽然本申请以较佳实施例揭示如上，然而并非用以限制本申请，任何熟悉本专业的技术人员，在不脱离本申请技术方案的范围内，利用上述揭示的技术内容做出些许的变动或修饰均等同于等效实施案例，均属于技术方案范围内。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 水声目标识别模型的训练方法及水声目标识别方法 [P] . 中国专利： CN114841220A . 2022-08-02
2. 信号处理与深-浅网络多模型融合的水声目标识别方法 [P] . 中国专利： CN112364779A . 2021-02-12
3. IMAGE PROCESSING METHOD, TARGET RECOGNITION MODEL TRAINING METHOD, AND TARGET RECOGNITION METHOD [P] . WO2021249233A1 . 2021-12-16

机译：图像处理方法，目标识别模型训练方法和目标识别方法
4. Target recognition system and target recognition method executed by the target recognition system, target recognition program executed on the target recognition system, and recording medium storing the target recognition program [P] . 欧洲知识产权局专利： EP2669846B1 . 2017-11-01

机译：由目标识别系统执行的目标识别系统和目标识别方法，在目标识别系统上执行的目标识别程序以及存储该目标识别程序的记录介质
5. Target recognition system, target recognition method executed by the target recognition system, target recognition program executed on the target recognition system, and recording medium storing the target recognition program [P] . 欧洲知识产权局专利： EP2669845A3 . 2014-11-19

机译：目标识别系统，由目标识别系统执行的目标识别方法，在目标识别系统上执行的目标识别程序以及存储该目标识别程序的记录介质