首页> 中文期刊> 《遥感学报》 >融合NetVLAD和全连接层的三元神经网络交叉视角场景图像定位

融合NetVLAD和全连接层的三元神经网络交叉视角场景图像定位

         

摘要

研究场景图像的地理定位问题在室外定位、目标搜寻、军事侦察等领域具有重要意义.针对街景影像与鸟瞰影像之间的交叉视角场景图像匹配与定位问题,本文提出了一种融合可训练局部聚集描述子向量NetVLAD(Net Vector of locally aggregated descriptors)和全连接层的三元神经网络(Triplet Network)定位方法(Tri-NetVLAD).三元神经网络由三组卷积神经网络CNN(Convolutional Neural Networks)构成,能同时处理3张影像,通过增大不匹配像对间的距离,减小匹配像对间的距离,实现图像检索与匹配;NetVLAD和全连接层的融合可以加强特征间的关联性.本文将CNN提取的局部卷积特征分别通过NetVLAD层和全连接层得到全局描述符与特征向量,并将二者融合,有效地提升了局部特征间的关联性,并保留了不同局部特征之间的差异性,提升了模型的定位精度;改进了 DBLloss(Distance-based layer loss),通过加入参数λ增强函数判别困难样本的能力,在提升模型的收敛速度和稳定性的同时也提升了模型的定位精度.在美国Vo and Hays公开数据集上的实验结果表明,Tri-NetVLAD取得了优于MCVPlaces、Triplet eDBL-Net和CVM-Net等现有方法的定位精度,在测试集上的精度高于63%.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号