首页> 中文学位 >基于注意力模型和特征层仿射对齐模型的行人再识别研究
【6h】

基于注意力模型和特征层仿射对齐模型的行人再识别研究

代理获取

摘要

当今社会,摄像头分布在城市的各个地方,由此获得了大量的监控视频数据。在监控视频数据中,对人的分析是最主要的。作为最近几年计算机视觉研究方面热门话题之一的行人再识别(Person Re-identification,Re-ID),就是在复杂的实际环境中人脸失效的情况下,衍生而来的一个核心难点问题。它旨在检索跨视域下拍摄的图像或视频中的同一个人。其研究具有广阔的应用前景,包括刑事侦查领域追捕犯人,搜寻失踪人口以及商场行人统计等。随着深度学习在计算机视觉领域的火热,Re-ID采用深度学习在性能上达到了一个新的水准,识别率和平均准确率都实现了更高层次的突破。然而,这些方法在可能包含更多候选行人图像的真实场景中仍未达到实际应用的要求,需要进一步的研究。本文首先总结国内外Re-ID的研究方法和现状,包括从传统的手工设计特征模型和度量学习方法到目前基于深度学习的主流方法,分析了Re-ID任务所面临的主要挑战。随后,提出了改进的算法网络架构,并在一些具有挑战性的公开数据集Market-1501,DukeMTMC-reID和MSMT17上论证了算法的可行性和有效性,最后的实验结果对所提出模型的有效性和鲁棒性做了充分的论证。论文的具体工作如下: 1.对于行人姿态变化大,背景杂乱,遮挡严重等问题,本文提出了一种基于区域注意力的行人再识别模型(Region Attention Model,RAM)。其主要思想是:考虑到卷积神经网络在高级语义特征上对行人有较好定位的特性,在该网络对行人响应较高的深层引入区域注意力,进一步的学习行人显著性语义特征,再结合行人高层全局特征得到对姿态、光照、背景变化等鲁棒性更强区分度更高的行人特征表示,模型结构简单易于实现,不需要额外的监督信息。 2.对于检测误差带来的行人不对齐以及全局特征的局限性等问题,本文提出了一种基于特征层仿射对齐的精细化行人再识别模型。通过卷积网络的学习得到仿射变换所需要的参数,自适应的定位和对齐行人,再学习良好对齐的行人局部特征,这样的局部特征更适合行人相似性的匹配,解决了全局特征的局限性,减少了行人不对齐的影响,进而提升了检索精度。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号