首页> 中文学位 >基于稀疏编码和计数的鲁棒视频追踪
【6h】

基于稀疏编码和计数的鲁棒视频追踪

代理获取

目录

声明

摘要

1 绪论

1.1 研究背景及意义

1.2 相关工作

1.3 本文贡献

1.4 本文的主要内容及章节安排

2 代表性的视频追踪算法

2.1 粒子滤波

2.1.1 运动模型

2.1.2 观测模型

2.2 基于增量的视频追踪(IVT)

2.3 基于稀疏原型的视频追踪

2.3.1 L1追踪算法

2.3.2 SP追踪算法

2.3.3 L0正则化追踪算法

3 基于稀疏编码和计数的视觉追踪

3.1 基于粒子滤波的视觉跟踪

3.2 基于贝叶斯框架的目标表示

3.3 快速数值算法理论

3.3.1 APG算法求解公式(3.7)

3.3.2 结合L1和L0正则化闭解

3.3.3 组合模型(3.25)的分析

3.4 视觉跟踪中的正交字典学习

3.4.1 字典初始化

3.4.2 正交字典更新

3.4.3 重新初始化字典

3.5 实验结果

3.5.1 定性评价

3.5.2 定量评价

结论

参考文献

攻读硕士学位期间发表学术论文情况

致谢

展开▼

摘要

视觉跟踪在计算机视觉中扮演一个重要的角色,有很多应用,如视频监控、机器人运动分析和人机交互。尽管有各种算法提出,但现实的视频序列中存在着复杂物体运动、遮挡、光照变化和杂乱的背景等,这使得视频追踪依然是一个有挑战性的工作。在本文中,我们提出了一个新颖的基于稀疏编码和计数的视觉跟踪法来解决上述问题。
  由于子空间线性表示下,重建目标有时仍然会存在遮挡或背景杂乱,稀疏约束允许跟踪器有效地克服这些困难的挑战。我们知道,贝叶斯框架己成功应用于选择变量当施加合适的先验。拉普拉斯先验被用来使得线性模型表示更加稀疏,然而它会导致过度惩罚。为了进一步加强系数稀疏性,减少其过度惩罚,我们对每个系数分配一个伯努利变量。在贝叶斯框架下通过执行最大后验概率(MAP)得到我们稀疏编码和计数目标表观模型。该方法被证明是采用L0范数和L1范数的结合来规范增量更新正交字典的系数。为了实现实时追踪,我们提出了一种快速而有效的数值算法来求解该模型。尽管它是一个NP问题,提出的加速近端梯度(APG)法能够保证快速地收敛到问题的解。同时,为了处理追踪漂移,我们提出了一种重新初始化字典方法,它可以在误差超过阈值时更新字典,重新追踪。此外,我们对L0范数和L1范数结合的正则化提出了一个闭解。为了验证我们方法的有效性,我们在遮挡、快速运动、光照变化、姿势和尺度变化、背景混杂等多个视频序列上进行实验,实验结果表明,在多个充满挑战性的视频序列上,我们的方法从速度和质量上都取得了值得称赞的实验结果。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号