首页> 中文学位 >基于ROI和JND的3D视频编码研究
【6h】

基于ROI和JND的3D视频编码研究

代理获取

目录

声明

致谢

摘要

1 绪论

1.1 课题背景及研究的目的和意义

1.2 国内外研究现状及分析

1.2.1 基于JND的视频编码

1.2.2 基于ROI的视频编码

1.2.3 国内外研究现状总结

1.3 本文的主要研究内容与结构

2 3D视频编码基础及人类视觉系统

2.1 3D视频编码基础

2.2 人类视觉特性

2.3 基于视觉特性的视频编码

2.4 图像质量评价

2.5 本章小结

3.1 引言

3.2 基于深度的立体投影显著性算法

3.2.1 简介

3.2.2 三维重建和立体投影

3.2.3 投影图像的处理

3.2.4 深度显著图和3D显著图的生成

3.2.1 实验结果及分析

3.3 基于背景检测显著性算法

3.3.1 简介

3.3.2 基本概念

3.3.3 颜色显著图

3.3.4 深度显著图的计算

3.3.4 显著图的融合

3.3.5 实验结果及分析

3.4 本章小结

4 3D场景下的JND模型研究

4.1 目前常见的JND模型

4.2 基于DCT变换的JND模型

4.3 改进的3D-JND模型

4.3.1 MJND

4.3.3 DJND

4.4 实验结果及分析

4.5 本章小结

5.1 引言

5.2 基于ROI和JND的精细分级量化策略

5.3 实验结果及分析

5.4 本章小结

6 结论

参考文献

作者简历及攻读硕士学位期间取得的研究成果

学位论文数据集

展开▼

摘要

3D视频在带给人身临其境的视觉体验的同时,也因其庞大的数据量而给视频的存储和传输带来了巨大的压力。因此,如何在保证视频主观质量的前提下,尽可能占用更小的传输带宽是3D视频编码领域亟待解决的重大挑战。以往的编码算法主要集中精力于去除视频的空间冗余、时间冗余等,而我们将注意力转向于去除视频中的视觉冗余。为此,本文提出把人眼视觉特性与现有的H.264编码框架相结合,着力于利用3D视频中的感兴趣区域和恰可察觉失真,在保证主观质量的前提下,尽可能减少码率,最终提高压缩效率。
  感兴趣区域(Region Of Interest,ROI)编码是指通过控制视频背景区域与ROI区域的宏块量化参数(Quantization Parameter,QP)的分配,在保证视频主观质量的同时提高压缩效率。对2D视频而言,ROI检测性能不稳定,这限制了ROI编码的推广与使用。而3D视频中包含的深度信息与人类视觉模型(HVS)中感兴趣程度间有着十分密切的联系,这为3D视频ROI区域检测提供了有利条件。因此本文综合深度信息,提出了两种3D显著性检测算法。
  恰可察觉失真(Just Noticeable Distortion,JND)是指由人类视觉系统的生理特性和心理特性所造成的,对图像不同区域具有不同失真敏感度的现象。当图像特定区域的失真程度低于JND阈值时,人眼无法感知其存在。JND视频编码技术主要针对视频的视觉冗余,在编码时结合人眼视觉特性,合理分配编码资源,进一步提高编码的效率。
  本文主要利用3D视频(单视点视频加深度图格式)中的纹理和深度信息,对其进行与H.264标准兼容的ROI和JND编码的研究。本文首先研究了人眼立体视觉系统模型,分析了景物深度与HVS中感兴趣程度间的关系。由此,提出了基于深度的立体投影显著性检测算法;进一步发掘深度和场景中背景区域的关系,提出了基于背景检测的3D显著性检测算法。针对人眼对不同深度的注意程度不同,以及不同视点间物体的相互遮盖等关系,提出了一种利用深度图计算JND阈值的模型。之后,探讨了H.264压缩标准和压缩后比特率的构成和调整方式。据此,在视频进行H.264压缩前,通过结合ROI和JND对视频帧的区域划分,建立更加符合人眼视觉特性的分级量化模型,指导人眼感兴趣区域量化参数的选取,进一步提升ROI区域的主观质量并提高编码效率。最后,从理论和实验两方面,分析了这个分级量化策略对视频压缩后比特率的影响。实验结果表明本文的方案在同等码率下,以较低失真保存了人眼视觉敏感区域,为用户提供了较好的视觉体验。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号