首页> 中国专利> 基于逻辑回规分类器的帧内编码单元快速选择方法

基于逻辑回规分类器的帧内编码单元快速选择方法

摘要

本发明提供一种基于逻辑回规分类器的帧内编码单元快速选择方法,所述方法将一个编码单元是否向下划分建模为“向下划分”和“不向下划分”两类的分类问题,采用逻辑回规分类器来解决这个两类分类问题。离线学习三个视频序列得到逻辑回规分类器最优的逻辑回规系数,通过计算多个候选特征的有效性来选择最佳的决策特征。利用离线学习得到的逻辑回规分类器对帧内编码单元进行快速选择,从而跳过其它不必要的预测编码模式计算,能够有效的降低HEVC编码器帧内编码复杂度,有利于实时HEVC编码器的实时应用。

著录项

  • 公开/公告号CN105430391A

    专利类型发明专利

  • 公开/公告日2016-03-23

    原文格式PDF

  • 申请/专利权人 上海交通大学;

    申请/专利号CN201510885775.6

  • 申请日2015-12-04

  • 分类号H04N19/105(20140101);H04N19/119(20140101);H04N19/147(20140101);H04N19/159(20140101);

  • 代理机构31236 上海汉声知识产权代理有限公司;

  • 代理人徐红银;郭国中

  • 地址 200240 上海市闵行区东川路800号

  • 入库时间 2023-12-18 15:07:46

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2018-11-16

    授权

    授权

  • 2016-05-04

    实质审查的生效 IPC(主分类):H04N19/105 申请日:20151204

    实质审查的生效

  • 2016-03-23

    公开

    公开

说明书

技术领域

本发明属于视频编码技术领域,基于新一代视频编码标准HighEfficiencyVideo Coding(HEVC),具体对HEVC的帧内预测的编码单元进行快速选择。

背景技术

为了解决高清及超高清视频急剧增长的数据率给网络传输带来的冲击,国际电 信联盟电信标准化部门(InternationalTelecommunicationUnion-Telecom,ITU-T)的 视频编码专家组(VideoCodingExpertsGroup,VECG)和国际标准化组织/国际电工 技术委员会(InternationalOrganizationforStandardization/International Electro-technicalCommission,ISO/IEC)的动态图像专家组(MovingPictureExperts Group,MPEG)于2010年1月成立了视频编码联合工作组(JointCollaborativeTeam onVideoCoding,JCT-VC),该工作组制定了具有更高的压缩效率的新一代视频压 缩标准HEVC(HighEfficiencyVideoCoding)。

作为新一代视频编码标准,HEVC(H.265)仍然属于预测加变换的混合编码框 架,并对该框架的各个模块进行了技术创新,包括灵活划分方式、更加精细的帧内 预测、全新的Merge模式、基于竞争的运动矢量预测、基于离散余弦变换的亚像素 插值、样点自适应补偿滤波器(SampleAdaptiveOffset,SAO)、Tile和追赶编码并 行处理技术等。这些新的技术使得HEVC编码效率比H.264/AVC提高了一倍。然 而,巨大而灵活的编码参数集的优化选择,也使得HEVC的编码器的复杂度急剧增 加,这阻碍了HEVC标准的应用与推广。因此,在保证视频图像编码质量的同时, 研究HEVC的快速、高效的编码优化算法至关重要。

发明内容

本发明的目的在于保证编码性能的条件下,快速进行HEVC帧内编码单元划分 的选择以减少编码运算复杂度。基于此目的提供了一种基于逻辑回规分类器的帧内 编码单元快速选择方法,能够极大地降低HEVC的编码复杂度。

为实现上述的目的,本发明提供一种基于逻辑回规分类器的帧内编码单元快速 选择方法,将编码单元的划分建模为分类问题,通过直接分析输入视频数据的特征, 用简单而高效的逻辑回规分类准则进行划分的快速预测,从而避免了基于率失真优 化的遍历搜索算法,降低了编码器的计算复杂度。并挖掘与编码单元划分密切相关的 输入图像数据特征,选择最优特征子集作为决策特征。

本发明主要包括两部分,第一部分是离线学习得到逻辑回规分类器,第二部分 是将学习得到的逻辑回规分类器用于CU划分选择过程中。

所述方法包括如下步骤:

步骤1:离线统计学习多个视频序列,采用HEVC中标准过程编码每个编码单 元(CU),并记录不同量化参数(QP)和不同编码深度下最优CU划分为“向下划 分”和“不向下划分”时候选特征的值;

步骤2:逻辑回规分类器输入特征的选择,将步骤1离线统计得到的候选特征 值进行比较,选出最佳输入特征;

步骤3:根据步骤2得到的最佳输入特征,运用梯度上升算法求得逻辑回规分 类器的最优逻辑回规系数;

步骤4:将步骤3得到的逻辑回规分类器用到CU划分选择过程中;

步骤5:对本层CU的所有预测模式进行编码,并求得逻辑回规输入特征的值;

步骤6:将步骤5求得的输入特征的值代入逻辑回规分类器中判定当前CU是 否向下划分,如果判定当前CU为“不向下划分”则转步骤8,否则转步骤7;

步骤7:CU继续向下划分成4个相同的子CU;

步骤8:结束当前编码树单元(CTU)的编码,进行下一个CTU的编码。

与现有技术相比,本发明具有如下的有益效果:

本发明为基于逻辑回规分类的CU切分选择方法,将CU的划分建模为两类分 类问题即“向下划分”和“不向下划分”,通过直接分析输入视频数据的特征,用简单 而高效的逻辑回规分类准则进行划分的快速预测,在保证编码质量的前提下,大大 降低了帧内编码的计算复杂度。经验证,在使用了该发明之后,在HEVC的参考编 码器HM16.0下,针对多个视频序列编码器,编码速度平均有55.5%的速度提升, 而BD-rate(相同质量下的码率)仅有1.29%的增加。

附图说明

通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、 目的和优点将会变得更明显:

图1是本发明一实施例的逻辑回规分类的结果示意图;

图2是本发明一实施例的基于逻辑回规分类CU划分提前判定流程图;

图3是本发明一实施例与原始编码器率失真(RD)性能曲线比较图。

具体实施方式

下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人 员进一步理解本发明,但不以任何形式限制本发明。应当指出的是,对本领域的普通技 术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进。这些都属于 本发明的保护范围。

本发明基于新一代视频编码标准HighEfficiencyVideoCoding(HEVC),提供一种 对HEVC的帧内预测的编码单元进行快速选择的方法。具体实施步骤如下:

步骤1:离线统计学习3个视频序列,并记录各种参数,具体是:

采用HEVC中标准过程编码CU,并记录不同量化参数(QP)和不同编码深度下最 优CU划分为“向下划分”和“不向下划分”时候选特征的值。其中候选的特征包括直接预 测(DC)模式的预测误差的方差、当前层最优模式的预测误差的方差、当前层最优模 式的量化系数的方差、当前层最优模式的率失真代价值、当前层最优模式编码所需比特。

本步骤中,离线统计学习3个视频序列,在其他实施例中,也可以根据需要设定其 他的视频序列数目,这对本发明的实现没有本质性影响。

步骤2:逻辑回规分类器输入特征的选择,将步骤1离线统计得到的候选特征值 进行比较,选出最佳输入特征,具体是:

因为输入数据的特征选择对分类器的设计至关重要,如果相关性不高甚至不相关的 输入数据,不但不会帮助分类,反而会使得分类器不准确。相反,如果选择出好的特征, 可以更好地理解数据,可以降低对于样本的存储开销,可以减少训练和预测的时间,可 以提高预测性能。因此,特征选择对于基于逻辑回规分类器的帧内编码单元快速选择方 法来说,显得更加重要。F-score是衡量两个集合即“向下切分”和“不向下划分”的数据差 异性的评价标准,它计算简单,其定义如下:

F(i)=(xi+-xi)2+(xi--xi)21n+-1Σk=1n+(xk,i+-xi+)2+1n--1Σk=1n-(xk,i--xi-)2---(1)

其中,分别是全部样本、“不向下划分”类样本、“向下划分”类样本中输入 矢量的第i个特征的均值,n+,n-分别是“不向下划分”类样本的总数、“向下划分”类样 本的总数,分别是“不向下划分”类、“向下划分”类中第k个样本的第i个特征。 从上式可得出,第i个特征在两类中的均值与所有样本的均值的差异越大,并且各自类 别中第i个特征的方差越小,F-score的值越大,那么第i个特征与类别的分离性越大, 即该特征对分类有很好的指导作用。分别计算候选特征的F-score值,然后选取值最大 的两个特征作为分类器的输入特征。

步骤3:根据步骤2得到的最佳输入特征,运用梯度上升算法求得逻辑回规分类 器的最优逻辑回规系数。梯度上升法基于的思想是:要找到某函数的最大值,最好的 方法是沿着函数f(w)的梯度方向探寻,计算公式如下:

w:=w+α·wf(w)---(2)

其中向量w是要找到最佳参数,α为沿梯度方向移动的大小,表示梯度,表 示函数f(w)的梯度,f(w)的定义如下:

f(w)=w0x0+w1x1+…+wnxn(3)

其中wi,i=0,1…n是向量w的一个分量,xi,i=0,1…n是输入特征值。公式(2) 将一直被迭代执行,直到达到指定的迭代次数或者梯度上升法达到允许的误差范围。

步骤4:将步骤3得到的逻辑回规分类器用到CU划分选择过程中。

步骤5:对本层CU的所有预测模式进行编码,并求得逻辑回规输入特征的值,具 体是:

开始编码当前编码深度层CU的所有预测模式,并得到当前编码深度最优的编码模 式,计算步骤2选择的输入特征的值,得到输入分类器的特征值。

步骤6:将步骤5求得的输入特征的值代入逻辑回规分类器中判定当前CU是否向 下划分,如果判定当前CU为“不向下划分”则转步骤8,否则转步骤7,具体是:

将步骤5求得的输入特征值代入逻辑回规分类器中判定当前CU是否向下划分,判 定准则如下:

p(Cunsplit|x)p(Csplit|x)>1,choosing>Cunsplitelse,choosing>Csplit---(3)

其中Cunsplit和Csplit分别表示“不向下划分”和“向下划分”,x为步骤5得到的输入特 征值。p(Csplit|x)表示“向下划分”的后验概率,计算公式如下:

p(Csplit|x)=11+e-z---(4)

其中z是特征值x的线性组合,计算公式如下:

z=w0x0+w1x1+…+wnxn(5)

其中wi,i=0,1…n是步骤(3)求得的最优逻辑回规系数,xi,i=0,1…n是输入 特征值。而“不向下划分”的后验概率p(Cunsplit|x)计算如下:

p(Cunsplit|x)=1-p(Csplit|x)(6)

若判定当前CU为“不向下划分”则转步骤(8),否则转步骤7。

步骤7:CU继续向下划分成4个相同的子CU,具体是:

当前层CU继续向下划分成4个相同的子CU,进入下一编码深度层的帧内预测模 式编码。

步骤8:结束当前编码树单元(CTU)的编码,进行下一个CTU的编码。

图1是本发明所提出的逻辑回规分类的结果示意图,图2是本发明所提出的基于逻 辑回规分类CU划分提前判定流程图,图3则是本发明与原始参考编码器的RD性能比 较图,从图可以看出两个RD曲线重合,表明RD性能没有明显下降。经验证,在使用 了该发明之后,在HEVC的参考编码器HM16.0下,针对多个视频序列编码器平均有 55.5%的速度提升,而BD-rate(相同质量下的码率)仅有1.29%的增加。

以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上 述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变形或修改, 这并不影响本发明的实质内容。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号