公开/公告号CN1938728A
专利类型发明专利
公开/公告日2007-03-28
原文格式PDF
申请/专利权人 汤姆森许可贸易公司;
申请/专利号CN200580010808.7
发明设计人 海因茨·维尔纳·基森;
申请日2005-01-22
分类号G06T9/00(20060101);
代理机构11021 中科专利商标代理有限责任公司;
代理人戎志敏
地址 法国布洛涅
入库时间 2023-12-17 18:25:15
法律状态公告日
法律状态信息
法律状态
2022-01-04
未缴年费专利权终止 IPC(主分类):H04N 7/50 专利号:ZL2005800108087 申请日:20050122 授权公告日:20091028
专利权的终止
2019-06-14
专利权的转移 IPC(主分类):H04N7/50 登记生效日:20190528 变更前: 变更后: 申请日:20050122
专利申请权、专利权的转移
2019-06-14
专利权人的姓名或者名称、地址的变更 IPC(主分类):H04N7/50 变更前: 变更后: 申请日:20050122
专利权人的姓名或者名称、地址的变更
2009-10-28
授权
授权
2007-06-13
实质审查的生效
实质审查的生效
2007-03-28
公开
公开
查看全部
技术领域
本发明涉及使用每一个都包括多个像素宏块的预测和非预测画面,对画面序列进行编码的方法和装置,具体地,涉及对非预测画面中的像素宏块进行编码。
背景技术
在诸如MPEG之类的已知视频压缩系统中,通过使用如离散余弦变换(DCT)编码,在帧间或场间模式下,对多数视频帧或场进行编码。为了提高编码/解码效率,在一些视频压缩系统中,使用帧内预测,例如MPEG-4AVC。
在许多视频压缩系统中,例如在MPEG中,常常对视频帧在帧内模式下进行编码,例如,MPEG中的GOP(画面组)的第一帧。通常,GOP包含帧内、帧间或预测的、以及双向预测的(I、P、B)画面。将画面划分为,例如8*8亮度像素块,或者划分为16*16亮度像素宏块,其中,将相应的色度像素块分配给每个亮度像素宏块。宏块可以代表一组四个8*8亮度块和两个相关的8*8色度块。在这样的情况下,基于宏块和块进行编码和解码。
发明内容
尽管在多数情况下,帧内模式(或非预测模式)编码画面需要比帧间或场间编码画面更多的比特来用于编码,但是通常假设需要帧内编码的帧来允许视频序列中的接入点,并限制例如信道错误传播。
本发明要解决的问题是,节约视频序列中的帧内编码所需的部分附加比特,而仍然向视频序列提供接入点,并且仍然限制错误传播。由权利要求1中公开的方法解决该问题。权利要求3中公开了利用该方法的装置。
根据本发明,为了限制错误传播、并使接入点或入口能够用于开始对视频序列的解码,仅对一些帧内模式的像素块、像素宏块、或者其它特定像素区域进行帧内编码就足够了,在这些像素块、像素宏块、或者其它特定像素区域中,至少一个像素用于预测一些未来画面的内容信息,而对其它像素块、像素宏块、或者特定像素区域则在帧间模式下进行编码。
为了检查能够对帧内的哪个块或宏块在帧间模式下进行编码,执行下个P帧(=帧间模式帧)或P场(=场间模式场)的运动补偿预分析,以发现那些块,那些块由于在块中没有像素用于对下面的P画面的预测,所以将不需要在帧内模式下进行编码。
I帧或场中用于构建下个B帧或B场中的预测宏块的块、宏块或其它特定像素区域,也可以在帧间模式下进行编码。
本发明处理的优点是,通过较高的编码器复杂度获得较高的压缩效率。
原则上,本发明的方法适于使用每一个都包括多个像素块、像素宏块、或其它特定像素区域的预测和非预测的帧或场,来对画面序列进行编码,所述方法包括以下步骤:
-对所述画面序列进行编码,从而
-确定非预测帧或场中的当前块或宏块中的所有像素是否都用于预测下个预测帧或场中的相应的块或宏块,其中,所述相应的块或宏块根据所述画面序列的画面内容中的运动而被位移,其中,
如果所述预测块或宏块与所述当前块或宏块至少有一个像素相同,则对所述当前块或宏块在非预测模式下进行编码;
如果所述预测块或宏块与所述当前块或宏块没有相同的像素,则对所述当前块或宏块在预测模式下进行编码。
原则上,本发明的装置适于使用每一个都包括多个像素块、像素宏块、或其它特定像素区域的预测和非预测的帧或场,来对画面序列进行编码,所述装置包括:
-装置,用于对所述画面序列进行编码;
-装置,用于确定非预测帧或场中的当前块或宏块中的所有像素是否都用于预测下个预测帧或场中的相应的块或宏块,其中,所述相应的块或宏块根据所述画面序列的画面内容中的运动而被位移,其中,
如果所述预测块或宏块与所述当前块或宏块至少有一个像素相同,则对所述当前块或宏块在非预测模式下进行编码;
如果所述预测块或宏块与所述当前块或宏块没有相同的像素,则对所述当前块或宏块在预测模式下进行编码。
在各个从属权利要求中,公开了本发明的有利的附加实施例。
附图说明
参照附图,对本发明的示例性实施例进行了描述,其中:
图1是用于视频数据的已知编码器;
图2是用于视频数据的已知编码器;
图3是用于视频数据的本发明的编码器;
图4是具有与参考像素块相同的像素的预测像素块;
图5是没有与参考像素块相同的像素的预测像素块。
具体实施方式
在图1中,编码器的视频数据输入信号IE包含用于编码的16*16宏块数据。在要对视频数据进行帧内编码的情况下,视频数据通过未修改的减法器SUB,开关SWE在位置‘I’处。之后,宏块的8*8块在离散余弦变换装置DCT和量化装置Q中处理,并通过熵编码器ECOD馈入多路复用器MUX,多路复用器MUX输出编码器视频数据输出信号OE。熵编码器ECOD可以对量化的DCT系数执行霍夫曼编码。在多路复用器MUX中,将头部信息和运动向量数据MV以及可能的编码音频数据与编码视频数据组合。在帧间视频数据的情况下,开关SWE在位置‘P’处,并且在块的基础上,从减法器SUB中的输入信号IE中减去预测宏块数据PMD,并通过变换装置DCT和量化装置Q,将8*8块差值数据馈入熵编码器EOD。量化装置Q的输出信号还在相应的逆量化装置QE-1中处理,将逆量化装置QE-1的输出信号通过相应的逆离散余弦变换装置DCTE-1,以重构块或宏块差值数据RMDD的形式馈入组合器ADDE。ADDE的输出信号缓冲存储于运动估计和补偿装置FS_MC_E中的画面存储库中,运动估计和补偿装置FS_MC_E对重构宏块数据执行运动补偿,并相应地将预测宏块数据PMD输出至SUB的相减输入、以及输出至组合器ADDE的另一输入。
由熵编码器ECOD中的编码器缓冲器的占用等级(occupancylevel)来控制量化装置Q和逆量化装置QE-1的特征。由控制器CTRL例如根据MPEG GOP结构来控制开关SWE,控制器也可以控制编码器中的其它单元。
运动估计器ME接收输入信号IE,并向运动估计和补偿装置FS_MC_E提供必要的运动信息,以及向多路复用器MUX提供运动向量数据MV。
QE-1、DCTE-1、ADDE和FS_MC_E构成了接收机端解码器的仿真,这将结合图2进行描述。
在图2中,通过解复用器DEMUX、熵解码器装置EDEC、逆量化装置QD-1、以及逆离散余弦变换装置DCTD-1,将编码视频数据输入信号ID馈入组合器ADDD,组合器ADDD输出视频数据输出信号OD。例如,EDEC能够对霍夫曼编码和量化系数执行霍夫曼解码。解复用器DEMUX分离头部信息、编码视频数据、画面类型数据和运动向量数据MV。
QD-1、DCTD-1和EDEC具有与图1编码器中的Q、DCT和ECOD的功能的相应逆功能。ADDD的输出信号缓冲存储于运动补偿装置FS_MC_D中的画面存储库中。FS_C_D根据运动向量数据MV,实现对重构宏块数据的运动补偿,并在P画面的情况下,通过开关SWD,将相应预测块或宏块数据PMD输出至加法器ADDD的另一输入,其中,在‘P’画面的情况下,在块的基础上,将预测数据与所接收的块差值数据组合。由从解复用器DEMUX接收画面类型数据的控制器CTRLD来控制开关SWD。在I或帧内模式的情况下,没有预测画面数据馈入加法器ADDD的第二输入。
在图3中本发明的编码器中,基本上,所有的功能块或单元都执行与图1中的相应功能块或单元相同的操作。然而,附加地,由相同块或宏块像素检测器CPDET来控制运动估计器ME,相同块或宏块像素检测器CPDET附加地确定下面的P帧或场中的预测块或预测宏块是否与预测所基于的I(或帧内模式)帧参考块或宏块的像素有至少一个亮度(或色度)像素相同。如果没有这样的相同像素,则对I帧中的相应的块或宏块在P(或帧间)模式中进行编码作为替代。CPDET或ME将相应的信息发送至控制器CTRL,使得在对该块或宏块进行处理期间,开关SWE从‘I’位置转换至‘P’位置。
在图4中,将I帧的参考像素块‘IN’与下面的P帧中从该块预测的预测像素块‘PN+1’一起描述。由运动向量MV来表示块位移量和方向。块PN+1与块IN有一个像素相同。由于不需要来自块IN的像素信息来预测块PN+1,所以将块IN保持及编解码为I块。
在图5中,I帧的参考像素块‘IN’与下面的P帧中从该块预测的预测像素块‘PN+1’一起描述。由运动向量MV来表示块位移量和方向。块PN+1与块IN没有相同像素。由于不需要来自块IN的像素信息来预测块PN+1,所以将块IN解码为P块。
为了简化描述,在两附图中,块具有4*4像素而不是8*8像素。
当解码器开始在I帧处对编码画面进行解码时,由于丢失了参考块或宏块信息,所以不能对先前已编码为P块或宏块的I帧块或宏块进行解码。然而,当达到下面的P帧时,对所有块或宏块无信息丢失地进行正确地重构。由于初始I帧和下面的P帧之间的时间段仅是,例如三帧或3*40ms=120ms,所以当开始接收或重放时,重构视频序列的观看者将不会生气。
例如,本发明可以用于数字电视信号的广播或数字视频信号的传输,用于因特网之类的网络中,用于视频电话中,或者当记录例如DVD或BD之类的光或磁存储介质时,用于MPEG-1、MPEG-2、MPEG-4和其它视频编/解码系统中。
机译: 用于使用各自包括多个宏块的预测图像和非预测图像对图像序列进行编码的方法和装置
机译: 用于使用各自包括多个宏块的预测和非预测图片对图片序列进行编码的方法和装置
机译: 使用预测的和非预测的图片对图像序列进行编码的方法和设备,该图片和预测图片分别包含多个宏块