首页> 中国专利> 用于减少频道变化时间以及在频道变化期间同步音频/视频内容的方法

用于减少频道变化时间以及在频道变化期间同步音频/视频内容的方法

摘要

一种数字A/V装置(50),提供减少的频道改变时间并且在频道改变事件期间保持音频和视频内容之间的同步。根据示例性的实施例,该数字A/V装置(50)包括:至少一个信号接收机(52、62),用于接收第一音频流、第一视频流和第二视频流,其中第一和第二视频流表示相同的节目并且第一视频流具有至少一个不同于第二视频流的特征;第一音频信号处理器(68),用于处理第一音频流以产生第一处理音频流;第一视频信号处理器(66),用于处理第一视频流以产生第一处理视频流;第二视频信号处理器(56、58),用于处理第二视频流以产生具有相对于第一处理音频流的延迟的第二处理视频流;第一缓冲器(74),用于缓冲第一处理音频流以提供去抖动;呈现器(78、80),用于响应于频道改变命令,呈现第一处理音频流和第二处理视频流;切换器(76),用于在呈现器(78)开始呈现第二处理视频流后,从第二处理视频流切换到第一处理视频流,从而使呈现器(78)开始呈现第一处理视频流;并且由此,在频道改变事件期间,保持第一处理音频流和第一处理视频流之间的同步。

著录项

  • 公开/公告号CN101536497A

    专利类型发明专利

  • 公开/公告日2009-09-16

    原文格式PDF

  • 申请/专利权人 汤姆森许可贸易公司;

    申请/专利号CN200680056311.3

  • 发明设计人 戴季旺;艾伦·杰·施坦因;

    申请日2006-12-13

  • 分类号H04N5/44(20060101);

  • 代理机构11021 中科专利商标代理有限责任公司;

  • 代理人王波波

  • 地址 法国布洛涅-比郎库尔

  • 入库时间 2023-12-17 22:40:15

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2019-02-22

    专利权的转移 IPC(主分类):H04N5/44 登记生效日:20190130 变更前: 变更后: 申请日:20061213

    专利申请权、专利权的转移

  • 2019-02-22

    专利权人的姓名或者名称、地址的变更 IPC(主分类):H04N5/44 变更前: 变更后: 申请日:20061213

    专利权人的姓名或者名称、地址的变更

  • 2011-06-15

    授权

    授权

  • 2009-12-30

    实质审查的生效

    实质审查的生效

  • 2009-09-16

    公开

    公开

说明书

相关专利的交叉引用

本申请要求于2006年11月7日在美国专利商标局提交的临时申请所产生的优先权和所有权益,为该临时申请分配的序号为60/857,371。

技术领域

本发明总体涉及数字音频和视频(A/V)装置,更具体地,涉及一种用于在数字A/V装置中减少频道改变时间以及在频道改变事件期间保持音频和视频内容间的同步的方法。

背景技术

在数字电视广播系统中,允许观众快速改变频道是一个重要的特征。频道改变延迟至少有两个主要来源。第一个来源来自很多视频压缩标准(如MPEG-2和H.264)所使用的图像组(group of picture,GOP)结构。在GOP中,使用帧内编码和帧间编码对图像进行编码。帧内编码(I)图像(又称为帧)使用其内部信息进行压缩,因而可以单独译码。然而,必须在相关的帧内编码图像(I图像)被译码后才能对帧间编码图像(即B或P图像)进行译码。由于与B或P图像相比,I图像所要求的比特通常是它们的3到10倍,因此为了减少总的比特率,在比特流中很少对其进行编码。在数字电视广播系统中,I帧可能每1到2秒只出现一次。当数字(A/V)装置调谐到一节目时,在可以译码或显示任何图像之前,必须进行等待直到接收到第一个I帧。这可能导致显著的延迟。

频道改变延迟的第二个来源来自于数字A/V装置中的处理组件(如机顶盒(STB))。例如,在互联网协议电视(IPTV)广播系统中,传输网络中各种有源组件向媒体流贡献抖动。在数字A/V装置处必须减少该抖动以避免向用户呈现不愉快的伪像(artifact)。典型地,在数字A/V装置处通过缓冲处理来减少这样的抖动,在频道改变事件期间,缓冲处理可能是视频内容的呈现中延迟的主要来源。由于与视频抖动相比,人类往往对音频抖动更加敏感,因此在数字A/V装置处通常需要更强地对接收到的音频内容进行去抖动。针对音频内容,更强的去抖动导致更长的缓冲、更长的频道改变时间、以及在频道改变事件期间音频和视频内容之间的同步丢失的潜在可能。

相应地,需要一种用于在数字A/V装置中减少频道改变时间和频道改变事件期间保持音频和视频内容之间的同步的方法。本发明解决了这些和/或其它问题。

发明内容

根据本发明的一方面,公开了一种用于在数字音频和视频装置中改变频道的方法。根据示例性的实施例,该方法包括以下步骤:接收第一音频流、第一视频流和第二视频流,其中第一和第二视频流表示相同的节目并且第一视频流具有至少一个不同于第二视频流的特征;处理第一音频流以产生第一处理音频流;处理第一视频流以产生第一处理视频流;处理第二视频流以产生具有相对于第一处理音频流的延迟的第二处理视频流;对第一处理音频流进行缓冲以提供去抖动;响应于频道改变命令,呈现第一处理音频流和第二处理视频流;由此,在频道改变期间,保持第一处理音频流和第二处理视频流之间的同步;随后从第二处理视频流切换到第一处理视频流并呈现第一处理视频流;以及由此,在频道改变期间,保持第一处理音频流和第一处理视频流之间的同步。例如,所述特征可以包括:较短的GOP大小、较低的分辨率和/或较低的比特率。

依照本发明另一方面,公开了一种数字音频和视频装置。根据示例性的实施例,该数字音频和视频装置包括:接收装置(例如至少一个信号接收机),用于接收第一音频流、第一视频流和第二视频流,其中第一和第二视频流表示相同的节目并且第一视频流具有至少一个不同于第二视频流的特征;第一音频处理装置(例如第一音频信号处理器),用于处理第一音频流以产生第一处理音频流;第一视频处理装置(例如第一视频信号处理器),用于处理第一视频流以产生第一处理视频流;第二视频处理装置(例如第二视频信号处理器),用于处理第二视频流以产生具有相对于第一处理音频流的延迟的第二处理视频流;缓冲装置(例如缓冲器),用于缓冲第一处理音频流以提供去抖动;呈现装置(例如呈现器),用于响应于频道改变命令,呈现第一处理音频流和第二处理视频流;由此,在频道改变期间,保持第一处理音频流和第二处理视频流之间的同步;切换装置(例如切换器),用于在呈现装置开始呈现第二处理视频流后,从第二处理视频流切换到第一处理视频流,从而使呈现装置开始呈现第一处理视频流;以及由此,在频道改变期间,保持第一处理音频流和第一处理视频流之间的同步。例如,所述特征可以包括:较短的GOP大小、较低的分辨率和/或较低的比特率。

附图说明

通过参考下面结合附图对本发明实施例的描述,以上提到的和本发明的其它的特征和优势以及获得它们的方式将变得更加显而易见,并且本发明将得到更好地理解,附图中:

图1是适于实现本发明的系统的框图;

图2是提供了根据本发明的示例性实施例的图1所示的单个数字A/V装置的进一步细节的框图;

图3是根据本发明的示例性实施例的定时图。

此处阐述的范例示出了本发明的优选实施例,这样的范例不应被理解为以任何方式限制本发明的范围。

具体实施方式

现在参见附图,更具体地参见图1,图1示出了适于实现本发明的系统100的框图。如图1所示,系统100包括:规则A/V编码器10、低分辨率低比特率视频编码器20、延迟单元30、多播切换器40和多个数字A/V装置50。根据示例性实施例,系统100表示IPTV广播系统。

在系统100中,译码器10和20将广播节目同时分别编码为第一压缩音频和视频流12(在此可被称作“规则流”)以及第二压缩视频流14(在此可被称为“频道改变流”)。规则流12包括广播节目的基本音频和视频流。频道改变流14包括与规则流12中的基本视频流相对应但是具有至少一个与规则流12中的基本视频流不同的特征的基本视频流。频道改变流14还不包括任何音频内容。根据示例性实施例,与规则流12的基本视频流相比,组成信道改变流14的基本视频流具有较短的GOP大小(如,短0.5秒等)、较低的分辨率(如,通用中间格式(CIF)等)和/或较低的比特率(如,小于200kbps等)。

延迟单元30有效地将信道改变流14延迟预定的可配置时间段(如,900毫秒等)。例如,系统100的业务提供者可以自适应地控制(如,调节)该延迟。多播切换器40从编码器10接收规则流12,从延迟单元20接收经延迟的信道改变流,并将这些流12和14多播到A/V装置50。根据示例性实施例,多播切换器40可以被实施为数字用户线接入复用器(DSLAM)。

在系统100中,可使用互联网协议(IP)多播来通过IP骨干网向多播联接点(如多播切换器40)发送压缩流12和14,多播联接点选择性地将流12和14转发到终端设备(如数字A/V装置50)。根据示例性实施例,可在系统100中使用互联网组管理协议(IGMP)进行频道选择。例如,终端设备(如数字A/V装置50)可将针对期望频道的联接请求发送到多播切换器40(如,DSLAM)。当不再想要该频道时,可以向多播切换器40发送离开请求。

根据本发明的原则,由延迟单元30对较低比特率的信道改变(视频)流14进行时移,以使规则(视频和音频)流12滞后一可配置时段(如,900毫秒等),从而减少频道改变时间。由于与视频帧相比,音频帧通常要求更多的去抖动缓冲,因此如果较低比特率(视频)的信道改变流14和规则(音频和视频)流12之间没有时移,较低比特流的信道改变流14的译码视频帧将经历与规则流12的音频帧相同的去抖动等待时间。这可能在将第一视频帧呈现给用户时导致增加的延迟。因此,由延迟单元30向信道改变流14引入的增加的时移减少了频道改变事件期间的视频缓冲等待时间。根据示例性的实施例,可在系统100中多播切换器40之前的任何地方引入由延迟单元30提供的延迟。例如,如图1所示,可在位于多播切换器40前的流或代理服务器(图1中未示出)处引入延迟。

参见图2,图2提供了根据本发明示例性实施例的图1所示的单个数字A/V装置50的进一步细节的框图。如图2所示,数字A/V装置50针对频道改变流14和规则流12提供单独的处理路径。针对频道改变流12的处理路径包括:接收缓冲器52、解复用器54、低比特率视频译码器56和上采样过滤器58。针对规则流12的处理路径包括:接收缓冲器60、解复用器62、规则视频译码器64、音频译码器66和去抖动缓冲器68。数字A/V装置50还包括:频道改变视频切换器70、去抖动缓冲器72、A/V同步块76、视频呈现器78和音频呈现器80。根据示例性的实施例,数字A/V装置50可以被实施为机顶盒或任何其它类型的数字A/V装置。

在图2中,接收缓冲器52接收并对频道改变流14进行缓冲以产生缓冲视频流,解复用器54将该缓冲视频流从其传输流中解复用为低比特率基本视频流。低比特率视频译码器56对低比特率基本视频流进行译码以产生未压缩的低分辨率视频流,上采样过滤器58对其进行上采样以产生处理后的视频流。

此外,在图2中,接收缓冲器60接收并对规则流12进行缓冲以产生缓冲音频和视频流,解复用器62从传输流中将该缓冲音频和视频流解复用为基本音频和视频流。规则视频译码器64对基本视频流进行译码以产生未压缩的处理后的视频流。音频译码器66对基本音频流进行译码以产生未压缩的处理后的音频流。

将从上采样过滤器58输出的处理后的视频流(与信道改变流14相对应)和从规则视频译码器64输出的处理后的视频流(与规则流12的视频内容相对应)都发送到频道改变视频切换器70。频道改变视频切换器70响应于来自用户的频道改变命令,将(从上采样过滤器58输出的)频道改变流14的视频内容切换到其输出,直到其接收到(从规则视频译码器64输出的)规则流的视频内容中的第一个未压缩的I帧为止。此后,频道改变视频切换器70将(从规则视频译码器64输出的)规则流12的视频内容切换到输出,并且不再使用(从上采样过滤器58输出的)频道改变流14的低分辨率视频内容。

去抖动缓冲器72对从频道改变视频切换器70输出的视频内容(即帧)进行缓冲以去除抖动。去抖动缓冲器68对从音频译码器66输出的音频内容(即帧)进行缓冲以去除抖动。根据示例性的实施例,去抖动缓冲器68和72可位于接收缓冲器52和60以及视频和音频呈现器78和80之间的任何位置。然而,为了示例和说明的目的,图2示出了恰好位于A/V同步块76之前的去抖动缓冲器68和72。

根据音频和视频呈现器的基于公共系统时钟(common systemclock)的表示时间戳,A/V同步块76确保由音频和视频呈现器80和78分别呈现从去抖动缓冲器68和72提供的音频和视频内容。换言之,A/V同步块76确保同时呈现具有相同表示时间戳的音频和视频内容(如,帧)。

现在参见图3,图3示出了根据本发明的示例性实施例的定时图。具体地,图3示出了由本发明提供的频道改变时间的减少。由参考数字300A表示的图3的上部示出了没有通过图1中的延迟单元30向频道改变流引入延迟的情况下,视频和音频帧的时间线。相反,由参考数字300B表示的图3的下部示出了依照本发明的原理,通过图1中的延迟单元30向频道改变流施加延迟的情况下,视频和音频帧的时间线。

在由参考数字300A表示的图3的上部,由编码器10和20分别同时对规则流12和低比特率频道改变流14进行编码,并进行发送。没有通过如图1所示的延迟单元30向频道改变流14施加延迟。数字A/V装置50的接收缓冲器60在时刻aa-0接收规则流12中的第一音频帧并由音频译码器66在时刻ad-0对其进行译码。在时刻ar-0被音频呈现器80呈现前,去抖动缓冲器68对规则流12中的第一音频帧进行缓冲以去除抖动。

由于只有帧内编码的视频帧(I帧)可以被独立译码,因此第一可译码和可显示视频帧是接收到的第一视频I帧。大多数时间,由于同规则流12相比I帧在频道改变流14中出现的更频繁,因此接收到的第一视频I帧来自频道改变流14。通常在第一音频帧后接收到首先接收到的视频I帧。假定数字A/V装置50的接收缓冲器52在时刻Ia-0接收频道改变流14的第一视频I帧,译码器56在时刻Id-0对该帧进行译码,然后去抖动缓冲器72在时刻Ij-0对其进行缓冲以去除抖动。在时刻Ij-0对该第一视频I帧进行去抖动后,准备将其进行呈现和显示。然而,由于音频和视频同步(即,对嘴)的要求,直到准备好呈现对应的音频帧(即,图3上部中的帧i)为止,不能呈现和显示该第一视频I帧。由于为了去除抖动音频帧需要比视频帧更长的缓冲时间(由于对音频抖动主观敏感度更高),第一视频I帧不得不等到时刻Ir-0(即,在将音频帧i去抖动后)才能呈现。

由参考数字300A表示的图3的上部示出了数字A/V装置50中的音频帧i的时间表(chronology)。具体地,接收缓冲器52在时刻ia-0接收到音频帧i,时刻ia-0与接收缓冲器60接收到频道改变流14中的第一视频I帧的时刻相同。然后在时刻id-0对音频帧i进行译码。在去抖动后,准备好在时刻ir-0呈现音频帧i,ir-0是音频帧i和第一视频I帧的实际呈现时间。由参考数字300A表示的图3的上部演示了由音频帧i的去抖动时间引起的针对视频的增加的频道改变时间。即使准备好在时刻Ij-0呈现第一视频I帧,也必须等到准备好音频帧i的时刻Ir-0。额外等待时间是时刻Ir-0和时刻Ij-0之间的差。

由参考数字300B表示的图3的下部示出了由本发明提供的频道改变时间的改进。在图3的下部,延迟单元30有意地将较低分辨率的频道改变流14延迟预定时段(参见图1)。在时刻ia-1接收与频道改变流14中的第一视频I帧对应的音频帧i,时刻ia-1比接收到频道改变流14中的第一视频I帧的时刻Ia-1早。接收时刻的差抵消了音频去抖动缓冲器68的较长延迟。因而,准备在时刻ir-1呈现视频帧I,ir-1比由参考数字300A所表示的图3的上部中要早。具体地,针对视频呈现的等待时间的实际减少量是ir-1和ir-0之间的差。

由参考数字300B表示的图3的下部示出了本发明另一优势,也就是缩短了呈现第一音频帧和呈现第一视频帧的时刻之间的时间差。在参考数字300A表示的图3的上部中,此时间差是ir-0和ar-0之间的差。相反,在参考数字300B表示的图3的下部中,此时间差是ir-1和ar-1之间的时间差。此缩短的时间差提供了更好的用户体验。

根据本发明的一个示例性实施例,可以使用以下参数。用于频道改变流14的GOP大小是500毫秒,后者在对第一视频I帧的接收中给出了250毫秒的平均延迟。用于对频道改变流14进行去抖动的缓冲时间是50毫秒。用于对规则流12进行去抖动的缓冲时间是350毫秒。当应用本发明时,频道改变流14比规则流12滞后250毫秒。不应用本发明,呈现第一视频I帧的平均等待时间是大约250毫秒加上350毫秒(或600毫秒)。呈现第一音频帧和呈现第一视频I帧的时刻之间的延迟是大约250毫秒。相反,在应用本发明通过延迟单元30延迟频道改变流14(参见图1)后,将呈现第一视频I帧的平均等待时间减少到250毫秒加350毫秒减250毫秒(或350毫秒)。此外,将呈现第一音频帧和呈现第一视频I帧的时刻之间的延迟减少到大约0毫秒。

如此处所述,本发明提供了一种用于在数字A/V装置中减少频道改变时间和在频道改变事件期间保持音频和视频内容之间的同步的方法。本发明适用于不同的数字A/V装置,所述数字A/V装置带有或不带有集成的显示装置。相应地,此处所用的短语“数字A/V装置”或“数字音频和视频装置”可以指系统或装置,所述系统或装置包括但不限于:包括集成显示装置的电视、计算机或监视器;诸如机顶盒、盒式磁带录像机(VCR)、数字多功能盘(DVD)播放器、视频游戏盒、个人录像机(PVR)、计算机等系统或装置;或者其它可能不包括集成显示装置的系统或装置。

虽然将本发明描述为具有优选的设计,然而可以在此公开的精神和范围内对本发明做进一步修改。因此,本申请意在覆盖任何使用本发明总体原理的对本发明所做的变型、使用或改装。此外,本申请意在覆盖那些属于本发明所属领域中的已知或惯用实践范围内的以及落入所附权利要求的限制范围内的源于本公开的技术方案。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号