首页> 中国专利> 可伸缩性编码装置、可伸缩性解码装置、可伸缩性编码方法、可伸缩性解码方法、通信终端装置以及基站装置

可伸缩性编码装置、可伸缩性解码装置、可伸缩性编码方法、可伸缩性解码方法、通信终端装置以及基站装置

摘要

本发明公开能够实现高量化效率和高性能的、频带可伸缩性LSP编码的可伸缩性编码装置以及可伸缩性解码装置等。在这些装置中,通过窄带-宽带变换单元(200)接收量化窄带LSP并将其变换为宽带,将变换后的量化窄带LSP(变换成的宽带LSP参数)输出到LSP-LPC变换单元(800)。LSP-LPC变换单元(800)将变换后的量化窄带LSP变换成线性预测系数,并输出到预加重单元(801)。预加重单元(801)计算经预加重处理的线性预测系数,并输出到LPC-LSP变换单元(802)。LPC-LSP变换单元(802)将经预加重处理的线性预测系数变换成经预加重处理的宽带变换后的量化窄带LSP,并输出到预测量化单元(803)。

著录项

  • 公开/公告号CN101023471A

    专利类型发明专利

  • 公开/公告日2007-08-22

    原文格式PDF

  • 申请/专利权人 松下电器产业株式会社;

    申请/专利号CN200580031531.6

  • 发明设计人 江原宏幸;

    申请日2005-09-15

  • 分类号G10L19/12(20060101);G10L21/04(20060101);

  • 代理机构11105 北京市柳沈律师事务所;

  • 代理人吕晓章;李晓舒

  • 地址 日本大阪府

  • 入库时间 2023-12-17 19:03:16

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2019-09-03

    未缴年费专利权终止 IPC(主分类):G10L19/12 授权公告日:20110525 终止日期:20180915 申请日:20050915

    专利权的终止

  • 2017-06-23

    专利权的转移 IPC(主分类):G10L19/12 登记生效日:20170605 变更前: 变更后: 申请日:20050915

    专利申请权、专利权的转移

  • 2014-08-06

    专利权的转移 IPC(主分类):G10L19/12 变更前: 变更后: 登记生效日:20140716 申请日:20050915

    专利申请权、专利权的转移

  • 2011-05-25

    授权

    授权

  • 2007-10-17

    实质审查的生效

    实质审查的生效

  • 2007-08-22

    公开

    公开

查看全部

说明书

技术领域

本发明涉及一种在移动通信系统或使用因特网协议的分组通信系统进行语音通信时所使用的通信终端装置和基站装置,以及安装在这些装置中的可伸缩性编码装置、可伸缩性解码装置、可伸缩性编码方法以及可伸缩性解码方法。

背景技术

在像VoIP(Voice over IP)等使用分组的语音通信中,对于语音数据的编码,人们希求对帧丢失具有抗性的编码系统。这是因为在以因特网通信为代表的分组通信中,有时因拥塞等而使得分组在传输路径上丢失。

一种用于提高对帧丢失的抗性的方法为:当传输信息的一部分丢失时,通过解码其他的部分来尽量减少帧丢失的影响(例如,参照专利文献1)。在专利文献1中,公开了使用可伸缩性编码来将核心层编码信息和增强层的编码信息装入不同的分组进行传输的方法。另外,作为分组通信的应用,可举出使用混有宽的线路(宽频线路)和窄的线路(传输速率低的线路)的网络的组播通信(一对多的通信)。即使在上述不均匀的网络上进行多地点间的通信的情况,可伸缩性编码也是有效的,因为只要对应各个网络使编码信息分层化,就没有必要对每个网络发送不同的编码信息,因此。

例如由专利文献2公开的技术,即,以能够对语音信号进行高效编码的CELP(Code Excited Linear Prediction,代码激励线性预测)系统为基础,并且在信号带宽上,也就是频率轴方向具有扩展性(scalability)的频带可伸缩性编码技术。在专利文献2中,公开了以LSP(Line Spectrum Pair,线谱对)参数表示语音信号的频谱包络信息的CELP系统的例子。在此,通过使用下面的等式(1),将用于窄带语音的编码单元(核心层)获得的量化LSP参数(窄带编码LSP)变换为用于宽带语音编码的LSP参数,并由用于宽带语音的编码单元(增强层)使用经变换的LSP参数,由此创建带宽可伸缩性的LSP编码方法。

fw(i)=0.5×fn(i)    (其中,i=0,…,Pn-1)

     =0.0    (其中,i=Pn,…,Pw-1)  (等式1)

并且,fw(i)表示宽带信号中i维(degree)的LSP参数,fn(i)表示窄带信号中i维的LSP参数,Pn表示窄带信号的LSP分析维数(order),Pw表示宽带信号的LSP分析维数。LSP也被称为LSF(Line Spectral Frequency,线谱频率)。

[专利文献1]日本专利申请特开2003-241799号公报

[专利文献2]日本专利申请特开平11-30997号公报

发明内容

发明需要解决的问题

但是,在专利文献2之中,因为只是简单地将通过窄带语音编码得到的量化LSP参数(窄带LSP)乘以一个常数,并用于对宽带信号预测LSP参数(宽带LSP),所以很难说该方法最大限度地有效利用了窄带LSP的信息,根据等式(1)而设计的宽带LSP编码器的量化效率和其它编码性能也不够充分。

本发明旨在提供能够实现高量化效率的、高性能的频带可伸缩性LSP编码的可伸缩性编码装置以及可伸缩性解码装置等。

解决该问题的方案

为了解决上述问题,本发明涉及的可伸缩性编码装置通过利用窄带的量化LSP参数进行宽带的LSP参数的预测量化,该装置包括:预加重单元,对量化窄带LSP参数进行预加重,其中,将经预加重处理的所述量化窄带LSP参数用于所述预测量化。

另外,本发明涉及的可伸缩性解码装置通过利用窄带的量化LSP参数解码宽带的LSP参数,该装置包括:预加重单元,对经解码处理的量化窄带LSP参数进行预加重,其中,将经预加重处理的所述量化窄带LSP参数用于所述宽带的LSP参数的解码。

另外,本发明涉及的可伸缩性编码方法通过利用窄带的量化LSP参数进行宽带的LSP参数的预测量化,该方法包括:预加重步骤,对量化窄带LSP参数进行预加重;以及,量化步骤,利用经预加重处理的所述量化窄带LSP参数进行所述预测量化。

另外,本发明涉及的可伸缩性解码方法通过利用窄带的量化LSP参数解码宽带的LSP参数,该方法包括:预加重步骤,对经解码处理的量化窄带LSP参数进行预加重,以及,LSP参数解码步骤,利用经预加重处理的所述量化窄带LSP参数进行所述宽带的LSP参数的解码。

发明的有益效果

根据本发明,通过对窄带LSP实施预加重处理,在窄带信号的分析时不使用预加重,而在宽带信号的分析时使用预加重的结构的可伸缩性编码装置中,能利用窄带LSP高性能地进行预测量化。

另外,根据本发明,利用窄带LSP的信息对宽带LSP参数自适应编码,由此能够实现量化效率高的高性能的频带可伸缩性LSP编码。

进一步,根据本发明,在宽带LSP参数的编码中,首先对宽带LSP参数进行级别分类,再选择对应于分类的级别的子码本,进一步使用选择出的子码本进行多级的向量量化。因此能够在编码数据上高精度地反映源信号的特征,并且能够抑制具有这些子码本的多级向量量化码本的存储量。

附图说明

图1是表示将宽带和窄带的LSP参数的例子对于每个帧编号(framenumber)进行标绘的图;

图2是表示实施例1的可伸缩性编码装置的主要结构的方框图;

图3是表示实施例1的分类器的主要结构的方框图;

图4是表示实施例1的可伸缩性解码装置的主要结构的方框图;

图5是表示实施例2的分类器的主要结构的方框图;

图6是表示实施例3的可伸缩性语音编码装置的主要结构的方框图;

图7是表示实施例3的可伸缩性语音解码装置的主要结构的方框图;

图8是表示实施例3的LPC量化单元(WB)的主要结构的方框图;

图9是表示实施例3的LPC解码单元(WB)的主要结构的方框图;

图10是表示实施例3的预加重单元的处理步骤的示例的流程图;

图11是表示实施例4的可伸缩性编码装置的主要结构的方框图;以及

图12是表示实施例4的可伸缩性解码装置的主要结构的方框图。

具体实施例

图1为用帧编号将第16维(order)的宽带LSP(从宽带信号求出第16维的LSP,图1的左侧)和第8维的窄带LSP(从窄带信号计算并通过等式(1)变换得到第8维的LSP,图1的右侧。)在横轴上进行标绘的图。在这些图中,横轴代表时间(分析帧编号),纵轴为归一化频率(以1.0作为奈奎斯特频率,在图中的例子为8kHz)。

这些图意味着:第一,通过等式(1)得到的LSP并不需要以高精度近似的,而是作为宽带LSP的低端的第8维近似比较妥当。第二,因为窄带信号的信号分量在3.4kHz附近分量消失(衰落)了,所以当宽带LSP在归一化频率0.5附近时,所对应的窄带LSP在3.4kHz附近被消波,并且通过等式(1)得到的近似值的误差会变大。相反,当窄带LSP的第8个的元素在3.4kHz附近时,宽带LSP的第8个元素存在于3.4kHz或3.4kHz以上的频率的可能性较大,类似这样能够在一定程度上从窄带LSP来预测宽带LSP的特征。

也就是,可以考虑为:当(1)窄带LSP基本上表现了宽带LSP的低维的一半的特征,并且(2)宽带LSP和窄带LSP之间具有一定程度的相关,且已知窄带LSP时,就能够在一定程度减少宽带LSP可能的候补。特别是在考虑如语音信号的信号时,当窄带LSP确定后,虽然包含了那样的特征的宽带LSP不能惟一地被确定下来,也能在一定程度缩小范围(比如窄带LSP具有“啊”的语音信号的特征时,宽带LSP也具有“啊”的语音信号的特征的可能性较高,包括具有那样的特征的LSP参数的模式的向量空间在一定程度上被限定)。

通过积极地利用从这样的窄带信号得到的LSP与从宽带信号得到的LSP之间的相互关系,可以使从宽带信号得到的LSP的量化效率得到提高。

以下,参照附图详细说明本发明的实施例。

(实施例1)

图2是表示本发明实施例1的可伸缩性编码装置的主要结构的方框图。

本实施例的可伸缩性编码装置包括:窄带-宽带变换单元200、放大器201、放大器202、延迟器203、除法器204、放大器205、放大器206、分类器207、多级向量量化(VQ)码本208、放大器209、预测系数表格210、加法器211、延迟器212、减法器213以及误差最小化单元214。多级VQ码本208包括:初级码本250、切换开关251、第二级码本(CBb)252、第三级码本(CBc)253以及加法器254、加法器255。

本实施例的可伸缩性编码装置的各个部分进行以下的操作。

窄带-宽带变换单元200将输入的量化窄带LSP(通过未示出的窄带LSP量化器预先进行量化的窄带信号的LSP参数)利用等式(1)等变换成宽带LSP参数,并将该宽带LSP参数输出到放大器201、延迟器203、放大器206以及分类器207。另外,当将窄带LSP参数变换成宽带LSP参数的方法利用等式(1)时,除非宽带信号与窄带信号的采样频率以及LSP维数的关系同时为2倍(宽带信号的采样频率为窄带信号的采样频率的2倍,而且宽带信号的LSP的分析维数为窄带信号的LSP的分析维数的2倍),否则无法获得所得到的宽带LSP参数与实际输入的宽带LSP之间的对应。因此双方不为2倍的关系时,将宽带LSP参数系一次变换为自相关系数,并将该自相关系数进行上采样,并将经上采样的自相关系数再次变换成宽带LSP即可。

以下,也有将通过窄带-宽带变换单元200变换成宽带形式的量化窄带LSP参数称为变换成的宽带LSP参数的时候。

放大器201将从窄带-宽带变换单元200输入的变换成的宽带LSP参数乘以从除法器204输入的放大系数,将结果输出到放大器202。

放大器202将从预测系数表格210输入的预测系数β3(对于每个向量元素具有值)乘以从放大器201输入的变换成的宽带LSP参数,将结果输出到加法器211。

延迟器203将从窄带-宽带变换单元200输入的变换成的宽带LSP参数延迟一帧的时间,并将结果输出到除法器204。

除法器204将从延迟器212输入的、1帧前的量化宽带LSP参数除以从延迟器203输入的、1帧前的量化的变换成的宽带LSP参数,并将结果输出到放大器201。

放大器205将从延迟器212输入的1帧前的量化宽带LSP参数乘上从预测系数表格210输入的预测系数β2(对于每个向量元素具有值),将结果输出到加法器211。

放大器206将从窄带-宽带变换单元200输入的变换成的宽带LSP参数乘以从预测系数表格210输入的预测系数β1(对于每个向量元素具有值),将结果输出到加法器211。

分类器207利用从窄带-宽带变换单元200输入的变换成的宽带LSP参数进行级别分类,并将表示该分类级别的级别信息输出到多级向量量化码本208中的切换开关251。这里,对于级别分类使用什么样的方法都可以,比如,分类器207可以包括存储着与分类级别的种类的数目相同数目的码向量的码本,并输入级别信息,该级别信息与使输入的变换成的宽带LSP参数与存储的上述码向量的均方差(square error)成为最小的码向量相对应。另外,考虑听觉特性对该均方差进行加权也是可以的。另外,分类器207的具体结构的示例将在后文中描述。

切换开关251从初级码本250中选择一个对应于从分类器207输入的级别信息的子码本(CBa1~CBan),并将该选择的子码本的输出端子连接到加法器254。在本实施例中,通过分类器207分类的级别数为n,子码本为n种,从n种中指定的级别的子码本的输出端子连接到切换开关251。

初级码本250根据来自误差最小化单元214的指示,将所指示的码向量经由切换开关251输出到加法器254。

第二级码本252根据来自误差最小化单元214的指示,将所指示的码向量输出到加法器254。

加法器254将从切换开关251输入的初级码本250的码向量与从第二级码本252输入的码向量相加,并将结果输出到加法器255。

第三级码本253根据来自误差最小化单元214的指示,将所指示的码向量输出到加法器255。

加法器255将从加法器254输入向量与从第三级码本253输入的码向量相加,并将结果输出到放大器209。

放大器209将从加法器255输入的向量乘以从预测系数表格210输入的预测系数α(对于每个向量元素具有值),将结果输出到加法器211。

预测系数表格210根据来自误差最小化单元214的指示,从存储的预测系数组中选择所指示的一组,并从选择出的预测系数组中将用于放大器202、205、206、209的系数分别输出到放大器202、205、206、209。并且,这个预测系数组包括针对每个放大器202、205、206、209,按LSP的每个维数准备的系数。

加法器211将来自放大器202、205、206、209的每个向量相加,并将结果输出到减法器213。加法器211的输出作为量化宽带LSP参数输出到图2的可伸缩性编码装置的外部单元和延迟器212。输出到图2的可伸缩性编码装置的外部单元的量化宽带LSP参数用于编码语音信号的、未示出的其它功能块等的处理。另外,通过后述的误差最小化单元214确定使误差成为最小的参数(从每个码本输出的码向量以及预测系数组),此时从加法器211输出的向量成为量化宽带LSP参数。量化宽带LSP参数输出到延迟器212。另外,用下面的等式(2)表示加法器211的输出信号。

>sup>>>L>^>>W>>(>n>)>sup>>>(>i>)>>=>α>>(>i>)> >>C>^>>>(>n>)> >>(>i>)>>+>>β>1>>>(>i>)>sup>>>L>^>>N>>(>n>)>sup>>>(>i>)>>>

获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号