首页> 中国专利> 在语音数字传输系统中产生悦耳噪声的方法与装置

在语音数字传输系统中产生悦耳噪声的方法与装置

页面导航

摘要
著录项
法律信息
说明书
相似文献

摘要

本发明涉及一个用于传输语音的产生悦耳噪声的方法与装置。在检测每个有效性期末尾后，产生一个静音描述帧，SID帧(如图中100)，即悦耳噪声的描述参数组合。对于所有连续当前的无效性帧，分析其频谱SFC(如图中101)，然后与参照频谱SFr进行比较(如图中102)，并存储(如图中103)。当参照频谱SFr与当前帧的频谱SFc处于同一性时，没有任一个新的SID帧的传输(如图中105)，在SFr与SFc频谱处于不同一性时，就传输一个新的SID帧(如图中104)。

著录项

公开/公告号CN1155801A

专利类型发明专利
公开/公告日1997-07-30

原文格式PDF
申请/专利权人法国电信公司;
展开▼

申请/专利号CN96121678.6
发明设计人多米尼奎·马斯阿郎斯;
展开▼

申请日1996-10-11
分类号H04M1/19;H04M1/74;
代理机构中国国际贸易促进委员会专利商标事务所;
代理人于静
地址法国巴黎
入库时间 2023-12-17 12:56:30

法律信息

法律状态公告日

法律状态信息

法律状态
2016-11-23

专利权有效期届满 IPC(主分类):G10L21/00 授权公告日:20030402 申请日:19961011

专利权的终止
2003-04-02

授权

授权
1998-01-28

实质审查请求的生效

实质审查请求的生效
1997-07-30

公开

公开

说明书

本发明涉及在断续的语音数字传输系统中产生悦耳噪声(bruit deconfort)的方法与装置。

断续的语音传输系统通常包含一个发声有效性的模块，后者能够输出有关语音信号的存在与否的信息。由前述系统输出的语音信号同样也包括先于和/或后于静音的前述的就本义而言的语音信号。当检测出静音或无效状态时，该传输系统是这样地控制的，即或者降低传输信号信息流量，或者干脆截断信息传输。

当通讯中的环境噪声增加时，在无效性状态中突然地抑制或改变其特征，就会形成对听者极端不舒的效果。这种效果会导致通迅中断的印象。而且，该语音信号有时达到了可听极限。

为了克服上述弊端，最近有人建议在无效性状态时，插入在中断传输以前出现的背景噪声的合成信号。用这种方法，人们就可以引用在欧洲移动(无线)电话系统规范确立的范围内以满信息流量与半信息流量所实现的作用。

满信息流量的欧洲移动电话系统受到STS1 GSM 06.12的推荐。该系统包括一个发出悦耳噪声的装置CNG(英语，即悦耳噪声发生器)。而且它包括一个能形成由260位(总共是20ms)编码的参数的帧的语音编码。一个语音活动性检测器对每一个帧发出一个与帧的活动性或不活动性有关的信息。激励装置的参数的幅度与来自编码器的LPC分析的记录区域系数(LAR)提供了有关环境噪声的频谱(LAR)的高度或幅度与包络的信息。悦耳噪声发生器在一定数量的加续帧上实行参数平均值，并根据用于语音编码器的量化过程实行量化，而且形成一个静音描述符的帧，即，SID(英语，静音描述符)帧。上述这种帧是在有效状态的最后部分形成的，而每一个无效状态总共是480ms。这些SID帧被编码，并配备一个SID编码字。以便确保能传输这些帧的符号，并被一个译码器所接受。上述悦耳噪声通过激励参数码的随机抽取被合成到译码器中，使预测器的增益码长期调到零点，并使相应的编码通过SID帧的编码放回到LPC分析与激励装置的幅度。然后如同语音帧的方式一样，对无效性帧进行译码。

在上述装置中，这些悦耳噪声发生器模块是安置于语音编码器与译码器外部的。以便能获取最大的模块式系统，其代价是增加语音帧处理的复杂性：即在正常的对语言帧的处理中附加了在编码器上制作SID帧，并随机形成激励编码。而且，在发送时语音编码器的本地译码器，以及在接收时远途的译码器都在经过一个无效状态以后，变得不再同步了。因为编码器的功能是独立于该系统的。

半信息流量的欧洲移动式电话系统同样地安置了一个悦耳噪声发生器，其结构与满信息流量的系统相似，参照ETSI GSM 06.22与GSM 06.20的介绍。如同满信息流量系统的CNG发生器所实施的过程一样，本系统的CNG发生器在8个连续帧上使用了输入信息，语音信号相关，以便估价环境噪声的频谱，考虑到能量，必须考虑上述8个帧的能量，以及计算能量与真空能量之间的比例参数的量化过程，即GS参数，参照ETSIGSM 06.20的介绍。而且，该语音编码器适合于在无效性状态下，与远途的译码器同步运转。上述发生器可以随机置于无效性区域中的每一个信息流量上。

总之，人们提出了实施多信息流量编码器的系统，其中以专门操作方式表现的作用类似于CNG的作用。上述系统中，我们可以指出由A DeJACO，W.GA RDNER，P.JACOBS与CHONG LEE发表，其题目为“QCELP：北美CDMA数字蜂窝式话机可变速率语音编码标准“的文章所叙述多信息流量编码器(出版在关于电讯语音编码的研讨会的刊物，IEEE，魁北克，1993年10月，第5-6页上)。在上述系统中，一个类似于语音有效性检测器的装置确定了传输所需的信息流量。可以有四个信息流量，即各为1，1/2，1/4，或1/8位。传输不会中断，而传输参数是一个相对于激励能量的显示读数与LPC系数的频谱的色络。这些参数传输到每一个帧，而且具有较低信息流量的系统显示出与一个CNG发生器相目似的作用。

此外，我们也可以指出由A.GROSSMAN发表的其标题为“用于电视会议的高性能的音响信号编码器”(ICSPAT，Santa Clara，93年10月，第1039-1042页)所描述系统。在具有展宽的频带和可变的信息流量的上述系统中使用了一个被噪声码转变的系数的代替过程。在这期间，同样地该信号的频谱色络总是传输着作用于帧间的平滑部分。

据本发明的在语音数字传输系统中产生悦耳噪声的方法和装置的目的，一方面是获得可以与高信息流量系统相比较的合成质量，一方面是允许可以与信息流量强烈下降的系统相比较的传输信息流量。

此外，本发明的另一个目的是产生能表现周围环境的高质量的悦耳噪声，同时最低限度地缩少欲传输数据的信息流量与音量，以便确保悦耳噪声的产生。

在断续的语音数字传输系统中产生悦耳噪声的方法与装置中，有效性状态期间传输已编码的语音信号。在这期间传输了有效性的帧，随有效性状态后是无效性状态，在这期间至少传输了无效的帧。本发明的目的特别是在传输中，根据一个有效性状态的检测，允许形成并传输静音描述的帧，其中包括一组描述悦耳噪声的编码参数。该静音描述符的帧包括在无效状态的第一个静音描述符的帧，以及随后的有效性状态的帧。对于在这无效性状态下的所有的连续当前的无效帧进行如下处理：

—分析与存储该当前的无效性帧的频谱，

—用参照频谱与该当前的无效性帧的频谱进行比较，及在当前的帧的频谱与参照频谱的同一性准则上：

—暂缓所有的传输，特别是在这当前的无效性帧期间的新的静音描述帧的传输。而在当前的帧的频谱与参照频谱缺乏同一性的准则上：

—在这当前的无效性帧期间，形成与传输一个新的静音描述帧，这允许减低悦耳噪声的传输信息流量直到唯一的静音描述帧的信息流量。其中它的频谱与在前一个的静音描述帧期间估计的参照频谱是有区别的。

作为本发明目的上述方法与装置，其显著特点同样在于在接受过程中分别允许结合一个语音译码器；

—对每个静音描述帧连续地解码悦耳噪声的描述的编码参数组合体，以便形成解码的参数。

—在处理上述译码参数之后，在语音译码器上合成相应的悦耳噪声。

用下列附图可以进一步更好地理解本发明的叙述内容。除了有关先有技术的附图1外；

—附图2a表示了按照本发明目的，在发送过程中，实施产生悦耳噪声过程时主要阶段的系列示意图；

—附图2b表示产生静音描述帧的最佳模式的流程框图；

—附图2c表示按照本发明目的，在接收过程中，实施产生悦耳噪声过程时要阶段的系列示意图；

—附图2d表示，在采用装有LPC滤波器的预告式的语音编码器的情况下，实施产生悦耳噪声过程时主要阶段的系列示意图；

—附图2e表示按照本发明方法的，在发送过程中，产生悦耳噪声的装置的示意图，其中以功能框图形式表示；

—附图3a表示按照本发明目的，在采用预告式的语音编码器的特定情况下，在接收过程中产生悦耳噪声的装置的示意图，其中以功能框图形式表示。

—附图3b表示实施附图3a的装置中的悦耳噪声发生器的具体实施方案。

—附图3c，以功能流程序框图的方式，表示产生一个传输或不传输静音描述帧的操纵信号的相继阶段集合；

—附图3s，以功能流程框图的方式，表示产生、编码与传输一个静音描述帧的相继阶段集合；

—附图3e，以功能流程框图方式，表示根据较佳实施案的产生一个激励信号的相继阶段的集合；

—附图4a，以功能框图方式，表示按照本发明目的，在接收过程中，产生悦耳噪声的装置的示意图；

—附图4b表示实施附图4a的装置中的悦耳噪声发生器的具体实施方案；

用上述的附图可以给出符合本发明目的的产生悦耳噪声的方法的最详细说明。

首先，要严格地说按事先的方法的说明，结合有关先有技术的附图1，我们注意到在一个语音数字传输系统中的一个传输的产生悦耳噪声的装置，在发送过程中，除了一个语音编码器外，还包含有一个语音有效性的检测器，图中用DAV表示，以及一个CNG发生器。这种组合可以在发送过程中，严格地说根据本说明书的前述一个方法，周期地在一个传输通道上传输静音描述帧或SID帧。

在接收过程中，一个语音译码器，当在发送过程中所用的语音编码器是预告式时，该语音译码器也同样是预告式，可以解码被传输的语音信号，它们分别是SID帧，以及由于CNG发生器的作用，在接收过程中可以产生相对应的悦耳噪声。

如同附图2a所表示，语音的数字传输是以间断方式进行的。这种传输包括在连续的有效性期间，使这过程编码的语音信号帧被传输；一再中断的无效性期间，在这个过程没有一个语音信号帧被传输。上述期间的各个时宽是根据传输的异步特性而随意的。

如同在前述附图2a中所看到，符合本发明目的的产生悦耳噪声的方法是在检测一个无效性期间以后，在发送过程中实施的。对无效性期间以后，在发送过程中实施的。对无效性期间的检测可以以语音有效性检测器DAV发送信号为开始来实现。这样就须进行等待时机的延时过程，以便在无效性期内确保有效的通道。考虑到检测期的持续时间，上述延时过程同时也是可以调节的，如图2a所示，以确保正确实施本发明的方法。在前述的附图2a中，检测期是随所考虑的有效性期之后，用点划线以间隔划定界限所表示。

随着每个无效性期的检测之后，本发明的方法包括了从前述的检测期末尾，如图2a中的阶段100所示，发生并发送一个SID帧，或静音描述帧。该静音描述帧包含悦耳噪声的描述编码参数组合。实际上，该静音描述帧包含随有效性期与前述的检测期之后的第一个无效性期的无效性帧。

此外，在附图2a中人们还可以看到：本发明的方法，如图中阶段101所示，还包含对上述无效性期的连续当前的无效性帧的频谱进行分析与存储。如在图中的阶段102所示。把上述当前的无效性帧的频谱每一个对照的频谱进行对比，后者将在以后叙述。

根据本发明的方法，或者在当前帧的频谱与对照频谱同一的准则下，如同图中阶段102所示，延缓所有的传输，特别是SID帧，即一个新的静音描述帧的传输，或者在当前帧频谱与对照频谱不同一的准则下，在这个当前的无效性帧期间，根据形成第一个SID帧的相同技术，发生并传输一个新的静音描述帧。如图中阶段100所示，该阶段100也是用于形成每个SID帧。在附图2a中，我们可以看到在上述的当前帧频谱与对照频谱同一的准则下，所有新的帧的延迟传输发生在图中阶段104上。

通常，我们知道本发明的方法能降低悦耳噪的传输信息流量直至唯一的静音描述帧的信息流量，其中其频谱是与前述的静音描述帧的频谱不同的。

根据符合本发明的的一个产生悦耳噪声方法的特别实施方案，我们知道对照频谱可以是从在产生每个静音描述帧期间得到的环境噪声的频谱形成的。因此，我们知道，本发明的方法，如同图2a中所示，可以包括图中的阶段103，后者是用于存储环境噪声，并能获得每个SID帧的对照频谱。

关于本发明方法的初始状态，我们知道：对于一个无效性期的第一个无效性帧，采用对照频谱是没用的。因为对于一个描述帧的发送决定并非取决于对当前帧频谱与对照频谱的对比。在第一个SID期间，该对照频谱sfr或是估算，或是通过形成SID帧的计算直接得到地照频谱，而且存储起来，用于处理随后的无效性帧。根据同样地用于起动预置一个无效性期的第一个SID帧的方法，该对照频谱对于每一个新发送的静音描述帧来说都是焕然一新的。

我们可以估算出每一个SID帧的对照频谱，而且我们也可以是根据图2b叙述的实施方案构成对照频谱。

在图2b叙述的实施方案中，本发明的方法包括：创立每个静音描述帧。SID帧，并据专门的过程，以某种方式使每个SID帧与环境噪声的演变相匹配，同时考虑了用于产生SID帧频谱的这种演变的若干具体因素。

如图2b所示，每个静音描述帧的创立过程可以包括确定连续无效性帧的平均频谱的阶段，以创立已过去的平均频谱，并用SFmp表示。上述阶段在图2b中用标号1041表示。

在上述情况下，它过去的平均频谱SFmp具有如下关系式(1)： $>>SFmp>=>1>/>n>>Σ>1>n>>SFi>>>其中，我们知道对于众多的无效性连续帧，用SF1，SFi、SFn表示。而在当前的无效性帧中，则用SFc表示频谱，已过去的平均谱相对应于前述的n个连续无效性帧的n个频谱的算术平均值。$

严格地说，SID帧是在随后的阶段1042中产生的。

前述的阶段1042包括：已过去的平均频谱与当前的无效性帧的频谱的同一性测试，用关系式(2)表示：

SFc＝SFmp。

我们知道，同一性准则不是对比频谱的严格同一性。因此，可以建立一个对应法则或准则。实际上，上述阶段可以测定频谱的局部稳定性。

在上述的频谱的同一性准则中，本发明的方法包括：选择如图中的1043所示的静音描述帧SID等于已过去的平均频谱SFmp；而在前述的频谱不同一性准则中，选择了如图中1044表示的，SIF帧相对应于当前的无效性帧的频谱。

上述实施方案特别有利于根据一个帧就可以估算出所有的当前的无效性帧的静音频谱。前述的帧可以属于局部稳定的谱区，也可以属于不稳定的谱区。

当然，用于计算已过去的平均频谱的连续的无效性帧的数量n是任意的。例如平均频谱可以是等距的，以便能取得在100ms数量等级的时间间隔。此外，我们还知道由此构成的静音描述帧SID在传输前受到量化。

根据附图2C，我们可以更详细地描述符合本发明目的，在接收过程中，在断续的语音数字传输系统中产生悦耳噪声的过程。

当然，我们知道在接收过程中，本发明方法过程牵连了根据前述方法过程的SID帧的发送过程。

参照附图2C，我们知道据本发明的方法包括一个用于每一个连续的静音描述帧与悦耳噪声的描述编码参数组合的译码器，它可以产生解码的参数，如在图中阶段200所示。然后在处理解码的参数后，在语音译码器上合成那些参数，以便在语音译码器上合成相应的悦耳噪音，如图中的阶段201所示。我们知道对解码的参数的处理包括较合适的特定的重编码。

通常，我们知道符合本发明目的的产生悦耳噪音的方法过程最好是如下述实施的：即在发送过程中，以及分别在接收过程中所用的编码器与译码器都是预测式的。

在上述情况下，通过一个合成滤波器LPC(下称LPC过滤器)过滤激励信号获得解码的信号，该激励信号根据新词典很可能称为长期激励信号。

本发明的方法过程还在于发生一个激励信号，其频谱相似于白色噪声的频谱，以便激励一个LPC滤波器，后者能够合成信号，以便产生悦耳的噪声。

在上述情况下，表示环境噪声频谱的参数是这样确定的：用滤波器LPC的系数表示频谱的包络，而用激励信号的能量表示上述频谱的高度。

本发明的方法在发送过程中将重复已在附图2a中描述的主要阶段。

这种方法由附图2d所描述与表示，即如同在传输一个静音描述帧的运转过程中所显示的阶段及其标号一样。

根据如图2d所示的本发明方法的实施方案，人们证实在该方法过程中，对于SID帧的传输决定或不传输决定，一方面取决于LPC滤波器的稳定性，另一面取决于激励能量的稳定性。

如同在附图2d中所示，在图中阶段100’的第一SID帧的传输之后，该方法包括比较用FC表示的当前帧的滤波器LPC。图中101’表示对当前帧滤波器FC的存储，图中102’则表示当前帧滤波器FC相对于参照滤波器Fr的比较，后者是据图中阶段103’的前一个SID帧期间获得并存储的。

当如图中阶段102’的前述滤波器处于不同一性时，在阶段100’中就会传输一个新的SID帧。图中的阶段100’，101’，102’与103’和图2a中的阶段100，101，102与103明显是没有变化的。

相反地，当当前帧滤波器Fc与参照滤波器Fr具有同一性时，那么在图2d中表示的方法过程包括：在阶段104’a中的当前帧的激励能量的估算Ec，以及在阶段104’c表示的前述的当前帧的激励能量Ec相对于在上一个的SID帧期间估算的参照能量Er的比较，这种对照能量的估算是如图2d中的阶段104’b所表示。

在图中的104’c阶段测试中，当前帧的激励能量对于参照能量的比较是很有意义的。这种比较可以使上述两种能量的比较差值达到界限值E₀，这个方法过程可以造成与传输新的SID帧，以返回到前述的阶段100’中。相反地，在图中的阶段104’c测试中，前述的激励能量之间的差异是没有意义的。该方法过程，正如在图2a中的104d一样，在本图中的阶段104’d上，延迟了一个帧的所有传输。

在图2d中表示的本发明的方法过程的范围内，我们知道了确保LPC滤波器的比较，人们采用特别适用于LPC滤波器的矢量的量化方法的距离准则。上述的距离可以组成ITAKURA-ASIT0距离，它是最大的可能性，或者用于计算来自LPC系数的参数的欧几里得距离。例如，频谱纹线对，或者记录区域比例。

关于激励信号能量的稳定性，人类收听器官的灵敏度的非直线性是被利用于增益(放大)的计量器中，后者是用于编码器中，为此，前述的编码程度最好是进行当前帧的激励能量Ec与参照能量Er之间的对比，其中采用这些能量的量化指数，为了简化该过程，所用的计量器是那些用于计算在SID帧中编码的能量计量器。

LPC滤波器的估算过程，以及对静音描述帧SID的激励能量的估算过程将在以后的一个相应的悦耳噪声发生器装置的具体实施方案中有所叙述。

关于激励信号的计算，本发明的方法过程需要发生一个激励信号，其频谱与白噪声的频谱的特性相类似，其平均能量是传输到译码器上的能量。一个简单的对该激励信号合成的方法可以偶然地得到由传输能量计算与确定出来的均匀概率的密度与幅度信号。

另一种方法可以通过偶然地抽取一个激励达到合成，该激励正如用于语音编码器的那种一样。第二种方法的优点是在接收部分可以实施装于译码器外部的模块。另一方面，从感性而言，前述的解码帧的中断的风险是很小的，因为该激励没有急剧的改变型式。前述的第二个方法的原始实施方案将在以后的相应的装置的具体实施方案中有所叙述。

结合附图2e最详细地描述一个符合本发明目的的、在断续的语音数字传输系统中产生悦耳噪声的装置，该装置当然能产生前述的那种悦耳噪声。

在附图2e中，上述的装置包括如图中标注1所示的一个语音编码器，一个在每个有效性期以后的一个检测期中的每个有效性期末尾的检测模块2。我们知道模块2是由常规的语音有效性检测器所组成，并与语音编码器1相连，而且它输出逻辑信号，即图中的VADin表示在编码语音帧传输期间的一个有效性期的存在；以及在静音描述帧应该传输或者相反地，设有任一个帧传输的期间的有效性期的不存在。

此外，在图2e中还表示一个用标号3表示的CNG发生器，它一方面与语音编码器1相连，另一方面也与语音有效性模块2相连。图中的多路复用器4一方面分别接收由语音编码器1输出的编码语音帧与由CNG发生器3输出的编码的静音描述帧，或SID帧的信号，即由同一个CNG发生器3输出的一个代表传输型式的信号，图中用VADout表示。

通常，人们知道据本发明的装置，如图2e所示，遵循根据本发明方法的原则。在CNG发生器3中包括一个条件发生与传输模块3a，它是用于在无效性期中，产生与传输组成一个悦耳噪声的描述编码参数组合的一个静音描述帧；一个用于分析与存储所有当前无效性帧的频谱的模块3b；一个用于比较当前无效性帧频谱与参照频谱的模块3c，它可输出一个取决于在当前帧频谱与参照频谱之间的同一性或不同一性的控制信号；一个用于当前帧的传输型式的估算模块3d，它使所有的帧输出一个在发生器3的VADout信号，即分别编码有效性帧，非传输帧以及静音描述帧等信息。

模块3d一方面接收来自语音有效性检测模块2的信号，另一方面也接收来自模块3c的比较信号。当当前帧是有效性时，模块3d重传输在VADout信号中的信息。否则，当当前帧是有效性期的第一个无效性帧时，该模块3d授予VADout信号一个与静音描述帧信息相对应的值，它还准许一个新的静音描述帧的传输。如果该当前帧是一个无效性帧，但并不组成无效性区域的第一个无效性帧时，该模块3c对当前帧频谱与对照频谱进行比较，而且在这些频谱处于同一性或不同一性时，发出分别表示静音描述帧与不传输帧信息的CMP信号。在这种情况下，该模块3d，使CMP信号编码或传输信息的VADout信号。当当前帧频谱与对照频谱同一性时，它就延缓所有的传输，而在当前帧频谱与对照频谱处于不同一性时，它就传输一个新的静音描述帧。

模块3和3b与上述语音编码器交换一些语音编码器的管理信号，在图中用Sg表示。在入口处，这些模块接收可便当前帧的频谱发生演变的数据，如在模块3b；而在模块3a，这些模块接收可使在当前帧前面的一些帧的频谱发生演变的数据。在出口处根据编码器的需要，模块3a必要时向语音编码器传送这些信号，以便及时处理好它们的存储器，避免与放置于接收部分的语音译码器发生不同步。

在入口处，模块3a也收到由模块3b产生的当前帧的频谱，即SFC信号。

图3a表示了一个产生悦耳噪声的装置的最详细的叙述，其中图中的语音编码器1是一个预测式语音编码器，它包含用于每个语音帧的一个分析模块LPC，其分检级别为M。所谓的分检极别是由滤波器Lpc的系数的数目确定的。参数(M+1)特别形成语音信号的自相关功能系数Acf，而该帧的滤波器Lpc的代表性参数M，图中用LPC表示，它是根据用于每个帧的预测性编码方法被编码成在前的帧的LPC参数。参数LPC的预测性编码对于本发明装置的功能而言是不必要的，但是反映了后者的构思。在编码器不采用参数LPC的预测性编码情况下，上述装置将容易简化。

语音编码器1，借助于分析与合成技术，产生并存储一个激励信号，图中用Exc表示。它与在译码器上计算的用于激励合成滤波器Lpc的信号是同一的。

图3a的装置采用了与前述图2e一样的构型。CNG发生器3接收来自预测性语音编码器1的语音信号的自相关功能Acf，在前帧的LPC参数，以及必要时一些来自在前帧的构成激励信号Exc的部分激励信号Exc(n)。应当指出，上述采样的进行在为了合成悦耳噪声的预测性编码器的长期激励的应用上是附有条件的。

图3b表示了据本发明的CNG发生器3的最详细描述。在该实施方案中的语音编码器是预测性的编码器。

在图3b中，据本发明的装置，特别是CNG发生器3包含一个用于计算当前帧的参数Pc的模块3a。它接收语音信号的自相关功能信号Acf，而且在其出口处生成与当前帧的参数Pc相对应的信号。这些参数包括当前滤波器Fc和当前激励能量Ec。

该CNG发生器3同样地包含，如图3b中所示的，一个用于决定发送已编码的语音帧的，或发送静音描述帧，SID帧的，或暂缓上述发送的模块31。它接收语音无效性信号VAin，与当前帧相关的参数Pc，以及由模块32送出的对照参数Pr。该模块31发送一个具有三个级别的传输信号，即VAout。当第一级别VADout＝0时，表示在无效性流动帧期间即VADin＝0时，没有发送由语音无效性的检测模块2发送的信号；当第二级别VADout＝1时，表示在有效帧期间，即VADin＝1时，有一个被编码的语音帧的发送；当第三级别VADout＝2时，表示在无效性帧期间，即VADin＝0时，有SID帧的发送。

CNG发生器3同样地包含一个模块32，它有条件地计算输入VADout的信号，这些信号与每个SID帧的计算参照参数Pr相对应的。这些参数包含参照滤波器Fr与参照激励能量Er。该模块在入口处接收自相关信号Acf与当前帧的参数Pc。

该CNG发生器3还包括模块33，即编码的静音描述，SID帧的发生器，它接收传输型信号VAout，与参照参数Pr相对应的信号，而且有条件地发送编码的静音描述帧信号。

此外，该CNG发生器3也包括模块34，即激励信号Exc的发生器。它接收传输型信号VADout，与参照参数Pr相对应的信号，以及必要时，根据所采用的发生方法，一些来自语音编码器的部分过去的激励信号Excpas。该模块有条件地向VADout信号发送一个用于当前帧的激励信号Exc。

该CNG发生器3还包含一个模块35，即重实现的滤波参数Ppc的描述信号的发生器。它接收传输型信号VAout，与参照参数Pr相对应的信号，以及由语音编码器1发送的在前帧的参数Lpc的描述信号。而且以VADout为条件重实现当前帧的信号Lpcr。

CNG发生器模块3的功能如下：

在入口处，该CMG发生器模块3接收由语音有效性的检测器模块2所输出的无效性帧0，有效性帧1的VADin信息，同样地它也从语音编码器模块1接收如下每个帧的信号：

—当前帧的语音信号的自相关功能信号Acf，

—至少与上述帧有关的参数Lpc的描述信号，这信号参数Lpc，并与编码器1的至少一个帧的参数LPc相关，这是用于语音编码器的预测性计量器的参数。

—必要时，已过去的激励信号。

在出口处，该CNG发生器模块3产生前述的具有三个级的，用于每个帧的传输型信号CABout。

对于静时描述帧即SID帧，该CNG发生器3还产生组成SID帧的编码的静音插入参数。

对于无效性帧，即由语音有效性模块2输出的有效性信号VADin等于0时，必要时该CNG发生器模块3还输出当前帧的激励信号Exc，以及参数Lpc的重实现信号Lpcr。

CNG发生器3的总功能可以如下所述：

—如果VAin＝1，该帧就是有效性，而且CNG发生器3满足于反映在VAout＝1的信息。

—否则，该模块30首先估算与当前的帧有关的参数Pc：

此外，如果该当前帧应是非传输的，或组成一个SID帧时，那么该模块31就决定传输：

—如果该当前帧是在无效性期以后的第一个无效性帧时，那么就是SID帧，

—否则，尽管该当前帧是一个SID帧，模块31就使用来自对前述SID帧的参照参数进行计算的模块32的参照参数Pr并确。

如果该当前帧是一个SID帧，那么VADout＝2，或VADout＝0。

如果该当前帧是一个SID帧，该模块33编码SID帧的参数。

在前述两种情况下，也就是说，当VADout＝0或2时，该模块34及时就产生与流动帧有关的激励信号Exc，而模块35就及时产生参数的表示信号Lpc。

图3C最详细地描述了模块31的操作模式，即决定发送编码的语音帧或静音描述帧，SID帧，或者中止该发送。

与在前帧有关的信号VADin的检验点1020，用指数t-1表示，用于确定该当前帧是否是第一个无效性帧，假设VAin(t-1)＝1，为了VADin(t)＝0，则致使在1021检验点中产生一个信号VAout＝2，也就是说，决定发送一个SID帧。

相反地，在检验点1020的反应为否定时，假设VAin(t-1)＝0，上述的帧是无效性时，与当前帧有关的滤波器Lpc根据下列关系式(3)在阶段1022上被计算： $>>At>>(>z>)>>=>>Σ>>i>=>0>>M>>>a>t>>>(>i>)>>>z>>->1>>>,>>a>t>>>(>0>)>>=>1>>>$

我们知道其中的a_t(i)表示从前述的自相关信号的自相关系数Acf计算出的滤波器Lpc的系数，i表示每个系数的指数。

该滤波器的值与在在前SID帧期间存储的传递功能的参照滤波器A_ref(z)相比较，即如前面描述实施本发明方法时所描述的那样，这种比较可以借鉴前述的Ltakura-Saito距离。这种距离是比较极限值，这样就可以避免对数计算，而且撤消除法运算。对极限值的比较是据下列关系式(4)实施例的：

其中，Err_t表示当前帧中Lpc剩余能Lpc剩余信号的平方和，该剩余能是据Levinson-Durbin方法，在滤波器的计算过程中得到的；R_Aref表示一个从参照滤波器的系数的自相关A_ref(z)产生的函数，如下列关系式(5)所示： $sup>>{>>>R>Aref>>>(>i>)>>=>2>>Σ>>j>=>0>>>M>->1>>>>A>ref>>>(>j>)>>×>>A>ref>>>(>j>+>i>)>>,>i>=>l>→>M>>>>R>Sref>>>(>o>)>>=>>Σ>>i>=>0>>M>>>A>ref>>>>(>i>)>>2>>sup>>>$

当关系式(4)是不等式时，就不考虑滤波器Lpc是否类似于参照滤波器，当前帧就限定为一个新的SID帧，VADout＝2。

否则，在图中同一个阶段1022中，对当前帧的激励能量Et的估算过程就是根据剩余能量Lpc Err_t进行的。为了进行对当前激励能量Et的估算，该剩余能量Lpc Err_t被一个因数CE相乘，后者是由最初的尝试估算的。然后人们计算m个帧的该能量的平均值。m是一个整数，与100-200ms的时间间隔相对应。我们根据关系式(6)进行量化运算，Q(.)： $>>i>>(>t>)>>=>Q>>(>>1>m>>>Σ>>j>=>t>->m>+>1>>t>>>E>j>>)>>>>$

其中，i(t)表示m个包括当前帧的连续帧的平均能量的量化指数，在图3C的阶段1023中完成了上述运算。

我们知道上述帧的m数是从每个无效性区的开头以1开始的，然后它就以每个帧递增，直至确定的最大值为止。

前述的运算1023后连着运算1024，如同前述它使当前帧的滤波器Lpc与参照滤波器A_ref(z)进行比较，当前述测验点1024的反应为肯定时，在阶段1027中的VADut信号是于2，即准许SID帧的传输，当测验1024的反应为否定时，测验点1025就起作用。该测验点1025包括由前述关系式(6)得到的能量的量化平均值，用于当前帧的量化指数i(t)与当在前SID帧期间得到的参照的帧的量化指i_ref相比较，据下列关系式(7)：

|i(t)-i_ref|＞阈值2

当检验点1025的反应为肯定时，证实了不等式，激励能量的大小就变化，而当前帧就如同SID帧限定。

当测检点1025的反应为否定时，该当前帧就如同不传输的静音帧1026。VADout信号等于0。

图3d更详细描述了编码的静音描述帧，即SID帧的发生器模块31的操作方式。

通常我们知道，在SID帧编码期间，就计算一个新的参照滤波器Aref(z)。

首先，为了实施上述运算，就要根据关系式(8)，在阶段1100估算出已过去的滤波器平均值Lpc，即传递函数A_part(z)。

A_part(z)＝Moy(A_j(z))

j＝t-P1→t-1

该滤波器是从在当前帧前面的P1帧的前述的信号的自相关量Acf计算出来的。该滤波器的系数的自相关计算R_APart是根据前述的关系式(5)实现的。

测验点1101以与图3C中的测验点1024相类似的并与关系式(2)相符的方式测试出局部稳定性，该测验点1101的阈值是等于阈值1。当前述的测验点1101的反应为肯定时，根据关系式A_ref(z)＝A_t(z)，该阶段1103就可以将当前滤波器选择为参照滤波器，这样就可以计算出新的参照滤波器的自相关函数R_Aref。

当测验点1101的反应为否定时，根据关系式A_ref(z)＝A_past(z)，已过去的滤波器平均值就可以被选择为参照滤波器。就可以使参照滤波器的系数的自相关函数与关系式(9)相适应。

R_Aref(i)＝R_Apst(i)，i＝0→M

量化阶段1104是基于代表前述1102-1103选择的参照滤波器的参数来执行的，量化运算是根据用于编码器的方法实施的。所得的编码被插入到编码的SID帧中。

在阶段1105中，已经在1023中计算与量化的激励能量(i)被插入到相应SID帧中，作为参照能量i_rer存储。

关于激励信号的合成，我们知道i_ref表示对能量的量化指数，g_ref表示相等于平均能量的平方根的增益系数，其关系式如下： $>>>g>ref>>=>>>Q>>->1>>>>(>>i>ref>>)> >>>$

其中Q^-1表示量化逆转运算。

当前帧的增益放大系数如下述产生：

g_t＝g_ref，在无效性帧的开头，

g_t＝α×g_t-1+(1-α)×g_ref，在无效性期

在上述关系式中，α是一个0与1之间的实系数。

在实施本发明方法的第一个方法过程中，可以通过随机提取样品进行对激励信号的合成，在这种情况下，我们知道一个帧的N个样品的提取可以凭借一个均匀规则的随和的发生器在[]间隔中实施。

激励信号的第二个合成或方法包括：随机提取参数编码，它构成激励信号Exc的特征。而且直接向译码器提供这些编码。这方法的优点在于使悦耳噪声发生器可以自行插入到译码器中，以避免在无效性帧与悦耳噪声之间失去平衡时可能出现激励信号的中断。对激励参数的编码应该进行调节，以便当前帧的解码激励能量相对应于所希望的能量值，即Ng_t²，其中g_t²表示样品的平均能量，而Ng_t²表示构成这个帧的N个样品的能量。

当语音编码器采用长期预报，或以等同方式使用一个用已过去的激励样品的适应性词典时，最简单的是废除这种激励，以选择激励的最小量化增益，LTP长期预报的激励基本上是零或接近于零。生成的激励在革新中实际上减弱了。使人们易控制该能量。对于大量的语音编码器而言，废除长期激励就形成差的谱线的激励。它们的特性就不是白噪声，而使由解码器合成的悦耳噪声质量受到影响。

一个特别有利的方法允许使用LTP激励与控制全部激励的增益，后者通过添加激励LTP而取得的，其中图3e描述了一个革新方案。

众所周知，据上述方法，该语音编码器向CNG3模块传送一些由已过去的帧的激励信号Exc_pas的样品，该信号如图3b中所示，用虚线表示。

在该实施方案中，N个样品的帧是分成N/L的样品块，其中激励参数被计算与编码。根据语音编码器的需要，可以再进一步划分上述块，长期激励的编码的计算时间不需要与该革新方案的时间相对应。

在图3e中，阶段1201允许与N/L样品块的完备性相关的计算变量j以0开头。

由样品Exc(n)，其中n＝0→N-1，组成的一个激励信号Exc，被确定为当前帧的一个长期预报激励e_LTP(n)与一个革新激励βu(n)的线性组合。其中u(n)表示革新波形，而β是去量化后的增益。人们对于每个功力图调节其增益，以便能控制激励能量。

对变量j的每一个块，长期的激励的参数编码是随机提取的，如图中的阶段1202所示，宜对长期的激励的增益的编码进行约束，以便限制其能量，为此，人们得到信号的L个样品e_LTp(n)，其中n＝jL+k，k是0→L-1，以利用由语音编码器提供的已过去的信号的样品Exc_pas。

接着通过随机提取革新波形的编码得到革新的激励信号，如图中的1203。人们还得到波形的L个样品u(n)，其中n＝jL+k，在块上，k是0→L-1。

图中的阶段1204允许求得革新的激励增益的量化系数ind，而且通过去量化的运算，与增益β组合，人们选择系数，以便在块上能使每个样品的平均能量接近如关系式(10)中所示的理想值： $>>|>>1>L>>>Σ>>n>=>jL>>>>(>j>+>1>)>>L>->1>>>>>(>>e>LTP>>>(>n>)>>+>βu>>(>n>)>>)>>2>>->>>g>t>>2>>|>>>最小值$

其中增益β代表革新的激励增益的计量器的恢复值。

当长期的激励的增益与革新激励共同地被一个矢量计量器所量化时，本方法的另一种形式是如下所述：在图中的阶段1202上，激励e_LTP(n)是通过随机提取代表期限LTP的编码取得的，其中增益等于1。上述关系式(10)改为关系式(11)： $>>|>>1>L>>>Σ>>n>=>jL>>>>(>j>+>1>)>>L>->1>>>>>(>>β>1>>>e>LTP>>>(>n>)>>+>>β>2>>u>>(>n>)>>)>>2>>->>>g>t>>2>>|>>>最小值$

量化的增益β₁，β₂是共同地通过矢量计量器的词典的扫描选择的。

图中阶段1204后随一个阶段1205，其中对当前块的样品的Exc进行计算，以修改激励信号Exc。

计算变量j的增量，使在具有这种变量的图中阶段1206后面的阶段1207上能够完成对组成一个帧的组合样品的激励信号的提取。

据附图4a与4b，可以进一步描述在接收过程中根据本发明的在断续的语音数字传输系统中发生悦耳噪声的装置。

如图4a所示，在接收过程中，该装置包括一个悦耳噪声的解码模块5，更确切地说，是在每个连续的静音描述帧中描述悦耳噪声的编码的参数组合的解码模块。

严格地说，上述模块5连着一个语音解码器。而且它接收与被模块5处理的当前帧形式有关的信息，即VAD信息。这信息再生成在发送过程中生成的具有三个级别的信号信息VADout当然也是编码的静音描述帧，即SID帧。此外，它还从语音解码器接收一个管理信号Sg，以便确保与解码器的同步。

该模块5能够生成与当前帧有关的悦耳噪声的描述参数PBC。

该语音信号的解码器一方面接收编码的语音帧，另一方面还接收与当前帧有关的悦耳噪声的参数描述信号PBC。通过对其合成输出一个合成的语音信号，如前图所示，限定于解码的信号范围。

当语音信号解码器是预报型解码器时，图46就进一步详细地描述在图4a中所示的模块5。其中解码模块5至少包括一个信息分离器50。后者接收传输的编码的静音描述帧的信号，输出一个过滤的参数的描述编码信号LPC，这种与当前帧有关的信号，如图4b所示的LPC_c，以及一个描述合成的激励信号级别的量化的增益系数信号i_ref。这些参数一直被引用到随后的SID帧。

此外，一个去量化模块51可以被用作接收前述的量化增益系数信号，而且输出一个去量化增益信号，g_ref。

一个计算模块52可以被用作接收与当前帧有关的滤波参数的描述编码信号(LPC)，即LPC：至少与前述帧有关的滤波参数的描述信号(LPC)，即LPC，以及帧的传输形式的信息，即VAD。该计算模块52输出具有当前帧的参数(LPC)的LPC信号。

一个激励发生器模块53可以被用作接收去量化的增益信号g_ref，必要时将已过去的激励信号，以及帧形式的信息VA用与当前帧有关的激励信号Exc进行修改。

当这些帧为无效性时，该解码器模块5就不发生作用。

在模块5的入口处，它接收由VAD0：不传输帧的信号所给的信息，由VAD2：SID帧的信号所给的信息，以及在几个SID帧情况下，该帧的编码的参数。另一方面，该语音解码器提供如下数据，

—用于预报性计量器的至少与前述帧有关的参数LPC，与前述帧的这些LPC相关的信号(LPC)，

—已过去的激励信号Exc_pas，长期预报器的存储。

在其出口处，该解码模块5为每个无效性帧生成N个新的样品的激励信号Exc，以及去量化后的新的参数LPC(称LPC)。

该语音解码器利用这些数据以合成无效性帧。

当信号VAD＝2等时，用于量化能量的SID帧的参数LPC与i_ref被解译与存储。在图中我们标出LPC_refc与g_ref这些存储参数。

当VA＝0时，计算模块52对LPC_ref进行量化与去量化处理或利用从解码器提供的已过去的参数LPC，不发生变化的去量化的增益g_ref，以及与当前帧有关的修改的增益g_t可以根据前述的关系式计算出一个新的参数组合LPC。

在第二种情况下，模块53可以根据前述66一个或其它方法计算出与当前帧有关的激励Exc，而且传输到语音解码器，以影响无效性帧的解码信号的合成。

我们知道悦耳噪声的解码器模块5可以完全独立地插置于解码器的外部。在这种情况下，所用的方法过程同样地是把解码器的一些基本功能转移到该模块上。

此外，在一个具体的实施方案中，它们的前述参数的较佳值是如下所示：(即在其频率为8kHz情况下，选取N＝240样品的帧

参数用途值 P₁ 帧/滤波器平均值 3 P₂ 帧/平均能量值 3 阈值1 频谱稳定性阈值 0.07 阈值2 能量稳定性阈值 3 C_E Err_t的校正系数 2.70

校正系数C_E与前述的数值适应于U.1.7标准的G723预报性编码器，这是用于可视电话的预报型编码器RTC。

我们已描述了一个性能良好的在断续的语言数字传输系统中产生悦耳噪声的方法与装置。

根据本发明的上述方法与装置在如下范围内具有特别的优越性：即依赖于在无效性期间对信号的分析，当所用的参数发生变化时，这些用于重生成噪声的参数进行翻新过程。在第一个无效性帧中，SID帧的发送既不受限制，也不是周期地重发生。而是被装置本身所控制。如此就可确保一个高质量的悦耳噪声，又可以降低欲传输数据的容量。

实际上，令人满意的是为了计算可形成SID帧的参数，它们实施了一个有效的方法以考虑环境噪声的稳定性与不稳定性，以便使环境噪声发生演变。

当上述装置中结合使用一个预报型的语音编码器时，为了估算能量的稳定性，根据本发明的方法就对量化的激励信号的能量进行比较，其中可以容易地提取讲量器的可理解的特性部分。

此外，在实施合成激励波的第二个方法中，根据本发明的方法提出，除了使用革新词典外，还使用一个适应词典LTP，即一个可以在传输能量中调节增益的方法，由上述方法所形成的激励波形式通常其频谱比只用革新词典的频谱更加丰富。

最后，本发明的组合是可以实施的，并可以生成高质量的噪声，其中当传输的平均率较小时，可以以适度的计算复杂性为代价，同样地被合成起来。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 在语音数字传输系统中产生悦耳噪声的方法与装置 [P] . 中国专利： CN1104710C . 2003.04.02
2. 在语音数字传输系统中产生悦耳噪声的方法与装置 [P] . 中国专利： CN1155801A . 1997-07-30
3. Method and Apparatus for Generating Comfort Noise in Voice Numerical Transmission System [P] . 韩国专利： KR100357254B1 . 2003-01-10

机译：语音数字传输系统中产生舒适噪声的方法和装置
4. METHOD AND DEVICE FOR MITIGATING WIND NOISE IN A SPEECH SIGNAL GENERATED AT A MICROPHONE OF THE DEVICE [P] . 欧洲知识产权局专利： EP3136385B1 . 2019-10-09

机译：用于减轻在装置的麦克风上产生的语音信号中的风噪声的方法和装置
5. METHOD AND DEVICE FOR MITIGATING WIND NOISE IN A SPEECH SIGNAL GENERATED AT A MICROPHONE OF THE DEVICE [P] . CA2935840A1 . 2017-02-25

机译：用于减轻在装置的麦克风上产生的语音信号中的风噪声的方法和装置