首页> 外文会议>Joint Conference JEP-TALN-RECITAL 2012 >Mapping de l'espace spectral vers l'espace visuel de la parole: Les voyelles du Français en Langue Française Parlée Complétée
【24h】

Mapping de l'espace spectral vers l'espace visuel de la parole: Les voyelles du Français en Langue Française Parlée Complétée

机译:从频谱空间到语音的视觉空间的映射:法语口语中的法语元音已完成

获取原文
获取原文并翻译 | 示例

摘要

Cet article présente les résultats de l'approche statistique GMM pour le mapping des paramètres spectraux du signal acoustique de la parole vers les paramètres visuels de la Langue Parlée Complétée (LPC) au sens des moindres carrés, à un bas niveau d'interfaçage ce qui est innovant par rapport à l'approche classique texte-parole visuelle. A toute fin d'évaluation de l'approche GMM, nous présentons aussi les résultats de l'approche de modélisation multi-linéaire. Les résultats montrent que la méthode GMM améliore très significativement le mapping, tout particulièrement dans le cas de faible niveau de corrélation entre certains paramètres cibles comme ceux du LPC et les prédicteurs constitués des paramètres spectraux du signal acoustique de parole.%In this paper, we present a statistical method based on GMM modeling to map the acoustic speech spectral features to visual features of Cued Speech in the sense of least square error in a low signal level which is innovative and different with the classic text-to-visual approach. In comparison with the GMM based mapping modeling we first present the results with the use of a multi-linear model also at the low signal level and study the limitation of the approach. The experimental results demonstrate that the GMM based mapping method can significant improve the mapping performance compared with the multi-linear based mapping model especial in the sense of the weak linear correlation between the target and the predictor such as the hand positions of Cued Speech and the acoustic speech spectral features.
机译:本文介绍了GMM统计方法的结果,该方法以最小二乘的方式将语音中的声音信号的语音频谱参数映射到语音完成语言(LPC)的视觉参数,并且接口水平较低。与经典的视觉文本转语音方法相比,它具有创新性。在GMM方法评估结束时,我们还介绍了多线性建模方法的结果。结果表明,GMM方法极大地改善了映射,尤其是在某些目标参数(如LPC的目标参数)与由语音语音信号的频谱参数组成的预测变量之间的相关性较低的情况下。%提出了一种基于GMM建模的统计方法,以最小的平方误差在低信号水平上将声学语音频谱特征映射到Cued语音的视觉特征,这是创新的,并且与经典的文本到视觉方法不同。与基于GMM的映射建模相比,我们首先在低信号水平上使用多线性模型来呈现结果,并研究该方法的局限性。实验结果表明,与基于多线性映射的模型相比,基于GMM的映射方法可以显着改善映射性能,尤其是在目标与预测变量之间的线性相关性较弱的情况下,例如“提示语音”的手势和声学语音频谱特征。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号