首页> 外文会议>Conference on Computational Linguistics and Speech Processing >改良調變頻譜統計圖等化法於強健性語音辨識之硏究
【24h】

改良調變頻譜統計圖等化法於強健性語音辨識之硏究

机译:改良调变频谱统计图等化法于强健性语音辨识之硏究

获取原文

摘要

在自動語音辨識技術的發展上,語音強健性長久以來都是相當重要的研究領域.近年來以調變頻譜的處理和正規化進行強健性語音辨識,已然成為一項活躍的研究議題.調變頻譜統計圖等化法(SHE)是其中一種相當有效的技術,可用以補償調變頻譜因環境干擾而產生的非線性扭曲.在過去研究中,我們改善了調變頻譜統計圖等化法,使其運算複雜度和所需的儲存空間下降,並稱之為多項式擬合調變頻譜統計圖等化法(PSHE);在此論文中,我們嘗試進一步改進此方法,結合前人的研究中將語音特徵在時域與空間域作分頻的概念,對於語音特徵的高低頻成份分別進行PSHE處理並將之結合,嘗試解除原本SHE和PSHE所依據的語音特徵維度必須獨立和相鄰音框語音特徵無關的兩個假設,將時域與空間域上的文脈資訊列入考慮.本論文的實驗採用Aurora-2語料庫進行自動語音辨識實驗;經一系列實驗結果顯示本論文所提出的方法是有實際成效的,能夠顯著地提升語音辨識率.
机译:在自动语音辨识技术的发展上,语音强健性长久以来都是相当重要的研究领域.近年来以调变频谱的处理和正规化进行强健性语音辨识,已然成为一项活跃的研究议题.调变频谱统计图等化法(SHE)是其中一种相当有效的技术,可用以补偿调变频谱因环境干扰而产生的非线性扭曲.在过去研究中,我们改善了调变频谱统计图等化法,使其运算复杂度和所需的储存空间下降,并称之为多项式拟合调变频谱统计图等化法(PSHE);在此论文中,我们尝试进一步改进此方法,结合前人的研究中将语音特征在时域与空间域作分频的概念,对于语音特征的高低频成份分别进行PSHE处理并将之结合,尝试解除原本SHE和PSHE所依据的语音特征维度必须独立和相邻音框语音特征无关的两个假设,将时域与空间域上的文脉资讯列入考虑.本论文的实验采用Aurora-2语料库进行自动语音辨识实验;经一系列实验结果显示本论文所提出的方法是有实际成效的,能够显著地提升语音辨识率.

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号