首页> 中文学位 >基于最小均方差幅度谱估计器的语音增强算法研究与实现
【6h】

基于最小均方差幅度谱估计器的语音增强算法研究与实现

代理获取

目录

声明

注释表

第一章 绪论

1.1 课题研究背景及意义

1.2 语音增强技术的发展与研究现状

1.3 本文主要内容和结构安排

第二章 基本MMSE幅度谱估计语音增强算法原理

2.1 语音和噪声

2.2 基于MMSE幅度谱估计的语音增强算法原理

2.3 算法的评价手段

2.4 本章小结

第三章 基于MMSE幅度谱估计器的语音增强算法研究改进

3.1 本文所提先验信噪比估计DDBSE

3.2 本文所提语音端点检测算法

3.3 本文所提噪声估计UMVAD算法

3.4本文所提噪声环境分类与参数优化方法

3.5 算法仿真实验与分析

3.6 本章小结

第四章 语音增强算法的DSP实现

4.1 硬件以及软件开发平台

4.2音频采集处理播放系统研究设计

4.3本文算法优化及移植

4.4 本章小结

第五章 总结和展望

5.1 本文主要工作

5.2 未来工作展望

参考文献

致谢

在学期间的研究成果及发表的学术论文

展开▼

摘要

语音增强算法是语音信号处理领域的重要技术,旨在提高低信噪比环境中语音信号的质量和可懂度,为进一步处理语音打下基础。在较低信噪比或者高度不平稳噪声环境中,语音的质量和可懂度会急剧下降,导致人类或者机器无法很好的识别或者传输,所以提高语音信号的质量对于语音的处理十分重要,具有较高的研究意义和应用价值。
  本文在分析经典语音增强算法的基础上,重点对基于最小均方误差(Minimum Mean Square Error,MMSE)幅度谱估计器的语音增强算法进行了研究和改进,并使用MATLAB工具对算法性能进行了评估;最后,将该算法移植到DM642芯片上实现音频采集处理和播放,并对算法进行了定点优化,提升了其实时性。
  本文主要内容如下:
  1.分析了语音增强算法的研究现状和各类算法的优缺点,通过对比选择基于MMSE幅度谱估计的语音增强算法进行研究,指出该算法存在着先验信噪比估计不足、噪声估计误差较大、DSP实现实时性较差等问题。
  2.针对MMSE幅度谱估计器所使用判决引导(Decision–Directed,DD)先验信噪比估计算法延迟较大的缺点,提出了新的基于熵值变化的DDBSE(DD Based on Single frequency Entropy,DDBSE)先验信噪比计算方法。该算法基于熵值变化,能够快速追踪语音的变化,从而改善DD算法的不足,为幅度估计器提供更精确的信噪比估计。
  3.针对噪声估计不足的问题,提出了基于无偏噪声估计(Unbiased MMSE)和语音活动检测(Voice Activity Detection,VAD)的新的噪声估计算法UMVAD。该算法能够减小噪声的过估计和欠估计,提供最小的中值估计均方误差。实验结果表明,DDBSE与UMVAD结合,能在分段信噪比和综合评分上取得较好的效果,特别适合于低信噪比和不平稳噪声环境中的语音增强。
  4.对VAD算法进行改进,提出了双阈值VAD判决方式,改进后统计VAD结合能量熵(Energy-Entropy,EE)特征和平均峰值点偏差(Mean-Delta,MD)特征,能够取得较为满意的整体命中率;同时,基于噪声分类思路,结合支持向量机(Supported Vector Machine,SVM)对算法中可调参数进行优化,并将噪声分类器结合到算法中,提出了具有环境意识的语音增强算法。
  5.在DSP芯片DM642上实现了本文的语音增强算法,设计了一个语音采集播放系统,并对浮点算法进行了定点化。相比于浮点型算法,本文所提的定点型算法取得了83%左右的处理速度提升,并且实现了音频信号的实时采集处理和播放,能够将处理一帧的时间限制在8毫秒左右。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号