首页> 中文学位 >非负稀疏信号分解及在单声道声音分离中的应用
【6h】

非负稀疏信号分解及在单声道声音分离中的应用

代理获取

目录

文摘

英文文摘

独创性声明及关于论文使用授权的说明

第一章引言

第二章语音信号的声学基础理论

第三章语音信号的时域处理和频域处理

第四章基于NMF的单声道语音分离算法

第五章基于SNMF的单声道语音分离算法

第六章基于球形k均+SNMF的单声道语音分离算法

第七章结论

致谢

参考文献

个人简历及攻读硕士期间的成果

修改提纲:

展开▼

摘要

在信息时代里,随着语音识别技术的不断发展,让机器具有“听懂”人类语言能力的研究正在一步一步成为现实。携带着大量信息的语音信号本身是非常复杂的,并且具有非平稳性、时变性等特征。 语音识别既是一个理论问题,也是一个工程问题。它综合了许多理论的研究成果,如声学、语音学、语言学、生理学、数字信号处理、信息工程、通信理论、电子技术、计算机科学、模式识别、人工智能等。在这篇文章开始的部分,介绍了声学的基础知识和人类声音感知的机理;接下来,给出了在时域处理和频域处理语音信号的一些经典的技术,比如短时平均能量分析、短时过零分析、短时自相关函数分析、快速傅立叶变换等;本文重点从理论和实验上讨论语音分离,特别是单声道语音分离的算法及其在分离音乐鼓点中应用。 现实生活中的声音信号往往是由几个声源发出的声音混合而成的,语音分离就是从这种混合声音信号中把一个一个源声音信号分离出来。人的耳朵能从熙熙攘攘的声音中有效的捕捉到相对自己重要(感兴趣)的信息,即使是这些声音在频率上和时间上都配合得很“融洽”。但是要在计算机上实现人耳的这个能力是非常困难的,这就是计算机模拟人耳功能的盲信号分离问题(BSS),即要从混合在一起的声音信号中分离出一个或者多个感兴趣的声音信号出来,而事先对混合在一起的声源信号的情况是根本不知道的。传统的解决这个问题的方法是用多个麦克风,在不同的位置上得到这段混合的声音信号,以便获取足够的、相对独立的信息来分离出源声音信号。如果已经知道了声源信号之间相互独立,则可以用独立主元分析(ICA)来解决这个特定的盲信号分离问题。在这篇论文里,我们用了一种和ICA算法数字自适应技术很类似的带稀疏性条件限制的非负因子分解法(SNMF)来处理语音分离问题。SNMF算法作为一个分析和解决问题的工具,在很多应用场合已经证明了它的价值。这个算法的最大特点就是它分解出的矩阵具有稀疏的特点,能表现出事物的局部特征,并且直观性强,易于理解。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号