非负稀疏信号分解及在单声道声音分离中的应用

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

在信息时代里，随着语音识别技术的不断发展，让机器具有“听懂”人类语言能力的研究正在一步一步成为现实。携带着大量信息的语音信号本身是非常复杂的，并且具有非平稳性、时变性等特征。语音识别既是一个理论问题，也是一个工程问题。它综合了许多理论的研究成果，如声学、语音学、语言学、生理学、数字信号处理、信息工程、通信理论、电子技术、计算机科学、模式识别、人工智能等。在这篇文章开始的部分，介绍了声学的基础知识和人类声音感知的机理；接下来，给出了在时域处理和频域处理语音信号的一些经典的技术，比如短时平均能量分析、短时过零分析、短时自相关函数分析、快速傅立叶变换等；本文重点从理论和实验上讨论语音分离，特别是单声道语音分离的算法及其在分离音乐鼓点中应用。现实生活中的声音信号往往是由几个声源发出的声音混合而成的，语音分离就是从这种混合声音信号中把一个一个源声音信号分离出来。人的耳朵能从熙熙攘攘的声音中有效的捕捉到相对自己重要(感兴趣)的信息，即使是这些声音在频率上和时间上都配合得很“融洽”。但是要在计算机上实现人耳的这个能力是非常困难的，这就是计算机模拟人耳功能的盲信号分离问题(BSS)，即要从混合在一起的声音信号中分离出一个或者多个感兴趣的声音信号出来，而事先对混合在一起的声源信号的情况是根本不知道的。传统的解决这个问题的方法是用多个麦克风，在不同的位置上得到这段混合的声音信号，以便获取足够的、相对独立的信息来分离出源声音信号。如果已经知道了声源信号之间相互独立，则可以用独立主元分析(ICA)来解决这个特定的盲信号分离问题。在这篇论文里，我们用了一种和ICA算法数字自适应技术很类似的带稀疏性条件限制的非负因子分解法(SNMF)来处理语音分离问题。SNMF算法作为一个分析和解决问题的工具，在很多应用场合已经证明了它的价值。这个算法的最大特点就是它分解出的矩阵具有稀疏的特点，能表现出事物的局部特征，并且直观性强，易于理解。

著录项

作者
赵晶;
展开▼
作者单位

电子科技大学;

展开▼
授予单位电子科技大学;
学科计算机软件与理论
授予学位硕士
导师姓名章毅;
年度 2006
页码
总页数
原文格式 PDF
正文语种中文
中图分类语音信号处理;
关键词
单声道; 语音识别; 傅立叶变换; 神经网络; 信号分解; 语音信号;

相似文献

中文文献
外文文献
专利

1. 应用于非负稀疏信号重构的交替方向乘子法 [J] . 闵刚 ,张雄伟 ,杨吉斌 . 信号处理 . 2015,第011期
2. 基于非负Tucker3分解的稀疏分量分析在故障信号提取中的应用 [J] . 王海军 ,许飞云 . 东南大学学报（自然科学版） . 2013,第004期
3. 奇异值分解技术在声音信息分离中的应用 [J] . 温广瑞 ,张西宁 ,屈梁生 . 西安交通大学学报 . 2003,第001期
4. 应用于非负稀疏信号重构的交替方向乘子法 [C] . MIN Gang ,闵刚 ,ZHANG Xiong-wei . 第十七届全国信号处理学术年会 . 2015
5. 非负稀疏信号分析理论及在文本聚类中的应用 [A] . 杨成福 . 2006

非负稀疏信号分解及在单声道声音分离中的应用

目录

摘要

著录项

相似文献

相关主题

期刊订阅