基于CNN-SVM性别组合分类的单通道语音分离

孙林慧; 张蒙; 梁文清

首页> 中文期刊> 《信号处理》 >基于CNN-SVM性别组合分类的单通道语音分离

基于CNN-SVM性别组合分类的单通道语音分离

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

实际语音分离时,混合语音的说话人性别组合相关信息往往是未知的。若直接在普适的模型上进行分离,语音分离效果欠佳。为了更好地进行语音分离,本文提出一种基于卷积神经网络-支持向量机(CNN-SVM)的性别组合判别模型,来确定混合语音的两个说话人是男-男、男-女还是女-女组合,以便选用相应性别组合的分离模型进行语音分离。为了弥补传统单一特征表征性别组合信息不足的问题,本文提出一种挖掘深度融合特征的策略,使分类特征包含更多性别组合类别的信息。本文的基于CNN-SVM性别组合分类的单通道语音分离方法,首先使用卷积神经网络挖掘梅尔频率倒谱系数和滤波器组特征的深度特征,融合这两种深度特征作为性别组合的分类特征,然后利用支持向量机对混合语音性别组合进行识别,最后选择对应性别组合的深度神经网络/卷积神经网络(DNN/CNN)模型进行语音分离。实验结果表明,与传统的单一特征相比,本文所提的深度融合特征可以有效提高混合语音性别组合的识别率;本文所提的语音分离方法在主观语音质量评估(PESQ)、短时客观可懂度(STOI)、信号失真比(SDR)指标上均优于普适的语音分离模型。

著录项

来源
《信号处理》 |2022年第12期|2519-2531|共13页
作者
孙林慧; 张蒙; 梁文清;
展开▼
作者单位

南京邮电大学通信与信息工程学院;

展开▼
原文格式 PDF
正文语种 chi
中图分类语音信号处理;
关键词
性别组合识别; 卷积神经网络-支持向量机; 单通道语音分离; 深度特征;

相似文献

中文文献
外文文献
专利

1. 基于计算听觉场景分析的单通道语音分离方法 [J] . 徐庆达 ,张二华 . 计算机与数字工程 . 2022,第3期
2. 基于深度学习特征融合和联合约束的单通道语音分离方法 [J] . 孙林慧 ,王灿 ,梁文清 . 电子与信息学报 . 2022,第9期
3. 基于TasNet的单通道语音分离技术的研究综述 [J] . 陆炜 ,朱定局 . 计算机与现代化 . 2022,第11期
4. 基于注意力机制的单通道双人语音分离研究 [J] . 周晓东 ,陈人楷 ,孙华星 . 通信技术 . 2020,第4期
5. 基于非负矩阵分解和长短时记忆网络的单通道语音分离 [J] . 崔建峰 ,邓泽平 ,申飞 . 科学技术与工程 . 2019,第012期
6. 基于NMF和FCRF的单通道语音分离算法 [C] . Li Xu ,李煦 ,Tu Ming . 第十三届全国人机语音通讯学术会议 . 2015

基于CNN-SVM性别组合分类的单通道语音分离

摘要

著录项

相似文献

相关主题

期刊订阅