基于语音分离的人工设计特征、参数化特征和可学习特征的比较

朱文博; 王谋; 张晓雷; Susanto Rahardja

首页> 中文期刊> 《中国传媒大学学报（自然科学版）》 >基于语音分离的人工设计特征、参数化特征和可学习特征的比较

基于语音分离的人工设计特征、参数化特征和可学习特征的比较

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

声学特征可以大致分为三类:人工设计特征,参数化特征和可学习特征。其中,可学习特征是指将其与分离网络以端到端的方式进行联合训练,如时域卷积语音分离网络(convolutional time domain audio separation network,Conv‑Tasnet),这成为了如今语音分离研究中的一种新的趋势。然而在最近的研究中证明了人工设计特征以及参数化特征也能产生具有竞争力的结果。但是,截止目前还没有工作对这三种声学特征进行系统的比较。本文通过设置不同声学特征作为编码器和解码器,在Conv‑Tasnet框架下对它们进行比较。我们还将人工设计的多相位gammatone滤波器组(multi‑phase gammatone filterbank,MPGTF)扩展为一种新的参数化多相位gammatone滤波器组(Parameterized MPGTF,ParaMPGTF)。在WSJ0‑2mix数据集上的实验结果表明:(i)如果解码器是可学习特征时,将编码器设置为STFT,MPGTF,ParaMPGTF以及可学习特征的性能相近;(ii)如果将STFT,MPGTF,ParaMPGTF的逆变换作为解码器时,所提出的ParaMPGTF相比于其他两种人工设计特征有更好的性能。

著录项

来源
《中国传媒大学学报（自然科学版）》 |2021年第3期|52-57|共6页
作者
朱文博; 王谋; 张晓雷; Susanto Rahardja;
展开▼
作者单位

西北工业大学航海学院智能声学与临境通信研究中心;

陕西西安710072;

展开▼
原文格式 PDF
正文语种 chi
中图分类语音信号处理;
关键词
语音分离; 人工设计特征; 参数化特征; 可学习特征; 多相位gammatone滤波器组;

相似文献

中文文献
外文文献
专利

1. 基于特征拼装和特征单元化相结合的参数化设计方法研究 [J] . 陈可坚 . 装备维修技术 . 1999,第Z1期
2. 基于语音个人特征信息分离的语音转换方法研究 [J] . 马振 ,张雄伟 ,杨吉斌 . 信号处理 . 2013,第004期
3. 英汉语音特征比较——兼谈我国学生英语语音学习中的错误 [J] . 崔建斌 . 渭南师范学院学报 . 1996,第003期
4. 基于声门特征与语音特征的语音情感识别对比研究 [J] . 朱智豪 ,郑徵羽 ,肖仲喆 . 电声技术 . 2020,第005期
5. 基于改进语音特征与极限学习机的语音端点检测 [J] . 罗庆 ,包亚萍 ,俞强 . 微电子学与计算机 . 2020,第3期
6. 基于子空间学习和特征选择融合的语音情感识别 [C] . SONG Peng ,宋鹏 ,ZHENG Wenming . 第十四届全国人机语音通讯学术会议 . 2017
7. 基于深度学习联合优化和特征融合的单通道语音分离技术研究 [A] . 王灿 . 2021

基于语音分离的人工设计特征、参数化特征和可学习特征的比较

摘要

著录项

相似文献

相关主题

期刊订阅