Head Fusion:一种提高语音情绪识别的准确性和鲁棒性的方法

徐鸣珂; 张帆

首页> 中文期刊> 《计算机科学》 >Head Fusion:一种提高语音情绪识别的准确性和鲁棒性的方法

Head Fusion:一种提高语音情绪识别的准确性和鲁棒性的方法

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

语音情绪识别指使用机器从说话人的语音中识别说话人的情绪。语音情绪识别是人机交互的重要环节,但是目前的研究中仍然存在很多问题,例如,缺乏高质量的数据、模型准确性不足、在嘈杂的环境下进行的研究很少等。文中提出了一种基于多头注意力机制的Head Fusion方法,提高了语音情绪识别在相应数据集上的准确性。文中还实现了一个基于注意力的卷积神经网络模型,并在IEMOCAP数据集上进行了实验。语音情绪识别在该数据集上的准确度提高到76.18%(Weighted Accuracy,WA)和76.36%(Unweighted Accuracy,UA)。根据调研,该结果与该数据集上的最新结果(76.4%的WA和70.1%的UA)相比,在保持WA的同时提高了约6%的UA。此外,还使用了混入50种常见噪声的语音数据进行了实验,通过改变噪声强度、对噪声进行时域平移、混合不同的噪声类型,以识别它们对语音情绪识别(Speech Emotion Recognition)准确度的不同影响并验证模型的鲁棒性。文中还将帮助研究人员和工程师通过使用带有适当类型噪声的语音数据来增加其训练数据,从而缓解语音情绪识别研究中高质量数据不足的问题。

著录项

来源
《计算机科学》 |2022年第7期|132-141|共10页
作者
徐鸣珂; 张帆;
展开▼
作者单位

南京工业大学计算机科学与技术学院;

国际商业机器麻省实验室;

展开▼
原文格式 PDF
正文语种 chi
中图分类模式识别与装置;
关键词
语音情绪识别; 注意力机制; 卷积神经网络; 噪声语音; 语音识别;

相似文献

中文文献
外文文献
专利

1. 一种面向对抗攻击的鲁棒性语音情感识别方法 [J] . 陈港 ,陈杰 ,张石清 . 软件工程 . 2021,第11期
2. 一种基于噪声对消与倒谱均值相减的鲁棒语音识别方法 [J] . 王振力 ,裴凌波 ,于元斌 . 智能系统学报 . 2008,第6期
3. 一种基于模糊规则的鲁棒语音识别方法 [J] . 张军 ,章熙春 ,曹燕 . 电路与系统学报 . 2006,第005期
4. 一种基于鲁棒特征的模型补偿噪声语音识别方法 [J] . 张军 ,韦岗 . 数据采集与处理 . 2003,第003期
5. 一种鲁棒性层次化语音/非语音检测方法 [J] . 张力 ,张连海 ,陈斌 . 信息工程大学学报 . 2012,第001期
6. 提高语音识别对声调变化鲁棒性的方法 [C] . 侯震 ,王之禹 ,李明 . 中国声学学会2002年全国声学学术会议 . 2002
7. 一种基于子带最大似然线性回归的鲁棒语音识别方法 [A] . 周懿 . 2009

Head Fusion:一种提高语音情绪识别的准确性和鲁棒性的方法

摘要

著录项

相似文献

相关主题

期刊订阅