声明
第一章绪论
1.1 研究工作的背景与意义
1.2 国内外研究历史与现状
1.3 本论文的结构安排
第二章声音事件识别基本原理与总体方案设计
2.1 声音事件识别总体方案
2.2 常见声音特征提取
2.3 声音事件识别模型
2.3.1 常用分类模型
2.3.2 优化器的选择
2.4 本章小结
第三章声音事件特征提取方法设计
3.1 样本预处理
3.1.1 预加重
3.1.2 分帧加窗
3.2 谐波分量和冲激分量分解
3.3 对数梅尔谱图差分特征提取方法
3.4 多特征组合提取方法设计
3.5 本章小结
第四章声音事件识别方法设计
4.1 声音事件识别模型性能评价指标
4.2 残差神经网络结构设计
4.3 数据增强
4.3.1 音频数据的常见增强方法
4.3.2 基于线性混合的数据增强
4.3.3 基于随机裁剪的数据增强
4.3.4 随机数据增强方法设计
4.4 SGD优化器参数调优
4.5 本章小结
第五章识别模型设计与性能分析
5.1 基线模型设计
5.2 各模块设计与性能分析
5.2.1 多特征组合提取
5.2.2 训练样本扩增
5.2.3 随机数据增强
5.3 声音事件识别模型设计与性能分析
5.4 K折交叉验证
5.5 本章小结
第六章总结与展望
6.1 本文总结
6.2 工作展望
致谢
参考文献
电子科技大学;