基于角度间隔嵌入特征的端到端声纹识别模型

王康; 董元菲

首页> 中文期刊> 《计算机应用》 >基于角度间隔嵌入特征的端到端声纹识别模型

基于角度间隔嵌入特征的端到端声纹识别模型

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

cqvip:针对传统身份认证矢量(i-vector)与概率线性判别分析(PLDA)结合的声纹识别模型步骤繁琐、泛化能力较弱等问题,构建了一个基于角度间隔嵌入特征的端到端模型。该模型特别设计了一个深度卷积神经网络,从语音数据的声学特征中提取深度说话人嵌入;选择基于角度改进的A-Softmax作为损失函数,在角度空间中使模型学习到的不同类别特征始终存在角度间隔并且同类特征间聚集更紧密。在公开数据集VoxCeleb2上进行的测试表明,与i-vector结合PLDA的方法相比,该模型在说话人辨认中的Top-1和Top-5上准确率分别提高了58.9%和30%;而在说话人确认中的最小检测代价和等错误率上分别减小了47.9%和45.3%。实验结果验证了所设计的端到端模型更适合在多信道、大规模的语音数据集上学习到有类别区分性的特征。

著录项

来源
《计算机应用》 |2019年第10期|2937-2941|共5页
作者
王康; 董元菲;
展开▼
作者单位

南京烽火天地通信科技有限公司南京210019;

武汉邮电科学研究院武汉430074;

展开▼
原文格式 PDF
正文语种 chi
中图分类语音识别与设备;
关键词
声纹识别; 端到端模型; 损失函数; 卷积神经网络; 深度说话人嵌入;

相似文献

中文文献
外文文献
专利

1. 基于LSTM的端到端声纹识别算法实现 [J] . 王飞 ,徐颖捷 . 软件工程与应用 . 2021,第004期
2. 基于频域卷积和三元组损失的端到端声纹识别 [J] . 董元菲 ,王康 . 电子设计工程 . 2020,第013期
3. T-STAM:基于双流时空注意力机制的端到端的动作识别模型 [J] . 石祥滨 ,李怡颖 ,刘芳 . 计算机应用研究 . 2021,第004期
4. 基于注意力机制的联合监督端到端说话人识别模型 [J] . 史王雷 ,冯爽 . 信息与电脑 . 2020,第004期
5. 基于公共空间嵌入的端到端深度零样本学习 [J] . 秦牧轩 ,荆晓远 ,吴飞 . 计算机技术与发展 . 2018,第011期
6. 以客户角度评价宽带质量及端到端感知提升探讨 [C] . 付宇辉 ,屈礼超 . 陕西省通信学会2016年学术年会 . 2016
7. 基于文本数据的端到端语音识别模型训练数据扩充方法 [A] . 郭家兴 . 2020

基于角度间隔嵌入特征的端到端声纹识别模型

摘要

著录项

相似文献

相关主题

期刊订阅