首页> 中文期刊> 《传感技术学报》 >面向复杂声学环境的伪装语音检测

面向复杂声学环境的伪装语音检测

         

摘要

随着技术更迭,最新语音合成和语音转换模型生成的伪装语音在感知上与真正语音无法区分,这严重威胁着公众的个人信息安全。现有的检测方法虽有可观进展,但仍存在检测声学环境单一、对未知欺骗攻击泛化能力差等问题。针对以上问题,提出了一种基于深度残差收缩网络(Deep Residual Shrinkage Networks,DRSN)的多特征联合语音欺骗检测方法,首先DRSN利用基于深度注意力机制的自适应阈值学习模块和软阈值模块提高了在复杂声学环境下的特征学习能力,再选取合适的声学特征构建单类特征-DRSN检测模型,最后执行多模型联合检测以实现互补,进一步提升整体性能。使用ASVspoof2019数据集的实验结果表明,相较于最佳基线系统,本方法在t-DCF和EER性能指标上分别降低47%和53%。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号