基于时域波形的半监督端到端虚假语音检测方法

方昕; 黄泽鑫; 张聿晗; 高天; 潘嘉; 付中华; 高建清; 刘俊华; 邹亮

首页> 中文期刊> 《计算机应用》 >基于时域波形的半监督端到端虚假语音检测方法

基于时域波形的半监督端到端虚假语音检测方法

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

现代语音合成和音色转换系统产生的虚假语音对自动说话人识别系统构成了严重威胁。大多数现有的虚假语音检测系统对在训练中已知的攻击类型表现良好,但对实际应用中的未知攻击类型检测效果显著降低。因此,结合最近提出的双路径Res2Net(DP-Res2Net),提出一种基于时域波形的半监督端到端虚假语音检测方法。首先,为了解决训练数据集和测试数据集两者数据分布差异较大的问题,采用半监督学习进行领域迁移;然后,对于特征工程,直接将时域采样点输入DP-Res2Net中,增加局部的多尺度信息,并充分利用音频片段之间的依赖性;最后,输入特征经过浅层卷积模块、特征融合模块、全局平均池化模块得到嵌入张量,用来判别自然语音与虚假伪造语音。在公开可用的ASVspoof 2021 Speech Deep Fake评估集和VCC数据集上评估了所提出方法的性能,实验结果表明它的等错误率(EER)为19.97%,与官方最优基线系统相比降低了10.8%。基于时域波形的半监督端到端检测虚假语音检测方法面对未知攻击时是有效的,且具有更高的泛化能力。

著录项

来源
《计算机应用》 |2023年第1期|227-231|共5页
作者
方昕; 黄泽鑫; 张聿晗; 高天; 潘嘉; 付中华; 高建清; 刘俊华; 邹亮;
展开▼
作者单位

语音及语言信息处理国家工程实验室(中国科学技术大学);

科大讯飞股份有限公司AI研究院;

中国矿业大学信息与控制工程学院;

西安讯飞超脑信息科技有限公司;

展开▼
原文格式 PDF
正文语种 chi
中图分类诊断机;
关键词
虚假语音检测; 语音合成; 音色转换; 说话人识别; 时域; 半监督学习;

相似文献

中文文献
外文文献
专利

1. 基于注意力机制的端到端合成语音检测 [J] . 王锦阳 ,华光 ,黄双 . 信号处理 . 2022,第9期
2. 基于韵律特征辅助的端到端语音识别方法 [J] . 刘聪 ,万根顺 ,高建清 . 计算机应用 . 2023,第2期
3. 基于RefineNet的端到端语音增强方法 [J] . 蓝天 ,彭川 ,李森 . 自动化学报 . 2022,第2期
4. 基于BERT的端到端语音合成方法 [J] . 安鑫 ,代子彪 ,李阳 . 计算机科学 . 2022,第4期
5. 一种基于路由集的VoLTE端到端语音质量问题分段定界定位方法的实现 [J] . 郑银云 . 电信工程技术与标准化 . 2021,第8期
6. 基于端到端保障机制的高铁VoLTE语音MOS优化提升思路及方法研究 [C] . 原振升 ,李庆伟 ,彭中峰 . 2019广东通信青年论坛 . 2019

基于时域波形的半监督端到端虚假语音检测方法

摘要

著录项

相似文献

相关主题

期刊订阅