首页> 中文学位 >说话人识别中的背景模型与得分问题研究
【6h】

说话人识别中的背景模型与得分问题研究

代理获取

目录

声明

摘要

第1章 绪论

1.1 研究背景与意义

1.2 说话人识别任务介绍

1.2.1 说话人识别的发展历程

1.2.2 说话人识别任务分类

1.3 说话人识别中背景模型和得分问题

1.4 本文章节安排

第2章 基于GMM-UBM的说话人识别方法

2.1 概述

2.2 基于GMM-UBM的说话人识别系统框架

2.3 前端处理

2.3.1 预处理

2.3.2 特征提取

2.4 GMM模型介绍

2.4.1 GMM模型定义

2.4.2 GMM模型的参数估计

2.4.3 MAP自适应算法得到目标模型

2.4.4 GMM-UBM模型似然得分计算

2.5 系统性能评价

2.6 本章小结

第3章 UBM支撑说话人集合

3.1 引言

3.2 UBM数据选择方法

3.3 自包容的uBM

3.4 UBM支撑说话人集合

3.4.1 UBM三元组

3.4.2 UBM空间三角形

3.5 结果验证及分析

3.6 本章小结

第4章 基于OLSM的样本复制语音入侵检测方法

4.1 引言

4.2 说话人识别攻击防御技术研究现状

4.3 基于OLSM的样本复制语音攻击检测方法

4.3.1 机器学习中的过拟合现象

4.3.2 模型阶数相关的似然得分单调性

4.3.3 基于OLSM的样本复制语音检测模型

4.4 基于OLSM现象样本复制语音检测方法的应用

4.4.1 系统流程

4.4.2 对样本复制语音回放攻击的检测

4.4.3 对样本复制语音直接攻击的检测

4.5 实验及分析

4.6 本章小结

第5章 N-Best token与GMMt tokenizer在说话人识别中的应用

5.1 GMM token在语音领域的应用

5.2 基于GMM token配比向量得分校正的说话人识别系统

5.3 N-Best token在说话人识别中的应用

5.3.1 N-Best token的定义

5.3.2 N-Best token对系统性能的影响

5.4 GMMt tokenizer在说话人识别中的应用

5.5 本章小结

第6章 总结与展望

6.1 工作总结

6.2 工作展望

参考文献

附录

攻读硕士学位期间主要的研究成果

致谢

展开▼

摘要

作为一种生物认证识别技术,说话人识别技术具有远程控制的独特优势,在互联网发展日新月异的今天拥有非常广泛的应用前景。近年来出现的说话人识别主流方法如GMM-SVM,JFA和i-vector等都是以GMM-UBM(Gaussian MixtureModel-Universal Background Model,高斯混合-通用背景模型)的识别框架为基础。因此对GMM-UBM的研究仍有很大价值。本文基于GMM-UBM的说话人识别框架,对背景模型建模与得分问题进行了新的探索,并提出了改进系统安全性和性能的方法。本文主要贡献如下:
  1.对通用背景模型UBM的构建方法进行了新的尝试。验证了自包容的UBM的有效性,并在此基础上提出了支撑说话人的概念,即对构建UBM起关键作用的是部分关键说话人。通过PCA降维发现,空间分布分散的说话人更有助于组成支撑说话人集合,比随机选择的方式平均识别效果好1%左右;
  2.针对说话人识别系统的样本复制语音攻击极大限制了说话人识别技术的应用和发展。提出了一种基于模型阶数相关的似然得分单调性(Orderdependent Likelihood Score Monotonic,OLSM)的样本复制语音检测方法,该方法利用了GMM模型的过拟合现象,可以有效提高GMM-UBM说话人识别系统的安全性。MASC库上该方法对样本复制语音的检测正确率达99.3%。
  3.GMM token是似然得分最高的高斯分量的索引。作为一种高层次特征,GMM token可以提供很多辅助信息来提高系统性能。传统GMM token中只取得分最高的高斯分量,将它扩展为取前N个得分最高的高斯分量,即N-Besttoken;此外,研究了不同GMM tokenizer对改进系统性能上的不同影响。在基于GMM token配比相似度得分校正的说话人识别系统上进行了验证,性能提升效果良好。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号