说话人识别中的背景模型与得分问题研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

作为一种生物认证识别技术，说话人识别技术具有远程控制的独特优势，在互联网发展日新月异的今天拥有非常广泛的应用前景。近年来出现的说话人识别主流方法如GMM-SVM，JFA和i-vector等都是以GMM-UBM(Gaussian MixtureModel-Universal Background Model，高斯混合-通用背景模型)的识别框架为基础。因此对GMM-UBM的研究仍有很大价值。本文基于GMM-UBM的说话人识别框架，对背景模型建模与得分问题进行了新的探索，并提出了改进系统安全性和性能的方法。本文主要贡献如下：
　　1.对通用背景模型UBM的构建方法进行了新的尝试。验证了自包容的UBM的有效性，并在此基础上提出了支撑说话人的概念，即对构建UBM起关键作用的是部分关键说话人。通过PCA降维发现，空间分布分散的说话人更有助于组成支撑说话人集合，比随机选择的方式平均识别效果好1％左右;
　　2.针对说话人识别系统的样本复制语音攻击极大限制了说话人识别技术的应用和发展。提出了一种基于模型阶数相关的似然得分单调性(Orderdependent Likelihood Score Monotonic，OLSM)的样本复制语音检测方法，该方法利用了GMM模型的过拟合现象，可以有效提高GMM-UBM说话人识别系统的安全性。MASC库上该方法对样本复制语音的检测正确率达99.3％。
　　3.GMM token是似然得分最高的高斯分量的索引。作为一种高层次特征，GMM token可以提供很多辅助信息来提高系统性能。传统GMM token中只取得分最高的高斯分量，将它扩展为取前N个得分最高的高斯分量，即N-Besttoken;此外，研究了不同GMM tokenizer对改进系统性能上的不同影响。在基于GMM token配比相似度得分校正的说话人识别系统上进行了验证，性能提升效果良好。

著录项

作者
孙永坤;
展开▼
作者单位

浙江大学;

展开▼
授予单位浙江大学;
学科计算机应用技术
授予学位硕士
导师姓名杨莹春;
年度 2016
页码
总页数
原文格式 PDF
正文语种中文
中图分类语音识别与设备;
关键词
说话人识别系统; 高斯混合-通用背景模型; 样本复制语音检测; 安全性能;

相似文献

中文文献
外文文献
专利

1. 采用模型和得分非监督自适应的说话人识别 [J] . 王尔玉 ,郭武 ,李轶杰 . 自动化学报 . 2009,第003期
2. 说话人识别模型失配下的似然得分补偿变换 [J] . 包永强 ,赵力 ,邹采荣 . 电路与系统学报 . 2006,第004期
3. 基于PLDA的说话人识别时变鲁棒性问题研究 [J] . 陈霄鹏 ,彭亚雄 ,贺松 . 微型机与应用 . 2016,第005期
4. 半相依非线性回归方程组中的近似得分函数和拟近似得分函数 [J] . 林路 . 应用数学 . 1998,第4期
5. 大数据背景下网络调查样本的建模推断问题研究——以广义Boosted模型的倾向得分推断为例 [J] . 刘展 ,潘莹丽 . 统计研究 . 2019,第009期
6. 说话人识别中的多系统得分融合策略 [C] . 郭武 ,戴礼荣 . 第十届全国人机语音通讯学术会议 . 2009
7. 说话人确认中背景模型的研究 [A] . 马静 . 2006

说话人识别中的背景模型与得分问题研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅