Employing Second-Order Circular Suprasegmental Hidden Markov Models to Enhance Speaker Identification Performance in Shouted Talking Environments

Ismail Shahin

首页> 外文期刊>EURASIP journal on audio, speech, and music processing >Employing Second-Order Circular Suprasegmental Hidden Markov Models to Enhance Speaker Identification Performance in Shouted Talking Environments

【24h】

Employing Second-Order Circular Suprasegmental Hidden Markov Models to Enhance Speaker Identification Performance in Shouted Talking Environments

机译：使用二阶圆形超分段隐马尔可夫模型增强在说话环境中说话人的识别性能

获取原文

获取原文并翻译 | 示例

掌桥外文数据库（机构版） >>

开具论文收录证明 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

Speaker identification performance is almost perfect in neutral talking environments. However, the performance is deteriorated significantly in shouted talking environments. This work is devoted to proposing, implementing, and evaluating new models called Second-Order Circular Suprasegmental Hidden Markov Models (CSPHMM2s) to alleviate the deteriorated performance in the shouted talking environments. These proposed models possess the characteristics of both Circular Suprasegmental Hidden Markov Models (CSPHMMs) and Second-Order Suprasegmental Hidden Markov Models (SPHMM2s). The results of this work show that CSPHMM2s outperform each of First-Order Left-to-Right Suprasegmental Hidden Markov Models (LTRSPHMMls), Second-Order Left-to-Right Suprasegmental Hidden Markov Models (LTRSPHMM2s), and First-Order Circular Suprasegmental Hidden Markov Models (CSPHMM1s) in the shouted talking environments. In such talking environments and using our collected speech database, average speaker identification performance based on LTRSPHMMls, LTRSPHMM2s, CSPHMMls, and CSPHMM2s is 74.6%, 78.4%, 78.7%, and 83.4%, respectively. Speaker identification performance obtained based on CSPHMM2s is close to that obtained based on subjective assessment by human listeners.

机译：在中立的谈话环境中，说话人识别性能几乎是完美的。但是，在喧闹的谈话环境中，性能会大大降低。这项工作致力于提出，实施和评估称为二阶圆形超分段隐马尔可夫模型（CSPHMM2s）的新模型，以缓解在喧闹的谈话环境中性能下降的问题。这些提议的模型具有圆形超分段隐马尔可夫模型（CSPHMM）和二阶超分段隐马尔可夫模型（SPHMM2s）的特征。这项工作的结果表明，CSPHMM2的性能优于一阶左至右超分割隐马尔可夫模型（LTRSPHMMls），二阶左至右超分割隐马尔可夫模型（LTRSPHMM2s）和一阶圆形超分割隐匿模型喧闹的谈话环境中的马尔可夫模型（CSPHMM1）。在这样的谈话环境中，并使用我们收集的语音数据库，基于LTRSPHMM1，LTRSPHMM2，CSPHMM1和CSPHMM2的平均说话者识别性能分别为74.6％，78.4％，78.7％和83.4％。基于CSPHMM2s获得的说话人识别性能接近于基于人类听众的主观评估获得的说话人识别性能。

著录项

来源
《EURASIP journal on audio, speech, and music processing》 |2010年第2期|p.862138.1-862138.10|共10页
作者
Ismail Shahin;
展开▼
作者单位

Electrical and Computer Engineering Department, University of Sharjah, P.O. Box 27272, Sharjah, United Arab Emirates;

展开▼
收录信息
原文格式 PDF
正文语种 eng
中图分类
关键词

相似文献

外文文献
中文文献
专利

1. Employing Second-Order Circular Suprasegmental Hidden Markov Models to Enhance Speaker Identification Performance in Shouted Talking Environments [J] . Ismail Shahin EURASIP journal on audio, speech, and music processing . 2010,第1期

机译：使用二阶圆形超分段隐马尔可夫模型增强在说话环境中说话人的识别性能
2. Speaker Identification in a Shouted Talking Environment Based on Novel Third-Order Circular Suprasegmental Hidden Markov Models [J] . Shahin Ismail M. A. Circuits, systems, and signal processing . 2016,第10期

机译：基于新颖的三阶圆形超分段隐马尔可夫模型的说话环境中说话人识别
3. Enhancing speaker identification performance under the shouted talking condition using second-order circular hidden Markov models [J] . Ismail Shahin Speech Communication . 2006,第8期

机译：使用二阶圆形隐马尔可夫模型提高说话条件下说话人的识别性能
4. Speaker identification in shouted talking environments based on novel Third-Order Hidden Markov Models [C] . Shahin Ismail International Conference on Audio, Language and Image Processing . 2014

机译：基于新颖的三阶隐马尔可夫模型的高声说话环境中的说话人识别
5. Radar system identification using hidden Markov models. [D] . Remington, Mark Daniel. 2002

机译：使用隐马尔可夫模型识别雷达系统。
6. An Indoor Mobile Location Estimator in Mixed Line of Sight/Non-Line of Sight Environments Using Replacement Modified Hidden Markov Models and an Interacting Multiple Model [O] . Jingyu Ru, Chengdong Wu, Zixi Jia, 2015

机译：使用替换修正的隐马尔可夫模型和交互式多重模型的混合视线/非视线环境中的室内移动位置估计器
7. Employing Second-Order Circular Suprasegmental Hidden Markov Models to Enhance Speaker Identification Performance in Shouted Talking Environments [O] . Ismail Shahin 2010

机译：使用二阶圆形超分段隐马尔可夫模型增强在说话环境中说话人的识别性能
8. Speaker Recognition by Hidden Markov Models and Neural Networks [R] . Zeek, E. J. 1996

机译：隐马尔可夫模型和神经网络的说话人识别

Employing Second-Order Circular Suprasegmental Hidden Markov Models to Enhance Speaker Identification Performance in Shouted Talking Environments

摘要

著录项

相似文献

相关主题

期刊订阅