Georgia Institute of Technology.;
机译:合奏演讲者和说话环境建模方法,用于鲁棒的语音识别
机译:基于说话者的基于深度神经网络的单通道联合语音分离和声学建模方法,用于多语音对话的鲁棒识别
机译:使用情感语音进行说话人建模,以更可靠地识别说话人
机译:用于稳健自动语音识别的合并扬声器和讲话环境建模的两个扩展
机译:基于麦克风阵列,视听和帧选择的强大语音处理功能,可实现车载语音识别和内置说话人识别。
机译:通过状态空间建模对来自演讲者环境中MEG的选择性听觉注意力进行可靠解码
机译:使用由MLLR转换生成的伪扬声器特征进行声学模型训练,以实现与扬声器无关的可靠语音识别
机译:最小化扬声器变化效果以实现与扬声器无关的语音识别。