NTT Communication Science Laboratories, NTT Corporation, 2-4 Hikaridai, Seika-cho, Soraku-gun, Kyoto 619-0237, Japan;
NTT Communication Science Laboratories, NTT Corporation, 2-4 Hikaridai, Seika-cho, Soraku-gun, Kyoto 619-0237, Japan;
NTT Communication Science Laboratories, NTT Corporation, 2-4 Hikaridai, Seika-cho, Soraku-gun, Kyoto 619-0237, Japan;
NTT Communication Science Laboratories, NTT Corporation, 2-4 Hikaridai, Seika-cho, Soraku-gun, Kyoto 619-0237, Japan;
Dictionaries; Estimation; Time-frequency analysis; Training; Noise measurement; Speech; Testing;
机译:音频广播新闻中演讲者跟踪的演讲者区分系统的开发:一个案例研究
机译:音频广播新闻中演讲者跟踪的演讲者差异化系统的开发:一个案例研究
机译:说话者角度信息的词袋表示概率的说话人区分
机译:使用概率空间字典建模音频定向统计信息讲话中的扬声器简化在真正的会议中
机译:会议发言者使用语音定位功能。
机译:使用预训练的视听同步模型进行多模态扬声器二分法
机译:基于扬声器角度N-GRam模型的会议扬声器演示
机译:使用锚模型在大型音频数据库中进行扬声器索引