The University of Texas at Dallas.;
机译:说话者差异化在非语音和非语音/语音混合视频音轨的音频索引中的适用性
机译:TEnet:目标说话人提取网络,具有累积的说话人嵌入功能,可自动识别语音
机译:讨论中基于说话人模型选择和自动语音识别的说话人索引
机译:同频道语音的自动语音识别:演讲者和语音识别的集成方法
机译:口音和说话者识别功能可实现高级自动语音识别。
机译:以语音包络作为时间参考的自动语音识别的大脑启发式语音分割
机译:言语分离,日复日记和识别的整合:系统描述,比较和分析
机译:强大的语音处理和识别:说话者ID,语言ID,语音识别/关键字识别,Diarization / Co-Channel /环境表征,说话者状态评估。