首页> 中文会议>第十一届全国人机语音通讯学术会议 >实时语音驱动的虚拟说话人

实时语音驱动的虚拟说话人

页面导航

摘要
著录项
相似文献
相关主题

摘要

本文实现了一个实时语音驱动的虚拟说话人面部动画方案。随着语音信号的输入，同步生成对应的面部动画。这种实时语音驱动的虚拟说话人在可视电话、虚拟会议、音视频聊天等即时通讯与娱乐媒体领域具有巨大的应用潜力。由于音素是最小的可分发音单元，因此构建音素识别器，对输入语音信号进行实时音素识别。为提高语音与口型的同步效果，改进了音素识别与输出算法。考虑协同发音影响，利用动态视素生成算法，将识别得到的音素转化为对应的面部动画参数序列。最后用参数序列驱动按照MPEG4面部动画标准参数化的3D头部模型，实现面部动画的同步生成。主观MOS评测结果表明：本文所实现的实时语音驱动虚拟说话人在的同步性和逼真度上的MOS评分分别达到了3.4和3.50。

著录项

来源
《第十一届全国人机语音通讯学术会议》|2011年|1-7|共7页
会议地点西安
作者
李冰锋; 谢磊; 周祥增; 付中华; 张艳宁;
展开▼
作者单位

中国中文信息学会;

中国声学学会;

中国语音学会;

展开▼
会议组织
正文语种
原文格式 PDF
中图分类语音合成;数理语言学;
关键词
面部动画; 语音合成; 音素识别; 数理语言学;

相似文献

中文文献
外文文献
专利

1. 对话语音中实时说话人检测的研究 [J] . 刘大鹏 ,朱庆生 . 小型微型计算机系统 . 2008,第002期
2. 从任意连续语音中实时提取说话人特征及三维显示 [J] . 俞振利 ,张礼和 . 浙江大学学报（理学版） . 1992,第004期
3. 基于关键点表示的语音驱动说话人脸视频生成 [J] . 年福东 ,王文涛 ,王妍 . 模式识别与人工智能 . 2021,第006期
4. 多说话人环境下目标说话人语音提取方案 [J] . 叶于林 ,莫建华 ,刘夏 . 计算机系统应用 . 2016,第004期
5. 通过分离语音空间和说话人空间的说话人识别 [J] . 邱政权 ,尹俊勋 . 计算机工程与应用 . 2008,第012期
6. 语音驱动虚拟说话人的自然头动生成 [C] . Bingfeng Li ,李冰锋 ,Lei Xie . 第十二届全国人机语言通讯学术会议（NCMMSC`2013） . 2013
7. 语音驱动虚拟说话人研究 [A] . 唐郅 . 2017

实时语音驱动的虚拟说话人

摘要

著录项

相似文献

相关主题

期刊订阅