首页> 中文会议>2018中国西部声学学术交流会 >融合人脸表情的手语到汉藏双语情感语音转换

融合人脸表情的手语到汉藏双语情感语音转换

页面导航

摘要
著录项
相似文献
相关主题

摘要

针对聋哑人与正常人之间存在的交流障碍问题,提出了一种融合人脸表情的手语到汉藏双语情感语音转换的方法.首先使用深度置信网络模型得到手势图像的特征信息,并通过深度神经网络模型得到人脸信息的表情特征.其次采用支持向量机对手势特征和人脸表情特征分别进行相应模型的训练及分类,根据识别出的手势信息和人脸表情信息分别获得手势文本及相应的情感标签.同时,利用普通话情感训练语料,采用说话人自适应训练方法,实现了一个基于隐Markov模型的情感语音合成系统.最后,利用识别获得的手势文本和情感标签,将手势及人脸表情转换为普通话或藏语的情感语音.客观评测表明,静态手势的识别率为92.8％,在扩充的Cohn-Kanade数据库和日本女性面部表情(Japanese Female Facial Expression,JAFFE)数据库上的人脸表情识别率为94.6％及80.3％.主观评测表明,转换获得的情感语音平均情感主观评定得分4.0分,利用三维情绪模型(Pleasure-Arousal-Dominance,PAD)分别评测人脸表情和合成的情感语音的PAD值,两者具有很高的相似度,表明合成的情感语音能够表达人脸表情的情感.

著录项

来源
《2018中国西部声学学术交流会》|2018年|372-379|共8页
会议地点兰州
作者
SONG Nan; 宋南; WU Pei-wen; 吴沛文; YANG Hong-wu; 杨鸿武;
展开▼
作者单位

中国声学学会微声学分会;

四川省声学学会;

山东声学学会;

上海声学学会;

黑龙江省声学学会;

陕西省声学学会;

浙江省声学学会;

展开▼
会议组织
正文语种
原文格式 PDF
中图分类人工神经网络与计算;
关键词
手势识别; 人脸表情; 深度神经网络; 汉藏双语; 情感语音合成; 语音转换;

相似文献

中文文献
外文文献
专利

1. 融合人脸表情的手语到汉藏双语情感语音转换 [J] . 宋南 ,吴沛文 ,杨鸿武 . 声学技术 . 2018,第4期
2. 汉藏双语法学教育实践探索与完善——以"一院两校"协同培养汉藏双语法律人才为例 [J] . 焦盛荣 ,罗艺 . 甘肃高师学报 . 2021,第003期
3. 汉藏双语翻译人才培养模式改革的思考——从中央民族大学藏学研究院培养汉藏双语翻译人才经验谈起 [J] . 周拉 ,仁乃杰 . 民族翻译 . 2020,第006期
4. 推广汉藏双语教育向建党九十周年献礼——康巴卫视举办“爱祖国爱家乡”2011年汉藏双语演讲大赛 [J] . . 西部广播电视 . 2011,第008期
5. 汉藏佛教的交流与融合:汉藏罗汉名号解析 [J] . 张长虹 . 西藏大学学报（社会科学版） . 2020,第003期
6. 甘孜藏区汉藏双语法律人才教育问题分析——以四川民族学院汉藏双语法学为例 [C] . 王秋红 . 四川省高等教育学会2013学术年会 . 2013
7. 汉藏双语跨语言语音转换方法的研究 [A] . 王振文 . 2015

融合人脸表情的手语到汉藏双语情感语音转换

摘要

著录项

相似文献

相关主题

期刊订阅