...
首页> 外文期刊>電子情報通信学会技術研究報告. 音声. Speech >Valence-Activation 2次元感情空間で定式化された感情普声合成法の提案
【24h】

Valence-Activation 2次元感情空間で定式化された感情普声合成法の提案

机译:在二维情感空间中制定情感通用语音合成方法的价激活方案

获取原文
获取原文并翻译 | 示例
   

获取外文期刊封面封底 >>

       

摘要

Speech to Speech Translation(S2ST)システムはある言語音声を他の言語音声に変換するための重要な技術である.音声には言語情報のみならず,パラ言語·非言語情報が含まれているが,これまでS2STシステムは言語情報を主に扱ってきており,感情などのパラ言語·非言語情報が含まれていない合成音声に限定されている.このためS2STで表現豊かな音声を扱えるようにするためには,感情を含んだ音声合成/認識システムが必要となる.また,多くの感情音声に関する研究では,怒り,悲しみなどの典型的でカテゴリカルな感情に焦点を当てているが,感情はカテゴリカルに表現されるものではなく,Valence-Activation(V-A)の2次元空間上で連続的に変化するものである.そこで,本稿では,V-A空間での感情表現にもとづいた感情音声合成法を提案する.音響的特徴とV-A空間の関係をモデル化するために,Fuzzy Inference System(FIS)を構築し,これを用いて21種類の音響的特徴をFISのルールに従って制御した.そして,V-A空間において合成された音声が同様の空間上に知覚されるか調べるために,聴取実験を行った.その結果,合成音声と評価値はV-A空間上で同じ象限に付置されることが確認された.
机译:语音到语音翻译(S2ST)系统是将一种语言的语音转换为另一种语言的一项重要技术。语音不仅包含语言信息,还包含辅助语言和非语言信息,但是直到现在,S2ST系统主要处理语言信息,并且包括辅助语言和非语言信息(例如情感)。仅限于非合成音频。因此,为了使S2ST处理表达性语音,需要包含情感的语音合成/识别系统。同样,许多关于情绪声音的研究都集中在典型的和分类的情绪上,例如愤怒和悲伤,但这些情绪不是分类表达的,而是价态激活(VA)2它在维空间中连续变化。因此,在本文中,我们提出了一种基于语音表达的情感语音合成方法。为了对声学特征和V-A空间之间的关系进行建模,我们构建了模糊推理系统(FIS),并根据FIS规则将其用于控制​​21种声学特征。然后,进行听觉实验以调查在同一空间中是否感知到了V-A空间中的合成声音。结果,确认了合成语音和评估值被分配给V-A空间中的相同象限。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号