首页> 中国专利> 用于计算机辅助发音训练和语音处理的声学字形模型和声学字形音位模型

用于计算机辅助发音训练和语音处理的声学字形模型和声学字形音位模型

摘要

介绍了一种用于以音素级分析语音的声学字形模型(AGM)和声学字形音位模型(AGPM)。AGM是多分布深度神经网络(MD‑DNN),其输入包括话语的声学特征的表示和文本的对应字形转录。AGPM的输入可以包括声学特征、字形转录和规范音位转变。AGM或AGPM的输出可以包括一组可辨识音素中的每个音素的后验概率。根据后验概率,例如可使用维特比解码算法和状态转变模型确定最可能音素序列,状态转变模型在考虑到特定的在前音素序列的情况下提供特定音素的后验概率。

著录项

  • 公开/公告号CN109863554A

    专利类型发明专利

  • 公开/公告日2019-06-07

    原文格式PDF

  • 申请/专利权人 香港中文大学;

    申请/专利号CN201780065301.4

  • 发明设计人 蒙美玲;李坤;孙立发;吴锡欣;

    申请日2017-10-27

  • 分类号

  • 代理机构北京英赛嘉华知识产权代理有限责任公司;

  • 代理人王达佐

  • 地址 中国香港新界

  • 入库时间 2024-02-19 11:46:10

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2019-07-02

    实质审查的生效 IPC(主分类):G10L15/00 申请日:20171027

    实质审查的生效

  • 2019-06-07

    公开

    公开

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号