基于融合特征的短语音汉语声调自动识别方法

沈凌洁; 王蔚

首页> 中文期刊> 《声学技术》 >基于融合特征的短语音汉语声调自动识别方法

基于融合特征的短语音汉语声调自动识别方法

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

提出一种基于韵律特征(基频、时长)和梅尔倒谱系数(Mel-Frequency Cepstral Coefficient,MFCC)特征的融合特征进行短语音汉语声调识别的方法,旨在利用两种特征的优势提高短语音汉语声调识别率。该融合特征包括7个根据不同模型得到的韵律特征和统计参数以及4个从每个音段的梅尔倒谱系数计算得来的对数化后验概率,使用高斯混合模型表示4个声调的倒谱特征的分布。实验分两步:第一步,将基于韵律特征和倒谱特征的分类器在决策阶段混合起来进行声调分类,分别赋予两个分类器权重,计算倒谱特征和韵律特征在声调分类任务中的权重;第二步,将基于字的韵律特征和基于帧的倒谱特征结合起来生成融合特征的超向量,使用融合特征进行汉语声调识别,根据准确率、未加权平均召回率(Unweigted Average Recall,UAR)和科恩卡帕(Cohen’s Kappa)系数3个指标,比较并评估5种分类器(两种设置的高斯混合模型,后向传播神经网络,支持向量机和卷积神经网络(Convolutional Neural Network,CNN))在不平衡数据集上的分类效果。实验结果表明:(1)倒谱特征方法能够提高汉语声调的识别率,该特征在总体分类任务中的权重为0.11;(2)基于融合特征的深度学习(CNN)方法对声调的识别率最高,为87.6%,与高斯混合模型的基线系统相比,提高了5.87%。该研究证明了倒谱特征法能够提供与韵律特征法互补的信息,从而提高短语音汉语声调识别率;同时,该方法可以运用到韵律检测和副语言信息检测等相关研究中。

著录项

来源
《声学技术》 |2018年第2期|167-174|共8页
作者
沈凌洁; 王蔚;
展开▼
作者单位

南京师范大学教育科学学院;

展开▼
原文格式 PDF
正文语种 chi
中图分类 H107;
关键词
韵律特征; 倒谱特征; 梅尔倒谱系数; 短语音声调; 声调分类; 融合; 卷积神经网络;

相似文献

中文文献
外文文献
专利

1. 基于连续分布型HMM的汉语连续语音的声调识别方法 [J] . 赵力 ,邹采荣 ,吴镇扬 . 信号处理 . 2000,第001期
2. 基于发音特征的汉语声调建模方法及其在汉语语音识别中的应用 [J] . 晁浩 ,杨占磊 ,刘文举 . 计算机应用 . 2013,第010期
3. 支持向量机的汉语连续语音声调识别方法 [J] . 傅德胜 ,李仕强 ,王水平 . 计算机科学 . 2010,第005期
4. 基于语音PZCPA时频域特征融合的语音情感识别方法 [J] . 阿卜杜萨拉木·艾海提 ,陈恳 . 数据通信 . 2021,第002期
5. 基于基本情感特征的汉语语音识别方法的研究 [J] . 马承泽 ,鞠婷婷 . 长春大学学报（自然科学版） . 2014,第008期
6. 基于长短时特征融合的语音情感识别方法研究 [C] . 韩文静 ,李海峰 ,韩纪庆 . 第九届全国人机语言通讯学术会议 . 2007
7. 基于音节的汉语连续语音声调识别方法研究 [A] . 钟金宏 . 2001

基于融合特征的短语音汉语声调自动识别方法

摘要

著录项

相似文献

相关主题

期刊订阅