语音端点检测
语音端点检测的相关文献在1999年到2022年内共计368篇,主要集中在无线电电子学、电信技术、自动化技术、计算机技术、物理学
等领域,其中期刊论文162篇、会议论文12篇、专利文献1162770篇;相关期刊99种,包括电声技术、电子与信息学报、数据采集与处理等;
相关会议12种,包括中国声学学会第九届青年学术会议、第五届全国青年计算语言学研讨会(YWCL 2010)、中国第二十届电路与系统学术年会暨2007年港澳内地电子信息学术研讨会等;语音端点检测的相关文献由677位作者贡献,包括张婷、李祺、范影乐等。
语音端点检测—发文量
专利文献>
论文:1162770篇
占比:99.99%
总计:1162944篇
语音端点检测
-研究学者
- 张婷
- 李祺
- 范影乐
- 郑侃彦
- 韩忠涛
- 马华东
- 李晔
- 张鹏
- 朱唯鑫
- 李超
- 沈小正
- 刘珩
- 庞全
- 武传艳
- 沈亚强
- 王健宗
- 王智国
- 胡国平
- 颜永红
- 冯涛
- 周强
- 国雁萌
- 姜友海
- 常乐
- 张楠赓
- 彭文超
- 徐国强
- 李姝
- 杨青
- 汪付强
- 赵欢
- 万根顺
- 不公告发明人
- 任相赢
- 伍强
- 何遵文
- 俞凯
- 倪红霞
- 刘杨
- 刘聪
- 刘荣
- 刘阳
- 孙文杰
- 张帆
- 张杰
- 张梅
- 张涛
- 果永振
- 殷业
- 王健
-
-
杨璐;
郭文明;
韩芳
-
-
摘要:
语音识别一般只是将语音转化成文字,识别的结果是没有标点的一连串汉字,这不利于读者阅读,也会影响后续任务的处理。因此,引入语音端点检测解决上述问题。同时针对传统的语言模型N-gram存在忽略字词之间语义的相似性、训练时的参数过大等问题,提出一种以全序列卷积神经网络DFCNN作为声学模型,Transformer作为语言模型的语音识别系统。在Thchs30、ST-CMDS数据集上的实验表明,相较于DFCNN结合3-gram模型,该系统在最优模型上达到了12.8%的字符错误率,相对下降了6.9%。
-
-
郭振超;
杨震;
葛子瑞;
郭海燕;
王婷婷
-
-
摘要:
本文通过将语音信号处理与图信号处理相结合,为语音样点构建出一种基于遗忘因子的遗忘图拓扑结构,利用基于遗忘图拓扑结构的图邻接矩阵所定义的图傅里叶变换(Graph Fourier Transform,GFT),研究语音图信号的图频域特性。并在此研究基础上,本文将基于自适应子带谱熵(Adaptive Band-partitioning Spectral Entropy,ABSE)算法的端点检测方法拓展至图频域,设计了一种图自适应子带谱熵(Graph Adaptive Band-partitioning Spectral Entropy,GABSE)算法。实验表明,本文所提出的基于遗忘图的GABSE算法可以使得语音段与非语音段谱熵差异更加显著,较传统ABSE算法端点检测及rVAD语音端点检测方法正确率提高了10%~20%,同时也验证了此语音遗忘图结构有效性。
-
-
张洪德;
韩鑫怡;
柳林;
柳扬
-
-
摘要:
针对低信噪比环境下语音端点检测准确率低、鲁棒性差,提出了一种将谱减降噪和自适应子带对数能熵积相结合的语音端点检测算法。首先利用改进的多窗谱估计谱减法提升语音信号质量,再以自适应子带对数能熵积这一新的语音特征参数为阈值,使用动态阈值双门限检测法进行语音端点检测。实验结果表明,该算法针对低信噪比语音信号具有更好的准确性和鲁棒性。
-
-
付洪威;
乔柱;
于泓
-
-
摘要:
文章针对“信号处理与系统设计实验”课程存在的实验模式单一、实验内容与理论课重复、脱离实际应用、实验学时较少等问题,明确了该门实践课程在信号处理课程群中承上启下的作用,并引入面向工程实践的教学理念,采用项目导学的教学方法,从课程的特点出发,在实验内容和实验方法上进行改革,以综合型实验为例探究培养具有工程素养的应用型人才的课程改革方法。
-
-
倪旭昇;
颜上取;
赵新民;
钱盛友
-
-
摘要:
语音信号在离散余弦变换(DCT)域上具有稀疏性,为压缩感知(CS)的应用创造了条件。将语音端点检测与压缩感知相结合,提出了一种新的语音增强方法。带噪语音通过端点检测得到有话帧与无话帧,利用压缩感知对有话帧进行降噪。将带噪的有话帧在DCT域稀疏表示,采用稀疏循环结构化矩阵进行压缩观测;利用前导无话段得到的噪声估计,提出双迭代正则化正交匹配追踪法(DIMP),通过该算法重构出有话帧;最后在时域叠接有话帧与无话帧,实现语音增强。实验结果表明:在低信噪比下,文章算法的去噪效果优于传统的谱减法和维纳滤波法。
-
-
单蒙;
米吉提·阿不里米提;
艾斯卡尔·艾木都拉
-
-
摘要:
语音端点检测作为语音信号处理前端处理部分的一个重要环节,是各种语音任务的基础。基于深度神经网络的语音端点检测在数据支撑上需要对语音进行大量帧级别的标注,针对此问题,文中提出一种基于原型网络(ProtoNet)的小样本学习(Few⁃shot Learning)的语音端点检测算法,进一步减少在语音端点检测算法过程中因帧级别数据标注带来的繁琐工作。该算法利用所给出的标签计算出一个分类中心,通过计算查询点到分类中心的距离将未给出标签的查询点归类到分类中心,得到一个原型中心;在测试集上,计算测试集中的查询点与原型中心的距离并进行测试。实验语料基于MUSAN语音库,使用该语音库自带的噪声库进行加噪。实验结果表明,在各种环境噪声下,基于小样本学习的语音端点检测算法的性能优于基于深度神经网络的语音端点检测算法,而且该算法能够显著减少语音端点检测算法的数据准备工作量与系统数据量。
-
-
张子丞;
谭志苇;
张晨瑞;
王旋;
刘晓璇;
俞一彪
-
-
摘要:
在分析语音信号与噪声在高低频带的能量谱表现特征基础上,提出一种低信噪比条件下采用高低频带对数能量谱比贝叶斯决策的语音端点检测方法.首先根据样本计算语音信号和背景噪声在高低两个不同频带的对数能量谱比值,依据最大似然估计得到两类信号对数能量谱比的统计分布,并基于贝叶斯决策准则推导最佳判决阈值.信号输入时,逐帧计算高低频带对数能量谱比并与判决阈值进行比较来进行语音和背景噪声的分类判决,从而实现语音信号的端点检测.实验结果表明,与传统的双门限检测法和谱熵检测法相比,提出的方法在较低信噪比条件下能更加准确地检测语音端点,明显提高了端点检测的准确率和速度.
-
-
陈爱华;
张石清
-
-
摘要:
针对当前单一的语音端点检测算法检测率低、鲁棒性较差的问题,提出一种基于深度神经网络和多特征融合的语音端点检测算法.该算法首先分别采用Gammatone滤波、Gabor滤波和LTSV滤波算法提取音频文件的耳蜗特征、短时特征以及长时变化特征;接着对三种特征做均一化处理,并在融合后将其作为深度神经网络的输入信号;然后采用事先训练好的深度神经网络模型,计算语音片段中属于语音/非语音的概率,进而确定语音片段的属性;最后采用中值滤波去掉误检测点,完成语音端点检测.为了验证算法的有效性,选取多个环境下采集的语音信号进行仿真实验.实验结果表明,该算法可以在噪声强度较高的环境下实现语音端点检测,并具有较好的准确性和鲁棒性.
-
-
柏顺;
颜夕宏;
张生平;
陈建飞;
张胜
-
-
摘要:
低信噪比环境下语音信号的端点检测在语音识别与通信等领域具有重要意义,目前低信噪比环境下的端点检测还存在效率低、识别率不高等问题.本文在分析梅尔频率倒谱系数(MFCC)和短时能量在端点检测中应用的基础上,提出将MFCC前三维度分量相加(MFCCa),再与短时能量相除(梅尔能量比)作为语音特征参数的语音端点检测测度,最后利用模糊C均值聚类算法自适应确定双门限阈值进行端点检测.选取TIMIT语音库中的50条语音信号进行实验,结果表明:在信噪比为5 dB、0 dB、-5 dB的噪声环境下,与能零比、谱熵等算法相比,本算法端点识别准确率均有所提高,其中在-5 dB信噪比环境下提升了约30%.
-
-
蒋学仕
-
-
摘要:
针对传统能量熵的短时能量与子带谱熵容易受噪声环境影响,低信噪比下端点检测性能下降的问题,提出一种基于噪声估计的改进能量熵语音端点检测算法.首先对语音进行噪声估计并以此计算语音存在概率;然后利用估计的噪声能量修正短时能量,用语音存在概率作为加权系数优化子带谱熵,并将两者结合生成改进的能量熵;最后给出基于噪声估计的动态门限以及实时的端点检测策略.实验结果表明,在信噪比5 dB、0 dB的多种噪声环境中,基于噪声估计的改进能量熵端点检测算法相比传统能量熵算法与改进子带能谱比算法,检测正确率平均提升7%.
-
-
-
-
蒋纯纲;
屈百达;
李金宝;
王月
- 《2007中国控制与决策学术年会》
| 2007年
-
摘要:
为提高语音端点检测在较低信噪比下的准确率,当语音信号与随机噪声在不同尺度上进行小波变换时,针对其传递特性不同的特征表现及其特点,提出一种新的基于分形维数的语音信号端点检测方法,即对带噪语音信号进行小波重构,去噪后,利用分形维数方法计算信号的维数,实现语音的端点检测,并给出其原理和具体算法.仿真实验结果表明,该方法简单可靠,有效可行,与已有方法相比,更具有广泛的实用性.
-
-
-
-
-
-
茹海峰;
殷业
- 《第三届全国信息获取与处理学术会议》
| 2005年
-
摘要:
语音端点的检测是语音识别的一个重要组成部分.传统的基于能量或过零率等特征的语音端点检测,在强噪声环境下,往往不能达到理想效果.实践表明直接通过人眼对语音波形图或频谱图进行端点检测往往比使用传统的自动检测方法更好,所以用图像处理替代人眼识别可得到一种新的端点检测方法,在此实现了这种方法,实验表明效果良好.
-
-
冯凯;
刘珩
- 《中国电子学会第十一届青年学术年会》
| 2005年
-
摘要:
在语音识别中,语音端点检测是关键的环节,对于提高语音的识别率有着重要的作用.本文结合语音的特点,提出了一种基于短时分形维数的自适应语音端点检测方法,为了能够做到满足实时的效果,本方法采用计盒维数的计算方法来计算语音信号的分形维数,并在短时分形维数的基础上,动态的改变门限值,以达到自适应的语音端点检测.仿真实验证明,该方法可以有效的实现整段语音的的端点检测,而且具有一定的噪声鲁棒性,是一种有效的带噪语音端点检测方法.
-
-
陶颖;
吴乐南
- 《全国第18届计算机技术与应用学术会议(CACIS)》
| 2007年
-
摘要:
介绍自适应多速率宽带语音编解码器AMR-WB的原理,讨论它在中波数字AM广播中的应用。AMR-WB是第一个可同时用于无线和有线的编解码器,语音带宽扩展为50Hz-7000Hz,编码语音自然度高,有9种不同速率的编码模式,并具备语音端点检测技术,能灵活地满足数字广播传输业务数据的要求。