您现在的位置：首页> 研究主题> 语音端点检测

语音端点检测

语音端点检测的相关文献在1999年到2022年内共计368篇，主要集中在无线电电子学、电信技术、自动化技术、计算机技术、物理学等领域，其中期刊论文162篇、会议论文12篇、专利文献1162770篇；相关期刊99种，包括电声技术、电子与信息学报、数据采集与处理等；相关会议12种，包括中国声学学会第九届青年学术会议、第五届全国青年计算语言学研讨会(YWCL 2010)、中国第二十届电路与系统学术年会暨2007年港澳内地电子信息学术研讨会等；语音端点检测的相关文献由677位作者贡献，包括张婷、李祺、范影乐等。

语音端点检测—发文量

期刊论文>

论文：162篇占比：0.01%

会议论文>

论文：12篇占比：0.00%

专利文献>

论文：1162770篇占比：99.99%

总计：1162944篇

语音端点检测—发文趋势图

语音端点检测
-研究学者

张婷
李祺
范影乐
郑侃彦
韩忠涛
马华东
李晔
张鹏
朱唯鑫
李超
沈小正
刘珩
庞全
武传艳
沈亚强
王健宗
王智国
胡国平
颜永红
冯涛
周强
国雁萌
姜友海
常乐
张楠赓
彭文超
徐国强
李姝
杨青
汪付强
赵欢
万根顺
不公告发明人
任相赢
伍强
何遵文
俞凯
倪红霞
刘杨
刘聪
刘荣
刘阳
孙文杰
张帆
张杰
张梅
张涛
果永振
殷业
王健

语音端点检测
-相关主题

语音端点检测
-相关期刊

语音端点检测
-相关会议

期刊论文
会议论文
专利文献

搜索

排序：

专利类型

专利分类

学科

年份

2022
(37)
2021
(44)
2020
(6)
2019
(11)
2018
(6)
2017
(8)
2016
(9)
2015
(13)
2014
(8)
2013
(9)
2012
(6)
2011
(9)
2010
(11)
2009
(11)
2008
(14)
2007
(8)
2006
(10)
2005
(7)
2004
(1)
2003
(4)
2002
(1)
2001
(1)
1999
(1)

期刊

收录数据库

作者

张婷
(9)
李祺
(8)
范影乐
(8)
郑侃彦
(8)
韩忠涛
(8)
马华东
(8)
李晔
(7)
张鹏
(6)
朱唯鑫
(6)
李超
(6)
沈小正
(6)
刘珩
(5)
庞全
(5)
武传艳
(5)
沈亚强
(5)
王健宗
(5)
王智国
(5)
胡国平
(5)
颜永红
(5)
冯涛
(4)
周强
(4)
国雁萌
(4)
姜友海
(4)
常乐
(4)
张楠赓
(4)
彭文超
(4)
徐国强
(4)
李姝
(4)
杨青
(4)
汪付强
(4)
赵欢
(4)
万根顺
(3)
不公告发明人
(3)
任相赢
(3)
伍强
(3)
何遵文
(3)
俞凯
(3)
倪红霞
(3)
刘杨
(3)
刘聪
(3)
刘荣
(3)
刘阳
(3)
孙文杰
(3)
张帆
(3)
张杰
(3)
张梅
(3)
张涛
(3)
果永振
(3)
殷业
(3)
王健
(3)

关键词

申请/权力人

;

1. 基于DFCNN-CTC和Transformer的中文语音识别
- 杨璐；郭文明；韩芳
- 摘要：语音识别一般只是将语音转化成文字,识别的结果是没有标点的一连串汉字,这不利于读者阅读,也会影响后续任务的处理。因此,引入语音端点检测解决上述问题。同时针对传统的语言模型N-gram存在忽略字词之间语义的相似性、训练时的参数过大等问题,提出一种以全序列卷积神经网络DFCNN作为声学模型,Transformer作为语言模型的语音识别系统。在Thchs30、ST-CMDS数据集上的实验表明,相较于DFCNN结合3-gram模型,该系统在最优模型上达到了12.8%的字符错误率,相对下降了6.9%。
2. 一种基于语音图信号处理的端点检测方法
- 郭振超；杨震；葛子瑞；郭海燕；王婷婷
- 摘要：本文通过将语音信号处理与图信号处理相结合,为语音样点构建出一种基于遗忘因子的遗忘图拓扑结构,利用基于遗忘图拓扑结构的图邻接矩阵所定义的图傅里叶变换(Graph Fourier Transform,GFT),研究语音图信号的图频域特性。并在此研究基础上,本文将基于自适应子带谱熵(Adaptive Band-partitioning Spectral Entropy,ABSE)算法的端点检测方法拓展至图频域,设计了一种图自适应子带谱熵(Graph Adaptive Band-partitioning Spectral Entropy,GABSE)算法。实验表明,本文所提出的基于遗忘图的GABSE算法可以使得语音段与非语音段谱熵差异更加显著,较传统ABSE算法端点检测及rVAD语音端点检测方法正确率提高了10%~20%,同时也验证了此语音遗忘图结构有效性。
3. 基于谱减与自适应子带对数能熵积的端点检测
- 张洪德；韩鑫怡；柳林；柳扬
- 摘要：针对低信噪比环境下语音端点检测准确率低、鲁棒性差,提出了一种将谱减降噪和自适应子带对数能熵积相结合的语音端点检测算法。首先利用改进的多窗谱估计谱减法提升语音信号质量,再以自适应子带对数能熵积这一新的语音特征参数为阈值,使用动态阈值双门限检测法进行语音端点检测。实验结果表明,该算法针对低信噪比语音信号具有更好的准确性和鲁棒性。
4. “信号处理与系统设计实验”课程实践教学探索——以北京科技大学为例
- 付洪威；乔柱；于泓
- 摘要：文章针对“信号处理与系统设计实验”课程存在的实验模式单一、实验内容与理论课重复、脱离实际应用、实验学时较少等问题,明确了该门实践课程在信号处理课程群中承上启下的作用,并引入面向工程实践的教学理念,采用项目导学的教学方法,从课程的特点出发,在实验内容和实验方法上进行改革,以综合型实验为例探究培养具有工程素养的应用型人才的课程改革方法。
5. 基于端点检测与压缩感知的语音增强方法
- 倪旭昇；颜上取；赵新民；钱盛友
- 摘要：语音信号在离散余弦变换(DCT)域上具有稀疏性,为压缩感知(CS)的应用创造了条件。将语音端点检测与压缩感知相结合,提出了一种新的语音增强方法。带噪语音通过端点检测得到有话帧与无话帧,利用压缩感知对有话帧进行降噪。将带噪的有话帧在DCT域稀疏表示,采用稀疏循环结构化矩阵进行压缩观测;利用前导无话段得到的噪声估计,提出双迭代正则化正交匹配追踪法(DIMP),通过该算法重构出有话帧;最后在时域叠接有话帧与无话帧,实现语音增强。实验结果表明:在低信噪比下,文章算法的去噪效果优于传统的谱减法和维纳滤波法。
6. 基于小样本学习的语音端点检测
- 单蒙；米吉提·阿不里米提；艾斯卡尔·艾木都拉
- 摘要：语音端点检测作为语音信号处理前端处理部分的一个重要环节,是各种语音任务的基础。基于深度神经网络的语音端点检测在数据支撑上需要对语音进行大量帧级别的标注,针对此问题,文中提出一种基于原型网络(ProtoNet)的小样本学习(Few⁃shot Learning)的语音端点检测算法,进一步减少在语音端点检测算法过程中因帧级别数据标注带来的繁琐工作。该算法利用所给出的标签计算出一个分类中心,通过计算查询点到分类中心的距离将未给出标签的查询点归类到分类中心,得到一个原型中心;在测试集上,计算测试集中的查询点与原型中心的距离并进行测试。实验语料基于MUSAN语音库,使用该语音库自带的噪声库进行加噪。实验结果表明,在各种环境噪声下,基于小样本学习的语音端点检测算法的性能优于基于深度神经网络的语音端点检测算法,而且该算法能够显著减少语音端点检测算法的数据准备工作量与系统数据量。
7. 基于高低频带对数能量谱比贝叶斯决策的语音端点检测
- 张子丞；谭志苇；张晨瑞；王旋；刘晓璇；俞一彪
- 摘要：在分析语音信号与噪声在高低频带的能量谱表现特征基础上,提出一种低信噪比条件下采用高低频带对数能量谱比贝叶斯决策的语音端点检测方法.首先根据样本计算语音信号和背景噪声在高低两个不同频带的对数能量谱比值,依据最大似然估计得到两类信号对数能量谱比的统计分布,并基于贝叶斯决策准则推导最佳判决阈值.信号输入时,逐帧计算高低频带对数能量谱比并与判决阈值进行比较来进行语音和背景噪声的分类判决,从而实现语音信号的端点检测.实验结果表明,与传统的双门限检测法和谱熵检测法相比,提出的方法在较低信噪比条件下能更加准确地检测语音端点,明显提高了端点检测的准确率和速度.
8. 基于深度神经网络和多特征融合的语音端点检测
- 陈爱华；张石清
- 摘要：针对当前单一的语音端点检测算法检测率低、鲁棒性较差的问题,提出一种基于深度神经网络和多特征融合的语音端点检测算法.该算法首先分别采用Gammatone滤波、Gabor滤波和LTSV滤波算法提取音频文件的耳蜗特征、短时特征以及长时变化特征;接着对三种特征做均一化处理,并在融合后将其作为深度神经网络的输入信号;然后采用事先训练好的深度神经网络模型,计算语音片段中属于语音/非语音的概率,进而确定语音片段的属性;最后采用中值滤波去掉误检测点,完成语音端点检测.为了验证算法的有效性,选取多个环境下采集的语音信号进行仿真实验.实验结果表明,该算法可以在噪声强度较高的环境下实现语音端点检测,并具有较好的准确性和鲁棒性.
9. 基于梅尔频率倒谱系数与短时能量的低信噪比语音端点检测
- 柏顺；颜夕宏；张生平；陈建飞；张胜
- 摘要：低信噪比环境下语音信号的端点检测在语音识别与通信等领域具有重要意义,目前低信噪比环境下的端点检测还存在效率低、识别率不高等问题.本文在分析梅尔频率倒谱系数(MFCC)和短时能量在端点检测中应用的基础上,提出将MFCC前三维度分量相加(MFCCa),再与短时能量相除(梅尔能量比)作为语音特征参数的语音端点检测测度,最后利用模糊C均值聚类算法自适应确定双门限阈值进行端点检测.选取TIMIT语音库中的50条语音信号进行实验,结果表明:在信噪比为5 dB、0 dB、-5 dB的噪声环境下,与能零比、谱熵等算法相比,本算法端点识别准确率均有所提高,其中在-5 dB信噪比环境下提升了约30％.
10. 基于噪声估计的改进能量熵语音端点检测算法
- 蒋学仕
- 摘要：针对传统能量熵的短时能量与子带谱熵容易受噪声环境影响,低信噪比下端点检测性能下降的问题,提出一种基于噪声估计的改进能量熵语音端点检测算法.首先对语音进行噪声估计并以此计算语音存在概率;然后利用估计的噪声能量修正短时能量,用语音存在概率作为加权系数优化子带谱熵,并将两者结合生成改进的能量熵;最后给出基于噪声估计的动态门限以及实时的端点检测策略.实验结果表明,在信噪比5 dB、0 dB的多种噪声环境中,基于噪声估计的改进能量熵端点检测算法相比传统能量熵算法与改进子带能谱比算法,检测正确率平均提升7％.

1. 一种构建语音端点检测模型的方法及语音端点检测系统
- 厦门亿联网络技术股份有限公司
- 公开公告日期：2021.08.03
- 摘要：本发明公开了一种构建语音端点检测模型的方法及语音端点检测系统，属于语音识别技术领域。本发明的一种构建语音端点检测模型的方法，先采集音频数据并合成混合语音，而后对混合语音进行特征提取得到62维特征，再将62维特征输入至RNN模型进行训练得到语音端点检测模型。本发明的一种语音端点检测系统，包括采集单元、计算单元、传输单元和终端，采集单元与计算单元电连接，计算单元和终端分别与传输单元连接。本发明克服了现有技术中，语音识别准确性和稳定性不高的不足，提供了一种构建语音端点检测模型的方法及语音端点检测系统，对各类噪声下的语音数据具有较高的识别率，可以应用部署至实时会议通信设备。
2. 一种应用于语音识别系统的语音端点检测方法
- 中国科学院声学研究所
- 北京中科信利技术有限公司
- 公开公告日期：2009.01.28
- 摘要：本发明涉及一种应用于语音识别系统的语音端点检测方法，包括如下步骤：1)对输入的语音数据进行分帧处理；2)对语音数据以帧为单位进行FFT运算，根据前N帧语音将整个语音频谱划分为信噪比高低不同的子带，计算出各子带的噪声门限；3)根据各子带的噪声门限对语音端点进行初步判别；4)根据共振峰值对语音端点进行精确判定。与现有技术相比，本发明的优点是：能够适用于各种不同自然环境的语音端点检测；能够适用于噪声较大时的语音端点检测；采用逐帧判别，且计算量小，可实际应用于各种实时语音识别系统中。
3. 一种构建语音检测模型的方法及语音端点检测系统
- 厦门亿联网络技术股份有限公司
- 公开公告日期：2019-09-20
- 摘要：本发明公开了一种构建语音检测模型的方法及语音端点检测系统，属于语音识别技术领域。本发明的一种构建语音检测模型的方法，先采集音频数据并合成混合语音，而后对混合语音进行特征提取得到62维特征，再将62维特征输入至RNN模型进行训练得到语音检测模型。本发明的一种语音端点检测系统，包括采集单元、计算单元、传输单元和终端，采集单元与计算单元电连接，计算单元和终端分别与传输单元连接。本发明克服了现有技术中，语音识别准确性和稳定性不高的不足，提供了一种构建语音检测模型的方法及语音端点检测系统，对各类噪声下的语音数据具有较高的识别率，可以应用部署至实时会议通信设备。
4. 一种适用于车内语音识别系统的语音端点检测方法及模块
- 清华大学苏州汽车研究院(相城)
- 华研慧声(苏州)电子科技有限公司
- 公开公告日期：2022-01-11
- 摘要：本发明公开了一种适用于车内语音识别系统的语音端点检测方法及模块，所述模块包括语音帧判断单元和语音帧标记单元，所述语音帧判断单元用于检测出实时音频数据中的含语音帧，所述语音帧标记单元用于根据所述语音帧判断单元的检测结果对所述实时音频数据中的含语音帧进行标记。本发明提供的适用于车内语音识别系统的语音端点检测方法及模块结合实际场景的行车工况特征，建立多特征融合的端点检测模型，采用具有维度差异的模型框架，并结合语音的语谱图像特点设计卷积核，提升了语音识别准确率。
5. 一种基于说话人语音特征的语音端点检测方法
- 东北大学
- 公开公告日期：2018-12-11
- 摘要：本发明涉及一种基于说话人语音特征的语音端点检测方法；本发明方法包括：100、预先获取至少两个人的语音特征；101、采集至少两个人说话的语音信号并预处理，获取背景噪声信号；102、针对语音信号和背景噪声信号分别加窗处理，获取声音帧和背景噪声帧；103、获取声音帧、背景噪声帧的短时能零积值和门限阈值；104、针对所有声音帧通过门限阈值获取语音信号的有音段；105、根据有音段的语音特征，更新门限阈值并获取语音信号的端点；本发明方法在传统的语音端点检测的基础上结合说话人识别，在考虑了噪声影响的同时，还针对说话人的语音特征提取和对比，使得语音端点检测更为准确，从而使多说话人识别更为准确。
6. 一种语音端点检测方法及语音识别方法
- 芋头科技(杭州)有限公司
- 公开公告日期：2018-08-21
- 摘要：本发明公开了一种语音端点检测方法及语音识别方法，属于语音识别技术领域；方法包括：提取语音数据的语音特征并输入至静音模型中；静音模型根据语音特征输出标签用于表示语音数据是否为静音帧；根据连续帧的语音数据的标签确认一段语音的语音端点：在非激活状态，若连续出现非静音帧的语音数据的长度大于一预设的第一阈值，则判断第一帧为非静音帧的语音数据为一段语音的起始端点；在激活状态，若连续出现静音帧的语音数据的长度大于一预设的第二阈值，则判断第一帧为静音帧的语音数据为一段语音的结束端点。上述技术方案的有益效果是：解决现有技术中语音端点检测不准确以及对于检测环境要求过高的问题。
7. 一种应用于语音识别系统的语音端点检测方法
- 中国科学院声学研究所
- 北京中科信利技术有限公司
- 公开公告日期：2006-05-17
- 摘要：本发明涉及一种应用于语音识别系统的语音端点检测方法，包括如下步骤：1)对输入的语音数据进行分帧处理；2)对语音数据以帧为单位进行FFT运算，根据前N帧语音将整个语音频谱划分为信噪比高低不同的子带，计算出各子带的噪声门限；3)根据各子带的噪声门限对语音端点进行初步判别；4)根据共振峰值对语音端点进行精确判定。与现有技术相比，本发明的优点是：能够适用于各种不同自然环境的语音端点检测；能够适用于噪声较大时的语音端点检测；采用逐帧判别，且计算量小，可实际应用于各种实时语音识别系统中。
8. 基于语音端点检测算法的低电压穿越电压检测方法及系统
- 国网内蒙古东部电力有限公司电力科学研究院
- 国家电网有限公司
- 公开公告日期：2022-11-25
- 摘要：本公开属于低电压穿越技术领域，具体涉及一种基于语音端点检测算法的低电压穿越电压检测方法及系统，包括：获取至少两个不同时刻的电网电压信号；对所获取的电网电压分别进行分帧采样处理，构造与电网电压信号相对应的自相关函数，得到每一帧电网电压信号的自相关函数序列；根据所得到的每一帧电网电压信号的自相关函数序列，构造电网电压信号的自相关序列矢量；计算不同电网电压信号的自相关序列矢量的夹角；根据所述夹角的余弦、电压突变判据和预设的语音端点检测模型，完成电压检测。
9. 一种自适应语音端点检测方法及检测电路
- 成都启英泰伦科技有限公司
- 公开公告日期：2021-10-01
- 摘要：一种自适应语音端点检测方法，包括如下步骤：对输入语音信号分割成单帧时域信号；计算时域基础背景能量、时域最大背景能量、时域最终背景能量和时域语音存在概率；对单帧时域信号进行加窗处理和离散傅立叶变换，计算频域语音存在概率；根据时域语音存在概率、频域语音存在概率、信噪比计算有效判决概率；根据有效判决概率Pfinal判断是否存在有效语音。本发明使用信噪比作为选择时域处理或频域处理作为是否有语音的判决条件，解决了现有技术难以满足对复杂环境有较高适应性的需求，提高了算法对环境的自适应性和鲁棒性。
10. 一种基于FFT语音信号的端点检测系统及检测方法
- 南京莱斯信息技术股份有限公司
- 公开公告日期：2019-01-18
- 摘要：本发明提供一种基于FFT语音信号的端点检测系统及检测方法，包括数字信号处理器、输入语音集成电路模块、输出语音集成电路模块、FPGA、无线电台；其中语音信号数据经AIC23采样转换为数字信号后，直接进入FPGA的FFT内核模块，由硬件电路实现FFT，速度快，系统延迟小，其中通过FPGA多了一次语音信号预处理程序，提高语音端点检测的准确率。

语音端点检测

语音端点检测—发文量

语音端点检测—发文趋势图

语音端点检测-研究学者

语音端点检测-相关主题

语音端点检测-相关期刊

语音端点检测-相关会议

语音端点检测
-研究学者

语音端点检测
-相关主题

语音端点检测
-相关期刊

语音端点检测
-相关会议