语音信号
语音信号的相关文献在1984年到2022年内共计1919篇,主要集中在无线电电子学、电信技术、自动化技术、计算机技术、语言学
等领域,其中期刊论文814篇、会议论文168篇、专利文献269944篇;相关期刊451种,包括电声技术、电信科学、电子设计工程等;
相关会议121种,包括2016年声频工程学术交流年会、第十六届全国信号处理学术年会及产业发展大会、第十一届全国人机语音通讯学术会议等;语音信号的相关文献由3202位作者贡献,包括吴殷美、赵力、成昊相等。
语音信号—发文量
专利文献>
论文:269944篇
占比:99.64%
总计:270926篇
语音信号
-研究学者
- 吴殷美
- 赵力
- 成昊相
- 王健
- 邹采荣
- 韩志艳
- 朱基岘
- 金重会
- 王彪
- 田惠晶
- 郑奎赫
- 金洛榕
- 杨震
- 佐藤宁
- 冯宇红
- 姜仁圭
- 梁民
- 陈砚圃
- 高毅
- 于蒙
- 张晨
- 蓝天翔
- 西口正之
- 陈孝良
- 姜鸿彦
- 孙昌用
- 张健
- 张玉梅
- 张雪英
- 李英汉
- 林福辉
- 梁勇
- 王晶
- 罗海涛
- 肖全之
- 金美英
- 陈又圣
- B·K·詹安
- S·尚德尔
- T·瑞安
- 余华
- 冯大航
- 刘勇
- 吴晓军
- 吴镇扬
- 周慧
- 孔维佳
- 张杰
- 曾庆宁
- 李晓东
-
-
罗海涛
-
-
摘要:
语言是人类特有的能力。通过声音传感器,把语音转换为电信号;通过采样和幅度量化,把语音信号转化为一系列离散化的采样数据,便于计算机存储、传输和处理;通过快速傅里叶变换,可以得到采样数据的频谱。频域特征与时域特征结合可应用于语音的识别,说话人识别,语音的编码、分割、合成、端点检测等领域。
-
-
曾庆宁;
王红丽;
龙超
-
-
摘要:
语音增强的目的是尽可能地从带噪语音中提取纯净的原始语音。传统的单麦克风语音增强算法在非平稳噪声、低信噪比等复杂情况下性能显著降低;而双麦克风因其可以抑制方向性噪声,整体降噪性能更好而得到广泛应用。针对微型双麦克风,文中提出一种有效的语音增强算法。该算法首先通过对两通道含噪语音信号进行差分运算来抑制方向噪声,然后采用基于语音活动检测的改进自适应噪声抵消算法进一步消除剩余噪声,再对畸变的语音信号进行恢复运算,最后使用对数最小均方误差算法进一步消除残留噪声。在对畸变的语音信号进行恢复运算的过程中,提出一种时域恢复算法,得到比已有频域恢复算法更小的运算量和时延。实验结果表明,文中所提算法能有效地抑制噪声,改善语音质量,其降噪效果良好而且易于实时实现。
-
-
罗海涛
-
-
摘要:
语音由发音器官发出,通过声电传感器,语音可以转化连续的模拟电信号;随着电子技术和计算机技术的进一步发展,语音信号的处理得到了飞速的发展;语音信号分析处理包括时域分析和频域分析两大类;语音的时域分析包括短时能量分析、短时过零率分析、短时相关分析,时域分析目的是提取语音时域特征,据此进行语音端点检测。
-
-
柏文展;
程汪鑫
-
-
摘要:
语谱图主要用于研究语音信号不同频段的信号强度随时间变化的关系。分析语谱图时,需要利用Python语言和相关库进行仿真,得到语音信号的伪彩色映射并将结果直观地显示出来,便于进一步分析、研究语音信号的特征。本文讨论语音信号的声学基础和有关特征,分析语音信号处理的发展及应用,用声卡采集湖南三个地方的方言语音信号,利用Python语言对方言语音信号语谱图进行显示,分析不同汉语方言之间的差异。该方法具有编程简单、相关功能库丰富、对设备要求低、显示结果直观等特点,为分析处理不同地区的方言语音信号提供了一种简洁高效的方法。调用Python进行仿真,能清晰地分辨出宽带信号与窄带信号的不同特性,因此可通过对频谱图的分析来识别不同地方的方言。
-
-
罗海涛
-
-
摘要:
语音是人类最常用最有效的交流工具。随着人类进入信息化时代,用计算机处理语音信息成为一种趋势。语音信号处理技术在基于语音的信息检索、语音识别、语种识别、说话人识别,以及基于语音的情感处理等方面都有广泛的应用前景。wav音频波形格式的文件是常用的一种语音文件格式,语音信号处理可以是频域的,也可以是时域的,语音信号滤波可以在时域实现,也可以在频域实现。
-
-
陈春凤;
王忆勤;
徐琎;
颜建军
-
-
摘要:
目的:运用现代声学技术,采集和分析肺系疾病患者的声音信号,为肺系疾病的中医辨证提供一定的声诊客观数据。方法:运用“中医闻诊采集系统”采集肺系疾病患者声音样本342例,其中原发性支气管癌79例、慢性支气管炎119例、支气管哮喘144例,另选上海中医药大学在校健康师生102名为正常对照组。运用小波包分析技术对信号分析处理,提取各组样本信号的小波包能量和Shannon熵值特征,通过独立变量非参数检验方法对各组样本的小波包特征参数进行检验,并运用这两种特征进行中医病证的分类识别研究。结果:多个时域频段的小波包能量特征值及Shannon熵值特征差异均有统计学意义(P<0.05),总熵值比较,正常对照组总熵值均低于患病各组。运用本研究得到的小波包能量和Shannon熵值两种特征,分别采用支持向量机和BP(back propagation)神经网络两种方法,对肺系不同证型样本进行分类识别,分类识别准确率分别为83.67%和71.95%。结论:肺系不同病证患者的语音信号特征存在差异,小波包能量和Shannon熵值特征能初步区分肺系常见病证的语音特征,辅助肺系常见病证的临床诊断和辨证;运用支持向量机和小波包能量、Shannon熵值特征进行肺系病证的分类识别,有较好的效果,为中医声诊的分类识别提供新的思路。
-
-
罗海涛
-
-
摘要:
数字语音处理是采用数字化的方法,对语音的传送、存储、识别、编码等进行数字化处理,涉及多个学科,广泛应用于数字通信、语言学习、自动翻译、人工智能等多个领域。滤波器在数字信号处理中发挥着重要作用。设计一个低通滤波器,对语音信号进行滤波,以获得语音信号的低频分量。
-
-
谢芳;
陆文骏
-
-
摘要:
含噪语音信号处理是指结合数字信号处理技术对含噪语音信号进行降噪处理。利用MATLAB软件对采集到的语音信号进行时域、频域分析,模拟产生噪声信号加到语音信号中,仿真分析得到含噪声语音信号的时域、频域波形图。文章综合运用数字信号处理技术设计低通滤波器对含噪语音信号降噪处理,并仿真产生滤波后的时域、频域波形图,对比分析完成含噪语音信号的降噪处理。
-
-
罗海涛
-
-
摘要:
语言是人类交流的便捷工具。通过传感器把语音转换为电信号,再经过离散采样、量化等处理,得到离散的采样数据。这些采样数据适合用计算机进行存储、传输、编码、增强等处理。语音信号处理是一门跨学科的新兴学科。语谱图又称为语音声纹,是语音信号的时域和频域信息结合的图像。
-
-
余华;
童馨
-
-
摘要:
提出一种基于粒子群优化算法的支持向量机网络,并把它应用到语音情感识别系统中。依据情感的维度空间模型,研究分析情感语音数据的韵律特征与音质特征。利用粒子群优化算法(PSO)训练网络的超参数以优化支持向量机模型,可快速地实现网络的收敛。最后在实验中比较线性核函数SVM、径向基核函数SVM与粒子群优化径向基SVM分别用于语音情感识别的识别率,结果显示粒子群优化径向基核SVM模型用于语音情感识别能获得明显的识别性能的提升。
-
-
-
-
HUANG Liang;
黄亮;
PAN Ping;
潘平;
ZHOU Chao;
周超
- 《第十七届中国Rough集与软计算学术会议、第十一届中国Web智能学术研讨会、第十一届中国粒计算研讨会及第五届三支决策学术会议联合会议 (CRSSC-CWI-CGrC-3WD 2017)》
| 2017年
-
摘要:
针对语音信号的非结构化特点,提出了一种基于量子隧穿效应的说话人真伪鉴别方法.以量子隧穿效应为理论依据,首先,在分析语音信号分帧的量子特性基础上,将每一帧语音信号看作一个量子态,实现算法的量子化;然后,利用势垒能分离能量的特性,通过构建势垒组以提取信号的能量谱特征,并以此作为特征参数;最后,通过高斯混合模型(GMM)进行语音信号建模,完成说话人的真伪鉴别.仿真结果表明,相对于传统方法,利用量子隧穿效应理论实现说话人鉴别可以有效降低算法的复杂度,提高识别的识别率和可靠性,为量子信息理论和说话人真伪鉴别方法提供了新的研究途径.
-
-
-
-
李军锋
- 《2016年声频工程学术交流年会》
| 2016年
-
摘要:
真实环境下的噪声和混响等干扰都严重影响了语音信号的质量和可懂度,降低了后继语音应用系统的性能.为了解决这一问题,自上世纪60年代以来,科研人员研发了大量的语音增强方法.根据使用麦克风个数的不同,语音增强技术大致可以分为单通道语音增强技术、多通道语音增强技术和双耳语音增强技术,经过几十年的研究,语音增强技术取得了许多重要进展并在很多应用中得到实际应用,并且应用场景更加真实,传声器阵列结构走向更加立体,同时也遇到了大数据时代所带来的挑战。
-
-
-
ZHANG Yan;
张燕;
XIAO Dong;
肖东;
MO Fuyuan;
莫福源;
GUO Shengming;
郭圣明
- 《2016年声频工程学术交流年会》
| 2016年
-
摘要:
中远距离水声通信时,由于受到各种不利因素的影响,如多途扩展等,导致传输速率较低.因此在中远距离水声语音通信时需要对语音信号进行压缩处理.考虑到语音信号存在一定的冗余,本文提出了一种语音预压缩方法.在保留说话人特征的前提下,通过语音段划分提取语音段并删除静音段,通过稳态浊音段检测删除冗余部分,最终实现语音的预压缩.通过实验对比了预压缩参数,将入耳比较容易接受的设定为最佳参数.最佳参数的预压缩结果表明:提出的语音预压缩算法具有一定的稳定性、通用性和灵活性,并且不影响语义的理解和说话人的听辨,语音压缩率基本上都在80%左右.
-
-
-
SONG Peng;
宋鹏;
ZHENG Wenming;
郑文明;
ZHAO Li;
赵力
- 《第十四届全国人机语音通讯学术会议》
| 2017年
-
摘要:
传统语音情感识别主要基于单一情感数据库进行训练与测试.而实际情况中,训练语句和测试语句往往来源于不同的数据库,识别率将显著下降.为了解决这一问题,提出了一种基于子空间学习和特征选择融合的语音情感识别方法.通过采用回归方法来学习特征的子空间表示;同时,引入l2,1-范数用于特征的选择;并引入最大均值差异(Maximum mean discrepancy,MMD)来减少不同情感数据库间的特征差异,对它们进行联合优化求解从而提取较为鲁棒的情感特征表示.在EMO-DB和eNTERFACE两个公开情感数据库上进行实验评价,结果表明:所提出的方法在跨库条件下具有较好的性能,相比其它经典的迁移学习方法更加鲁棒高效.