基于SIFT的说话人唇动识别

马新军; 吴晨晨; 仲乾元; 李园园

首页> 中文期刊> 《计算机应用》 >基于SIFT的说话人唇动识别

基于SIFT的说话人唇动识别

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

Aiming at the problem that the lip feature dimension is too high and sensitive to the scale space,a technique based on the Scale-Invariant Feature Transform (SIFT) algorithm was proposed to carry out the speaker authentication.Firstly,a simple video frame image neat algorithm was proposed to adjust the length of the lip video to the same length,and the representative lip motion pictures were extracted.Then,a new algorithm based on key points of SIFT was proposed to extract the texture and motion features.After the integration of Principal Component Analysis (PCA) algorithm,the typical lip motion features were obtained for authentication.Finally,a simple classification algorithm was presented according to the obtained features.The experimental results show that compared to the common Local Binary Pattern (LBP) feature and the Histogram of Oriental Gradient (HOG) feature,the False Acceptance Rate (FAR) and False Rejection Rate (FRR) of the proposed feature extraction algorithm are better,which proves that the whole speaker lip motion recognition algorithm is effective and can get the ideal results.%针对唇部特征提取维度过高以及对尺度空间敏感的问题,提出了一种基于尺度不变特征变换(SIFT)算法作特征提取来进行说话人身份认证的技术.首先,提出了一种简单的视频帧图片规整算法,将不同长度的唇动视频规整到同一的长度,提取出具有代表性的唇动图片;然后,提出一种在SIFT关键点的基础上,进行纹理和运动特征的提取算法,并经过主成分分析(PCA)算法的整合,最终得到具有代表性的唇动特征进行认证;最后,根据所得到的特征,提出了一种简单的分类算法.实验结果显示,和常见的局部二元模式(LBP)特征和方向梯度直方图(HOG)特征相比较,该特征提取算法的错误接受率(FAR)和错误拒绝率(FRR)表现更佳.说明整个说话人唇动特征识别算法是有效的,能够得到较为理想的结果.

著录项

来源
《计算机应用》 |2017年第9期|2694-2699|共6页
作者
马新军; 吴晨晨; 仲乾元; 李园园;
展开▼
作者单位

哈尔滨工业大学(深圳)机电工程与自动化学院;

广东深圳518055;

哈尔滨工业大学(深圳)机电工程与自动化学院;

广东深圳518055;

哈尔滨工业大学(深圳)机电工程与自动化学院;

广东深圳518055;

哈尔滨工业大学(深圳)机电工程与自动化学院;

广东深圳518055;

展开▼
原文格式 PDF
正文语种 chi
中图分类 TP391.41;
关键词
唇部特征; 尺度不变特征变换; 特征提取; 说话人识别;

相似文献

中文文献
外文文献
专利

1. 基于唇动的说话人识别技术 [J] . 刘庆辉 ,姚鸿勋 . 计算机工程与应用 . 2006,第012期
2. 用于说话人识别的实时唇线提取方法 [J] . 周晔 ,刘万春 ,朱玉文 . 计算机工程 . 2006,第005期
3. 基于说话人特有特征集的GMM和i-矢量方法的说话人识别 [J] . 沈思秋 ,吕勇 ,杨芸 . 电子设计工程 . 2014,第023期
4. 基于说话人模型聚类的说话人识别 [J] . 熊华乔 ,郑建彬 ,詹恩奇 . 计算机工程与应用 . 2014,第002期
5. 基于说话人分类技术的分级说话人识别研究 [J] . 刘文举 ,孙兵 ,钟秋海 . 电子学报 . 2005,第007期
6. 基于SIFT的说话人唇动识别 [C] . MA Xinjun ,马新军 ,WU Chenchen . 第十七届中国Rough集与软计算学术会议、第十一届中国Web智能学术研讨会、第十一届中国粒计算研讨会及第五届三支决策学术会议联合会议（CRSSC-CWI-CGrC-3WD 2017） . 2017
7. 基于GMM说话人分类的说话人识别系统研究 [A] . 李圆 . 2007

基于SIFT的说话人唇动识别

摘要

著录项

相似文献

相关主题

期刊订阅