首页> 中文期刊> 《智能计算机与应用》 >基于多尺度时长音频特征的暴力音频事件检测

基于多尺度时长音频特征的暴力音频事件检测

         

摘要

暴力镜头检测是近年来的研究热点之一.早期的暴力镜头检测主要依赖视频特征,由于音频信息具有良好的稳定性和在不同文化和人群之间的一致性,现在人们越来越多地关注音频信息的使用.为此研究使用音频特征对电影镜头中的暴力音频事件进行检测.为此提出了一种基于多尺度时长的特征提取方法.提取了除MFCC、LPC、能量等短时特征以外,还提取了能量均值方差、子带能量均值和方差、帧间差分等长时特征.暴力镜头中出现较多且具有代表性的音频事件有爆炸、尖叫、枪击三种.本文以电影的镜头为识别单位,使用支持向量机分类算法实现了一个检测系统.通过在15部好莱坞电影上的实验,表明本文基于多尺度时长的音频特征在暴力音频事件检测工作中,能够取得较好的结果.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号