...
首页> 外文期刊>電子情報通信学会論文誌, D. 情報·システム >大規模映像資源のためのマルチモーダル高次特徴検出
【24h】

大規模映像資源のためのマルチモーダル高次特徴検出

机译:大型视频资源的多模式高阶特征检测

获取原文
获取原文并翻译 | 示例
           

摘要

本研究では,映像の中から「飛行機」や「歌っている人」といった高次特徴を検出するタスクに対し,SIFT特徴とMFCC特徴の混合ガウス分布(GMM)を用いた統計的手法を提案する。検出手法には,話者認識などで用いられてきたゆうIX比による検出と,GMM Supervector SVM (GS-SVM)による検出の二つを用いる.ゆう度比による検出では,高次特徴が出現する部分としない部分のGMMをそれぞれ学習し,二つのモデルから得られるゆう度の比をもとに高次特徴を検出する。GS-SVMでは,各ショットに対するGMMを求め,GMM間の距離から定義されるRBFカーネルを用いたSVMで学習識別を行う.最後に,各手法から対数ゅう度比を求め,その重み付き和により手法の融合を行う.TRECVID2009のデータセットを用いて評価実験を行った結果,Me an Ave rag e P re c is io nはSIFT特徴とG S-SVM を用いた場合の0. 14 1から,融合手法により0.173まで向上した.
机译:在这项研究中,任务是从图像中检测诸如“平面”和“歌唱人”的高层功能我们提出了一种使用混合高斯分布(GMM)的SIFT功能和MFCC功能的统计方法。发现方法是一个扬声器用于通过在识别等中使用的IX比率检测,并通过GMM监控器SVM(GS-SVM)检测有。在测量比率的检测中,分别出现高阶特征的部分的GMM出现,两个根据从戴尔获得的延迟的比率接触高阶功能。 GS-SVM会为每个镜头寻求GMM,使用从GMM之间的距离定义的RBF内核使用SVM执行学习识别。最后,来自每种方法确定比率,并且加权方法由加权和执行。使用TRECVID 2009数据集进行评估实验由于导通,我通过融合方法使用SIFT特征和G S-SVM时,AVE RAG E P RE C是IO N为10.14 1提高了0.173。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号