要解决的问题:提供一种在视频图像中高精度提取有意义的场景间隔的技术。
解决方案:脚本文本间隔获取装置13读取视频图像的脚本数据以获取脚本文本间隔,并且视频文本间隔生成装置14对从字幕信息和语音信息获得的测试数据进行有意义的关系阈值处理。在输入视频间隔中生成视频文本间隔。文本相似度计算装置15计算每个视频文本间隔的文本信息和每个脚本文本间隔的文本信息,并且文本交叉引用装置16基于相似度确认对应于视频文本间隔的脚本文本间隔。递归处理控制装置17修改阈值,直到获得交叉引用以重复上述处理,然后视频文本间隔合并装置18合并多个视频文本间隔,其中相应的脚本文本间隔在时间上与每个相邻的视频文本间隔中其他相同的是一个视频文本间隔。
版权:(C)2005,JPO&NCIPI
公开/公告号JP4109185B2
专利类型
公开/公告日2008-07-02
原文格式PDF
申请/专利权人 日本電信電話株式会社;
申请/专利号JP20030401171
申请日2003-12-01
分类号H04N5/222;G06F17/30;
国家 JP
入库时间 2022-08-21 20:19:13