公开/公告号CN114928764A
专利类型发明专利
公开/公告日2022-08-19
原文格式PDF
申请/专利权人 广州阿凡提电子科技有限公司;
申请/专利号CN202210383270.X
发明设计人 张征;
申请日2022-04-12
分类号H04N21/44(2011.01);H04N21/439(2011.01);G10L15/22(2006.01);
代理机构北京深川专利代理事务所(普通合伙) 16058;
代理人李焕焕
地址 510000 广东省广州市海珠区新港西路135号大院园西区705号楼中大科技园B座自编号13141315室
入库时间 2023-06-19 16:25:24
法律状态公告日
法律状态信息
法律状态
2022-09-06
实质审查的生效 IPC(主分类):H04N21/44 专利申请号:202210383270X 申请日:20220412
实质审查的生效
技术领域
本发明属于视频判断处理技术领域,具体地说,涉及一种原创短视频AI智能化检测方法、系统及装置。
背景技术
目前,现在越来越多用户通过在各媒体渠道平台发布短视频来作为引流的方式,其中短视频渠道平台作为主流平台,本身设置了视频原创性检查机制,但是该机制是通用规则下的机制,并非针对汽车垂直类领域的检测机制;现汽车厂家设置KPI给经销商,但存在部分经销商通过合成平台视频片段为新视频,甚至直接搬运其他原创作者的视频,通过非原创视频来应对考核KPI,目前的短视频原创判定通常是通过审核员人工逐一审核排查的鉴别处理方式实现,导致短视频原创判定的效率较低,对于视频审核人员而言,不但需要耗费较大的时间和精力来审核每个视频的内容,而且还有可能出现审核错误的情况。
因此需要一种基于汽车垂直类的短视频原创性检测工具对短视频的原创性进行判定,可以满足厂家个性化的考核需求。
发明内容
1、要解决的问题
针对现有短视频人工审核会耗费较大的时间还容易审核错误的问题,本发明提供一种原创短视频AI智能化检测方法、系统及装置。
2、技术方案
为解决上述问题,本发明采用如下的技术方案。
一种原创短视频AI智能化检测方法,采用以下步骤:
步骤1:建立数据库,获取多个视频素材并保存进数据库内;
步骤2:对步骤1获取的视频素材进行分析,获取每个视频素材的标签;
步骤3:对步骤1获取的视频素材进行视频信息抽取,获取视频素材信息;
步骤4:将步骤3获取的视频素材信息结合步骤2获取的视频素材标签保存至视频素材库中;
步骤5:建立检测队列,获取待检测视频并将其导入检测队列;
步骤6:检测队列按顺序将待检测视频导出,对导出的待检测视频进行分析和视频信息抽取,获取待检测视频标签和待检测视频信息;
步骤7:将步骤6获取的待检测视频标签与视频素材库内保存的视频素材标签进行匹配,将匹配的视频素材标签与其对应的视频素材信息与待检测视频信息进行比对,获取比对结果;
步骤8:预设相似阈值,将步骤7获取的比对结果与预设相似阈值比较,大于和等于预设相似阈值的比对结果为非原创结果,小于预设相似阈值的比对结果为原创结果。
为了获取大量的视频素材,优选地,所述步骤1中获取多个视频素材是从第三方媒体渠道平台采集的视频素材。
为了对视频素材做出准确分类标签,优选地,所述步骤2中获取视频素材的标签是结合渠道平台热点规则、视频粉赞评比例规则和声量线索规则对视频做出分类标签。
为了让视频信息更加详细准确,优选地,所述步骤3中视频素材信息包括文本信息和图片信息。
为了进行准确的比对,进一步地,所述文本信息是通过抽取视频的语音,采用矢量量化法将语音转换为语音文本。
为了减小视频存储空间,同时获取视频关键帧,进一步地,所述图片信息是抽取视频中的IPB帧,将IPB帧转换图片信息。
为了减轻系统运行压力,优选地,所述步骤1中获取视频素材,步骤2中分析视频素材,步骤3中抽取视频信息均使用预设时间,三个操作步骤分步进行,按照预设时间进行循环重复操作。
为了增加视频素材库的内容,优选地,所述步骤8中对比对结果进行判断,若是待检测视频为原创视频,会将该视频保存至数据库内,将该视频的标签和视频信息保存至视频素材库。
一种原创短视频AI智能化检测系统,包括:
视频获取模块,用于从第三方媒体平台获取视频素材;
数据存储模块,用于保存获取的视频素材和数据;
标签分析模块,用于对视频进行分析,获取视频素材的视频标签;
文本生成模块,用于抽取视频语音,将视频语音转换为字幕文本;
图像生成模块,用于抽取视频IPB帧,将其转换为图片数据;
标签搜索模块,用于根据待检测视频的标签寻找到与其标签相匹配的视频素材;
判断比较模块,用于将待检测视频的字幕文本和图片数据与视频素材的字幕文本和图片数据进行比较,对待检测视频做出判断。
一种原创短视频AI智能化检测装置,所述装置包括服务处理器和分布存储器,所述服务处理器连接所述存储器,所述分布存储器中存储有服务自管理程序,配置用于存储机器可读指令,所述服务处理器执行所述服务自管理程序,指令在由所述处理器执行时,以实现如上所述的原创短视频AI智能化检测方法。
一种原创短视频AI智能化检测方法、系统及装置,通过采集第三方媒体平台获取视频素材,对视频素材进行分析,获取视频素材标签,抽取视频素材语音,将视频素材语音转换为字幕文本,抽取视频素材IPB帧,获取视频素材图片信息,同时对待检测视频也进行进行分析,获取待检测视频标签,抽取待检测视频语音,获取字幕文本,抽取待检测视频IPB帧,获取待检测视频图片信息,按照待检测视频的标签进行搜索,得到与其相匹配的视频素材,再将该视频素材与待检测视频的文本信息和图片信息进行比对,将比对结果与预设阈值比对,达到要求的则为原创视频,未达到要求的为非原创视频。
3、有益效果
相比于现有技术,本发明的有益效果为:
(1)本发明对视频素材和待检测视频进行标签提取,文本信息和IPB帧抽取,按照待检测视频标签搜索与待检测视频匹配的视频素材,可以不用与数据库内所有的视频素材数据进行匹配对比,减少系统运行时的资源消耗;
(2)本发明通过对视频的语音进行抽取,将语音转换为文本信息,对视频进行IPB帧抽取,达到视频关键帧的图片信息,通过文本比对和图片相似度比对,可以得出待检测视频与视频素材之间的相似度,让对视频原创的比对结果更加准确;
(3)本发明在对待检测视频进行比对后,会将属于原创视频的待检测视频也导入数据库和视频素材库内,以此增加数据库和视频素材库的视频量,会随着数据库和视频素材库内视频量,让比对结果的准确性逐步提高。
附图说明
为了更清楚地说明本申请实施例或示例性中的技术方案,下面将对实施例或示例性描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以按照这些附图示出的获得其他的附图。
图1为本发明的步骤示意图;
图2为本发明的流程示意图;
图3为本发明的系统结构示意图;
图4为本发明的设备结构示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例,通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例,基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
实施例1
如图1所示,一种原创短视频AI智能化检测方法,具体流程如下:
建立数据库,从第三方媒体渠道平台采集视频素材,将获取的多个视频素材保存进数据库内,第三方媒体渠道平台可以是抖音、快手、懂车帝等多个媒体平台,视频素材主要为汽车垂直类。
对获取的视频素材进行分析,结合渠道平台热点规则、视频粉赞评比例规则和声量线索规则对视频做出分类标签,获取每个视频素材的标签,不仅仅局限于渠道平台本身对视频的热门定义判断,给视频打上标签,用于被检测短视频能快速筛选匹配出非原创性短视频的作用。
对获取的视频素材进行视频信息抽取,获取视频素材信息,视频素材信息包括文本信息和图片信息,文本信息是通过抽取视频的语音,采用阿里云AI智能音频文件解析算法将语音转换为语音文本,主要基于AI智能化技术通过语音转字幕,图片信息是使用ffmpeg工具,抽取视频中的IPB帧,将IPB帧转换图片信息,每一帧图片都可以通过百度图像识别技术识别出曝光率、是否有人,是否有车等侦查值,将获取的视频素材信息结合获取的视频素材标签保存至视频素材库中。
获取视频素材,分析视频素材,抽取视频信息均使用预设时间,三个操作步骤分步进行,按照预设时间进行循环重复操作,由于采集、分析、打标、抽取都需要耗费大量服务器资源以及较高性能配置,故执行动作三个子流程拆分三个时间段执行,每周更新频率一般控制在一到两次较合适。
建立检测队列,获取待检测视频并将其导入检测队列,检测队列按顺序将待检测视频导出,对导出的待检测视频进行分析,获取待检测视频标签,对导出的待检测视频进行视频信息抽取,获取待检测视频信息,待检测视频信息包括文本信息和图片信息,文本信息通过阿里云AI智能音频文件解析算法将语音转换为语音文本,图片信息是使用ffmpeg工具,抽取视频中的IPB帧,将IPB帧转换图片信息。
将获取的待检测视频标签与视频素材库内保存的视频素材标签进行匹配,将匹配的视频素材标签与其对应的视频素材信息与待检测视频信息进行比对,将待检测视频的文本内容和图片信息与视频素材库中视频素材的文本内容和图片信息进行匹配,获取比对结果。
预设相似阈值,将获取的比对结果与预设相似阈值比较,大于和等于预设相似阈值的比对结果为非原创结果,小于预设相似阈值的比对结果为原创结果,每次检测结果信息都会保存到数据库,若是待检测视频为原创视频,会将该视频保存至数据库内,将该视频的标签和视频信息保存至视频素材库。
在前期视频素材库中的视频素材数据比较少的时候,可以通过通过对视频进行分类、抽样和人工审核的方式对视频进行原创性判断,提高在视频素材数据不足情况下的准确性。
通过上述描述可知,在本实例中,采集第三方媒体平台获取视频素材,对视频素材进行分析,获取视频素材标签,抽取视频素材语音,将视频素材语音转换为字幕文本,抽取视频素材IPB帧,获取视频素材图片信息,同时对待检测视频也进行进行分析,获取待检测视频标签,抽取待检测视频语音,获取字幕文本,抽取待检测视频IPB帧,获取待检测视频图片信息,按照待检测视频的标签进行搜索,得到与其相匹配的视频素材,再将该视频素材与待检测视频的文本信息和图片信息进行比对,将比对结果与预设阈值比对,达到要求的则为原创视频。
实施例2
如图2所示,一种原创短视频AI智能化检测系统,包括:
视频获取模块,用于从第三方媒体平台获取视频素材;
数据存储模块,用于保存获取的视频素材和数据;
标签分析模块,用于对视频进行分析,获取视频素材的视频标签;
文本生成模块,用于抽取视频语音,将视频语音转换为字幕文本;
图像生成模块,用于抽取视频IPB帧,将其转换为图片数据;
标签搜索模块,用于根据待检测视频的标签寻找到与其标签相匹配的视频素材;
判断比较模块,用于将待检测视频的字幕文本和图片数据与视频素材的字幕文本和图片数据进行比较,对待检测视频做出判断。
通过上述描述可知,在本实例中,通过视频获取模块采集第三方媒体平台获取视频素材,标签分析模块获取视频素材和待检测视频的标签,文本生成模块提取视频素材和待检测视频文本信息,图像生成模块抽取视频素材和待检测视频的视频素材IPB帧,获取图片信息,标签搜索模块根据待检测视频的标签寻找到与其标签相匹配的视频素材,判断比较模块将待检测视频的文本信息和图片信息与视频素材的文本信息和图片信息进行比较,最终得出待检测视频是否为原创视频。
实施例3
如图3所示,一种原创短视频AI智能化检测装置,所述装置包括服务处理器和分布存储器,所述服务处理器连接所述存储器,所述分布存储器中存储有服务自管理程序,配置用于存储机器可读指令,所述服务处理器执行所述服务自管理程序,指令在由所述处理器执行时,以实现如实施例1所述的原创短视频AI智能化检测方法。
通过上述描述可知,在本实例中,采集第三方媒体平台获取视频素材,对视频素材进行分析,获取视频素材标签,抽取视频素材语音,将视频素材语音转换为字幕文本,抽取视频素材IPB帧,获取视频素材图片信息,同时对待检测视频也进行进行分析,获取待检测视频标签,抽取待检测视频语音,获取字幕文本,抽取待检测视频IPB帧,获取待检测视频图片信息,按照待检测视频的标签进行搜索,得到与其相匹配的视频素材,再将该视频素材与待检测视频的文本信息和图片信息进行比对,将比对结果与预设阈值比对,达到要求的则为原创视频。
以上所述实施例仅表达了本发明的优选实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形、改进及替代,这些都属于本发明的保护范围。
机译: 一种用于在具有多元振幅分布的元素场中检测振幅阶跃的方法,一种用于执行这种方法的装置以及一种包括这种装置的视频系统
机译: 用于压缩和解压缩彩色数字视频数据的视频电信系统和方法技术领域本发明涉及一种用于压缩电信系统视频中数字彩色视频数据的方法,该方法具有用于生成视频信号的装置,该装置是用于生成视频信号的装置。将视频信号转换为多个彩色视频帧速率,每个帧图像由多个扫描线组成,扫描线由多个像素组成,图像中的每个像素由彩色数字分量组成(该方法包括确定功能的步骤);基于彩色数字(b)的三个分量中的至少一个的亮度像素,基于两个像素之间的亮度差异,针对当前图像表的扫描线中的至少大部分像素,确定至少一个参数决策。与每条扫描线中至少一个像素相距预定距离的像素,以及至少(c)比较决策参数与
机译: 用于在视频帧中聚合特征的系统和方法,提高AI检测算法的精度