首页> 中国专利> 国籍信息智能识别系统

国籍信息智能识别系统

页面导航

摘要
著录项
法律信息
说明书
相似文献

摘要

本发明涉及一种国籍信息智能识别系统，包括：触摸屏，与音频编辑器和视频编辑器连接，用于为用户对音频编辑器的编辑和视频编辑器的编辑提供用户访问接口；音频编辑器，用于接收待编辑的音频数据，从所述待编辑的音频数据中提取出片头音频片段，所述待编辑的音频数据与所述待编辑的视频数据归属于同一影片；视频编辑器，用于接收待编辑的视频数据，从所述待编辑的视频数据中提取出多个片头图像，其中，所述视频编辑器的提取的多个片头图像的多个时间戳保持等间距时间间隔。通过本发明，以较少的运算量完成了复杂的图像场景辨识。

著录项

公开/公告号CN109309864A

专利类型发明专利
公开/公告日2019-02-05

原文格式PDF
申请/专利权人周群;
展开▼

申请/专利号CN201810895069.3
发明设计人周群;
展开▼

申请日2018-08-08
分类号
代理机构
代理人
地址 223600 江苏省宿迁市沭阳县经济开发区天能路7号
入库时间 2024-02-19 06:44:48

法律信息

法律状态公告日

法律状态信息

法律状态
2019-06-07

授权

授权
2019-05-28

专利申请权的转移 IPC(主分类):H04N21/439 登记生效日:20190507 变更前: 变更后: 申请日:20180808

专利申请权、专利权的转移
2019-03-05

实质审查的生效 IPC(主分类):H04N21/439 申请日:20180808

实质审查的生效
2019-02-05

公开

公开

说明书

技术领域

本发明涉及多媒体数据处理领域，尤其涉及一种国籍信息智能识别系统。

背景技术

音视频编辑是将图片、背景音乐、视频等素材经过编辑后，生成视频的工具，除了简单的将各种素材合成视频，音视频编辑通常还具有添加转场特效、MTV字幕特效、添加文字注释的功能，因此，音视频编辑也属于多媒体视频编辑的范畴。

音视频编辑其实是对图片、视频、音频等素材进行重组编码工作的多媒体软件。重组编码是将图片、视频、音频等素材进行线性编辑后，根据视频编码规范进行重新编码，转换成新的格式，比如VCD、DVD格式，这样图片、视频、音频无法被重新提取出来，因为已经转化为新的视频格式，发生质的变化。

发明内容

为了解决现有技术中图像场景所在国籍不易辨认的技术问题，本发明提供了一种国籍信息智能识别系统。

为此，本发明需要以下四处重要发明点：

(1)在影片的后续处理中，对片头音频片段和片头视频内容分别对应的国籍信息进行一致性分析，以判断是否错配不同语言的音频文件；

(2)在对片头视频内容的国籍信息提取中，采用了高精度的定制图像处理机制；

(3)通过对待处理图像中的目标的提取和分析，判断待处理图像中的轮廓像素点总数，以在所述待处理图像中的轮廓像素点过多时，避免使用对轮廓滤波效果不佳的滤波器，而选用空域平滑滤波模式；

(4)在所述待处理图像中的轮廓像素点不多时，选择使用抑制低频效果更佳的精细滤波模式。

根据本发明的一方面，提供了一种国籍信息智能识别系统，所述系统包括：

触摸屏，与音频编辑器和视频编辑器连接，用于为用户对音频编辑器的编辑和视频编辑器的编辑提供用户访问接口；音频编辑器，用于接收待编辑的音频数据，从所述待编辑的音频数据中提取出片头音频片段，所述待编辑的音频数据与所述待编辑的视频数据归属于同一影片；视频编辑器，用于接收待编辑的视频数据，从所述待编辑的视频数据中提取出多个片头图像，其中，所述视频编辑器的提取的多个片头图像的多个时间戳保持等间距时间间隔。

更具体地，在所述国籍信息智能识别系统中，还包括：

时间设定设备，与所述视频编辑器连接，用于设定所述视频编辑器的提取的多个片头图像的多个时间戳之间的等间距时间间隔；重复度鉴定设备，与所述视频编辑器连接，用于接收所述多个片头图像，鉴定每一个片头图像的场景，将具有重复场景的片头图像划为一组，以获得多组片头图像，将每一组片头图像中熵值最低的图像作为目标图像，以输出多组片头图像分别对应的多个目标图像。

更具体地，在所述国籍信息智能识别系统中，还包括：

目标提取设备，与所述重复度鉴定设备连接，用于接收所述目标图像，对所述目标图像中的各个目标进行提取，以获得对应的各个目标子图像，每一个目标子图像只包括组成相应目标的各个像素点，基于每一个目标子图像确定组成其对应目标的轮廓的各个轮廓像素点。

更具体地，在所述国籍信息智能识别系统中，还包括：

轮廓分析设备，与所述目标提取设备连接，用于接收所述目标图像中每一个目标子图像对应的各个轮廓像素点，累计所述目标图像中各个目标子图像对应的各个轮廓像素点以获得轮廓点总数，并输出所述轮廓点总数；滤波触发设备，与所述轮廓分析设备连接，用于接收所述轮廓点总数，并在所述轮廓点总数未超过预设点数阈值时，发出第一触发信号，以及在所述轮廓点总数超过预设点数阈值时，发出第二触发信号；复合处理设备，分别与所述滤波触发设备和所述目标提取设备连接，包括对数运算单元、傅里叶变换单元、高通滤波单元、傅里叶逆变换单元和指数运算单元，用于在所述第一处理设备接收到所述第一触发信号时，对所述目标图像依次执行对数运算、傅里叶变换、高通滤波、傅里叶逆变换和指数运算，以获得并输出与所述目标图像对应的信号转换图像；单一处理设备，分别与所述滤波触发设备和所述目标提取设备连接，用于在接收到所述第一触发信号时，对所述目标图像执行空域平滑滤波处理，以获得与所述目标图像对应的信号转换图像；电源管理设备，分别与所述复合处理设备和所述单一处理设备连接，用于在所述复合处理设备或所述单一处理设备进入省电模式时，控制对所述复合处理设备或所述单一处理设备的电量供应；国籍判断设备，与所述单一处理设备连接，用于接收每一个信号转换图像，对每一个信号转换图像执行以下操作：将所述信号转换图像中景深最浅的演员所在区域从所述信号转换图像中分割出来，基于各国标准人体轮廓判断与所述信号转换图像中景深最浅的演员所在区域的轮廓最符合的标题人体轮廓所对应的国籍以作为所述信号转换图像对应的国籍；国籍统计设备，与所述国籍判断设备连接，用于接收各个信号转换图像分别对应的各个国籍，基于所述各个国籍判断待编辑的视频数据对应的视频国籍类别；一致性分析设备，分别与所述国籍统计设备和所述音频编辑器连接，用于对片头音频片段进行成分分析，以确定所述片头音频片段中的音乐的归属国籍，对所述片头音频片段中的音乐的归属国籍与所述待编辑的视频数据对应的视频国籍类别进行一致性分析，以获得相应的分析结果；其中，在所述国籍统计设备中，基于所述各个国籍判断待编辑的视频数据对应的视频国籍类别包括：将所述各个国籍中出现频率最高的国籍作为待编辑的视频数据对应的视频国籍类别。

更具体地，在所述国籍信息智能识别系统中：在所述复合处理设备中，所述傅里叶变换单元分别与所述对数运算单元和所述高通滤波单元连接，所述傅里叶逆变换单元与所述高通滤波单元连接，所述指数运算单元与所述傅里叶逆变换单元连接。

更具体地，在所述国籍信息智能识别系统中：所述复合处理设备在接收到所述第二触发信号时，从工作模式切换到省电模式。

更具体地，在所述国籍信息智能识别系统中：所述单一处理设备在接收到所述第一触发信号时，从工作模式切换到省电模式。

更具体地，在所述国籍信息智能识别系统中：在所述一致性分析设备中，当所述分析结果超过限量时，发出国籍对应指令，否则，发出国籍错位指令。

附图说明

以下将结合附图对本发明的实施方案进行描述，其中：

图1为根据本发明实施方案示出的国籍信息智能识别系统的视频编辑器从待编辑的视频数据中提取的多个片头图像。

具体实施方式

下面将参照附图对本发明的国籍信息智能识别系统的实施方案进行详细说明。

音视频编辑的重要技术特征在于，除了具有图片转视频的技术，优秀专业的音视频编辑，还需具有为原始图片添加各种多媒体素材，实现制作出的视频图文并茂的展示，譬如，为图片配音乐，添加MTV字幕效果，各种相片过渡转场特效等等，这些都是优秀的音视频编辑必须具有的显著特征。

为了克服上述不足，本发明搭建了一种国籍信息智能识别系统，能够有效解决相应的技术问题。

图1为根据本发明实施方案示出的国籍信息智能识别系统的视频编辑器从待编辑的视频数据中提取的多个片头图像。多个片头图像在时间轴上连续。

根据本发明实施方案示出的国籍信息智能识别系统包括：

触摸屏，与音频编辑器和视频编辑器连接，用于为用户对音频编辑器的编辑和视频编辑器的编辑提供用户访问接口；

音频编辑器，用于接收待编辑的音频数据，从所述待编辑的音频数据中提取出片头音频片段，所述待编辑的音频数据与所述待编辑的视频数据归属于同一影片；

视频编辑器，用于接收待编辑的视频数据，从所述待编辑的视频数据中提取出多个片头图像，其中，所述视频编辑器的提取的多个片头图像的多个时间戳保持等间距时间间隔。

接着，继续对本发明的国籍信息智能识别系统的具体结构进行进一步的说明。

在所述国籍信息智能识别系统中，还包括：

时间设定设备，与所述视频编辑器连接，用于设定所述视频编辑器的提取的多个片头图像的多个时间戳之间的等间距时间间隔；

重复度鉴定设备，与所述视频编辑器连接，用于接收所述多个片头图像，鉴定每一个片头图像的场景，将具有重复场景的片头图像划为一组，以获得多组片头图像，将每一组片头图像中熵值最低的图像作为目标图像，以输出多组片头图像分别对应的多个目标图像。

在所述国籍信息智能识别系统中，还包括：

轮廓分析设备，与所述目标提取设备连接，用于接收所述目标图像中每一个目标子图像对应的各个轮廓像素点，累计所述目标图像中各个目标子图像对应的各个轮廓像素点以获得轮廓点总数，并输出所述轮廓点总数；

滤波触发设备，与所述轮廓分析设备连接，用于接收所述轮廓点总数，并在所述轮廓点总数未超过预设点数阈值时，发出第一触发信号，以及在所述轮廓点总数超过预设点数阈值时，发出第二触发信号；

复合处理设备，分别与所述滤波触发设备和所述目标提取设备连接，包括对数运算单元、傅里叶变换单元、高通滤波单元、傅里叶逆变换单元和指数运算单元，用于在所述第一处理设备接收到所述第一触发信号时，对所述目标图像依次执行对数运算、傅里叶变换、高通滤波、傅里叶逆变换和指数运算，以获得并输出与所述目标图像对应的信号转换图像；

单一处理设备，分别与所述滤波触发设备和所述目标提取设备连接，用于在接收到所述第一触发信号时，对所述目标图像执行空域平滑滤波处理，以获得与所述目标图像对应的信号转换图像；

电源管理设备，分别与所述复合处理设备和所述单一处理设备连接，用于在所述复合处理设备或所述单一处理设备进入省电模式时，控制对所述复合处理设备或所述单一处理设备的电量供应；

国籍判断设备，与所述单一处理设备连接，用于接收每一个信号转换图像，对每一个信号转换图像执行以下操作：将所述信号转换图像中景深最浅的演员所在区域从所述信号转换图像中分割出来，基于各国标准人体轮廓判断与所述信号转换图像中景深最浅的演员所在区域的轮廓最符合的标题人体轮廓所对应的国籍以作为所述信号转换图像对应的国籍；

国籍统计设备，与所述国籍判断设备连接，用于接收各个信号转换图像分别对应的各个国籍，基于所述各个国籍判断待编辑的视频数据对应的视频国籍类别；

一致性分析设备，分别与所述国籍统计设备和所述音频编辑器连接，用于对片头音频片段进行成分分析，以确定所述片头音频片段中的音乐的归属国籍，对所述片头音频片段中的音乐的归属国籍与所述待编辑的视频数据对应的视频国籍类别进行一致性分析，以获得相应的分析结果；

其中，在所述国籍统计设备中，基于所述各个国籍判断待编辑的视频数据对应的视频国籍类别包括：将所述各个国籍中出现频率最高的国籍作为待编辑的视频数据对应的视频国籍类别。

在所述国籍信息智能识别系统中：在所述复合处理设备中，所述傅里叶变换单元分别与所述对数运算单元和所述高通滤波单元连接，所述傅里叶逆变换单元与所述高通滤波单元连接，所述指数运算单元与所述傅里叶逆变换单元连接。

在所述国籍信息智能识别系统中：所述复合处理设备在接收到所述第二触发信号时，从工作模式切换到省电模式。

在所述国籍信息智能识别系统中：所述单一处理设备在接收到所述第一触发信号时，从工作模式切换到省电模式。

在所述国籍信息智能识别系统中：在所述一致性分析设备中，当所述分析结果超过限量时，发出国籍对应指令，否则，发出国籍错位指令。

另外，在所述国籍信息智能识别系统中：所述一致性分析设备可选型为通用阵列逻辑器件GAL。

通用阵列逻辑器件GAL(Generic Array Logic www.husoon.com)器件是1985年LATTICE公司最先发明的可电擦除、可编程、可设置加密位的PLD。具有代表性的GAL芯片有GAL16V8、GAL20，这两种GAL几乎能够仿真所有类型的PAL器件。实际应用中，GAL器件对PAL器件仿真具有100％的兼容性，所以GAL几乎可以全代替PAL器件，并可取代大部分SSI、MSI数字集成电路，因而获得广泛应用。

GAL和PAL的最大差别在于GAL的输出结构可由用户定义，是一种可编程的输出结构。GAL的两种基本型号GAL16V8(20引脚)GAL20V8(24引脚)可代替树十种PAL器件，因而称为痛用可编程电路。而PAL的输出是由厂家定义好的，芯片选定后就固定了，用户无法改变。

采用本发明的国籍信息智能识别系统，针对现有技术中图像场景所在国籍不易辨认的技术问题，在影片的后续处理中，对片头音频片段和片头视频内容分别对应的国籍信息进行一致性分析，以判断是否错配不同语言的音频文件；在对片头视频内容的国籍信息提取中，采用了高精度的定制图像处理机制；通过对待处理图像中的目标的提取和分析，判断待处理图像中的轮廓像素点总数，以在所述待处理图像中的轮廓像素点过多时，避免使用对轮廓滤波效果不佳的滤波器，而选用空域平滑滤波模式；以及在所述待处理图像中的轮廓像素点不多时，选择使用抑制低频效果更佳的精细滤波模式，从而解决了上述技术问题。

可以理解的是，虽然本发明已以较佳实施例披露如上，然而上述实施例并非用以限定本发明。对于任何熟悉本领域的技术人员而言，在不脱离本发明技术方案范围情况下，都可利用上述揭示的技术内容对本发明技术方案做出许多可能的变动和修饰，或修改为等同变化的等效实施例。因此，凡是未脱离本发明技术方案的内容，依据本发明的技术实质对以上实施例所做的任何简单修改、等同变化及修饰，均仍属于本发明技术方案保护的范围内。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 国籍信息智能识别系统 [P] . 中国专利： CN109309864B . 2019.06.07
2. 国籍信息智能识别方法 [P] . 中国专利： CN109618221B . 2019.07.26
3. REAL-TIME POSITION AUTOMATIC RECOGNITION SYSTEM AND METHOD OF OPERATING SAME, WHICH USE BEACON INFORMATION, PHOTOGRAPH INFORMATION, AND MAP INFORMATION OF SMARTPHONE [P] . 世界知识产权组织专利： WO2017116080A1 . 2017-07-06

机译：使用智能手机的信标信息，摄影信息和地图信息的实时位置自动识别系统和操作方法
4. INFORMATION PUSHING METHOD WHEN CONTACT LIST IS MATCHED AND INTELLIGENT INFORMATION DISTINGUISHING SYSTEM [P] . 世界知识产权组织专利： WO2017124247A1 . 2017-07-27

机译：匹配列表时的信息推送方法和智能信息识别系统
5. DATA COLLECTION METHOD IN RELEVANT ART OF CONTACT MATCHING AND INTELLIGENT INFORMATION DISTINGUISHING SYSTEM [P] . 世界知识产权组织专利： WO2017124246A1 . 2017-07-27

机译：接触匹配与智能信息识别系统相关技术的数据收集方法