[发明专利]视频检测方法、装置、电子设备及计算机可读存储介质在审
申请号: | 201811496505.6 | 申请日: | 2018-12-07 |
公开(公告)号: | CN111291602A | 公开(公告)日: | 2020-06-16 |
发明(设计)人: | 黄君实;罗玄;陈强 | 申请(专利权)人: | 北京奇虎科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 北京市立方律师事务所 11330 | 代理人: | 张筱宁 |
地址: | 100088 北京市西城区新*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 检测 方法 装置 电子设备 计算机 可读 存储 介质 | ||
本申请提供了一种视频检测方法、装置、电子设备及计算机可读存储介质,应用于视频检测技术领域,其中该方法包括:通过特征提取网络提取待检测视频中的关键帧图像的图像特征,然后通过池化网络对提取得到的图像特征进行处理得到关键帧图像的固定长度的图像特征向量,并将得到的固定长度的图像特征向量输入至分类网络得到关键帧图像的低俗检测结果,继而基于关键帧图像的低俗检测结果确定待检测视频的低俗检测结果,即基于待检测视频的关键帧图像的图像特征,确定关键帧图像的低俗检测结果,继而根据关键帧图像的低俗检测结果确定待检测视频的低俗检测结果,从而实现了待检测视频是否为低俗视频的自动检测,与此同时,降低了待检测视频的检测成本。
技术领域
本申请涉及视频检测技术领域,具体而言,本申请涉及一种视频检测方法、装置、电子设备及计算机可读存储介质。
背景技术
随着视频制作技术的发展,人人都可以制作并分享自己的视频,造成网络上视频数量的激增。在网络上的大量视频中,有一部分视频是“三俗”(即庸俗、低俗、媚俗)视频,其传播的信息内容非常低俗,相关低俗视频的传播将对社会产生不良影响,因此,实现视频的低俗检测具有重要意义。
目前,对视频的低俗检测是通过人工方式实现的,即相应视频平台的相关工作人员通过人工检测的方式,逐一对视频平台上的视频进行浏览、观看,然后确定相应的视频是否为低俗视频。然而,根据现有的人工方式进行视频的低俗检测,相关工作人员需要逐一检测相关视频,对于部分视频,甚至需要观看视频的完整内容之后才能确定相关视频是否为低俗视频,检测效率非常低,此外,随着视频平台视频数量的激增,需要大量的相关工作人员才能完成视频的低俗检测工作,人工成本非常高。因此,现有的人工进行视频的低俗检测方式存在效率低、成本高的问题。
发明内容
本申请提供了一种视频检测方法、装置、电子设备及计算机可读存储介质,用于提升视频的低俗检测的效率,及降低视频的低俗检测的成本,本申请采用的技术方案如下:
第一方面,提供了一种视频检测方法,该方法包括,
通过特征提取网络提取待检测视频中的关键帧图像的图像特征;
通过池化网络对提取得到的图像特征进行处理得到关键帧图像的固定长度的图像特征向量;
将得到的固定长度的图像特征向量输入至分类网络得到关键帧图像的低俗检测结果;
基于关键帧图像的低俗检测结果确定待检测视频的低俗检测结果。
进一步地,通过池化网络对提取得到的图像特征进行处理得到关键帧图像的固定长度的图像特征向量,包括以下至少一项:
将提取得到的图像特征输入至全局平均池化网络得到关键帧图像的固定长度的图像特征向量;
将提取得到的图像特征输入至VLAD池化网络得到关键帧图像的固定长度的图像特征向量。
进一步地,将提取得到的图像特征输入至VLAD池化网络得到关键帧图像的图像特征向量,包括:
对多个图像特征进行聚类处理,得到多个聚类中心;
计算确定各个图像特征的特征值分别与其对应的聚类中心特征值的残差值,并针对任一聚类中心对该聚类中心与对应的各个图像特征之间的残差值进行求和得到残差值的和;
基于得到的各个聚类中心分别对应的残差值的和来确定关键帧图像的固定长度的图像特征向量。
进一步地,待检测视频的关键帧图像的确定方法,包括:
对待检测视频进行解码处理得到多个视频帧图像;
基于各个视频帧图像的图像特征对多个视频帧图像进行聚类处理,得到至少一个聚类分组;
从各个聚类分组中分别确定一个视频帧图像作为关键帧图像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇虎科技有限公司,未经北京奇虎科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811496505.6/2.html,转载请声明来源钻瓜专利网。