[发明专利]视频识别方法及装置在审
申请号: | 201610150800.0 | 申请日: | 2016-03-16 |
公开(公告)号: | CN107205162A | 公开(公告)日: | 2017-09-26 |
发明(设计)人: | 张荣 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | H04N21/234 | 分类号: | H04N21/234;H04N21/44 |
代理公司: | 北京博浩百睿知识产权代理有限责任公司11134 | 代理人: | 宋子良 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视频 识别 方法 装置 | ||
1.一种视频识别方法,其特征在于,包括:
提取待测视频中的图像;
将所述图像输入至经指定样本集训练后的深度卷积神经网络模型,得到输出值,其中,所述指定样本集为对多个类型的图片样本进行预处理后得到的样本集;
判断所述输出值与第一预设阈值的大小;
在所述输出值大于所述第一预设阈值的情况下,确定所述待测视频为所述多个类型中的指定类型的视频。
2.根据权利要求1所述的方法,其特征在于,对多个类型的图片样本进行预处理包括:
将多个类型的图片样本进行过滤;
将过滤后剩余的所有图片样本归一化到同一分辨率;
计算所述归一化后的所有图片样本中每一个图像样本的像素的均值;
将归一化后的所述所有图片样本中的每一个图片样本的像素值与所述均值作差值运算,得到所述指定样本集中的样本。
3.根据权利要求2所述的方法,其特征在于,将多个所述类型的图片样本进行过滤包括:
丢弃所述多个类型的图片样本中满足以下条件的所述图片样本:
所述图片样本的长度与宽度之比或宽度与长度之比大于第二预定阈值。
4.根据权利要求1至3中任一项所述的方法,其特征在于,对多个类型的图片样本进行预处理还包括以下至少之一:对所述指定类型的图片样本中的每一个所述图片样本进行旋转处理,得到经旋转处理后的图片样本;对所述指定类型的图片样本中的每一个所述图片样本进行平移处理,得到经平移处理后的图片样本;对所述指定类型的图片样本中的每一个所述图片样本进行镜像处理,得到经镜像处理后的图片样本;对所述指定类型的图片样本中的每一个所述图片样本进行模糊处理,得到经模糊处理后的图片样本;
其中,所述指定样本集包括所述多个类型的图片样本,以及以下至少之一:所述经旋转处理后得到的图片样本,所述经平移处理后的图片样本,所述经镜像处理后的图片样本和所述经模糊处理后的图片样本。
5.根据权利要求1所述的方法,其特征在于,所述深度卷积神经网络模型包括:8个卷积层和3个全连接层;其中,所述8个卷积层之后为所述3个全连接层,所述8个卷积层中的第一个卷积层用于接收输入所述深度卷积神经网络模型的图像,所述3个全连接层中的最后一个全连接层用于输出所述输出值。
6.根据权利要求5所述的方法,其特征在于,所述8个卷积层中的每个卷积层包括以下至少之一操作:卷积操作、最大池化操作、平均池化操作。
7.根据权利要求5所述的方法,其特征在于,所述8个卷积层中的第一个卷积层、第二个卷积层、第四个卷积层和第七个卷积层包括最大池化操作;所述8个卷积层中的第八个卷积层包括平均池化操作;所述8个卷积层中的第三个卷积层、第五个卷积层和第六个卷积层不包括最大池化操作。
8.根据权利要求7所述的方法,其特征在于,所述第一个卷积层的卷积步长为2,所述第一个卷积层至所述第八个卷积层的卷积步长为1,所述第一个卷积层、所述第二个卷积层、所述第四个卷积层和所述第七个卷积层的池化补偿为2,所述第八个卷积层的池化步长为7。
9.一种视频识别装置,其特征在于,包括:
提取模块,用于提取待测视频中的图像;
处理模块,用于将所述图像输入至经指定样本集训练后的深度卷积神经网络模型,得到输出值,其中,所述指定样本集为对多个类型的图片样本进行预处理后得到的样本集;
判断模块,用于判断所述输出值与第一预设阈值的大小;
确定模块,用于在所述输出值大于所述第一预设阈值的情况下,确定所述待测视频为所述多个类型中的指定类型的视频。
10.根据权利要求9所述的装置,其特征在于,所述处理模块还用于将多个定类型的图片样本进行过滤;将过滤后剩余的所有图片样本归一化到同一分辨率;计算所述归一化后的所有图片样本中每一个图像样本的像素的均值;将归一化后的所述所有图片样本中的每一个图片样本的像素值与所述均值作差值运算,得到所述指定样本集中的样本。
11.根据权利要求10所述的装置,其特征在于,所述处理模块还用于丢弃所述多个类型的图片样本中满足以下条件的所述图片样本:
所述图片样本的长度与宽度之比或宽度与长度之比大于第二预定阈值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610150800.0/1.html,转载请声明来源钻瓜专利网。