[发明专利]一种logo识别加速方法在审
申请号: | 202110374874.3 | 申请日: | 2021-04-03 |
公开(公告)号: | CN113312961A | 公开(公告)日: | 2021-08-27 |
发明(设计)人: | 缪亚男;李扬曦;王佩 | 申请(专利权)人: | 国家计算机网络与信息安全管理中心 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100029*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 logo 识别 加速 方法 | ||
本发明公开了一种logo识别加速方法,应用于图像处理技术领域,包括以下步骤:S1、视频输入步骤;S2、关键帧抽取步骤;S3、logo检测步骤;S4、logo识别训练步骤;S5、logo识别测试步骤。本发明能够快速有效地对视频中特定的目标人物进行检测和识别;具有很快的检测和识别速度。
技术领域
本发明涉及图像处理技术领域,尤其涉及一种logo识别加速方法。
背景技术
随着互联网的发展,在互联网上的视频数量也越来越多,同时也会面临着安全问题,像一些特殊组织在网上散播一些特殊视频,这些视频如果在社会上流传开来,对于整个社会安稳有着很大的影响,因此识别出这些特殊视频成为很重要的任务。这些特殊视频大部分都会有特定的logo,所以logo识别成为特殊视频识别很重要的一步。Logo识别一般会用到特征比对,用输入图像中logo的特征和底库特征进行比对,logo的特征一般是高维向量比如2048 维,如果底库的特征比较多,那么一对一的比对会消耗过多的时间。
现有的特征检索方案是如果底库数据量比较少,特征维度比较低,那么就采取一对一的计算欧式距离的方法,如果是底库数据量比较多,那么构建 kd-tree,然后进行特征检索。如果是一对一进行检索,从效率来讲是相对比较慢,实用性并不高,如果是构建kd-tree的话,效率会有所提高,但是构建kd-tree 过程比较麻烦,并且不利于后期维护。
因此,提供一种logo识别加速方法,提高logo识别的速度,是本领域技术人员亟需解决的问题。
发明内容
有鉴于此,本发明提供了一种logo识别加速方法,能够加速logo识别速度。
为了实现上述目的,本发明采用如下技术方案:
一种logo识别加速方法,包括以下步骤:
S1、视频输入步骤,获取视频数据;
S2、关键帧抽取步骤,获取关键帧;
S3、logo检测步骤,通过候选区域产生网络和回归器获取分类候选框的类别;
S4、logo识别训练步骤,采用残差网络ResNet50、经过全局平均池化和损失函数,获得logo识别训练网络;
S5、logo识别测试步骤,输出logo分类结果。
优选的,步骤S2中关键帧抽取步骤的具体内容为:
对步骤S1输入的视频采用多媒体视频处理工具FFmpeg进行视频抽帧,具体为每隔一个固定时间抽取视频中的一帧图像,作为关键帧。
优选的,固定时间可选2秒钟。
优选的,步骤S3中logo检测步骤的具体内容为:
将步骤S2中得到的关键帧首先通过ResNet50进行图像特征提取,采用候选区域产生网络(RPN,Region Proposal Network)获取候选框,然后采用回归器来回归候选框的位置坐标,采用分类器来分类候选框的类别。
优选的,步骤S4中logo识别训练步骤的具体内容为:
采用ResNet50输出7×7×2048的特征向量,该特征向量经过全局平均池化(Global Avarage Pooling)输出的2048维向量输入到损失函数(Loss函数) 中,完成训练,得到logo识别训练网络。
优选的,步骤S4中logo识别测试步骤的具体内容为:
采用logo识别训练网络最后一层输出的2048维特征向量,与目标底库中的logo特征向量进行欧式距离计算,若计算结果小于设定阈值,则认为该logo 属于目标底库中的一种,否则,认为该logo不是目标logo。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家计算机网络与信息安全管理中心,未经国家计算机网络与信息安全管理中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110374874.3/2.html,转载请声明来源钻瓜专利网。