[发明专利]一种logo识别加速方法在审
申请号: | 202110374874.3 | 申请日: | 2021-04-03 |
公开(公告)号: | CN113312961A | 公开(公告)日: | 2021-08-27 |
发明(设计)人: | 缪亚男;李扬曦;王佩 | 申请(专利权)人: | 国家计算机网络与信息安全管理中心 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100029*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 logo 识别 加速 方法 | ||
1.一种logo识别加速方法,其特征在于,包括以下步骤:
S1、视频输入步骤,获取视频数据;
S2、关键帧抽取步骤,获取关键帧;
S3、logo检测步骤,通过候选区域产生网络和回归器获取分类候选框的类别;
S4、logo识别训练步骤,采用残差网络ResNet50、经过全局平均池化和损失函数,获得logo识别训练网络;
S5、logo识别测试步骤,输出logo分类结果。
2.根据权利要求1所述的一种logo识别加速方法,其特征在于,
步骤S2中关键帧抽取步骤的具体内容为:
对步骤S1输入的视频采用多媒体视频处理工具进行视频抽帧,具体为每隔一个固定时间抽取视频中的一帧图像,作为关键帧。
3.根据权利要求2所述的一种logo识别加速方法,其特征在于,
步骤S3中logo检测步骤的具体内容为:
将步骤S2中得到的关键帧首先通过残差网络ResNet50进行图像特征提取,采用候选区域产生网络获取候选框,然后采用回归器来回归候选框的位置坐标,采用分类器来分类候选框的类别。
4.根据权利要求3所述的一种logo识别加速方法,其特征在于,
步骤S4中logo识别训练步骤的具体内容为:
采用残差网络ResNet50输出7×7×2048的特征向量,该特征向量经过全局平均池化输出的2048维向量输入到损失函数中,完成训练,得到logo识别训练网络。
5.根据权利要求4所述的一种logo识别加速方法,其特征在于,
步骤S5中logo识别测试步骤的具体内容为:
采用logo识别训练网络最后一层输出的2048维特征向量,与目标底库中的logo特征向量进行欧式距离计算,若计算结果小于设定阈值,则认为该logo属于目标底库中的一种,否则,认为该logo不是目标logo。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家计算机网络与信息安全管理中心,未经国家计算机网络与信息安全管理中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110374874.3/1.html,转载请声明来源钻瓜专利网。