[发明专利]一种易于快速迭代更新的Logo检测方法有效
申请号: | 201811578524.3 | 申请日: | 2018-12-24 |
公开(公告)号: | CN109359207B | 公开(公告)日: | 2021-01-22 |
发明(设计)人: | 王旻毅;房鹏展 | 申请(专利权)人: | 焦点科技股份有限公司 |
主分类号: | G06F16/53 | 分类号: | G06F16/53;G06K9/62 |
代理公司: | 南京瑞弘专利商标事务所(普通合伙) 32249 | 代理人: | 陈建和 |
地址: | 210032 江苏省南京*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种易于快速迭代更新的Logo检测方法,其特征在于,包括构建并训练logo检测模型至收敛,得到特征点Landmark 1,用于预测未知图片里的logo位置;构建并训练图片分类网络模型至收敛,得到特征点Landmark 2,用于预测logo类别。达到解决某些Logo样本过少,难以收集的情形;确定Logo检测任务的最优目标检测模型;新增Logo时模型快速迭代更新,免去新Logo标注过程并保证准确率的效果。 | ||
搜索关键词: | 一种 易于 快速 更新 logo 检测 方法 | ||
【主权项】:
1.一种易于快速迭代更新的Logo检测方法,其特征在于,包括构建并训练logo检测模型至收敛,得到特征点Landmark 1,用于预测未知图片里的logo位置;构建并训练图片分类网络模型至收敛,得到特征点Landmark 2,用于预测logo类别,具体步骤如下:步骤1,根据给定的关键字抓取搜索引擎的图片源,将图片的抓取结果分成4类:第1类,含Logo图片样本;第2类,没有多余背景的纯Logo;第3类,完全不相关的图片;第4类,不属于前3类的所有抓取结果;步骤2,生成xml文件,记录矩形框位置及标注类别;步骤2‑1对步骤1中含Logo图片样本(第1类),使用开源工具labelImg对图片中Logo所在位置用矩形框进行标注,标注类别统一设为general_logo,将矩形框位置及标注类别保存为xml文件;步骤2‑2对步骤1中纯Logo(第2类)做旋转操作;然后将其嵌入完全不相关的图片(第3类)的随机位置且不超出边界,合成新的有效图片,合成时记录纯Logo(第2类)所在位置以及标注类别,写入xml文件;在步骤2‑1获取的图片量不足1.5w张时,将合成的新的有效图片作为补充;步骤3,确定Landmark 1最优模型;步骤3‑1,以tensorflow为统一框架,实现Faster RCNN,R‑FCN,SSD以及附带的特征提取器,所述特征提取器包括Inception Resnet V2、Inception V2、Inception V3、MobileNet、Resnet 101、VGG;步骤3‑2,使用步骤1获取的图片以及步骤2生成的xml文件进行训练,获得Landmark 1最终模型;步骤4,利用步骤3的Landmark 1批量抠取Logo,生成纯Logo图片,训练图片分类网络至收敛,得到Landmark 2,并预测Logo类别;步骤5,当新增1类Logo时,收集至少100张的新Logo样本,重复步骤4,重新训练Landmark 2,并使用重新训练的Landmark 2预测新增logo的类别。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于焦点科技股份有限公司,未经焦点科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811578524.3/,转载请声明来源钻瓜专利网。