[发明专利]应用于视频品牌识别系统的检测识别模块在审
申请号: | 201710132929.3 | 申请日: | 2017-03-08 |
公开(公告)号: | CN106919926A | 公开(公告)日: | 2017-07-04 |
发明(设计)人: | 李少雄 | 申请(专利权)人: | 上海极链网络科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 上海海贝律师事务所31301 | 代理人: | 范海燕 |
地址: | 202150 上海市崇明县*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 应用于 视频 品牌 识别 系统 检测 模块 | ||
技术领域
本发明涉及一种在一段视频中自动地检测品牌LOGO空间位置的品牌识别技术,具体地说是一种应用于视频品牌识别系统的检测识别模块。
背景技术
视频内品牌识别技术是在一段视频中自动地检测品牌LOGO的空间位置,并且在接下来的时间里,自动地跟踪该LOGO的运动轨迹,并且识别出该LOGO所属品牌的一种技术,涉及到图像处理、计算机视觉、模式识别、人工智能等前沿技术。本发明提供了一种检测识别模块,本检测识别模块应用在视频品牌识别系统中。
发明内容
本发明为解决上述技术问题而采用的技术方案是提供一种应用于视频品牌识别系统的检测识别模块,其中,具体技术方案为:
检测识别模块包括2个核心模块:RPN网络、分类网络,检测识别模块进行两个步骤,第一个步骤为离线的训练出模型,第二个步骤是根据训练得到的模型,进行输入图片的inference,即检测识别LOGO。
上述的用于视频品牌识别系统的检测识别模块,其中:检测识别模块是基于深度神经网络的解决方案,使用基于Deep Learning的LOGO检测/识别算法,并且,基于PVANet深度学习网络来满足视频内LOGO检测的独特需求,训练方法为end2end。
上述的用于视频品牌识别系统的检测识别模块,其中:end2end训练共229类LOGO,使用AP/mAP来度量准确率与召回率,目前的229类的mAP=97.31%,单帧检测速度150ms/frame,视频处理时间比0.5,每10帧进行一次Logo检测/识别。
上述的用于视频品牌识别系统的检测识别模块,其中:PVANet是基于faster-rcnn的一种新的detection方法,目的在提高精度的同时进行加速,根据需求对于PVANet进行了以下改进:
1)将PVANet整合进faster-rcnn中进行end2end训练,backbone使用的是PVANet;PVANet是用于分类的一个网络,所以必须将其整合进faster-rcnn的框架后才能支持检测+识别;
2)在消除误检方面,同时采取了两种措施:第一种是将在线地全图取负样本(OHEM)整合进框架中,第二种是采取自举的方式,离线地通过多次迭代,定点清除误检;
3)利用PVANet+OHEM的特点调整了数据集,使得数据集中除了标注的logo外,不存在其他干扰的LOGO类别,使得mAP从0.953提高至0.970;
4)通过减小Pooling层的stride来增加Feature Map的大小来满足对小物体的检测需求;经过这个措施后,mAP达到了新高0.9731;
5)在4)的基础上,对视频进行分割区块,再结合原图的检测。
本发明相对于现有技术具有如下有益效果:
在视频经由前处理处理过后输入到检测识别模块中,实现对品牌LOGO的检测和识别同时进行,如果在某一帧中检测和识别到了LOGO,即得到了其位置信息,结合后续程序,在接下来的视频序列中可对这个检测到的LOGO进行跟踪。
附图说明
图1为本发明提供的用于视频品牌识别系统的检测识别模块的系统示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的描述。
本发明提供了一种用于视频品牌识别系统的检测识别模块;检测识别模块包括2个核心模块:RPN网络、分类网络,检测识别模块进行两个步骤,第一个步骤为离线的训练出模型,第二个步骤是根据训练得到的模型,进行输入图片的inference,即检测识别LOGO。
检测识别模块是基于深度神经网络的解决方案,使用基于Deep Learning的LOGO检测/识别算法,并且,基于PVANet深度学习网络来满足视频内LOGO检测的独特需求,训练方法为end2end。
end2end训练共229类LOGO,使用AP/mAP来度量准确率与召回率,目前的229类的mAP=97.31%,单帧检测速度150ms/frame,视频处理时间比0.5,每10帧进行一次Logo检测/识别。
PVANet是基于faster-rcnn的一种新的detection方法,目的在提高精度的同时进行加速,根据需求对于PVANet进行了以下改进:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海极链网络科技有限公司,未经上海极链网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710132929.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种可拆卸的带磁铁吸附性底板的美甲灯
- 下一篇:一种带支撑装置的美甲灯