[发明专利]应用于视频品牌识别系统的检测识别模块在审
申请号: | 201710132929.3 | 申请日: | 2017-03-08 |
公开(公告)号: | CN106919926A | 公开(公告)日: | 2017-07-04 |
发明(设计)人: | 李少雄 | 申请(专利权)人: | 上海极链网络科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/62 |
代理公司: | 上海海贝律师事务所31301 | 代理人: | 范海燕 |
地址: | 202150 上海市崇明县*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 应用于 视频 品牌 识别 系统 检测 模块 | ||
1.一种用于视频品牌识别系统的检测识别模块,其特征在于:检测识别模块包括2个核心模块:RPN网络、分类网络,检测识别模块进行两个步骤,第一个步骤为离线的训练出模型,第二个步骤是根据训练得到的模型,进行输入图片的inference,即检测识别LOGO。
2.如权利要求1所述的用于视频品牌识别系统的检测识别模块,其特征在于:检测识别模块是基于深度神经网络的解决方案,使用基于Deep Learning的LOGO检测/识别算法,并且,基于PVANet深度学习网络来满足视频内LOGO检测的独特需求,训练方法为end2end。
3.如权利要求2所述的用于视频品牌识别系统的检测识别模块,其特征在于:end2end训练共229类LOGO,使用AP/mAP来度量准确率与召回率,目前的229类的mAP=97.31%,单帧检测速度150ms/frame,视频处理时间比0.5,每10帧进行一次Logo检测/识别。
4.如权利要求2-3中任一项所述的用于视频品牌识别系统的检测识别模块,其特征在于:PVANet是基于faster-rcnn的一种新的detection方法,目的在提高精度的同时进行加速,根据需求对于PVANet进行了以下改进:
1)将PVANet整合进faster-rcnn中进行end2end训练,backbone使用的是PVANet;PVANet是用于分类的一个网络,所以必须将其整合进faster-rcnn的框架后才能支持检测+识别;
2)在消除误检方面,同时采取了两种措施:第一种是将在线地全图取负样本(OHEM)整合进框架中,第二种是采取自举的方式,离线地通过多次迭代,定点清除误检;
3)利用PVANet+OHEM的特点调整了数据集,使得数据集中除了标注的logo外,不存在其他干扰的LOGO类别,使得mAP从0.953提高至0.970;
4)通过减小Pooling层的stride来增加Feature Map的大小来满足对小物体的检测需求;经过这个措施后,mAP达到了新高0.9731;
5)在4)的基础上,对视频进行分割区块,再结合原图的检测。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海极链网络科技有限公司,未经上海极链网络科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710132929.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种可拆卸的带磁铁吸附性底板的美甲灯
- 下一篇:一种带支撑装置的美甲灯