[发明专利]基于Faster RCNN网络的广义少样本目标检测方法及系统有效
申请号: | 202210971672.1 | 申请日: | 2022-08-15 |
公开(公告)号: | CN115049884B | 公开(公告)日: | 2022-10-25 |
发明(设计)人: | 朱光旭;晏文仲;黄金;田楷;胡江洪;曹彬 | 申请(专利权)人: | 菲特(天津)检测技术有限公司 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/82;G06T3/00;G06N3/04;G06N3/08 |
代理公司: | 天津知川知识产权代理事务所(特殊普通合伙) 12249 | 代理人: | 郑聪 |
地址: | 300000 天津市东丽区自贸试验区(空港经济区*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 faster rcnn 网络 广义 样本 目标 检测 方法 系统 | ||
本发明公开了一种基于Faster RCNN网络的广义少样本目标检测方法及系统,属于汽车内饰检测技术领域,包括:S1、获取内饰板图,并进行预处理;S2、改进Faster RCNN网络模型;S3、通过第一仿射层和第二仿射层生成参数λ;S4、分类层和边框回归层解耦;S5、Faster RCNN网络模型训练,先将参数λ值设为1,并用基础集对模型进行基础训练,再改变参数λ值用小数据集进行微调,得到最终模型;S6、计算损失函数;S7、训练改进Faster RCNN网络模型;S8、建立评测系统。本发明对Faster RCNN进行改进,提升对于novel集的训练效果的同时,尽可能地不降低base类的检出能力。
技术领域
本发明属于汽车内饰检测技术领域,具体涉及一种基于Faster RCNN网络的广义少样本目标检测方法及系统。
背景技术
汽车内饰板材在生产工艺中会不可避免地出现各种缺陷。这些缺陷有的甚小,有些甚不明显,依靠工人肉眼判断不仅效率低、成本高,最为关键的是漏检率极高,最终导致在售卖时增加用户投诉量。因此,通过人工智能深度学习进行该领域的检测逐渐成为主流。
缺陷分为很多类型,这些类型在真实应用场景中会自然形成长尾效应,即少数缺陷种类占总缺陷的绝大多数,而总有一部分缺陷出现次数极少,而又必须检出,这对于深度学习的模型能力是一项严峻的挑战。
深度学习目标检测通常需要庞大数据量在让模型自动学习数据集特征,来对已知类型进行检测。少样本检测(FSOD)旨在通过现有大数据集(base集)和base集中不存在的只有极少数新样本的新类型的小数据集(novel集)进行学习快速检测新的目标。目前,大多数研究者使用Faster RCNN作为基本检测框架,然而,由于其对于数据稀疏场景缺乏定制化的考虑,对于novel集的检测效果往往并不令人满意。不仅如此,在对novel集进行增量训练时,大多数模型对于base集的检出效果也会出现灾难性遗忘。检测novel集的同时,避免base集的检出发生灾难性遗忘的少样本检测任务被称为广义少样本检测(GFSOD)。
目前在汽车内饰板材生产流水线中应用的基于深度学习神经网络的目标检测主要包含两个分支:即双阶段目标检测和单阶段目标检测。单阶段目标检测主要包括yolo系列等,双阶段目标检测则以FasterRCNN最为典型。双阶段目标检测虽检出速度较慢,但具有检出率高的特点,因此成为大多数研究者研究FSOD问题的基本检测框架。TFA提出了一种基于迁移学习的方法,通过冻结网络主干,只微调能够输出novel样本的检测头的方法,尽可能让模型利用base集的庞大数据优势来对novel集进行预测。旷视团队的RetentiveRCNN认为完全冻结FasterRCNN的主干会使其主干网络无法学习对于novel类的区域建议能力,从而降低了学习效果。RetentiveRCNN在主干网络和头部网络中同时假如了base和novel网络的双分支,然后仅将base网络分支冻结,最后再将两个分支合并,以此增强了网络的学习能力,同时还对base集的检出效果进行了充分的保护,不容易发生灾难性遗忘。
现有技术的客观缺陷:
在汽车内饰板材的检测领域中,现有的广义少样本检测对于novel类的检出效果仍然不够理想,发表在顶级会议的论文对于30样例的novel类的检出率仅有在15%-20%,这些方法应用到汽车内饰板材领域时,效果还有进一步下降,novel类的样例数不足30时,效果也会大幅下降。同时,这些方法对于base类的检出效果仍会出现不同程度的下降,过分看中novel类效果的模型往往得不偿失,需要持续不断地改进才能在现实中更加实用。
发明内容
本发明为解决公知技术中存在的技术问题,提供一种基于Faster RCNN网络的广义少样本目标检测方法及系统,通过新的神经网络模型,在Faster RCNN的基础上进行改进,添加了一些有用的网络层,使其对不同层进行了解耦,网络中各个模块功能独立性增加,旨在提升其对于novel集的训练效果的同时尽可能地不降低base类的检出能力。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于菲特(天津)检测技术有限公司,未经菲特(天津)检测技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210971672.1/2.html,转载请声明来源钻瓜专利网。