[发明专利]一种快速过滤背景图片的检测模型及其训练方法有效
申请号: | 202110299944.3 | 申请日: | 2021-03-22 |
公开(公告)号: | CN112686344B | 公开(公告)日: | 2021-07-02 |
发明(设计)人: | 王威 | 申请(专利权)人: | 浙江啄云智能科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 310051 浙江省杭州市滨*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 快速 过滤 背景图片 检测 模型 及其 训练 方法 | ||
本发明公开了一种快速过滤背景图片的检测模型,包括主干网络、分类头模块、特征融合模块、区域推荐网络、感兴趣区域池化,级联检测器;所述分类头模块与检测模型共享主干网络,将主干网络最后一层的特征图经过分类头模块计算得到分类置信度,再根据分类结果决定是否进入到检测模块。使用该模型能够有效地提高分类模型的计算效率,并且结构简单可行性高。
技术领域
本发明属于目标检测技术领域,具体涉及一种快速过滤背景图片的检测模型及其训练方法。
背景技术
近年来,随着人工智能技术的不断发展,深度学习技术已经在计算机视觉领域的分类、识别、检测、分割、跟踪等任务中都取得了突破性的进展。相较于传统的机器视觉方法,深度卷积神经网络在大数据的训练下,从大量数据中学习出有用的特征,具有速度快、精度高、成本低等优势。但是,深度学习能达到这种优于传统方法的很大一部分原因是因为深度学习是建立在大量数据基础上的,学习这些数据需要大量的计算资源,如果应用于存在大量背景的目标检测应用场景中(如智能安检、工业检测、医疗领域等),深度学习模型所检测的大部分图片均是背景图像,特别是对于简单背景而言,检测模型的大部分计算都是没必要的,这样便造成了计算资源的浪费。
发明内容
本发明所要解决的技术问题是针对背景技术中所涉及到的技术缺陷,提供一种快速过滤背景图片的检测模型及其训练方法,保持检测准确率的前提下极大地提高了检测效率。
根据本发明的一个方面,提供一种快速过滤背景图片的检测模型,所述检测模型包括主干网络、分类头模块、特征融合模块、区域推荐网络、感兴趣区域池化,级联检测器。
所述主干网络用于对输入图像提取特征信息,主干网络的输出端连接分类头模块。
所述分类头模块用于对主干网络提取的特征信息分类从而得到图片的阳性置信度,根据所述分类头模块的结果选择后续操作,如果是阳性则将主干网络的特征提取信息送入到特征融合模块,如果为阴性则直接输出检测结果,即图片为阴性且未检测出目标。
所述特征融合模块用于进一步融合主干网络提取的特征,经过特征融合模块后得到融合后的特征图,该特征图与区域建议网络连接。所述区域推荐网络用于初步过滤候选区域得到感兴趣区域,感兴趣区域池化层将得到的感兴趣区域特征固定成相同尺寸。
所述级联检测器对上步骤的感兴趣区域进一步分类与回归输出最终检测结果。
所述分类头模块结构如下,经过一层3×3卷积,再经过1×1卷积降维,使用自适应全局池化使不同尺寸的输入图像得到相同维度的特征,最后经过一层全连接层后输出,输出层使用的激活函数为sigmoid,输出神经元个数与目标类别数量相等,分类时损失函数采用交叉熵损失。
进一步优选的,对于分类头训练时的标签编码方式为:设定分类头输出的神经元个数与检测任务的类别数相同,若被检测的图片中存在某一类别的目标,则对应的神经元的标签为1,不存在则为0。
根据本发明的另一个技术方案,提供一种模型训练方法用于训练所述检测模型,设定主干网络为A模块,分类头模块为B模块,所述特征融合模块、区域推荐网络、感兴趣区域池化,级联检测器的组合为C模块,模型训练时采用如下交替训练的方式:
(a)先将A模块和B 模块作为整体训练m1个epoch;
(b)冻结A模块,微调 C模块n1个epoch;
(c)再将A模块和C模块作为整体训练m2个epoch;
(d)冻结A模块和C模块,微调模块 n2个epoch;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江啄云智能科技有限公司,未经浙江啄云智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110299944.3/2.html,转载请声明来源钻瓜专利网。