[发明专利]一种快速过滤背景图片的检测模型及其训练方法有效
申请号: | 202110299944.3 | 申请日: | 2021-03-22 |
公开(公告)号: | CN112686344B | 公开(公告)日: | 2021-07-02 |
发明(设计)人: | 王威 | 申请(专利权)人: | 浙江啄云智能科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 310051 浙江省杭州市滨*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 快速 过滤 背景图片 检测 模型 及其 训练 方法 | ||
1.一种快速过滤背景图片的检测模型,其特征在于:
包括主干网络、分类头模块、检测模块;所述主干网络用于对输入的图像提取特征信息,主干网络的输出端连接分类头模块;所述分类头模块用于对主干网络提取的特征信息分类从而得到输入的图像中是否含有目标,如果含有目标则将主干网络的特征提取信息送入到检测模块,如果不含有目标则直接输出检测结果;
设定含有目标的图片为阳性,不含有目标的为阴性;并设定分类头输出的神经元个数与检测任务的类别数相同,则会出现与类别数目相同的结果数,每个结果代表该类别可能存在目标的置信度,若存在置信度大于等于阈值的结果则图片为阳性,若不存在置信度大于等于阈值的结果则图片为阴性,所述阈值通过绘制分类pr曲线结合场景需求设置;
模型通过如下训练方法获得:
(a)先将主干网络和分类头模块作为整体训练m1次;
(b)微调检测模块n1次;
(c)再将主干网络和检测模块作为整体训练m2次;
(d)微调分类头模块 n2次;
其中,m1、m2为模型训练时设定的一个周期的训练次数;n1、n2为微调模型时设定的训练次数,m1、m2、n1、n2均为≥1的整数。
2.根据权利要求1所述的一种快速过滤背景图片的检测模型,其特征在于,所述检测模块包括特征融合模块、区域推荐网络、感兴趣区域池化,级联检测器。
3.根据权利要求2所述的一种快速过滤背景图片的检测模型,其特征在于,所述特征融合模块用于进一步融合主干网络提取的特征,经过特征融合模块后得到融合后的特征图,该特征图与区域建议网络连接。
4.根据权利要求2所述的一种快速过滤背景图片的检测模型,其特征在于,所述区域推荐网络用于初步过滤候选区域得到感兴趣区域,感兴趣区域池化层将得到的感兴趣区域特征固定成相同尺寸。
5.根据权利要求2所述的一种快速过滤背景图片的检测模型,其特征在于,所述级联检测器对所述感兴趣区域进一步分类与回归输出最终检测结果。
6.根据权利要求1所述的一种快速过滤背景图片的检测模型,其特征在于,所述分类头模块结构如下,经过一层3×3卷积,再经过1×1卷积降维,使用自适应全局池化使不同尺寸的输入图像得到相同维度的特征,最后经过一层全连接层后输出。
7.根据权利要求1所述的一种快速过滤背景图片的检测模型,其特征在于,所述分类头模块训练时的标签编码方式为:设定分类头输出的神经元个数与检测任务的类别数相同,若输入的图片中存在某一类别的目标,则对应的神经元的标签为1,不存在则为0。
8.一种模型训练方法,用于训练权利要求1-7任一项检测模型,设定主干网络为A模块,分类头模块为B模块,特征融合模块、区域推荐网络、感兴趣区域池化,级联检测器的组合为C模块,模型训练时采用如下交替训练的方式:
(a)先将A模块和B模块作为整体训练m1次;
(b)微调 C模块n1次;
(c)再将A模块和C模块作为整体训练m2次;
(d)微调B模块 n2次;
其中,m1、m2为模型训练时设定的一个周期的训练次数;n1、n2为微调模型时设定的训练次数,m1、m2、n1、n2均为≥1的整数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江啄云智能科技有限公司,未经浙江啄云智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110299944.3/1.html,转载请声明来源钻瓜专利网。