[发明专利]基于SE-FPN的目标检测模型训练方法、目标检测方法及装置在审
申请号: | 202011560657.5 | 申请日: | 2020-12-25 |
公开(公告)号: | CN112561801A | 公开(公告)日: | 2021-03-26 |
发明(设计)人: | 谷晓琳;杨敏;张燚;刘科 | 申请(专利权)人: | 北京轩宇空间科技有限公司 |
主分类号: | G06T3/40 | 分类号: | G06T3/40;G06N3/08;G06N3/04;G06K9/62 |
代理公司: | 成都诚中致达专利代理有限公司 51280 | 代理人: | 曹宇杰 |
地址: | 101399 北京市顺义*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 se fpn 目标 检测 模型 训练 方法 装置 | ||
基于SE‑FPN的目标检测模型训练方法、目标检测方法及装置,训练方法包括:对多张训练图片按不同缩放系数进行缩放,拼接成一张新图片,所述新的图片包括多个不同大小的目标;将所述多个不同大小的目标按照预定的分配策略分配到SE‑FPN目标检测模型的不同金字塔特征层;在每个金字塔特征层中,根据该层的训练样本的真值找到离中心点最近的
技术领域
本发明涉及计算机视觉领域,尤其与一种基于SE-FPN的目标检测模型训练方法、目标检测方法及装置有关。
背景技术
目标检测是计算机视觉领域的基础研究课题,被广泛应用于无人驾驶、智能监控和自动目标识别等领域。传统的目标检测方法主要是通过滑动窗口进行区域选择和定位,然后通过支持向量机(SVM)等分类器对其进行分类。随着深度学习的发展,卷积神经网络在目标检测中取得了一系列成果,相比于传统的目标检测方法,基于深度卷积网络模型的检测方法具有特征自主提取、泛化能力强等优点,成为目标检测领域重要的研究课题之一。
目前基于深度学习的目标检测方法主要分为两类:一类是两阶段的目标检测器,如Faster-RCNN,首先通过区域生成网络提取候选区域,然后将候选区域送入检测网络进行目标分类和位置回归。两阶段检测器的检测精度较高,但速度慢,难以达到实时性要求。另一类是单阶段检测器,如Yolo,将图像划分为多个网格,通过检测网络直接预测每个网格含有目标的概率,回归边界框和类别信息。单阶段检测器检测速度快,可实时检测目标,但检测精度较低,特别是对密集目标和小目标。
目前单阶段检测器主要存在两个问题:
(1)目标预测由目标中心所在的网格负责,当目标比较密集时,一个网格可能包含多个目标,但最终只输出一组预测参数,只能准确预测一个目标,其他目标被忽略或者存在较大的误差。
(2)检测器采用特征金字塔结构分层对图像进行检测,每个特征层用特定的锚进行预测。但实际项目获取的数据集中,目标的尺度往往分布不均匀,大部分目标都集中对金字塔的某一层进行训练,其余两层不能得到很好的训练,不仅造成资源浪费,还会影响检测精度。
发明内容
针对上述现状,本发明提供一种基于SE-FPN的目标检测模型训练方法、目标检测方法及装置、及电子设备和可读存储介质,构建基于SE-FPN的目标检测网络模型,并通过改进图像预处理方式和样本选择策略并训练模型,应用于目标检测,提高了目标的检测效率。
为了实现本发明的目的,拟采用以下方案:
一种基于SE-FPN的目标检测模型训练方法,包括步骤:
对从数据集获取的多张训练图片按不同的缩放系数进行缩放后,拼接成一张新的图片,并将多张训练图片对应的目标标签做相同的缩放和拼接处理,新的图片包括多个不同大小的目标;
将多个不同大小的目标按照预定的分配策略分配到SE-FPN目标检测模型的不同金字塔特征层;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京轩宇空间科技有限公司,未经北京轩宇空间科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011560657.5/2.html,转载请声明来源钻瓜专利网。