[发明专利]一种目标检测模型的训练方法、目标检测的方法和装置在审
申请号: | 202111582867.9 | 申请日: | 2021-12-22 |
公开(公告)号: | CN114399629A | 公开(公告)日: | 2022-04-26 |
发明(设计)人: | 刘安;吕晶晶;张政;刘平 | 申请(专利权)人: | 北京沃东天骏信息技术有限公司 |
主分类号: | G06V10/25 | 分类号: | G06V10/25;G06V10/774;G06V10/82;G06K9/62;G06N3/04 |
代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 李娜;张效荣 |
地址: | 100176 北京市北京经济技术*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 目标 检测 模型 训练 方法 装置 | ||
本发明公开了一种目标检测模型的训练方法、目标检测的方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:获取多个图像和每个图像对应的图像标签,图像标签包括图像中目标的位置和类别,根据图像获得图像对应的特征向量和位置编码向量,根据特征向量和位置编码向量获得图像对应的解码向量,采用多个图像对应的解码向量和图像标签进行训练,得到目标检测模型。然后利用该目标检测模型预测待检测图像中目标的位置和类别。该实施方式通过卷积神经网络结合自注意力机制检测图像中目标的位置和类别,提高了目标检测的精度,简化了目标检测的流程。
技术领域
本发明涉及计算机技术领域,尤其涉及一种目标检测模型的训练方法、目标检测的方法和装置。
背景技术
目前实现商品检测的方法主要分为两类:一类是使用两阶段目标检测模型在商品场景下进行检测,如以Faster-RCNN为代表的目标检测模型;另一类是使用单阶段目标检测模型进行商品检测,如以YOLO为代表的一系列目标检测模型。但是,卷积神经网络(Convolution Neural Network,CNN)擅长提取局部有效信息而无法提取全局数据之间的长距离特征关系,且计算流程复杂。
基于自注意力机制的目标检测方法主要包括DETR和ViT-FRCNN两个方法,但DETR方法的计算复杂度高、对小目标检测效果不好,ViT-FRCNN存在后处理操作复杂等缺陷。
发明内容
有鉴于此,本发明实施例提供一种目标检测模型的训练方法、目标检测的方法和装置,能够更充分的获取图像中的全局特征信息,丰富特征表达,对小目标具有良好的检测性能,简化了目标检测的流程,提高了目标检测的精度。
为实现上述目的,根据本发明实施例的一个方面,提供了一种目标检测模型的训练方法,包括:
获取多个图像和每个所述图像对应的图像标签,所述图像标签包括所述图像中目标的位置和类别;
根据所述图像获得所述图像对应的特征向量和位置编码向量;
根据所述特征向量和所述位置编码向量获得所述图像对应的解码向量;
采用多个所述图像对应的解码向量和图像标签进行训练,得到所述目标检测模型。
可选地,根据所述图像获得所述图像对应的特征向量和位置编码向量之前,还包括:
从多个图像和每个所述图像对应的图像标签中选择出部分图像和每个图像对应的图像标签;
根据所述部分图像和每个图像对应的图像标签训练得到图像检测模型;
利用所述图像检测模型对所述多个图像和图像标签进行数据清洗,确定出待重新标注的图像标签,对所述待重新标注的图像标签进行重新标注。
可选地,根据所述图像获得所述图像对应的特征向量和位置编码向量之前,还包括:
根据每个所述图像对应的图像标签确定每个类别对应的图像的数量;
根据每个所述类别对应的图像的数量对部分类别的图像和图像标签进行数据增强。
可选地,根据所述图像获得所述图像对应的特征向量和位置编码向量,包括:
提取所述图像的每个子区域的图像特征,根据各个子区域的图像特征得到所述图像对应的特征向量;
根据各个子区域的图像特征获得所述图像对应的位置编码向量,所述位置编码向量包含所述图像对应的各个子区域的图像特征之间的位置关系。
可选地,提取所述图像的每个子区域的图像特征之前,包括:
采用显著性检测模型检测出所述图像的前景区域;
对所述前景区域按照不同尺度划分,获得所述图像对应的多个子区域。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京沃东天骏信息技术有限公司,未经北京沃东天骏信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111582867.9/2.html,转载请声明来源钻瓜专利网。