[发明专利]模型生成方法、目标检测方法、装置、设备及介质有效
申请号: | 202210791426.8 | 申请日: | 2022-07-07 |
公开(公告)号: | CN114862683B | 公开(公告)日: | 2022-12-09 |
发明(设计)人: | 赵雅倩;金良;范宝余;李晓川;闫瑞栋;蒋东东;杨宏斌;姜金哲 | 申请(专利权)人: | 浪潮电子信息产业股份有限公司 |
主分类号: | G06T3/40 | 分类号: | G06T3/40;G06T7/11;G06V10/774 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 夏菁 |
地址: | 250101 山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 生成 方法 目标 检测 装置 设备 介质 | ||
本申请涉及大场景超分辨率图像目标检测技术领域,公开了一种模型生成方法、目标检测方法、装置、设备及介质,模型生成方法包括:利用各超分辨率图像的真实框构成各图像的样本集合;从样本集合中选择一真实框,根据选择的真实框对超分辨率图像裁切,得到裁切图像;从超分辨率图像的样本集合中删除裁切图像包含的真实框,返回执行从样本集合中选择一真实框的步骤,直至样本集合为空集;利用各超分辨率图像的裁切图像及其包含的真实框作为第一训练集,对第一模型进行训练,得到第一目标检测模型。本申请公开的技术方案,通过每次从样本集合中删除裁切图像包含的真实框及重复执行至样本集合为空集解决过采样和欠采样问题,提高模型性能。
技术领域
本申请涉及大场景超分辨率图像目标检测技术领域,更具体地说,涉及一种模型生成方法、目标检测方法、装置、电子设备及可读存储介质。
背景技术
超分辨率大场景对象检测中,场景平均覆盖平方千米级范围,可同时观测数千人,百米外人脸清晰可识别,视频分辨率近10亿像素,因此,现有算力无法满足将整张图像输入到模型中进行训练或推理。
目前,多采用锚框切图算法对超分辨率图像进行切图,得到裁切图像,并将裁切图像作为训练集来对模型进行训练,后续则利用训练得到的模型进行目标检测。其中,目前的锚框切图算法每次均采用随机采样方法从超分辨率图像中选择样本,具体是以目标为导向,根据样本的真实标注去随机选择样本,然后,根据选择的样本进行切图。但是,由于超分辨率图像中密集人群所占比重明显大于其他区域,因此,上述方式就会导致密集人群区域被多次采样,出现过采样现象,且上述采样策略并不能保证图像中所有目标都能参与训练,即上述采样策略存在无法覆盖所有目标的欠采样问题,从而会影响到模型性能。
综上所述,如何解决现有模型生成过程中的过采样和欠采样的问题,以提高模型性能,是目前本领域技术人员亟待解决的技术问题。
发明内容
有鉴于此,本申请的目的是提供一种模型生成方法、目标检测方法、装置、电子设备及可读存储介质,用于解决现有模型生成过程中的过采样和欠采样的问题,以提高模型性能。
为了实现上述目的,本申请提供如下技术方案:
一种模型生成方法,包括:
获取大场景数据集中各超分辨率图像包含的真实框,利用各所述超分辨率图像包含的真实框构成各所述超分辨率图像对应的样本集合;
从所述超分辨率图像对应的样本集合中选择一真实框,根据选择的真实框对所述超分辨率图像进行裁切,得到第一裁切图像;
从所述超分辨率图像对应的样本集合中删除所述第一裁切图像包含的真实框,返回执行所述从所述超分辨率图像对应的样本集合中选择一真实框的步骤,直至所述超分辨率图像对应的样本集合为空集;
利用各所述超分辨率图像对应的各所述第一裁切图像及各所述第一裁切图像包含的真实框作为第一训练集,利用所述第一训练集对第一模型进行训练,得到第一目标检测模型。
优选的,在利用所述第一训练集对第一模型进行训练,得到第一目标检测模型之后,还包括:
利用所述第一目标检测模型对所述第一训练集进行预测,得到各所述超分辨率图像对应的预测结果;
根据各所述超分辨率图像对应的预测结果及相应超分辨率图像包含的真实框,得到各所述超分辨率图像对应的预测错误样本;
根据所述超分辨率图像对应的各预测错误样本对所述超分辨率图像进行裁切,得到各预测错误样本所对应的第二裁切图像;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮电子信息产业股份有限公司,未经浪潮电子信息产业股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210791426.8/2.html,转载请声明来源钻瓜专利网。