[发明专利]一种图像检测模型的多尺度anchor初始化方法与装置在审
申请号: | 202010930363.0 | 申请日: | 2020-09-07 |
公开(公告)号: | CN111986255A | 公开(公告)日: | 2020-11-24 |
发明(设计)人: | 刘铎 | 申请(专利权)人: | 北京凌云光技术集团有限责任公司 |
主分类号: | G06T7/62 | 分类号: | G06T7/62;G06K9/62 |
代理公司: | 北京弘权知识产权代理事务所(普通合伙) 11363 | 代理人: | 逯长明;许伟群 |
地址: | 100094 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图像 检测 模型 尺度 anchor 初始化 方法 装置 | ||
本发明涉及一种图像检测模型的多尺度anchor初始化方法,方法包括:将每种待检测图像对应的样本标签划分到对应的尺度内;根据每个尺度内的样本标签数量阈值,判断是否保留尺度;确定保留的每个尺度下的样本标签面积和宽高情况;根据样本标签面积和宽高情况,动态调整anchor数量并生成每个尺度下的初始化anchor;通过评价指标比较面积和宽高两种方法确定的anchor的情况,选择较达到评价指标的一组结果。本发明生成的初始化anchor既能够指导算法采用最合适的尺度,节省效率,避免尺度间的竞争;又能够与样本的分布情况一致,提升检测精度。
技术领域
本申请涉及互联网技术领域,尤其涉及一种图像检测模型的多尺度anchor初始化方 法与装置。
背景技术
目标检测算法(Detection)是深度学习计算机视觉(CV)领域一个非常重要的方向, 算法过程是通过一系列带有标签的图像进行训练,提取目标特征,用于预测新的图像是 否含目标并用矩形框标示,对目标图像进行标注,带有标签的图像的矩形框为目标矩形框。如图1所示,含有三个目标。
目标检测训练过程中,Anchor需要设置有多个参数,其中非常重要的一个参数就是 锚框(anchor),其形态是矩形框。其原理是将一系列(常见的是9个)初始化的anchor 做为基准,找到IoU(锚框和目标矩形框的面积交集/并集,如图2所示)和目标矩形框 最接近的一个,并学习锚框和目标矩形框之间的变换关系。这种学习可近似看作线性变 换,所以初始化的anchor和目标矩形框越接近,学习的效果越好,预测精度会越高。其 中,目标矩形框,即标注的矩形框,通常称为标签。
Anchor由两个参数构成,数量和大小。其中,anchor的数量一般会影响生成初始化anchor的效率,也在一定程度上影响检测精度。anchor的大小会影响最终检测结果的准 确程度,即anchor初始大小与数据集标签尺寸约接近越好,但标注的矩形的数量远大于anchor数量,所以如何让初始化的anchor框的分布能够与标注的矩形框的分布保持一 致(距离最小)并且采用合理的anchor数量是该算法要解决的主要问题之一。
发明内容
本申请提供了一种图像检测模型的多尺度anchor初始化方法与装置,以解决如何让 初始化的anchor框的分布能够与标注的矩形框的分布保持一致(距离最小)并且采用合理的anchor数量的问题。
本申请采用的技术方案如下:
本申请提供了一种图像检测模型的多尺度anchor初始化方法,所述方法包括:
将每种待检测图像对应的样本标签划分到对应的尺度内;
根据每个所述尺度内的样本标签数量阈值,判断是否保留所述尺度;
确定保留的每个尺度下的样本标签面积和宽高情况;
根据所述样本标签面积和宽高情况,确定anchor数量并生成所述尺度下的初始化anchor。
进一步地,将每种待检测图像对应的样本标签划分到对应的尺度内,包括:
根据尺度阈值,将每种待检测图像对应的样本标签划分到对应的尺度内,
所述尺度阈值为样本标签面积范围,所述样本标签面积范围为通过实验获取的能够 对所述尺度下的样本标签有最佳检测结果的范围。
进一步地,根据所述样本标签面积情况,确定anchor数量并生成所述尺度下的初始化anchor,包括:
根据每个尺度下的样本标签面积和宽高情况,通过不同的聚类的距离计算方式和动 态调整anchor数量方法,生成所述尺度下的初始化anchor。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京凌云光技术集团有限责任公司,未经北京凌云光技术集团有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010930363.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种墙壁自动开凿布线的设备
- 下一篇:一种地热暖管铺设防碾压车轮
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序