[发明专利]目标检测方法、装置、电子设备和存储介质在审
申请号: | 202110428029.X | 申请日: | 2021-04-21 |
公开(公告)号: | CN112926551A | 公开(公告)日: | 2021-06-08 |
发明(设计)人: | 刘伟峰;程云建;刘旭 | 申请(专利权)人: | 北京京东乾石科技有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/32;G06T7/13;G06K9/34;G06K9/46;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京律智知识产权代理有限公司 11438 | 代理人: | 孙宝海;袁礼君 |
地址: | 100176 北京市大兴区北京经济技*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 目标 检测 方法 装置 电子设备 存储 介质 | ||
1.一种目标检测方法,其特征在于,包括:
获取具有待检测目标的图像;
基于主干网络提取所述图像中的图像特征;
将所述图像特征输入分割模型,以由所述分割模型输出对所述待检测目标的分割特征;
基于所述图像特征生成包括所述待检测目标的目标边缘的边缘图像;
将所述边缘图像与所述分割特征进行融合,得到融合特征,基于所述融合特征确定检测到的所述目标。
2.根据权利要求1所述的目标检测方法,其特征在于,所述分割模型包括目标分类模型、目标包围框预测模型和目标分割掩膜预测模型,所述将所述图像特征输入分割模型,以由所述分割模型输出对所述待检测目标的分割特征包括:
基于所述目标分类模型对所述图像特征进行分类,以区分所述待检测目标的区域和背景区域;
在所述待检测目标的区域,基于所述目标包围框预测模型得到所述待检测目标的包围框特征;
在所述包围框特征对应的包围框内,基于所述目标分割掩膜预测模型,得到所述待检测目标的分割掩膜;
基于所述包围框特征和所述分割掩膜生成所述分割特征。
3.根据权利要求2所述的目标检测方法,其特征在于,所述基于所述目标分类模型对所述图像特征进行分类,以区分所述待检测目标的区域和背景区域包括:
将所述图像特征输入区域生成网络,并输出候选区域;
基于双线性插值法对所述图像特征和所述候选区域进行聚集,得到聚集特征;
将所述聚集特征输入到所述目标分类模型,以输出所述待检测目标的区域和所述背景区域。
4.根据权利要求2所述的目标检测方法,其特征在于,所述将所述边缘图像与所述分割特征进行融合,得到融合特征包括:
基于所述包围框特征和所述边缘图像之间的位置映射关系,在所述边缘图像中提取边缘数据;
将所述边缘数据与所述分割掩膜进行融合,得到融合掩膜,将所述融合掩膜确定为所述融合特征。
5.根据权利要求4所述的目标检测方法,其特征在于,所述将所述边缘数据与所述分割掩膜进行融合,得到融合掩膜包括:
在检测到所述包围框特征对应的区域内任一像素的掩膜值非0,而所述任一像素在所述边缘数据中的边缘分类值也非0时,将所述任一像素的掩膜值修改为0,以基于修改结果得到所述融合掩膜。
6.根据权利要求5所述的目标检测方法,其特征在于,所述基于所述融合特征确定检测到的所述目标包括:
对所述融合特征进行连通区域分析,基于所述连通区域分析的结果确定检测到的所述目标。
7.根据权利要求6所述的目标检测方法,其特征在于,所述对所述融合特征进行连通区域分析,基于所述连通区域分析的结果确定检测到的所述目标包括:
对所述融合掩膜进行所述连通区域分析;
基于所述连通区域分析的结果确定最大的连通区域;
将所述最大的连通区域确定为目标掩膜;
基于所述目标掩膜的包围框确定检测到的所述目标。
8.根据权利要求1至7中任一项所述的目标检测方法,其特征在于,所述主干网络包括基于卷积的编码-解码神经网络的编码器,所述基于主干网络提取所述图像中的图像特征包括:
将所述图像输入所述编码器,以输出所述图像的图像特征。
9.根据权利要求8所述的目标检测方法,其特征在于,所述基于所述图像特征生成包括所述待检测目标的目标边缘的边缘图像包括:
将所述图像特征输入所述编码-解码神经网络中的解码器,以基于所述解码器执行边缘图像预测操作;
基于所述边缘图像预测操作的预测结果,得到所述待检测目标的边缘图像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东乾石科技有限公司,未经北京京东乾石科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110428029.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种注塑机用光轴淬火机床
- 下一篇:一种基于语义分割的磨粒图像分类方法及装置