[发明专利]目标检测方法、装置、电子设备及可读存储介质有效
申请号: | 202110790334.3 | 申请日: | 2021-07-13 |
公开(公告)号: | CN113486908B | 公开(公告)日: | 2023-08-29 |
发明(设计)人: | 张凯;谭文明;李哲暘;张如意 | 申请(专利权)人: | 杭州海康威视数字技术股份有限公司 |
主分类号: | G06V10/44 | 分类号: | G06V10/44;G06N3/0464;G06N3/08;G06V10/82 |
代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 杨春香 |
地址: | 310051 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 目标 检测 方法 装置 电子设备 可读 存储 介质 | ||
本申请提供一种目标检测方法、装置、电子设备及可读存储介质,该目标检测方法包括:获取待检测图像的多尺度特征;所述多尺度特征包括至少两个不同尺度的特征图;依据所述多尺度特征,分别生成各尺度的第一类型卷积核;分别依据各尺度的第一类型卷积核,对对应尺度的特征图进行特征融合,得到各尺度的特征融合后的特征图;分别对各尺度的特征融合后的特征图进行目标检测。该方法可以提高目标检测的准确性。
技术领域
本申请涉及计算机视觉技术领域,尤其涉及一种目标检测方法、装置、电子设备及可读存储介质。
背景技术
卷积神经网络通过逐层抽象的方式来提取目标的特征。高层网络的感受野比较大,语义信息表征能力强,但是特征图的分辨率低,几何信息的表征能力弱(空间几何特征细节缺乏);低层网络的感受野比较小,几何细节信息表征能力强,虽然分辨率高,但是语义信息表征能力弱。
因此,在利用卷积神经网络进行目标检测和分割等任务时,可以多尺度特征融合的方式来提高准确性。
以利用特征金字塔网络(Feature Pyramid Network,简称FPN)进行多尺度特征融合为例,基于多尺度特征融合的目标检测方法流程可以如下:
1、将图像输入主干网络,获得多尺度的特征;
2、将多尺度特征输入到金字塔网络,得到融合后的特征;
3、在融合后的特征上回归目标框。
然而实践发现,上述方案中进行多尺度特征融合(即利用FPN进行多尺度特征融合)时,仅仅是在特征层面,对不同尺度特征进行了简单地元素相加(eltwise-add)或者拼接操作(concat)等操作,性能较差。
发明内容
有鉴于此,本申请提供一种目标检测方法、装置、电子设备及可读存储介质。
具体地,本申请是通过如下技术方案实现的:
根据本申请实施例的第一方面,提供一种目标检测方法,包括:
获取待检测图像的多尺度特征;所述多尺度特征包括至少两个不同尺度的特征图;
依据所述多尺度特征,分别生成各尺度的第一类型卷积核,其中,所述第一类型卷积核包括多尺度信息;
分别依据各尺度的第一类型卷积核,对对应尺度的特征图进行特征融合,得到各尺度的特征融合后的特征图;
分别对各尺度的特征融合后的特征图进行目标检测。
根据本申请实施例的第二方面,提供一种目标检测装置,包括:
获取单元,用于获取待检测图像的多尺度特征;所述多尺度特征包括至少两个不同尺度的特征图;
生成单元,用于依据所述多尺度特征,分别生成各尺度的第一类型卷积核,其中,所述第一类型卷积核包括多尺度信息;
特征融合单元,用于分别依据各尺度的第一类型卷积核,对对应尺度的特征图进行特征融合,得到各尺度的特征融合后的特征图;
检测单元,用于分别对各尺度的特征融合后的特征图进行目标检测。
根据本申请实施例的第三方面,提供一种电子设备,包括处理器和机器可读存储介质,所述机器可读存储介质存储有能够被所述处理器执行的机器可执行指令,所述处理器用于执行机器可执行指令,以实现上述目标检测方法。
根据本申请实施例的第四方面,提供一种机器可读存储介质,所述机器可读存储介质内存储有机器可执行指令,所述机器可执行指令被处理器执行时实现上述目标检测方法。
本申请提供的技术方案至少可以带来以下有益效果:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州海康威视数字技术股份有限公司,未经杭州海康威视数字技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110790334.3/2.html,转载请声明来源钻瓜专利网。