[发明专利]目标检测方法、装置、计算机设备和存储介质在审
申请号: | 201811302293.3 | 申请日: | 2018-11-02 |
公开(公告)号: | CN111144398A | 公开(公告)日: | 2020-05-12 |
发明(设计)人: | 黄永祯;曹春水;杨家辉 | 申请(专利权)人: | 银河水滴科技(北京)有限公司 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/46;G06N3/04;G06N3/08 |
代理公司: | 北京华夏泰和知识产权代理有限公司 11662 | 代理人: | 陈英 |
地址: | 100000 北京市密云区经济开*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 目标 检测 方法 装置 计算机 设备 存储 介质 | ||
本申请涉及一种目标检测方法、装置、计算机设备和存储介质,所述方法包括:将待检测图像输入已训练的卷积神经网络模型中,通过已训练的卷积神经网络模型对待检测图像进行特征提取,得到对应的特征图,根据特征图从多个输出层中选择目标输出层,在目标输出层输出待检测目标的识别结果和定位结果。通过设置多个输出层,每个输出层用于输出不同尺寸的检测目标,提升模型的检测能力,根据目标的尺寸来选择输出层使得网络的检测更具有针对性,从而提升目标检测的精确度。
技术领域
本申请涉及计算机视觉领域,尤其涉及一种目标检测方法、装置、计算机设备和存储介质。
背景技术
随着计算机视觉技术的发展,计算机视觉技术被应用到各个技术领域中。计算机视觉最主要的是图像数据处理,图像中感兴趣目标物的实时高精度检测具有重要的应用价值。目标物检测的速度和精度受到下面几个方面的影响:(1)目标物尺度大小不确定,模型需要支持各种尺度的目标物检测;(2)模型结构的设计和学习策略的制定,不同的网络结构和学习策略千差万别。
近期提出的single shot multibox detector(SSD)实现了较高精度较高速度的目标物检测,它通过在深度卷积神经网络的多个特征层添加识别和定位环节一定程度上实现了覆盖多个尺度的目标检测,通过在每个尺度上设置各种不同的锚框,在锚框上同时学习物体类别分类和坐标回归实现模型的学习。但是由于锚框的设置缺乏精确有效的方法进行度量,导致检测精度受到影响。
发明内容
为了解决上述技术问题,本申请提供了一种目标检测方法、装置、计算机设备和存储介质。
一种目标检测方法,包括:
将待检测图像输入已训练的卷积神经网络模型中,其中已训练的卷积神经网络模型包含多个卷积层和多个输出层,各个输出层用于输出不同尺寸的待检测目标;
通过已训练的卷积神经网络模型对待检测图像进行特征提取,得到对应的特征图;
根据特征图从多个输出层中选择目标输出层,在目标输出层输出待检测目标的识别结果和定位结果。
一种目标检测装置,包括:
图像卷积模块,用于将待检测图像输入已训练的卷积神经网络模型中,其中已训练的卷积神经网络模型包含多个卷积层和多个输出层,各个输出层用于输出不同尺寸的待检测目标,通过已训练的卷积神经网络模型对待检测图像进行特征提取,得到对应的特征图;
识别定位模块,用于根据特征图从多个输出层中选择目标输出层,在目标输出层输出待检测目标的识别结果和定位结果。
一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
将待检测图像输入已训练的卷积神经网络模型中,其中已训练的卷积神经网络模型包含多个卷积层和多个输出层,各个输出层用于输出不同尺寸的待检测目标;
通过已训练的卷积神经网络模型对待检测图像进行特征提取,得到对应的特征图;
根据特征图从多个输出层中选择目标输出层,在目标输出层输出待检测目标的识别结果和定位结果。
一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
将待检测图像输入已训练的卷积神经网络模型中,其中已训练的卷积神经网络模型包含多个卷积层和多个输出层,各个输出层用于输出不同尺寸的待检测目标;
通过已训练的卷积神经网络模型对待检测图像进行特征提取,得到对应的特征图;
根据特征图从多个输出层中选择目标输出层,在目标输出层输出待检测目标的识别结果和定位结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于银河水滴科技(北京)有限公司,未经银河水滴科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811302293.3/2.html,转载请声明来源钻瓜专利网。