[发明专利]目标检测方法、装置、计算机设备和存储介质在审
申请号: | 201811302293.3 | 申请日: | 2018-11-02 |
公开(公告)号: | CN111144398A | 公开(公告)日: | 2020-05-12 |
发明(设计)人: | 黄永祯;曹春水;杨家辉 | 申请(专利权)人: | 银河水滴科技(北京)有限公司 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/46;G06N3/04;G06N3/08 |
代理公司: | 北京华夏泰和知识产权代理有限公司 11662 | 代理人: | 陈英 |
地址: | 100000 北京市密云区经济开*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 目标 检测 方法 装置 计算机 设备 存储 介质 | ||
1.一种目标检测方法,所述方法包括:
将待检测图像输入已训练的卷积神经网络模型中,其中所述已训练的卷积神经网络模型包含多个卷积层和多个输出层,各个所述输出层用于输出不同尺寸的待检测目标;
通过所述已训练的卷积神经网络模型对所述待检测图像进行特征提取,得到对应的特征图;
根据所述特征图从多个所述输出层中选择目标输出层,在所述目标输出层输出待检测目标的识别结果和定位结果。
2.根据权利要求1所述的方法,其特征在于,生成所述已训练的卷积神经网络模型的步骤包括:
构建卷积神经网络模型,所述卷积神经网络模型包含多个卷积层和多个输出层;
获取训练图像集合,所述训练图像集合中的训练图像包含训练目标和所述训练目标所对应的标识信息,所述标识信息包含目标的尺寸信息;
将所述训练图像和对应标识信息输入所述卷积神经网络模型中,获取所述卷积神经网络模型中的各个所述输出层的标准尺寸信息;
当所述卷积神经网络模型学习到所述训练图像的训练目标的尺寸信息,与所述标准尺寸信息匹配时,在与所述标准尺寸信息对应的输出层输出对应的识别结果和定位结果;
根据与各个所述训练目标对应的所述识别结果、所述定位结果和所述标识信息调整所述卷积神经网络模型,直到所述卷积神经网络模型满足预设模型收敛条件,得到所述已训练的卷积神经网络模型。
3.根据权利要求2所述的方法,其特征在于,所述标识信息还包括定位信息和目标类别,所述根据与各个所述训练目标对应的所述识别结果、所述定位结果和所述标识信息调整所述卷积神经网络模型,直到所述卷积神经网络模型满足预设模型收敛条件,得到所述已训练的卷积神经网络模型,包括:
将所述标识信息中的定位信息作为标准输出定位信息;
将所述标识信息中的目标类别作为标准输出类别信息;
计算所述标准输出定位信息与定位结果的定位差异度;
计算所述标准输出类别信息与识别结果的类别差异度;
根据所述定位差异度和所述类别差异度采用梯度下降法调整各个卷积层的参数,更新所述定位差异度和所述类别差异度,直到更新后的所述定位差异度和所述类别差异度满足预设收敛条件,得到所述已训练的卷积神经网络模型。
4.根据权利要求1所述的方法,其特征在于,所述待检测目标包含多个,所述根据所述特征图从多个所述输出层中选择目标输出层,在所述目标输出层输出所述待检测目标的识别结果和定位结果包括:
根据各个所述待检测目标对应的特征图确定各个所述待检测目标对应的视觉模式特征;
根据各个所述待检测目标对应的视觉模式特征确定各个待见目标对应的目标输出层,在与各个所述待检测目标匹配的输出层,输出各个所述待检测目标对应的识别结果和定位结果。
5.根据权利要求1至4任意一项所述的方法,其特征在于,所述已训练的卷积神经网络包含5个输出层。
6.一种目标检测装置,其特征在于,所述装置包括:
图像卷积模块,用于将所述待检测图像输入已训练的卷积神经网络模型中,其中所述已训练的卷积神经网络模型包含多个卷积层和多个输出层,各个所述输出层用于输出不同尺寸的待检测目标,通过所述已训练的卷积神经网络模型对所述待检测图像进行特征提取,得到对应的特征图;
识别定位模块,用于根据所述特征图从多个所述输出层中选择目标输出层,在所述目标输出层输出所述待检测目标的识别结果和定位结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于银河水滴科技(北京)有限公司,未经银河水滴科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811302293.3/1.html,转载请声明来源钻瓜专利网。