[发明专利]物体检测方法和装置、神经网络训练方法和装置有效
申请号: | 201710827779.8 | 申请日: | 2017-09-14 |
公开(公告)号: | CN108875482B | 公开(公告)日: | 2022-01-21 |
发明(设计)人: | 何蔚然;周舒畅;冯迭乔 | 申请(专利权)人: | 北京旷视科技有限公司;北京迈格威科技有限公司 |
主分类号: | G06V40/16 | 分类号: | G06V40/16;G06V10/774;G06V10/764;G06V10/82;G06K9/62;G06N3/08 |
代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 张晓明 |
地址: | 100190 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 物体 检测 方法 装置 神经网络 训练 | ||
本公开提供了一种基于神经网络的物体检测方法和装置、用于物体检测的神经网络的训练方法和装置、以及计算机可读存储介质。该神经网络包括输入层、中间层和输出层。物体检测方法包括:获取待检测的图像;经由输入层输入图像;经由中间层中级联的多个计算节点中的每个计算节点的卷积层对输入的数据执行卷积计算以获得中间表示,并对获得的中间表示执行二值化处理;经由所述输出层输出图像的热力图和热力图中每个像素对应的包围框的X通道值,热力图表示图像中的每个像素是否属于检测目标,每个像素对应的包围框用于在图像上标记所述每个像素对应的检测目标;以及根据热力图和热力图中每个像素对应的包围框的X通道值,确定至少一个目标包围框。
技术领域
本公开涉及图像处理领域,更具体地,本公开涉及基于神经网络的物体检测方法和装置、用于物体检测的神经网络的训练方法和装置、以及计算机可读存储介质。
背景技术
神经网络是一种大规模、多参数优化的工具。依靠大量的训练数据,神经网络能够学习出数据中难以总结的隐藏特征,从而完成多项复杂的任务,如人脸检测,物体检测,物体检测,动作追踪,自然语言翻译等。神经网络已被人工智能界广泛应用。
在利用神经网络进行图像物体检测的任务中,与只输出一个类别的普通分类网络不同,物体检测任务中使用的神经网络最后需要返回多通道的与原始图像大小相同的输出图。因此,利用神经网络进行图像物体检测的任务需要占用大量的计算和存储资源。在诸如移动设备这样计算和存储资源有限的应用平台上,利用神经网络进行图像物体检测的任务将导致长延时、功耗和发热量增加,从而使得用户体验劣化。
发明内容
鉴于上述问题而提出了本公开。本公开提供了一种基于神经网络的物体检测方法和装置、用于物体检测的神经网络的训练方法和装置、以及计算机可读存储介质。
根据本公开的一个方面,提供了一种基于神经网络的物体检测方法,其中,所述神经网络包括输入层、中间层和输出层,所述物体检测方法包括:获取待检测的图像;经由所述输入层输入所述图像;经由所述中间层中级联的多个计算节点中的每个计算节点的卷积层对输入的数据执行卷积计算以获得中间表示,并对获得的所述中间表示执行二值化处理;经由所述输出层输出所述图像的热力图和所述热力图中每个像素对应的包围框的X通道值,其中,X的取值为大于或等于2的整数,所述热力图表示所述图像中的每个像素是否属于检测目标,所述每个像素对应的包围框用于在所述图像上标记所述每个像素对应的检测目标;以及根据所述热力图和所述热力图中每个像素对应的包围框的X通道值,确定至少一个目标包围框。
根据本公开的另一个方面,提供了一种用于物体检测的神经网络的训练方法,其中,所述神经网络包括输入层、中间层和输出层,所述训练方法包括:经由所述输入层输入训练图像;经由所述中间层中级联的多个计算节点中的每个计算节点的卷积层对输入的数据执行卷积计算以获得中间表示,并对所述多个计算节点中的至少一个计算节点的中间表示执行二值化处理;经由所述输出层输出训练结果,所述训练结果包括所述训练图像的热力图和所述训练图像的热力图中每个像素对应的包围框的X通道值;以及在所述神经网络的损失函数满足预定条件时,获得训练好的所述神经网络,在所述神经网络的损失函数不满足预定条件时,继续输入训练图像以重复执行上述训练过程,其中所述损失函数是根据所述训练结果确定的。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京旷视科技有限公司;北京迈格威科技有限公司,未经北京旷视科技有限公司;北京迈格威科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710827779.8/2.html,转载请声明来源钻瓜专利网。