[发明专利]物体检测方法和神经网络的训练方法、装置及电子设备有效
申请号: | 201710233770.4 | 申请日: | 2017-04-11 |
公开(公告)号: | CN108230292B | 公开(公告)日: | 2021-04-02 |
发明(设计)人: | 郝泽锟;秦红伟;闫俊杰 | 申请(专利权)人: | 北京市商汤科技开发有限公司 |
主分类号: | G06T7/00 | 分类号: | G06T7/00;G06K9/00;G06N3/08 |
代理公司: | 北京康达联禾知识产权代理事务所(普通合伙) 11461 | 代理人: | 兰淑铎;王方明 |
地址: | 100084 北京市海淀区中*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 物体 检测 方法 神经网络 训练 装置 电子设备 | ||
本发明实施例提供了一种物体检测方法、神经网络的训练方法、装置和电子设备,其中,所述物体检测方法包括:通过用于检测物体尺寸范围的第一神经网络,从待检图像获取物体的尺寸范围的数据;根据所述待检图像中物体的尺寸范围的数据,从所述待检图像检测目标物体。通过本发明实施例,能够在保证对图像中物体的检测精度的同时,还能够减少对图像中物体进行检测的计算量。
技术领域
本发明实施例涉及人工智能技术,尤其涉及一种物体检测方法、装置及电子设备,以及,一种神经网络的训练方法、装置及电子设备。
背景技术
物体检测技术是计算机视觉领域中最重要的技术之一,其被很多其它技术所依赖。物体检测技术以图片作为输入,输出检测到的图片中物体,还可以进一步输出这些物体的位置和大小。其中,图片中物体的位置和大小可以有多种表达方式,例如,物体的外接形状、物体的边界、物体的关键点等。
近年来,基于神经网络的物体检测技术取得了很大的成功,但是过大的计算量限制了物体检测技术的发展和应用。造成基于神经网络的物体检测技术计算量大的原因之一,是神经网络如卷积神经网络自身不具备尺度不变性。尺度不变性指的是针对图片中同一个物体,无论它的分辨率是高是低,神经网络的输出结果均不变的特性。由于在实际应用中,物体在图片中的尺寸难以保持恒定,因此,基于神经网络的物体检测技术一般需要具有多尺度物体检测的能力。
现有的基于神经网络的物体检测技术一般通过两种方式来解决图片中物体尺度的问题。一种方式是通过使用不同尺度的物体图片对神经网络进行训练,来使神经网络在不同尺度的物体上获得相似的检测精度。另一种方式是通过将待检测的图片缩放为多种分辨率,并将每种分辨率的图片通过基于神经网络的物体检测技术进行物体检测,最终将不同分辨率的图片的检测结果合并,实现物体的多尺度检测。
发明内容
本发明实施例的目的在于,提供一种物体检测的技术方案和神经网络训练的技术方案。
根据本发明实施例的第一方面,提供了一种物体检测方法,包括:通过用于检测物体尺寸范围的第一神经网络,从待检图像获取物体的尺寸范围的数据;根据所述待检图像中物体的尺寸范围的数据,从所述待检图像检测目标物体。
可选地,所述根据所述待检图像中物体的尺寸范围的数据,从所述待检图像检测目标物体,包括:通过用于物体检测的第二神经网络,从所述待检图像检测目标物体。
可选地,在通过用于物体检测的第二神经网络,从所述待检图像检测目标物体之前,所述根据所述待检图像中物体的尺寸范围的数据,从所述待检图像检测目标物体,还包括:根据所述第二神经网络的物体尺度检测范围和所述物体的尺寸范围的数据,确定所述待检图像的缩放比例数据;根据所述待检图像的缩放比例数据对所述待检图像进行缩放。
可选地,所述根据所述第二神经网络的物体尺度检测范围和所述物体的尺寸范围的数据,确定所述待检图像的缩放比例数据,包括:分别确定所述物体的尺寸范围的数据的上限和下限以及所述第二神经网络的物体尺度检测范围的上限和下限;将所述物体的尺寸范围的数据的上限和下限分别与所述第二神经网络的物体尺度检测范围的上限和下限进行比较,得到比较结果;根据所述比较结果确定所述待检图像的缩放次数和所述待检图像每次缩放的缩放比例。
可选地,所述待检图像中物体的尺寸范围的数据包括所述待检图像中物体的尺度向量,所述尺度向量的各个元素分别指示所述待检图像中物体的尺寸落入所述元素对应的尺寸范围的概率。
可选地,所述通过用于检测物体尺寸范围的第一神经网络,从待检图像获取物体的尺寸范围的数据之后,所述方法还包括:对所述尺度向量对应的尺度直方图进行平滑,得到平滑后的尺度直方图;从所述经过平滑处理的尺度直方图提取所述待检图像中预测的物体的尺寸与预测的物体的尺寸的置信度的集合;根据所述集合中预测的物体的尺寸的置信度大于预设阈值的物体的尺寸确定最终预测的物体的尺寸。
可选地,所述物体尺度检测范围的最大检测尺寸为所述物体尺度检测范围的最小检测尺寸的两倍。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京市商汤科技开发有限公司,未经北京市商汤科技开发有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710233770.4/2.html,转载请声明来源钻瓜专利网。