[发明专利]物体检测方法、网络训练方法、装置和计算机存储介质有效
申请号: | 201810143218.0 | 申请日: | 2018-02-11 |
公开(公告)号: | CN108388859B | 公开(公告)日: | 2022-04-15 |
发明(设计)人: | 岳晓宇;旷章辉;张兆阳;陈振方;张伟 | 申请(专利权)人: | 深圳市商汤科技有限公司 |
主分类号: | G06V10/25 | 分类号: | G06V10/25;G06V20/40;G06N3/08 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 李梅香;张颖玲 |
地址: | 518057 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 物体 检测 方法 网络 训练 装置 计算机 存储 介质 | ||
本发明实施例公开了一种基于深度学习的物体检测方法、网络训练方法、装置和计算机存储介质。所述检测方法包括:基于第一图像数据和区域估计网络,获得第二图像数据,所述第二图像数据包括所述第一图像数据中待检测物体的估计区域;将所述第一图像数据和所述第二图像数据输入物体检测网络,以使所述物体检测网络基于所述估计区域对所述第一图像数据进行检测,获得所述第一图像数据中所述待检测物体的实际区域。
技术领域
本发明涉及图像处理技术领域,具体涉及一种基于深度学习的物体检测方法、网络训练方法、装置和计算机存储介质。
背景技术
物体检测是计算机视觉领域的重要问题之一,在多种任务诸如自动驾驶、场景分析、人脸分析中有着重要的应用。随着目前深度学习技术的大规模落地,检测算法的运行平台有可能是性能比较低的手机或者嵌入式平台,过慢的检测速度或者过差的检测效果必然会降低用户体验。
发明内容
为解决现有存在的技术问题,本发明实施例提供一种基于深度学习的物体检测方法、网络训练方法、装置和计算机存储介质。
本发明实施例的技术方案是这样实现的:
本发明实施例提供了一种基于深度学习的物体检测方法,所述方法包括:
基于第一图像数据和区域估计网络,获得第二图像数据,所述第二图像数据包括所述第一图像数据中待检测物体的估计区域;
将所述第一图像数据和所述第二图像数据输入物体检测网络,以使所述物体检测网络基于所述估计区域对所述第一图像数据进行检测,获得所述第一图像数据中所述待检测物体的检测区域。
上述方案中,所述方法还包括:
获得用于网络训练的第四图像数据,以及所述第四图像数据中包括的标注区域对应的标注信息;所述标注区域表征所述第四图像数据中物体所在区域;
采用包含有向卷积层的卷积神经网络对携带有标注区域的所述第四图像数据、所述标注区域对应的标注信息进行训练,获得物体检测网络,所述卷积神经网络用于在训练过程中对所述第四图像数据的标注区域进行计算处理。
上述方案中,所述采用包含有向卷积层的卷积神经网络对携带有标注区域的所述第四图像数据、所述标注区域对应的标注信息进行训练,获得物体检测网络,包括:
确定除所述标注区域以外的背景区域的部分背景区域;所述部分背景区域采用随机方式从所述背景区域中确定;
将所述部分背景区域添加至所述标注区域,生成所述第三图像数据的更新标注区域;
基于有向卷积层分别识别所述第四图像数据中的标注区域和更新标注区域,对所述标注区域中的图像数据以及对应的标注信息进行训练,以及对所述更新标注区域中的图像数据以及对应的标注信息进行训练,获得物体检测网络。
上述方案中,所述基于第一图像数据和区域估计网络,获得第二图像数据,包括:
对所述第一图像数据进行卷积处理,获得所述第一图像数据对应的第一特征图;
将所述特征图输入至少一个池化层,获得与所述特征图的尺度不同的至少一个第二特征图;
对具有不同尺度的所述第一特征图、所述至少一个第二特征图分别进行卷积处理,对卷积处理后的所述第一特征图、所述至少一个第二特征图进行融合,输出携带有标识待检测物体的估计区域的第二图像数据。
上述方案中,所述输出携带有标识待检测物体的估计区域的第二图像数据,包括:
对融合后的所述第一特征图、所述至少一个第二特征图进行二值化处理,输出二值化表示的携带有标识待检测物体的估计区域的第二图像数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市商汤科技有限公司,未经深圳市商汤科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810143218.0/2.html,转载请声明来源钻瓜专利网。