[发明专利]一种基于神经网络的目标检测方法、装置有效
申请号: | 202210036200.7 | 申请日: | 2022-01-13 |
公开(公告)号: | CN114067108B | 公开(公告)日: | 2022-04-19 |
发明(设计)人: | 张宁;杨作兴;房汝明;向志宏 | 申请(专利权)人: | 深圳比特微电子科技有限公司 |
主分类号: | G06V10/25 | 分类号: | G06V10/25;G06V10/82;G06N3/04;G06F40/279;G10L25/30 |
代理公司: | 北京德琦知识产权代理有限公司 11018 | 代理人: | 谢安昆;宋志强 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 神经网络 目标 检测 方法 装置 | ||
本申请公开了一种基于神经网络的目标检测方法,所述神经网络对输入数据进行目标检测,对神经网络卷积运算输出结果中特征点的特征值,进行第一操作,其中,第一操作用于对特征值的组织形式进行处理,基于第一操作的结果,计算特征点的置信度;按照特征点在第一操作结果中的第一位置信息,通过所述第一操作的反向操作,得到所述特征点在卷积运算输出结果中的第二位置信息,将特征点的置信度、以及特征点的第二位置信息输出,得到目标检测结果。本申请减少了检测过程中的算力消耗。
技术领域
本发明涉及深度学习领域,特别地,涉及一种基于神经网络的目标检测方法、装置。
背景技术
在机器学习和深度学习中,基于神经网络的目标检测有着广泛的应用。尽管基于神经网络的目标检测效果好,但依赖于大量的计算量,这导致了在硬件上对算力和带宽的消耗。
以深度学习检测网络中的一段式多目标检测方法(SSD,Single Shot Multi-BoxDetector)为例。参见图1所示,图1为SSD神经网络结构的一种示意图。SSD的神经网络结构包括基础网络和金字塔网络。基础网络是视觉几何组(Visual Geometry Group,VGG)例如VGG-16的前4层网络。金字塔网络是特征图逐渐变小的简单卷积网络。SSD的检测包括两路,一路是特征点的置信度(confidence)计算,另一路是特征点的坐标位置的计算。
虽然置信度和坐标位置的计算共享骨干(backbone)网络,但由于置信度和坐标位置本身特性的差异,所以相当一部分的计算是独立的。不论是置信度的计算,还是坐标位置的计算,都需要耗费大量的算力和带宽。
发明内容
本发明提供了一种基于神经网络的目标检测方法、装置,以节省检测过程中的算力。
本发明第一方面提供一种基于神经网络的目标检测方法,所述神经网络对输入数据进行目标检测, 包括:
对神经网络中卷积运算输出结果中特征点的特征值,进行第一操作,其中,第一操作用于对特征值的组织形式进行处理,
基于第一操作的结果,计算特征点的置信度;
按照特征点在第一操作结果中的第一位置信息,通过所述第一操作的反向操作,得到所述特征点在卷积运算输出结果中的第二位置信息,
将特征点的置信度、以及特征点的第二位置信息输出,得到目标检测结果。
较佳地,该方法进一步包括,
从所述特征点中挑选出置信度大于设定置信度阈值的特征点,得到第一特征点,
所述按照特征点在第一操作结果中的第一位置信息,通过所述第一操作的反向操作,得到所述特征点在卷积运算输出结果中的第二位置信息,包括,
按照所述第一特征点在第一操作结果中的第一位置信息,通过所述第一操作的反向操作,得到所述第一特征点在卷积运算输出结果中的第二位置信息。
较佳地,所述对神经网络中卷积运算输出结果中特征点的特征值,进行第一操作,包括:
将卷积运算输出结果中特征点的特征值,进行重排操作,所述重排操作用于将高维矩阵中特征值进行维度位置交换;
将重排操作的结果,进行平铺操作,所述平铺操作用于将高维矩阵中每一维度的特征值分别展开为一维数组,
将平铺操作的结果,进行合并操作,所述合并操作用于将每维数组合并。
较佳地,所述按照所述第一特征点在第一操作结果中的第一位置信息,通过所述第一操作的反向操作,得到所述第一特征点在卷积运算输出结果中的第二位置信息,包括,
根据第一特征点在合并操作结果中的第一位置信息,确定第一特征点在平铺操作结果中的位置信息,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳比特微电子科技有限公司,未经深圳比特微电子科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210036200.7/2.html,转载请声明来源钻瓜专利网。