[发明专利]目标对象识别方法、装置、存储介质和设备有效
| 申请号: | 201910892639.8 | 申请日: | 2019-09-20 |
| 公开(公告)号: | CN110647893B | 公开(公告)日: | 2022-04-05 |
| 发明(设计)人: | 赵梦傲;张骞;王国利;苏治中;晏梦佳;徐梓宁 | 申请(专利权)人: | 北京地平线机器人技术研发有限公司 |
| 主分类号: | G06V10/44 | 分类号: | G06V10/44;G06V10/774;G06V10/82;G06K9/62 |
| 代理公司: | 北京思源智汇知识产权代理有限公司 11657 | 代理人: | 毛丽琴 |
| 地址: | 100080 北京*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 目标 对象 识别 方法 装置 存储 介质 设备 | ||
1.一种目标对象识别方法,包括:
将待识别图像提供给用于目标对象识别的神经网络;
在通过所述神经网络对所述待识别图像执行特征提取处理操作的过程中,根据所述神经网络中的分组卷积层对应的卷积分组数,对所述分组卷积层的输入特征进行分组卷积处理,得到所述分组卷积层的输出特征;其中,所述分组卷积层对应的卷积分组数是根据所述分组卷积层的输入特征通道数和分组基数确定的;
在通过所述神经网络对所述待识别图像执行特征提取处理操作的过程中,对第二逐点卷积层的输出特征进行压缩并激活处理,其中,所述第二逐点卷积层的输入特征为第二分组卷积层的输出特征,所述第二分组卷积层的输入特征为第一逐点卷积层的输出特征,所述第一逐点卷积层的输入特征为第一分组卷积层的输出特征;将所述第一分组卷积层的输入特征与所述压缩并激活处理后的特征进行逐元素相加,获得第一特征;对所述第一特征进行第一非线性变换,获得第二特征;其中,所述第二特征被作为所述神经网络中的位于所述第一非线性变换之后的处理的输入特征;
根据所述神经网络的输出,获得所述待识别图像的目标对象特征向量;
基于所述特征向量,识别所述待识别图像中的目标对象。
2.根据权利要求1所述的方法,其中,所述方法还包括:
在通过所述神经网络对所述待识别图像执行特征提取处理操作的过程中,将所述分组卷积层的输出特征作为所述神经网络中的逐点卷积层的输入特征,并对所述逐点卷积层的输入特征进行逐点卷积处理,得到所述逐点卷积层的输出特征。
3.根据权利要求1所述的方法,其中,
所述第一分组卷积层的输入特征的通道数与所述第一分组卷积层的输出特征的通道数不相同;
所述第一逐点卷积层的输入特征的通道数与所述第一逐点卷积层的输出特征的通道数不相同;
所述第二分组卷积层的输入特征的通道数与所述第二分组卷积层的输出特征的通道数不相同;
所述第二逐点卷积层的输入特征的通道数与所述第二逐点卷积层的输出特征的通道数不相同;
所述第二特征与所述第一分组卷积层的输入特征具有相同的空间分辨率和通道数。
4.根据权利要求1至3中任一项所述的方法,其中,所述方法还包括:
在通过所述神经网络对所述待识别图像执行特征提取处理操作的过程中,将第三逐点卷积层的输出特征和第四逐点卷积层的输出特征进行逐元素相加,获得第三特征;其中,所述第三逐点卷积层的输入特征为第三分组卷积层的输出特征,所述第四逐点卷积层的输入特征为第四分组卷积层的输出特征;
对所述第三特征进行第二非线性变换,获得第四特征;其中,所述第四特征被作为第六分组卷积层的输入特征,所述第六分组卷积层的输出特征被作为第六逐点卷积层的输入特征;
将第五逐点卷积层的输出特征和第六逐点卷积层的输出特征进行逐元素相加,获得第五特征;其中,所述第五逐点卷积层的输入特征为第五分组卷积层的输出特征,所述第三分组卷积层、第四分组卷积层和第五分组卷积层的输入特征相同;
对所述第五特征进行第三非线性变换,获得第六特征;
其中,所述第六特征被作为所述神经网络中的位于所述第三非线性变换之后的处理的输入特征。
5.根据权利要求4所述的方法,其中,所述第三分组卷积层、第四分组卷积层和第五分组卷积层的输入特征的空间分辨率高于所述第五特征的空间分辨率,所述第三分组卷积层、第四分组卷积层和第五分组卷积层的输入特征的通道数低于所述第五特征的通道数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京地平线机器人技术研发有限公司,未经北京地平线机器人技术研发有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910892639.8/1.html,转载请声明来源钻瓜专利网。





