[发明专利]一种用于自动驾驶系统的道路目标识别方法有效
申请号: | 201910454059.0 | 申请日: | 2019-05-28 |
公开(公告)号: | CN110197152B | 公开(公告)日: | 2022-08-26 |
发明(设计)人: | 徐小龙;赵家瀚;朱曼;李洋;柳林青 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G06V20/58 | 分类号: | G06V20/58;G06V10/80;G06V10/774;G06K9/62 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 柏尚春 |
地址: | 210003 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 自动 驾驶 系统 道路 目标 识别 方法 | ||
1.一种用于自动驾驶系统的道路目标识别方法,其特征在于,包括如下步骤:
步骤1、调整输入图片的尺寸,使其适配网络模型;
步骤2、采用主干网络提取图片特征;
步骤3、通过扩张卷积模块进行下采样操作;
步骤4、利用主干网络和下采样所得特征图构建特征金字塔结构;
步骤5、在特征金字塔结构中的特征图和下采样所得的尺度不同的特征图上生成大小比例不同的锚框;
步骤6、根据边界框相对于锚框的偏移值,对图片进行解码,得到边界框;
步骤7、依照网络预测得分对边界框进行降序排列和非极大值抑制,得到模型预测的目标边界框;
步骤8、在训练部分,利用平滑化绝对值损失函数和平衡前背景样本类别的加权平均损失函数的加权和作为损失函数,对步骤1至步骤5所述网络进行训练。
2.根据权利要求1所述的用于自动驾驶系统的道路目标识别方法,其特征在于:所述步骤2中,所述主干网络采用50层残差网络。
3.根据权利要求2所述的用于自动驾驶系统的道路目标识别方法,其特征在于:保留50层残差网络的C1、C2、C3、C4层;所述C1层为第一个卷积块的输出特征图,所述C2层为第一组残差块的输出特征图,所述C3层为第二组残差块的输出特征图,所述C4层为第三组残差块的输出特征图。
4.根据权利要求1所述的用于自动驾驶系统的道路目标识别方法,其特征在于:所述步骤3中,扩张卷积模块包括3个残差模块,各残差模块包括主路径和副路径;
所述主路径依次为:卷积核为1×1的卷积,卷积核为3×3、扩张率为2的扩张卷积,卷积核为1×1的卷积;通道数恒为256,3个卷积之间使用线性整流函数作为激活函数;
所述副路径将残差模块输入通过卷积核为1×1的卷积,并和主路径输出做元素级别加法,得到残差模块输出;特征图的大小在扩张卷积模块中保持不变。
5.根据权利要求1所述的用于自动驾驶系统的道路目标识别方法,其特征在于:所述步骤3中,下采样操作由连续6个卷积核为3×3、步幅为2的卷积堆叠实现。
6.根据权利要求1所述的用于自动驾驶系统的道路目标识别方法,其特征在于:所述步骤4中,所述特征金字塔结构由特征图通过横向连接和双线性插值上采样,自顶向下做特征融合所得。
7.根据权利要求6所述的用于自动驾驶系统的道路目标识别方法,其特征在于:所述特征融合包括连结和元素级别加法两个操作。
8.根据权利要求1所述的用于自动驾驶系统的道路目标识别方法,其特征在于:所述步骤5中,按照如下规则生成大小比例不同的锚框:
选取7个用于预测的特征图,在其上生成锚框,锚框面积分别设为{322,642,1282,2562,3412,4262,5122},在每个特征图上以每个像素点为中心生成锚框,锚框宽高比设置为{1:2,1:1,2:1},而对于每种宽高比的锚框,设置其大小为{20,21/3,22/3}。
9.根据权利要求1所述的用于自动驾驶系统的道路目标识别方法,其特征在于,所述步骤8中,损失函数L(x,c,l,g)为:
式中,Lloc为平滑化绝对值损失函数,Lconf为平衡前背景样本类别的加权平均损失函数;
所述Lloc为:
其中,i为预测框序号;j为真实框序;表示第i个预测框和第j个真实框关于类别k是否匹配;所述smoothL1为:
为预测框位置信息,为真实框相对于锚框的编码位置信息,二者都由框的中心点横坐标cx、纵坐标cy、框的宽w、高h所确定;
所述Lconf为:
其中,为预测框关于类别的置信度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910454059.0/1.html,转载请声明来源钻瓜专利网。