[发明专利]一种用于自动驾驶系统的道路目标识别方法有效
申请号: | 201910454059.0 | 申请日: | 2019-05-28 |
公开(公告)号: | CN110197152B | 公开(公告)日: | 2022-08-26 |
发明(设计)人: | 徐小龙;赵家瀚;朱曼;李洋;柳林青 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G06V20/58 | 分类号: | G06V20/58;G06V10/80;G06V10/774;G06K9/62 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 柏尚春 |
地址: | 210003 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 自动 驾驶 系统 道路 目标 识别 方法 | ||
本发明公开了一种用于自动驾驶系统的道路目标识别方法,包括如下步骤:调整输入图片大小;通过主干网络提取图片特征;通过扩张卷积模块进行下采样;基于部分特征图构建特征金字塔结构;在特征金字塔结构和下采样所得的尺度不同的特征图上生成锚框;将图片通过网络得到边界框相对于锚框的偏移值,对其进行解码得到边界框;对这些边界框进行降序排列和非极大值抑制得到最终检测识别结果;在训练部分,利用平滑化的绝对值损失函数和平衡前背景样本类别的加权平均损失函数对该网络进行训练。本发明显著增大了网络浅层的感受野,满足了识别小目标时对空间分辨率的需求;本发明充分利用全部的前背景样本来训练网络,具有很好的普适性和广泛的应用前景。
技术领域
本发明涉及目标识别技术领域,具体涉及一种用于自动驾驶系统的道路目标识别方法。
背景技术
目标识别一直是计算机视觉中的一个重要问题,它的主要任务是通过计算,自动完成对一张图片中感兴趣目标的位置和类别的预测。目标识别在很多方面都有着重要的应用,其中就包括自动驾驶技术:在自动驾驶场景下进行行人、车辆、交通标志、交通信号灯等目标的识别,以应对复杂的路况以及突发事件,保证行车安全。
特征提取是传统目标识别技术中的关键,特征的质量往往可以很大程度上决定最终目标识别算法性能。不同的任务常常需要对特征有着不同的要求,也因此没有一种万能、通用的特征。
而近年来基于深度学习技术的目标识别方法通过训练网络使得模型自主学习特征,使得识别精度大幅度提升,其中包括:基于区域建议的两阶段算法Faster R-CNN,R-FCN等;基于回归的单阶段算法,如YOLO,SSD等。
然而,由于实际场景中目标物体的各种形变、尺度变化、姿态变化以及背景光照、角度、天气等复杂的环境因素,目标识别仍是一个具有挑战的任务。现有的目标识别方法在精确性以及实时性方面仍有上升空间。
发明内容
发明目的:针对现有技术存在的问题,本发明的目的是提供一种用于自动驾驶系统的道路目标识别方法,以提高自动驾驶场景下的目标识别的精确性和实时性。
技术方案:一种用于自动驾驶系统的道路目标识别方法,包括如下步骤:
步骤1、调整输入图片的尺寸,使其适配网络模型;
步骤2、采用主干网络提取图片特征;优选的,所述主干网络采用50层残差网络。
步骤3、通过扩张卷积模块进行下采样操作;
步骤4、利用主干网络和下采样所得特征图构建特征金字塔结构;
步骤5、在特征金字塔结构中的特征图和下采样所得的尺度不同的特征图上生成大小比例不同的锚框;
步骤6、根据边界框相对于锚框的偏移值,对图片进行解码,得到边界框;
步骤7、依照网络预测得分对边界框进行降序排列和非极大值抑制,得到模型预测的目标边界框;
步骤8、在训练部分,利用平滑化绝对值损失函数和平衡前背景样本类别的加权平均损失函数的加权和作为损失函数,对步骤1至步骤5所述网络进行训练。
进一步的,所述步骤2中,保留50层残差网络的C1、C2、C3、C4层;所述C1层为第一个卷积块的输出特征图,所述C2层为第一组残差块的输出特征图,所述C3层为第二组残差块的输出特征图,所述C4层为第三组残差块的输出特征图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910454059.0/2.html,转载请声明来源钻瓜专利网。