[发明专利]一种基于语义分割的野外道路车辆行驶偏转角计算方法在审
申请号: | 202310096638.9 | 申请日: | 2023-02-10 |
公开(公告)号: | CN116342874A | 公开(公告)日: | 2023-06-27 |
发明(设计)人: | 孙莹伊;孔亚广;郑小青;邹洪波 | 申请(专利权)人: | 杭州电子科技大学 |
主分类号: | G06V10/26 | 分类号: | G06V10/26;G06V10/82;G06N3/0464;G06N3/08;G06V10/80;G06N3/048 |
代理公司: | 杭州奥创知识产权代理有限公司 33272 | 代理人: | 王佳健 |
地址: | 310018 浙*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 语义 分割 野外 道路 车辆 行驶 偏转 计算方法 | ||
本发明公开了一种基于语义分割的野外道路车辆行驶偏转角计算方法。本发明首先收集不同季节以及不同光照强度下的野外道路图片,并对道路区域以及非道路区域进行标注。其次构建并训练由信息共享层、双路语义推理层、细节引导模块以及聚合层组成的语义分割网络模型。然后对相机进行相机畸变矫正,将矫正图片输入到训练好的模型中获得野外道路分割结果图。最后提取分割结果中野外道路的中线,计算偏转角。本发明使网络在保证实时性的同时对野外道路的分割精度有了进一步的提高,并且解决了整体网络算法的实际落地可用性以及由于输入图像存在畸变导致网络计算结果欠佳的问题。
技术领域
本发明属于无人车在野外道路下的行驶偏转角计算方法领域,尤其是一种基于语义分割的野外道路车辆行驶偏转角计算方法。
背景技术
为了提高车辆安全性以及驾驶体验,基于人工智能的自动驾驶技术开始辅助并逐渐替代手动驾驶。作为自动驾驶技术的核心,道路检测技术虽然在以结构化道路为主的城市道路上表现优异,但在野外环境下的鲁棒性仍有待提高。作为非结构化道路中的极端特例,野外道路存在路面特征复杂、道路边界模糊、背景干扰特征与路面相似等特点。基于模型和特征的道路识别方法在识别非结构化道路时存在着泛化能力弱,鲁棒性差等问题。而基于目前主流的语义分割网络在识别城市道路上表现优异,但在野外道路环境下的表现并非最优且实时性较差。
发明内容
本发明针对上述问题及技术需求,提出了一种基于语义分割的野外道路车辆行驶偏转角计算方法。本发明采用信息共享层以促进语义分割网络模型中的双流网络(双路语义推理层)特征参数在浅层进行信息交流;利用多信息拼接模块来缓解浅层信息在网络深层丢失的问题;构建双路语义推理层以增强网络的上下文信息提取能力;添加细节引导模块以促进网络对道路细节特征的捕获;最后使用相机畸变矫正算法和透视变换等方法在无人车上实现了输入图像与小车沿道路行驶所需偏转角度的换算。解决了传统基于模型和特征的道路识别方法泛化能力弱的问题,并且相较于主流语义分割网络其更能适应野外环境下的道路精确识别且检测速度更快。
本发明的技术方案包括如下步骤:
步骤1:数据集收集与图片标注。收集不同季节以及不同光照强度下的野外道路图片,并对所有图片中的道路区域以及非道路区域进行人工标注。随后划分出训练集、验证集以及测试集。
步骤2:构建语义分割网络模型。该网络模型主要由信息共享层、双路语义推理层、细节引导模块以及聚合层组成。使用到的标准卷积层若没有特别指出,其卷积核大小均为3×3。标准卷积层由卷积层、批标准化层以及ReLU激活函数组成。
(1)信息共享层总共三层,第一层由两个标准卷积层组成:第一个标准卷积层的输入通道为3,输出通道为32,步长为2;第二个标准卷积层的输入通道为32,输出通道也为32,步长为1。信息共享层的第二层由三个标准卷积层组成:第一个标准卷积层的输入通道为32,输出通道为64,步长为2;第二个标准卷积层的输入通道为64,输出通道也为64,步长为1;第三个标准卷积层的结构与第二层的相同。信息共享层的第三层也由三个标准卷积层组成:第一个标准卷积层的输入通道为64,输出通道为128,步长为2;第二个标准卷积层的输入通道为128,输出通道也为128,步长为1;第三个标准卷积层的结构与第二个的相同。
(2)双路语义推理层分为空间分支和语义分支两部分。空间分支对输入特征图不进行任何处理,直接输出。语义分支主要由8层组成:第一层为标准卷积层,其卷积核大小为1×1,输入通道数为128,输出通道数为32,步长为1;第二层由输入通道为32,输出通道为64,且进行下采样的多信息拼接模块组成;第三层为输入输出通道数均为64的注意力优化模块组成;第四层由输入通道数为64,输出通道数为128且进行下采样的多信息拼接模块组成;第五层由输入输出通道数均为128且不进行下采样的多信息拼接模块组成;第六层的网络结构与第五层相同;第七层由输入输出通道均为128的注意力优化模块组成;第八层由输入通道数和输出通道数均为128的上下文嵌入模块组成。最后,信息共享层的空间分支和语义分支的输出特征图通过聚合层来实现信息融合以及上采样。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310096638.9/2.html,转载请声明来源钻瓜专利网。