[发明专利]基于多尺度带孔卷积神经网络的道路场景语义分割方法有效
| 申请号: | 201811186784.6 | 申请日: | 2018-10-12 |
| 公开(公告)号: | CN109508639B | 公开(公告)日: | 2021-04-16 |
| 发明(设计)人: | 周武杰;顾鹏笠;潘婷;吕思嘉;钱亚冠;向坚 | 申请(专利权)人: | 浙江科技学院 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/34;G06N3/04;G06N3/08 |
| 代理公司: | 宁波奥圣专利代理有限公司 33226 | 代理人: | 周珏 |
| 地址: | 310023 浙*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 尺度 卷积 神经网络 道路 场景 语义 分割 方法 | ||
本发明公开了一种基于多尺度带孔卷积神经网络的道路场景语义分割方法,其在训练阶段,构建多尺度带孔卷积神经网络,其隐层包括9个神经网络块、5个级联层、6个上采样块;使用原始的道路场景图像输入到多尺度带孔卷积神经网络中进行训练,得到对应的12幅语义分割预测图;再通过计算原始的道路场景图像对应的12幅语义分割预测图构成的集合与对应的真实语义分割图像处理成的12幅独热编码图像构成的集合之间的损失函数值,获得多尺度带孔卷积神经网络分类训练模型的最优权值矢量和偏置项;在测试阶段,将待分割的道路场景图像输入到多尺度带孔卷积神经网络分类训练模型中,得到预测语义分割图像;优点是提高了道路场景图像的语义分割效率和准确度。
技术领域
本发明涉及一种深度学习的语义分割方法,尤其是涉及一种基于多尺度带孔卷积神经网络的道路场景语义分割方法。
背景技术
随着智能交通行业的快速发展,道路场景理解在辅助驾驶和无人驾驶系统的智能交通中得到了越来越广泛的应用。自动驾驶中最具挑战的任务之一是道路场景理解,包括计算机视觉任务下的车道检测和语义分割。车道检测帮助指导车辆,语义分割提供更多关于周围环境目标的细节位置。语义分割是计算机视觉的一个重要方向,其本质是对图像进行像素级别的分类,应用在道路场景理解中就是将图像中包括道路、汽车、行人等等类别的目标分割出来。
目前,语义分割的方法分为两种,一种是以传统机器学习方式进行的,以归一化分割(Normalized cut,N-cut)为代表,其核心思想是根据像素间的权重关系给出阈值将图像划分;另一种是以深度学习方式进行的,以全卷积神经网络为代表,直接进行像素级别端到端(end-to-end)的语义分割,其只需要将训练集中的图像输入进模型框架中训练,得到权重与模型,即可在测试集中得到相较于传统机器学习方式更好的分割效果。得益于强大的学习表示能力,卷积神经网络使语义分割研究方向有了新进展,但依然很难处理外形较复杂物体的分割。传统的卷积神经网络,任意层接收上层的数据作输入,再作卷积并加激活传给下一层,是以单一直线型流程执行的。卷积神经网络的强大之处在于它的多层结构能自动学习特征,并且可以学习到多个层次的特征:较浅的卷积层感知域较小,学习到一些部分具体的特征;较深的卷积层具有较大的感知域,能够学习到更加抽象的特征,这些抽象的特征对物体的大小、位置和方向等鲁棒性更好,有利于提高分割效果。
现有的道路场景语义分割方法大多采用深度学习的方法,其利用卷积层与池化层相结合的方式,然而池化层通过缩小分辨率来获取较大的感知域,损失分辨率从而会导致得到的图像的特征信息减少,最终导致还原的边缘信息比较粗糙,分割精度低。
发明内容
本发明所要解决的技术问题是提供一种基于多尺度带孔卷积神经网络的道路场景语义分割方法,其能够充分考虑到道路场景图像多种特征对场景理解的影响,利用多尺度与带孔卷积相结合的方式,以扩大感知域,得到更多图像的特征信息,从而提高了道路场景图像的语义分割效率和准确度。
本发明解决上述技术问题所采用的技术方案为:一种基于多尺度带孔卷积神经网络的道路场景语义分割方法,其特征在于包括训练阶段和测试阶段两个过程;
所述的训练阶段过程的具体步骤为:
步骤1_1:选取Q幅原始的道路场景图像及每幅原始的道路场景图像对应的真实语义分割图像,并构成训练集,将训练集中的第q幅原始的道路场景图像记为{Iq(i,j)},将训练集中与{Iq(i,j)}对应的真实语义分割图像记为然后采用独热编码技术将训练集中的每幅原始的道路场景图像对应的真实语义分割图像处理成12幅独热编码图像,将处理成的12幅独热编码图像构成的集合记为其中,道路场景图像为RGB彩色图像,Q为正整数,Q≥200,q为正整数,1≤q≤Q,1≤i≤W,1≤j≤H,W表示{Iq(i,j)}的宽度,H表示{Iq(i,j)}的高度,Iq(i,j)表示{Iq(i,j)}中坐标位置为(i,j)的像素点的像素值,表示中坐标位置为(i,j)的像素点的像素值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江科技学院,未经浙江科技学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811186784.6/2.html,转载请声明来源钻瓜专利网。





