[发明专利]一种边界引导上下文聚合的交通场景语义分割方法在审
| 申请号: | 202210464104.2 | 申请日: | 2022-04-29 |
| 公开(公告)号: | CN114782949A | 公开(公告)日: | 2022-07-22 |
| 发明(设计)人: | 赵于前;肖晓阳;张帆;阳春华;桂卫华 | 申请(专利权)人: | 中南大学 |
| 主分类号: | G06V20/70 | 分类号: | G06V20/70;G06V10/20;G06V10/44;G06V10/82;G06N3/04;G06N3/08 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 410083 湖南*** | 国省代码: | 湖南;43 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 边界 引导 上下文 聚合 交通 场景 语义 分割 方法 | ||
本发明公开了一种边界引导上下文聚合的交通场景语义分割方法,其实施方案为:1)获取数据集与分割标签;2)数据处理;3)构建分割模型;4)构建损失函数;5)训练分割模型;6)交通场景图像分割。本发明构建的具有边界细化模块的交通场景分割模型,在去除低层次的轮廓纹理信息的同时保留了高级的语义边界信息,能够有效检测对象的边界,并沿着目标边界聚合上下文信息,增强同类像素的一致性,从而有效利用边界信息对交通场景图像进行语义分割。本发明方法能够捕获边界区域像素与对象内部像素之间的依赖关系,有效提高分割准确性和鲁棒性。
技术领域
本发明属于图像处理技术领域,涉及交通场景图像自动分割,可用于自动驾驶。
背景技术
语义分割的目的是对给定图像中每个像素指定类别标签,实现同类像素的归类,提供图像丰富的细节信息,具有广泛的应用空间和发展前景。例如在自动驾驶场景中,通过对场景分割,算法可以提供有关道路上自由空间的信息,以及车辆附近的行人和交通标志等信息。
现有的分割方法主要通过卷积运算来扩大感受视野进而捕获全局上下文信息,这种方法忽略了对象内部与边界之间的关系,从而导致边界信息的丢失。为了利用边界信息,有些方法直接将浅层的边界特征信息与深层语义特征融合。由于浅层的特征不仅包含边界信息,也包含对象内部的纹理噪声,这对语义分割会产生负面的影响。还有一些工作使用边界信息对预测的结果进行细化,由于语义分割与图像边界分割两个任务彼此之间非正交,错误的边界估计可能会给语义分割任务带来困难。
发明内容
本发明的目的在于克服现有技术的缺点与不足,提出一种边界引导上下文聚合的交通场景语义分割方法,该方法通过语义分割模块和边界细化模块分别提取语义信息和边界信息,并利用边界来聚合上下文信息,使得同一类别的像素获得相似的增益,从而有效利用边界信息与语义信息,提高模型的分割准确性。
为实现上述目的,本发明提供以下技术方案:
一种边界引导上下文聚合的交通场景的语义分割方法,包括以下步骤:
(1)获取数据集与分割标签
获取交通场景公开数据集与对应的分割标签;
(2)数据处理,具体包括以下步骤:
(2-a)对步骤(1)获取的数据集中的图像与对应的分割标签同步水平翻转;
(2-b)将步骤(2-a)获得的图像及对应的分割标签都缩放至m1×m2像素大小,其中m1和m2分别为缩放后图像的宽和高,m1、m2都为正整数;
(2-c)将步骤(2-b)缩放得到的图像及对应的分割标签进行归一化操作,组成处理后的样本数据集;
(3)构建分割模型,具体包括以下步骤:
(3-a)构建语义分割模块,该模块一共包括五组下采样层和一个空洞空间卷积池化金字塔模块,即ASPP模块;输入图像依次经过这五组下采样层,分别得到特征图F1、F2、F3、F4和F5,F5经过ASPP模块后,得到特征图Ff;第一组下采样层由一个残差卷积块与一个池化层组成,第二、三、四、五组下采样层都由一个残差卷积块组成;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中南大学,未经中南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210464104.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种钛铝涡轮与转轴的锥体连接结构
- 下一篇:一种细胞影画成像VR整装设备系统





