[发明专利]一种面向复杂环境的图像语义分割方法及装置有效
| 申请号: | 201910333809.9 | 申请日: | 2019-04-24 |
| 公开(公告)号: | CN110136141B | 公开(公告)日: | 2023-07-11 |
| 发明(设计)人: | 吴俊君;王嫣然;陈世浪 | 申请(专利权)人: | 佛山科学技术学院 |
| 主分类号: | G06V10/26 | 分类号: | G06V10/26;G06V10/80;G06V10/82;G06N3/0464;G06N3/044 |
| 代理公司: | 广州嘉权专利商标事务所有限公司 44205 | 代理人: | 王国标 |
| 地址: | 528000 广*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 面向 复杂 环境 图像 语义 分割 方法 装置 | ||
本发明属于计算机视觉技术领域,具体涉及一种面向复杂环境的图像语义分割方法及装置,首先将微调的VGG16卷积神经网络生成基础网络,通过所述基础网络提取训练图像的初步特征;进而将隐藏层卷积特征模块和VGG16卷积神经网络的每一个卷积层进行连接,生成高层语义特征;并通过空洞卷积方法将所述初步特征输入到金字塔结构的空洞卷积中,得到细粒度低层特征;然后将所述高层语义特征和细粒度低层特征进行融合,生成高分辨率特征图;通过设置网络训练参数,以交叉熵损失函数为目标,通过反向传播进行网络训练,从而建立语义分割网络;最后将测试图像输入所述语义分割网络,生成测试图像的语义分割结果,本发明能解决现有方法在复杂环境下分割边界模糊的缺点,能够产生高分辨率的预测图像,提高在复杂环境下的图像语义分割方法的性能。
技术领域
本发明属于计算机视觉技术领域,具体涉及一种面向复杂环境的图像语义分割方法及装置。
背景技术
图像语义分割是指按照图像中每个像素点所表达的语义内容对其进行分类的图像分割方法,它是场景理解的基础性技术,可在像素级别对物体进行定位识别,对智能驾驶、机器人认知层面的自主导航、无人机着陆系统以及智慧安防监控等无人系统具有至关重要的作用,直接关系到无人系统对场景理解的准确度。
由于无人系统在面对非结构化复杂环境时,传统语义分割方法的场景理解能力及工作效率表现欠佳,因此近年来面向复杂环境的语义分割问题成为研究的热点,并取得了一系列显著的成果。尤其是卷积神经网络的出现,使得图像语义分割领域取得了可喜的进展,从模型结构、损失函数、效率等不同角度提高了语义分割精度问题。但是面对复杂的真实环境所具备的非结构化、目标多样化、形状不规则化以及物体遮挡等各种因素,都给现有的图像语义分割精度带来了极大的挑战。
发明内容
本发明的目的在于提供一种面向复杂环境的图像语义分割方法及装置,以解决现有方法在复杂环境下分割边界模糊的缺点,提高在复杂环境下的图像语义分割方法的性能。
为实现上述目的,本发明提供了如下方案:
一种面向复杂环境的图像语义分割方法,包括以下步骤:
步骤S100、将VGG16卷积神经网络进行修改生成基础网络,通过所述基础网络提取训练图像的初步特征,所述VGG16卷积神经网络中的卷积层分为5个阶段;
步骤S200、使用隐藏层卷积特征模块处理所述基础网络中前4阶段卷积层得到的初步特征,生成高层语义特征;
步骤S300、通过金字塔结构的空洞卷积处理所述基础网络中最末层卷积得到的初步特征,得到细粒度低层特征;
步骤S400、将所述高层语义特征和细粒度低层特征进行融合,生成高分辨率特征图;
步骤S500、设置网络训练参数,以交叉熵损失函数为目标,通过反向传播进行网络训练,从而建立语义分割网络;
步骤S600、将测试图像输入所述语义分割网络,生成测试图像的语义分割结果。
进一步,在步骤S100中,所述将VGG16卷积神经网络进行修改生成基础网络具体为:
舍弃原始VGG16卷积神经网络中所有的全连接层和最后一个池化层,构建端到端的全卷积网络;
通过所述全卷积网络进行卷积、池化、批量归一化及ReLU操作,得到基础网络中每一个卷积层的特征图,从而提取图像的初步特征。
进一步,所述步骤S200的具体实现方法为:
步骤S210、将所述特征图分别输入到1×1大小的卷积和3×3大小的卷积,获取各个尺度的卷积特征;
步骤S220、将各个尺度的卷积特征进行融合,并进行ReLU操作,得到第一结果;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于佛山科学技术学院,未经佛山科学技术学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910333809.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:眼底图像血管影像分割方法及设备
- 下一篇:一种图像裁剪方法、装置、电子设备
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





