[发明专利]一种使用门控和自适应注意力的图像分割方法和装置有效
申请号: | 202010711682.2 | 申请日: | 2020-07-22 |
公开(公告)号: | CN111915623B | 公开(公告)日: | 2022-06-21 |
发明(设计)人: | 吴强;石伟;朱奇晓;刘琚 | 申请(专利权)人: | 山东大学 |
主分类号: | G06T7/11 | 分类号: | G06T7/11 |
代理公司: | 济南圣达知识产权代理有限公司 37221 | 代理人: | 李健康 |
地址: | 266237 *** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 使用 门控 自适应 注意力 图像 分割 方法 装置 | ||
本发明公开了一种使用门控和自适应注意力的图像分割方法和装置。其中使用门控和自适应注意力的图像分割方法包括训练阶段和推理阶段,训练阶段分割模型的构建如下所示:首先将处理后的数据送入残差单元,之后进行下采样操作,该系列操作重复进行多次;然后,将数据送入残差单元,输出数据送入自适应注意单元;接着,对数据进行上采样操作,上采样后的数据送入门控残差单元,该系列操作重复进行多次;最后,将多个门控残差单元的输出数据上采样到原始数据的分辨率,进行卷积运算后相加得到最后的分割结果。实验证明与传统的深度学习模型相比,本发明提出的方法优于传统方法,分割精度有明显提升。
技术领域
本发明涉及图像处理领域,特别涉及一种使用门控和自适应注意力的图像分割方法和装置。
背景技术
随着科技的进步,计算机的性能得到了巨大的提升,得益于现代互联网的海量数据以及图形处理器并行处理的强大计算力,计算机视觉得到了飞速的发展。计算机视觉中最重要的基本问题之一就是对图像进行语义级别的分割,其实质是对图像的每个像素点进行分类。图像语义分割方法分为传统的图像自动分割算法和基于深度学习的分割方法。
传统的图像自动分割算法,需要人为干预,并且分割结果对噪声敏感,使得分割结果存在较大的误差。基于深度学习的分割方法克服了传统算法的缺点,但是深度学习分割方法仍然不能完全精准的分割,它的性能具有很大的提升空间。
视觉注意力机制是人类脑部视觉神经网络特有的一种机制,这种机制可以在人类通过视觉快速扫描全局图像的时候,分辨出需要关注的重点区域,从而对重点区域分配更多的资源,提高视觉处理的速度和效率。
深度学习分割方法严重依赖于深度神经网络提取的图像特征,如果深度神经网络能够使用注意力机制,分辨出需要关注的图像特征的重点区域,从而对重点区域分配更多的资源,无疑会对深度学习分割方法的性能产生很大的提升。
发明内容
深度学习分割方法严重依赖于深度神经网络提取的图像特征,如果深度神经网络能够使用注意力机制,分辨出需要关注的图像特征的重点区域,从而对重点区域分配更多的资源,无疑会对深度学习分割方法的性能产生很大的提升。针对这一问题,本发明提出了一种使用门控和自适应注意力的图像分割方法、系统和电子设备。
本发明采用的技术方案如下所示:
一种使用门控和自适应注意力的图像分割方法,将图像的ROI区域从整幅图像中分割出来,所述方法包括训练阶段和推理阶段;
(一)训练阶段包括:
(1)获取图像:获取待处理的图像,包括互联网下载或者线下采集;
(2)图像预处理:对图像进行归一化处理,将多模态数据拼接成多通道数据,对数据进行清洗,去除无效数据;
(3)构建分割模型:使用门控注意力机制和自适应注意力机制构建分割模型,具体步骤包括:
(3-1)将经过预处理的图像数据送入残差单元,提取出图像的特征,输出的数据进行两倍下采样处理,降低数据量,提高数据的信噪比,该过程重复进行多次;
(3-2)将经过步骤(3-1)处理的数据送入残差单元,输出的数据送入自适应注意单元,该单元能够利用提取的图像特征之间的差异,进行自适应的注意力操作,自动寻找出每个特征通道的度量值,该度量值表征了每个特征通道对图像分割起作用的重要程度,故可以将该度量值作为每个特征通道的权重,从而对在图像分割中起重要作用的特征赋予更大的权重,而对在图像分割中不起作用的特征,赋予更小的权重,过程如下所示:
yi(t)=f(Xi(t)·Wi+yi(t-1)·Vi+bi)
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东大学,未经山东大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010711682.2/2.html,转载请声明来源钻瓜专利网。