[发明专利]一种用于语义分割像素组的压缩注意力模型在审
| 申请号: | 202110482353.X | 申请日: | 2021-04-30 |
| 公开(公告)号: | CN113095330A | 公开(公告)日: | 2021-07-09 |
| 发明(设计)人: | 叶松发;齐向明;王晓龙;刘强;严萍萍;李健林 | 申请(专利权)人: | 辽宁工程技术大学 |
| 主分类号: | G06K9/34 | 分类号: | G06K9/34;G06K9/62;G06N3/04 |
| 代理公司: | 北京华夏正合知识产权代理事务所(普通合伙) 11017 | 代理人: | 韩登营 |
| 地址: | 123000 辽*** | 国省代码: | 辽宁;21 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 用于 语义 分割 像素 压缩 注意力 模型 | ||
本发明公开了一种用于语义分割像素组的压缩注意力模型,该模型利用有效的压缩注意力(SA)模块来解决语义分割中像素组的两个独特特征:(1)像素组注意力和(2)逐像素预测。具体而言,提出的SA模型通过引入“注意力”卷积通道将像素组注意力强加于常规卷积上,从而以有效的方式考虑了空间通道的相互依赖性。与现有的注意力模型不同,使用通过池化层实现的下采样通道来聚合多尺度特征并同时生成的压缩全局注意力模型(SA)。因此,SA模型增强了像素级密集预测的目标,并考虑了被忽略的像素组注意力的问题。本发明相较于其他方法都有显著提高,在PASCAL数据集上的测试结果表明新方法的PAcc和mIoU高于FCN50、FCN101等经典方法。
技术领域
本发明属于语义分割的技术领域,尤其涉及一种用于语义分割像素组的压缩注意力模型。
背景技术
卷积网络(FCN)是从抽象的特征中恢复出每个像素所属的类别。即从图像级别的分类进一步延伸到像素级别的分类。采用反卷积层对最后一个卷积层的feature map进行上采样,使它恢复到输入图像相同的尺寸,从而可以对每个像素都产生了一个预测,同时保留了原始输入图像中的空间信息,最后在上采样的特征图上进行逐像素分类。但主要主要集中于从像素级别提高分割性能,但很大程度上忽略了像素分组的隐式任务。
多尺度空间非对称重新校准(MS-SAR),证明了不完全压缩的模块对于图像分类是有效的,且边际计算成本较高。由于空间非对称重新校准(SAR)模块生成的权重是矢量,因此它们不能直接用于分割。
发明内容
为了克服现有技术中的不足,本发明所解决的技术问题在于提供一种用于语义分割像素组的压缩注意力模型,解决在于考虑被忽略的像素组注意力的问题。
为了解决上述技术问题,本发明通过以下技术方案来实现:本发明提供一种用于语义分割像素组的压缩注意力模型,通过考虑本地和全局方面的重新加权机制来学习语义分割任务的更多代表性功能;
首先以残差网络作为基础的残差块;
通过重新校准特征图通道;
采用重新加权机制对通道进行加权,并且对未完全压缩的空间信息进行解析。
优选的,对未完全压缩的空间信息进行解析表示如下:
xout=xattn*xres+xattn
和Up(·)用于扩展关注通道输出的上采样函数;
其中表示注意力卷积通道Fattn(·)的输出,该输出由θattn和注意力卷积层的结构ψattn进行参数化;平均池化层APool(·)用于执行未完全压缩的操作,然后对注意力通道的输出进行上采样,以匹配主卷积通道xres的输出。
进一步的,使用通过池化层实现的下采样通道来聚合多尺度特征并同时生成的压缩全局注意力模型。
由上,本发明针对于语义分割像素组的问题,提出了一种新颖的压缩注意力模型,可以处理单个像素的多尺度密集预测,又可以处理像素组的空间注意,具有以下优点:
1、增强了像素级密集预测。
2、解决了大部分被忽略的像素组注意问题。
3、达到更好的语义分割效果。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其他目的、特征和优点能够更明显易懂,以下结合优选实施例,并配合附图,详细说明如下。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于辽宁工程技术大学,未经辽宁工程技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110482353.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种吊扇控制系统
- 下一篇:一种统计多项计数的教学设备





