[发明专利]基于注意力机制的胶囊内镜息肉目标检测网络在审

专利信息
申请号: 202111474711.9 申请日: 2021-12-06
公开(公告)号: CN114170538A 公开(公告)日: 2022-03-11
发明(设计)人: 黄胜;李松;向思皓;廖星 申请(专利权)人: 重庆邮电大学
主分类号: G06V20/20 分类号: G06V20/20;G06N3/04;G06N3/08
代理公司: 暂无信息 代理人: 暂无信息
地址: 400065*** 国省代码: 重庆;50
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 注意力 机制 胶囊 息肉 目标 检测 网络
【权利要求书】:

1.一种基于注意力机制的胶囊内镜息肉目标检测网络,其特征在于,所构建的息肉目标检测网络主要包括特征提取模块、ARM(Refined Anchors Module)模块、残差注意力机制模块、特征池化模块和特征融合模块。

2.根据权力要求1所述的残差注意力机制模块,其特征在于,该模块由两部分构成,其中第一部分为通道注意力分支,从通道的维度上增强对息肉信息的学习,第二部分为残差注意力分支,从空间、通道两个维度增强对于息肉的学习。构建残差注意力机制模块包括如下步骤:

步骤1,构建通道注意力分支,对输入特征块经过Conv-block模块(其中Conv-block模块由一个1×1的卷积和两个3×3的卷积组成)得到特征块1,将特征块1经过SE注意力机制得到通道注意力分支的输出,其中SE注意力机制为将通道数赋予不同的权重,从而抑制一些不重要的通道信息。

步骤2,构建残差注意力分支,该部分由两个分支构成,第一个分支为主干分支,第二个分支为掩码分支,构建两个分支包括如下子步骤:

步骤2-1,构建主干分支,将输入特征块经过两个Conv-block模块(其中Conv-block模块由一个1×1的卷积和两个3×3的卷积组成)得到主干分支的输出特征块。

步骤2-2,构建掩码分支,其中掩码分支包括下采样、上采样操作,包括如下个子步骤:

步骤2-2-1,构建下采样操作,下采样操作为输入特征块首先进行一个最大池化操作和两个Conv-block模块,此时得到特征块1,然后对特征块1继续进行一个最大池化操作和Conv-block模块得到下采样输出特征块。

步骤2-2-2,构建上采样操作,上采样操作为对步骤2-2-1输出特征块首先进行UpsamplingBilinear(插值上采样)得到特征块2,为了使在采样过程中特征信息不丢失,在特征提取过程中加入了残差横向连接,将步骤2-2-1得到的特征块1和步骤2-2-2得到的特征块2进行融合得到输出特征块,将输出特征块再次经过Conv-block模块、UpsamplingBilinear和两个1×1卷积得到第二个分支的输出特征块,对掩码分支的输出采用Sigmoid函数使得输出值在0-1之间。

步骤2-3,将步骤2-1主干得到的特征块与步骤2-2-2掩码分支得到的特征块进行像素相乘得到残差注意力分支的输出。

步骤3,将步骤1中通道注意力分支的输出与步骤2-3中残差注意力分支的输出进行像素相加,然后在经过两个3×3的卷积得到残差注意力机制模块的输出。

对主干网络提取的特征所形成的特征金字塔结构中低层的两个特征块加上入残差注意力机制使得网络能够学习到更多的息肉细节信息,对高层的两个特征块加入Bottleneck模块用于降维,最后得到经过处理后的特征金字塔结构。

3.根据权力要求1所述的一种基于注意力机制的胶囊内镜息肉目标检测网络,其特征在于,特征池化模块由权力要求2所述经过处理后的特征金字塔,对特征金字塔中的每个特征块都进行4个不同寸尺的自适应池化操作,使得特征金字塔中的每个特征块经过池化后都形成由4个不同尺寸特征块组成的空间特征金字塔结构,此时每个空间特征金字塔中的特征块都具有相同的语义信息。

4.整个网络的数据流向为,首先选取特征提取模块中不同层的特征块形成特征金字塔结构,对特征金字塔结构中的低层特征经过权力要求2所述的残差注意力机制模块,高层特征经过Bottleneck模块用于降维,此时输出的4个特征块形成新的特征金字塔结构;然后对输出的特征金字塔结构中的每个特征块都进行权力要求3所述的特征池操作;对权力要求3所述形成的4个空间特征金字塔,融合每个空间特征金字塔中相同的特征块,对融合后的特征块加上入SE(Squeeze And Excitation)注意力机制,进一步加强对于息肉的学习,所有融合后的特征块形成特征金字塔作为网络最后的输出,本文网络结构的输出使用SSD网络结构的输出。为了解决网络训练过程中正负样本不均衡的问题,在网络中加入了ARM模块,ARM模块也是网络的一个输出,对特征提取模块形成的特征金字塔中每个特征块经过一个3×3的卷积后作为ARM模块的一个分支接上网络的输出,此时的输出也是一个多任务分类和框的回归(分类为二分类,用于区分前景和背景)。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111474711.9/1.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top