[发明专利]一种基于上下文注意力策略的三维肝脏影像语义分割方法有效

专利信息
申请号: 202110196132.6 申请日: 2021-02-22
公开(公告)号: CN112927255B 公开(公告)日: 2022-06-21
发明(设计)人: 张晓龙;邵赛;邓春华;程若勤;李波 申请(专利权)人: 武汉科技大学
主分类号: G06T7/155 分类号: G06T7/155;G06V10/40;G06N3/04;G06N3/08;G06T5/30;G06T5/40
代理公司: 杭州宇信知识产权代理事务所(普通合伙) 33231 代理人: 张宇娟
地址: 430081 *** 国省代码: 湖北;42
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 上下文 注意力 策略 三维 肝脏 影像 语义 分割 方法
【权利要求书】:

1.一种基于上下文注意力策略的三维肝脏影像语义分割方法,其特征在于,包括如下步骤:

S1、选定待进行肝脏分割的医疗影像数据集,将其划分为训练集和测试集;

S2、对所述训练集中的三维肝脏影像进行预处理,并输入编解码网络模型,具体包括:

S21、将训练集进行调窗处理,把灰度值设置在[-200,250]范围内;

S22、对训练集进行降采样和重采样,将图像数据的z轴间隔调整到1mm;

S23、找到肝脏区域的开始和结束切片,并在两个方向上向外扩张n个切片,n∈[15,20];

S24、对训练集中的图像进行三维区域直方图均衡化;

S25、对训练集中的图像进行最小最大归一化操作,最小最大归一化公式如下:

其中,xmax代表图像CT的最大值,xmin代表图像CT的最小值,x为图像的CT值,x*代表最小最大归一化后的结果;

S26、随机选择48个连续的切片作为网络的输入,此时网络的输入尺寸为1×48×256×256;

S3、在编码阶段,利用残差结构、卷积网络和空洞卷积得到肝脏的特征图,具体包括:

S31、设置网络初始化参数,包括批处理大小、学习率、动量、最大迭代次数、L2权重和学习率衰减策略;

S32、使用kaiming正态分布初始化网络权重,常数初始化偏差参数;

S33、将预处理后的三维图像输入到卷积神经网络中,通过残差结构和空洞卷积进行训练得到若干特征信息;其中,在编码阶段共经过四层卷积,每层卷积由2-3个尺寸为3×3×3的三维卷积构成,倒数第二层分别加入膨胀率为2和4的空洞卷积,最后一层分别加入膨胀率为3,4,5的空洞卷积,最终得到肝脏的特征图;卷积的输入输出尺寸关系为:

O=(I-K+2P)/S+1

其中,I为输入图片大小,K为卷积核大小,S为步长,P为填充的像素数,O代表卷积层输出的特征图大小;

空洞卷积的计算过程如下:

其中,i1代表输入图片大小,k1为卷积核大小,p1为填充的像素数,d代表膨胀率,s1为步长,o1代表输出的特征图大小;

残差结构如下:

xl+1=xl+F(xl,Wl),F=Wl*xl+bl

其中,xl代表输入特征,F代表卷积操作,Wl代表卷积中的权重,bl代表卷积中的偏置;

S4、在解码阶段,利用上下文注意力策略模块、转置卷积和深度监督机制得到肝脏的分割图像,具体包括:

S41、在解码阶段,将步骤3得到的特征图进行反卷积,公式如下:

o2=s2(i2-1)-2p2+k2

其中,o2代表输出的尺寸大小,p2代表填充的大小,s2代表卷积核移动的步长,i2代表输入的尺寸大小,k2代表卷积核的尺寸大小;

S42、利用在编码阶段每层最后一次卷积得到的特征与步骤S41每层反卷积得到的特征,分别作为上层信息和下层信息来通过跳跃连接中的上下文注意力策略模块得到注意力图;

其中,在上下文注意力策略模块中,分别有上层特征输入和下层特征输入,首先让上层特征和下层特征分别通过1×1×1的卷积调整通道数,其次对两个特征进行简单的相加融合操作,然后经过上下两条线路,其中上面一条路径融合特征图先经过ReLu激活函数,再经过一个三维卷积对通道维度进行压缩,把channel维降为1,最后利用Sigmoid归一化生成空间注意力系数和上层输入x逐元素相乘,从而有效利用到医疗影像这种三维数据特有的空间信息;下面一条线路则经过3维全局自适应平均池化使特征图在空间维度上进行压缩,得到一个1×1×1×C的数据后再经过两个三维卷积的Excitation过程,接着通过Sigmoid得到通道注意力系数,最后与空间特征图做逐元素相乘就得到了上下文注意力策略图;

S43、把每一层得到的上下文注意力策略图与同一层经过上采样的解码层特征进行连接,再进行一系列的卷积操作提取特征;其中,解码的每一层的结果都会经过不同尺度的上采样恢复图像尺寸得到一个输出,最终会得到4个输出,前3个输出会作为深度监督机制中的辅助损失,最后的输出作为输出的最终的掩码图;

S44、在迭代训练中的反向传播过程,通过网络预测的输出与真实标签比较计算损失,不断迭代更新网络参数,使得输出结果接近真实值;

S5、对语义分割后得到的肝脏图像进行后处理。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉科技大学,未经武汉科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110196132.6/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top