[发明专利]一种基于CNN-Transformer并行融合方法在审
| 申请号: | 202310041351.6 | 申请日: | 2023-01-13 |
| 公开(公告)号: | CN116051945A | 公开(公告)日: | 2023-05-02 |
| 发明(设计)人: | 袁宝华;陈佳璐;李宁;肖德豪;汤瑞 | 申请(专利权)人: | 常州大学 |
| 主分类号: | G06V10/80 | 分类号: | G06V10/80;G06V10/82;G06V10/26;G06N3/0455;G06N3/0464;G06N3/048 |
| 代理公司: | 常州市英诺创信专利代理事务所(普通合伙) 32258 | 代理人: | 王美华 |
| 地址: | 213000 *** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 cnn transformer 并行 融合 方法 | ||
本发明涉及图像处理技术领域,尤其涉及一种基于CNN‑Transformer并行融合方法,包括:通过PCTNet网络的编码器提取待分割的医学图像特征,PaFusion‑encoder由两个分支组成;CNN分支感受野逐渐增大,特征编码从局部到全局;Transformer分支,采用全局自注意力与CNN分支中同等分辨率大小的特征图组成的并行融合模块,最大限度地保留了局部特征和全局特征。本发明通过充分挖掘CNN和Transformer各自的优点,提出基于医学图像分割的CNN和Transformer并行融合网络,进而整合图像中粗粒度和细粒度信息。
技术领域
本发明涉及图像处理技术领域,尤其涉及一种基于CNN-Transformer并行融合方法。
背景技术
医学图像分割的目的是使图像中解剖或病理结构的变化更加清晰,在各种计算机辅助诊断任务中发挥着关键作用;例如:病变轮廓,手术计划和三维重建等。医学图像分割有助于检测和定位图像中病变的边界,从而有助于快速识别肿瘤和癌变区域的潜在存在,这将有可能帮助临床医生节省诊断时间,提高发现肿瘤的可能性。
传统上,医学图像分割算法通常被构建为对称的自顶向下编码器-解码器结构,U-Net已经成为不同的变体中的选择基准,并取得了巨大的成功。U-Net由卷积组成,而卷积的优点是具有局部连接、权值共享两种特性的卷积算子,从而使得模型具有等变性。虽然这些特性有助于开发高效和通用的医学成像解决方案,但它们仍然需要额外的改进,以便真正帮助临床医生进行早期疾病诊断。
目前已经提出了各种在CNN中添加全局上下文的改进方法,比较有影响的方法有引入注意机制以及扩展卷积核以增加核的感受域。然而,卷积层中感受野的局部性仍然将它们的学习能力限制在相对较小的区域,阻止了网络利用来自输入图像的长距离语义依赖性,无法充分探索对象级信息,尤其是对于在器官的纹理、形状和大小方面通常产生较弱的性能,表现出较大的患者间差异。
ViT在自然图像的成功激起了医学界的极大兴趣,研究者们探讨了在医学图像分割背景下Transformer的潜力,减轻CNN固有的感受野偏差,使其适用于医学成像应用。然而,基于Transformer的模型的性能在很大程度上取决于预训练,它们的实验也验证了这一观点,同样预训练也会帮助医学图像分割。但基于Transformer的模型的预训练过程带来了两个问题;首先,预训练过程通常会在时间或计算消耗方面产生高计算复杂性;其次,对于医学图像,用于预训练的完整且公认的大型数据集很少(相比之下,ImageNet可用于自然场景图像),因为医学图像并不总是可用的,需要专业人士花费大量时间进行注释。并且自然图像和医学图像之间的领域鸿沟使得医学图像分割模型很难直接使用现有的大型自然图像数据集,此外在不同类型的医学图像也存在一些开放的挑战,例如,由于CT和MRI图像之间存在较大的区域差距,在CT数据集上预先训练的Swin UNETR在直接应用于其他医学成像模式(如MRI)时表现不佳。
充分挖掘CNN和Transformer各自的优点,有效地整合图像中粗粒度和细粒度信息的深度学习模型能够达到更好的分割精度,成为研究者们热衷的研究方向。例如,TransUNet在由CNN组成的编码器和解码器之间引入了Transformer;UCTransNet通过Transformer桥接从编码器到解码器的所有阶段,而不只是相邻阶段,捕获了多尺度的全局依赖性;MT-Unet交织Transformer和CNN块到一个混合模型,其中卷积可以编码精确的空间信息和自我注意可以捕获全局上下文。这些架构从宏观上实现了Transformer和CNN的串行组合;然而,在串行组合中,若只是采用堆叠的方式融合粗粒度和细粒度特征,会导致这两类网络的融合效果降低,不能充分发挥其互补的潜力。
发明内容
针对现有算法的不足,本发明通过充分挖掘CNN和Transformer各自的优点,提出基于医学图像分割的CNN和Transformer并行融合网络(简称为PCTNet),进而整合图像中粗粒度和细粒度信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于常州大学,未经常州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310041351.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:角度与开度可调的煤矸分拣拨爪装置及拨选方法
- 下一篇:有机废水处理系统及方法
- 基于Transformer+LSTM神经网络模型的商品销量预测方法及装置
- 一种基于Transformer模型自然场景文字识别方法
- 一种深度Transformer级联神经网络模型压缩算法
- 点云分割方法、系统、介质、计算机设备、终端及应用
- 基于Transformer的中文智能对话方法
- 一种基于改进Transformer模型的飞行器故障诊断方法和系统
- 一种基于Transformer模型的机器翻译模型优化方法
- 基于Transformer和增强交互型MPNN神经网络的小分子表示学习方法
- 基于U-Transformer多层次特征重构的异常检测方法及系统
- 基于EfficientDet和Transformer的航空图像中的飞机检测方法





