[发明专利]一种基于动态加权注意力机制的眼底图像检测方法及系统有效
| 申请号: | 202210548394.9 | 申请日: | 2022-05-20 |
| 公开(公告)号: | CN114708258B | 公开(公告)日: | 2022-08-02 |
| 发明(设计)人: | 张冬冬 | 申请(专利权)人: | 北京至真互联网技术有限公司 |
| 主分类号: | G06T7/00 | 分类号: | G06T7/00;G06T7/11;G06T1/60;G06N3/04;G06N3/08 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 100085 北京市昌平区回龙观*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 动态 加权 注意力 机制 眼底 图像 检测 方法 系统 | ||
本发明涉及一种基于动态加权注意力机制的眼底图像检测方法及系统,涉及图像处理技术领域。利用眼底图像分割模型检测早产儿眼底图像的病变信息。首先对眼底图像进行连续下采样,将得到的下采样特征与相邻层得到的下采样特征进行动态加权注意力融合,再将加权融合后的特征与对应的上采样层的输出特征融合,最后将第n层上采样层的输出进行分类卷积操作,得到每个像素的病变概率。本发明对浅层网络模型进行层级特征融合以及动态加权注意力机制,在保证识别准确性的同时,可达到降低算法设计的复杂度、降低算法的运行时间以及减少GPU资源的过多占用的目的。
技术领域
本发明涉及图像处理技术领域,特别是涉及一种基于动态加权注意力机制的眼底图像检测方法及系统。
背景技术
图像检测分割检测技术是计算机视觉研究中的一个经典难题,已成为图像理解领域关注的一个热点。传统的分割检测手段包括基于灰度、颜色、空间纹理、几何形状等把图像分割为若干个互不相交的区域,使得这些特征在同一区域内表现出一致性或者相似性。近年来,随着深度学习技术的不断发展,图像分割技术也有了突飞猛进的进展,该技术已被广泛应用于无人驾驶、现实增强、安防监控等领域。
然而现有采用深度学习的分割检测方法为了提取到更丰富的特征,往往会将网络模型设置的很深,这不但导致了算法复杂度增加、算法运行时间过长,同时还占用了过多的GPU资源。
因此,本领域亟需一种能够在保证识别准确性的前提下,降低算法复杂度的技术方案。
发明内容
本发明的目的是提供一种基于动态加权注意力机制的眼底图像检测方法及系统,通过对浅层网络模型进行层级特征融合以及动态加权注意力机制,在保证识别准确性的同时,可达到降低算法设计的复杂度、降低算法的运行时间以及减少GPU资源的过多占用的目的。
为实现上述目的,本发明提供了如下方案:
本发明提供了一种基于动态加权注意力机制的眼底图像检测方法,所述方法包括:
获取待使用的眼底图像;
利用眼底图像分割模型检测所述眼底图像的病变信息;所述眼底图像分割模型包括n层连续的下采样层和n层连续的上采样层,第n层下采样层与第一层上采样层连接:
采用所述眼底图像分割模型对所述眼底图像进行连续n层下采样,得到n层下采样输出特征;
将第i层下采样输出特征和相邻层下采样输出特征利用动态加权注意力机制融合,得到第i层加权特征,;其中,第1层加权特征为第1层下采样输出特征;
将第i层加权特征与第n-i层的上采样层的输出特征进行融合,并对融合特征进行反卷积后输入第n-i+1层上采样层;其中,第1层上采样层的输入为第n层加权特征与第n层下采样输出特征融合反卷积操作后的特征;
对第n层上采样层的输出进行分类卷积操作,得到每个像素的病变概率。
在一些实施例中,所述对第n层上采样层的输出进行分类卷积操作,得到每个像素的病变概率,具体包括:
对第n层上采样层的输出进行1x1x
在一些实施例中,在所述对第n层上采样层的输出进行分类卷积操作之后,还包括:
利用softmax归一化函数对卷积结果进行归一化。
在一些实施例中,所述将第i层输出特征和相邻层输出特征利用动态加权注意力机制融合,得到第i层加权特征,,具体包括:
获取第i层、第i-1层和第i+1层下采样输出特征;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京至真互联网技术有限公司,未经北京至真互联网技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210548394.9/2.html,转载请声明来源钻瓜专利网。





