[发明专利]一种基于知识蒸馏网络检测眼底图像类型的方法及装置有效
申请号: | 202110700727.0 | 申请日: | 2021-06-23 |
公开(公告)号: | CN113421243B | 公开(公告)日: | 2023-06-02 |
发明(设计)人: | 谢海;雷柏英;张国明;汪天富;陈懿;田汝银 | 申请(专利权)人: | 深圳大学 |
主分类号: | G06T7/00 | 分类号: | G06T7/00;G06V10/764;G06N3/042;G06N3/045;G06N3/094 |
代理公司: | 深圳市君胜知识产权代理事务所(普通合伙) 44268 | 代理人: | 陈小强;徐凯凯 |
地址: | 518061 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 知识 蒸馏 网络 检测 眼底 图像 类型 方法 装置 | ||
1.一种基于知识蒸馏网络检测眼底图像类型的方法,其特征在于,包括步骤:
在教师网络和学生网络之间设置若干个教师辅助网络,得到基础网络架构,定义教师网络和学生网络的最后输出为和,则利用KL散度计算KD损失可表达为:,其中,是一个超参数,控制教师网络和学生网络的软信号输出,所述教师辅助网络具有的残差层数量大于学生网络具有的残差层数量且小于教师网络具有的残差层数量,避免蒸馏过程中的特征信息损失,使得学生网络以小尺寸实现对眼底图像类型的高精度预测;
在所述基础网络架构中的每一个网络的最后特征输出层中增设稠密传输模块,降低蒸馏过程中的特征信息损失,在所述基础网络构架中的任意两个相邻网络之间设置对抗学习网络的判别器,构建知识蒸馏网络模型,使得两个相邻网络的特征保持一致,所述稠密传输模块还用于对基础网络架构中每个网络的最后特征输出层进行稠密传输处理,并以和范数约束每个网络的特征输出,定义教师网络和学生网络的最后特征输出层的特征分别为和,则其最后特征输出层的损失函数为:
,;定义教师辅助网络的蒸馏损失为,为教师辅助网络的数量索引;整合和范数损失之后,得到的多级稠密传输KD模型的损失可定义为:;所述对抗学习网络的判别器由两个卷积核大小为1的卷积层、一个自适应平均池化层、全连接层及一个Sigmoid层组成,所述判别器用于对基础网络构架中的任意两个相邻网络的输出特征进行特征空间对齐;
将已标记眼底图像输入到所述知识蒸馏网络模型中进行训练,得到训练后知识蒸馏网络模型,所述已标记眼底图像包括正常眼底图像、ROP眼底图像以及AP-ROP眼底图像;
将待测眼底图像输入到所述训练后知识蒸馏网络模型,输出待测眼底图像的类型;
所述教师网络为ResNet-34网络、ResNet-50网络或ResNet-101中的一种,所述学生网络为具有6个残差层的网络结构,所述教师辅助网络为具有18、14、10、8个残差层的网络结构中的一种或多种;
所述稠密传输模块用于将教师网络和学生网络的最后输出以KL散度作为损失函数,约束学生网络的输出并蒸馏教师网络学习到的特征。
2.一种存储介质,其特征在于,所述存储介质存储有一个或者多个程序,所述一个或者多个程序可被一个或者多个处理器执行,以实现如权利要求1所述基于知识蒸馏网络检测眼底图像类型的方法中的步骤。
3.一种基于知识蒸馏网络检测眼底图像类型的装置,其特征在于,包括处理器,适于实现各指令;以及存储介质,适于存储多条指令,所述指令适于由处理器加载并执行权利要求1所述基于知识蒸馏网络检测眼底图像类型的方法中的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳大学,未经深圳大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110700727.0/1.html,转载请声明来源钻瓜专利网。