[发明专利]一种基于位置敏感图的知识蒸馏指导方法有效
申请号: | 201910517256.2 | 申请日: | 2019-06-14 |
公开(公告)号: | CN110245754B | 公开(公告)日: | 2021-04-06 |
发明(设计)人: | 常立博;卢通;杜慧敏;张霞;张丽果;王一鸣;徐一丁 | 申请(专利权)人: | 西安邮电大学 |
主分类号: | G06N5/02 | 分类号: | G06N5/02;G06N3/04 |
代理公司: | 西安智邦专利商标代理有限公司 61211 | 代理人: | 汪海艳 |
地址: | 710121 陕西*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 位置 敏感 知识 蒸馏 指导 方法 | ||
1.一种基于位置敏感图的知识蒸馏指导方法,其特征在于,包括基于位置敏感图的指导和基于网络输出与标注信息的指导;
通过基于位置敏感图的指导获得基于位置敏感图的指导损失函数,通过基于网络输出与标注信息的指导,获得基于网络输出的指导损失函数及基于标注信息的指导损失函数;
利用基于位置敏感图的指导损失函数、基于网络输出的指导损失函数及基于标注信息的指导损失函数加权相加后获得总体指导损失函数,利用总体指导损失函数指导学生网络的参数更新;
其中基于位置敏感图的指导包括以下步骤:
S1、选取教师网络中的至少一个网络层作为指导层;选取学生网络中的至少一个网络层作为被指导层;指导层与被指导层一一对应;
S2、获得教师网络与学生网络的多通道位置敏感图;
S21、根据希望获得的位置敏感图的通道数分别将指导层与被指导层输出特征图均分为C组,其中组数与位置敏感图的通道数相同;
S22、分别对指导层与被指导层中每组输出特征图进行3D最大值池化,得到至少一组教师网络多通道位置敏感图及至少一组学生网络多通道位置敏感图,其中C为大于等于1的正整数;
S3、对获得的教师网络多通道位置敏感图及对应的学生网络多通道位置敏感图作损失,得到基于位置敏感图的指导损失函数;
所述学生网络为轻量化目标检测网络;所述轻量化目标检测网络包括轻量化基础卷积神经网络和轻量化分支预测网络;
所述轻量化基础卷积神经网络包括卷积层、第一网络层、第二网络层及第三网络层;
所述第一网络层包括至少一个第一类卷积模块与至少一个第二类卷积模块;
所述第二网络层包括至少一个第二类卷积模块,或至少一个第二类卷积模块与至少一个第一类卷积模块;
所述第三网络层包括至少一个第二类卷积模块,或至少一个第二类卷积模块与至少一个第一类卷积模块;
所述第一类卷积模块输出通道数与输入通道数相同,由一个卷积核尺寸为t×t、步长为1的深度卷积层与一个卷积核尺寸为1×1、步长为1的卷积层及旁路组成;其中t为正整数;
所述第二类卷积模块输出通道数是输入通道数的2倍,由一个卷积核尺寸为l×l,步长为2的深度卷积层与一个卷积核尺寸为1×1,步长为1的卷积层组成;其中l为正整数;
所述卷积层的输入为待测图像,用于获取待测图像的特征;
卷积层输出的图像经过由第一网络层卷积运算后输出a特征图像;
a特征图像输入至第二网络层卷积运算后输出b特征图像;
b特征图像输入至第三网络层卷积运算后输出c特征图像;
所述轻量化分支预测网络包括至少一个第四类卷积模块与一个卷积层c′;
所述第四类卷积模块输出通道数与输入通道数相同,由一个卷积核尺寸为t×t、步长为1的深度卷积层与一个卷积核尺寸为1×1、步长为1的卷积层组成;
其中第四类卷积模块Ⅰ(14)接收轻量化基础卷积神经网络输出的c特征图像;
c特征图像经第四类卷积模块Ⅰ(14)卷积运算后输出至卷积层c′运算后输出第一组预测张量。
2.根据权利要求1所述的基于位置敏感图的知识蒸馏指导方法,其特征在于:基于位置敏感图的指导损失函数为:
其中,gps是Generate position sensitive map的缩写,表示生成位置敏感图;u(x;wl')表示教师网络指导层的输出特征图,v(x;wj)表示学生网络被指导层的输出特征图;l′为教师网络中的第l′层,j为学生网络中的第j层。
3.根据权利要求1所述的基于位置敏感图的知识蒸馏指导方法,其特征在于:所述教师网络为YOLOv3目标检测网络。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安邮电大学,未经西安邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910517256.2/1.html,转载请声明来源钻瓜专利网。