[发明专利]基于剪枝卷积神经网络的分类方法及相关设备在审
申请号: | 202210458105.6 | 申请日: | 2022-04-27 |
公开(公告)号: | CN114881136A | 公开(公告)日: | 2022-08-09 |
发明(设计)人: | 陆强 | 申请(专利权)人: | 际络科技(上海)有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 周淑娟 |
地址: | 202150 上海市崇明区长*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 剪枝 卷积 神经网络 分类 方法 相关 设备 | ||
1.一种基于剪枝卷积神经网络的分类方法,其特征在于,包括:
获取待分类的图片;
将所述待分类的图片输入剪枝后的分类模型,得到对应的分类结果;
其中,所述剪枝后的分类模型中的分类模型权重是通过预定义的神经网络结构搜索方法对预先训练好的剪枝敏感度分析模型搜索得到;
所述预先训练好的剪枝敏感度分析模型是基于初始分类模型、训练图片集、所述训练图片集对应的标签集以及权重掩码训练集训练得到。
2.根据权利要求1所述的基于剪枝卷积神经网络的分类方法,其特征在于,所述方法还包括:
为初始分类模型中每个待分析网络层构建初始剪枝敏感度分析模型;
将权重掩码训练集输入所述初始剪枝敏感度分析模型,得到待分析网络层的初始权重;所述权重掩码训练集通过随机数生成方法生成,且所述权重掩码训练集中的每项权重掩码训练数据与剪枝率对应;
将训练图片集输入所述初始分类模型,基于每个待分析网络层的初始权重以及前向计算得到初始预测结果;
根据所述初始预测结果以及所述标签集,利用反向传播算法对所述每个待分析网络层的初始权重进行更新,得到待分析网络层的更新后权重;
根据所述待分析网络层的更新后权重,利用反向传播算法的链式法则,对所述初始剪枝敏感度分析模型中的权重进行更新,直到所述初始分类模型收敛,从而得到预先训练好的剪枝敏感度分析模型以及训练好的分类模型。
3.根据权利要求2所述的基于剪枝卷积神经网络的分类方法,其特征在于,所述将权重掩码训练集输入所述初始剪枝敏感度分析模型,得到待分析网络层的初始权重,包括:
将所述权重掩码训练集中的权重掩码训练数据输入多个卷积网络,以生成特征图;以及
融合所述特征图与所述权重掩码训练数据,以生成所述待分析网络层的所述初始权重。
4.根据权利要求2所述的基于剪枝卷积神经网络的分类方法,其特征在于,所述方法还包括:
步骤201,在预设的剪枝率搜索空间内穷举所述训练好的分类模型中每个网络层的剪枝率,得到剪枝率集合;在所述剪枝率集合中筛选出满足预设的剪枝目标的剪枝率,作为待分析剪枝率;其中,所述预设的剪枝目标为所述训练好的分类模型的剪枝目标;
步骤202,根据剪枝率与权重掩码的对应关系,确定所述待分析剪枝率所对应的权重掩码,作为待分析权重掩码;
步骤203,将所述待分析权重掩码输入所述预先训练好的剪枝敏感度分析模型中,得到所述训练好的分类模型对应的剪枝后权重;
步骤204,基于所述剪枝后权重对所述训练好的分类模型进行性能评价,得到性能评价指标值;
步骤205,重复所述步骤203至所述步骤204,直到穷尽所有待分析剪枝率,从而得到多个性能评价指标值;
步骤206,从所述多个性能评价指标值中确定出最大的性能评价指标值作为最优灵敏度,将所述最优灵敏度对应的剪枝后权重作为剪枝后的分类模型中的分类模型权重。
5.根据权利要求4所述的基于剪枝卷积神经网络的分类方法,其特征在于,所述剪枝率与权重掩码的对应关系为权重掩码mask基于剪枝率p与权重维度信息得到,其中,所述权重维度信息包括通道数C:
mask[0:C*p]=0,mask[C*p:C]=1
其中,mask[0:C*p]=0为C个通道中前C*p个通道对应的权重掩码mask为0,mask[C*p:C]=1为C个通道中后C-C*p个通道对应的权重掩码mask为1。
6.根据权利要求4所述的基于剪枝卷积神经网络的分类方法,其特征在于,所述在预设的剪枝率搜索空间内穷举所述训练好的分类模型中每个网络层的剪枝率,得到剪枝率集合,包括:
根据预先设定的剪枝率的取值范围以及剪枝率取值步长,在所述预先设定的剪枝率的取值范围内,穷举得到所有符合所述剪枝率取值步长的剪枝率,从而得到剪枝率集合。
7.根据权利要求4-6任一所述的基于剪枝卷积神经网络的分类方法,其特征在于,所述预设的剪枝目标包括以下至少一项:所述训练好的分类模型的目标计算力;所述训练好的分类模型的目标参数量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于际络科技(上海)有限公司,未经际络科技(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210458105.6/1.html,转载请声明来源钻瓜专利网。