[发明专利]模型处理方法以及相关产品在审
申请号: | 202210010948.X | 申请日: | 2022-01-05 |
公开(公告)号: | CN114358254A | 公开(公告)日: | 2022-04-15 |
发明(设计)人: | 刘瑞 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 陈梅君 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 处理 方法 以及 相关 产品 | ||
本申请实施例公开了一种模型处理方法以及相关产品,可用于智慧交通和自动驾驶领域。模型处理方法包括:获取待处理深度网络模型,待处理深度网络模型包括N个处理层,任一处理层均包含一个或多个剪枝对象,N是正整数;获取待处理深度网络模型对应的剪枝结构先验知识,剪枝结构先验知识包括N个处理层的N个剪枝率所呈现的分布规律;根据剪枝结构先验知识,对各处理层包含的剪枝对象分别进行剪枝处理,得到精简深度网络模型;输出精简深度网络模型。采用本申请,可以降低深度学习模型的计算量以及降低模型占用的存储空间。
技术领域
本申请涉及智慧交通及自动驾驶领域,尤其涉及一种模型处理方法以及相关产品。
背景技术
深度学习已成为机器学习中最主流的分支之一。然而,随着深度学习的不断优化,模型的深度从几层扩展到上百层,随之而来的是计算量的同步膨胀。对非计算密集型终端设备而言,如果直接部署深度学习模型,计算量以及模型占用存储空间的大小等都会成为问题。进一步地,在特定领域(例如,医疗领域或者高频视频领域),图片的分辨率已经达到2k*2k,甚至5k*5k,图片分辨率的增大,进一步增加了模型计算量。
因此,如何降低深度学习模型的计算量以及降低模型占用的存储空间成为了亟待解决的重点问题。
发明内容
本申请实施例提供一种模型处理方法以及相关产品,可以降低深度学习模型的计算量以及降低模型占用的存储空间。
本申请实施例一方面提供了一种模型处理方法,包括:
获取待处理深度网络模型,所述待处理深度网络模型包括N个处理层,任一处理层均包含一个或多个剪枝对象,N是正整数;
获取所述待处理深度网络模型对应的剪枝结构先验知识,所述剪枝结构先验知识包括所述N个处理层的N个剪枝率所呈现的分布规律;
根据所述剪枝结构先验知识,对各处理层包含的剪枝对象分别进行剪枝处理,得到精简深度网络模型;
输出所述精简深度网络模型。
本申请实施例一方面提供了一种模型处理装置,包括:
获取模块,用于获取待处理深度网络模型,所述待处理深度网络模型包括N个处理层,任一处理层均包含一个或多个剪枝对象,N是正整数;
所述获取模块,还用于获取所述待处理深度网络模型对应的剪枝结构先验知识,所述剪枝结构先验知识包括所述N个处理层的N个剪枝率所呈现的分布规律;
剪枝模块,用于根据所述剪枝结构先验知识,对各处理层包含的剪枝对象分别进行剪枝处理,得到精简深度网络模型;
输出模块,用于输出所述精简深度网络模型。
本申请实施例一方面提供了一种计算机设备,包括存储器和处理器,存储器存储有计算机程序,计算机程序被处理器执行时,使得处理器执行上述各实施例中的方法。
本申请实施例一方面提供了一种计算机存储介质,计算机存储介质存储有计算机程序,计算机程序包括程序指令,程序指令当被处理器执行时,执行上述各实施例中的方法。
本申请实施例一方面提供了一种计算机程序产品,计算机程序产品包括计算机程序/指令,计算机程序/指令存储在计算机可读存储介质中,计算机程序/指令被计算机设备的处理器执行时,执行上述各实施例中的方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210010948.X/2.html,转载请声明来源钻瓜专利网。