[发明专利]一种裁剪神经网络模型的方法和电子设备在审
申请号: | 201910815213.2 | 申请日: | 2019-08-30 |
公开(公告)号: | CN110516797A | 公开(公告)日: | 2019-11-29 |
发明(设计)人: | 舒红乔;王奇刚;李远辉;杨安荣;邓建林 | 申请(专利权)人: | 联想(北京)有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08;G06F17/16 |
代理公司: | 11227 北京集佳知识产权代理有限公司 | 代理人: | 赵焕<国际申请>=<国际公布>=<进入国 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 裁剪 神经网络模型 特征图 依次选择 准确度 预设 筛选 申请 分析 保证 | ||
本申请提供了一种裁剪神经网络模型的方法,包括:依据预设裁剪参数,分析得到待裁剪神经网络模型中待裁剪层;依次选择所述待裁剪神经网络模型中至少一个待裁剪层,基于所述待裁剪层中特征图的奇异值对所述待裁剪层中的至少一个特征图进行裁剪,得到裁剪后的神经网络模型。本方案中,基于神经网络模型中待裁剪层中特征图的奇异值与其所含的特征图进行筛选裁剪,在保证了神经网络模型的处理准确度的前提下,简化了神经网络模型。
技术领域
本申请涉及电子设备领域,更具体的说,是涉及一种裁剪神经网络模型的方法和电子设备。
背景技术
“边缘智能”作为人工智能落实到真实生活的最后一里路,需在终端设备上运行复杂的深度神经网络模型。
而随着人工智能领域对机器智能化需求的提高,神经网络的结构设计得愈加复杂,所需的计算量和存储空间也随之大大增加,但处于边缘的便携设备(如移动手机的FaceID(刷脸认证)、无人机、去中心化自动驾驶系统等)的计算和存储等资源有限,这使得深度神经网络难以在边缘设备上的高效的部署。因此需对神经网络模型进行压缩裁剪以完成轻量级部署。
所以,亟需一种能够对神经网络模型进行裁剪的方法。
发明内容
有鉴于此,本申请提供了一种裁剪神经网络模型的方法,解决现有技术中边缘设备的资源有限导致其不能支持神经网络模型部署的问题。
为实现上述目的,本申请提供如下技术方案:
一种裁剪神经网络模型的方法,包括:
依据预设裁剪参数,分析得到待裁剪神经网络模型中待裁剪层;
依次选择所述待裁剪神经网络模型中至少一个待裁剪层,基于所述待裁剪层中特征图的奇异值对所述待裁剪层中的至少一个特征图进行裁剪,得到裁剪后的神经网络模型。
优选的,上述的方法,所述依次选择所述待裁剪神经网络模型中至少一个待裁剪层,基于所述待裁剪层中特征图的奇异值对所述待裁剪层中的至少一个特征图进行裁剪,得到裁剪后的神经网络模型,包括:
选择所述待裁剪神经网络模型中的第一待裁剪层;
将预设训练数据输入所述待裁剪神经网络模型中,基于所述第一待裁剪层中特征图的奇异值对所述第一待裁剪层中的至少一个特征图进行裁剪,得到裁剪完第一待裁剪层后的神经网络模型;
判断是否还有待裁剪层,如果否,将所述裁剪完第一待裁剪层后的神经网络模型记为裁剪后的神经网络模型;
如果是,选择所述待裁剪神经网络模型中的第二待裁剪层,所述第一待裁剪层相对于所述第二待裁剪层更靠近输入层;
将预设训练数据输入所述裁剪完第一待裁剪层后的神经网络模型中,基于所述第二待裁剪层中特征图的奇异值对所述第二待裁剪层中的至少一个特征图进行裁剪,得到裁剪完第二待裁剪层后的神经网络模型;
判断是否还有待裁剪层,如果否,将所述裁剪完第二待裁剪层后的神经网络模型记为裁剪后的神经网络模型;
如果是,选择所述待裁剪神经网络模型中的第三待裁剪层,并执行将预设训练数据输入所述裁剪完第二待裁剪层后的神经网络模型中。
优选的,上述的方法,所述将预设训练数据输入所述待裁剪神经网络模型中,基于所述第一待裁剪层中特征图的奇异值对所述第一待裁剪层中的至少一个特征图进行裁剪,得到裁剪完第一待裁剪层后的神经网络模型,包括:
将预设训练数据输入所述待裁剪神经网络模型中,计算训练数据经过所述第一待裁剪层时的至少两个特征图的均值;
依据所述第一待裁剪层时的至少两个特征图的均值,分别对所述至少两个特征图进行奇异值分解,并分别计算得到所述至少两个特征图奇异值的和;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于联想(北京)有限公司,未经联想(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910815213.2/2.html,转载请声明来源钻瓜专利网。