[发明专利]一种数据处理方法、装置及电子设备在审
申请号: | 201910977544.6 | 申请日: | 2019-10-15 |
公开(公告)号: | CN110728374A | 公开(公告)日: | 2020-01-24 |
发明(设计)人: | 李远辉;王奇刚;舒红乔;杨安荣;魏闪闪 | 申请(专利权)人: | 联想(北京)有限公司 |
主分类号: | G06N20/00 | 分类号: | G06N20/00 |
代理公司: | 11227 北京集佳知识产权代理有限公司 | 代理人: | 王欢 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 权重参数 模型训练过程 人工智能模型 数据处理 迭代过程 多次迭代 模型训练 模型压缩 预设条件 预设要求 迭代 可控 权重 裁剪 申请 | ||
本申请公开了一种数据处理方法及装置,包括:在模型训练过程中,针对多个权重参数主体中的每一个权重参数主体:至少确定权重参数主体的权重在多次迭代过程中的第一距零值和第二距零值,在所述第一距零值和所述第二距零值满足预设条件时,将所述权重参数主体的权重值设为零。所述数据处理方法及装置,在模型训练过程中,能够依据权重在迭代过程中的至少两个距零值确定对应的权重参数的重要性,直接对不满足预设要求的权重参数进行裁剪,实现过程中不需要再对人工智能模型进行次数巨大的迭代,因而节省了模型训练时间;且过程中模型压缩率可控,能够得到最精简的人工智能模型。
技术领域
本申请涉及数据处理技术,更具体的说,是涉及一种数据处理方法、装置及电子设备。
背景技术
在深度学习模型成型之前的训练阶段,需要根据训练时的输入输出,对深度学习模型进行裁剪调整,以将一些对网络贡献冗余的非零权重参数裁剪掉,从而提升整个深度学习模型的精度。
发明内容
有鉴于此,本申请提供如下技术方案:
一种数据处理方法,包括:
在模型训练过程中,针对多个权重参数主体中的每一个权重参数主体:
至少确定权重参数主体的权重在多次迭代过程中的第一距零值和第二距零值;
在所述第一距零值和所述第二距零值满足预设条件时,将所述权重参数主体的权重值设为零。
可选的,所述第一距零值早于所述第二距零值出现,则所述在所述第一距零值和所述第二距零值满足预设条件时,将所述权重参数主体的权重值设为零,包括:
在所述第二距零值小于所述第一距零值,且所述第二距零值的绝对值小于第一阈值的情况下,将所述权重参数主体的权重值设为零。
可选的,还包括:
依据所述第一距零值和所述第二距零值,确定每一个权重参数主体的权重的距零值变化幅度;
依据所述距零值变化幅度确定每一个权重参数主体的重要性数值;
则所述在所述第一距零值和所述第二距零值满足预设条件时,将所述权重参数主体的权重值设为零,包括:
将重要性数值不满足第一条件的权重参数主体的权重值设为零。
可选的,所述确定每一个权重参数主体的权重的距零值变化幅度,包括:
确定每一个权重参数主体迭代前和迭代后的权重的距零值变化幅度;
所述确定各个权重参数主体迭代前和迭代后的权重的距零值变化幅度,包括:
设置固定的迭代步伐,确定迭代后与迭代前权重参数主体的权重的距零值变化幅度;
或,
设置固定的迭代步伐,确定权重参数主体迭代后的权重值与其初始权重值之间的距零值变化幅度;
或,
确定模型经过迭代满足精度要求后,权重参数主体的权重值与其初始权重值之间的距零值变化幅度。
可选的,所述将重要性数值不满足第一条件的权重参数主体的权重值设为零,包括:
将重要性数值小于第二阈值的权重参数主体的权重值设为零;
或,
将重要性数值由大到小的队列中,末尾的第一比例的权重参数主体的权重值设为零。
可选的,还包括:
确定每一个权重参数主体迭代后的权重值的绝对值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于联想(北京)有限公司,未经联想(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910977544.6/2.html,转载请声明来源钻瓜专利网。