[发明专利]一种网络模型的训练方法、装置及设备在审
| 申请号: | 202210753273.8 | 申请日: | 2022-06-28 |
| 公开(公告)号: | CN115062793A | 公开(公告)日: | 2022-09-16 |
| 发明(设计)人: | 张凯;任文奇;李哲暘;谭文明;任烨 | 申请(专利权)人: | 杭州海康威视数字技术股份有限公司 |
| 主分类号: | G06N20/00 | 分类号: | G06N20/00;G06N3/04;G06N3/08 |
| 代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 杨春香 |
| 地址: | 310051 浙*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本申请提供一种网络模型的训练方法、装置及设备,该方法包括:获取网络层对应的浮点型激活梯度值,对浮点型激活梯度值进行量化,得到定点型激活梯度值和激活值量化超参;基于定点型激活梯度值对网络层的初始模型权重进行调整,将调整后的模型权重更新为所述网络层的初始模型权重;若所述网络层不是首个网络层,则对网络层的初始模型权重进行量化,得到反向定点型权重和反向权重值量化超参;基于所述定点型激活梯度值、所述反向定点型权重、所述激活值量化超参和所述反向权重值量化超参,确定所述网络层的前一个网络层对应的浮点型激活梯度值。通过本申请的技术方案,可以减轻运算复杂度,运算量较小,资源消耗较小,能够对训练过程进行加速。 | ||
| 搜索关键词: | 一种 网络 模型 训练 方法 装置 设备 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州海康威视数字技术股份有限公司,未经杭州海康威视数字技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202210753273.8/,转载请声明来源钻瓜专利网。





