[发明专利]混合精度神经网络在审

专利信息
申请号: 202110572483.2 申请日: 2021-05-25
公开(公告)号: CN113723589A 公开(公告)日: 2021-11-30
发明(设计)人: T·彭内洛 申请(专利权)人: 美商新思科技有限公司
主分类号: G06N3/04 分类号: G06N3/04;G06N3/063;G06N3/08
代理公司: 北京市金杜律师事务所 11256 代理人: 李兴斌
地址: 美国加利*** 国省代码: 暂无信息
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 混合 精度 神经网络
【说明书】:

本公开的实施例涉及混合精度神经网络。用于机器学习(ML)模型的混合精度量化技术。对于ML模型(114),接收目标带宽增加(302),ML模型(114)包括由第一位数目表示的第一数据类型的对象。目标带宽增加涉及将对象的第一部分改变为由不同于第一位数目的第二位数目表示的第二数据类型(310)。方法进一步包括基于带宽对ML模型中的对象进行排序(304)。方法进一步包括:基于目标带宽增加和多个对象的排序来标识对象的第一部分,以从第一数据类型改变为第二数据类型(508)。方法进一步包括将对象的第一部分从第一数据类型改变为第二数据类型(508)。

技术领域

本公开涉及机器学习,并且更具体地涉及使用以不止一个精度表示的值的神经网络。

背景技术

神经网络和其他机器学习(ML)模型可以包括表示数值的变量。这些数值通常被表示为浮点数据类型。例如,浮点值通常用于表示:(1)网络中某个层(诸如卷积或内积)的权重或学习值,以及(2)特征图,也被称为激活或二进制大对象(BLOB)。这些权重和BLOB可以用于例如神经网络中给定层的输出以及后续层的输入。

然而,以浮点值执行神经网络在计算上可能是昂贵的(例如,执行可能较慢,并且功率密集)。许多神经网络包括大量的浮点值,并且浮点算术通常较慢并且消耗功率。另外,浮点数据类型通常为32位或更大,因此加载和存储这种值需要存储空间并且需要时间。因此,使用浮点值可能会抑制神经网络在可用计算资源较少或功率受限的设备(包括诸如智能手机和平板电脑的边缘设备)上的执行。

发明内容

实施例包括一种方法。该方法包括:接收针对机器学习(ML)模型的目标带宽增加,ML模型包括由第一位数目表示的第一数据类型的多个对象。目标带宽增加涉及将多个对象的第一部分改变为由不同于第一位数目的第二位数目表示的第二数据类型。方法还包括基于带宽对ML模型中的多个对象进行排序。方法还包括:基于目标带宽增加和多个对象的排序,标识多个对象的第一部分以从第一数据类型改变为第二数据类型。方法还包括将多个对象的第一部分从第一数据类型改变为第二数据类型。

实施例还包括一种系统,系统包括处理器和存储指令的存储器,该指令在由处理器执行时,使处理器执行操作。操作包括:接收针对神经网络的目标带宽增加,神经网络包括由第一位数目表示的第一数据类型的多个二进制大对象(BLOB)和权重。目标带宽增加涉及:将多个BLOB和权重中的至少一些改变为由不同于第一位数目的第二位数目表示的第二数据类型。操作还包括:基于目标带宽增加,标识多个BLOB和权重的第一部分,以从第一数据类型改变为第二数据类型。操作还包括将多个BLOB和权重的第一部分从第一数据类型改变为第二数据类型。

实施例还包括非暂态计算机可读介质,其包括所存储的指令,该指令在由处理器执行时,使处理器执行操作。操作包括:接收针对机器学习(ML)模型的目标性能改变,ML模型包括由第一位数目表示的第一数据类型的多个对象。目标性能改变涉及:将多个对象中的至少一些改变为由不同于第一位数目的第二位数目表示的第二数据类型。操作还包括基于大小对ML模型中的多个对象进行排序。操作还包括:基于目标性能改变和对多个对象的排序,标识多个对象的第一部分以从第一数据类型改变为第二数据类型。操作还包括将多个对象的第一部分从第一数据类型改变为第二数据类型。操作还包括:使用ML模型(包括将多个对象的第一部分改变为第二数据类型)来推断一个或多个输入的结果。

附图说明

通过下面给出的详细描述和本文描述的示例的附图,将更全面地理解本公开。附图用于提供本文描述的示例的知识和理解,并且不将本公开的范围限制为这些特定示例。此外,附图不必按比例绘制。

图1图示了根据一个实施例的将混合精度值用于ML模型。

图2图示了根据一个实施例的用于将混合精度值用于ML模型的ML训练服务器和混合精度量化服务器。

图3是根据一个实施例的用于将混合精度值用于ML模型的流程图。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于美商新思科技有限公司,未经美商新思科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110572483.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top