[发明专利]一种数据处理方法及相关产品在审
申请号: | 202010402271.5 | 申请日: | 2020-05-13 |
公开(公告)号: | CN111652368A | 公开(公告)日: | 2020-09-11 |
发明(设计)人: | 不公告发明人 | 申请(专利权)人: | 上海寒武纪信息科技有限公司 |
主分类号: | G06N3/08 | 分类号: | G06N3/08;G06N3/04 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 201306 上海*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据处理 方法 相关 产品 | ||
1.一种数据处理方法,其特征在于,包括:
通用处理器读取超参数映射表;其中,所述超参数映射表是不同的神经网络模型与超参数之间的对应关系;
所述通用处理器根据所述神经网络模型从所述超参数映射表中确定对应的超参数;其中,所述超参数是用于确定在训练过程中目标迭代间隔;所述目标迭代间隔包括至少一次权值更新迭代,且同一目标迭代间隔内量化过程中采用相同的所述数据位宽;
所述通用处理器根据所述端侧人工智能处理器的硬件架构信息和所述超参数生成对应的二进制指令;
所述通用处理器根据所述二进制指令生成对应的训练任务,将所述训练任务发送至云侧人工智能处理器上运行。
2.如权利要求1所述的数据处理方法,其特征在于,所述超参数映射表的获得步骤包括:
所述通用处理器获取端侧人工智能处理器的硬件架构信息,根据所述端侧人工智能处理器的硬件架构信息生成对应的二进制指令;
所述通用处理器根据所述二进制指令生成对应的训练任务,将所述训练任务发送至云侧人工智能处理器上运行;
所述云侧人工智能处理器接收所述训练任务,执行所述训练任务,获得训练结果;
所述通用处理器接收所述训练任务对应的训练结果,根据所述训练结果确定对应的超参数;其中,所述超参数是用于确定在训练过程中目标迭代间隔;所述目标迭代间隔包括至少一次权值更新迭代,且同一目标迭代间隔内量化过程中采用相同的所述数据位宽;
所述通用处理器根据同一端侧人工智能处理器的硬件架构信息的不同训练结果对应的超参数确定超参数映射表;其中,所述超参数映射表是不同的神经网络模型与超参数之间的对应关系。
3.如权利要求2所述的方法,其特征在于,所述训练任务包括:
统计待量化数据,确定每种待量化数据的统计结果;其中,所述待量化数据包括所述神经网络的神经元、权值、梯度、偏置中的至少一种数据;
利用每种待量化数据的统计结果以及数据位宽确定对应量化参数;
利用所述量化参数对所述待量化数据进行量化,获得对应的定点型数据;
利用所述定点型数据进行训练。
4.如权利要求3所述的方法,其特征在于,所述统计结果为每种待量化数据中的最大值和最小值;
或所述统计结果为每种待量化数据中的绝对值最大值;
或所述绝对值最大值根据每种待量化数据中的最大值和最小值确定。
5.如权利要求3所述的方法,其特征在于,所述量化参数根据每种待量化数据中的最大值、最小值以及所述数据位宽确定;
或所述量化参数根据每种待量化数据中的绝对值最大值、所述数据位宽确定;
或所述量化参数为点位置参数或第一缩放系数;
或所述量化参数包括点位置参数和第二缩放系数。
6.如权利要求5所述的方法,其特征在于,所述第一缩放系数根据点位置参数和第二缩放系数确定;其中,确定第一缩放系数时使用的点位置参数为已知固定值,或所述点位置参数和对应的所述第二缩放系数相乘的结果整体作为第一缩放系数应用于神经网络运算过程中的数据量化。
7.如权利要求5所述的方法,其特征在于,所述第二缩放系数根据所述点位置参数、所述统计结果、所述数据位宽确定。
8.如权利要求5~6任一项权利要求所述的方法,其特征在于,所述量化参数还包括偏移量;其中,所述偏移量根据每种待量化数据的统计结果确定。
9.如权利要求3所述的方法,其特征在于,所述数据位宽是预设值;或所述数据位宽根据对应的量化误差进行调整;其中,所述量化误差是根据量化后的数据与对应的量化前的数据确定。
10.如权利要求9所述的方法,其特征在于,所述数据位宽的调整步骤包括:
所述量化误差与阈值进行比较,根据比较结果,调整所述数据位宽;其中,所述阈值包括第一阈值和第二阈值中的至少一个。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海寒武纪信息科技有限公司,未经上海寒武纪信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010402271.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:具有密闭供氧的好氧发酵系统
- 下一篇:一种连续变焦系统装调方法