[发明专利]一种数据处理方法及相关产品在审
申请号: | 202010402271.5 | 申请日: | 2020-05-13 |
公开(公告)号: | CN111652368A | 公开(公告)日: | 2020-09-11 |
发明(设计)人: | 不公告发明人 | 申请(专利权)人: | 上海寒武纪信息科技有限公司 |
主分类号: | G06N3/08 | 分类号: | G06N3/08;G06N3/04 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 201306 上海*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据处理 方法 相关 产品 | ||
本技术方案涉及一种数据处理方法及相关产品,所述产品中的板卡包括:存储器件、接口装置和控制器件以及人工智能芯片;其中,所述人工智能芯片与所述存储器件、所述控制器件以及所述接口装置分别连接;所述存储器件,用于存储数据;所述接口装置,用于实现所述人工智能芯片与外部设备之间的数据传输;所述控制器件,用于对所述人工智能芯片的状态进行监控。所述板卡可以用于执行人工智能运算。
技术领域
本公开的实施例涉及一种数据处理方法及相关产品。
背景技术
神经网络(neural network,NN)是一种模仿生物神经网络的结构和功能的数学模型或计算模型。神经网络通过样本数据的训练,不断修正网络权值和阈值使误差函数沿负梯度方向下降,逼近期望输出。它是一种应用较为广泛的识别分类模型,多用于函数逼近、模型识别分类、数据压缩和时间序列预测等。
在实际运用中,神经网络的数据常用32Bit,现有的神经网络的数据占用的比特位较多,虽然确保了精度,但是需要较高的存储空间以及处理带宽,提高了成本。
发明内容
为了解决上述所述的技术问题,本公开提出一种数据处理方法及相关产品。
为实现上述目的,本公开提供一种数据处理方法,包括:
所述通用处理器获取端侧人工智能处理器的硬件架构信息,根据所述端侧人工智能处理器的硬件架构信息生成对应的二进制指令;
所述通用处理器根据所述二进制指令生成对应的训练任务,将所述训练任务发送至云侧人工智能处理器上运行;
所述云侧人工智能处理器接收所述训练任务,执行所述训练任务,获得训练结果;
所述通用处理器接收所述训练任务对应的训练结果,根据所述训练结果确定对应的超参数;其中,所述超参数是用于确定在训练过程中目标迭代间隔;所述目标迭代间隔包括至少一次权值更新迭代,且同一目标迭代间隔内量化过程中采用相同的所述数据位宽;
所述通用处理器根据同一端侧人工智能处理器的硬件架构信息的不同训练结果对应的超参数确定超参数映射表;其中,所述超参数映射表是同一端侧人工智能处理器的硬件架构信息所述对应的不同的训练结果与超参数之间的对应关系。
为实现上述目的,本公开提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,所述计算机程序被执行时,实现如上述所述的方法的步骤。
为实现上述目的,本公开提供一种数据处理装置,所述装置包括:存储器、通用处理器以及云侧人工智能处理器;所述存储器上存储有可在所述通用处理器和/或所述云侧人工智能处理器上运行上述所述方法的计算机程序。
在神经网络运算过程中,量化时利用本公开的技术方案确定量化参数,该量化参数用于人工智能处理器对神经网络运算过程中的数据进行量化,将高精度数据转换为低精度定点数,可以减少神经网络运算过程中涉及的数据存储所有的空间大小。例如:float32转化为fix8可以将模型参数减少4倍。由于数据存储空间变小,使得神经网络部署时使用更小的空间,使得人工智能处理器芯片上的片上内存可以容纳更多的数据,减少了人工智能处理器芯片访存数据,提高计算性能。
附图说明
为了更清楚地说明本公开实施例的技术方案,下面将对实施例的附图作简单地介绍,显而易见地,下面描述中的附图仅仅涉及本公开的一些实施例,而非对本公开的限制。
图1为神经网络结构示意图;
图2a为人工智能处理器的软件栈示意图;
图2为本技术方案的系统架构图;
图3为示意性给出本技术方案的应用场景图之一;
图4为示意性给出本技术方案的应用场景图之二;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海寒武纪信息科技有限公司,未经上海寒武纪信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010402271.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:具有密闭供氧的好氧发酵系统
- 下一篇:一种连续变焦系统装调方法