[发明专利]数据处理方法、装置、集成芯片、电子设备及存储介质在审
申请号: | 202210303441.3 | 申请日: | 2022-03-24 |
公开(公告)号: | CN114692745A | 公开(公告)日: | 2022-07-01 |
发明(设计)人: | 吴博 | 申请(专利权)人: | 北京奕斯伟计算技术有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08;G06N5/04;G06V10/764;G06V10/82 |
代理公司: | 北京市立方律师事务所 11330 | 代理人: | 张筱宁 |
地址: | 100176 北京市北京经济技*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据处理 方法 装置 集成 芯片 电子设备 存储 介质 | ||
本申请实施例提供了一种数据处理方法、装置、集成芯片、电子设备及计算机可读存储介质,涉及集成电路技术领域。该方法包括:获取待处理数据,从第一处理器调用数据处理模型的输入层对待处理数据进行图形计算,得到预处理数据;从第二处理器调用数据处理模型的隐含层,对预处理数据进行矢量运算,生成合并数据;从第三处理器调用数据处理模型的输出层,对合并数据进行分类处理,得到数据处理结果。本申请实施例通过将数据处理模型的各数据处理层级分别与第一处理器、第二处理器和第三处理器进行优化匹配,实现了基于多处理器的高性能的模型推理,提高了数据处理结果的准确性。
技术领域
本申请涉及计算机软件技术领域,具体而言,本申请涉及一种数据处理方法、装置、集成芯片、电子设备及计算机可读存储介质。
背景技术
随着人工智能的兴起,深度学习已成为当前AI(Artificial Intelligence,人工智能)研究的重点,广泛应用于自动驾驶领域、环境感知、传感器融合等领域。
在通过数据处理模型,即神经网络模型进行海量数据的并行运算的同时,做到高效、可靠的推理,那就意味着承载AI算法的计算平台需要具备足够的加速处理性能。现有技术中,通常采用NPU(Neural-network Processing Unit,神经网络处理器)来进行数据处理模型的计算与推理,提升了模型的运行效率。但是在输入数据比较复杂的情况下,特别是图像数据的处理过程中,往往会出现NPU的硬件功能无法达到相应的数据处理要求的情况,造成模型的推理任务无法高效完成。
发明内容
本申请实施例提供了一种数据处理方法、装置、集成芯片、电子设备及计算机可读存储介质,可以解决现有技术中数据处理模型无法高效完成推理任务的问题。所述技术方案如下:
根据本申请实施例的一个方面,提供了一种数据处理方法,该方法包括:
获取待处理数据,从第一处理器调用数据处理模型的输入层对待处理数据进行图形计算,得到预处理数据;
从第二处理器调用数据处理模型的隐含层,对预处理数据进行矢量运算,生成合并数据;
从第三处理器调用数据处理模型的输出层,对合并数据进行分类处理,得到数据处理结果。
可选的,上述对预处理数据进行矢量运算,生成合并数据,包括:
基于第二处理器的内存层级将预处理数据拆分为至少两个分块数据;
针对分块数据进行矢量运算,生成合并数据。
可选的,上述隐含层对应存在至少两条处理链路;
针对分块数据进行矢量运算,生成合并数据,包括:
基于至少两条处理链路分别对分块数据进行矢量运算,生成至少两个中间数据;
将至少两个中间数据进行合并处理,得到合并数据。
可选的,每一处理链路包括至少两个计算单元;
基于第二处理器的内存层级将预处理数据拆分为至少两个分块数据之前,还包括:
基于内存层级为每一计算单元匹配目标存储空间;目标存储空间用于存放计算单元的输出数据。
可选的,上述目标存储空间包括第一层级存储器;
针对分块数据进行矢量运算,生成合并数据之前,还包括:
将预处理数据和分块数据均存储于第一层级存储器。
可选的,上述目标存储空间还包括第二层级存储器和第三层级存储器;第一层级存储器、第二层级存储器和第三层级存储器的层级依次递增;
基于至少两条处理链路分别对分块数据进行矢量运算,生成至少两个中间数据,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奕斯伟计算技术有限公司,未经北京奕斯伟计算技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210303441.3/2.html,转载请声明来源钻瓜专利网。