[发明专利]经由编译器发现深度学习加速器的硬件特性以用于优化在审
申请号: | 202180082044.1 | 申请日: | 2021-10-19 |
公开(公告)号: | CN116601645A | 公开(公告)日: | 2023-08-15 |
发明(设计)人: | A·T·扎伊迪;M·维泰兹;E·库卢尔切洛;J·卡明斯;A·X·明·张 | 申请(专利权)人: | 美光科技公司 |
主分类号: | G06N3/063 | 分类号: | G06N3/063;G06F17/16 |
代理公司: | 北京律盟知识产权代理有限责任公司 11287 | 代理人: | 赵子杰 |
地址: | 美国爱*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 经由 编译器 发现 深度 学习 加速器 硬件 特性 用于 优化 | ||
1.一种方法,其包括:
由计算装置向集成电路装置传输一或多个命令,每一命令与对指示所述集成电路装置在执行矩阵计算时的硬件特性的响应的一或多个请求相关联;
在所述计算装置处并在确定所述集成电路装置的所述硬件特性之后,接收代表人工神经网络的描述的数据;及
由所述计算装置至少部分地基于所述集成电路装置的所述硬件特性,从代表所述人工神经网络的所述描述的所述数据产生编译结果,所述编译结果包含第一数据及第二数据,所述第一数据代表所述人工神经网络的参数,所述第二数据代表能够由所述集成电路装置执行以基于所述第一数据及到所述人工神经网络的输入来产生所述人工神经网络的输出的指令。
2.根据权利要求1所述的方法,其中所述集成电路装置的所述硬件特性识别所述集成电路装置的至少一个处理单元的特征、选项、行为、性能或延时,或其任何组合。
3.根据权利要求2所述的方法,其中所述向所述集成电路装置传输所述一或多个命令包含将测试程序加载到所述集成电路装置中,以接收在所述集成电路装置中执行所述测试程序的响应。
4.根据权利要求3所述的方法,其进一步包括:
从在所述集成电路装置中执行所述测试程序的所述响应来确定所述硬件特性。
5.根据权利要求3所述的方法,其进一步包括:
从与所述集成电路装置中的所述测试程序的执行相关联的时间戳确定所述硬件特性。
6.根据权利要求3所述的方法,其进一步包括:
基于在所述集成电路装置中执行所述测试程序的所述响应,在集成电路装置的多个预定规范中识别所述集成电路装置的规范。
7.根据权利要求3所述的方法,其进一步包括:
基于在所述集成电路装置中执行所述测试程序的所述响应来探测所述集成电路的矩阵处理单元的硬件选项。
8.根据权利要求3所述的方法,其进一步包括:
基于经配置以执行矩阵计算的集成电路装置的多个硬件平台的规范而产生所述测试程序。
9.根据权利要求3所述的方法,其进一步包括:
变换来自所述人工神经网络的所述描述的所述编译结果,以基于所述集成电路装置的所述硬件特性改进当在所述集成电路装置中执行时所述结果的性能。
10.一种计算装置,其包括:
存储器;及
至少一个微处理器,其耦合到所述存储器,并且经配置以探测集成电路装置以在执行矩阵计算时识别所述集成电路装置的硬件特性,并且至少部分地基于所述集成电路装置的所述硬件特性,从代表人工神经网络的描述的数据产生编译结果,所述编译结果包含第一数据及第二数据,所述第一数据代表所述人工神经网络的参数,所述第二数据代表能够由所述集成电路装置执行以基于所述第一数据及到所述人工神经网络的输入来产生所述人工神经网络的输出的指令。
11.根据权利要求10所述的计算装置,其中所述集成电路装置的所述硬件特性识别所述集成电路装置的至少一个处理单元的特征、选项、行为、性能或延时,或其任何组合。
12.根据权利要求10所述的计算装置,其中所述至少一个微处理器进一步经配置以产生测试程序,将所述测试程序加载到所述集成电路装置中以供执行,及从所述集成电路装置检索执行所述测试程序的结果;且其中所述集成电路装置的所述硬件特性是从所述结果来识别。
13.根据权利要求12所述的计算装置,其中所述至少一个微处理器进一步经配置以基于所述集成电路装置的所述硬件特性来执行对所述编译结果的优化。
14.根据权利要求13所述的计算装置,其进一步包括与所述至少一个微处理器耦合的所述集成电路装置。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于美光科技公司,未经美光科技公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202180082044.1/1.html,转载请声明来源钻瓜专利网。