[发明专利]用于临时缓冲的片上密集存储器在审
申请号: | 202080014421.3 | 申请日: | 2020-02-24 |
公开(公告)号: | CN113424169A | 公开(公告)日: | 2021-09-21 |
发明(设计)人: | V·乔治;A·科克;A·阿南塔拉曼;S·马伊尤兰;S·金;V·安德烈;E·乌尔德-艾哈迈德-瓦勒;J·雷;A·R·阿普;N·C·加洛坡冯伯里斯;P·苏提;M·麦克弗森 | 申请(专利权)人: | 英特尔公司 |
主分类号: | G06F15/78 | 分类号: | G06F15/78;G06F15/17 |
代理公司: | 永新专利商标代理有限公司 72002 | 代理人: | 刘瑜 |
地址: | 美国加*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 临时 缓冲 密集 存储器 | ||
1.一种图形多处理器,包括:
多个计算引擎,其用于执行第一计算以生成第一组数据;
高速缓存,其用于存储数据;以及
高密度存储器,其与所述多个计算引擎和所述高速缓存一起在片上集成,所述高密度存储器用于接收所述第一组数据,临时地存储所述第一组数据,并且在第一时间段期间将所述第一组数据提供给所述高速缓存,所述第一时间段在所述多个计算引擎将使用所述第一组数据进行第二计算的第二时间段之前。
2.根据权利要求1所述的图形多处理器,其中,所述多个计算引擎使用所述第一组数据进行第二计算以生成第二组数据。
3.根据权利要求1所述的图形多处理器,其中,所述高密度存储器包括用于接收所述第一组数据的第一串行端口和用于提供所述第一组数据的第二串行端口。
4.根据权利要求1所述的图形多处理器,其中,所述第一组数据以串行方式循环通过所述高密度存储器。
5.根据权利要求4所述的图形多处理器,还包括:
并行到串行转换器,其用于从所述多个计算引擎以并行格式接收所述第一组数据,并且将所述第一组数据以串行格式提供给所述高密度存储器;以及
串行到并行转换器,其用于从所述高密度存储器以串行格式接收所述第一组数据,并且将所述第一组数据以并行格式提供给所述高速缓存。
6.根据权利要求1所述的图形多处理器,其中,所述第一时间段在所述第二时间段之前大约5到10毫秒。
7.根据权利要求1所述的图形多处理器,其中,所述高密度存储器包括嵌入式动态随机存取存储器(DRAM)。
8.根据权利要求1所述的图形多处理器,其中,所述高速缓存包括嵌入式动态随机存取存储器(DRAM)。
9.一种图形处理器,包括:
多个计算引擎,其用于执行第一计算以生成第一组数据;
高速缓存,其用于存储数据;以及
基于栈的存储器,其与所述多个计算引擎和所述高速缓存一起在片上集成,所述基于栈的存储器用于接收所述第一组数据,临时地存储所述第一组数据,并且在第一时间段期间将所述第一组数据提供给所述高速缓存,所述第一时间段在所述多个计算引擎将使用所述第一组数据进行第二计算的第二时间段之前。
10.根据权利要求9所述的图形处理器,其中,所述多个计算引擎使用所述第一组数据进行第二计算以生成第二组数据。
11.根据权利要求9所述的图形多处理器,其中,所述基于栈的存储器包括后进先出(LIFO)栈,其中,数据以后进先出方式被添加或移除。
12.根据权利要求11所述的图形处理器,其中,在需要指令或数据之前将所述指令或所述数据从所述基于栈的存储器预取到所述高速缓存中,以便节省用于对片外存储器进行读取和写入的带宽。
13.根据权利要求11所述的图形处理器,其中,所述多个计算引擎生成用于机器学习层的第一组数据和第二组数据,其中,用于第一层的数据被推入所述基于栈的存储器,而用于第二层的数据未被推入所述基于栈的存储器。
14.根据权利要求13所述的图形处理器,其中,从所述基于栈的存储器弹出的用于所述第一层的所述数据被重新计算,以便确定未被推入所述基于栈的存储器的用于所述第二层的数据。
15.根据权利要求9所述的图形处理器,其中,所述高速缓存包括嵌入式动态随机存取存储器(DRAM)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202080014421.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:多层阳离子交换氯碱膜
- 下一篇:用于生成光强度图像的装置和方法