[发明专利]用于低等待时间硬件存储器的系统和方法有效
申请号: | 201980016230.8 | 申请日: | 2019-02-11 |
公开(公告)号: | CN111788552B | 公开(公告)日: | 2023-10-24 |
发明(设计)人: | P·J·班农;K·A·胡德;E·塔尔佩斯 | 申请(专利权)人: | 特斯拉公司 |
主分类号: | G06F9/06 | 分类号: | G06F9/06;G06F13/00;G06F15/80;G06F16/53;G06F21/71 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 马明月 |
地址: | 美国得*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 等待时间 硬件 存储器 系统 方法 | ||
1.一种用于在硬件加速处理系统内检索数据的方法,所述方法包括:
根据与所述硬件加速处理系统的至少一个参数有关的所定义的程序,将数据文件存储在存储器内,所述数据文件被划分为具有对应的多个地址指针的多个固定长度块;
生成存储器映射,所述存储器映射标识在多个固定长度块内的被连续地存储的所述多个固定长度块;
响应于读取请求,标识:
数据的长度,所述长度与进入硬件加速处理器中的输入的长度有关;以及
地址指针,所述地址指针在所述存储器内标识用于所述读取请求的第一数据块;
基于所述块长度、所述长度和所述存储器映射中的至少一项,计算块计数和掩码,所述掩码是用于所述读取请求的要检索的若干数据块的代表;以及使用所述地址指针从所述存储器检索一个或多个数据块。
2.根据权利要求1所述的方法,其中所述硬件加速处理器是矩阵处理器。
3.根据权利要求1所述的方法,进一步包括步骤:将所述一个或多个数据块映射到所述硬件加速处理器的所述输入,使得所述一个或多个数据块是呈多维格式的,并且所述输入是一维的。
4.根据权利要求1所述的方法,其中所述固定长度块与所述硬件加速处理器的所述输入的所述长度有关。
5.根据权利要求1所述的方法,其中所述读取请求与固定长度数据块的第一组相对应,所述第一组被连续地存储并且使用单个初始地址指针被读取。
6.根据权利要求5所述的方法,其中在单个时钟周期中执行所述读取请求。
7.根据权利要求1所述的方法,其中所述硬件加速处理器的所述长度是固定长度数据块的整数倍。
8.根据权利要求1所述的方法,进一步包括步骤:计算结束地址,所述结束地址与对应于所述读取请求的所述多个固定长度数据块相关联。
9.根据权利要求8所述的方法,其中使用所述第一数据块的所述地址指针和所述固定长度数据块的所述长度计算所述结束地址。
10.一种用于将数据从存储器映射到硬件加速处理系统的系统,所述系统包括:
存储器,所述存储器根据与所述硬件加速处理系统的至少一个参数有关的所定义的程序来存储数据文件,所述数据文件被划分为具有对应的多个地址指针的多个固定长度数据块;
耦合到所述存储器的控制器,所述控制器被配置为根据所述所定义的程序来存储数据并且生成所存储的数据的虚拟映射;
耦合到所述存储器的定序器,所述定序器响应于恢复到读取请求,执行以下步骤:
标识数据的长度和地址指针,所述长度与进入硬件加速处理器中的输入的长度有关,所述地址指针在所述存储器内标识用于所述读取请求的第一数据块;
基于所述多个固定长度数据块的所述长度、所述地址指针和存储器映射,计算块计数,所述块计数是要从所述存储器检索的数据块的数目的代表;以及
检索所述多个固定长度数据块的与所述读取请求相对应的子组。
11.根据权利要求10所述的系统,进一步包括:耦合到所述定序器的格式器,所述格式器基于所述数据的长度,将从存储器检索到的所述多个固定长度数据块映射到所述硬件加速处理器的一维输入。
12.根据权利要求11所述的系统,其中所述硬件加速处理器是矩阵处理器。
13.根据权利要求10所述的系统,进一步包括耦合到所述格式器的缓存,所述缓存被配置为存储跨所述硬件加速处理器的多个操作的冗余的数据。
14.根据权利要求10所述的系统,其中所述存储器的虚拟映射被存储在所述定序器或所述控制器中。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于特斯拉公司,未经特斯拉公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201980016230.8/1.html,转载请声明来源钻瓜专利网。