[发明专利]用于处理具有偏斜非零分布的稀疏矩阵数据的异构硬件加速器架构在审
申请号: | 201810001937.9 | 申请日: | 2018-01-02 |
公开(公告)号: | CN108268424A | 公开(公告)日: | 2018-07-10 |
发明(设计)人: | E·努维塔蒂;D·马尔 | 申请(专利权)人: | 英特尔公司 |
主分类号: | G06F17/16 | 分类号: | G06F17/16;G06F9/50 |
代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 李炜;黄嵩泉 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 描述了用于处理具有偏斜非零分布的稀疏矩阵数据的异构硬件加速器架构。加速器包括用于通过高带宽接口从第一存储器访问数据的稀疏片以及用于通过低等待时间接口从第二存储器随机地访问数据的超/极稀疏片。该加速器确定要执行涉及矩阵的一个或多个计算任务,将矩阵分区为第一多个块和第二多个块,该第一多个块包括该矩阵的一个或多个稀疏区段,该第二多个块包括该矩阵中为超稀疏或极稀疏的区段。该加速器使(多个)稀疏片使用第一多个块来执行针对(多个)计算任务的一个或多个矩阵操作,并且进一步使(多个)超/极稀疏片使用第二多个块来执行针对(多个)计算任务的一个或多个矩阵操作。 | ||
搜索关键词: | 稀疏 矩阵 加速器 硬件加速器 矩阵操作 稀疏矩阵 非零 偏斜 异构 架构 存储器访问数据 第二存储器 访问数据 时间接口 高带宽 随机地 分区 | ||
【主权项】:
1.一种在用于处理具有偏斜非零分布的稀疏矩阵数据的硬件处理器中的方法,所述方法包括:由所述硬件处理器确定要执行涉及矩阵的一个或多个计算任务;由所述硬件处理器将所述矩阵分区为第一多个块和第二多个块,其中,所述第一多个块包括所述矩阵中为稀疏的一个或多个区段,并且其中,所述第二多个块包括所述矩阵中为超稀疏或极稀疏的另外一个或多个区段;以及由所述硬件处理器使所述硬件处理器的一个或多个稀疏片使用所述第一多个块来执行针对所述一个或多个计算任务的一个或多个矩阵操作;以及进一步使所述硬件处理器的一个或多个超/极稀疏片使用所述第二多个块来执行针对所述一个或多个计算任务的所述一个或多个矩阵操作。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810001937.9/,转载请声明来源钻瓜专利网。