[发明专利]一种适用于GPU硬件的矩阵存储与计算方法在审

申请号：	201910859641.5	申请日：	2019-09-11
公开（公告）号：	CN110580675A	公开（公告）日：	2019-12-17
发明（设计）人：	邵雪;王晓光;周振亚	申请（专利权）人：	北京华大九天软件有限公司
主分类号：	G06T1/60	分类号：	G06T1/60;G06T1/20
代理公司：	11467 北京德崇智捷知识产权代理有限公司	代理人：	王金双
地址：	100102 北京***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	非零元素矩阵矩阵存储矩阵元素非零存储矩阵高速访问矩阵计算矩阵运算多线程列数行数访问
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

一种适用于GPU硬件的矩阵存储与计算方法，包括以下步骤：1）存储矩阵的行数、列数、非零元素、每个元素是否非零的标志，以及起始非零元素所在位置；2）通过GPU访问矩阵元素,取得矩阵元素是否非零以及非零元素的值，设置矩阵非零元素的值；3）使用GPU进行矩阵运算。本发明的适用于GPU硬件的矩阵存储与计算方法，能实现GPU硬件下多线程高速访问矩阵中的任意元素，从而大幅提升了GPU中矩阵计算的速度。

技术领域

本发明涉及GPU硬件高性能计算领域，具体涉及GPU硬件对矩阵乘法计算及LU分解的高性能计算技术领域，特别涉及一种适用于GPU硬件的矩阵存储与计算方法。

背景技术

近年来高性能计算中矩阵运算的规模越来越大，所需要的计算能力也越来越强，传统CPU构架受限于功耗瓶颈难以进一步提高性能，无法胜任计算的需求。相比之下GPU具有计算资源充足、数据访问带宽高的优势，理想情况下相比CPU可以加速十数倍。但矩阵分解存在高相关性导致算法优化难度很大，GPU应用进展较为缓慢。

发明内容

为了解决现有技术存在的不足，本发明的目的在于提供一种适用于GPU硬件的矩阵存储与计算方法，充分利用GPU硬件的特性，实现矩阵的高性能计算。

为实现上述目的，本发明提供的适用于GPU硬件的矩阵存储与计算方法，包括以下步骤：

1)存储矩阵的行数、列数、非零元素、每个元素是否非零的标志，以及起始非零元素所在位置；

2)通过GPU访问矩阵元素,取得矩阵元素是否非零以及非零元素的值，设置矩阵非零元素的值；

3)使用GPU进行矩阵运算。

进一步地，所述步骤1)进一步包括：

存储矩阵的行数与列数；