[发明专利]一种矩阵数据架构及其基于压缩稀疏列的加速SPMV的方法在审
申请号: | 202210577113.2 | 申请日: | 2022-05-25 |
公开(公告)号: | CN114880031A | 公开(公告)日: | 2022-08-09 |
发明(设计)人: | 叶纬材;江颖 | 申请(专利权)人: | 中山大学 |
主分类号: | G06F9/30 | 分类号: | G06F9/30;G06F17/16 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 黄志铖 |
地址: | 510275 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 矩阵 数据 架构 及其 基于 压缩 稀疏 加速 spmv 方法 | ||
本发明涉及一种矩阵数据架构,包括矩阵头和矩阵块;所述矩阵头包括了矩阵行、列数,非零元个数、矩阵块的个数和向量化长度SVVec;所述矩阵块包括矩阵块元素每一个所述矩阵块对应的x向量像素几何方块的边长为SImgB;所述矩阵块的结构至少有两种,分别为定长稠密VxG块和定长稀疏VxG块。一种基于压缩稀疏列的加速稀疏矩阵向量乘(SPMV)的方法,将输入的稀疏矩阵A的矩阵格式转换为上述的矩阵数据架构,该矩阵数据架构为稀疏矩阵存储格式;对局部临时y向量重排序和完全向量化的SPMV计算。该数据架构具有占用空间少的特点,再结合基于压缩稀疏列的加速SPMV的方法,能够高效利用硬件向量化计算指令和内存带宽,使得SPMV能够以更快的的速度运行,达到加速的目的。
技术领域
本发明涉及优化加速领域,更具体地,涉及一种矩阵数据架构及其基于压缩稀疏列的加速SPMV的方法。
背景技术
稀疏矩阵向量乘(英文简称SPMV)是一个核心程序,用于许多应用:科学和工程计算、经济建模、基于社会网络数据的图分析等。在这些应用程序中,SPMV操作通常使用相同的矩阵以较高的频率执行,并支配着性能。因此,在各种特定的硬件上加速SPMV是一项重要的任务,特别是在单台计算机节点上。在单台计算机节点中,中央处理器(CentralProcessing Unit,CPU)内核共享主内存来交换数据,是主要的通用计算设备。
SPMV在单个计算节点上的性能受到内存带宽和计算中的指令延迟的限制。存储器带宽决定处理器和存储器之间传输矩阵数据的最短时间。当使用全计算节点时,SPMV的峰值性能由内存带宽决定。指令延迟通常来自浮点指令和加载和存储向量元素的指令。此外,对于SPMV,延迟还来自指示非零元素的额外指令。当使用少量CPU线程时,SPMV所消耗的时间主要由指令延迟决定,其中指示非零元素的指令所产生的延迟是可以忽略不计的一部分。加速由积分方程产生的SPMV,如迭代CT影像重建,有两类方法。第一类方法利用特定矩阵的稀疏模式,在特定的CT图像重建算法中获得了理想的加速。第二类方法忽略特定矩阵的稀疏模式,将矩阵转换为通用的存储格式,并使用常用的矩阵存储格式对SPMV操作进行优化,例如压缩稀疏行(Compress Sparse Row,CSR)、压缩稀疏列(Compress SparseColumn,CSC)、逐块格式和混合格式(SPC5、LAV)等。
为了提升使用宽向量指令的效率,部分加速SPMV计算方法采用了局部稠密矩阵块表示稀疏矩阵的方法,但是效果与应用密切相关。原因是采用了局部稠密矩阵表示方法后,大量无用的0元素将加入到矩阵里,引起无用的内存操作和计算操作。而加速SPMV计算方法则使用全局的向量和矩阵重排方案,在计算一次SPMV以前,要对向量进行一次重排序,计算完成后再进行一次重排序。难点在于确定重排序所需要的参数多数是逐案进行的,而且确定参数的计算时间甚至是进行一次SPMV耗时的数十倍到上千倍,这也大大影响了加速SPMV计算方法的实际应用。
发明内容
本发明为克服上述现有技术中加速SPMV的方法效果差问题,提供一种矩阵数据架构及其基于压缩稀疏列的加速SPMV的方法,能够高效利用硬件向量化计算指令和内存带宽,从而对SPMV进行加速。
为解决上述技术问题,本发明采用的技术方案是:一种矩阵数据架构,包括矩阵头和矩阵块;所述矩阵头包括了矩阵行、列数,非零元个数、矩阵块的个数和向量化长度SVVec;每一个所述矩阵块对应的x向量像素几何方块的边长为SImgB;所述矩阵块的结构至少有两种,分别为定长稠密VxG块和定长稀疏VxG块。VxG是向量化执行组(Vectorized eXecutionGroup)的简称。
该数据架构通过对稀疏矩阵的格式进行处理获得,该数据架构具有占用空间少的特点,而使用两种不同的矩阵块结构可以实现存储量不同程度的压缩。使用该矩阵数据架构进行加速SPMV计算时,能够快速确定矩阵块结构参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210577113.2/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置