[发明专利]一种用于优化稀疏矩阵-向量乘的并行处理方法及装置在审
申请号: | 202110541392.2 | 申请日: | 2021-05-18 |
公开(公告)号: | CN113360188A | 公开(公告)日: | 2021-09-07 |
发明(设计)人: | 刘伟峰;曲正语;高宇翔;杨德闯;金洲 | 申请(专利权)人: | 中国石油大学(北京) |
主分类号: | G06F9/38 | 分类号: | G06F9/38 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 谢志超 |
地址: | 102249*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 优化 稀疏 矩阵 向量 并行 处理 方法 装置 | ||
1.一种用于优化稀疏矩阵-向量乘的并行处理方法,其特征在于,包括以下步骤:
输入待处理的稀疏矩阵,根据迭代次数,确定当前的优化选项,并根据当前的所述优化选项并行进行对应次数的迭代;
获取每次迭代后的稀疏矩阵-向量乘的性能,取迭代后得到的性能的平均值作为待处理的稀疏矩阵对应的稀疏矩阵-向量乘的性能并输出;
其中,优化选项包括第一优化选项、第二优化选项、第三优化选项和第四优化选项;
当迭代次数为第一次数时,当前的优化选项确定为第一优化选项;
当迭代次数为第二次数时,当前的优化选项确定为第一优化选项和第二优化选项;
当迭代次数为第三次数时,当前的优化选项确定为第一优化选项、第二优化选项和第三优化选项;
当迭代次数为第四次数时,当前的优化选项确定为第一优化选项、第二优化选项、第三优化选项和第四优化选项;
在并行进行每次迭代时,将当前确定的优化选项中输出最优的稀疏矩阵-向量乘的性能作为当次迭代的稀疏矩阵-向量乘的性能。
2.根据权利要求1所述的用于优化稀疏矩阵-向量乘的并行处理方法,其特征在于,所述第一优化选项使用CSR格式存储稀疏矩阵,并对稀疏矩阵执行并行稀疏矩阵-向量乘操作;
所述第二优化选项使用CSR格式存储稀疏矩阵,对稀疏矩阵进行负载均衡优化后执行并行稀疏矩阵-向量乘操作;
所述第三优化选项使用SELL-C-δ或CSR5格式存储稀疏矩阵,并对稀疏矩阵执行并行稀疏矩阵-向量乘操作;
所述第四优化选项对待处理的稀疏矩阵进行重新排序,对重新排序后的稀疏矩阵执行并行稀疏矩阵-向量乘操作。
3.根据权利要求2所述的用于优化稀疏矩阵-向量乘的并行处理方法,其特征在于,所述第一次数为1次,所述第二次数为2至99次,所述第三次数为100至999次,所述第四次数为大于999次。
4.根据权利要求2所述的用于优化稀疏矩阵-向量乘的并行处理方法,其特征在于,所述第一优化选项使用OpenMP指令。
5.根据权利要求2所述的用于优化稀疏矩阵-向量乘的并行处理方法,其特征在于,稀疏矩阵采用第二优化选项进行优化时,具体包括以下步骤:
判断是否有线程未工作;
若不存在未工作的线程,使用CSR-LBL格式存储待处理的稀疏矩阵,并对待处理的稀疏矩阵执行并行稀疏矩阵-向量乘操作并输出对应的稀疏矩阵-向量乘的性能;
若存在未工作的线程,使用CSR-LBLT格式存储待处理的稀疏矩阵,并对待处理的稀疏矩阵执行并行稀疏矩阵-向量乘操作并输出对应的稀疏矩阵-向量乘的性能。
6.根据权利要求2所述的用于优化稀疏矩阵-向量乘的并行处理方法,其特征在于,稀疏矩阵采用第三优化选项进行优化时,具体包括以下步骤:
获取稀疏矩阵的行的变化;其中,所述行的变化为稀疏矩阵行长度标准差与行平均长度的比值;
若行的变化大于设定的阈值vt,使用CSR5格式存储待处理的稀疏矩阵,并对待处理的稀疏矩阵执行并行稀疏矩阵-向量乘操作并输出对应的稀疏矩阵-向量乘的性能;
若行的变化不大于设定的阈值vt,使用SELL-C-δ格式存储待处理的稀疏矩阵,并对待处理的稀疏矩阵执行并行稀疏矩阵-向量乘操作并输出对应的稀疏矩阵-向量乘的性能。
7.根据权利要求2所述的用于优化稀疏矩阵-向量乘的并行处理方法,其特征在于,稀疏矩阵采用第四优化选项进行优化时,具体包括以下步骤:
基于图或超图分割技术对待处理的稀疏矩阵进行重新排序;
对重新排序后的稀疏矩阵执行并行稀疏矩阵-向量乘操作,输出待处理的稀疏矩阵对应的稀疏矩阵-向量乘的性能。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国石油大学(北京),未经中国石油大学(北京)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110541392.2/1.html,转载请声明来源钻瓜专利网。