[发明专利]一种基于GPU的压缩稀疏矩阵的对称矩阵构造方法有效
申请号: | 201611140177.7 | 申请日: | 2016-12-12 |
公开(公告)号: | CN106775598B | 公开(公告)日: | 2018-02-23 |
发明(设计)人: | 赵汉理;季智坚 | 申请(专利权)人: | 温州大学 |
主分类号: | G06F9/38 | 分类号: | G06F9/38;G06T9/00 |
代理公司: | 温州名创知识产权代理有限公司33258 | 代理人: | 陈加利 |
地址: | 325000 浙江省温州市瓯海*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明实施例公开了一种基于GPU的压缩稀疏矩阵的对称矩阵构造方法,包括给定基于CSR存储格式的压缩稀疏矩阵M作为输入矩阵;根据压缩稀疏矩阵M,并行地将CSR存储格式转换为三元组数组T1;并行地将三元组数组T1中每一个三元组及其对称的三元组保存到三元组数组T2并进行并行排序得到三元组数组T3;查找T3中重复数据,构造数组F标记重复存储的元素,并行地删除T3中F标记为1的重复存储的元素,得到无重复项的三元组数组T4;根据三元组数组T4,并行地将其转换成CSR存储格式作为输出矩阵。实施本发明,能有效地改善求解稀疏矩阵的对称矩阵的处理性能,使每一个步骤都具有可并行性,发挥GPU中高效并行处理能力。 | ||
搜索关键词: | 一种 基于 gpu 压缩 稀疏 矩阵 对称 构造 方法 | ||
【主权项】:
一种基于GPU的压缩稀疏矩阵的对称矩阵构造方法,其特征在于,所述方法包括:步骤S101、给定一个基于CSR存储格式的压缩稀疏矩阵M作为输入矩阵;步骤S102、根据输入的压缩稀疏矩阵M,并行地将CSR存储格式转换为一个三元组数组T1(p,q,v);其中,p表示元素行号,q表示元素列号,v表示矩阵中(p,q)位置对应的元素值;步骤S103、根据构造的三元组数组T1,对于T1中的每一个三元组(p,q,v),并行地将(p,q,v)及其对称的三元组(q,p,v)保存到新的三元组数组T2,并对得到的新的三元组数组T2以((p<<32)|q)为排序关键字进行并行排序得到新的三元组数组T3;步骤S104、根据排序后得到的三元组T3,查找三元组T3中重复数据,并构造一个数组F用于标记三元组T3中的重复存储的三元组元素,并行地删除三元组T3中通过数组F标记为1的重复存储的元素,得到无重复项的三元组数组T4;步骤S105、根据得到的无重复项的三元组数组T4,并行地将其转换成CSR存储格式作为输出矩阵M1。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于温州大学,未经温州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201611140177.7/,转载请声明来源钻瓜专利网。