[发明专利]大规模矩阵QR分解并行计算系统有效
| 申请号: | 202010609939.3 | 申请日: | 2020-06-29 |
| 公开(公告)号: | CN111858465B | 公开(公告)日: | 2023-06-06 |
| 发明(设计)人: | 吴明钦;刘红伟;潘灵;贾明权;郝黎宏;林勤;张昊 | 申请(专利权)人: | 西南电子技术研究所(中国电子科技集团公司第十研究所) |
| 主分类号: | G06F15/80 | 分类号: | G06F15/80;G06F17/16;G06F7/78 |
| 代理公司: | 成都九鼎天元知识产权代理有限公司 51214 | 代理人: | 刘小彬 |
| 地址: | 610036 四川*** | 国省代码: | 四川;51 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 大规模 矩阵 qr 分解 并行 计算 系统 | ||
1.一种大规模矩阵QR分解并行计算系统,包括:大规模并行计算平台上实现大规模矩阵QR并行分解的多处理器节点间并行、单处理器多核间并行和单核多数据并行三级并行结构,具有二叉树结构特点的第一层并行结构属于三层并行结构中的顶层架构,第二层并行架构属于三级并行结构中的中层架构,第三层并行架构属于三级并行结构中的底层架构,其特征在于:在采用多核处理器芯片构建具有大规模并行计算能力的处理器集群系统和QR分解并行计算结构中,顶层架构利用多核处理器集群特点,将待分解矩阵分割成多个数据分片,通过多核处理器节点间互联的通信网络分发到第一级各并行节点,第一级各节点并行地完成相应QR分解任务后通过网络发送上三角矩阵R到第二级节点,第二级节点完成R矩阵合并和QR分解后通过网络发送R矩阵到第三级节点,以此类推,各级节点根据二叉树完整结构依次逐级执行,同级节点并行执行,以此完成多处理器芯片节点间并行的计算流图;中层架构根据处理器节点输入的矩阵规模和处理器核心数量进行矩阵分块,每个分块矩阵均为统一矩阵规模的方阵,整个运算过程沿着对角子阵逐层进行,单层的子阵QR分解和矩阵数据更新操作由处理器片内的多核并行执行,底层架构利用具备单指令多数据操作SIMD的处理器指令集进行多数据并行的矢量计算,完成单核的QR分解或乘法操作;多核处理器集群采用逐层分解的方法,从多处理器芯片节点间并行、单处理器芯片多核间并行和单核多数据并行三级并行结构,实现大规模矩阵的QR并行分解。
2.如权利要求1所述的一种大规模矩阵QR分解并行计算系统,其特征在于:在大规模并行计算平台上至少设有8片多核处理器芯片,大小为至少行16N和列N的输入待分解矩阵A,输入待分解矩阵A的子阵分割可根据上述平台提供的最大并行度能力灵活裁剪,按列分割为多个大小为行2N和列N子矩阵块Ai,8片多核处理器芯片最大可分割为A1~A8个矩阵块,待分解矩阵A顶层架构,按二叉树8-4-2-1架构的结构进行级联,顶层并行架构以典型二叉树架构,完成处理器芯片节点间并行,并按至少17个处理器节点,最大每级8个多核处理器节点可同时并行执行,利用8-4-2-1架构构造至少四级流水线。
3.如权利要求2所述的一种大规模矩阵QR分解并行计算系统,其特征在于:按层递进方向,第一级流水线对8个处理器节点同时并行处理,节点1执行A1的QR分解,节点2执行A2的QR分解,节点i执行Ai的QR分解,每个节点Ai执行时间相同;第二级流水线对第一级流水线输出的矩阵大小为N*N的上三角矩阵R1,i进行两两数据合并,合并后新矩阵大小为2N*N;第三级流水线对第二级输出的矩阵大小为N*N的上三角矩阵R2,i进行两两数据合并,合并后新矩阵大小为2N*N;第四级流水线对第三级流水线输出的结果上矩阵大小为N*N的三角矩阵R3,i进行两两数据合并,合并后新矩阵大小为2N*N。
4.如权利要求3所述的一种大规模矩阵QR分解并行计算系统,其特征在于:第二级流水线单节点操作执行数据合并和QR分解;第三级流水线单节点操作执行数据合并和QR分解,第四级流水线1个处理器节点对新矩阵进行QR分解,输出结果即为QR分解的上三角R矩阵。
5.如权利要求1所述的一种大规模矩阵QR分解并行计算系统,其特征在于:中间层并行架构对行2N,列N子矩阵块进行QR分解,按层递进方向分多层递进执行,每层并行执行,利用单节点处理器多核并行完成QR分解。
6.如权利要求1所述的一种大规模矩阵QR分解并行计算系统,其特征在于:中间层并行架构对第一层分块方阵A1,1进行QR分解,将其同列的分块方阵Ai,1(i>1)进行0消除,第一层:对分块方阵A1,1进行QR分解,将其同列的分块方阵Ai,1(i>1)进行0消除,将其同行的分块方阵A1,j(j>1)进行数据更新,包括4种运算操作,分别为通用QR操作并转置GEQRT、QR后乘法操作同行更新ORMQR、高瘦矩阵QR操作并转置TSQRT、QR后高瘦矩阵乘法操作同行更新TSMQR。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西南电子技术研究所(中国电子科技集团公司第十研究所),未经西南电子技术研究所(中国电子科技集团公司第十研究所)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010609939.3/1.html,转载请声明来源钻瓜专利网。





