[发明专利]一种广义Hermitian矩阵特征问题标准化方法在审
| 申请号: | 202211471275.4 | 申请日: | 2022-11-23 |
| 公开(公告)号: | CN115758058A | 公开(公告)日: | 2023-03-07 |
| 发明(设计)人: | 刘世芳;赵永华 | 申请(专利权)人: | 中国科学院计算机网络信息中心 |
| 主分类号: | G06F17/16 | 分类号: | G06F17/16 |
| 代理公司: | 北京亿腾知识产权代理事务所(普通合伙) 11309 | 代理人: | 陈霁 |
| 地址: | 100190 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 广义 hermitian 矩阵 特征 问题 标准化 方法 | ||
本发明涉及一种广义Hermitian矩阵特征问题标准化方法,使用并行异构计算,将矩阵B的Cholesky分解与求解矩阵A的标准化的过程相结合,通过使用设备端的两个stream流控制矩阵B的Cholesky分解和矩阵A的标准化的求解,使得当主机端在做B的相关工作时,设备端可以做关于矩阵A的标准化的相关计算,在主机端做矩阵A的标准化的相关工作时,设备端可以做关于B的相关工作,实现主机端和设备端的异步工作。具体可实现的4种形式的主机端和设备端的重叠:主机端计算和主机‑设备之间数据传输的重叠;主机端通信和主机‑设备之间数据传输的重叠;设备端计算和主机‑设备之间数据传输的重叠;主机端通信和设备端计算的重叠。
技术领域
本发明涉及高性能计算领域,尤其涉及一种广义Hermitian矩阵特征问题标准化方法。
背景技术
解决大型密集矩阵的特征值和特征向量问题是许多计算科学和数值模拟中的核心计算问题。例如,在电子结构、材料设计、仿真模拟和量子化学计算中存在大量广义稠密Hermitian特征值问题的数值求解。本发明中描述的广义稠密Hermitian特征问题可以被描述为如公式(1)所述的形式:
AX=BXΛ (1)
其中,矩阵A和矩阵B是复数Hermitian稠密矩阵,矩阵B是正定矩阵,Λ是对角特征值矩阵,X是特征向量矩阵。现有技术中,该问题的求解首先通过将公式(1)转化为标准稠密特征问题,然后求解转换后的标准特征值问题。其中,称转换广义Hermitian特征问题为标准特征问题为标准化方法,该标准化方法是整个求解广义特征值问题的关键方法。
目前的标准化方法基于两步技术实现。第一步,将矩阵B进行Cholesky分解:B=LLH,其中,L为下三角矩阵,LH为L的共轭转置矩阵。第二步,计算标准特征值问题对应的矩阵此时,原问题便转换为了标准稠密特征问题:其中,Y=LHX。
目前的标准化方法在多GPU加速计算环境下,存在着下列问题:第一步和第二步间存在着大量的重复通信;主机端-设备端之间的数据传输和主机端之间通信无法协同工作;主机端之间通信和设备端内数据处理无法同步进行;主机端内的计算和设备端内计算无法同时处理。其中,主机端代表CPU,设备端代表GPU。
发明内容
本发明的目的是提供一种广义Hermitian矩阵特征问题标准化方法,旨在解决现有技术中存在的问题,提高标准化的效率。
本发明为了解决以上问题,提供了一种广义Hermitian矩阵特征问题标准化方法,应用于计算系统,所述计算系统包括主机端和设备端,所述设备端包括第一流和第二流,所述方法包括:
第一流接收矩阵B,第二流接收矩阵A,其中,所述矩阵A为Hermitian矩阵,所述矩阵B为正定Hermitian矩阵;
对所述矩阵A和矩阵B进行若干轮迭代更新,任意一轮迭代更新包括:
第一流将矩阵B未更新部分的左上角子方阵B11发送到主机端;
第二流将矩阵A未更新部分的左上角子方阵A11发送到主机端,并行地,主机端对B11进行Cholesky分解,得到下三角矩阵LB;
第一流从主机端接收LB并存储到B11,并行地,主机端根据LB对A11进行标准化,得到矩阵CA;
第二流从主机端接收CA并存储到A11,并行地,主机端列播送LB;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算机网络信息中心,未经中国科学院计算机网络信息中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211471275.4/2.html,转载请声明来源钻瓜专利网。





