[发明专利]一种GPU加速的电力潮流雅可比矩阵的QR分解方法有效
申请号: | 201610592223.0 | 申请日: | 2016-07-26 |
公开(公告)号: | CN106026107B | 公开(公告)日: | 2019-01-29 |
发明(设计)人: | 周赣;孙立成;张旭;柏瑞;冯燕钧;秦成明;傅萌 | 申请(专利权)人: | 东南大学 |
主分类号: | H02J3/06 | 分类号: | H02J3/06 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 张婧 |
地址: | 210009 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本文公开了一种GPU加速的电力潮流雅可比矩阵的QR分解方法,所述方法包括:CPU中对雅可比矩阵J进行QR符号分解,得到Household变换矩阵V和上三角阵R阵的稀疏结构;根据R阵的稀疏结构,对矩阵J各列进行并行化分层;GPU中按层次递增的顺序计算分层QR分解内核函数SparseQR。本发明利用CPU控制程序的流程并处理基础数据和GPU处理密集的浮点运算相结合的模式提高了电力潮流雅可比矩阵QR分解的效率,解决了电力系统静态安全性分析中潮流计算耗时大的问题。 | ||
搜索关键词: | 一种 gpu 加速 电力 潮流 可比 矩阵 qr 分解 方法 | ||
【主权项】:
1.一种GPU加速的电力潮流雅可比矩阵的QR分解方法,其特征在于:所述方法包括:(1)CPU中对雅可比矩阵J进行QR符号分解,得到Household变换矩阵V和上三角阵R阵的稀疏结构;根据R阵的稀疏结构,对矩阵J各列进行并行化分层;所述并行化分层将矩阵J的n列归并到MaxLevel层中,属于同一层中的列并行进行QR分解;每层包含的列的数量为Levelnum(k),k表示层号;存储第k层中所有列号至映射表Mapk;(2)GPU中按层次递增的顺序计算分层QR分解内核函数SparseQR;分层QR分解内核函数定义为SparseQR,其线程块大小Nthreads固定为128,当对k层进行计算时,线程块数量Nblocks=Levelnum(k),总线程数量为:Nblocks×Nthreads;按照层次递增的顺序,调用内核函数SparseQR分解属于第k层的所有列;SparseQR的计算流程为:(2.1)CUDA自动为每个线程分配线程块索引blockID和线程块中的线程索引threadID;(2.2)将blockID和threadID赋值给变量bid和t,之后通过bid和t来索引bid号线程块中的t号线程;(2.3)第bid号线程块负责QR分解雅可比矩阵J的第j=Mapk(bid)列;(2.4)第bid号线程块中,变量i从1递增到j‑1,如果R(i,j)≠0,执行以下计算:首先,计算中间变量β=2V(i:n,i)T·J(i:n,j),其中V(i:n,i)是Household变换矩阵V中第i列的第i~n行元素构成的向量,J(i:n,j)是雅克比矩阵J中第j列的第i~n行元素构成的向量;然后,采用公式J(i:n,j)=J(i:n,j)‑βV(i:n,i)更新雅可比矩阵J的第j列;(2.5)计算第j列的Household变换向量;(2.6)更新J矩阵第j列:J(j,j)=a,J(j+1:n,j)=0。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610592223.0/,转载请声明来源钻瓜专利网。