[发明专利]一种面向可编程代数处理器的矩阵乘法计算装置及方法有效
申请号: | 201410123578.6 | 申请日: | 2014-03-28 |
公开(公告)号: | CN103902507B | 公开(公告)日: | 2017-05-10 |
发明(设计)人: | 郭晓龙;王晓琴;王伟康;吴军宁;林啸;郭璟;张森;赵旭莹 | 申请(专利权)人: | 中国科学院自动化研究所 |
主分类号: | G06F17/16 | 分类号: | G06F17/16 |
代理公司: | 中科专利商标代理有限责任公司11021 | 代理人: | 宋焰琴 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 可编程 代数 处理器 矩阵 乘法 计算 装置 方法 | ||
技术领域
本发明涉及数据处理技术领域,更具体地,涉及一种基于可编程代数处理器的矩阵乘法计算装置及方法。
背景技术
矩阵乘法是科学计算中一种基本操作,其广泛用于信号处理、图像处理、雷达、声纳、通信等复杂计算领域中,并且由于其计算复杂度为O(n3),使得矩阵乘法往往成为算法计算过程中最为耗时的操作,进而影响整个算法的性能。矩阵乘法操作又分为大矩阵乘法和小矩阵乘法,大矩阵乘法由于其行列数值非常巨大,导致运算量呈指数级增加,近些年受到广泛关注,一种通用的处理方法为将大矩阵进行分块处理,以加快其运算效率;小矩阵乘法由于其单个乘法的计算量并不是很大,往往被人们所忽视,但随着无线通信领域、雷达信号处理领域,数字图像处理等计算密集型领域的广泛发展,海量信息必须在固定时间内进行处理,而其中大规模的小矩阵乘法随着矩阵数量的急剧增加,逐渐成为非常耗时的计算操作。
例如在无线通信领域中的预编码过程,存在着多种模式的大规模小矩阵乘法,并且其有非常严格的时间约束。具体说来,多天线技术包括传输分集、空间复用和波束赋形技术。这三种技术简单来说都包含大规模小矩阵相乘,以空间复用为例,其分为闭环空间复用和开环空间复用,其计算公式如下:
闭环空间复用:
开环空间复用:
其中:
W(i)为码本,根据天线数不同存在着不同的码本,例如,在两天线情况下存在如下码本:
四天线情况下具体码本由得出,un及Wn从下表得出:
八天线码本相对更为复杂一些,这里就不一一列举。然后这些小矩阵码本再和每层的信号进行矩阵乘法,最终得出不同天线上的发射信号,由于信号量非常巨大,导致该过程也变得异常费时。基于非码本的预编码操作,同样是小矩阵码本和信号矩阵相乘,只是码本获得方式不同而已。
总体来说,对于无线通信领域,特别是LTE/LTE-A中,存在码本矩阵行列为(1,1),(2,1),(2,2),(4,1),(4,2),(4,3),(4,4),(8,1),(8,2),(8,3),(8,4),(8,5),(8,6),(8,7),(8,8)15种情况和信号矩阵行列为(1,1),(2,1),(3,1),(4,1),(5,1),(6,1),(7,1),(8,1)8种情况,并且码本矩阵和信号矩阵相乘的次数非常多。对于该类矩阵乘法由于其矩阵行列比较小,无法使用分块方法进行计算,而直接行列做乘累加操作又相对耗时,因此有必要提出一种高效地解决上述问题的大规模小矩阵相乘的方法与装置。
发明内容
(一)要解决的技术问题
本发明所要解决的技术问题是现有的矩阵相乘方法与装置对于大规模小矩阵的相乘执行效率不高的问题。
(二)技术方案
(三)有益效果
本发明对矩阵算法进行了优化,通过“数据缓存、广播及流水”机制,结合一个运算模式多样的运算部件,使得一系列小矩阵乘法能够充分的并行执行,能够提高大规模小矩阵的运算效率。
附图说明
图1为本发明的矩阵乘法装置图;
图2为本发明中A系列矩阵在多粒度并行存储器中的数据分布图;
图3为本发明中B系列矩阵在多粒度并行存储器中的数据分布图;
图4为本发明实施例的矩阵乘法的计算示意图;
图5为本发明中广播操作示意图。
具体实施方式
本发明针对现有的情况,提出了一种高效地计算矩阵乘法的方法和装置,特别适合于大规模小矩阵乘法。
本发明所提出的大规模小矩阵乘法向量化装置包含:多粒度并行存储器10、数据缓存装置20、数据广播缓存装置30、向量运算装置40。其中:
所述多粒度并行存储器10用于存储多个要进行乘法运算的矩阵、广播索引以及矩阵乘法之后的结果。所述广播索引用于对矩阵中的每个数据进行广播操作。该存储器的读写位宽与数据缓存装置的寄存器堆201位宽、数据广播缓存装置中相关寄存器位宽以及所述向量运算装置40的运算尺寸一致,记为P。
所述数据缓存装置20用于将矩阵乘法中的不需要广播的矩阵从多粒度并行存储器10中取出,存入到寄存器堆201中。所述数据缓存装置20由寄存器堆201组成。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410123578.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于绑扎机的夹具
- 下一篇:双回路中频感应加热炉