[发明专利]基于寄存器的矩阵乘法在审
| 申请号: | 201880041798.0 | 申请日: | 2018-06-08 |
| 公开(公告)号: | CN110770701A | 公开(公告)日: | 2020-02-07 |
| 发明(设计)人: | 大卫·汉纳·曼塞尔;鲁纳·霍姆;伊恩·迈克尔·考尔菲尔德;伊莲娜·米兰诺维奇 | 申请(专利权)人: | ARM有限公司 |
| 主分类号: | G06F9/30 | 分类号: | G06F9/30 |
| 代理公司: | 11258 北京东方亿思知识产权代理有限责任公司 | 代理人: | 林强 |
| 地址: | 英国*** | 国省代码: | 英国;GB |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 矩阵乘法 矩阵 寄存器 数据元素 指令 寄存器操作数 结果数据元素 矩阵乘法运算 数据处理装置 点积运算 方形矩阵 元素矢量 源寄存器 指令引用 虚拟机 存储 响应 应用 | ||
公开了一种用于在数据处理装置中执行矩阵乘法的技术,该技术包括装置、矩阵乘法指令、操作该装置的方法以及虚拟机实施方式。寄存器由矩阵乘法指令引用,每个寄存器用于存储至少四个数据元素,并且响应于矩阵乘法指令,执行矩阵乘法运算。从第一和第二源寄存器提取第一和第二数据元素矩阵,并执行分别作用于第一矩阵的相应行和第二矩阵的相应列的多个点积运算,以生成应用于目的寄存器的结果数据元素的方形矩阵。对于逐元素矢量技术,对于给定数量的寄存器操作数,可以实现更高的计算密度。
技术领域
本公开涉及数据处理装置。更具体地,本公开涉及数据处理装置中矩阵乘法的性能。
背景技术
现代数据处理装置通常设置有多个寄存器,其中可以保存作为数据处理装置的数据处理操作的主体的数据值。数据处理装置可以将这些寄存器的内容视为值的阵列,例如,在寄存器具有保持512位的存储容量的情况下,数据处理装置可以将其视为十六个32位值的阵列。然后,数据处理装置可以例如以SIMD(单指令多数据)方式将数据处理操作应用于该阵列的单独指定的元素,或应用于值的阵列的相应元素,例如将每个元素乘以指定值。
发明内容
在一个示例实施例中,提供了一种装置,包括:具有多个寄存器的寄存器存储电路,每个寄存器用于存储至少四个数据元素;解码器电路,其响应于矩阵乘法指令以生成控制信号,其中,矩阵乘法指令在多个寄存器中指定:第一源寄存器、第二源寄存器以及目的寄存器;以及数据处理电路,其响应于控制信号以执行矩阵乘法运算,包括:从第一源寄存器提取第一数据元素矩阵;从第二源寄存器提取第二数据元素矩阵;执行多个点积运算以生成结果数据元素的方形矩阵,其中每个点积运算作用于第一数据元素矩阵的相应行和第二数据元素矩阵的相应列,以生成结果数据元素的方形矩阵的相应结果数据元素;并且将结果数据元素的方形矩阵(square matrix)应用于目的寄存器。
在另一个示例实施例中,提供了一种操作数据处理装置的方法,该方法包括:响应于矩阵乘法指令生成控制信号,其中矩阵乘法指令在多个寄存器中指定第一源寄存器、第二源寄存器和目的寄存器,每个寄存器能够存储至少四个数据元素;响应于控制信号执行矩阵乘法运算,包括:从第一源寄存器提取第一数据元素矩阵;以及从第二源寄存器提取第二数据元素矩阵;执行多个点积运算以生成结果数据元素的方形矩阵,其中每个点积运算作用于第一数据元素矩阵的相应行和第二数据元素矩阵的相应列,以生成结果数据元素的方形矩阵的相应结果数据元素;并将结果数据元素的方形矩阵应用于目的寄存器。
在另一个示例实施例中,提供了一种装置,该装置包括:用于响应于矩阵乘法指令而生成控制信号的单元,其中矩阵乘法指令在多个寄存器中指定第一源寄存器、第二源寄存器和目的寄存器,每个寄存器能够存储至少四个数据元素;响应于控制信号执行矩阵乘法运算的单元,包括:用于从第一源寄存器提取第一数据元素矩阵的单元;和用于从第二源寄存器提取第二数据元素矩阵的单元;用于执行多个点积运算以生成结果数据元素的方形矩阵的装置,其中每个点积运算作用于第一数据元素矩阵的相应行和第二数据元素矩阵的相应列以生成结果数据元素的方形矩阵的相应结果数据元素;用于将结果数据元素的方形矩阵应用于目的寄存器的单元。
附图说明
参照附图中所示的本技术的实施例,仅以示例的方式进一步描述本技术,在附图中:
图1示意性地示出了可以实现本技术的各种示例的数据处理装置;
图2A示意性地示出了逐元素向量技术,其使用来自源寄存器A的指定元素和来自源寄存器B的值的阵列来生成四个要存储在累加器寄存器C中的元素,而图2B示意性地示出了本技术的一个实施例,根据该技术,将从源寄存器A获取的数据元素的方形矩阵与从源寄存器B获取的元素的方形矩阵相乘,以生成要在目的寄存器C中累加的元素的方形矩阵;
图3示意性地示出了在一个实施例中提供的用以支持诸如图2B所示的矩阵乘法运算的电路;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于ARM有限公司,未经ARM有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201880041798.0/2.html,转载请声明来源钻瓜专利网。





