[发明专利]处理器、用于计算系统的方法、机器可读介质和计算机系统有效
申请号: | 201611063814.5 | 申请日: | 2011-12-23 |
公开(公告)号: | CN106775592B | 公开(公告)日: | 2019-03-12 |
发明(设计)人: | J·考博尔圣阿德里安;A·T·福塞斯;T·D·弗莱切;L·K·吴;E·斯普林格 | 申请(专利权)人: | 英特尔公司 |
主分类号: | G06F9/30 | 分类号: | G06F9/30;G06F9/38 |
代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 姬利永 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 使用 三个 标量 超级 madd 指令 | ||
1.一种处理器,包括:
第一寄存器,用于存储第一输入向量;
第二寄存器,用于存储第二输入向量;
第三存储器位置,用于存储单个打包数据结构,所述打包数据结构包含第一输入标量、第二输入标量和第三输入标量;
解码器,用于将单个指令解码成经解码的单个指令;以及
执行单元,具有与所述第一寄存器、第二寄存器以及第三存储器位置耦合的乘法器,所述执行单元用于执行所述经解码的单个指令以对于每个元素位置,将所述第一输入标量与所述第一输入向量的元素相乘以产生第一值,将所述第二输入标量与所述第二输入向量的相应元素相乘以产生第二值,以及将所述第一值、所述第二值以及所述第三输入标量相加以通过单次舍入产生结果。
2.如权利要求1所述的处理器,其特征在于,所述乘法器包括用于接收所述第一输入向量的第一输入、用于接收所述第一输入标量的第二输入、用于接收所述第二输入向量的第三输入以及用于接收所述第二输入标量的第四输入,并且所述第一值和第二值是基本上同时被计算的。
3.如权利要求1所述的处理器,其特征在于,所述执行单元包括用于在执行所述经解码的单个指令时循环通过所述乘法器两次的微代码,第一次循环用于产生第一值而第二次循环用于产生第二值。
4.如权利要求1所述的处理器,其特征在于,所述执行单元用于在执行所述经解码的单个指令时不多次循环通过所述乘法器。
5.如权利要求1所述的处理器,其特征在于,所述单个指令的指令格式包括用于指示单精度数据模式和双精度数据模式之间的选择的字段。
6.如权利要求5所述的处理器,其特征在于,所述字段是所述单个指令的操作码。
7.如权利要求1所述的处理器,其特征在于,所述单个指令的指令格式包括用于标识在所述第三存储器位置中何处找到所述第一输入标量、第二输入标量以及所述第三输入标量的字段。
8.如权利要求7所述的处理器,其特征在于,所述字段是所述单个指令的立即操作数。
9.一种用于计算系统的方法,包括:
向第一寄存器加载第一输入向量;
向第二寄存器加载第二输入向量;
向第三存储器位置加载单个打包数据结构,所述打包数据结构包含第一输入标量、第二输入标量以及第三输入标量;
通过处理器的解码器,将单个指令解码成经解码的单个指令;以及
通过所述处理器的执行单元,执行所述经解码的单个指令以对于每个元素位置,将所述第一输入标量与所述第一输入向量的元素相乘以产生第一值,将所述第二输入标量与所述第二输入向量的相应元素相乘以产生第二值,以及将所述第一值、所述第二值以及所述第三输入标量相加以通过单次舍入产生结果。
10.如权利要求9所述的方法,其特征在于,还包括基本上同时计算所述第一值和第二值。
11.如权利要求9所述的方法,其特征在于,所述执行包括在执行所述经解码的单个指令时循环通过所述处理器的乘法器两次,第一次循环用于产生第一值而第二次循环用于产生第二值。
12.如权利要求9所述的方法,其特征在于,所述执行在执行所述经解码的单个指令时不多次循环通过所述处理器的乘法器。
13.如权利要求9所述的方法,其特征在于,所述单个指令的指令格式包括用于指示单精度数据模式和双精度数据模式之间的选择的字段。
14.如权利要求13所述的方法,其特征在于,所述字段是所述单个指令的操作码。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611063814.5/1.html,转载请声明来源钻瓜专利网。