[发明专利]用于执行点积运算的指令和逻辑有效
| 申请号: | 201510348092.7 | 申请日: | 2007-09-20 |
| 公开(公告)号: | CN105022605B | 公开(公告)日: | 2018-10-26 |
| 发明(设计)人: | R.佐哈;M.塞科尼;R.帕塔萨拉蒂;S.钦努帕蒂;M.布克斯顿;C.德西尔瓦;M.阿卜杜拉 | 申请(专利权)人: | 英特尔公司 |
| 主分类号: | G06F7/544 | 分类号: | G06F7/544 |
| 代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 朱君;陈岚 |
| 地址: | 美国加利*** | 国省代码: | 美国;US |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 指令 点积运算 点积 程序部件 存储单元 操作数 存储 响应 | ||
1.一种处理器,包括:
指令预取部件,用于取出点积打包双精度DPPD浮点指令,所述点积打包双精度DPPD浮点指令具有第一操作数、第二操作数以及8位立即操作数;
第一128位XMM寄存器,用于存储所述第一操作数;
第二128位XMM寄存器,用于存储所述第二操作数;
解码部件,用于对由所述指令预取部件所取出的DPPD浮点指令进行解码;
调度部件,用于对所述DPPD浮点指令进行调度;以及
执行部件,用于基于所调度的DPPD浮点指令对所述第一操作数和所述第二操作数执行点积操作,其中每个操作数具有两个对应64位段,每个对应64位段用于存储对应打包双精度浮点值,其中所述8位立即操作数的每个相应位5和位4用于选择所述对应打包双精度浮点值的相应积,以便包含在所述点积操作中,从而生成点积结果,其中所述点积结果将被存储在包括恰好64位的临时寄存器中直到它准备将要被进一步操作为止,其中生成所述点积结果进一步包括检测溢出,并且其中临时存储的点积结果用于存储在所述第一128位XMM寄存器中。
2.如权利要求1所述的处理器,其中,要根据所述8位立即操作数的位1和位0来选择所述点积结果在所述第一128位XMM寄存器中的存储。
3.一种片上系统SOC硬件,包括:
存储器控制器;
显示器控制器;以及
耦合到所述存储器控制器和所述显示器控制器的处理器,所述处理器包括:
指令预取部件,用于取出点积打包双精度DPPD浮点指令,所述点积打包双精度DPPD浮点指令具有第一操作数、第二操作数以及8位立即操作数;
第一128位XMM寄存器,用于存储所述第一操作数;
第二128位XMM寄存器,用于存储所述第二操作数;
解码部件,用于对由所述指令预取部件所取出的DPPD浮点指令进行解码;
调度部件,用于对所述DPPD浮点指令进行调度;以及
执行部件,用于基于所调度的DPPD浮点指令对所述第一操作数和所述第二操作数执行点积操作,其中每个操作数具有两个对应64位段,每个对应64位段用于存储对应打包双精度浮点值,其中所述8位立即操作数的每个相应位5和位4用于选择所述对应打包双精度浮点值的相应积,以便包含在所述点积操作中,从而生成点积结果,其中生成所述点积结果进一步包括检测溢出,其中所述点积结果将被存储在包括恰好64位的临时寄存器中直到它准备将要被进一步操作为止,并且其中临时存储的点积结果用于存储在所述第一128位XMM寄存器中。
4.如权利要求3所述的SOC硬件,其中,要根据所述8位立即操作数的位1和位0来选择所述点积结果在所述第一128位XMM寄存器中的存储。
5.如权利要求3所述的SOC硬件,进一步包括耦合到所述处理器的接口逻辑,所述接口逻辑包括通用串行总线USB接口逻辑和输入/输出I/O接口逻辑。
6.一种计算机系统,包括:
如权利要求1至2中的任一项所述的处理器;
网络控制器;
输入/输出I/O控制器,其与所述处理器耦合;
硬盘驱动器,其与I/O桥接器耦合;
闪存,其与I/O桥接器耦合;以及
无线收发器。
7.一种计算机系统,包括:
如权利要求1至2中的任一项所述的处理器;
存储器控制器,其与所述处理器耦合;
存储器,其与所述存储器控制器耦合;
输入/输出I/O控制器,其与所述存储器控制器耦合;
海量存储设备;
无线收发器;以及
音频控制器。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510348092.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种BMS安全自检及信息交互方法
- 下一篇:生成打印作业的方法及系统





