[发明专利]用于机器学习的快速数据操作和有限状态机在审
申请号: | 201810310957.4 | 申请日: | 2018-04-09 |
公开(公告)号: | CN108694081A | 公开(公告)日: | 2018-10-23 |
发明(设计)人: | S.雅哈吉达尔;A.科克;V.兰加纳坦;B.温布;J.雷;L.马;A.阿普;J.博特尔森;N.R.萨蒂什;F.阿克巴里;K.辛哈;E.努尔维塔迪 | 申请(专利权)人: | 英特尔公司 |
主分类号: | G06F9/48 | 分类号: | G06F9/48;G06F9/50;G06F9/54 |
代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 姜冰;杨美灵 |
地址: | 美国加利*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 快速数据 机器学习 图形处理器 状态机描述 计算部件 处理器 旁路 推送 流水线 检测 | ||
1. 一种用于促进用于机器学习的快速数据操作的设备,所述设备包括:
检测/观测逻辑,用于检测在计算任务中要由包含图形处理器的处理器的计算流水线的计算部件使用的输入数据;以及
旁路/迂回逻辑,用于确定来自所述数据的一个或多个频繁使用的数据值(FDV),其中所述旁路/迂回逻辑用于推送所述一个或多个频繁数据值以旁路所述计算任务。
2.如权利要求1所述的设备,其中所述旁路/迂回逻辑进一步用于确定来自所述数据的一个或多个非FDV,其中所述旁路/迂回逻辑进一步将所述非FDV设置在计算路径上以通过所述计算部件。
3.如权利要求1所述的设备,其中所述一个或多个FDV包括其计算值和结果是已知或可预测的频繁出现的值。
4.如权利要求1所述的设备,进一步包括计算/定制化逻辑,用于生成要指派到所述输入数据以减少与所述一个或多个FDV和所述一个或多个非FDV关联的数学操作的一个或多个配置集合。
5.如权利要求4所述的设备,其中所述数学操作包括加法、减法、乘法、和除法中的一个或更多。
6.如权利要求4所述的设备,其中所述计算/定制化逻辑进一步用于主控有限状态机(FSM)以提供用于卷积和全连接计算的公共图元,其中所述FSM用于组合存储器读取访问并将所述数学操作中的一个或更多与所述数学操作中的另外一个或更多合并。
7.如权利要求1所述的设备,其中所述图形处理器与应用处理器共置于公共半导体封装上。
8. 一种用于促进用于机器学习的快速数据操作的方法,所述方法包括:
检测在计算任务中要由包含图形处理器的处理器的计算流水线的计算部件使用的输入数据;以及
确定来自所述数据的一个或多个频繁使用的数据值(FDV);
以及推送所述一个或多个频繁数据值以旁路所述计算任务。
9. 如权利要求8所述的方法,进一步包括:
确定来自所述数据的一个或多个非FDV;以及
将所述非FDV设置在计算路径上以通过所述计算部件。
10.如权利要求8所述的方法,其中所述一个或多个FDV包括其计算值和结果是已知或可预测的频繁出现的值。
11.如权利要求8所述的方法,进一步包括生成要指派到所述输入数据以减少与所述一个或多个FDV和所述一个或多个非FDV关联的数学操作的一个或多个配置集合。
12.如权利要求11所述的方法,其中所述数学操作包括加法、减法、乘法、和除法中的一个或更多。
13.如权利要求11所述的方法,进一步包括主控有限状态机(FSM)以提供用于卷积和全连接计算的公共图元,其中所述FSM用于组合存储器读取访问并将所述数学操作中的一个或更多与所述数学操作中的另外一个或更多合并。
14.如权利要求8所述的方法,其中所述图形处理器与应用处理器共置于公共半导体封装上。
15.至少一种包括多个指令的机器可读介质,所述多个指令当在计算装置上执行时,用于实现或执行如权利要求8-14的任一项中所要求的方法。
16.一种系统,包括用于实现或执行如权利要求或示例8-14的任一项中所要求的方法的机制。
17.一种设备,包括用于执行如权利要求或示例8-14的任一项中所要求的方法的组件。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810310957.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:高效线程组调度
- 下一篇:一种跨域作业流调度方法及系统