[发明专利]一种超限学习机的运算加速系统及方法在审

申请号：	201910887896.2	申请日：	2019-09-19
公开（公告）号：	CN110737472A	公开（公告）日：	2020-01-31
发明（设计）人：	李海东;徐丽华;崔东顺;钱兴;黄广斌	申请（专利权）人：	烟台市广智微芯智能科技有限责任公司
主分类号：	G06F9/30	分类号：	G06F9/30;G06N3/04;G06N3/08
代理公司：	11624 北京卓岚智财知识产权代理事务所(特殊普通合伙)	代理人：	郭智
地址：	264000 山东省***	国省代码：	山东;37
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明实施例提供一种超限学习机(ELM)的运算加速系统及方法，其中，所述系统通过现场可编程门阵列(FPGA)对超限学习机的计算过程进行硬件加速，包括：数据输入并行化单元，用于接收待处理数据并将其输入并行独立运算通路中；矩阵并行乘加计算单元，用于将超限学习机的配置信息及各并行的运算通道中的数据进行并行矩阵乘加运算后获得所述超限学习机的隐层输入数据；激活函数加速单元，用于对所述隐层输入数据的激活函数进行加速运算获得隐层输出数据；加速非连续乘加单元，对隐层输出数据进行加速非连续乘加后输出，获得对所述待处理数据的处理结果。根据本发明的技术方案实现了提高超限学习机的运算速度和降低其功耗的效果。
搜索关键词：	学习机超限隐层运算并行待处理数据激活函数输出数据非连续现场可编程门阵列矩阵并行矩阵乘加单元乘加运算计算单元计算过程加速单元加速系统配置信息硬件加速运算通路并行化功耗输出
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种超限学习机的运算加速系统，其特征在于，通过现场可编程门阵列FPGA对超限学习机的计算过程进行硬件加速，所述系统包括：/n数据输入并行化单元，用于接收待处理数据并将所述待处理数据输入并行运算通路中；/n矩阵并行乘加计算单元，用于读取超限学习机的配置信息及各并行的运算通道中的数据进行并行矩阵乘加运算后获得所述超限学习机的隐层输入数据，并将隐层输入数据输出至激活函数加速单元；/n激活函数加速单元，用于对所述隐层输入数据的激活函数进行加速运算获得隐层输出数据，并将隐层输出数据输出到加速非连续乘加单元；/n加速非连续乘加单元，用于接收从激活函数加速单元输出的隐层输出数据，对隐层输出数据加速非连续乘加后输出获得对所述待处理数据的处理结果。/n

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于烟台市广智微芯智能科技有限责任公司，未经烟台市广智微芯智能科技有限责任公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201910887896.2/，转载请声明来源钻瓜专利网。

上一篇：指令处理方法、装置及相关产品
下一篇：数据处理方法及装置、终端、存储介质

同类专利

依DMB操作用加载/存储操作实施加载撷取/存储释放指令-201910999320.5
发明人： M·阿什克拉夫特;C·纳尔逊 -专利权人：安培计算有限责任公司
申请日： 2015-07-21 - 公布日： 2020-02-14 - 主分类号： G06F9/30
摘要：本申请涉及依DMB操作用加载/存储操作实施加载撷取/存储释放指令。提供用于将精简指令集运算(RISC)中使用的加载撷取与存储释放语意简化的系统及方法。将该语意转译成用于实施复杂机器指令的微操作、或低阶指令，可避免必须实施复杂的新存储器操作。当数据存储器屏障确保居前指令是在执行后续指令之前先进行及完成时，搭配加载与存储操作使用一或多个数据存储器的屏障操作可提供充分定序。

令牌管理方法、装置、芯片及可移动平台-201880042195.2
发明人：刘瑛 -专利权人：深圳市大疆创新科技有限公司
申请日： 2018-09-30 - 公布日： 2020-02-14 - 主分类号： G06F9/30
摘要：一种令牌管理方法，通过在将指令分割为多个指令片段后，依次分配多个令牌后，并依次存储令牌还生成令牌的存储信息，每个令牌的存储信息用于指示：该令牌是否为所述指令的最后一个令牌、该令牌是否为所述指令所属指令标识对应的最后一个令牌以及所述指令中该令牌的下一个令牌的存储地址。通过该存储信息，可以根据令牌的分配顺序获取到该指令下的所有令牌，从而保证同一指令下的数据不会出错。无需按照令牌的分配顺序以FIFO的形式存储令牌，节省了存储资源，避免资源浪费。

内容数据管理-201880043850.6
发明人：托马斯·克里斯多夫·格鲁卡特;弗朗索瓦·克里斯托弗·雅克·波特曼;布兰得利·约翰·史密斯 -专利权人： ARM有限公司
申请日： 2018-06-19 - 公布日： 2020-02-14 - 主分类号： G06F9/30
摘要：一种数据处理系统包括处理电路，该处理电路用于执行由解码器电路解码的内容数据相依性程序指令。该内容数据相依性程序指令执行取决于当前存在的内容数据的处理。作为实例，该内容数据相依性程序指令可为浮点指令，且内容数据可为舍入模式信息。该解码器电路支持内容保存指令，该内容保存指令在内容数据标记为使用时保存内容数据且在当前内容数据标记为未使用时保存默认内容数据。该解码器电路进一步支持内容还原指令，该内容还原指令在当前内容数据标记为使用时还原内容数据且在当前内容数据标记为当前未使用时准许该当前内容数据继续用于未来使用。

基于自我裁决的无主持自动选举方法-201911038115.9
发明人：郎宁 -专利权人：道崇电子科技(嘉兴)有限公司
申请日： 2019-10-29 - 公布日： 2020-02-07 - 主分类号： G06F9/30
摘要：本发明公开了一种基于自我裁决的无主持自动选举方法。基于自我裁决的无主持自动选举方法包括以下步骤：步骤S1：各个候选部件依次且相互独立地判断自动选举是否结束，如果判断成功则执行步骤S4，否则执行步骤S2；步骤S2：根据预置的自动裁决步骤，生成相应的自我裁决结果，并且判断该候选部件是否当选，如果判断成功则执行步骤S3，否则执行步骤S1；步骤S3：该候选部件判断自动选举是否结束，如果判断成功则执行步骤S4，否则由该候选部件成为唯一的执行者。本发明专利申请公开的基于自我裁决的无主持自动选举方法，在系统工作的任何时刻，只要执行者缺失，候选部件组即自动执行选举程序，毋需主持者即可选举新的执行者。

数据指令处理方法、存储芯片、存储系统和可移动平台-201880039744.0
发明人：庹伟;宋喆喆;张强 -专利权人：深圳市大疆创新科技有限公司
申请日： 2018-08-22 - 公布日： 2020-02-07 - 主分类号： G06F9/30
摘要：一种数据指令处理方法、存储芯片、存储系统和可移动平台，此方法包括：生成数据指令；将数据指令写入存储芯片内的存储单元中，并向存储芯片外部的第一存储器发送指示信息；其中，指示信息包括数据指令的存储地址，以使第一存储器根据存储地址从存储芯片内的存储单元中获取数据指令。本实施例通过将生成的数据指令写入存储芯片内的存储单元，写入数据指令的时间更短，而且上述第一存储器是从存储芯片内的存储单元获取数据指令，第一存储器获取数据指令的时间更短，进而减少了数据指令的执行时间，提高了存储效率。

基于寄存器的矩阵乘法-201880041798.0
发明人：大卫·汉纳·曼塞尔;鲁纳·霍姆;伊恩·迈克尔·考尔菲尔德;伊莲娜·米兰诺维奇 -专利权人： ARM有限公司
申请日： 2018-06-08 - 公布日： 2020-02-07 - 主分类号： G06F9/30
摘要：公开了一种用于在数据处理装置中执行矩阵乘法的技术，该技术包括装置、矩阵乘法指令、操作该装置的方法以及虚拟机实施方式。寄存器由矩阵乘法指令引用，每个寄存器用于存储至少四个数据元素，并且响应于矩阵乘法指令，执行矩阵乘法运算。从第一和第二源寄存器提取第一和第二数据元素矩阵，并执行分别作用于第一矩阵的相应行和第二矩阵的相应列的多个点积运算，以生成应用于目的寄存器的结果数据元素的方形矩阵。对于逐元素矢量技术，对于给定数量的寄存器操作数，可以实现更高的计算密度。

一种基于忆阻器存储器内处理的混合计算装置-201910881699.X
发明人：薛晓勇;李飞强;梁成豪;姜婧雯;田丰实;章志元;王陈泽岱;杨何勇;赵晨阳 -专利权人：复旦大学
申请日： 2019-09-18 - 公布日： 2020-02-04 - 主分类号： G06F9/30
摘要：本发明属于处理器技术领域，具体一种基于忆阻器存储器内处理的混合计算装置。本发明的混合计算装置包括通用处理核、指令存储器、基于忆阻器的具有存储器内处理的数据存储器、输入设备和输出设备；通用处理核包括基本计算机控制器和基本计算机运算器；指令存储器为一个用于存放程序指令的常规存储器；基于忆阻器的具有存储器内处理的数据存储器为一个能够实现特定逻辑功能的数据存储器；输入输出设备为系统所需的输入和输出设备。本发明的混合计算装置重新设计了系统数据通路和控制逻辑，可在存储器阵列或存储器阵列附近中处理一些数据，显著减少通过总线传输的数据，从而降低功耗并提高性能。

一种超限学习机的运算加速系统及方法-201910887896.2
发明人：李海东;徐丽华;崔东顺;钱兴;黄广斌 -专利权人：烟台市广智微芯智能科技有限责任公司
申请日： 2019-09-19 - 公布日： 2020-01-31 - 主分类号： G06F9/30
摘要：本发明实施例提供一种超限学习机(ELM)的运算加速系统及方法，其中，所述系统通过现场可编程门阵列(FPGA)对超限学习机的计算过程进行硬件加速，包括：数据输入并行化单元，用于接收待处理数据并将其输入并行独立运算通路中；矩阵并行乘加计算单元，用于将超限学习机的配置信息及各并行的运算通道中的数据进行并行矩阵乘加运算后获得所述超限学习机的隐层输入数据；激活函数加速单元，用于对所述隐层输入数据的激活函数进行加速运算获得隐层输出数据；加速非连续乘加单元，对隐层输出数据进行加速非连续乘加后输出，获得对所述待处理数据的处理结果。根据本发明的技术方案实现了提高超限学习机的运算速度和降低其功耗的效果。

数据处理方法及装置、终端、存储介质-201910907142.9
发明人：刘琦;何亮亮 -专利权人：北京小米移动软件有限公司
申请日： 2019-09-24 - 公布日： 2020-01-31 - 主分类号： G06F9/30
摘要：本公开是关于一种数据处理方法及装置、终端、存储介质，所述方法包括：将神经网络基于N个输入数据输出的第一特征矩阵转换为第二特征矩阵；其中，第一特征矩阵包括：1行和N*M列，第二特征矩阵包括：N行和M列；将神经网络的第一卷积矩阵转化为第二卷积矩阵；其中，第一卷积矩阵包括：1行和O*M列；第二卷积矩阵包括：O行和M列；基于第二特征矩阵和第二卷积矩阵进行卷积运算，得到第三特征矩阵。通过该方法，在不增加内存的同时提升了卷积运算的效率。

用于部分波前合并的方法和系统-201810758486.3
发明人：朱韵鹏;吉姆歇德·米尔扎 -专利权人：超威半导体公司;ATI科技无限责任公司
申请日： 2018-07-11 - 公布日： 2020-01-21 - 主分类号： G06F9/30
摘要：描述了用于部分波前合并的方法和系统。向量处理机器采用所述部分波前合并将部分波前合并成一个或多个波前。所述系统包括部分波前管理器和统一寄存器。所述部分波前管理器检测在不同的单指令多数据(“SIMD”)单元中的包含不活动工作项和活动工作项的波前(以下称为“部分波前”)，将所述部分波前移动到一个或多个SIMD单元中并将所述部分波前合并成一个或多个波前。所述统一寄存器允许在所述一个或多个合并的波前中的每个活动工作项访问原始SIMD单元中的先前分配的寄存器。因此，所述统一寄存器的内容不必被复制到执行所述一个或多个合并的波前的所述SIMD单元。

一种访问不可缓存区域的存储指令的合并方法-201910859164.2
发明人：胡向东;王飙;杨剑新;路冬冬;张晓东 -专利权人：上海高性能集成电路设计中心
申请日： 2019-09-11 - 公布日： 2020-01-14 - 主分类号： G06F9/30
摘要：本发明涉及一种访问不可缓存区域的存储指令的合并方法，在存储指令队列后设置合并缓冲，将访存地址落在同一个Cache块范围内的多条访问不可缓存区域的存储指令进行合并，并将所述多条存储指令的写数据合并存储于一个“不可缓存区域写数据缓冲”条目中。本发明减少访问不可缓存区域的存储指令对相关请求通道和数据通道的占用。

一种数据处理的方法、装置、电子设备和存储介质-201810716524.9
发明人：吴帅 -专利权人：杭州海康威视数字技术股份有限公司
申请日： 2018-06-29 - 公布日： 2020-01-07 - 主分类号： G06F9/30
摘要：本申请实施例提供了一种数据处理的方法、装置、电子设备和存储介质，属于计算机技术领域。所述方法包括：接收数据操作指令，所述数据操作指令用于指示对目标类型的目标数据进行数据操作处理，确定所述目标数据对应的第一指针，所述第一指针为预设通用类型的指针，调用预设的队列操作函数，根据所述第一指针和预设的所述目标类型对应的元素大小，对所述目标数据进行数据操作处理。采用本申请，技术人员无需针对不同类型的数据重新编写程序代码、建立队列，降低了人工成本。

用于战胜边信道攻击的处理器指令支持-201910456359.2
发明人：刘芳菲;B.邢;M.施泰纳;M.维吉;C.罗扎斯;F.麦克金;M.奥兹索伊;M.弗南德斯;K.朱姆青斯基;M.沙纳汉 -专利权人：英特尔公司
申请日： 2019-05-29 - 公布日： 2020-01-07 - 主分类号： G06F9/30
摘要：本文详述的是用于计算机架构的系统、设备和方法，所述计算机架构具有用于缓解基于页故障和/或基于高速缓存的边信道攻击的指令集支持。在实施例中，一种设备包括用于解码第一指令的解码器，所述第一指令具有针对第一操作码的第一字段，所述第一操作码指示执行电路将在第一寄存器中设置第一标志，所述第一标志指示在事件发生时将程序流程重定向到异常处理程序的操作模式。所述设备还包括执行电路，所述执行电路用于执行所解码的第一指令以在第一寄存器中设置指示操作模式的第一标志，并将异常处理程序的地址存储在第二寄存器中。

非对称多核异构并行处理系统-201911050881.7
发明人：乔治斯·科拉米达斯;雅科沃斯·斯塔姆利斯;乔治·西迪罗坡洛斯 -专利权人：畅想芯科有限公司
申请日： 2018-06-20 - 公布日： 2020-01-07 - 主分类号： G06F9/30
摘要：本申请涉及非对称多核异构并行处理系统。多核非对称图形处理单元(GPU)包括第一组的GPU核心和第二组的GPU核心。第一组的GPU核心具有第一微架构和第一功耗简档。第一组的GPU核心被配置为执行指令集架构(ISA)的指令子集。第二组的GPU核心具有第二微架构和比第一功耗简档高的第二功耗简档，并被配置为执行整个ISA。第一组的GPU核心和第二组的GPU核心可以通过流水线阶段的数量、寄存器的数量、分支执行、矢量化单元或其组合来进一步区分。任一组中的GPU核心子集可能具有不同的操作频率。在一些实施例中，可执行指令可以包括用以确定执行是由第一组的GPU核心还是由第二组的GPU核心执行的指示符。

用于诠释与能力相关联的权限的装置及方法-201880032317.X
发明人：格雷姆·彼得·巴尔内斯 -专利权人： ARM有限公司
申请日： 2018-04-27 - 公布日： 2020-01-07 - 主分类号： G06F9/30
摘要：本文提供用于诠释与能力相关联的权限的装置及方法。该装置具有：处理电路，用于执行指令以执行操作；以及能力存储组件，可由处理电路可访问并且被布置为存储用于约束处理电路在执行指令时执行的至少一个操作的能力。该能力标识数目为N个的多个默认权限，所述默认权限的状态是根据默认诠释从该能力中提供的N个权限标志来确定的。根据该默认诠释，每个权限标志可以与这些默认权限中的一个相关联。处理电路随后被布置为根据替代诠释来分析能力，以便根据N个权限标志的逻辑组合来导出权限的扩展集的状态，其中该扩展集包括至少N+1个权限。这提供了用于将额外权限编码到能力中而不增加所需的权限标志数量，同时仍保持期望行为的机制。

运算装置及相关产品-201810680463.5
发明人：不公告发明人 -专利权人：北京中科寒武纪科技有限公司
申请日： 2018-06-27 - 公布日： 2020-01-03 - 主分类号： G06F9/30
摘要：本公开涉及运算装置及相关产品，所述装置包括控制器单元和运算单元，所述控制器单元用于获取张量分解指令；所述运算单元用于：在所述控制器单元的控制下获取待分解张量和所述张量分解指令；根据所述待分解张量和所述张量分解指令进行张量分解运算，得到张量分解结果。在本公开实施例中，由控制器单元和运算单元组成的张量分解运算装置可以高效、可靠地完成张量分解运算，处理效率高，处理结果准确。

多路并联寄存器-201810667038.2
发明人：刘杰尧;张楠赓;吴敬杰;马晟厚 -专利权人：北京嘉楠捷思信息技术有限公司
申请日： 2018-06-25 - 公布日： 2019-12-31 - 主分类号： G06F9/30
摘要：本发明提供一种在计算设备中应用的多路并联寄存器，包括多个输入端，用于输入数据；一时钟控制端，用于输入时钟信号；多个输出端，用于输出数据；多个动态D触发器，所述多个动态D触发器并联连接，用于在时钟信号控制下锁存和/或读出所述数据；一时钟缓冲器，用于将所述时钟控制端输入的时钟信号缓冲之后向所述多个动态D触发器提供时钟信号。可以简化后端布局布线流程，降低设计难度，提高性能，增加实用性。

去除循环处理流程中条件判断语句的方法和装置、应用单元-201611255464.2
发明人：何君舰;刘瑞祥;张鹏;曹红胜;赵东旭;刘海明;沈海寅 -专利权人：智车优行科技(北京)有限公司
申请日： 2016-12-30 - 公布日： 2019-12-31 - 主分类号： G06F9/30
摘要：本发明公开了一种去除循环处理流程中条件判断语句的方法和装置、应用单元，其中，方法包括：响应于读取到条件判断语句，获取所述条件判断语句中判断条件的条件形式；根据所述判断条件的条件形式，生成所述条件判断语句的非判断执行应用单元；所述非判断执行应用单元通过符号位获取、加减法操作和按位与操作实现所述条件判断语句的执行结果。另外，上述方法还可以进一步包括：执行所述非判断执行应用单元，获得所述条件判断语句的执行结果。本发明无需执行判断条件，通过符号位获取、加减法操作和按位与操作来实现条件判断语句的执行结果，提高了循环处理流程的执行效率。本发明应用于需要高速计算的领域时，对于执行效率的提升效果尤其明显。

数据处理方法、装置、计算机设备及可读存储介质-201810628408.1
发明人：甘霖;付昊桓;杨广文;徐敬蘅;庞小允;杨超;薛巍 -专利权人：清华大学
申请日： 2018-06-19 - 公布日： 2019-12-27 - 主分类号： G06F9/30
摘要：本发明提供的数据处理方法、装置、计算机设备及可读存储介质，该方法包括：将每一个任务分块中的网格点数据区域进行划分，得到中心区域以及围绕中心区域的外围区域，通过FPGA对中心区域中的每一个网格点数据进行欧拉模板计算，得到第一计算结果，通过CPU获取与外围区域中每一个网格点所在任务分块相邻的任务分块中的网格点数据，对外围区域中的每一个网格点数据，以及获取的相邻的任务分块中的网格点数据进行欧拉模板计算，得到第二计算结果，通过CPU将第一计算结果和第二计算结果存储至存储空间。由于计算机设备将算法偏移，快速查找表和混合精度方法综合考虑到欧拉模板计算过程中，以降低欧拉模板计算对FPGA资源的需求，从而提高能耗功率。

用于管理能力域的设备及方法-201880032291.9
发明人：格雷姆·彼得·巴尔内斯 -专利权人： ARM有限公司
申请日： 2018-04-27 - 公布日： 2019-12-27 - 主分类号： G06F9/30
摘要：本发明提供一种用于管理能力域的设备及方法。该设备具有用于执行指令的处理电路，该处理电路当处于默认状态时被布置为在能力域中操作，该能力域包括用以约束执行指令时由处理电路执行的操作的能力。亦提供了程序计数器能力储存元件以储存由处理电路用来确定程序计数器值的程序计数器能力。程序计数器能力被布置为标识处理电路的能力状态。当能力状态指示默认状态时，则处理电路被布置为在能力域中操作。然而，当能力状态指示执行状态时，处理电路被布置为以比当处于默认状态时受到更少约束的方式操作，以便允许更改能力域。此提供了用于选择性地允许设备更改能力域的简单且有效的机制。

免划分的多插槽存储器系统架构-200910141917.2
发明人： E·斯普兰格尔 -专利权人：英特尔公司
申请日： 2009-03-31 - 公布日： 2019-12-24 - 主分类号： G06F9/30
摘要：本发明名称为“免划分的多插槽存储器系统架构”。一种为吞吐量应用增加存储器带宽的技术。在一个实施例中，能增加存储器带宽，特别是对于吞吐量应用，而不用通过在存储器访问时钟的半周期上在一个或多个存储器存储区域之间用管道输送页来增加互连迹线或引脚数。

向量归约处理器-201810118791.6
发明人：格雷戈里·米歇尔·索尔森;安德鲁·埃弗里特·菲尔普斯;奥利维尔·泰马姆 -专利权人：谷歌有限责任公司
申请日： 2018-02-06 - 公布日： 2019-12-24 - 主分类号： G06F9/30
摘要：本申请涉及一种向量归约处理器。一种被配置为对元素的输入向量进行归约的向量归约电路包括多个单元电路，其中，除接收所述输入向量的指定的第一元素的指定的第一单元电路以外的所述多个单元电路中的每个单元电路被配置为：接收所述输入向量的特定元素，从所述一个或多个单元电路中的另一个单元电路接收临时归约元素，使用所述特定元素和所述临时归约元素来执行归约操作，并提供使用所述特定元素和所述临时归约元素来执行所述归约操作的结果作为新的临时归约元素。所述向量归约电路也包括输出电路，所述输出电路被配置为提供与使用所述输入向量的最后元素来执行所述归约操作的结果相对应的新的临时归约元素以用于作为所述输入向量的归约而输出。

一种指令集模拟器指令函数自动生成优化方法-201910705850.4
发明人：张凯旋;蔡铭 -专利权人：浙江大学
申请日： 2019-08-01 - 公布日： 2019-12-20 - 主分类号： G06F9/30
摘要：本发明公开了一种指令集模拟器指令函数自动生成优化方法。该方法通过指令微操作和指令执行表达式标准化规则，可以有效提高指令函数自动生成方法的指令覆盖率。指令微操作提供指令集手册中为了描述简便大量使用的功能函数。指令执行表达式标准化规则限制了指令执行表达式中过于随意描述方式，对不符合规范的表达式进行等价的轻微修改，使得可以自动生成该指令的指令函数。该方法适用于多种类型的指令集，能有效降低开发人员的编程工作量，提高指令集模拟器的开发效率，具有较好的应用前景。

一种系统信息获取方法、终端及介质-201910873601.6
发明人：王泽森 -专利权人：腾讯科技(深圳)有限公司
申请日： 2019-09-12 - 公布日： 2019-12-20 - 主分类号： G06F9/30
摘要：本申请实施例公开了一种系统信息获取方法、终端及介质，其中方法包括：基于汇编方式获取预设环境块的地址，所述预设环境块包括进程环境块或操作系统环境块；根据所述预设环境块的地址获取所述预设环境块的结构体，所述结构体包括多个字段，所述多个字段中包括用于指示系统信息的目标字段；从所述预设环境块的结构体提取出所述目标字段的信息，并根据所述目标字段的信息确定所述系统信息。采用本申请实施例，有助于提升获取的系统信息的可靠性。

可变格式、可变稀疏矩阵乘法指令-201910431218.5
发明人：马克·A·安德斯;希曼殊·考尔;萨努·马修 -专利权人：英特尔公司
申请日： 2019-05-22 - 公布日： 2019-12-17 - 主分类号： G06F9/30
摘要：公开的实施例涉及可变格式、可变稀疏矩阵乘法指令。在一个示例中，处理器包括提取和解码电路，用于提取和解码可变格式、可变稀疏矩阵乘法(VFVSMM)指令，所述指令指定分别具有(M×K)、(K×N)和(M×N)个元素的A、B和C矩阵的位置；执行电路，该执行电路响应于经解码的VFVSMM指令用于：将指定的A矩阵的每一行与后续行错开路由到(M×N)处理阵列的相应行中，并将指定的B矩阵的每一列与后续列错开路由到处理阵列的相应列中，其中，处理单元中的每一个生成A矩阵元素和具有与A矩阵元素的列地址相同的行地址的匹配B矩阵元素的K个乘积，并且将每个所生成的乘积与相应的C矩阵元素累加。

用于提升用于深度学习的深度神经网络的方法和系统-201780088080.2
发明人：王立彬;郭怡文;姚安邦;蔡东琪;徐琳;胡平;王山东;程文华;陈玉荣 -专利权人：英特尔公司
申请日： 2017-04-07 - 公布日： 2019-12-17 - 主分类号： G06F9/30
摘要：公开了用于提升用于深度学习的深度神经网络的方法和系统。在一个示例中，在包括第一浅网络和第二浅网络的深度神经网络中，由第一浅网络使用相等的权重来处理第一训练样本。基于使用相等的权重处理的训练样本来确定第一浅网络的损失。基于所确定的第一浅网络的损失来调整第二浅网络的权重。由第二浅网络使用调整后的权重来处理第二训练样本。在另一示例中，在包括第一弱网络和第二弱网络的深度神经网络中，由第一弱网络使用初始化的权重来处理训练样本的第一子集。确定第一弱网络在训练样本的第一子集上的分类误差。使用所确定的第一弱网络的分类误差利用调整后的权重来提升第二弱网络。由第二弱网络使用调整后的权重来处理训练样本的第二子集。

间接存储器提取器-201910363863.8
发明人：斯泰恩·艾尔曼;维姆·希尔曼;克里斯托夫·杜波依斯;易卜拉欣·胡尔;约书亚·B·弗里曼 -专利权人：英特尔公司
申请日： 2019-04-30 - 公布日： 2019-12-10 - 主分类号： G06F9/30
摘要：所公开的实施例涉及间接存储器提取器。在一个示例中，一种装置包括：电路，用于提取和解码指令，指令指定包括N个操作数的稀疏操作数数组和包括N个连续寻址索引的索引数组。该装置还包括与间接存储器提取(IMF)单元相关联的处理引擎，以通过以下操作来响应经解码的指令：初始化IMF单元以按顺序提取N个操作数，探测IMF单元以确定所提取的操作数准备好待取回，从IMF单元取回所提取的操作数，并重复探测和取回，直到取回所有N个操作数。独立于处理引擎的IMF单元用于从索引数组中提取N个连续寻址索引，使用N个提取的索引来计算N个操作数的存储器地址，并发出多个读取请求以按顺序提取N个操作数。

一种可解码点阵字库的处理器芯片-201822048763.X
发明人：张林;崔瀚之 -专利权人：深圳高通半导体有限公司
申请日： 2018-12-06 - 公布日： 2019-12-10 - 主分类号： G06F9/30
摘要：本实用新型公开一种可解码点阵字库的处理器芯片，包括：算法处理器，与所述算法处理器通信相连的寄存器组、字符信息存储器组、程序存储器和数据缓存区单元。本实用新型的可解码点阵字库的处理器芯片具有成本低和适用性强的优点，用户不需要采购或者定制指定的字库芯片，使用本芯片可以非常简单地生成适合自己的理想字库，并且在产品有需求时，可以方便地进行更换升级。并且增强了字库的防盗版能力。

数据元素选择和合并处理器、方法、系统和指令-201580044339.4
发明人： M.L.梅蒙 -专利权人：英特尔公司
申请日： 2015-08-19 - 公布日： 2019-12-10 - 主分类号： G06F9/30
摘要：一种处理器，包括压缩数据寄存器以及用于对数据元素选择和合并指令进行解码的解码单元。指令要具有第一源压缩数据操作数(其要具有多个数据元素)和第二源操作数(其要具有多个屏蔽元素)。各屏蔽元素对应于相同相对位置中的不同数据元素。执行单元与解码单元耦合。执行单元响应指令而要在要通过指令所指示的目的地存储位置中存储结果压缩数据操作数。结果压缩数据操作数要包括第一源压缩数据操作数的所有数据元素，其对应于在结果压缩数据操作数的一部分中合并在一起的第二源操作数的未屏蔽的屏蔽元素。

使用低精度和高精度的混合推理-201910973729.X
发明人： E·乌尔德-阿迈德-瓦尔;B·拉克舍玛南;T·史佩斯曼;J·雷;P·T·唐;M·斯特里克兰德;陈晓明;姚安邦;B·J·阿什博;L·L·赫德;马立伟 -专利权人：英特尔公司
申请日： 2018-04-23 - 公布日： 2019-12-06 - 主分类号： G06F9/30
摘要：本申请公开了使用低精度和高精度的混合推理。一个实施例提供了一种用于执行机器学习操作的计算设备，所述计算设备包括：指令解码逻辑，所述指令解码逻辑用于将包括多个操作数的单个指令解码成单个经解码指令，所述多个操作数具有不同的精度；以及包括第一逻辑单元和第二逻辑单元的通用图形计算单元，所述通用图形计算单元用于执行所述单个经解码指令，其中，执行所述单个经解码指令包括以第一精度对所述多个操作数中的第一组操作数执行第一指令操作，并且同时以第二精度对所述多个操作数中的第二组操作数执行第二指令操作。

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理
G06F9-00 程序控制装置，例如，控制器
G06F9-02 .应用有线连接的，例如，插头板
G06F9-04 .应用仅含程序指令的记录载体的
G06F9-06 .应用存入的程序的，即应用处理设备的内部存储来接收程序并保持程序的
G06F9-22 ..微控制或微程序装置
G06F9-30 ..执行机器指令的装置，例如指令译码

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种超限学习机的运算加速系统及方法在审

专利文献下载