[发明专利]一种数据处理方法、装置及处理器在审

专利信息
申请号: 202211634334.5 申请日: 2022-12-15
公开(公告)号: CN115809091A 公开(公告)日: 2023-03-17
发明(设计)人: 郭伟 申请(专利权)人: 海光信息技术股份有限公司
主分类号: G06F9/302 分类号: G06F9/302;G06F9/30;G06N3/04;G06N3/063
代理公司: 北京市广友专利事务所有限责任公司 11237 代理人: 张仲波
地址: 300000 天津市滨海新区天津华苑*** 国省代码: 天津;12
权利要求书: 查看更多 说明书: 查看更多
摘要: 本公开提供一种数据处理方法、装置及处理器,其中所述方法包括:读取单一数据特征计算硬件指令;对读取到的单一数据特征计算硬件指令进行解码;执行解码后的单一数据特征计算硬件指令,以完成至少3个以上数据的特征计算全过程。本公开提供的技术方案可适用于深度学习和人工智能技术中池化层实现池化算法的场景,能够很好地提高计算速度。
搜索关键词: 一种 数据处理 方法 装置 处理器
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于海光信息技术股份有限公司,未经海光信息技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/202211634334.5/,转载请声明来源钻瓜专利网。

同类专利
  • 数据处理方法、装置和计算机设备-202310843408.4
  • 余玉琴;曾耀辉;卞仁玉;张淮声 - 格兰菲智能科技有限公司
  • 2023-07-10 - 2023-10-20 - G06F9/302
  • 本申请涉及数据处理技术领域,具体涉及一种数据处理方法、装置、计算机设备、存储介质和计算机程序产品。所述数据处理方法包括:响应于计算指令,获取源数据;采用计算模块对源数据进行计算,得到目标数据值;当目标数据值不符合计算指令携带的计算信息时,获取新的源数据,并将目标数据值转发至计算模块的输入端;采用计算模块对新的源数据和目标数据值进行计算,得到新的目标数据值;当新的目标数据值符合计算信息时,将新的目标数据值作为数据计算结果;否则,持续获取新的源数据,直到新的目标数据值符合计算信息,通过该种设置,能够节约寄存器资源,省略数据的写入和读取步骤,加快计算速度。
  • 嵌入式星载异构多核智能计算系统及方法-202310807961.2
  • 黄宇轩;刘奎;朱坤托;王滔;程世祺;田文波;朱新忠 - 上海航天计算机技术研究所
  • 2023-07-03 - 2023-10-03 - G06F9/302
  • 本发明提供一种嵌入式星载异构多核智能计算系统及方法,该系统包括主控中央处理模块和神经网络处理模块。其中,主控中央处理模块中,NOR FLASH采用三模冗余实现主程序备份,NAND FLASH中存储数据,上电后激活值数据从NAND FLASH传输至DDR中,权重数据从NAND FLASH传输至LPDDR中,CPU通过总线将指令和激活值数据发送至NPU;神经网络处理模块中,NPU接收指令和激活值数据,从LPDDR中读取权重数据并计算,计算后的数据有两种传输方式,一种通过流水线形式传输给下一级NPU计算,另一种通过总线将计算完成的结果传输回CPU。本发明支持基于数据流并行的主控CPU+多NPU的神经网络模型推理加速,提升面向星载应用的神经网络计算帧率和能效。
  • 一种空间远距离传输数据编解码指令集系统及计算系统-202310809805.X
  • 黄丹;禹霁阳;杨天宝;肖雄;程思玮;卢玲;闫欢 - 中国兵器科学研究院;北京空间飞行器总体设计部
  • 2023-07-04 - 2023-09-22 - G06F9/302
  • 本发明公开了一种空间远距离传输数据编解码指令集系统及计算系统,指令集系统包括扩展指令集编码,用于进行编码处理指令集;扩展指令集编码为28位等长的指令集编码格式,支持8个32位通用功能寄存器,编码处理指令集gfmu指令,用于完成寄存器支架的伽罗华域乘法操作;compvec指令,用于完成内存中地址向量A和地址向量C的加、减、乘、除、与、或、非、异或、左旋转移位和右旋转移位操作,结果存入地址向量C;compvbwr指令,用于以DMA形式完成向向量B写入向量处理所需要的数据;sboxcpy指令,用于写入查询表格数据,以完成查询预置表的写入;sboxing指令,用于实现写入数据的编码操作输出功能;本发明可以降低批量数据编码中控制流程造成的计算时间开销,提高计算性能。
  • 混合精度运算的处理方法以及指令处理装置-202310571408.3
  • 张文蒙 - 阿里巴巴(中国)有限公司
  • 2023-05-17 - 2023-08-25 - G06F9/302
  • 公开了一种混合精度运算的处理方法以及指令处理装置。指令处理装置包括:寄存器堆,包括多个寄存器;译码单元,用于对混合精度运算指令进行译码,并得到译码信息,所述译码信息指示执行单元执行下述操作;对多个寄存器中的第一寄存器和第二寄存器执行指定算术操作,并将结果写回到多个寄存器中的第三寄存器,第一寄存器和第二寄存器内的操作数的精度不同;执行单元,耦接到寄存器堆和译码单元,用于基于译码信息执行相应操作。和现有的处理器相比,该指令处理装置无需将混合精度统一为同一精度再进行算术操作,因而提高了混合精度运算的处理效率,并节省了将混合精度统一为同一精度时所占用的存储空间。
  • 神经网络模型的编译方法、优化模型的训练方法和装置-202310603567.7
  • 沈碧螺;邓博文;李建军;张骞 - 北京地平线信息技术有限公司
  • 2023-05-25 - 2023-08-22 - G06F9/302
  • 本公开实施例公开了一种神经网络模型的编译方法、优化模型的训练方法和装置,其中,方法包括:获取待编译神经网络模型;基于待编译神经网络模型,确定待编译神经网络模型对应的中间指令序列;利用预先训练获得的指令序列优化模型对中间指令序列进行处理,获得中间指令序列对应的目标优化参数;基于目标优化参数,确定中间指令序列对应的优化指令序列;将优化指令序列转换为可执行指令序列,获得待编译神经网络模型对应的神经网络处理器可执行的目标指令序列。本公开实施例可以大大降低编译时间,从而可以有效提高编译效率。
  • 一种浮点除法、开根号硬件计算装置及计算方法-202310378233.4
  • 高玉鑫 - 青岛本原微电子有限公司
  • 2023-04-11 - 2023-08-11 - G06F9/302
  • 本发明涉及微处理器内的浮点运算技术领域,公开了一种浮点除法、开根号硬件计算装置及计算方法,装置采用16级流水线结构,分成三个部分;第一部分是数据的预处理部分,共1级流水线;第二部分是迭代部分,总共14级流水线,用于处理尾数除法和开根号迭代运算以及得出指数结果;第三部分是最终数据处理部分,共1级流水线,用于特殊数据处理、非规格化处理、5种舍入、规格化以及5种异常标志处理。本发明所公开的装置及方法计算精度高、硬件资源小、实现功能全面,本装置通过降低舍入模式处理的复杂度,进行资源复用,提高资源复用率;在实现浮点除法、开根号计算时,保证计算的最高精度要求,同时得出完善的特殊计算时的标志。
  • 一种多功能定点乘法和乘累加运算装置及方法-202310383363.7
  • 张余超 - 青岛本原微电子有限公司
  • 2023-04-11 - 2023-07-18 - G06F9/302
  • 本发明属于计算机数据处理领域,公开了一种多功能定点乘法和乘累加运算装置及方法,运算装置包括依次设置的指令译码和数据分配模块、符号扩展预处理模块、布什编码模块、布什译码模块、部分积数位分配模块、华莱士树模块以及加法器模块;本发明的装置实现了一个基本的2n位乘法华莱士压缩树逻辑可以完全复用在两个乘累加器的华莱士树压缩电路上,极大地节约了晶体管资源,减小了面积和降低了功耗;可以满足高性能处理器的时钟周期长度的要求,芯片设计面积小、功耗低、时序路径优。并且本发明兼有溢出保护处理,十分适合应用在对功耗、面积、频率要求较高的嵌入式场景中,满足了数字信号处理等应用场景对乘累加操作溢出保护处理的要求。
  • 转换指令-202211637277.6
  • R·瓦伦丁;W·S·王;J·库姆斯;M·查尼 - 英特尔公司
  • 2022-12-16 - 2023-07-14 - G06F9/302
  • 本发明描述转换指令。描述了用于使用指令进行数据类型转换的技术。示例性指令包括用于以下各项的字段:操作码、源操作对象的标识和目的地操作对象的标识,其中操作码用于指示执行电路和/或存储器访问电路要进行:将来自所标识的源操作对象的32比特浮点值转换为16比特浮点值,以及将该16比特浮点值存储在所标识的目的地操作对象的数据元素位置中。
  • 一种应用于向量运算的浮点处理方法、系统、介质及设备-202310209993.2
  • 伍政学;郑泽锐;蔡显能;王荣丰;李晋;霍旭东;杜鹰;胡波 - 成都申威科技有限责任公司
  • 2023-03-07 - 2023-07-11 - G06F9/302
  • 本发明属于浮点计算领域,尤其涉及一种应用于向量运算的浮点处理方法、系统、介质及设备。该方法包括:获取待处理指令,增加发射队列的计数器;当发射队列的计数器不为0时,且发射接收单元准备好,根据待处理指令中的元素数量以及待处理指令的类别,按预设通道对与元素数量相对应的第一操作数进行发射,对第一操作数进行计算,生成执行结果,将执行结果放入结果队列中,增加结果队列的计数器;当结果队列的计数器不为0时,基于待处理指令的类别,将结果队列中的执行结果按类别进行整合;重复步骤1至步骤3直至完成所有待处理指令。通过本发明能够达到较高性能以及较小面积和较低功耗的效果。
  • 转换指令-202211603326.4
  • R·瓦伦丁;W·S·王;J·库姆斯;M·查尼 - 英特尔公司
  • 2022-12-13 - 2023-06-27 - G06F9/302
  • 本发明描述转换指令。描述了用于数据类型转换的技术。示例使用指令,该指令包括用于操作码、源操作对象位置标识和目的地操作对象位置标识的字段,其中操作码用于指示指令处理电路要进行:将来自所标识的源操作对象位置的16比特浮点值转换为32比特浮点值,以及将该32比特浮点值存储在所标识的目的地操作对象的一个或多个数据元素位置中。
  • 一种基于SVE指令集的池化层函数的高性能实现方法-202310132475.5
  • 全哲;谭言西 - 湖南大学
  • 2023-02-20 - 2023-05-05 - G06F9/302
  • 本申请公开了一种基于SVE指令集的池化层函数的高性能实现方法,其针对支持SVE指令集的Armv8、Armv9架构平台,采用interface接口‑driver驱动‑kernel汇编核心代码三层代码设计框架,使用循环展开,汇编级别流水线指令重排,SIMD向量化指令,双向循环展开等技术手段,实现了汇编级别的优化手段,并且提供了多线程的接口和可用于多线程的逻辑实现来获取线程化的优化。面对NHWC数据类型的池化操作,解决了编译器无法获得最佳性能的问题,提高了硬件的性能表现,与传统形式NHWC深度优先的池化相比,在x86上创建的Armv8.2虚拟机上仍可以达到2.67倍加速比。
  • 基于MT3000异构处理器的深度学习计算库实现方法-202310101112.5
  • 全哲;张程 - 湖南大学
  • 2023-02-13 - 2023-04-28 - G06F9/302
  • 本申请公开了一种基于MT3000异构处理器的深度学习计算库实现方法,属于深度学习技术领域。该方法针对天河新一代超级计算机异构处理器MT3000原型机,使用engine引擎‑stream数据流‑memory内存对象‑primitives原语四层设计框架,实现了一套完整的深度学习计算库,并针对该处理器的体系结构对卷积、池化、激活、归一化等深度学习常用算子进行计算优化,卷积算子相较于纯CPU版本实现最高加速比为7.56。
  • 一种数据处理方法、装置及处理器-202211634334.5
  • 郭伟 - 海光信息技术股份有限公司
  • 2022-12-15 - 2023-03-17 - G06F9/302
  • 本公开提供一种数据处理方法、装置及处理器,其中所述方法包括:读取单一数据特征计算硬件指令;对读取到的单一数据特征计算硬件指令进行解码;执行解码后的单一数据特征计算硬件指令,以完成至少3个以上数据的特征计算全过程。本公开提供的技术方案可适用于深度学习和人工智能技术中池化层实现池化算法的场景,能够很好地提高计算速度。
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top