[发明专利]一种基于张量切分的张量处理方法和张量处理系统在审
申请号: | 202110823040.6 | 申请日: | 2021-07-21 |
公开(公告)号: | CN113485836A | 公开(公告)日: | 2021-10-08 |
发明(设计)人: | 李国亮;张磊;杨勤富;钱军 | 申请(专利权)人: | 瀚博半导体(上海)有限公司 |
主分类号: | G06F9/50 | 分类号: | G06F9/50 |
代理公司: | 上海市金茂律师事务所 31299 | 代理人: | 彭世明;王翠平 |
地址: | 201210 上海市浦东新区中国(上海)自由贸*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 张量 切分 处理 方法 系统 | ||
本申请提供一种基于张量切分的张量处理方法和系统,该方法包括:确定用于对原始张量进行处理的多个操作算子中的目标算子;将相邻的至少两个目标算子组合为目标子图,其中所有目标算子与已组合的目标算子之差集为剩余目标算子;基于所述目标子图及其他算子,按原顺序对所述原始张量执行相应处理,所述其他算子为已组合的目标算子以外的其他操作算子。本申请能够明显提升对大尺寸张量进行复杂运算的效率。
技术领域
本申请涉及计算机信息处理领域,尤其涉及一种基于张量切分的张量 处理方法。
背景技术
近几年来,计算机系统处理能力取得了巨大发展。在某些情况下(例 如处理深度学习神经网络时),会涉及二维或更高维张量的卷积计算。以 二维张量为例,在实际计算时,二维张量的某些参数有时可能会超出硬件 加速器的相关限制,例如张量的高度或宽度可能超出加速器的相应限制, 或者加速器对片上内存、可用的计算资源等可能会进行限制。这些限制都 制约了对大尺寸张量的处理。
为了解决上述问题,为了在上述限制存在的情况下对大尺寸张量进行 预定处理,可以将大尺寸张量进行切分(例如将二维/三维张量在高度上切 分为若干部分),再分别对切分获得的各个部分进行前述预定处理,最后 将各部分的处理结果进行拼接,以获得对原大尺寸张量进行预定处理的处 理结果。一般而言,若需要依次对大尺寸张量进行若干次类似的处理,则 需要在每次处理前切分大尺寸张量,并在处理后将处理结果合并,以供后 续处理。
发明内容
本申请的一个目的是提供一种基于张量切分的张量处理方法和张量 处理系统。
根据本申请的一个方面,本申请提供了一种基于张量切分的张量处理 方法,该方法包括以下步骤:
确定用于对原始张量进行处理的多个操作算子中的目标算子;
将相邻的至少两个目标算子组合为目标子图,其中所有目标算子与已 组合的目标算子之差集为剩余目标算子;以及,
基于所述目标子图及其他算子,按原顺序对所述原始张量执行相应处 理,所述其他算子为已组合的目标算子以外的其他操作算子,其中所述 目标子图以及所述剩余目标算子的输入张量分别经切分后输入。
根据本申请的另一方面,本申请提供了一种基于张量切分的张量处理 系统,该系统至少包括:
目标子图获取装置,用于获取包括至少两个目标算子的目标子图,其 中所述目标子图获取装置被配置为:
确定用于对原始张量进行处理的多个操作算子中的目标算子;以及,
将相邻的至少两个目标算子组合为目标子图,其中所有目标算子与已 组合的目标算子之差集为剩余目标算子;
以及,
张量处理装置,用于基于所述目标子图处理所述原始张量,其中所述 张量处理装置被配置为:
基于所述目标子图及其他算子,按原顺序对所述原始张量执行相应处 理,所述其他算子为已组合的目标算子以外的其他操作算子,其中所述目 标子图以及所述剩余目标算子的输入张量分别经切分后输入。
根据本申请的另一方面,本申请提供了一种计算机可读存储介质,该 计算机可读存储介质上存储有计算机程序,所述计算机程序被执行时能够 实现以上所述的张量处理方法。
根据本申请的另一方面,本申请提供了一种电子设备,该电子设备至 少包括:
一个或多个处理器;
存储器,其用于存储可执行指令;
所述一个或多个处理器被配置为经由所述可执行指令来实现以上所 述的张量处理方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于瀚博半导体(上海)有限公司,未经瀚博半导体(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110823040.6/2.html,转载请声明来源钻瓜专利网。