[发明专利]计算装置及其卷积数据的共享机制在审
申请号: | 202211491657.3 | 申请日: | 2022-11-25 |
公开(公告)号: | CN115796251A | 公开(公告)日: | 2023-03-14 |
发明(设计)人: | 李超;朱炜;林博 | 申请(专利权)人: | 星宸科技股份有限公司 |
主分类号: | G06N3/063 | 分类号: | G06N3/063;G06N3/0464 |
代理公司: | 深圳紫藤知识产权代理有限公司 44570 | 代理人: | 黄灵飞 |
地址: | 361199 福建*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 计算 装置 及其 卷积 数据 共享 机制 | ||
本申请实施例公开了一种计算装置及其卷积数据的共享机制。计算装置耦接一外部存储器且包括一第一计算核心以及一第二计算核心。第一计算核心包括一广播电路,且用来从该外部存储器取得一目标数据、将该目标数据储存至该广播电路,以及使用该目标数据进行卷积运算。第二计算核心用来从该广播电路读取该目标数据,并且使用该目标数据进行卷积运算。
技术领域
本申请涉及计算装置,具体涉及人工智能(Artificial Intelligence,AI)加速器的计算核心或卷积核心的卷积数据的共享机制。
背景技术
随着深度学习理论的进步,神经网络在机器学习和认知科学领域得到快速发展及应用。无论网络的种类(如卷积神经网络(Convolutional Neural Network,CNN)、循环神经网络(Recurrent Neural Network,RNN))还是网络的层数(如8层的AlexNet网络、152层的ResNet网络),其发展现状都达到了前所未有的高度。相应的,网络计算的复杂度也指数级升高,对人工智能加速器的计算能力提升产生了更多挑战。
为应对快速增长的计算复杂度,许多AI加速器在计算能力达到瓶颈后开始向多核方向发展。然而由于存储器频宽的限制,导致多核加速器也难以有效利用计算能力资源。
发明内容
鉴于先前技术的不足,本申请实施例提供一种计算装置及其计算核心,以改善先前技术的不足。
本申请实施例提供一种计算装置。该计算装置耦接一外部存储器且包括一第一计算核心以及一第二计算核心。第一计算核心包括一广播电路,且用来从该外部存储器取得一目标数据、将该目标数据储存至该广播电路,以及使用该目标数据进行卷积运算。第二计算核心用来从该广播电路读取该目标数据,并且使用该目标数据进行卷积运算。
本申请实施例还提供一种计算核心。该计算核心耦接一外部存储器。该外部存储器储存一目标数据。该计算核心包括一存储器以及一卷积核心。存储器用来储存该目标数据。卷积核心包括一广播电路及一乘积累加运算电路。卷积核心从该存储器读取该目标数据、将该目标数据储存至该广播电路,并且将该目标数据提供给该乘积累加运算电路。
本申请实施例所体现的技术手段可以改善先前技术的缺点的至少其中之一,因此本申请相较于先前技术可以降低计算装置对存储器频宽的需求。
有关本申请的特征、实作与功效,兹配合图式作实施例详细说明如下。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的计算装置的功能方块图;
图2是本申请实施例提供的卷积核心的较详细的功能方块图;
图3是本申请实施例提供的广播电路的功能方块图;
图4是本申请实施例提供的数据加载电路的功能方块图;
图5是本申请实施例提供的数据加载电路的状态机;
图6是本申请实施例提供的权重加载电路的功能方块图;
图7是本申请实施例提供的权重加载电路的状态机;
图8是本申请实施例提供的计算装置的另一功能方块图;以及
图9是本申请实施例提供的计算装置的又一功能方块图。
【符号说明】
100:计算装置
110:外部存储器
120:存储器总线
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于星宸科技股份有限公司,未经星宸科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211491657.3/2.html,转载请声明来源钻瓜专利网。