[发明专利]融合神经网络的装置、板卡、方法及可读存储介质在审
| 申请号: | 202011043888.9 | 申请日: | 2020-09-28 |
| 公开(公告)号: | CN114330676A | 公开(公告)日: | 2022-04-12 |
| 发明(设计)人: | 不公告发明人 | 申请(专利权)人: | 中科寒武纪科技股份有限公司 |
| 主分类号: | G06N3/063 | 分类号: | G06N3/063;G06N3/04;G06N3/08;G06K9/62;G06V10/80 |
| 代理公司: | 北京维昊知识产权代理事务所(普通合伙) 11804 | 代理人: | 李波;孙新国 |
| 地址: | 100191 北京市海淀区*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 融合 神经网络 装置 板卡 方法 可读 存储 介质 | ||
1.一种融合神经网络的集成电路装置,包括:
处理装置,用以根据融合策略选择起始层,并建立模板融合单元;以及
计算装置,用以根据所述模板融合单元执行神经网络计算;
其中,所述起始层为除卷积层及池化层之外的层。
2.根据权利要求1所述的集成电路装置,其中所述起始层为元素对元素层。
3.根据权利要求2所述的集成电路装置,其中所述起始层为基本运算层、进阶运算层、三角函数运算层、取整运算层及激活层其中之一。
4.根据权利要求1所述的集成电路装置,其中所述起始层为添加填充层。
5.根据权利要求1所述的集成电路装置,其中所述起始层为自定义层。
6.根据权利要求1所述的集成电路装置,其中所述融合策略为所述起始层为所述神经网络中最前未被融合的层。
7.根据权利要求1所述的集成电路装置,其中所述融合策略为当所述神经网络包括块结构时,所述处理装置判断所述块结构中的最前层是否为除卷积层及池化层之外的层,如是,所述处理装置选择所述最前层为所述起始层,所述模板融合单元包括所述块结构。
8.根据权利要求7所述的集成电路装置,其中当所述处理装置判断所述最前层为卷积层及池化层其中之一时,向前选择最接近所述最前层的除卷积层及池化层之外的层为所述起始层,所述模板融合单元包括所述块结构。
9.根据权利要求7所述的集成电路装置,其中当所述处理装置判断所述最前层为卷积层及池化层其中之一时,向后选择最接近所述最前层的除卷积层及池化层之外的层为所述起始层。
10.根据权利要求1所述的集成电路装置,其中所述计算装置包括多个集群,每个集群包括共享存储单元,所述处理装置判断特征图所需存储空间是否大于所述共享存储单元的可用空间,如是,所述处理装置拆分所述特征图为片上单元图,所述片上单元图的大小不大于所述共享存储单元的可用空间。
11.根据权利要求10所述的集成电路装置,其中所述特征图包括N、H、W、C维度,所述处理装置在所述N、H、W、C维度其中之一进行特定粒度的拆分。
12.根据权利要求11所述的集成电路装置,其中所述C维度为输出通道参数。
13.根据权利要求12所述的集成电路装置,其中每个集群还包括多个处理器核,每个处理器核包括权值存储单元,所述融合策略为所述片上单元图涉及的权值所需存储空间除以所述处理器核的数量不大于所述权值存储单元的可用空间,当所述处理装置判断所述融合策略未被满足时,所述处理装置减少所述片上单元图的大小。
14.根据权利要求10所述的集成电路装置,其中所述融合策略为拆分成所述片上单元图所产生的冗余总和不超出百分比阈值,当所述处理装置判断所述融合策略未被满足时,所述处理装置停止融合。
15.根据权利要求14所述的集成电路装置,其中所述规则为:
其中,sizeTFU为所述冗余总和,sizeori为所述片上单元图的数据量。
16.根据权利要求10所述的集成电路装置,其中当所述处理装置判断所述特征图所需存储空间不大于所述共享存储单元的可用空间时,所述处理装置还分析所述共享存储单元的可用空间可以容纳多少特征图,可以容纳的所有特征图的集合为所述片上单元图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中科寒武纪科技股份有限公司,未经中科寒武纪科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011043888.9/1.html,转载请声明来源钻瓜专利网。





