[发明专利]资源动态分配型神经网络芯片的构架、方法和设备有效
| 申请号: | 202210914053.9 | 申请日: | 2022-08-01 |
| 公开(公告)号: | CN114968602B | 公开(公告)日: | 2022-10-21 |
| 发明(设计)人: | 贺新 | 申请(专利权)人: | 成都图影视讯科技有限公司 |
| 主分类号: | G06F9/50 | 分类号: | G06F9/50;G06F9/54;G06N3/04;G06N3/063;G06N3/08 |
| 代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 孙朝锐 |
| 地址: | 610000 四川省成都*** | 国省代码: | 四川;51 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 资源 动态分配 神经网络 芯片 构架 方法 设备 | ||
本申请实施例公开了一种资源动态分配型神经网络芯片的构架、方法和设备,涉及人工智能技术领域。该资源动态分配型神经网络芯片的构架包括:数据输入缓存模块,数据输出缓存模块,片上资源优化模块和片上资源分配模块,该资源动态分配型神经网络芯片的构架由于设置了片上资源优化模块,因此,可以根据神经网络配置参数获得在不同资源配置方式下的时间数组,由于时间数组可以反映不同资源配置方式下的运行效率,因此,根据时间数组,确定目标资源配置方式可以是较优的资源配置方式,按照目标资源配置方式进行数据处理自然可以提高芯片的数据处理效率。
技术领域
本申请涉及人工智能技术领域,尤其涉及一种资源动态分配型神经网络芯片的构架、方法和设备。
背景技术
神经网络,英文全称为Artificial Neural Network, 缩写ANN, 在机器学习,尤其是深度学习领域广泛应用。无论是SOC、GPU、ASIC构架的集成电路芯片,在设计初期首先明确芯片的设计框架及具体实现的成本、功能与方法,在具体设计过程中的确定各种控制、运算及存储单元的种类与数量,芯片设计完成后交由芯片代工厂按设计工艺进行生产制造,最终交付用户使用。芯片设计完成后,芯片内部可利用计算资源皆已固定,如何在芯片有限资源下提高神经网络数据处理效率已成为急需解决的技术问题。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本申请的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本申请实施例提供了一种资源动态分配型神经网络芯片的构架、方法和设备,有效提高神经网络的数据处理效率。
一方面,本申请实施例提供了一种资源动态分配型神经网络芯片的构架,包括:
数据输入缓存模块,用于缓存片上数据总线的第一神经网络数据并将所述第一神经网络数据发送给神经网络计算执行模块;
数据输出缓存模块,用于缓存所述神经网络计算执行模块处理后的第二神经网络数据,并将所述第二神经网络数据发送给所述片上数据总线;
片上资源优化模块,用于根据神经网络配置参数在不同资源配置方式下的不同参数值,获得在不同资源配置方式下的若干第一时间数组;基于若干所述第一时间数组,获得若干第二时间数组;并基于若干所述第二时间数组,确定目标资源配置方式;其中,所述第一时间数组包括从外部存储模块读取分片数据的第一时间和计算分片数据所需的第二时间,所述第二时间数组包括所有数据的读取占用所述片上数据总线的第三时间和计算当前网络层所有数据所消耗的第四时间;
片上资源分配模块,用于根据所述目标资源配置方式,配置所述数据输入缓存模块、所述神经网络计算执行模块和所述数据输出缓存模块。
可选地,所述神经网络配置参数包括固定参数和可配置参数;所述片上资源优化模块,还用于根据固定参数以及在不同资源配置方式下的若干组可配置参数值,获得若干第一时间数组。
可选地,所述第一神经网络数据和所述第二神经网络数据均为图像数据。
可选地,所述固定参数,包括:
输入图像数据宽度,输入图像数据高度;
输入数据通道数,输出数据通道数;
滤波器大小;
片上并行计算单元数量以及计算单元组数;
片上计算结果缓存大小;
外部存储模块批量数据读写长度;
片上数据交换损失时间。
可选地,所述可配置参数包括:实际输入图像宽度、实际输入图像高度和图像数据缓存组数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都图影视讯科技有限公司,未经成都图影视讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210914053.9/2.html,转载请声明来源钻瓜专利网。





