[发明专利]一种基于宏指令集的卷积网络加速方法及装置在审
申请号: | 201810934301.X | 申请日: | 2018-08-16 |
公开(公告)号: | CN109086875A | 公开(公告)日: | 2018-12-25 |
发明(设计)人: | 方兴;杨宏斌;刘栩辰 | 申请(专利权)人: | 郑州云海信息技术有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 罗满 |
地址: | 450018 河南省郑州市*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 宏指令 卷积 网络加速器 网络 映射 调度 技术效果 加速装置 接收主机 神经网络 网络计算 应用场景 映射过程 解析 发送 | ||
本发明公开了一种基于宏指令集的卷积网络加速方法,基于卷积网络加速器,所述方法包括:接收主机发送的宏指令集;宏指令集中的每个宏指令中均包括执行不同操作的宏指令参数;通过解析宏指令集中的每个宏指令,实现卷积网络至卷积网络加速器的映射和调度。可见,本发明公开了卷积网络加速器的宏指令集,该宏指令集将卷积网络计算中的各个部分组成一条宏指令,从而实现了不同规格和不同类型的卷积网络到卷积网络加速器硬件的高效映射和调度,简化深度神经网络中卷积网络的映射过程,具有广泛的应用场景。本发明还公开了一种基于宏指令集的卷积网络加速装置,同样能实现上述技术效果。
技术领域
本发明涉及卷积网络加速技术领域,更具体地说,涉及一种基于宏指令集的卷积网络加速方法及装置。
背景技术
目前的神经网络加速器设计中,将卷积、池化、归一化等过程作为独立的部件对待,分别设计了独立的指令,多个部件的同时运行和乱序执行会导致调度复杂的问题,并增加了深度神经网络编译和映射的难度。
因此,如何如何简化神经网络中卷积网络的映射及调度过程,是本领域技术人员需要解决的问题。
发明内容
本发明的目的在于提供一种基于宏指令集的卷积网络加速方法及装置,以简化神经网络中卷积网络的映射及调度过程。
为实现上述目的,本发明实施例提供了如下技术方案:
一种基于宏指令集的卷积网络加速方法,基于卷积网络加速器,所述方法包括:
接收主机发送的宏指令集;所述宏指令集中的每个宏指令中均包括执行不同操作的宏指令参数;
通过解析所述宏指令集中的每个宏指令,实现卷积网络至卷积网络加速器的映射和调度。
其中,所述通过解析所述宏指令集中的每个宏指令,实现卷积网络至卷积网络加速器的映射和调度,包括:
根据宏指令的指令编码,确定宏指令的操作类型;
利用宏指令的操作类型以及宏指令的宏指令参数,实现卷积网络至卷积网络加速器的映射和调度。
其中,所述利用宏指令的操作类型以及宏指令的宏指令参数,实现卷积网络至卷积网络加速器的映射和调度,包括:
若所述操作类型为卷积计算宏指令,则控制卷积网络加速器的卷积网络加速器核,按照宏指令参数执行卷积操作、激活操作、池化操作、量化操作、归一化操作中的至少一者。
其中,所述利用宏指令的操作类型以及宏指令的宏指令参数,实现卷积网络至卷积网络加速器的映射和调度,包括:
若所述操作类型为数据操作指令,则利用DMA部件对宏指令参数中指定的地址空间执行数据操作;所述数据操作包括数据切分操作、数据连接操作、数据整形操作中的至少一者。
其中,所述利用宏指令的操作类型以及宏指令的宏指令参数,实现卷积网络至卷积网络加速器的映射和调度,包括:
若所述操作类型为主机交互指令,则利用卷积网络加速器的自身执行状态与主机执行交互操作。
一种基于宏指令集的卷积网络加速装置,基于卷积网络加速器,所述装置包括:
宏指令集接收模块,用于接收主机发送的宏指令集;所述宏指令集中的每个宏指令中均包括执行不同操作的宏指令参数;
执行模块,用于通过解析所述宏指令集中的每个宏指令,实现卷积网络至卷积网络加速器的映射和调度。
其中,所述执行模块,包括:
操作类型确定单元,用于根据宏指令的指令编码确定宏指令的操作类型;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑州云海信息技术有限公司,未经郑州云海信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810934301.X/2.html,转载请声明来源钻瓜专利网。