[发明专利]用于深度学习的可重构处理单元在审
申请号: | 202210483441.6 | 申请日: | 2022-04-29 |
公开(公告)号: | CN114780481A | 公开(公告)日: | 2022-07-22 |
发明(设计)人: | 陈松;蒋先阁;倪小兵;孙文迪 | 申请(专利权)人: | 中国科学技术大学 |
主分类号: | G06F15/78 | 分类号: | G06F15/78;G06N3/063 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 孙蕾 |
地址: | 230026 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 深度 学习 可重构 处理 单元 | ||
一种用于深度学习的可重构处理单元,包括:配置控制单元,用于接收来自外部总线的配置信息和总线命令,生成模式指令和控制指令,以及得到配置参数;先入先出存储器,接收外部数据和输出计算结果数据;多路选择器,将外部数据输入到算术逻辑单元或静态随机存储器;算术逻辑单元,利用配置参数,对外部数据进行计算,得到计算结果数据,并将计算结果数据输入到静态随机存储器或先入先出存储器;静态随机存储器,存储计算结果数据或外部数据,将所述计算结果数据或外部数据输出到算术逻辑单元,或将计算结果数据输出到所述先入先出存储器。
技术领域
本公开涉及网络装置领域,更具体地,涉及一种用于深度学习的可重构处理单元。
背景技术
随着计算机技术的发展,深度学习成为近几年的机器学习的研究热点之一,深度学习对于目标特征的训练和推理需要进行大量的数据运算,进行深度学习计算运算的处理器的主要有通用处理器(GPP,General-Purpose Processor)、专用集成电路(ASIC,Application Specific Integrated Circuit)等。常见的深度学习的算子主要有卷积、池化、激活函数等。
GPP可以应对各种类型的计算应用,包括数学方面和逻辑方面的运算,但是GPP不能充分利用算法并行性对数据进行处理;ASIC是应对特定用户要求和特定电子系统的需要而设计、制造的集成电路,设计周期长、设计成本高。可重构处理器是一种将一定数量的处理单元通过特定连接方式连接的可以实现对不同的算法进行并行处理的处理结构,可重构处理器研究中,按照可重构粒度主要可以分为细粒度和粗粒度两种,细粒度可重构处理器通用性高,但是在计算过程中,细粒度可重构处理器配置时间过长、无法满足在一些实时性应用中动态实时性配置的需求。
发明内容
有鉴于此,本公开提供了一种用于深度学习的可重构处理单元,包括:
配置控制单元,用于接收来自外部总线的配置信息和总线命令,并根据上述配置信息和总线命令生成模式指令和控制指令,以及得到配置参数。
先入先出存储器,用于根据上述控制指令,接收外部数据和输出计算结果数据。
多路选择器,用于根据上述模式指令和控制指令,将上述外部数据输入到算术逻辑单元或静态随机存储器。
算术逻辑单元,响应于上述控制信息,利用上述配置参数,对来自多路选择器或静态随机存储器的上述外部数据进行计算,得到8比特数据精度或16比特数据精度的计算结果数据,并将计算结果数据输入到上述静态随机存储器或上述先入先出存储器。
以及,静态随机存储器,响应于上述模式指令和控制指令,用于存储来自上述算术逻辑单元产生的计算结果数据或上述外部数据,将上述计算结果数据或外部数据输出到上述算术逻辑单元,或将上述计算结果数据输出到上述先入先出存储器。
根据本公开的实施例,上述配置控制单元包括:
配置寄存器,用于接收来自外部总线的配置信息,生成上述模式指令。
以及,控制器,用于接收来自外部总线的总线命令,生成上述使能信号。
上述配置寄存器还用于根据来自上述控制器的使能信号,基于配置信息得到上述配置参数。
以及,上述控制器还用于根据响应于上述模式指令,基于配置信息得到上述控制指令。
根据本公开的实施例,上述配置寄存器包括:单元模式寄存器、行寄存器、列寄存器、池化模式寄存器、通道寄存器、量化寄存器。
上述单元模式寄存器接收来自外部总线的配置信息,根据上述配置信息生成模式指令,上述模式指令包含卷积模式指令和池化模式指令。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学技术大学,未经中国科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210483441.6/2.html,转载请声明来源钻瓜专利网。