[发明专利]一种执行卷积计算的系统及方法有效
申请号: | 201711366904.6 | 申请日: | 2017-12-18 |
公开(公告)号: | CN108205701B | 公开(公告)日: | 2021-12-28 |
发明(设计)人: | 蔡松芳;丛培贵;范博钧;赖守仁 | 申请(专利权)人: | 联发科技股份有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/063 |
代理公司: | 深圳市威世博知识产权代理事务所(普通合伙) 44280 | 代理人: | 何青瓦 |
地址: | 中国台湾新竹市*** | 国省代码: | 台湾;71 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 执行 卷积 计算 系统 方法 | ||
本发明提供一种以矩阵模式或者滤波器模式执行卷积计算的系统。分析模块生成模式选择信号,以基于分析卷积特征的结果而选择矩阵模式或者滤波器模式。该结果包括至少矩阵模式和滤波器模式之间的资源利用的比较。卷积模块包括多个处理元件,每个处理元件进一步包括算术计算电路。卷积模块用于根据矩阵模式执行自卷积计算转换而来的矩阵乘法,并用于根据滤波器模块执行卷积计算。本发明还提供了对应的方法。本发明能有效执行卷积计算,并提高资源利用率。
本申请主张在2016年12月20日提出的申请号为62/436,488号的美国临时专利申请的优先权,且上述美国专利申请整体以引用方式并入本文中。
技术领域
本发明的实施例涉及用于卷积计算(convolution computing)的计算机架构,更具体地,涉及一种执行卷积计算的系统及方法。
背景技术
在计算机视觉、语音识别、自然语言处理和生物信息学的领域中,深度学习以其优越的性能已得到广泛的认可。深度学习是机器学习的分支,其利用包含多个隐藏层的人工神经网络。称为卷积神经网络(convolutional neural network,CNN)的一种类型的人工神经网络由深度学习在大数据集上使用,例如,图像数据的大数据集。CNN已在图像应用中显现出良好的结果。例如,CNN可以被用在特征提取上。从输入端所接收的原始图像像素中,CNN可以在输出端为不同级别的特征生成分数。
CNN的计算工作量很大。CNN的核心计算为卷积,其涉及高阶嵌套环(high-ordernested loop)。对于特征提取,CNN在信道集(例如,红、绿和蓝)上对具有二维滤波器集的输入图像像素进行卷积,然后进行非线性计算、向下采样计算和级别分数计算。已经了解卷积计算对资源要求很高。除了CNN,卷积计算还经常用于解决科学问题和工程问题。因此,需要优化卷积计算以提高性能。
发明内容
本发明的目的在于,提供一种执行卷积计算的系统及方法,以解决上述问题。
在一个实施例中,提供了一种用于执行卷积计算的系统。该系统包括分析模块,其根据分析多个卷积特征的多个结果,生成模式选择信号以选择矩阵模式和滤波器模式中的一个。所述多个结果包括至少矩阵模式和滤波器模式之间的资源利用的比较。该系统还包括与所述分析模块耦接的卷积模块。该卷积模块包括多个处理元件,每个处理元件包括算术计算电路。所述卷积模块用于根据所述矩阵模式执行自多个卷积计算转换而来的多个矩阵乘法,并用于根据所述滤波器模式执行所述多个卷积计算。
在另一实施例中,提供了用于执行卷积计算的方法。该方法包括:卷积模块接收用于选择矩阵模式和滤波器模式中的一个的模式选择信号。所述模式选择信号是基于分析多个卷积特征的多个结果生成而来,所述多个卷积特征包括至少矩阵模式和滤波器模式之间的资源利用的比较。所述卷积模块包括多个处理元件,每个处理元件包括算术计算电路。该方法还包括:响应于选择所述矩阵模式,执行自多个卷积计算转换而来的多个矩阵乘法;以及响应于选择所述滤波器模式,执行所述多个卷积计算。
通过根据一个给定的CNN问题的特征而使用处理元件的配置和/或数据调度到处理元件,本发明实施例使得卷积计算有效,实施例的有益效果将在下文中详细解释。
本发明通过分析卷积特征,根据分析的结果产生模式选择信号以选择矩阵模式或滤波器模式,进而多个处理元件根据矩阵模式进行矩阵乘法,并根据滤波器模式进行卷积计算,有效执行卷积计算,并通过多个处理元件既进行矩阵乘法又进行卷积计算,提高资源利用率。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于联发科技股份有限公司,未经联发科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711366904.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:神经网络运算装置和方法
- 下一篇:一种多输入多输出矩阵卷积的并行处理方法