[发明专利]用于执行卷积运算的存储设备和方法有效
申请号: | 201580062941.0 | 申请日: | 2015-11-19 |
公开(公告)号: | CN107003988B | 公开(公告)日: | 2021-04-02 |
发明(设计)人: | E.埃雷罗阿韦利亚纳斯;G.图尔纳维蒂斯;F.C.普拉塔斯;M.卢庞;F.拉托雷;P.洛佩斯;A.J.福尔肯 | 申请(专利权)人: | 英特尔公司 |
主分类号: | G06F17/15 | 分类号: | G06F17/15;G06T1/60 |
代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 张凌苗;张涛 |
地址: | 美国加利*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 执行 卷积 运算 存储 设备 方法 | ||
1.一种执行卷积运算的装置,包括:
多个处理单元,所述多个处理单元用于对输入数据和部分结果执行卷积运算;
统一暂存器存储器,所述统一暂存器存储器包括通过多个读/写端口通信地耦合到所述多个处理单元的多个存储器组块,将所述多个存储器组块中的每个进行划分以存储输入数据和部分结果二者;
控制单元,所述控制单元用于将所述输入数据和部分结果分配给所述存储器组块,以根据指定数量的读/写端口和要执行的指定卷积运算来确保最低服务质量;
其中,将所述存储器组块中的每个在逻辑上划分成用于输入数据的第一区域和用于部分结果的第二区域,其中基于要执行的指定卷积运算来动态地调整分区的大小。
2.根据权利要求1所述的装置,其中,所述控制单元将所述输入数据和部分结果分配给所述存储器组块,以确保在每个处理周期中访问存储器组块的不同集合。
3.根据权利要求1所述的装置,其中,所述输入数据包括图像或矩阵,并且其中所述控制单元将映射所述图像/矩阵的每一行,因此针对所述处理单元在所述输入数据和部分结果上的每个相邻操作,每一行在不同的存储器组块中开始。
4.根据权利要求3所述的装置,其中,对于针对在给定周期中进行处理所需的图像或矩阵的N个元素的列,所述控制单元将分配所述输入数据和部分结果以确保所有N个元素在所述周期中都可以从不同存储器组块读取。
5.根据权利要求1所述的装置,其中,所述控制单元将所述输入数据和部分结果分配给所述存储器组块,以确保在指定卷积窗口内的所有输入数据和部分结果在每个处理周期上都对处理单元可用。
6.根据权利要求5所述的装置,其中,所述卷积窗口基于指定的滤波器大小和同时要处理的滤波器的实例的数量。
7.根据权利要求1所述的装置,其中,所述存储器组块中的每个包括单个读/写端口。
8.根据权利要求1所述的装置,还包括:
一个或多个部分写回缓冲器,用于在存储在所述多个存储器组块之一中之前临时缓冲由处理单元中的一个或多个生成的新的部分结果。
9.根据权利要求1所述的装置,还包括:
输入多路复用器,其通信地耦合以从输入/输出接口接收新的输入数据,所述输入多路复用器由所述控制单元控制以使所述输入数据对准并存储在指定的存储器组块中。
10.根据权利要求1所述的装置,还包括:
输出多路复用器,其通过处理单元接口通信地耦合到所述处理单元和所述存储器组块的读/写端口,所述输出多路复用器由控制单元控制以对准从所述存储器组块接收的输入数据和部分结果以及将所述输入数据和部分结果提供给一个或多个指定的处理单元。
11.一种方法,包括:
使用输入数据和部分结果在多个处理单元上执行卷积运算;
对统一暂存器存储器的多个存储器组块中的每个进行划分以存储所述输入数据和部分结果两者,所述多个存储器组块通过多个读/写端口通信地耦合到所述多个处理单元;
将所述输入数据和部分结果分配给所述存储器组块,以根据指定数量的读/写端口和要执行的指定卷积运算来确保最低服务质量;
其中,将所述存储器组块中的每个在逻辑上划分成用于输入数据的第一区域和用于部分结果的第二区域,其中基于要执行的指定卷积运算来动态地调整分区的大小。
12.根据权利要求11所述的方法,其中,将所述输入数据和部分结果分配给所述存储器组块,以确保在每个处理周期中访问存储器组块的不同集合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201580062941.0/1.html,转载请声明来源钻瓜专利网。