[发明专利]乘累加处理器有效
申请号: | 201811311471.9 | 申请日: | 2018-11-06 |
公开(公告)号: | CN109669666B | 公开(公告)日: | 2022-12-16 |
发明(设计)人: | 刘勇攀;岳金山;刘若洋;袁哲;孙文钰;李学清;杨华中 | 申请(专利权)人: | 清华大学 |
主分类号: | G06F7/525 | 分类号: | G06F7/525;G06N3/04 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 王莹;吴欢燕 |
地址: | 100084 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明实施例提供一种乘累加处理器,包括:乘累加阵列包括阵列式排列的多个乘累加单元;存储器为转置静态随机访问存储器,用于存储第一变换域序列;串并行转换模块,用于从存储器中获取第一变换域序列中第m个位置的数据,将获取的第一变换域序列中第m个位置的数据分别输入对应的乘累加阵列中的各行;乘累加单元,用于根据输入乘累加单元所在行的第一变换域序列中第m个位置的数据和输入乘累加单元所在列的第二变换域序列中的数据进行乘累加。本发明实施例提供的乘累加处理器,实现了数据的复用,减少了对存储器中数据的读取次数,能提高数据处理效率、降低乘累加处理器的功耗。 | ||
搜索关键词: | 累加 处理器 | ||
【主权项】:
1.一种乘累加处理器,其特征在于,包括:存储器、串并行转换模块和乘累加阵列;所述乘累加阵列包括阵列式排列的多个乘累加单元;所述存储器为转置静态随机访问存储器,用于存储第一变换域序列;所述串并行转换模块,用于从所述存储器中获取第一变换域序列中第m个位置的数据,将获取的第一变换域序列中第m个位置的数据分别输入对应的所述乘累加阵列中的各行;所述乘累加单元,用于根据输入所述乘累加单元所在行的第一变换域序列中第m个位置的数据和输入所述乘累加单元所在列的第二变换域序列中的数据进行乘累加;其中,所述第一变换域序列包括M个位置的数据,M表示第一变换域序列的数据位宽;m=1,2,…,M。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811311471.9/,转载请声明来源钻瓜专利网。
- 同类专利
- 基于位串行结构的booth4乘法器的设计-202211153379.0
- 王忆文;程筱舒;丁玮然;李平 - 电子科技大学
- 2022-09-20 - 2023-05-16 - G06F7/525
- 深度神经网络中大量的乘累加单元都需要用到乘法器和加法器。随着人工智能芯片对性能的要求逐步上升,将功耗和面积降下去迫在眉睫。位串行结构由于其占用面积小,全部的硬件利用率,工作频率高等特性而被受瞩目。本发明具体涉及一种基于位串行结构的booth4乘法器的设计,主要由一个最低有效位乘法器单元、一个最高有效位乘法器单元和若干个中间乘法器单元级联组成。位串行技术所带来的速率过慢的影响,将利用booth编码技术来进行一定程度上的弥补。本发明考虑到各种基本的逻辑门结构的优势与劣势,会从门级结构进行自底向上的搭建。该位串行booth4乘法器除了有比并行乘法器面积小的特点,在功耗上也优于原来的位串行乘法器。
- 用于数据计算的MAC阵列-202310012131.0
- 孙猛;梁喆;胡文静;靳馥华 - 爱芯元智半导体(上海)有限公司
- 2023-01-05 - 2023-04-18 - G06F7/525
- 本公开提出一种用于数据计算的MAC阵列,包括:多个阵列单元,每个阵列单元包括:多个子MAC模块、第一移位器和第一加法器;其中,第一个子MAC模块的第一端与第一加法器的第一端连接,第二个子MAC模块的第一端与第一移位器的第一端连接,第一移位器的第二端与第一加法器的第二端连接,第一加法器的输出端作为阵列单元的输出端;第一移位器用于实现第二个子MAC模块输出数据的移位;第一加法器用于实现第一个子MAC模块输出数据和第一移位器输出数据相加。由此,通过对数据的拆分、移位累加,实现MAC阵列支持混合精度数据格式,从而不仅可以根据目标数据格式对MAC阵列进行配置,还降低了MAC阵列的功耗。
- 乘累加处理器-201811311471.9
- 刘勇攀;岳金山;刘若洋;袁哲;孙文钰;李学清;杨华中 - 清华大学
- 2018-11-06 - 2022-12-16 - G06F7/525
- 本发明实施例提供一种乘累加处理器,包括:乘累加阵列包括阵列式排列的多个乘累加单元;存储器为转置静态随机访问存储器,用于存储第一变换域序列;串并行转换模块,用于从存储器中获取第一变换域序列中第m个位置的数据,将获取的第一变换域序列中第m个位置的数据分别输入对应的乘累加阵列中的各行;乘累加单元,用于根据输入乘累加单元所在行的第一变换域序列中第m个位置的数据和输入乘累加单元所在列的第二变换域序列中的数据进行乘累加。本发明实施例提供的乘累加处理器,实现了数据的复用,减少了对存储器中数据的读取次数,能提高数据处理效率、降低乘累加处理器的功耗。
- 基于磁隧道结计算单元的模拟域全精度存内计算电路及方法-202211033693.5
- 崔佳乐;孙澜洋;蔡浩 - 东南大学
- 2022-08-26 - 2022-11-25 - G06F7/525
- 本发明公开了一种基于磁隧道结计算单元的模拟域全精度存内计算电路及方法,包括3晶体管2磁隧道结(3T2M)的磁性随机存储器(MRAM)计算阵列、脉冲产生电路、时序控制电路、累加电路、多路选择器、输入敏感并行模拟/数字转换器(Flash ADC)、使能信号产生电路以及数字移位累加器。该发明存内计算模式下利用3T2M计算单元实现内置乘法操作并通过两个互补磁隧道结(MTJ)提高计算单元良率,基于基尔霍夫电流定律,使用并联晶体管和电容实现累加操作。相比传统的冯诺依曼架构加速器和已有的MRAM模拟域存内计算架构,本发明能够有效适配稀疏向量矩阵乘累加操作,降低功耗开销,提升电路能效。
- 一种基于2D脉动阵列的通用稀疏矩阵乘法实现方法及装置-202210847492.2
- 文梅;汤珉琎;杨靖奎;王淇;曹亚松;沈俊忠;杨建超;费佳伟;郭阳;刘胜 - 中国人民解放军国防科技大学
- 2022-07-19 - 2022-11-11 - G06F7/525
- 本发明公开了一种基于2D脉动阵列的通用稀疏矩阵乘法实现方法及装置,本发明方法中在2D脉动阵列中每一个处理单元的处理步骤包括:先加载压缩矩阵C*,再接收输入的压缩矩阵A*、压缩矩阵B*,各压缩矩阵均采用索引和数值的格式记录;判断压缩矩阵A*或B*的索引为零则直接传递压缩矩阵A*和B*,否则拼接得到拼接索引,若和压缩矩阵C*的索引相同则计算A*×B*+C*并传递矩阵A*和矩阵B*,若不相同计算A*×B*并传递矩阵A*和矩阵B*。本发明可加速脉动阵列上的稀疏矩阵乘法,可以有效地处理稀疏矩阵乘法,确保在不同资源限制下的有效性、效率和性能。
- 基于二次剩余的低成本RFID认证协议的乘法器-201611169105.5
- 董庆宽;李军辉;樊凯;薄星;吴克强;陶雅欣 - 西安电子科技大学
- 2016-12-16 - 2019-03-26 - G06F7/525
- 本发明提出了一种基于二次剩余的低成本RFID认证协议的乘法器,用于解决现有的公钥密码运算中大数模乘硬件资源功耗大和安全性差的技术问题,包括乘法单元、移位单元和求和单元,乘法单元包括至少并联的四个16位乘法器,每个乘法器依次连接32位加法器和16×n的移位寄存器,其前两个16×n位移位寄存器之间连接有第一16位加法器,该第一16位加法器的输出端与第三个16×n位移位寄存器之间连接有第二16位加法器,该第二16位加法器的输出端与第四个16×n位移位寄存器之间连接有第三16位加法器;移位单元包括依次相连的16位移位寄存器、1位移位寄存器、并行排列的内存RAM1及内存RAM2和第四16位加法器;求和单元采用一个16位加法器。
- 基于循环左移的准循环矩阵串行乘法器-201310138839.7
- 张鹏;刘志文;张燕 - 荣成市鼎通电子信息科技有限公司
- 2013-04-19 - 2013-08-28 - G06F7/525
- 本发明提供了一种基于循环左移的准循环矩阵串行乘法器,用于实现QC-LDPC近似下三角编码中向量m与准循环矩阵F的乘法运算,该乘法器包括u个预先存储矩阵F中循环矩阵生成多项式的生成多项式查找表、u个对向量m数据比特和生成多项式进行标量乘的b位二进制乘法器、u个对乘积和移位寄存器内容进行模2加的b位二进制加法器、u个存储被循环左移1位的和的b位移位寄存器。本发明提供的准循环矩阵串行乘法器具有寄存器少、结构简单、功耗小、成本低等优点。
- 基于循环左移的CMMB中准循环矩阵串行乘法器-201310136709.X
- 张鹏;刘志文;张燕 - 荣成市鼎通电子信息科技有限公司
- 2013-04-19 - 2013-08-28 - G06F7/525
- 本发明提供了一种基于循环左移的CMMB中准循环矩阵串行乘法器,用于实现CMMB标准多码率QC-LDPC近似下三角编码中向量m与准循环矩阵F的乘法运算,该乘法器包括5个预先存储所有码率矩阵F中循环矩阵生成多项式的生成多项式查找表、5个对向量m数据比特和生成多项式进行标量乘的256位二进制乘法器、5个对乘积和移位寄存器内容进行模2加的256位二进制加法器、5个存储被循环左移1位的和的256位移位寄存器。本发明提供的准循环矩阵串行乘法器兼容所有码率,具有寄存器少、结构简单、功耗小、成本低等优点。
- 基于共享存储机制的准循环矩阵串行乘法器-201310136715.5
- 张鹏;刘志文;张燕 - 荣成市鼎通电子信息科技有限公司
- 2013-04-19 - 2013-08-28 - G06F7/525
- 本发明提供了一种基于共享存储机制的准循环矩阵串行乘法器,用于实现QC-LDPC近似下三角编码中向量m与准循环矩阵F的乘法运算,该乘法器包括1个预先存储矩阵F中循环矩阵生成多项式的生成多项式查找表、1个滑动存储向量m数据比特的u位延时器、u个缓存生成多项式的b位缓冲器、u个对向量m数据比特和生成多项式进行标量乘的b位二进制乘法器、u个对乘积和移位寄存器内容进行模2加的b位二进制加法器、u个存储被循环左移1位的和的b位移位寄存器。本发明提供的准循环矩阵串行乘法器具有功耗小、结构简单、存储器消耗少、成本低等优点。
- 无乘法运算的深空通信中准循环矩阵串行乘法器-201310136712.1
- 张鹏;刘志文;张燕 - 荣成市鼎通电子信息科技有限公司
- 2013-04-19 - 2013-08-21 - G06F7/525
- 本发明提供了一种无乘法运算的深空通信中准循环矩阵串行乘法器,用于实现CCSDS深空通信标准多码类QC-LDPC近似下三角编码中向量m与准循环矩阵F的乘法运算,该乘法器包括4个预先存储所有码类矩阵F中循环矩阵生成多项式及2048位零向量的生成多项式查找表、4个对生成多项式查找表输出和移位寄存器内容进行模2加的2048位二进制加法器、4个存储被循环左移1位的和的2048位移位寄存器。本发明提供的准循环矩阵串行乘法器兼容所有码类,去除了乘法运算,具有逻辑资源少、结构简单、功耗小、成本低等优点。
- 基于循环左移的DTMB中准循环矩阵串行乘法器-201310138840.X
- 张鹏;刘志文;张燕 - 荣成市鼎通电子信息科技有限公司
- 2013-04-19 - 2013-08-07 - G06F7/525
- 本发明提供了一种基于循环左移的DTMB中准循环矩阵串行乘法器,用于实现DTMB标准多码率QC-LDPC近似下三角编码中向量m与准循环矩阵F的乘法运算,该乘法器包括3个预先存储所有码率矩阵F中循环矩阵生成多项式的生成多项式查找表、3个对向量m数据比特和生成多项式进行标量乘的127位二进制乘法器、3个对乘积和移位寄存器内容进行模2加的127位二进制加法器、3个存储被循环左移1位的和的127位移位寄存器。本发明提供的准循环矩阵串行乘法器兼容所有码率,具有寄存器少、结构简单、功耗小、成本低等优点。
- 专利分类