[发明专利]一种神经网络运算的加速方法、终端和存储介质在审
| 申请号: | 202111672418.3 | 申请日: | 2021-12-31 |
| 公开(公告)号: | CN116432719A | 公开(公告)日: | 2023-07-14 |
| 发明(设计)人: | 祝叶华;姜坤 | 申请(专利权)人: | OPPO广东移动通信有限公司 |
| 主分类号: | G06N3/063 | 分类号: | G06N3/063 |
| 代理公司: | 北京安信方达知识产权代理有限公司 11262 | 代理人: | 龙洪 |
| 地址: | 523860 广东*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 神经网络 运算 加速 方法 终端 存储 介质 | ||
1.一种神经网络运算的加速方法,应用于神经网络加速器,所述神经网络加速器支持logistics算子、最大池化算子、减法算子、ReLU算子、乘法算子,其特征在于,所述方法包括:
通过所述logistics算子处理输入元素序列,生成第一结果元素序列Ra;通过所述最大池化算子处理所述第一结果,生成第二结果元素序列Rb;
通过所述减法算子逐元素地执行1-(Rb-Ra)操作,输出第三结果元素序列;
通过所述ReLU算子对所述第三结果元素序列逐元素地执行ReLU操作,输出第四结果元素序列;以及
通过所述乘法算子对所述第一结果元素序列和第四结果元素序列执行逐元素相乘操作,输出第五结果元素序列。
2.如权利要求1所述的方法,其特征在于:
所述方法用于加速AON神经网络在所述神经网络加速器上的运算。
3.如权利要求2所述的方法,其特征在于:
所述AON神经网络包括equal算子和select算子,所述神经网络加速器不支持所述equal算子和select算子。
4.如权利要求3所述的方法,其特征在于:
所述方法基于对所述NPU硬件资源的软件配置来实现。
5.如权利要求2所述的方法,其特征在于:
所述Logistic算子用于实现所述AON神经网络的激活函数。
6.如权利要求1所述的方法,其特征在于:
所述通过所述减法算子逐元素地执行1-(Rb-Ra)操作,输出第三结果元素序列包括:
对所述第二结果和第一结果逐元素地执行Rb-Ra操作,输出第一子结果Rc;
对常数1序列和所述第一子结果逐元素地执行1-Rc操作,输出所述第三结果。
7.一种神经网络运算的加速方法,应用于神经网络加速器,所述神经网络加速器支持logistics算子、最大池化算子、量化算子、加法算子、ReLU算子、乘法算子,其特征在于,所述方法包括:
通过所述logistics算子处理输入元素序列,生成第一结果元素序列Ra;通过所述最大池化算子处理所述第一结果,生成第二结果元素序列Rb;
通过所述量化算子和加法算子逐元素地执行1-(Rb-Ra)操作,输出第三结果元素序列;
通过所述ReLU算子对所述第三结果元素序列逐元素地执行ReLU操作,输出第四结果元素序列;以及
通过所述乘法算子对所述第一结果元素序列和第四结果元素序列执行逐元素相乘操作,输出第五结果元素序列。
8.如权利要求7所述的方法,其特征在于:
所述通过所述量化算子和加法算子逐元素地执行1-(Rb-Ra)操作,输出第三结果元素序列,包括:
通过所述量化算子执行逐元素乘加操作Ra*(-1),并通过所述加法算子对所述量化算子的输出和所述第二结果执行逐元素相加操作Rb+Ra*(-1),输出所述第一子结果Rc;
通过所述量化算子执行逐元素乘加操作Rc*(-1),并通过所述加法算子对常数1序列和所述第一子结果执行逐元素相加操作1+Rc*(-1),输出所述第三结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于OPPO广东移动通信有限公司,未经OPPO广东移动通信有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111672418.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种数据处理方法、装置、设备以及可读存储介质
- 下一篇:一种有机电致发光器件





