[发明专利]卷积神经网络的量化感知训练方法、卷积神经网络结构在审
| 申请号: | 202111304007.9 | 申请日: | 2021-11-05 |
| 公开(公告)号: | CN114118363A | 公开(公告)日: | 2022-03-01 |
| 发明(设计)人: | 杨敏;艾国;杨作兴;房汝明;向志宏 | 申请(专利权)人: | 杭州研极微电子有限公司 |
| 主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08 |
| 代理公司: | 北京德琦知识产权代理有限公司 11018 | 代理人: | 谢安昆;宋志强 |
| 地址: | 310051 浙江省杭州市滨江*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 卷积 神经网络 量化 感知 训练 方法 结构 | ||
1.一种卷积神经网络的量化感知训练方法,其特征在于,该方法包括,
对第一卷积神经网络进行样本训练,其中,第一卷积神经网络中至少一个卷积层包括有可合并分支结构和至少一个第一直连分支,
在训练后的第一卷积神经网络至少一个卷积层中存在至少一个第一直连分支,将卷积层中除第一直连分支之外的可合并分支结构进行合并,得到具有第一直连分支结构的第二卷积神经网络;
基于第二卷积神经网络进行量化感知训练。
2.如权利要求1所述的量化感知训练方法,其特征在于,所述第一直连分支为在第一卷积神经网络中增加的直连分支,和/或,所述可合并分支结构中的既有直连分支。
3.如权利要求1所述的量化感知训练方法,其特征在于,若所述第一直连分支为在第一卷积神经网络中增加的直连分支,所述第一直连分支按照如下方式增加:
对于第一卷积神经网络中至少一个具有相同输入数据维度与输出数据维度的卷积层,将与本卷积层相邻的上一卷积层的输出结果作为本卷积层的至少一个第一直连分支,与本卷积层激活函数运算的输出结果进行本卷积层的第一累加运算,将该第一累加运算结果输入至与本卷积层相邻的下一卷积层。
4.如权利要求3所述的量化感知训练方法,其特征在于,所述第一直连分支的增加方式进一步包括,
将本卷积层的输出结果作为与本卷积层相邻的下一卷积层的至少一个第一直连分支,与所述下一卷积层激活函数运算的输出结果进行所述下一卷积层的第一累加运算,将该第一累加运算结果输入至与所述下一卷积层相邻的下一卷积层,
以此递推,直至最后一个卷积层,使得第一卷积神经网络中具有相同输入数据维度与输出数据维度的每个卷积层均增加第一直连分支结构。
5.如权利要求4所述的量化感知训练方法,其特征在于,所述上一卷积层的输出结果为:所述上一卷积层中用于将激活函数运算的结果与该卷积层中的第一直连分支进行第一累加运算的输出结果,
所述本卷积层的输出结果为:本卷积层中用于将激活函数运算的结果与该卷积层中的第一直连分支进行第一累加运算的输出结果。
6.如权利要求4所述的量化感知训练方法,其特征在于,所述上一卷积层的输出结果为:所述上一卷积层中用于将卷积运算的输出结果与可合并分支进行第二累加运算的输出结果,
所述本卷积层的输出结果为:所述本卷积层中用于将卷积运算结果与可合并分支进行第二累加运算的输出结果。
7.如权利要求1至6任一所述的量化感知训练方法,其特征在于,所述可合并分支包括残差分支和/或第二直连分支,
对于每个卷积层,将输入数据进行卷积运算,将卷积运算的输出结果与残差分支、和/或直连分支进行第二累加运算,将第二累加运算的输出结果进行激活函数运算。
8.如权利要求7所述的量化感知训练方法,其特征在于,所述第一直连分支为可合并分支中的第二直连分支。
9.一种卷积神经网络的量化感知训练装置,其特征在于,该装置包括,
样本训练模块,用于对第一卷积神经网络进行样本训练,其中,第一卷积神经网络中的至少一个卷积层包括有可合并分支结构和至少一个第一直连分支,
分支合并模块,用于将训练后的第一卷积神经网络至少一个卷积层中的至少一个第一直连分支予以保留,将卷积层中除第一直连分支之外的可合并分支结构进行合并,得到具有第一直连分支结构的第二卷积神经网络,
量化感知训练模块,用于基于第二卷积神经网络进行量化感知训练。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州研极微电子有限公司,未经杭州研极微电子有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111304007.9/1.html,转载请声明来源钻瓜专利网。





