[发明专利]卷积神经网络的量化感知训练方法、卷积神经网络结构在审
| 申请号: | 202111304007.9 | 申请日: | 2021-11-05 |
| 公开(公告)号: | CN114118363A | 公开(公告)日: | 2022-03-01 |
| 发明(设计)人: | 杨敏;艾国;杨作兴;房汝明;向志宏 | 申请(专利权)人: | 杭州研极微电子有限公司 |
| 主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08 |
| 代理公司: | 北京德琦知识产权代理有限公司 11018 | 代理人: | 谢安昆;宋志强 |
| 地址: | 310051 浙江省杭州市滨江*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 卷积 神经网络 量化 感知 训练 方法 结构 | ||
公开了一种卷积神经网络的量化感知训练方法,包括,对第一卷积神经网络进行样本训练,其中,第一卷积神经网络中至少一个卷积层包括有可合并分支结构和至少一个第一直连分支,将训练后的第一卷积神经网络至少一个卷积层中的至少一个第一直连分支予以保留,将卷积层中除第一直连分支之外的可合并分支结构进行合并,得到具有第一直连分支结构的第二卷积神经网络,基于第二卷积神经网络进行量化感知训练,以提高卷积神经网络模型的量化精度。
技术领域
本发明涉及机器学习领域,特别地,涉及一种卷积神经网络的量化感知训练方法。
背景技术
卷积神经网络(CNN)由于精度高在视觉任务中已经有非常广泛的应用。为了得到更高的精度,在训练时采用多分支结构的卷积神经网络,这样可以做得很复杂,在推理时可以把多分支合并为单分支,这样就可以减少存储空间占用,加快推理速度。典型的可合并分支结构卷积神经网络有RepVGG,DBB等。
为了进一步节省存储空间,加快推理速度,往往还需要对卷积神经网络模型进行量化,以便将高精度浮点数的模型参数更新为低精度整数模型参数,例如,将浮点数表示的权重和激活用低精度整数来近似表示,从而可以得到低比特的卷积神经网络模型。量化感知训练是模型量化技术之一,其在训练的过程中通过网络模拟量化的效果来进行参数更新和优化。
对于训练时采用的可合并分支结构卷积神经网络,如果直接对其进行量化感知训练,由于目前的量化感知训练都是针对每一个卷积做的,训练时会有额外的量化参数,每个分支的参数可能都不一样,这样导致量化后,多分支无法合并成单分支。所以,现有量化感知训练方法是把多分支合并成单分支以后,再对其进行量化感知训练。而基于单分支结构的卷积神经网络的量化感知训练,所得到的卷积神经网络的模型参数精度不佳。
发明内容
本发明提供了一种卷积神经网络的量化感知训练方法,以在多分支结构下对卷积神经网络进行量化感知训练。
本发明提供的一种卷积神经网络的量化感知训练方法,该方法包括,
对第一卷积神经网络进行样本训练,其中,第一卷积神经网络中至少一个卷积层包括有可合并分支结构和至少一个第一直连分支,
在训练后的第一卷积神经网络至少一个卷积层中存在至少一个第一直连分支,将卷积层中除第一直连分支之外的可合并分支结构进行合并,得到具有第一直连分支结构的第二卷积神经网络;
基于第二卷积神经网络进行量化感知训练。
较佳地,所述第一直连分支为在第一卷积神经网络中增加的直连分支,和/或,所述可合并分支结构中的既有直连分支。
较佳地,若所述第一直连分支为在第一卷积神经网络中增加的直连分支,所述第一直连分支按照如下方式增加:
对于第一卷积神经网络中至少一个具有相同输入数据维度与输出数据维度的卷积层,将与本卷积层相邻的上一卷积层的输出结果作为本卷积层的至少一个第一直连分支,与本卷积层激活函数运算的输出结果进行本卷积层的第一累加运算,将该第一累加运算结果输入至与本卷积层相邻的下一卷积层。
较佳地,所述第一直连分支的增加方式进一步包括,
将本卷积层的输出结果作为与本卷积层相邻的下一卷积层的至少一个第一直连分支,与所述下一卷积层激活函数运算的输出结果进行所述下一卷积层的第一累加运算,将该第一累加运算结果输入至与所述下一卷积层相邻的下一卷积层,
以此递推,直至最后一个卷积层,使得第一卷积神经网络中具有相同输入数据维度与输出数据维度的每个卷积层均增加第一直连分支结构。
较佳地,所述上一卷积层的输出结果为:所述上一卷积层中用于将激活函数运算的结果与该卷积层中的第一直连分支进行第一累加运算的输出结果,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州研极微电子有限公司,未经杭州研极微电子有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111304007.9/2.html,转载请声明来源钻瓜专利网。





