[发明专利]网络量化方法及系统及装置及介质及图像处理方法在审
申请号: | 202210129537.2 | 申请日: | 2022-02-11 |
公开(公告)号: | CN114444668A | 公开(公告)日: | 2022-05-06 |
发明(设计)人: | 不公告发明人 | 申请(专利权)人: | 成都数联云算科技有限公司 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08;G06N5/04;G06V10/82;G06V10/764;G06K9/62 |
代理公司: | 成都云纵知识产权代理事务所(普通合伙) 51316 | 代理人: | 熊曦;陈婉鹃 |
地址: | 610041 四川省成都市中国(四川)自*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 网络 量化 方法 系统 装置 介质 图像 处理 | ||
1.网络量化方法,其特征在于,所述方法包括:
获得第一深度神经网络Mf,所述Mf包括n个神经网络层,所述神经网络层分为量化层和非量化层,所述Mf的准确率为Accf,设定量化深度神经网络最高可接受的准确率损失阈值σ;
基于所述Accf和所述σ,使用二分法从所述n个神经网络层中查找获得所有量化层,将获得的量化层进行量化。
2.根据权利要求1所述的网络量化方法,其特征在于,所述基于所述Accf和所述σ,使用二分法从所述n个神经网络层中查找获得所有量化层,将获得的量化层进行量化,具体包括:
定义qi表示所述Mf中第1至第i层所述神经网络层之间的量化层集合,将所述Mf中的第i至第j层以及所述qi对应的所述神经网络层均量化后获得第二深度神经网络,Mi,j表示所述第二深度神经网络的准确率;
设定初始条件并执行预设查找步骤查找所述Mf中第i至第j层所述神经网络层之间的量化层,初始条件为i=1,j=n;
所述预设查找步骤包括:
步骤1:若i>j,则所述Mf中第i至第j层所述神经网络层之间的量化层查找结果为空;若i=j,且Accf-Mi,j≤σ*(1+|qi|)/n,则所述Mf中第i至第j层所述神经网络层之间的量化层查找结果为第i层;若i=j,且Accf-Mi,j>σ*(1+|qi|)/n,则所述Mf中第i至第j层所述神经网络层之间的量化层查找结果为空;
步骤2:若i<j,且Accf-Mi,j≤σ*(j-i+1+|qi|)/n,则所述Mf中第i至第j层所述神经网络层之间的量化层查找结果为第i至第j层;若i<j,且Accf-Mi,j>σ*(j-i+1+|qi|)/n,则令并执行步骤3;
步骤3:更新所述初始条件,令i=1,j=mid,并返回执行步骤1,获得所述第一神经网络在第i至第mid层之间的第一量化层集合qleff,并执行步骤4;
步骤4:更新所述初始条件,令i=mid+1,j=n,并返回执行步骤1,获得所述第一神经网络在第mid+1层至第j层之间的第二量化层集合qright;
步骤5:基于所述第一量化层集合和所述第二量化层集合,获得所述Mf中第i至第j层所述神经网络层之间的量化层查找结果;
步骤6:将所述Mf中第i至第j层所述神经网络层之间的量化层查找结果中的所有量化层均量化。
3.根据权利要求2所述的网络量化方法,其特征在于,量化前所述Mf中每个所述神经网络层的参数均采用32位浮点型数据表示。
4.根据权利要求3所述的网络量化方法,其特征在于,将所述量化层量化具体为:将量化层的参数采用8位整数型数据表示。
5.根据权利要求2所述的网络量化方法,其特征在于,本方法中深度神经网络的准确率获取方式为:利用测试集数据测试深度神经网络,获得深度神经网络的准确率。
6.根据权利要求5所述的网络量化方法,其特征在于,本方法在图形处理器端使用所述Mf在所述测试集上进行推理得到所述Accf。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都数联云算科技有限公司,未经成都数联云算科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210129537.2/1.html,转载请声明来源钻瓜专利网。