[发明专利]模型量化方法、装置、介质及电子设备有效
申请号: | 202310379833.2 | 申请日: | 2023-04-11 |
公开(公告)号: | CN116108896B | 公开(公告)日: | 2023-07-07 |
发明(设计)人: | 马文建;李晓泉 | 申请(专利权)人: | 上海登临科技有限公司 |
主分类号: | G06N3/0464 | 分类号: | G06N3/0464;G06N3/08 |
代理公司: | 北京泛华伟业知识产权代理有限公司 11280 | 代理人: | 王勇;纪雯 |
地址: | 201306 上海市浦*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 量化 方法 装置 介质 电子设备 | ||
1.一种用于图像识别的模型量化方法,其特征在于,所述方法包括:
获取模型和样本集,所述模型用于在支持第一数据形式的系统上运行以执行图像识别;
为模型运行过程中的待量化数据设置对应的量化统计算子,所述待量化数据分为:1)随着样本的不同发生变化的动态待量化数据;2)随着样本的不同不发生变化的静态待量化数据;
在样本集上第一次整体运行所述模型,在第一次整体运行所述模型的过程中,由所述量化统计算子统计对应的待量化数据的全局最大值和全局最小值;
在所述样本集上第二次整体运行所述模型,在第二次整体运行所述模型的过程中,由所述量化统计算子基于对应的待量化数据的全局最大值和全局最小值,构建对应的待量化数据的全局直方图;以及
基于对应的待量化数据的全局直方图对该待量化数据执行模型量化,得到量化后的模型,所述量化后的模型用于在支持第二数据形式的系统上运行以执行图像识别,其中所述第二数据形式的数据在长度上小于所述第一数据形式的数据;
其中,在样本集上整体运行所述模型是指将样本集中每个样本依次输入模型,该模型针对输入的每个样本都整体运行一遍,得到对应于每个样本的输出。
2.根据权利要求1所述的方法,其特征在于,当对应的待量化数据为动态待量化数据时,在第一次整体运行所述模型的过程中,由所述量化统计算子统计对应的待量化数据的全局最大值和全局最小值,包括:
由所述量化统计算子将对应的待量化数据的初始全局最大值和初始全局最小值设置为空;以及
将所述样本集中的每个样本依次输入所述模型,在针对每个样本运行所述模型时,由所述量化统计算子统计对应的待量化数据的局部最大值和局部最小值,并且根据所述局部最大值和所述局部最小值来更新对应的待量化数据的全局最大值和全局最小值。
3.根据权利要求1或2所述的方法,其特征在于,当对应的待量化数据为动态待量化数据时,在第二次整体运行所述模型的过程中,由所述量化统计算子基于对应的待量化数据的全局最大值和全局最小值,构建对应的待量化数据的全局直方图,包括:
由所述量化统计算子基于对应的待量化数据的全局最大值和全局最小值,得到对应的待量化数据的全局直方图的范围;
由所述量化统计算子在对应的待量化数据的全局直方图的范围内,构建对应的待量化数据的初始全局直方图;以及
将所述样本集中的每个样本依次输入所述模型,在针对每个样本运行所述模型时,由所述量化统计算子构建对应的待量化数据的局部直方图,并且将所述局部直方图与对应的待量化数据的全局直方图进行累加,以更新对应的待量化数据的全局直方图。
4.根据权利要求1或2所述的方法,其特征在于,当对应的待量化数据为动态待量化数据时,所述方法还包括:
在所述模型中,将所述量化统计算子设置在获得对应的待量化数据的位置与使用对应的待量化数据进行计算的位置之间。
5. 根据权利要求1或2所述的方法,其特征在于,所述方法还包括:
由所述量化统计算子存储对应的待量化数据的全局最大值和全局最小值;以及
由所述量化统计算子注册回调函数,以对所述量化统计算子内存储的信息进行跟踪查看。
6.根据权利要求1或2所述的方法,其特征在于,基于对应的待量化数据的全局直方图对该待量化数据执行模型量化的过程中,对于动态待量化数据和静态待量化数据使用不同的模型量化方法执行量化。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海登临科技有限公司,未经上海登临科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310379833.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:数据处理方法、装置、电子设备、存储介质及程序产品
- 下一篇:血液分析装置