[发明专利]一种基于动态采样的分类模型迭代加速方法及系统在审
申请号: | 202211512755.0 | 申请日: | 2022-11-28 |
公开(公告)号: | CN115795363A | 公开(公告)日: | 2023-03-14 |
发明(设计)人: | 李楠;彭斌;杨艺 | 申请(专利权)人: | 凌云光技术股份有限公司 |
主分类号: | G06F18/241 | 分类号: | G06F18/241;G06F18/214 |
代理公司: | 北京弘权知识产权代理有限公司 11363 | 代理人: | 逯长明;占园 |
地址: | 100094 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 动态 采样 分类 模型 加速 方法 系统 | ||
本申请提供一种基于动态采样的分类模型迭代加速方法及系统,所述方法通过加载待训练模型,得到待训练模型的初始化权重,并根据初始化权重调整训练轮数,按照特定的比例,将训练轮数分割为多个数组,并设置每个数组在训练时的梯度步长。最后按照多个数组的训练顺序以及对应的梯度步长,对待训练模型交替进行全部训练和部分训练,直至待训练模型收敛。本申请提供的方法通过分割训练轮数,并在对应的数组筛选出部分较难学习的训练样本进行训练,再通过交替进行全部训练和部分训练的方式防止待训练模型的学习遗忘,以达到节省待训练模型的训练时间,提升待训练模型的训练效率的目的。
技术领域
本申请涉及检测模型训练领域,尤其涉及一种基于动态采样的分类模型迭代加速方法及系统。
背景技术
在工业视觉领域,由于采样数据比较困难,往往初始训练的可用数据比较少,在对用于工业检测的模型训练时,需要后期不停的收集样本,进行迭代训练。这就造成了大量时间和资源的消耗,所以在保证精度的情况下,提高迭代训练速度是一项很重要的问题。
现有迭代训练的常规方法是将一个由大型数据集训练出来的待训练模型的权重作为迭代训练的初始化权重,再随着样本数据的不断增多,向数据集中不断增加新采样得到的样本数据,再使用增量后的数据集作为训练集重新对待训练模型进行训练。
但是,上述预模型在不断迭代训练的过程中,每迭代训练一次都需要耗费大量的时间,且占用资源。多次的对待训练模型进行迭代训练更是极大增加了工业产品的生产周期以及维护成本,降低生产效率。
发明内容
为解决在工业视觉领域中,待训练模型在不断迭代训练的过程中,训练一次待训练模型需要消耗大量的时间,且占用资源,多次对待训练模型进行迭代训练极大增加工业产品的生产周期以及维护成本,降低生产效率的问题。
第一方面,本申请实施例提供一种基于动态采样的分类模型迭代加速方法及系统,所述方法包括:
加载待训练模型,得到所述待训练模型的初始化权重;
根据所述初始化权重调整训练轮数,并按照第一预设比例将所述训练轮数分割为多个数组;
设置每个数组在训练时的梯度步长;
按照多个数组的训练顺序以及对应的梯度步长,对待训练模型交替进行全部训练和部分训练;所述全部训练为使用所述训练集中的全部训练样本对待训练模型进行训练;所述部分训练为使用训练集中第二预设比例的训练样本对待训练模型进行训练。
在本申请的一些实施例中,所述方法还包括:
按照所述数组的个数,将训练集分为多个子训练集;
按照第二预设比例筛选所述子训练集中的训练样本,得到有效样本集;
使用所述有效样本集对待训练模型进行所述部分训练。
在本申请的一些实施例中,按照第二预设比例筛选所述子训练集中的训练样本的步骤中,所述方法还包括:
在执行任意一次训练之后,获取当前模型的训练权重;
根据所述训练权重,计算下一次训练对应的子训练集中的训练样本的学习难度等级;
根据第二预设比例,按照所述学习难度等级由高到低的排列顺序筛选有效样本。
在本申请的一些实施例中,计算下一次训练对应的子训练集中样本的难度值的步骤中,所述方法还包括:
使用交叉熵损失函数计算子训练集中的训练样本的交叉熵损失;
按照所述交叉熵损失确定样本的所述学习难度等级。
在本申请的一些实施例中,所述方法还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于凌云光技术股份有限公司,未经凌云光技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211512755.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种抗紫外线锦涤面料及其加工工艺
- 下一篇:一种防短路圆弧面氧化槽