[发明专利]一种工业质检模型训练方法在审
申请号: | 202211071730.1 | 申请日: | 2022-08-31 |
公开(公告)号: | CN115438801A | 公开(公告)日: | 2022-12-06 |
发明(设计)人: | 史胡祎;彭斌 | 申请(专利权)人: | 凌云光技术股份有限公司 |
主分类号: | G06N20/00 | 分类号: | G06N20/00;G06Q50/04 |
代理公司: | 北京弘权知识产权代理有限公司 11363 | 代理人: | 逯长明;温瑞鑫 |
地址: | 100094 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 工业 质检 模型 训练 方法 | ||
1.一种工业质检模型训练方法,其特征在于,所述方法包括:
获取基线模型信息,所述基线模型信息包括预制模型的权重及训练轮数;
基于所述基线模型信息,对所述训练模型进行初始化,得到所述训练模型的初始权重及训练轮数,所述初始权重为通过所述预制模型的权重对所述训练模型进行初始化得到,所述训练轮数基于所述预制模型对应的训练轮数,按照预设第一比例确定,且所述训练轮数小于所述预制模型对应的训练轮数;
基于所述初始权重与所述训练轮数,并通过扩充后的训练集对所述训练模型进行训练,所述扩充后的训练集包括错检样本及漏检样本,在完成所述训练轮数的训练后,得到工业质检模型。
2.如权利要求1所述一种工业质检模型训练方法,其特征在于,在所述获取基线模型信息,所述基线模型信息包括预输入模型的权重及训练轮数步骤中,所述方法进一步包括:
所述基线模型信息为当前训练任务已有模型中的预制模型或基于预训练得到的预制模型的信息,所述当前训练任务已有模型中的预制模型为最近一次同任务训练所得到的模型。
3.如权利要求1所述一种工业质检模型训练方法,其特征在于,在所述获取基线模型信息步骤中,所述方法进一步包括:
判断本次训练是否为增量训练,且基于判断结果获取基线模型信息;
若本次非增量训练,则基于已知数据集对模型进行训练,得到预训练预制模型,将所述预训练预制模型的权重及对应的训练轮数保存,得到所述基线模型信息,所述已知数据集为ImageNet数据集或COCO数据集;
若本次为增量训练,直接获取所述基线模型信息,所述基线模型信息包括前一轮训练所得到模型的权重及对应的训练轮数。
4.如权利要求3所述一种工业质检模型训练方法,其特征在于,在判断本次训练是否为增量训练步骤中,所述方法进一步包括:
加载前一轮训练保存的模型信息,根据模型信息,得到当前任务所用模型类型与前一轮训练保存的模型的类型是否一致,所述模型信息包括模型类型;
基于所述判断结果,进行错误信息提示或读取所述基线模型信息。
5.如权利要求1所述一种工业质检模型训练方法,其特征在于,在所述得到工业质检模型步骤之后,所述方法还包括:
将所述工业质检模型的权重及所述基线模型信息中的训练轮数保存至所述基线模型信息中,用于下一次对模型进行训练。
6.如权利要求5所述一种工业质检模型训练方法,其特征在于,在将所述工业质检模型的权重及所述基线模型信息中的训练轮数保存至所述基线模型信息中,用于下一次对模型进行训练步骤之后,所述方法还包括:
所述基线模型信息还包括增量训练次数,所述增量训练次数为在首次训练的基础上共进行增量训练的迭代次数,在每次训练结束后,将次数+1后的增量训练次数保存至所述基线模型信息中。
7.如权利要2所述一种工业质检模型训练方法,其特征在于,在所述基线模型信息包括预制模型的权重及训练轮数步骤中,所述方法进一步包括:
所述基线模型信息中的所述训练轮数为首次训练时得到预制模型的训练轮数。
8.如权利要求1所述一种工业质检模型训练方法,其特征在于,在所述训练轮数基于所述预制模型对应的训练轮数,按照预设第一比例确定,且所述训练轮数小于所述预制模型对应的训练轮数步骤中,所述方法进一步包括:
所述训练轮数基于所述预制模型对应的训练轮数,按照预设第一比例确定,所述预设第一比例为三分之二;
所述训练模型在训练时开始保存的轮数基于所述预制模型对应的训练轮数,按照预设第二比例确定,所述预设第二比例为三分之一。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于凌云光技术股份有限公司,未经凌云光技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211071730.1/1.html,转载请声明来源钻瓜专利网。