[发明专利]模型训练及缺陷识别方法、装置、电子设备和存储介质在审
申请号: | 202210827110.X | 申请日: | 2022-07-13 |
公开(公告)号: | CN115205253A | 公开(公告)日: | 2022-10-18 |
发明(设计)人: | 邵庆彬;杨凯;崔磊 | 申请(专利权)人: | 上海商汤智能科技有限公司 |
主分类号: | G06T7/00 | 分类号: | G06T7/00 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 李江;浦彩华 |
地址: | 200233 上海市徐*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 模型 训练 缺陷 识别 方法 装置 电子设备 存储 介质 | ||
本公开提供了一种模型训练及缺陷识别方法、装置、电子设备和存储介质,模型训练方法包括:利用已标注样本集对待训练缺陷识别模型进行训练,得到初始缺陷识别模型;利用初始缺陷识别模型,对未标注样本集中的未标注样本进行不确定度评估,选取出k个未标注样本;k为大于等于1的自然数;k个未标注样本中每个未标注样本对应的不确定度,大于未标注样本集中与k个未标注样本不同的每个未标注样本对应的不确定度;对k个未标注样本进行工业缺陷标注,得到k个已标注样本;利用k个已标注样本和已标注样本集,对初始缺陷识别模型进行训练,得到已训练缺陷识别模型。
技术领域
本公开涉及主动学习技术领域,尤其涉及一种模型训练及缺陷识别方法、装置、电子设备和存储介质。
背景技术
近年来,计算机视觉技术在各个领域都取得了巨大的进展,同时在工业界也产生了实际的应用价值。
目前,用于工业缺陷识别的缺陷识别模型,在训练阶段使用的大量样本,往往是人工随机选择并标注的,不仅需要消耗大量的人力,模型训练效率较低,而且训练得到的模型的精确度较低。
发明内容
本公开实施例期望提供一种模型训练及缺陷识别方法、装置、电子设备和存储介质。
本公开实施例的技术方案是这样实现的:
本公开实施例提供了一种模型训练方法,包括:
利用已标注样本集对待训练缺陷识别模型进行训练,得到初始缺陷识别模型;
利用所述初始缺陷识别模型,对未标注样本集中的未标注样本进行不确定度评估,选取出k个未标注样本;k为大于等于1的自然数;其中,所述k个未标注样本中每个未标注样本对应的不确定度,大于所述未标注样本集中与所述k个未标注样本不同的每个未标注样本对应的不确定度;
对所述k个未标注样本进行工业缺陷标注,得到k个已标注样本;
利用所述k个已标注样本和所述已标注样本集,对所述初始缺陷识别模型进行训练,得到已训练缺陷识别模型。
在上述模型训练方法中,所述利用所述初始缺陷识别模型,对未标注样本集中的未标注样本进行不确定度评估,选取出k个未标注样本,包括:
针对所述未标注样本集中每个未标注样本,利用所述初始缺陷识别模型进行工业缺陷识别,得到对应的缺陷识别结果;
针对所述未标注样本集中每个未标注样本,根据对应的缺陷识别结果确定对应的不确定度;
从所述未标注样本集中,按照对应的不确定度从大到小选取未标注样本,直至选取出的未标注样本数量达到k个,得到所述k个未标注样本。
在上述模型训练方法中,所述针对所述未标注样本集中每个未标注样本,根据对应的缺陷识别结果确定对应的不确定度,包括:
针对所述未标注样本集中每个未标注样本,根据对应的缺陷识别结果计算对应的信息熵;
针对所述未标注样本集中每个未标注样本,将对应的信息熵作为对应的不确定度。
在上述模型训练方法中,所述从所述未标注样本集中,按照对应的不确定度从大到小选取未标注样本,直至选取出的未标注样本数量达到k个,得到所述k个未标注样本,包括:
将所述未标注样本集中的未标注样本,按照对应的不确定度从大到小排序,得到未标注样本序列;
从所述未标注样本序列中,依次选取出前k个未标注样本,得到所述k个未标注样本。
在上述模型训练方法中,所述利用所述k个已标注样本和所述已标注样本集,对所述初始缺陷识别模型进行训练,得到已训练缺陷识别模型之后,所述方法还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海商汤智能科技有限公司,未经上海商汤智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210827110.X/2.html,转载请声明来源钻瓜专利网。