[发明专利]图像识别模型的训练方法、装置、设备及存储介质在审
申请号: | 202111583676.4 | 申请日: | 2021-12-22 |
公开(公告)号: | CN114330522A | 公开(公告)日: | 2022-04-12 |
发明(设计)人: | 卢晶 | 申请(专利权)人: | 上海高德威智能交通系统有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06V10/82;G06V10/774;G06N3/02 |
代理公司: | 北京中博世达专利商标代理有限公司 11274 | 代理人: | 申健 |
地址: | 201821 上海市嘉定*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 识别 模型 训练 方法 装置 设备 存储 介质 | ||
本申请公开了一种图像识别模型的训练方法、装置、设备及存储介质,涉及图像识别技术领域,用于基于图像样本中的原型样本训练图像识别模型,有助于节省存储空间和运算时间,同时降低模型的训练难度。该方法包括:基于至少两个图像预识别模型,确定多个图像样本中每个图像样本的不确定度;至少两个图像预识别模型均用于从相同的多个图像类别中确定待识别图像的类别;将多个图像样本中的不确定度小于等于第一预设阈值的第一目标图像样本,确定为第一目标图像样本所属图像类别的原型样本;基于多个图像类别中每个图像类别的原型样本,训练神经网络模型,得到图像识别模型。
技术领域
本申请涉及图像识别技术领域,尤其涉及一种图像识别模型的训练方法、装置、设备及存储介质。
背景技术
在计算机视觉的图像识别领域中,开集识别模型能够处理复杂的识别系统中新出现的样本类别,避免将未知类别样本误判未某个已知类别,因此,应用场景非常广泛。
但是,相关技术中,在训练开集识别模型时,通常会引入每个类别的原型特征(即代表每个类别样本特征的代表性特征向量),并将每个样本的特征与原型特征的距离作为额外参数进行训练学习,这就导致随着样本类别的增加,模型的训练过程会引入大量的额外参数,不仅增大了占用的存储空间与运算时间,还会增加模型的训练难度。
发明内容
本申请实施例提供了一种图像识别模型的训练方法、装置、设备及存储介质,用于基于训练样本中的原型样本训练图像识别模型,从而能够节省存储空间和运算时间,并降低模型的训练难度。
为达到上述目的,本申请实施例提供如下技术方案:
第一方面,提供了一种图像识别模型的训练方法,包括:基于至少两个图像预识别模型,确定多个图像样本中每个图像样本的不确定度;其中,不确定度用于表征至少两个图像预识别模型识别图像类别的不确定性;至少两个图像预识别模型均用于从相同的多个图像类别中确定待识别图像的类别;将多个图像样本中的不确定度小于等于第一预设阈值的第一目标图像样本,确定为第一目标图像样本所属图像类别的原型样本,或将多个图像样本中的不确定度小于其他图像样本的第一预设数量的第二目标图像样本,确定为第二目标图像样本所属图像类别的原型样本;基于多个图像类别中每个图像类别的原型样本,训练神经网络模型,得到图像识别模型;其中,图像识别模型用于从多个图像类别中确定待识别图像的类别,或者确定待识别图像的类别不属于多个图像类别。
该技术方案,通过每个图像样本的不确定度,对多个图像样本进行筛选,过滤掉多个图像样本中的低质量的噪声样本,得到每个图像类别的原型样本,并根据原型样本训练神经网络模型,得到图像识别模型。通过使用原型样本进行模型训练,不必再引入每个类别的原型特征,并不必将每个样本的特征与原型特征的距离作为额外参数进行训练学习,进而避免了样本类别增加时引入大量的额外参数,节省了存储空间和运算时间,降低了训练难度。
在一种可能的实现方式中,至少两个图像预识别模型包括第一图像预识别模型和第二图像预识别模型,多个图像样本包括第一图像样本;基于至少两个图像预识别模型,确定多个图像样本中每个图像样本的不确定度,包括:基于第一图像预识别模型提取每个图像样本的第一特征向量;其中,第一特征向量用于第一图像预识别模型从多个图像类别中确定待识别图像的类别;基于第二图像预识别模型提取每个图像样本的第二特征向量;其中,第二特征向量用于第二图像预识别模型从多个图像类别中确定待识别图像的类别;基于第一图像样本的第一特征向量分别与每个图像样本的第一特征向量,得到第一特征分布向量;其中,第一特征分布向量用于表征第一图像样本的第一特征向量与其他图像样本的第一特征向量的距离分布;基于第一图像样本的第二特征向量分别与每个图像样本的第二特征向量,得到第二特征分布向量;其中,第二特征分布向量用于表征第一图像样本的第二特征向量与其他图像样本的第二特征向量的距离分布;基于第一特征分布向量和第二特征分布向量,得到第一图像样本的不确定度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海高德威智能交通系统有限公司,未经上海高德威智能交通系统有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111583676.4/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序