[发明专利]图像分类模型生成方法、装置、计算机设备和存储介质有效
申请号: | 202010063515.1 | 申请日: | 2020-01-20 |
公开(公告)号: | CN111310800B | 公开(公告)日: | 2023-10-10 |
发明(设计)人: | 张力文;刘建光;金子杰;武小亮;罗育浩;潘浩 | 申请(专利权)人: | 天翼数字生活科技有限公司 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/774;G06V10/82;G06N3/0464 |
代理公司: | 华进联合专利商标代理有限公司 44224 | 代理人: | 冯右明 |
地址: | 200040 上海市静安*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 分类 模型 生成 方法 装置 计算机 设备 存储 介质 | ||
本申请涉及一种图像分类模型生成方法、装置、计算机设备和存储介质,通过获取图片数据集;将图片数据集输入待训练的图像分类模型,确定出图片中目标对象的位置,得到目标对象图像并输出给对象识别单元;通过对象识别单元识别出与目标对象图像对应的特征图;通过预设的加权欧几里德损失函数确定特征图与目标对象图像之间的损失函数值;根据损失函数值调整图像分类模型中位置检测单元和/或对象识别单元中的待训练参数,直到识别出的特征图与目标对象图像对应的损失函数值小于预设阈值时,训练完成。本方法加快了损失函数值收敛的速度,提高了图像分类模型生成效率,同时通过本方法得到的图像分类模型对低像素图片的识别能力得到提高。
技术领域
本申请涉及计算机视觉技术领域,特别是涉及一种图像分类模型生成方法、装置、计算机设备和存储介质。
背景技术
随着计算机视觉技术的迅猛发展,图像分类技术已经日趋成熟,并且被应用于多个生活场景中。
损失函数广泛应用于对图像分类模型训练效果的评估,损失函数值越小,说明图像分类模型训练的效果就越好,模型预测结果的准确性就越高。
但是,在利用较低像素图片对图像分类模型进行训练时,模型对低像素图片的识别效果较差,损失函数值收敛的速度较慢,导致得到可用的图像分类模型的效率较低。
发明内容
基于此,有必要针对上述技术问题,提供一种图像分类模型生成方法、装置、计算机设备和存储介质。
一种图像分类模型生成方法,所述方法包括:
获取图片数据集;所述图片数据集包括多张图片,各个所述图片至少包括一个目标对象;所述图片中还包括有预先标注的目标对象的位置标识以及类别标识;
将所述图片数据集输入待训练的图像分类模型,使得所述图像分类模型中的位置检测单元根据所述位置标识确定出所述图片中所述目标对象的位置,得到目标对象图像并输出给所述待训练的图像分类模型的对象识别单元;
通过所述对象识别单元识别出与所述目标对象图像对应的特征图;所述特征图中包含所述目标对象的特征识别信息、位置检测信息和类别识别信息;
通过预设的加权欧几里德损失函数,基于所述特征识别信息、位置检测信息和类别识别信息确定所述特征图与所述目标对象图像之间的损失函数值;所述加权欧几里德损失函数的收敛速度快于欧几里德损失函数的收敛速度;
根据所述损失函数值调整所述图像分类模型中位置检测单元和/或对象识别单元中的待训练参数,直到所述图像分类模型识别出的特征图与所述目标对象图像对应的所述损失函数值小于预设阈值时,结束训练,得到训练完成的图像分类模型。
在其中一个实施例中,所述特征图与所述目标对象图像之间的损失函数值可通过下述方式计算得到:
其中,Lsal为所述预设的加权欧几里德损失函数;Lsal(x,g)为所述损失函数值;x是所述特征图的像素点值,g是所述目标对象图像的像素点值,gi0.5;i表示所述特征图的第i个像素点;d为所述特征图的像素点个数的最大值;α是固定权重。
在其中一个实施例中,所述预先标注的目标对象的位置标识为与包含有所述目标对象的矩形边框;所述位置标识携带有所述矩形边框的宽度和高度信息,以及至少两个对角的位置坐标。
在其中一个实施例中,所述目标对象图像可通过下述方式计算得到:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天翼数字生活科技有限公司,未经天翼数字生活科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010063515.1/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序