[发明专利]图像分类模型生成方法、装置、计算机设备和存储介质有效
申请号: | 202010063515.1 | 申请日: | 2020-01-20 |
公开(公告)号: | CN111310800B | 公开(公告)日: | 2023-10-10 |
发明(设计)人: | 张力文;刘建光;金子杰;武小亮;罗育浩;潘浩 | 申请(专利权)人: | 天翼数字生活科技有限公司 |
主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/774;G06V10/82;G06N3/0464 |
代理公司: | 华进联合专利商标代理有限公司 44224 | 代理人: | 冯右明 |
地址: | 200040 上海市静安*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 分类 模型 生成 方法 装置 计算机 设备 存储 介质 | ||
1.一种图像分类模型生成方法,其特征在于,所述方法包括:
获取图片数据集;所述图片数据集包括多张图片,各个所述图片至少包括一个目标对象;所述图片中还包括有预先标注的目标对象的位置标识以及类别标识;
将所述图片数据集输入待训练的图像分类模型,使得所述图像分类模型中的位置检测单元根据所述位置标识确定出所述图片中所述目标对象的位置,得到目标对象图像并输出给所述待训练的图像分类模型的对象识别单元;
通过所述对象识别单元识别出与所述目标对象图像对应的特征图;所述特征图中包含所述目标对象的特征识别信息、位置检测信息和类别识别信息;
通过预设的加权欧几里德损失函数,基于所述特征识别信息、位置检测信息和类别识别信息确定所述特征图与所述目标对象图像之间的损失函数值;所述加权欧几里德损失函数的收敛速度快于欧几里德损失函数的收敛速度;
根据所述损失函数值调整所述图像分类模型中位置检测单元和/或对象识别单元中的待训练参数,直到所述图像分类模型识别出的特征图与所述目标对象图像对应的所述损失函数值小于预设阈值时,结束训练,得到训练完成的图像分类模型。
2.根据权利要求1所述的方法,其特征在于,所述特征图与所述目标对象图像之间的损失函数值可通过下述方式计算得到:
其中,Lsal为所述预设的加权欧几里德损失函数;Lsal(x,g)为所述损失函数值;x是所述特征图的像素点值,g是所述目标对象图像的像素点值,gi0.5;i表示所述特征图的第i个像素点;d为所述特征图的像素点个数的最大值;α是固定权重。
3.根据权利要求1所述的方法,其特征在于,所述预先标注的目标对象的位置标识为包含有所述目标对象的矩形边框;所述位置标识携带有所述矩形边框的宽度和高度信息,以及两个对角的位置坐标。
4.根据权利要求3所述的方法,其特征在于,所述目标对象图像可通过下述方式计算得到:
其中,Mg为所述目标对象图像;x,y是所述目标对象所在矩形边框的两个向量;Cxi和Cyi为目标对象所在矩形边框的中心点;s为所述训练参数中的训练步长;T是矩阵转置;N是图片中所述目标对象所在矩形边框的数量;vxy是所述目标对象所在矩形边框的中心位置坐标,vxy=[x,y]T且vxy∈RBi,RBi表示目标对象所在矩形边框在图片中的面积占比,Bi表示所述图片中第i个矩形边框;μi是所述特征图的中心位置坐标;Σi为协方差矩阵;wi和hi分别代表目标对象所在边框的宽度以及高度。
5.根据权利要求1所述的方法,其特征在于,在将所述图片数据集输入待训练的图像分类模型之前,还包括:调整所述图片数据集中图片的尺寸,使得所述图片数据集中图片的尺寸统一。
6.根据权利要求1所述的方法,其特征在于,所述待训练的图像分类模型为卷积神经网络。
7.根据权利要求1所述的方法,其特征在于,在所述得到训练完成的图像分类模型之后,还包括:
将测试图片输入所述训练完成的图像分类模型,得到所述训练完成的图像分类模型返回的图像分类结果;所述图像分类结果包含类别识别信息;所述测试图片中至少包括一个所述目标对象,还包括所述目标对象的类别标识;
若所述图像分类结果中的类别识别信息,与所述测试图片的类别标识相同且匹配程度达到预设匹配阈值,则确定生成所述图像分类模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天翼数字生活科技有限公司,未经天翼数字生活科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010063515.1/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序