[发明专利]图像识别模型的训练方法、装置及设备在审
申请号: | 202110367654.8 | 申请日: | 2021-04-06 |
公开(公告)号: | CN112766427A | 公开(公告)日: | 2021-05-07 |
发明(设计)人: | 张培尧;刘树春;张飞云;高巍;邵蔚元 | 申请(专利权)人: | 浙江口碑网络技术有限公司;口碑(上海)信息技术有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F40/289 |
代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 周嗣勇 |
地址: | 310012 浙江省杭州市西*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 识别 模型 训练 方法 装置 设备 | ||
1.一种图像识别模型的训练方法,所述方法包括:
利用初始数据集确定出训练数据集后,循环执行以下步骤直到图像识别模型满足模型性能条件:
利用训练数据集对图像识别模型进行训练;所述训练数据集包括多张训练图像,每张所述训练图像对应有图像类别;
利用训练后的图像识别模型对多张验证图像进行分类识别,并将识别结果与所述验证图像的实际图像类别进行对比;
基于对比结果确定出相似的至少两个图像类别后,将文本相似度满足相似度条件的图像类别合并为一个图像类别,将合并后的数据集确定为新的训练数据集。
2.根据权利要求1所述的方法,若所述图像识别模型将所述验证图像的实际图像类别识别为目标图像类别,所述实际图像类别与目标图像类别的相似度,与所述图像识别模型将所述实际图像类别识别为所述目标图像类别的次数正相关。
3.根据权利要求2所述的方法,所述根据对比结果获取相似的至少两个图像类别,包括:
针对每个实际图像类别,计算图像识别模型将该实际图像类别识别为目标图像类别的识别错误率;
将识别错误率满足设定阈值的实际图像类别与目标图像类别,确定为相似的两个图像类别。
4.根据权利要求1所述的方法,所述将文本相似度满足相似度条件的图像类别合并为一个图像类别,包括:
对所述相似的至少两个图像类别中每个图像类别进行文本分词;
基于文本分词结果的相似度,确定所述相似的至少两个图像类别中各图像类别的文本相似度,将文本相似度满足相似度条件的图像类别合并为一个图像类别。
5.根据权利要求1所述的方法,通过如下方式利用初始数据集确定出训练数据集:
获取初始数据集中各图像对应的原始类别名称的文本特征后,利用文本特征的相似度,对各原始类别名称进行文本聚类,获得多个初始图像类别;
根据文本聚类后的类别名称,获取各图像的图像特征后,利用图像特征的相似度,利用所述多个初始图像类别下的各图像进行图像聚类,获得所述训练数据集。
6.根据权利要求5所述的方法,所述对所述多个初始图像类别下的各图像进行图像聚类,包括:
分别对每个初始图像类别下各图像进行图像聚类,获得每个初始图像类别的聚类中心图像;
计算不同初始图像类别的聚类中心图像的相似度,将聚类中心图像的相似度满足聚类条件的不同初始图像类别合并为同一个图像类别。
7.根据权利要求6所述的方法,在获得每个初始图像类别的聚类中心图像后,还包括如下对任一初始图像类别的图像去噪处理:
计算初始图像类别下的目标图像与聚类中心图像的相似度,将相似度低于设定阈值的目标图像从所述初始图像类别中滤除;其中,所述目标图像为所述初始图像类别下除所述聚类中心图像之外的其他任意图像。
8.一种图像识别模型的训练装置,所述装置包括:
数据集处理模块,用于:利用初始数据集确定出训练数据集;
训练模块,用于:循环执行以下处理直到图像识别模型满足模型性能条件:
利用训练数据集对图像识别模型进行训练;所述训练数据集包括多张训练图像,每张所述训练菜品图像对应有图像类别;
利用训练后的图像识别模型对多张验证图像进行分类识别,并将识别结果与所述验证图像的实际图像类别进行对比;
基于对比结果确定出相似的至少两个图像类别后,将文本相似度满足相似度条件的图像类别合并为一个图像类别,将合并后的数据集确定为新的训练数据集。
9.根据权利要求8所述的装置,若所述图像识别模型将所述验证图像的实际图像类别识别为目标图像类别,所述实际图像类别与目标图像类别的相似度,与所述图像识别模型将所述实际图像类别识别为所述目标图像类别的次数正相关。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江口碑网络技术有限公司;口碑(上海)信息技术有限公司,未经浙江口碑网络技术有限公司;口碑(上海)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110367654.8/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序