[发明专利]一种图像识别模型的确定方法及装置在审
申请号: | 202210187143.2 | 申请日: | 2022-02-28 |
公开(公告)号: | CN114580517A | 公开(公告)日: | 2022-06-03 |
发明(设计)人: | 胡晓纤;黄轩;赵智维;王孝宇;陈宁 | 申请(专利权)人: | 深圳云天励飞技术股份有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京三聚阳光知识产权代理有限公司 11250 | 代理人: | 陈刚 |
地址: | 518000 广东省深圳市龙岗区园山*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 图像 识别 模型 确定 方法 装置 | ||
本发明公开了一种图像识别模型的确定方法及装置,该图像识别模型的确定方法包括:获取标注后的初始数据集,并根据所述初始数据集中训练样本的样本信息,通过训练方案规则集,配置待训练模型;通过所述初始数据集对所述待训练模型进行训练,得到原始模型;获取扩展数据集,基于挖掘算法规则集确定预设挖掘算法,并利用所述原始模型和所述预设挖掘算法,从所述扩展数据集中筛选出指定数量的优化样本;在所述优化样本被标注后,利用标注后的优化样本对所述原始模型再次进行训练,得到优化后的图像识别模型。本发明生成的图像识别模型可以筛选出海量无标签的数据或者重复性高的冗余数据中的有效数据,减低了人工标注的成本,提高了开发效率。
技术领域
本发明涉及计算机科学技术领域,具体涉及一种图像识别模型的确定方法及装置。
背景技术
随着人工智能技术的发展与进步,人工智能商业化在算力、算法和技术方面基本达到阶段性成熟,极大地方便了人们的工作和生活。人工智能应用在产品落地过程中相当依赖高质量的有效数据,但在实际场景中,存在的都是海量无标签的数据或者重复性高的冗余数据需要处理。
目前对于这一类海量无标签的数据或者重复性高的冗余数据主要是通过外包给第三方标注系统进行标注,但是该标注方法人力的成本会非常高。即便是有一些图像识别模型,但是在模型训练、挖掘过程中经常面临深度学习算法框架的选择,需要算法人员对各类算法框架有比较深入的了解才能根据数据集的特性来选择合适的算法框架。缺乏人工智能专业知识的用户,在算法框架选择时常常面临困难。
发明内容
因此,本发明为了解决目前海量无标签的图像数据或者重复性高的图像数据筛选过程消耗人力成本高的问题,从而提供一种图像识别模型的确定方法及装置。
为实现上述目的,本发明采用如下技术方案:
本发明实施例提供了一种图像识别模型的确定方法,包括:获取标注后的初始数据集,并根据所述初始数据集中训练样本的样本信息,通过训练方案规则集,配置待训练模型;通过所述初始数据集对所述待训练模型进行训练,得到原始模型;获取扩展数据集,基于挖掘算法规则集确定预设挖掘算法,并利用所述原始模型和所述预设挖掘算法,从所述扩展数据集中筛选出指定数量的优化样本;在所述优化样本被标注后,利用标注后的优化样本对所述原始模型再次进行训练,得到优化后的图像识别模型。
本发明通过获取标注后的初始数据集,再根据该初始数据集中训练样本的样本信息,配置待训练模型,进而通过初始数据集对待训练模型进行训练得到原始模型,再结合获取的扩展数据集,并利用原始模型以及预设的挖掘算法,从扩展数据集中筛选出指定数量的优化样本,最后对优化样本进行标注,利用标注后的优化样本对原始模型再次进行训练,得到优化后的图像识别模型。本发明得到的图像识别模型在实际应用中可以对无标签的图像数据以及重复性高的图像数据进行筛选,得到具有标签以及重复性低的高质量的有效数据,进而利用有效数据进行人工智能应用模型的开发,提高人工智能应用的开发效率。
可选地,所述标注后的初始数据集按照以下方式获取:采集图像数据,并利用预设的去重规则集,对所述图像数据进行去重处理;通过创建的标注任务,对去重处理后的图像数据进行标注,生成标注后的初始数据集。
本发明通过对采集的图像数据进行基于规则集的去重处理,并对去重处理后的图像数据进行标注,减少图像数据中相似度高的初始数据,降低后续对待训练模型训练的成本。
可选地,所述初始数据集中训练样本的样本信息,包括:所述训练样本中正样本和负样本的平衡性、所述初始数据集的大小以及各类标签在所述初始数据集中的占比。
可选地,所述根据所述初始数据集中训练样本的样本信息,配置待训练模型,包括:根据所述初始数据集中训练样本的样本信息,配置所述待训练模型的超参数、算法框架和骨干网络层数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳云天励飞技术股份有限公司,未经深圳云天励飞技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210187143.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种复合纸纱线及其制备工艺
- 下一篇:可以提高柚皮素产量的查尔酮合成酶突变体
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序