[发明专利]基于多模型的样本标注方法及装置有效
申请号: | 201910009377.6 | 申请日: | 2019-01-04 |
公开(公告)号: | CN109784391B | 公开(公告)日: | 2021-01-05 |
发明(设计)人: | 樊宗 | 申请(专利权)人: | 杭州比智科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京市浩天知识产权代理事务所(普通合伙) 11276 | 代理人: | 宋菲;刘云贵 |
地址: | 311100 浙江省杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 模型 样本 标注 方法 装置 | ||
本发明公开了一种基于多模型的样本标注方法及装置,其中,方法包括:S1,根据训练样本集中的已标注样本图片以及已标注样本图片的标注信息对联合模型所包含的各个子模型进行训练更新得到更新后的联合模型;S2,将训练样本集中的未标注样本图片输入至更新后的联合模型所包含的各个子模型中进行预测处理得到各个子模型输出的预测结果;S3,根据各个子模型输出的预测结果进行相互校验,根据校验结果确定未标注样本图片的标注信息;S4,判断更新后的联合模型是否满足预设的模型迭代终止条件;若否,执行步骤S5;S5,在训练样本集中将已确定标注信息的未标注样本图片归类为已标注样本图片,执行步骤S1。本发明的方法能够实现对未标注图片进行准确标注。
技术领域
本发明涉及计算机视觉技术领域,具体涉及一种基于多模型的样本标注方法及装置。
背景技术
近些年来,深度学习技术得到了学术界广泛的关注,大量新的研究使其完成许多任务的能力接近甚至超过了人类水平,因此在业界中已经得到了广泛的应用。在很多领域,深度学习算法都可以替代原来的人工操作,这不仅降低了人工成本,还大幅降低了出错的概率和风险。比如,在目前安防领域中常用的行人检测以及人脸识别、金融领域常用的人证合一验证、新零售中常用的商品识别等等。
由于目前的主流深度学习算法都是监督学习,模型的训练依赖大量的标注数据,其中,基于深度学习的神经网络模型需要的样本数量尤其巨大,这也是模型能够具有很高表现力和鲁棒性的原因。在实际应用中,采集大量样本图像然后进行人工打标有两方面的限制:第一,需要大量的时间和人工成本,影响模型的快速开发;第二,在一些情况下无法采集到足够的图片。因此,如何快速廉价获取标注样本是实现快速开发适应实际需求的模型的重要因素。
现如今,越来越多的研究开始关注自动图像标注的问题,现有的方法往往是基于传统机器学习或者深度学习来预训练一个模型,然后利用模型进行预测的方式实现自动标注过程。然而,这种方式至少存在以下不足:首先,需要相对较多的样本,而能公开获取到的数据集种类相对较少,无法满足要求;其次,不能保证模型的准确性,导致后期还需要较多的人工校验。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的基于多模型的样本标注方法及装置。
根据本发明的一个方面,提供了一种基于多模型的样本标注方法,方法包括:
S1,根据训练样本集中的已标注样本图片以及已标注样本图片的标注信息对联合模型所包含的各个子模型进行训练更新,得到更新后的联合模型;
S2,将训练样本集中的未标注样本图片输入至更新后的联合模型所包含的各个子模型中进行预测处理,得到各个子模型输出的预测结果;
S3,根据各个子模型输出的预测结果进行相互校验,根据校验结果确定未标注样本图片的标注信息;
S4,判断更新后的联合模型是否满足预设的模型迭代终止条件;若是,则本方法结束;若否,则执行步骤S5;
S5,在训练样本集中将已确定标注信息的未标注样本图片归类为已标注样本图片,跳转执行步骤S1。
可选地,预测结果包括:预测类别结果以及预测概率分值,则步骤S3进一步包括:
针对每一个子模型,根据该子模型输出的各个预测类别结果所对应的概率分值确定该子模型的可信预测类别结果,其中,可信预测类别结果所对应的概率分值不小于第一预设分值阈值;
根据各个子模型的可信预测类别结果进行相互校验,根据校验结果确定未标注样本图片的标注信息。
可选地,根据各个子模型的可信预测类别结果进行相互校验,根据校验结果确定未标注样本图片的标注信息进一步包括:
若各个子模型均未预测得到可信预测类别结果,则放弃确定未标注样本图片的标注信息;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州比智科技有限公司,未经杭州比智科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910009377.6/2.html,转载请声明来源钻瓜专利网。