[发明专利]基于多模型的样本标注方法及装置有效
申请号: | 201910009377.6 | 申请日: | 2019-01-04 |
公开(公告)号: | CN109784391B | 公开(公告)日: | 2021-01-05 |
发明(设计)人: | 樊宗 | 申请(专利权)人: | 杭州比智科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京市浩天知识产权代理事务所(普通合伙) 11276 | 代理人: | 宋菲;刘云贵 |
地址: | 311100 浙江省杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 模型 样本 标注 方法 装置 | ||
1.一种基于多模型的样本标注方法,其特征在于,所述方法包括:
S1,根据训练样本集中的已标注样本图片以及所述已标注样本图片的标注信息对联合模型所包含的各个子模型进行训练更新,得到更新后的联合模型;
S2,将训练样本集中的未标注样本图片输入至所述更新后的联合模型所包含的各个子模型中进行预测处理,得到各个子模型输出的预测结果;其中,所述预测结果包括:预测类别结果以及预测概率分值;
S3,针对每一个子模型,根据该子模型输出的各个预测类别结果所对应的预测概率分值确定该子模型的可信预测类别结果,所述可信预测类别结果所对应的预测概率分值不小于第一预设分值阈值;根据各个子模型的可信预测类别结果进行相互校验,若各个子模型均未预测得到可信预测类别结果,则放弃确定所述未标注样本图片的标注信息;
若各个子模型均预测得到相同的可信预测类别结果,则将所述可信预测类别结果确定为类别真值结果,根据类别真值结果确定所述未标注样本图片的标注信息;
若预测得到相同的可信预测类别结果的子模型的数量超过预设数量阈值,则根据预测得到所述相同的可信预测类别结果的子模型的数量和/或可靠度分值判断所述相同的可信预测类别结果是否为类别真值结果,若是,根据类别真值结果确定所述未标注样本图片的标注信息;其中,所述预设数量阈值小于子模型的总数量且大于1;
若每两个子模型预测得到的可信预测类别结果均不一致,则针对每一个子模型预测得到的可信预测类别结果,根据该子模型预设的可靠度分值确定该可信预测类别结果的可信度分值,判断该可信预测类别结果的可信度分值是否达到第二预设分值阈值,若是,则将该子模型的可信预测类别结果确定为类别真值结果,根据类别真值结果确定所述未标注样本图片的标注信息;
S4,判断所述更新后的联合模型是否满足预设的模型迭代终止条件;若是,则本方法结束;若否,则执行步骤S5;
S5,在训练样本集中将已确定标注信息的未标注样本图片归类为已标注样本图片,跳转执行所述步骤S1。
2.根据权利要求1所述的方法,其特征在于,当所述各个子模型分别为检测子模型时,所述预测结果还包括:预测位置结果,则根据类别真值结果确定所述未标注样本图片的标注信息进一步包括:
根据所述类别真值结果确定所述未标注样本图片的分类标注信息;
按照预设的融合处理规则对所述类别真值结果所对应的多个预测位置结果进行融合,根据融合结果确定所述未标注样本图片的位置标注信息。
3.根据权利要求1所述的方法,其特征在于,所述步骤S1具体包括:
将训练样本集中的已标注样本图片输入至联合模型所包含的各个子模型中进行预测处理,得到各个子模型输出的训练预测结果;
将所述各个子模型输出的训练预测结果与所述已标注样本图片的标注信息进行比对,得到所述各个子模型针对所述已标注样本图片的预测差异信息;
利用预设的联合损失函数对所述各个子模型针对所述已标注样本图片的预测差异信息进行整合,根据整合结果对所述各个子模型的参数进行更新。
4.根据权利要求3所述的方法,其特征在于,所述根据整合结果对所述各个子模型的参数进行更新进一步包括:
针对每一个子模型,每一次更新过程中,控制该子模型的第一参数保持不变,对该子模型的参数中除第一参数之外的第二参数进行更新。
5.根据权利要求1所述的方法,其特征在于,所述判断所述更新后的联合模型是否满足预设的模型迭代终止条件具体包括:
依据预设的模型评估函数判断所述更新后的联合模型是否满足模型迭代终止条件;
其中,所述预设的模型评估函数根据以下中的一种或多种因素而设计:模型准确率信息、模型召回率信息、模型复杂度信息。
6.根据权利要求1所述的方法,其特征在于,所述判断所述更新后的联合模型是否满足预设的模型迭代终止条件进一步包括:
确定利用本次训练迭代得到的更新后的联合模型进行预测得到的已标注样本图片的数量,判断所述预测得到的已标注样本图片的数量是否不大于预设数量阈值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州比智科技有限公司,未经杭州比智科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910009377.6/1.html,转载请声明来源钻瓜专利网。