[发明专利]一种跨数据集的目标检测联合训练方法在审
申请号: | 202111212986.5 | 申请日: | 2021-10-19 |
公开(公告)号: | CN113947148A | 公开(公告)日: | 2022-01-18 |
发明(设计)人: | 杨培文;张成英;梁惠莹;于振东;张辽 | 申请(专利权)人: | 深圳市玻尔智造科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 杭州九洲专利事务所有限公司 33101 | 代理人: | 张羽振 |
地址: | 518110 广东省深圳市龙华区观澜街道大*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据 目标 检测 联合 训练 方法 | ||
本发明涉及一种跨数据集的目标检测联合训练方法,包括步骤:根据客户初始需求对原数据集中的每张图片进行标注;客户提出新的检测需求,设又增加了标签分类问题;寻找现有数据集后对新的标签分类进行标注,或者新增一个含有与新检测需求对应的标注数据集,联合已经标注且训练过的数据集进行联合训练。本发明的有益效果是:不需要重新去补齐原来已经标注且训练过的数据集中所有新的标签,只需要对新提供的数据集做好对应新增检测任务的标注就可以了(如在新数据集中的每张图片上面做好三轮车的标注),然后将原来数据集和新数据集联合起来一起重新训练,即可保证模型精度。
技术领域
本发明属于图像目标检测领域,尤其涉及一种跨数据集的目标检测联合训练方法。
背景技术
在对工业产品的多标签多分类检测任务中,一个数据集中的单张图像一般包含多个检测任务,初始获取检测需求时客户一般只提供其中几个检测需求(如在街景检测项目中客户刚开始只要求检测出行人和汽车),但当检测模型已经训练好准备交付时,这个时候客户又提出需要增加新的检测任务并提供新检测任务的分类标准及对应的新数据集(如在街景检测项目中客户又提出需要检测出三轮车)。针对这种情况,当前常见目标检测训练方法都是必须采取补齐原来数据集中所有新的标签(如在街景检测项目原来数据集的每张图片再加上三轮车的标注),然后和提供的新数据集一起将构建好的模型重新训练,否则会影响模型精度,这种方法增加了大量的重复工作,延长了模型交付时间。
发明内容
本发明的目的是克服现有技术中的不足,提供一种跨数据集的目标检测联合训练方法。
这种跨数据集的目标检测联合训练方法,包括以下步骤:
步骤1、根据客户初始需求对原数据集中的每张图片进行标注,设原数据集为一个标注好的n个标签分类问题,选取深度学习模型训练数据集,验证模型精度;
步骤2、客户提出新的检测需求,设又增加了k个标签分类问题;
步骤3、寻找现有数据集后对新的标签分类进行标注,或者新增一个含有与新检测需求对应的标注数据集,联合步骤1中已经标注且训练过的数据集进行联合训练;
步骤4、判断交付的深度学习模型是否达到客户要求,若交付的深度学习模型未达到客户要求,重复执行步骤2和步骤3,直至交付的深度学习模型达到客户要求;
步骤5、向客户交付达到要求的深度学习模型。
作为优选,步骤1中对数据集中的每张图片进行标注时在图片上面用框将瑕疵标注出来。
作为优选,数据集存储的是已经标注好的所有图片及瑕疵标注集合,包括图片名称、各种瑕疵的坐标、瑕疵类型,以JSON数据格式存储。
作为优选,步骤3具体包括如下步骤:
步骤3.1、找到包含所有标签分类的m个数据集;
步骤3.2、定义深度学习模型中神经网络的损失函数为每个数据集中每个标签类别所预测的类别损失的总和,用损失函数来训练神经网络;具体损失函数mask_Loss如下:
上式中,pred为预测的每一类标签的输出值,为n+k向量;label为真实标签;mask为n+k向量,mask(j)表示对数据集中一张图片的第j个标签进行标注的情况,其中j∈{1,2,…,n+k};
若数据集中一张图片的第j个标签是未标注的,则标注mask(j)为0,对该张图片进行监督,损失函数不参与神经网络训练,此时pred*mask为n+k-m,m为mask标注为0的个数,更新深度学习模型的模型参数;
若数据集中一张图片的第j个标签是已标注的,则标注mask(j)为1,不对该张图片进行监督,损失函数参与神经网络训练,生成深度学习模型;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市玻尔智造科技有限公司,未经深圳市玻尔智造科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111212986.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种具有失调校准的低成本模拟测试电路
- 下一篇:基于局域网的通信安全防护系统
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置