[发明专利]一种基于主动学习的抽烟检测数据标注方法有效

专利信息
申请号: 202310042572.5 申请日: 2023-01-28
公开(公告)号: CN116071624B 公开(公告)日: 2023-06-27
发明(设计)人: 刘鹏;张真;张堃;王美民;江兴斌 申请(专利权)人: 南京云创大数据科技股份有限公司
主分类号: G06V10/778 分类号: G06V10/778;G06V10/774;G06V10/764;G06V10/82;G06V20/52;G06N3/0464;G06N3/048;G06N3/091
代理公司: 南京中盟科创知识产权代理事务所(特殊普通合伙) 32279 代理人: 孙丽君
地址: 210000 江苏省南京市秦淮区永*** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 主动 学习 抽烟 检测 数据 标注 方法
【说明书】:

发明公开了一种基于主动学习的抽烟检测数据标注方法,该方法包括以下步骤:步骤S1、通过网络采集抽烟数据和香烟数据,并利用YOLOv7进行预训练得到初代模型;步骤S2、将初代模型部署至实际场景中,通过摄像头采集实际图像,并对初代模型进行测试;步骤S3、根据初代部署模型得到的预测结果,通过主动学习策略对样本进行筛选;步骤S4、将筛选的样本通过数据标注员进行针对性标注,重新训练下一代模型,并重复执行步骤S1至步骤S4。本发明为标注数据和模型迭代提供了新的模式,有效地降低数据标注时间,降低了数据标注员的标注成本和提成迭代模型的效率。

技术领域

本发明涉及计算机视觉算法技术领域,具体来说,涉及一种基于主动学习的抽烟检测数据标注方法。

背景技术

数据作为人工智能模型中生产资料,是人工智能的四驾马车之一,在实际模型算法落地过程中需要不断迭代模型以适应具体的应用场景,具体来说,当一个检测模型在实际场景中部署后,会因为实际场景下的数据与训练模型时的数据不属于同一个分布,导致会产生各种错误检测和疏漏检测的问题。因此,需要二次采集数据进行数据标注,并重新训练。在这个过程中,有大量相似的数据需要进行标注。由于数据标注员对具体模型训练的细节不了解,无法判断如何丢弃重复数据,导致了巨大的无用工作量,且对迭代模型没有起到推进的作用。除此之外,大量重复无用的数据使得训练时间变长,降低了迭代模型的效率。

针对于检测公共场所中行人是否抽烟的问题,就目前的情况来说,香烟在具体场景中比较小,容易和手机的边框、卡片等物体进行混淆,会导致检测错误,因此每次在部署后一段时间,会产生大量的误报,需要数据标注员进行大量的重新标注。

针对相关技术中的问题,目前尚未提出有效的解决方案。

发明内容

针对相关技术中的问题,本发明提出一种基于主动学习的抽烟检测数据标注方法,以克服现有相关技术所存在的目标检测算法的数据标注成本过高,效率过低技术问题。

为此,本发明采用的具体技术方案如下:

一种基于主动学习的抽烟检测数据标注方法,该方法包括以下步骤:

步骤S1、通过网络采集抽烟数据和香烟数据,并利用YOLOv7进行预训练得到初代模型;

步骤S2、将初代模型部署至实际场景中,通过摄像头采集实际图像,并对初代模型进行测试;

步骤S3、根据初代部署模型得到的预测结果,通过主动学习策略对样本进行筛选;

步骤S4、将筛选的样本通过数据标注员进行针对性标注,重新训练下一偶尔不确定性代模型,并重复执行步骤S1至步骤S4。

进一步的,所述通过网络采集抽烟数据和香烟数据,并利用YOLOv7进行预训练得到初代模型包括以下步骤:

步骤S11、对网络中的香烟特写图片和香烟售卖时的展示图片集进行采集;

步骤S12、使用YOLOv7官方提供的训练脚本进行模型训练,得到初代模型。

进一步的,所述将初代模型部署至实际场景中,通过摄像头采集实际图像,并对初代模型进行测试包括以下步骤:

步骤S21、将模型部署至实际应用场景中,通过摄像头采集实际图像对模型进行错误检测;

步骤S22、错误检测的图片通过审查员进行批准、记录、保存,得到包含错误数据集的数据库。

进一步的,所述根据初代部署模型得到的预测结果,通过主动学习策略对样本进行筛选包括以下步骤:

步骤S31、利用主动学习对数据进行筛选;

步骤S32、通过评估偶尔不确定性和认知不确定性计算图片的信息量得分,判断图片是否被标注。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京云创大数据科技股份有限公司,未经南京云创大数据科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202310042572.5/2.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top