[发明专利]一种基于主动学习的抽烟检测数据标注方法有效
申请号: | 202310042572.5 | 申请日: | 2023-01-28 |
公开(公告)号: | CN116071624B | 公开(公告)日: | 2023-06-27 |
发明(设计)人: | 刘鹏;张真;张堃;王美民;江兴斌 | 申请(专利权)人: | 南京云创大数据科技股份有限公司 |
主分类号: | G06V10/778 | 分类号: | G06V10/778;G06V10/774;G06V10/764;G06V10/82;G06V20/52;G06N3/0464;G06N3/048;G06N3/091 |
代理公司: | 南京中盟科创知识产权代理事务所(特殊普通合伙) 32279 | 代理人: | 孙丽君 |
地址: | 210000 江苏省南京市秦淮区永*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 主动 学习 抽烟 检测 数据 标注 方法 | ||
1.一种基于主动学习的抽烟检测数据标注方法,其特征在于,该方法包括以下步骤:
步骤S1、通过网络采集抽烟数据和香烟数据,并利用YOLOv7进行预训练得到初代模型;
步骤S2、将初代模型部署至实际场景中,通过摄像头采集实际图像,并对初代模型进行测试;
步骤S3、根据初代部署模型得到的预测结果,通过主动学习策略对样本进行筛选;
步骤S4、将筛选的样本通过数据标注员进行针对性标注,重新训练下一代模型,并重复执行步骤S1至步骤S4;
所述根据初代部署模型得到的预测结果,通过主动学习策略对样本进行筛选包括以下步骤:
步骤S31、利用主动学习对数据进行筛选;
步骤S32、通过评估偶尔不确定性和认知不确定性计算图片的信息量得分,判断图片是否被标注;
所述利用主动学习对数据进行筛选包括以下步骤:
步骤S311、在YOLOv7输出层后接入高斯混合密度网络预测混合高斯分布的均值和方差,计算出偶尔不确定性和认知不确定性;
步骤S312、对于目标框的位置,通过高斯混合密度网络模型输出三组参数;
步骤S313、根据参数计算出目标框位置信息的高斯分布权重、高斯分布均值和高斯分布方差;
所述偶尔不确定性和认知不确定性的计算公式为:
;
;
式中k=1,2,…,k,且k为混合高斯模型的高斯分布个数,为第k个高斯分布参数的权重;
所述三组参数为u、sigma、pi;
其中,u为均值,sigma为方差,pi为混合系数;
三组参数对应的特征包括目标框中心的横坐标x、纵坐标y、宽w和高h;
根据参数计算出目标框位置信息的高斯分布权重、高斯分布均值和高斯分布方差,计算方式分别为:
;
;
;
;
式中,共四个候选值,表示一张图片中所有的物体框,为归一函数;
所述通过评估偶尔不确定性和认知不确定性计算图片的信息量得分,判断图片是否被标注包括以下步骤:
步骤S321、定义为第i张图片中的第j个目标物体的偶尔不确定性和认知不确定性聚合的得分;
步骤S322、定义所有得分的集合为,并根据集合计算出所有得分的均值和方差;
步骤S323、对不确定性和图片的信息量进行归一化,得到每一张图片的每一个框的信息量;
步骤S324、计算第i个目标框的信息量,并根据指定的阈值判断该图片是否应当被标注;
所述第i张图片中的第j个目标物体的偶尔不确定性和认知不确定性聚合的得分的计算公式为:
;
式中,
所述对不确定性和图片的信息量进行归一化的计算公式为:
;
所述计算第i个目标框的信息量的计算公式为:
;
式中,为第i张图片中目标框的个数。
2.根据权利要求1所述的一种基于主动学习的抽烟检测数据标注方法,其特征在于,所述通过网络采集抽烟数据和香烟数据,并利用YOLOv7进行预训练得到初代模型包括以下步骤:
步骤S11、对网络中的香烟特写图片和香烟售卖时的展示图片集进行采集;
步骤S12、使用YOLOv7官方提供的训练脚本进行模型训练,得到初代模型。
3.根据权利要求2所述的一种基于主动学习的抽烟检测数据标注方法,其特征在于,所述将初代模型部署至实际场景中,通过摄像头采集实际图像,并对初代模型进行测试包括以下步骤:
步骤S21、将模型部署至实际应用场景中,通过摄像头采集实际图像对模型进行错误检测;
步骤S22、错误检测的图片通过审查员进行批准、记录、保存,得到包含错误数据集的数据库。
4.根据权利要求3所述的一种基于主动学习的抽烟检测数据标注方法,其特征在于,所述将筛选的样本通过数据标注员进行针对性标注,重新训练下一代模型,并重复执行步骤S1至步骤S4包括以下步骤:
步骤S41、将筛选的图片发送给数据标注员进行再标注;
步骤S42、利用新的数据集混合初代模型训练模型的数据集进行再训练,得到新一代模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京云创大数据科技股份有限公司,未经南京云创大数据科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310042572.5/1.html,转载请声明来源钻瓜专利网。