[发明专利]一种用于目标检测的数据错误评分方法在审
申请号: | 202210011101.3 | 申请日: | 2022-01-05 |
公开(公告)号: | CN114511001A | 公开(公告)日: | 2022-05-17 |
发明(设计)人: | 杨鑫;贾楠;徐倩 | 申请(专利权)人: | 惠州市德赛西威汽车电子股份有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N5/04 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 练逸夫 |
地址: | 516006 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 目标 检测 数据 错误 评分 方法 | ||
本申请涉及一种用于目标检测的数据错误评分方法,所述方法包括:对多个图片内的目标进行标记处理,生成目标检测数据;并将所述目标检测数据划分为训练集、测试集;将所述测试集通过训练模型进行推理,生成推理结果;将所述推理结果与所述训练集的真值进行配对,获得真正例、假正例、假反例;分别计算所述真正例、假正例、假反例的错误得分,并根据所述错误得分对多个图片进行处理;其中,所述训练模型通过目标检测算法对训练集训练获得。其有益效果在于:本申请实现量化待清洗数据集的错误,并且综合考虑模型输出的不确定性,以及优化错误得分排序。
技术领域
本申请涉及汽车电子技术领域,特别涉及一种用于目标检测的数据错误评分方法。
背景技术
目标检测中使用边界框对目标进行标注,在训练中,给算法输入图片和真值目标的边界框坐标,通过多种调参方法最后获得该算法模型;在推理中,将图片数据输入给模型得到结果,该结果包含图片内部的目标的类别、边界框坐标、置信度。通过推理结果和真值比较得到真正例、假正例、假反例,比较前一般将推理结果中置信度小于某个阈值的所有目标删除,不再与真值进行比较,相当于手动将这部分设置为真反例,此外还要设定交并比阈值,即真值边界框和推理边界框的交并比大于阈值才能算匹配上。根据上述评估方法和规则可对数据集进行数据噪声查找,错误标注定位,使得数据得到清洗,提高数据准确度。
现行方法中,一般将得到的真正例、假正例、假反例结果绘制于原始图片上,然后进行审核和数据清洗工作。此外也会根据每张图片的精确率和召回率或者真正例、假正例个数等进行图片粒度的错误评分,挑选错误得分超过阈值的图片,再进行后续清洗工作。
在上述方法中,推理结果包含目标的类别、边界框坐标、置信度,上述方法直接给出三种box类型结果,未考虑置信度,而置信度反映了该目标伪概率,概率越大表示模型认为此输出更可靠,那么置信度与1的差值越大则模型不确定性更大。此外,数据集错误排序一般是采用一张图的精确率和召回率或者计算真正例、假正例个数等方法进行错误打分,再排序选出超过错误得分阈值的图片。此方法错误得分的粒度为一张图,并未对box进行错误打分,准确度不够。同时,交并比阈值也是一个人工设定值,取值[0,1],一般认为两个box的交并比若大于0.5则表示两者匹配,而推理结果和真值结果匹配上的box(真正例)中存在0.5-1的取值范围,将0.5和1的交并比置为同等权重存在缺陷。
发明内容
本申请为了解决现有技术中的问题,提供了一种用于目标检测的数据错误评分方法。
一种用于目标检测的数据错误评分方法,所述方法包括:
对多个图片内的目标进行标记处理,生成目标检测数据;并将所述目标检测数据划分为训练集、测试集;
将所述测试集通过训练模型进行推理,生成推理结果;
将所述推理结果与所述训练集的真值进行配对,获得真正例、假正例、假反例;
分别计算所述真正例、假正例、假反例的错误得分,并根据所述错误得分对多个图片进行处理;
其中,所述训练模型通过目标检测算法对训练集训练获得。
可选地,所述对多个图片内的目标进行标记处理,包括:
将图片内的目标通过边界框进行标记,并标注当前边界框的目标类别,生成目标检测数据。
可选地,所述训练集与所述测试集的比例为8:2或者所述训练集与所述测试集的比例为7:3。
可选地,所述目标检测算法包括YOLO系列算法、RCNN系列算法中任一种。
可选地,所述推理结果包括每个目标检测数据的目标类别、边界框坐标、置信度。
可选地,所述将所述推理结果与训练集的真值进行配对,获得真正例、假正例、假反例,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于惠州市德赛西威汽车电子股份有限公司,未经惠州市德赛西威汽车电子股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210011101.3/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置