[发明专利]一种用于监控视频车辆检测的半监督带噪声学习方法有效
申请号: | 202110348338.6 | 申请日: | 2021-03-31 |
公开(公告)号: | CN113033679B | 公开(公告)日: | 2022-05-31 |
发明(设计)人: | 王好谦;刘伟锋 | 申请(专利权)人: | 清华大学深圳国际研究生院 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06V10/764;G06V10/774;G06V20/40 |
代理公司: | 深圳新创友知识产权代理有限公司 44223 | 代理人: | 孟学英 |
地址: | 518055 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 监控 视频 车辆 检测 监督 噪声 学习方法 | ||
1.一种用于监控视频车辆检测的半监督带噪声学习方法,其特征在于,包括如下步骤:
S1:在公开的目标检测数据集上采用c角监督方法同时训练c个标注器,其中,c为大于1的自然数;c角监督方法是在同一数据集训练c个模型,每一次常规迭代后,各所述模型输出一定数量的检测结果,选取损失值低于阈值L的结果,作为另外c-1个模型的真值,进行一次c角监督迭代;
S2:用所述c个标注器在不带标签的业务数据上进行推断,得到c组检测结果,分别计算每个车辆包围框的置信度加权平均值作为所述c个标注器的整体输出结果,所述整体输出结果作为所述业务数据的集成标签;
S3:所述公开的目标检测数据集和带集成标签的所述业务数据混合得到混合数据集,所述混合数据集包含图片和标签,所述图片和所述标签来自于所述公开的目标检测数据集和所述业务数据,且保持图片和标签的对应关系,在所述混合数据集上采用全监督方式训练校正器,所述校正器输出校正标签;得到所述校正标签包括如下步骤:
S31:在所述混合数据集上,用全监督方式训练一个二阶段目标检测模型M;
S32:固定所述二阶段目标检测模型M的参数修正所述混合数据集的标签;
S33:用修正后的所述标签继续训练所述二阶段目标检测模型M至验证集的损失值收敛,得到所述校正标签;
修正所述混合数据集的标签,包括如下步骤:
带噪声的标签和所述混合数据集的图片一起输入到所述二阶段目标检测模型M,骨干网络提取特征并将所得特征传至类别无关的包围框校正器,包围框校正器输出车辆包围框经第一阶段校正后的坐标向量b*,所述车辆包围框所在区域的特征经过精细感兴趣区域池化后传至至少3个结构相同但初始化方法不同的检测头,所述检测头包括分类头和定位头,所述定位头输出所述车辆包围框的坐标;所述分类头对所述车辆包围框的内容进行分类;
至少3个所述检测头分别预测1个所述车辆包围框的4个坐标的偏移量,得到偏移向量;
至少3个偏移向量的均值乘以一个小于1的超参数后,与第一阶段校正后的包围框坐标向量相加,输出最终的校正标签的坐标向量;
S4:将所述混合数据集的标签替换为所述校正标签,采用全监督方式训练推断器;
S5:采用所述推断器实时处理监控视频流检测出车辆。
2.如权利要求1所述的用于监控视频车辆检测的半监督带噪声学习方法,其特征在于,在步骤S1之前还包括对所述公开的目标检测数据集进行处理,所述处理包括如下至少一种:
剔除所述公开的目标检测数据集中宽度小于10像素且高度小于10像素或面积小于5像素乘5像素的包围框;
剔除所述公开的目标检测数据集中没有车辆包围框的图片;
剔除所述公开的目标检测数据集中的灰度图片;
采用数据增强方法扩充所述公开的目标检测数据集。
3.如权利要求2所述的用于监控视频车辆检测的半监督带噪声学习方法,其特征在于,所述c个标注器采用不同类型的模型;所述模型的类型是二阶段目标检测模型、单阶段基于先验框的目标检测模型或单阶段基于关键点的目标检测模型。
4.如权利要求3所述的用于监控视频车辆检测的半监督带噪声学习方法,其特征在于,得到所述业务数据的集成标签包括如下步骤:
所述c个标注器在所述业务数据上进行推断,采用软性非极大值抑制后处理方法过滤置信度低于第一预设阈值的车辆包围框,并保留置信度最高的预设个数的车辆包围框得到c组检测结果,分别计算每个所述车辆包围框的置信度加权平均值作为所述c个标注器的整体输出结果得到所述集成标签。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学深圳国际研究生院,未经清华大学深圳国际研究生院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110348338.6/1.html,转载请声明来源钻瓜专利网。