[发明专利]基于视觉的渣土车检测方法、装置、计算机及存储介质在审
| 申请号: | 202210620077.3 | 申请日: | 2022-06-02 |
| 公开(公告)号: | CN115147642A | 公开(公告)日: | 2022-10-04 |
| 发明(设计)人: | 莫家源;欧阳一村;罗富章;王和平;朱光强;邓奇宝 | 申请(专利权)人: | 盛视科技股份有限公司 |
| 主分类号: | G06V10/764 | 分类号: | G06V10/764;G06V10/774;G06V10/82;G06T7/73 |
| 代理公司: | 深圳市深软翰琪知识产权代理有限公司 44380 | 代理人: | 吴雅丽 |
| 地址: | 518000 广东省深圳市福田区华富街道莲花一村社区彩田*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 视觉 渣土 车检 方法 装置 计算机 存储 介质 | ||
1.一种基于视觉的渣土车检测方法,其特征在于,所述方法包括:
获取渣土车图像数据集;
利用深度卷积神经网络的特征提取网络提取所述渣土车图像数据集中的渣土车特征并生成特征图;
对所述特征图进行解耦划分为分类网络分支、定位网络分支并经卷积处理分别得到边界框的分类置信度、定位置信度;通过获取高置信度的边界框以作为先验框;
将所述特征图和所述先验框输入所述深度卷积神经网络的预测网络中以得到预测框,并将所述预测框作为新的先验框和所述特征图再次输入所述深度卷积神经网络的预测网络以得到渣土车检测框;
利用所述渣土车图像数据集验证所述深度卷积神经网络以得到训练好的深度卷积神经网络;
利用所述训练好的深度卷积神经网络对待检测图像进行检测以判断待检测图像中是否包含渣土车;
若判断为是,则输出提示信息。
2.如权利要求1所述基于视觉的渣土车检测方法,其特征在于,所述利用深度卷积神经网络的特征提取网络提取所述渣土车图像样本中的渣土车特征并生成特征图之前,所述方法包括:
对所述渣土车数据集进行标签处理和/或数据增强处理,其中,所述标签处理包括保留宽度和高度大于预设像素值的渣土车真实框;所述数据增强处理至少如下处理中的一种或多种:对图像进行裁剪、翻转、扭曲及亮度调整。
3.如权利要求1所述基于视觉的渣土车检测方法,其特征在于,所述利用深度卷积神经网络的特征提取网络提取所述渣土车图像数据集中的渣土车特征并生成特征图包括:
利用所述利用深度卷积神经网络的特征提取网络提取所述渣土车图像数据集中的渣土车特征并生成三个不同尺寸的输出特征图。
4.如权利要求3所述基于视觉的渣土车检测方法,其特征在于,所述对所述特征图进行解耦划分为分类网络分支、定位网络分支并经卷积处理分别得到边界框的分类置信度、定位置信度包括:
利用1×1卷积层对所述输出特征图进行降维以得到一低维特征图;
将所述低维特征图输入所述分类网络分支、所述定位网络分支以得到相应的分类置信度和定位置信度。
5.如权利要求3所述基于视觉的渣土车检测方法,其特征在于,所述利用所述训练好的深度卷积神经网络对待检测图像进行检测以判断待检测图像中是否包含渣土车包括:
利用所述渣土车检测框对待检测图像进行检测;
采用非极大值抑制算法获取最佳的目标边界框;
判断所述目标边界框内的内容是否包含渣土车。
6.如权利要求1所述基于视觉的渣土车检测方法,其特征在于,所述深度卷积神经网络基于YOLO模型架构;所述特征提取网络采用mobilenet-v2网络;所述深度卷积神经网络采用的卷积神经网络中,采用Focal Loss函数作为分类损失函数,采用G-IOU Loss函数作为定位损失函数;
所述Focal Loss函数满足如下关系式:
其中,y~是经过激活函数的输出,在0-1之间;α是用于平衡正负样本本身的比例不匀的平衡因子;γ是用于减少易分类样本的损失;
所述G-IOU Loss函数满足如下关系式:
其中,G和P分别表示真实框和预测框;C表示G与P的最小闭包矩形。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于盛视科技股份有限公司,未经盛视科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210620077.3/1.html,转载请声明来源钻瓜专利网。





