[发明专利]多尺度机非人检测方法、装置、介质及设备在审
申请号: | 202111448871.6 | 申请日: | 2021-11-30 |
公开(公告)号: | CN114267010A | 公开(公告)日: | 2022-04-01 |
发明(设计)人: | 王慧;陈利军;洪曙光;王祥雪;林焕凯;刘双广 | 申请(专利权)人: | 高新兴科技集团股份有限公司;西安电子科技大学 |
主分类号: | G06V20/52 | 分类号: | G06V20/52;G06V20/54;G06V10/40;G06V10/74;G06V10/75;G06V10/774;G06V10/80;G06V10/82;G06V10/764;G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 广州国鹏知识产权代理事务所(普通合伙) 44511 | 代理人: | 葛红 |
地址: | 510530 广东省广州*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 尺度 非人 检测 方法 装置 介质 设备 | ||
本发明公开了一种多尺度机非人检测方法,包括:获取道路监控场景的图像训练集,对所述图像训练集中的训练样本进行预处理;采用预处理后的训练样本训练预设的机非人检测模型,所述机非人检测模型采用不同大小的四个预测尺度对输入图像进行机非人目标预测;获取道路监控场景的待预测图像,通过训练好的机非人检测模型提取所述待预测图像中的机非人目标特征;将所述机非人目标特征与道路监控场景图库中的特征信息进行匹配,得到所述待预测图像中的机非人目标的位置信息和分类信息。本发明在机非人检测模型的预测步骤中采用四个预测尺度,可以兼顾更小目标的检测,对大目标和小目标都有较好的检测效果,有效地提高了机非人检测的精确度和稳健性。
技术领域
本发明涉及数据处理技术领域,尤其涉及一种多尺度机非人检测方法、装置、介质及设备。
背景技术
随着交通运输行业的高速发展,带来的负面影响也逐渐显现:比如城市道路交通拥堵严重、交通安全事故频繁发生等等。为了改善交通环境,需要对道路交通场景中的机动车、非机动车以及行人进行管控。近年来随着计算机视觉技术的发展,基于深度卷积神经网络下目标定位与识别技术的智能分析监控系统广泛应用于道路交通监管场所,比如基于深度卷积神经网络的机非人检测技术,不仅能实现机非人(机动车、非机动车、行人)的检测,同时生成位置坐标和类别信息,而且检测速度很快,满足实时要求。
然而现有的检测技术对小目标检测困难,且因为anchor box的使用,使得大量的bounding box都处于背景中,导致样本不均衡;除此之外,在复杂场景中,对模糊及界定不清晰的边界框预测效果不够好;机非人检测的精确度和稳健性欠佳。
发明内容
本发明实施例提供了一种多尺度机非人检测方法、装置、介质及设备,以解决现有技术在检测机非人目标时存在的小目标检测困难、机非人检测的精确度和稳健性欠佳的问题。
一种多尺度机非人检测方法,所述方法包括:
获取道路监控场景的图像训练集,对所述图像训练集中的训练样本进行预处理,所述训练样本为已知机非人位置信息和分类信息的道路监控场景图像;
采用预处理后的训练样本训练预设的机非人检测模型,所述机非人检测模型采用不同大小的四个预测尺度对输入图像进行机非人目标预测;
获取道路监控场景的待预测图像,通过训练好的机非人检测模型提取所述待预测图像中的机非人目标特征,所述待预测图像为未知机非人位置信息和分类信息的道路监控场景图像;
将所述机非人目标特征与道路监控场景图库中的特征信息进行匹配,得到所述待预测图像中的机非人目标的位置信息和分类信息。
可选地,所述对所述图像训练集中的训练样本进行预处理包括:
将所述图像训练集中的训练样本调整为预设尺寸。
可选地,所述机非人检测模型包括主干网络和特征融合层;
所述主干网络采用CSPDarknet53网络,包括依次首尾相连的第一阶段、第二阶段、第三阶段、第四阶段,所述第一阶段和第二阶段输出浅层特征,所述第三阶段和第四阶段输出深层特征,其中所述第一阶段输出的浅层特征比第二阶段输出的浅层特征更浅,所述第四阶段输出的深层特征比第三阶段输出的深层特征更深;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于高新兴科技集团股份有限公司;西安电子科技大学,未经高新兴科技集团股份有限公司;西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111448871.6/2.html,转载请声明来源钻瓜专利网。