[发明专利]基于中轴线的无锚点车载行人检测方法有效
申请号: | 202110542621.2 | 申请日: | 2021-05-18 |
公开(公告)号: | CN113312995B | 公开(公告)日: | 2023-02-14 |
发明(设计)人: | 张梦雪;刘琼 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06V40/10 | 分类号: | G06V40/10;G06V10/40;G06V10/764;G06V10/82;G06N3/0464;G06N3/08 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 何淑珍;江裕强 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 轴线 无锚点 车载 行人 检测 方法 | ||
本发明公开了基于中轴线的无锚点车载行人检测方法。所述方法包括以下步骤:利用ResNet‑50网络提取车载图像特征并实施多次上采样和横向连接操作,构建特征金字塔;监督定位网络对特征金字塔每一层依次采样,获取特征采样点集合;对特征采样点集合进行分类,获得行人特征,根据行人中轴线的表达式由行人特征采样点的位置初步定位行人中轴线;设计可变形卷积,使其初始采样范围比例与行人宽高比例对齐,并调整行人特征采样点位置,获得校正后的行人特征,再由校正后的行人特征采样点位置精准定位行人中轴线;将精准行人中轴线转换至行人外接矩形,定位车载图像中的行人。本发明计算开销较小,车载行人检测鲁棒性较强。
技术领域
本发明涉及计算机视觉的行人检测领域,具体涉及一种基于中轴线的无锚点车载行人检测方法。
背景技术
行人检测是计算机视觉研究领域的热门研究话题,是人体识别、自动驾驶、动作识别等应用的必要前提和关键组件,因此成为了业界的迫切需求。目前绝大多数行人检测器采用锚点框架,首先对输入图像铺设一系列尺度、长宽比例的锚点框作为粗略的目标假设,然后不断调整锚点框的位置和尺度,得到最终预测结果。但是锚点框架存在两方面不足:(1)与锚点框相关的超参数调优困难,不同超参数组合显著影响检测器精度;(2)车载视角行人分布不均匀,密集铺设锚点框引发严重冗余,计算开销大。因此,在时间要求和实时计算资源紧张情况下,采用无锚点框架是更好的选择,能够简化网络学习且计算开销较小。
在基准检测框架的选择上,现有文献(Wang X,Xiao T,Jiang Y,et al.Repulsionloss:Detecting pedestrians in a crowd[C].Proceedings of the IEEE Conferenceon Computer Vision and Pattern Recognition.2018:7774-7783.)中所提RepPoints为通用目标检测框架,其核心思路是为每个目标学习一组特征采样点,再根据采样点位置估计目标外接矩形的位置和尺度。然而,车载视角下道路场景行人间或行人与其他物体间遮挡频发,部分行人分辨率较低,采用RepPoints方法难以精确地定位特征采样点,检测精度较低。因此,如何简洁、精确地定义行人位置和尺度是行人目标表示方法和网络学习目标设计的关键。
此外,RepPoints方法中采用可变形卷积在每个目标的规则网格采样位置增加一项二维的偏移量,使卷积核感受域具有自适应性,用于行人检测任务中有利于建模行人运动导致的形变,可用于对行人特征采样点位置进行校正,该可变形卷积初始化形状为正方形,因而初始采样范围也为正方形。然而,在车载视角下,行人目标大多接近“瘦高”的矩形,与可变形卷积初始采样范围宽高比例不匹配,难以使得所有行人特征点都能在网络训练的同一次反向传播中得到合适的校正。因此,对可变形卷积初始化方式进行适当调整,是提升特征采样准确度的关键。
发明内容
本发明的目的在于克服现有技术的缺点,提出基于中轴线的无锚点车载行人检测方法,包括利用ResNet-50提取车载图像特征并构建特征金字塔;设计行人中轴线及中轴线回归损失函数,监督网络采样特征金字塔,获取特征采样点集合;分类特征采样点集合,获得行人特征,初步定位行人中轴线;设计可变形卷积调整行人特征点位置,并精准定位行人中轴线;设计行人中轴线至行人外接矩形的转换算法,定位车载图像中的行人。本方法基于无锚点深度学习算法,计算开销较小,车载行人检测鲁棒性较强。。
本发明的目的至少通过如下技术方案之一实现。
基于中轴线的无锚点车载行人检测方法,包括以下步骤:
S1、利用ResNet-50网络提取车载图像特征,对ResNet-50网络输出的特征图实施多次上采样和横向连接操作,构建特征金字塔;
S2、设计行人中轴线及中轴线回归损失函数,监督定位网络对特征金字塔每一层依次采样,以各层特征图中每个像素点为中心位置学习特征采样点,获取特征采样点集合;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110542621.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种少模全光放大方法、系统和少模光纤通信系统
- 下一篇:显示组件及电子设备