[发明专利]一种基于深度学习的点云三维物体检测方法有效
申请号: | 202110334132.8 | 申请日: | 2021-03-29 |
公开(公告)号: | CN113095172B | 公开(公告)日: | 2022-08-05 |
发明(设计)人: | 雷建军;于传波;彭勃;王梦园;刘秉正 | 申请(专利权)人: | 天津大学 |
主分类号: | G06V20/64 | 分类号: | G06V20/64;G06V10/26;G06V10/46;G06V10/764;G06V10/80;G06K9/62 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 李林娟 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 学习 三维 物体 检测 方法 | ||
1.一种基于深度学习的点云三维物体检测方法,其特征在于,所述方法包括:
通过分层体素编码模块提取点云场景中点稀疏、点密集区域中非空体素的特征表示;
通过注意力模块融合组合的体素特征和体素特征以有效的获得体素的特征表示点云场景;
通过高度信息补充模块引入点云BEV图以补偿体素特征图高度信息;
通过通道注意力模块提取掩模处理后的特征图中有用信息以提高几何结构感知能力;
构建一特征学习网络用于挖掘特征图中的高级语义特征,在输出端增加了一个体素分割任务来判断非空的体素是否属于目标物体,并基于多任务检测头,设计了一个总体的损失约束网络;
将训练后的损失约束网络用于三维物体的检测任务;
其中,通过分层体素编码模块提取点云场景中点稀疏、点密集区域中非空体素的特征表示为:
将给定的点云场景P划分为两种尺度大小的柱体体素和其中,v表示体素,i和j表示尺度索引,k和t表示第k和第t个体素;
采用相同的特征提取器独立的提取两种尺度非空体素的特征,并采用非线性激活函数和最大池化得到非空体素特征的特征表示;根据体素在点云空间中的位置关系,将对应位置的尺度j体素特征进行组合,组合后的体素特征表示为
其中,分层体素编码模块为:
其中,[.]表示级联操作,和均为体素特征,ψ表示全连接层,表示的是注意力模块和元素级最大池化的组合操作,Fk表示分层体素编码模块输出的体素特征;
其中,所述注意力模块为:
其中,φ表示通道级最大池化,mlp表示多层感知器,σ表示非线性激活,表示元素级相乘操作,f表示和级联后的特征,Att为注意力模块函数;
所述高度信息补充模块为:
利用由卷积组成的卷积块分别提取体素特征图和点云BEV图的特征,以通道级联的方式融合特征,并经掩模处理:
其中,Fm为掩模处理后的特征图,表示元素级相乘,τ表示卷积,M为掩模图,FS为融合的特征图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110334132.8/1.html,转载请声明来源钻瓜专利网。