[发明专利]一种基于多尺度监督的三维场景点云分割方法在审
申请号: | 202310067111.3 | 申请日: | 2023-01-16 |
公开(公告)号: | CN116012587A | 公开(公告)日: | 2023-04-25 |
发明(设计)人: | 杨晓文;文阳晖;张元;韩慧妍;庞敏;况立群;韩燮;熊风光;贾彩琴;薛红新;焦世超 | 申请(专利权)人: | 中北大学 |
主分类号: | G06V10/26 | 分类号: | G06V10/26;G06V10/40;G06V10/82;G06N3/09 |
代理公司: | 太原申立德知识产权代理事务所(特殊普通合伙) 14115 | 代理人: | 王芳 |
地址: | 030051*** | 国省代码: | 山西;14 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 尺度 监督 三维 景点 分割 方法 | ||
1.一种基于多尺度监督的三维场景点云分割方法,其特征在于:包括以下步骤:
步骤1:获取点云数据并对其进行旋转、平移操作;
步骤2:构建基于多尺度监督的点云分割网络模型;
步骤3:将步骤1获得的点云数据连同标签信息输入步骤2获得的模型进行多尺度监督语义分割。
2.根据权利要求1所述的方法,其特征在于:所述网络模型遵循编码器-解码器结构;所述编码器对输入点云进行语义特征提取,对标签进行类别信息向量提取,所述语义特征提取与类别信息向量提取共享下采样;所述解码器采用上采样技术恢复输入分辨率,同时对每层特征进行预测,并利用编码阶段生成的类别信息向量作为标签,对多个不同尺度的解码特征进行监督,指导网络特征的学习,最后通过全连接层为每个输入点云分配一个语义类别。
3.根据权利要求2所述的方法,其特征在于:所述编码器利用SCF-Net作为主干网络提取点云特征。
4.根据权利要求2所述的方法,其特征在于:所述类别信息向量的具体定义为:以表示编码器第k层中的第i个点,将类别信息向量定义为一个1×C的二进制向量,表示点的感受野内存在的对象类别;点云感受野中若存在第j个类别,元素为1,若不存在,则为0;将定义为输入点云的类别信息向量,则点云感受野中只含有自身点,具体定义如下式所示:
式中,li表示输入点云pi的标签;
编码器第k层的类别信息向量利用编码器第k-1层的类别信息向量通过类别信息聚合推得而出,所述类别信息聚合如下式所定义:
式中,n表示点在k-1层感受野中的点云序号,N(i)表示点在k-1层感受野中的点云集合,∨表示逻辑或操作。
5.根据权利要求2所述的方法,其特征在于:所述编码器利用类别信息生成模块提取类别信息向量,具体提取过程包括:将上一层的类别信息向量作为输入,对于单个类别信息向量,通过K近邻算法获取邻域内的K个类别信息向量,经过一次类别信息聚合操作得到能够表示其邻域的类别信息向量。
6.根据权利要求2所述的方法,其特征在于:所述解码器使用类别信息预测模块对每层特征进行预测,具体预测过程包括:
(1)定义解码特征dk对应于编码特征ek,ek-1相对于ek是邻近的浅层编码特征,拥有更加丰富的细粒度局部结构信息,ek+1相对于ek是邻近的高层编码特征,拥有更多的高层语义上下文信息;
(2)利用多层感知机和最远点采样将邻近浅层编码特征ek-1与解码特征dk对齐,利用多层感知机和最近邻插值将邻近高层编码ek+1与解码特征dk对齐;将对齐后的浅层和高层特征拼接后输入多层感知机中,得到融合了浅层几何信息和高层语义信息的增强特征fk,定义如下式所示:
式中,MLP表示多层感知机,FPS表示最远点采样,NI表示最近邻插值,表示拼接操作;
(3)将增强特征fk与解码特征dk拼接后输入多层感知机,然后通过Sigmoid函数得到预测类别信息向量定义如下式所示:
7.根据权利要求6所述的方法,其特征在于:类别信息预测过程中引入类别信息预测损失,计算过程如下式表示:
式中,表示点在解码器中对应层的预测类别类别信息向量,表示每一点所产生的预测损失,表示每一层中所有点产生的预测损失,C表示类别总数,N表示对应层的点云数,Lc表示解码器所有层产生的预测损失。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中北大学,未经中北大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310067111.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种知识图谱生成方法、装置、设备及存储介质
- 下一篇:一种卧式冷柜