[发明专利]一种基于Transformer的点云几何编解码方法在审
申请号: | 202210104899.6 | 申请日: | 2022-01-28 |
公开(公告)号: | CN114422806A | 公开(公告)日: | 2022-04-29 |
发明(设计)人: | 韩成;张超;杨华民;卢时禹;李岩芳;李华;权巍;胡汗平;徐超 | 申请(专利权)人: | 长春理工大学 |
主分类号: | H04N19/597 | 分类号: | H04N19/597;H04N19/147;H04N19/91;G06N3/08;G06N3/04;G06K9/62 |
代理公司: | 安徽顺超知识产权代理事务所(特殊普通合伙) 34120 | 代理人: | 贺湘君 |
地址: | 130000 *** | 国省代码: | 吉林;22 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 transformer 几何 解码 方法 | ||
本发明公开了点云几何编解码技术领域的一种基于Transformer的点云几何编解码方法,将3379个训练点云放在名为‘train’的文件夹内,将用来测试的621个测试点云放在名为‘test’的文件夹内;3D卷积操作对输入张量的大小要求为[Bs,Ic,T,H,W];输入张量中每个参数的含义:Bs表示为输入批量大小,Ic表示为输入张量的通道数,T表示为输入点云三维空间网格的长;H表示为输入点云三维空间网格的高;W表示为点云三维空间网格的宽;循环遍历‘train’文件夹内的数据或‘test’文件夹内的数据,保存每个文件的索引地址方便后面查找使用,根据Tramsformer网络结构实现三维点云的全局信息特征提取,提高点云解码后精度,利用Transformer结构可以获得三维网格空间的点云几何信息。
技术领域
本发明涉及点云几何编解码技术领域,具体为一种基于Transformer的点云几何编解码方法。
背景技术
点云是对三维物体表面的数字化采样,在表现形式上是由点的几何信息(x,y,z)和属性信息(R,G,B和纹理信息等)组成。利用三维点云信息可以重建真实的三维世界。三维点云信息主要应用在无人驾驶、高精度地图重建、虚拟现实和增强现实等领域。相比于排列规则的2D图像,三维点云是无规则点的集合,而且点云的数据量庞大,难以对点云的集合信息进行压缩,基于此,本发明设计了一种基于Transformer的点云几何编解码方法以解决上述问题。
发明内容
本发明的目的在于提供一种基于Transformer的点云几何编解码方法,以解决上述背景技术中提出的,,,,,。
为实现上述目的,本发明提供如下技术方案:一种基于Transformer的点云几何编解码方法,包括从ModelNet数据集平台中获得一组测试点云传入计算机1中,其具体步骤如下:
步骤1:将3379个训练点云放在名为‘train’的文件夹内,将用来测试的621个测试点云放在名为‘test’的文件夹内;
步骤2:3D卷积操作对输入张量的大小要求为[Bs,Ic,T,H,W];
步骤3:循环遍历‘train’文件夹内的数据或‘test’文件夹内的数据,保存每个文件的索引地址方便后面查找使用;
步骤4:进入神经网络后,经过第一次卷积操作,第一次3D卷积操作参数设置如下:Ks表示为卷积核的尺寸,St表示为卷积操作滑动步长,Ba表示为偏置量,Pa表示为对原始三维网格空间的填充,3D卷积操作所使用的卷积核为三维矩阵,矩阵中所有元素的值为随机生成,其范围为[-1,1]区间;在所使用的输入张量为[1,1,64,64,64],Bs输入批量大小为1,Ks大小为(3,3,3),St的步长为1;Pa的输入为1,偏置量设置为True,输出通道设置为16;经过第一次3D卷积操作之后得到的张量大小为[1,16,64,64,64];
步骤5:然后利用RELU激活函数对第一次3D卷积操作得到的张量进行第一次非线性拟合;
步骤6:将一次非线性拟合得到的张量输入到第二次3D卷积操作,输入的张量大小为[1,16,64,64,64],Bs输入批量大小为1,Ks的大小为(3,3,3),St的步长为2,Pa的输入为0,偏置量设置为True,输出通道设置为32;经过第二次3D卷积操作之后得到的张量大小为[1,32,32,32,32];
步骤7:然后利用RELU激活函数对第二次3D卷积操作得到的张量进行第二次非线性拟合;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于长春理工大学,未经长春理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210104899.6/2.html,转载请声明来源钻瓜专利网。
- 基于Transformer+LSTM神经网络模型的商品销量预测方法及装置
- 一种基于Transformer模型自然场景文字识别方法
- 一种深度Transformer级联神经网络模型压缩算法
- 点云分割方法、系统、介质、计算机设备、终端及应用
- 基于Transformer的中文智能对话方法
- 一种基于改进Transformer模型的飞行器故障诊断方法和系统
- 一种基于Transformer模型的机器翻译模型优化方法
- 基于Transformer和增强交互型MPNN神经网络的小分子表示学习方法
- 基于U-Transformer多层次特征重构的异常检测方法及系统
- 基于EfficientDet和Transformer的航空图像中的飞机检测方法