[发明专利]基于规范等变转换算子神经网络的三维物体形状分类方法有效

申请号：	202110895887.5	申请日：	2021-08-05
公开（公告）号：	CN113723208B	公开（公告）日：	2023-10-20
发明（设计）人：	林宙辰;董一鸣;何翎申;王奕森	申请（专利权）人：	北京大学
主分类号：	G06V20/64	分类号：	G06V20/64;G06V10/82;G06N3/0464;G06T17/20;G06N3/045;B07C5/34
代理公司：	北京万象新悦知识产权代理有限公司 11360	代理人：	黄凤茹
地址：	100871***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	基于规范转换算子神经网络三维物体形状分类方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于规范等变转换算子的神经网络的三维物体形状识别方法，创建用于实现模型规范等变性的等变转换算子，再将全局坐标系投影到局部坐标系，并基于规范等变性实现模型的旋转不变性，用于高效地进行三维物体分类与识别视觉分析；包括以下步骤：

1)对以流形结构表示的3D物体数据进行网格(mesh)化，生成3D物体mesh数据；

2)对3D物体mesh数据进行预处理；包括：归一化；确定邻域；选定局部坐标系；计算对数映射以及联络；构造模型输入特征，对mesh中每一个点，将其在全局坐标系下的坐标投影到局部坐标系下，作为模型输入特征；

3)将3D物体mesh数据集分为训练样本和测试样本；

4)构建规范等变的Transformer；

所述Transformer包括：键值函数、查询函数和价值函数；其中，注意力分数包括键值key和查询query；通过设计不变的注意力分数和等变的价值函数实现规范等变的Transformer；包括如下步骤：

41)构建规范等变的Transformer架构；

设Transformer输入特征域f的维度为C_in，群表示为ρ_in,输出特征域的维度为C_out，群表示为ρ_out；定义规范等变的Transformer在规范w下，点p的输出为：

其中，MHSA是多头注意力函数，SA是单头注意力函数，W_M是线性变换矩阵，||是向量拼接操作运算符；在头h处，SA函数的输出为：

其中，点q_u＝exp_pw_p(u),f_w′(q_u)为点q_u处的特征向量平行移动到点p在规范w下的值，V_u为价值函数，其将相对位置u用一个矩阵进行编码，表达式如下：

其中，α是注意力分数，其在中心点为p,邻域点为q_u时头h处的表达式如下：

42)扩展正规表示；

C_N群是由空间中所有对应的弧度值为的旋转矩阵所构成的具有N个元素的群，其中k为0到N-1之间的整数；正规表示是C_N的一种特殊群表示；如果用Θ_k来表示旋转角度为的旋转矩阵，则C_N可表示为{Θ₀,Θ₁,…,Θ_N-1}；对整数k，正规表示是一个N×N的置换矩阵，其中向量的所有分量循环平移k个单位；

可用不可约表示分解为其中是C_N的不可约表示，A是N×N的可逆矩阵；当N为奇数时，不可约表示的形式如下：

其中，θ∈[0,2π)是矩阵Θ对应的旋转角度，即：

且

进一步地，将不可约表示扩展到二维旋转群SO(2)上，表示为：

其中即得到扩展后的群表示为：

由此实现对空间中的任意向量平行移动而不损失旋转角度信息；

43)构建规范等变的价值函数，将相对位置u用矩阵进行编码；

将价值函数定义为平行移动的特征向量的数值左乘价值编码矩阵W_V；价值函数规范等变的充分必要条件是W_V(Θ^-1u)＝ρ_out(Θ^-1)W_V(u)ρ_in(Θ)；对W_V进行泰勒展开求解此方程，即：

将该式代入到规范等变的充分必要条件式，即得线性方程组，表示为：

W₀＝ρ_out(Θ^-1)W₀ρ_in(Θ),

cos(θ)W₁-sin(θ)W₂＝ρ_out(Θ^-1)W₁ρ_in(Θ),

sin(θ)K₁-cos(θ)K₂＝ρ_out(Θ^-1)W₂ρ_in(Θ),