[发明专利]基于多环路视图卷积神经网络的立体视觉检索方法与系统有效
| 申请号: | 201910071879.1 | 申请日: | 2019-01-25 |
| 公开(公告)号: | CN109857895B | 公开(公告)日: | 2020-10-13 |
| 发明(设计)人: | 高跃;蒋建文;赵曦滨 | 申请(专利权)人: | 清华大学 |
| 主分类号: | G06F16/583 | 分类号: | G06F16/583;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 北京律谱知识产权代理事务所(普通合伙) 11457 | 代理人: | 黄云铎 |
| 地址: | 100084*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 环路 视图 卷积 神经网络 立体 视觉 检索 方法 系统 | ||
1.基于多环路视图卷积神经网络的立体视觉检索方法,其特征在于,所述方法包括:
步骤1,获取视觉对象在所处空间内至少两个相交平面上的环路视图,其中,所述环路视图包括至少三张对象视图;
步骤2,根据视图卷积神经网络和长短时记忆网络模型,对所述环路视图进行特征提取,得到所述环路视图对应的环路描述子,其中,具体包括:
步骤21,根据所述视图卷积神经网络中的残差神经网络模型,对任一张所述对象视图进行特征向量处理,记作第一特征向量;
步骤22,采用所述视图卷积神经网络中的环路正则化模型,根据所述第一特征向量和所述对象视图中的环路统计信息,抽取第二特征向量;
步骤23,根据所述第二特征向量和所述长短时记忆网络模型,采用平均池化算法,生成所述环路描述子;
步骤3,采用拼接算法,对所述环路描述子进行拼接处理,得到全局特征标识,记作检索特征;
步骤4,根据样本空间中的样本与所述检索特征之间的欧氏距离的排序,依次输出所述样本。
2.如权利要求1所述的基于多环路视图卷积神经网络的立体视觉检索方法,其特征在于,所述长短时记忆网络模型的计算公式为:
式中,为当前输入量,为上一个中间输出,为当前中间输出,为第二变换矩阵,为第二偏移量,为第三变换矩阵,为第三偏移量,为第四变换矩阵,为第四偏移量,为第五变换矩阵,为第五偏移量,函数是阈值激活函数,函数是特征激活函数,
其中,第二变换矩阵、第二偏移量、第三变换矩阵、第三偏移量、第四变换矩阵、第四偏移量、第五变换矩阵和第五偏移量的取值,由所述环路视图确定。
3.基于多环路视图卷积神经网络的立体视觉检索系统,其特征在于,所述系统包括:获取单元,提取单元,拼接单元以及输出单元;
所述获取单元用于获取视觉对象在所处空间内至少两个相交平面上的环路视图,其中,所述环路视图包括至少三张对象视图;
所述提取单元用于根据视图卷积神经网络和长短时记忆网络模型,对所述环路视图进行特征提取,得到所述环路视图对应的环路描述子,其中,具体包括:处理模块,正则化模块以及生成模块;
所述处理模块用于根据所述视图卷积神经网络中的残差神经网络模型,对任一张所述对象视图进行特征向量处理,记作第一特征向量;
所述正则化模块用于采用所述视图卷积神经网络中的环路正则化模型,根据所述第一特征向量和所述对象视图中的环路统计信息,抽取第二特征向量;
所述生成模块用于根据所述第二特征向量和所述长短时记忆网络模型,采用平均池化算法,生成所述环路描述子;
所述拼接单元用于采用拼接算法,对所述环路描述子进行拼接处理,得到全局特征标识,记作检索特征;
所述输出单元用于根据样本空间中的样本与所述检索特征之间的欧氏距离的排序,依次输出所述样本。
4.如权利要求3所述的基于多环路视图卷积神经网络的立体视觉检索系统,其特征在于,所述长短时记忆网络模型的计算公式被配置为:
式中,为当前输入量,为上一个中间输出,为当前中间输出,为第二变换矩阵,为第二偏移量,为第三变换矩阵,为第三偏移量,为第四变换矩阵,为第四偏移量,为第五变换矩阵,为第五偏移量,函数是阈值激活函数,函数是特征激活函数,
其中,第二变换矩阵、第二偏移量、第三变换矩阵、第三偏移量、第四变换矩阵、第四偏移量、第五变换矩阵和第五偏移量的取值,由所述环路视图确定。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910071879.1/1.html,转载请声明来源钻瓜专利网。





