[发明专利]一种基于预训练卷积神经网络的视觉SLAM回环检测方法有效

专利信息
申请号: 201910013010.1 申请日: 2019-01-07
公开(公告)号: CN109800692B 公开(公告)日: 2022-12-27
发明(设计)人: 余宇;胡峰 申请(专利权)人: 重庆邮电大学
主分类号: G06V20/52 分类号: G06V20/52;G06V10/762;G06V10/82;G06N3/04
代理公司: 重庆市恒信知识产权代理有限公司 50102 代理人: 刘小红;陈栋梁
地址: 400065 重*** 国省代码: 重庆;50
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 训练 卷积 神经网络 视觉 slam 回环 检测 方法
【权利要求书】:

1.一种基于预训练卷积神经网络的视觉SLAM回环检测方法,其特征在于,包括以下步骤:

S1、输入场景图像集合,对输入图像先进行去均值标准化处理,基于预训练卷积神经网络VGG-19的结构,在VGG-19的前向传播中对输入图像数据集进行特征提取,并构造图像特征向量集;

S2、基于K-Means算法对图像特征向量集进行特征聚类,并生成聚类模型;

S3、对新输入图像帧经过预训练VGG-19提取特征向量作为特征描述,并通过聚类模型输出预测标签;

S4.在同一类别标签内,利用欧式距离度量对新加入图像的特征向量和其余图像的特征向量进行相似度计算,当度量值小于设定阈值时则判定与之形成回环,经过条件筛选,输出构成的真实回环图像集合;

所述步骤S1输入场景图像集合,基于预训练卷积神经网络VGG-19的结构对输入图像数据集进行特征提取,并构造图像特征向量集,具体步骤如下:

S11.对于任一单张三通道图像fi,对图像进行去均值标准化处理,

其中,j表示图像的RGB通道,i表示图像下标,n表示图像数量,表示数据集中所有图像在通道j上的平均值;

S12.对于S11中处理过后的图像,通过Conv1到Conv5的卷积层前向传播,

al=σ(zl)=σ(al-1*Wl+bl)#(2)

ReLU(zl)=max(0,zl)#(3)

其中上标l代表当前层数,al代表第l层的输出,*代表卷积,W代表卷积核,

b代表偏置量,σ(·)代表了使用的激活函数ReLU;

S13.在Conv1到Conv5的每个卷积层的后面分别接一个最大池化层,通过最大池化的方式进行前向传播,

S=βdown(C)+b#(4)

其中,β和b为标量,down(C)表示对输入的矩阵C进行下采样;

S14.在预训练的VGG-19卷积神经网络末端有FC6和FC7作为全连接层,对隐藏层学到的分布式特征进行映射,使用卷积核进行全层卷积,

S15.至此,通过提取FC7层的输出结果,得到了单一图像的输出结果一个4096维的图像特征向量;

S16.为了加快图像特征的提取,对VGG-19的BATCH值做了调整,对于一次性输入的k张图像,能够在前向传播到FC7层时直接输出一个(k,4096)的特征矩阵M,作为特征向量集:

所述步骤S2基于K-Means算法对图像特征向量集进行特征聚类,并生成聚类模型,具体步骤如下:

S21.对于S16中得到的图像特征矩阵,随机选取K个聚类中心;

S22.对图像特征矩阵中的特征向量,按照欧氏距离度量方式选择最近邻聚类中心进行聚类,特征向量V1(x1,x2…x4096)和V2(y1,y2…y4096)的欧式距离为:

S23.对K个聚类分别计算其样本均值,计算结果作为新的K个聚类中心,再根据步骤S22重新聚类,特征向量V1(x1,x2…x4096)的样本均值计算为:

S24.对当前聚类结果,计算误差平方和SSE:

S25.重复步骤S23和S24,直到误差平方和SSE不再变化,输出最终聚类结果,包括类别C={c1,c2…ck}和每一个类别下的特征向量集合Ci=1,2…k={Vj},保存当前K-means聚类模型;

所述步骤S3对新输入图像帧经过预训练VGG-19提取特征向量作为特征描述,并通过聚类模型输出预测标签,具体步骤如下:

S31.对于新加入的图像帧通过预训练的VGG-19卷积神经网络结构进行前向传播算法,得到FC7层的输出结果V=(x1,x2…x4096),作为该帧图像的特征描述向量;

S32.通过在步骤S25中保存的K-means聚类模型,对步骤S31所得到图像特征向量V进行聚类,得到其所属类别Cv

所述步骤S4的详细步骤如下:

S41.对步骤S31中得到的V与所属类别Cv中的其余所有特征向量,逐一进行步骤S22中的欧式距离度量,得到所有大于阈值的图像集合F1

S42.进行条件筛选,对于步骤S41的F1中出现的连续下标图像,则选择其中与V的欧式距离度量值最小的一个,判定为真实回环,构成新的图像集合F={fi},非连续下标图像则直接加入到集合F中,至此,输出集合F={fi}为所有与新加入图像帧构成真实回环的图像集合。

2.根据权利要求1所述的基于预训练卷积神经网络的视觉SLAM回环检测方法,其特征在于,所述步骤S16中BATCH值的调整根据具体需要构造的图像特征向量集的维度而决定。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910013010.1/1.html,转载请声明来源钻瓜专利网。

同类专利
专利分类
×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top