[发明专利]基于SLAM空间不变信息的闭环检测方法和装置在审
| 申请号: | 201911039054.8 | 申请日: | 2019-10-29 |
| 公开(公告)号: | CN110781841A | 公开(公告)日: | 2020-02-11 |
| 发明(设计)人: | 吉长江 | 申请(专利权)人: | 北京影谱科技股份有限公司 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06K9/46;G06K9/62;G01C21/00 |
| 代理公司: | 11694 北京万思博知识产权代理有限公司 | 代理人: | 姜楠楠 |
| 地址: | 100000 北京市*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 闭环检测 空间结构 图像 最近邻居搜索 方法和装置 查询条件 处理模块 附加数据 空间信息 匹配模块 实时获取 所述空间 图像建立 信息转换 转换模块 准确率 申请 匹配 检索 检测 分析 | ||
本申请公开了一种基于SLAM空间不变信息的闭环检测方法和装置,涉及闭环检测领域。该方法包括:实时获取当前图像,为所述当前图像建立词袋;分析所述当前图像的空间结构提取出空间信息,将所述空间信息转换到不变坐标系下得到ISI空间不变信息;使用所述ISI作为查询条件,在所述词袋内进行最近邻居搜索,完成匹配。该装置包括:处理模块、转换模块和匹配模块。本申请在闭环检测时把ISI当作附加数据参与BoW的检索,提高了检测的准确率。
技术领域
本申请涉及闭环检测领域,特别是涉及一种基于SLAM空间不变信息的闭环检测方法和装置。
背景技术
LCD(Loop-Closure Detection,闭环检测)是视觉SLAM(SimultaneousLocalization And Mapping,即时定位与地图构建)的一项重要过程。简单的来说,闭环检测就是确定现在扫描的场景之前有没有遇到过。因为即使有了前后端的存在,依然无法保证位姿与路标的完全正确性,由于噪声的存在,下一次再次走到该地方的时候,得到的路标可能与上次的路标位置不同,这几乎是一定会发生的事情。因此,没有闭环检测,就会导致建图出现差错,重影,从而也会影响到定位。
BoW(Bag-of-Word,词袋模型)是LCD事实上的标准解决方法,其基本思想是通过无序的局部特征集合(称为视觉单词)来表示每个映射(或参考)图像,然后通过倒排索引有效地索引和检索。词袋模型需要字典(dictionary)。简单来说,就是对扫描的场景中出现的属于某些东西的像素做成一个分类,类似于字典。对于扫描到的每一帧,建立一个词袋,判断该帧里的像素点是否在字典中出现过。具体可以用0和1来表示某个“字”是否出现过,或者用大于1的数表示该帧里出现的次数,从而对于某个帧都能形成一个向量,再比较向量的相似性,从而比较图片的相似性。假设字典里有桌子,椅子等等,但是实际上字典的建立是一个聚类问题,比如使用k-means算法进行无监督学习来聚类,字典中的“字”就是聚类的结果,一般来说就是一个个数字来标识类别。为了提高字典的查找速度,可能需要用多叉树来建立这个字典,也就是多层聚类等。
比如ICRA2018的一篇《Assigning Visual Words to Places for Loop ClosureDetection》提出一种闭环检测的方法:展现image-to-sequence的策略,把时间和内容上接近的图像聚集,产生一个图像序列,定义为place,设图像为I,每一帧图像上有v个最显著的SURF特征点被检测到(设立v个是为了后面VW与feature的匹配),每张图的特征向量示意为dI。为了避免重建一些不连续的场景,如相机没动或者减速,场景内几乎无变化,当图像中特制点的个数小于ε时,这张图片将会被删除,不参与place的生成。然后用GNG(GrowingNeural Gas Network)生成VWs(视觉单词),将局部描述子数据库Ds作为GNG的输入,GNG没有预先设定的聚类结果的聚类数,GNG会增量增加新的端点(新的VW)直到符合最小误差要求。接下来是寻找候选,选用voting方法,将查询图像的描述子投影到数据库里已经生成的VWs,在查询图像描述子转换的过程中,转换即投票。候选闭环寻找通过二项概率函数(binomial probability function),被选择为candidate需要具备两个条件:相似性分数要满足阈值,预候选位置的VWs数大于分布的扩展值。利用KNN分类器,将查询图像的描述子集dQ与属于S(m)的D_S(m)进行匹配。具有最多匹配数目的图像I^{S}被认为是闭环潜在帧。再进行后续的一致性检查。
但是,现有的闭环方法忽略特征空间联系,仅根据物体在图像平面上的2D投影,容易受到视点变化和遮挡的影响,存在较大的投影量化误差,造成感知歧义,即相同单词投影到不同区域,不同单词却投影到相同区域,边缘单词发生此种情况的概率更大。
发明内容
本申请的目的在于克服上述问题或者至少部分地解决或缓减解决上述问题。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京影谱科技股份有限公司,未经北京影谱科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911039054.8/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序





