[发明专利]视觉定位方法、装置、电子设备及存储介质有效
申请号: | 202010985839.0 | 申请日: | 2020-09-18 |
公开(公告)号: | CN111967481B | 公开(公告)日: | 2023-06-20 |
发明(设计)人: | 李照虎 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06T7/70 | 分类号: | G06T7/70;G06V10/42;G06V10/54;G06V10/80 |
代理公司: | 北京银龙知识产权代理有限公司 11243 | 代理人: | 许静;黄灿 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 视觉 定位 方法 装置 电子设备 存储 介质 | ||
本申请公开了视觉定位方法、装置、电子设备及存储介质,涉及计算机视觉定位、增强现实和深度学习技术领域。具体实现方案为:获取待定位位置的目标图片;对所述目标图片进行特征提取,获得所述目标图片的第一全局特征;其中,所述第一全局特征中包括第一布局特征和第一纹理特征,所述第一布局特征用于表征所述目标图片中各物体的空间结构信息;从数据库中获取多张候选图片;其中,每张候选图片的第二全局特征与所述第一全局特征之间的差异值小于所述数据库中其他图片的第二全局特征与所述第一全局特征之间的差异值;基于所述多张候选图片对所述待定位位置进行定位。
技术领域
本申请涉及图像处理技术,尤其涉及计算机视觉定位技术领域,具体涉及一种视觉定位方法、装置、电子设备及存储介质。
背景技术
视觉定位技术通常可以分为粗定位和精定位,粗定位是指在数据库中查询与当前位置的图片类似的一些候选图片,并基于这些候选图片,得到多个候选位置。精定位是指使用验证技术验证上述多个候选位置的置信度,并将置信度较高的位置作为当前位置的定位结果。
目前,在粗定位阶段,通常是通过提取当前位置的图片的纹理特征,并基于该纹理特征与数据库中的图片进行匹配,以得到多张候选图片,构造当前位置的子地图。
发明内容
本公开提供了一种视觉定位方法、装置、电子设备及存储介质。
根据本公开的第一方面,提供了一种视觉定位方法,包括:
获取待定位位置的目标图片;
对所述目标图片进行特征提取,获得所述目标图片的第一全局特征;其中,所述第一全局特征中包括第一布局特征和第一纹理特征,所述第一布局特征用于表征所述目标图片中各物体的空间结构信息;
从数据库中获取多张候选图片;其中,每张候选图片的第二全局特征与所述第一全局特征之间的差异值小于所述数据库中其他图片的第二全局特征与所述第一全局特征之间的差异值;
基于所述多张候选图片对所述待定位位置进行定位。
根据本公开的第二方面,提供了一种视觉定位装置,包括:
第一获取模块,用于获取待定位位置的目标图片;
特征提取模块,用于对所述目标图片进行特征提取,获得所述目标图片的第一全局特征;其中,所述第一全局特征中包括第一布局特征和第一纹理特征,所述第一布局特征用于表征所述目标图片中各物体的空间结构信息;
第二获取模块,用于从数据库中获取多张候选图片;其中,每张候选图片的第二全局特征与所述第一全局特征之间的差异值小于所述数据库中其他图片的第二全局特征与所述第一全局特征之间的差异值;
定位模块,用于基于所述多张候选图片对所述待定位位置进行定位。
根据本公开的第三方面,提供了一种电子设备,包括:
至少一个处理器;以及
与至少一个处理器通信连接的存储器;其中,
存储器存储有可被至少一个处理器执行的指令,该指令被至少一个处理器执行,以使至少一个处理器能够执行第一方面中的任一项方法。
根据本公开的第四方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,该计算机指令用于使计算机执行第一方面中的任一项方法。
根据本申请的技术解决了视觉定位技术存在的定位准确性比较差的问题,提高了视觉定位的准确性。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010985839.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种全新防护结构的玻璃磨头电机
- 下一篇:一种扫路车干式除尘过滤装置