[发明专利]图像分析方法及相关模型的训练方法、装置、设备和介质在审
申请号: | 202210307855.3 | 申请日: | 2022-03-25 |
公开(公告)号: | CN114612545A | 公开(公告)日: | 2022-06-10 |
发明(设计)人: | 章国锋;鲍虎军;叶伟才;余星源 | 申请(专利权)人: | 浙江商汤科技开发有限公司 |
主分类号: | G06T7/55 | 分类号: | G06T7/55;G06T7/73;G06T7/269;G06N3/04;G06N3/08 |
代理公司: | 深圳市威世博知识产权代理事务所(普通合伙) 44280 | 代理人: | 何倚雯 |
地址: | 311215 浙江省杭州市萧*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 图像 分析 方法 相关 模型 训练 装置 设备 介质 | ||
本申请公开了一种图像分析方法及相关模型的训练方法、装置、设备和介质,其中,图像分析方法包括:获取图像序列、光流数据和图像序列中各个图像的参考数据;其中,各个图像包括具有共视关系的第一图像和第二图像,光流数据包括第一图像与第二图像之间的静态光流和整体光流,静态光流由摄像器件运动引起,整体光流由摄像器件运动和拍摄对象运动共同引起,且参考数据包括位姿和深度;基于图像序列和光流数据,预测得到分析结果;其中,分析结果包括静态光流的光流校准数据;基于静态光流和光流校准数据,对位姿和深度进行优化,得到更新的位姿和更新的深度。上述方案,能够在动态场景下,提升位姿和深度的精度。
技术领域
本申请涉及计算机视觉技术领域,特别是涉及一种图像分析方法及相关模型的训练方法、装置、设备和介质。
背景技术
同时定位和建图(Simultaneous Localization and Mapping,SLAM)是计算机视觉和机器人领域中最基本的任务之一,其应用范围包括但不限于:AR(Augmented Reality,增强现实)、VR(Virtual Reality,虚拟现实)、自动驾驶等。
在此其中,单目稠密SLAM由于单目视频采集的简单性而备受关注,但与RGB-D稠密SLAM相比,则是一项困难的任务。经研究发现,构建稳健、可靠的SLAM系统仍然具有挑战性,尤其是在动态场景中,目前SLAM系统仍然存在较大问题,而无法获取到精确的位姿和深度。有鉴于此,如何提升位姿和深度的精度成为亟待解决的问题。
发明内容
本申请提供一种图像分析方法及相关模型的训练方法、装置、设备和介质。
本申请第一方面提供了一种图像分析方法,包括:获取图像序列、光流数据和图像序列中各个图像的参考数据;其中,各个图像包括具有共视关系的第一图像和第二图像,光流数据包括第一图像与第二图像之间的静态光流和整体光流,静态光流由摄像器件运动引起,整体光流由摄像器件运动和拍摄对象运动共同引起,且参考数据包括位姿和深度;基于图像序列和光流数据,预测得到分析结果;其中,分析结果包括静态光流的光流校准数据;基于静态光流和光流校准数据,对位姿和深度进行优化,得到更新的位姿和更新的深度。
因此,获取图像序列、光流数据和图像序列中各个图像的参考数据,且各个图像包括具有共视关系的第一图像和第二图像,光流数据包括第一图像与第二图像之间的静态光流和整体光流,静态光流由摄像器件运动引起,整体光流由摄像器件运动和拍摄对象运动共同引起,参考数据包括位姿和深度,在此基础上,再基于图像序列和光流数据,预测得到分析结果,且分析结果包括静态光流的光流校准数据,并基于静态光流和光流校准数据,对位姿和深度进行优化,得到更新的位姿和更新的深度。故通过模仿人类感知现实世界的方式,将整体光流视为由摄像器件运动和拍摄对象运动共同引起,并在图像分析过程中,参考整体光流和由摄像器件运动引起的静态光流,预测出静态光流的光流校准数据,从而能够在后续位姿和深度优化过程中,结合静态光流及其光流校准数据尽可能地降低拍摄对象运动所导致的影响,进而能够提升位姿和深度的精度。
其中,基于图像序列和光流数据,预测得到分析结果,包括:基于第一图像和第二图像的图像特征,得到第一图像与第二图像之间的特征相关数据,并基于静态光流将第一图像中像素点进行投影,得到第一图像中像素点在第二图像中的第一投影位置;基于第一投影位置在特征相关数据中搜索,得到目标相关数据;基于目标相关数据、静态光流和整体光流,得到分析结果。
因此,基于第一图像和第二图像的图像特征,得到第一图像与第二图像之间的特征相关数据,并基于静态光流将第一图像中像素点进行投影,得到第一图像中像素点在第二图像中的第一投影位置,在此基础上,基于第一投影位置在特征相关数据中搜索,得到目标相关数据,从而基于目标相关数据、静态光流和整体光流,得到分析结果,即在第一图像和第二图像两者的特征相关数据中搜索目标相关数据的过程中,参考由摄像器件运动而引起的静态光流,能够进一步降低拍摄对象运动所产生的影响,进而能够提升后续优化位姿和深度的精度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江商汤科技开发有限公司,未经浙江商汤科技开发有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210307855.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种浮球式蒸汽疏水阀的浮球打磨装置
- 下一篇:一种可双向密封的偏心球阀
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序